Заблуждения и ошибки допускаемые аналитиками, при прогнозировании в начале карьеры

Обращаем внимание начинающего аналитика на то, что при выборе метода прогнозирования необходимо учесть следующие очевидные факты:

Любой метод прогнозирования может построить прогноз, но не каждый прогноз может быть точным.
1.
ППример для наглядности. Вы выбираете фильтр для очистки воды. Любой фильтр пропускает через себя воду, но вода, полученная из разных фильтров, имеет разную степень очистки. Так и любой алгоритм на вход может принять ваш ряд и на выходе показать, какие-то «похожие» числа, но это не означает, что эти числа будут моделью «будущего прогноза». Это будет лишь результатом «пропуска» вашего ряда через алгоритм.
Точность прогноза зависит от модели, которая заложена в методе и описывает статистические закономерности ряда, а не кривую, которая описывает график продаж.
2.
В терминах фильтра для воды это может быть интерпретировано следующим образом. Чтобы фильтр очищал хорошо воду, структура материала фильтра должна быть создана именно для очистки и задержания опасных компонентов, а не просто устранения мути, видимой глазу. Любая марля может сделать воду прозрачной, но она не может удалить вредные вещества. Так и метод, который применяется в прогнозе, может нарисовать «похожую» ясную линию, но это будет только «чистая вода», а не прогноз, который отражает статистическую структуру ряда. Обычно, начинающие маркетологи в качестве «марли» используют интерполяционные полиномы, количество и виды, которых вызывают у них трепет перед математикой. И маркетологи впадают в заблуждение, начиная заниматься «гаданием на полиномах», стремятся увеличить их число, как слои марли для очистки воды. Довольно редко результатом такого «гадания» становится увеличение продаж.
Точность прогноза зависит и от природы самого ряда, и от времени, когда прогноз совершался.
3.
Возьмем все тот же фильтр для воды, в случае с которым данное утверждение может быть интерпретировано так:

Какой бы совершенный фильтр вы не использовали, всегда есть вероятность, что в кране появится такая дрянь, которую не сможет удержать фильтр с самой лучшей микроструктурой материала. «Химические ужасы» можно ожидать в любой момент времени. Поэтому, чтобы иметь идеальную чистую воду необходимо постоянно выбирать фильтр или проводить многоэтапную очистку. Такая интерпретация очевидна.
В терминах прогнозов ситуация такова: в любой момент времени могут появиться такие экономические изменения и факторы, которые могут повлечь ухудшение прогнозов, вычисленных самым лучшим подобранным методом. Для прогноза с учетом новых закономерностей в ряде необходимо подобрать и новый метод.

Ошибка начинающих аналитиков состоит в том, что они полагают, что выбрав программу и метод, они тем самым нашли лучший фильтр для своих целей, то есть для своего ряда. Это заблуждение.

Необходимо иметь процедуру выбора методов, с различными моделями описания ряда. И при этом нельзя путать модели описания ряда, с выбором параметров методов (обычно выбирают параметры интерполяционных полиномов). Последнее может быть интерпретировано, как выбор цвета марли для фильтра, а не смены материала очистки, картриджа, активированного угля и т. д.

Общий вывод

Для построения прогнозов продаж необходимо применять методы, которые изучают статистическую природу ряда, а не те математические приемы, которые рисуют форму кривой. Метод должен узнать закономерности ряда и воплотить их в виде точного прогноза.
Н Небольшой пример. Нарисуйте на листе бумаге кривую линию, и дайте продолжить ее траекторию своему ребенку. С вероятностью в 99% он с ней справится успешно.

Но если вы дадите, скажем, ему график продаж вина и попросите нарисовать продолжение графика, то очень мала вероятность, что ваш ребенок это сможет сделать. Не справится и никто другой, кроме специализированного метода для построения сезонных прогнозов.
Так и экстрополяционный метод, изучающий форму кривой, позволит вам нарисовать продолжения графика, но он не сможет построить прогноз. Конечно, его может заставить сделать это только эксперт по экстраполяционным методам. Но это так далеко от маркетинговой практики, что просто не подлежит обсуждению.

Сглаживать аномалии ряда на основе анализа его статистической структуры, а не формы кривой, которой может быть построена по наблюдаемым точкам.
«СГЛАДИТЬ РЯД ПРОСТО, НАДО ЕГО ИНТЕРПОЛИРОВАТЬ!». Так говорят начинающие аналитики.
Но это — заблуждение!
Прогнозируемый ряд может содержать «неожиданные» для Вас всплески, провалы и даже пропуски в данных. Мы поставили слово «неожиданные» в кавычки, стремясь подчеркнуть тот факт, что для большинства маркетологов наблюдаемые аномалии ряда интуитивно понятны.

Узел причин и следствий, по которым исследуемый ряд содержит аномалии, кроется в особенностях протекания торгового процесса. Чаще всего начинающий аналитик не задается анализом причин этих аномалий, а поступает просто — он пытается их «сгладить».
Следуя рефлексам, заложенным еще в университетском курсе численных методов, аналитик принимает решение сгладить или поправить внешний вид кривой, которая описывает изучаемый ряд. Для этого он применяет один из известных ему интерполяционных методов и получает красивую кривую, которая внешне привлекательна, и следовательно, считает аналитик, и правильна — ведь она ему нравится.

Очевидно, что это его предубеждение — иллюзия, порожденная верой во всесильность математики, которую ему рассказали на первых курсах университета.
Аналитик просто забыл, что когда он изучал интерполяционные методы, ему говорили, что сглаживаемые кривые должны быть определены на интервале изменения переменной. Кроме того, они должны удовлетворять свойствам непрерывности, гладкости и т. д. Конечно, эти милые подробности со временем забылись аналитиком. А осталась только вера в то, что сгладить можно все. И теперь, когда он встретился с временным рядом, решил вспомнить свои прошлые навыки. Но не заметил, что в случае исследуемого ряда продаж в качестве переменной выступает время. И тот отрезок времени, на котором он наблюдает свой ряд, будет сразу же расширен, как только он начнет строить прогноз на будущее. В этом случае изменятся условия интерполяции и, следовательно, его гипотезы о виде интерполяционного полинома просто окажутся, мягко говоря, некорректными.

А на самом деле построение интерполяционного полинома для последующей экстраполяции поведения функции как методы прогнозирования ряда продаж имеет отношение к прогнозированию весьма далекое. Это назвать методом прогнозирования нельзя.
Этот подход можно определить как способ рисования формы кривой по точкам, в то время метод прогнозирования изучает статистические закономерности прошлого, на их основе моделируя будущее. А в данном случае использование полинома является красивым приемом, ориентированным на остаточные знания начинающих аналитиков. Это прием, который позволяет построить красивые кривые. Этот способ имеет отношение к методам прогнозирования продаж примерно такое же, как ваш прекрасный монитор последней модели. Он красиво рисует, что ему подают на вход, но он не понимает сути того, что рисует.
Итак, заблуждение аналитика состоит в том, что занимаясь сглаживанием «помех» в наблюдаемом ряде он для этого применяет методы, которые созданы для других приложений — построения функций, определенный на интервале, а не функций, область определения которых расширяется.
Поэтому рисование красивых кривых продаж превращается в успешно выполненную студенческую курсовую работу по численным методам. Эта работа весьма далека от той предметной области, с которой в реальности столкнулся аналитик «прогнозирование поведения кривой продаж».

Аналитик должен исследовать статистическую структуру ряда, для которого он собирается построить прогноз. Он должен выявить статистические закономерности поведения ряда, а не числовые параметры расположения точек относительно друг друга, как это делается в интерполяционных методах. Аналитик должен на основе статистических закономерностей ряда выбрать метод прогнозирования и затем построить «правильный» прогноз. Правильный в смысле правильной и точной модели, построенной на основе статистических закономерностей ряда, а не формы кривой который можно интерполировать наблюдаемые точки.
Итак, задача аналитика состоит в том, чтобы исследовать статистическую природу наблюдаемого ряда. Но что это такое — статистическая природа ряда? Это есть распределение наблюдаемых величин (объемов продаж) относительно линии тренда ряда. И если наблюдения прошлого принадлежат данному распределению, тогда можно говорить, что наблюдаемый ряд не содержит помех, которые мешают построить прогноз. НО если на некоторых шагах ряда наблюдаются величины «выскакивающие» или «выпадающие» из данного распределения, то тогда такими величинами аналитик должен заниматься «лично».
Успокоить эти аномалии аналитик может простейшим интерполяцией, выполненной на наблюдениях, которые окружают всплеск. В этом случае статистическая структура ряда, измененная добавлением исправленного наблюдения, будет искажена минимально.

Невнимательный читатель, встретив наши слова об интерполяции применимой к ближайшим точкам аномалии ряда, может сказать — «Ну вот, вы все-таки используете интерполяцию?! Так почему же раньше говорили, что это делать некорректно?». Все дело в том, что здесь мы применяем ее на ограниченном участке прошлых наблюдений. На участке, где происходит единичное аномальное поведение точки. Мы не занимаемся интерполяцией всех прошлых наблюдений и не применяем интерполяционные полиномы для «угадывания» будущего. Мы применяем полином только к небольшому участку ряда, тому, на котором отдельные точки обладают схожим поведением. Это допущение более оправдано, чем гипотеза о том, что интерполяционный полином, построенный на всех точках ряда, будет и может предсказывать будущее поведение ряда.
Итак, в том случае, когда отдельные наблюдения «выскакивают» из общей закономерности ряда, тогда мы можем сгладить их. Но бывают ситуации, когда этих всплесков или выпадений наблюдается слишком много. При этом их может оказаться так много, что это явление будет статистически значимо. Другими словами, мы видим, что наблюдаемый ряд есть результат протекания двух или более скрытых процессов.
Например, ряд дневных продаж товаров может быть построен как сумма продаж розничной и оптовой торговли. И ясно, что на фоне устойчивых и многочисленных розничных актов розничных продаж, могут быть отдельные всплески оптовых сделок. В этом случае аналитик должен принять решение о корректности поставленной задачи прогнозирования. А именно он должен сказать, будут ли его всплески и падения семантически значимы, и поэтому их следует учесть в природе ряда, или же они есть «досадные» промахи, возникшие при подготовке изучаемого ряда. Действительно, если отдельные аномалии, которые мы признали случайными, и подлежащие исправлению, были устранены, то тогда в ряде остаются только те «выбросы», семантика которых не вписывается в природу ряда — то есть аномалии подготовки данных для прогноза.
Таким образом, процедура сглаживания ряда для прогнозирования это совсем не то, что сглаживание функции, определенной на интервале времени, как это ошибочно полагают начинающие аналитики.
Made on
Tilda