Сглаживание динамических рядов. Сглаженный ряд

таблице 4.

Таблица 4.

Для данного ряда:К=8, L=-8.

8 3.703 3,46

Находим теоретические значения характеристики с (n-2) степенями

t 0,95,n 2=2,365,

т.е. с вероятностью

утверждать, что

имеется тенденция в дисперсии (t K t теор ) и имеется тенденция в среднем, так какt L t теор . Следовательно, можно говорить о наличии тренда во временном

Метод средних

5.3. Методы механического сглаживания временного ряда

Очень часто уровни экономических рядов динамики колеблются, при

этом тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью более четкого выявления тенденции развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых

моделей, производят сглаживание (выравнивание) временных рядов.

Сглаживание всегда включает некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга.

Методы сглаживания временных рядов делятся на две основные группы:

1) механическое выравнивание отдельных уровней временного ряда с

использованием фактических значений соседних уровней.

2) аналитическое выравнивание с использованием кривой, проведенной

между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных

колебаний;

Суть методов механического сглаживания заключается в следующем.

Берется несколько первых уровней временного ряда, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания; с помощью полинома определяются новые, выровненные значения уровней в середине

Метод простой скользящей средней.

Самый простой метод сглаживания - скользящее среднее, в котором

дних членов, где m - ширина интервала сглаживания. Вместо среднего можно использовать медиану значений, попавших в интервал сглаживания.

Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим. Если нужно сохранить более мелкие колебания, интервал сглаживания уменьшают. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным.

Для вычисления сглаженных уровней ряда Y t применяется формула:


			Где p m 1 (при нечетномт);

В результате такой процедуры получаются (n-m+1 )сглаженных значений уровней ряда; при этом первыер и последниер уровней ряда теряются (не сглаживаются). -

При четных значениях т, после процедуры сглаживания обычно поводят центрирование полученного ряда (находят средние значения двух последовательных скользящих средних).

Данный метод применим применим лишь для рядов, имеющих линейную

тенденцию. Если для процесса характерно нелинейное развитие, то простая скользящая средняя может привести к существенным искажениям.

Когда тренд выравниваемого ряда имеет изгибы и для исследователя желательно сохранить волны, то предпочтительной является взвешенная

скользящая средняя. При построении взвешенной скользящей средней на

каждом интервале сглаживания значение центрального уровня заменяется на расчетное, определяемое по формуле взвешенной средней арифметической:


			y tw i

где w i - весовые коэффициенты, определяемы методом наименьших

квадратов, при этом выравнивание на каждом интервале сглаживания осуществляется чаще всего с применением полиномов второго или третьего порядков11 .Например, весовые коэффициенты для интервала 5 будут

следующие: 35 1 [ 3, 12, 17, 12, 3] , а для интервала 7: 21 1 [ 2, 3, 6, 7, 6, 3, 2]

Пример . Задан временной ряд объема выпуска продукции (в тыс. руб). Уровни ряда Y (t ) приведены в таблице 5.

Выберем интервал сглаживания m=3 и проведем сглаживание простой скользящей средней (третья строка таблицы) После сглаживания явно видна возрастающая тенденция.

11 Михтарян В.С., Архипова М.Ю. и др. Эконометрика.: учеб./ под ред. Михтарян В.С. М.: ООО

«Проспект»,2008 , стр. 293

Таблица 5

S(t)ср

S(t)вз

интервал сглаживания

проведем

сглаживание

взвешенной

скользящей средней на основе полинома второй степени

(четвертая

таблицы), используя приведенные

выше весовые

коэффициенты.

Метод экспоненциального сглаживания.

При исследовании экономических данных иногда важным является влияние на процесс более поздних наблюдений. Этот вопрос решает метод

экспоненциального сглаживания. В этом случае текущее значение временного

ряда сглаживается с учетом сглаживающей константы (веса), обычно

обозначаемой. Расчет проводится по следующей формуле:

S t Y t (1) S t 1 , (5.4),

Рассматривая рекуррентный процесс разложения для величин S t 1 ,S t 2 и

т.д. по формуле (5.4), получим:

	) j Y t j (1)t Y 0
S t(1

где j – число периодов отставания от моментаt . Согласно формуле (5.5)

относительный вес каждого предшествующего уровня снижается по экспоненте по мере удаления от момента, для которого вычисляется сглаженное значение.

Отсюда и название данного метода.

При практическом использовании метода возникают проблемы выбора параметра и определения начального уровня Y 0 . Чем больше значение

параметра, тем меньше сказывается влияние предшествующих уровней В каждом конкретном случае необходимо выбирать наиболее приемлемое

значение. Чаще всего это делается на основе проверки нескольких значений.

Задачу выбора начального значения Y 0 решают следующим образом: заY 0

принимается первое значение временного ряда или среднее арифметическое

нескольких первых членов ряда.

Рассмотрим предыдущий пример. Проведем экспоненциальное

сглаживание временного ряда (третья строка табли цы)

Первое сглаженное значение равняется первому уровню ряда.. Следующее сглаженное значение рассчитываем согласно формуле (5.3), где

Очень часто, урони рядов динамики колеблются, при этом тенденция развития явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью более четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание ) временных рядов.

Методы сглаживания временных рядов делятся на две основные группы:

1. аналитическое выравнивание с использованием кривой, проведенной между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных колебаний;

2. механическое выравнивание отдельных уровней временного ряда с использованием фактических значений соседних уровней.

Суть методов механического сглаживания заключается в следующем. Берется несколько уровней временного ряда, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания; с помощью полинома определяются новые, выровненные значения уровней в середине интервала сглаживания. Далее интервал сглаживания сдвигается на один уровень ряда вправо, вычисляется следующее сглаженное значение и так далее.

Самым простым методом механического сглаживания является метод простой скользящей средней.

2.4.1. Метод простой скользящей средней.

Сначала для временного ряда: определяется интервал сглаживания . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания.

Для первых уровней ряда вычисляется их среднее арифметическое. Это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление среднего арифметического и так далее. Для вычисления сглаженных уровней ряда применяется формула:

где (при нечетном ); для четных формула усложняется.

В результате такой процедуры получаются сглаженных значений уровней ряда; при этом первые и последние уровней ряда теряются (не сглаживаются). Другой недостаток метода в том, что он применим лишь для рядов, имеющих линейную тенденцию.

2.4.2. Метод взвешенной скользящей средней.

Метод взвешенной скользящей средней отличается от предыдущего метода сглаживания тем, что уровни, входящие в интервал сглаживания, суммируются с разными весами. Это связано с тем, что аппроксимация ряда в пределах интервала сглаживания осуществляется с использованием полинома не первой степени, как в предыдущем случае, а степени начиная со второй.

Используется формула средней арифметической взвешенной:

причем веса определяются с помощью метода наименьших квадратов. Эти веса рассчитаны для различных степеней аппроксимирующего полинома и различных интервалов сглаживания.

1. для полиномов второго и третьего порядков числовая последовательность весов при интервале сглаживания имеет вид: , а при имеет вид: ;

2. для полиномов четвертой и пятой степеней и при интервале сглаживания последовательность весов выглядит следующим образом: .

Распределение весов на протяжении интервала сглаживания, полученное на основе метода наименьших квадратов см. на диаграмме 1.

2.4.3. Метод экспоненциального сглаживания.

К той же группе методов относится метод экспоненциального сглаживания.

Его особенность заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Если для исходного временного ряда

соответствующие сглаженные значения обозначить через , то экспоненциальное сглаживание осуществляется по формуле:

где параметр сглаживания ; величина называется коэффициентом дисконтирования.

Используя, приведенное рекуррентное соотношение для всех уровней ряда, начиная с первого и кончая моментом времени , можно получить, что экспоненциальная средняя, то есть сглаженное данным методом значение уровня ряда, является взвешенной средней всех предшествующих уровней.

Углубленный анализ временных рядов требует использования более сложных методик математической статистики. При наличии в динамических рядах значительной случайной ошибки (шума) применяют один из двух простых приемов - сглаживание или выравнивание путем укрупнения интервалови вычисления групповых средних. Этот метод позволяет повысить наглядность ряда, если большинство «шумовых» составляющих находятся внутри интервалов. Однако, если «шум» не согласуется с периодичностью, распределение уровней показателей становится грубым, что ограничивает возможности детального анализа изменения явления во времени.

Более точные характеристики получаются, если используют скользящие средние - широко применяемый способ для сглаживания показателей среднего ряда. Он основан на переходе от начальных значений ряда к средним в определенном интервале времени. В этом случае интервал времени при вычислении каждого последующего показателя как бы скользит по временному ряду.

Применение скользящего среднего полезно при неопределенных тенденциях динамического ряда или при сильном воздействии на показатели циклически повторяющихся выбросов (резко выделяющиеся варианты или интервенция).

Чем больше интервал сглаживания, тем более плавный вид имеет диаграмма скользящих средних. При выборе величины интервала сглаживания необходимо исходить из величины динамического ряда и содержательного смысла отражаемой динамики. Большая величина динамического ряда с большим числом исходных точек позволяет использовать более крупные временные интервалы сглаживания (5, 7, 10 и т.д.). Если процедура скользящего среднего используется для сглаживания не сезонного ряда, то чаще всего величину интервала сглаживания принимают равной 3 или 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - отличная возможность выбрать авиакомпанию на перелет из Москвы в Нью-Йорк

Приведем пример вычисления скользящего среднего числа хозяйств с высокой урожайностью (более 30 ц/га) (табл. 10.3).

Таблица 10.3 Сглаживание динамического ряда укрупнением интервалов искользящим средним

Учетный год	Число хозяйств с высокой урожайностью	Суммы за три года	Скользящие за три года	Скользящие средние

			90,0	89,7
1984				88,7
				87,3
			87,3	87,0
				86,7
				83,0
			83,0	82,3
				82,3
				82,6
			82,7	82,7

Примеры вычисления скользящего среднего:

1982 г.(84 + 94 + 92) / 3 = 90,0;

1983 г. (94 + 92 + 83) / 3 = 89,7;

1984 г.(92 + 83 + 91) / 3 = 88,7;

1985 г.(83 + 91 + 88) / 3 = 87,3.

Составляется график. На оси абсцисс указываются годы, на оси ординат - число хозяйств с высокой урожайностью. Указываются координаты числа хозяйств на графике и соединяют полученные точки ломаной линией. Затем указываются координаты скользящей средней по годам на графике и соединяются точки плавной полужирной линией.

Более сложным и результативным методом является сглаживание (выравнивание) рядов динамики с помощью различных функций аппроксимации. Они позволяют формировать плавный уровень общей тенденции и основную ось динамики.

Наиболее эффективным методом сглаживания с помощью математических функций является простое экспоненциальное сглаживание. Этим методом учитываются все предшествующие наблюдения ряда по формуле:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

где S t - каждое новое сглаживание в момент времени t ; S t - 1 - сглаженное значение в предыдущий момент времени t -1; X t - фактическое значение ряда в момент времени t ; α - параметр сглаживания.

Если α = 1, то предыдущие наблюдения полностью игнорируются; при величине α = 0 игнорируются текущие наблюдения; значения α между 0 и 1 дают промежуточные результаты. Изменяя значения этого параметраможно подобрать наиболее приемлемый вариант выравнивания. Выбор оптимального значения α осуществляется путем анализа полученных графических изображений исходной и выравненной кривых, либо на основе учета суммы квадратов ошибок (погрешностей) вычисленных точек. Практическое использование этого метода следует проводить с использованием ЭВМ в программе MS Excel . Математическое выражение закономерности динамики данных можно получить с помощью функции экспоненциального сглаживания.

Экстраполяция - это метод научного исследования, который основан на распространении прошлых и настоящих тенденций, закономерностей, связей на будущее развитие объекта прогнозирования. К методам экстраполяции относятся метод скользящей средней, метод экспоненциального сглаживания, метод наименьших квадратов.

Метод скользящих средних является одним из широко известных методов сглаживания временных рядов. Применяя этот метод, можно элиминировать случайные колебания и получить значения, соответствующие влиянию главных факторов.

Сглаживание с помощью скользящих средних основано на том, что в средних величинах взаимно погашаются случайные отклонения. Это происходит вследствие замены первоначальных уровней временного ряда средней арифметической величиной внутри выбранного интервала времени. Полученное значение относится к середине выбранного интервала времени (периода).

Затем период сдвигается на одно наблюдение, и расчет средней повторяется. При этом периоды определения средней берутся все время одинаковыми. Таким образом, в каждом рассматриваемом случае средняя центрирована, т.е. отнесена к серединной точке интервала сглаживания и представляет собой уровень для этой точки.

При сглаживании временного ряда скользящими средними в расчетах участвуют все уровни ряда. Чем шире интервал сглаживания, тем более плавным получается тренд. Сглаженный ряд короче первоначального на (n–1) наблюдений, где n – величина интервала сглаживания.

При больших значениях n колеблемость сглаженного ряда значительно снижается. Одновременно заметно сокращается количество наблюдений, что создает трудности.

Выбор интервала сглаживания зависит от целей исследования. При этом следует руководствоваться тем, в какой период времени происходит действие, а следовательно, и устранение влияния случайных факторов.

Данный метод используется при краткосрочном прогнозировании. Его рабочая формула:

Пример применения метода скользящей средней для разработки прогноза

Задача . Имеются данные, характеризующие уровень безработицы в регионе, %

Постройте прогноз уровня безработицы в регионе на ноябрь, декабрь, январь месяцы, используя методы: скользящей средней, экспоненциального сглаживания, наименьших квадратов.
Рассчитайте ошибки полученных прогнозов при использовании каждого метода.
Сравните полученные результаты, сделайте выводы.

Решение методом скользящей средней

Для расчета прогнозного значения методом скользящей средней необходимо:

1. Определить величину интервала сглаживания, например равную 3 (n = 3).

2. Рассчитать скользящую среднюю для первых трех периодов
m фев = (Уянв + Уфев + У март)/ 3 = (2,99+2,66+2,63)/3 = 2,76
Полученное значение заносим в таблицу в средину взятого периода.
Далее рассчитываем m для следующих трех периодов февраль, март, апрель.
m март = (Уфев + Умарт + Уапр)/ 3 = (2,66+2,63+2,56)/3 = 2,62
Далее по аналогии рассчитываем m для каждых трех рядом стоящих периодов и результаты заносим в таблицу.

3. Рассчитав скользящую среднюю для всех периодов, строим прогноз на ноябрь по формуле:

где t + 1 – прогнозный период; t – период, предшествующий прогнозному периоду (год, месяц и т.д.); Уt+1 – прогнозируемый показатель; mt-1 – скользящая средняя за два периода до прогнозного; n – число уровней, входящих в интервал сглаживания; Уt – фактическое значение исследуемого явления за предшествующий период; Уt-1 – фактическое значение исследуемого явления за два периода, предшествующих прогнозному.

У ноябрь = 1,57 + 1/3 (1,42 – 1,56) = 1,57 – 0,05 = 1,52
Определяем скользящую среднюю m для октября.
m = (1,56+1,42+1,52) /3 = 1,5
Строим прогноз на декабрь.
У декабрь = 1,5 + 1/3 (1,52 – 1,42) = 1,53
Определяем скользящую среднюю m для ноября.
m = (1,42+1,52+1,53) /3 = 1,49
Строим прогноз на январь.
У январь = 1,49 + 1/3 (1,53 – 1,52) = 1,49
Заносим полученный результат в таблицу.

Рассчитываем среднюю относительную ошибку по формуле:

ε = 9,01/8 = 1,13% точность прогноза высокая.

Далее решим данную задачу методами экспоненциального сглаживания и наименьших квадратов . Сделаем выводы.

Перейдем к вопросу о сглаживании временных рядов экономических показателей. Очень часто уровни рядов динамики колеблются, при этом тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание) временных рядов. Таким образом, сглаживание можно рассматривать как устранение случайной составляющей  t из модели временного ряда.

Самым простым методом механического сглаживания является метод простой скользящей средней. Сначала для временного ряда y 1 , y 2 , y 3 ,…, y n определяется интервал сглаживания т (т < п). Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Для первых т уровней временного ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т.д.

Для вычисления сглаженных уровней ряда применяется формула

при нечетном m ;

для четных т формула усложняется.

В результате такой процедуры получаются п - т + 1 сглаженных значений уровней ряда; при этом первые р и последние р уровней ряда теряются (не сглаживаются).

Особенность метода экспоненциального сглаживания заключается в том, что в процедуре нахождения сглаживания i -го уровня используются значения только предшествующих уровней ряда (i -1, i -2,…), взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Если для исходного временного ряда y 1 , y 2 , y 3 ,…, y n соответствующие сглаженные значения уровней обозначить через S t , t = 1,2, …, п, то экспоненциальное сглаживание осуществляется по формуле

здесь S 0 – величина, характеризующая начальные условия.

В практических задачах обработки экономических временных рядов рекомендуется выбирать величину параметра сглаживания в интервале от 0,1 до 0,3.

Пример 4.4. Вернемся к примеру 1, в котором рассматриваются квартальные объемы продаж компании «Lewplan». Мы уже выяснили, что этим данным отвечает аддитивная модель, т.е. фактически объемы продаж можно выразить следующим образом:

Y = U + V + E.

Для того чтобы элиминировать влияние сезонной компоненты, воспользуемся методом скользящей средней. Просуммировав первые четыре значения, получим общий объем продаж в 1998 г. Если поделить эту сумму на четыре, можно найти средний балл продаж в каждом квартале 1998 г., т.е.

(239 + 201 +182 + 297)/4 = 229,75;
(201+182+297+324)/4 и т. д.

Полученное значение уже не содержит сезонной компоненты, поскольку представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, т.е. для точки, лежащей в середине между кварталами II и III. Если последовательно передвигаться вперед с интервалом в три месяца, можно рассчитать средние квартальные значения на промежутке апрель – март 1998 (251), июль – июнь 1998 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по четырем точкам для исходного множества данных. Получаемое таким образом множество скользящих средних представляет наилучшую оценку искомого тренда.

Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем:

Y – U = V + E .

К сожалению, оценки значений тренда, полученные в результате расчета средних по четырем точкам, относятся к нескольким иным моментам времени, чем фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 1998 г., т.е. лежит в центре промежутка фактических значений объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же требуются десезонализированные средние значения, соответствующие тем же интервалам времени, что и фактические значения за квартал. Положение десезонализированных средних во времени сдвигается путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из первой оценок, центрируя их на июль – сентябрь 1998 г., т.е.

(229,75 + 251)/2 = 240,4.

Это и есть десезонализированная средняя за июль – сентябрь 1999 г. Эту десезонализированную величину, которая называется центрированной скользящей средней , можно непосредственно сравнивать с фактическим значением за июль – сентябрь 1998 г., равным 182. Отметим, что это означает отсутствие оценок тренда за первые два или последние два квартала временного ряда. Результаты этих расчетов приведены в табл.4.5.

Для каждого квартала мы имеем оценки сезонной компоненты, которые включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Эта процедура позволит уменьшить некоторые значения ошибок. Наконец, скорректируем средние значения, увеличивая или уменьшая их на одно и тоже число таким образом, чтобы общая их сумма была равна нулю. Это необходимо, чтобы усреднить значения сезонной компоненты в целом за год.

Таблица 4.5. Оценка сезонной компоненты

	Объем продаж Y , тыс. шт.	за четыре квартала	Скользящая средняя за четыре квартала	Центрированная скользящая средняя U	сезонной компоненты Y - U = V + E
Январь-март 1998
Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 1999

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 2000

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь
Январь-март 2001

Таблица 4.6. Расчет средних значений сезонной компоненты

Рассчитываемые компоненты	Номер квартала



Среднее значение
Оценка сезонной компоненты		Сумма = -0,2
Скорректированная сезонная компонента 1

Корректирующий фактор рассчитывается следующим образом: сумма оценок сезонных компонент делится на 4. В последнем столбце табл. 4.5 эти оценки записаны под соответствующими квартальными значениями. Сама процедура приведена в табл. 4.6.

Значение сезонной компоненты еще раз подтверждает наши выводы, сделанные в примере 4.1 на основе анализа диаграммы. Объемы продаж за два зимних квартала превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс.шт. соответственно.

Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезона выступают дни недели, для элиминирования влияния ежедневной сезонной компоненты также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, т.е. в четверг; таким образом, необходимость в процедуре центрирования отпадает.