Форум студентів мті - показати повідомлення окремо - економетрика. Розрахунок показників динаміки економічних процесів

таблиці 4.

Таблиця 4.

Для цього ряду: К = 8, L = -8.

8 3.703 3,46

Знаходимо теоретичні значення характеристики з (n-2) ступенями

t 0,95,n 2=2,365,

тобто. з ймовірністю

стверджувати, що

є тенденція в дисперсії (t K t теор) і є тенденція в середньому, тому що t L t теор. Отже, можна говорити про наявність тренду у тимчасовому

Метод середніх

5.3. Методи механічного згладжування часового ряду

Дуже часто рівні економічних рядів динаміки коливаються,

цьому тенденція розвитку економічного явища у часі прихована випадковими відхиленнями рівнів у той чи інший бік. З метою більш чіткого виявлення тенденції розвитку досліджуваного процесу, у тому числі для подальшого застосування методів прогнозування на основі трендових

моделей, виробляють згладжування (вирівнювання)тимчасових рядів.

Згладжування завжди включає певний спосіб локального усереднення даних, у якому несистематичні компоненти взаємно погашають одне одного.

Методи згладжування часових рядів поділяються на дві основні групи:

1) механічне вирівнювання окремих рівнів часового ряду з

використанням фактичних значень сусідніх рівнів.

2) аналітичне вирівнювання з використанням кривої, проведеної

між конкретними рівнями ряду так, щоб вона відображала тенденцію, властиву ряду, і одночасно звільняла його від незначних

коливань;

Суть методів механічного згладжування полягає у наступному.

Береться кілька перших рівнів часового ряду, що утворюють інтервал згладжування.Для них підбирається поліном, ступінь якого має бути меншим за кількість рівнів, що входять в інтервал згладжування; за допомогою полінома визначаються нові, вирівняні значення рівнів у середині

Метод простий ковзної середньої.

Найпростіший метод згладжування - ковзне середнє,в якому

членів, де m - ширина інтервалу згладжування. Замість середнього можна використовувати медіану значень, що потрапили до інтервалу згладжування.

Якщо необхідно згладити дрібні безладні коливання, то інтервал згладжування беруть якомога більшим. Якщо потрібно зберегти дрібніші коливання, зменшують інтервал згладжування. За інших рівних умов інтервал згладжування рекомендується брати непарним.

Для обчислення згладжених рівнів ряду Y t застосовується формула:

Де p m 1 (при непарному);

В результаті такої процедури виходять (n-m+1) згладжених значень рівнів ряду; при цьому першір і останній рівнів ряду губляться (не згладжуються). -

При парних значенняхт, після процедури згладжування зазвичай поводять центрування отриманого ряду (знаходять середні значення двох послідовних ковзних середніх).

Даний метод застосовується тільки для рядів, що мають лінійну

тенденцію. Якщо процесу характерний нелінійний розвиток, то проста ковзна середня може призвести до істотних спотворень.

Коли тренд вирівнюваного ряду має вигини і для дослідника бажано зберегти хвилі, то кращою є зважена

ковзна середня. При побудові зваженої ковзної середньої на

кожному інтервалі згладжування значення центрального рівня замінюється на розрахункове, що визначається за формулою зваженої середньої арифметичної:

y tw i

де w i - вагові коефіцієнти, що визначаються методом найменших

квадратів, при цьому вирівнювання на кожному інтервалі згладжування здійснюється найчастіше із застосуванням поліномів другого або третього порядків11 .Наприклад, вагові коефіцієнти для інтервалу 5 будуть

наступні: 35 1 [3, 12, 17, 12, 3], а для інтервалу 7: 21 1 [2, 3, 6, 7, 6, 3, 2]

Приклад. Заданий часовий ряд обсягу випуску продукції (у тис. руб). Рівні ряду Y (t) наведені у таблиці 5.

Виберемо інтервал згладжування m=3 і проведемо згладжування простої ковзної середньої (третій рядок таблиці) Після згладжування явно видно тенденцію, що зростає.

11 Міхтарян В.С., Архіпова М.Ю. та ін. Економетріка.: Навч. / За ред. Міхтарян В.С. М: ТОВ

«Проспект», 2008, стор 293

Таблиця 5

S(t)ср

S(t)вз

інтервал згладжування

проведемо

згладжування

зваженою

ковзної середньої на основі полінома другого ступеня

(четверта

таблиці), використовуючи наведені

вище вагові

Коефіцієнти.

Метод експонентного згладжування.

Під час дослідження економічних даних іноді важливим є впливом геть процес пізніших спостережень. Це питання вирішує метод

експонентного згладжування. У цьому випадку поточне значення тимчасового

ряду згладжується з урахуванням константи, що згладжує (ваги), зазвичай

позначається. Розрахунок проводиться за такою формулою:

S t Y t (1) S t 1 , (5.4),

Розглядаючи рекурентний процес розкладання для величин S t 1 ,S t 2 і

і т.д. за формулою (5.4), отримаємо:

) j Y t j (1) t Y 0

S t(1

де j - Число періодів відставання від моменту t. Згідно з формулою (5.5)

відносна вага кожного попереднього рівня знижується за експонентом у міру віддалення від моменту, для якого обчислюється згладжене значення.

Звідси і назва цього методу.

При практичному використанні методу виникають проблеми вибору параметра та визначення початкового рівня Y0. Чим більше значення

параметра, тим менше впливає попередніх рівнів У кожному конкретному випадку необхідно вибирати найбільш прийнятне

значення. Найчастіше це робиться на основі перевірки кількох значень.

Завдання вибору початкового значення Y 0 вирішують так: за Y 0

приймається перше значення часового ряду або середнє арифметичне

кількох перших членів низки.

Розглянемо попередній приклад. Проведемо експоненційне

згладжування часового ряду (третій рядок таблиці)

Перше згладжене значення дорівнює першому рівню ряду. Наступне згладжене значення розраховуємо згідно з формулою (5.3), де

Перейдемо до питання згладжування тимчасових рядів економічних показників. Найчастіше рівні рядів динаміки коливаються, у своїй тенденція розвитку економічного явища у часі прихована випадковими відхиленнями рівнів у той чи інший бік. З метою чітко виявити тенденцію розвитку досліджуваного процесу, у тому числі для подальшого застосування методів прогнозування на основі трендових моделей, виробляють згладжування (вирівнювання) часових рядів. Таким чином, згладжування можна розглядати як усунення випадкової складової tз моделі часового ряду.

Найпростішим методом механічного згладжування є метод простий ковзної середньої.Спочатку для тимчасового ряду y 1 , y 2 , y 3 ,…, y n визначається інтервал згладжування т (т< п). Якщо необхідно згладити дрібні безладні коливання, то інтервал згладжування беруть якомога більшим; інтервал згладжування зменшують, якщо потрібно зберегти дрібніші коливання. За інших рівних умов інтервал згладжування рекомендується брати непарним. Для перших трівнів часового ряду обчислюється їхня середня арифметична; це буде згладжене значення рівня ряду, що знаходиться всередині інтервалу згладжування. Потім інтервал згладжування зсувається на один рівень праворуч, повторюється обчислення середньої арифметичної і т.д.

Для обчислення згладжених рівнів ряду застосовується формула

при непарному m;

для парних тформула ускладнюється.

В результаті такої процедури виходять п - т + 1 згладжених значень рівнів ряду; при цьому перші рта останні ррівнів ряду губляться (не згладжуються).

Особливість методу експоненційногозгладжуванняполягає в тому, що у процедурі знаходження згладжування i-го рівня використовуються значення лише попередніх рівнів ряду ( i-1, i-2,…), узяті з певною вагою, причому вага спостереження зменшується в міру видалення його від часу, для якого визначається згладжене значення рівня ряду.

Якщо для вихідного часового ряду y 1 , y 2 , y 3 ,…, y nвідповідні згладжені значення рівнів позначити через S t , t = 1,2, …, п,то експоненційне згладжування здійснюється за формулою

тут S 0 - Величина, що характеризує початкові умови.

У практичних завданнях обробки економічних часових рядів рекомендується вибирати величину параметра згладжування інтервалі від 0,1 до 0,3.

Приклад 4.4.Повернемося до прикладу 1, у якому розглядаються квартальні обсяги продажів компанії Lewplan. Ми з'ясували, що цим даним відповідає адитивна модель, тобто. Фактично обсяги продажів можна виразити так:

Y = U + V + E.

Для того щоб елімінувати вплив сезонної компоненти, скористаємося методом ковзної середньої. Просумувавши перші чотири значення, отримаємо загальний обсяг продажу 1998 р. Якщо розділити цю суму чотирма, можна знайти середній бал продажів кожному кварталі 1998 р., тобто.

(239 + 201 +182 + 297)/4 = 229,75;
(201+182+297+324)/4 тощо.

Отримане значення вже не містить сезонної компоненти, оскільки є середньою величиною за рік. В Україні з'явилася оцінка значення тренду для середини року, тобто. для точки, що лежить у середині між кварталами II та III. Якщо послідовно пересуватися вперед з інтервалом три місяці, можна розрахувати середні квартальні значення проміжку квітень – березень 1998 (251), липень – червень 1998 (270,25) тощо. Дана процедура дозволяє генерувати ковзні середні по чотирьох точках для вихідної множини даних. Отримуване таким чином безліч ковзних середніх представляє найкращу оцінку тренда, що шукається.

Тепер отримані значення тренду можна використовуватиме знаходження оцінок сезонної компоненти. Ми розраховуємо:

YU = V + E.

На жаль, оцінки значень тренда, отримані в результаті розрахунку середніх по чотирьох точках, відносяться до кількох інших моментів часу, ніж фактичні дані. Перша оцінка, що дорівнює 229,75, є крапкою, що збігається з серединою 1998 р., тобто. лежить у центрі проміжку фактичних значень обсягів продажу у ІІ та ІІІ кварталах. Друга оцінка, що дорівнює 251, лежить між фактичними значеннями у III та IV кварталах. Нам же потрібні десезоналізовані середні значення, що відповідають тим самим інтервалам часу, що й фактичні значення за квартал. Положення десезоналізованих середніх у часі зсувається шляхом подальшого розрахунку середніх кожної пари значень. Знайдемо середню з перших оцінок, центруючи їх у липень – вересень 1998 р., тобто.

(229,75 + 251)/2 = 240,4.

Це і є десезоналізована середня за липень – вересень 1999 р. Цю десезоналізовану величину, яка називається центрованої ковзної середньої, Можна безпосередньо порівнювати з фактичним значенням за липень – вересень 1998, рівним 182. Зазначимо, що це означає відсутність оцінок тренду за перші два або останні два квартали тимчасового ряду. Результати цих розрахунків наведено у табл.4.5.

Для кожного кварталу ми маємо оцінки сезонної компоненти, які включають помилку або залишок. Перш ніж ми зможемо використовувати сезонну компоненту, потрібно пройти два наступні етапи. Знайдемо середні значення сезонних оцінок кожного сезону року. Ця процедура дозволить зменшити деякі значення помилок. Нарешті, скоригуємо середні значення, збільшуючи або зменшуючи їх на одне і те ж число таким чином, щоб загальна їх сума дорівнювала нулю. Це необхідно, щоб усереднити значення сезонної компоненти загалом за рік.

Таблиця 4.5. Оцінка сезонної компоненти

Обсяг продажів Y, тис. Шт.

за чотири

кварталу

Ковзаюча

середня за чотири

кварталу

Центрована ковзна середня U

сезонної компоненти

Y- U= V+ E

Січень-березень 1998

Квітень-червень

Липень-вересень

Жовтень-грудень

Січень-березень 1999

Квітень-червень

Липень-вересень

Жовтень-грудень

Січень-березень 2000

Квітень-червень

Липень-вересень

Жовтень-грудень

Січень-березень 2001

Таблиця 4.6. Розрахунок середніх значень сезонної компоненти

Розраховані

компоненти

Номер кварталу

Середнє значення

Оцінка сезонної

компоненти

Сума = -0,2

Скоригована

сезонна компонента 1

Коригуючий фактор розраховується так: сума оцінок сезонних компонент ділиться на 4. В останньому стовпці табл. 4.5 ці оцінки записані під відповідними квартальними значеннями. Сама процедура наведена у табл. 4.6.

Значення сезонної компоненти вкотре підтверджує наші висновки, зроблені з прикладу 4.1 з урахуванням аналізу діаграми. Обсяги продажів за два зимові квартали перевищують середнє трендове значення приблизно на 40 тис. шт., а обсяги продажів за два літні періоди нижчі від середніх на 21 і 62 тис.шт. відповідно.

Аналогічна процедура застосовна щодо сезонної варіації за будь-який проміжок часу. Якщо, наприклад, як сезон виступають дні тижня, для елімінування впливу щоденної сезонної компоненти також розраховують ковзну середню, але вже не по чотирьох, а по семи точках. Ця ковзна середня є значення тренда у середині тижня, тобто. у четвер; таким чином, потреба у процедурі центрування відпадає.

Міністерство освіти Російської Федерації

Всеросійський заочний фінансово – економічний інститут

Ярославська філія

Кафедра статистики

Курсова робота

з дисципліни:

Статистика

завдання №19

Студент: Курашова Анастасія Юріївна

Спеціальність «Фінанси та кредит»

3 курс, периферія

Керівник: Сергєєв В.П.

Ярославль, 2002 р.

1. Вступ……………………………………………………………3 стор.

2. Теоретична частина…………………………………………… …4 стор.

2.1 Основні поняття про ряди динаміки…………………………...4 стор.

2.2 Методи згладжування та вирівнювання динамічних рядів……………………………………………………………….6 стор.

2.2.1 Методи «механічного згладжування»………………………6 стор.

2.2.2 Методи «аналітичного» вирівнювання…………………. 8 стор.

3. Розрахункова частина……………………………………………… ……11 стор.

4. Аналітична частина……………………………………………. .16 стор.

5. Висновок ………………………………………………………. 25 стор.

6. Список літератури……………………………………………… 26 стор.

7. Додатки………………………………………………………. 27 стор.


Вступ

Повна та достовірна статистична інформація є тією необхідною підставою, на якій базується процес управління економікою. Вся інформація, що має народногосподарську значущість, зрештою, обробляється та аналізується за допомогою статистики.

Саме статистичні дані дозволяють визначити обсяги валового внутрішнього продукту та національного доходу, виявити основні тенденції розвитку галузей економіки, оцінити рівень інфляції, проаналізувати стан фінансових та товарних ринків, дослідити рівень життя населення та інші соціально-економічні явища та процеси.

Опанування статистичної методологією - одна з умов пізнання кон'юнктури ринку, вивчення тенденцій та прогнозування, прийняття оптимальних рішень на всіх рівнях діяльності.

Складною, трудомісткою та відповідальною є заключна, аналітична стадія дослідження. На цій стадії розраховуються середні показники та показники розподілу, аналізується структура сукупності, досліджується динаміка та взаємозв'язок між досліджуваними явищами та процесами.

На всіх стадіях дослідження статистика використовує різноманітні методи. Методи статистики – це особливі прийоми та способи вивчення масових суспільних явищ.

I. Теоретична частина.

1.1 Основні поняття про лави динаміки.

Ряди динаміки - статистичні дані, що відображають розвиток у часі явища, що вивчається. Їх також називають динамічними рядами, часовими рядами.

У кожному ряді динаміки є два основні елементи:

1) показник часу t;

2) відповідні їм рівні розвитку досліджуваного явища y;

Як показання часу у лавах динаміки виступають або певні дати (моменти), або окремі періоди (роки, квартали, місяці, доба).

Рівні рядів динаміки відображають кількісну оцінку (захід) розвитку в часі явища, що вивчається. Вони можуть виражатися абсолютними, відносними чи середніми величинами.

Ряди динаміки розрізняються за такими ознаками:

1) За часом. Залежно від характеру явища, що вивчається, рівні рядів динаміки можуть ставитися або до певних дат (моментів) часу, або до окремих періодів. Відповідно до цього ряди динаміки поділяються на моментні та інтервальні.

Моментні ряди динаміки відображають стан явищ, що вивчаються на певні дати (моменти) часу. Прикладом моментного ряду динаміки є така інформація про облікову чисельність працівників магазину 1991 року (таб. 1):

Таблиця 1

Облікова кількість працівників магазину в 1991 році

Особливістю моментного низки динаміки і те, що у рівні можуть входити одні й самі одиниці досліджуваної сукупності. Хоча й у моментному ряду є інтервали – проміжки між сусідніми ряду датами, – величина тієї чи іншої конкретного рівня залежить від тривалості періоду між двома датами. Так, основна частина персоналу магазину, що становить облікову чисельність на 1.01.1991, що продовжує працювати протягом цього року, відображена в рівнях наступних періодів. Тому під час підсумовування рівнів моментного ряду може виникнути повторний рахунок.

За допомогою моментних рядів динаміки в торгівлі вивчаються товарні запаси, стан кадрів, кількість обладнання та інших показників, що відображають стан явищ, що вивчаються на окремі дати (моменти) часу.

Інтервальні ряди динаміки відбивають підсумки розвитку (функціонування) досліджуваних явищ окремі періоди (інтервали) часу.

Прикладом інтервального ряду можуть бути дані про роздрібний товарообіг магазину 1987 – 1991 гг. (таб. 2):

Таблиця 2

Обсяг роздрібного товарообігу магазину 1987 - 1991 гг.

Обсяг роздрібного товарообігу, тис. н.

885.7 932.6 980.1 1028.7 1088.4

Кожен рівень інтервального ряду вже є сумою рівнів за більш короткі проміжки часу. У цьому одиниця сукупності, що входить до складу одного рівня, не входить до складу інших рівнів.

Особливістю інтервального ряду динаміки і те, кожен його рівень складається з даних більш короткі інтервали (субперіоди) часу. Наприклад, підсумовуючи товарообіг за перші три місяці року, отримують його обсяг за I квартал, а підсумовуючи товарообіг за чотири квартали, отримують його величину за рік, і т. д. якого цей рівень належить.

Властивість підсумовування рівнів за послідовні інтервали часу дозволяє отримати ряд динаміки більш укрупнених періодів.

За допомогою інтервальних рядів динаміки в торгівлі вивчають зміни у часі надходження та реалізації товарів, суми витрат обігу та інших показників, що відображають результати функціонування явища, що вивчається, за окремі періоди.

Структура низки динаміки:

Будь-який ряд динаміки теоретично може бути представлений у вигляді складових:

1) тренд - основна тенденція розвитку динамічного ряду (до збільшення або зниження його рівнів);

2) циклічні (періодичні коливання, зокрема сезонні);

випадкові коливання.

1. 2. Методи згладжування та вирівнювання динамічних рядів.

Виняток випадкових коливань значень рівнів низки здійснюється з допомогою знаходження «усереднених» значень. Способи усунення випадкових факторів поділяються на дві більше групи:

1. Способи «механічного» згладжування коливань шляхом усереднення значень ряду щодо інших, розташованих поряд, рівнів ряду.

2. Способи «аналітичного» вирівнювання, т. е. визначення спочатку функціонального вираження тенденції низки, та був нових, розрахункових значень ряду.

1.2. 1 Методи "механічного" згладжування.

Сюди відносяться:

а. Метод усереднення по двох половинах ряду, коли ряд ділиться на дві частини. Потім, розраховуються два значення середніх рівнів низки, якими графічно визначається тенденція ряду. Вочевидь, що такий тренд мало повно відбиває основну закономірність розвитку явища.

б. Метод укрупнення інтервалів, у якому виробляється збільшення протяжності часових проміжків, і розраховуються нові значення рівнів ряду.

в. Метод ковзної середньої. Даний метод застосовується для характеристики тенденції розвитку досліджуваної статистичної сукупності та ґрунтується на розрахунку середніх рівнів низки за певний період. Послідовність визначення ковзної середньої:

Встановлюється інтервал згладжування або кількість рівнів, що входять до нього. Якщо при розрахунку середньої враховуються три рівні, середня ковзна називається тричленної, п'ять рівнів - п'ятичленної і т.д. Якщо згладжуються дрібні, безладні коливання рівнів у ряді динаміки, то інтервал (число ковзної середньої) збільшують. Якщо хвилі слід зберегти, кількість членів зменшують.

Обчислюють перший середній рівень за арифметичною простою:

y1 = Sy1/m, де

y1 - перший рівень ряду;

m – членність ковзної середньої.

Перший рівень відкидають, а обчислення середньої включають рівень, що йде за останнім рівнем, що бере участь у першому розрахунку. Процес триває доти, доки до розрахунку y буде включений останній рівень досліджуваного ряду динаміки y n .

За низкою динаміки, побудованому із середніх рівнів, виявляють загальну тенденцію розвитку явища.

Негативною стороною використання методу ковзної середньої є утворення зрушень у коливаннях рівнів ряду, зумовлених «ковзанням» інтервалів укрупнення. Згладжування за допомогою ковзної середньої може призвести до появи «зворотних» коливань, коли опукла «хвиля» замінюється на увігнуту.

Останнім часом почала розраховуватися адаптивна ковзна середня. Її відмінність полягає в тому, що середнє значення ознаки, що розраховується як описано вище, відноситься не до середини ряду, а до останнього проміжку часу в інтервалі укрупнення. Причому передбачається, що адаптивна середня залежить від попереднього рівня меншою мірою, ніж від поточного. Тобто чим більше проміжків часу між рівнем ряду і середнім значенням, тим менший вплив надає значення цього рівня ряду на величину середньої.

г. Метод експоненційної середньої. Експонентна середня – це адаптивна ковзна середня, розрахована із застосуванням ваг, що залежать від ступеня «віддаленості» окремих рівнів ряду від середнього значення. Величина ваги зменшується в міру видалення рівня за хронологічною прямою від середнього значення відповідно до експоненційної функції, тому така середня називається експоненційною. Насправді застосовується багаторазове експоненційне згладжування низки динаміки, що використовується для прогнозування розвитку явища.

Висновок: методи, включені до першої групи, зважаючи на застосовувані методики розрахунку надають досліднику дуже спрощене, неточне, уявлення про тенденції у ряді динаміки. Проте коректне застосування цих методів вимагає від дослідника глибини знання динаміку різних соціально - економічних явищ.

16.02.15 Віктор Гаврилов

38133 0

Тимчасовим рядом називається послідовність значень, що змінюються у часі. Про деякі прості, але ефективні підходи до роботи з подібними послідовностями я спробую розповісти в цій статті. Прикладів таких даних можна зустріти дуже багато – котирування валют, обсяги продажу, звернення клієнтів, дані у різних прикладних науках (соціологія, метеорологія, геологія, спостереження у фізиці) та багато іншого.

Ряди є поширеною і важливою формою опису даних, оскільки дозволяють спостерігати всю історію зміни значення, що нас цікавить. Це дає нам можливість судити про «типову» поведінку величини та про відхилення від такої поведінки.

Переді мною постало завдання вибрати набір даних, на якому можна було б продемонструвати особливості тимчасових рядів. Я вирішив скористатися статистикою пасажиропотоку на міжнародних авіалініях, оскільки цей набір даних дуже наочний і став свого роду стандартним (http://robjhyndman.com/tsdldata/data/airpass.dat, джерело Time Series Data Library, RJ Hyndman). Ряд визначає кількість пасажирів міжнародних авіаліній на місяць (у тисячах) за період з 1949 по 1960 роки.

Оскільки в мене завжди під рукою, в якій є цікавий інструмент для роботи з рядами, я скористаюся саме ним. Перед імпортуванням даних у файл потрібно додати стовпець з датою, щоб прив'язувати значення часу, і стовпець з іменем ряду для кожного спостереження. Нижче видно, як виглядає мій вихідний файл, який я імпортував у Prognoz Platform за допомогою майстра імпорту безпосередньо із інструмента аналізу часових рядів.

Перше, що ми зазвичай робимо з тимчасовим рядом, відображаємо його на графіку. Prognoz Platform дозволяє побудувати графік, просто перетягнувши ряд в робочу книгу.

Тимчасовий ряд на графіку

Символ 'M' наприкінці імені ряду означає, що ряд має місячну динаміку (інтервал між спостереженнями дорівнює одному місяцю).

Вже з графіка бачимо, що ряд демонструє дві особливості:

  • тренд– на нашому графіку це довгострокове зростання значень, що спостерігаються. Видно, що тренд практично лінійний.
  • сезонність- На графіку це періодичні коливання величини. У наступній статті на тему часових рядів ми дізнаємося, як можна визначити період.

Наш ряд досить «акуратний», проте часто зустрічаються ряди, які, крім двох описаних вище характеристик, демонструють ще одну – наявність «шуму», тобто. випадкових варіацій у тій чи іншій формі. Приклад такого ряду можна побачити на графіці нижче. Це синусоїдальний сигнал, змішаний із випадковою величиною.

При аналізі рядів нас цікавить виявлення їхньої структури та оцінка всіх основних компонентів – тренду, сезонності, шуму та інших особливостей, а також можливість будувати прогнози зміни величини у майбутніх періодах.

Працюючи з рядами наявність шуму часто ускладнює аналіз структури ряду. Щоб унеможливити його вплив і краще побачити структуру ряду, можна використовувати методи згладжування рядів.

Найпростіший метод згладжування рядів – ковзна середня. Ідея у тому, що з будь-якого непарного кількості точок послідовності ряду замінювати центральну точку на середнє арифметичне інших точок:

де x i- Вихідний ряд, s i- Згладжений ряд.

Нижче можна побачити результат застосування даного алгоритму до двох наших рядів. Prognoz Platform за промовчанням пропонує використовувати згладжування з розміром вікна в 5 точок ( kу нашій формулі вище дорівнюватиме 2). Зверніть увагу, що згладжений сигнал вже не так схильний до впливу шуму, проте разом з шумом, звичайно, пропадає і частина корисної інформації про динаміку ряду. Також видно, що згладжений ряд відсутні перші (і також останні) kточок. Це з тим, що згладжування виконується для центральної точки вікна (у разі для третьої точки), після чого вікно зсувається однією точку, і обчислення повторюються. Для другого, випадкового ряду я використовував згладжування з вікном рівним 30, щоб краще виявити структуру ряду, так як ряд «високочастотний», точок дуже багато.

Метод ковзного середнього має певні недоліки:

  • Ковзне середнє неефективне у обчисленні. Для кожної точки середнє необхідно перераховувати за новою. Ми не можемо перевикористати результат, обчислений для попередньої точки.
  • Ковзне середнє не можна продовжити на перші та останні точки ряду. Це може спричинити проблему, якщо нас цікавлять саме ці точки.
  • Ковзне середнє не визначено за межами ряду, і як наслідок, не може використовуватися для прогнозування.

Експонентне згладжування

Найбільш просунутий метод згладжування, який також можна використовувати для прогнозування – експоненційне згладжування, яке іноді називається методом Хольта-Уінтерса (Holt-Winters) на честь імен його творців.

Існує наскільки варіантів даного методу:

  • одинарне згладжування для рядів, у яких немає тренду та сезонності;
  • подвійне згладжування для рядів, які мають тренд, але немає сезонності;
  • потрійне згладжування для рядів, які мають і тренд, і сезонність.

Метод експонентного згладжування обчислює значення згладженого ряду шляхом оновлення значень, розрахованих на попередньому кроці, використовуючи інформацію з поточного кроку. Інформація з попереднього та поточного кроків береться з різними вагами, якими можна керувати.

У найпростішому варіанті одинарного згладжування таке співвідношення:

Параметр α визначає співвідношення між незгладженим значенням на поточному кроці та згладженим значенням з попереднього кроку. При α =1 ми братимемо лише точки вихідного ряду, тобто. ніякого згладжування не буде. При α =0 ряд ми братимемо лише згладжені значення з попередніх кроків, тобто. ряд перетвориться на константу.

Щоб зрозуміти, чому згладжування називається експоненційним, нам потрібно розкрити співвідношення рекурсивно:

Зі співвідношення видно, що всі попередні значення ряду роблять внесок у поточне згладжене значення, однак їхній внесок згасає експоненційно за рахунок зростання ступеня параметра α .

Однак, якщо в даних є тренд, просте згладжування «відставатиме» від нього (або доведеться брати значення α близькими до 1, але тоді згладжування буде недостатнім). Потрібно використовувати подвійне експонентне згладжування.

Подвійне згладжування використовує вже два рівняння – одне рівняння оцінює тренд як різницю між поточним та попереднім згладженим значеннями, потім згладжує тренд простим згладжуванням. Друге рівняння виконує згладжування як у випадку простого варіанту, але у другому доданку використовується сума попереднього згладженого значення та тренду.

Потрійне згладжування включає ще один компонент - сезонність і використовує ще одне рівняння. При цьому розрізняються два варіанти сезонного компонента - адитивний та мультиплікативний. У першому випадку амплітуда сезонного компонента стала і з часом не залежить від базової амплітуди ряду. У другому випадку амплітуда змінюється разом із зміною базової амплітуди низки. Це якраз наш випадок, як видно із графіка. Зі зростанням низки амплітуда сезонних коливань зростає.

Так як наш перший ряд має і тренд, і сезонність, вирішив підібрати параметри потрійного згладжування для нього. У Prognoz Platform це досить просто зробити, тому що при оновленні значення параметра платформа відразу перемальовує графік згладженого ряду, і візуально можна відразу побачити, наскільки добре він описує вихідний ряд. Я зупинився на наступних значеннях:

Як я вирахував період, ми розглянемо в наступній статті про тимчасові ряди.

Зазвичай як перші наближення можна розглядати значення між 0,2 і 0,4. Prognoz Platform також використовує модель із додатковим параметром ɸ що демпфує тренд так, що він наближається до константи в майбутньому. Для ɸ я взяв значення 1, що відповідає звичайній моделі.

Також я зробив прогноз значень низки даним методом на останні 2 роки. На малюнку нижче я помітив точку початку прогнозу, провівши через неї межу. Як видно, вихідний ряд і згладжений дуже непогано збігаються, в тому числі і на період прогнозування - непогано для такого простого методу!

Prognoz Platform також дозволяє автоматично підібрати оптимальні значення параметрів, використовуючи систематичний пошук у просторі значень параметрів та мінімізуючи суму квадратів відхилень згладженого ряду від вихідного.

Описані методи дуже прості, їх легко застосовувати, і вони є гарною відправною точкою для аналізу структури та прогнозування часових рядів.

Ще більше про тимчасові ряди читайте у наступній статті.

Дуже часто, втрати рядів динаміки коливаються, при цьому тенденція розвитку явища в часі прихована випадковими відхиленнями рівнів в той чи інший бік. З метою чіткіше виявити тенденцію розвитку досліджуваного процесу, у тому числі для подальшого застосування методів прогнозування на основі трендових моделей, виробляють згладжування(вирівнювання) тимчасових рядів.

Методи згладжування часових рядів поділяються на дві основні групи:

1. аналітичне вирівнювання з використанням кривої, проведеної між конкретними рівнями ряду так, щоб вона відображала тенденцію, властиву ряду, і одночасно звільняла його від незначних коливань;

2. механічне вирівнювання окремих рівнів часового ряду з використанням фактичних значень сусідніх рівнів.

Суть методів механічного згладжування полягає у наступному. Береться кілька рівнів часового ряду, що утворюють інтервал згладжування. Для них підбирається поліном, ступінь якого має бути меншим за кількість рівнів, що входять в інтервал згладжування; за допомогою полінома визначаються нові вирівняні значення рівнів у середині інтервалу згладжування. Далі інтервал згладжування зсувається на один рівень ряду вправо, обчислюється таке значення, що згладжує, і так далі.

Найпростішим методом механічного згладжування є метод простий ковзної середньої.

2.4.1.Метод простий ковзної середньої.

Спочатку для часового ряду: визначається інтервал згладжування. Якщо необхідно згладити дрібні безладні коливання, то інтервал згладжування беруть якомога більшим; інтервал згладжування зменшують, якщо потрібно зберегти дрібніші коливання.

Для перших рівнів ряду обчислюється їхнє середнє арифметичне. Це буде згладжене значення рівня ряду, що знаходиться всередині інтервалу згладжування. Потім інтервал згладжування зсувається на один рівень праворуч, повторюється обчислення середнього арифметичного і так далі. Для обчислення згладжених рівнів ряду застосовується формула:

де (при непарному); для парних формула ускладнюється.

В результаті такої процедури виходять згладжені значення рівнів ряду; при цьому перші та останні рівні ряду губляться (не згладжуються). Інший недолік методу в тому, що він застосовується лише для рядів, що мають лінійну тенденцію.

2.4.2.Метод виваженої ковзної середньої.

Метод зваженої ковзної середньої відрізняється від попереднього методу згладжування тим, що рівні, що входять в інтервал згладжування, підсумовуються різними вагами. Це з тим, що апроксимація низки межах інтервалу згладжування здійснюється з використанням полінома не першого ступеня, як у попередньому випадку, а ступеня починаючи з другого.

Використовується формула середньої арифметичної зваженої:

,

причому ваги визначаються за допомогою методу найменших квадратів. Ці ваги розраховані для різних ступенів апроксимуючого полінома та різних інтервалів згладжування.

1. для поліномів другого та третього порядків числова послідовність ваг при інтервалі згладжування має вигляд: , а при має вигляд: ;

2. для поліномів четвертого та п'ятого ступенів і при інтервалі згладжування послідовність ваг виглядає наступним чином: .

Розподіл ваг протягом інтервалу згладжування, отриманий на основі методу найменших квадратів див. на діаграмі 1.



2.4.3.Метод експонентного згладжування.

До тієї ж групи методів належать метод експоненційного згладжування.

Його особливість полягає в тому, що в процедурі знаходження згладженого рівня використовуються значення попередніх рівнів ряду, взяті з певною вагою, причому вага спостереження зменшується в міру видалення його від моменту часу, для якого визначається згладжене значення рівня ряду.

Якщо для вихідного часового ряду

відповідні згладжені значення позначити через , то експоненційне згладжування здійснюється за формулою:

де параметр згладжування ; величина називається коефіцієнт дисконтування.

Використовуючи, наведене рекурентне співвідношення для всіх рівнів ряду, починаючи з першого і кінчаючи моментом часу , можна отримати, що експоненційна середня, тобто згладжене даним методом значення рівня ряду, є зваженою середню всіх попередніх рівнів.