Студентски форум на МИТ - прикажете порака одделно - економетрија. Пресметка на показатели за динамиката на економските процеси

табела 4.

Табела 4.

За овој ред: K=8, L=-8.

8 3.703 3,46

Наоѓање на теоретските вредности на карактеристиката со (n-2) степени

t 0,95, n 2=2,365,

тие. со веројатност

тврди дека

има тенденција во дисперзија (t K t теора) и има тенденција во просек, бидејќи t L t теорија. Затоа, можеме да зборуваме за присуство на тренд во времето

Просечен метод

5.3. Методи за механичко измазнување на временски серии

Многу често нивоата на економските временски серии флуктуираат, со

Во овој случај, трендот на развој на економски феномен со текот на времето се крие со случајни отстапувања на нивоата во една или друга насока. Со цел појасно да се идентификува развојниот тренд на процесот што се проучува, вклучително и за понатамошна примена на методите за прогнозирање засновани на трендот

модели, произведуваат измазнување (израмнување)временски серии.

Измазнувањето секогаш вклучува некој метод на локално просекување на податоците, во кој несистематските компоненти се поништуваат една со друга.

Методите за измазнување на временските серии се поделени во две главни групи:

1) механичко усогласување на поединечни нивоа на временска серија со

користејќи реални вредности на соседните нивоа.

2) аналитичко порамнување со помош на нацртана крива

помеѓу одредени нивоа на серија, така што таа ја одразува тенденцијата својствена на серијата, а во исто време ја ослободува од незначителни

двоумење;

Суштината на методите на механичко измазнување е како што следува.

Се земаат првите неколку нивоа од временските серии, кои се формираат интервал на измазнување.За нив, се избира полином, чиј степен мора да биде помал од бројот на нивоа вклучени во интервалот за измазнување; со помош на полином, се одредуваат нови, порамнети вредности на нивоата во средината

Едноставен метод на подвижен просек.

Наједноставниот метод на измазнување е подвижен просек,во која

денови термини, каде што m е ширината на интервалот на измазнување. Наместо просекот, можете да ја користите медијаната на вредностите што спаѓаат во интервалот за измазнување.

Ако е неопходно да се изедначат мали случајни флуктуации, тогаш интервалот на измазнување се зема колку што е можно поголем. Доколку е потребно да се зачуваат помали флуктуации, интервалот на измазнување се намалува. Бидејќи сите други работи се еднакви, се препорачува да се земе непарен интервалот за измазнување.

За да се пресметаат измазнетите нивоа на серијата Y t, се користи формулата:

Каде што p m 1 (ако е непарно);

Како резултат на оваа постапка, се добиваат (n-m+1) измазнети вредности на сериските нивоа; во овој случај, првото и последното ниво од серијата се изгубени (не се измазнуваат). -

За дури и вредности t, по постапката за измазнување, добиената серија обично се центрира (се наоѓаат просечните вредности на два последователни подвижни просеци).

Овој метод е применлив само за серии кои имаат линеарна

тренд. Ако процесот се карактеризира со нелинеарен развој, тогаш едноставниот подвижен просек може да доведе до значителни нарушувања.

Кога трендот на порамнетите серии има свиоци и е пожелно истражувачот да ги зачува брановите, тогаш се претпочита пондерираната метода.

подвижен просек. Кога се конструира пондериран подвижен просек на

Секој интервал на измазнување, вредноста на централното ниво се заменува со пресметаната, одредена со пондерираната аритметичка просечна формула:

ytw i

каде што w i се тежински коефициенти утврдени со методот на најмалку

квадрати, додека израмнувањето на секој интервал на измазнување најчесто се врши со користење на полиноми од втор или трет ред11. На пример, тежинските коефициенти за интервалот 5 ќе бидат

следново: 35 1 [3, 12, 17, 12, 3] и за интервалот 7: 21 1 [2, 3, 6, 7, 6, 3, 2]

Пример. Наведена е временска серија на излезниот волумен на производот (во илјади рубли). Нивоата на Y (t) серијата се дадени во Табела 5.

Да избереме интервал на измазнување m=3 и да го израмниме едноставниот подвижен просек (трет ред од табелата).По измазнувањето јасно се гледа тренд на зголемување.

11 Михтаријан В.С., Аркипова М.Ју. и други.Економетрија: учебник / ред. Михтаријан В.С. М.: ДООЕЛ

„Проспект“, 2008, стр.293

Табела 5

S(t)avg

S(t)in

интервал на измазнување

ќе спроведеме

измазнување

пондерирана

подвижен просек врз основа на полином од втор степен

(четврто

табели) користејќи ги дадените

поголема тежина

коефициенти

Метод на експоненцијално измазнување.

Кога се испитуваат економските податоци, понекогаш е важно влијанието на подоцнежните набљудувања. Овој метод го решава овој проблем

експоненцијално измазнување. Во овој случај, моменталната вредност на привремената

серијата се измазнува земајќи ја предвид константата на измазнување (тежина), обично

назначен. Пресметката се врши со следнава формула:

S t Y t (1) S t 1, (5.4),

Со оглед на процесот на повторливо проширување за количините S t 1, S t 2 и

итн. според формулата (5.4), добиваме:

) j Y t j (1)t Y 0

S t(1

каде j е бројот на периоди на задоцнување од моментот t. Според формулата (5.5)

релативната тежина на секое претходно ниво се намалува експоненцијално со растојанието од моментот за кој се пресметува измазнетата вредност.

Оттука и името на овој метод.

При користење на методот во пракса, се јавуваат проблеми при изборот на параметар и одредувањето на почетното ниво Y 0 . Колку е поголема вредноста

параметар, толку е помало влијанието на претходните нивоа.Во секој конкретен случај, потребно е да се избере најприфатливото

значење. Најчесто тоа се прави со проверка на повеќе вредности.

Проблемот со изборот на почетната вредност Y 0 се решава на следниот начин: за Y 0

се прифаќа првата вредност на временските серии или аритметичката средина

првите неколку членови на серијата.

Да го погледнеме претходниот пример. Ајде да направиме експоненцијална

измазнување на временските серии (трет ред од табелата)

Првата измазнета вредност е еднаква на првото ниво од серијата.Следната измазнета вредност се пресметува според формулата (5.3), каде што

Да преминеме на прашањето за измазнување на временските серии на економските показатели. Многу често, нивоата на сериите на динамиката флуктуираат, додека трендот на развој на економски феномен со текот на времето се крие со случајни отстапувања на нивоата во една или друга насока. Со цел јасно да се идентификува развојниот тренд на процесот што се проучува, вклучително и за понатамошна примена на методите за предвидување базирани на модели на трендови, временските серии се измазнуваат (порамнети). Така, измазнувањето може да се смета како елиминација на случајната компонента тод модел на временски серии.

Наједноставниот метод на механичко измазнување е едноставен метод на подвижен просек.Прво за временските серии y 1 , y 2 , y 3 ,…, y n се одредува интервалот на измазнување т (т< п). Ако е неопходно да се изедначат мали случајни флуктуации, тогаш интервалот на измазнување се зема колку што е можно поголем; Интервалот на измазнување се намалува доколку треба да се зачуваат помали флуктуации. Бидејќи сите други работи се еднакви, се препорачува да се земе непарен интервалот за измазнување. За првиот Тнивоа на временските серии, се пресметува нивната аритметичка средина; ова ќе биде измазнетата вредност на нивото на серијата лоцирана во средината на интервалот за измазнување. Потоа интервалот на измазнување се поместува за едно ниво надесно, се повторува пресметката на аритметичката средина итн.

Да се ​​пресметаат измазнети нивоа на серија се применува формулата

за непарни м;

за дури Тформулата станува посложена.

Резултатот од оваа постапка е p - t + 1 измазнети вредности на сериски нивоа; додека првиот Ри најновите Рнивоата на серијата се изгубени (не се измазнуваат).

Особеност експоненцијален методизмазнувањее дека во постапката за наоѓање на измазнувањето јасод тото ниво, се користат само вредностите на претходните нивоа од серијата ( јас-1, јас-2,...), земено со одредена тежина, а тежината на набљудувањето се намалува како што се оддалечува од временската точка за која се одредува измазнетата вредност на сериското ниво.

Ако за оригиналната временска серија y 1 , y 2 , y 3 ,…, y nсоодветните измазнети вредности на нивоата се означуваат со С т , т = 1,2, …, П,тогаш се врши експоненцијално измазнување според формулата

Еве С 0 – количина што ги карактеризира почетните услови.

Во практичните проблеми на обработка на економските временски серии, се препорачува да се избере вредноста на параметарот за измазнување во опсег од 0,1 до 0,3.

Пример 4.4.Да се ​​вратиме на Пример 1, кој ги разгледува кварталните обеми на продажба на Левплан. Веќе дознавме дека на овие податоци одговара модел на адитив, т.е. Всушност, обемот на продажба може да се изрази на следниов начин:

Y = U + V + E.

Со цел да се елиминира влијанието на сезонската компонента, ќе го користиме методот на подвижен просек. Со собирање на првите четири вредности се добиваат вкупните продажби за 1998 година. Поделувајќи ја оваа сума со четири се добива просечната продажна оценка за секој квартал од 1998 година, т.е.

(239 + 201 +182 + 297)/4 = 229,75;
(201+182+297+324)/4, итн.

Добиената вредност повеќе не содржи сезонска компонента, бидејќи ја претставува просечната вредност за годината. Сега имаме проценка на вредноста на трендот за средината на годината, т.е. за точка која лежи на средината помеѓу четвртините II и III. Ако се движите напред последователно во интервали од три месеци, можете да ги пресметате просечните квартални вредности за периодот април - март 1998 година (251), јули - јуни 1998 година (270,25) итн. Оваа постапка ви овозможува да генерирате подвижни просеци со четири точки за оригиналниот сет на податоци. Добиениот сет на подвижни просеци ја претставува најдобрата проценка на посакуваниот тренд.

Сега добиените тренд вредности може да се искористат за да се најдат проценки на сезонската компонента. Ние очекуваме:

YУ = В + Е.

За жал, проценките на трендовите добиени со пресметување на просеците од четири точки се однесуваат на неколку различни временски точки од вистинските податоци. Првата проценка, еднаква на 229,75, ја претставува точката што се совпаѓа со средината на 1998 година, т.е. се наоѓа во центарот на интервалот на реалните обеми на продажба во II и III квартал. Втората проценка, еднаква на 251, лежи помеѓу вистинските вредности во третиот и четвртиот квартал. Потребни ни се десезонски просечни вредности што одговараат на истите временски интервали како и вистинските вредности за кварталот. Позицијата на десезонализираните просеци со текот на времето се менува со дополнително пресметување на просеците за секој пар вредности. Да го најдеме просекот на првите проценки, центрирајќи ги на јули - септември 1998 година, т.е.

(229,75 + 251)/2 = 240,4.

Ова е десезонализираниот просек за јули - септември 1999 година. Оваа десезонализирана вредност, која се нарекува центриран подвижен просек, може директно да се спореди со вистинската вредност од јули-септември 1998 година од 182. Забележете дека ова значи дека нема проценки за трендовите за првите два или последните два квартали од временската серија. Резултатите од овие пресметки се дадени во Табела 4.5.

За секој квартал, имаме проценки на сезонски компоненти кои вклучуваат грешка или преостанати. Пред да можеме да ја користиме сезонската компонента, треба да ги поминеме следните два чекори. Ајде да ги најдеме просечните вредности на сезонските проценки за секоја сезона од годината. Оваа постапка ќе намали некои вредности на грешки. Конечно, ги прилагодуваме просечните вредности, зголемувајќи ги или намалувајќи ги за ист број, така што нивната вкупна сума е нула. Ова е неопходно за да се просечат вредностите на сезонската компонента за целата година.

Табела 4.5. Проценка на сезонската компонента

Обем на продажба Y, илјада парчиња

во четири

четвртина

лизгање

просек за четири

четвртина

Центриран подвижен просек У

сезонска компонента

Y- У= В+ Е

јануари-март 1998 г

април јуни

јули-септември

октомври декември

јануари-март 1999 г

април јуни

јули-септември

октомври декември

јануари-март 2000 година

април јуни

јули-септември

октомври декември

јануари-март 2001 година

Табела 4.6. Пресметка на просечните вредности на сезонската компонента

Пресметано

Компоненти

Број на четвртина

Средна вредност

Сезонско оценување

Компоненти

Износ = -0,2

Прилагодени

сезонска компонента 1

Корекциониот фактор се пресметува на следниов начин: збирот на проценките на сезонските компоненти се дели со 4. Во последната колона од табелата. 4.5 овие проценки се евидентираат според соодветните квартални вредности. Самата процедура е дадена во табела. 4.6.

Вредноста на сезонската компонента уште еднаш ги потврдува нашите заклучоци направени во примерот 4.1 врз основа на анализата на дијаграмот. Обемот на продажба за двата зимски квартали ја надминува просечната тренд вредност за приближно 40 илјади единици, а обемот на продажба за двата летни периоди е под просекот за 21 и 62 илјади единици. соодветно.

Слична постапка е применлива при одредување на сезонските варијации за кој било временски период. Ако, на пример, сезоната се деновите во неделата, за да се елиминира влијанието на дневната сезонска компонента, се пресметува и подвижен просек, но не за четири, туку за седум поени. Овој подвижен просек ја претставува вредноста на трендот во средината на неделата, т.е. во четврток; со што се елиминира потребата од процедура за центрирање.

Министерство за образование на Руската Федерација

Серуски финансиски и економски институт за кореспонденција

Филијала Јарослав

Одделот за статистика

Работа на курсот

по дисциплина:

„Статистика“

задача бр.19

Ученик: Курашова Анастасија Јуриевна

Специјалност „Финансии и кредити“

3-та година, периферија

Раководител: Сергеев В.П.

Јарослав, 2002 година

1. Вовед………………………………………………………………………………… 3 страници.

2. Теоретски дел……………………………………………4 страници.

2.1 Основни поими за динамичките серии………………………………4 стр.

2.2 Методи за израмнување и израмнување на временски серии……………………………………………………………………………………….6 стр.

2.2.1 Методи на „механичко измазнување“………………………6 стр.

2.2.2 Методи на „аналитичко“ усогласување……………………. 8 страници

3. Пресметковен дел……………………………………………………11 стр.

4. Аналитички дел………………………………………………. .16 стр.

5. Заклучок………………………………………………………. 25 стр.

6. Список на референци……………………………………………………………… 26 страници.

7. Апликации…………………………………………………………. 27 стр.


Вовед

Целосните и веродостојни статистички информации се неопходната основа на која се заснова процесот на економско управување. Сите информации од национално економско значење на крајот се обработуваат и анализираат со помош на статистика.

Статистичките податоци овозможуваат да се одреди обемот на бруто домашниот производ и националниот доход, да се идентификуваат главните трендови во развојот на економските сектори, да се процени нивото на инфлација, да се анализира состојбата на финансиските и стоковните пазари, да се проучи стандардот на живеење на населението и други општествено-економски појави и процеси.

Совладувањето на статистичка методологија е еден од условите за разбирање на пазарните услови, проучување на трендовите и прогнозирање и донесување оптимални одлуки на сите нивоа на активност.

Конечната, аналитичка фаза на студијата е сложена, одзема многу време и одговорна. Во оваа фаза се пресметуваат просечни показатели и индикатори за дистрибуција, се анализира структурата на населението и се проучуваат динамиката и односите помеѓу појавите и процесите што се проучуваат.

Во сите фази на истражување, статистиката користи различни методи. Статистичките методи се посебни техники и начини на проучување на масовните општествени појави.

I. Теоретски дел.

1.1 Основни концепти за динамичките серии.

Временските серии се статистички податоци кои го одразуваат развојот на феноменот што се проучува со текот на времето. Тие се нарекуваат и динамични серии, временски серии.

Секој ред на динамика има два главни елементи:

1) индикатор за време t;

2) соодветните нивоа на развој на феноменот што се проучува;

Временските индикации во динамичките серии се или конкретни датуми (моменти) или поединечни периоди (години, квартали, месеци, денови).

Нивоата на серијата динамика одразуваат квантитативна проценка (мерка) на развојот со текот на времето на феноменот што се проучува. Тие можат да се изразат во апсолутни, релативни или просечни вредности.

Динамичките серии се разликуваат според следниве карактеристики:

1) По време. Во зависност од природата на феноменот што се проучува, нивоата на временските серии може да се однесуваат или на одредени временски датуми (моменти) или на поединечни периоди. Во согласност со ова, динамичките серии се поделени на момент и интервал.

Сериите за динамика на моментот ја прикажуваат состојбата на феномените што се проучуваат на одредени датуми (моменти) во времето. Пример за моментална серија на динамика е следната информација за бројот на платите на вработените во продавницата во 1991 година (Табела 1):

Табела 1

Список на вработени во продавницата во 1991 година

Карактеристика на моменталната серија на динамика е тоа што нејзините нивоа може да ги вклучуваат истите единици на популацијата што се проучува. Иако постојат интервали во сериите на моменти - интервали помеѓу соседните датуми во серијата - вредноста на едно или друго специфично ниво не зависи од времетраењето на периодот помеѓу два датуми. Така, најголемиот дел од персоналот во продавницата, кој го сочинува платниот список од 1 јануари 1991 година, кој продолжува да работи во дадена година, е прикажан во нивоата на следните периоди. Затоа, кога се собираат нивоата на сериите на моменти, може да се појави повторено броење.

Користејќи ги моменталните серии на динамика во трговијата, се проучуваат залихите на стоки, состојбата на персоналот, количината на опрема и други показатели кои ја рефлектираат состојбата на појавите што се проучуваат на поединечни датуми (точки) во времето.

Сериите за динамика на интервал ги рефлектираат резултатите од развојот (функционирањето) на феномените што се проучуваат во поединечни временски периоди (интервали).

Пример за интервална серија се податоците за прометот на малопродажба на продавница во 1987-1991 година. (Табела 2):

табела 2

Обемот на малопродажниот промет на продавницата во 1987 - 1991 година.

Обем на промет на мало, илјади рубли

885.7 932.6 980.1 1028.7 1088.4

Секое ниво од интервалната серија веќе го претставува збирот на нивоа во пократки временски периоди. Во овој случај, единица на население што е дел од едно ниво не е вклучена во другите нивоа.

Особеноста на серијата на интервална динамика е што секое нејзино ниво се состои од податоци за пократки временски интервали (подпериоди). На пример, сумирајќи го прометот за првите три месеци од годината, го добиваме неговиот волумен за првиот квартал, а сумирајќи го прометот за четири квартали, ја добиваме неговата вредност за годината, итн. нивото на интервалната серија е поголемо, толку е подолг интервалот на кој припаѓа ова ниво.

Својството на собирање нивоа во последователни временски интервали овозможува да се добијат динамички серии за повеќе зголемени периоди.

Со користење на интервални серии, динамиката во трговијата се користи за проучување на промените во времето на прием и продажба на стоки, износот на трошоците за дистрибуција и други показатели кои ги одразуваат резултатите од функционирањето на феноменот што се проучува за поединечни периоди.

Структура на серијата динамика:

Секоја серија на динамика теоретски може да се претстави во форма на компоненти:

1) тренд – главна тенденција за развој на временска серија (кон зголемување или намалување на нејзините нивоа);

2) циклични (периодични флуктуации, вклучително и сезонски);

случајни флуктуации.

1. 2. Методи за измазнување и порамнување на временски серии.

Елиминацијата на случајните флуктуации во вредностите на сериските нивоа се врши со наоѓање на „просечни“ вредности. Методите за елиминирање на случајните фактори се поделени во две групи:

1. Методи на „механичко“ измазнување на флуктуациите со просекување на вредностите на серијата во однос на другите блиски нивоа на серијата.

2. Методи на „аналитичко“ усогласување, т.е. прво одредување на функционалниот израз на трендот на серијата, а потоа нови, пресметани вредности на серијата.

1.2. 1 Методи на „механичко“ измазнување.

Тие вклучуваат:

А. Методот на просек од две половини од серијата, кога серијата е поделена на два дела. Потоа се пресметуваат две вредности на просечните нивоа на серијата, од кои графички се одредува трендот на серијата. Очигледно е дека таквиот тренд не го отсликува доволно целосно основниот модел на развој на феноменот.

б. Метод за зголемување на интервали, во кој се зголемува должината на временските интервали и се пресметуваат нови вредности на сериски нивоа.

В. Метод на подвижна просечна вредност. Овој метод се користи за карактеризирање на развојниот тренд на статистичката популација што се проучува и се заснова на пресметка на просечните нивоа на сериите за одреден период. Низа за одредување на движечкиот просек:

Се поставува интервалот на измазнување или бројот на нивоа вклучени во него. Ако се земат предвид три нивоа при пресметување на просекот, движечкиот просек се нарекува трирочен, петте нивоа се нарекуваат петрочни итн. Ако се измазнуваат мали, случајни флуктуации на нивоата во серијата динамика, тогаш интервалот (бројот на подвижниот просек) се зголемува. Ако треба да се зачуваат брановите, бројот на членови се намалува.

Првото просечно ниво се пресметува со едноставна аритметика:

y1 = Sy1/m, каде

y1 – 1-во ниво од редот;

m – член на подвижен просек.

Првото ниво е отфрлено, а пресметката на просекот го вклучува нивото по последното ниво вклучено во првата пресметка. Процесот продолжува се додека последното ниво од проучуваната серија на динамика y n не се вклучи во пресметката на y.

Врз основа на низа динамики конструирани од просечни нивоа, се открива општиот тренд во развојот на феноменот.

Негативната страна на користењето на методот на подвижен просек е формирањето на поместувања во флуктуациите во сериските нивоа поради „лизгањето“ на интервалите на агрегација. Измазнувањето со помош на подвижен просек може да доведе до појава на „обратни“ флуктуации, кога конвексниот „бран“ се заменува со конкавен.

Неодамна, почна да се пресметува адаптивен подвижен просек. Неговата разлика е во тоа што просечната вредност на атрибутот, исто така пресметана како што е опишано погоре, не се однесува на средината на серијата, туку на последниот временски период во интервалот на проширување. Покрај тоа, се претпоставува дека адаптивниот просек зависи од претходното ниво во помала мера отколку од сегашното. Односно, колку повеќе временски интервали помеѓу нивото на серијата и просечната вредност, толку помало влијание има вредноста на ова ниво од серијата врз вредноста на просекот.

г. Метод на експоненцијален просек. Експоненцијалниот просек е адаптивен подвижен просек, пресметан со помош на тежини кои зависат од степенот на „оддалеченост“ на поединечните нивоа на серијата од просечната вредност. Вредноста на тежината се намалува како што нивото се оддалечува по хронолошката линија од просечната вредност во согласност со експоненцијалната функција, затоа таквиот просек се нарекува експоненцијален. Во пракса се користи повеќекратно експоненцијално измазнување на динамичката серија, која се користи за предвидување на развојот на феноменот.

Заклучок: методите вклучени во првата група, поради користените методи на пресметка, му даваат на истражувачот многу поедноставена, неточна идеја за трендот во серијата динамика. Меѓутоа, правилната примена на овие методи бара од истражувачот да има длабочина на знаење за динамиката на различните социо-економски појави.

16.02.15 Виктор Гаврилов

38133 0

Временската серија е низа од вредности кои се менуваат со текот на времето. Ќе се обидам да зборувам за некои едноставни, но ефективни пристапи за работа со такви секвенци во оваа статија. Има многу примери за такви податоци - валутни цитати, обем на продажба, барања на клиенти, податоци во различни применети науки (социологија, метеорологија, геологија, набљудувања во физиката) и многу повеќе.

Сериите се вообичаена и важна форма на опишување податоци, бидејќи ни овозможуваат да ја набљудуваме целата историја на промени во вредноста што ни е интерес. Ова ни дава можност да судиме за „типичното“ однесување на одредена количина и отстапувањата од таквото однесување.

Бев соочен со задача да изберам збир на податоци на кој би било можно јасно да се покажат карактеристиките на временските серии. Решив да користам статистика за меѓународниот патнички сообраќај на авиокомпании бидејќи овој сет на податоци е многу јасен и стана донекаде стандард (http://robjhyndman.com/tsdldata/data/airpass.dat, изворна библиотека со податоци за серии на време, R. J. Hyndman). Серијата го опишува бројот на патници на меѓународни авиокомпании месечно (во илјадници) за периодот од 1949 до 1960 година.

Бидејќи секогаш имам при рака, која има интересна алатка „“ за работа со редови, ќе ја користам. Пред да внесете податоци во датотека, треба да додадете колона со датум, така што вредностите се врзани за времето и колона со името на серијата за секое набљудување. Подолу можете да видите како изгледа мојата изворна датотека, која ја внесов во платформата Prognoz користејќи го Волшебникот за увоз директно од алатката за анализа на временски серии.

Првото нешто што обично го правиме со временската серија е да ја нацртаме на графикон. Платформата Prognoz ви овозможува да изградите графикон со едноставно влечење серија во работната книга.

Временски серии на графикон

Симболот „М“ на крајот од името на серијата значи дека серијата има месечна динамика (интервалот помеѓу набљудувањата е еден месец).

Веќе од графиконот гледаме дека серијата покажува две карактеристики:

  • тренд– на нашиот графикон ова е долгорочно зголемување на забележаните вредности. Се гледа дека трендот е речиси линеарен.
  • сезонски– на графикот тоа се периодични флуктуации на вредноста. Во следната статија на тема временски серии, ќе научиме како можеме да го пресметаме периодот.

Нашата серија е прилично „уредна“, меѓутоа, често има серии кои, покрај двете карактеристики опишани погоре, покажуваат уште една - присуство на „шум“, т.е. случајни варијации во една или друга форма. Пример за таква серија може да се види на табелата подолу. Ова е синусен бран измешан со случајна променлива.

Кога ги анализираме сериите, ние сме заинтересирани да ја идентификуваме нивната структура и да ги процениме сите главни компоненти - тренд, сезонска, бучава и други карактеристики, како и способност да правиме прогнози за промените на вредноста во идните периоди.

Кога работите со серии, присуството на бучава често ја отежнува анализата на структурата на серијата. За да го елиминирате неговото влијание и подобро да ја видите структурата на серијата, можете да користите методи за измазнување на сериите.

Наједноставниот метод за измазнување на сериите е подвижен просек. Идејата е дека за кој било непарен број точки во сериската низа, централната точка да се замени со аритметичката средина на преостанатите точки:

Каде x i- почетен ред, и јас– измазнета серија.

Подолу можете да го видите резултатот од примената на овој алгоритам во нашите две серии. Стандардно, платформата Prognoz предлага користење на анти-алиасинг со големина на прозорец од 5 поени ( кво нашата формула погоре ќе биде еднаква на 2). Ве молиме имајте предвид дека измазнетиот сигнал повеќе не е толку засегнат од бучавата, но заедно со бучавата, природно, исчезнуваат и некои корисни информации за динамиката на серијата. Исто така, јасно е дека на измазнетата серија и недостига првата (а исто така и последната) кпоени. Ова се должи на фактот дека измазнувањето се изведува на централната точка на прозорецот (во нашиот случај, третата точка), по што прозорецот се поместува за една точка, а пресметките се повторуваат. За втората, случајна серија, користев измазнување со прозорец од 30 за подобро да ја идентификувам структурата на серијата, бидејќи серијата е „висока фреквенција“ со многу поени.

Методот на подвижен просек има одредени недостатоци:

  • Движечкиот просек е неефикасен за пресметување. За секој поен, просекот мора повторно да се пресмета. Не можеме повторно да го користиме резултатот пресметан за претходната точка.
  • Движечкиот просек не може да се прошири на првата и последната точка од серијата. Ова може да предизвика проблем ако тоа се точките што нè интересираат.
  • Движечкиот просек не е дефиниран надвор од серијата и како резултат на тоа не може да се користи за прогнозирање.

Експоненцијално измазнување

Понапреден метод на измазнување кој може да се користи и за прогнозирање е експоненцијалното измазнување, кое понекогаш се нарекува и метод Холт-Винтерс по неговите креатори.

Постојат неколку варијации на овој метод:

  • единечно измазнување за серии кои немаат тренд или сезона;
  • двојно измазнување за серии кои имаат тренд, но немаат сезонска;
  • тројно измазнување за серии кои имаат и тренд и сезонско.

Методот на експоненцијално измазнување ги пресметува вредностите на измазнетата серија со ажурирање на вредностите пресметани во претходниот чекор користејќи информации од тековниот чекор. Информациите од претходните и тековните чекори се преземаат со различни тежини кои можат да се контролираат.

Во наједноставната верзија на единечно измазнување, односот е:

Параметар α ја дефинира врската помеѓу неизмазнетата вредност на тековниот чекор и измазнетата вредност од претходниот чекор. На α =1 ќе ги земеме само точките од оригиналната серија, т.е. нема да има измазнување. На α =0 ред ќе земеме само измазнети вредности од претходните чекори, т.е. серијата ќе стане константа.

За да разбереме зошто измазнувањето се нарекува експоненцијално, треба да ја прошириме врската рекурзивно:

Од односот е јасно дека сите претходни вредности на серијата придонесуваат за тековната измазнета вредност, но нивниот придонес експоненцијално исчезнува поради зголемувањето на степенот на параметарот α .

Меѓутоа, ако има тренд во податоците, едноставното измазнување ќе „заостане“ зад него (или ќе треба да ги земете вредностите α блиску до 1, но тогаш измазнувањето ќе биде недоволно). Треба да користите двојно експоненцијално измазнување.

Двојното измазнување веќе користи две равенки - една равенка го оценува трендот како разлика помеѓу сегашните и претходните измазнети вредности, а потоа го измазнува трендот со едноставно измазнување. Втората равенка врши измазнување како во едноставниот случај, но вториот член го користи збирот на претходната измазнета вредност и трендот.

Тројното измазнување вклучува уште една компонента - сезонско, и користи друга равенка. Во овој случај, постојат две варијанти на сезонската компонента - адитивна и мултипликативна. Во првиот случај, амплитудата на сезонската компонента е константна и не зависи со текот на времето од основната амплитуда на серијата. Во вториот случај, амплитудата се менува заедно со промената на основната амплитуда на серијата. Токму тоа е нашиот случај, како што може да се види од графиконот. Како што расте серијата, се зголемува амплитудата на сезонските флуктуации.

Бидејќи нашиот прв ред има и тренд и сезонско, решив да изберам тројни параметри за измазнување за него. Во платформата Prognoz, ова е прилично лесно да се направи, бидејќи кога ќе се ажурира вредноста на параметарот, платформата веднаш го прецртува графикот на измазнетата серија и визуелно можете веднаш да видите колку добро ја опишува нашата оригинална серија. Се решив на следните вредности:

Како го пресметав периодот ќе погледнеме во следната статија за временски серии.

Вообичаено, вредностите помеѓу 0,2 и 0,4 може да се сметаат како први приближувања. Платформата Prognoz користи и модел со дополнителен параметар ɸ , што го придушува трендот така што тој се приближува кон константа во иднина. За ɸ Ја зедов вредноста 1, што одговара на нормалниот модел.

Исто така, направив прогноза за вредностите на серијата користејќи го овој метод за последните 2 години. На сликата подолу, ја означив почетната точка на прогнозата со цртање линија низ неа. Како што можете да видите, оригиналната серија и измазнетата се совпаѓаат доста добро, вклучително и за време на периодот на прогнозирање - не е лошо за толку едноставен метод!

Платформата Prognoz исто така ви овозможува автоматски да изберете оптимални вредности на параметри користејќи систематско пребарување во просторот на вредностите на параметрите и минимизирање на збирот на квадратни отстапувања на измазнетата серија од оригиналната.

Опишаните методи се многу едноставни, лесни за примена и обезбедуваат добра почетна точка за анализа на структурата и предвидување на временските серии.

Прочитајте повеќе за временските серии во следната статија.

Многу често, нивоата на динамичките серии флуктуираат, додека трендот на развој на феноменот со текот на времето се крие со случајни отстапувања на нивоата во една или друга насока. Со цел појасно да се идентификува развојниот тренд на процесот што се проучува, вклучително и за понатамошна примена на методите за прогнозирање засновани на модели на трендови, измазнување(израмнување) временски серии.

Методите за измазнување на временските серии се поделени во две главни групи:

1. аналитичко усогласување со помош на крива нацртана помеѓу одредени нивоа на серијата, така што ја одразува тенденцијата својствена за серијата и истовремено ја ослободува од мали флуктуации;

2. механичко усогласување на поединечни нивоа на временска серија користејќи ги вистинските вредности на соседните нивоа.

Суштината на методите на механичко измазнување е како што следува. Се земаат неколку нивоа од временските серии кои се формираат интервал на измазнување. За нив, се избира полином, чиј степен мора да биде помал од бројот на нивоа вклучени во интервалот за измазнување; со помош на полином, нови, израмнети вредности на нивоа се одредуваат во средината на интервалот за измазнување. Следно, интервалот на измазнување се поместува за едно ниво на ред надесно, се пресметува следната измазнета вредност итн.

Наједноставниот метод на механичко измазнување е едноставен метод на подвижен просек.

2.4.1.Едноставен метод на подвижен просек.

Прво за временските серии: се одредува интервалот на измазнување. Ако е неопходно да се изедначат мали случајни флуктуации, тогаш интервалот на измазнување се зема колку што е можно поголем; Интервалот на измазнување се намалува доколку треба да се зачуваат помали флуктуации.

За првите нивоа од серијата се пресметува нивната аритметичка средина. Ова ќе биде измазнетата вредност на нивото на серијата лоцирана во средината на интервалот за измазнување. Потоа интервалот на измазнување се поместува за едно ниво надесно, се повторува пресметката на аритметичката средина итн. За да се пресметаат измазнетите нивоа на серија, се користи формулата:

каде (ако е непарно); за парни броеви формулата станува посложена.

Како резултат на оваа постапка, се добиваат измазнети вредности на сериските нивоа; во овој случај, првото и последното ниво од серијата се изгубени (не се измазнуваат). Друг недостаток на методот е тоа што е применлив само за серии кои имаат линеарен тренд.

2.4.2.Метод на пондериран подвижен просек.

Методот на пондериран подвижен просек се разликува од претходниот метод на измазнување по тоа што нивоата вклучени во интервалот за измазнување се сумирани со различни тежини. Ова се должи на фактот дека приближувањето на серијата во интервалот на измазнување се врши со користење на полином не од прв степен, како во претходниот случај, туку со степен почнувајќи од вториот.

Се користи аритметичката пондерирана просечна формула:

,

при што тежините се одредуваат со методот на најмали квадрати. Овие тежини се пресметуваат за различни степени на приближниот полином и различни интервали на измазнување.

1. за полиноми од втор и трет ред, нумеричката низа на тежини на интервалот на измазнување има форма: , а за има форма: ;

2. за полиноми од четврти и петти степен и со интервал на измазнување редоследот на тежините е следна: .

За распределбата на тежините преку интервалот на измазнување, добиена со методот на најмали квадрати, видете го дијаграмот 1.



2.4.3.Метод на експоненцијално измазнување.

Истата група методи го вклучува методот на експоненцијално измазнување.

Неговата особеност е што во постапката за наоѓање на измазнето ниво се користат само вредностите на претходните нивоа од серијата, земени со одредена тежина, а тежината на набљудувањето се намалува како што се оддалечува од временската точка. за што се одредува измазнетата вредност на сериското ниво.

Ако за оригиналната временска серија

соодветните измазнети вредности се означуваат со , тогаш експоненцијално измазнување се врши според формулата:

Каде параметар за измазнување ; количината се нарекува фактор на попуст.

Користејќи ја дадената релација за повторување за сите нивоа на серијата, почнувајќи од првото и завршувајќи со моментот на времето, можеме да добиеме дека експоненцијалниот просек, односно вредноста на нивото на серијата измазнета со овој метод, е пондериран просек од сите претходни нивоа.