MIT Student Forum - vis besked separat - økonometri. Beregning af indikatorer for dynamikken i økonomiske processer

tabel 4.

Tabel 4.

For denne række: K=8, L=-8.

8 3.703 3,46

At finde de teoretiske værdier af karakteristikken med (n-2) grader

t 0,95,n 2=2,365,

de der. med sandsynlighed

hævde det

der er en tendens i spredning (t K t-teor), og der er en tendens i gennemsnittet, da t L t-teor. Derfor kan vi tale om tilstedeværelsen af ​​en trend i tide

Gennemsnitlig metode

5.3. Metoder til mekanisk udjævning af tidsserier

Meget ofte svinger niveauerne af økonomiske tidsserier, med

I dette tilfælde er tendensen til udvikling af et økonomisk fænomen over tid skjult af tilfældige afvigelser af niveauer i en eller anden retning. For mere klart at identificere udviklingstendensen for den undersøgte proces, herunder for den videre anvendelse af prognosemetoder baseret på trend

modeller, producere udglatning (udfladning) tidsserier.

Udjævning involverer altid en eller anden metode til lokal midling af data, hvor ikke-systematiske komponenter ophæver hinanden.

Tidsserieudjævningsmetoder er opdelt i to hovedgrupper:

1) mekanisk justering af individuelle niveauer i en tidsserie med

ved hjælp af faktiske værdier af tilstødende niveauer.

2) analytisk justering ved hjælp af en tegnet kurve

mellem specifikke niveauer af serien, så den afspejler den tendens, der ligger i serien, og samtidig frigør den fra ubetydelig

tøven;

Essensen af ​​mekaniske udjævningsmetoder er som følger.

De første par niveauer af tidsserien tages, dannes udjævningsinterval. For dem vælges et polynomium, hvis grad skal være mindre end antallet af niveauer, der er inkluderet i udjævningsintervallet; ved hjælp af et polynomium bestemmes nye, justerede værdier af niveauerne i midten

Simpel glidende gennemsnitsmetode.

Den enkleste udjævningsmetode er glidende gennemsnit, hvori

dages termer, hvor m er bredden af ​​udjævningsintervallet. I stedet for gennemsnittet kan du bruge medianen af ​​de værdier, der falder inden for udjævningsintervallet.

Hvis det er nødvendigt at udjævne små tilfældige udsving, tages udjævningsintervallet så stort som muligt. Hvis det er nødvendigt at bevare mindre udsving, reduceres udjævningsintervallet. Alt andet lige anbefales det at tage udjævningsintervallet ulige.

For at beregne de udjævnede niveauer af Y t-serien bruges formlen:

Hvor p m 1 (hvis ulige);

Som et resultat af denne procedure opnås (n-m+1) udjævnede værdier af serieniveauerne; i dette tilfælde går seriens første og sidste niveau tabt (ikke udjævnet). -

For lige værdier t, efter udjævningsproceduren, er den resulterende serie normalt centreret (gennemsnitsværdierne af to på hinanden følgende glidende gennemsnit findes).

Denne metode er kun anvendelig for serier, der har en lineær

tendens. Hvis processen er karakteriseret ved ikke-lineær udvikling, kan et simpelt glidende gennemsnit føre til betydelige forvrængninger.

Når tendensen for den justerede serie har bøjninger, og det er ønskeligt for forskeren at bevare bølgerne, så er den vægtede metode at foretrække.

glidende gennemsnit. Når man konstruerer et vægtet glidende gennemsnit på

Hvert udjævningsinterval erstattes værdien af ​​det centrale niveau med det beregnede, bestemt af den vægtede aritmetiske gennemsnitsformel:

ytw i

hvor w i er vægtkoefficienter bestemt ved metoden mindst

kvadrater, mens nivellering ved hvert udjævningsinterval oftest udføres ved hjælp af anden- eller tredjeordens polynomier11. For eksempel vil vægtningskoefficienterne for interval 5 være

følgende: 35 1 [ 3, 12, 17, 12, 3] , og for intervallet 7: 21 1 [ 2, 3, 6, 7, 6, 3, 2]

Eksempel. En tidsserie af produktoutputvolumen (i tusind rubler) er angivet. Niveauerne for Y(t)-serien er angivet i tabel 5.

Lad os vælge et udjævningsinterval m=3 og udglatte det simple glidende gennemsnit (tredje række i tabellen) Efter udjævning er en stigende tendens tydeligt synlig.

11 Mikhtaryan V.S., Arkhipova M.Yu. Økonometri: lærebog / udg. Mikhtaryan V.S. M.: LLC

"Prospect", 2008, s. 293

Tabel 5

S(t)gns

S(t)in

udjævningsinterval

vi vil udføre

udjævning

vægtet

glidende gennemsnit baseret på et andengradspolynomium

(fjerde

tabeller) ved hjælp af det givne

højere vægt

koefficienter.

Eksponentiel udjævningsmetode.

Når man undersøger økonomiske data, er indflydelsen af ​​senere observationer nogle gange vigtig. Denne metode løser dette problem

eksponentiel udjævning. I dette tilfælde den aktuelle værdi af den midlertidige

serier udjævnes under hensyntagen til en udjævningskonstant (vægt), normalt

udpeget. Beregningen udføres ved hjælp af følgende formel:

S t Y t (1) S t 1 , (5.4),

I betragtning af den tilbagevendende ekspansionsproces for mængderne S t 1, S t 2 og

etc. ifølge formel (5.4) opnår vi:

) j Y t j (1) t Y 0

S t(1

hvor j er antallet af forsinkelsesperioder fra øjeblik t. Ifølge formel (5.5)

den relative vægt af hvert tidligere niveau falder eksponentielt med afstanden fra det øjeblik, for hvilket den udjævnede værdi beregnes.

Deraf navnet på denne metode.

Ved anvendelse af metoden i praksis opstår der problemer med at vælge en parameter og bestemme startniveauet Y 0 . Jo højere værdi

parameter, jo mindre er indflydelsen af ​​tidligere niveauer. I hvert enkelt tilfælde er det nødvendigt at vælge den mest acceptable

betyder. Oftest gøres dette ved at kontrollere flere værdier.

Problemet med at vælge startværdien Y 0 løses som følger: for Y 0

den første værdi af tidsserien eller det aritmetiske middelværdi accepteres

de første medlemmer af serien.

Lad os se på det foregående eksempel. Lad os lave en eksponentiel

udjævning af tidsserien (tredje række i tabellen)

Den første udjævnede værdi er lig med det første niveau i serien. Den næste udjævnede værdi beregnes efter formel (5.3), hvor

Lad os gå videre til spørgsmålet om udjævning af tidsserier af økonomiske indikatorer. Meget ofte svinger niveauerne af dynamikserier, mens tendensen i udviklingen af ​​et økonomisk fænomen over tid er skjult af tilfældige afvigelser af niveauerne i den ene eller anden retning. For klart at identificere udviklingstendensen for den undersøgte proces, herunder for den videre anvendelse af prognosemetoder baseret på trendmodeller, udjævnes (justeres) tidsserier. Udjævning kan således betragtes som eliminering af den tilfældige komponent t fra en tidsseriemodel.

Den enkleste metode til mekanisk udjævning er simpel glidende gennemsnitsmetode. Først for tidsserien y 1 , y 2 , y 3 ,…, y n udjævningsintervallet bestemmes t (t< п). Hvis det er nødvendigt at udjævne små tilfældige udsving, så tages udjævningsintervallet så stort som muligt; Udjævningsintervallet reduceres, hvis mindre udsving skal bevares. Alt andet lige anbefales det at tage udjævningsintervallet ulige. For det første T niveauer af tidsserien, beregnes deres aritmetiske middelværdi; dette vil være den udjævnede værdi af niveauet for serien, der er placeret i midten af ​​udjævningsintervallet. Derefter forskydes udjævningsintervallet et niveau til højre, udregningen af ​​det aritmetiske gennemsnit gentages osv.

For at beregne udjævnede niveauer af en serie formel gælder

for ulige m;

for endda T formlen bliver mere kompliceret.

Resultatet af denne procedure er p - t+ 1 udjævnede værdier af serieniveauer; mens den første R og det seneste R niveauer af serien går tabt (ikke udjævnet).

Ejendommelighed eksponentiel metodeudjævning er det i proceduren for at finde udjævningen jeg af det th niveau bruges kun værdierne fra de foregående niveauer i serien ( jeg-1, jeg-2,...), taget med en vis vægt, og vægten af ​​observationen falder, når den bevæger sig væk fra det tidspunkt, for hvilket serieniveauets udjævnede værdi bestemmes.

Hvis for den originale tidsserie y 1 , y 2 , y 3 ,…, y n de tilsvarende udjævnede værdier for niveauerne er angivet med S t , t = 1,2, …, P, derefter udføres eksponentiel udjævning ifølge formlen

Her S 0 – mængde, der karakteriserer startbetingelserne.

I praktiske problemer med behandling af økonomiske tidsserier anbefales det at vælge værdien af ​​udjævningsparameteren i området fra 0,1 til 0,3.

Eksempel 4.4. Lad os vende tilbage til eksempel 1, som ser på Lewplans kvartalsvise salgsmængder. Vi har allerede fundet ud af, at en additiv model svarer til disse data, dvs. Faktisk kan salgsmængder udtrykkes som følger:

Y = U + V + E.

For at eliminere indflydelsen fra sæsonkomponenten vil vi bruge den glidende gennemsnitsmetode. Tilføjelse af de første fire værdier giver det samlede salg for 1998. At dividere denne sum med fire giver den gennemsnitlige salgsscore for hvert kvartal af 1998, dvs.

(239 + 201 +182 + 297)/4 = 229,75;
(201+182+297+324)/4 osv.

Den resulterende værdi indeholder ikke længere en sæsonbestemt komponent, da den repræsenterer gennemsnitsværdien for året. Vi har nu et skøn over trendværdien for midten af ​​året, dvs. for et punkt, der ligger i midten mellem kvarter II og III. Hvis du bevæger dig fremad sekventielt med intervaller på tre måneder, kan du beregne de gennemsnitlige kvartalsværdier for perioden april - marts 1998 (251), juli - juni 1998 (270,25) osv. Denne procedure giver dig mulighed for at generere firepunkts glidende gennemsnit for det originale datasæt. Det resulterende sæt af glidende gennemsnit repræsenterer det bedste estimat for den ønskede tendens.

Nu kan de opnåede trendværdier bruges til at finde estimater af sæsonkomponenten. Vi forventer:

YU = V + E.

Desværre refererer trendestimaterne opnået ved at beregne firepunktsgennemsnittene til flere forskellige tidspunkter end de faktiske data. Det første skøn, svarende til 229,75, repræsenterer det punkt, der falder sammen med midten af ​​1998, dvs. ligger i centrum af intervallet af faktiske salgsmængder i II og III kvartalerne. Det andet skøn, svarende til 251, ligger mellem de faktiske værdier i tredje og fjerde kvartal. Vi kræver sæsonbestemte gennemsnitsværdier svarende til de samme tidsintervaller som de faktiske værdier for kvartalet. Placeringen af ​​de sæsonbestemte gennemsnit over tid forskydes ved yderligere at beregne gennemsnittet for hvert par værdier. Lad os finde gennemsnittet af de første estimater, og centrere dem om juli - september 1998, dvs.

(229,75 + 251)/2 = 240,4.

Dette er det sæsonbestemte gennemsnit for juli - september 1999. Denne sæsonbestemte værdi, som kaldes centreret glidende gennemsnit, kan direkte sammenlignes med den faktiske værdi for juli-september 1998 på 182. Bemærk, at dette betyder, at der ikke er nogen tendensestimater for de første to eller sidste to kvartaler af tidsserien. Resultaterne af disse beregninger er angivet i tabel 4.5.

For hvert kvartal har vi sæsonbestemte komponenter, der inkluderer en fejl eller rest. Før vi kan bruge sæsonkomponenten, skal vi gennemgå de følgende to trin. Lad os finde de gennemsnitlige værdier af sæsonbestemte estimater for hver sæson af året. Denne procedure vil reducere nogle fejlværdier. Til sidst justerer vi gennemsnitsværdierne, øger eller mindsker dem med det samme tal, så deres samlede sum er nul. Dette er nødvendigt for at gennemsnittet værdierne af sæsonkomponenten for året som helhed.

Tabel 4.5. Estimering af sæsonkomponenten

Salgsmængde Y, tusinde stykker

i fire

kvarter

glidende

gennemsnit for fire

kvarter

Centreret glidende gennemsnit U

sæsonbestemt komponent

Y- U= V+ E

januar-marts 1998

april juni

juli-september

oktober december

januar-marts 1999

april juni

juli-september

oktober december

januar-marts 2000

april juni

juli-september

oktober december

januar-marts 2001

Tabel 4.6. Beregning af gennemsnitsværdier af sæsonkomponenten

Beregnet

Komponenter

Kvartalsnummer

Gennemsnits værdi

Sæsonvurdering

Komponenter

Beløb = -0,2

Justeret

sæsonbestemt komponent 1

Korrektionsfaktoren beregnes som følger: summen af ​​estimaterne af sæsonkomponenterne divideres med 4. I tabellens sidste kolonne. 4.5 disse estimater er registreret under de tilsvarende kvartalsvise værdier. Selve proceduren er angivet i tabel. 4.6.

Værdien af ​​sæsonkomponenten bekræfter endnu en gang vores konklusioner i eksempel 4.1 baseret på analysen af ​​diagrammet. Salgsvolumen for de to vinterkvartaler overstiger den gennemsnitlige trendværdi med ca. 40 tusinde enheder, og salgsvolumen for de to sommerperioder ligger under gennemsnittet med 21 og 62 tusinde enheder. henholdsvis.

En lignende procedure er anvendelig ved bestemmelse af sæsonvariationer for en hvilken som helst periode. Hvis f.eks. sæsonen er ugedagene, beregnes der også et glidende gennemsnit for at eliminere indflydelsen fra den daglige sæsonkomponent, men ikke med fire, men med syv point. Dette glidende gennemsnit repræsenterer midtugens trendværdi, dvs. på torsdag; dermed er behovet for en centreringsprocedure elimineret.

Undervisningsministeriet i Den Russiske Føderation

All-Russian Correspondence Financial and Economic Institute

Yaroslavl filial

Institut for Statistik

Kursusarbejde

efter disciplin:

"Statistikker"

opgave nr. 19

Elev: Kurashova Anastasia Yurievna

Speciale "Finans og kredit"

3. årgang, periferi

Leder: Sergeev V.P.

Yaroslavl, 2002

1. Introduktion………………………………………………………………………………………3 sider.

2. Teoretisk del……………………………………………………… …4 sider.

2.1 Grundlæggende begreber om dynamikserier…………………………...4 s.

2.2 Metoder til udjævning og udjævning af tidsserier……………………………………………………………………………………….6 s.

2.2.1 Metoder til "mekanisk udjævning"………………………6 s.

2.2.2 Metoder til "analytisk" justering…………………. 8 sider

3. Beregningsdel……………………………………………………… ……11 s.

4. Analytisk del………………………………………………………. .16 sider.

5. Konklusion………………………………………………………………. 25 s.

6. Referenceliste……………………………………………………………… 26 sider.

7. Ansøgninger………………………………………………………………. 27 s.


Introduktion

Fuldstændige og pålidelige statistiske oplysninger er det nødvendige grundlag for den økonomiske styringsproces. Al information af nationaløkonomisk betydning behandles og analyseres i sidste ende ved hjælp af statistik.

Det er statistiske data, der gør det muligt at bestemme mængden af ​​bruttonationalprodukt og nationalindkomst, identificere de vigtigste tendenser i udviklingen af ​​økonomiske sektorer, estimere inflationsniveauet, analysere tilstanden på finans- og råvaremarkeder, studere standarden for leve af befolkningen og andre socioøkonomiske fænomener og processer.

At mestre statistisk metodologi er en af ​​betingelserne for at forstå markedsforhold, studere tendenser og prognoser og træffe optimale beslutninger på alle aktivitetsniveauer.

Den sidste, analytiske fase af undersøgelsen er kompleks, tidskrævende og ansvarlig. På dette stadium beregnes gennemsnitsindikatorer og fordelingsindikatorer, befolkningens struktur analyseres, og dynamikken og sammenhængen mellem de fænomener og processer, der undersøges, studeres.

På alle stadier af forskningen anvender statistik forskellige metoder. Statistiske metoder er specielle teknikker og måder at studere sociale fænomener i massevis.

I. Teoretisk del.

1.1 Grundlæggende begreber om dynamikserier.

Tidsserier er statistiske data, der afspejler udviklingen over tid af det fænomen, der undersøges. De kaldes også dynamiske serier, tidsserier.

Hver række af dynamik har to hovedelementer:

1) tidsindikator t;

2) de tilsvarende udviklingsniveauer af det fænomen, der studeres y;

Tidsangivelser i dynamikserier er enten specifikke datoer (øjeblikke) eller individuelle perioder (år, kvartaler, måneder, dage).

Niveauerne i dynamikserien afspejler en kvantitativ vurdering (mål) af udviklingen over tid af det fænomen, der undersøges. De kan udtrykkes i absolutte, relative eller gennemsnitlige værdier.

Dynamics-serien adskiller sig i henhold til følgende egenskaber:

1) Efter tid. Afhængigt af arten af ​​det fænomen, der undersøges, kan niveauerne af tidsserier enten relatere til bestemte datoer (øjeblikke) eller til individuelle perioder. I overensstemmelse hermed er dynamikrækkerne opdelt i moment og interval.

Moment dynamics-serier viser tilstanden af ​​de fænomener, der studeres på bestemte datoer (øjeblikke) i tiden. Et eksempel på en momentserie af dynamikker er følgende oplysninger om lønantallet for butiksansatte i 1991 (tabel 1):

tabel 1

Liste over butiksansatte i 1991

Et træk ved momentrækken af ​​dynamikker er, at dens niveauer kan omfatte de samme enheder af den befolkning, der studeres. Selvom der er intervaller i en momentserie - intervaller mellem tilstødende datoer i serien - afhænger værdien af ​​et eller andet specifikt niveau ikke af varigheden af ​​perioden mellem to datoer. Således vises hovedparten af ​​butikspersonalet, der udgør lønsummen pr. 1. januar 1991, som fortsætter med at arbejde i et givet år, i niveauerne for efterfølgende perioder. Når man summerer niveauerne af momentserien, kan der derfor forekomme gentagen optælling.

Ved hjælp af momentserier af dynamik i handel studeres varebeholdninger, personalets tilstand, mængden af ​​udstyr og andre indikatorer, der afspejler tilstanden af ​​de fænomener, der studeres på individuelle datoer (punkter) i tid.

Intervaldynamikserier afspejler resultaterne af udviklingen (funktionen) af de fænomener, der studeres over individuelle tidsperioder (intervaller).

Et eksempel på en intervalserie er data om en butiks detailomsætning i 1987-1991. (Tabel 2):

tabel 2

Butikkens detailomsætningsmængde i 1987 - 1991.

Volumen af ​​detailomsætning, tusind rubler

885.7 932.6 980.1 1028.7 1088.4

Hvert niveau i en intervalserie repræsenterer allerede summen af ​​niveauer over kortere tidsperioder. I dette tilfælde er en enhed af befolkningen, der er en del af et niveau, ikke inkluderet i andre niveauer.

Det særlige ved intervaldynamikserien er, at hvert af dets niveauer består af data for kortere tidsintervaller (underperioder). For eksempel opsummerer vi omsætningen for årets første tre måneder, får vi dens volumen for første kvartal, og opsummerer omsætningen for fire kvartaler, får vi dens værdi for året osv. Alt andet lige niveau af intervalserien er større, jo længere intervallet er, som dette niveau tilhører.

Egenskaben ved at summere niveauer over successive tidsintervaller gør det muligt at opnå dynamikserier for mere forstørrede perioder.

Ved hjælp af intervalserier bruges dynamikken i handelen til at studere ændringer i tidspunktet for modtagelse og salg af varer, mængden af ​​distributionsomkostninger og andre indikatorer, der afspejler resultaterne af funktionen af ​​det fænomen, der undersøges for individuelle perioder.

Dynamik-seriens opbygning:

Enhver serie af dynamik kan teoretisk repræsenteres i form af komponenter:

1) tendens – hovedtendensen for udviklingen af ​​en tidsserie (mod en stigning eller et fald i dens niveauer);

2) cyklisk (periodiske udsving, herunder sæsonbestemte);

tilfældige udsving.

1. 2. Metoder til udjævning og justering af tidsserier.

Eliminering af tilfældige udsving i værdierne af serieniveauer udføres ved at finde "gennemsnitlige" værdier. Metoder til at eliminere tilfældige faktorer er opdelt i to grupper:

1. Metoder til "mekanisk" udjævning af fluktuationer ved at tage et gennemsnit af seriens værdier i forhold til andre nærliggende niveauer af serien.

2. Metoder til "analytisk" justering, dvs. først at bestemme det funktionelle udtryk for seriens trend, og derefter nye, beregnede værdier af serien.

1.2. 1 Metoder til "mekanisk" udjævning.

Disse omfatter:

EN. Metoden til at beregne et gennemsnit over to halvdele af en serie, når serien er opdelt i to dele. Derefter beregnes to værdier af seriens gennemsnitlige niveauer, hvorfra seriens trend bestemmes grafisk. Det er indlysende, at en sådan tendens ikke i tilstrækkelig grad afspejler det grundlæggende udviklingsmønster for fænomenet.

b. En metode til at forstørre intervaller, hvor længden af ​​tidsintervaller øges og nye værdier af serieniveauer beregnes.

V. Glidende gennemsnitsmetode. Denne metode bruges til at karakterisere udviklingstendensen for den statistiske population, der er undersøgt, og er baseret på beregningen af ​​seriens gennemsnitlige niveauer for en bestemt periode. Sekvens til bestemmelse af det glidende gennemsnit:

Udjævningsintervallet eller antallet af niveauer, der er inkluderet i det, indstilles. Hvis der tages højde for tre niveauer ved beregning af gennemsnittet, kaldes det glidende gennemsnit for tre-term, fem niveauer kaldes fem-term osv. Hvis små, tilfældige udsving i niveauer i dynamikserien udjævnes, så øges intervallet (tallet på det glidende gennemsnit). Hvis bølgerne skal bevares, reduceres antallet af medlemmer.

Det første gennemsnitsniveau beregnes ved hjælp af simpel aritmetik:

y1 = Sy1/m, hvor

y1 – 1. niveau af rækken;

m – medlem af det glidende gennemsnit.

Det første niveau kasseres, og beregningen af ​​gennemsnittet inkluderer niveauet efter det sidste niveau involveret i den første beregning. Processen fortsætter, indtil det sidste niveau af den undersøgte serie af dynamikker y n indgår i beregningen af ​​y.

Baseret på en række dynamikker konstrueret ud fra gennemsnitlige niveauer afsløres den generelle tendens i udviklingen af ​​fænomenet.

Den negative side ved at bruge den glidende gennemsnitsmetode er dannelsen af ​​skift i udsving i serieniveauer på grund af "glidningen" af aggregeringsintervaller. Udjævning ved hjælp af et glidende gennemsnit kan føre til udseendet af "omvendte" udsving, når en konveks "bølge" erstattes af en konkav.

For nylig er et adaptivt glidende gennemsnit begyndt at blive beregnet. Dens forskel er, at den gennemsnitlige værdi af attributten, også beregnet som beskrevet ovenfor, ikke refererer til midten af ​​serien, men til den sidste tidsperiode i forstørrelsesintervallet. Desuden antages det, at det adaptive gennemsnit afhænger af det tidligere niveau i mindre grad end af det nuværende. Det vil sige, at jo flere tidsintervaller mellem seriens niveau og gennemsnitsværdien, jo mindre indflydelse har værdien af ​​dette seriens niveau på gennemsnitsværdien.

d. Eksponentiel gennemsnitsmetode. Det eksponentielle gennemsnit er et adaptivt glidende gennemsnit, beregnet ved hjælp af vægte, der afhænger af graden af ​​"fjernhed" af individuelle niveauer i serien fra gennemsnitsværdien. Værdien af ​​vægten falder, efterhånden som niveauet bevæger sig væk langs den kronologiske linje fra gennemsnitsværdien i overensstemmelse med den eksponentielle funktion, derfor kaldes et sådant gennemsnit eksponentielt. I praksis anvendes multipel eksponentiel udjævning af dynamikserien, som bruges til at forudsige fænomenets udvikling.

Konklusion: De metoder, der er inkluderet i den første gruppe, giver på grund af de anvendte beregningsmetoder forskeren en meget forenklet, unøjagtig idé om tendensen i dynamikserien. Den korrekte anvendelse af disse metoder kræver dog, at forskeren har en dybdegående viden om dynamikken i forskellige socioøkonomiske fænomener.

16.02.15 Viktor Gavrilov

38133 0

En tidsserie er en sekvens af værdier, der ændrer sig over tid. Jeg vil prøve at tale om nogle enkle, men effektive tilgange til at arbejde med sådanne sekvenser i denne artikel. Der er mange eksempler på sådanne data - valutakurser, salgsmængder, kundeønsker, data inden for forskellige anvendte videnskaber (sociologi, meteorologi, geologi, observationer i fysik) og meget mere.

Serier er en almindelig og vigtig form for beskrivelse af data, da de giver os mulighed for at observere hele historien om ændringer i værdien af ​​interesse for os. Dette giver os mulighed for at bedømme den "typiske" adfærd af en mængde og afvigelser fra en sådan adfærd.

Jeg stod over for opgaven med at vælge et datasæt, hvorpå det ville være muligt klart at demonstrere egenskaberne ved tidsserier. Jeg besluttede at bruge statistik over international flypassagertrafik, fordi dette datasæt er meget klart og er blevet noget af en standard (http://robjhyndman.com/tsdldata/data/airpass.dat, kilde Time Series Data Library, R. J. Hyndman). Serien beskriver antallet af internationale flypassagerer pr. måned (i tusindvis) for perioden 1949 til 1960.

Da jeg altid har ved hånden, som har et interessant værktøj "" til at arbejde med rækker, vil jeg bruge det. Før du importerer data til en fil, skal du tilføje en kolonne med en dato, så værdierne er bundet til tiden, og en kolonne med navnet på serien for hver observation. Nedenfor kan du se, hvordan min kildefil ser ud, som jeg importerede til Prognoz Platform ved hjælp af Import Wizard direkte fra tidsserieanalyseværktøjet.

Det første, vi normalt gør med en tidsserie, er at plotte den på en graf. Prognoz Platform giver dig mulighed for at bygge et diagram ved blot at trække en serie ind i projektmappen.

Tidsserier på et diagram

Symbolet 'M' i slutningen af ​​serienavnet betyder, at serien har månedlig dynamik (intervallet mellem observationer er en måned).

Allerede fra grafen ser vi, at serien demonstrerer to funktioner:

  • tendens– på vores diagram er dette en langsigtet stigning i de observerede værdier. Det kan ses, at tendensen er nærmest lineær.
  • sæsonbestemt– på grafen er disse periodiske udsving i værdi. I den næste artikel om emnet tidsserier vil vi lære, hvordan vi kan beregne perioden.

Vores serie er ret "pæn", men der er ofte serier, der ud over de to ovenfor beskrevne egenskaber demonstrerer en anden - tilstedeværelsen af ​​"støj", dvs. tilfældige variationer i en eller anden form. Et eksempel på en sådan serie kan ses i skemaet nedenfor. Dette er en sinusbølge blandet med en tilfældig variabel.

Når vi analyserer serier, er vi interesserede i at identificere deres struktur og vurdere alle hovedkomponenterne - trend, sæsonbestemt, støj og andre funktioner, samt evnen til at lave prognoser for ændringer i værdi i fremtidige perioder.

Når man arbejder med serier, gør tilstedeværelsen af ​​støj det ofte vanskeligt at analysere seriens struktur. For at eliminere dens indflydelse og bedre se strukturen af ​​serien, kan du bruge serieudjævningsmetoder.

Den enkleste metode til udjævning af serier er et glidende gennemsnit. Ideen er, at for et hvilket som helst ulige antal punkter i rækkefølgen skal du erstatte det centrale punkt med det aritmetiske middelværdi af de resterende punkter:

Hvor x i– indledende række, s jeg– udglattede serier.

Nedenfor kan du se resultatet af at anvende denne algoritme til vores to serier. Som standard foreslår Prognoz Platform at bruge anti-aliasing med en vinduesstørrelse på 5 punkter ( k i vores formel ovenfor vil det være lig med 2). Bemærk venligst, at det udjævnede signal ikke længere er så påvirket af støj, men sammen med støjen forsvinder naturligvis også nogle nyttige oplysninger om seriens dynamik. Det er også tydeligt, at den udjævnede serie mangler den første (og også den sidste) k point. Dette skyldes det faktum, at udjævning udføres på vinduets centrale punkt (i vores tilfælde det tredje punkt), hvorefter vinduet forskydes med et punkt, og beregningerne gentages. Til den anden, tilfældige serie brugte jeg udjævning med et vindue på 30 for bedre at identificere seriens struktur, da serien er "højfrekvent" med mange punkter.

Metoden med glidende gennemsnit har visse ulemper:

  • Et glidende gennemsnit er ineffektivt at beregne. For hvert punkt skal gennemsnittet genberegnes på ny. Vi kan ikke genbruge resultatet beregnet for et tidligere punkt.
  • Det glidende gennemsnit kan ikke udvides til det første og sidste punkt i serien. Dette kan forårsage et problem, hvis det er disse punkter, vi er interesserede i.
  • Det glidende gennemsnit er ikke defineret uden for serien og kan derfor ikke bruges til prognoser.

Eksponentiel udjævning

En mere avanceret udjævningsmetode, der også kan bruges til prognoser, er eksponentiel udjævning, også nogle gange kaldet Holt-Winters-metoden efter dens skabere.

Der er flere variationer af denne metode:

  • enkelt udjævning for serier, der ikke har nogen tendens eller sæsonbestemt;
  • dobbelt udjævning for serier, der har en trend, men ingen sæsonbestemt;
  • tredobbelt udjævning til serier, der både har en trend og sæsonbestemt.

Den eksponentielle udjævningsmetode beregner værdierne af en udjævnet serie ved at opdatere værdierne beregnet i det foregående trin ved hjælp af information fra det aktuelle trin. Information fra de tidligere og nuværende trin tages med forskellige vægte, der kan kontrolleres.

I den enkleste version af enkelt udjævning er forholdet:

Parameter α definerer forholdet mellem den uudjævnede værdi ved det aktuelle trin og den udjævnede værdi fra det foregående trin. På α =1 tager vi kun punkterne i den originale serie, dvs. der vil ikke være nogen udjævning. På α =0 række vil vi kun tage udjævnede værdier fra tidligere trin, dvs. serien bliver en konstant.

For at forstå, hvorfor udjævning kaldes eksponentiel, er vi nødt til at udvide forholdet rekursivt:

Det er klart fra forholdet, at alle tidligere værdier i serien bidrager til den aktuelle udjævnede værdi, men deres bidrag falmer eksponentielt på grund af en stigning i graden af ​​parameteren α .

Men hvis der er en tendens i dataene, vil simpel udjævning "halte" bagud (eller du bliver nødt til at tage værdierne α tæt på 1, men så vil udjævningen være utilstrækkelig). Du skal bruge dobbelt eksponentiel udjævning.

Dobbelt udjævning bruger allerede to ligninger - en ligning evaluerer tendensen som forskellen mellem de nuværende og tidligere udjævnede værdier, og udjævner derefter tendensen med simpel udjævning. Den anden ligning udfører udjævning som i det simple tilfælde, men det andet led bruger summen af ​​den tidligere udjævnede værdi og tendensen.

Tredobbelt udjævning inkluderer en anden komponent - sæsonbestemt, og bruger en anden ligning. I dette tilfælde er der to varianter af sæsonkomponenten - additiv og multiplikativ. I det første tilfælde er amplituden af ​​sæsonkomponenten konstant og afhænger ikke over tid af seriens basisamplitude. I det andet tilfælde ændres amplituden sammen med ændringen i seriens basisamplitude. Det er netop vores tilfælde, som det kan ses af grafen. Efterhånden som serien vokser, øges amplituden af ​​sæsonudsving.

Da vores første række har både en trend og sæsonbestemthed, besluttede jeg at vælge tredobbelte udjævningsparametre til den. I Prognoz Platform er dette ret nemt at gøre, for når parameterværdien opdateres, gentegner platformen straks grafen for den udjævnede serie, og visuelt kan man med det samme se, hvor godt den beskriver vores originale serie. Jeg valgte følgende værdier:

Vi vil se på, hvordan jeg har beregnet perioden i næste artikel om tidsserier.

Typisk kan værdier mellem 0,2 og 0,4 betragtes som første tilnærmelser. Prognoz Platform bruger også en model med en ekstra parameter ɸ , hvilket dæmper tendensen, så den nærmer sig en konstant i fremtiden. Til ɸ Jeg tog værdien 1, som svarer til den normale model.

Jeg lavede også en prognose for serieværdierne ved hjælp af denne metode for de sidste 2 år. I nedenstående figur har jeg markeret udgangspunktet for prognosen ved at tegne en streg igennem den. Som du kan se, falder den originale serie og den udjævnede ganske godt sammen, også i prognoseperioden - ikke dårligt for så simpel en metode!

Prognoz Platform giver dig også mulighed for automatisk at vælge optimale parameterværdier ved hjælp af en systematisk søgning i området af parameterværdier og minimere summen af ​​kvadrerede afvigelser af den udjævnede serie fra den oprindelige.

De beskrevne metoder er meget enkle, nemme at anvende og giver et godt udgangspunkt for at analysere strukturen og prognosen af ​​tidsserier.

Læs mere om tidsserier i næste artikel.

Meget ofte svinger niveauerne i dynamikserien, mens tendensen til udvikling af fænomenet over tid er skjult af tilfældige afvigelser af niveauerne i den ene eller anden retning. For mere klart at identificere udviklingstendensen for den undersøgte proces, herunder for den videre anvendelse af prognosemetoder baseret på trendmodeller, udjævning(nivellering) tidsserier.

Tidsserieudjævningsmetoder er opdelt i to hovedgrupper:

1. analytisk justering ved hjælp af en kurve tegnet mellem specifikke niveauer af en serie, således at den afspejler den iboende tendens i serien og samtidig frigør den for mindre udsving;

2. mekanisk justering af individuelle niveauer i en tidsserie ved hjælp af de faktiske værdier af tilstødende niveauer.

Essensen af ​​mekaniske udjævningsmetoder er som følger. Flere niveauer af tidsserierne tages og dannes udjævningsinterval. For dem vælges et polynomium, hvis grad skal være mindre end antallet af niveauer, der er inkluderet i udjævningsintervallet; ved hjælp af et polynomium bestemmes nye, udjævnede niveauværdier i midten af ​​udjævningsintervallet. Dernæst flyttes udjævningsintervallet et rækkeniveau til højre, den næste udjævnede værdi beregnes og så videre.

Den enkleste metode til mekanisk udjævning er simpel glidende gennemsnitsmetode.

2.4.1.Simpel glidende gennemsnitsmetode.

Først for tidsserien: udjævningsintervallet bestemmes. Hvis det er nødvendigt at udjævne små tilfældige udsving, så tages udjævningsintervallet så stort som muligt; Udjævningsintervallet reduceres, hvis mindre udsving skal bevares.

For de første niveauer af serien beregnes deres aritmetiske middelværdi. Dette vil være den udjævnede værdi af niveauet for serien, der er placeret i midten af ​​udjævningsintervallet. Derefter forskydes udjævningsintervallet et niveau til højre, beregningen af ​​det aritmetiske gennemsnit gentages, og så videre. For at beregne de udjævnede niveauer af en serie bruges formlen:

hvor (hvis ulige); for lige tal bliver formlen mere kompliceret.

Som et resultat af denne procedure opnås udjævnede værdier af serieniveauerne; i dette tilfælde går seriens første og sidste niveau tabt (ikke udjævnet). En anden ulempe ved metoden er, at den kun er anvendelig til serier, der har en lineær tendens.

2.4.2.Vægtet glidende gennemsnitsmetode.

Metoden med vægtet glidende gennemsnit adskiller sig fra den tidligere udjævningsmetode ved, at de niveauer, der indgår i udjævningsintervallet, summeres med forskellige vægte. Dette skyldes det faktum, at tilnærmelsen af ​​serien inden for udjævningsintervallet udføres ved hjælp af et polynomium, der ikke er af den første grad, som i det foregående tilfælde, men af ​​en grad, der starter fra den anden.

Den aritmetiske vægtede gennemsnitsformel bruges:

,

hvor vægtene bestemmes ved hjælp af mindste kvadraters metode. Disse vægte beregnes for forskellige grader af det approksimerende polynomium og forskellige udjævningsintervaller.

1. for polynomier af anden og tredje orden har den numeriske sekvens af vægte ved udjævningsintervallet formen: , og for har formen: ;

2. For polynomier af fjerde og femte grad og med et udjævningsinterval er rækkefølgen af ​​vægte som følger: .

For fordelingen af ​​vægte over udjævningsintervallet, opnået ved hjælp af mindste kvadraters metode, se diagram 1.



2.4.3.Eksponentiel udjævningsmetode.

Den samme gruppe af metoder inkluderer den eksponentielle udjævningsmetode.

Dets ejendommelighed er, at i proceduren til at finde det udjævnede niveau, bruges kun værdierne af de tidligere niveauer i serien, taget med en vis vægt, og vægten af ​​observationen falder, når den bevæger sig væk fra tidspunktet for hvilken den udjævnede værdi af serieniveauet bestemmes.

Hvis for den originale tidsserie

de tilsvarende udjævnede værdier er angivet med , derefter udføres eksponentiel udjævning i henhold til formlen:

Hvor udjævningsparameter ; mængden kaldes rabatfaktor.

Ved at bruge den givne gentagelsesrelation for alle niveauer i serien, startende fra det første og slutter med tidspunktet, kan vi opnå, at det eksponentielle gennemsnit, det vil sige værdien af ​​niveauet af serien, der udjævnes ved denne metode, er en vægtet gennemsnit af alle tidligere niveauer.