Juhusliku suuruse standardhälve. Statistilised parameetrid

Standardhälve on kirjeldava statistika varieeruvuse klassikaline näitaja.

Standardhälve, standardhälve, standardhälve, valimi standardhälve (ing. standard deviation, STD, STDev) – kirjeldavas statistikas väga levinud hajuvuse näitaja. Aga sest tehniline analüüs on sarnane statistikaga; seda indikaatorit saab (ja tuleks) kasutada tehnilises analüüsis, et tuvastada analüüsitava instrumendi hinna hajumise määr ajas. Tähistatakse kreeka sümboliga Sigma "σ".

Täname Carl Gaussi ja Pearsoni standardhälbe kasutamise lubamise eest.

Kasutades standardhälve tehnilises analüüsis, keerame selle ümber "hajumise indeks""V "volatiilsuse indikaator“, säilitades tähenduse, kuid muutes termineid.

Mis on standardhälve

Kuid peale vahepealsete abiarvutuste standardhälve on sõltumatuks arvutamiseks üsna vastuvõetav ja rakendused tehnilises analüüsis. Nagu meie ajakirja aktiivne lugeja Burdock märkis, " Ma ei saa siiani aru, miks standardhälve ei sisaldu kodumaiste kaubanduskeskuste standardnäitajate komplektis«.

Tõesti, standardhälbe abil saab mõõta instrumendi varieeruvust klassikalisel ja “puhtal” viisil. Kuid kahjuks pole see näitaja väärtpaberianalüüsis nii levinud.

Standardhälbe rakendamine

Standardhälbe käsitsi arvutamine pole eriti huvitav, kuid kogemuse jaoks kasulik. Standardhälvet saab väljendada valem STD=√[(∑(x-x ) 2)/n] , mis kõlab kui valimi elementide ja keskmise ruudu erinevuste summa juur, mis on jagatud valimi elementide arvuga.

Kui valimi elementide arv ületab 30, siis juure all oleva murdosa nimetaja saab väärtuse n-1. Muidu kasutatakse n.

Samm sammu haaval standardhälbe arvutamine:

  1. arvutada andmevalimi aritmeetiline keskmine
  2. lahutage see keskmine igast valimielemendist
  3. paneme kõik saadud erinevused ruudusse
  4. summeerige kõik saadud ruudud
  5. jagage saadud summa valimi elementide arvuga (või n-1-ga, kui n>30)
  6. arvutage saadud jagatise ruutjuur (nn dispersioon)

Väärib märkimist, et sellel dispersiooniarvutusel on puudus – see osutub kallutatud, s.t. selle matemaatiline ootus ei ole võrdne dispersiooni tegeliku väärtusega. Loe selle kohta lähemalt. Samas pole kõik nii hull. Valimi suuruse kasvades läheneb see ikkagi oma teoreetilisele analoogile, s.t. on asümptootiliselt erapooletu. Seetõttu võite suurte valimimahtudega töötades kasutada ülaltoodud valemit.

Kasulik on tõlkida märkide keel sõnade keelde. Selgub, et dispersioon on hälvete keskmine ruut. See tähendab, et kõigepealt arvutatakse keskmine väärtus, seejärel võetakse iga algse ja keskmise väärtuse erinevus, ruudustatakse, liidetakse ja jagatakse seejärel populatsiooni väärtuste arvuga. Individuaalse väärtuse ja keskmise erinevus peegeldab hälbe mõõtu. See on ruudus nii, et kõik hälbed muutuksid eranditult positiivseteks arvudeks ja et nende summeerimisel vältida positiivsete ja negatiivsete hälvete vastastikust hävitamist. Seejärel arvutame ruudus hälbeid arvestades lihtsalt aritmeetilise keskmise. Keskmine – ruut – kõrvalekalded. Kõrvalekalded ruudustatakse ja arvutatakse keskmine. Lahendus peitub vaid kolmes sõnas.

Puhtal kujul, nagu aritmeetiline keskmine või indeks, dispersiooni siiski ei kasutata. See on pigem abi- ja vahenäitaja, mis on vajalik muud tüüpi statistilise analüüsi jaoks. Sellel pole isegi tavalist mõõtühikut. Valemi järgi otsustades on see algandmete mõõtühiku ruut. Ilma pudelita, nagu öeldakse, ei saa te sellest aru.

(moodul 111)

Et dispersioon reaalsusesse tagasi tuua ehk kasutada seda olmelisematel eesmärkidel, eraldatakse sellest ruutjuur. Selgub nn standardhälve (RMS). Seal on nimed "standardhälve" või "sigma" (kreeka tähe nimest). Standardhälbe valem on järgmine:

Selle näidise indikaatori saamiseks kasutage valemit:

Nagu dispersiooni puhul, on arvutusvõimalus veidi erinev. Kuid valimi kasvades erinevus kaob.

Ilmselgelt iseloomustab standardhälve ka andmete hajumise mõõtu, kuid nüüd saab seda (erinevalt dispersioonist) võrrelda algandmetega, kuna neil on samad mõõtühikud (see selgub arvutusvalemist). Kuid see näitaja puhtal kujul ei ole väga informatiivne, kuna see sisaldab liiga palju vahepealseid arvutusi, mis tekitavad segadust (hälve, ruut, summa, keskmine, juur). Kuid standardhälbega on juba võimalik otse töötada, sest selle indikaatori omadused on hästi uuritud ja teada. Näiteks on see olemas kolme sigma reegel, mis väidab, et andmetel on 997 väärtust 1000-st ±3 sigma piires aritmeetilisest keskmisest. Standardhälvet kui määramatuse mõõdikut kasutatakse ka paljudes statistilistes arvutustes. Tema abiga määratakse erinevate hinnangute ja prognooside täpsusaste. Kui variatsioon on väga suur, siis on ka standardhälve suur ja seetõttu on prognoos ebatäpne, mis väljendub näiteks väga laiades usaldusvahemikes.

Variatsioonikoefitsient

Standardhälve annab dispersiooni suuruse absoluutse hinnangu. Seetõttu on vaja suhtelist indikaatorit, et mõista, kui suur on erinevus väärtuste endi suhtes (st sõltumata nende skaalast). Seda indikaatorit nimetatakse variatsioonikoefitsient ja arvutatakse järgmise valemi abil:

Variatsioonikoefitsienti mõõdetakse protsentides (kui korrutada 100%-ga). Selle indikaatori abil saate võrrelda mitmesuguseid nähtusi, olenemata nende skaalast ja mõõtühikutest. See asjaolu muudab variatsioonikoefitsiendi nii populaarseks.

Statistikas on aktsepteeritud, et kui variatsioonikoefitsiendi väärtus on alla 33%, loetakse populatsioon homogeenseks, kui see on üle 33%, siis on see heterogeenne. Mul on siin raske midagi kommenteerida. Ma ei tea, kes selle määratles ja miks, kuid seda peetakse aksioomiks.

Tunnen, et kuiv teooria mind tõmbab ja pean tooma midagi visuaalset ja kujundlikku. Seevastu kõik variatsiooninäitajad kirjeldavad ligikaudu sama asja, ainult et neid arvutatakse erinevalt. Seetõttu on raske tuua erinevaid näiteid, erineda võivad ainult indikaatorite väärtused, kuid mitte nende olemus. Seega võrdleme, kuidas erinevad variatsiooninäitajate väärtused sama andmekogumi puhul. Võtame näiteks keskmise lineaarse hälbe (alates ) arvutamise. Siin on lähteandmed:

Ja ajakava, mis teile meelde tuletab.

Neid andmeid kasutades arvutame välja erinevad variatsiooninäitajad.

Keskmine väärtus on tavaline aritmeetiline keskmine.

Variatsioonivahemik on erinevus maksimumi ja miinimumi vahel:

Keskmine lineaarne hälve arvutatakse järgmise valemi abil:

Standardhälve:

Võtame arvutuse tabelisse kokku.

Nagu näha, annavad lineaarne keskmine ja standardhälve andmete varieerumise astme jaoks sarnased väärtused. Dispersioon on sigma ruudus, seega on see alati suhteliselt suur arv, mis tegelikult ei tähenda midagi. Variatsioonivahemik on erinevus äärmuslike väärtuste vahel ja võib rääkida palju.

Võtame mõned tulemused kokku.

Indikaatori varieeruvus peegeldab protsessi või nähtuse muutlikkust. Selle astet saab mõõta mitme näitaja abil.

1. Variatsioonivahemik – maksimumi ja miinimumi vahe. Peegeldab võimalike väärtuste vahemikku.
2. Keskmine lineaarne hälve – kajastab analüüsitud populatsiooni kõigi väärtuste absoluutsete (mooduli) kõrvalekallete keskmist nende keskmisest väärtusest.
3. Dispersioon – kõrvalekallete keskmine ruut.
4. Standardhälve on dispersiooni juur (hälbete keskmine ruut).
5. Variatsioonikoefitsient on kõige universaalsem näitaja, mis peegeldab väärtuste hajumise astet, sõltumata nende skaalast ja mõõtühikutest. Variatsioonikoefitsienti mõõdetakse protsentides ja selle abil saab võrrelda erinevate protsesside ja nähtuste varieeruvust.

Seega on statistilises analüüsis olemas näitajate süsteem, mis peegeldab nähtuste homogeensust ja protsesside stabiilsust. Tihti pole variatsiooninäitajatel iseseisvat tähendust ja neid kasutatakse andmete edasiseks analüüsiks (usaldusvahemike arvutamiseks

Standardhälve

Kõige täiuslikum variatsiooni tunnus on keskmine ruuthälve, mida nimetatakse standardhälbeks (või standardhälbeks). Standardhälve() on võrdne atribuudi üksikute väärtuste keskmise ruuthälbe ruutjuurega aritmeetilisest keskmisest:

Standardhälve on lihtne:

Rühmitatud andmetele rakendatakse kaalutud standardhälvet:

Tavalise jaotustingimuste korral on keskmise ruudu ja keskmise lineaarhälbe vahel järgmine suhe: ~ 1,25.

Standardhälvet, mis on peamine absoluutne variatsioonimõõt, kasutatakse normaaljaotuse kõvera ordinaatväärtuste määramisel, valimi vaatluse korraldamise ja valimi karakteristikute täpsuse kindlakstegemisega seotud arvutustes, samuti proovide tunnuste täpsuse hindamisel. tunnuse varieerumise piirid homogeenses populatsioonis.

18. Dispersioon, selle liigid, standardhälve.

Juhusliku suuruse dispersioon- antud juhusliku suuruse leviku mõõt, st selle kõrvalekalle matemaatilisest ootusest. Statistikas kasutatakse sageli tähist või. Tavaliselt nimetatakse dispersiooni ruutjuurt standardhälve, standardhälve või tavaline levi.

Kogu dispersioon (σ 2) mõõdab tunnuse muutumist tervikuna kõigi selle kõikumise põhjustanud tegurite mõjul. Samas on tänu rühmitamismeetodile võimalik tuvastada ja mõõta rühmitamistunnusest tulenevat variatsiooni ja arvestamata tegurite mõjul tekkivat variatsiooni.

Gruppidevaheline dispersioon (σ 2 m.gr) iseloomustab süstemaatilist varieerumist ehk erinevusi uuritava tunnuse väärtuses, mis tekivad tunnuse – rühma aluseks oleva teguri – mõjul.

Standardhälve(sünonüümid: standardhälve, standardhälve, ruuthälve; seotud terminid: standardhälve, standardne levik) - tõenäosusteoorias ja statistikas on kõige levinum juhusliku suuruse väärtuste hajuvuse näitaja selle matemaatilise ootuse suhtes. Piiratud väärtuste valimite massiivi puhul kasutatakse matemaatilise ootuse asemel valimite komplekti aritmeetilist keskmist.

Standardhälvet mõõdetakse juhusliku suuruse enda mõõtühikutes ja seda kasutatakse aritmeetilise keskmise standardvea arvutamisel, usaldusvahemike koostamisel, hüpoteeside statistilisel kontrollimisel, juhuslike suuruste vahelise lineaarse seose mõõtmisel. Määratletakse juhusliku suuruse dispersiooni ruutjuurena.

Standardhälve:

Standardhälve(juhusliku suuruse standardhälbe hinnang x võrreldes selle matemaatilise ootusega, mis põhineb selle dispersiooni erapooletul hinnangul):

kus on dispersioon; - i valiku element; - näidissuurus; - valimi aritmeetiline keskmine:

Tuleb märkida, et mõlemad hinnangud on kallutatud. Üldjuhul on erapooletu hinnangu koostamine võimatu. Sel juhul on erapooletu dispersioonihinnangul põhinev hinnang järjepidev.

19. Režiimi ja mediaani olemus, ulatus ja määramise kord.

Lisaks statistikas võimsuskeskmistele kasutatakse muutuva tunnuse väärtuse ja jaotusridade sisemise struktuuri suhteliseks iseloomustamiseks struktuurseid keskmisi, mida esindavad peamiselt mood ja mediaan.

Mood- See on seeria kõige levinum variant. Moodi kasutatakse näiteks klientide seas kõige enam nõutavate rõivaste ja jalanõude suuruse määramisel. Diskreetse seeria režiim on kõrgeima sagedusega variant. Intervalli variatsiooniseeria režiimi arvutamisel on äärmiselt oluline kõigepealt määrata modaalne intervall (maksimaalse sageduse järgi) ja seejärel - atribuudi modaalväärtuse väärtus valemi abil:

§ - moe tähendus

§ - modaalse intervalli alumine piir

§ - intervalli väärtus

§ - modaalintervalli sagedus

§ - modaalile eelneva intervalli sagedus

§ - modaalile järgneva intervalli sagedus

Mediaan – see atribuudi väärtus ĸᴏᴛᴏᴩᴏᴇ asub järjestatud seeria aluses ja jagab selle seeria kaheks võrdseks osaks.

Mediaani määramiseks diskreetses seerias kui sagedused on saadaval, arvutage esmalt sageduste poolsumma ja seejärel määrake, milline variandi väärtus sellele langeb. (Kui sorteeritud seerias on paaritu arv tunnuseid, arvutatakse mediaanarv järgmise valemi abil:

M e = (n (tunnuste arv kokku) + 1)/2,

paarisarvu tunnuste korral on mediaan võrdne rea keskel asuva kahe tunnuse keskmisega).

Mediaani arvutamisel intervallide variatsiooniseeriate jaoks Esmalt määrake mediaanintervall, mille sees mediaan asub, ja seejärel määrake mediaani väärtus valemi abil:

§ – nõutav mediaan

§ - mediaani sisaldava intervalli alumine piir

§ - intervalli väärtus

§ - sageduste summa või seerialiikmete arv

§ - mediaanile eelnevate intervallide akumuleeritud sageduste summa

§ - mediaanintervalli sagedus

Näide. Leidke režiim ja mediaan.

Lahendus: selles näites on modaalne intervall vanuserühmas 25–30 aastat, kuna sellel intervallil on kõrgeim sagedus (1054).

Arvutame režiimi suuruse:

See tähendab, et õpilaste modaalne vanus on 27 aastat.

Arvutame mediaani. Keskmine intervall on vanuserühmas 25-30 aastat, kuna selle intervalli sees on valik, mis jagab elanikkonna kaheks võrdseks osaks (Σf i /2 = 3462/2 = 1731). Järgmisena asendame valemis vajalikud arvandmed ja saame mediaanväärtuse:

See tähendab, et pooled õpilastest on alla 27,4-aastased, teine ​​pool aga üle 27,4-aastased.

Lisaks režiimile ja mediaanile kasutatakse selliseid näitajaid nagu kvartiilid, mis jagavad järjestatud seeriad 4 võrdseks osaks, detsiilid - 10 osaks ja protsentiilid - 100 osaks.

20. Valimivaatluse mõiste ja selle ulatus.

Valikuline vaatlus kehtib pideva järelevalve kasutamisel füüsiliselt võimatu suure andmemahu tõttu või ei ole majanduslikult otstarbekas. Füüsiline võimatus ilmneb näiteks reisijatevoogude, turuhindade ja pereeelarvete uurimisel. Majanduslik ebaotstarbekus ilmneb nende hävitamisega seotud kaupade kvaliteedi hindamisel, näiteks maitsmisel, telliste tugevuse kontrollimisel jne.

Vaatluseks valitud statistilised ühikud on näidispopulatsioon või näidis ja kogu nende massiiv - üldine elanikkond(GS). Kus ühikute arv proovis tähistama n ja kogu GS-is - N. Suhtumine n/N tavaliselt kutsutakse suhteline suurus või näidisosa.

Proovide vaatlustulemuste kvaliteet sõltub valimi esinduslikkus st selle kohta, kui esinduslik see GS-is on. Valimi esinduslikkuse tagamiseks on äärmiselt oluline järgida ühikute juhusliku valiku põhimõte, mis eeldab, et HS-ühiku valimisse kaasamist ei saa mõjutada ükski muu tegur peale juhuse.

Olemas 4 juhusliku valiku võimalust prooviks:

  1. Tegelikult juhuslikult valik või "lotomeetod", kui statistilistele väärtustele määratakse seerianumbrid, mis registreeritakse teatud objektidele (näiteks tünnid), mis seejärel segatakse konteineris (näiteks kotis) ja valitakse juhuslikult. Praktikas kasutatakse seda meetodit juhuslike arvude generaatori või juhuslike arvude matemaatiliste tabelite abil.
  2. Mehaaniline valik, mille järgi iga ( N/n)-nda üldkogumi väärtus. Näiteks kui see sisaldab 100 000 väärtust ja peate valima 1000, kaasatakse valimisse iga 100 000 / 1000 = 100. väärtus. Veelgi enam, kui neid ei järjestata, valitakse esimene saja hulgast juhuslikult ja teiste numbrid on saja võrra suuremad. Näiteks kui esimene ühik oli nr 19, siis järgmine peaks olema nr 119, siis nr 219, siis nr 319 jne. Kui rahvastikuüksused on järjestatud, siis valitakse kõigepealt nr 50, seejärel nr 150, siis nr 250 jne.
  3. Väärtused valitakse heterogeensest andmemassiivist kihistunud(kihistatud) meetod, kui populatsioon jagatakse esmalt homogeenseteks rühmadeks, millele rakendatakse juhuslikku või mehaanilist valikut.
  4. Spetsiaalne proovivõtumeetod on sari selektsioon, mille käigus nad valivad juhuslikult või mehaaniliselt mitte üksikuid väärtusi, vaid nende seeriaid (jadad mingist arvust mõne numbrini reas), mille raames teostatakse pidevat vaatlust.

Proovivaatluste kvaliteet sõltub ka sellest proovi tüüp: kordas või kordumatu. Kell uuesti valik Valimisse kaasatud statistilised väärtused või nende seeriad tagastatakse pärast kasutamist üldkogumisse, millel on võimalus sattuda uude valimisse. Veelgi enam, kõigil üldkogumi väärtustel on valimisse kaasamise tõenäosus sama. Kordumatu valik tähendab, et valimisse kaasatud statistilised väärtused või nende seeriad ei naase pärast kasutamist üldkogumisse ja seetõttu suureneb viimaste ülejäänud väärtuste puhul tõenäosus järgmisse valimisse sattuda.

Mittekorduv proovivõtt annab täpsemad tulemused ja seetõttu kasutatakse seda sagedamini. Kuid on olukordi, kus seda ei saa rakendada (reisijatevoogude, tarbijanõudluse jms uurimine) ja siis tehakse korduv valik.

21. Maksimaalne vaatlusviga, keskmine valimiviga, nende arvutamise kord.

Vaatleme üksikasjalikult ülaltoodud meetodeid valimi üldkogumi moodustamiseks ja tekkivaid esindusvigu. Õige juhuslikult valim põhineb populatsioonist üksuste juhuslikul valimisel ilma süstemaatiliste elementideta. Tehniliselt toimub tegelik juhuslik valik loosi teel (näiteks loteriid) või juhuslike arvude tabeli abil.

Õiget juhuslikku valikut "puhtal kujul" kasutatakse selektiivse vaatluse praktikas harva, kuid see on teiste valikutüüpide hulgas esialgne, rakendab selektiivse vaatluse põhiprintsiipe. Vaatleme mõningaid küsimusi valimimeetodi teooriast ja lihtsa juhusliku valimi veavalemi kohta.

Valimi kallutatus- ϶ᴛᴏ parameetri väärtuse erinevus üldkogumis ja selle valimi vaatluse tulemuste põhjal arvutatud väärtuse vahel. Oluline on märkida, et keskmise kvantitatiivse karakteristiku valimi võtmise vea määrab

Näitajat nimetatakse tavaliselt maksimaalseks diskreetimisveaks. Valimi keskmine on juhuslik suurus, mis võib saada erinevaid väärtusi, sõltuvalt sellest, millised ühikud valimisse kaasatakse. Seetõttu on valimivead ka juhuslikud muutujad ja võivad omandada erinevaid väärtusi. Sel põhjusel määratakse võimalike vigade keskmine - keskmine proovivõtuviga, mis sõltub:

· valimi suurus: mida suurem arv, seda väiksem on keskmine viga;

· uuritava tunnuse muutumise määr: mida väiksem on tunnuse varieeruvus ja sellest tulenevalt ka dispersioon, seda väiksem on keskmine valimiviga.

Kell juhuslik uuesti valik arvutatakse keskmine viga. Praktikas ei ole üldist dispersiooni täpselt teada, kuid tõenäosusteoorias on see tõestatud . Kuna piisavalt suure n väärtus on 1-le lähedane, võime eeldada, et . Seejärel tuleks arvutada keskmine valimiviga: . Kuid väikese valimi korral (koos n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

Kell juhuslik mittekorduv valim antud valemeid korrigeeritakse väärtusega . Siis on keskmine mittekorduv diskreetimisviga: Ja . Sest on alati väiksem kui , siis kordaja () on alati väiksem kui 1. See tähendab, et korduva valiku korral on keskmine viga alati väiksem kui korduva valiku korral. Mehaaniline proovivõtt kasutatakse siis, kui üldrahvastik on mingil viisil järjestatud (näiteks valijate nimekirjad tähestikulises järjekorras, telefoninumbrid, maja- ja korterinumbrid). Ühikute valimine toimub teatud intervalliga, mis on võrdne proovivõtuprotsendi pöördväärtusega. Seega valitakse 2% valimiga iga 50 ühikut = 1/0,02, 5% valimi korral iga 1/0,05 = 20 ühikut üldkogumist.

Võrdluspunkt valitakse erineval viisil: juhuslikult, intervalli keskelt, võrdluspunkti muutusega. Peaasi on vältida süstemaatilisi vigu. Näiteks 5% valimiga, kui esimene ühik on 13., siis järgmised on 33, 53, 73 jne.

Täpsuse poolest on mehaaniline valik lähedane tegelikule juhuslikule valimile. Sel põhjusel kasutatakse mehaanilise valimi keskmise vea määramiseks õigeid juhusliku valiku valemeid.

Kell tüüpiline valik küsitletav elanikkond on esialgselt jagatud homogeenseteks sarnasteks rühmadeks. Näiteks ettevõtete küsitlemisel on need majandusharud, allsektorid, rahvastiku uurimisel piirkonnad, sotsiaalsed või vanuserühmad. Järgmisena tehakse igast rühmast sõltumatu valik mehaaniliselt või puhtjuhuslikult.

Tüüpiline proovivõtt annab täpsemaid tulemusi kui muud meetodid. Üldkogumi tüpiseerimine tagab, et iga tüpoloogiline rühm on valimis esindatud, mis võimaldab välistada rühmadevahelise dispersiooni mõju keskmisele valimiveale. Seetõttu on tüüpvalimi vea leidmisel dispersioonide liitmise reegli ( () järgi äärmiselt oluline arvestada ainult grupi dispersioonide keskmist. Siis keskmine proovivõtuviga: korduva proovivõtmisega, mittekorduva proovivõtuga , Kus – valimi rühmasiseste dispersioonide keskmine.

Seeria (või pesa) valik kasutatakse, kui üldkogum jagatakse enne valikuuringu algust seeriateks või rühmadeks. Need seeriad hõlmavad valmistoodete pakendeid, õpilasrühmi ja brigaade. Uurimiseks valitakse seeriad mehaaniliselt või puhtjuhuslikult ning seeria raames viiakse läbi pidev ühikute kontroll. Sel põhjusel sõltub keskmine valimiviga ainult rühmadevahelisest (ridadevahelisest) dispersioonist, mis arvutatakse järgmise valemi abil: kus r on valitud seeriate arv; – i-nda seeria keskmine. Arvutatakse jadavalimise keskmine viga: korduva valimiga, mittekorduva valimiga , kus R on seeriate koguarv. Kombineeritud valik on valitud valikumeetodite kombinatsioon.

Iga valimivõtumeetodi keskmine valimiviga sõltub peamiselt valimi absoluutsest suurusest ja vähemal määral valimi protsendist. Oletame, et esimesel juhul tehakse 225 vaatlust 4500 ühiku suurusest populatsioonist ja teisel juhul 225 000 ühiku suurusest populatsioonist. Dispersioon on mõlemal juhul võrdne 25-ga. Siis on esimesel juhul 5% valiku korral valimiviga: Teisel juhul, 0,1% valikuga, on see võrdne:

Kui aga valimiprotsenti vähendati 50 korda, suurenes valimi võtmise viga veidi, kuna valimi suurus ei muutunud. Oletame, et valimi suurust suurendatakse 625 vaatluseni. Sel juhul on proovivõtu viga: Valimi suurendamine sama populatsiooni suurusega 2,8 korda vähendab valimi vea suurust rohkem kui 1,6 korda.

22.Meetodid ja meetodid valimipopulatsiooni moodustamiseks.

Statistikas kasutatakse erinevaid valimipopulatsioonide moodustamise meetodeid, mis on määratud uuringu eesmärkidega ja sõltuvad uurimisobjekti spetsiifikast.

Valimküsitluse läbiviimise peamiseks tingimuseks on vältida süstemaatiliste vigade tekkimist, mis tulenevad võrdse võimaluse põhimõtte rikkumisest üldkogumi iga valimisse sattumise üksuse osas. Süstemaatiliste vigade vältimine saavutatakse teaduslikult põhjendatud meetodite kasutamisega valimipopulatsiooni moodustamisel.

Üldkogumi hulgast üksuste valimiseks on järgmised meetodid: 1) individuaalne valik - valimisse valitakse üksikud üksused; 2) rühmavalik - valimisse kuuluvad kvalitatiivselt homogeensed uuritavad rühmad või ühikute seeriad; 3) kombineeritud valik on kombinatsioon individuaalsest ja rühmavalikust. Valimismeetodid on määratud valimi üldkogumi moodustamise reeglitega.

Näidis peaks olema:

  • tegelikult juhuslik seisneb selles, et valimipopulatsioon moodustub üldkogumist üksikute üksuste juhusliku (tahtmatu) valiku tulemusena. Sel juhul määratakse valimikogumisse valitud üksuste arv tavaliselt aktsepteeritud valimi osakaalu alusel. Valimi osakaal on valimi üldkogumi n üksuste arvu ja üldkogumi N üksuste arvu suhe, ᴛ.ᴇ.
  • mehaanilised seisneb selles, et valimipopulatsiooni üksuste valik tehakse üldkogumi hulgast, mis on jagatud võrdseteks intervallideks (rühmadeks). Sel juhul on intervalli suurus üldkogumis võrdne valimi osakaalu pöördarvuga. Seega valitakse 2% valimiga iga 50. ühik (1:0,02), 5% valimiga iga 20. ühik (1:0,05) jne. Kuid vastavalt aktsepteeritud valiku proportsioonile jagatakse üldpopulatsioon justkui mehaaniliselt võrdseteks rühmadeks. Igast rühmast valitakse valimi jaoks ainult üks ühik.
  • tüüpiline - milles üldpopulatsioon jagatakse esmalt homogeenseteks tüüpilisteks rühmadeks. Seejärel kasutatakse igast tüüpilisest rühmast puhtjuhuslikku või mehaanilist valimit, et valida üksused valimipopulatsiooni. Tüüpilise valimi oluline tunnus on see, et see annab täpsemaid tulemusi võrreldes teiste valimipopulatsiooni üksuste valimise meetoditega;
  • sari- milles üldpopulatsioon on jagatud võrdse suurusega rühmadeks - seeriad. Seeriad valitakse valimipopulatsiooni. Seeria sees toimub seeriasse kuuluvate ühikute pidev vaatlus;
  • kombineeritud- proovide võtmine peaks olema kaheetapiline. Sel juhul jagatakse elanikkond esmalt rühmadesse. Järgmisena valitakse rühmad ja viimase sees üksikud üksused.

Statistikas eristatakse valimipopulatsioonis üksuste valimiseks järgmisi meetodeid:

  • üks etapp valim - iga valitud üksus allutatakse koheselt uuringule vastavalt etteantud kriteeriumile (õige juhuslik ja jadavalim);
  • mitmeastmeline valim - tehakse valik üksikute rühmade üldkogumi hulgast ja rühmade hulgast valitakse välja üksikud üksused (tüüpiline valim mehaanilise ühikute valimise meetodiga valimipopulatsiooni).

Lisaks on olemas:

  • uuesti valik- vastavalt tagastatud palli skeemile. Sel juhul tagastatakse iga valimisse kuuluv üksus või seeria üldkogumisse ja seetõttu on tal võimalus uuesti valimisse kaasata;
  • korda valikut- tagastamata palli skeemi järgi. Sellel on täpsemad tulemused sama valimi suurusega.

23. Äärmiselt olulise valimi suuruse määramine (Studentsi t-tabeli abil).

Valimiteooria üks teaduslikest põhimõtetest on tagada, et valitakse piisav arv ühikuid. Teoreetiliselt on selle printsiibi järgimise üliolulisust väljendatud tõenäosusteooria piirteoreemide tõestustes, mis võimaldavad kindlaks teha, milline maht ühikuid tuleks üldkogumist valida, et see oleks piisav ja tagaks valimi esinduslikkuse.

Valimi standardvea vähenemine ja seega ka hinnangu täpsuse suurenemine on alati seotud valimi suuruse suurenemisega, seetõttu tuleb juba valimivaatluse korraldamise etapis otsustada, milline suurus on valimi populatsioonist peaks olema, et tagada vaatlustulemuste nõutav täpsus. Äärmiselt olulise proovimahu arvutamisel kasutatakse maksimaalsete proovivõtuvigade (A) valemitest tuletatud valemeid, mis vastavad konkreetsele tüübile ja valikumeetodile. Seega on juhusliku korduva valimi suuruse (n) jaoks:

Selle valemi olemus seisneb selles, et äärmiselt oluliste arvude juhusliku korduva valimi võtmisel on valimi suurus otseselt võrdeline usalduskoefitsiendi ruuduga. (t2) ja variatsioonikarakteristiku dispersioon (?2) ning on pöördvõrdeline maksimaalse diskreetimisvea (A2) ruuduga. Eelkõige tuleks maksimaalse vea suurendamisel kahekordselt nõutavat valimi suurust vähendada neljakordselt. Kolmest parameetrist kaks (t ja?) määrab uurija. Samal ajal uurija, lähtudes eesmärgist

ja valikuuringu probleemid peavad lahendama küsimuse: millisesse kvantitatiivsesse kombinatsiooni on parem neid parameetreid kaasata, et tagada optimaalne valik? Ühel juhul võib ta olla rohkem rahul saadud tulemuste usaldusväärsusega (t) kui täpsuse mõõduga (?), teisel juhul - vastupidi. Maksimaalse valimivea väärtuse küsimuse lahendamine on keerulisem, kuna valimivaatluse kavandamise staadiumis uurijal see näitaja puudub, mistõttu on praktikas tavaks määrata maksimaalse valimivea väärtus. , tavaliselt 10% piires atribuudi eeldatavast keskmisest tasemest. Hinnangulise keskmise määramisele saab läheneda erineval viisil: kasutades sarnaste varasemate uuringute andmeid või kasutades valimi raami andmeid ja viies läbi väikese pilootvalimi.

Valimivaatluse kujundamisel on kõige keerulisem tuvastada valemis (5.2) kolmas parameeter - valimi üldkogumi dispersioon. Sel juhul on äärmiselt oluline kasutada kogu teadlasele kättesaadavat teavet, mis on saadud varasemate sarnaste ja pilootuuringute käigus.

Äärmiselt olulise valimi suuruse määramise küsimus muutub keerulisemaks, kui valikuuringu käigus uuritakse mitut valimiüksuste tunnust. Sel juhul on iga tunnuse keskmised tasemed ja nende varieeruvus reeglina erinevad ning sellega seoses on võimalik otsustada, millist erinevust millistest omadustest eelistada, ainult eesmärki ja eesmärke arvesse võttes. uuringust.

Valimivaatluse kavandamisel eeldatakse lubatud valimivea etteantud väärtust vastavalt konkreetse uuringu eesmärkidele ja vaatlustulemuste põhjal järelduste tegemise tõenäosusele.

Üldiselt võimaldab valimi keskmise maksimaalse vea valem määrata:

‣‣‣ üldkogumi näitajate võimalike kõrvalekallete suurust valimi üldkogumi näitajatest;

‣‣‣ nõutava täpsuse tagamiseks vajalik valimi suurus, mille juures võimaliku vea piirid ei ületa teatud määratud väärtust;

‣‣‣ tõenäosus, et valimi veal on määratud piir.

Õpilaste jaotus tõenäosusteoorias on see absoluutselt pidevate jaotuste üheparameetriline perekond.

24. Dünaamilised seeriad (intervall, hetk), dünaamiliste seeriate sulgemine.

Dünaamika seeria- need on statistiliste näitajate väärtused, mis on esitatud teatud kronoloogilises järjestuses.

Iga aegrida sisaldab kahte komponenti:

1) ajaperioodide näitajad(aastad, kvartalid, kuud, päevad või kuupäevad);

2) uuritavat objekti iseloomustavad näitajad perioodideks või vastavatel kuupäevadel, mida kutsutakse seeria tasemed.

Seeriatasemeid väljendatakse nii absoluutsete kui ka keskmiste või suhteliste väärtustena. Võttes arvesse sõltuvust näitajate olemusest, koostatakse absoluutsete, suhteliste ja keskmiste väärtuste dünaamilised seeriad. Suhteliste ja keskmiste väärtuste dünaamilised seeriad koostatakse tuletatud absoluutväärtuste seeriate põhjal. Dünaamikas on intervallide ja hetkede jada.

Dünaamilised intervallid sisaldab teatud ajaperioodide näitajate väärtusi. Intervallreas saab tasemeid summeerida, et saada nähtuse maht pikema perioodi jooksul ehk nn akumuleeritud summad.

Dünaamiline hetkesari peegeldab indikaatorite väärtusi teatud ajahetkel (kellaaeg). Hetkesarjade puhul võib uurijat huvitada vaid nähtuste erinevus, mis peegeldab seeria taseme muutumist teatud kuupäevade vahel, kuna tasemete summal pole siin tegelikku sisu. Kumulatiivseid kogusummasid siin ei arvutata.

Aegridade õige konstrueerimise kõige olulisem tingimus on seeriatasemete võrreldavus mis kuuluvad erinevatesse perioodidesse. Tasemed peavad olema esitatud homogeensetes kogustes ja nähtuse eri osade katvus peab olema võrdne.

Reaalse dünaamika moonutamise vältimiseks tehakse statistilistes uuringutes eelarvutused (dünaamikarea sulgemine), mis eelneb aegridade statistilisele analüüsile. Under dünaamika jada sulgemineÜldtunnustatud on mõista kombinatsiooni üheks seeriaks kahest või enamast seeriast, mille tasemed on arvutatud erineva metoodikaga või ei vasta territoriaalsetele piiridele jne. Dünaamikaseeria sulgemine võib tähendada ka dünaamikaseeriate absoluuttasemete viimist ühisele alusele, mis neutraliseerib dünaamikaseeriate tasemete võrreldamatuse.

25. Dünaamika ridade, koefitsientide, kasvu ja kasvumäärade võrreldavuse mõiste.

Dünaamika seeria- need on statistiliste näitajate jada, mis iseloomustavad loodus- ja ühiskonnanähtuste arengut aja jooksul. Venemaa riikliku statistikakomitee avaldatud statistikakogud sisaldavad suurt hulka dünaamika seeriaid tabeli kujul. Dünaamilised seeriad võimaldavad tuvastada uuritavate nähtuste arengumustreid.

Dünaamikaseeriad sisaldavad kahte tüüpi indikaatoreid. Aja indikaatorid(aastad, kvartalid, kuud jne) või ajapunktid (aasta alguses, iga kuu alguses jne). Rea taseme indikaatorid. Dünaamika seeriate tasemenäitajaid saab väljendada absoluutväärtustes (tootetoodang tonnides või rublades), suhtelistes väärtustes (linnaelanikkonna osakaal protsentides) ja keskmistes väärtustes (tööstustöötajate keskmine palk aasta lõikes). , jne.). Tabeli kujul sisaldab aegrida kahte veergu või kahte rida.

Aegridade õige koostamine eeldab mitme nõude täitmist:

  1. kõik mitme dünaamika näitajad peavad olema teaduslikult põhjendatud ja usaldusväärsed;
  2. dünaamikaseeria näitajad peavad olema ajas võrreldavad, ᴛ.ᴇ. tuleb arvutada samade ajavahemike või samade kuupäevade kohta;
  3. mitme dünaamika näitajad peavad olema kogu territooriumil võrreldavad;
  4. dünaamika jada näitajad peavad olema sisult võrreldavad, ᴛ.ᴇ. arvutatakse ühe metoodika järgi, samal viisil;
  5. mitme dünaamika näitajad peaksid olema kõigi arvesse võetavate põllumajandusettevõtete puhul võrreldavad. Kõik dünaamikaseeria näitajad tuleb esitada samades mõõtühikutes.

Statistilised näitajad võivad iseloomustada kas uuritava protsessi tulemusi teatud ajaperioodi jooksul või uuritava nähtuse seisundit teatud ajahetkel, ᴛ.ᴇ. indikaatorid võivad olla intervallsed (perioodilised) ja hetkelised. Vastavalt sellele on dünaamikaseeriad algselt kas intervall või hetk. Momendidünaamika seeriad tulevad omakorda võrdsete ja ebavõrdsete ajavahemikega.

Algset dünaamikaseeriat saab teisendada keskmiste väärtuste ja suhteliste väärtuste seeriaks (ahel ja põhi). Selliseid aegridu nimetatakse tuletatud aegridadeks.

Dünaamika seeria keskmise taseme arvutamise metoodika on erinev, olenevalt dünaamika seeria tüübist. Näidete abil käsitleme dünaamika seeriate tüüpe ja keskmise taseme arvutamise valemeid.

Absoluutsed tõusud (Δy) näitavad, mitu ühikut on seeria järgnev tase muutunud võrreldes eelmisega (gr. 3. - ahel absoluutsed tõusud) või võrreldes algtasemega (gr. 4. - põhi absoluutsed tõusud). Arvutusvalemid saab kirjutada järgmiselt:

Kui seeria absoluutväärtused vähenevad, toimub vastavalt "vähendamine" või "vähendamine".

Absoluutsed kasvunäitajad viitavad sellele, et näiteks 1998.a. toote "A" tootmine kasvas võrreldes 1997. aastaga. 4 tuhande tonni võrra ja võrreldes 1994. aastaga ᴦ. - 34 tuhande tonni võrra; teiste aastate kohta vaata tabelit. 11,5 gr.
Postitatud aadressil ref.rf
3 ja 4.

Kasvumäär näitab, mitu korda on seeria tase muutunud võrreldes eelmisega (gr. 5 – kasvu või languse ahela koefitsiendid) või võrreldes algtasemega (gr. 6 – kasvu või languse põhikoefitsiendid). Arvutusvalemid saab kirjutada järgmiselt:

Kasvumäärad näidata, mitu protsenti on seeria järgmine tase võrreldes eelmisega (veerg 7 - ahela kasvumäärad) või võrreldes algtasemega (gr. 8 - põhikasvumäärad). Arvutusvalemid saab kirjutada järgmiselt:

Nii näiteks 1997.a. toote "A" tootmismaht võrreldes 1996. aastaga ᴦ. moodustas 105,5% (

Kasvumäär näidata, mitu protsenti aruandeperioodi tase tõusis võrreldes eelmisega (veerg 9 - ahela kasvumäärad) või võrreldes algtasemega (veerg 10 - põhikasvumäärad). Arvutusvalemid saab kirjutada järgmiselt:

T pr = T r - 100% või T pr = absoluutne kasv / eelmise perioodi tase * 100%

Nii näiteks 1996. a. võrreldes 1995. aastaga ᴦ. Toodet "A" toodeti rohkem 3,8% (103,8% - 100%) ehk (8:210) x 100% võrra ja võrreldes 1994. aastaga ᴦ. - 9% võrra (109% - 100%).

Kui seeria absoluuttasemed vähenevad, on määr alla 100% ja vastavalt sellele toimub ka vähenemise määr (miinusmärgiga kasvutempo).

Absoluutväärtus 1% tõus(gr.
Postitatud aadressil ref.rf
11) näitab, mitu ühikut on vaja antud perioodil toota, et eelmise perioodi tase tõuseks 1%. Meie näites 1995. aastal ᴦ. oli vaja toota 2,0 tuhat tonni ja 1998 ᴦ. - 2,3 tuhat tonni, ᴛ.ᴇ. palju suurem.

1% kasvu absoluutväärtust saab määrata kahel viisil:

§ eelmise perioodi tase jagatud 100-ga;

§ ahela absoluutsed kasvud jagatakse vastavate ahela kasvumääradega.

1% kasvu absoluutväärtus =

Dünaamikas, eriti pika perioodi jooksul, on oluline kasvutempo ühine analüüs koos iga protsendi suurenemise või languse sisuga.

Pange tähele, et vaadeldav metoodika aegridade analüüsimiseks on rakendatav nii aegridade puhul, mille tasemed on väljendatud absoluutväärtustes (t, tuhat rubla, töötajate arv jne), kui ka aegridade puhul, mille tasemed väljendatakse suhteliste näitajatena (defektide %, kivisöe tuhasisaldus % jne) või keskmiste väärtustena (keskmine saagikus c/ha, keskmine palk jne).

Dünaamikaseeriate analüüsimisel on lisaks igaks aastaks arvutatud analüütilistele näitajatele, mis on arvutatud võrreldes eelmise või algtasemega, äärmiselt oluline arvutada perioodi keskmised analüütilised näitajad: rea keskmine tase, aasta keskmine absoluutne tase. suurenemine (vähenemine) ja keskmine aastane kasvumäär ja kasvutempo .

Eespool käsitleti dünaamikaseeria keskmise taseme arvutamise meetodeid. Vaadeldavas intervalldünaamika seerias arvutatakse seeria keskmine tase lihtsa aritmeetilise keskmise valemi abil:

Toote keskmine aastane tootmismaht aastatel 1994-1998. moodustas 218,4 tuhat tonni.

Aasta keskmine absoluutkasv arvutatakse samuti aritmeetilise keskmise valemi abil

Standardhälve – mõiste ja liigid. Kategooria "Keskmine ruuthälve" klassifikatsioon ja tunnused 2017, 2018.

Hüpoteeside statistilisel testimisel juhuslike suuruste vahelise lineaarse seose mõõtmisel.

Standardhälve:

Standardhälve(juhusliku suuruse põrand, meid ümbritsevad seinad ja lagi standardhälbe hinnang, x võrreldes selle matemaatilise ootusega, mis põhineb selle dispersiooni erapooletul hinnangul):

kus on dispersioon; - põrand, meid ümbritsevad seinad ja lagi, i valiku element; - näidissuurus; - valimi aritmeetiline keskmine:

Tuleb märkida, et mõlemad hinnangud on kallutatud. Üldjuhul on erapooletu hinnangu koostamine võimatu. Siiski on erapooletu dispersioonihinnangul põhinev hinnang järjepidev.

Kolme sigma reegel

Kolme sigma reegel() - peaaegu kõik normaalse jaotusega juhusliku muutuja väärtused asuvad intervallis. Täpsemalt – mitte vähem kui 99,7% usaldusväärsusega asub normaalse jaotusega juhusliku suuruse väärtus määratud intervallis (eeldusel, et väärtus on tõene ja seda ei saadud valimi töötlemise tulemusena).

Kui tegelik väärtus on teadmata, siis peaksime kasutama mitte põrandat, meid ümbritsevaid seinu ja lage, s. Seega muudetakse kolme sigma reegel kolme sigma reegliks. Korrus, seinad meie ümber ja lagi, s .

Standardhälbe väärtuse tõlgendamine

Suur standardhälbe väärtus näitab väärtuste suurt levikut esitatud komplektis koos komplekti keskmise väärtusega; väike väärtus näitab vastavalt, et komplekti väärtused on rühmitatud keskmise väärtuse ümber.

Näiteks on meil kolm arvukomplekti: (0, 0, 14, 14), (0, 6, 8, 14) ja (6, 6, 8, 8). Kõigil kolmel komplektil on keskmised väärtused 7 ja standardhälbed vastavalt 7, 5 ja 1. Viimasel komplektil on väike standardhälve, kuna komplekti väärtused on rühmitatud keskmise väärtuse ümber; esimesel komplektil on suurim standardhälbe väärtus - komplektis olevad väärtused erinevad suuresti keskmisest väärtusest.

Üldises mõttes võib standardhälvet pidada määramatuse mõõdupuuks. Näiteks füüsikas kasutatakse standardhälvet mingi suuruse järjestikuste mõõtmiste jada vea määramiseks. See väärtus on väga oluline uuritava nähtuse usutavuse määramiseks võrreldes teooria ennustatud väärtusega: kui mõõtmiste keskmine väärtus erineb suuresti teoorias ennustatud väärtustest (suur standardhälve), siis tuleks saadud väärtused või nende saamise meetod uuesti üle kontrollida.

Praktiline kasutamine

Praktikas võimaldab standardhälve määrata, kui palju võivad komplekti väärtused keskmisest väärtusest erineda.

Kliima

Oletame, et on kaks linna, mille keskmine ööpäevane maksimaalne temperatuur on sama, kuid üks asub rannikul ja teine ​​sisemaal. On teada, et rannikul asuvates linnades on palju erinevaid maksimaalseid päevaseid temperatuure, mis on madalamad kui sisemaal asuvates linnades. Seetõttu on rannikulinna maksimaalsete ööpäevaste temperatuuride standardhälve väiksem kui teise linna puhul, hoolimata asjaolust, et selle väärtuse keskmine väärtus on sama, mis praktikas tähendab, et tõenäosus, et maksimaalne õhutemperatuur mis tahes päev aastas erineb sisemaal asuva linna keskmisest väärtusest kõrgem.

Sport

Oletame, et on mitu jalgpallimeeskonda, keda hinnatakse mõne parameetri alusel, näiteks löödud ja löödud väravate arv, väravavõimalused jne. Suure tõenäosusega on selle grupi parimal meeskonnal paremad väärtused rohkemate parameetrite järgi. Mida väiksem on meeskonna standardhälve iga esitatud parameetri puhul, seda prognoositavam on meeskonna tulemus; sellised meeskonnad on tasakaalus. Seevastu suure standardhälbega meeskonnal on raske tulemust ennustada, mis omakorda on seletatav tasakaalustamatusega, näiteks tugev kaitse, aga nõrk rünnak.

Meeskonna parameetrite standardhälbe kasutamine võimaldab ühel või teisel määral ennustada kahe meeskonna vahelise matši tulemust, hinnates meeskondade tugevaid ja nõrku külgi ning seega ka valitud võitlusviise.

Tehniline analüüs

Vaata ka

Kirjandus

* Borovikov, V. STATISTIKA. Andmeanalüüsi kunst arvutis: Professionaalidele / V. Borovikov. - Peterburi. : Peeter, 2003. - 688 lk. - ISBN 5-272-00078-1.

Standardhälve on üks neid statistilisi termineid ärimaailmas, mis annab usaldusväärsuse inimestele, kes saavad selle vestluses või esitluses hästi välja tuua, jättes samas ebamäärase segaduse neile, kes ei tea, mis see on, kuid on liiga piinlik. küsi. Tegelikult ei mõista enamik juhte standardhälbe mõistet ja kui olete üks neist, on aeg lõpetada vales elamine. Tänases artiklis räägin teile, kuidas see alahinnatud statistiline meede aitab teil paremini mõista andmeid, millega töötate.

Mida mõõdab standardhälve?

Kujutage ette, et olete kahe poe omanik. Ja kahjude vältimiseks on oluline omada selget kontrolli varude jääkide üle. Püüdes välja selgitada, milline juht haldab laoseisu paremini, otsustate analüüsida viimase kuue nädala laoseisu. Mõlema kaupluse keskmine laokulu nädalas on ligikaudu sama ja moodustab ligikaudu 32 tavaühikut. Esmapilgul näitab keskmine äravool, et mõlemad juhid toimivad sarnaselt.

Kui aga teise poe tegevust lähemalt vaadata, siis veendud, et kuigi keskmine väärtus on õige, on laoseisu varieeruvus väga suur (10-58 USD). Seega võime järeldada, et keskmine ei hinda alati andmeid õigesti. Siin tulebki sisse standardhälve.

Standardhälve näitab, kuidas väärtused on jaotatud meie keskmise suhtes. Teisisõnu saate aru, kui suur on äravoolu levik nädalast nädalasse.

Meie näites kasutasime standardhälbe arvutamiseks koos keskmisega Exceli funktsiooni STDEV.

Esimese juhi puhul oli standardhälve 2. See näitab, et iga valimi väärtus erineb keskmiselt 2 võrra keskmisest. Kas see on hea? Vaatame küsimust teise nurga alt – standardhälve 0 ütleb meile, et iga väärtus valimis on võrdne selle keskmisega (meie puhul 32,2). Seega ei erine standardhälve 2 palju 0-st, mis näitab, et enamik väärtusi on keskmise lähedal. Mida lähemal on standardhälve 0-le, seda usaldusväärsem on keskmine. Veelgi enam, 0-le lähedane standardhälve näitab andmete vähest varieeruvust. See tähendab, et äravoolu väärtus standardhälbega 2 näitab esimese halduri uskumatut järjepidevust.

Teise kaupluse puhul oli standardhälve 18,9. See tähendab, et äravoolu maksumus erineb nädalast nädalasse keskmiselt 18,9 võrra. Hull levi! Mida kaugemal on standardhälve nullist, seda vähem täpne on keskmine. Meie puhul näitab näitaja 18,9, et keskmist väärtust (32,8 USD nädalas) lihtsalt ei saa usaldada. Samuti ütleb see meile, et iganädalane äravool on väga erinev.

See on lühidalt standardhälbe mõiste. Kuigi see ei anna ülevaadet muudest olulistest statistilistest mõõtmistest (režiim, mediaan...), mängib standardhälve enamikus statistilistes arvutustes otsustavat rolli. Standardhälbe põhimõtete mõistmine heidab valgust paljudele teie äriprotsessidele.

Kuidas arvutada standardhälvet?

Nüüd teame, mida standardhälbe arv ütleb. Mõelgem välja, kuidas see arvutatakse.

Vaatame andmekogumit vahemikus 10 kuni 70 sammuga 10. Nagu näete, olen juba arvutanud nende standardhälbe väärtuse, kasutades funktsiooni STANDARDEV lahtris H2 (oranžis).

Allpool on toodud sammud, mida Excel teeb, et jõuda 21.6.

Pange tähele, et kõik arvutused visualiseeritakse paremaks mõistmiseks. Tegelikult toimub Excelis arvutamine koheselt, jättes kõik sammud kulisside taha.

Esiteks leiab Excel näidise keskmise. Meie puhul osutus keskmiseks 40, mis järgmises etapis lahutatakse igast valimi väärtusest. Iga saadud erinevus ruudustatakse ja summeeritakse. Saime summa, mis on võrdne 2800-ga, mis tuleb jagada näidiselementide arvuga, millest on lahutatud 1. Kuna meil on 7 elementi, siis tuleb välja, et peame 2800 jagama 6-ga. Saadud tulemusest leiame ruutjuure, see näitaja on standardhälve.

Neile, kes pole visualiseerimise abil standardhälbe arvutamise põhimõttes täiesti selged, annan selle väärtuse leidmise matemaatilise tõlgenduse.

Funktsioonid standardhälbe arvutamiseks Excelis

Excelis on mitut tüüpi standardhälbe valemeid. Peate vaid sisestama =STDEV ja näete ise.

Väärib märkimist, et funktsioonid STDEV.V ja STDEV.G (loendi esimene ja teine ​​funktsioon) dubleerivad vastavalt funktsioone STDEV ja STDEV (loendi viies ja kuues funktsioon), mis säilitati varasemaga ühilduvuse huvides. Exceli versioonid.

Üldiselt näitab funktsioonide .B ja .G lõppude erinevus valimi või üldkogumi standardhälbe arvutamise põhimõtet. Nende kahe massiivi erinevust selgitasin juba eelmises.

Funktsioonide STANDARDEV ja STANDDREV (loendi kolmas ja neljas funktsioon) eripära on see, et massiivi standardhälbe arvutamisel võetakse arvesse loogilisi ja tekstiväärtusi. Tekst ja tõelised tõeväärtused on 1 ja väärad tõeväärtused on 0. Ma ei kujuta ette olukorda, kus mul oleks neid kahte funktsiooni vaja, seega arvan, et neid saab ignoreerida.