Parameetrilised ja mitteparameetrilised meetodid statistiliste hüpoteeside kontrollimiseks.

Kõik statistika parameetrilised meetodid töötavad intervallskaalaga, erinevalt mitteparameetrilistest meetoditest, mis keskenduvad peamiselt kahele esimesele skaalale. Selgitame nende meetodite erinevusi.

Enamiku statistiliste meetodite kaalumisel eeldatakse, et vaatlusalused vaatlused on väljendatud intervallskaalal ja on juhusliku suuruse realisatsioonid, mille jaotus kuulub mõnda parameetrilisse jaotuste perekonda. Näiteks juhuslikul suurusel on normaal- ehk Poissoni või muu jaotus. See tähendab, et eeldame, et jaotuse kuju on teada, näiteks võime eeldada normaalset N (μ, δ ) mudel, kuid teadmata parameetritega μ Ja δ . Hindamis- ja hüpoteeside kontrollimise meetodid võimaldavad teha järeldusi tundmatute parameetrite kohta ning mis tahes järelduste väärtus peab mingil määral sõltuma parameetrilise perekonna, st jaotuse kuju kohta tehtud esialgse eelduse adekvaatsusest. Siiski on juhuslikke muutujaid, mis ei järgi ühtki levinud jaotusvormi. Järelikult ei saa nende puhul rakendada parameetriliste jaotuste jaoks välja töötatud matemaatilisi meetodeid. Seetõttu on selliste tunnuste jaoks välja töötatud spetsiaalsed matemaatilised mudelid, mida nimetatakse mitteparameetrilisteks ehk jaotusvabadeks.

Seega saab eristada kahte statistiliste meetodite rühma: parameetrilised ja mitteparameetrilised.

Parameetriliste meetodite eeliseks on see, et nende jaoks on olemas hästi arenenud matemaatiline aparaat. Nende meetodite kasutamine eeldab aga muu hulgas suurt valimi suurust. Kvantitatiivsete näitajate jaoks kasutatakse parameetrilisi meetodeid.

Nominaalsete ja auaste muutujate analüüsimiseks kasutatakse ainult mitteparameetrilisi meetodeid, mis ei nõua esialgseid eeldusi algse jaotuse tüübi kohta. See on nende väärikus. Kuid on ka puudus - väheneb nn. võimsus (tundlikkus objektide erinevuste suhtes). Selgitame seda.

Meenutagem, et enne katse tulemusi analüüsima asumist esitab teadlane kaks üksteist välistavat hüpoteesi. Üks neist on statistiline hüpotees, mille tagasilükkamist uurija tavaliselt eeldab (nn nullhüpotees H 0: näiteks uuritud sordid ei erine saagikuse poolest). Alternatiivne hüpotees ( H 1) lükkab tegelikult nullhüpoteesi tagasi. Alternatiivne hüpotees sisaldab tavaliselt uurija tehtud oletusi (erinevusi on).

Analüüsis on kahte tüüpi statistilisi vigu. Esimest tüüpi viga (viga α – tüüp): nullhüpotees, mis tegelikult on tõene, lükatakse tagasi. Teist tüüpi viga (viga β – tüüp): aktsepteerime nullhüpoteesi, mis on tegelikult vale.

Statistilise kriteeriumi (meetodi) võimsus või tundlikkus on tõenäosus, et selle rakendamise tulemusena tehakse õige otsus ( H 1) tõeliselt vale nullhüpoteesi alusel. Testi võimsus sõltub valimi suurusest, olulisuse tasemest, null- ja alternatiivhüpoteeside suunast, katseandmete usaldusväärsusest, instrumentidest ja statistilisest meetodist endast. Võrdsetes tingimustes on parameetrilised meetodid võimsamad kui mitteparameetrilised. Kuid mitteparameetriliste meetodite võimsus suureneb valimi suuruse suurenemisega.

Igal skaala tüübil on oma statistiline tehnika. Nominaalskaalade puhul kasutatakse sageli χ 2 (hii-ruut) testi. Järjekorraskaalade jaoks – astmestatistika. Intervallskaalade jaoks - kogu statistiliste kriteeriumide arsenal.

Mitteparameetriliste kriteeriumide arvutamise algoritmid ja näited.

Oma uurimistöö statistilist töötlemist alustades peab psühholoog tema materjali omaduste põhjal otsustama, millised meetodid on talle sobivamad - parameetrilised või mitteparameetrilised. Nende erinevust on lihtne mõista.

Kuuenda klassi õpilaste mootorikiiruse mõõtmisest oli juba juttu.

Kuidas neid andmeid töödelda?

Kõik tehtud mõõtmised on vaja üles märkida – antud juhul on selleks iga katseaine määratud punktide arv – ning seejärel arvutada tema tulemuste põhjal iga katseaine aritmeetiline keskmine. Pärast seda korraldage kõik andmed nende järjekorras, alustades näiteks väikseimast suurimani. Nende andmete nähtavuse hõlbustamiseks ühendatakse need tavaliselt rühmadesse; sel juhul saate rühmas kombineerida 5-9 mõõtmist. Üldiselt on sellise kombinatsiooni puhul soovitav, et kui juhtumite koguarv ei ületa sada, peaks rühmade koguarv olema umbes kaksteist.

Järgmisena peate kindlaks tegema, mitu korda katsetes igale rühmale vastavaid arvväärtusi kohtas. Pärast seda kirjutage iga rühma suurus üles. Sellises tabelis saadud andmeid nimetatakse arvude või sageduste jaotuseks. See jaotus on soovitatav esitada diagrammina, mis kujutab jaotuse hulknurka, või jaotuse histogrammi kujul. Selle hulknurga kontuurid aitavad lahendada statistiliste töötlemismeetodite probleemi.

Sageli meenutavad need kontuurid kella kontuure, mille kõrgeim punkt on hulknurga keskel ja sümmeetrilised oksad ulatuvad mõlemas suunas. See kontuur vastab normaaljaotuse kõverale. Selle mõiste tõi matemaatilisesse statistikasse K. F. Gauss (1777-1855), seetõttu nimetatakse kõverat ka nn. Gaussi kõver. Ta andis ka selle kõvera matemaatilise kirjelduse. Gaussi kõvera (või kellukese kõvera) joonistamine nõuab teoreetiliselt lõpmatu arvu juhtumeid. Praktikas tuleb rahulduda uuringus kogunenud faktilise materjaliga. Kui teadlase käsutuses olevad andmed lahknevad hoolikal uurimisel või pärast diagrammile ülekandmist normaaljaotuskõverast vaid vähesel määral, siis annab see teadlasele õiguse kasutada statistilises töötluses parameetrilisi meetodeid, mille lähtekohad lähtuvad. normaalsel Gaussi jaotuskõveral.

Normaaljaotust nimetatakse parameetriliseks, kuna Gaussi kõvera koostamiseks ja analüüsimiseks piisab ainult kahest parameetrist: keskmisest väärtusest, mis peab vastama kõvera keskpunktis taastatud risti kõrgusele, ja nn keskmisest. ruut ehk väärtuse standardhälve, mis iseloomustab väärtuste hajumist keskväärtuse ümber; Mõlema koguse arvutamise meetodeid käsitletakse allpool.

Parameetrilistel meetoditel on uurija jaoks palju eeliseid, kuid ei tohi unustada, et nende kasutamine on õigustatud vaid siis, kui töödeldud andmed näitavad Gaussi omast vaid ebaoluliselt erinevat jaotust.

Kui parameetrilisi pole võimalik rakendada, võtke ühendust mitteparameetrilised meetodid. Neid meetodeid on edukalt välja töötatud viimase 3-4 aastakümne jooksul ning nende väljatöötamise tingisid eelkõige mitmete teaduste, eelkõige psühholoogia vajadused. Nad on näidanud oma kõrget efektiivsust. Kuid need ei nõua keerulist arvutustööd.

Kaasaegne psühholoogiauurija peab lähtuma sellest, et "... on suur hulk andmeid, mida kas ei saa kellakõvera abil üldse analüüsida või ei vasta selle kasutamiseks vajalikud põhitingimused."

Rahvaarv Ja näidis. Psühholoog peab nende kahe mõistega pidevalt tegelema.

Kaasaegsetes pedagoogiliste probleemide uurimises kasutatakse laialdaselt matemaatilise andmetöötluse meetodeid. Kvantitatiivsete andmete töötlemise meetodid hõlmavad statistilisi võtteid uuringu tulemuste summeerimiseks, nendevaheliste teatud seoste tuvastamiseks ja püstitatud hüpoteesi usaldusväärsuse kontrollimiseks.

Uurimistulemuste matemaatiline töötlemine tagab nende tõendusliku ja esinduslikkuse. Kombinatsioonis kvalitatiivsete näitajatega suurendab kvantitatiivne andmetöötlus oluliselt uuringu objektiivsust. Tulemuste statistiline töötlemine, üksikute nähtuste uurimise registreerimine, võimaldab teha üldistusi ja järeldusi kogu uuritavate nähtuste kogumi kohta. Statistiliste meetodite kasutamise oluliseks tunnuseks pedagoogilises uurimistöös on see, et see võimaldab kasutada kvantitatiivset uuringut ka seal, kus uuritavate objektide omadusi pole võimalik kindlaks teha. Näiteks on võimatu otseselt mõõta õpilaste moraalsete omaduste arengutaset, konkreetse õpetamismeetodi tõhususe astet jne. Kuid asjakohaste sündmuste, tegevuste, ilmingute registreerimisega on võimalik saada teatud õppetöö kvalitatiivseid omadusi. kõik need omadused, määravad kindlaks nende võimalikud avaldumismustrid ja kinnitavad väljendatud hüpoteeside õigsust.

Statistikas viiakse hüpoteeside testimine läbi erinevuste staatilise hindamise kriteeriume kasutades. Statistiline kriteerium on määrav reegel, mis tagab usaldusväärse käitumise, s.t. tõese hüpoteesi vastuvõtmine ja vale suure tõenäosusega tagasilükkamine (G.V. Sukhodolsky). Statistilised kriteeriumid tähistavad ka teatud arvu arvutamise meetodit ja arvu ennast.

Pedagoogikas kasutatavad statistilised kriteeriumid jagunevad parameetrilisteks ja mitteparameetrilisteks. Parameetrilised kriteeriumid hõlmavad kriteeriume, mis sisaldavad arvutusvalemis jaotusparameetreid, st. keskmine ja dispersioon (Student, Fisher, Chi-ruut testid). Mitteparameetriliste kriteeriumide hulka kuuluvad need, mis põhinevad sageduste või auastmetega töötamisel ja jaotusparameetrite arvestamata jätmisel jaotusparameetrite arvutamise valemis (märgitestid, Kolmogorov-Smirnov, Wilcoxon, Mann-Whitney). Mõlemal kriteeriumirühmal on oma eelised ja puudused. Parameetriliste ja mitteparameetriliste kriteeriumide võimaluste ja piirangute võrdlev kirjeldus on toodud järgmises tabelis.



Parameetrilised kriteeriumid Mitteparameetrilised testid
Võimaldab otseselt hinnata kahe valimiga saadud keskmiste erinevusi (õpilase t-test) Võimaldab hinnata ainult keskmisi trende (näiteks vastata küsimusele, kas tunnuse kõrgemad väärtused on proovis A tavalisemad ja tunnuse madalamad väärtused on valimis B (kriteeriumid Q, U jne). .)
Võimaldab dispersioonide erinevuste otsest hindamist (Fisheri test) Võimaldab hinnata ainult erinevusi tunnuse varieeruvuse vahemikes
Võimaldab tuvastada tunnuse muutuste suundumusi seisundist seisundisse liikumisel (ühe muutuja dispersioonanalüüs), kuid ainult tunnuse normaalse jaotuse tingimustes Võimaldab tuvastada tunnuse muutuste suundumusi, kui liigute tingimuselt tingimusele tunnuse mis tahes jaotuse korral (trendide L ja S kriteeriumid)
Võimaldab hinnata kahe või enama teguri koostoimet nende mõjus tunnuse muutustele (kahefaktoriline dispersioonanalüüs) See funktsioon pole saadaval
Katseandmed peavad vastama kahele ja mõnikord kolmele tingimusele: a) tunnuse väärtusi mõõdetakse intervallskaalal; b) tunnuse jaotus on normaalne; c) dispersioonanalüüsis peab olema täidetud kompleksi rakkude dispersioonide võrdsuse nõue Katseandmed ei pruugi vastata ühelegi tingimusele: a) atribuutide väärtusi saab esitada mis tahes skaalal, alates nimede skaalast; b) tunnuse jaotus võib olla ükskõik milline ja selle kokkulangevus ühegi teoreetilise jaotusseadusega ei ole vajalik ega vaja kontrollida; c) dispersioonide võrdsuse nõuet ei ole
Kui määratud tingimused on täidetud, on parameetrilised kriteeriumid võimsamad kui mitteparameetrilised kriteeriumid Kui määratud tingimused ei ole täidetud, on mitteparameetrilised kriteeriumid usaldusväärsemad, kuna nad on vähem tundlikud "ummistumise" suhtes
Matemaatika on üsna keeruline Matemaatilised arvutused on enamasti lihtsad ja võtavad vähe aega

Parameetrilised meetodid

Õpilase t test

Kahe andmekogumi valimi keskmiste väärtuste võrdlemiseks ja otsustamaks, kas keskmised väärtused erinevad üksteisest statistiliselt oluliselt psühholoogilistes ja pedagoogilistes katsetes, kasutavad nad sageli t- Üliõpilase kriteerium, mille arvestuslik väärtus määratakse valemiga:

,

kus on muutuja keskmine valimi väärtus ühe andmevalimi kohta; -valimi keskmine väärtus, mis põhineb muul andmevalimil; m 1 Ja m 2 - integreeritud indikaatorid osaväärtuste kõrvalekallete kohta kahest proovist nende vastavatest keskmistest väärtustest.

Kui t arvutus on tabelist suurem või sellega võrdne, siis järeldavad nad, et kahe proovi võrreldavad keskmised väärtused on vastuvõetava vea tõenäosusega tõepoolest statistiliselt oluliselt erinevad.

Seda tehnikat kasutatakse siis, kui on vaja kindlaks teha, kas katse õnnestus või ebaõnnestus, kas see mõjutas või ei mõjutanud kvaliteedi taset, mida sellega kavatseti muuta.

Kui t hinnanguliselt vähem t tabelina, siis sel juhul pole veenvat põhjust, et katse õnnestus, isegi kui keskmised väärtused katse alguses ja lõpus on absoluutväärtustes erinevad.

Kriteeriumφ* - Angular Fisheri teisendus

Seda meetodit on kirjeldatud paljudes käsiraamatutes (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992 jne). See kirjeldus põhineb meetodi versioonil, mille töötas välja ja esitas E.V. Gubler.

Fisheri test on loodud kahe proovi võrdlemiseks vastavalt uurijat huvitava mõju esinemissagedusele. Kriteerium hindab erinevuste usaldusväärsust kahe valimi protsentide vahel, milles registreeriti teadlast huvipakkuv mõju.

Fisheri nurga teisenduse olemus on teisendada protsendid kesknurga väärtusteks, mida mõõdetakse radiaanides. Suurem protsent vastab suuremale nurgale φ ja väiksem protsent väiksemale nurgale, kuid siinsed seosed ei ole lineaarsed:

φ = 2 arcsin(),

kus on protsent väljendatuna ühiku murdosades.

Kui nurkade φ 1 ja φ 2 lahknevus suureneb ja valimite arv suureneb, suureneb kriteeriumi väärtus. Mida suurem on φ* väärtus, seda tõenäolisem on, et erinevused on olulised.

2.1. Põhimõisted

Eksperimentaalsete andmete töötlemise parameetrilised meetodid põhinevad põhimõttelisel tõsiasjal, mille kohaselt kirjeldatakse juhuslike objektidena käsitletavate eksperimentaalsete uuringute tulemuste omadusi mingi jaotusseadusega. Eeldatakse, et katseandmete analüüs võimaldab piisava täpsusega kindlaks teha jaotusseaduse tüübi ja konkreetse vormi või selle parameetrite väärtused, kui seadust ennast pole vaja kasutada. Selline teave võimaldab täielikult kasutada tõenäosusteooria meetodeid töötlemisprobleemide lahendamiseks.

Kuna tegelik jaotusseadus ja selle parameetrite väärtused pole teada, toimivad parameetrilised meetodid nende lähendustega - statistiliste jaotusseaduste ja jaotusparameetrite hinnangutega.

Juhusliku suuruse statistiline jaotuse seadus nimetatakse antud suuruse jaotuse seaduseks, mis on kehtestatud statistiliste andmetöötlusmeetodite abil.

Statistilise jaotuse seadust saab defineerida statistilise jaotusfunktsiooni, statistilise jaotustiheduse või statistilise jaotusreana P * (x i), .

Juhusliku suuruse jaotusseaduse parameetrite statistilised hinnangud on nende parameetrite (statistika) ligikaudsed väärtused, mis on saadud statistiliste andmetöötlusmeetodite abil.

Järgnevalt nimetatakse statistilisi hinnanguid lihtsalt lühiduse hinnanguteks.

Kui mõnda jaotusseadust iseloomustavad parameetrid a 1 , a 2 ,…, olen, siis nende hinnangud tähistatakse kujul , ,…,. Enamlevinud jaotusseaduste parameetrite tüübid katseandmete töötlemisel on matemaatiline ootus, dispersioon või standardhälve ning juhuslike suuruste süsteemi puhul - korrelatsioonimoment või korrelatsioonikordaja. Mõnikord kasutatakse kolmandat ja neljandat järku keskseid momente. Vastavalt sellele kasutatakse andmete töötlemisel nende statistilisi analooge - matemaatilise ootuse hinnanguid, korrelatsioonimomenti jne.

Seega, kui on olemas katseandmete kogum x 1 , x 2 ,…, x n, siis esindavad nii statistilise jaotuse seadus, näiteks funktsioon, kui ka selle parameetrite hinnangud mõningaid nende andmete funktsioone:

, . (2.1.2)

Statistika tüüp y ja f j määrab hinnangute kvaliteedi ja . Sellega seoses kerkib esile rida probleeme, millest peamine on tingimuste kindlaksmääramise probleem, mille korral hinnangud (2.1.1) ja (2.1.2) suudavad esitada teoreetilisi jaotusseadusi ja nende parameetreid nõutava usaldusväärsusega. Need tingimused moodustuvad piirteoreemid tõenäosusteooria. Need on aluseks eksperimentaalsete andmete töötlemise parameetrilistele meetoditele, mille alusel saab sobivaid hinnanguid vaadeldavate tunnuste jaotuse seaduste ja parameetrite kohta.

Teine probleem on valik piisav statistika, st. selline statistika, mis võimaldab konkreetsetel tingimustel saada hinnanguid antud kvaliteedi kohta. Kuna vaatlustulemuste põhjal x 1 , x 2 ,…, x n saab moodustada suure hulga statistikat (2.1.1) ja (2.1.2) see probleem taandub nende hulgast teatud mõttes optimaalse statistika valimisele. Ülesanne lahendatakse statistilise otsustusteooria meetoditega.

Nagu on näha jooniselt 1.1, ei ole eksperimentaalsete andmete töötlemisel otsustamise probleem ainult piisava statistika valimise probleem. Enamikku andmetöötlusülesandeid võib erineval määral liigitada otsustusülesanneteks. Seoses sellega on parameetriliste töötlusmeetodite vundamendiks ka statistilise otsustamise põhimõtted, mille alusel kujunevad kriteeriumid teatud mõttes optimaalsete otsuste tegemiseks. Erilist rolli nende põhimõtete hulgas mängivad maksimaalse tõenäosuse printsiip ja vähimruutude meetod, mis sellest normaaljaotuse seaduse puhul järeldub.

See brošüür käsitleb eksperimentaalsete andmete parameetrilise töötlemise küsimusi.

2.2. Tõenäosusteooria piirteoreemid

Andmetöötluse parameetriliste meetodite kasutamine hõlmab tingimuste tuvastamist, mis määravad uuritava juhusliku suuruse jaotusseaduse vormi ja selle parameetrite omaduste a priori eelduste kehtivuse. Need tingimused on tõenäosusteoorias sõnastatud piirteoreemide kujul. Allpool toome välja teoreemide sisu ja olemuse ilma tõestuseta, samuti mõned soovitused nende praktiliseks rakendamiseks.