Tulemuste olulisuse määramine omavahel. Usaldusväärsus ja statistiline olulisus

Statistiline usaldusväärsus on FCC arvutuspraktikas oluline. Varem märgiti, et samast elanikkonnast valida saab mitu näidist:

Kui need on õigesti valitud, siis nende keskmised näitajad ja üldkogumi näitajad erinevad üksteisest veidi representatiivsusvea suuruse poolest, võttes arvesse aktsepteeritud usaldusväärsust;

Kui nad on valitud erinevatest populatsioonidest, osutub erinevus nende vahel oluliseks. Statistika seisneb valimite võrdlemises;

Kui need erinevad ebaoluliselt, ebapõhiliselt, ebaoluliselt, st kuuluvad tegelikult samasse üldkogumisse, nimetatakse nendevahelist erinevust statistiliselt ebausaldusväärseks.

Statistiliselt usaldusväärne Valimi erinevus on valim, mis erineb oluliselt ja põhimõtteliselt, see tähendab, et see kuulub erinevatesse üldkogumitesse.

FCC-s tähendab valimi erinevuste statistilise olulisuse hindamine komplekti lahendamist praktilisi probleeme. Näiteks uute õppemeetodite, programmide, harjutuste komplektide, testide kasutuselevõtt, kontrollharjutused on seotud nende eksperimentaalse testimisega, mis peaks näitama, et katserühm erineb põhimõtteliselt kontrollrühmast. Seetõttu eriline statistilised meetodid, mida nimetatakse statistilise olulisuse kriteeriumiteks, mis võimaldavad tuvastada proovide vahel statistiliselt olulise erinevuse olemasolu või puudumise.

Kõik kriteeriumid on jagatud kahte rühma: parameetrilised ja mitteparameetrilised. Parameetrilised kriteeriumid nõuavad normaaljaotuse seaduse olemasolu, s.t. see tähendab tavaseaduse põhinäitajate – keskmise – kohustuslikku määramist aritmeetiline väärtus ja standardhälve s. Parameetrilised kriteeriumid on kõige täpsemad ja õigemad. Mitteparameetrilised testid põhinevad valimi elementide auaste (järjekorra) erinevustel.

Siin on peamised statistilise olulisuse kriteeriumid, mida FCC praktikas kasutatakse: Studenti test ja Fisheri test.

Õpilase t test nime saanud inglise teadlase K. Gosseti (Õpilane – pseudonüüm) järgi, kes avastas seda meetodit. Studenti t-test on parameetriline ja seda kasutatakse võrdlemiseks absoluutsed näitajad proovid. Proovid võivad olla erineva suurusega.

Õpilase t test on määratletud nii.

1. Leidke Studenti t-test, kasutades järgmist valemit:

kus on võrreldavate valimite aritmeetilised keskmised; t 1, t 2 - võrreldavate valimite näitajate alusel tuvastatud esindusvead.

2. FCC praktika on näidanud, et sporditöö puhul piisab, kui aktsepteerida konto usaldusväärsust P = 0,95.

Usaldusväärsuse arvutamiseks: P = 0,95 (a = 0,05) koos vabadusastmete arvuga

k = n 1 + n 2 - 2 lisa 4 tabelist leiame kriteeriumi piirväärtuse väärtuse ( t gr).

3. Tuginedes normaaljaotuse seaduse omadustele, võrdleb Studenti kriteerium t ja t gr.

Teeme järeldused:

kui t t gr, siis on erinevus võrreldavate valimite vahel statistiliselt oluline;

kui t t gr, siis on erinevus statistiliselt ebaoluline.

FCS valdkonna teadlaste jaoks on statistilise olulisuse hindamine esimene samm konkreetse probleemi lahendamisel: kas võrreldavad valimid erinevad üksteisest põhimõtteliselt või mitte-põhimõtteliselt. Järgmine samm on selle erinevuse hindamine pedagoogiline punkt nägemine, mille määravad probleemi tingimused.

Vaatleme õpilase testi rakendamist konkreetse näite abil.

Näide 2.14. 18 isikust koosneval rühmal hinnati südame löögisagedust (bpm) enne x i ja pärast seda y i soojendama.

Hinnake soojenduse tõhusust pulsisageduse järgi. Algandmed ja arvutused on toodud tabelis. 2.30 ja 2.31.

Tabel 2.30

Südame löögisageduse indikaatorite töötlemine enne soojendamist

Mõlema rühma vead langesid kokku, kuna valimi suurused on võrdsed (sama rühma uuritakse erinevad tingimused) ja keskmine standardhälbed oli s x = s y = 3 lööki/min. Liigume edasi õpilase testi määratlemise juurde:

Seadsime konto usaldusväärsuse: P = 0,95.

Vabadusastmete arv k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Lisa 4 tabelist leiame t gr= 2,02.

Statistiline järeldus. Kuna t = 11,62 ja piir t gr = 2,02, siis 11,62 > 2,02, s.o. t > t gr, seetõttu on valimite erinevus statistiliselt oluline.

Pedagoogiline järeldus. Selgus, et pulsisageduse osas on erinevus rühma soojenduseeelse ja -järgse seisundi vahel statistiliselt oluline, s.o. oluline, põhiline. Seega võime pulsi indikaatori põhjal järeldada, et soojendus on tõhus.

Fisheri kriteerium on parameetriline. Seda kasutatakse proovi dispersioonimäärade võrdlemisel. Tavaliselt tähendab see võrdlust sportliku soorituse stabiilsuse või funktsionaalsete ja tehniliste näitajate stabiilsuse osas praktikas füüsiline kultuur ja sport. Proovid võivad olla erineva suurusega.

Fisheri kriteerium on määratletud järgmises järjestuses.

1. Leidke valemi abil Fisheri kriteerium F

kus , on võrreldavate valimite dispersioonid.

Fisheri kriteeriumi tingimused näevad ette, et valemi lugejas F on suur hajuvus, st. arv F on alati suurem kui üks.

Seadsime arvutuse usaldusväärsuse: P = 0,95 - ja määrame mõlema valimi vabadusastmete arvu: k 1 = n 1 - 1, k 2 = n 2 - 1.

Kasutades lisa 4 tabelit, leiame kriteeriumi F piirväärtuse gr.

F ja F kriteeriumide võrdlus gr võimaldab meil teha järeldusi:

kui F > F gr, siis on valimite erinevus statistiliselt oluline;

kui F< F гр, то различие между выборками статически недостоверно.

Toome konkreetse näite.

Näide 2.15. Analüüsime kahte käsipallurite rühma: x i (n 1= 16 inimest) ja y i (p 2 = 18 inimest). Neid sportlaste gruppe uuriti palli väravasse viskamise stardiaja(de) kohta.

Kas tõukenäidikud on sama tüüpi?

Algandmed ja põhiarvutused on toodud tabelis. 2,32 ja 2,33.

Tabel 2.32

Käsipallurite esimese grupi tõukenäitajate töötlemine

Määratleme Fisheri kriteeriumi:

Vastavalt lisa 6 tabelis toodud andmetele leiame Fgr: Fgr = 2,4

Pöörakem tähelepanu asjaolule, et lisa 6 tabelis on toodud lähenemisel nii suurema kui ka väiksema dispersiooni vabadusastmete arvud. suured numbrid läheb karmimaks. Seega järgneb suurema dispersiooni vabadusastmete arv järgmises järjekorras: 8, 9, 10, 11, 12, 14, 16, 20, 24 jne ning väiksema - 28, 29, 30, 40 , 50 jne d.

Seda seletatakse asjaoluga, et valimi suuruse suurenedes vähenevad F-testi erinevused ja on võimalik kasutada tabeliväärtusi, mis on lähedased algandmetele. Seega näites 2.15 =17 puudub ja saame võtta sellele lähima väärtuse k = 16, millest saame Fgr = 2.4.

Statistiline järeldus. Kuna Fisheri test F= 2,5 > F= 2,4, on valimid statistiliselt eristatavad.

Pedagoogiline järeldus. Mõlema grupi käsipallurite stardiaja(de) väärtused palli väravasse viskamisel erinevad oluliselt. Neid rühmi tuleks käsitleda erinevatena.

Edasised uuringud peaksid välja selgitama selle erinevuse põhjuse.

Näide 2.20.(valimi statistilise usaldusväärsuse kohta ). Kas jalgpalluri kvalifikatsioon on paranenud, kui treeningu alguses oli aeg(ad) signaali andmisest palli löömiseni x i ja lõpus y i .

Algandmed ja põhiarvutused on toodud tabelis. 2.40 ja 2.41.

Tabel 2.40

Ajanäitajate töötlemine alates signaali andmisest kuni palli tabamiseni treeningu alguses

Määrame näitajate rühmade erinevuse Studenti kriteeriumi abil:

Usaldusväärsusega P = 0,95 ja vabadusastmetega k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, leiame lisa 4 tabelit kasutades t gr= 2,02. Kuna t = 8,3 > t gr= 2,02 – erinevus on statistiliselt oluline.

Määrame näitajate rühmade erinevuse Fisheri kriteeriumi abil:

Lisa 2 tabeli järgi usaldusväärsuse P = 0,95 ja vabadusastmega k = 22-1 = 21 väärtus F gr = 21. Kuna F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistiline järeldus. Aritmeetilise keskmise järgi on näitajate rühmade erinevus statistiliselt oluline. Dispersiooni (dispersiooni) osas on näitajate rühmade erinevus statistiliselt ebausaldusväärne.

Pedagoogiline järeldus. Jalgpalluri kvalifikatsioon on oluliselt paranenud, kuid tähelepanu tuleks pöörata tema tunnistuse stabiilsusele.

Tööks valmistumine

Enne seda laboritööd distsipliini järgi" Spordi metroloogia» kõigile õpilastele õpperühm igas on vaja moodustada 3-4 õpilasest koosnevad töörühmad, ühiselt täita kõigi laboritööde tööülesanne.

Tööks valmistumisel lugege läbi soovitatava kirjanduse asjakohased jaotised (vt andmete jaotist 6 metoodilised juhised) ja loengukonspektid. Uurige selle laboritöö 1. ja 2. jagu, samuti selle tööülesannet (4. jaotis).

Valmistage ette aruande vorm A4 formaadis kirjapaberi standardlehtedel ja täitke see tööks vajalike materjalidega.

Aruanne peab sisaldama :

Tiitelleht näidates ära osakond (ÕK ja TR), õpperühm, perekonnanimi, eesnimi, üliõpilase isanimi, laboritöö number ja nimetus, selle tegemise kuupäev, samuti perekonnanimi, akadeemiline kraad, tööle vastuvõtva õppejõu akadeemiline nimetus ja ametikoht;

Töö eesmärk;

Valemid koos arvväärtusi, selgitades arvutuste vahe- ja lõpptulemusi;

Mõõdetud ja arvutatud väärtuste tabelid;

Ülesandes nõutav graafiline materjal;

Lühikesed järeldused lähtudes tööülesande iga etapi tulemustest ja üldiselt tehtud tööst.

Kõik graafikud ja tabelid on joonistatud hoolikalt joonistustööriistade abil. Tavapärased graafilised ja tähtsümbolid peavad vastama GOST-idele. Aruande on lubatud koostada arvutitehnoloogia abil.

Tööülesanne

Enne kõigi mõõtmiste läbiviimist peab iga meeskonnaliige tutvuma kasutusreeglitega spordimäng Lisas 7 toodud nooled, mis on vajalikud järgnevate uurimisetappide läbiviimiseks.

Uurimise I etapp„Sportmängu Darts sihtmärgi tabamise tulemuste uurimine iga meeskonnaliikme poolt vastavuse tagamiseks tavaline seadus jaotused vastavalt kriteeriumile χ 2 Pearson ja kriteerium kolm sigma"

1. mõõta (testida) oma (isiklikku) kiirust ja tegevuste koordineerimist, visates noolemängu 30-40 korda ringmärki spordimängus Darts.

2. Mõõtmiste tulemused (testid) x i(klaasidega) vormista variatsiooni seeria ja sisestage tabelisse 4.1 (veerud , tehke kõik vajalikud arvutused, täitke vajalikud tabelid ja tehke vastavad järeldused saadud vastavuse kohta empiiriline jaotus normaaljaotuse seadus, analoogselt näite 2.12 sarnaste arvutuste, tabelite ja järeldustega, mis on toodud käesolevate juhiste jaotises 2 lk 7–10.

Tabel 4.1

Subjektide tegevuse kiiruse ja koordinatsiooni vastavus normaaljaotuse seadusele

Ei.										ümardatud







…
…
Kokku

II – uurimistöö etapp

“Sportmängu Darts tabamuste üldkogumi keskmiste näitajate hindamine kõigi õpperühma õpilaste ühe võistkonna liikmete mõõtmistulemuste põhjal”

Hinnake kõigi võistkonnaliikmete Dartsi spordimängu sihtmärgi tabamise tulemuste põhjal kõigi õpperühma õpilaste (vastavalt õpperühma nimekirjale klassilehes) keskmisi kiiruse ja tegevuse koordinatsiooni näitajaid. selle laboritöö uurimise esimeses etapis.

1. Kiiruse ja tegevuste koordineerimise mõõtmiste tulemused dokumenteerida nooleviske viskamisel spordimängus Noolemäng kõik oma võistkonna liikmed (2–4 inimest), kes esindavad mõõtmistulemuste valimit üldkogumikust (kõikide õpperühma õpilaste mõõtmistulemused – näiteks 15 inimest), kandes need teise ja kolmandasse veergu Tabel 4.2.

Tabel 4.2

Kiiruse ja tegevuste koordineerimise näitajate töötlemine

brigaadi liikmed

Ei.


…
…
Kokku

Tabelis 4.2 all tuleks mõista , ühtinud keskmine tulemus (vt arvutustulemusi tabelist 4.1) teie meeskonna liikmed ( , saadud uurimistöö esimeses etapis. Tuleb märkida, et tavaliselt, Tabel 4.2 sisaldab ühe meeskonnaliikme poolt uuringu esimeses etapis saadud mõõtmistulemuste arvutatud keskmist väärtust , kuna tõenäosus, et mõõtmise tulemused erinevaid liikmeid brigaadid langevad kokku väga väikestena. Siis reeglina väärtused veerus Tabel 4.2 iga rea kohta – võrdne 1-ga, A real „Kokku " veerud " ", on kirjutatud teie meeskonna liikmete arv.

2. Tehke kõik vajalikud arvutused, et täita tabel 4.2, samuti muud arvutused ja järeldused, mis on sarnased käesoleva artikli 2. osas toodud näite 2.13 arvutuste ja järeldustega. metoodiline areng lk 13-14. Seda tuleks esindusvea arvutamisel meeles pidada "m" on vaja kasutada käesoleva metoodilise arenduse lk 13 toodud valemit 2.4, kuna valim on väike (n ja üldkogumi elementide arv N on teada ja võrdub õpilaste arvuga õpperühmas, õpperühma ajakirja nimekirja järgi.

III – uurimistöö etapp

Soojenduse efektiivsuse hindamine vastavalt indikaatorile "Tegevuste kiirus ja koordineerimine" iga meeskonnaliikme poolt Studenti t-testi abil

Hinnake selle laboritöö uurimise esimeses etapis sooritatud nooleviske soojenduse tõhusust spordimängu "Darts" sihtmärgile iga meeskonnaliikme poolt vastavalt näitajale "Kiirus ja toimingute koordineerimine", kasutades Studenti kriteeriumi - empiirilise jaotusseaduse statistilise usaldusväärsuse parameetriline kriteerium normaaljaotuse seadusele .

… Kokku

2. dispersioonid ja RMS , soojenduse tulemuste põhjal indikaatori "Kiirus ja toimingute koordineerimine" mõõtmiste tulemused, toodud tabelis 4.3, (vt sarnaseid arvutusi, mis on antud vahetult pärast näite 2.14 tabelit 2.30 käesoleva metoodilise arenduse leheküljel 16).

3. Iga töörühma liige mõõta (testi) oma (isiklikku) kiirust ja tegevuste koordineerimist pärast soojendust,

… Kokku

5. Tehke keskmised arvutused dispersioonid ja RMS ,indikaatori "Kiirus ja toimingute koordineerimine" mõõtmistulemused pärast soojenemist, toodud tabelis 4.4, pane soojendustulemuste põhjal kirja üldine mõõtmistulemus (vt sarnaseid arvutusi, mis on antud vahetult pärast näite 2.14 tabelit 2.31 käesoleva metoodilise arenduse leheküljel 17).

6. Tehke kõik vajalikud arvutused ja järeldused, mis on sarnased käesoleva metoodilise arenduse 2. osas lk 16-17 toodud näite 2.14 arvutuste ja järeldustega. Seda tuleks esindusvea arvutamisel meeles pidada "m" on vaja kasutada käesoleva metoodilise arenduse leheküljel 12 toodud valemit 2.1, kuna valim on n ja elementide arv üldkogumis N ( pole teada.

IV – uurimistöö etapp

Kahe meeskonnaliikme näitajate “Tegevuste kiirus ja koordineeritus” ühtsuse (stabiilsuse) hindamine Fisheri kriteeriumi alusel.

Kahe meeskonnaliikme näitajate “Tegevuste kiirus ja koordineeritus” ühetaolisust (stabiilsust) hinnata Fisheri kriteeriumi abil, tuginedes käesolevas laboritöös uuringu kolmandas etapis saadud mõõtmistulemustele.

Selleks peate tegema järgmist.

Kasutades tabelite 4.3 ja 4.4 andmeid, nendest tabelitest saadud dispersioonide arvutamise tulemusi kolmandas uurimisetapis, samuti Fisheri kriteeriumi arvutamise ja rakendamise meetodit ühtluse (stabiilsuse) hindamiseks. sportlik sooritus toodud näites 2.15 käesoleva metoodilise arenduse lehekülgedel 18-19, teha asjakohased statistilised ja pedagoogilised järeldused.

V – uurimistöö etapp

Ühe meeskonnaliikme näitajate rühmade hindamine "Tegevuse kiirus ja koordineerimine" enne ja pärast soojendust

Psühholoogia kursuse-, diplomi- ja magistritööde statistiliste arvutuste tulemuste tabelites on näitaja “p” alati olemas.

Näiteks vastavalt uurimiseesmärgid Arvutati välja erinevused teismeliste poiste ja tüdrukute elu mõtestatuse tasemes.

	Keskmine väärtus		Mann-Whitney U test	Statistiline olulisuse tase (p)
	Poisid (20 inimest)	Tüdrukud (5 inimest)	Mann-Whitney U test	Statistiline olulisuse tase (p)
Eesmärgid	28,9	35,2	17,5	0,027*
Protsess	30,1	32,0	38,5	0,435
Tulemus	25,2	29,0	29,5	0,164
Kontrolli koht - "mina"	20,3	23,6		0,067
Kontrolli koht – "Elu"	30,4	33,8	27,5	0,126
Mõtekas elu	98,9	111,2		0,103

* - erinevused on statistiliselt olulised (lk≤ 0,05)

Parempoolne veerg näitab p väärtust ja selle väärtuse järgi saab kindlaks teha, kas poiste ja tüdrukute elu mõttekuse erinevused tulevikus on olulised või mitte. Reegel on lihtne:

Kui statistilise olulisuse tase “p” on väiksem või võrdne 0,05, siis järeldame, et erinevused on olulised. Allolevas tabelis on poiste ja tüdrukute vahelised erinevused olulised seoses indikaatoriga “Eesmärgid” – elu mõtestatus tulevikus. Tüdrukute puhul on see näitaja statistiliselt oluliselt kõrgem kui poistel.
Kui statistilise olulisuse tase “p” on suurem kui 0,05, siis järeldatakse, et erinevused ei ole olulised. Allolevas tabelis ei ole poiste ja tüdrukute erinevused kõigi teiste näitajate puhul olulised, välja arvatud esimene.

Kust tuleb statistilise olulisuse tase "p"?

Arvutatakse statistilise olulisuse tase statistikaprogramm koos arvutusega statistiline kriteerium. Nendes programmides saab määrata ka statistilise olulisuse taseme kriitilise piiri ja vastavad näitajad tuuakse programmi poolt esile.

Näiteks programmis STATISTICA saab korrelatsioonide arvutamisel määrata “p” piiri, näiteks 0,05 ja kõik statistiliselt olulised seosed on punasega esile tõstetud.

Kui statistiline kriteerium arvutatakse käsitsi, siis olulisuse tase “p” määratakse saadud kriteeriumi väärtuse võrdlemisel kriitilise väärtusega.

Mida näitab statistilise olulisuse tase “p”?

Kõik statistilised arvutused on ligikaudsed. Selle lähenduse tase määrab "p". Olulisuse tase on kirjutatud kui kümnendkohad, näiteks 0,023 või 0,965. Kui korrutada see arv 100-ga, saame p näitaja protsendina: 2,3% ja 96,5%. Need protsendid peegeldavad tõenäosust, et meie eeldused näiteks agressiooni ja ärevuse vahelise seose kohta on valed.

See on, korrelatsioonikordaja 0,58 agressiivsuse ja ärevuse vahel saadi statistilise olulisuse tasemel 0,05 või vea tõenäosusega 5%. Mida see täpsemalt tähendab?

Meie tuvastatud korrelatsioon tähendab, et meie valimis on täheldatud järgmist mustrit: mida kõrgem on agressiivsus, seda suurem on ärevus. See tähendab, et kui me võtame kaks teismelist ja ühel on suurem ärevus kui teisel, siis teades positiivset korrelatsiooni, võime öelda, et sellel teismelisel on ka suurem agressiivsus. Kuid kuna statistikas on kõik ligikaudne, siis seda väites mööname, et võime eksida ja vea tõenäosus on 5%. See tähendab, et olles teinud selles noorukite rühmas 20 sellist võrdlust, võime agressiivsuse taseme ennustamisel, ärevuse tundmisel, teha ühe vea.

Milline statistilise olulisuse tase on parem: 0,01 või 0,05

Statistilise olulisuse tase peegeldab vea tõenäosust. Seetõttu on tulemus p = 0, 01 korral täpsem kui p = 0, 05 korral.

IN psühholoogilised uuringud võttis vastu kaks lubatud tasemed tulemuste statistiline olulisus:

p=0,01 - tulemuse kõrge usaldusväärsus võrdlev analüüs või suhete analüüs;

p=0,05 - piisav täpsus.

Loodan, et see artikkel aitab teil iseseisvalt psühholoogiatööd kirjutada. Kui vajate abi, võtke meiega ühendust (igat tüüpi tööd psühholoogias; statistilised arvutused).

Enne andmete kogumist ja uurimist otsustavad eksperimentaalpsühholoogid tavaliselt, kuidas andmeid statistiliselt analüüsitakse. Sageli määrab uurija olulisuse taseme, mis on määratletud kui statistiline väärtus, kõrgem ( või madalam), mis sisaldab väärtusi, mis võimaldavad arvestada tegurite mõju mittejuhuslikult. Teadlased esindavad seda taset tavaliselt tõenäosusavaldise kujul.

Paljudes psühholoogilised katsed seda saab väljendada kui " tase 0,05" või " tase 0,01" See tähendab, et juhuslikud tulemused ilmnevad ainult sagedusega 0,05 (1 korda) või 0,01 (1 korda 100-st). tulemused Statistiline analüüs andmed, mis vastavad eelnevalt kehtestatud kriteeriumile ( olgu see siis 0,05, 0,01 või isegi 0,001), on allpool nimetatud statistiliselt olulisteks.

Tuleb märkida, et tulemus ei pruugi olla statistiliselt oluline, kuid siiski huvi pakkuda. Sageli, eriti eeluuringutes või katsetes, milles osaleb väike arv katsealuseid või piiratud arv vaatlusi, ei pruugi tulemused jõuda statistilise olulisuse tasemeni, kuid viitavad sellele, et edasised uuringud täpsema juhtimisega ja rohkem vaatluste põhjal saavad nad suurema usaldusväärsuse. Samas peab katsetaja olema väga ettevaatlik oma soovis katsetingimusi eesmärgipäraselt muuta, et saavutada soovitud tulemus iga hinna eest.

Teises 2x2 plaani näites Ji kasutas kahte tüüpi aineid ja kahte tüüpi ülesandeid, et uurida eriteadmiste mõju teabe meeldejätmisele.

Tema uuringus Ji õppis numbrite ja malenuppude meeldejätmist ( muutuja A) lapsed toolidel RECARO Young Sport ja täiskasvanud ( muutuja B), ehk 2x2 kava järgi. Lapsed olid 10-aastased ja osavad malet, täiskasvanud aga olid mängus uued. Esimeses ülesandes tuli meeles pidada nuppude asukohta laual, nagu see võib olla tavalise mängu ajal, ja taastada see pärast nuppude eemaldamist. Teine osa sellest ülesandest nõudis standardsete numbrite päheõppimist, nagu tavaliselt tehakse IQ määramisel.

Tuleb välja, eriteadmised, näiteks malet mängima õppides, hõlbustavad selle valdkonnaga seotud teabe meeldejätmist, kuid neil on vähe mõju numbrite meeldejätmisele. Täiskasvanud, kes pole tarkuse osas liiga kogenud vanim mäng, mäletavad vähem arve, kuid suudavad paremini numbreid meelde jätta.

Aruande tekstis Ji pakub statistilist analüüsi, mis kinnitab esitatud tulemusi matemaatiliselt.

2x2 disain on kõigist faktoriaalsetest konstruktsioonidest lihtsaim. Tegurite arvu või üksikute tegurite tasemete suurendamine suurendab oluliselt nende plaanide keerukust.

TASULINE FUNKTSIOON. Statistilise olulisuse funktsioon on saadaval ainult valitud plaanide puhul. Kontrollige, kas see on sees.

Saate teada, kas saadud vastustes on statistiliselt olulisi erinevusi erinevad rühmad küsitluse küsimustele vastajad. SurveyMonkey statistilise olulisuse funktsiooni kasutamiseks peate:

Lubage statistilise olulisuse funktsioon, kui lisate oma uuringu küsimusele võrdlusreegli. Valige võrdlemiseks vastajate rühmad, et sortida uuringutulemused visuaalseks võrdlemiseks rühmadesse.
Uurige oma küsitlusküsimuste andmetega tabeleid, et tuvastada statistiliste andmete olemasolu olulisi erinevusi alates saadud vastustes erinevad rühmad vastajad.

Vaata statistilist olulisust

Järgides alltoodud samme, saate luua küsitluse, mis kuvatakse statistiline olulisus.

1. Lisage oma küsitlusele suletud küsimused

Tulemuste analüüsimisel statistilise olulisuse kuvamiseks peate oma küsitluse mis tahes küsimusele rakendama võrdlusreeglit.

Saate rakendada võrdlusreeglit ja arvutada vastuste statistilist olulisust, kui kasutate oma küsitluse koostamisel ühte järgmistest. järgmised tüübid küsimused:

Tuleb veenduda, et pakutud vastusevariante saab jagada terviklikeks rühmadeks. Võrdlusreegli loomisel võrdlemiseks valitud vastusevalikuid kasutatakse andmete korraldamiseks risttabeliteks kogu uuringu jooksul.

2. Koguge vastuseid

Kui olete küsitluse täitnud, looge koguja selle väljasaatmiseks. On mitmeid viise.

Peate saama vähemalt 30 vastust iga vastusevaliku kohta, mida kavatsete oma võrdlusreeglis statistilise olulisuse aktiveerimiseks ja vaatamiseks kasutada.

Uuringu näide

Tahad teada, kas mehed on sinu toodetega oluliselt rohkem rahul kui naised.

Lisage oma küsitlusele kaks valikvastustega küsimust:
Mis on sinu sugu? (mees naine)
Kas olete meie tootega rahul või rahulolematu? (rahul, rahulolematu)
Veenduge, et vähemalt 30 vastajat valivad sooküsimuseks „mees“ JA vähemalt 30 vastajat valivad sooks „naise“.
Lisage võrdlusreegel küsimusele "Mis on teie sugu?" ja valige oma rühmadeks mõlemad vastusevalikud.
Kasutage küsimuste tabeli "Kas olete meie tootega rahul või rahulolematud?" all olevat andmetabelit. et näha, kas vastusevariandid näitavad statistiliselt olulist erinevust

Mis on statistiliselt oluline erinevus?

Statistiliselt oluline erinevus tähendab, et statistilise analüüsiga on kindlaks tehtud, et ühe vastajate grupi ja teise rühma vastuste vahel on olulisi erinevusi. Statistiline olulisus tähendab, et saadud arvud on oluliselt erinevad. Sellised teadmised aitavad teid andmeanalüüsis palju. Saadud tulemuste tähtsuse määrate aga ise. Teie otsustate, kuidas uuringutulemusi tõlgendada ja milliseid toiminguid nende põhjal ette võtta.

Näiteks saate naisklientidelt rohkem kaebusi kui meesklientidelt. Kuidas me saame kindlaks teha, kas selline erinevus on tõeline ja kas selle suhtes on vaja midagi ette võtta? Üks neist suurepäraseid viise Oma tähelepanekute kontrollimiseks on vaja läbi viia uuring, mis näitab, kas meessoost ostjad on tõesti teie tootega palju rohkem rahul. Kasutades statistiline valem Meie pakutav statistilise olulisuse funktsioon annab teile võimaluse määrata, kas teie toode meeldib meestele oluliselt rohkem kui naistele. See võimaldab teil tegutseda faktide, mitte oletuste põhjal.

Statistiliselt oluline erinevus

Kui teie tulemused on andmetabelis esile tõstetud, tähendab see, et need kaks vastajate rühma on üksteisest oluliselt erinevad. Mõiste "oluline" ei tähenda, et saadud numbritel oleks mingi eriline tähtsus või tähendus, vaid nende vahel on statistiline erinevus.

Statistiliselt olulist erinevust pole

Kui teie tulemusi pole vastavas andmetabelis esile tõstetud, tähendab see, et hoolimata võimalik erinevus kahel võrreldaval joonisel ei ole nende vahel statistilist erinevust.

Vastused ilma statistiliselt oluliste erinevusteta näitavad, et teie kasutatava valimi suurust arvestades ei ole kahe võrreldava üksuse vahel olulist erinevust, kuid see ei tähenda tingimata, et need pole olulised. Võib-olla saate valimi suurust suurendades tuvastada statistiliselt olulise erinevuse.

Näidissuurus

Kui valimi suurus on väga väike, on kahe rühma vahel olulised ainult väga suured erinevused. Kui teil on väga suur valim, loetakse nii väikesed kui ka suured erinevused olulisteks.

Kuid see, et kaks numbrit on statistiliselt erinevad, ei tähenda, et tulemuste erinevus teie jaoks midagi muudaks. praktiline tähtsus. Peate ise otsustama, millised erinevused on teie küsitluse jaoks olulised.

Statistilise olulisuse arvutamine

Arvutame statistilise olulisuse standardse 95% usaldusnivoo abil. Kui vastusevariant on näidatud statistiliselt olulisena, tähendab see, et juhuslikult või valimivea tõttu on kahe rühma vahelise erinevuse esinemise tõenäosus väiksem kui 5% (sageli näidatud järgmiselt: p<0,05).

Statistiliselt oluliste erinevuste arvutamiseks rühmade vahel kasutame järgmisi valemeid:

Parameeter	Kirjeldus
a1	Esimese rühma osalejate protsent, kes vastasid küsimusele teatud viisil, korrutatuna selle rühma valimi suurusega.
b1	Teise grupi osalejate protsent, kes vastasid küsimusele teatud viisil, korrutatuna selle rühma valimi suurusega.
Koondproovi osakaal (p)	Mõlema grupi kahe aktsia kombinatsioon.
Standardviga (SE)	Näitaja selle kohta, kui palju teie osa tegelikust aktsiast erineb. Väiksem väärtus tähendab, et murdosa on tegelikule murdarvule lähedane, suurem väärtus tähendab, et murdosa erineb oluliselt tegelikust murdarvust.
Testi statistika (t)	Testi statistika. Standardhälbete arv, mille võrra antud väärtus erineb keskmisest.
Statistiline olulisus	Kui testistatistika absoluutväärtus on suurem kui 1,96* standardhälvet keskmisest, loetakse seda statistiliselt oluliseks erinevuseks.

*1,96 on väärtus, mida kasutatakse 95% usaldusnivoo jaoks, sest 95% Studenti t-jaotuse funktsiooniga käsitletavast vahemikust jääb keskmisest 1,96 standardhälbesse.

Arvutamise näide

Jätkates ülaltoodud näitega, uurime, kas nende meeste protsent, kes ütlevad, et nad on teie tootega rahul, on oluliselt suurem kui naiste protsent.

Oletame, et teie küsitluses osales 1000 meest ja 1000 naist ning uuringu tulemuseks oli, et 70% meestest ja 65% naistest ütlesid, et on teie tootega rahul. Kas 70% tase on oluliselt kõrgem kui 65% tase?

Asendage järgmised uuringu andmed antud valemitesse:

p1 (% tootega rahulolevatest meestest) = 0,7
p2 (% tootega rahulolevatest naistest) = 0,65
n1 (küsitluses osalenud meeste arv) = 1000
n2 (küsitletud naiste arv) = 1000

Kuna testistatistika absoluutväärtus on suurem kui 1,96, tähendab see, et erinevus meeste ja naiste vahel on märkimisväärne. Naistega võrreldes on mehed teie tootega suurema tõenäosusega rahul.

Statistilise olulisuse varjamine

Kuidas varjata statistilist olulisust kõigi küsimuste puhul

Klõpsake vasakpoolsel külgribal võrdlusreeglist paremal oleval allanoolt.
Valige üksus Redigeeri reeglit.
Keela funktsioon Näita statistilist olulisust kasutades lülitit.
Klõpsake nuppu Rakenda.

Ühe küsimuse statistilise olulisuse peitmiseks peate:

Klõpsake nuppu Tunni selle probleemi diagrammi kohal.
Avage vahekaart Kuvavalikud.
Tühjendage kõrval olev ruut Statistiline olulisus.
Klõpsake nuppu Salvesta.

Kuvamisvalik on automaatselt lubatud, kui statistilise olulisuse kuvamine on lubatud. Kui tühjendate selle kuvamisvaliku, keelatakse ka statistilise olulisuse kuva.

Lülitage statistilise olulisuse funktsioon sisse, kui lisate oma küsitluses olevale küsimusele võrdlusreegli. Uurige oma küsitluse küsimuste andmetabeleid, et teha kindlaks, kas erinevatelt vastajate rühmadelt saadud vastustes on statistiliselt olulisi erinevusi.

Olulisuse tase - see on tõenäosus, et pidasime erinevusi olulisteks, kuid need on tegelikult juhuslikud.

Kui näitame, et erinevused on olulised 5% olulisuse tasemel või millal R< 0,05 , siis me mõtleme, et tõenäosus, et need on ebausaldusväärsed, on 0,05.

Kui näitame, et erinevused on olulised 1% olulisuse tasemel või millal R< 0,01 , siis me mõtleme, et tõenäosus, et need on ebausaldusväärsed, on 0,01.

Kui tõlgida see kõik formaliseeritud keelde, siis on olulisuse tasand nullhüpoteesi tagasilükkamise tõenäosus, kuigi see on tõsi.

Viga,koosnevadsee üksmida metagasi lükatudnullhüpoteeskuigi see on õige, nimetatakse seda 1. tüüpi veaks.(Vt tabel 1)

Tabel 1. Null- ja alternatiivhüpoteesid ning võimalikud testimistingimused.

Sellise vea tõenäosust tähistatakse tavaliselt kui α. Sisuliselt peaksime sulgudes märkima, mitte lk < 0,05 või lk < 0,01 ja α < 0,05 või α < 0,01.

Kui vea tõenäosus on α , siis õige otsuse tõenäosus: 1-α. Mida väiksem α, seda suurem on õige otsuse tõenäosus.

Ajalooliselt on psühholoogias üldiselt aktsepteeritud, et madalaim statistilise olulisuse tase on 5% tase (p≤0,05): piisav on 1% tase (p≤0,01) ja kõrgeim 0,1% tase (p≤0,001). Seetõttu sisaldavad kriitiliste väärtuste tabelid tavaliselt kriteeriumide väärtusi, mis vastavad statistilise olulisuse tasemetele p≤0,05 ja p≤0,01, mõnikord - p≤0,001. Mõne kriteeriumi puhul on tabelites näidatud nende erinevate empiiriliste väärtuste täpne olulisustase. Näiteks kui φ*=1,56 p=O,06.

Kuni statistilise olulisuse tasemeni p=0,05 pole meil aga õigust nullhüpoteesi tagasi lükata. Erinevuste puudumise hüpoteesi (Ho) ümberlükkamisel ja erinevuste statistilise olulisuse hüpoteesi (H 1) aktsepteerimisel järgime järgmist reeglit.

Ho tagasilükkamise ja h1 aktsepteerimise reegel

Kui testi empiiriline väärtus on võrdne p≤0,05-le vastava kriitilise väärtusega või sellest suurem, siis H 0 lükatakse tagasi, kuid H 1 ei saa veel kindlalt aktsepteerida.

Kui kriteeriumi empiiriline väärtus on võrdne p≤0,01-le vastava kriitilise väärtusega või ületab selle, siis H 0 lükatakse tagasi ja H 1 aktsepteeritakse.

Erandid : G-märgi test, Wilcoxoni T test ja Mann-Whitney U test. Nende jaoks luuakse pöördsuhted.

Riis. 4. Rosenbaumi Q-kriteeriumi "olulisuse telje" näide.

Kriteeriumi kriitilised väärtused on tähistatud Q o, o5 ja Q 0,01, kriteeriumi empiiriline väärtus Q em. See on ümbritsetud ellipsiga.

Kriitilise väärtuse Q 0,01 paremal pool laiendab "olulisuse tsooni" - see hõlmab empiirilisi väärtusi, mis ületavad Q 0,01 ja seega kindlasti olulised.

Kriitilisest väärtusest Q 0,05 vasakule ulatub "ebaolulisuse tsoon" - see hõlmab empiirilisi Q väärtusi, mis on alla Q 0,05 ja on seetõttu kindlasti ebaolulised.

Me näeme seda K 0,05 =6; K 0,01 =9; K em. =8;

Kriteeriumi empiiriline väärtus jääb Q 0,05 ja Q 0,01 vahele jäävasse piirkonda. See on "määramatuse" tsoon: hüpoteesi erinevuste ebausaldusväärsuse kohta (H 0) võime juba tagasi lükata, kuid me ei saa veel nõustuda hüpoteesiga nende usaldusväärsuse kohta (H 1).

Praktikas saab uurija aga pidada usaldusväärseteks erinevusi, mis ei lange ebaolulisuse tsooni, kuulutades, et need on usaldusväärsed p juures. < 0,05 või märkides saadud empiirilise kriteeriumi väärtuse täpse olulisuse taseme, näiteks: p=0,02. Kasutades standardtabeleid, mis on kõigis matemaatiliste meetodite õpikutes, saab seda teha seoses Kruskal-Wallis H kriteeriumidega, χ 2 r Friedman, Page's L, Fisher's φ* .

Statistilise olulisuse tase ehk kriitilised testiväärtused määratakse suund- ja mittesuunaliste statistiliste hüpoteeside testimisel erinevalt.

Suunatud statistilise hüpoteesi puhul kasutatakse ühepoolset, mittesuunalise hüpoteesi puhul kahepoolset testi. Kahesuunaline test on rangem, kuna see testib erinevusi mõlemas suunas ja seega testi empiirilist väärtust, mis vastas varem olulisuse tasemele p < 0,05, vastab nüüd ainult p tasemele < 0,10.

Me ei pea iga kord ise otsustama, kas ta kasutab ühe- või kahepoolset kriteeriumi. Kriteeriumide kriitiliste väärtuste tabelid on valitud nii, et suunahüpoteesid vastavad ühepoolsele kriteeriumile ja mittesuunatud hüpoteesid kahepoolsele kriteeriumile ning antud väärtused vastavad nõuetele, kohaldada igaühele neist. Uurija peab vaid tagama, et tema hüpoteesid kattuvad tähenduselt ja vormilt iga kriteeriumi kirjelduses välja pakutud hüpoteesidega.