Mida väljend tähendab, rühmad on statistiliselt oluliselt erinevad. Statistiline olulisus: definitsioon, mõiste, olulisus, regressioonivõrrandid ja hüpoteeside testimine

Psühholoogia kursuse-, diplomi- ja magistritööde statistiliste arvutuste tulemuste tabelites on näitaja “p” alati olemas.

Näiteks vastavalt uurimiseesmärgid Arvutati välja erinevused teismeliste poiste ja tüdrukute elu mõtestatuse tasemes.

Keskmine väärtus

Mann-Whitney U test

Statistiline olulisuse tase (p)

Poisid (20 inimest)

Tüdrukud

(5 inimest)

Eesmärgid

28,9

35,2

17,5

0,027*

Protsess

30,1

32,0

38,5

0,435

Tulemus

25,2

29,0

29,5

0,164

Kontrolli koht - "mina"

20,3

23,6

0,067

Kontrolli koht - "Elu"

30,4

33,8

27,5

0,126

Mõtekas elu

98,9

111,2

0,103

* - erinevused on statistiliselt olulised (lk0,05)

Parempoolne veerg näitab "p" väärtust ja selle väärtuse järgi saab kindlaks teha, kas poiste ja tüdrukute elu mõttekuse erinevused tulevikus on olulised või mitte. Reegel on lihtne:

  • Kui statistilise olulisuse tase "p" on väiksem või võrdne 0,05, siis järeldame, et erinevused on olulised. Allolevas tabelis on poiste ja tüdrukute vahelised erinevused olulised seoses indikaatoriga “Eesmärgid” – elu mõtestatus tulevikus. Tüdrukute puhul on see näitaja statistiliselt oluliselt kõrgem kui poistel.
  • Kui statistilise olulisuse tase “p” on suurem kui 0,05, siis järeldatakse, et erinevused ei ole olulised. Allolevas tabelis ei ole poiste ja tüdrukute erinevused kõigi teiste näitajate puhul olulised, välja arvatud esimene.

Kust tuleb statistilise olulisuse tase "p"?

Arvutatakse statistilise olulisuse tase statistikaprogramm koos arvutusega statistiline kriteerium. Nendes programmides saab määrata ka statistilise olulisuse taseme kriitilise piiri ja vastavad näitajad tuuakse programmi poolt esile.

Näiteks programmis STATISTICA saab korrelatsioonide arvutamisel määrata “p” piiri, näiteks 0,05 ja kõik statistiliselt olulised seosed on punasega esile tõstetud.

Kui statistiline kriteerium arvutatakse käsitsi, siis olulisuse tase “p” määratakse saadud kriteeriumi väärtuse võrdlemisel kriitilise väärtusega.

Mida näitab statistilise olulisuse tase “p”?

Kõik statistilised arvutused on ligikaudsed. Selle lähenduse tase määrab "p". Olulisuse tase on kirjutatud kui kümnendkohad, näiteks 0,023 või 0,965. Kui korrutada see arv 100-ga, saame p näitaja protsendina: 2,3% ja 96,5%. Need protsendid peegeldavad tõenäosust, et meie eeldused näiteks agressiooni ja ärevuse vahelise seose kohta on valed.

See on, korrelatsioonikordaja 0,58 agressiivsuse ja ärevuse vahel saadi statistilise olulisuse tasemel 0,05 või vea tõenäosusega 5%. Mida see täpsemalt tähendab?

Meie tuvastatud korrelatsioon tähendab, et meie valimis on täheldatud järgmist mustrit: mida suurem on agressiivsus, seda suurem on ärevus. See tähendab, et kui me võtame kaks teismelist ja ühel on suurem ärevus kui teisel, siis teades positiivset korrelatsiooni, võime öelda, et sellel teismelisel on ka suurem agressiivsus. Kuid kuna statistikas on kõik ligikaudne, siis seda väites mööname, et võime eksida ja vea tõenäosus on 5%. See tähendab, et olles teinud selles noorukite rühmas 20 sellist võrdlust, võime agressiivsuse taseme ennustamisel, ärevuse tundmisel, teha ühe vea.

Milline statistilise olulisuse tase on parem: 0,01 või 0,05

Statistilise olulisuse tase peegeldab vea tõenäosust. Seetõttu on tulemus p = 0, 01 korral täpsem kui p = 0, 05 korral.

IN psühholoogilised uuringud võttis vastu kaks lubatud tasemed tulemuste statistiline olulisus:

p=0,01 - tulemuse kõrge usaldusväärsus võrdlev analüüs või suhete analüüs;

p=0,05 - piisav täpsus.

Loodan, et see artikkel aitab teil iseseisvalt psühholoogiatööd kirjutada. Kui vajate abi, võtke meiega ühendust (igat tüüpi tööd psühholoogias; statistilised arvutused).

Kui te ei tegutse, pole palatist kasu. (Shota Rustaveli)

Meditsiinistatistika põhimõisted ja mõisted

Selles artiklis tutvustame mõnda võtmemõisteid meditsiiniuuringutega seotud statistika. Tingimustest on täpsemalt juttu vastavates artiklites.

Variatsioon

Definitsioon. Andmete (atribuutide väärtuste) hajutatuse määr väärtusvahemikus

Tõenäosus

Definitsioon. Tõenäosus - millegi avaldumise võimalikkuse määr teatud sündmus teatud tingimustel.

Näide. Selgitagem mõiste definitsiooni lauses „Taastumistõenäosus kasutamisel ravimtoode Arimidex on 70%. Sündmus on "patsiendi paranemine", seisund "patsient võtab Arimidexi", tõenäosus on 70% (jämedalt öeldes, 100 Arimidexi võtvast inimesest paraneb 70).

Kumulatiivne tõenäosus

Definitsioon. Kumulatiivne ellujäämise tõenäosus ajahetkel t on sama, mis sel ajal elus olevate patsientide osakaal.

Näide. Kui öeldakse, et viieaastase ravikuuri järel on kumulatiivne ellujäämise tõenäosus 0,7, siis see tähendab, et vaatlusalusest patsientide rühmast jäi ellu 70%. esialgne kogus ja 30% suri. Teisisõnu, igast sajast inimesest 30 suri esimese 5 aasta jooksul.

Aeg enne sündmust

Definitsioon. Aeg enne sündmust on aeg, mis on väljendatud mõnes ühikus, mis on möödunud mingist esialgsest ajahetkest kuni sündmuse toimumiseni.

Selgitus. Ajaühikutena meditsiinilised uuringud ilmuvad päevad, kuud ja aastad.

Tüüpilised näited esialgsed hetked aeg:

    alustada patsiendi jälgimist

    kirurgiline ravi

Tüüpilised näited vaadeldavatest sündmustest:

    haiguse progresseerumine

    retsidiivi esinemine

    patsiendi surm

Näidis

Definitsioon. Valiku teel saadud populatsiooni osa.

Valimi analüüsi tulemuste põhjal tehakse järeldused kogu populatsiooni kohta, mis kehtivad ainult juhul, kui valik oli juhuslik. Kuna populatsioonist juhuslikult valida on praktiliselt võimatu, tuleks püüda tagada, et valim oleks populatsiooni suhtes vähemalt representatiivne.

Sõltuvad ja sõltumatud proovid

Definitsioon. Proovid, millesse uuritavad värvati üksteisest sõltumatult. Alternatiivne sõltumatud proovid- sõltuvad (ühendatud, seotud) proovid.

Hüpotees

Kahepoolsed ja ühepoolsed hüpoteesid

Esiteks selgitame termini hüpotees kasutamist statistikas.

Enamiku uuringute eesmärk on kontrollida mõne väite õigsust. Uimastitestide eesmärk on kõige sagedamini kontrollida hüpoteesi, et üks ravim on tõhusam kui teine ​​(näiteks Arimidex on tõhusam kui tamoksifeen).

Uuringu ranguse tagamiseks väljendatakse kontrollitav väide matemaatiliselt. Näiteks kui A on Arimidexi võtva patsiendi eluaastate arv ja T on tamoksifeeni kasutava patsiendi eluaastate arv, saab testitava hüpoteesi kirjutada kujul A>T.

Definitsioon. Hüpoteesi nimetatakse kahepoolseks, kui see koosneb kahe suuruse võrdsusest.

Näide kahepoolsest hüpoteesist: A=T.

Definitsioon. Hüpoteesi nimetatakse ühepoolseks (ühepoolseks), kui see koosneb kahe suuruse ebavõrdsusest.

Ühepoolsete hüpoteeside näited:

Dihhotoomsed (binaarsed) andmed

Definitsioon. Andmed on väljendatud ainult kahe kehtiva alternatiivse väärtusega

Näide: patsient on "terve" - ​​"haige". Turse "on" - "ei".

Usaldusvahemik

Definitsioon. Koguse usaldusintervall on suuruse väärtuse vahemik, milles asub selle suuruse tegelik väärtus (koos teatud tase usaldus).

Näide. Olgu uuritavaks koguseks patsientide arv aastas. Keskmiselt on nende arv 500 ja 95% - usaldusvahemik- (350, 900). See tähendab, et suure tõenäosusega (tõenäosusega 95%) võtab aasta jooksul kliinikuga ühendust vähemalt 350 ja mitte rohkem kui 900 inimest.

Määramine. Väga sageli kasutatav lühend on: CI 95% on usaldusvahemik, mille usaldusnivoo on 95%.

Usaldusväärsus, statistiline olulisus (P - tase)

Definitsioon. Statistiline olulisus tulemus on mõõdupuu usaldusest selle "tõe" vastu.

Kõik uuringud viiakse läbi ainult osa objektide põhjal. Ravimi efektiivsuse uuring ei toimu mitte kõigi planeedi patsientide, vaid ainult teatud patsientide rühma põhjal (kõikide patsientide põhjal on lihtsalt võimatu analüüsi teha).

Oletame, et analüüsi tulemusena tehti teatud järeldus (näiteks Arimidexi kasutamine adekvaatse ravina on 2 korda tõhusam kui tamoksifeen).

Küsimus, mis tuleb esitada, on järgmine: "Kui palju saate seda tulemust usaldada?"

Kujutage ette, et viisime läbi uuringu, mis põhines ainult kahel patsiendil. Loomulikult tuleks sel juhul tulemustesse suhtuda ettevaatlikult. Kui uuriti palju patsiente ( arvväärtus « suur kogus“oleneb olukorrast), siis võib tehtud järeldusi juba usaldada.

Seega määrab usalduse määr p-taseme väärtuse (p-väärtus).

Kõrgem p-tase vastab enamale madal tase usaldusväärsust proovi analüüsimisel saadud tulemuste suhtes. Näiteks p-tase, mis on võrdne 0,05-ga (5%), näitab, et teatud rühma analüüsist tehtud järeldus on ainult nende objektide juhuslik tunnus, mille tõenäosus on vaid 5%.

Teisisõnu väga suure tõenäosusega(95%) järeldust saab laiendada kõikidele objektidele.

Paljud uuringud peavad 5% vastuvõetavaks p-taseme väärtuseks. See tähendab, et kui näiteks p = 0,01, siis saab tulemusi usaldada, aga kui p = 0,06, siis mitte.

Uuring

Prospektiivne uuring on uuring, mille käigus valitakse algfaktori alusel proovid ja proovides analüüsitakse mõnda sellest tulenevat faktorit.

Retrospektiivne uuring on uuring, mille käigus valitakse saadud teguri alusel proovid ja proovides analüüsitakse mõnda algtegurit.

Näide. Esialgne tegur on noorem/üle 20-aastane rase naine. Tulemuseks on see, et laps on kergem/raskem kui 2,5 kg. Analüüsime, kas lapse kaal sõltub ema vanusest.

Kui värvata 2 valimit, millest ühes on alla 20-aastased emad, teises vanemad emad, ja seejärel analüüsime laste massi igas rühmas, siis on see perspektiivuuring.

Kui värvata 2 valimit, millest ühes - emad, kes sünnitasid kergemad kui 2,5 kg lapsed, teises - raskemad, ja seejärel analüüsime iga rühma emade vanust, siis on tegemist retrospektiivse uuringuga (loomulikult on selline uuring saab läbi viia alles siis, kui katse on lõppenud, st kõik lapsed on sündinud).

Exodus

Definitsioon. Kliiniliselt oluline nähtus labori väärtus või tunnus, mis on uurijale huvipakkuv objekt. Kliiniliste uuringute läbiviimisel on tulemused terapeutilise või ennetava sekkumise tõhususe hindamise kriteeriumid.

Kliiniline epidemioloogia

Definitsioon. Teadus, mis võimaldab ennustada iga konkreetse patsiendi jaoks konkreetset tulemust, uurides haiguse kliinilist kulgu sarnastel juhtudel rangelt teaduslikud meetodid patsientide uurimine, et tagada prognooside täpsus.

Kohort

Definitsioon. Rühm uuringus osalejaid, keda ühendavad mõned ühine omadus moodustamise ajal ja uuriti läbivalt pikk periood aega.

Kontroll

Ajalooline kontroll

Definitsioon. Kontrollgrupp, moodustatud ja uuritud uuringule eelneval perioodil.

Paralleeljuhtimine

Definitsioon. Samaaegselt põhirühma moodustamisega moodustati kontrollrühm.

Korrelatsioon

Definitsioon. Statistiline seos kahe tunnuse (kvantitatiivse või järgu) vahel, mis näitab seda kõrgem väärtusÜks tunnus teatud osal juhtudel vastab suuremale väärtusele - positiivse (otse) korrelatsiooni korral - teise tunnuse väärtusele või väiksemale väärtusele - negatiivse (pöörd)korrelatsiooni korral.

Näide. Leiti oluline korrelatsioon trombotsüütide ja leukotsüütide taseme vahel patsiendi veres. Korrelatsioonikordaja on 0,76.

Riskikoefitsient (RR)

Definitsioon. Riskikordaja on mõne (“halva”) sündmuse toimumise tõenäosuse suhe esimese objektirühma puhul sama sündmuse toimumise tõenäosuse vahel teise objektirühma puhul.

Näide. Kui mittesuitsetajatel on kopsuvähi tekke tõenäosus 20% ja suitsetajatel 100%, siis on CR võrdne viiendikuga. Selles näites on esimene rühm objekte mittesuitsetajad, teine ​​​​rühm on suitsetajad ja kopsuvähi esinemist peetakse "halvaks" sündmuseks.

On ilmne, et:

1) kui KR = 1, siis on sündmuse rühmades toimumise tõenäosus sama

2) kui KP>1, siis esineb sündmus sagedamini esimese rühma objektidega kui teisest

3) kui KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Metaanalüüs

Definitsioon. KOOS statistiline analüüs, mis võtab kokku mitme sama probleemi uurinud uuringute tulemused (tavaliselt ravi efektiivsus, ennetus, diagnostikameetodid). Uuringute ühendamine annab suurema valimi analüüsiks ja suurema statistilise võimsuse kombineeritud uuringute jaoks. Kasutatakse uuritava meetodi tõhususe kohta tehtud järelduste tõendite või kindlustunde suurendamiseks.

Kaplan-Meieri meetod (Kaplani-Meieri kordaja hinnangud)

Selle meetodi leiutasid statistikud E. L. Kaplan ja Paul Meyer.

Meetodit kasutatakse erinevate suuruste arvutamiseks, mis on seotud patsiendi vaatlusajaga. Selliste koguste näited:

    taastumise tõenäosus ühe aasta jooksul ravimi kasutamisel

    kordumise tõenäosus pärast operatsiooni kolme aasta jooksul pärast operatsiooni

    elulemuse kumulatiivne tõenäosus viie aasta pärast eesnäärmevähiga patsientide seas pärast elundi amputatsiooni

Selgitame Kaplan-Meieri meetodi kasutamise eeliseid.

Suuruste väärtused "tavalises" analüüsis (mitte Kaplan-Meieri meetodit kasutades) arvutatakse vaadeldava ajavahemiku jagamisel intervallideks.

Näiteks kui uurime patsiendi surma tõenäosust 5 aasta jooksul, siis võib ajaintervalli jagada 5 ossa (alla 1 aasta, 1-2 aastat, 2-3 aastat, 3-4 aastat, 4- 5 aastat), nii ja 10 (igaüks kuus kuud) või muul arvul intervallidel. Erinevate partitsioonide tulemused on erinevad.

Kõige sobivama partitsiooni valimine pole lihtne ülesanne.

Kaplan-Meieri meetodi abil saadud väärtuste hinnangud ei sõltu vaatlusaja intervallideks jagamisest, vaid sõltuvad ainult iga patsiendi elueast.

Seetõttu on uurijal lihtsam analüüsi läbi viia ning tulemused on sageli paremad kui “tavalise” analüüsi tulemused.

Kaplan-Meier kõver on Kaplan-Meieri meetodi abil saadud ellujäämiskõvera graafik.

Cox mudel

Selle mudeli leiutas Sir David Roxby Cox (s. 1924), kuulus inglise statistik, enam kui 300 artikli ja raamatu autor.

Coxi mudelit kasutatakse olukordades, kus ellujäämisanalüüsis uuritavad suurused sõltuvad aja funktsioonidest. Näiteks võib retsidiivi tõenäosus t aasta pärast (t=1,2,...) sõltuda aja log(t) logaritmist.

Coxi pakutud meetodi oluliseks eeliseks on selle meetodi rakendatavus väga paljudes olukordades (mudel ei sea rangeid piiranguid tõenäosusjaotuse olemusele ega kujule).

Coxi mudeli alusel saab teha analüüsi (nimetatakse Coxi analüüsiks), mille tulemuseks on riskikoefitsiendi väärtus ja riskikoefitsiendi usaldusvahemik.

Mitteparameetrilised statistilised meetodid

Definitsioon. Statistiliste meetodite klass, mida kasutatakse eelkõige normaaljaotust mitte moodustavate kvantitatiivsete andmete analüüsiks, aga ka kvalitatiivsete andmete analüüsiks.

Näide. Patsientide süstoolse rõhu erinevuste olulisuse tuvastamiseks sõltuvalt ravi tüübist kasutame mitteparameetrilist Mann-Whitney testi.

Märk (muutuja)

Definitsioon. X uurimisobjekti (vaatluse) omadused. On kvalitatiivseid ja kvantitatiivseid omadusi.

Randomiseerimine

Definitsioon. Meetod uurimisobjektide juhuslikuks jaotamiseks põhi- ja kontrollgruppidesse, kasutades selleks spetsiaalseid vahendeid (tabelid või juhuslike arvude loendur, mündiviskamine ja muud meetodid kaasatud vaatlusele rühmanumbri juhuslikuks määramiseks). Randomiseerimine minimeerib erinevused rühmade vahel teadaolevate ja tundmatute omaduste osas, mis võivad mõjutada uuritavat tulemust.

Risk

Atributiivne- ebasoodsa tulemuse (näiteks haiguse) täiendav risk, mis on tingitud teatud tunnuse (riskiteguri) olemasolust uuringu subjektis. See on osa riskist haigestuda haigusesse, mis on seotud, seletatav ja mida on võimalik kõrvaldada, kui riskifaktor on kõrvaldatud.

Suhteline risk- ebasoodsa seisundi riski suhe ühes rühmas selle seisundi riskiga teises rühmas. Kasutatakse prospektiivsetes ja vaatlusuuringutes, kui rühmad moodustatakse eelnevalt ja uuritavat seisundit pole veel ilmnenud.

Veerev eksam

Definitsioon. Meetod statistilise mudeli stabiilsuse, usaldusväärsuse, jõudluse (kehtivuse) kontrollimiseks vaatluste järjestikuse eemaldamise ja mudeli ümberarvutamise teel. Mida sarnasemad on saadud mudelid, seda stabiilsem ja töökindlam on mudel.

Sündmus

Definitsioon. Uuringus täheldatud kliiniline tulemus, nagu tüsistuse, retsidiivi, paranemise või surma esinemine.

Kihistumine

Definitsioon. M valimi moodustamise meetod, mille puhul kõigi uuringusse kaasamise kriteeriumidele vastavate osalejate populatsioon jagatakse esmalt rühmadeks (kihtideks) ühe või mitme tunnuse (tavaliselt sugu, vanus) alusel, mis võivad huvipakkuvat tulemust mõjutada, ja seejärel igast nende rühmade (kihi) osalejad värvatakse sõltumatult katse- ja kontrollrühmadesse. See võimaldab teadlasel tasakaalustada olulisi omadusi katse- ja kontrollrühmade vahel.

Ettenägematute olukordade tabel

Definitsioon. Vaatluste absoluutsete sageduste (arvude) tabel, mille veerud vastavad ühe tunnuse väärtustele ja read - mõne teise tunnuse väärtustele (kahemõõtmelise situatsioonitabeli korral). Absoluutsed sageduse väärtused asuvad ridade ja veergude ristumiskohas olevates lahtrites.

Toome näite situatsioonitabeli kohta. Aneurüsmi operatsioon tehti 194 patsiendil. Turse raskusaste patsientidel enne operatsiooni on teada.

Turse\ Tulemus

turset pole 20 6 26
mõõdukas turse 27 15 42
väljendunud turse 8 21 29
m j 55 42 194

Seega jäi 26 turseta patsiendist pärast operatsiooni ellu 20 patsienti ja 6 patsienti suri. 42 mõõduka tursega patsiendist jäi ellu 27 patsienti, 15 suri jne.

Hii-ruut test situatsioonitabelite jaoks

Ühe märgi erinevuste olulisuse (usaldusväärsuse) määramiseks sõltuvalt teisest (näiteks operatsiooni tulemus sõltuvalt turse raskusastmest) kasutatakse kontingentsustabelite jaoks hii-ruut testi:


Juhus

Olgu mõne sündmuse tõenäosus võrdne p. Siis on tõenäosus, et sündmust ei toimu, 1-p.

Näiteks kui tõenäosus, et patsient jääb ellu viie aasta pärast, on 0,8 (80%), siis tõenäosus, et ta selle aja jooksul sureb, on 0,2 (20%).

Definitsioon. Tõenäosus on sündmuse toimumise tõenäosuse ja sündmuse mittetoimumise tõenäosuse suhe.

Näide. Meie näites (patsiendi kohta) on võimalus 4, kuna 0,8/0,2=4

Seega on taastumise tõenäosus 4 korda suurem pigem surmast.

Koguse väärtuse tõlgendamine.

1) Kui Juhus=1, siis on sündmuse toimumise tõenäosus võrdne tõenäosusega, et sündmust ei toimu;

2) kui Juhus >1, siis on sündmuse toimumise tõenäosus suurem kui tõenäosus, et sündmust ei toimu;

3) kui võimalus<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Koefitsientide suhe

Definitsioon. Koefitsientide suhe on esimese objektirühma ja teise objektirühma koefitsientide suhe.

Näide. Oletame, et nii mehed kui naised läbivad teatud ravi.

Tõenäosus, et meespatsient jääb ellu viie aasta pärast, on 0,6 (60%); tõenäosus, et ta selle aja jooksul sureb, on 0,4 (40%).

Naiste puhul on sarnased tõenäosused 0,8 ja 0,2.

Selle näite koefitsientide suhe on

Koguse väärtuse tõlgendamine.

1) Kui koefitsientide suhe = 1, siis on esimese grupi võimalus võrdne teise grupi võimalusega

2) Kui koefitsientide suhe on >1, siis esimese grupi võimalus rohkem võimalust teise rühma jaoks

3) Kui koefitsientide suhe<1, то шанс для первой группы меньше шанса для второй группы

STATISTILINE USALDUSVÄÄRSUS

- Inglise usaldusväärsus/kehtivus, statistiline; saksa keel Validitat, statistische. Järjepidevus, objektiivsus ja mitmetähenduslikkuse puudumine statistilises testis või q.l. mõõtude komplekt. D. s. saab testida, korrates sama testi (või küsimustikku) samal teemal, et näha, kas saadakse samad tulemused; või võrrelda testi erinevaid osi, mis peaksid mõõtma sama objekti.

Antinazi. Sotsioloogia entsüklopeedia, 2009

Vaadake, mis on "STATISTILINE ULDUSVÄÄRSUS" teistes sõnaraamatutes:

    STATISTILINE USALDUSVÄÄRSUS- Inglise usaldusväärsus/kehtivus, statistiline; saksa keel Validitat, statistische. Järjepidevus, objektiivsus ja mitmetähenduslikkuse puudumine statistilises testis või q.l. mõõtude komplekt. D. s. seda saab kontrollida sama testi kordamisega (või... Sotsioloogia seletav sõnaraamat

    Statistikas nimetatakse väärtust statistiliselt oluliseks, kui selle juhusliku või isegi äärmuslikuma esinemise tõenäosus on väike. Siin peame äärmuse all silmas teststatistika kõrvalekalde astet nullhüpoteesist. Erinevust nimetatakse... ... Vikipeediaks

    Statistilise stabiilsuse füüsikaline nähtus seisneb selles, et valimi suuruse kasvades kaldub juhusliku sündmuse sagedus või füüsikalise suuruse keskmine väärtus mingi kindla numbrini. Statistilise... ... Vikipeedia fenomen

    ERINEVUSTE USALDUSVÄÄRSUS (sarnasused)- analüütiline statistiline protseduur valimite erinevuste või sarnasuste olulisuse taseme kindlaksmääramiseks vastavalt uuritud näitajatele (muutujatele) ... Kaasaegne haridusprotsess: põhimõisted ja terminid

    ARUANDLUS, STATISTIKA Suurepärane raamatupidamissõnastik

    ARUANDLUS, STATISTIKA- riikliku statistilise vaatluse vorm, mille käigus vastavad asutused saavad ettevõtetelt (organisatsioonidelt ja asutustelt) neile vajalikku teavet seaduslikult kehtestatud aruandlusdokumentide (statistiliste aruannete) vormis... Suur majandussõnastik

    Teadus, mis uurib inimeste ühiskonnaelus toimuvate massinähtuste süstemaatilise vaatluse meetodeid, nende arvuliste kirjelduste koostamist ja nende kirjelduste teaduslikku töötlemist. Seega on teoreetiline statistika teadus...... Entsüklopeediline sõnaraamat F.A. Brockhaus ja I.A. Efron

    Korrelatsioonikordaja- (Korrelatsioonikordaja) Korrelatsioonikordaja on kahe juhusliku suuruse sõltuvuse statistiline näitaja Korrelatsioonikordaja definitsioon, korrelatsioonikordaja tüübid, korrelatsioonikordaja omadused, arvutamine ja rakendamine... ... Investorite entsüklopeedia

    Statistika- (Statistika) Statistika on üldteoreetiline teadus, mis uurib kvantitatiivseid muutusi nähtustes ja protsessides. Riigistatistika, statistikateenused, Rosstat (Goskomstat), statistilised andmed, päringustatistika, müügistatistika,... ... Investorite entsüklopeedia

    Korrelatsioon- (Korrelatsioon) Korrelatsioon on statistiline seos kahe või enama juhusliku muutuja vahel. Korrelatsiooni mõiste, korrelatsiooni liigid, korrelatsioonikordaja, korrelatsioonianalüüs, hinnakorrelatsioon, valuutapaaride korrelatsioon Forexil Sisu... ... Investorite entsüklopeedia

Raamatud

  • Teadusuuringud matemaatikas ja matemaatika uurimistöös: Metoodiline kogumik õpilaste uurimistegevuse kohta, Borzenko V.I.. Kogumik esitab õpilaste uurimistegevuse korraldamisel rakendatavaid metoodilisi arenguid. Kogumiku esimene osa on pühendatud uurimismeetodi rakendamisele...

Enne andmete kogumist ja uurimist otsustavad eksperimentaalpsühholoogid tavaliselt, kuidas andmeid statistiliselt analüüsitakse. Sageli määrab uurija statistilise väärtusena määratletud olulisuse taseme kõrgemaks kui ( või madalam), mis sisaldab väärtusi, mis võimaldavad arvestada tegurite mõju mittejuhuslikult. Teadlased esindavad seda taset tavaliselt tõenäosusavaldise kujul.

Paljudes psühholoogilistes katsetes võib seda väljendada kui " tase 0,05" või " tase 0,01" See tähendab, et juhuslikud tulemused ilmnevad ainult sagedusega 0,05 (1 korda) või 0,01 (1 korda 100-st). Statistiliste andmete analüüsi tulemused, mis vastavad eelnevalt kehtestatud kriteeriumile ( olgu see siis 0,05, 0,01 või isegi 0,001), on allpool nimetatud statistiliselt olulisteks.

Tuleb märkida, et tulemus ei pruugi olla statistiliselt oluline, kuid siiski teatud huvi pakkuda. Sageli, eriti eeluuringutes või katsetes, milles osaleb väike arv katsealuseid või piiratud arvu vaatlusi, ei pruugi tulemused jõuda statistilise olulisuse tasemeni, kuid viitavad sellele, et edasistes uuringutes, täpsema kontrolli ja suurema arvu uuringutega. tähelepanekud, muutuvad need usaldusväärsemaks. Samas peab katsetaja olema väga ettevaatlik oma soovis katsetingimusi sihipäraselt muuta, et iga hinna eest soovitud tulemust saavutada.

Teises 2x2 plaani näites Ji kasutas kahte tüüpi aineid ja kahte tüüpi ülesandeid, et uurida eriteadmiste mõju teabe meeldejätmisele.

Tema uuringus Ji õppis numbrite ja malenuppude meeldejätmist ( muutuja A) lapsed toolidel RECARO Young Sport ja täiskasvanud ( muutuja B), ehk 2x2 plaani järgi. Lapsed olid 10-aastased ja osavad malet, täiskasvanud aga olid mängus uued. Esimeses ülesandes tuli meeles pidada nuppude asukohta laual, nagu see võib olla tavalise mängu ajal, ja taastada see pärast nuppude eemaldamist. Teine osa sellest ülesandest nõudis standardsete numbrite päheõppimist, nagu tavaliselt tehakse IQ määramisel.

Selgub, et eriteadmised, näiteks malemänguoskus, muudavad selle valdkonnaga seotud teabe meeldejätmise lihtsamaks, kuid ei avalda palju mõju numbrite meeldejätmisele. Täiskasvanud, kes pole iidse mängu keerukuses eriti kogenud, mäletavad vähem kujundeid, kuid suudavad paremini numbreid meelde jätta.

Aruande tekstis Ji pakub statistilist analüüsi, mis kinnitab esitatud tulemusi matemaatiliselt.

2x2 disain on kõigist faktoriaalsetest konstruktsioonidest lihtsaim. Tegurite arvu või üksikute tegurite tasemete suurendamine suurendab oluliselt nende plaanide keerukust.

Igas eksperimendi (uuringu) teaduslikus ja praktilises olukorras saavad teadlased uurida mitte kõiki inimesi (üldpopulatsiooni, populatsiooni), vaid ainult teatud valimit. Näiteks isegi kui me uurime suhteliselt väikest rühma inimesi, näiteks neid, kes põevad teatud haigust, on siiski väga ebatõenäoline, et meil on vastavad vahendid või vajadus iga patsiendi testimiseks. Selle asemel on tavaline testida valimit populatsioonist, kuna see on mugavam ja vähem aeganõudev. Kui jah, siis kuidas me teame, et valimi põhjal saadud tulemused esindavad kogu rühma? Või kui kasutada professionaalset terminoloogiat, kas võime olla kindlad, et meie uurimus kirjeldab tervikut õigesti elanikkonnast, proov, mida kasutasime?

Sellele küsimusele vastamiseks on vaja kindlaks määrata testitulemuste statistiline olulisus. Statistiline olulisus (Märkimisväärne tase, lühendatult allkiri), või /7-olulisuse tase (p-tase) - on tõenäosus, et antud tulemus esindab õigesti populatsiooni, millest uuringu valim võeti. Pange tähele, et see on ainult tõenäosus- on võimatu täiesti kindlalt väita, et antud uuring kirjeldab õigesti kogu populatsiooni. Parimal juhul saab olulisuse taseme põhjal järeldada, et see on väga tõenäoline. Seega tekib paratamatult järgmine küsimus: milline olulisuse tase peab olema enne, kui antud tulemust saab pidada populatsiooni õigeks iseloomustamiseks?

Näiteks millise tõenäosuse väärtusega olete nõus ütlema, et sellistest võimalustest piisab riski võtmiseks? Mis siis, kui koefitsient on 10 100-st või 50 100-st? Mis siis, kui see tõenäosus on suurem? Kuidas on koefitsientidega nagu 90 100-st, 95 100-st või 98 100-st? Riskiga seotud olukorra puhul on see valik üsna problemaatiline, kuna see sõltub inimese isikuomadustest.

Psühholoogias arvatakse traditsiooniliselt, et 95 või enam võimalus 100-st tähendab, et tulemuste õigsuse tõenäosus on piisavalt suur, et neid saaks üldistada kogu elanikkonnale. See näitaja loodi teadusliku ja praktilise tegevuse käigus - pole seadust, mille kohaselt tuleks see juhiseks valida (ja tõepoolest, teistes teadustes valitakse mõnikord ka muid olulisuse taseme väärtusi).

Psühholoogias kasutatakse seda tõenäosust mõnevõrra ebatavaliselt. Selle asemel, et tõenäosus, et valim esindab üldkogumit, on tõenäosus, et valim ei esinda elanikkonnast. Teisisõnu, see on tõenäosus, et vaadeldav seos või erinevused on juhuslikud, mitte populatsiooni omadus. Seega, selle asemel, et väita, et tõenäosus, et uuringu tulemused on õiged, on 95 100-st, väidavad psühholoogid, et tõenäosus, et tulemused on valed, on 5 100-st (tähendab 40 100-st, et tulemused on õiged). võimalus 60 100st nende ebaõigsuse kasuks). Tõenäosuse väärtust väljendatakse mõnikord protsentides, kuid sagedamini kirjutatakse see kümnendmurruna. Näiteks 10 võimalust 100-st väljendatakse kümnendmurruna 0,1; 5 100-st on kirjas 0,05; 1 100-st – 0,01. Selle salvestusvormi puhul on piirväärtus 0,05. Et tulemust saaks pidada õigeks, peab selle olulisuse tase olema allpool see arv (pidage meeles, et see on tõenäosus, et tulemus vale kirjeldab populatsiooni). Terminoloogiast kõrvale jätmiseks olgu lisatud, et “tulemuse ebaõige tõenäosus” (mida õigemini nimetatakse olulisuse tase) tähistatakse tavaliselt ladina tähega R. Katsetulemuste kirjeldused sisaldavad tavaliselt kokkuvõtvat avaldust, näiteks „tulemused olid usaldustasemel olulised (R(p) vähem kui 0,05 (st vähem kui 5%).

Seega olulisuse tase ( R) näitab tõenäosust, et tulemused Mitte esindavad elanikkonda. Traditsiooniliselt peetakse psühholoogias tulemusi usaldusväärselt üldist pilti kajastavaks, kui väärtus on R alla 0,05 (s.o 5%). See on aga vaid tõenäosuslik väide ja mitte sugugi tingimusteta garantii. Mõnel juhul ei pruugi see järeldus õige olla. Tegelikult saame arvutada, kui sageli see juhtuda võib, kui vaatame olulisuse taseme suurust. Olulisuse tasemel 0,05 on 5 korda 100-st tulemused tõenäoliselt valed. 11a esmapilgul tundub, et see pole väga levinud, aga kui järele mõelda, siis 5 võimalust 100-st on sama, mis 1 20-st. Ehk siis ühel juhul 20-st on tulemus vale. Sellised koefitsiendid ei tundu eriti soodsad ja teadlased peaksid pühendumise eest ettevaatlikud olema esimest tüüpi vead. See on vea nimi, mis ilmneb siis, kui teadlased arvavad, et on leidnud tõelisi tulemusi, kuid tegelikult pole nad seda leidnud. Vastupidine viga, mis seisneb selles, et teadlased arvavad, et nad pole tulemust leidnud, kuigi see tegelikult on, nimetatakse teist tüüpi vead.

Need vead tekivad seetõttu, et ei saa välistada võimalust, et teostatud statistiline analüüs. Vea tõenäosus sõltub tulemuste statistilise olulisuse tasemest. Oleme juba märkinud, et tulemuse õigeks lugemiseks peab olulisuse tase olema alla 0,05. Muidugi on mõned tulemused sellest madalamad ja pole harvad tulemused nii madalad kui 0,001 (väärtus 0,001 tähendab, et tõenäosus, et tulemused on valed, on 1:1000). Mida väiksem on p väärtus, seda tugevam on meie usaldus tulemuste õigsuses.

Tabelis 7.2 näitab olulisuse tasemete traditsioonilist tõlgendust statistilise järelduse võimaluse kohta ja seose (erinevuste) olemasolu käsitleva otsuse põhjendust.

Tabel 7.2

Psühholoogias kasutatav olulisuse tasemete traditsiooniline tõlgendamine

Praktilise uurimistöö kogemusele tuginedes on soovitatav: esimest ja teist tüüpi vigade võimalikult suureks vältimiseks tuleks oluliste järelduste tegemisel langetada otsuseid erinevuste (seoste) olemasolu kohta, keskendudes tasemele. R n märk.

Statistiline test(Statistiline test – see on vahend statistilise olulisuse taseme määramiseks. See on otsustav reegel, mis tagab tõese hüpoteesi aktsepteerimise ja vale hüpoteesi suure tõenäosusega tagasilükkamise.

Statistilised kriteeriumid tähistavad ka teatud arvu arvutamise meetodit ja arvu ennast. Kõiki kriteeriume kasutatakse ühel põhieesmärgil: määrata olulisuse tase andmed, mida nad analüüsivad (st tõenäosus, et andmed peegeldavad tõelist efekti, mis esindab õigesti üldkogumit, millest valim on koostatud).

Mõnda testi saab kasutada ainult normaalselt jaotatud andmete jaoks (ja kui tunnust mõõdetakse intervallskaalal) – neid teste nimetatakse tavaliselt nn. parameetriline. Teiste kriteeriumide abil saate andmeid analüüsida peaaegu iga jaotusseadusega - neid nimetatakse mitteparameetriline.

Parameetrilised kriteeriumid on kriteeriumid, mis sisaldavad arvutusvalemis jaotusparameetreid, s.t. keskmised ja dispersioonid (õpilase t-test, Fisheri F-test jne).

Mitteparameetrilised kriteeriumid on kriteeriumid, mis ei sisalda jaotusparameetreid jaotusparameetrite arvutamise valemis ja põhinevad töötamisel sageduste või auastmetega (kriteerium K Rosenbaumi kriteerium U Manna - Whitney

Näiteks kui me ütleme, et erinevuste olulisus määrati Studenti t-testiga, siis peame silmas seda, et empiirilise väärtuse arvutamiseks kasutati Studenti t-testi meetodit, mida seejärel võrreldakse tabelina esitatud (kriitilise) väärtusega.

Empiiriliste (meie poolt arvutatud) ja kriteeriumi kriitiliste väärtuste (tabelina) suhte järgi saame hinnata, kas meie hüpotees on kinnitatud või ümber lükatud. Enamasti on selleks, et saaksime erinevusi olulisteks tunnistada, et kriteeriumi empiiriline väärtus ületaks kriitilist väärtust, kuigi on olemas kriteeriumid (näiteks Mann-Whitney test või märgitest). peame järgima vastupidist reeglit.

Mõnel juhul sisaldab kriteeriumi arvutusvalem uuritavas valimis vaatluste arvu, mida tähistatakse kui P. Spetsiaalse tabeli abil määrame, millisele erinevuste statistilise olulisuse tasemele antud empiiriline väärtus vastab. Enamasti võib sama kriteeriumi empiiriline väärtus olla oluline või ebaoluline olenevalt vaatluste arvust uuritavas valimis ( P ) või nn vabadusastmete arv , mis on tähistatud kui v (g>) või kuidas df (Mõnikord d).

Teades P või vabadusastmete arvu, saame määrata spetsiaalsete tabelite abil (peamised on toodud lisas 5) kriitilised väärtused kriteeriumid ja võrrelda saadud empiirilist väärtust nendega. Tavaliselt kirjutatakse see nii: “millal n = Kriteeriumi 22 kriitilist väärtust on t St = 2.07" või "at v (d) = 2 Studenti testi kriitilist väärtust on = 4,30” jne.

Tavaliselt eelistatakse ikkagi parameetrilisi kriteeriume ja me järgime seda seisukohta. Neid peetakse usaldusväärsemaks ja need võivad anda rohkem teavet ja sügavamat analüüsi. Seoses raskusega matemaatilised arvutused, siis kasutamisel arvutiprogrammid see raskus kaob (kuid mõned teised tunduvad siiski üsna ületatavad).

  • Selles õpikus me statistika probleemi üksikasjalikult ei käsitle
  • hüpoteesid (null - R0 ja alternatiiv - Hj) ja aktsepteeritud statistilised lahendused, kuna psühholoogiatudengid õpivad seda eraldi distsipliinis "Psühholoogia matemaatilised meetodid". Lisaks tuleb märkida, et registreerimisel uurimistöö aruanne(kursusetöö või lõputöö, publikatsioonid) statistilisi hüpoteese ja statistilisi lahendusi reeglina ei esitata. Tavaliselt on tulemuste kirjeldamisel märgitud kriteerium ja vajalik kirjeldav statistika(keskmised, sigma, korrelatsioonikoefitsiendid jne), kriteeriumide empiirilised väärtused, vabadusastmed ja tingimata p-olulisuse tase. Seejärel sõnastatakse testitava hüpoteesi kohta sisukas järeldus, mis näitab (tavaliselt ebavõrdsuse kujul) saavutatud või saavutamata olulisuse taset.