Hvad betyder udtrykket, at grupperne er statistisk signifikant forskellige. Statistisk signifikans: definition, begreb, signifikans, regressionsligninger og hypotesetestning

I tabellerne over resultater af statistiske beregninger i kurser, diplom- og kandidatafhandlinger i psykologi er indikatoren "p" altid til stede.

F.eks. iflg forskningsmål Forskelle i niveauet af meningsfuldhed i livet blandt teenagedrenge og -piger blev beregnet.

Gennemsnits værdi

Mann-Whitney U-test

Statistisk signifikansniveau (p)

Drenge (20 personer)

Piger

(5 personer)

Mål

28,9

35,2

17,5

0,027*

Behandle

30,1

32,0

38,5

0,435

Resultat

25,2

29,0

29,5

0,164

Kontrolsted - "I"

20,3

23,6

0,067

Kontrolsted - "Livet"

30,4

33,8

27,5

0,126

Meningsfuldt liv

98,9

111,2

0,103

* - forskelle er statistisk signifikante (s0,05)

Højre kolonne viser værdien af ​​"p", og det er ud fra dens værdi, at man kan afgøre, om forskellene i fremtidens meningsfuldhed mellem drenge og piger er betydelige eller ej. Reglen er enkel:

  • Hvis niveauet af statistisk signifikans "p" er mindre end eller lig med 0,05, konkluderer vi, at forskellene er signifikante. I nedenstående tabel er forskellene mellem drenge og piger væsentlige i forhold til "mål"-indikatoren - meningsfuldhed i livet i fremtiden. For piger er denne indikator statistisk signifikant højere end for drenge.
  • Hvis niveauet af statistisk signifikans "p" er større end 0,05, konkluderes det, at forskellene ikke er signifikante. I nedenstående tabel er forskellene mellem drenge og piger ikke signifikante for alle andre indikatorer med undtagelse af den første.

Hvor kommer niveauet af statistisk signifikans "p" fra?

Niveauet af statistisk signifikans beregnes statistisk program sammen med beregningen statistisk kriterium. I disse programmer kan du også sætte en kritisk grænse for niveauet af statistisk signifikans, og de tilsvarende indikatorer vil blive fremhævet af programmet.

For eksempel, i STATISTICA-programmet, når du beregner korrelationer, kan du indstille "p"-grænsen, for eksempel 0,05, og alle statistisk signifikante sammenhænge vil blive fremhævet med rødt.

Hvis det statistiske kriterium beregnes manuelt, så bestemmes signifikansniveauet "p" ved at sammenligne værdien af ​​det resulterende kriterium med den kritiske værdi.

Hvad viser niveauet af statistisk signifikans "p"?

Alle statistiske beregninger er omtrentlige. Niveauet af denne tilnærmelse bestemmer "p". Signifikansniveauet skrives som decimaler, for eksempel 0,023 eller 0,965. Hvis vi gange dette tal med 100, får vi p-indikatoren i procent: 2,3% og 96,5%. Disse procenter afspejler sandsynligheden for, at vores antagelser om forholdet mellem for eksempel aggression og angst er forkerte.

Det er, korrelationskoefficient 0,58 mellem aggression og angst blev opnået ved et statistisk signifikansniveau på 0,05 eller en fejlsandsynlighed på 5 %. Hvad betyder det helt præcist?

Korrelationen, vi identificerede, betyder, at i vores prøve observeres følgende mønster: Jo højere aggressivitet, jo højere angst. Det vil sige, at hvis vi tager to teenagere, og den ene har højere angst end den anden, så kan vi, ved at vide om den positive sammenhæng, sige, at denne teenager også vil have højere aggressivitet. Men da alt i statistik er omtrentligt, indrømmer vi ved at angive dette, at vi kan tage fejl, og sandsynligheden for fejl er 5%. Det vil sige, at efter at have foretaget 20 sådanne sammenligninger i denne gruppe af unge, kan vi begå én fejl ved at forudsige graden af ​​aggressivitet, ved at kende angst.

Hvilket niveau af statistisk signifikans er bedre: 0,01 eller 0,05

Niveauet af statistisk signifikans afspejler sandsynligheden for fejl. Derfor er resultatet ved p=0,01 mere nøjagtigt end ved p=0,05.

I psykologisk forskning accepteret to tilladte niveauer statistisk signifikans af resultaterne:

p=0,01 - høj pålidelighed af resultatet sammenlignende analyse eller analyse af relationer;

p=0,05 - tilstrækkelig nøjagtighed.

Jeg håber, at denne artikel vil hjælpe dig med at skrive en psykologiopgave på egen hånd. Har du brug for hjælp, så kontakt os (alle former for arbejde inden for psykologi; statistiske beregninger).

Hvis du ikke handler, vil afdelingen ikke være til nogen nytte. (Shota Rustaveli)

Grundlæggende termer og begreber for medicinsk statistik

I denne artikel vil vi præsentere nogle Nøglekoncepter statistikker, der er relevante for medicinsk forskning. Vilkårene er beskrevet mere detaljeret i de relevante artikler.

Variation

Definition. Graden af ​​spredning af data (attributværdier) over værdiintervallet

Sandsynlighed

Definition. Sandsynlighed - graden af ​​mulighed for manifestationen af ​​noget bestemt begivenhed under visse forhold.

Eksempel. Lad os forklare definitionen af ​​udtrykket i sætningen "Sandsynlighed for genopretning ved brug lægemiddel Arimidex er 70 %." Hændelsen er "genopretning af patienten", tilstanden "patienten tager Arimidex", graden af ​​mulighed er 70% (groft sagt, ud af 100 personer, der tager Arimidex, bliver 70 raske).

Kumulativ sandsynlighed

Definition. Den kumulative sandsynlighed for at overleve på tidspunktet t er den samme som andelen af ​​patienter i live på det tidspunkt.

Eksempel. Hvis det siges, at den kumulative overlevelsessandsynlighed efter et femårigt behandlingsforløb er 0,7, så betyder det, at 70 % af den gruppe af patienter, der overvejes, forblev i live. oprindelige mængde, og 30 % døde. Med andre ord, ud af hver hundrede mennesker døde 30 inden for de første 5 år.

Tid før begivenhed

Definition. Tid før en hændelse er den tid, udtrykt i nogle enheder, der er gået fra et eller andet indledende tidspunkt, indtil en hændelse indtræffer.

Forklaring. Som tidsenheder i Medicinsk forskning dage, måneder og år vises.

Typiske eksempler indledende øjeblikke tid:

    begynde at overvåge patienten

    kirurgisk behandling

Typiske eksempler på de overvejede begivenheder:

    sygdomsprogression

    forekomst af tilbagefald

    patientens død

Prøve

Definition. Den del af en population opnået ved selektion.

På baggrund af resultaterne af stikprøveanalysen drages konklusioner om hele populationen, hvilket kun er gyldigt, hvis udvælgelsen var tilfældig. Da det er praktisk talt umuligt at udvælge tilfældigt fra en population, bør der tilstræbes, at stikprøven som minimum er repræsentativ for populationen.

Afhængige og uafhængige prøver

Definition. Prøver, hvor forsøgspersoner blev rekrutteret uafhængigt af hinanden. Alternativ uafhængige prøver- afhængige (forbundne, parrede) prøver.

Hypotese

To-sidede og ensidige hypoteser

Lad os først forklare brugen af ​​begrebet hypotese i statistik.

Formålet med de fleste undersøgelser er at teste sandheden af ​​et udsagn. Formålet med lægemiddeltestning er oftest at teste hypotesen om, at et lægemiddel er mere effektivt end et andet (f.eks. er Arimidex mere effektivt end Tamoxifen).

For at sikre stringens af undersøgelsen, udtrykkes erklæringen, der verificeres, matematisk. For eksempel, hvis A er antallet af år, som en patient, der tager Arimidex, vil leve, og T er det antal år, som en patient, der tager Tamoxifen, vil leve, så kan hypotesen, der testes, skrives som A>T.

Definition. En hypotese kaldes to-sidet, hvis den består i ligheden mellem to størrelser.

Et eksempel på en tosidet hypotese: A=T.

Definition. En hypotese kaldes ensidig (1-sidet), hvis den består i uligheden mellem to størrelser.

Eksempler på ensidige hypoteser:

Dikotome (binære) data

Definition. Data udtrykt ved kun to gyldige alternative værdier

Eksempel: Patienten er "rask" - "syg". Ødem "er" - "nej".

Konfidensinterval

Definition. Konfidensintervallet for en mængde er intervallet omkring værdien af ​​den mængde, hvori den sande værdi af denne mængde ligger (med et vist niveau tillid).

Eksempel. Lad den undersøgte mængde være antallet af patienter pr. år. I gennemsnit er deres antal 500, og 95% - konfidensinterval- (350, 900). Det betyder, at højst sandsynligt (med en sandsynlighed på 95%), mindst 350 og højst 900 personer vil kontakte klinikken i løbet af året.

Betegnelse. En meget almindeligt brugt forkortelse er: CI 95% er et konfidensinterval med et konfidensniveau på 95%.

Pålidelighed, statistisk signifikans (P - niveau)

Definition. Statistisk signifikans resultatet er et mål for tillid til dens "sandhed".

Enhver forskning udføres kun på basis af en del af genstandene. En undersøgelse af effektiviteten af ​​et lægemiddel udføres ikke på grundlag af alle patienter på planeten, men kun på en bestemt gruppe patienter (det er simpelthen umuligt at udføre en analyse på grundlag af alle patienter).

Lad os antage, at der som et resultat af analysen blev lavet en bestemt konklusion (for eksempel er brugen af ​​Arimidex som en passende terapi 2 gange mere effektiv end Tamoxifen).

Spørgsmålet, der skal stilles, er: "Hvor meget kan du stole på dette resultat?"

Forestil dig, at vi udførte en undersøgelse baseret på kun to patienter. Selvfølgelig skal resultaterne i dette tilfælde behandles med forsigtighed. Hvis et stort antal patienter blev undersøgt ( numerisk værdi « stor mængde"afhænger af situationen), så kan man allerede stole på de dragede konklusioner.

Så graden af ​​tillid bestemmes af p-niveauværdien (p-værdi).

Et højere p-niveau svarer til mere lavt niveau tillid til resultaterne opnået fra analysen af ​​prøven. For eksempel indikerer et p-niveau på 0,05 (5%), at konklusionen fra analysen af ​​en bestemt gruppe kun er et tilfældigt træk ved disse objekter med en sandsynlighed på kun 5%.

Med andre ord med meget høj sandsynlighed(95%) kan konklusionen udvides til alle objekter.

Mange undersøgelser betragter 5% som en acceptabel værdi på p-niveau. Det betyder, at hvis f.eks. p = 0,01, så kan man stole på resultaterne, men hvis p = 0,06, så kan man ikke.

Undersøgelse

Prospektiv undersøgelse er en undersøgelse, hvor prøver udvælges på basis af en initial faktor, og nogle resulterende faktor analyseres i prøverne.

Retrospektiv undersøgelse er en undersøgelse, hvor prøver udvælges på baggrund af en resulterende faktor, og en initial faktor analyseres i prøverne.

Eksempel. Den indledende faktor er en gravid kvinde yngre/over 20 år. Den resulterende faktor er, at barnet er lettere/tyngre end 2,5 kg. Vi analyserer, om barnets vægt afhænger af moderens alder.

Hvis vi rekrutterer 2 prøver, den ene med mødre under 20 år, den anden med mødre ældre, og derefter analyserer massen af ​​børn i hver gruppe, så er dette en prospektiv undersøgelse.

Hvis vi rekrutterer 2 prøver, i den ene - mødre, der fødte børn, der var lettere end 2,5 kg, i den anden - tungere, og derefter analyserer alderen på mødrene i hver gruppe, så er dette en retrospektiv undersøgelse (naturligvis sådan en undersøgelse kan først udføres, når forsøget er afsluttet, dvs. alle børn er født).

Exodus

Definition. Klinisk signifikant fænomen laboratorieværdi eller et træk, der tjener som et objekt af interesse for forskeren. Når der udføres kliniske forsøg, tjener resultaterne som kriterier for vurdering af effektiviteten af ​​en terapeutisk eller forebyggende intervention.

Klinisk epidemiologi

Definition. Videnskab, der gør det muligt at forudsige et bestemt udfald for hver specifik patient baseret på at studere det kliniske forløb af sygdommen i lignende tilfælde ved hjælp af strenge videnskabelige metoder at studere patienter for at sikre nøjagtighed af prognoser.

Kohorte

Definition. En gruppe af studiedeltagere forenet af nogle fællestræk på tidspunktet for dets dannelse og studeret hele vejen igennem lang periode tid.

Styring

Historisk kontrol

Definition. Kontrolgruppe, dannet og undersøgt i perioden forud for undersøgelsen.

Parallel kontrol

Definition. En kontrolgruppe blev dannet samtidig med dannelsen af ​​hovedgruppen.

Korrelation

Definition. Statistisk sammenhæng mellem to karakteristika (kvantitativ eller ordinær), der viser det højere værdi En karakteristik i en bestemt del af tilfældene svarer til en større værdi - i tilfælde af en positiv (direkte) korrelation - værdien af ​​en anden karakteristik, eller en mindre værdi - i tilfælde af en negativ (invers) korrelation.

Eksempel. Der blev fundet en signifikant sammenhæng mellem niveauet af blodplader og leukocytter i patientens blod. Korrelationskoefficienten er 0,76.

Risikokoefficient (RR)

Definition. Risikoforholdet er forholdet mellem sandsynligheden for forekomsten af ​​en (“dårlig”) begivenhed for den første gruppe af objekter og sandsynligheden for forekomsten af ​​den samme begivenhed for den anden gruppe af objekter.

Eksempel. Hvis sandsynligheden for at udvikle lungekræft hos ikke-rygere er 20%, og hos rygere - 100%, så vil CR være lig med en femtedel. I dette eksempel er den første gruppe af objekter ikke-rygere, den anden gruppe er rygere, og forekomsten af ​​lungekræft betragtes som en "dårlig" begivenhed.

Det er tydeligt at:

1) hvis KR = 1, så er sandsynligheden for, at en hændelse sker i grupper, den samme

2) hvis KP>1, så forekommer hændelsen oftere med objekter fra den første gruppe end fra den anden

3) hvis KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analyse

Definition. MED statistisk analyse, der opsummerer resultaterne af flere undersøgelser, der undersøger det samme problem (normalt effektiviteten af ​​behandling, forebyggelse, diagnostiske metoder). Pooling af undersøgelser giver en større stikprøve til analyse og større statistisk kraft for de kombinerede undersøgelser. Bruges til at øge evidensen eller tilliden til en konklusion om effektiviteten af ​​den undersøgte metode.

Kaplan-Meier metode (Kaplan-Meier multiplikator estimater)

Denne metode blev opfundet af statistikerne E.L. Kaplan og Paul Meyer.

Metoden bruges til at beregne forskellige mængder forbundet med observationstiden for en patient. Eksempler på sådanne mængder:

    sandsynlighed for helbredelse inden for et år ved brug af lægemidlet

    chance for tilbagefald efter operationen inden for tre år efter operationen

    kumulativ sandsynlighed for overlevelse efter fem år blandt patienter med prostatacancer efter organamputation

Lad os forklare fordelene ved at bruge Kaplan-Meier-metoden.

Værdierne af værdierne i "konventionel" analyse (ikke ved hjælp af Kaplan-Meier-metoden) beregnes ud fra opdeling af det undersøgte tidsinterval i intervaller.

For eksempel, hvis vi studerer sandsynligheden for en patients død inden for 5 år, så kan tidsintervallet opdeles i 5 dele (mindre end 1 år, 1-2 år, 2-3 år, 3-4 år, 4- 5 år), så og i 10 (seks måneder hver), eller i et andet antal intervaller. Resultaterne for forskellige partitioner vil være forskellige.

At vælge den mest passende partition er ikke en let opgave.

Estimater af værdier opnået ved hjælp af Kaplan-Meier metoden afhænger ikke af opdelingen af ​​observationstiden i intervaller, men afhænger kun af levetiden for hver enkelt patient.

Derfor er det nemmere for forskeren at udføre analysen, og resultaterne er ofte bedre end resultaterne af "konventionel" analyse.

Kaplan - Meier-kurven er en graf over overlevelseskurven opnået ved hjælp af Kaplan-Meier-metoden.

Cox model

Denne model blev opfundet af Sir David Roxby Cox (f. 1924), en berømt engelsk statistiker, forfatter til mere end 300 artikler og bøger.

Cox-modellen bruges i situationer, hvor de undersøgte mængder i overlevelsesanalysen afhænger af tidens funktioner. For eksempel kan sandsynligheden for tilbagefald efter t år (t=1,2,...) afhænge af logaritmen af ​​tidslog(t).

En vigtig fordel ved metoden foreslået af Cox er anvendeligheden af ​​denne metode i et stort antal situationer (modellen pålægger ikke strenge begrænsninger på arten eller formen af ​​sandsynlighedsfordelingen).

Med udgangspunkt i Cox-modellen kan der udføres en analyse (kaldet Cox-analyse), hvis resultat er værdien af ​​risikokoefficienten og konfidensintervallet for risikokoefficienten.

Ikke-parametriske statistiske metoder

Definition. En klasse af statistiske metoder, der primært bruges til analyse af kvantitative data, der ikke danner en normalfordeling, samt til analyse af kvalitative data.

Eksempel. For at identificere betydningen af ​​forskelle i det systoliske tryk hos patienter afhængigt af typen af ​​behandling, vil vi bruge den ikke-parametriske Mann-Whitney test.

Tegn (variabel)

Definition. x karakteristika ved undersøgelsesobjektet (observation). Der er kvalitative og kvantitative egenskaber.

Randomisering

Definition. En metode til tilfældig fordeling af forskningsobjekter i hoved- og kontrolgrupperne ved hjælp af specielle midler (tabeller eller tilfældigt taltæller, møntkast og andre metoder til tilfældigt at tildele et gruppenummer til en inkluderet observation). Randomisering minimerer forskelle mellem grupper på kendte og ukendte karakteristika, der potentielt har indflydelse på det udfald, der undersøges.

Risiko

Attributiv- yderligere risiko for et ugunstigt resultat (for eksempel sygdom) på grund af tilstedeværelsen af ​​en bestemt karakteristik (risikofaktor) i emnet for undersøgelsen. Dette er den del af risikoen for at udvikle en sygdom, der er forbundet med, forklaret af og kan elimineres, hvis risikofaktoren elimineres.

Relativ risiko- forholdet mellem risikoen for en ugunstig tilstand i en gruppe og risikoen for denne tilstand i en anden gruppe. Anvendes i prospektive og observationsstudier, når grupper er dannet på forhånd, og forekomsten af ​​den tilstand, der undersøges, endnu ikke er indtruffet.

Rullende eksamen

Definition. En metode til at kontrollere stabiliteten, reliabiliteten, ydeevnen (validiteten) af en statistisk model ved sekventielt at fjerne observationer og genberegne modellen. Jo mere ens de resulterende modeller er, jo mere stabil og pålidelig er modellen.

Begivenhed

Definition. Det kliniske resultat observeret i undersøgelsen, såsom forekomsten af ​​en komplikation, tilbagefald, bedring eller død.

Stratificering

Definition. M en stikprøveteknik, hvor populationen af ​​alle deltagere, der opfylder inklusionskriterierne for en undersøgelse, først opdeles i grupper (strata) baseret på en eller flere karakteristika (normalt køn, alder), der potentielt har indflydelse på resultatet af interessen, og derefter fra hver af disse grupper (stratum) deltagere rekrutteres uafhængigt i forsøgs- og kontrolgrupperne. Dette giver forskeren mulighed for at balancere vigtige egenskaber mellem forsøgs- og kontrolgruppen.

Beredskabstabel

Definition. En tabel med absolutte frekvenser (antal) af observationer, hvis kolonner svarer til værdierne af en karakteristik, og rækkerne - til værdierne af en anden karakteristik (i tilfælde af en todimensionel beredskabstabel). Absolutte frekvensværdier er placeret i celler i skæringspunktet mellem rækker og kolonner.

Lad os give et eksempel på en beredskabstabel. Aneurismeoperation blev udført hos 194 patienter. Sværhedsgraden af ​​ødemet hos patienter før operation er kendt.

Ødem\ Udfald

ingen hævelse 20 6 26
moderat hævelse 27 15 42
udtalt ødem 8 21 29
m j 55 42 194

Ud af 26 patienter uden ødem overlevede 20 patienter således efter operationen, og 6 patienter døde. Af de 42 patienter med moderat ødem overlevede 27 patienter, 15 døde osv.

Chi-kvadrattest til beredskabstabeller

For at bestemme betydningen (reliabiliteten) af forskelle i et tegn afhængigt af et andet (for eksempel resultatet af en operation afhængigt af sværhedsgraden af ​​ødemet), bruges chi-square-testen til kontingenstabeller:


Chance

Lad sandsynligheden for en begivenhed være lig med p. Så er sandsynligheden for, at hændelsen ikke indtræffer, 1-p.

For eksempel, hvis sandsynligheden for, at en patient forbliver i live efter fem år er 0,8 (80 %), så er sandsynligheden for, at han dør i løbet af denne periode, 0,2 (20 %).

Definition. Chance er forholdet mellem sandsynligheden for, at en begivenhed vil indtræffe, og sandsynligheden for, at begivenheden ikke indtræffer.

Eksempel. I vores eksempel (om en patient) er chancen 4, da 0,8/0,2=4

Således er sandsynligheden for genopretning 4 gange mere sandsynligt af døden.

Fortolkning af værdien af ​​en mængde.

1) Hvis Chance=1, så er sandsynligheden for, at en begivenhed indtræffer, lig med sandsynligheden for, at begivenheden ikke indtræffer;

2) hvis Chance >1, så er sandsynligheden for, at begivenheden indtræffer, større end sandsynligheden for, at begivenheden ikke indtræffer;

3) hvis Chance<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Oddsforhold

Definition. Oddsforholdet er oddsforholdet for den første gruppe af objekter til oddsforholdet for den anden gruppe af objekter.

Eksempel. Lad os antage, at både mænd og kvinder gennemgår en vis behandling.

Sandsynligheden for, at en mandlig patient forbliver i live efter fem år er 0,6 (60 %); sandsynligheden for, at han dør i denne periode er 0,4 (40%).

Lignende sandsynligheder for kvinder er 0,8 og 0,2.

Oddsforholdet i dette eksempel er

Fortolkning af værdien af ​​en mængde.

1) Hvis oddsforholdet = 1, så er chancen for den første gruppe lig med chancen for den anden gruppe

2) Hvis odds ratio er >1, så er chancen for den første gruppe mere chance for den anden gruppe

3) Hvis odds ratio<1, то шанс для первой группы меньше шанса для второй группы

STATISTISK PÅLIDELIGHED

- engelsk troværdighed/validitet, statistisk; tysk Validitat, statistisk. Konsistens, objektivitet og manglende tvetydighed i en statistisk test eller i en q.l. sæt af målinger. D. s. kan testes ved at gentage den samme test (eller spørgeskema) om det samme emne for at se, om de samme resultater opnås; eller ved at sammenligne forskellige dele af en test, der formodes at måle det samme objekt.

Antinazi. Encyclopedia of Sociology, 2009

Se, hvad "STATISTISK PÅLIDELIGHED" er i andre ordbøger:

    STATISTISK PÅLIDELIGHED- Engelsk troværdighed/validitet, statistisk; tysk Validitat, statistisk. Konsistens, objektivitet og manglende tvetydighed i en statistisk test eller i en q.l. sæt af målinger. D. s. kan verificeres ved at gentage den samme test (eller... Forklarende sociologiordbog

    I statistik kaldes en værdi statistisk signifikant, hvis sandsynligheden for, at den opstår ved en tilfældighed eller endnu mere ekstreme værdier er lav. Her mener vi med ekstrem grad af afvigelsen af ​​teststatistikken fra nulhypotesen. Forskellen hedder... ...Wikipedia

    Det fysiske fænomen med statistisk stabilitet er, at når stikprøvestørrelsen øges, tenderer hyppigheden af ​​en tilfældig hændelse eller gennemsnitsværdien af ​​en fysisk størrelse til et bestemt fast tal. Fænomenet statistisk... ... Wikipedia

    PÅLIDELIGHED AF FORSKELLE (ligheder)- analytisk statistisk procedure til at bestemme signifikansniveauet af forskelle eller ligheder mellem prøver i henhold til de undersøgte indikatorer (variabler) ... Moderne uddannelsesproces: grundlæggende begreber og termer

    RAPPORTERING, STATISTISK Stor regnskabsordbog

    RAPPORTERING, STATISTISK- en form for statslig statistisk observation, hvor de relevante organer fra virksomheder (organisationer og institutioner) modtager de oplysninger, de har brug for i form af lovligt etablerede rapporteringsdokumenter (statistiske rapporter) for... Stor økonomisk ordbog

    En videnskab, der studerer metoder til systematisk observation af massefænomener i menneskets sociale liv, kompilering af numeriske beskrivelser af dem og videnskabelig bearbejdning af disse beskrivelser. Således er teoretisk statistik en videnskab... ... Encyklopædisk ordbog F.A. Brockhaus og I.A. Ephron

    Korrelationskoefficient- (Korrelationskoefficient) Korrelationskoefficienten er en statistisk indikator for afhængigheden af ​​to stokastiske variable Definition af korrelationskoefficienten, typer af korrelationskoefficienter, egenskaber af korrelationskoefficienten, beregning og anvendelse... ... Investor Encyclopedia

    Statistikker- (Statistik) Statistik er en generel teoretisk videnskab, der studerer kvantitative ændringer i fænomener og processer. Statsstatistikker, statistiske tjenester, Rosstat (Goskomstat), statistiske data, forespørgselsstatistik, salgsstatistik,... ... Investor Encyclopedia

    Korrelation- (Korrelation) Korrelation er et statistisk forhold mellem to eller flere tilfældige variable. Begrebet korrelation, typer af korrelation, korrelationskoefficient, korrelationsanalyse, priskorrelation, korrelation af valutapar på Forex Contents... ... Investor Encyclopedia

Bøger

  • Forskning i matematik og matematik i forskning: Metodologisk indsamling om studerendes forskningsaktiviteter, Borzenko V.I.. Samlingen præsenterer metodiske udviklinger, der kan anvendes til at organisere studerendes forskningsaktiviteter. Den første del af samlingen er afsat til anvendelsen af ​​en forskningstilgang i...

Før de indsamler og studerer data, beslutter eksperimentelle psykologer typisk, hvordan dataene skal analyseres statistisk. Ofte sætter forskeren signifikansniveauet, defineret som en statistisk værdi, højere end ( eller lavere) som indeholder værdier, der giver os mulighed for at overveje indflydelsen af ​​faktorer, der ikke er tilfældige. Forskere repræsenterer normalt dette niveau i form af et sandsynlighedsudtryk.

I mange psykologiske eksperimenter kan det udtrykkes som " niveau 0,05"eller" niveau 0,01" Det betyder, at tilfældige resultater kun vil forekomme med hyppighed 0,05 (1 af gangene) eller 0,01 (1 ud af 100 gange). Resultater af statistisk dataanalyse, der opfylder et på forhånd fastlagt kriterium ( det være sig 0,05, 0,01 eller endda 0,001), omtales nedenfor som statistisk signifikante.

Det skal bemærkes, at resultatet måske ikke er statistisk signifikant, men stadig har en vis interesse. Ofte, især i forundersøgelser eller eksperimenter, der involverer et lille antal forsøgspersoner eller med et begrænset antal observationer, når resultaterne muligvis ikke op på niveauet for statistisk signifikans, men tyder på, at i yderligere undersøgelser med mere præcis kontrol og med et større antal observationer, vil de blive mere pålidelige. Samtidig skal forsøgslederen være meget omhyggelig i sit ønske om målrettet at ændre de eksperimentelle forhold for at opnå det ønskede resultat for enhver pris.

I et andet eksempel på en 2x2 plan Ji brugt to typer emner og to typer opgaver til at studere specialvidens indflydelse på memorering af information.

I sit arbejdsværelse Ji studerede at huske tal og skakbrikker ( variabel A) børn i stole RECARO Young Sport og voksne ( variabel B), altså ifølge 2x2 planen. Børnene var 10 år og gode til skak, mens de voksne var nye i spillet. I den første opgave skulle man huske brikkernes placering på brættet, som det kunne være under et normalt spil, og gendanne det, efter at brikkerne var fjernet. En anden del af denne opgave krævede at huske en standardserie af tal, som det normalt gøres ved bestemmelse af IQ.

Det viser sig, at specialiseret viden, såsom at vide, hvordan man spiller skak, gør det lettere at huske information, der er relevant for dette område, men ikke har den store effekt på at huske tal. Voksne, der ikke er særlig erfarne i det gamle spils forviklinger, husker færre figurer, men har større succes med at huske tal.

I rapportens tekst Ji giver statistisk analyse, der matematisk validerer de præsenterede resultater.

2x2-designet er det enkleste af alle faktorielle designs. At øge antallet af faktorer eller niveauer af individuelle faktorer i høj grad øger kompleksiteten af ​​disse planer.

I enhver videnskabelig og praktisk situation for et eksperiment (undersøgelse) kan forskere studere ikke alle mennesker (generel befolkning, befolkning), men kun en bestemt prøve. For eksempel, selvom vi studerer en relativt lille gruppe mennesker, såsom dem, der lider af en bestemt sygdom, er det stadig meget usandsynligt, at vi har de passende ressourcer eller behovet for at teste hver patient. I stedet er det almindeligt at teste en prøve fra befolkningen, fordi det er mere bekvemt og mindre tidskrævende. Hvis ja, hvordan ved vi, at resultaterne fra stikprøven er repræsentative for hele gruppen? Eller, for at bruge faglig terminologi, kan vi være sikre på, at vores forskning korrekt beskriver det hele befolkning, prøven vi brugte?

For at besvare dette spørgsmål er det nødvendigt at bestemme den statistiske signifikans af testresultaterne. Statistisk signifikans (Betydende niveau, forkortet Sig.), eller /7-signifikansniveau (p-niveau) - er sandsynligheden for, at et givet resultat korrekt repræsenterer den population, hvorfra undersøgelsen blev udtaget. Bemærk, at dette kun er sandsynlighed- det er umuligt at sige med absolut sikkerhed, at en given undersøgelse korrekt beskriver hele befolkningen. I bedste fald kan signifikansniveauet kun konkludere, at dette er meget sandsynligt. Det næste spørgsmål melder sig derfor uundgåeligt: ​​hvilket signifikansniveau skal være, før et givet resultat kan betragtes som en korrekt karakterisering af befolkningen?

For eksempel, med hvilken sandsynlighedsværdi er du villig til at sige, at sådanne chancer er nok til at tage en risiko? Hvad hvis oddset er 10 ud af 100 eller 50 ud af 100? Hvad hvis denne sandsynlighed er højere? Hvad med odds som 90 ud af 100, 95 ud af 100 eller 98 ud af 100? For en situation, der involverer risiko, er dette valg ret problematisk, fordi det afhænger af personens personlige karakteristika.

Inden for psykologi tror man traditionelt på, at en chance på 95 eller mere ud af 100 betyder, at sandsynligheden for, at resultaterne er korrekte, er høj nok til, at de kan generaliseres til hele befolkningen. Denne figur blev etableret i processen med videnskabelig og praktisk aktivitet - der er ingen lov, ifølge hvilken den skal vælges som rettesnor (og faktisk i andre videnskaber vælges nogle gange andre værdier af betydningsniveauet).

I psykologien opereres denne sandsynlighed på en noget usædvanlig måde. I stedet for sandsynligheden for, at stikprøven repræsenterer populationen, er sandsynligheden for, at stikprøven repræsenterer ikke befolkning. Det er med andre ord sandsynligheden for, at den observerede sammenhæng eller forskelle er tilfældige og ikke en egenskab ved populationen. Så i stedet for at sige, at der er en 95 ud af 100 chance for, at resultaterne af en undersøgelse er korrekte, siger psykologer, at der er en 5 ud af 100 chance for, at resultaterne er forkerte (ligesom en 40 ud af 100 chance for, at resultaterne er korrekte betyder en 60 ud af 100 chance til fordel for deres ukorrekthed). Sandsynlighedsværdien udtrykkes nogle gange som en procentdel, men oftere skrives den som en decimalbrøk. For eksempel er 10 chancer ud af 100 udtrykt som en decimalbrøk på 0,1; 5 ud af 100 skrives som 0,05; 1 ud af 100 - 0,01. Ved denne form for optagelse er grænseværdien 0,05. For at et resultat kan betragtes som korrekt, skal dets signifikansniveau være under dette tal (husk, dette er sandsynligheden for, at resultatet forkert beskriver befolkningen). For at få terminologien af ​​vejen, lad os tilføje, at "sandsynligheden for, at resultatet er forkert" (som mere korrekt kaldes betydningsniveau) normalt betegnet med et latinsk bogstav R. Beskrivelser af eksperimentelle resultater inkluderer normalt en opsummerende udtalelse, såsom "resultaterne var signifikante på konfidensniveauet (R(p) mindre end 0,05 (dvs. mindre end 5%).

Således er signifikansniveauet ( R) angiver sandsynligheden for, at resultaterne Ikke repræsentere befolkningen. Traditionelt i psykologi anses resultater for pålideligt at afspejle det samlede billede, hvis værdien R mindre end 0,05 (dvs. 5%). Dette er dog kun en sandsynlighedserklæring, og slet ikke en ubetinget garanti. I nogle tilfælde er denne konklusion muligvis ikke korrekt. Faktisk kan vi beregne, hvor ofte dette kan ske, hvis vi ser på størrelsen af ​​signifikansniveauet. Ved et signifikansniveau på 0,05 vil 5 ud af 100 gange sandsynligvis være forkerte. 11a ved første øjekast ser det ud til, at dette ikke er særlig almindeligt, men hvis du tænker over det, så er 5 chancer ud af 100 det samme som 1 ud af 20. Med andre ord, i et ud af hver 20 tilfælde vil resultatet være ukorrekt. Sådanne odds virker ikke særligt gunstige, og forskere skal passe på med at begå sig fejl af den første type. Dette er navnet på den fejl, der opstår, når forskere tror, ​​de har fundet rigtige resultater, men det har de faktisk ikke. Den modsatte fejl, som består i, at forskere tror, ​​at de ikke har fundet et resultat, mens der faktisk er et, kaldes fejl af den anden type.

Disse fejl opstår, fordi muligheden for, at den udførte statistiske analyse ikke kan udelukkes. Sandsynligheden for fejl afhænger af niveauet af statistisk signifikans af resultaterne. Vi har allerede bemærket, at for at et resultat kan anses for korrekt, skal signifikansniveauet være under 0,05. Selvfølgelig er nogle resultater lavere end det, og det er ikke ualmindeligt at se resultater så lave som 0,001 (en værdi på 0,001 betyder, at der er en 1 ud af 1000 chance for, at resultaterne er forkerte). Jo mindre p-værdien er, jo stærkere er vores tillid til resultaternes rigtighed.

I tabel 7.2 viser den traditionelle fortolkning af signifikansniveauer om muligheden for statistisk inferens og begrundelsen for beslutningen om tilstedeværelsen af ​​en sammenhæng (forskelle).

Tabel 7.2

Traditionel fortolkning af betydningsniveauer brugt i psykologi

Baseret på erfaringerne fra praktisk forskning anbefales det: for så vidt muligt at undgå fejl af den første og anden type, når der drages vigtige konklusioner, bør der træffes beslutninger om tilstedeværelsen af ​​forskelle (forbindelser), med fokus på niveauet R n tegn.

Statistisk test(Statistisk test - det er et værktøj til at bestemme niveauet af statistisk signifikans. Dette er en afgørende regel, der sikrer, at en sand hypotese accepteres, og en falsk hypotese afvises med stor sandsynlighed.

Statistiske kriterier angiver også metoden til at beregne et bestemt tal og selve tallet. Alle kriterier bruges med ét hovedformål: at bestemme betydningsniveau de data, de analyserer (dvs. sandsynligheden for, at dataene afspejler en sand effekt, der korrekt repræsenterer den population, som stikprøven er trukket fra).

Nogle test kan kun bruges til normalfordelte data (og hvis egenskaben måles på en intervalskala) - disse tests kaldes normalt parametrisk. Ved hjælp af andre kriterier kan du analysere data med næsten enhver distributionslov - de kaldes ikke-parametrisk.

Parametriske kriterier er kriterier, der medtager fordelingsparametre i beregningsformlen, dvs. midler og varianser (Elevs t-test, Fishers F-test osv.).

Ikke-parametriske kriterier er kriterier, der ikke inkluderer fordelingsparametre i formlen til beregning af fordelingsparametre og er baseret på drift med frekvenser eller ranger (kriterium Q Rosenbaum kriterium U Manna - Whitney

Når vi for eksempel siger, at betydningen af ​​forskellene blev bestemt af Elevens t-test, mener vi, at Elevens t-testmetode blev brugt til at beregne den empiriske værdi, som så sammenlignes med den tabulerede (kritiske) værdi.

Ved forholdet mellem de empiriske (udregnet af os) og kritiske værdier af kriteriet (tabel) kan vi bedømme, om vores hypotese er bekræftet eller afkræftet. I de fleste tilfælde, for at vi kan anerkende forskellene som signifikante, er det nødvendigt, at den empiriske værdi af kriteriet overstiger den kritiske værdi, selvom der er kriterier (f.eks. Mann-Whitney-testen eller fortegnstesten), hvori vi skal overholde den modsatte regel.

I nogle tilfælde inkluderer beregningsformlen for kriteriet antallet af observationer i den prøve, der undersøges, angivet som P. Ved hjælp af en speciel tabel bestemmer vi, hvilket niveau af statistisk signifikans af forskelle en given empirisk værdi svarer til. I de fleste tilfælde kan den samme empiriske værdi af kriteriet være signifikant eller ubetydelig afhængig af antallet af observationer i prøven, der undersøges ( P ) eller fra den såkaldte antal frihedsgrader , som er betegnet som v (g>) eller hvordan df (Sommetider d).

At vide P eller antallet af frihedsgrader, kan vi bestemme ved hjælp af specielle tabeller (de vigtigste er angivet i bilag 5) kritiske værdier kriterier og sammenligne den opnåede empiriske værdi med dem. Dette skrives normalt sådan: "hvornår n = 22 kritiske værdier af kriteriet er t St = 2.07" eller "kl v (d) = 2 kritiske værdier for den studerendes test er = 4,30", osv.

Typisk foretrækkes stadig parametriske kriterier, og vi overholder denne holdning. De anses for at være mere pålidelige og kan give mere information og dybere analyser. Angående sværhedsgrad matematiske beregninger, derefter ved brug computerprogrammer denne vanskelighed forsvinder (men nogle andre synes dog ret overkommelige).

  • I denne lærebog behandler vi ikke i detaljer problemet med statistisk
  • hypoteser (nul - R0 og alternativ - Hj) og accepteret statistiske løsninger, da psykologistuderende studerer dette separat i disciplinen "Matematiske metoder i psykologi." Derudover skal det bemærkes, at ved tilmelding forskningsrapport(kursus eller afhandling, publikationer) statistiske hypoteser og statistiske løsninger er som regel ikke givet. Normalt, når resultaterne beskrives, er et kriterium angivet og det nødvendige beskrivende statistik(midler, sigma, korrelationskoefficienter osv.), empiriske værdier af kriterier, frihedsgrader og nødvendigvis p-signifikansniveau. Derefter formuleres en meningsfuld konklusion vedrørende den hypotese, der testes, som angiver (normalt i form af en ulighed) det opnåede eller ikke opnåede signifikansniveau.