Konfidensintervalstatistik. Kvantitative analysemetoder: Estimering af konfidensintervaller

I de foregående underafsnit overvejede vi spørgsmålet om at estimere en ukendt parameter ENét nummer. Dette kaldes et "punkt"-estimat. I en række opgaver skal du ikke kun finde efter parameteren EN passende numerisk værdi, men også for at evaluere dens nøjagtighed og pålidelighed. Du skal vide, hvad fejl udskiftning af en parameter kan føre til EN dets punktestimat EN og med hvilken grad af sikkerhed kan vi forvente, at disse fejl ikke vil overskride kendte grænser?

Problemer af denne art er især relevante med et lille antal observationer, når punktoverslaget og i er stort set tilfældig og omtrentlig udskiftning af a med a kan føre til alvorlige fejl.

For at give en idé om nøjagtigheden og pålideligheden af ​​estimatet EN,

I matematisk statistik bruges såkaldte konfidensintervaller og konfidenssandsynligheder.

Lad for parameteren EN uvildigt skøn opnået ud fra erfaring EN. Vi ønsker at vurdere den mulige fejl i dette tilfælde. Lad os tildele en tilstrækkelig stor sandsynlighed p (for eksempel p = 0,9, 0,95 eller 0,99), således at en hændelse med sandsynlighed p kan betragtes som praktisk talt pålidelig, og finde en værdi s, for hvilken

Derefter rækken af ​​praktisk mulige værdier af fejlen, der opstår under udskiftningen ENEN, vil være ± s; Store fejl i den absolutte værdi vil kun forekomme med en lav sandsynlighed a = 1 - p. Lad os omskrive (14.3.1) som:

Lighed (14.3.2) betyder, at med sandsynlighed p den ukendte værdi af parameteren EN falder ind i intervallet

Det er nødvendigt at bemærke én omstændighed. Tidligere har vi gentagne gange overvejet sandsynligheden for, at en stokastisk variabel falder ind i et givet ikke-tilfældigt interval. Her er situationen en anden: størrelsen EN er ikke tilfældigt, men intervallet / p er tilfældigt. Dens position på x-aksen er tilfældig, bestemt af dens centrum EN; Generelt er længden af ​​intervallet 2s også tilfældig, da værdien af ​​s som regel beregnes ud fra eksperimentelle data. Derfor ville det i dette tilfælde være bedre at fortolke p-værdien ikke som sandsynligheden for at "ramme" punktet EN i intervallet / p, og som sandsynligheden for, at et tilfældigt interval / p vil dække punktet EN(Fig. 14.3.1).

Ris. 14.3.1

Sandsynligheden p kaldes normalt tillidssandsynlighed, og interval / p - konfidensinterval. Intervalgrænser Hvis. a x = a- s og a 2 = a + og kaldes tillidsgrænser.

Lad os give en anden fortolkning af begrebet et konfidensinterval: det kan betragtes som et interval af parameterværdier EN, kompatible med eksperimentelle data og ikke modsige dem. Faktisk, hvis vi er enige om at betragte en begivenhed med sandsynlighed a = 1-p praktisk talt umulig, så er de værdier af parameteren a, for hvilke a - a> s skal anerkendes som modstridende eksperimentelle data, og dem, for hvilke |a - EN a t na 2.

Lad for parameteren EN der er et upartisk skøn EN. Hvis vi kendte loven om fordeling af mængden EN, ville opgaven med at finde et konfidensinterval være meget enkel: det ville være nok at finde en værdi s, for hvilken

Vanskeligheden er, at loven om fordeling af skøn EN afhænger af mængdens distributionslov x og følgelig på dets ukendte parametre (især på selve parameteren EN).

For at komme uden om denne vanskelighed kan du bruge følgende nogenlunde omtrentlige teknik: Erstat de ukendte parametre i udtrykket for s med deres punktestimater. Med et relativt stort antal eksperimenter P(ca. 20...30) giver denne teknik normalt resultater, der er tilfredsstillende med hensyn til nøjagtighed.

Som et eksempel kan du overveje problemet med et konfidensinterval for den matematiske forventning.

Lad det produceres P X, hvis karakteristika er den matematiske forventning T og varians D- ukendt. Følgende estimater blev opnået for disse parametre:

Det er nødvendigt at konstruere et konfidensinterval / p svarende til konfidenssandsynligheden p for den matematiske forventning T mængder X.

Når vi løser dette problem, vil vi bruge det faktum, at mængden T repræsenterer summen P uafhængige identisk fordelte stokastiske variable X h og ifølge den centrale grænsesætning, for en tilstrækkelig stor P dens distributionslov er tæt på normalen. Selv med et relativt lille antal led (ca. 10...20) kan fordelingsloven for summen i praksis anses for nogenlunde normal. Vi vil antage, at værdien T fordelt efter normalloven. Denne lovs karakteristika - matematisk forventning og varians - er henholdsvis lige store T Og

(se kapitel 13 underafsnit 13.3). Lad os antage, at værdien D vi kender og vil finde en værdi Ep som

Ved hjælp af formlen (6.3.5) i kapitel 6 udtrykker vi sandsynligheden på venstre side af (14.3.5) gennem normalfordelingsfunktionen

hvor er standardafvigelsen for estimatet T.

Fra Eq.

find værdien af ​​Sp:

hvor arg Ф* (х) er den omvendte funktion af Ф* (X), de der. sådan en værdi af argumentet, som normalfordelingsfunktionen er lig med X.

Spredning D, hvorigennem mængden er udtrykt EN 1P, ved vi ikke præcist; som dens omtrentlige værdi, kan du bruge estimatet D(14.3.4) og angiv ca.

Dermed er problemet med at konstruere et konfidensinterval tilnærmelsesvis løst, hvilket er lig med:

hvor gp er bestemt ved formel (14.3.7).

For at undgå omvendt interpolation i tabellerne for funktionen Ф* (l) ved beregning af s p, er det praktisk at kompilere en speciel tabel (tabel 14.3.1), som giver værdierne af mængden

afhængig af r. Værdien (p bestemmer for normalloven antallet af standardafvigelser, der skal plottes til højre og venstre fra spredningscentret, så sandsynligheden for at komme ind i det resulterende område er lig med p.

Ved hjælp af værdien 7 p udtrykkes konfidensintervallet som:

Tabel 14.3.1

Eksempel 1. Der blev udført 20 forsøg på mængden X; resultaterne er vist i tabel. 14.3.2.

Tabel 14.3.2

Det er nødvendigt at finde et skøn fra for den matematiske forventning til mængden x og konstruer et konfidensinterval svarende til konfidenssandsynligheden p = 0,8.

Løsning. Vi har:

Ved at vælge l: = 10 som referencepunkt ved hjælp af den tredje formel (14.2.14) finder vi det upartiske estimat D :

Ifølge tabellen 14.3.1 finder vi

Tillidsgrænser:

Konfidensinterval:

Parameterværdier T, liggende i dette interval er kompatible med de eksperimentelle data givet i tabellen. 14.3.2.

Et konfidensinterval for variansen kan konstrueres på lignende måde.

Lad det produceres P uafhængige eksperimenter på en stokastisk variabel x med ukendte parametre for både A og dispersion D et objektivt skøn blev opnået:

Det er nødvendigt at tilnærmelsesvis konstruere et konfidensinterval for variansen.

Af formel (14.3.11) fremgår det tydeligt, at mængden D repræsenterer

beløb P tilfældige variable af formen. Disse mængder er ikke

uafhængig, da nogen af ​​dem inkluderer mængden T, afhængig af alle andre. Det kan dog påvises, at med stigende P loven om fordeling af deres sum nærmer sig også normal. Næsten kl P= 20...30 kan det allerede betragtes som normalt.

Lad os antage, at det er sådan, og lad os finde egenskaberne ved denne lov: matematisk forventning og spredning. Siden vurderingen D- så upartisk M[D] = D.

Variansberegning D D er forbundet med relativt komplekse beregninger, så vi præsenterer dets udtryk uden afledning:

hvor q 4 er det fjerde centrale moment af størrelsen X.

For at bruge dette udtryk skal du erstatte værdierne \u003d 4 og D(i hvert fald tætte). I stedet for D du kan bruge hans vurdering D. I princippet kan det fjerde centrale moment også erstattes af et skøn, for eksempel en værdi af formen:

men en sådan udskiftning vil give ekstremt lav nøjagtighed, da der generelt med et begrænset antal eksperimenter bestemmes momenter af høj orden med store fejl. Men i praksis sker det ofte, at typen af ​​mængdefordelingslov x kendt på forhånd: kun dens parametre er ukendte. Så kan du prøve at udtrykke μ 4 igennem D.

Lad os tage det mest almindelige tilfælde, når værdien x fordelt efter normalloven. Derefter udtrykkes dets fjerde centrale moment i form af spredning (se kapitel 6, underafsnit 6.2);

og formel (14.3.12) giver eller

Erstatter det ukendte i (14.3.14) D hans vurdering D, vi får: hvorfra

Moment μ 4 kan udtrykkes gennem D også i nogle andre tilfælde, når fordelingen af ​​værdien x er ikke normalt, men dets udseende er kendt. For loven om ensartet tæthed (se kapitel 5) har vi for eksempel:

hvor (a, P) er det interval, som loven er specificeret på.

Derfor,

Ved hjælp af formlen (14.3.12) får vi: hvor finder vi ca

I de tilfælde, hvor arten af ​​fordelingsloven for mængden 26 er ukendt, anbefales det ved et omtrentligt skøn over værdien a/ stadig at anvende formel (14.3.16), medmindre der er særlige grunde til at tro, at denne lov er meget forskellig fra den normale (har en mærkbar positiv eller negativ kurtose).

Hvis den omtrentlige værdi a/) opnås på den ene eller anden måde, så kan vi konstruere et konfidensinterval for variansen på samme måde, som vi byggede det for den matematiske forventning:

hvor værdien afhængig af den givne sandsynlighed p findes ifølge tabellen. 14.3.1.

Eksempel 2. Find ca. 80 % konfidensinterval for variansen af ​​en stokastisk variabel x under betingelserne i eksempel 1, hvis det er kendt, at værdien x fordelt efter en lov tæt på normalen.

Løsning. Værdien forbliver den samme som i tabellen. 14.3.1:

Ifølge formel (14.3.16)

Ved hjælp af formlen (14.3.18) finder vi konfidensintervallet:

Det tilsvarende område af standardafvigelsesværdier: (0,21; 0,29).

14.4. Nøjagtige metoder til at konstruere konfidensintervaller for parametrene for en stokastisk variabel fordelt efter en normallov

I det foregående underafsnit undersøgte vi nogenlunde tilnærmede metoder til at konstruere konfidensintervaller for matematisk forventning og varians. Her vil vi give en idé om de nøjagtige metoder til at løse det samme problem. Vi understreger, at for nøjagtigt at finde konfidensintervaller er det absolut nødvendigt på forhånd at kende formen for distributionsloven for mængden X, der henviser til, at dette ikke er nødvendigt for at anvende omtrentlige metoder.

Ideen om nøjagtige metoder til at konstruere konfidensintervaller kommer ned til følgende. Ethvert konfidensinterval findes ud fra en betingelse, der udtrykker sandsynligheden for at opfylde visse uligheder, som inkluderer det skøn, vi er interesserede i EN. Lov om vurderingsfordeling EN i det generelle tilfælde afhænger af ukendte parametre for mængden X. Nogle gange er det dog muligt at overføre uligheder fra en tilfældig variabel EN til en anden funktion af observerede værdier X p X 2, ..., X p. hvis distributionslov ikke afhænger af ukendte parametre, men kun afhænger af antallet af forsøg og af typen af ​​distributionslov for mængden X. Disse former for tilfældige variable spiller en vigtig rolle i matematisk statistik; de er blevet studeret mest detaljeret for tilfældet med en normalfordeling af mængden X.

For eksempel er det bevist, at med en normalfordeling af værdien x tilfældig værdi

adlyder den såkaldte Elevfordelingslov Med P- 1 frihedsgrad; tætheden af ​​denne lov har formen

hvor G(x) er den kendte gammafunktion:

Det er også bevist, at den stokastiske variabel

har en "distribution %2" med P- 1 frihedsgrad (se kapitel 7), hvis tæthed er udtrykt ved formlen

Uden at dvæle ved udledningerne af fordelinger (14.4.2) og (14.4.4), vil vi vise, hvordan de kan anvendes, når der konstrueres konfidensintervaller for parametre ty D.

Lad det produceres P uafhængige eksperimenter på en stokastisk variabel X, normalt fordelt med ukendte parametre TIL. For disse parametre blev estimater indhentet

Det er nødvendigt at konstruere konfidensintervaller for begge parametre svarende til konfidenssandsynligheden p.

Lad os først konstruere et konfidensinterval for den matematiske forventning. Det er naturligt at tage dette interval symmetrisk mhp T; lad s p betegne halvdelen af ​​intervallets længde. Værdien s p skal vælges, så betingelsen er opfyldt

Lad os prøve at flytte på venstre side af lighed (14.4.5) fra den stokastiske variabel T til en tilfældig variabel T, fordelt efter elevens lov. For at gøre dette skal du gange begge sider af uligheden |m-w?|

med en positiv værdi: eller ved at bruge notation (14.4.1),

Lad os finde et tal / p, således at værdien / p kan findes ud fra betingelsen

Fra formel (14.4.2) er det klart, at (1) er en lige funktion, derfor giver (14.4.8)

Ligestilling (14.4.9) bestemmer værdien / p afhængig af p. Hvis du har en tabel med integrale værdier til din rådighed

så kan værdien af ​​/p findes ved omvendt interpolation i tabellen. Det er dog mere praktisk at lave en tabel med /p-værdier​​på forhånd. En sådan tabel er angivet i tillægget (tabel 5). Denne tabel viser værdierne afhængigt af konfidensniveauet p og antallet af frihedsgrader P- 1. Efter at have bestemt / p fra tabellen. 5 og forudsat

vi finder halvdelen af ​​bredden af ​​konfidensintervallet / p og selve intervallet

Eksempel 1. 5 uafhængige eksperimenter blev udført på en tilfældig variabel X, normalt fordelt med ukendte parametre T og om. Resultaterne af forsøgene er angivet i tabel. 14.4.1.

Tabel 14.4.1

Find bedømmelse T for den matematiske forventning og konstruer et 90 % konfidensinterval / p for den (dvs. intervallet svarende til konfidenssandsynligheden p = 0,9).

Løsning. Vi har:

Ifølge tabel 5 i ansøgningen vedr P - 1 = 4 og p = 0,9 finder vi hvor

Konfidensintervallet vil være

Eksempel 2. For betingelserne i eksempel 1 i underafsnit 14.3, antaget værdien x normalfordelt, find det nøjagtige konfidensinterval.

Løsning. Ifølge tabel 5 i bilaget finder vi hvornår P - 1 = 19ir =

0,8/p = 1,328; herfra

Sammenligner vi med løsningen i eksempel 1 i underafsnit 14.3 (e p = 0,072), er vi overbeviste om, at uoverensstemmelsen er meget ubetydelig. Hvis vi bevarer nøjagtigheden til anden decimal, så falder konfidensintervallerne fundet ved de nøjagtige og omtrentlige metoder sammen:

Lad os gå videre til at konstruere et konfidensinterval for variansen. Overvej den upartiske variansestimator

og udtrykke den stokastiske variabel D gennem størrelse V(14.4.3), med fordeling x 2 (14.4.4):

At kende loven om fordeling af mængde V, du kan finde intervallet /(1), hvori det falder med en given sandsynlighed p.

Fordelingsloven kn_x(v) størrelsen I 7 har formen vist i fig. 14.4.1.

Ris. 14.4.1

Spørgsmålet opstår: hvordan vælger man intervallet / p? Hvis loven om størrelsesfordeling V var symmetrisk (som normalloven eller Studentfordelingen), ville det være naturligt at tage intervallet /p symmetrisk med hensyn til den matematiske forventning. I dette tilfælde loven k p_x (v) asymmetrisk. Lad os blive enige om at vælge intervallet /p, så sandsynligheden for, at værdien er V ud over intervallet til højre og venstre (skraverede områder i fig. 14.4.1) var ens og ens

For at konstruere et interval /p med denne egenskab bruger vi tabellen. 4 applikationer: den indeholder numre y) sådan at

for værdien V, have x 2 -fordeling med r frihedsgrader. I vores tilfælde r = n- 1. Lad os ordne r = n- 1 og find i den tilsvarende række i tabellen. 4 to betydninger x 2 - den ene svarer til sandsynlighed den anden - sandsynlighed Lad os betegne disse

værdier kl 2 Og xl? Intervallet har y 2, med din venstre, og y ~ højre ende.

Lad os nu ud fra intervallet / p finde det ønskede konfidensinterval /|, for spredningen med grænser D, og D2, som dækker punktet D med sandsynlighed p:

Lad os konstruere et interval / (, = (?> ь А), der dækker punktet D hvis og kun hvis værdien V falder ind i intervallet /r. Lad os vise, at intervallet

opfylder denne betingelse. Faktisk ulighederne svarer til uligheder

og disse uligheder er tilfredsstillet med sandsynlighed p. Således er konfidensintervallet for variansen fundet og er udtrykt ved formel (14.4.13).

Eksempel 3. Find konfidensintervallet for variansen under betingelserne i eksempel 2 i underafsnit 14.3, hvis det er kendt, at værdien x normalt fordelt.

Løsning. Vi har . I henhold til tabel 4 i bilaget

finder vi kl g = n - 1 = 19

Ved hjælp af formlen (14.4.13) finder vi konfidensintervallet for variansen

Det tilsvarende interval for standardafvigelsen er (0,21; 0,32). Dette interval overskrider kun lidt intervallet (0,21; 0,29) opnået i eksempel 2 i underafsnit 14.3 ved brug af den tilnærmede metode.

  • Figur 14.3.1 betragter et konfidensinterval som er symmetrisk omkring a. Generelt, som vi vil se senere, er dette ikke nødvendigt.

Lad os konstruere et konfidensinterval i MS EXCEL for at estimere middelværdien af ​​fordelingen i tilfælde af en kendt spredningsværdi.

Selvfølgelig valget tillidsniveau afhænger helt af problemet, der bliver løst. En flypassagers tillid til et flys pålidelighed bør således utvivlsomt være højere end en købers tillid til pålideligheden af ​​en elektrisk pære.

Problemformulering

Lad os antage, at fra befolkning er blevet taget prøve størrelse n. Det antages at standardafvigelse denne fordeling er kendt. Nødvendigt ud fra dette prøver vurdere det ukendte fordelingsmiddel(μ, ) og konstruer den tilsvarende dobbeltsidet konfidensinterval.

Punktestimat

Som det kendes fra Statistikker(lad os betegne det X gns) er upartisk skøn over gennemsnittet det her befolkning og har en fordeling N(μ;σ 2/n).

Bemærk: Hvad skal du gøre, hvis du skal bygge konfidensinterval i tilfælde af en fordeling, der er ikke normal? I dette tilfælde kommer til undsætning, som siger, at med en tilstrækkelig stor størrelse prøver n fra distribution ikke være normal, stikprøvefordeling af statistik X gns vilje rundt regnet korrespondere Normal fordeling med parametre N(μ;σ 2/n).

Så, punktestimat gennemsnit fordelingsværdier vi har - dette prøvegennemsnit, dvs. X gns. Lad os nu komme i gang konfidensinterval.

Konstruktion af et konfidensinterval

Normalt, ved at kende fordelingen og dens parametre, kan vi beregne sandsynligheden for, at den stokastiske variabel vil tage en værdi fra det interval, vi angiver. Lad os nu gøre det modsatte: find det interval, hvori den stokastiske variabel vil falde med en given sandsynlighed. Fx fra ejendommene Normal fordeling det er kendt, at med en sandsynlighed på 95%, en stokastisk variabel fordelt over normal lov, vil falde inden for området på ca. +/- 2 fra gennemsnits værdi(se artikel om). Dette interval vil tjene som en prototype for os konfidensinterval.

Lad os nu se, om vi kender fordelingen , at beregne dette interval? For at besvare spørgsmålet skal vi angive fordelingens form og dens parametre.

Vi kender distributionsformen - det er Normal fordeling(husk, at vi taler om prøveudtagningsfordeling Statistikker X gns).

Parameteren μ er ukendt for os (den skal blot estimeres ved hjælp af konfidensinterval), men vi har et skøn over det X gennemsnit, beregnes ud fra prøver, som kan bruges.

Anden parameter – standardafvigelse af prøvegennemsnit vi vil betragte det som kendt, det er lig med σ/√n.

Fordi vi kender ikke μ, så bygger vi intervallet +/- 2 standardafvigelser ikke fra gennemsnits værdi og fra dets kendte skøn X gns. De der. ved beregning konfidensinterval det vil vi IKKE gå ud fra X gns falder inden for området +/- 2 standardafvigelser fra μ med en sandsynlighed på 95 %, og vi vil antage, at intervallet er +/- 2 standardafvigelser fra X gns med 95 % sandsynlighed vil den dække μ - gennemsnittet af den almindelige befolkning, hvorfra den er taget prøve. Disse to udsagn er ækvivalente, men den anden udsagn giver os mulighed for at konstruere konfidensinterval.

Lad os derudover præcisere intervallet: en tilfældig variabel fordelt over normal lov, med 95 % sandsynlighed falder inden for intervallet +/- 1,960 standardafvigelser, ikke +/- 2 standardafvigelser. Dette kan beregnes ved hjælp af formlen =NORM.ST.REV((1+0,95)/2), cm. eksempel fil Sheet Interval.

Nu kan vi formulere en sandsynlighedserklæring, som vil tjene os til at danne konfidensinterval:
"Sandsynligheden for at befolkningsmiddel placeret fra prøvegennemsnit inden for 1.960" standardafvigelser for prøvegennemsnittet", svarende til 95 %".

Sandsynlighedsværdien nævnt i udsagnet har et særligt navn , som er forbundet med signifikansniveau α (alfa) ved et simpelt udtryk tillidsniveau =1 . I vores tilfælde betydningsniveau α =1-0,95=0,05 .

Ud fra denne sandsynlighedserklæring skriver vi nu et udtryk til beregning konfidensinterval:

hvor Z a/2 standard Normal fordeling(denne værdi af den tilfældige variabel z, Hvad P(z>=Z a/2 )=a/2).

Bemærk: Øvre α/2-kvantil definerer bredden konfidensinterval V standardafvigelser prøvegennemsnit. Øvre α/2-kvantil standard Normal fordeling altid større end 0, hvilket er meget praktisk.

I vores tilfælde, med α=0,05, øvre α/2-kvantil svarer til 1.960. For andre signifikansniveauer α (10 %; 1 %) øvre α/2-kvantil Z a/2 kan beregnes ved hjælp af formlen =NORM.ST.REV(1-α/2) eller, hvis kendt tillidsniveau, =NORM.ST.OBR((1+tillidsniveau)/2).

Normalt når man bygger konfidensintervaller til estimering af gennemsnittet kun brug øverste α/2-kvantil og ikke bruge lavere α/2-kvantil. Dette er muligt pga standard Normal fordeling symmetrisk om x-aksen ( dens fordelingstæthed symmetrisk omkring gennemsnit, dvs. 0). Derfor er der ingen grund til at beregne lavere α/2-kvantil(det kaldes simpelthen α /2-kvantil), fordi det er lige øverste α/2-kvantil med et minustegn.

Lad os huske på, at på trods af formen af ​​fordelingen af ​​værdien x, den tilsvarende stokastiske variabel X gns fordelt rundt regnet Bøde N(μ;σ 2 /n) (se artikel om). Derfor generelt er ovenstående udtryk for konfidensinterval er kun en tilnærmelse. Hvis værdien x er fordelt over normal lov N(μ;σ 2 /n), derefter udtrykket for konfidensinterval er nøjagtig.

Konfidensintervalberegning i MS EXCEL

Lad os løse problemet.
En elektronisk komponents responstid på et inputsignal er en vigtig egenskab ved enheden. En ingeniør ønsker at konstruere et konfidensinterval for den gennemsnitlige responstid ved et konfidensniveau på 95 %. Ud fra tidligere erfaring ved ingeniøren, at standardafvigelsen for responstiden er 8 ms. Det er kendt, at for at evaluere responstiden foretog ingeniøren 25 målinger, den gennemsnitlige værdi var 78 ms.

Løsning: En ingeniør vil gerne vide responstiden for en elektronisk enhed, men han forstår, at responstiden ikke er en fast værdi, men en tilfældig variabel, der har sin egen fordeling. Så det bedste, han kan håbe på, er at bestemme parametrene og formen for denne fordeling.

Ud fra problemets betingelser kender vi desværre ikke formen af ​​responstidsfordelingen (det behøver det ikke at være normal). , denne fordeling er også ukendt. Kun ham er kendt standardafvigelseσ=8. Derfor, mens vi ikke kan beregne sandsynligheder og konstruere konfidensinterval.

Dog på trods af, at vi ikke kender fordelingen tid separat svar, det ved vi iflg CPT, prøveudtagningsfordeling gennemsnitlig svartid er ca normal(vi antager, at betingelserne CPT udføres, pga størrelse prøver ret stor (n=25)) .

I øvrigt, gennemsnit denne fordeling er lig med gennemsnits værdi fordeling af et enkelt svar, dvs. μ. EN standardafvigelse af denne fordeling (σ/√n) kan beregnes ved hjælp af formlen =8/ROOT(25) .

Det er også kendt, at ingeniøren modtog punktestimat parameter μ lig med 78 ms (X gns.). Derfor kan vi nu beregne sandsynligheder, fordi vi kender distributionsformen ( normal) og dens parametre (X avg og σ/√n).

Ingeniøren vil vide det forventet værdiμ responstidsfordelinger. Som nævnt ovenfor er denne μ lig med matematisk forventning til stikprøvefordelingen af ​​den gennemsnitlige svartid. Hvis vi bruger Normal fordeling N(X avg; σ/√n), så vil den ønskede μ være i området +/-2*σ/√n med en sandsynlighed på cirka 95%.

Betydningsniveau er lig med 1-0,95=0,05.

Lad os endelig finde venstre og højre kant konfidensinterval.
Venstre kant: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Højre kant: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Venstre kant: =NORM.REV(0,05/2; 78; 8/ROD(25))
Højre kant: =NORM.REV(1-0,05/2; 78; 8/ROD(25))

Svar: konfidensinterval95 % konfidensniveau og σ=8msek lige med 78+/-3,136 ms.

I eksempelfil på Sigma-arket kendt, lavet et skema til beregning og konstruktion dobbeltsidet konfidensinterval for vilkårlig prøver med givet σ og betydningsniveau.

CONFIDENCE.NORM() funktion

Hvis værdierne prøver er i sortimentet B20:B79 , A betydningsniveau lig med 0,05; derefter MS EXCEL formlen:
=MIDDEL(B20:B79)-TILLID.NORM(0,05;σ; ANTAL(B20:B79))
vil returnere den venstre kant konfidensinterval.

Den samme grænse kan beregnes ved hjælp af formlen:
=MIDDEL(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROD(ANTAL(B20:B79))

Bemærk: Funktionen CONFIDENCE.NORM() dukkede op i MS EXCEL 2010. I tidligere versioner af MS EXCEL blev TRUST()-funktionen brugt.

KONFIDENSINTERVALLER FOR FREKVENSER OG BRØKKER

© 2008

Statens Institut for Folkesundhed, Oslo, Norge

Artiklen beskriver og diskuterer beregningen af ​​konfidensintervaller for frekvenser og proportioner ved brug af Wald, Wilson, Clopper - Pearson metoderne, ved brug af vinkeltransformationen og Wald metoden med Agresti - Coull korrektion. Det præsenterede materiale giver generel information om metoder til beregning af konfidensintervaller for frekvenser og proportioner og har til formål at vække interesse hos tidsskriftslæsere ikke kun for at bruge konfidensintervaller, når de præsenterer resultaterne af deres egen forskning, men også for at læse specialiseret litteratur inden arbejdet påbegyndes. om fremtidige udgivelser.

Nøgleord: konfidensinterval, frekvens, proportion

En af de tidligere publikationer nævnte kort beskrivelsen af ​​kvalitative data og rapporterede, at deres intervalestimat er at foretrække frem for punktestimat til at beskrive hyppigheden af ​​forekomsten af ​​den egenskab, der undersøges i befolkningen. Da forskning udføres ved hjælp af stikprøvedata, skal fremskrivningen af ​​resultaterne på befolkningen faktisk indeholde et element af stikprøveupræcis. Konfidensintervallet er et mål for nøjagtigheden af ​​den parameter, der estimeres. Det er interessant, at nogle bøger om grundlæggende statistik for læger fuldstændig ignorerer emnet konfidensintervaller for frekvenser. I denne artikel vil vi se på flere måder at beregne konfidensintervaller for frekvenser på, hvilket indebærer sådanne prøvekarakteristika som ikke-gentagelse og repræsentativitet, såvel som uafhængigheden af ​​observationer fra hinanden. I denne artikel forstås frekvens ikke som et absolut tal, der viser, hvor mange gange en bestemt værdi forekommer i det samlede antal, men som en relativ værdi, der bestemmer andelen af ​​undersøgelsesdeltagere, hos hvem den undersøgte egenskab forekommer.

I biomedicinsk forskning er 95 % konfidensintervaller mest almindeligt anvendt. Dette konfidensinterval er det område, inden for hvilket den sande andel falder 95 % af tiden. Med andre ord kan vi sige med 95 % sikkerhed, at den sande værdi af hyppigheden af ​​forekomst af en egenskab i populationen vil være inden for 95 % konfidensintervallet.

De fleste statistikmanualer til medicinske forskere rapporterer, at frekvensfejl beregnes ved hjælp af formlen

hvor p er hyppigheden af ​​forekomsten af ​​karakteristikken i prøven (værdi fra 0 til 1). De fleste indenlandske videnskabelige artikler angiver hyppigheden af ​​forekomsten af ​​en egenskab i en prøve (p), såvel som dens fejl (s) i formen p ± s. Det er dog mere hensigtsmæssigt at præsentere et 95 % konfidensinterval for hyppigheden af ​​forekomst af et træk i befolkningen, som vil omfatte værdier fra

Før.

Nogle manualer anbefaler, at man for små prøver erstatter værdien 1,96 med værdien t for N – 1 frihedsgrader, hvor N er antallet af observationer i prøven. t-værdien findes fra tabeller for t-fordelingen, som er tilgængelig i næsten alle statistiklærebøger. Brugen af ​​t-fordelingen til Wald-metoden giver ikke synlige fordele sammenlignet med andre metoder, der diskuteres nedenfor, og anbefales derfor ikke af nogle forfattere.

Metoden præsenteret ovenfor til beregning af konfidensintervaller for frekvenser eller proportioner er navngivet Wald til ære for Abraham Wald (1902-1950), da dens udbredte brug begyndte efter udgivelsen af ​​Wald og Wolfowitz i 1939. Selve metoden blev imidlertid foreslået af Pierre Simon Laplace (1749-1827) tilbage i 1812.

Wald-metoden er meget populær, men dens anvendelse er forbundet med betydelige problemer. Metoden anbefales ikke til små stikprøvestørrelser, såvel som i tilfælde, hvor hyppigheden af ​​forekomst af en karakteristik har tendens til 0 eller 1 (0 % eller 100 %) og simpelthen er umulig for frekvenser på 0 og 1. tilnærmelse af normalfordelingen, som bruges ved beregning af fejlen, "virker ikke" i tilfælde, hvor n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Da den nye variabel er normalfordelt, vil den nedre og øvre grænse for 95 % konfidensintervallet for variablen φ være φ-1,96 og φ+1,96venstre">

I stedet for 1,96 for små prøver anbefales det at erstatte t-værdien med N – 1 frihedsgrader. Denne metode producerer ikke negative værdier og tillader mere nøjagtige estimater af konfidensintervaller for frekvenser end Wald-metoden. Derudover er den beskrevet i mange indenlandske opslagsværker om medicinsk statistik, hvilket dog ikke har ført til dens udbredte anvendelse i medicinsk forskning. Beregning af konfidensintervaller ved hjælp af vinkeltransformation anbefales ikke for frekvenser, der nærmer sig 0 eller 1.

Det er her beskrivelsen af ​​metoder til at estimere konfidensintervaller i de fleste bøger om det grundlæggende i statistik for medicinske forskere normalt slutter, og dette problem er typisk ikke kun for indenlandsk, men også for udenlandsk litteratur. Begge metoder er baseret på den centrale grænsesætning, som indebærer en stor stikprøve.

Under hensyntagen til manglerne ved at estimere konfidensintervaller ved hjælp af ovenstående metoder, foreslog Clopper og Pearson i 1934 en metode til at beregne det såkaldte eksakte konfidensinterval, givet den binomiale fordeling af den egenskab, der undersøges. Denne metode er tilgængelig i mange online-beregnere, men konfidensintervallerne opnået på denne måde er i de fleste tilfælde for brede. Samtidig anbefales denne metode til brug i tilfælde, hvor en konservativ vurdering er nødvendig. Graden af ​​konservativitet af metoden stiger, efterhånden som prøvestørrelsen falder, især når N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Ifølge mange statistikere udføres den mest optimale vurdering af konfidensintervaller for frekvenser ved Wilson-metoden, foreslået tilbage i 1927, men praktisk talt ikke brugt i indenlandsk biomedicinsk forskning. Denne metode giver ikke kun mulighed for at estimere konfidensintervaller for både meget små og meget store frekvenser, men er også anvendelig til et lille antal observationer. Generelt har konfidensintervallet ifølge Wilsons formel formen



hvor tager værdien 1,96 ved beregning af 95 % konfidensintervallet, N er antallet af observationer, og p er hyppigheden af ​​forekomsten af ​​karakteristikken i stikprøven. Denne metode er tilgængelig i online regnemaskiner, så brugen er ikke problematisk. og anbefaler ikke at bruge denne metode til n s< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Ud over Wilson-metoden menes Wald-metoden med Agresti-Coll-korrektion også at give et optimalt estimat af konfidensintervallet for frekvenser. Agresti-Coll-korrektionen er en erstatning i Wald-formlen af ​​hyppigheden af ​​forekomst af en karakteristik i en stikprøve (p) med p`, når man beregner hvilken 2 der lægges til tælleren og 4 der lægges til nævneren, dvs. p` = (X + 2) / (N + 4), hvor X er antallet af undersøgelsesdeltagere, der har den egenskab, der undersøges, og N er stikprøvestørrelsen. Denne modifikation giver resultater, der ligner Wilsons formel, undtagen når hændelsesfrekvensen nærmer sig 0 % eller 100 %, og prøven er lille. Ud over ovenstående metoder til beregning af konfidensintervaller for frekvenser, er der foreslået kontinuitetskorrektioner for både Wald- og Wilson-metoderne for små prøver, men undersøgelser har vist, at deres anvendelse er uhensigtsmæssig.

Lad os overveje anvendelsen af ​​ovenstående metoder til beregning af konfidensintervaller ved hjælp af to eksempler. I det første tilfælde studerer vi en stor stikprøve på 1.000 tilfældigt udvalgte studiedeltagere, hvoraf 450 har egenskaben under undersøgelse (dette kan være en risikofaktor, et resultat eller en hvilken som helst anden egenskab), hvilket repræsenterer en frekvens på 0,45 eller 45 %. I det andet tilfælde udføres undersøgelsen ved hjælp af en lille stikprøve, f.eks. kun 20 personer, og kun 1 undersøgelsesdeltager (5%) har den egenskab, der undersøges. Konfidensintervaller ved brug af Wald-metoden, Wald-metoden med Agresti-Coll-korrektion og Wilson-metoden blev beregnet ved hjælp af en online-beregner udviklet af Jeff Sauro (http://www. /wald. htm). Wilsons kontinuitetskorrigerede konfidensintervaller blev beregnet ved hjælp af lommeregneren leveret af Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Angular Fisher-transformationsberegninger blev udført manuelt ved hjælp af den kritiske t-værdi for henholdsvis 19 og 999 frihedsgrader. Beregningsresultaterne er vist i tabellen for begge eksempler.

Konfidensintervaller beregnet på seks forskellige måder for to eksempler beskrevet i teksten

Konfidensinterval beregningsmetode

P=0,0500 eller 5 %

95 % CI for X=450, N=1000, P=0,4500 eller 45 %

–0,0455–0,2541

Wald med Agresti-Coll korrektion

<,0001–0,2541

Wilson med kontinuitetskorrektion

Clopper-Pearson "nøjagtig metode"

Vinkel transformation

<0,0001–0,1967

Som det kan ses af tabellen, kommer konfidensintervallet beregnet ved hjælp af den "generelt accepterede" Wald-metode for det første eksempel ind i det negative område, hvilket ikke kan være tilfældet for frekvenser. Desværre er sådanne hændelser ikke ualmindelige i russisk litteratur. Den traditionelle måde at præsentere data på med hensyn til frekvens og dens fejl maskerer delvist dette problem. For eksempel, hvis hyppigheden af ​​forekomst af en egenskab (i procent) præsenteres som 2,1 ± 1,4, så er dette ikke så "stødende for øjet" som 2,1 % (95 % CI: –0,7; 4,9), selvom og betyder det samme. Wald-metoden med Agresti-Coll-korrektion og beregning ved hjælp af vinkeltransformation giver en nedre grænse, der har tendens til nul. Wilsons kontinuitetskorrigerede metode og den "nøjagtige metode" producerer bredere konfidensintervaller end Wilsons metode. For det andet eksempel giver alle metoder omtrent de samme konfidensintervaller (forskelle vises kun i tusindedele), hvilket ikke er overraskende, da hyppigheden af ​​forekomsten af ​​hændelsen i dette eksempel ikke er meget forskellig fra 50 %, og stikprøvestørrelsen er temmelig stor.

For læsere, der er interesseret i dette problem, kan vi anbefale værkerne af R. G. Newcombe og Brown, Cai og Dasgupta, som giver fordele og ulemper ved at bruge henholdsvis 7 og 10 forskellige metoder til at beregne konfidensintervaller. Blandt de hjemlige manualer anbefaler vi bogen, og som udover en detaljeret beskrivelse af teorien præsenterer Wald og Wilsons metoder, samt en metode til beregning af konfidensintervaller under hensyntagen til den binomiale frekvensfordeling. Ud over gratis online-beregnere (http://www. /wald. htm og http://faculty. vassar. edu/lowry/prop1.html), kan konfidensintervaller for frekvenser (og ikke kun!) beregnes ved hjælp af CIA-program (Confidence Intervals Analysis), som kan downloades fra http://www. medskole. soton. ac. dk/cia/ .

Den næste artikel vil se på univariate måder at sammenligne kvalitative data på.

Bibliografi

Banerji A. Medicinsk statistik i klart sprog: et introduktionskursus / A. Banerjee. – M.: Praktisk medicin, 2007. – 287 s. Medicinsk statistik / . – M.: Lægeinformationsstyrelsen, 2007. – 475 s. Glanz S. Medicinsk og biologisk statistik / S. Glanz. – M.: Praktika, 1998. Datatyper, distributionstest og beskrivende statistik // Human Ecology – 2008. – Nr. 1. – S. 52–58. Zhizhin K.S.. Medicinsk statistik: lærebog / . – Rostov n/d: Phoenix, 2007. – 160 s. Anvendt medicinsk statistik / , . - Sankt Petersborg. : Foliot, 2003. – 428 s. Lakin G. F.. Biometri / . – M.: Højere skole, 1990. – 350 s. Læge V.A. Matematisk statistik i medicin / , . – M.: Finans og statistik, 2007. – 798 s. Matematisk statistik i klinisk forskning / , . – M.: GEOTAR-MED, 2001. – 256 s. Junkerov V. OG. Medicinsk og statistisk behandling af medicinske forskningsdata / , . - Sankt Petersborg. : VmedA, 2002. – 266 s. Agresti A. Tilnærmet er bedre end eksakt til intervalestimering af binomiale proportioner / A. Agresti, B. Coull // Amerikansk statistiker. – 1998. – N 52. – S. 119–126. Altman D. Statistik med tillid // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – London: BMJ Books, 2000. – 240 s. Brown L.D. Interval estimering for en binomial proportion / L. D. Brown, T. T. Cai, A. Dasgupta // Statistisk videnskab. – 2001. – N 2. – S. 101–133. Clopper C.J. Brugen af ​​tillids- eller tillidsgrænser illustreret i tilfældet med binomialet / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – S. 404–413. Garcia-Perez M.A. Om konfidensintervallet for den binomiale parameter / M. A. Garcia-Perez // Kvalitet og kvantitet. – 2005. – N 39. – S. 467–481. Motulsky H. Intuitiv biostatistik // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 s. Newcombe R.G. To-sidede konfidensintervaller for den enkelte andel: Sammenligning af syv metoder / R. G. Newcombe // Statistik i medicin. – 1998. – N. 17. – S. 857–872. Sauro J. Estimering af fuldførelsesrater fra små stikprøver ved hjælp af binomiale konfidensintervaller: sammenligninger og anbefalinger / J. Sauro, J. R. Lewis // Årsmøde for samfundet for menneskelige faktorer og ergonomi. – Orlando, FL, 2005. Wald A. Konfidensgrænser for kontinuerte fordelingsfunktioner // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – S. 105–118. Wilson E.B. Sandsynlig slutning, arveloven og statistisk slutning / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – S. 209–212.

KONFIDENSINTERVALLER FOR PROPORTIONER

EN. M. Grjibovski

Statens Institut for Folkesundhed, Oslo, Norge

Artiklen præsenterer flere metoder til beregning af konfidensintervaller for binomiale proportioner, nemlig Wald, Wilson, arcsine, Agresti-Coull og eksakte Clopper-Pearson metoder. Artiklen giver kun en generel introduktion til problemet med konfidensintervalestimering af en binomial proportion, og dens formål er ikke kun at stimulere læserne til at bruge konfidensintervaller, når de præsenterer resultater af deres egen empiriske forskning, men også at tilskynde dem til at konsultere statistikbøger forud for analyse af egne data og udarbejdelse af manuskripter.

Nøgleord: konfidensinterval, proportion

Kontakt information:

Seniorrådgiver, Statens Institut for Folkesundhed, Oslo, Norge

Konfidensintervaller.

Beregningen af ​​konfidensintervallet er baseret på gennemsnitsfejlen for den tilsvarende parameter. Konfidensinterval viser inden for hvilke grænser med sandsynlighed (1-a) den sande værdi af den estimerede parameter ligger. Her er a signifikansniveauet, (1-a) kaldes også konfidenssandsynlighed.

I det første kapitel viste vi, at f.eks. for det aritmetiske gennemsnit ligger den sande populationsmiddelværdi i cirka 95 % af tilfældene inden for 2 standardfejl af middelværdien. Således vil grænserne for 95 % konfidensintervallet for middelværdien adskilles fra stikprøvegennemsnittet med det dobbelte af middelfejlen af ​​middelværdien, dvs. vi multiplicerer gennemsnitsfejlen med en bestemt koefficient afhængigt af konfidensniveauet. For gennemsnittet og forskellen af ​​gennemsnit tages Student-koefficienten (kritisk værdi af Elevens test), for andelen og forskellen af ​​andele, den kritiske værdi af z-kriteriet. Produktet af koefficienten og gennemsnitsfejlen kan kaldes den maksimale fejl af en given parameter, dvs. det maksimale, vi kan opnå, når vi vurderer det.

Konfidensinterval for aritmetisk middelværdi : .

Her er prøvegennemsnittet;

Middelfejl af det aritmetiske middelværdi;

s – prøve standardafvigelse;

n

f = n-1 (Elevens koefficient).

Konfidensinterval for forskelle i aritmetiske middelværdier :

Her er forskellen mellem prøvemiddel;

- gennemsnitlig fejl af forskellen mellem aritmetiske middelværdier;

s 1, s 2 – prøve standardafvigelser;

n1,n2

Den kritiske værdi af Elevens test for et givet signifikansniveau a og antallet af frihedsgrader f=n 1 + n 2-2 (Elevens koefficient).

Konfidensinterval for aktier :

.

Her er d prøvefraktionen;

– gennemsnitlig brøkfejl;

n– stikprøvestørrelse (gruppestørrelse);

Konfidensinterval for forskel på aktier :

Her er forskellen i prøveandele;

– gennemsnitlig fejl af forskellen mellem aritmetiske middelværdier;

n1,n2– stikprøvestørrelser (antal grupper);

Den kritiske værdi af z-kriteriet ved et givet signifikansniveau a ( , , ).

Ved at beregne konfidensintervaller for forskellen mellem indikatorer ser vi for det første direkte de mulige værdier af effekten og ikke kun dens punktestimat. For det andet kan vi drage en konklusion om accept eller afvisning af nulhypotesen, og for det tredje kan vi drage en konklusion om testens styrke.

Når du tester hypoteser ved hjælp af konfidensintervaller, skal du overholde følgende regel:

Hvis 100(1-a) procent konfidensintervallet for forskellen i gennemsnit ikke indeholder nul, så er forskellene statistisk signifikante på signifikansniveau a; tværtimod, hvis dette interval indeholder nul, så er forskellene ikke statistisk signifikante.

Faktisk, hvis dette interval indeholder nul, så kan den sammenlignede indikator være enten større eller mindre i en af ​​grupperne sammenlignet med den anden, dvs. de observerede forskelle skyldes tilfældigheder.

Testens styrke kan bedømmes ud fra placeringen af ​​nul inden for konfidensintervallet. Hvis nul er tæt på den nedre eller øvre grænse af intervallet, så er det muligt, at med et større antal grupper, der sammenlignes, vil forskellene nå statistisk signifikans. Hvis nul er tæt på midten af ​​intervallet, betyder det, at både en stigning og et fald i indikatoren i forsøgsgruppen er lige sandsynlige, og sandsynligvis er der ingen forskelle.

Eksempler:

For at sammenligne kirurgisk dødelighed ved brug af to forskellige typer anæstesi: 61 personer blev opereret med den første type anæstesi, 8 døde, med den anden type - 67 personer, 10 døde.

d1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Forskellen i dødelighed af de sammenlignede metoder vil ligge i området (-0,018 - 0,122; -0,018 + 0,122) eller (-0,14; 0,104) med en sandsynlighed på 100(1-a) = 95%. Intervallet indeholder nul, dvs. hypotesen om ens dødelighed med to forskellige typer anæstesi kan ikke afvises.

Dødeligheden kan og vil således falde til 14 % og stige til 10,4 % med en sandsynlighed på 95 %, dvs. nul er omtrent midt i intervallet, så det kan argumenteres for, at disse to metoder højst sandsynligt ikke adskiller sig i dødelighed.

I det tidligere omtalte eksempel blev den gennemsnitlige pressetid under tappetesten sammenlignet i fire grupper af studerende, som var forskellige i eksamensresultater. Lad os beregne konfidensintervallerne for den gennemsnitlige pressetid for elever, der bestod eksamen med karaktererne 2 og 5, og konfidensintervallet for forskellen mellem disse gennemsnit.

Elevens koefficienter findes ved hjælp af Students fordelingstabeller (se bilag): for den første gruppe: = t(0,05;48) = 2,011; for den anden gruppe: = t(0,05;61) = 2,000. Således konfidensintervaller for den første gruppe: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), for den anden gruppe (156,55- 2.000*1,805; (0,15) ; 160,3). Så for dem, der bestod eksamen med 2, varierer den gennemsnitlige pressetid fra 157,8 ms til 166,6 ms med en sandsynlighed på 95 %, for dem, der bestod eksamen med 5 – fra 152,8 ms til 160,3 ms med en sandsynlighed på 95 % .

Du kan også teste nulhypotesen ved at bruge konfidensintervaller for middelværdier og ikke kun for forskellen i middelværdier. For eksempel, som i vores tilfælde, hvis konfidensintervallerne for midlerne overlapper hinanden, kan nulhypotesen ikke forkastes. For at forkaste en hypotese på et valgt signifikansniveau må de tilsvarende konfidensintervaller ikke overlappe hinanden.

Lad os finde konfidensintervallet for forskellen i den gennemsnitlige pressetid i de grupper, der bestod eksamen med karaktererne 2 og 5. Forskel på gennemsnit: 162,19 – 156,55 = 5,64. Elevens koefficient: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Gruppestandardafvigelser vil være lig med: ; . Vi beregner den gennemsnitlige fejl af forskellen mellem middelværdierne: . Konfidensinterval: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Så forskellen i den gennemsnitlige pressetid i grupperne, der bestod eksamen med 2 og 5, vil ligge i området fra -0,044 ms til 11,33 ms. Dette interval omfatter nul, dvs. Den gennemsnitlige pressetid for dem, der bestod eksamen godt, kan enten stige eller falde i forhold til dem, der bestod eksamen utilfredsstillende, dvs. nulhypotesen kan ikke forkastes. Men nul er meget tæt på den nedre grænse, og pressetiden er meget mere tilbøjelig til at falde for dem, der bestod godt. Således kan vi konkludere, at der stadig er forskelle i den gennemsnitlige pressetid mellem dem, der passerede 2 og 5, vi kunne bare ikke opdage dem i betragtning af ændringen i den gennemsnitlige tid, spredningen af ​​den gennemsnitlige tid og stikprøvestørrelserne.



En tests magt er sandsynligheden for at forkaste en forkert nulhypotese, dvs. finde forskelle, hvor de faktisk findes.

Testens styrke bestemmes ud fra signifikansniveauet, størrelsen af ​​forskelle mellem grupper, spredningen af ​​værdier i grupper og størrelsen af ​​prøver.

Til Students t-test og variansanalyse kan følsomhedsdiagrammer bruges.

Kriteriets magt kan bruges til foreløbigt at bestemme det nødvendige antal grupper.

Konfidensintervallet viser inden for hvilke grænser den sande værdi af den estimerede parameter ligger med en given sandsynlighed.

Ved hjælp af konfidensintervaller kan du teste statistiske hypoteser og drage konklusioner om kriteriernes følsomhed.

LITTERATUR.

Glanz S. – Kapitel 6,7.

Rebrova O.Yu. – s.112-114, s.171-173, s.234-238.

Sidorenko E.V. – s.32-33.

Spørgsmål til selvtest af elever.

1. Hvad er styrken af ​​kriteriet?

2. I hvilke tilfælde er det nødvendigt at vurdere kriteriernes magt?

3. Metoder til beregning af effekt.

6. Hvordan tester man en statistisk hypotese ved hjælp af et konfidensinterval?

7. Hvad kan man sige om kriteriets magt ved beregning af konfidensintervallet?

Opgaver.

Konfidensinterval

Konfidensinterval- et udtryk, der bruges i matematisk statistik til interval (i modsætning til punkt) estimering af statistiske parametre, hvilket er at foretrække, når stikprøvestørrelsen er lille. Et konfidensinterval er et, der dækker en ukendt parameter med en given pålidelighed.

Metoden med konfidensintervaller er udviklet af den amerikanske statistiker Jerzy Neumann, baseret på ideerne fra den engelske statistiker Ronald Fisher.

Definition

Konfidensinterval for parameteren θ tilfældig variabel fordeling x med konfidensniveau 100 p%, genereret af prøven ( x 1 ,…,x n), kaldes et interval med grænser ( x 1 ,…,x n) og ( x 1 ,…,x n), som er realiseringer af stokastiske variable L(x 1 ,…,x n) og U(x 1 ,…,x n), sådan at

.

Grænsepunkterne for konfidensintervallet kaldes tillidsgrænser.

En intuitionsbaseret fortolkning af konfidensintervallet ville være: hvis s er stor (f.eks. 0,95 eller 0,99), så indeholder konfidensintervallet næsten helt sikkert den sande værdi θ .

En anden fortolkning af begrebet et konfidensinterval: det kan betragtes som et interval af parameterværdier θ kompatible med eksperimentelle data og ikke modsige dem.

Eksempler

  • Konfidensinterval for den matematiske forventning af en normal prøve;
  • Konfidensinterval for normal prøvevarians.

Bayesiansk konfidensinterval

I Bayesiansk statistik er der en lignende, men anderledes definition af et konfidensinterval i nogle nøgledetaljer. Her betragtes selve den estimerede parameter som en tilfældig variabel med en given forudgående fordeling (i det simpleste tilfælde ensartet), og stikprøven er fast (i klassisk statistik er alt præcis det modsatte). Et Bayesiansk konfidensinterval er et interval, der dækker parameterværdien med den posteriore sandsynlighed:

.

Generelt er klassiske og Bayesianske konfidensintervaller forskellige. I den engelsksprogede litteratur kaldes det bayesianske konfidensinterval normalt for udtrykket troværdigt interval, og den klassiske - konfidensinterval.

Noter

Kilder

Wikimedia Foundation. 2010.

  • Børn (film)
  • Kolonist

Se, hvad "Konfidensinterval" er i andre ordbøger:

    Konfidensinterval- et interval beregnet ud fra stikprøvedata, som med en given sandsynlighed (konfidens) dækker den ukendte sande værdi af den estimerede fordelingsparameter. Kilde: GOST 20522 96: Jordbund. Metoder til statistisk behandling af resultater... Ordbogsopslagsbog med vilkår for normativ og teknisk dokumentation

    konfidensinterval- for en skalær parameter for befolkningen er dette et segment, der højst sandsynligt indeholder denne parameter. Denne sætning er meningsløs uden yderligere uddybning. Da grænserne for konfidensintervallet estimeres ud fra stikprøven, er det naturligt at... ... Ordbog over sociologisk statistik

    KONFIDENSINTERVAL- en metode til at estimere parametre, der adskiller sig fra punkt estimering. Lad prøven x1,. . ., xn fra en fordeling med sandsynlighedstæthed f(x, α), og a*=a*(x1, . . ., xn) estimat α, g(a*, α) estimat for sandsynlighedstæthed. Leder efter…… Geologisk encyklopædi

    KONFIDENSINTERVAL- (konfidensinterval) Et interval, hvor pålideligheden af ​​parameterværdien for populationen opnået på grundlag af en stikprøveundersøgelse har en vis grad af sandsynlighed, for eksempel 95 %, hvilket skyldes selve stikprøven. Bredde … … Økonomisk ordbog

    konfidensinterval- er det interval, hvori den sande værdi af den bestemte størrelse er placeret med en given konfidenssandsynlighed. Generel kemi: lærebog / A. V. Zholnin ... Kemiske termer

    Konfidensinterval CI- Konfidensinterval, CI * datainterval, CI * konfidensintervalinterval for den karakteristiske værdi, beregnet for k.l. fordelingsparameter (for eksempel gennemsnitsværdien af ​​en karakteristik) på tværs af stikprøven og med en vis sandsynlighed (for eksempel 95 % for 95 % ... Genetik. encyklopædisk ordbog

    KONFIDENSINTERVAL- et begreb, der opstår ved estimering af en statistisk parameter. fordeling efter interval af værdier. D. og. for parameter q, svarende til denne koefficient. tillid P er lig med et sådant interval (q1, q2), at for enhver sandsynlighedsfordeling af ulighed... ... Fysisk encyklopædi

    konfidensinterval- - Telekommunikationsemner, grundlæggende begreber EN konfidensinterval ... Teknisk oversættervejledning

    konfidensinterval- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: engl. konfidensinterval vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

    konfidensinterval- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: engl. konfidensinterval rus. tillidsområde; konfidensinterval... Chemijos terminų aiškinamasis žodynas