Usaldusvahemiku arvutamise valem füüsika. Usaldusvahemik

Usaldusvahemik– statistilise suuruse piirväärtused, mis antud usaldustõenäosusega γ jäävad suurema mahu proovivõtmisel sellesse intervalli. Tähistatakse kui P(θ - ε. Praktikas valitakse usaldustõenäosus γ üsna ühtsusele lähedaste väärtuste hulgast: γ = 0,9, γ = 0,95, γ = 0,99.

Teenuse eesmärk. Seda teenust kasutades saate kindlaks teha:

  • üldkeskmise usaldusvahemik, dispersiooni usaldusvahemik;
  • standardhälbe usaldusvahemik, üldaktsia usaldusvahemik;
Saadud lahendus salvestatakse Wordi faili (vt näidet). Allpool on videojuhend algandmete täitmiseks.

Näide nr 1. Kolhoosis tehti 1000-pealisest lambakarjast valikuline kontrollpügamine 100-le. Selle tulemusel määrati lamba keskmine villalõikus 4,2 kg. Määrake tõenäosusega 0,99 valimi keskmine ruutviga lamba keskmise villalõikuse määramisel ja piirväärtused, mille piires on lõikeväärtus, kui dispersioon on 2,5. Näidis ei ole korduv.
Näide nr 2. Moskva Põhjatolli postis asuvast importtoodete partiist võeti pistelise kordusproovi teel 20 toote “A” proovi. Katse tulemusena tehti kindlaks toote “A” keskmine niiskusesisaldus proovis, mis osutus 1% standardhälbega võrdseks 6%.
Määrake tõenäosusega 0,683 toote keskmise niiskusesisalduse piirid kogu imporditud tootepartiis.
Näide nr 3. 36 üliõpilase seas läbi viidud küsitlus näitas, et nende poolt loetud õpikute keskmine arv õppeaasta jooksul oli 6. Kui eeldada, et üliõpilase poolt loetud õpikute arv semestris on normaaljaotusseadusega standardhälbega 6, leia : A) selle juhusliku suuruse matemaatilise ootuse usaldusväärsusega 0,99 intervallhinnangut; B) Millise tõenäosusega võib väita, et selle valimi põhjal arvutatud õpikute keskmine arv, mida õpilase loeb semestris, kaldub absoluutväärtuses matemaatilisest ootusest kõrvale mitte rohkem kui 2 võrra.

Usaldusvahemike klassifikatsioon

Hinnatava parameetri tüübi järgi:

Proovi tüübi järgi:

  1. Usaldusvahemik lõpmatu valimi jaoks;
  2. lõpliku proovi usaldusvahemik;
Valimit nimetatakse resamplinguks, kui valitud objekt tagastatakse üldkogumisse enne järgmise valimist. Näidist nimetatakse mittekorduvaks, kui valitud objekti populatsiooni ei tagastata. Praktikas tegeleme tavaliselt mittekorduvate proovidega.

Juhusliku valimi keskmise valimivea arvutamine

Valimist saadud näitajate väärtuste ja üldkogumi vastavate parameetrite lahknevust nimetatakse esindusviga.
Üld- ja näidispopulatsioonide põhiparameetrite tähistused.
Keskmise valimi vea valemid
uuesti valikkorda valikut
keskmiseksjagamisekskeskmiseksjagamiseks
Suhe diskreetimisvea piiri (Δ) vahel on teatud tõenäosusega garanteeritud Р(t), ja keskmine diskreetimisviga on kujul: või Δ = t·μ, kus t– usalduskoefitsient, mis määratakse sõltuvalt tõenäosustasemest P(t) vastavalt Laplace'i integraalfunktsiooni tabelile.

Valemid valimi suuruse arvutamiseks puhtjuhusliku valimi meetodil

Eelmistes alajaotistes käsitlesime tundmatu parameetri hindamise küsimust Aüks number. Seda nimetatakse "punkthinnanguks". Paljude ülesannete puhul ei pea te leidma ainult parameetrit A sobiv arvväärtus, vaid ka hinnata selle täpsust ja usaldusväärsust. Peate teadma, milliseid vigu võib parameetri asendamine kaasa tuua A selle punkthinnang A ja kui suure kindlusega võime eeldada, et need vead ei ületa teadaolevaid piire?

Sedalaadi probleemid on eriti aktuaalsed väikese arvu vaatluste puhul, kui punkthinnang ja sisse on suures osas juhuslik ja a ligikaudne asendamine a-ga võib põhjustada tõsiseid vigu.

Anda aimu hinnangu täpsusest ja usaldusväärsusest A,

Matemaatilises statistikas kasutatakse nn usaldusvahemikke ja usaldustõenäosusi.

Laske parameetri jaoks A kogemusest saadud erapooletu hinnang A. Tahame antud juhul hinnata võimalikku viga. Määrakem mingi piisavalt suur tõenäosus p (näiteks p = 0,9, 0,95 või 0,99), et sündmust tõenäosusega p saaks pidada praktiliselt usaldusväärseks, ja leiame väärtuse s, mille jaoks

Seejärel asendamisel tekkiva vea praktiliselt võimalike väärtuste vahemik A peal A, on ± s; Suured absoluutväärtuse vead ilmnevad ainult väikese tõenäosusega a = 1 - p. Kirjutame (14.3.1) ümber järgmiselt:

Võrdsus (14.3.2) tähendab, et tõenäosusega p on parameetri tundmatu väärtus A jääb intervalli sisse

On vaja märkida üks asjaolu. Varem oleme korduvalt arvestanud tõenäosusega, et juhuslik suurus langeb antud mittejuhuslikku intervalli. Siin on olukord erinev: suurusjärk A ei ole juhuslik, kuid intervall / p on juhuslik. Selle asukoht x-teljel on juhuslik, määratud keskpunkti järgi A; Üldiselt on ka intervalli 2s pikkus juhuslik, kuna s väärtus arvutatakse reeglina katseandmete põhjal. Seetõttu oleks sel juhul parem tõlgendada p väärtust mitte kui tõenäosust punkti "löömiseks" A intervallis / p ja tõenäosusena, et juhuslik intervall / p katab punkti A(joonis 14.3.1).

Riis. 14.3.1

Tavaliselt nimetatakse tõenäosust p usalduse tõenäosus, ja intervall / p - usaldusvahemik. Intervallide piirid Kui. a x = a- s ja a 2 = a + ja neid kutsutakse usalduse piirid.

Andkem usaldusvahemiku mõistele teine ​​tõlgendus: seda võib käsitleda parameetri väärtuste intervallina A,ühilduvad eksperimentaalsete andmetega ega ole nendega vastuolus. Tõepoolest, kui nõustume pidama sündmust tõenäosusega a = 1-p praktiliselt võimatuks, siis on need parameetri a väärtused, mille puhul a - a> s tuleb tunnistada vastuolulisteks katseandmeteks ja need, mille puhul |a - A a t na 2 .

Laske parameetri jaoks A on erapooletu hinnang A. Kui me teaksime suuruse jaotuse seadust A, oleks usaldusvahemiku leidmise ülesanne väga lihtne: piisaks, kui leiad väärtuse s, mille jaoks

Raskus seisneb selles, et hinnangute jaotamise seadus A sõltub suuruse jaotusseadusest X ja seetõttu selle tundmatute parameetrite (eriti parameetri enda) järgi A).

Selle raskuse ületamiseks võite kasutada järgmist ligikaudset tehnikat: asendage avaldises olevad tundmatud parameetrid nende punkthinnangutega. Suhteliselt suure hulga katsetega P(umbes 20...30) annab see tehnika tavaliselt täpsuse poolest rahuldavad tulemused.

Vaatleme näiteks matemaatilise ootuse usaldusvahemiku probleemi.

Las toodetakse P X, mille tunnusteks on matemaatiline ootus T ja dispersioon D- teadmata. Nende parameetrite kohta saadi järgmised hinnangud:

Matemaatilise ootuse jaoks on vaja konstrueerida usaldusvahemik / p, mis vastab usaldustõenäosusele p T kogused X.

Selle probleemi lahendamisel kasutame seda, et kogus T esindab summat P sõltumatud identselt jaotatud juhuslikud muutujad X h ja keskpiiri teoreemi kohaselt piisavalt suure P selle jaotusseadus on normilähedane. Praktikas võib isegi suhteliselt väikese liikmete arvuga (umbes 10...20) summa jaotusseadust pidada ligikaudu normaalseks. Eeldame, et väärtus T jaotatakse tavaseaduse järgi. Selle seaduse tunnused – matemaatiline ootus ja dispersioon – on vastavalt võrdsed T Ja

(vt ptk 13 alajaotis 13.3). Oletame, et väärtus D me teame ja leiame väärtuse Ep, mille jaoks

Kasutades 6. peatüki valemit (6.3.5), väljendame tõenäosuse (14.3.5) vasakul küljel normaaljaotuse funktsiooni kaudu

kus on hinnangu standardhälve T.

Alates Eq.

leidke Sp väärtus:

kus arg Ф* (х) on Ф* pöördfunktsioon (X), need. argumendi selline väärtus, mille normaaljaotuse funktsioon on võrdne X.

Dispersioon D, mille kaudu kogust väljendatakse A 1P, me ei tea täpselt; selle ligikaudse väärtusena võite kasutada hinnangut D(14.3.4) ja pange ligikaudu:

Seega on usaldusvahemiku konstrueerimise probleem ligikaudu lahendatud, mis on võrdne:

kus gp määratakse valemiga (14.3.7).

Pöördinterpolatsiooni vältimiseks funktsiooni Ф* (l) tabelites s p arvutamisel on mugav koostada spetsiaalne tabel (tabel 14.3.1), mis annab suuruse väärtused.

olenevalt r-st. Väärtus (p määrab normaalseaduse jaoks standardhälbete arvu, mis tuleb joonistada dispersioonikeskmest paremale ja vasakule nii, et tõenäosus saada saadud alale on võrdne p-ga.

Väärtuse 7 p kaudu väljendatakse usaldusvahemikku järgmiselt:

Tabel 14.3.1

Näide 1. Kogusega viidi läbi 20 katset X; tulemused on toodud tabelis. 14.3.2.

Tabel 14.3.2

Koguse matemaatilise ootuse jaoks on vaja leida hinnang X ja konstrueerida usaldusvahemik, mis vastab usalduse tõenäosusele p = 0,8.

Lahendus. Meil on:

Valides võrdluspunktiks l: = 10, leiame kolmanda valemi (14.2.14) abil erapooletu hinnangu D :

Tabeli järgi 14.3.1 leiame

Usalduse piirid:

Usaldusvahemik:

Parameetrite väärtused T, selles intervallis asuvad andmed ühilduvad tabelis toodud katseandmetega. 14.3.2.

Dispersiooni usaldusvahemiku saab koostada sarnasel viisil.

Las toodetakse P sõltumatud katsed juhusliku muutujaga X tundmatute parameetritega nii A kui ka dispersiooni jaoks D saadi erapooletu hinnang:

Dispersiooni jaoks on vaja ligikaudselt konstrueerida usaldusvahemik.

Valemist (14.3.11) on selge, et kogus D esindab

summa P juhuslikud muutujad kujul . Need väärtused ei ole

sõltumatu, kuna ükskõik milline neist sisaldab kogust T, sõltuvad kõigist teistest. Siiski võib näidata, et suurenedes P ka nende summa jaotusseadus läheneb normaalsele. Peaaegu kell P= 20...30 võib seda juba normaalseks pidada.

Oletame, et see on nii, ja leiame selle seaduse tunnused: matemaatiline ootus ja dispersioon. Alates hindamisest D- siis erapooletu M[D] = D.

Dispersiooni arvutamine D D on seotud suhteliselt keerukate arvutustega, seega esitame selle avaldise ilma tuletamiseta:

kus q 4 on suuruse neljas keskmoment X.

Selle avaldise kasutamiseks peate asendama väärtused\u003d 4 ja D(vähemalt lähedased). Selle asemel D võite kasutada tema hinnangut D. Põhimõtteliselt võib neljanda keskse momendi asendada ka hinnanguga, näiteks vormi väärtusega:

kuid selline asendamine annab äärmiselt madala täpsuse, kuna üldiselt määratakse piiratud arvu katsete korral kõrge astme momendid suurte vigadega. Praktikas juhtub aga sageli, et kogusejaotuse seaduse tüüp X ette teada: teadmata on ainult selle parameetrid. Seejärel võite proovida väljendada μ 4 läbi D.

Võtame kõige tavalisema juhtumi, kui väärtus X jaotatakse tavaseaduse kohaselt. Seejärel väljendatakse selle neljandat keskmomenti hajuvusena (vt 6. peatüki alajaotis 6.2);

ja valem (14.3.12) annab või

Tundmatu asendamine (14.3.14) D tema hinnang D, saame: kust

Momenti μ 4 saab väljendada läbi D ka mõnel muul juhul, kui väärtuse jaotus X ei ole normaalne, kuid selle välimus on teada. Näiteks ühtlase tiheduse seaduse jaoks (vt 5. peatükk) on meil:

kus (a, P) on intervall, millel seadus on täpsustatud.

Seega

Kasutades valemit (14.3.12) saame: kust me ligikaudu leiame

Juhtudel, kui suuruse 26 jaotusseaduse tüüp on teadmata, on väärtuse a/) ligikaudse hinnangu tegemisel siiski soovitatav kasutada valemit (14.3.16), välja arvatud juhul, kui on erilist põhjust arvata, et see seadus on tavalisest väga erinev (on märgatav positiivne või negatiivne kurtoos) .

Kui ligikaudne väärtus a/) saadakse ühel või teisel viisil, siis saame dispersioonile konstrueerida usaldusvahemiku samamoodi, nagu koostasime selle matemaatilise ootuse jaoks:

kus antud tõenäosusest p sõltuv väärtus leitakse tabeli järgi. 14.3.1.

Näide 2. Leidke juhusliku suuruse dispersiooni ligikaudu 80% usaldusvahemik X näite 1 tingimustel, kui on teada, et väärtus X jaotatakse normaalsele lähedase seaduse järgi.

Lahendus. Väärtus jääb samaks, mis tabelis. 14.3.1:

Vastavalt valemile (14.3.16)

Kasutades valemit (14.3.18) leiame usaldusvahemiku:

Vastav standardhälbe väärtuste vahemik: (0,21; 0,29).

14.4. Täpsed meetodid normaalseaduse järgi jaotatud juhusliku suuruse parameetrite usaldusvahemike konstrueerimiseks

Eelmises alapeatükis uurisime ligikaudseid meetodeid matemaatiliste ootuste ja dispersiooni usaldusvahemike koostamiseks. Siin anname ülevaate täpsetest meetoditest sama probleemi lahendamiseks. Rõhutame, et usaldusvahemike täpseks leidmiseks on tingimata vaja eelnevalt teada suuruse jaotusseaduse kuju X, samas kui ligikaudsete meetodite rakendamiseks pole see vajalik.

Usaldusvahemike konstrueerimise täpsete meetodite idee taandub järgmisele. Mis tahes usaldusvahemik leitakse tingimusest, mis väljendab teatud ebavõrdsuse täitmise tõenäosust, mis sisaldab meid huvitavat hinnangut A. Hindamisjaotuse seadus Aüldiselt sõltub koguse tundmatutest parameetritest X. Mõnikord on aga võimalik juhuslikust suurusest ebavõrdsust sisse kanda A mõnele muule vaadeldavate väärtuste funktsioonile X p X 2, ..., X lk. mille jaotusseadus ei sõltu tundmatutest parameetritest, vaid sõltub ainult katsete arvust ja suuruse jaotusseaduse tüübist X. Seda tüüpi juhuslikud muutujad mängivad matemaatilises statistikas olulist rolli; neid on kõige detailsemalt uuritud koguse normaaljaotuse korral X.

Näiteks on tõestatud, et väärtuse normaaljaotusega X juhuslik väärtus

allub nn Üliõpilaste jagamise seadus Koos P- 1 vabadusaste; selle seaduse tihedusel on vorm

kus G(x) on teadaolev gammafunktsioon:

Samuti on tõestatud, et juhuslik suurus

on "%2 jaotus" koos P- 1 vabadusaste (vt 7. peatükk), mille tihedust väljendatakse valemiga

Jaotuste (14.4.2) ja (14.4.4) tuletustel peatumata näitame, kuidas neid saab rakendada parameetrite usaldusvahemike koostamisel. ty D.

Las toodetakse P sõltumatud katsed juhusliku muutujaga X, tavaliselt jaotatud tundmatute parameetritega T&O. Nende parameetrite kohta saadi hinnangud

Mõlema parameetri jaoks on vaja konstrueerida usaldusvahemikud, mis vastavad usalduse tõenäosusele p.

Koostame esmalt matemaatilise ootuse usaldusvahemiku. On loomulik, et see intervall on sümmeetriline T; tähistame s p poolt intervalli pikkusest. Väärtus s p tuleb valida nii, et tingimus oleks täidetud

Proovime liikuda juhuslikust suurusest võrdsuse (14.4.5) vasakule poole T juhuslikule suurusele T, levitatakse vastavalt Studenti seadusele. Selleks korrutage võrratuse |m-w?| mõlemad pooled

positiivse väärtuse järgi: või kasutades tähistust (14.4.1),

Leiame sellise arvu / p, et väärtuse / p leiaks tingimusest

Valemist (14.4.2) on selge, et (1) on paarisfunktsioon, mistõttu (14.4.8) annab

Võrdsus (14.4.9) määrab väärtuse / p sõltuvalt p-st. Kui teie käsutuses on integraalväärtuste tabel

siis saab /p väärtuse leida pöördinterpolatsiooni teel tabelist. Siiski on mugavam koostada /p väärtuste tabel eelnevalt. Selline tabel on toodud lisas (tabel 5). See tabel näitab väärtusi, mis sõltuvad usaldustasemest p ja vabadusastmete arvust P- 1. Olles määranud tabelist / p. 5 ja eeldades

leiame poole usaldusvahemiku / p laiusest ja intervalli enda

Näide 1. Juhusliku muutujaga viidi läbi 5 sõltumatut katset X, tavaliselt jaotatud tundmatute parameetritega T ja umbes. Katsete tulemused on toodud tabelis. 14.4.1.

Tabel 14.4.1

Otsi hinnang T matemaatilise ootuse jaoks ja konstrueerida selle jaoks 90% usaldusvahemik / p (st intervall, mis vastab usaldustõenäosusele p = 0,9).

Lahendus. Meil on:

Taotluse tabeli 5 kohaselt P - 1 = 4 ja p = 0,9 leiame kus

Usaldusvahemik on

Näide 2. Alajaotise 14.3 näite 1 tingimuste jaoks, eeldades väärtust X normaalselt jaotatud, leidke täpne usaldusvahemik.

Lahendus. Vastavalt lisa tabelile 5 leiame millal P - 1 = 19ir =

0,8 / p = 1,328; siit

Võrreldes alajao 14.3 näite 1 lahendusega (e p = 0,072), oleme veendunud, et lahknevus on väga ebaoluline. Kui säilitame täpsuse teise kümnendkoha täpsusega, langevad täpse ja ligikaudse meetodiga leitud usaldusvahemikud kokku:

Liigume edasi dispersiooni usaldusvahemiku konstrueerimise juurde. Mõelge erapooletu dispersioonihinnangule

ja väljendada juhuslikku suurust D suurusjärgu kaudu V(14.4.3), jaotus x 2 (14.4.4):

Koguste jaotumise seaduse tundmine V, leiad intervalli /(1), millesse see antud tõenäosusega p.

Jaotamise seadus kn_x(v) suurusjärk I 7 on joonisel fig. 14.4.1.

Riis. 14.4.1

Tekib küsimus: kuidas valida intervalli / p? Kui suurusjaotuse seadus V oli sümmeetriline (nagu normaalseadus või Studenti jaotus), oleks loomulik võtta intervall /p matemaatilise ootuse suhtes sümmeetriliseks. Sel juhul seadus k p_x (v) asümmeetriline. Leppigem kokku, et valime intervalli /p nii, et väärtuse tõenäosus on V väljaspool intervalli paremale ja vasakule (varjutatud alad joonisel 14.4.1) olid samad ja võrdsed

Selle omadusega intervalli /p konstrueerimiseks kasutame tabelit. 4 rakendust: see sisaldab numbreid y) selline, et

väärtuse eest V, millel on x 2 -jaotus r vabadusastmega. Meie puhul r = n- 1. Parandame r = n- 1 ja leidke tabeli vastavast reast. 4 kaks tähendust x 2 -üks vastab tõenäosusele teine ​​- tõenäosus Tähistame need

väärtused kell 2 Ja xl? Intervall on y 2, vasakuga ja y~õige ots.

Nüüd leiame intervallist / p soovitud usaldusvahemiku /| piiridega D dispersiooni jaoks ja D2, mis katab asja D tõenäosusega p:

Koostame intervalli / (, = (?> ь А), mis katab punkti D siis ja ainult siis, kui väärtus V langeb intervalli /r. Näitame, et intervall

vastab sellele tingimusele. Tõepoolest, ebavõrdsus on samaväärsed ebavõrdsusega

ja need ebavõrdsused on rahuldatud tõenäosusega p. Seega on dispersiooni usaldusvahemik leitud ja seda väljendatakse valemiga (14.4.13).

Näide 3. Leidke dispersiooni usaldusvahemik alajaotise 14.3 näite 2 tingimustel, kui on teada, et väärtus X normaalselt jaotunud.

Lahendus. Meil on . Vastavalt lisa tabelile 4

leiame aadressil r = n - 1 = 19

Valemi (14.4.13) abil leiame dispersiooni usaldusvahemiku

Standardhälbe vastav intervall on (0,21; 0,32). See intervall ületab vaid pisut ligikaudse meetodiga alajao 14.3 näites 2 saadud intervalli (0,21; 0,29).

  • Joonisel 14.3.1 on usaldusvahemik a suhtes sümmeetriline. Üldiselt, nagu me hiljem näeme, pole see vajalik.

Iga valim annab ainult ligikaudse ettekujutuse üldkogumist ja kõik valimi statistilised karakteristikud (keskmine, moodus, dispersioon...) on üldiste parameetrite ligikaudsed või näiteks hinnangud, mida enamikul juhtudel ei ole võimalik välja arvutada. üldrahvastiku ligipääsmatuseni (joonis 20) .

Joonis 20. Valimiviga

Kuid saate määrata intervalli, milles teatud tõenäosusega asub statistilise tunnuse tegelik (üldine) väärtus. Seda intervalli nimetatakse d usaldusvahemik (CI).

Seega on üldine keskmine väärtus 95% tõenäosusega sees

alates kuni, (20)

Kus t – Student’s testi tabeli väärtus α =0,05 ja f= n-1

Sel juhul võib leida ka 99% CI t jaoks valitud α =0,01.

Mis on usaldusvahemiku praktiline tähtsus?

    Lai usaldusvahemik näitab, et valimi keskmine ei kajasta populatsiooni keskmist täpselt. Tavaliselt on selle põhjuseks valimi ebapiisav suurus või selle heterogeensus, s.t. suur dispersioon. Mõlemad annavad suurema keskmise vea ja vastavalt laiema CI. Ja see on aluseks uurimistöö planeerimise etappi naasmiseks.

    CI ülemine ja alumine piir annavad hinnangu selle kohta, kas tulemused on kliiniliselt olulised

Peatugem üksikasjalikumalt rühmaomaduste uurimise tulemuste statistilise ja kliinilise olulisuse küsimusel. Meenutagem, et statistika ülesanne on avastada näidisandmete põhjal vähemalt mõningaid erinevusi üldpopulatsioonides. Arstide väljakutse on tuvastada erinevusi (mitte ainult kõiki), mis aitavad diagnoosida või ravida. Ja statistilised järeldused ei ole alati kliiniliste järelduste aluseks. Seega statistiliselt oluline hemoglobiini langus 3 g/l ei tekita muret. Ja vastupidi, kui mõni probleem inimkehas ei ole kogu elanikkonna tasandil laialt levinud, ei ole see põhjus selle probleemiga mitte tegeleda.

Vaatame seda olukorda näide.

Teadlased mõtlesid, kas mõnda nakkushaigust põdenud poisid jäävad kasvus oma eakaaslastest maha. Selleks viidi läbi valikuuring, milles osales 10 seda haigust põdenud poissi. Tulemused on toodud tabelis 23.

Tabel 23. Statistilise töötlemise tulemused

madalam limiit

ülempiir

Standardid (cm)

keskmine

Nendest arvutustest järeldub, et mõnda nakkushaigust põdenud 10-aastaste poiste valimi keskmine pikkus on normilähedane (132,5 cm). Usaldusvahemiku alumine piir (126,6 cm) viitab aga sellele, et 95% tõenäosusega vastab nende laste tegelik keskmine pikkus „lühikese pikkuse“ mõistele, s.t. need lapsed on kidurad.

Selles näites on usaldusvahemiku arvutuste tulemused kliiniliselt olulised.

Usaldusvahemik tuleb meile statistika valdkonnast. See on teatud vahemik, mille abil saab hinnata tundmatut parameetrit suure usaldusväärsusega. Kõige lihtsam on seda selgitada näitega.

Oletame, et peate uurima mõnda juhuslikku muutujat, näiteks serveri reageerimiskiirust kliendi päringule. Iga kord, kui kasutaja sisestab konkreetse saidi aadressi, vastab server erineva kiirusega. Seega on uuritav reaktsiooniaeg juhuslik. Niisiis, usaldusvahemik võimaldab meil määrata selle parameetri piirid ja siis võime öelda, et 95% tõenäosusega jääb server meie arvutatud vahemikku.

Või peate välja selgitama, kui paljud inimesed ettevõtte kaubamärgist teavad. Usaldusvahemiku arvutamisel saab näiteks väita, et 95% tõenäosusega jääb sellest teadlike tarbijate osakaal vahemikku 27-34%.

Selle terminiga on tihedalt seotud usalduse tõenäosuse väärtus. See näitab tõenäosust, et soovitud parameeter sisaldub usaldusvahemikus. Sellest väärtusest sõltub see, kui suur on meie soovitud vahemik. Mida suurema väärtuse see võtab, seda kitsamaks muutub usaldusvahemik ja vastupidi. Tavaliselt on see 90%, 95% või 99%. Väärtus 95% on kõige populaarsem.

Seda näitajat mõjutab ka vaatluste hajuvus ja selle definitsioon põhineb eeldusel, et uuritav tunnus järgib seda väidet nimetatakse ka Gaussi seaduseks. Tema järgi on normaalne pideva juhusliku suuruse kõigi tõenäosuste jaotus, mida saab kirjeldada tõenäosustihedusega. Kui normaaljaotuse eeldus on vale, võib hinnang olla vale.

Esiteks selgitame välja, kuidas arvutada usaldusvahemikku Siin on kaks võimalikku juhtumit. Dispersioon (juhusliku suuruse leviku määr) võib olla teada, aga võib ka mitte teada. Kui see on teada, arvutatakse meie usaldusvahemik järgmise valemi abil:

xsr – t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - märk,

t - parameeter Laplace'i jaotustabelist,

σ on dispersiooni ruutjuur.

Kui dispersioon on teadmata, saab selle arvutada, kui teame kõiki soovitud tunnuse väärtusi. Selleks kasutatakse järgmist valemit:

σ2 = х2ср - (хср)2, kus

х2ср - uuritava tunnuse ruutude keskmine väärtus,

(хср)2 on selle tunnuse ruut.

Usaldusvahemiku arvutamise valem sel juhul muutub veidi:

xsr – t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr – valimi keskmine,

α - märk,

t on parameeter, mis leitakse Studenti jaotustabeli abil t = t(ɣ;n-1),

sqrt(n) – ruutjuur kogu valimi suurusest,

s on dispersiooni ruutjuur.

Mõelge sellele näitele. Oletame, et 7 mõõtmise tulemuste põhjal määrati uuritud tunnuseks 30 ja valimi dispersiooniks 36. Tõenäosusega 99% on vaja leida usaldusvahemik, mis sisaldab tõest mõõdetud parameetri väärtus.

Kõigepealt määrame, millega t on võrdne: t = t (0,99; 7-1) = 3,71. Kasutades ülaltoodud valemit, saame:

xsr – t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71 * 36 / (ruut (7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Dispersiooni usaldusvahemik arvutatakse nii teadaoleva keskmise korral kui ka siis, kui puuduvad andmed matemaatilise ootuse kohta ning on teada vaid dispersiooni punkthinnangu väärtus. Me ei anna siin selle arvutamiseks valemeid, kuna need on üsna keerulised ja soovi korral leiate alati Internetist.

Pangem vaid tähele, et usaldusvahemikku on mugav määrata Exceli või võrguteenuse abil, mida nii nimetatakse.

Usaldusintervallide hindamine

Õppeeesmärgid

Statistika arvestab järgmist kaks peamist ülesannet:

    Meil on näidisandmetel põhinev hinnang ja me tahame teha tõenäosusliku väite selle kohta, kus asub hinnangulise parameetri tegelik väärtus.

    Meil on konkreetne hüpotees, mida tuleb prooviandmete abil testida.

Selles teemas käsitleme esimest ülesannet. Tutvustame ka usaldusvahemiku määratlust.

Usaldusvahemik on intervall, mis on üles ehitatud parameetri hinnangulise väärtuse ümber ja näitab, kus asub hinnangulise parameetri tegelik väärtus a priori määratud tõenäosusega.

Pärast selle teema materjali uurimist:

    õppida, mis on usaldusvahemik;

    õppida klassifitseerima statistilisi probleeme;

    valdama usaldusvahemike konstrueerimise tehnikat, kasutades nii statistilisi valemeid kui ka tarkvaratööriistu;

    õppida määrama vajalikke valimi suurusi, et saavutada statistiliste hinnangute täpsuse teatud parameetrid.

Valimi tunnuste jaotused

T-jaotus

Nagu eespool mainitud, on juhusliku suuruse jaotus lähedane standardiseeritud normaaljaotusele parameetritega 0 ja 1. Kuna me ei tea σ väärtust, asendame selle mõne s hinnanguga. Kogusel on juba erinev jaotus, nimelt või Õpilaste jaotus, mis määratakse parameetriga n -1 (vabadusastmete arv). See jaotus on lähedane normaaljaotusele (mida suurem n, seda lähemal on jaotused).

Joonisel fig. 95
esitatakse õpilaste jaotus 30 vabadusastmega. Nagu näete, on see normaaljaotusele väga lähedal.

Sarnaselt normaaljaotusega NORMIDIST ja NORMINV töötavatele funktsioonidele on olemas ka t-jaotusega töötamise funktsioonid - STUDIST (TDIST) ja STUDRASOBR (TINV). Nende funktsioonide kasutamise näide on näha failis STUDRASP.XLS (mall ja lahendus) ja joonisel fig. 96
.

Muude tunnuste jaotused

Nagu me juba teame, vajame matemaatilise ootuse hindamise täpsuse määramiseks t-jaotust. Teiste parameetrite, näiteks dispersiooni, hindamiseks on vaja erinevaid jaotusi. Kaks neist on F-jaotus ja x 2 -jaotus.

Keskmise usaldusvahemik

Usaldusvahemik- see on intervall, mis on üles ehitatud parameetri hinnangulise väärtuse ümber ja näitab, kus asub hinnangulise parameetri tegelik väärtus a priori määratud tõenäosusega.

Tekib keskmise väärtuse usaldusvahemiku konstrueerimine järgmisel viisil:

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks selle järele plaanib juht valida juba proovinute hulgast juhuslikult 40 külastajat ja paluda neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata eeldatavat punktide arv, mille uus toode saab, ja koostage selle hinnangu jaoks 95% usaldusvahemik. Kuidas seda teha? (vt faili SANDWICH1.XLS (mall ja lahendus).

Lahendus

Selle probleemi lahendamiseks võite kasutada. Tulemused on esitatud joonisel fig. 97
.

Koguväärtuse usaldusvahemik

Mõnikord on näidisandmete abil vaja hinnata mitte matemaatilist ootust, vaid väärtuste kogusummat. Näiteks olukorras, kus on audiitor, võib huvi pakkuda mitte konto keskmise suuruse, vaid kõigi kontode summa hindamine.

Olgu N elementide koguarv, n valimi suurus, T 3 valimi väärtuste summa, T" kogu populatsiooni summa hinnang, siis , ja usaldusvahemik arvutatakse valemiga , kus s on valimi standardhälbe hinnang ja valimi keskmise hinnang.

Näide

Oletame, et maksuamet soovib hinnata 10 000 maksumaksja kogumaksutagastust. Maksumaksja kas saab raha tagasi või maksab täiendavalt makse. Leidke tagasimakse summa 95% usaldusvahemik, eeldades, et valimi suurus on 500 inimest (vt faili AMOUNT OF REFUND.XLS (mall ja lahendus).

Lahendus

StatPro-l ei ole selleks puhuks spetsiaalset protseduuri, kuid võib märkida, et piirid saab ülaltoodud valemite põhjal keskmise jaoks saada piiridest (joon. 98
).

Proportsiooni usaldusvahemik

Olgu p klientide osakaalu matemaatiline ootus ja p b selle osakaalu hinnang, mis saadakse n suuruse valimi põhjal. Võib näidata, et piisavalt suur hindamise jaotus on matemaatilise ootuse p ja standardhälbe korral normaalsele lähedane . Hinnangu standardviga väljendatakse sel juhul järgmiselt , ja usaldusvahemik on nagu .

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks valis juht juhuslikult 40 külastajat juba proovinute seast ja palus neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata eeldatavat osakaalu kliendid, kes hindavad uut toodet vähemalt 6 punktiga (ta eeldab, et need kliendid on uue toote tarbijad).

Lahendus

Algselt loome uue veeru atribuudi 1 alusel, kui kliendi hinnang oli üle 6 punkti ja muul juhul 0 (vt faili SANDWICH2.XLS (mall ja lahendus).

1. meetod

Arvu 1 lugedes hindame osakaalu ja seejärel kasutame valemeid.

Zcr väärtus võetakse spetsiaalsetest normaaljaotuse tabelitest (näiteks 1,96 95% usaldusvahemiku korral).

Kasutades seda lähenemisviisi ja konkreetseid andmeid 95% intervalli koostamiseks, saame järgmised tulemused (joonis 99
). Parameetri zcr kriitiline väärtus on 1,96. Hinnangu standardviga on 0,077. Usaldusvahemiku alumine piir on 0,475. Usaldusvahemiku ülempiir on 0,775. Seega on juhil õigus 95% kindlusega uskuda, et klientide osakaal, kes hindab uut toodet 6 punkti või kõrgemalt, jääb vahemikku 47,5–77,5.

2. meetod

Selle probleemi saab lahendada standardsete StatPro tööriistade abil. Selleks piisab, kui märkida, et osakaal langeb sel juhul kokku veeru Tüüp keskmise väärtusega. Järgmisena kandideerime StatPro/Statistiline järeldus/Ühe proovi analüüs et koostada veeru Tüüp keskmise (matemaatilise ootuse hinnangu) usaldusvahemik. Sel juhul saadud tulemused on väga lähedased 1. meetodi tulemustele (joonis 99).

Standardhälbe usaldusvahemik

s kasutatakse standardhälbe hinnanguna (valem on toodud jaotises 1). Hinnangu s tihedusfunktsioon on hii-ruutfunktsioon, millel on sarnaselt t-jaotusele n-1 vabadusastet. Selle distributsiooniga CHIDIST ja CHIINV on töötamiseks spetsiaalsed funktsioonid.

Sel juhul ei ole usaldusvahemik enam sümmeetriline. Tavaline piiride diagramm on näidatud joonisel fig. 100 .

Näide

Masin peab tootma 10 cm läbimõõduga detaile. Erinevate asjaolude tõttu tuleb aga ette vigu. Kvaliteedikontrolör on mures kahe asjaolu pärast: esiteks peaks keskmine väärtus olema 10 cm; teiseks, isegi sel juhul, kui kõrvalekalded on suured, lükatakse paljud osad tagasi. Iga päev teeb ta 50 osast koosneva näidise (vt faili QUALITY CONTROL.XLS (mall ja lahendus). Milliseid järeldusi saab selline näidis anda?

Lahendus

Koostame 95% usaldusvahemikud keskmise ja standardhälbe jaoks kasutades StatPro/Statistiline järeldus/Ühe proovi analüüs(Joonis 101
).

Järgmisena arvutame läbimõõtude normaaljaotuse eeldust kasutades defektsete toodete osakaalu, seades maksimaalseks hälbeks 0,065. Kasutades asendustabeli võimalusi (kahe parameetri juhtum), joonistame defektide osakaalu sõltuvuse keskmisest väärtusest ja standardhälbest (joon. 102).
).

Kahe keskmise erinevuse usaldusvahemik

See on statistiliste meetodite üks olulisemaid rakendusi. Näited olukordadest.

    Rõivapoe juhataja tahaks teada, kui palju keskmine naisklient poes rohkem või vähem kulutab kui keskmine meesklient.

    Need kaks lennufirmat lendavad sarnastel marsruutidel. Tarbijaorganisatsioon soovib võrrelda mõlema lennufirma keskmiste eeldatavate lendude hilinemise aegade erinevust.

    Ettevõte saadab teatud tüüpi kaupade kuponge ühes linnas, teises mitte. Juhid soovivad võrrelda nende toodete keskmisi ostumahte järgmise kahe kuu jooksul.

    Automüüja tegeleb esitlustel sageli abielupaaridega. Et mõista nende isiklikke reaktsioone esitlusele, intervjueeritakse paare sageli eraldi. Juht soovib hinnata meeste ja naiste antud hinnangute erinevust.

Sõltumatute proovide juhtum

Keskmiste erinevusel on t-jaotus n 1 + n 2 - 2 vabadusastmega. Usaldusvahemikku μ 1 - μ 2 jaoks väljendab seos:

Seda probleemi saab lahendada mitte ainult ülaltoodud valemite, vaid ka standardsete StatPro tööriistade abil. Selleks piisab, kui kasutada

Proportsioonide erinevuse usaldusvahemik

Laskma olla aktsiate matemaatiline ootus. Olgu nende valimi hinnangud, mis on koostatud vastavalt n 1 ja n 2 suurustest valimitest. Siis on erinevuse hinnang. Seetõttu väljendatakse selle erinevuse usaldusvahemikku järgmiselt:

Siin on z cr väärtus, mis saadakse spetsiaalsete tabelite abil normaaljaotusest (näiteks 1,96 95% usaldusvahemiku korral).

Hinnangu standardviga väljendatakse sel juhul seosega:

.

Näide

Suureks müügiks valmistuv pood võttis ette järgmised turundusuuringud. 300 parimat ostjat valiti välja ja jagati juhuslikult kahte 150-liikmelisse rühma. Kõikidele väljavalitud ostjatele saadeti kutsed müügil osalemiseks, kuid ainult esimese grupi liikmed said kupongi, mis annab õiguse 5% allahindlusele. Müügi käigus fikseeriti kõigi 300 valitud ostja ostud. Kuidas saab juht tulemusi tõlgendada ja kupongide tõhususe kohta hinnanguid anda? (vt faili COUPONS.XLS (mall ja lahendus)).

Lahendus

Meie konkreetse juhtumi puhul sooritas 150 sooduskupongi saanud kliendist 55 soodusostu ja 150 kupongi mittesaanud kliendi hulgast sooritas ostu vaid 35 (joonis 103).
). Siis on proovi proportsioonide väärtused vastavalt 0,3667 ja 0,2333. Ja nende valimi erinevus on vastavalt 0,1333. 95% usaldusvahemikku eeldades leiame normaaljaotuse tabelist z cr = 1,96. Valimi erinevuse standardvea arvutus on 0,0524. Lõpuks leiame, et 95% usaldusvahemiku alumine piir on vastavalt 0,0307 ja ülempiir 0,2359. Saadud tulemusi võib tõlgendada nii, et iga 100 sooduskupongi saanud kliendi kohta on meil oodata 3 kuni 23 uut klienti. Peame aga meeles pidama, et see järeldus iseenesest ei tähenda kupongide kasutamise efektiivsust (kuna allahindlust tehes kaotame kasumit!). Näitame seda konkreetsete andmetega. Oletame, et ostu keskmine suurus on 400 rubla, millest 50 rubla. poe jaoks on kasum. Siis on oodatav kasum 100 kliendilt, kes ei saanud kupongi:

50 0,2333 100 = 1166,50 hõõruda.

Sarnased arvutused 100 kupongi saanud kliendi kohta annavad:

30 0,3667 100 = 1100,10 hõõruda.

Keskmise kasumi vähenemine 30-le on seletatav asjaoluga, et soodustust kasutades sooritavad kupongi saanud kliendid keskmiselt 380 rubla eest ostu.

Seega näitab lõppjäreldus selliste kupongide kasutamise ebaefektiivsust selles konkreetses olukorras.

Kommenteeri. Selle probleemi saab lahendada standardsete StatPro tööriistade abil. Selleks piisab, kui taandada see probleem kahe keskmise erinevuse hindamise probleemiks meetodi abil ja seejärel rakendada StatPro/Statistiline järeldus/Kahe proovi analüüs

kahe keskmise väärtuse erinevuse usaldusvahemiku konstrueerimiseks.

Usaldusvahemiku pikkuse juhtimine Usaldusvahemiku pikkus sõltub:

    järgmisi tingimusi

    andmed otse (standardhälve);

    olulisuse tase;

näidissuurus.

Valimi suurus keskmise hindamiseks
Esiteks käsitleme probleemi üldiselt. Tähistame meile antud usaldusvahemiku poole pikkuse väärtuse B-ks (joon. 104 ). Teame, et mõne juhusliku suuruse X keskmise väärtuse usaldusvahemik on väljendatud kujul , Kus

. Uskudes:

Kahjuks ei tea me juhusliku suuruse X dispersiooni täpset väärtust. Lisaks ei tea me tcr väärtust, kuna see sõltub vabadusastmete arvust n-st. Sellises olukorras saame teha järgmist. Dispersiooni s asemel kasutame mingit dispersiooni hinnangut, mis põhineb uuritava juhusliku muutuja mis tahes saadaolevatel rakendustel. T cr väärtuse asemel kasutame normaaljaotuse jaoks z cr väärtust. See on täiesti vastuvõetav, kuna normaal- ja t-jaotuse jaotustiheduse funktsioonid on väga lähedased (välja arvatud väikese n puhul). Seega on nõutav valem järgmine:

.

Kuna valem annab üldiselt mittetäisarvulisi tulemusi, võetakse soovitud valimi suuruseks ümardamine tulemuse ülejäägiga.

Näide

Kiirtoidurestoran plaanib oma sortimenti laiendada uut tüüpi võileivaga. Nõudluse hindamiseks plaanib juht valida juba proovinute hulgast juhuslikult külastajate arvu ja paluda neil hinnata oma suhtumist uude tootesse skaalal 1-10. Juht soovib hinnata. eeldatav punktide arv, mille uus toode toote saab, ja koostage selle hinnangu jaoks 95% usaldusvahemik. Samas soovib ta, et usaldusvahemiku poollaius ei ületaks 0,3. Kui palju külastajaid ta küsitlemiseks vajab?

järgnevalt:

Siin r ots on proportsiooni p hinnang ja B on antud pool usaldusvahemiku pikkusest. Väärtuse abil saab saada n ülehinnangu r ots= 0,5. Sel juhul ei ületa usaldusvahemiku pikkus p ühegi tegeliku väärtuse jaoks määratud väärtust B.

Näide

Laske eelmise näite juhil hinnata uut tüüpi toodet eelistanud klientide osakaalu. Ta soovib konstrueerida 90% usaldusvahemiku, mille poole pikkus ei ületa 0,05. Mitu klienti peaks juhuslikku valimisse kaasama?

Lahendus

Meie puhul on z cr väärtus 1,645. Seetõttu arvutatakse vajalik kogus järgmiselt .

Kui juhil oleks põhjust arvata, et soovitud p-väärtus on näiteks ligikaudu 0,3, siis asendades selle väärtuse ülaltoodud valemiga, saaksime väiksema juhusliku valimi väärtuse, nimelt 228.

Määramise valem juhuslik valimi suurus kahe keskmise erinevuse korral kirjutatud kui:

.

Näide

Mõnel arvutifirmal on klienditeeninduskeskus. Viimasel ajal on suurenenud klientide kaebuste arv teenuse halva kvaliteedi kohta. Teeninduskeskuses töötab peamiselt kahte tüüpi töötajaid: need, kellel pole palju kogemusi, kuid on läbinud spetsiaalsed ettevalmistuskursused, ja need, kellel on suur praktiline kogemus, kuid pole erikursusi läbinud. Ettevõte soovib analüüsida viimase kuue kuu klientide kaebusi ja võrrelda kahe töötajate grupi keskmist kaebuste arvu. Eeldatakse, et mõlema rühma valimite numbrid on samad. Mitu töötajat peab valimisse kaasama, et saada 95% intervall, mille poole pikkus ei ületa 2?

Lahendus

Siin on σ ots mõlema juhusliku suuruse standardhälbe hinnang eeldusel, et need on lähedased. Seega peame oma ülesandes selle hinnangu kuidagi saama. Seda saab teha näiteks järgmiselt. Vaadates viimase kuue kuu klientide kaebuste andmeid, võib juht märgata, et iga töötaja saab üldjuhul 6–36 kaebust. Teades, et normaaljaotuse korral on peaaegu kõik väärtused kuni kolme standardhälbe kaugusel keskmisest, võib ta mõistlikult arvata, et:

, kust σ ots = 5.

Asendades selle väärtuse valemis, saame .

Määramise valem juhusliku valimi suurus proportsioonide erinevuse hindamisel on kujul:

Näide

Mõnel ettevõttel on kaks tehast, mis toodavad sarnaseid tooteid. Firmajuht soovib võrrelda defektsete toodete protsenti mõlemas tehases. Olemasoleva teabe kohaselt on defektide määr mõlemas tehases 3–5%. Selle eesmärk on konstrueerida 99% usaldusvahemik, mille poole pikkus ei ületa 0,005 (või 0,5%). Mitu toodet tuleb igast tehasest valida?

Lahendus

Siin on p 1ots ja p 2ots hinnangud kahe teadmata defektide osakaalu kohta 1. ja 2. tehases. Kui paneme p 1ots = p 2ots = 0,5, siis saame n jaoks ülehinnatud väärtuse. Aga kuna meil on nende aktsiate kohta a priori info olemas, siis võtame nende aktsiate ülemise hinnangu, nimelt 0,05. Saame

Valimiandmete põhjal mõne üldkogumi parameetri hindamisel on kasulik anda mitte ainult parameetri punkthinnang, vaid esitada ka usaldusvahemik, mis näitab, kus hinnatava parameetri täpne väärtus võib asuda.

Selles peatükis tutvusime ka kvantitatiivsete seostega, mis võimaldavad konstrueerida selliseid intervalle erinevate parameetrite jaoks; õppinud viise usaldusvahemiku pikkuse kontrollimiseks.

Pange tähele ka seda, et valimi suuruse hindamise probleemi (katse planeerimise probleemi) saab lahendada standardsete StatPro tööriistade abil, nimelt StatPro/statistiline järeldus/proovi suuruse valik.