Дефинирајте го концептот на интервал на доверба. Интервал на доверба

Интервал на доверба

Интервал на доверба- термин што се користи во математичката статистика за интервална (за разлика од точка) проценка на статистичките параметри, што се претпочита кога големината на примерокот е мала. Интервал на доверба е оној кој покрива непознат параметар со дадена сигурност.

Методот на интервали на доверба беше развиен од американскиот статистичар Јерзи Нојман, врз основа на идеите на англискиот статистичар Роналд Фишер.

Дефиниција

Интервал на доверливост на параметарот θ распределба на случајна променлива Xсо ниво на доверба 100 p%, генерирана од примерокот ( x 1 ,…,x n), се нарекува интервал со граници ( x 1 ,…,x n) и ( x 1 ,…,x n), кои се реализација на случајни променливи Л(X 1 ,…,X n) и У(X 1 ,…,Xн), така што

.

Се повикуваат граничните точки на интервалот на доверба граници на доверба.

Интерпретацијата на интервалот на доверба заснована на интуиција би била: ако стре голем (да речеме 0,95 или 0,99), тогаш интервалот на доверба речиси сигурно ја содржи вистинската вредност θ .

Друга интерпретација на концептот на интервал на доверба: може да се смета како интервал на вредности на параметрите θ компатибилни со експериментални податоци и не им противречат.

Примери

  • Интервал на доверба за математичко очекување на нормален примерок;
  • Интервал на доверба за нормална варијанса на примерокот.

Бајесов интервал на доверба

Во баезијанската статистика, постои слична, но различна дефиниција за интервал на доверба во некои клучни детали. Овде, самиот проценет параметар се смета за случајна променлива со одредена претходна распределба (во наједноставниот случај, униформа), а примерокот е фиксиран (во класичната статистика сè е токму спротивното). Бајесов интервал на доверба е интервал кој ја покрива вредноста на параметарот со задната веројатност:

.

Општо земено, класичните и бајесовските интервали на доверба се различни. Во литературата на англиски јазик, бајесовиот интервал на доверба обично се нарекува термин веродостоен интервали класичниот - интервал на доверба.

Белешки

Извори

Фондацијата Викимедија. 2010 година.

  • Деца (филм)
  • Колонист

Погледнете што е „Интервал на доверба“ во другите речници:

    Интервал на доверба- интервал пресметан од примерок податоци, кој со дадена веројатност (доверба) ја покрива непознатата вистинска вредност на проценетиот параметар на дистрибуција. Извор: ГОСТ 20522 96: Почви. Методи за статистичка обработка на резултатите... Речник-референтна книга на поими за нормативна и техничка документација

    интервал на доверба- за скаларен параметар на популацијата, ова е сегмент кој најверојатно го содржи овој параметар. Оваа фраза е бесмислена без дополнителна елаборација. Бидејќи границите на интервалот на доверба се проценуваат од примерокот, природно е да... ... Речник на социолошка статистика

    ИНТЕРВАЛ НА ДОВЕРБА- метод за проценка на параметрите што се разликува од проценката на точка. Нека примерокот x1, . . ., xn од распределба со густина на веројатност f(x, α), и a*=a*(x1, . . ., xn) проценка на густината на веројатноста α, g(a*, α). Се бараат…… Геолошка енциклопедија

    ИНТЕРВАЛ НА ДОВЕРБА- (интервал на доверба) Интервал во кој веродостојноста на вредноста на параметарот за популацијата добиена врз основа на примерок анкета има одреден степен на веројатност, на пример 95%, што се должи на самиот примерок. Ширина…… Економски речник

    интервал на доверба- е интервалот во кој се наоѓа вистинската вредност на одредената величина со дадена веројатност за доверба. Општа хемија: учебник / A. V. Zholnin ... Хемиски термини

    Интервал на доверба CI- Интервал на доверба, CI * интервал на податоци, CI * интервал на доверливост на карактеристичната вредност, пресметан за k.l. параметар на дистрибуција (на пример, просечна вредност на карактеристика) низ примерокот и со одредена веројатност (на пример, 95% за 95% ... Генетика. енциклопедиски речник

    ИНТЕРВАЛ НА ДОВЕРБА- концепт што се јавува при проценка на статистички параметар. распределба по интервал на вредности. D. и. за параметар q, што одговара на овој коефициент. довербата P е еднаква на таков интервал (q1, q2) што за секоја распределба на веројатност на нееднаквост... ... Физичка енциклопедија

    интервал на доверба- - Теми за телекомуникации, основни концепти EN интервал на доверба ... Водич за технички преведувач

    интервал на доверба- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato verte. atitikmenys: ингли. интервал на доверба vok. Vertrauensbereich, m rus.…… Penkiakalbis aiškinamasis metrologijos terminų žodynas

    интервал на доверба- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų verte. atitikmenys: ингли. интервал на доверба rus. област на доверба; интервал на доверба... Chemijos terminų aiškinamasis žodynas

Ајде да конструираме интервал на доверба во MS EXCEL за да ја процениме средната вредност на распределбата во случај на позната вредност на дисперзија.

Се разбира изборот ниво на довербацелосно зависи од проблемот што се решава. Така, степенот на доверба на патникот во воздух во доверливоста на авионот несомнено треба да биде повисок од степенот на доверба на купувачот во доверливоста на електричната сијалица.

Формулација на проблемот

Да претпоставиме дека од популацијаоткако е земен примерголемина n. Се претпоставува дека Стандардна девијацијаоваа дистрибуција е позната. Потребно е врз основа на ова примероциоцени го непознатото дистрибутивна средина(μ, ) и конструирај го соодветниот двострано интервал на доверба.

Точка проценка

Како што е познато од статистика(да го означиме X просечно) е непристрасна проценка на средната вредностова популацијаи има распределба N(μ;σ 2 /n).

Забелешка: Што да направите ако треба да изградите интервал на довербаво случај на распределба која не е нормално?Во овој случај, доаѓа на помош, во која се наведува дека со доволно голема големина примероци n од дистрибуција не битие нормално, дистрибуција на примероци на статистика X просечноќе приближноодговараат нормална дистрибуцијасо параметри N(μ;σ 2 /n).

Значи, бодовна проценка просек дистрибутивни вредностиимаме - ова примерок значи, т.е. X просечно. Сега да почнеме интервал на доверба.

Конструирање интервал на доверба

Обично, знаејќи ја дистрибуцијата и нејзините параметри, можеме да ја пресметаме веројатноста случајната променлива да земе вредност од интервалот што го одредуваме. Сега да го направиме спротивното: најдете го интервалот во кој случајната променлива ќе падне со дадена веројатност. На пример, од својствата нормална дистрибуцијапознато е дека со веројатност од 95%, распределена е случајна променлива нормален закон, ќе падне во опсег од приближно +/- 2 од средна вредност(види статија за). Овој интервал ќе ни послужи како прототип интервал на доверба.

Сега да видиме дали ја знаеме дистрибуцијата , да се пресмета овој интервал? За да одговориме на прашањето, мора да ја наведеме формата на дистрибуцијата и нејзините параметри.

Ја знаеме формата на дистрибуција - ова е нормална дистрибуција(запомнете дека зборуваме за дистрибуција на примероци статистика X просечно).

Параметарот μ ни е непознат (само треба да се процени со користење интервал на доверба), но имаме проценка за тоа X просечно,пресметано врз основа на примероци,кои можат да се користат.

Втор параметар - стандардна девијација на средната вредност на примерокот ќе го сметаме за познато, тоа е еднакво на σ/√n.

Бидејќи не знаеме μ, тогаш ќе го изградиме интервалот +/- 2 стандардни отстапувањане од средна вредност, и од неговата позната проценка X просечно. Оние. при пресметување интервал на довербатоа НЕМА да го претпоставуваме X просечноспаѓа во опсегот +/- 2 стандардни отстапувањаод μ со веројатност од 95%, и ќе претпоставиме дека интервалот е +/- 2 стандардни отстапувањаод X просечносо 95% веројатност ќе покрие μ – просек од општата популација,од кој е земен пример. Овие две тврдења се еквивалентни, но втората изјава ни овозможува да конструираме интервал на доверба.

Дополнително, да го разјасниме интервалот: случајна променлива дистрибуирана нормален закон, со 95% веројатност спаѓа во интервалот +/- 1,960 стандардни отстапувања,не +/- 2 стандардни отстапувања. Ова може да се пресмета со помош на формулата =NORM.ST.REV((1+0,95)/2), цм. пример интервал на лист со датотека.

Сега можеме да формулираме веројатност што ќе ни послужи да го формираме интервал на доверба:
„Веројатноста дека популација значилоциран од примерок просекво рок од 1.960" стандардни отстапувања на средната вредност на примерокот", еднакво на 95%“.

Вредноста на веројатноста спомената во изјавата има посебно име , кој е поврзан сониво на значајност α (алфа) со едноставен израз ниво на доверба =1 . Во нашиот случај ниво на значајност α =1-0,95=0,05 .

Сега, врз основа на оваа веројатност, пишуваме израз за пресметување интервал на доверба:

каде Z α/2 стандарден нормална дистрибуција(оваа вредност на случајната променлива z, Што П(z>=Z α/2 )=α/2).

Забелешка: Горна α/2-квантилаја дефинира ширината интервал на довербаВ стандардни отстапувања примерок значи. Горна α/2-квантила стандарден нормална дистрибуцијасекогаш поголем од 0, што е многу погодно.

Во нашиот случај, со α=0,05, горна α/2-квантила изнесува 1.960. За други нивоа на значајност α (10%; 1%) горна α/2-квантила Z α/2 може да се пресмета со помош на формулата =NORM.ST.REV(1-α/2) или, доколку е познато ниво на доверба, =NORM.ST.OBR((1+ ниво на доверба)/2).

Обично кога се гради интервали на доверба за проценка на средната вредносткористете само горен α/2-квантили не користете пониски α/2-квантил. Ова е можно затоа што стандарден нормална дистрибуцијасиметрично околу оската x ( неговата густина на дистрибуцијасиметрично за просек, т.е. 0). Затоа, нема потреба да се пресметува пониска α/2-квантила(тоа едноставно се нарекува α /2-квантила), бидејќи тоа е еднакво горен α/2-квантилсо знак минус.

Да потсетиме дека, и покрај обликот на распределбата на вредноста x, соодветната случајна променлива X просечнодистрибуирани приближно Добро N(μ; σ 2 /n) (види статија за). Затоа, генерално, горенаведениот израз за интервал на довербае само приближна. Ако вредноста x се дистрибуира над нормален закон N(μ;σ 2 /n), потоа изразот за интервал на довербае точен.

Пресметка на интервал на доверба во MS EXCEL

Ајде да го решиме проблемот.
Времето на одговор на електронската компонента на влезниот сигнал е важна карактеристика на уредот. Инженерот сака да изгради интервал на доверба за просечното време на одговор на ниво на доверба од 95%. Од претходното искуство, инженерот знае дека стандардното отстапување на времето на одговор е 8 ms. Познато е дека за да се оцени времето на одговор, инженерот направил 25 мерења, просечната вредност била 78 ms.

Решение: Инженерот сака да го знае времето на одговор на електронскиот уред, но разбира дека времето на одговор не е фиксна вредност, туку случајна променлива која има своја дистрибуција. Значи, најдоброто на што може да се надева е да ги одреди параметрите и обликот на оваа дистрибуција.

За жал, од проблематичните услови не ја знаеме формата на распределбата на времето на одговор (не мора да биде нормално). , оваа дистрибуција е исто така непозната. Само тој е познат Стандардна девијацијаσ=8. Затоа, додека не можеме да ги пресметаме веројатностите и да конструираме интервал на доверба.

Сепак, и покрај тоа што не ја знаеме распределбата време посебен одговор, знаеме дека според CPT, дистрибуција на примероци просечно време на одговоре приближно нормално(ќе претпоставиме дека условите CPTсе спроведуваат, бидејќи големина примероцидоста голем (n=25)) .

Згора на тоа, просековаа распределба е еднаква на средна вредностдистрибуција на еден одговор, т.е. μ. А Стандардна девијацијана оваа распределба (σ/√n) може да се пресмета со формулата =8/ROOT(25) .

Познато е и дека инженерот примил бодовна проценкапараметар μ еднаков на 78 ms (X средна). Затоа, сега можеме да пресметаме веројатности, бидејќи ја знаеме формата на дистрибуција ( нормално) и неговите параметри (X avg и σ/√n).

Инженерот сака да знае очекуваната вредностμ распределби на времето на одговор. Како што е наведено погоре, ова μ е еднакво на математичко очекување на распределбата на примерокот на просечното време на одговор. Доколку користиме нормална дистрибуција N(X avg; σ/√n), тогаш саканиот μ ќе биде во опсегот +/-2*σ/√n со веројатност од приближно 95%.

Ниво на значајностеднакво на 1-0,95=0,05.

Конечно, да ја најдеме левата и десната граница интервал на доверба.
Лева граница: =78-NORM.ST.REV(1-0.05/2)*8/ROOT(25) = 74,864
Десна граница: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

Лева граница: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Десна граница: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Одговори: интервал на довербана 95% ниво на доверба и σ=8msecеднакви 78+/-3,136 ms.

ВО пример датотека на листот Сигмапознат, создаде образец за пресметка и конструкција двострано интервал на довербаза произволни примероцисо дадени σ и ниво на значење.

Функција DOFIDENCE.NORM().

Доколку вредностите примероцисе во опсегот Б20: Б79 , А ниво на значајностеднакво на 0,05; потоа формулата MS EXCEL:
=ПРОСЕК(B20:B79)-ДОВЕРБА.НОРМА(0.05;σ; COUNT(B20:B79))
ќе ја врати левата граница интервал на доверба.

Истата граница може да се пресмета со формулата:
=ПРОСЕК(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

Забелешка: Функцијата CONFIDENCE.NORM() се појави во MS EXCEL 2010. Во претходните верзии на MS EXCEL, се користеше функцијата TRUST().

Во претходните потсекции го разгледавме прашањето за проценка на непознат параметар Аеден број. Ова се нарекува проценка на „точка“. Во голем број задачи, не само што треба да го пронајдете параметарот Асоодветна нумеричка вредност, но и да се оцени нејзината точност и сигурност. Треба да знаете до какви грешки може да доведат замена на параметар Анеговата точка проценка Аи со кој степен на доверба можеме да очекуваме дека овие грешки нема да ги надминат познатите граници?

Проблемите од овој вид се особено релевантни со мал број на набљудувања, кога се проценува точка и вое во голема мера случајна и приближна замена на a со a може да доведе до сериозни грешки.

Да се ​​даде идеја за точноста и веродостојноста на проценката А,

Во математичката статистика се користат таканаречените интервали на доверба и веројатности за доверба.

Нека за параметарот Анепристрасна проценка добиена од искуство А.Сакаме да ја процениме можната грешка во овој случај. Дозволете ни да доделиме некоја доволно голема веројатност p (на пример, p = 0,9, 0,95 или 0,99) така што настанот со веројатност p може да се смета за практично сигурен, и да најдеме вредност s за која

Потоа опсегот на практично можните вредности на грешката што се појавува при замена Ана А, ќе биде ± s; Големи грешки во апсолутна вредност ќе се појават само со мала веројатност a = 1 - стр. Ајде да ја преработиме (14.3.1) како:

Еднаквоста (14.3.2) значи дека со веројатност p непознатата вредност на параметарот Аспаѓа во интервалот

Неопходно е да се забележи една околност. Претходно, ние постојано ја разгледувавме веројатноста случајната променлива да падне во даден неслучаен интервал. Овде ситуацијата е поинаква: големината Ане е случаен, но интервалот / p е случаен. Неговата позиција на оската x е случајна, одредена од нејзиниот центар А; Општо земено, должината на интервалот 2s е исто така случајна, бидејќи вредноста на s се пресметува, по правило, од експериментални податоци. Затоа, во овој случај, би било подобро да се протолкува p вредноста не како веројатност да се „погоди“ точката Аво интервалот / p, и како веројатност дека случаен интервал / p ќе ја покрие точката А(Сл. 14.3.1).

Ориз. 14.3.1

Веројатноста p обично се нарекува веројатност за доверба, и интервал / p - интервал на доверба.Границите на интервалот Ако. a x =a-песок a 2 = a +и се нарекуваат граници на доверба.

Ајде да дадеме друго толкување на концептот на интервал на доверба: тој може да се смета како интервал на вредности на параметри А,компатибилни со експериментални податоци и не им противречат. Навистина, ако се согласиме да сметаме дека настан со веројатност a = 1-p е практично невозможен, тогаш оние вредности на параметарот a за кои а - а> s мора да се препознаат како контрадикторни експериментални податоци, и оние за кои |a - Аа т на 2 .

Нека за параметарот Апостои непристрасна проценка А.Кога би го знаеле законот за распределба на количината А, задачата да се најде интервал на доверба би била многу едноставна: би било доволно да се најде вредност s за која

Тешкотијата е во тоа што законот за распределба на проценките Азависи од законот за распределба на количината Xи, според тоа, на неговите непознати параметри (особено, на самиот параметар А).

За да ја надминете оваа тешкотија, можете да ја користите следнава приближно приближна техника: заменете ги непознатите параметри во изразот за s со нивните проценки на точки. Со релативно голем број на експерименти П(околу 20...30) оваа техника обично дава резултати кои се задоволителни во однос на точноста.

Како пример, разгледајте го проблемот со интервалот на доверба за математичкото очекување.

Нека се произведува П X,чии карактеристики се математичкото очекување Ти варијанса Д- непознато. Добиени се следните проценки за овие параметри:

Потребно е да се конструира интервал на доверба / p што одговара на веројатноста за доверба p за математичкото очекување Тколичини X.

При решавањето на овој проблем ќе го искористиме фактот дека количината Тго претставува збирот Пнезависни идентично распределени случајни променливи Xhа според централната гранична теорема, за доволно голем Пнеговиот закон за распределба е блиску до нормалата. Во пракса, дури и со релативно мал број поими (околу 10...20), законот за распределба на збирот приближно може да се смета за нормален. Ќе претпоставиме дека вредноста Траспределени според нормалниот закон. Карактеристиките на овој закон - математичко очекување и варијанса - се еднакви, соодветно ТИ

(види поглавје 13 потточка 13.3). Да претпоставиме дека вредноста Дзнаеме и ќе најдеме вредност Ep за која

Користејќи ја формулата (6.3.5) од Поглавје 6, ја изразуваме веројатноста на левата страна на (14.3.5) преку функцијата за нормална дистрибуција

каде е стандардното отстапување на проценката Т.

Од равенството.

Најдете ја вредноста на Sp:

каде arg Ф* (х) е инверзна функција на Ф* (X),тие. таква вредност на аргументот за која функцијата за нормална распределба е еднаква на X.

Дисперзија Д,преку кој се изразува количината А 1P, не знаеме точно; како нејзина приближна вредност, можете да ја користите проценката Д(14.3.4) и ставете приближно:

Така, проблемот со конструирање на интервал на доверба е приближно решен, што е еднакво на:

каде gp се одредува со формулата (14.3.7).

За да се избегне обратна интерполација во табелите на функцијата Ф* (l) при пресметување s p, погодно е да се состави посебна табела (табела 14.3.1), која ги дава вредностите на количината

во зависност од р. Вредноста (p го одредува за нормалниот закон бројот на стандардни отстапувања што мора да се нацртаат десно и лево од центарот на дисперзија, така што веројатноста да се влезе во добиената област е еднаква на стр.

Користејќи ја вредноста 7 p, интервалот на доверба се изразува како:

Табела 14.3.1

Пример 1. Извршени се 20 експерименти на количината X;резултатите се прикажани во табелата. 14.3.2.

Табела 14.3.2

Потребно е да се најде проценка од за математичкото очекување на количината Xи конструирај интервал на доверба што одговара на веројатноста за доверба p = 0,8.

Решение.Ние имаме:

Избирајќи l: = 10 како референтна точка, користејќи ја третата формула (14.2.14) ја наоѓаме непристрасната проценка Д :

Според табелата 14.3.1 наоѓаме

Граници на доверба:

Интервал на доверба:

Вредности на параметрите Т,кои лежат во овој интервал се компатибилни со експерименталните податоци дадени во табелата. 14.3.2.

На сличен начин може да се конструира интервал на доверба за варијансата.

Нека се произведува Пнезависни експерименти на случајна променлива Xсо непознати параметри и за А и за дисперзија Ддобиена е непристрасна проценка:

Потребно е приближно да се конструира интервал на доверба за варијансата.

Од формулата (14.3.11) е јасно дека количината Дпретставува

износ Пслучајни променливи на формата . Овие вредности не се

независни, бидејќи било кој од нив ја вклучува количината Т,зависен од сите други. Сепак, може да се покаже дека со зголемување Пзаконот за распределба на нивниот збир исто така се приближува до нормалата. Речиси во П= 20...30 веќе може да се смета за нормално.

Да претпоставиме дека е така, и да ги најдеме карактеристиките на овој закон: математичко очекување и дисперзија. Од проценката Д- тогаш непристрасно М[Д] = Д.

Пресметка на варијанса Д Де поврзан со релативно сложени пресметки, затоа го прикажуваме неговото изразување без изведување:

каде што q 4 е четвртиот централен момент на големината X.

За да го користите овој израз, треба да ги замените вредностите \u003d 4 и Д(барем блиските). Наместо Дможете да ја искористите неговата проценка Д.Во принцип, четвртиот централен момент може да се замени и со проценка, на пример, вредност на формата:

но таквата замена ќе даде исклучително мала точност, бидејќи генерално, со ограничен број експерименти, моментите од висок ред се одредуваат со големи грешки. Меѓутоа, во практиката често се случува типот на законот за распределба на количините Xоднапред познат: само неговите параметри се непознати. Потоа можете да се обидете да изразите μ 4 преку Д.

Да го земеме најчестиот случај, кога вредноста Xраспределени според нормалниот закон. Тогаш неговиот четврти централен момент е изразен во смисла на дисперзија (види Поглавје 6, потточка 6.2);

и формулата (14.3.12) ја дава или

Замена на непознатото во (14.3.14) Днеговата проценка Д, добиваме: од каде

Моментот μ 4 може да се изрази преку Дисто така и во некои други случаи, кога распределбата на вредноста Xне е нормално, но неговиот изглед е познат. На пример, за законот за еднаква густина (види Поглавје 5) имаме:

каде што (a, P) е интервалот на кој е наведен законот.

Оттука,

Користејќи ја формулата (14.3.12) добиваме: каде наоѓаме приближно

Во случаи кога типот на законот за распределба за количината 26 е непознат, при приближна проценка на вредноста а/) сепак се препорачува да се користи формулата (14.3.16), освен ако постојат посебни причини да се верува дека овој закон многу се разликува од нормалната (има забележлива позитивна или негативна куртоза) .

Ако приближната вредност a/) се добие на еден или друг начин, тогаш можеме да изградиме интервал на доверба за варијансата на ист начин како што ја изградивме за математичкото очекување:

каде според табелата се наоѓа вредноста во зависност од дадената веројатност p. 14.3.1.

Пример 2. Најдете приближно 80% интервал на доверба за варијансата на случајна променлива Xпод условите од примерот 1, доколку се знае дека вредноста Xраспределени според закон близок до нормалата.

Решение.Вредноста останува иста како во табелата. 14.3.1:

Според формулата (14.3.16)

Користејќи ја формулата (14.3.18) го наоѓаме интервалот на доверба:

Соодветниот опсег на вредности на стандардно отстапување: (0,21; 0,29).

14.4. Точни методи за конструирање интервали на доверба за параметрите на случајна променлива распределена според нормален закон

Во претходната потсекција, испитавме приближно приближни методи за конструирање интервали на доверба за математичко очекување и варијанса. Овде ќе дадеме идеја за точните методи за решавање на истиот проблем. Нагласуваме дека за прецизно да се најдат интервали на доверба, апсолутно е неопходно однапред да се знае формата на законот за распределба на количината X,додека за примена на приближни методи тоа не е потребно.

Идејата за точни методи за конструирање интервали на доверба се сведува на следново. Секој интервал на доверба се наоѓа од услов што ја изразува веројатноста за исполнување на одредени нееднаквости, кои ја вклучуваат проценката за која сме заинтересирани А.Закон за вредносна распределба Аво општ случај зависи од непознати параметри на количината X.Меѓутоа, понекогаш е можно да се префрлат неравенки од случајна променлива Ана некоја друга функција на набљудуваните вредности X p X 2, ..., X стр.чиј закон за распределба не зависи од непознати параметри, туку зависи само од бројот на експерименти и од типот на законот за распределба на количината X.Овие типови на случајни променливи играат важна улога во математичката статистика; тие се најподетално проучени за случајот на нормална распределба на количината X.

На пример, докажано е дека со нормална распределба на вредноста Xслучајна вредност

се покорува на т.н Закон за распределба на студентиСо П- 1 степен на слобода; густината на овој закон има форма

каде што G(x) е познатата гама функција:

Докажано е и дека случајната променлива

има „%2 дистрибуција“ со П- 1 степен на слобода (види Поглавје 7), чија густина е изразена со формулата

Без да се задржиме на изводите на распределбите (14.4.2) и (14.4.4), ќе покажеме како тие можат да се применат при конструирање интервали на доверба за параметрите ty D.

Нека се произведува Пнезависни експерименти на случајна променлива X,нормално распределени со непознати параметри ДО.За овие параметри се добиени проценки

Потребно е да се конструираат интервали на доверба за двата параметри што одговараат на веројатноста за доверба стр.

Ајде прво да изградиме интервал на доверба за математичкото очекување. Природно е да се земе овој интервал симетричен во однос на Т; нека s p означува половина од должината на интервалот. Вредноста s p мора да биде избрана така што условот е исполнет

Ајде да се обидеме да се движиме на левата страна на еднаквоста (14.4.5) од случајната променлива Тдо случајна променлива Т,распределени според студентскиот закон. За да го направите ова, помножете ги двете страни на неравенката |m-w?|

со позитивна вредност: или, користејќи нотација (14.4.1),

Ајде да најдеме број / p таков што вредноста / p може да се најде од условот

Од формулата (14.4.2) е јасно дека (1) е парна функција, затоа (14.4.8) дава

Еднаквоста (14.4.9) ја одредува вредноста / p во зависност од стр. Доколку имате на располагање табела со интегрални вредности

тогаш вредноста на /p може да се најде со обратна интерполација во табелата. Сепак, попогодно е однапред да се подготви табела со / p вредности. Таква табела е дадена во Додаток (Табела 5). Оваа табела ги прикажува вредностите во зависност од нивото на доверба p и бројот на степени на слобода П- 1. Имајќи утврдено / стр од табелата. 5 и под претпоставка

ќе најдеме половина од ширината на интервалот на доверба / p и самиот интервал

Пример 1. Извршени се 5 независни експерименти на случајна променлива X,нормално распределени со непознати параметри Ти околу. Резултатите од експериментите се дадени во табела. 14.4.1.

Табела 14.4.1

Најдете рејтинг Тза математичкото очекување и конструирајте интервал на доверба од 90% / p за него (т.е. интервалот што одговара на веројатноста за доверба p = 0,9).

Решение.Ние имаме:

Според табела 5 од пријавата за П - 1 = 4 и p = 0,9 наоѓаме каде

Интервалот на доверба ќе биде

Пример 2. За условите од примерот 1 од потточка 14.3, претпоставувајќи ја вредноста Xнормално распределени, најдете го точниот интервал на доверба.

Решение.Според табела 5 од додатокот наоѓаме кога П - 1 = 19ir =

0,8 / p = 1,328; од тука

Споредувајќи го со решението од примерот 1 од потточка 14.3 (e p = 0,072), ние сме убедени дека несовпаѓањето е многу незначително. Ако ја одржиме точноста до второто децимално место, тогаш интервалите на доверба пронајдени со точните и приближните методи се совпаѓаат:

Ајде да продолжиме со конструирање на интервал на доверба за варијансата. Размислете за непристрасен проценувач на варијанса

и изразете ја случајната променлива Дпреку големината В(14.4.3), со дистрибуција x 2 (14.4.4):

Познавање на законот за распределба на количеството V,можеш да го најдеш интервалот /(1) во кој паѓа со дадена веројатност стр.

Закон за дистрибуција kn_x(v)магнитудата I 7 ја има формата прикажана на сл. 14.4.1.

Ориз. 14.4.1

Се поставува прашањето: како да се избере интервалот / стр? Ако законот за распределба на големината Вбеше симетричен (како нормалниот закон или студентската распределба), би било природно да се земе интервалот /p симетричен во однос на математичкото очекување. Во овој случај законот k p_x (v)асиметрични. Да се ​​согласиме да го избереме интервалот /p така што веројатноста вредноста да биде Внадвор од интервалот десно и лево (засенчените области на Сл. 14.4.1) беа исти и еднакви

За да изградиме интервал / p со ова својство, ја користиме табелата. 4 апликации: содржи броеви y)такви што

за вредноста V,има x 2 -распределба со r степени на слобода. Во нашиот случај r = n- 1. Ајде да се поправиме r = n- 1 и најдете во соодветниот ред од табелата. 4 две значења x 2 -еден одговара на веројатност другиот - веројатност Да ги означиме овие

вредности во 2И xl?Интервалот има y 2,со лево, и y~десен крај.

Сега да го најдеме од интервалот / p саканиот интервал на доверба /|, за дисперзијата со границите D, и Д2,која ја опфаќа поентата Дсо веројатност p:

Да изградиме интервал / (, = (?> ь А) што ја покрива точката Дако и само ако вредноста Впаѓа во интервалот /r. Да покажеме дека интервалот

ја задоволува оваа состојба. Навистина, нееднаквостите се еквивалентни на неравенки

а овие неравенки се задоволуваат со веројатност стр. Така, интервалот на доверба за варијансата е пронајден и се изразува со формулата (14.4.13).

Пример 3. Најдете го интервалот на доверба за варијансата под условите од примерот 2 од потточка 14.3, ако се знае дека вредноста Xнормално дистрибуирани.

Решение.Ние имаме . Според табела 4 од додатокот

наоѓаме кај r = n - 1 = 19

Користејќи ја формулата (14.4.13) го наоѓаме интервалот на доверба за варијансата

Соодветниот интервал за стандардното отстапување е (0,21; 0,32). Овој интервал само малку го надминува интервалот (0,21; 0,29) добиен во примерот 2 од потточка 14.3 со користење на приближниот метод.

  • Слика 14.3.1 разгледува интервал на доверба симетричен за a. Во принцип, како што ќе видиме подоцна, ова не е потребно.
Интервал на доверба- ограничувачките вредности на статистичка големина што, со дадена веројатност за доверба γ, ќе биде во овој интервал при земање примероци на поголем волумен. Означено како P(θ - ε. Во пракса, веројатноста за доверба γ е избрана од вредности сосема блиски до единството: γ = 0,9, γ = 0,95, γ = 0,99.

Цел на услугата. Користејќи ја оваа услуга, можете да одредите:

  • интервал на доверба за општата средина, интервал на доверба за варијансата;
  • интервал на доверба за стандардното отстапување, интервал на доверба за општото учество;
Резултираното решение е зачувано во датотека Word (види пример). Подолу е видео-инструкција како да ги пополните првичните податоци.

Пример бр. 1. На колективна фарма, од вкупно стадо од 1000 овци, 100 овци биле подложени на селективно контролно стрижење. Како резултат на тоа, беше воспоставено просечно сечење волна од 4,2 кг по овца. Да се ​​определи со веројатност од 0,99 средната квадратна грешка на примерокот при определување на просечното стрижење на волна по овца и границите во кои се содржи вредноста на стрижењето ако варијансата е 2,5. Примерокот не се повторува.
Пример бр. 2. Од серија увезени производи на поштата на Московската северна царина, земени се 20 примероци од производот „А“ по случаен избор, повторено земање мостри. Како резултат на тестот, беше утврдена просечната содржина на влага на производот „А“ во примерокот, што се покажа дека е еднаква на 6% со стандардно отстапување од 1%.
Определете ги со веројатност 0,683 границите на просечната содржина на влага на производот во целата серија на увезени производи.
Пример бр. 3. Истражувањето на 36 студенти покажа дека просечниот број на учебници што ги читал во текот на учебната година е еднаков на 6. Ако се претпостави дека бројот на учебници што ги чита студент по семестар има нормален закон за распределба со стандардна девијација еднаква на 6, најдете : А) со веродостојност од 0,99 интервална проценка за математичкото очекување на оваа случајна променлива; Б) со која веројатност можеме да кажеме дека просечниот број на учебници што ги чита студент по семестар, пресметан од овој примерок, ќе отстапува од математичкото очекување во апсолутна вредност не повеќе од 2.

Класификација на интервали на доверба

Според типот на параметар што се проценува:

По тип на примерок:

  1. Интервал на доверба за бесконечен примерок;
  2. Интервал на доверба за конечниот примерок;
Примерокот се нарекува повторен примерок, доколку избраниот објект се врати на популацијата пред да се избере следниот. Примерокот се нарекува неповторлив, доколку избраниот објект не се врати во популацијата. Во пракса, ние обично се занимаваме со примероци кои не се повторуваат.

Пресметка на просечната грешка при земање примероци за случајно земање примероци

Несовпаѓањето помеѓу вредностите на индикаторите добиени од примерокот и соодветните параметри на општата популација се нарекува репрезентативна грешка.
Означување на главните параметри на општата популација и примерокот.
Формули за просечни грешки при земање примероци
реизборповторете го изборот
за просекза споделувањеза просекза споделување
Врската помеѓу границата на грешка при земање мостри (Δ) гарантирана со одредена веројатност Р(t),а просечната грешка при земање примероци има форма: или Δ = t·μ, каде т– коефициент на доверба, определен во зависност од нивото на веројатност P(t) според табелата на Лапласовата интегрална функција.

Формули за пресметување на големината на примерокот користејќи чисто случаен метод на земање примероци

Цел– научете ги учениците алгоритми за пресметување интервали на доверливост на статистичките параметри.

При статистичка обработка на податоците, пресметаната аритметичка средина, коефициентот на варијација, коефициентот на корелација, критериумите за разлика и другите точки статистики треба да добијат квантитативни граници на доверба, кои укажуваат на можни флуктуации на индикаторот во помали и поголеми насоки во рамките на интервалот на доверба.

Пример 3.1 . Распределбата на калциумот во крвниот серум на мајмуните, како што е претходно утврдено, се карактеризира со следните индикатори на примерокот: = 11,94 mg%; = 0,127 mg%; n= 100. Потребно е да се одреди интервалот на доверба за општиот просек ( ) со веројатност за доверба П = 0,95.

Општиот просек се наоѓа со одредена веројатност во интервалот:

, Каде – примерок аритметичка средина; т– студентски тест; – грешка на аритметичката средина.

Користејќи ја табелата „Tstudent’s t-test values“ ја наоѓаме вредноста со веројатност на доверба од 0,95 и број на степени на слобода к= 100-1 = 99. Тоа е еднакво на 1,982. Заедно со вредностите на аритметичката средина и статистичката грешка, ја заменуваме во формулата:

или 11.69
12,19

Така, со веројатност од 95%, може да се констатира дека општиот просек на оваа нормална распределба е помеѓу 11,69 и 12,19 mg%.

Пример 3.2 . Определете ги границите на 95% интервал на доверба за општата варијанса ( ) дистрибуција на калциум во крвта на мајмуните, ако се знае дека
= 1,60, во n = 100.

За да го решите проблемот, можете да ја користите следнава формула:

Каде – статистичка грешка на дисперзија.

Ја наоѓаме грешката на варијансата при земање примероци користејќи ја формулата:
. Тоа е еднакво на 0,11. Значење т- критериум со веројатност на доверба од 0,95 и број на степени на слобода к= 100–1 = 99 е познато од претходниот пример.

Ајде да ја искористиме формулата и да добиеме:

или 1,38
1,82

Попрецизно, интервалот на доверба на општата варијанса може да се конструира користејќи (хи-квадрат) - Пирсон тест. Критичните точки за овој критериум се дадени во посебна табела. При користење на критериумот За да се изгради интервал на доверба, се користи двострано ниво на значајност. За долната граница, нивото на значајност се пресметува со помош на формулата
, за врвот -
. На пример, за нивото на доверба = 0,99= 0,010,= 0,990. Според тоа, според табелата на распределба на критичните вредности , со пресметани нивоа на доверба и број на степени на слобода к= 100 – 1= 99, најдете ги вредностите
И
. Добиваме
е еднакво на 135,80 и
изнесува 70,06.

Да се ​​најдат граници на доверба за општата варијанса користејќи Да ги користиме формулите: за долната граница
, за горната граница
. Да ги замениме пронајдените вредности за податоците за проблемот во формули:
= 1,17;
= 2,26. Така, со веројатност за доверба П= 0,99 или 99% општа варијанса ќе лежи во опсегот од 1,17 до 2,26 mg% вклучително.

Пример 3.3 . Помеѓу 1000 семиња пченица од серијата добиени во лифтот, 120 семиња се пронајдени заразени со ергот. Неопходно е да се утврдат веројатните граници на општата пропорција на заразени семиња во дадена серија пченица.

Препорачливо е да се одредат границите на доверба за општата акција за сите негови можни вредности користејќи ја формулата:

,

Каде n – број на набљудувања; м– апсолутна големина на една од групите; т– нормализирано отстапување.

Процентот на примерокот на заразени семиња е
или 12%. Со веројатност за доверба Р= 95% нормализирано отстапување ( т-Ученички тест на к =
)т = 1,960.

Достапните податоци ги заменуваме во формулата:

Оттука, границите на интервалот на доверба се еднакви на = 0,122-0,041 = 0,081, или 8,1%; = 0,122 + 0,041 = 0,163, или 16,3%.

Така, со веројатност на доверливост од 95% може да се каже дека општата пропорција на заразени семиња е помеѓу 8,1 и 16,3%.

Пример 3.4 . Коефициентот на варијација што ја карактеризира варијацијата на калциум (mg%) во крвниот серум на мајмуните беше еднаков на 10,6%. Големина на примерокот n= 100. Потребно е да се одредат границите на 95% интервал на доверба за општиот параметар CV.

Граници на интервалот на доверба за општиот коефициент на варијација CV се одредуваат со следните формули:

И
, Каде К средна вредност пресметана со формулата
.

Знаејќи го тоа со доверба веројатност Р= 95% нормализирано отстапување (студентски тест на к =
)т = 1,960, прво да ја пресметаме вредноста ДО:

.

или 9,3%

или 12,3%

Така, општиот коефициент на варијација со ниво на доверба од 95% се наоѓа во опсег од 9,3 до 12,3%. Со повторени примероци, коефициентот на варијација нема да надмине 12,3% и нема да биде под 9,3% во 95 случаи од 100.

Прашања за самоконтрола:

Проблеми за самостојно решавање.

1. Просечниот процент на маснотии во млекото за време на лактацијата на мелезните крави Kholmogory беше како што следува: 3,4; 3.6; 3.2; 3.1; 2,9; 3,7; 3.2; 3.6; 4.0; 3.4; 4.1; 3,8; 3.4; 4.0; 3.3; 3,7; 3,5; 3.6; 3.4; 3.8. Воспоставете интервали на доверба за општата средина на ниво на доверба од 95% (20 поени).

2. На 400 хибридни 'рж растенија првите цветови се појавувале во просек 70,5 дена по сеидбата. Стандардната девијација беше 6,9 дена. Одредете ја грешката на средната вредност и интервалите на доверба за општата средина и варијансата на ниво на значајност В= 0,05 и В= 0,01 (25 поени).

3. При проучување на должината на листовите на 502 примероци градинарски јагоди, добиени се следните податоци: = 7,86 см; σ = 1,32 см, =± 0,06 cm Одредување интервали на доверба за аритметичката популација средна вредност со нивоа на значајност од 0,01; 0,02; 0,05. (25 поени).

4. Во студија на 150 возрасни мажи, просечната висина била 167 см, а σ = 6 cm Кои се границите на општата средина и општата варијанса со веројатност на доверба од 0,99 и 0,95? (25 поени).

5. Распределбата на калциумот во крвниот серум на мајмуните се карактеризира со следните селективни индикатори: = 11,94 mg%, σ = 1,27, n = 100. Конструирај интервал на доверба од 95% за општата средина на оваа дистрибуција. Пресметај го коефициентот на варијација (25 поени).

6. Проучена е вкупната содржина на азот во крвната плазма на албино стаорци на возраст од 37 и 180 дена. Резултатите се изразени во грамови на 100 cm 3 плазма. На возраст од 37 дена, 9 стаорци имале: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. На возраст од 180 дена, 8 стаорци имале: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1.13; 1.12. Поставете интервали на доверба за разликата на ниво на доверба од 0,95 (50 поени).

7. Определете ги границите на интервалот на доверба од 95% за општата варијанса на дистрибуцијата на калциум (mg%) во крвниот серум на мајмуните, ако за оваа дистрибуција големината на примерокот е n = 100, статистичка грешка на варијансата на примерокот с σ 2 = 1,60 (40 поени).

8. Определете ги границите на интервалот на доверливост од 95% за општата варијанса на распределбата на 40 шипки од пченица по должината (σ 2 = 40,87 mm 2). (25 поени).

9. Пушењето се смета за главен фактор кој предиспонира за опструктивни белодробни заболувања. Пасивното пушење не се смета за таков фактор. Научниците се сомневаа во безопасноста на пасивното пушење и ја испитуваа проодноста на дишните патишта кај непушачите, пасивните и активните пушачи. За да ја карактеризираме состојбата на респираторниот тракт, зедовме еден од индикаторите за функцијата на надворешно дишење - максималната волуметриска стапка на проток на средината на издишување. Намалувањето на овој индикатор е знак за опструкција на дишните патишта. Податоците од анкетата се прикажани во табелата.

Број на испитани луѓе

Максимална стапка на средно-експираторен проток, l/s

Стандардна девијација

Непушачи

работа во простор за непушачи

работа во зачадена просторија

Пушењето

пуши мал број цигари

просечен број пушачи на цигари

пуши голем број цигари

Користејќи ги податоците од табелата, пронајдете 95% интервали на доверба за вкупната средна вредност и вкупната варијанса за секоја група. Кои се разликите помеѓу групите? Презентирајте ги резултатите графички (25 поени).

10. Определете ги границите на интервалите на доверливост од 95% и 99% за општата варијанса на бројот на прасиња во 64 огради, доколку статистичката грешка на варијансата на примерокот с σ 2 = 8,25 (30 поени).

11. Познато е дека просечната тежина на зајаците е 2,1 кг. Определете ги границите на интервалите на доверба од 95% и 99% за општата средина и варијансата на n= 30, σ = 0,56 кг (25 поени).

12. Содржината на зрното во увото е измерена за 100 клас ( X), должина на увото ( Y) и масата на жито во увото ( З). Најдете интервали на доверба за општата средина и варијанса на П 1 = 0,95, П 2 = 0,99, П 3 = 0,999 ако = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29,153, σ y 2 = 2. 111, σ z 2 = 0. 064. (25 поени).

13. Во 100 по случаен избор одбрани класови зимска пченица бил изброен бројот на шипки. Популацијата на примерокот се карактеризираше со следните индикатори: = 15 шипки и σ = 2,28 парчиња. Определете со која точност е добиен просечниот резултат ( ) и конструирајте интервал на доверба за општата средина и варијанса на нивоа на значајност од 95% и 99% (30 поени).

14. Број на ребра на школки од фосилни мекотели Ортамбонити калиграма:

Познато е дека n = 19, σ = 4,25. Определете ги границите на интервалот на доверба за општата средина и општата варијанса на ниво на значајност В = 0,01 (25 поени).

15. За да се одреди приносот на млеко на комерцијална млечна фарма, дневно се одредуваше продуктивноста на 15 крави. Според податоците за годината, секоја крава во просек ја давала следната количина млеко дневно (л): 22; 19; 25; 20; 27; 17; триесет; 21; 18; 24; 26; 23; 25; 20; 24. Конструирајте интервали на доверба за општата варијанса и аритметичката средина. Можеме ли да очекуваме просечниот годишен принос на млеко по крава да биде 10.000 литри? (50 поени).

16. За да се утврди просечниот принос на пченица за земјоделското претпријатие, се изврши косење на пробни парцели од 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 и 2 хектари. Продуктивноста (c/ha) од парцелите беше 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 соодветно. Конструирајте интервали на доверба за општата варијанса и аритметичка средина. Можеме ли да очекуваме дека просечниот земјоделски принос ќе биде 42 c/ha? (50 поени).