Дефиниција на интервал на доверба и веројатност за доверба. Веројатност и самодоверба

Откако ќе се добие точна проценка, пожелно е да се имаат податоци за веродостојноста на таа проценка. Јасно е дека вредноста е само приближна вредност на параметарот q. Пресметаната проценка на точка може да биде блиска до параметарот што се проценува или може да биде многу различно од него. Точка проценка не дава информации за точноста на постапката за проценка. Особено е важно да имате информации за веродостојноста на проценките за мали примероци. Во такви случаи, треба да се користат проценки на интервали.

Проблемот на проценката на интервалот во својата најопшта форма може да се формулира на следниов начин: користејќи примерок податоци, конструирајте нумерички интервал во однос на кој, со однапред избрана веројатност, можеме да кажеме дека проценетиот параметар лежи во овој интервал. Тука има неколку пристапи. Најчестиот метод за проценка на интервалот е метод на интервал на доверба.

Интервал на довербаза параметар q е интервал кој содржи непозната вредност на параметар популација со дадена веројатносте , т.е.

.

Се нарекува бројот g веројатност за доверба, а бројот a=1–g – ниво на доверливост. Веројатноста за доверба се поставува априори и се определува со специфични услови. Типично се користи g=0,9; 0,95; 0,99 (соодветно, a=0,1; 0,05; 0,01).

Должината на интервалот на доверба, кој ја карактеризира точноста на проценката на интервалот, зависи од големината на примерокот nи веројатноста за доверба g. Со зголемена вредност nдолжината на интервалот на доверба се намалува, а како што веројатноста g се приближува до единството, таа се зголемува.

Честопати интервалот на доверба се конструира симетрично во однос на проценката на поени, т.е. како

, (3.15)

Овде се нарекува бројот D крајна(или стандарден) грешка при земање мостри. Сепак, не е секогаш можно да се конструираат симетрични интервали, понекогаш треба да се ограничиме на еднострани интервали на доверба;

или .

Бидејќи во економетриските проблеми често е потребно да се конструираат интервали на доверба за параметрите на случајните променливи кои имаат нормална дистрибуција, ви претставуваме дијаграми на нивната локација.



3.4.2. Интервал на доверба на генералот
просек со позната општа варијанса

Нека квантитативниот знак Xнаселението има нормална дистрибуција со дадена варијанса s 2 и непознато математичко очекување а. Да се ​​процени параметарот аизваден примерок X 1 , X 2 , …, X n, која се состои од nнезависни нормални распределени случајни променливи со параметри аи s, и s е познато, а вредноста апроценето по примерок:

.

Дозволете ни да ја оцениме точноста на оваа приближна еднаквост. За да го направите ова, да ја поставиме веројатноста g и да се обидеме да најдеме број D така што релацијата важи

.

Следно, ќе ги користиме својствата на нормалната дистрибуција. Познато е дека и збирот на нормално распределените количини има нормална распределба. Според тоа, просечната вредност има нормална распределба, чие математичко очекување и варијанса се еднакви

Оттука,

.

Сега да ја користиме формулата за наоѓање на веројатностите за отстапување на нормално распределена случајна променлива од математичкото очекување:

,

каде F( x) – Лапласова функција. Замена Xна и на , добиваме

,

Каде. Од последната еднаквост го наоѓаме тоа маргинална грешка при земање мостриќе бидат еднакви

.

Имајќи предвид дека веројатноста за доверба е дадена и еднаква на g, го добиваме конечниот резултат.

Проценката на интервалот на општиот просек (математичко очекување) ја има формата

, (3.17)

или пократко

каде од равенството се одредува бројот t g.

Да ги дадеме вредностите т g за широко прифатени вредности на доверба:

, , .

Дозволете ни да разговараме како тоа влијае на точноста на проценката на параметрите аголемина на примерокот n, вредноста на стандардното отстапување s, како и вредноста на веројатноста за доверба g.

а) При зголемување nсе зголемува точноста на оценувањето. За жал, зголемувањето на точноста (т.е. намалувањето на должината на интервалот на доверба) е пропорционално на, а не 1/ n, т.е. се случува многу побавно од зголемувањето на бројот на набљудувања. На пример, ако сакаме да ја зголемиме точноста на заклучоците за фактор 10 чисто со статистички средства, тогаш мора да ја зголемиме големината на примерокот за фактор 100.

б) Колку е поголемо s, толку е помала точноста. Зависноста на точноста од овој параметар е линеарна.

в) Колку е поголема веројатноста за доверба g, толку е поголема вредноста на параметарот те, т.е. колку е помала точноста. Покрај тоа, помеѓу g и т g постои нелинеарна врска. Со зголемување на вредноста на g т g нагло се зголемува (на). Затоа, со голема доверба (со голема веројатност за доверба), можеме да гарантираме само релативно мала точност. (Интервалот на доверба ќе биде широк.) И обратно: кога означуваме непознат параметар арелативно тесни граници, ризикуваме да направиме грешка - со релативно голема веројатност.

Забележете дека вредноста

повикани просечна грешка при земање мостри. За земање примероци што не се повторуваат, оваа формула ќе ја има формата

. (3.20)

Тогаш максималната грешка при земање мостри D ќе биде т- повеќекратна просечна грешка:

Пример 3.7.Врз основа на долгорочно следење на тежината Xпакувањата со јаткасти плодови се полнат автоматски, се утврдува дека стандардното отстапување на тежината на пакувањата е s=10 Г. Беа измерени 25 пакувања, а нивната просечна тежина беше . Во кој интервал со 95% сигурност лежи вистинската вредност на просечната тежина на пакетот?

.

За да го одредиме интервалот на доверливост од 95%, ја пресметуваме максималната грешка при земање примероци

Затоа, интервалот на доверба од 95% за вистинската вредност на просечната тежина на пакетот ќе биде

,

На прв поглед, може да изгледа дека добиениот резултат претставува само теоретски резултат, бидејќи стандардното отстапување s, по правило, е исто така непознато и се пресметува од податоците од примерокот. Меѓутоа, ако примерокот е доволно голем, тогаш добиениот резултат е сосема прифатлив за практична употреба, бидејќи функцијата на дистрибуција малку ќе се разликува од нормалната, а проценката на варијансата с 2 ќе биде доста блиску до вистинската вредност s 2. Покрај тоа, добиениот резултат често се користи во случај кога распределбата на населението се разликува од нормалната. Ова се должи на фактот што збирот на независни случајни променливи, поради централната гранична теорема, со големи примероци има распределба блиска до нормалата. â

Пример 3.8.Да претпоставиме дека како резултат на примерок анкета за условите за домување на жителите на градот врз основа на случаен повторен примерок, се добиваат следните серии на варијации:

Табела 3.5

Конструирај интервал на доверба од 95% за карактеристиката што се проучува.

Решение.Да ја пресметаме средната вредност на примерокот и варијансата на карактеристиката што се проучува.

Табела 3.6

Вкупната површина на живеалишта по лице м 2 Број на жители n i Средината на интервалот x i
До 5.0 2,5 20,0 50,0
5,0–10,0 7,5 712,5 5343,8
10,0–15,0 12,5 2550,0 31875,0
15,0–20,0 17,5 4725,0 82687,5
20,0–25,0 22,5 4725,0 106312,5
25,0–30,0 27,5 3575,0 98312,5
30,0 или повеќе 32,5 2697,5 87668,8
Вкупно 19005,0 412250,0

; ; .

Просечната грешка при земање примероци ќе биде

.

Да ја одредиме максималната грешка при земање примероци со веројатност 0,95 ():

Ајде да ги поставиме границите на општиот просек

.

Така, врз основа на спроведената примерок анкета со веројатност од 0,95, можеме да заклучиме дека просечната големина на вкупната површина по лице во градот во целина се движи од 18,6 до 19,4 м 2. â

3.4.3. Интервал на доверба на генералот
просек со непозната општа варијанса

Погоре, го решивме проблемот со конструирање интервална проценка за математичкото очекување на нормална распределба кога е позната нејзината варијанса. Меѓутоа, во пракса, варијансата обично е исто така непозната и се пресметува од истиот примерок како и математичкото очекување. Ова доведува до потреба да се користи друга формула при определување на интервалот на доверба за математичкото очекување на случајна променлива која има нормална дистрибуција. Оваа формулација на проблемот е особено релевантна за мали големини на примероци.

Нека квантитативниот знак Xнаселението има нормална дистрибуција Н(а,s), и двата параметри аи се непознати. Врз основа на примерок податоци X 1 , X 2 , …, X n, пресметајте ја аритметичката средина и поправената варијанса:

, .

За да се најде интервалот на доверба во овој случај, се конструираат статистики

имајќи Студентска распределба со број на степени на слобода n=n–1, без оглед на вредностите на параметрите a и s. Со избирање на веројатноста за доверба g и со познавање на големината на примерокот n, можете да најдете број t таков што еднаквоста

,

.

Од тука наоѓаме

проценка на интервал за општиот просек (математичко очекување) со непознати s:

, (3.22)

или пократко

Број т (Студентски коефициент) се наоѓа од табелите за распределбата Студент. Забележете дека тоа е функција на два аргументи: веројатноста за доверба g и бројот на степени на слобода к=n-1, т.е. t=t(g,n).

Треба да бидете многу внимателни кога користите табели за распределба на Студентите. Прво, табелите обично го користат нивото на доверливост a=1–g наместо веројатноста за доверба g. Второ, многу често табелите ги содржат вредностите на т.н. едноопашест Студентски т тест

Или .

Во овој случај, табелите треба да земаат вредности ако табелата користи ниво на доверливост или ако табелата користи ниво на доверба.

И покрај очигледната сличност на формулите (3.17) и (3.22), постои значајна разлика меѓу нив, имено дека коефициентот Студент тне зависи само од нивото на доверба, туку и од големината на примерокот. Оваа разлика е особено забележлива кај малите примероци. (Потсетиме дека со големи примероци разликата помеѓу Студентската распределба и нормалната распределба практично исчезнува.) Во овој случај, употребата на нормалната дистрибуција доведува до неоправдано стеснување на интервалот на доверба, т.е. до неоправдано зголемување на точноста. На пример, ако n=5 и g=0,99, тогаш, користејќи ја распределбата Student, добиваме т=4.6, и користејќи ја нормалната дистрибуција, - т=2,58, т.е. интервалот на доверба во вториот случај е речиси двојно потесен од интервалот кога се користи распределбата Студент.

Пример 3.9.Еден берзански аналитичар го проценува просечниот принос на одредени акции. Случаен примерок од 15 дена покажа дека просечниот (годишен) принос со стандардна девијација од . Претпоставувајќи дека повратот на акциите следи нормална дистрибуција, конструирајте интервал на доверба од 95% за просечниот принос на типот на акции од интерес за аналитичарот.

Решение.Од големината на примерокот n=15, тогаш потребно е да се примени Студентската распределба со степени на слобода. Користејќи ги табелите за студентска распределба наоѓаме

.

Користејќи ја оваа вредност, конструираме интервал на доверба од 95%.

.

Затоа, аналитичарот може да биде 95% уверен дека просечниот годишен принос на акциите е помеѓу 8,44% и 12,3%. â

Честопати, проценителот треба да го анализира пазарот на недвижности на сегментот во кој се наоѓа имотот што се проценува. Ако пазарот е развиен, може да биде тешко да се анализира целиот сет на презентирани објекти, па затоа се користи примерок од објекти за анализа. Овој примерок не излегува секогаш хомоген, понекогаш е неопходно да се исчистат од екстремни точки - премногу високи или премногу ниски понуди на пазарот; За таа цел се користи интервал на доверба. Целта на оваа студија е да се спроведе компаративна анализа на два методи за пресметување на интервалот на доверба и да се избере оптималната опција за пресметка при работа со различни примероци во системот estimatica.pro.

Интервал на доверба е интервал на вредности на атрибути пресметан врз основа на примерок, кој со позната веројатност го содржи проценетиот параметар на општата популација.

Поентата на пресметувањето на интервалот на доверливост е да се конструира таков интервал врз основа на податоците од примерокот, така што може да се наведе со дадена веројатност дека вредноста на проценетиот параметар е во овој интервал. Со други зборови, интервалот на доверба ја содржи непознатата вредност на проценетата вредност со одредена веројатност. Колку е поширок интервалот, толку е поголема неточноста.

Постојат различни методи за одредување на интервалот на доверба. Во оваа статија ќе разгледаме 2 методи:

  • преку медијаната и стандардната девијација;
  • преку критичната вредност на t-статистика (Студентски коефициент).

Фази на компаративна анализа на различни методи за пресметување на CI:

1. формира примерок од податоци;

2. го обработуваме со помош на статистички методи: пресметуваме просечна вредност, медијана, варијанса итн.;

3. пресметајте го интервалот на доверба на два начина;

4. анализирајте ги исчистените примероци и добиените интервали на доверба.

Фаза 1. Земање примероци на податоци

Примерокот е формиран со користење на системот estimatica.pro. Примерокот опфати 91 понуда за продажба на станови со една соба во третата ценовна зона со распоред на типот „Хрушчов“.

Табела 1. Почетен примерок

Цена 1 кв.м., единица

Сл.1. Почетен примерок



Фаза 2. Обработка на првичниот примерок

Обработката на примерок со помош на статистички методи бара пресметување на следните вредности:

1. Аритметичка средина

2. Медијана е бројка што го карактеризира примерокот: точно половина од елементите на примерокот се поголеми од медијаната, другата половина се помали од медијаната

(за примерок со непарен број вредности)

3. Опсег - разликата помеѓу максималните и минималните вредности во примерокот

4. Варијанса - се користи за попрецизна проценка на варијацијата на податоците

5. Стандардна девијација на примерокот (во натамошниот текст - SD) е најчестиот индикатор за дисперзија на вредностите за прилагодување околу аритметичката средина.

6. Коефициент на варијација - го одразува степенот на расејување на вредностите за прилагодување

7. коефициент на осцилација - ја одразува релативната флуктуација на екстремните ценовни вредности во примерокот околу просекот

Табела 2. Статистички показатели на оригиналниот примерок

Коефициентот на варијација, кој ја карактеризира хомогеноста на податоците, е 12,29%, но коефициентот на осцилација е превисок. Така, можеме да кажеме дека оригиналниот примерок не е хомоген, па да продолжиме со пресметување на интервалот на доверба.

Фаза 3. Пресметка на интервал на доверба

Метод 1. Пресметка со користење на медијана и стандардна девијација.

Интервалот на доверба се одредува на следниов начин: минимална вредност - стандардното отстапување се одзема од средната вредност; максимална вредност - стандардната девијација се додава на медијаната.

Така, интервалот на доверба (47179 CU; 60689 CU)

Ориз. 2. Вредностите што спаѓаат во интервалот на доверба 1.



Метод 2. Конструирање интервал на доверливост користејќи ја критичната вредност на t-статистика (студентски коефициент)

С.В. Грибовски во својата книга „Математички методи за проценка на вредноста на имотот“ опишува метод за пресметување на интервалот на доверба преку коефициентот Студент. Кога се пресметува со користење на овој метод, проценувачот мора самиот да го постави нивото на значајност ∝, кое ја одредува веројатноста со која ќе се изгради интервалот на доверба. Типично, се користат нивоа на значајност од 0,1; 0,05 и 0,01. Тие одговараат на веројатноста за доверба од 0,9; 0,95 и 0,99. Со овој метод, се претпоставува дека вистинските вредности на математичкото очекување и варијансата се практично непознати (што е скоро секогаш точно кога се решаваат практични проблеми со проценка).

Формула за интервал на доверба:

n - големина на примерокот;

Критичната вредност на t-статистика (Студентска дистрибуција) со ниво на значајност ∝, бројот на степени на слобода n-1, кој се одредува од посебни статистички табели или со помош на MS Excel (→„Статистичка“→ СТУДИСТ);

∝ - ниво на значајност, земете ∝=0,01.

Ориз. 2. Вредностите што спаѓаат во интервалот на доверба 2.

Фаза 4. Анализа на различни методи за пресметување на интервалот на доверба

Два методи за пресметување на интервалот на доверба - преку медијаната и студентскиот коефициент - доведоа до различни вредности на интервалите. Според тоа, добивме два различни исчистени примероци.

Табела 3. Статистика за три примероци.

Индекс

Почетен примерок

1 опција

Опција 2

Средна вредност

Дисперзија

Коф. варијации

Коф. осцилации

Број на пензионирани објекти, ЕЕЗ.

Врз основа на извршените пресметки, можеме да кажеме дека вредностите на интервалот на доверливост добиени со различни методи се вкрстуваат, така што можете да користите кој било од методите за пресметка по дискреција на проценителот.

Сепак, веруваме дека кога работиме во системот estimatica.pro, препорачливо е да се избере метод за пресметување на интервалот на доверба во зависност од степенот на развој на пазарот:

  • ако пазарот е неразвиен, користете го пресметковниот метод со користење на средната и стандардната девијација, бидејќи бројот на пензионирани објекти во овој случај е мал;
  • ако пазарот е развиен, применете ја пресметката преку критичната вредност на t-статистика (Student's коефициент), бидејќи е можно да се формира голем почетен примерок.

При подготовката на статијата се користеа следново:

1. Грибовски С.В., Сиветс С.А., Левикина И.А. Математички методи за проценка на вредноста на имотот. Москва, 2014 година

2. Системски податоци estimatica.pro

Анализата на случајните грешки се заснова на теоријата на случајни грешки, што овозможува со одредена гаранција да се пресмета вистинската вредност на измерената вредност и да се проценат можните грешки.

Теоријата на случајни грешки се заснова на следните претпоставки:

со голем број мерења, случајни грешки со иста големина, но со различни знаци, се случуваат подеднакво често;

големите грешки се поретки од малите (веројатноста за грешка се намалува како што се зголемува нејзината големина);

со бесконечно голем број мерења, вистинската вредност на измерената величина е еднаква на аритметичката средина на сите резултати од мерењето;

појавата на еден или друг резултат од мерењето како случаен настан е опишан со законот за нормална дистрибуција.

Во пракса, се прави разлика помеѓу општо и примерок збир на мерења.

Под населението го подразбираат целиот сет на можни мерни вредности или можни вредности на грешка
.

За популацијата на примерокот број на мерења ограничени и строго определени во секој конкретен случај. Тие мислат дека ако
, тогаш просечната вредност на овој сет на мерења е доволно блиску до неговата вистинска вредност.

1. Проценка на интервал користејќи веројатност за доверба

За голем примерок и нормална дистрибуција, општата оценка карактеристика на мерењето е дисперзија
и коефициент на варијација :

;
. (1.1)

Дисперзијата ја карактеризира хомогеноста на мерењето. Колку е повисоко
, толку е поголема расејувањето на мерењата.

Коефициентот на варијација ја карактеризира варијабилноста. Колку е повисоко , толку е поголема варијабилноста на мерењата во однос на просечните вредности.

За да се процени веродостојноста на резултатите од мерењето, се воведуваат концептите на интервал на доверба и веројатност на доверба.

Доверливо наречен интервал вредности , во која спаѓа вистинската вредност измерена величина со дадена веројатност.

Веројатност за доверба (сигурност) на мерењето е веројатноста вистинската вредност на измерената вредност да падне во даден интервал на доверба, т.е. до зоната
. Оваа вредност се одредува во фракции од единица или како процент

,

Каде
- Лапласова интегрална функција ( табела 1.1 )

Лапласовата интегрална функција е дефинирана со следниот израз:

.

Аргументот за оваа функција е гарантен фактор :

Табела 1.1

Лапласова интегрална функција

Доколку врз основа на одредени податоци се утврди веројатност за доверба (често се зема еднакво на
), потоа се поставува точност на мерењата (интервал на доверба
) врз основа на соодносот

.

Половина од интервалот на доверба е

, (1.3)

Каде
- аргумент на Лапласовата функција, ако
(табела 1.1 );

- Студентски функции, доколку
(табела 1.2 ).

Така, интервалот на доверба ја карактеризира точноста на мерењето на даден примерок, а веројатноста за доверба ја карактеризира веродостојноста на мерењето.

Пример

Направено
мерења на јачината на површината на патот на автопатска делница со просечен модул на еластичност
и пресметаната вредност на стандардното отстапување
.

Неопходно определи ја потребната точностмерења за различни нивоа на доверба
, земајќи ги вредностите Од страна на табела 1.1 .

Во овој случај, соодветно |

Следствено, за дадено средство и метод на мерење, интервалот на доверба се зголемува приближно пати ако се зголеми само на
.

Теоремите 1 и 2, иако се општи, односно се формулирани под прилично широки претпоставки, тие не овозможуваат да се одреди колку проценките се блиску до проценетите параметри. Од фактот дека -проценките се конзистентни, произлегува само дека како што се зголемува големината на примерокот, вредноста П(|θ * – θ | < δ), δ < 0, приближается к 1.

Се појавуваат следните прашања.

1) Која треба да биде големината на примерокот? П,така што наведената точност
|θ * – θ | = δ беше гарантиран со претходно прифатена веројатност?

2) Која е точноста на проценката ако е позната големината на примерокот и е дадена веројатноста за заклучок без грешка?

3) Која е веројатноста дека, со оглед на големината на примерокот, ќе се обезбеди одредената точност на проценката?

Да воведеме неколку нови дефиниции.

Дефиниција. Веројатност γ за исполнување на неравенството,|θ *– θ | < δ се нарекува ниво на доверба или веродостојност на проценката θ.

Да продолжиме од нееднаквоста | θ *–θ | < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

Бидејќи θ (проценет параметар) е константен број, и θ * – случајна вредност, концептот на веројатност за доверба може да се формулира на следниов начин: веројатност на доверба γ е веројатноста дека интервалот ( θ *– δ, θ *+ δ) го опфаќа проценетиот параметар.

Дефиниција. Случаен интервал(θ *–δ , θ *+δ ), во кој непознатиот проценет параметар лежи со веројатност γ се нарекува интервал на доверба İ, што одговара на коефициентот на доверба γ,

İ= (θ*– δ, θ*+ δ ). (3)

Веродостојност на проценката γ може да се специфицира однапред, тогаш, знаејќи го законот за распределба на случајната променлива што се проучува, може да се најде интервалот на доверба İ . Инверзната задача се решава и кога, дадено е дадено İ се наоѓа соодветната веродостојност на проценката.

Нека, на пример, γ = 0,95; потоа бројот Р= 1 – y = 0,05 ја покажува веројатноста со која заклучокот за веродостојноста на проценката е погрешен. Број р=1–γповикани ниво на значење.Нивото на значајност е однапред поставено во зависност од конкретниот случај. Вообичаено Рземено еднакво на 0,05; 0,01; 0,001.

Ајде да дознаеме како да изградиме интервал на доверба за математичкото очекување на нормално распределената карактеристика. Се покажа дека

Да го процениме математичкото очекување користејќи го просекот на примерокот, имајќи предвид дека тој има и нормална дистрибуција*. Ние имаме

(4)

а од формулата (12.9.2) добиваме

Имајќи ја предвид (13.5.12) добиваме

(5)

Нека се знае веројатноста γ . Потоа

За погодност за користење на табелата на функцијата Лаплас, потоа поставивме a

Интервал

(7)

го покрива параметарот a = М(X) со веројатност γ .

Во повеќето случаи стандардното отстапување σ(X)карактеристиката што се проучува е непозната. Затоа, наместо σ (X) со голем примерок ( n> 30) примени го исправеното стандардно отстапување на примерокот с, што пак е проценка σ (X), интервалот на доверба ќе изгледа вака

İ =

Пример.Со веројатност γ = 0,95, најдете го интервалот на доверба за М(X) – должината на увото на сортата јачмен „Московски 121“. Дистрибуцијата е специфицирана со табела во која „наместо интервали на промена (x јас, Х јас+ 1) се земаат броеви, видете Сметајте дека е случајна променлива Xе предмет на нормална дистрибуција.

Решение. Примерокот е голем ( n= 50). Ние имаме

Ајде да ја најдеме точноста на проценката

Ајде да ги дефинираме границите на доверба:

Така, со сигурност γ = 0,95 математичко очекување е содржано во интервалот на доверба Јас= (9,5; 10,3).

Значи, во случај на голем примерок ( n> 30), кога коригираното стандардно отстапување малку отстапува од стандардното отстапување на карактеристичната вредност во популацијата, може да се најде интервал на доверба. Но, не е секогаш можно да се направи голем примерок и не е секогаш препорачливо. Од (7) јасно е дека помалите П,толку е поширок интервалот на доверба, т.е. Јасзависи од големината на примерокот П.

Англискиот статистичар Госет (псевдоним Студент) докажал дека во случај на нормална распределба на карактеристика Xво општата популација на нормализација случајна променлива

(8)

зависи само од големината на примерокот. Пронајдена е дистрибутивната функција на случајната променлива Ти веројатноста П(Т < t γ), t γ– точност на проценката. Функција дефинирана со еднаквост

с (n, t γ) = П(|Т| < t γ) = γ (9)

именуван Студентска т-распределбаСо П– 1 степен на слобода. Формулата (9) ја поврзува случајната променлива Т,интервал на доверба İ и веројатноста за доверба γ . Знаејќи две од нив, можете да го најдете третиот. Земајќи ја предвид (8), имаме

(10)

Неравенката од левата страна на (13.7.10) ја заменуваме со еквивалентната неравенка . Како резултат добиваме

(11)

Каде t γ=т(γ ,n). За функцијата t γтабелите се составени (види Додаток 5). На n> 30-ти t γИ т,Лапласовите функции пронајдени од табелата практично се совпаѓаат.

Интервал на доверба за проценка на стандардната девијација σ xво случај на нормална дистрибуција.

Теорема.Нека се знае дека случајната променлива има нормална дистрибуција. Потоа, за да се процени параметарот σ x од овој закон, важи еднаквоста

(12)

Кадеγ – веројатноста за доверба во зависност од големината на примерокот n и точноста на проценката β.

Функција γ = Ψ (n, β ) е добро проучен. Се користи за одредување β = β (γ ,П). За β = β (γ ,П) составени се табели според познати П(големина на примерокот) и γ (веројатноста на доверба) се одредува β .

Пример.За да се процени параметарот на нормално распределена случајна променлива, земен е примерок (дневен принос на млеко од 50 крави) и пресметан с= 1,5. Најдете го интервалот на доверливост што го покрива со веројатност γ = 0,95.

Решение. Според табелата β (γ , П)За n= 50 и γ = 0,95 наоѓаме β = 0,21 (види Додаток 6).

Во согласност со нееднаквоста (13), ги наоѓаме границите на интервалот на доверба. Ние имаме

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21 1,5 = 1,185;

Интервал

Разгледуваните точкести проценки на параметрите на дистрибуција даваат проценка во форма на број најблизок до вредноста на непознатиот параметар. Ваквите проценки се користат само за голем број мерења. Колку е помала големината на примерокот, толку е полесно да се направи грешка при изборот на параметар. За пракса, важно е не само да се добие проценка на точка, туку и да се одреди интервалот, наречен верувајќи,меѓу чии граници со дадена веродостојна веројатност

каде q е нивото на значајност; x n, x b - долните и горните граници на интервалот, се наоѓа вистинската вредност на проценетиот параметар.

Општо земено, интервалите на доверба може да се конструираат врз основа на Нееднаквости на Чебишев.За секој закон за распределба на случајна променлива со моменти од првите два реда, горната граница на веројатноста за отстапување на случајната променлива x од центарот на дистрибуција X c паѓа во интервалот tS x е опишана со неравенката Чебишев.

каде што S x е проценка на стандардното отстапување на распределбата; t е позитивен број.

За да најдете интервал на доверба, не треба да го знаете законот за распределба на резултатите од набљудувањето, туку треба да ја знаете проценката на стандардното отстапување. Интервалите добиени со помош на нееднаквоста на Чебишев се покажаа премногу широки за вежбање. Така, веројатноста за доверба од 0,9 за многу закони за дистрибуција одговара на интервал на доверба од 1,6S X. Неравенството на Чебишев во овој случај дава 3,16S X. Поради ова, таа не стана широко распространета.

Во метролошката практика главно се користат квантилни проценкиинтервал на доверба. Под 100P процентен квантил x p се подразбира како апсциса на таква вертикална линија, лево од која површината под кривата на густината на распределбата е еднаква на P%. Со други зборови, квантил- ова е вредноста на случајна променлива (грешка) со дадена веројатност за доверба P. На пример, медијаната на распределбата е квантил од 50% x 0,5.

Во пракса, квантилите од 25 и 75% обично се нарекуваат набори,или квантили на дистрибуцијата.Помеѓу нив лежи 50% од сите можни вредности на случајната променлива, а останатите 50% се надвор од нив. Интервалот на вредности на случајна променлива x помеѓу x 0 05 и x 0 95 покрива 90% од сите нејзини можни вредности и се нарекува интерквантилен интервал со 90% веројатност.Неговата должина е d 0,9 = x 0,95 - x 0,05.

Врз основа на овој пристап, се воведува концептот квантилни вредности на грешка,тие. вредности на грешка со дадена веројатност за доверба P - границите на интервалот на несигурност ± D D = ± (x p - x 1-p)/2 = ± d p /2. По должината на нејзината должина, се појавуваат P% од вредностите на случајната променлива (грешка), а q = (1- P)% од нивниот вкупен број остануваат надвор од овој интервал.

За да се добие интервална проценка на нормално распределена случајна променлива, потребно е:

Определете ја проценката на точката на MO x̅ и стандардната девијација S x на случајната променлива користејќи ги формулите (6.8) и (6.11), соодветно;

Најдете ги горните x во и долните x n граници во согласност со равенките

добиени земајќи ја предвид (6.1). Вредностите на x n и x b се одредуваат од табелите на вредностите на функцијата за интегрална дистрибуција F(t) или Лапласовата функција Ф(1).

Добиениот интервал на доверба ја задоволува состојбата

каде n е бројот на измерени вредности; z p е аргумент на Лапласовата функција Ф(1), што одговара на веројатноста Р/2. Во овој случај, z p се нарекува квантилен фактор. Половина од должината на интервалот на доверба се нарекува граница на доверба на грешката на резултатот од мерењето.

Пример 6.1. Беа направени 50 мерења на постојан отпор. Да се ​​определи интервалот на доверба за вредноста на MO на постојан отпор ако законот за распределба е нормален со параметри m x = R = 590 Ohm, S x = 90 Ohm со веројатност на доверба од P = 0,9.

Бидејќи хипотезата за нормалноста на законот за распределба не е во спротивност со експерименталните податоци, интервалот на доверба се одредува со формулата

Оттука Ф(z р) = 0,45. Од табелата дадена во Додаток 1, откриваме дека z p = 1,65. Затоа, интервалот на доверба ќе биде напишан како

Или 590-21< R < 590 + 21. Окончательно 509 Ом < R < 611 Ом.

Ако законот за распределба на случајна променлива се разликува од нормалната, неопходно е да се конструира неговиот математички модел и да се одреди интервалот на доверба користејќи го.

Разгледаниот метод за наоѓање интервали на доверба е валиден за доволно голем број набљудувања n, кога s = S x. Треба да се запомни дека пресметаната проценка на стандардната девијација S x е само одредена приближна вредност на вистинската вредност на s. Одредувањето на интервал на доверба за дадена веројатност се покажува како помалку веродостојно, толку е помал бројот на набљудувања. Невозможно е да се користат формули за нормална дистрибуција со мал број на набљудувања ако не е можно теоретски да се одреди стандардната девијација врз основа на прелиминарни експерименти со доволно голем број на набљудувања.

Пресметка на интервали на доверба за случајот кога распределбата на резултатите од набљудувањето е нормална, но нивната варијанса е непозната, т.е. со мал број на набљудувања n, можно е да се изврши со користење на Студентската распределба S(t,k). Ја опишува густината на дистрибуцијата на односот (Допка на ученикот):

каде што Q е вистинската вредност на измерената величина. Количини x̅, S x. и S x ̅ се пресметуваат врз основа на експериментални податоци и претставуваат точкести проценки на MO, стандардна девијација на резултатите од мерењето и стандардна девијација на аритметичката средна вредност.

Веројатноста дека дропката Student, како резултат на направените набљудувања, ќе добие одредена вредност во интервалот (- t p ; + t p)

каде k е бројот на степени на слобода еднаков на (n - 1). Вредностите на t p (во овој случај се нарекуваат Студентски коефициенти),пресметани со помош на последните две формули за различни вредности на веројатноста за доверба и број на мерења, се табелирани (види табела во Додаток 1). Затоа, користејќи ја распределбата Student, можете да ја најдете веројатноста дека отстапувањето на аритметичката средина од вистинската вредност на измерената вредност не надминува

Во случаите кога распределбата на случајни грешки не е нормална, често се користи распределбата Студент со приближување, чиј степен останува непознат. Дистрибуцијата Student се користи за голем број мерења n< 30, поскольку уже при n = 20, ...,30 оно переходит в нормальное и вместо уравнения (6.14) можно использовать уравнение (6.13). Результат измерения записывается в виде: ; P = Р d, каде што Р d е специфична вредност на веројатноста за доверба. Факторот t за голем број мерења n е еднаков на квантилниот фактор z p. За мало n е еднакво на коефициентот Студент.

Добиениот резултат од мерењето не е еден специфичен број, туку претставува интервал во кој, со одредена веројатност P d, се наоѓа вистинската вредност на измерената вредност. Истакнувањето на средината на интервалот x воопшто не значи дека вистинската вредност е поблиску до него отколку до другите точки во интервалот. Може да биде каде било во интервалот, а со веројатност 1 - Р d дури и надвор од него.

Пример 6.2. Одредувањето на специфичните магнетни загуби за различни примероци од една серија на електричен челик 2212 ги даде следните резултати: 1,21; 1,17; 1,18; 1.13; 1,19; 1.14; 1,20 и 1,18 W/kg. Под претпоставка дека нема систематска грешка и дека случајната грешка е нормално распределена, неопходно е да се одреди интервалот на доверба при вредности на доверливост на веројатност од 0,9 и 0,95. За да го решите проблемот, користете ја формулата Лапласова и распределбата Студент.

Користејќи ги формулите (6.8) во (6.11) наоѓаме проценки на аритметичката средна вредност и стандардното отстапување на резултатите од мерењето. Тие се соодветно еднакви на 1,18 и 0,0278 W/kg. Претпоставувајќи дека проценката на MSD е еднаква на самото отстапување, наоѓаме:

Оттука, користејќи ги вредностите на функцијата Лаплас дадени во табелата во Додаток 1, го одредуваме тоа z стр= 1,65. За P = 0,95, z коефициент p = 1,96. Интервалите на доверба што одговараат на P = 0,9 и 0,95 се 1,18 ± 0,016 и 1,18 ± 0,019 W/kg.

Според табелата во Додаток 1, наоѓаме дека t 0,9 = 1,9 и t 0,95 = 2,37. Оттука, интервалите на доверба се соодветно 1,18±0,019 и 1,18±0,023 W/kg.