Дайте визначення поняття довірчого інтервалу. Довірчий інтервал

Довірчий інтервал

Довірчий інтервал- термін, який використовується в математичній статистиці при інтервальній (на відміну від точкової) оцінки статистичних параметрів, що краще при невеликому обсязі вибірки. Довірчим називають інтервал, який покриває невідомий параметр із заданою надійністю.

Метод довірчих інтервалів розробив американський статистик Єжи Нейман, виходячи з ідей англійського статистика Рональда Фішера.

Визначення

Довірчим інтервалом параметра θ розподілу випадкової величини Xз рівнем довіри 100 p%, породженим вибіркою ( x 1 ,…,x n), називається інтервал з межами ( x 1 ,…,x n) та ( x 1 ,…,x n), які є реалізаціями випадкових величин L(X 1 ,…,X n) та U(X 1 ,…,X n), таких, що

.

Граничні точки довірчого інтервалу і називаються довірчими межами.

Інтерпретація довірчого інтервалу, заснована на інтуїції, буде такою: якщо pвелике (скажімо, 0,95 або 0,99), то довірчий інтервал майже напевно містить справжнє значення θ .

Ще одне тлумачення поняттю довірчого інтервалу: його можна як інтервал значень параметра θ , сумісні з досвідченими даними і не суперечать їм.

Приклади

  • Довірчий інтервал для математичного очікування нормальної вибірки;
  • Довірчий інтервал для дисперсії нормальної вибірки.

Байєсовський довірчий інтервал

У байєсовской статистиці існує схоже, але визначення деяких ключових деталях визначення довірчого інтервалу. Тут параметр, що оцінюється, сам вважається випадковою величиною з деяким заданим апріорним розподілом (у найпростішому випадку - рівномірним), а вибірка фіксована (у класичній статистиці все в точності навпаки). Байєсовський -довірчий інтервал - це інтервал, що покриває значення параметра з апостеріорною ймовірністю:

.

Як правило, класичний та байєсовський довірчі інтервали різняться. В англомовній літературі байєсівський довірчий інтервал прийнято називати терміном credible interval, а класичний - confidence interval.

Примітки

Джерела

Wikimedia Foundation. 2010 .

  • Дітки (фільм)
  • Колоніст

Дивитись що таке "Довірчий інтервал" в інших словниках:

    Довірчий інтервал- інтервал, обчислений за вибірковими даними, який із заданою ймовірністю (довірчою) накриває невідоме справжнє значення параметра розподілу, що оцінюється. Джерело: ГОСТ 20522 96: Ґрунти. Методи статистичної обробки результатів … Словник-довідник термінів нормативно-технічної документації

    довірчий інтервал- для скалярного параметра генеральної сукупності - це відрізок, що з великою ймовірністю містить цей параметр. Ця фраза без подальших уточнень безглузда. Оскільки межі довірчого інтервалу оцінюються за вибіркою, природно його… Словник соціологічної статистики

    ДОВІРНИЙ ІНТЕРВАЛ- метод оцінювання параметрів, який відрізняється від точкового оцінювання. Нехай задана вибірка x1, . . ., хn з розподілу з густиною ймовірності f(x, α), і а*=а*(x1, . . ., хn) оцінка α, g(a*, α) густина ймовірності оцінки. Шукаємо… … Геологічна енциклопедія

    ДОВІРНИЙ ІНТЕРВАЛ- (confidence interval) Інтервал, в якому достовірність значення параметра населення, отриманого на основі вибіркового обстеження, має певний ступінь ймовірності, наприклад 95%, що обумовлено самою вибіркою (sample). Ширина… … Економічний словник

    довірчий інтервал- – інтервал, у якому перебуває справжнє значення визначається величини із заданою довірчою ймовірністю. Загальна хімія: підручник / А. В. Жолнін … Хімічні терміни

    Довірчий інтервал ДІ- довірчий інтервал, ДІ * даверальний інтервал, ДІ * confidence interval інтервал значення ознаки, розрахований для к. л. параметра розподілу (напр., середнього значення ознаки) за вибіркою та з певною ймовірністю (напр., 95% для 95% … Генетика. Енциклопедичний словник

    ДОВІРНИЙ ІНТЕРВАЛ- поняття, що виникає в оцінці параметра статистич. розподілу інтервалом значень. Д. в. для параметра q, відповідний даному коеф. довіри Р, дорівнює такому інтервалу (q1, q2), що з будь-якому розподілі ймовірності нерівності… … Фізична енциклопедія

    довірчий інтервал- - Тематики електрозв'язок, основні поняття EN confidence interval ... Довідник технічного перекладача

    довірчий інтервал- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: англ. confidence interval vok. Vertrauensbereich, m rus. Penkiakalbis aiškinamasis metrologijos terminų žodynas

    довірчий інтервал- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: англ. confidence interval ukr. довірча область; довірчий інтервал … Chemijos terminų aiškinamasis žodynas

Побудуємо в MS EXCEL довірчий інтервал з метою оцінки середнього значення розподілу у разі відомого значення дисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупностімає взята вибіркарозміру n. Передбачається, що стандартне відхиленняцього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за досить великого розміру вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуз параметрами N(μ; 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз надійдемо навпаки: знайдемо інтервал, в який випадкова величина потрапить із заданою ймовірністю. Наприклад, із властивостей нормального розподілувідомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону, потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді на запитання ми маємо вказати форму розподілу та його параметри.

Форму розподілу ми знаємо – це нормальний розподіл(нагадаємо, що йдеться про вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значимості α (альфа) простим виразом рівень довіри =1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, в загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикою пристрою. Інженер хоче збудувати довірчий інтервал для середнього часу відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення часу відгуку складає 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованою, а випадковою величиною, яка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більше того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичному очікуванню вибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Зрештою, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

У попередніх підрозділах ми розглянули питання щодо оцінки невідомого параметра аодним числом. Така оцінка називається "точковою". У ряді завдань потрібно не тільки знайти параметр авідповідне чисельне значення, але й оцінити його точність та надійність. Потрібно знати, до яких помилок може призвести заміна параметра айого точковою оцінкою аі з яким ступенем впевненості можна очікувати, що ці помилки не вийдуть за певні межі?

Такі завдання особливо актуальні при малій кількості спостережень, коли точкова оцінка а взначною мірою випадкова і наближена заміна а на а може призвести до серйозних помилок.

Щоб дати уявлення про точність та надійність оцінки а,

у математичній статистиці користуються так званими довірчими інтервалами та довірчими ймовірностями.

Нехай для параметра аотримана з досвіду незміщена оцінка а.Ми хочемо оцінити можливу при цьому помилку. Призначимо деяку досить велику ймовірність р (наприклад, р = 0,9, 0,95 або 0,99) таку, що подію з ймовірністю р можна вважати практично достовірною, і знайдемо таке значення s, для якого

Тоді діапазон практично можливих значень помилки, що виникає під час заміни ана а, буде ± s; великі по абсолютній величині помилки з'являтимуться лише з малою ймовірністю а = 1 - р. Перепишемо (14.3.1) у вигляді:

Рівність (14.3.2) означає, що з ймовірністю р невідоме значення параметра апотрапляє в інтервал

При цьому слід зазначити одну обставину. Раніше ми неодноразово розглядали можливість потрапляння випадкової величини в заданий невипадковий інтервал. Тут справа інакша: величина ане випадкова, зате випадковий інтервал/р. Випадково його становище на осі абсцис, що визначається його центром а; випадкова взагалі і довжина інтервалу 2s, так як величина s обчислюється, як правило, за дослідними даними. Тому в даному випадку краще буде тлумачити величину р не як ймовірність «попадання» точки ав інтервал/р, а як ймовірність того, що випадковий інтервал/р накриє точку а(Рис. 14.3.1).

Мал. 14.3.1

Імовірність р прийнято називати довірчою ймовірністю, а інтервал / р - довірчим інтервалом.Межі інтервалу If. а х = а- s та а 2 = а +а називаються довірчими межами.

Дамо ще одне тлумачення поняттю довірчого інтервалу: його можна як інтервал значень параметра а,сумісних з досвідченими даними і не суперечать їм. Справді, якщо домовитися вважати подію з ймовірністю а = 1-р практично неможливим, то значення параметра а, котрим а - а> s, слід визнати такими, що суперечать досвідченим даним, а ті, для яких |а - а a t na 2 .

Нехай для параметра ає незміщена оцінка а.Якби нам був відомий закон розподілу величини а, Завдання знаходження довірчого інтервалу була б дуже проста: достатньо було б знайти таке значення s, для якого

Труднощі полягає в тому, що закон розподілу оцінки азалежить від закону розподілу величини Xі, отже, від його невідомих параметрів (зокрема, і від параметра а).

Щоб обійти цю скруту, можна застосувати наступний грубо наближений прийом: замінити у виразі s невідомі параметри їх точковими оцінками. При порівняно великій кількості дослідів п(близько 20...30) цей прийом зазвичай дає задовільні за точністю результати.

Як приклад розглянемо завдання про довірчий інтервал для математичного очікування.

Нехай зроблено п X,характеристики якої - математичне очікування тта дисперсія D- Невідомі. Для цих параметрів отримано оцінки:

Потрібно побудувати довірчий інтервал/р, що відповідає довірчій ймовірності р, для математичного очікування твеличини X.

При вирішенні цього завдання скористаємося тим, що величина тявляє собою суму пнезалежних однаково розподілених випадкових величин X hі відповідно до центральної граничної теореми за досить великого пїї закон розподілу близький до нормального. Насправді навіть за відносно невеликій кількості доданків (близько 10...20) закон розподілу суми можна приблизно вважати нормальним. Виходитимемо з того, що величина трозподілено за нормальним законом. Характеристики цього закону – математичне очікування та дисперсія – рівні відповідно ті

(Див. розділ 13 підрозділ 13.3). Припустимо, що величина Dнам відома і знайдемо таку величину Єр, для якої

Застосовуючи формулу (6.3.5) глави 6, виразимо ймовірність у лівій частині (14.3.5) через нормальну функцію розподілу

де - середнє квадратичне відхилення оцінки т.

З рівняння

знаходимо значення Sp:

де arg Ф * (х) - функція, зворотна Ф * (х),тобто. таке значення аргументу, при якому нормальна функція розподілу дорівнює х.

Дисперсія D,через яку виражена величина а 1П, нам точно не відома; як її орієнтовне значення можна скористатися оцінкою D(14.3.4) та покласти приблизно:

Таким чином, наближено вирішено завдання побудови довірчого інтервалу, який дорівнює:

де gp визначається формулою (14.3.7).

Щоб уникнути при обчисленні s p зворотного інтерполювання у таблицях функції Ф*(л), зручно скласти спеціальну таблицю (табл. 14.3.1), де наводяться значення величини

залежно від нар. Величина (р визначає для нормального закону число середніх квадратичних відхилень, яке потрібно відкласти праворуч і ліворуч від центру розсіювання для того, щоб ймовірність попадання в отриману ділянку дорівнювала р.).

Через величину 7 р довірчий інтервал виражається у вигляді:

Таблиця 14.3.1

Приклад 1. Проведено 20 дослідів над величиною X;результати наведено у табл. 14.3.2.

Таблиця 14.3.2

Потрібно знайти оцінку для математичного очікування від величини Xта побудувати довірчий інтервал, що відповідає довірчій ймовірності р = 0,8.

Рішення.Маємо:

Вибравши за початок відліку л: = 10, за третьою формулою (14.2.14) знаходимо незміщену оцінку D :

За табл. 14.3,1 знаходимо

Довірчі кордони:

Довірчий інтервал:

Значення параметра т,що лежать у цьому інтервалі, є сумісними з досвідченими даними, наведеними в табл. 14.3.2.

Аналогічним способом може бути побудований довірчий інтервал для дисперсії.

Нехай зроблено пнезалежних дослідів над випадковою величиною Xз невідомими параметрами від Л і для дисперсії Dотримано незміщену оцінку:

Потрібно приблизно побудувати довірчий інтервал для дисперсії.

З формули (14.3.11) видно, що величина Dє

суму пвипадкових величин виду. Ці величини не є

незалежними, тому що до кожної з них входить величина т,залежить від решти. Однак, можна показати, що при збільшенні пзакон розподілу їхньої суми теж наближається до нормального. Практично при п= 20...30 він може вважатися нормальним.

Припустимо, що це так, і знайдемо характеристики цього закону: математичне очікування та дисперсію. Оскільки оцінка D- незміщена, то М [D] = D.

Обчислення дисперсії D Dпов'язано з порівняно складними викладками, тому наведемо її вираз без висновку:

де ц 4 - четвертий центральний момент величини X.

Щоб скористатися цим виразом, потрібно підставити значення ц 4 і D(хоча б наближені). Замість Dможна скористатися його оцінкою D.У принципі четвертий центральний момент також можна замінити його оцінкою, наприклад величиною виду:

але така заміна дасть вкрай невисоку точність, тому що взагалі при обмеженій кількості дослідів моменти високого порядку визначаються з більшими помилками. Однак практично часто буває, що вид закону розподілу величини Xвідомий наперед: невідомі лише його параметри. Тоді можна спробувати виразити ц 4 через D.

Візьмемо випадок, що найбільш часто зустрічається, коли величина Xрозподілено за нормальним законом. Тоді її четвертий центральний момент виражається через дисперсію (див. Розділ 6 підрозділ 6.2);

та формула (14.3.12) дає або

Заміняючи на (14.3.14) невідоме Dйого оцінкою D, отримаємо: звідки

Момент ц 4 можна виразити через Dтакож і в деяких інших випадках, коли розподіл величини Xперестав бути нормальним, але його відомий. Наприклад, для закону рівномірної щільності (див. розділ 5) маємо:

де (а, Р) - інтервал, у якому заданий закон.

Отже,

За формулою (14.3.12) отримаємо: звідки знаходимо приблизно

У випадках, коли вид закону розподілу величини 26 невідомий, при орієнтовній оцінці величини а/) рекомендується все ж таки користуватися формулою (14.3.16), якщо немає спеціальних підстав вважати, що цей закон сильно відрізняється від нормального (має помітний позитивний або негативний ексцес) .

Якщо орієнтовне значення а/) тим чи іншим способом отримано, можна побудувати довірчий інтервал для дисперсії аналогічно тому, як ми будували його для математичного очікування:

де величина в залежності від заданої ймовірності р знаходиться по таблиці. 14.3.1.

Приклад 2. Знайти приблизно 80% довірчий інтервал для дисперсії випадкової величини Xв умовах прикладу 1, якщо відомо, що величина Xрозподілено згідно із законом, близьким до нормального.

Рішення.Розмір залишається тієї ж, що у табл. 14.3.1:

За формулою (14.3.16)

За формулою (14.3.18) знаходимо довірчий інтервал:

Відповідний інтервал значень середнього відхилення квадратичного: (0,21; 0,29).

14.4. Точні методи побудови довірчих інтервалів для параметрів випадкової величини, розподіленої за нормальним законом

У попередньому підрозділі ми розглянули грубо наближені методи побудови довірчих інтервалів для математичного очікування та дисперсії. Тут ми дамо уявлення про точні методи вирішення того ж завдання. Підкреслимо, що для точного знаходження довірчих інтервалів необхідно знати заздалегідь вид закону розподілу величини X,тоді як застосування наближених методів це обов'язково.

Ідея точних методів побудови довірчих інтервалів зводиться до наступного. Будь-який довірчий інтервал знаходиться з умови, що виражає ймовірність виконання деяких нерівностей, в які входить оцінка, що нас цікавить а.Закон розподілу оцінки ау загальному випадку залежить від невідомих параметрів величини X.Однак іноді вдається перейти в нерівності від випадкової величини адо будь-якої іншої функції спостережених значень Х п Х 2 , ..., X п.закон розподілу якої не залежить від невідомих параметрів, а залежить тільки від кількості дослідів та й від виду закону розподілу величини X.Такі випадкові величини грають велику роль математичної статистиці; вони найбільш докладно вивчені для випадку нормального розподілу величини X.

Наприклад, доведено, що за нормального розподілу величини Xвипадкова величина

підкоряється так званому закону розподілу Ст'юдентаз п- 1 ступенями свободи; щільність цього закону має вигляд

де Г(х) - відома гамма-функція:

Доведено також, що випадкова величина

має «розподіл % 2» з п- 1 ступенями свободи (див. розділ 7), щільність якого виражається формулою

Не зупиняючись на висновках розподілів (14.4.2) та (14.4.4), покажемо, як їх можна застосувати при побудові довірчих інтервалів для параметрів ти D .

Нехай зроблено пнезалежних дослідів над випадковою величиною X,розподіленої за нормальним законом із невідомими параметрами тіо.Для цих параметрів отримано оцінки

Потрібно побудувати довірчі інтервали для обох параметрів, що відповідають довірчій ймовірності р.

Побудуємо спочатку довірчий інтервал для математичного очікування. Природно, цей інтервал взяти симетричним відносно т; позначимо s p половину довжини інтервалу. Величину s p потрібно вибрати так, щоб виконувалася умова

Спробуємо перейти у лівій частині рівності (14.4.5) від випадкової величини тдо випадкової величини Т,розподіленої згідно із законом Стьюдента. І тому помножимо обидві частини нерівності |m-w?|

на позитивну величину: або, використовуючи позначення (14.4.1),

Знайдемо таке число/р, що Величина/р знайдеться з умови

З формули (14.4.2) видно, що (1) – парна функція, тому (14.4.8) дає

Рівність (14.4.9) визначає величину/р залежно від р. Якщо мати у своєму розпорядженні таблицю значень інтеграла

то величину/р можна знайти зворотним інтерполюванням у таблиці. Однак зручніше скласти заздалегідь таблицю значень/р. Така таблиця дається у додатку (табл. 5). У цій таблиці наведено значення залежно від довірчої ймовірності р та числа ступенів свободи п- 1. Визначивши/р за табл. 5 і вважаючи

ми знайдемо половину ширини довірчого інтервалу/р і сам інтервал

Приклад 1. Зроблено 5 незалежних дослідів над випадковою величиною X,розподіленої нормально з невідомими параметрами тта о. Результати дослідів наведено у табл. 14.4.1.

Таблиця 14.4.1

Знайти оцінку тдля математичного очікування і побудувати для нього 90%-й довірчий інтервал/р (тобто інтервал, що відповідає довірчій ймовірності р=0,9).

Рішення.Маємо:

За таблицею 5 додатки для п - 1 = 4 і р = 0,9 знаходимо звідки

Довірчий інтервал буде

Приклад 2. Для прикладу 1 підрозділу 14.3, припускаючи величину Xрозподілено нормально, знайти точний довірчий інтервал.

Рішення.За таблицею 5 додатка знаходимо при п - 1 = 19ір =

0,8/р = 1,328; звідси

Порівнюючи з рішенням прикладу 1 підрозділу 14.3 (е р = 0,072), переконуємося, що розбіжність дуже незначна. Якщо зберегти точність до другого знака після коми, то довірчі інтервали, знайдені точним та наближеним методами, збігаються:

Перейдемо до побудови довірчого інтервалу дисперсії. Розглянемо незміщену оцінку дисперсії

і висловимо випадкову величину Dчерез величину V(14.4.3), що має розподіл х 2 (14.4.4):

Знаючи закон розподілу величини V,можна знайти інтервал / (1, в який вона потрапляє із заданою ймовірністю р.).

Закон розподілу k n _ x (v)величини I 7 має вигляд, зображений на рис. 14.4.1.

Мал. 14.4.1

Виникає питання: як вибрати інтервал/р? Якби закон розподілу величини Vбув симетричним (як нормальний закон чи розподіл Стьюдента), природно було взяти інтервал /р симетричним щодо математичного очікування. В даному випадку закон до п х (v)несиметричний. Умовимося вибирати інтервал /р так, щоб ймовірність виходу величини Vза межі інтервалу вправо та вліво (заштриховані площі на рис. 14.4.1) були однакові та рівні

Щоб побудувати інтервал/р з такою властивістю, скористаємось табл. 4 додатки: у ній наведені числа у)такі, що

для величини V,що має х 2 -розподіл з г ступенями свободи. У нашому випадку г = п- 1. Зафіксуємо г = п- 1 і знайдемо у відповідному рядку табл. 4 два значення х 2 -одне, що відповідає ймовірності інше - ймовірності Позначимо ці

значення у 2і xl?Інтервал має у 2 ,своїм лівим, а у ~правим кінцем.

Тепер знайдемо по інтервалу / р шуканий довірчий інтервал /|, для дисперсії з межами D, та D 2який накриває крапку Dз ймовірністю р:

Побудуємо такий інтервал /(, = (?> ь А), який накриває точку Dтоді і лише тоді, коли величина Vпотрапляє в інтервал/р. Покажемо, що інтервал

задовольняє цю умову. Справді, нерівності рівносильні нерівностям

а ці нерівності виконуються з ймовірністю р. Таким чином, довірчий інтервал дисперсії знайдено і виражається формулою (14.4.13).

Приклад 3. Знайти довірчий інтервал дисперсії в умовах прикладу 2 підрозділу 14.3, якщо відомо, що величина Xрозподілено нормально.

Рішення.Маємо . За таблицею 4 додатки

знаходимо при г = п - 1 = 19

За формулою (14.4.13) знаходимо довірчий інтервал для дисперсії

Відповідний інтервал для середнього відхилення квадратичного: (0,21; 0,32). Цей інтервал лише трохи перевищує отриманий у прикладі 2 підрозділу 14.3 наближеним методом інтервал (0,21; 0,29).

  • На малюнку 14.3.1 розглядається довірчий інтервал, симетричний щодо а. Загалом, як ми побачимо далі, це необов'язково.
Довірчий інтервал– граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде у цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається у файлі Word (див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладена величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції посаді Московської Північної митниці було взято як випадкової повторної вибірки 20 проб продукту «А». В результаті перевірки встановлено середню вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте з ймовірністю 0,683 межі середньої вологості продукту в усій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, дорівнювала 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0 ,99 інтервальну оцінку для математичного очікування цієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування абсолютної величини не більше, ніж на 2.

Класифікація довірчих інтервалів

По виду оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому відборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.
Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

Ціль– навчити студентів алгоритмів обчислення довірчих інтервалів статистичних параметрів.

При статистичній обробці даних обчислені середня арифметична, коефіцієнт варіації, коефіцієнт кореляції, критерії відмінності та інші точкові статистики повинні отримати кількісні межі довіри, які позначають можливі коливання показника меншу і більшу сторону в межах довірчого інтервалу.

Приклад 3.1 . Розподіл кальцію у сироватці крові мавп, як було встановлено раніше, характеризується такими вибірковими показниками: = 11,94 мг%; = 0,127 мг%; n= 100. Потрібно визначити довірчий інтервал для генеральної середньої ( ) при довірчій ймовірності P = 0,95.

Генеральна середня знаходиться з певною ймовірністю в інтервалі:

, де - Вибіркова середня арифметична; t– критерій Стьюдента; - Помилка середньої арифметичної.

За таблицею «Значення критерію Стьюдента» знаходимо значення при довірчій ймовірності 0,95 та числі ступенів свободи k= 100-1 = 99. Воно дорівнює 1,982. Разом зі значеннями середньої арифметичної та статистичної помилки підставляємо його у формулу:

або 11,69
12,19

Таким чином, з ймовірністю 95%, можна стверджувати, що генеральна середня цього нормального розподілу знаходиться між 11,69 і 12,19 мг%.

Приклад 3.2 . Визначте межі 95% довірчого інтервалу для генеральної дисперсії ( ) розподілу кальцію в крові мавп, якщо відомо, що
= 1,60, при n = 100.

Для вирішення задачі можна скористатися такою формулою:

Де - Статистична помилка дисперсії.

Знаходимо помилку вибіркової дисперсії за формулою:
. Вона дорівнює 0,11. Значення t- критерію при довірчій ймовірності 0,95 та числі ступенів свободи k= 100-1 = 99 відомо з попереднього прикладу.

Скористаємося формулою та отримаємо:

або 1,38
1,82

Більш точно довірчий інтервал генеральної дисперсії можна побудувати із застосуванням (хі-квадрат) – критерію Пірсона. Критичні точки при цьому критерію наводяться у спеціальній таблиці. При використанні критерію для побудови довірчого інтервалу застосовують двосторонній рівень значущості. Для нижньої межі рівень значущості розраховується за формулою
, для верхньої –
. Наприклад, для довірчого рівня = 0,99= 0,010,= 0,990. Відповідно до таблиці розподілу критичних значень , при розрахованих довірчих рівнях та числі ступенів свободи k= 100 - 1 = 99, знайдемо значення
і
. Отримуємо
дорівнює 135,80, а
рівно70,06.

Щоб знайти довірчі межі генеральної дисперсії за допомогою скористаємося формулами: для нижньої межі
для верхнього кордону
. Підставимо ці завдання знайдені значення у формули:
= 1,17;
= 2,26. Таким чином, за довірчої ймовірності P= 0,99 або 99% генеральна дисперсія лежатиме в інтервалі від 1,17 до 2,26 мг% включно.

Приклад 3.3 . Серед 1000 насіння пшениці з партії, що надійшла на елеватор, виявлено 120 насіння заражених ріжків. Необхідно визначити можливі межі генеральної частки зараженого насіння у цій партії пшениці.

Довірчі межі для генеральної частки за всіх можливих її значеннях доцільно визначати за такою формулою:

,

Де n - Число спостережень; m- Абсолютна чисельність однієї з груп; t– нормоване відхилення.

Вибіркова частка зараженого насіння дорівнює
чи 12%. За довірчої ймовірності Р= 95% нормоване відхилення ( t-критерій Стьюдента при k =
)t = 1,960.

Підставляємо наявні дані у формулу:

Звідси межі довірчого інтервалу дорівнюють = 0,122-0,041 = 0,081, або 8,1%; = 0,122 + 0,041 = 0,163, чи 16,3%.

Таким чином, з довірчою ймовірністю 95% можна стверджувати, що генеральна частка зараженого насіння знаходиться між 8,1 та 16,3%.

Приклад 3.4 . Коефіцієнт варіації, що характеризує варіювання кальцію (мг%) у сироватці крові мавп, дорівнював 10,6%. Обсяг вибірки n= 100. Необхідно визначити межі 95% довірчого інтервалу для генерального параметра Cv.

Кордони довірчого інтервалу для генерального коефіцієнта варіації Cv визначаються за такими формулами:

і
, де K проміжна величина, що обчислюється за формулою
.

Знаючи, що за довірчої ймовірності Р= 95% нормоване відхилення (критерій Стьюдента при k =
)t = 1,960, попередньо розрахуємо величину До:

.

або 9,3%

або 12,3%

Таким чином, генеральний коефіцієнт варіації з довірчою ймовірністю 95% лежить в інтервалі від 93 до 123%. При повторних вибірках коефіцієнт варіації не перевищить 12,3% і не виявиться нижчим за 9,3% у 95 випадках зі 100.

Запитання для самоконтролю:

Завдання для самостійного вирішення.

1. Середній відсоток жиру у молоці за лактацію корів холмогорських помісей був таким: 3,4; 3,6; 3,2; 3,1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4,1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3,8. Встановіть довірчі інтервали для середньої середньої при довірчій ймовірності 95% (20 балів).

2. На 400 рослинах гібридного жита перші квітки з'явилися в середньому на 70,5 день після посіву. Середнє відхилення було 6,9 дня. Визначте помилку середньої та довірчі інтервали для генеральної середньої та дисперсії при рівні значущості W= 0,05 та W= 0,01 (25 балів).

3. При вивченні довжини листя 502 екземплярів садової суниці були отримані такі дані: = 7,86 див; σ = 1,32 см, =± 0,06 см. Визначте довірчі інтервали для середньої арифметичної генеральної сукупності з рівнями значущості 0,01; 0,02; 0,05. (25 балів).

4. При обстеженні 150 дорослих чоловіків середній зріст дорівнював 167 см, а σ = 6 см. У яких межах знаходиться генеральна середня та генеральна дисперсія з довірчою ймовірністю 0,99 та 0,95? (25 балів).

5. Розподіл кальцію у сироватці крові мавп характеризується такими вибірковими показниками: = 11,94 мг%, σ = 1,27, n = 100. Побудуйте 95% довірчий інтервал для генеральної середньої цього розподілу. Розрахуйте коефіцієнт варіації (25 балів).

6. Було вивчено загальний вміст азоту в плазмі крові щурів-альбіносів у віці 37 та 180 днів. Результати виражені у грамах на 100 см 3 плазми. У віці 37 днів 9 щурів мали: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. У віці 180 днів 8 щурів мали: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1,12. Встановіть довірчі інтервали для різниці з вірогідністю 0,95 (50 балів).

7. Визначте межі 95% довірчого інтервалу для генеральної дисперсії розподілу кальцію (мг%) у сироватці крові мавп, якщо для цього розподілу обсяг вибірки n = 100, статистична помилка вибіркової дисперсії s σ 2 = 1,60 (40 балів).

8. Визначте межі 95% довірчого інтервалу для генеральної дисперсії розподілу 40 колосків пшениці по довжині (σ 2 = 40, 87 мм 2). (25 балів).

9. Куріння вважають основним фактором, що привертає до обструктивних захворювань легень. Пасивне куріння таким фактором не вважається. Вчені засумнівалися у нешкідливості пасивного куріння та досліджували прохідність дихальних шляхів у курців, що не палять, пасивних та активних. Для характеристики стану дихальних шляхів взяли один із показників функції зовнішнього дихання – максимальну об'ємну швидкість середини видиху. Зменшення цього показника – ознака порушення прохідності дихальних шляхів. Дані обстеження наведені у таблиці.

Число обстежених

Максимальна об'ємна швидкість середини видиху, л/с

Стандартне відхилення

Некурці

працюють у приміщенні, де не курять

працюють у накуреному приміщенні

Курці

викурюють невелику кількість сигарет

викурюють середню кількість сигарет

викурюють велику кількість сигарет

За даними таблиці знайдіть 95% довірчі інтервали для генеральної середньої та генеральної дисперсії для кожної групи. У чому різниця між групами? Результати подайте графічно (25 балів).

10. Визначте межі 95%-ного та 99%-ного довірчого інтервалу для генеральної дисперсії чисельності поросят у 64 опоросах, якщо статистична помилка вибіркової дисперсії s σ 2 = 8, 25 (30 балів).

11. Відомо, що середня маса кролів становить 2,1 кг. Визначте межі 95%-ного та 99%-ного довірчого інтервалу для генеральної середньої та дисперсії при n= 30, σ = 0,56 кг (25 балів).

12. У 100 колосків вимірювали озерненість колосу ( Х), довжину колосу ( Y) та масу зерна в колосі ( Z). Знайти довірчі інтервали для генеральної середньої та дисперсії при P 1 = 0,95, P 2 = 0,99, P 3 = 0,999, якщо = 19, = 6,766 см, = 0,554 м; x 2 = 29, 153, y 2 = 2, 111, z 2 = 0,064. (25 балів).

13. У відібраних випадковим чином 100 колосках пшениці озимої підраховувалося число колосків. Вибіркова сукупність характеризувалася такими показниками: = 15 колосків та σ = 2,28 шт. Визначте, з якою точністю отримано середній результат ( ) та побудуйте довірчий інтервал для генеральної середньої та дисперсії при 95% та 99% рівнях значущості (30 балів).

14. Число ребер на раковинах викопного молюска Orthambonites calligramma:

Відомо, що n = 19, σ = 4,25. Визначте межі довірчого інтервалу для генеральної середньої та генеральної дисперсії при рівні значущості W = 0,01 (25 балів).

15. Для визначення надої молока на молочно-товарній фермі щодня визначалася продуктивність 15 корів. За даними протягом року кожна корова давала загалом на добу таку кількість молока (л): 22; 19; 25; 20; 27; 17; 30; 21; 18; 24; 26; 23; 25; 20; 24. Побудуйте довірчі інтервали для генеральної дисперсії та середньої арифметичної. Чи можна очікувати, що середньорічний надій на кожну корову складе 10000 літрів? (50 балів).

16. З метою визначення врожаю пшениці в середньому по агрогосподарству були проведені укоси на пробних ділянках площею 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 та 2 га. Урожайність (ц/га) з ділянок становила 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 відповідно. Побудуйте довірчі інтервали для генеральних дисперсії та середньої арифметичної. Чи можна очікувати, що в середньому в агрогосподарстві врожай складе 42 ц/га? (50 балів).