Визначення довірчого інтервалу та довірчої ймовірності. Довірча ймовірність та довірчий

Після отримання точкової оцінки бажано мати дані щодо надійності такої оцінки. Зрозуміло, що величина лише наближеним значенням параметра q. Обчислена точкова оцінка може бути близька до параметра, що оцінюється, а може і дуже сильно відрізнятися від нього. Точкова оцінка не несе інформації щодо точності процедури оцінювання. Особливо важливо мати інформацію про надійність оцінок для невеликих вибірок. У таких випадках слід скористатися інтервальними оцінками.

Завдання інтервального оцінювання в загальному вигляді можна сформулювати наступним чином: за даними вибірки побудувати числовий інтервал, щодо якого з заздалегідь обраною ймовірністю можна сказати, що всередині цього інтервалу знаходиться параметр, що оцінюється. Тут є кілька підходів. Найбільш поширеним методом інтервального оцінювання є метод довірчих інтервалів.

Довірчим інтерваломдля параметра q називається інтервал, що містить невідоме значення параметра генеральної сукупності із заданою ймовірністю g , тобто.

.

Число g називається довірчою ймовірністю, а число a = 1-g – рівнем надійності. Довірча ймовірність визначається апріорно і визначається конкретними умовами. Зазвичай використовується g = 0,9; 0,95; 0,99 (відповідно, a = 0,1; 0,05; 0,01).

Довжина довірчого інтервалу, що характеризує точність інтервальної оцінки, залежить від обсягу вибірки nта довірчої ймовірності g. При збільшенні величини nдовжина довірчого інтервалу зменшується, а з наближенням ймовірності g до одиниці збільшується.

Нерідко довірчий інтервал будують симетричним щодо точкової оцінки, тобто. у вигляді

, (3.15)

Тут число D називається граничною(або стандартною) помилкою вибірки. Однак симетричні інтервали не завжди вдається побудувати, більше того, іноді доводиться обмежуватись односторонніми довірчими інтервалами:

або .

Оскільки в економетричних задачах часто доводиться будувати довірчі інтервали параметрів випадкових величин, що мають нормальний розподіл, наведемо схеми їхнього знаходження.



3.4.2. Довірчий інтервал оцінки генеральної
середньої за відомої генеральної дисперсії

Нехай кількісна ознака Xгенеральної сукупності має нормальний розподіл із заданою дисперсією s 2 та невідомим математичним очікуванням a. Для оцінки параметра aвилучено вибірку X 1 , X 2 , …, X n, що складається з nнезалежних нормальної розподілених випадкових величин з параметрами aі s, причому s відомо, а величину aоцінюють за вибіркою:

.

Оцінимо точність цієї наближеної рівності. Для цього поставимо можливість g і спробуємо знайти таке число D, щоб виконувалося співвідношення

.

Далі скористаємось властивостями нормального розподілу. Відомо, що сума нормально розподілених величин також має нормальний розподіл. Тому середня величина має нормальний розподіл, математичне очікування та дисперсія якої рівні

Отже,

.

Скористаємося тепер формулою знаходження ймовірностей відхилення нормально розподіленої випадкової величини від математичного очікування:

,

де F( x) – функція Лапласа. Замінюючи Xна і s на , отримаємо

,

де. З останньої рівності знаходимо, що гранична помилка вибіркибуде рівна

.

Взявши до уваги, що довірча можливість задана і дорівнює g, отримаємо остаточний результат.

Інтервальна оцінка генеральної середньої (математичного очікування) має вигляд

, (3.17)

або коротше

де число t g визначається з рівності.

Наведемо значення t g для поширених значень довірчої ймовірності:

, , .

Обговоримо, як впливає на точність оцінювання параметра aобсяг вибірки nвеличина середнього квадратичного відхилення s, а також значення довірчої ймовірності g.

а) При збільшенні nточність оцінки зростає. На жаль, збільшення точності (тобто зменшення довжини довірчого інтервалу) пропорційно , а не 1/ n, тобто. відбувається набагато повільніше, ніж зростання числа спостережень. Наприклад, якщо ми хочемо збільшити точність висновків у 10 разів чисто статистичними засобами, то ми маємо збільшити обсяг вибірки у 100 разів.

б) Що більше s, то нижче точність. Залежність точності від цього параметра має лінійний характер.

в) Чим вище довірча ймовірність g, тим більше значення параметра t g, тобто. тим нижча точність. При цьому між g і t g існує нелінійний зв'язок. Зі збільшенням g значення t g різко збільшується (при). Тому з великою впевненістю (з високою вірогідністю) ми можемо гарантувати лише відносно невисоку точність. (Довірчий інтервал виявиться широким.) І навпаки: коли ми вказуємо для невідомого параметра aвідносно вузькі межі, ми ризикуємо зробити помилку - з відносно високою ймовірністю.

Зазначимо, що величина

називається середньою помилкою вибірки. Для безповторної вибірки ця формула набуде вигляду

. (3.20)

Тоді гранична помилка вибірки D буде являти собою t-кратну середню помилку:

Приклад 3.7.На основі тривалих спостережень за вагою Xпакетів горішків, що заповнюються автоматично, встановлено, що середнє квадратичне відхилення ваги пакетів дорівнює s=10 г. Виважено 25 пакетів, при цьому їхня середня вага склала . У якому інтервалі з надійністю 95% лежить дійсне значення середньої ваги пакетів?

.

Для визначення 95% довірчого інтервалу обчислимо граничну помилку вибірки

Отже 95%-й довірчий інтервал для справжнього значення середньої ваги пакетів буде мати вигляд

,

На перший погляд може здатися, що отриманий результат є лише теоретичним результатом, оскільки середнє квадратичне відхилення s, як правило, теж невідоме і обчислюється за вибірковими даними. Однак якщо вибірка досить велика, то отриманий результат цілком прийнятний для практичного використання, оскільки функція розподілу мало відрізнятиметься від нормальної, а оцінка дисперсії s 2 буде досить близька до справжнього значення s 2 . Понад те, отриманий результат часто використовують у тому разі, коли розподіл генеральної сукупності відрізняється нормального. Це пов'язано з тим, що сума незалежних випадкових величин, з центральної граничної теореми, при великих вибірках має розподіл, близьке до нормального. â

Приклад 3.8.Припустимо, що в результаті вибіркового обстеження житлових умов мешканців міста на основі власно-випадкової повторної вибірки отримано наступний варіаційний ряд:

Таблиця 3.5

Побудувати 95%-довірчий інтервал для ознаки, що вивчається.

Рішення.Розрахуємо вибіркову середню величину і дисперсію ознаки, що вивчається.

Таблиця 3.6

Загальна площа житла, що припадає на 1 чол., м 2 Число мешканців, n i Середина інтервалу, x i
До 5,0 2,5 20,0 50,0
5,0–10,0 7,5 712,5 5343,8
10,0–15,0 12,5 2550,0 31875,0
15,0–20,0 17,5 4725,0 82687,5
20,0–25,0 22,5 4725,0 106312,5
25,0–30,0 27,5 3575,0 98312,5
30,0 і більше 32,5 2697,5 87668,8
Разом 19005,0 412250,0

; ; .

Середня помилка вибірки складе

.

Визначимо граничну помилку вибірки з ймовірністю 0,95 ():

Встановимо межі генеральної середньої

.

Таким чином, на підставі проведеного вибіркового обстеження з ймовірністю 0,95 можна зробити висновок, що середній розмір загальної площі, що припадає на 1 особу, в цілому по місту лежить в межах від 18,6 до 19,4 м 2 . â

3.4.3. Довірчий інтервал оцінки генеральної
середньої при невідомій генеральній дисперсії

Вище було вирішено завдання побудови інтервальної оцінки для математичного очікування нормального розподілу, коли його дисперсія відома. Однак на практиці дисперсія зазвичай теж невідома і її обчислюють за тією ж вибіркою, що і математичне очікування. Це призводить до необхідності використання іншої формули щодо довірчого інтервалу для математичного очікування випадкової величини, що має нормальний розподіл. Така постановка завдання особливо актуальна за малих обсягів вибірки.

Нехай кількісна ознака Xгенеральної сукупності має нормальний розподіл N(a,s), причому обидва параметри aта s невідомі. За даними вибірки X 1 , X 2 , …, X n, обчислимо середню арифметичну та виправлену дисперсію:

, .

Для знаходження довірчого інтервалу у цьому випадку будується статистика

має розподіл Стьюдента з числом ступенів свободи n=n–1 незалежно від значень параметрів a та s. Вибравши довірчу ймовірність g і знаючи обсяг вибірки n, можна знайти таке число t, що виконуватиметься рівність

,

.

Звідси знаходимо

інтервальну оцінку для генеральної середньої (математичного очікування) при невідомому s:

, (3.22)

або коротше

Число t (коефіцієнт Стьюдента) З таблиць для розподілу Стьюдента. Зазначимо, що він є функцією двох аргументів: довірчої ймовірності g та числа ступенів свободи k=n-1, тобто. t=t(g, n).

Слід бути дуже уважним під час використання таблиць для розподілу Стьюдента. По-перше, зазвичай, у таблицях замість довірчої ймовірності g використовують рівень надійності a=1–g. По-друге, часто в таблицях наводяться значення т.зв. одностороннього критерію Стьюдента

Або .

У цьому випадку в таблицях слід брати значення , якщо таблиці використовується рівень надійності, або , якщо таблиці використовується довірча ймовірність.

Незважаючи на подібність формул (3.17) і (3.22), що здається, між ними є істотна відмінність, що полягає в тому, що коефіцієнт Стьюдента tзалежить як від довірчої ймовірності, а й від обсягу вибірки. Особливо ця відмінність помітна при малих вибірках. (Нагадаємо, що з великих вибірках різницю між розподілом Стьюдента і нормальним розподілом практично исчезает.) У разі використання нормального розподілу призводить до невиправданого звуження довірчого інтервалу, тобто. до невиправданого підвищення точності. Наприклад, якщо n=5 і g=0,99, то, користуючись розподілом Стьюдента, отримаємо t=4,6, а використовуючи нормальний розподіл, – t=2,58, тобто. довірчий інтервал у разі майже вдвічі, ніж інтервал під час використання розподілу Стьюдента.

Приклад 3.9.Аналітик фондового ринку оцінює середню прибутковість певних акцій. Випадкова вибірка 15 днів показала, що середня (річна) прибутковість із середнім квадратичним відхиленням. Припускаючи, що прибутковість акцій підпорядковується нормальному закону розподілу, побудуйте 95%-довірчий інтервал для середньої прибутковості виду акцій, що цікавить аналітика.

Рішення.Оскільки обсяг вибірки n=15, необхідно застосувати розподіл Стьюдента з ступенями свободи. За таблицями для розподілу Стьюдента знаходимо

.

Використовуючи це значення, будуємо 95%-довірчий інтервал:

.

Отже, аналітик може бути на 95% впевнений, що середня річна дохідність акцій перебуває між 8,44% і 12,3%. â

Часто оцінювачу доводиться аналізувати ринок нерухомості того сегмента, в якому знаходиться об'єкт оцінки. Якщо ринок розвинений, проаналізувати всю сукупність представлених об'єктів буває складно, для аналізу використовується вибірка об'єктів. Не завжди ця вибірка виходить однорідною, іноді потрібно очистити її від екстремумів - надто високих чи надто низьких пропозицій ринку. Для цієї мети застосовується довірчий інтервал. Мета даного дослідження - провести порівняльний аналіз двох способів розрахунку довірчого інтервалу та вибрати оптимальний варіант розрахунку під час роботи з різними вибірками у системі estimatica.pro.

Довірчий інтервал - обчислений з урахуванням вибірки інтервал значень ознаки, що з певною ймовірністю містить оцінюваний параметр генеральної сукупності.

Сенс обчислення довірчого інтервалу полягає в побудові за даними вибірки такого інтервалу, щоб можна було стверджувати із заданою ймовірністю, що значення параметра, що оцінюється, знаходиться в цьому інтервалі. Іншими словами, довірчий інтервал з певною ймовірністю містить невідоме значення величини, що оцінюється. Чим ширший інтервал, тим вища неточність.

Існують різні способи визначення довірчого інтервалу. У цій статті розглянемо 2 способи:

  • через медіану та середньоквадратичне відхилення;
  • через критичне значення t-статистики (коефіцієнт Стьюдента).

Етапи порівняльного аналізу різних способів розрахунку ДІ:

1. формуємо вибірку даних;

2. обробляємо її статистичними методами: розраховуємо середнє значення, медіану, дисперсію тощо;

3. розраховуємо довірчий інтервал двома способами;

4. аналізуємо очищені вибірки та отримані довірчі інтервали.

Етап 1. Вибірка даних

Вибірку сформовано за допомогою системи estimatica.pro. У вибірку увійшла 91 пропозиція про продаж 1 кімнатних квартир у 3-му ціновому поясі з типом планування «Хрущовка».

Таблиця 1. Вихідна вибірка

Ціна 1 кв.м., д.е.

Рис.1. Вихідна вибірка



Етап 2. Обробка вихідної вибірки

Обробка вибірки методами статистики потребує обчислення наступних значень:

1. Середнє арифметичне значення

2. Медіана - число, що характеризує вибірку: рівно половина елементів вибірки більше медіани, інша половина менше медіани

(Для вибірки, що має непарне число значень)

3. Розмах - різниця між максимальним та мінімальним значеннями у вибірці

4. Дисперсія – використовується для більш точного оцінювання варіації даних

5. Середньоквадратичне відхилення за вибіркою (далі - СКО) - найпоширеніший показник розсіювання значень коригування навколо середнього арифметичного значення.

6. Коефіцієнт варіації - відбиває ступінь розкиданості значень коригувань

7. коефіцієнт осциляції - відбиває відносне коливання крайніх значень цін у вибірці навколо середньої

Таблиця 2. Статистичні показники вихідної вибірки

Коефіцієнт варіації, що характеризує однорідність даних, становить 12,29%, проте коефіцієнт осциляції занадто великий. Таким чином ми можемо стверджувати, що вихідна вибірка не є однорідною, тому перейдемо до розрахунку довірчого інтервалу.

Етап 3. Розрахунок довірчого інтервалу

Спосіб 1. Розрахунок через медіану та середньоквадратичне відхилення.

Довірчий інтервал визначається так: мінімальне значення - з медіани віднімається СКО; максимальне значення - до медіани додається СКО.

Таким чином, довірчий інтервал (47179 д.е.; 60689 д.е.)

Мал. 2. Значення, що потрапили в інтервал довіри 1.



Спосіб 2. Побудова довірчого інтервалу через критичне значення t-статистики (коефіцієнт Стьюдента)

С.В. Грибовський у книзі «Математичні методи оцінки вартості майна» визначає спосіб обчислення довірчого інтервалу через коефіцієнт Стьюдента. При розрахунку цим методом оцінювач повинен сам задати рівень значущості ∝, що визначає ймовірність, з якою буде побудовано довірчий інтервал. Зазвичай застосовуються рівні значимості 0,1; 0,05 та 0,01. Їм відповідають довірчі ймовірності 0,9; 0,95 та 0,99. При такому методі вважають справжні значення математичного очікування та дисперсії практично невідомими (що майже завжди є вірним при вирішенні практичних завдань оцінки).

Формула довірчого інтервалу:

n – обсяг вибірки;

Критичне значення t-статистики (розподілу Стьюдента) з рівнем значимості ∝, числом ступенів свободи n-1, яке визначається за спеціальними статистичними таблицями або за допомогою MS Excel (→ "Статистичні" → СТЬЮДРАСПОБР);

∝ – рівень значущості, приймаємо ∝=0,01.

Мал. 2. Значення, що потрапили в інтервал довіри 2.

Етап 4. Аналіз різних способів розрахунку довірчого інтервалу

Два способи розрахунку довірчого інтервалу – через медіану та коефіцієнт Стьюдента – привели до різних значень інтервалів. Відповідно, вийшло дві різні очищені вибірки.

Таблиця 3. Статистичні показники за трьома вибірками.

Показник

Вихідна вибірка

1 варіант

2 варіант

Середнє значення

Дисперсія

Коеф. варіації

Коеф. осциляції

Кількість об'єктів, що вибули, шт.

З виконаних розрахунків можна сказати, що отримані різними методами значення довірчих інтервалів перетинаються, тому можна використовувати будь-який із способів розрахунку розсуд оцінювача.

Однак ми вважаємо, що при роботі в системі estimatica.pro доцільно вибирати метод розрахунку довірчого інтервалу в залежності від рівня розвиненості ринку:

  • якщо ринок нерозвинений, застосовувати метод розрахунку через медіану і середньоквадратичне відхилення, оскільки кількість об'єктів, що вибули, у цьому випадку невелика;
  • якщо ринок розвинений, застосовувати розрахунок через критичне значення t-статистики (коефіцієнт Стьюдента), оскільки є можливість сформувати велику вихідну вибірку.

Під час підготовки статті було використано:

1. Грибовський С.В., Сівець С.А., Левикіна І.А. Математичні методи оцінки вартості майна. Москва, 2014 р.

2. Дані системи estimatica.pro

Аналіз випадкових похибок ґрунтується на теорії випадкових помилок, що дає можливість із певною гарантією обчислити дійсне значення виміряної величини та оцінити можливі помилки.

Основу теорії випадкових помилок становлять такі припущення:

при великій кількості вимірів випадкові похибки однакової величини, але різного знака зустрічаються однаково часто;

великі похибки трапляються рідше, ніж малі (ймовірність появи похибки зменшується із зростанням її величини);

при нескінченно великому числі вимірі справжнє значення вимірюваної величини дорівнює середньоарифметичному значенню всіх результатів вимірів;

поява тієї чи іншої результату виміру як випадкового події описується нормальним законом розподілу.

Насправді розрізняють генеральну і вибіркову сукупність вимірів.

Під генеральною сукупністю мають на увазі все безліч можливих значень вимірів або можливих значень похибок
.

Для вибіркової сукупності кількість вимірів обмежено, й у кожному даному випадку суворо визначається. Вважають, що якщо
, то середнє значення даної сукупності вимірів досить наближається для його істинного значення.

1. Інтервальна оцінка за допомогою довірчої ймовірності

Для великої вибірки та нормального закону розподілу загальною оцінною характеристикою вимірювання є дисперсія
та коефіцієнт варіації :

;
. (1.1)

Дисперсія характеризує однорідність виміру. Чим вище
тим більше розкид вимірювань.

Коефіцієнт варіації характеризує мінливість. Чим вище , тим більше мінливість вимірів щодо середніх значень.

Для оцінки достовірності результатів вимірювань вводяться до розгляду поняття довірчого інтервалу та довірчої ймовірності.

Довірчим називається інтервал значень , в який потрапляє справжнє значення вимірюваної величини із заданою ймовірністю.

Довірчою ймовірністю (Достовірністю) вимірювання називається ймовірність того, що справжнє значення вимірюваної величини потрапляє в даний довірчий інтервал, тобто. у зону
. Ця величина визначається у частках одиниці або у відсотках

,

де
- інтегральна функція Лапласа ( табл.1.1 )

Інтегральна функція Лапласа визначається наступним виразом:

.

Аргументом цієї функції є гарантійний коефіцієнт :

Таблиця 1.1

Інтегральна функція Лапласа

Якщо ж на основі певних даних встановлено довірчу ймовірність (часто її приймають рівною
), то встановлюється точність вимірів (довірчий інтервал
) на основі співвідношення

.

Половина довірчого інтервалу дорівнює

, (1.3)

де
- аргумент функції Лапласа, якщо
(табл.1.1 );

- функції Стьюдента, якщо
(табл.1.2 ).

Таким чином, довірчий інтервал характеризує точність виміру даної вибірки, а довірча ймовірність – достовірність виміру.

приклад

Виконано
вимірювання міцності дорожнього покриття ділянки автомобільної дороги при середньому модулі пружності
та обчисленому значенні середньоквадратичного відхилення
.

Необхідно визначити необхідну точністьвимірювань для різних рівнів довірчої ймовірності
, Прийнявши значення по табл.1.1 .

І тут відповідно |

Отже, для даного засобу та методу вимірювань довірчий інтервал зростає приблизно в рази, якщо збільшити тільки на
.

Теореми 1 і 2 хоча і є загальними, тобто сформульовані при досить широких припущеннях, вони не дають можливості встановити, наскільки близькі оцінки до параметрів, що оцінюються. З факту, що оцінки є заможними, слід тільки те, що при збільшенні обсягу вибірки значення P(|θ * – θ | < δ), δ < 0, приближается к 1.

Виникають такі питання.

1) Яким має бути обсяг вибірки п,щоб задана точність
|θ * – θ | = δ була гарантована із заздалегідь прийнятою ймовірністю?

2) Яка точність оцінки, якщо обсяг вибірки відомий і можливість безпомилковості виведення задана?

3) Якою є ймовірність того, що при заданому обсязі вибірки буде забезпечена задана точність оцінки?

Введемо кілька нових визначень.

Визначення. Імовірність виконання нерівності,|θ *– θ | < δ називається довірчою ймовірністю чи надійністю оцінки θ.

Перейдемо від нерівності θ *–θ | < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

Оскільки θ (оцінюється параметр) - число постійне, а θ * – величина випадкова, поняття довірчої ймовірності сформулювати так: довірчою ймовірністю γ називається ймовірність того, що інтервал ( θ *– δ, θ *+ δ) накриває оцінюваний параметр.

Визначення. Випадковий інтервал(θ *–δ , θ *+δ ), в межах якого з ймовірністю γ знаходиться невідомий параметр, що оцінюється, називається довірчим інтервалом İ, відповідним коефіцієнтом довіри γ,

İ= (θ*– δ, θ*+ δ ). (3)

Надійність оцінки γ може задаватися заздалегідь, тоді, знаючи закон розподілу випадкової величини, що вивчається, можна знайти довірчий інтервал İ . Вирішується і зворотне завдання, коли по заданому İ перебуває відповідна надійність оцінки.

Нехай, наприклад, γ = 0,95; тоді число р= 1 - у = 0,05 показує, з якою ймовірністю висновок про надійність оцінки помилково. Число р=1–γназивається рівнем значимості.Рівень значущості визначається заздалегідь залежно від конкретного випадку. Зазвичай рприймають рівним 0,05; 0,01; 0,001.

З'ясуємо, як побудувати довірчий інтервал для математичного очікування нормально розподіленої ознаки. Було показано, що

Оцінимо математичне очікування за допомогою вибіркової середньої враховуючи, що також має нормальний розподіл*. Маємо

(4)

а за формулою (12.9.2) отримуємо

Беручи до уваги (13.5.12), отримаємо

(5)

Нехай відома ймовірність γ . Тоді

Для зручності користування таблицею функції Лапласа покладемо тоді

Інтервал

(7)

накриває параметр а = М(Х) з ймовірністю γ .

Найчастіше середнє квадратичне відхилення σ(Х)досліджуваного ознаки невідомо. Тому замість σ (Х) при великій вибірці ( n> 30) застосовують виправлене вибіркове середнє квадратичне відхилення s, що є, у свою чергу, оцінкою σ (X), довірчий інтервал матиме вигляд

İ =

приклад.З ймовірністю γ = 0,95 знайти довірчий інтервал для М(Х) - Довжини колосу ячменю сорту «Московський 121». Розподіл задається таблицею, в якій замість інтервалів зміни (х iх i+ 1) взяті числа, див. Вважати, що випадкова величина Xпідпорядкована нормальному розподілу.

Рішення. Вибірка велика ( n= 50). Маємо

Знайдемо точність оцінки

Визначимо довірчі межі:

Таким чином, з надійністю γ = 0,95 математичне очікування укладено у довірчому інтервалі I= (9,5; 10,3).

Отже, у разі великої вибірки ( n> 30), коли виправлене середнє квадратичне відхилення відхиляється від середнього квадратичного відхилення значення ознаки в генеральній сукупності, можна знайти довірчий інтервал. Але робити велику вибірку вдається не завжди і це не завжди є доцільним. З (7) видно, що менше п,тим ширше довірчий інтервал, тобто. Iзалежить від обсягу вибірки п.

Англійський статистик Держсет (псевдонім Стьюдент) довів, що у разі нормального розподілу ознаки Xу генеральній сукупності нормування випадкова величина

(8)

залежить лише від обсягу вибірки. Було знайдено функцію розподілу випадкової величини Тта ймовірність P(T < t γ), t γ- Точність оцінки. Функція, що визначається рівністю

s (n, t γ) = P(|T| < t γ) = γ (9)

названа t-розподілом Стьюдентаз п- 1 ступенями свободи. Формула (9) пов'язує випадкову величину Т,довірчий інтервал İ та довірчу ймовірність γ . Знаючи дві з них, можна знайти третю. Враховуючи (8), маємо

(10)

Нерівність у лівій частині (13.7.10) замінимо рівносильною йому нерівністю . В результаті отримаємо

(11)

де t γ=t(γ ,n). Для функції t γскладено таблиці (див. Додаток 5). При n>30 числа t γі t,знайдені за таблицею функції Лапласа практично збігаються.

Довірчий інтервал для оцінки середнього квадратичного відхилення σ xу разі нормального розподілу.

Теорема.Нехай відомо, що випадкова величина має нормальний розподіл. Тоді для оцінки параметра х цього закону має місце рівність

(12)

деγ – довірча ймовірність, яка залежить від обсягу вибірки п і точності оцінки β.

Функція γ = Ψ (n, β ) добре вивчена. З її допомогою визначають β = β (γ ,п). Для β = β (γ ,п) складено таблиці, за якими за відомими п(обсягу вибірки) та γ (довірчої ймовірності) визначається β .

приклад.Для оцінки параметра нормально розподіленої випадкової величини було зроблено вибірку (денний удій 50 корів) та обчислено s= 1,5. Знайти довірчий інтервал, що накриває з ймовірністю γ = 0,95.

Рішення. За таблицею β (γ , д)для n= 50 і γ = 0,95 знаходимо β = 0,21 (див. Додаток 6).

Відповідно до нерівності (13) знайдемо межі довірчого інтервалу. Маємо

1,5 - 0,21 · 1,5 = 1,185; 1,5 + 0,21 · 1,5 = 1,185;

Інтервал

Розглянуті точкові оцінки параметрів розподілу дають оцінку як числа, найбільш близького до значення невідомого параметра. Такі оцінки використовують лише за великої кількості вимірів. Чим менший обсяг вибірки, тим легше припуститися помилки при виборі параметра. Для практики важливо не лише отримати точкову оцінку, а й визначити інтервал, що називається довірчим,між межами якого із заданою довірити ймовірністю

де q – рівень значущості; х н, х в - нижня і верхня межі інтервалу, знаходиться справжнє значення параметра, що оцінюється.

Загалом довірчі інтервали можна будувати на основі нерівності Чебишева.За будь-якого закону розподілу випадкової величини, що володіє моментами перших двох порядків, верхня межа ймовірності попадання відхилення випадкової величини х від центру розподілу Х ц в інтервал tS x описується нерівністю Чебишева

де S x – оцінка СКО розподілу; t – позитивне число.

Для знаходження довірчого інтервалу не потрібно знати закону розподілу результатів спостережень, але потрібно знати оцінку СКО. Отримані за допомогою нерівності Чебишева інтервали виявляються надто широкими для практики. Так, довірчої ймовірності 0,9 багатьох законів розподілів відповідає довірчий інтервал 1,6S X . Нерівність Чебишева дає у разі 3,16S X . У зв'язку з цим воно не набуло широкого поширення.

У метрологічній практиці використовують головним чином кван-тильні оцінкидовірчого інтервалу. Під 100P-відсотковим квантилемх р розуміють абсцис такий вертикальної лінії, зліва від якої площа під кривою щільності розподілу дорівнює Р%. Інакше кажучи, квантиль- Це значення випадкової величини (похибки) із заданою довірчою ймовірністю Р. Наприклад, медіана розподілу є 50%-ним квантилем х 0,5.

Насправді 25- і 75%-ный квантили прийнято називати згинами,або квантилями розподілу.Між ними укладено 50% всіх можливих значень випадкової величини, інші 50% лежать поза ними. Інтервал значень випадкової величини х між х 005 і х 095 охоплює 90% всіх її можливих значень і називається інтерквантильним проміжком з 90% ймовірністю.Його протяжність дорівнює d 0,9 = х 0,95 - х 0,05.

На підставі такого підходу вводиться поняття квантильних значень похибки,тобто. значень похибки із заданою довірчою ймовірністю Р - меж інтервалу невизначеності ± D Д = ± (х р - х 1-р)/2 = ± d p /2. На його довжині зустрічається Р% значень випадкової величини (похибки), a q = (1-Р)% загальної кількості залишаються поза цього інтервалу.

Для отримання інтервальної оцінки нормально розподіленої випадкової величини необхідно:

Визначити точкову оцінку МО х і СКО S x випадкової величини за формулами (6.8) і (6.11) відповідно;

Знайти верхню х в і нижню х н кордону відповідно до рівнянь

одержаними з урахуванням (6.1). Значення х н і х визначаються з таблиць значень інтегральної функції розподілу F(t) або функції Лапласа Ф(1).

Отриманий довірчий інтервал задовольняє умову

де n – число виміряних значень; z p - аргумент функції Лапласа Ф(1), що відповідає ймовірності Р/2. В даному випадку z p називається квантильним множником. Половина довжини довірчого інтервалу називається довірчою межею похибки результату вимірів.

Приклад 6.1. Зроблено 50 вимірів постійного опору. Визначити довірчий інтервал МО значення постійного опору, якщо закон розподілу нормальний з параметрами m x = R = 590 Ом, S x = 90 Ом при довірчій ймовірності Р = 0,9.

Оскільки гіпотеза про нормальність закону розподілу не суперечить досвідченим даним, довірчий інтервал визначається за формулою

Звідси Ф(z р) = 0,45. З таблиці, наведеної у додатку 1, бачимо, що z p = 1,65. Отже, довірчий інтервал запишеться як

Або 590 - 21< R < 590 + 21. Окончательно 509 Ом < R < 611 Ом.

За відмінності закону розподілу випадкової величини від нормального необхідно побудувати його математичну модель та визначати довірчий інтервал із її використанням.

Розглянутий спосіб знаходження довірчих інтервалів справедливий для досить великої кількості спостережень n, коли s = S x . Слід пам'ятати, що оцінка СКО S x, що обчислюється, є лише деяким наближенням до істинного значення s. Визначення довірчого інтервалу при заданій ймовірності виявляється тим менш надійним, чим менше спостережень. Не можна користуватися формулами нормального розподілу при малій кількості спостережень, якщо немає можливості теоретично на основі попередніх дослідів з достатньою кількістю спостережень визначити СКО.

Розрахунок довірчих інтервалів випадку, коли розподіл результатів спостережень нормально, та його дисперсія невідома, тобто. при малій кількості спостережень п, можливо виконати з використанням розподілу Стьюдента S(t,k). Воно визначає щільність розподілу відносини (дробі Стьюдента):

де Q - дійсне значення вимірюваної величини. Величини х, S x . і S x ̅ обчислюються на підставі дослідних даних і являють собою точкові оцінки МО, СКО результатів вимірювань та СКО середнього арифметичного значення.

Імовірність того, що дріб Стьюдента в результаті виконаних спостережень прийме деяке значення в інтервалі (- t p ; + t p)

де k - число ступенів свободи, що дорівнює (п - 1). Величини t p (названі в даному випадку коефіцієнтами Стьюдента),розраховані за допомогою двох останніх формул для різних значень довірчої ймовірності та числа вимірювань табульовані (див. таблицю в додатку 1). Отже, за допомогою розподілу Стьюдента можна знайти ймовірність того, що відхилення середнього арифметичного від справжнього значення вимірюваної величини не перевищує

У тих випадках, коли розподіл випадкових похибок не є нормальним, все ж таки часто користуються розподілом Стьюдента з наближенням, ступінь якого залишається невідомим. Розподіл Стьюдента застосовують за числі вимірювань n< 30, поскольку уже при n = 20, ...,30 оно переходит в нормальное и вместо уравнения (6.14) можно использовать уравнение (6.13). Результат измерения записывается в виде: ; P = Р д, де Р д – конкретне значення довірчої ймовірності. Множник t при великій кількості вимірів n дорівнює квантильному множнику z p . При малому n він дорівнює коефіцієнту Стьюдента.

Отриманий результат виміру не є одним конкретним числом, а являє собою інтервал, всередині якого з певною ймовірністю Р д знаходиться справжнє значення вимірюваної величини. Виділення середини інтервалу х зовсім не передбачає, що справжнє значення ближче до нього, ніж до інших точок інтервалу. Воно може бути будь-де інтервалу, а з ймовірністю 1 - Р д навіть поза ним.

Приклад 6.2. Визначення питомих магнітних втрат для різних зразків однієї партії електротехнічної сталі марки 2212 дало такі результати: 1,21; 1,17; 1,18; 1,13; 1,19; 1,14; 1,20 та 1,18 Вт/кг. Вважаючи, що систематична похибка відсутня, а випадкова розподілена за нормальним законом, потрібно визначити довірчий інтервал при значеннях довірчої ймовірності 0,9 та 0,95. Для вирішення задачі використовувати формулу Лапласа та розподіл Стьюдента.

За формулами (6.8) у (6.11) знаходимо оцінки середнього арифметичного значення та СКО результатів вимірювань. Вони відповідно дорівнюють 1,18 та 0,0278 Вт/кг. Вважаючи, що оцінка СКО дорівнює самому відхилення, знаходимо:

Звідси, використовуючи значення функції Лапласа, наведені у таблиці додатка 1, визначаємо, що z p= 1,65. Для Р = 0,95 коефіцієнт z p = 1,96. Довірчі інтервали, що відповідають Р = 0,9 та 0,95, дорівнюють 1,18 ± 0,016 та 1,18±0,019 Вт/кг.

За таблицею додатка 1 знаходимо, що t 0,9 = 1,9 та t 0,95 = 2,37. Звідси довірчі інтервали відповідно дорівнюють 1,18±0,019 та 1,18±0,023 Вт/кг.