Т критерій студента для незалежних вибірок формула. Розподіл t-критерію Стьюдента для перевірки гіпотези про середню та розрахунку довірчого інтервалу в MS Excel

Еквівалентним підходом до інтерпретації результатів тесту буде наступний: припустивши, що нульова гіпотеза вірна, ми можемо розрахувати, наскільки велика ймовірністьотримати t-Критерій, що дорівнює або перевищує те реальне значення, яке ми розрахували за наявними вибірковими даними. Якщо ця ймовірність виявляється меншою, ніж заздалегідь прийнятий рівень значущості (наприклад, Р< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Припустимо, у нас є дані щодо добового споживання енергії, що надходить з їжею (кДж/добу), для 11 жінок (приклад запозичений з книги Altman D. G. (1981) Практична статистика для медичного дослідження, Chapman & Hall, London):


Середнє значення цих 11 спостережень становить:


Питання: чи відрізняється це вибіркове середнє значення встановленої норми 7725 кДж/сутки? Різниця між нашим вибірковим значенням та цим нормативом досить пристойна: 7725 – 6753.6 = 971.4. Але наскільки велика ця різниця статистично? Відповісти на це запитання допоможе одновибірковий t-Тест. Як і інші варіанти tтесту, одновибірковий тест Стьюдента виконується в R за допомогою функції t.test() :


Питання: чи розрізняються ці середні значення статистично? Перевіримо гіпотезу про відсутність різниці за допомогою t-тесту:

Але як у таких випадках оцінити наявність ефекту від дії статистично? У загальному вигляді критерій Стьюдента можна подати як

Метод дозволяє перевірити гіпотезу про те, що середні значення двох генеральних сукупностей, з яких вилучені порівнювані залежнівиборки, відрізняються один від одного. Допущення залежності найчастіше означає, що ознака виміряний на одній і тій же вибірці двічі, наприклад, до впливу і після нього. У загальному випадку кожному представнику однієї вибірки поставлений у відповідність представник з іншої вибірки (вони по-парному об'єднані) так, що два ряди даних позитивно корелюють один з одним. Більш слабкі види залежності вибірок: вибірка 1 - чоловіки, вибірка 2 - їх дружини; вибірка 1 - однорічні діти, вибірка 2 складена з близнюків дітей вибірки 1, і т.д.

Перевірювана статистична гіпотеза,як і в попередньому випадку, Н 0: М 1 = М 2(Середні значення у вибірках 1 і 2 рівні). При її відхиленні приймається альтернативна гіпотеза про те, що М 1більше (менше) М2.

Вихідні припущеннядля статистичної перевірки:

Кожному представнику однієї вибірки (з однієї генеральної сукупності) поставлений у відповідність представник іншої вибірки (з іншої генеральної сукупності);

Дані двох вибірок позитивно корелюють (утворюють пари);

Розподіл досліджуваної ознаки і в тій і іншій вибірці відповідає нормальному закону.

Структура вихідних даних:є по два значення ознаки, що вивчається, для кожного об'єкта (для кожної пари).

Обмеження:розподілу ознаки і в тій, і в іншій вибірці має істотно не відрізнятися від нормального; дані двох вимірювань, що відповідають тій та іншій вибірці, позитивно корелюють.

Альтернативи:критерій Т-Вілкоксона, якщо розподіл хоча б для однієї вибірки суттєво відрізняється від нормального; критерій t-Стьюдента для незалежних вибірок - якщо дані для двох вибірок не корелюють позитивно.

Формуладля емпіричного значення критерію t-Стьюдента відбиває той факт, що одиницею аналізу відмінностей є різницю (зсув)значень ознаки для кожної пари спостережень. Відповідно, для кожної з N пар значень ознаки спочатку обчислюється різниця d i = х 1 i - x 2 i.

де M d – середня різниця значень; d - стандартне відхилення різниць.

Приклад розрахунку:

Припустимо, в ході перевірки ефективності тренінгу кожному з 8 членів групи ставилося питання «Наскільки часто твоя думка збігаєтеся думкою групи?» - Двічі, до і після тренінгу. Для відповідей використовувалася 10-бальна шкала: 1 – ніколи, 5 – у половині випадків, 10 – завжди. Перевірялася гіпотеза у тому, що результаті тренінгу самооцінка конформізму (прагнення бути як інші групи) учасників зросте (α = 0,05). Складемо таблицю для проміжних обчислень (таблиця 3).


Таблиця 3

Середня арифметична для різниці M d = (-6)/8 = -0,75. Віднімемо це значення кожного d (передостанній стовпець таблиці).

Формула для стандартного відхилення відрізняється лише тим, замість Х у ній фігурує d. Підставляємо всі необхідні значення, отримуємо:

d = = 0,886.

К а г 1. Обчислюємо емпіричне значення критерію за формулою (3): середня різниця M d= -0,75; стандартне відхилення σ d = 0,886; t е = 2,39; df = 7.

Крок 2. Визначаємо за таблицею критичних значень критерію t-Стьюдента рівень значущості. Для df = 7 емпіричне значення знаходиться між критичними для р= 0,05 та р - 0,01. Отже, р< 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Крок 3. Приймаємо статистичне рішення та формулюємо висновок. Статистична гіпотеза про рівність середніх значень відхиляється. Висновок: показник самооцінки конформізму учасників після тренінгу збільшився статистично достовірно (на рівні значимості р< 0,05).

До параметричних методів відноситься і порівняння дисперсій двох вибірок за критерієм F-фішера. Іноді цей метод призводить до цінних змістових висновків, а в разі порівняння середніх для незалежних вибірок порівняння дисперсій є обов'язковоюпроцедурою.

Для обчислення F емппотрібно знайти відношення дисперсій двох вибірок, причому так, щоб більша за величиною дисперсія знаходилася б у чисельнику, а менша знаменника.

Порівняння дисперсій. Метод дозволяє перевірити гіпотезу про те, що дисперсії двох генераль-них сукупностей, з яких вилучені порівнювані вибірки, відрізняються один від одного. Перевірювана статистична гіпотеза Н 0: σ 1 2 = σ 2 2 (дисперсія у вибірці 1 дорівнює дисперсії у вибірці 2). При її відхиленні приймається альтернативна гіпотеза про те, що одна дисперсія більша за іншу.

Вихідні припущення: дві вибірки вилучаються випадково з різних генеральних сукупностей з нормальним розподілом досліджуваної ознаки.

Структура вихідних даних:ознака, що вивчається, виміряний у об'єктів (випробуваних), кожен з яких належить до однієї з двох порівнюваних вибірок.

Обмеження:розподілу ознаки і в тій, і в іншій вибірці істотно не відрізняються від нормального.

Альтернатива методу:критерій Лівена (Levene"sTest), застосування якого не вимагає перевірки припущення про нормальність (використовується в програмі SPSS).

Формуладля емпіричного значення критерію F-фішера:

(4)

де σ 1 2 велика дисперсія, a σ 2 2 - Менша дисперсія. Так як заздалегідь не відомо, яка дисперсія більша, то для визначення р-уровня застосовується Таблиця критичних значень для ненаправлених альтернатив.Якщо F е > F Kpдля відповідної кількості ступенів свободи, то р< 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Приклад розрахунку:

Дітям давалися звичайні арифметичні завдання, після чого одній випадково обраної половині учнів повідомляли, що де вони витримали випробування, а іншим — зворотне. Потім у кожної дитини запитували, скільки секунд їй потрібно було б вирішити аналогічне завдання. Експериментатор обчислював різницю між званою дитиною часом і результатом виконаного завдання (в сек.). Очікувалося, що повідомлення про невдачу викличе деяку неадекватність самооцінки дитини. Перевірювана гіпотеза (на рівні α = 0,005) полягала в тому, що дисперсія сукупності самооцінок не залежить від повідомлень про удачу чи невдачу (Н 0: σ 1 2 = σ 2 2).

Були отримані такі дані:

К а г 1. Обчислимо емпіричне значення критерію та числа ступенів свободи за формулами (4):

Крок 2. За таблицею критичних значень критерію f-фішера для ненаправленихальтернатив знаходимо критичне значення для df чисел= 11; df знам= 11. Проте критичне значення є лише для df чисел= 10 і df знам = 12. Велике число ступенів свободи брати не можна, тому беремо критичне значення для df чисел= 10: Для р= 0,05 F Kp = 3,526; для р= 0,01 F Kp = 5,418.

Крок 3. Прийняття статистичного рішення та змістовний висновок. Оскільки емпіричне значення перевищує критичне значення для р= 0,01 (і тим більше - для р = 0,05), то в даному випадку р< 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р< 0,01). Отже, після повідомлення про невдачу неадекватність самооцінки вище, ніж після повідомлення про удачу.

Історія

Цей критерій був розроблений Вільямом Госсеттом для оцінки якості пива в компанії Гіннес. У зв'язку з зобов'язаннями перед компанією з нерозголошення комерційної таємниці (керівництво Гіннесса вважало таке використання статистичного апарату у роботі), стаття Госсета вийшла 1908 року у журналі «Біометрика» під псевдонімом «Student» (Студент).

Вимоги до даних

Для застосування даного критерію необхідно, щоб вихідні дані мали нормальний розподіл. У разі застосування двовибіркового критерію для незалежних вибірок також необхідне дотримання умови рівності дисперсій. Існують, однак, альтернативи критерію Стьюдента для ситуації з нерівними дисперсіями.

Двовибірковий t-критерій для незалежних вибірок

У випадку з незначним розміром вибірки застосовується спрощена формула наближених розрахунків:

У разі, якщо розмір вибірки відрізняється значно, застосовується складніша і точніша формула:

Де M 1 ,M 2 - середні арифметичні, 1, 2 - стандартні відхилення, а N 1 ,N 2 – розміри вибірок.

Двовибірковий t-критерій для залежних вибірок

Для обчислення емпіричного значення t-критерію в ситуації перевірки гіпотези про відмінності між двома залежними вибірками (наприклад, двома пробами того самого тесту з тимчасовим інтервалом) застосовується наступна формула:

де M d- середня різниця значень, а σ d- Стандартне відхилення різниць.

Кількість ступенів свободи розраховується як

Одновибірковий t-критерій

Застосовується для перевірки гіпотези про відмінність середнього значення деякого відомого значення :

Кількість ступенів свободи розраховується як

Непараметричні аналоги

Аналогом двовибіркового критерію для незалежних вибірок є U-критерій Манна-Уітні. Для ситуації із залежними вибірками аналогами є критерій знаків та T-критерій Вілкоксону.

Автоматичний розрахунок t-критерію Стьюдента


Wikimedia Foundation. 2010 .

  • Гіннес
  • Геохімічний резервуар

Дивитись що таке "T-критерій Стьюдента" в інших словниках:

    Критерій Стьюдента t-до- Критерій Стьюдента, t к. * Критерій Ст'юдента, t к. * Student's criterion or t c. or S. t test статистичний критерій суттєвості різниці між порівнюваними середніми. Визначається ставленням цієї різниці до помилки різниці: При значеннях t… … Генетика. Енциклопедичний словник

    Критерій Стьюдента- t критерій Стьюдента загальна назва класу методів статистичної перевірки гіпотез (статистичних критеріїв), заснованих на порівнянні з розподілом Стьюдента. Найчастіші випадки застосування t критерію пов'язані з перевіркою рівності.

    критерій Стьюдента- Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, isreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: англ. Student's test rus. критерій Стьюдента … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    критерій Стьюдента- Статистичний критерій, у якому, припущення нульової гіпотези, використовувана статистика відповідає t розподілу (розподілу Стьюдента). Примітка. Ось приклади застосування цього критерію: 1. перевірка рівності середнього… Словник соціологічної статистики

    КРИТЕРІЙ СТЬЮДЕНТА- Біометричний показник достовірності різниці (td) між середніми значеннями двох порівнюваних між собою груп тварин (M1 та М2) за якоюсь ознакою. Достовірність різниці визначається за формулою: Отримане значення td порівнюється з… Терміни та визначення, що використовуються в селекції, генетиці та відтворенні сільськогосподарських тварин

    КРИТЕРІЙ СТЬЮДЕНТА- оцінює близькість двох середніх значень з погляду віднесення або віднесення її до випадкової (при заданому рівні значимості), відповідаючи питанням тому, чи відрізняються середні значення статистично достовірно друг від друга )