Т критерий стьюдента для независимых выборок формула. Распределение t-критерия Стьюдента для проверки гипотезы о средней и расчета доверительного интервала в MS Excel

Эквивалентным подходом к интерпретации результатов теста будет следующий: допустив, что нулевая гипотеза верна, мы можем рассчитать, насколько велика вероятность получить t -критерий, равный или превышающий то реальное значение, которое мы рассчитали по имеющимся выборочным данным. Если эта вероятность оказывается меньше, чем заранее принятый уровень значимости (например, Р < 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Предположим, у нас имеются данные по суточному потреблению энергии, поступающей с пищей (кДж/сутки), для 11 женщин (пример заимствован из книги Altman D. G. (1981) Practical Statistics for Medical Research , Chapman & Hall, London ):


Среднее значение для этих 11 наблюдений составляет:


Вопрос: отличается ли это выборочное среднее значение от установленной нормы в 7725 кДж/сутки? Разница между нашим выборочным значением и этим нормативом довольно прилична: 7725 - 6753.6 = 971.4. Но насколько велика эта разница статистически? Ответить на этот вопрос поможет одновыборочный t -тест. Как и другие варианты t -теста, одновыборочный тест Стьюдента выполняется в R при помощи функции t.test() :


Вопрос: различаются ли эти средние значения статистически? Проверим гипотезу об отсутствии разницы при помощи t -теста:

Но как в таких случаях оценить наличие эффекта от воздействия статистически? В общем виде критерий Стьюдента можно представить как

Метод позволяет проверить гипотезу о том, что средние значения двух ге-неральных совокупностей, из которых извлечены сравниваемые зависимые вы-борки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воз-действия и после него. В общем же случае каждому представителю одной вы-борки поставлен в соответствие представитель из другой выборки (они по-парно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 — мужья, вы-борка 2 — их жены; выборка 1 — годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.

Проверяемая статистическая гипотеза, как и в предыдущем случае, Н 0: М 1 = М 2 (средние значения в выборках 1 и 2 равны). При ее отклонении принимается альтернативная гипотеза о том, что М 1 больше (меньше) М 2 .

Исходные предположения для статистической проверки:

Каждому представителю одной выборки (из одной генеральной совокупно-сти) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);

Данные двух выборок положительно коррелируют (образуют пары);

Распределение изучаемого признака и в той и другой выборке соответству-ет нормальному закону.

Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).

Ограничения: распределения признака и в той, и в другой выборке должно суще-ственно не отличаться от нормального; данные двух измерений, соответству-ющих той и другой выборке, положительно коррелируют.

Альтернативы: критерий Т-Вилкоксона , если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок — если данные для двух выборок не корре-лируют положительно.

Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений при-знака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность d i = х 1 i - x 2 i .

где M d - средняя разность значений; σ d - стандартное отклонение разностей.

Пример расчета:

Предположим, в ходе проверки эффективности тренинга каждому из 8 членов груп-пы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» — дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 — никогда, 5 — в половине случаев, 10 — всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).


Таблица 3

Среднее арифметической для разности M d = (-6)/8 = -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).

Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d. Подставляем все нужные значения, получаем:

σ d = = 0,886.

Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя раз-ность M d = -0,75; стандартное отклонение σ d = 0,886; t э = 2,39; df = 7.

Шаг 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится меж-ду критическими для р = 0,05 и р — 0,01. Следовательно, р < 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Шаг 3. Принимаем статистическое решение и формулируем вывод. Статистичес-кая гипотеза о равенстве средних значений отклоняется. Вывод: показатель само-оценки конформизма участников после тренинга увеличился статистически досто-верно (на уровне значимости р < 0,05).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера . Иногда этот метод приводит к ценным содержатель-ным выводам, а в случае сравнения средних для независимых выборок срав-нение дисперсий является обязательной процедурой.

Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.

Сравнение дисперсий . Метод позволяет проверить гипотезу о том, что дисперсии двух генераль-ных совокупностей, из которых извлечены сравниваемые выборки, отлича-ются друг от друга. Проверяемая статистическая гипотеза Н 0: σ 1 2 = σ 2 2 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.

Исходные предположения : две выборки извлекаются случайно из разных ге-неральных совокупностей с нормальным распределением изучаемого признака.

Структура исходных данных: изучаемый признак измерен у объектов (ис-пытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.

Ограничения: распределения признака и в той, и в другой выборке суще-ственно не отличаются от нормального.

Альтернатива методу: критерий Ливена (Levene"sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).

Формула для эмпирического значения критерия F-Фишера:

(4)

где σ 1 2 большая дисперсия, a σ 2 2 — меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если F э > F Kp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример расчета:

Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а ос-тальным — обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного за-дания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекват-ность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н 0: σ 1 2 = σ 2 2).

Были получены следующие данные:

Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):

Шаг 2. По таблице критических значений критерия f-Фишера для ненаправлен-ных альтернатив находим критическое значение для df числ = 11; df знам = 11. Однако критическое значение есть только для df числ = 10 и df знам = 12. Боль-шее число степеней свободы брать нельзя, поэтому берем критическое значение для df числ = 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.

Шаг 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем бо-лее — для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следователь-но, после сообщения о неудаче неадекватность самооценки выше, чем после сооб-щения об удаче.

История

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс . В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение . В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий . Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Двухвыборочный t-критерий для независимых выборок

В случае с незначительно отличающимся размером выборки применяется упрощённая формула приближенных расчётов:

В случае, если размер выборки отличается значительно, применяется более сложная и точная формула:

Где M 1 ,M 2 - средние арифметические, σ 1 ,σ 2 - стандартные отклонения, а N 1 ,N 2 - размеры выборок.

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

где M d - средняя разность значений, а σ d - стандартное отклонение разностей.

Количество степеней свободы рассчитывается как

Одновыборочный t-критерий

Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения :

Количество степеней свободы рассчитывается как

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна-Уитни . Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Автоматический расчет t-критерия Стьюдента


Wikimedia Foundation . 2010 .

  • Гиннесс
  • Геохимический резервуар

Смотреть что такое "T-критерий Стьюдента" в других словарях:

    Критерий Стьюдента t-к - Критерий Стьюдента, t к. * крытэрый Ст’юдэнта, t к. * Student’s criterion or t c. or S. t test статистический критерий существенности разности между сравниваемыми средними. Определяется отношением этой разности к ошибке разности: При значениях t… … Генетика. Энциклопедический словарь

    Критерий Стьюдента - t критерий Стьюдента общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t критерия связаны с проверкой равенства… … Википедия

    критерий Стьюдента - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: angl. Student’s test rus. критерий Стьюдента … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    критерий Стьюдента - Статистический критерий, в котором, в предположении нулевой гипотезы, используемая статистика соответствует t распределению (распределению Стьюдента). Примечание. Вот примеры применения этого критерия: 1. проверка равенства среднего из… … Словарь социологической статистики

    КРИТЕРИЙ СТЬЮДЕНТА - Биометрический показатель достоверности разницы (td) между средними значениями двух сравниваемых между собой групп животных (M1 и М2) по какому либо признаку. Достоверность разницы определяется по формуле: Полученное значение td сравнивается с… … Термины и определения, используемые в селекции, генетике и воспроизводстве сельскохозяйственных животных

    КРИТЕРИЙ СТЬЮДЕНТА - оценивает близость двух средних значений с точки зрения отнесения или не отнесения ее к случайной (при заданном уровне значимости), отвечая на вопрос о том, отличаются ли средние значения статистически достоверно друг от друга }