Эквивалентным подходом к интерпретации результатов теста будет следующий: допустив, что нулевая гипотеза верна, мы можем рассчитать, насколько велика вероятность получить t -критерий, равный или превышающий то реальное значение, которое мы рассчитали по имеющимся выборочным данным. Если эта вероятность оказывается меньше, чем заранее принятый уровень значимости (например, Р < 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.
Предположим, у нас имеются данные по суточному потреблению энергии, поступающей с пищей (кДж/сутки), для 11 женщин (пример заимствован из книги Altman D. G. (1981) Practical Statistics for Medical Research , Chapman & Hall, London ):
Среднее значение для этих 11 наблюдений составляет:
Вопрос: отличается ли это выборочное среднее значение от установленной нормы в 7725 кДж/сутки? Разница между нашим выборочным значением и этим нормативом довольно прилична: 7725 - 6753.6 = 971.4. Но насколько велика эта разница статистически? Ответить на этот вопрос поможет одновыборочный t
-тест. Как и другие варианты t
-теста, одновыборочный тест Стьюдента выполняется в R при помощи функции t.test()
:
Вопрос: различаются ли эти средние значения статистически? Проверим гипотезу об отсутствии разницы при помощи t
-теста:
Но как в таких случаях оценить наличие эффекта от воздействия статистически? В общем виде критерий Стьюдента можно представить как
Метод позволяет проверить гипотезу о том, что средние значения двух ге-неральных совокупностей, из которых извлечены сравниваемые зависимые вы-борки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воз-действия и после него. В общем же случае каждому представителю одной вы-борки поставлен в соответствие представитель из другой выборки (они по-парно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 — мужья, вы-борка 2 — их жены; выборка 1 — годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.
Проверяемая статистическая гипотеза, как и в предыдущем случае, Н 0: М 1 = М 2 (средние значения в выборках 1 и 2 равны). При ее отклонении принимается альтернативная гипотеза о том, что М 1 больше (меньше) М 2 .
Исходные предположения для статистической проверки:
Каждому представителю одной выборки (из одной генеральной совокупно-сти) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);
Данные двух выборок положительно коррелируют (образуют пары);
Распределение изучаемого признака и в той и другой выборке соответству-ет нормальному закону.
Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).
Ограничения: распределения признака и в той, и в другой выборке должно суще-ственно не отличаться от нормального; данные двух измерений, соответству-ющих той и другой выборке, положительно коррелируют.
Альтернативы: критерий Т-Вилкоксона , если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок — если данные для двух выборок не корре-лируют положительно.
Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений при-знака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность d i = х 1 i - x 2 i .
где M d - средняя разность значений; σ d - стандартное отклонение разностей.
Пример расчета:
Предположим, в ходе проверки эффективности тренинга каждому из 8 членов груп-пы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» — дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 — никогда, 5 — в половине случаев, 10 — всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).
Таблица 3
Среднее арифметической для разности M d = (-6)/8 = -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).
Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d. Подставляем все нужные значения, получаем:
σ d = = 0,886.
Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя раз-ность M d = -0,75; стандартное отклонение σ d = 0,886; t э = 2,39; df = 7.
Шаг 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится меж-ду критическими для р = 0,05 и р — 0,01. Следовательно, р < 0,05.
df | Р | ||
0,05 | 0,01 | 0,001 | |
2,365 | 3,499 | 5,408 |
Шаг 3. Принимаем статистическое решение и формулируем вывод. Статистичес-кая гипотеза о равенстве средних значений отклоняется. Вывод: показатель само-оценки конформизма участников после тренинга увеличился статистически досто-верно (на уровне значимости р < 0,05).
К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера . Иногда этот метод приводит к ценным содержатель-ным выводам, а в случае сравнения средних для независимых выборок срав-нение дисперсий является обязательной процедурой.
Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.
Сравнение дисперсий . Метод позволяет проверить гипотезу о том, что дисперсии двух генераль-ных совокупностей, из которых извлечены сравниваемые выборки, отлича-ются друг от друга. Проверяемая статистическая гипотеза Н 0: σ 1 2 = σ 2 2 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.
Исходные предположения : две выборки извлекаются случайно из разных ге-неральных совокупностей с нормальным распределением изучаемого признака.
Структура исходных данных: изучаемый признак измерен у объектов (ис-пытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.
Ограничения: распределения признака и в той, и в другой выборке суще-ственно не отличаются от нормального.
Альтернатива методу: критерий Ливена (Levene"sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).
Формула для эмпирического значения критерия F-Фишера:
(4)
где σ 1 2 — большая дисперсия, a σ 2 2 — меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если F э > F Kp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).
Пример расчета:
Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а ос-тальным — обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного за-дания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекват-ность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н 0: σ 1 2 = σ 2 2).
Были получены следующие данные:
Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):
Шаг 2. По таблице критических значений критерия f-Фишера для ненаправлен-ных альтернатив находим критическое значение для df числ = 11; df знам = 11. Однако критическое значение есть только для df числ = 10 и df знам = 12. Боль-шее число степеней свободы брать нельзя, поэтому берем критическое значение для df числ = 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.
Шаг 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем бо-лее — для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следователь-но, после сообщения о неудаче неадекватность самооценки выше, чем после сооб-щения об удаче.
История
Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс . В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
Требования к данным
Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение . В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий . Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.
Двухвыборочный t-критерий для независимых выборок
В случае с незначительно отличающимся размером выборки применяется упрощённая формула приближенных расчётов:
В случае, если размер выборки отличается значительно, применяется более сложная и точная формула:
Где M 1 ,M 2 - средние арифметические, σ 1 ,σ 2 - стандартные отклонения, а N 1 ,N 2 - размеры выборок.
Двухвыборочный t-критерий для зависимых выборок
Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:
где M d - средняя разность значений, а σ d - стандартное отклонение разностей.
Количество степеней свободы рассчитывается как
Одновыборочный t-критерий
Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения :
Количество степеней свободы рассчитывается как
Непараметрические аналоги
Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна-Уитни . Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона
Автоматический расчет t-критерия Стьюдента
Wikimedia Foundation . 2010 .
- Гиннесс
- Геохимический резервуар
Смотреть что такое "T-критерий Стьюдента" в других словарях:
Критерий Стьюдента t-к - Критерий Стьюдента, t к. * крытэрый Ст’юдэнта, t к. * Student’s criterion or t c. or S. t test статистический критерий существенности разности между сравниваемыми средними. Определяется отношением этой разности к ошибке разности: При значениях t… … Генетика. Энциклопедический словарь
Критерий Стьюдента - t критерий Стьюдента общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t критерия связаны с проверкой равенства… … Википедия
критерий Стьюдента - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: angl. Student’s test rus. критерий Стьюдента … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas
критерий Стьюдента - Статистический критерий, в котором, в предположении нулевой гипотезы, используемая статистика соответствует t распределению (распределению Стьюдента). Примечание. Вот примеры применения этого критерия: 1. проверка равенства среднего из… … Словарь социологической статистики
КРИТЕРИЙ СТЬЮДЕНТА - Биометрический показатель достоверности разницы (td) между средними значениями двух сравниваемых между собой групп животных (M1 и М2) по какому либо признаку. Достоверность разницы определяется по формуле: Полученное значение td сравнивается с… … Термины и определения, используемые в селекции, генетике и воспроизводстве сельскохозяйственных животных
КРИТЕРИЙ СТЬЮДЕНТА
- оценивает близость двух средних значений с точки зрения отнесения или не отнесения ее к случайной (при заданном уровне значимости), отвечая на вопрос о том, отличаются ли средние значения статистически достоверно друг от друга }