Студентски Т тест за независни примероци формула. Студентска т-тест дистрибуција за тестирање на хипотезата за средната вредност и пресметување на интервалот на доверба во MS Excel

Еквивалентен пристап за толкување на резултатите од тестот би бил да се претпостави дека нултата хипотеза е вистинита, можеме да пресметаме колку голема веројатностдобие т- критериум еднаков или поголем од реалната вредност што ја пресметавме од достапните податоци од примерокот. Ако оваа веројатност се покаже дека е помала од претходно прифатеното ниво на значајност (на пример, П< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Да претпоставиме дека имаме податоци за дневниот внес на енергија од храната (kJ/ден) за 11 жени (пример земен од книгата Altman D. G. (1981) Практична статистика за медицински истражувања, Chapman & Hall, Лондон):


Просекот за овие 11 набљудувања е:


Прашање: Дали овој просек на примерок се разликува од утврдената норма од 7725 kJ/ден? Разликата помеѓу нашата вредност на примерокот и овој стандард е доста значајна: 7725 - 6753,6 = 971,4. Но, колку е голема оваа разлика статистички? Еден примерок ќе помогне да се одговори на ова прашање. т-тест. Како и другите опции т-тест, t тест со еден примерок се изведува во R користејќи ја функцијата t.test():


Прашање: Дали овие просеци се статистички различни? Ајде да ја провериме хипотезата дека нема разлика користејќи т-тест:

Но, во такви случаи, како можеме статистички да го оцениме присуството на ефект од интервенција? Општо земено, студентскиот тест може да се претстави како

Методот ви овозможува да ја тестирате хипотезата дека просечните вредности на две општи популации од кои се извлечени споредените зависниселекции се разликуваат едни од други. Претпоставката за зависност најчесто значи дека карактеристиката се мери на ист примерок двапати, на пример, пред интервенцијата и по неа. Во општиот случај, на секој претставник на еден примерок му се доделува претставник од друг примерок (тие се комбинираат во парови) така што двете серии на податоци се во позитивна корелација една со друга. Послаби типови на зависност од примерокот: примерок 1 - сопрузи, примерок 2 - нивните сопруги; примерок 1 - едногодишни деца, примерокот 2 е составен од близнаци деца во примерокот 1 итн.

Тестирачка статистичка хипотеза,како и во претходниот случај, H 0: М 1 = М 2(просечните вредности во примероците 1 и 2 се еднакви). Доколку се отфрли, се прифаќа алтернативната хипотеза дека М 1повеќе помалку) М 2.

Првичните претпоставкиза статистичко тестирање:

Секој претставник на еден примерок (од една општа популација) е поврзан со претставник на друг примерок (од друга општа популација);

Податоците од двата примерока се во позитивна корелација (формираат парови);

Распределбата на проучуваната карактеристика во двата примерока одговара на нормалниот закон.

Изворна структура на податоци:има две вредности на проучуваната карактеристика за секој објект (за секој пар).

Ограничувања:распределбата на карактеристиката во двата примерока не треба значително да се разликува од нормалната; податоците од две мерења што одговараат на едното и на другиот примерок се во позитивна корелација.

Алтернативи: Wilcoxon T тест, ако распределбата за барем еден примерок значително се разликува од нормалната; т-Студентски тест за независни примероци - ако податоците за два примероци не корелираат позитивно.

Формулаза емпириската вредност на Студентскиот t тест го одразува фактот дека единицата за анализа за разликите е разлика (смена)вредности на атрибути за секој пар на набљудувања. Според тоа, за секој од N паровите вредности на атрибутот, прво се пресметува разликата d i = x 1 i - x 2 i.

каде M d е просечната разлика на вредностите; σ d - стандардна девијација на разликите.

Пример за пресметка:

Да претпоставиме дека за време на тестирањето на ефективноста на обуката, на секој од 8-те членови на групата му беше поставено прашањето „Колку често вашето мислење се совпаѓа со мислењето на групата? - двапати, пред и после тренинг. За одговорите се користеше скала од 10 точки: 1 - никогаш, 5 - половина од времето, 10 - секогаш. Беше тестирана хипотезата дека како резултат на обуката ќе се зголеми самопочитта за усогласеност (желбата да се биде како другите во групата) на учесниците (α = 0,05). Ајде да создадеме табела за средни пресметки (Табела 3).


Табела 3

Аритметичката средина за разликата M d = (-6)/8 = -0,75. Одземете ја оваа вредност од секоја d (претпоследната колона од табелата).

Формулата за стандардно отстапување се разликува само по тоа што во неа наместо X се појавува d. Ги заменуваме сите потребни вредности, добиваме:

σ d = = 0,886.

Чекор 1. Пресметајте ја емпириската вредност на критериумот користејќи ја формулата (3): просечна разлика Md= -0,75; Стандардна девијација σ d = 0,886; т е = 2,39; дф = 7.

Чекор 2. Користејќи ја табелата со критични вредности на критериумот t-Student, го одредуваме p-нивото на значајност. За df = 7 емпириската вредност е помеѓу критичните вредности за Р= 0,05 и Р - 0,01. Оттука, Р< 0,05.

дф Р
0,05 0,01 0,001
2,365 3,499 5,408

Чекор 3. Донесуваме статистичка одлука и формулираме заклучок. Статистичката хипотеза за еднаквост на просечните вредности е отфрлена. Заклучок: индикаторот за самооценување на сообразноста на учесниците по обуката статистички значително се зголеми (на ниво на значајност стр< 0,05).

Параметриските методи вклучуваат споредба на варијанси на два примерока според критериумотФ-Фишер. Понекогаш овој метод води до вредни значајни заклучоци, а во случај на споредување средства за независни примероци, споредбата на варијансите е задолжителнопостапка.

Да се ​​пресмета F emтреба да го пронајдете односот на варијансите на двата примерока, и така што поголемата варијанса е во броителот, а помалата во именителот.

Споредба на варијанси. Методот ви овозможува да ја тестирате хипотезата дека варијансите на двете општи популации од кои се извлекуваат споредените примероци се разликуваат една од друга. Тестирана статистичка хипотеза H 0: σ 1 2 = σ 2 2 (варијансата во примерокот 1 е еднаква на варијансата во примерокот 2). Доколку се отфрли, се прифаќа алтернативната хипотеза дека едната варијанса е поголема од другата.

Првичните претпоставки: два примероци се земаат по случаен избор од различни популации со нормална распределба на карактеристиката што се проучува.

Изворна структура на податоци:карактеристиката што се проучува се мери во предмети (субјекти), од кои секој припаѓа на еден од двата примера што се споредуваат.

Ограничувања:распределбите на особината во двата примерока не се разликуваат значително од нормалните.

Алтернативен метод:Левеновиот тест, чија употреба не бара проверка на претпоставката за нормалност (се користи во програмата SPSS).

Формулаза емпириската вредност на Фишеровиот F тест:

(4)

каде σ 1 2 голема дисперзија, а σ 2 2 - помала дисперзија. Бидејќи однапред не се знае која дисперзија е поголема, тогаш за одредување на p-нивото се користи Табела на критични вредности за алтернативи кои не се насочени.Ако F e > F Kpза соодветниот број на степени на слобода, тогаш Р< 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример за пресметка:

На децата им беа дадени редовни аритметички задачи, по што на една по случаен избор избрана половина од учениците им беше кажано дека паднале на тестот, а на останатите им беше кажано спротивното. Потоа секое дете беше прашано колку секунди ќе му бидат потребни за да реши сличен проблем. Експериментаторот ја пресметал разликата помеѓу времето кога детето се јавило и резултатот од завршената задача (во секунди). Се очекуваше дека пораката за неуспех ќе предизвика одредена несоодветност во самодовербата на детето. Тестираната хипотеза (на ниво α = 0,005) беше дека варијансата на збирната самодоверба не зависи од извештаите за успех или неуспех (H 0: σ 1 2 = σ 2 2).

Добиени се следните податоци:

Чекор 1. Пресметајте ја емпириската вредност на критериумот и бројот на степени на слобода користејќи формули (4):

Чекор 2. Според табелата со критични вредности на Fisher f-критериумот за ненасоченалтернативи за кои ја наоѓаме критичната вредност df број= 11; df знам= 11. Сепак, постои критична вредност само за df број= 10 и df знам = 12. Не може да се земе поголем број на степени на слобода, затоа ја земаме критичната вредност за df број= 10: За Р= 0,05 F Kp = 3.526; За Р= 0,01 F Kp = 5,418.

Чекор 3. Донесување статистичка одлука и значаен заклучок. Бидејќи емпириската вредност ја надминува критичната вредност за Р= 0,01 (и уште повеќе за стр = 0,05), тогаш во овој случај стр< 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (Р< 0,01). Следствено, по порака за неуспех, несоодветноста на самодовербата е поголема отколку по порака за успех.

Приказна

Овој критериум го разви Вилијам Госет за да го процени квалитетот на пивото во Гинис. Во врска со обврските кон компанијата во врска со неоткривање на деловни тајни (менаџментот на Гинис ја сметаше употребата на статистички апарат во својата работа како таква), написот на Госет беше објавен во 1908 година во списанието Biometrics под псевдонимот „Студент“.

Барања за податоци

За да се примени овој критериум, неопходно е оригиналните податоци да имаат нормална дистрибуција. Во случај на примена на тест со два примерока за независни примероци, исто така е неопходно да се почитува условот за еднаквост на варијанси. Меѓутоа, постојат алтернативи за студентскиот t тест за ситуации со нееднакви варијанси.

Т-тест со два примерока за независни примероци

Во случај на малку поинаква големина на примерокот, се користи поедноставена формула за приближни пресметки:

Ако големината на примерокот значително се разликува, се применува посложена и точна формула:

Каде М 1 ,М 2 - аритметички просеци, σ 1, σ 2 - стандардни отстапувања и Н 1 ,Н 2 - големини на примероци.

Т-тест со два примерока за зависни примероци

За да се пресмета емпириската вредност на t-тестот во ситуација на тестирање на хипотеза за разлики помеѓу два зависни примероци (на пример, два примероци од истиот тест со временски интервал), се користи следнава формула:

Каде М ге просечната разлика во вредностите, а σ г- стандардно отстапување на разликите.

Бројот на степени на слобода се пресметува како

T-тест со еден примерок

Се користи за тестирање на хипотезата за разликата помеѓу просечната вредност и некоја позната вредност:

Бројот на степени на слобода се пресметува како

Непараметриски аналози

Аналог на тестот со два примерока за независни примероци е Mann-Whitney U тестот. За ситуацијата со зависни примероци, аналози се тестот за знаци и Wilcoxon T-тестот

Автоматско пресметување на Студентскиот т-тест


Фондацијата Викимедија. 2010 година.

  • Гинис
  • Геохемиски резервоар

Погледнете што е „Студентски Т-тест“ во другите речници:

    Студентски t-c тест- Студентски критериум или т в. или S. t тестот е статистички критериум за значајноста на разликата помеѓу споредените средини. Утврдено со односот на оваа разлика кон разликата грешка: За вредности од t... ... Генетика. енциклопедиски речник

    Студентски т тест- Студентскиот t тест е општо име за класа методи за статистичко тестирање на хипотези (статистички тестови) врз основа на споредба со студентската распределба. Најчестите случаи на користење на t тестот се поврзани со проверка на еднаквоста... ... Википедија

    Студентски т тест- Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: ингли. Студентски тест rus. Студентски т тест... Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    Студентски т тест- Статистички тест во кој, под претпоставка на нултата хипотеза, користените статистики одговараат на распределбата t (Студентска дистрибуција). Забелешка. Еве примери за примена на овој критериум: 1. проверка на еднаквоста на просекот на... ... Речник на социолошка статистика

    СТУДЕНТСКИ КРИТЕРИУМ- Биометриски индикатор за веродостојноста на разликата (td) помеѓу просечните вредности на две групи животни споредени една со друга (M1 и M2) за која било карактеристика. Веродостојноста на разликата се одредува со формулата: Добиената td вредност се споредува со... ... Термини и дефиниции кои се користат во одгледувањето, генетиката и репродукцијата на фармски животни

    СТУДЕНТСКИ КРИТЕРИУМ- ја оценува блискоста на две просечни вредности од гледна точка на тоа дали е класифицирана како случајна или не (на дадено ниво на значајност), одговарајќи на прашањето дали просечните вредности статистички значајно се разликуваат една од друга)