Утврдување на значењето на резултатите меѓу себе. Доверливост и статистичка значајност

Статистичката веродостојност е од суштинско значење во пресметковната практика на FCC. Претходно беше забележано дека од истиот популацијаможе да се изберат повеќе примероци:

Ако се правилно избрани, тогаш нивните просечни показатели и показателите на општата популација малку се разликуваат едни од други во големината на репрезентативната грешка, земајќи ја предвид прифатената веродостојност;

Ако тие се избрани од различни популации, разликата меѓу нив се покажува значајна. Статистиката е сè за споредување на примероците;

Ако тие се разликуваат незначително, непринципиелно, незначително, т.е., тие всушност припаѓаат на иста општа популација, разликата меѓу нив се нарекува статистички неверодостојна.

Статистички доверлив Разликата во примерокот е примерок кој значително и суштински се разликува, односно припаѓа на различни општи популации.

Во FCC, оценувањето на статистичката значајност на разликите во примероците значи решавање на множество практични проблеми. На пример, воведување нови наставни методи, програми, множества вежби, тестови, контролни вежбие поврзано со нивното експериментално тестирање, кое треба да покаже дека тест групата е суштински различна од контролната група. Затоа, посебно статистички методи, наречени критериуми за статистичка значајност, што овозможува да се открие присуството или отсуството на статистички значајна разлика помеѓу примероците.

Сите критериуми се поделени во две групи: параметарски и непараметриски. Параметриските критериуми бараат присуство на нормален закон за распределба, т.е. тоа значи задолжително утврдување на главните показатели на нормалниот закон - просекот аритметичка количинаи стандардна девијација s. Параметриските критериуми се најточни и најточни. Непараметриските тестови се засноваат на ранг (редни) разлики помеѓу елементите на примерокот.

Еве ги главните критериуми за статистичка значајност што се користат во практиката на FCC: Студентски тест и Фишер тест.

Студентски т тестименуван по англискиот научник К. Госет (Студент - псевдоним), кој открил овој метод. Студентскиот t тест е параметарски и се користи за споредба апсолутни показателипримероци. Примероците може да се разликуваат по големина.

Студентски т тест се дефинира вака.

1. Најдете го тестот Student t користејќи ја следната формула:


каде се аритметичките просеци на споредените примероци; t 1, t 2 - грешки на репрезентативноста идентификувани врз основа на индикаторите на споредените примероци.

2. Практиката во FCC покажа дека за спортска работа доволно е да се прифати веродостојноста на сметката P = 0,95.

За веродостојност на броење: P = 0,95 (a = 0,05), со бројот на степени на слобода

k = n 1 + n 2 - 2 користејќи ја табелата во Додаток 4 ја наоѓаме вредноста на граничната вредност на критериумот ( т гр).

3. Врз основа на својствата на законот за нормална распределба, студентскиот критериум ги споредува t и t gr.

Извлекуваме заклучоци:

ако t t gr, тогаш разликата помеѓу споредените примероци е статистички значајна;

ако t t gr, тогаш разликата е статистички незначителна.

За истражувачите од областа на FCS, оценувањето на статистичката значајност е првиот чекор во решавањето на конкретен проблем: дали примероците што се споредуваат се фундаментално или нефундаментално различни едни од други. Следниот чекор е да се оцени оваа разлика со педагошка точкавизија, која е одредена од условите на проблемот.

Да ја разгледаме примената на Студентскиот тест користејќи конкретен пример.

Пример 2.14. Група од 18 испитаници беше проценета за отчукувањата на срцето (bpm) пред x i и потоа y јасЗагреј се.

Проценете ја ефективноста на загревањето врз основа на отчукувањата на срцето. Првичните податоци и пресметки се прикажани во табелата. 2.30 и 2.31.

Табела 2.30

Обработка на индикатори за отчукувањата на срцето пред загревање


Грешките за двете групи се совпаднаа, бидејќи големини на примерокот се еднакви (иста група се проучува во различни услови), и просекот стандардни отстапувањаизнесуваше s x = s y = 3 отчукувања/мин. Ајде да продолжиме со дефинирање на студентскиот тест:

Ја поставивме веродостојноста на сметката: P = 0,95.

Број на степени на слобода k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Од табелата во Додаток 4 наоѓаме т гр= 2,02.

Статистички заклучок. Бидејќи t = 11,62, а границата t gr = 2,02, тогаш 11,62 > 2,02, т.е. t > t gr, затоа разликата помеѓу примероците е статистички значајна.

Педагошки заклучок. Утврдено е дека во однос на отчукувањата на срцето разликата помеѓу состојбата на групата пред и по загревањето е статистички значајна, т.е. значаен, фундаментален. Значи, врз основа на индикаторот за отчукувањата на срцето, можеме да заклучиме дека загревањето е ефективно.

Фишер критериуме параметарски. Се користи кога се споредуваат стапките на дисперзија на примерокот. Ова обично значи споредба во однос на стабилноста на спортските перформанси или стабилноста на функционалните и техничките показатели во пракса физичка култураи спортот. Примероците можат да бидат со различни големини.

Фишеровиот критериум е дефиниран во следната низа.

1. Најдете го Фишеровиот критериум F користејќи ја формулата


каде , се варијансите на споредените примероци.

Условите на критериумот Фишер предвидуваат дека во броителот на формулата Ф има голема дисперзија, т.е. бројот F е секогаш поголем од еден.

Ја поставуваме веродостојноста на пресметката: P = 0,95 - и го одредуваме бројот на степени на слобода за двата примероци: k 1 = n 1 - 1, k 2 = n 2 - 1.

Користејќи ја табелата во Додаток 4, ја наоѓаме граничната вредност на критериумот F гр.

Споредба на критериумите F и F грни овозможува да формулираме заклучоци:

ако F > F gr, тогаш разликата помеѓу примероците е статистички значајна;

ако Ф< F гр, то различие между выборками статически недо­стоверно.

Да дадеме конкретен пример.

Пример 2.15. Да анализираме две групи ракометари: x i (n 1= 16 луѓе) и y i (n 2 = 18 луѓе). Овие групи на спортисти беа проучувани за времето (и) на полетување при фрлање на топката во голот.

Дали показателите за одбивност се од ист тип?

Првичните податоци и основните пресметки се прикажани во табелата. 2.32 и 2.33.

Табела 2.32

Обработка на показатели за одбивност на прва група ракометари


Да го дефинираме критериумот на Фишер:





Според податоците прикажани во табелата во Додаток 6, наоѓаме Fgr: Fgr = 2,4

Да обрнеме внимание на фактот дека табелата во Додаток 6 ги наведува броевите на степени на слобода на поголема и помала дисперзија при приближување големи бројкистанува погруб. Така, бројот на степени на слобода на поголемата дисперзија следи по овој редослед: 8, 9, 10, 11, 12, 14, 16, 20, 24 итн., а помалата - 28, 29, 30, 40 , 50, итн. г.

Ова се објаснува со фактот дека како што се зголемува големината на примерокот, разликите во F-тестот се намалуваат и можно е да се користат табеларни вредности кои се блиску до оригиналните податоци. Така, во примерот 2.15 =17 е отсутен и можеме да ја земеме вредноста најблиску до неа k = 16, од која добиваме Fgr = 2.4.

Статистички заклучок. Бидејќи Фишеровиот тест F= 2,5 > F= 2,4, примероците се статистички разграничени.

Педагошки заклучок. Вредностите на времето (и) на полетување при фрлање на топката во голот за ракометарите од двете групи значително се разликуваат. Овие групи треба да се сметаат за различни.

Понатамошните истражувања треба да ја откријат причината за оваа разлика.

Пример 2.20.(на статистичката веродостојност на примерокот ). Дали се подобрија квалификациите на фудбалерот ако времето (и) од давање сигнал до шутирање на топката на почетокот на тренингот беше x i, а на крајот y i.

Првичните податоци и основните пресметки се дадени во табелата. 2.40 и 2.41.

Табела 2.40

Обработка на индикатори за време од давање сигнал до удирање на топката на почетокот на тренингот


Дозволете ни да ја одредиме разликата помеѓу групите индикатори користејќи го студентскиот критериум:

Со сигурност P = 0,95 и степени на слобода k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, користејќи ја табелата во Додаток 4 наоѓаме т гр= 2,02. Бидејќи t = 8,3 > т гр= 2,02 - разликата е статистички значајна.

Дозволете ни да ја одредиме разликата помеѓу групите индикатори користејќи го критериумот на Фишер:


Според табелата во Додаток 2, со сигурност P = 0,95 и степени на слобода k = 22-1 = 21, вредноста F gr = 21. Бидејќи F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Статистички заклучок. Според аритметичкиот просек, разликата меѓу групите показатели е статистички значајна. Во однос на дисперзијата (дисперзија), разликата помеѓу групите индикатори е статистички неверодостојна.

Педагошки заклучок.Квалификациите на фудбалерот се значително подобрени, но треба да се внимава на стабилноста на неговото сведочење.

Подготовка за работа

Пред ова лабораториска работапо дисциплина“ Спортска метрологија» на сите студенти студиска групапотребно е да се формираат работни тимови од по 3-4 ученици во секој, заеднички да ја завршат работната задача на сите лабораториски работи.

Во подготовка за работа прочитајте ги соодветните делови од препорачаната литература (види дел 6 од податоците методолошки инструкции) и белешки за предавање. Проучете ги деловите 1 и 2 за оваа лабораториска работа, како и работната задача за неа (дел 4).

Подгответе формулар за извештајна стандардни листови хартија за пишување со големина А4 и пополнете ја со материјалите потребни за работата.

Извештајот мора да содржи :

Насловна страницасо назначување на одделот (UC и TR), студиска група, презиме, име, патроним на студентот, број и наслов на лабораториска работа, датум на неговото завршување, како и презиме, академски степен, академско звање и работно место на наставникот што ја прифаќа работата;

Цел на работата;

Формули со нумерички вредности, објаснувајќи ги средните и конечните резултати од пресметките;

Табели на измерени и пресметани вредности;

Графички материјал потребен со задачата;

Кратки заклучоциврз основа на резултатите од секоја фаза од работната задача и воопшто на извршената работа.

Сите графикони и табели се нацртани внимателно со помош на алатки за цртање. Конвенционалните графички и букви симболи мора да се усогласат со ГОСТ. Дозволено е да се подготви извештај со користење на компјутерска технологија.

Работна задача

Пред да ги изврши сите мерења, секој член на тимот мора да ги проучи правилата за употреба спортска играПикадо дадени во Додаток 7, кои се неопходни за спроведување на следните фази на истражување.

Фаза I на истражување„Проучување на резултатите од погодувањето на целта на спортската игра Пикадо од секој член на тимот за усогласеност нормален законраспределби според критериум χ 2Пирсон и критериум од трисигма"

1. измерете ја (тестирајте) вашата (лична) брзина и координација на акциите, со фрлање пикадо 30-40 пати кон кружна цел во спортската игра Пикадо.

2. Резултати од мерењата (тестови) x i(со чаши) наредете во форма варијација серијаи внесете во табелата 4.1 (колони , направи сè потребни пресметки, пополнете ги потребните табели и извлечете соодветни заклучоци во однос на усогласеноста на примените емпириска дистрибуцијазаконот за нормална дистрибуција, по аналогија со слични пресметки, табели и заклучоци од примерот 2.12, дадени во делот 2 од овие упатства на страниците 7 -10.

Табела 4.1

Соодветност на брзината и координацијата на дејствијата на субјектите со нормалниот закон за дистрибуција

бр. заоблени
Вкупно

II – фаза на истражување

„Проценка на просечните показатели на општата популација на удари на целта на спортската игра Пикадо на сите студенти од студиската група врз основа на резултатите од мерењата на членовите на еден тим“

Проценете ги просечните показатели за брзина и координација на акциите на сите ученици во студиската група (според списокот на студиската група во класниот магазин) врз основа на резултатите од погодувањето на целта на спортската игра Пикадо на сите членови на тимот, добиени во првата фаза од истражувањето на оваа лабораториска работа.

1. Документирајте ги резултатите од мерењата на брзината и координацијата на акциите кога фрлате пикадо на кружна цел во спортската игра Пикадо на сите членови на вашиот тим (2 - 4 лица), кои претставуваат примерок од мерните резултати од општата популација (резултати од мерење на сите ученици во студиската група - на пример, 15 лица), внесувајќи ги во втората и третата колона Табела 4.2.

Табела 4.2

Обработка на индикатори за брзина и координација на акции

членови на бригадата

бр.
Вкупно

Во табелата 4.2 под треба да се разбере , усогласен просечен резултат (видете ги резултатите од пресметката во Табела 4.1) членови на вашиот тим ( , добиени во првата фаза од истражувањето. Треба да се напомене дека, обично, Табелата 4.2 ја содржи пресметаната просечна вредност на резултатите од мерењето добиени од еден член од тимот во првата фаза од истражувањето , бидејќи веројатноста дека мерењето резултира разни членовибригадите ќе се поклопат многу мали. Потоа, по правило вредностите во колона Табела 4.2 за секој ред - еднаква на 1, А во редот „Вкупно " колони " ", е напишано бројот на членовите на вашиот тим.

2. Извршете ги сите потребни пресметки за пополнување на табелата 4.2, како и други пресметки и заклучоци слични на пресметките и заклучоците од примерот 2.13 дадени во вториот дел од оваа методолошки развојна страници 13-14. Треба да се има на ум при пресметување на репрезентативната грешка "м" неопходно е да се користи формулата 2.4 дадена на страница 13 од овој методолошки развој, бидејќи примерокот е мал (n, а бројот на елементи од општата популација N е познат и е еднаков на бројот на студенти во студиската група, според списокот на списанието на студиската група.

III – фаза на истражување

Евалуација на ефективноста на загревањето според индикаторот „Брзина и координација на дејствијата“ од секој член на тимот користејќи го Студентскиот т-тест

Да се ​​оцени ефикасноста на загревањето за фрлање пикадо на целта на спортската игра „Пикадо“, изведена во првата фаза од истражувањето на оваа лабораториска работа, од секој член на тимот според индикаторот „Брзина и координација на дејства“, користејќи го студентскиот критериум - параметарски критериум за статистичката веродостојност на законот за емпириска распределба на законот за нормална распределба.

… Вкупно

2. варијанси и RMS , резултати од мерењата на индикаторот „Брзина и координација на дејствата“ врз основа на резултатите од загревањето, дадени во табела 4.3, (види слични пресметки дадени веднаш по табелата 2.30 од примерот 2.14 на страница 16 од овој методолошки развој).

3. Секој член на работниот тим измерете ја (тестирајте) вашата (лична) брзина и координација на дејствата по загревањето,

… Вкупно

5. Изведете просечни пресметки варијанси и RMS ,резултати од мерењата на индикаторот „Брзина и координација на дејствата“ по загревањето, дадени во табела 4.4, запишете го целокупниот резултат од мерењето врз основа на резултатите од загревањето (види слични пресметки дадени веднаш по табелата 2.31 од примерот 2.14 на страница 17 од овој методолошки развој).

6. Извршете ги сите потребни пресметки и заклучоци слични на пресметките и заклучоците од примерот 2.14 дадени во вториот дел од овој методолошки развој на страници 16-17. Треба да се има на ум при пресметување на репрезентативната грешка "м" неопходно е да се користи формулата 2.1 дадена на страница 12 од овој методолошки развој, бидејќи примерокот е n, а бројот на елементи во популацијата N ( е непознат.

IV – фаза на истражување

Проценка на униформноста (стабилноста) на индикаторите „Брзина и координација на акциите“ на двајца членови на тимот користејќи го критериумот Фишер

Проценете ја униформноста (стабилноста) на индикаторите „Брзина и координација на дејствијата“ на двајца членови на тимот користејќи го критериумот Фишер, врз основа на резултатите од мерењето добиени во третата фаза од истражувањето во оваа лабораториска работа.

За да го направите ова, треба да го направите следново.

Користејќи ги податоците од табелите 4.3 и 4.4, резултатите од пресметувањето на варијансите од овие табели добиени во третата фаза на истражување, како и методот на пресметување и примена на критериумот Фишер за проценка на униформноста (стабилност) спортски настапдаден во примерот 2.15 на страниците 18-19 од овој методолошки развој, извлечете соодветни статистички и педагошки заклучоци.

V – фаза на истражување

Проценка на групи индикатори „Брзина и координација на акции“ на еден член на тимот пред и по загревањето

Во табелите со резултати од статистичките пресметки на предмети, дипломски и магистерски трудови по психологија секогаш е присутен индикаторот „p“.

На пример, според истражувачки целиБеа пресметани разликите во нивото на значајност во животот кај тинејџерите момчиња и девојчиња.

Средна вредност

Мен-Витни U тест

Ниво на статистичка значајност (стр)

Момци (20 луѓе)

Девојки

(5 лица)

Цели

28,9

35,2

17,5

0,027*

Процес

30,1

32,0

38,5

0,435

Резултат

25,2

29,0

29,5

0,164

Локус на контрола - „Јас“

20,3

23,6

0,067

Место на контрола - „Живот“

30,4

33,8

27,5

0,126

Смислен живот

98,9

111,2

0,103

* - разликите се статистички значајни (стр0,05)

Десната колона ја покажува вредноста на „p“ и по нејзината вредност може да се утврди дали разликите во смислата на животот во иднина меѓу момчињата и девојчињата се значајни или не. Правилото е едноставно:

  • Доколку нивото на статистичка значајност „p“ е помало или еднакво на 0,05, тогаш заклучуваме дека разликите се значајни. Во табелата подолу, разликите помеѓу момчињата и девојчињата се значајни во однос на индикаторот „Цели“ - значајност на животот во иднина. Кај девојчињата, овој индикатор е статистички значително повисок отколку кај момчињата.
  • Доколку нивото на статистичка значајност „p“ е поголемо од 0,05, тогаш се заклучува дека разликите не се значајни. Во табелата подолу, разликите меѓу момчињата и девојчињата не се значајни за сите други показатели, со исклучок на првиот.

Од каде потекнува нивото на статистичка значајност „p“?

Се пресметува нивото на статистичка значајност статистичка програмазаедно со пресметката статистички критериум. Во овие програми, можете исто така да поставите критична граница за нивото на статистичка значајност и соодветните индикатори ќе бидат истакнати од програмата.

На пример, во програмата STATISTICA, при пресметување на корелации, можете да ја поставите границата „p“, на пример, 0,05 и сите статистички значајни врски ќе бидат означени со црвено.

Ако статистичкиот критериум се пресметува рачно, тогаш нивото на значајност „p“ се одредува со споредување на вредноста на добиениот критериум со критичната вредност.

Што покажува нивото на статистичка значајност „p“?

Сите статистички пресметки се приближни. Нивото на ова приближување го одредува „p“. Нивото на значајност е напишано како децимали, на пример 0,023 или 0,965. Ако го помножиме овој број со 100, го добиваме индикаторот p како процент: 2,3% и 96,5%. Овие проценти ја одразуваат веројатноста нашите претпоставки за врската помеѓу, на пример, агресијата и анксиозноста да бидат погрешни.

Тоа е, коефициент на корелација 0,58 помеѓу агресијата и анксиозноста е добиена на ниво на статистичка значајност од 0,05 или веројатност за грешка од 5%. Што точно значи ова?

Корелацијата што ја идентификувавме значи дека во нашиот примерок се забележува следнава шема: колку е поголема агресивноста, толку е поголема анксиозноста. Односно, ако земеме двајца тинејџери, а едниот има поголема анксиозност од другиот, тогаш, знаејќи за позитивната корелација, можеме да кажеме дека и овој тинејџер ќе има поголема агресивност. Но, бидејќи сè во статистиката е приближно, тогаш со наведување на ова, признаваме дека можеби грешиме, а веројатноста за грешка е 5%. Односно, откако направивме 20 такви споредби во оваа група адолесценти, можеме да направиме една грешка во предвидувањето на нивото на агресивност, познавањето на анксиозноста.

Кое ниво на статистичка значајност е подобро: 0,01 или 0,05

Нивото на статистичка значајност ја одразува веројатноста за грешка. Според тоа, резултатот при p=0,01 е попрецизен отколку при p=0,05.

ВО психолошко истражувањеприфати две дозволените нивоастатистичка значајност на резултатите:

p=0,01 - висока сигурност на резултатот компаративна анализаили анализа на односите;

p=0,05 - доволна точност.

Се надевам дека оваа статија ќе ви помогне сами да напишете психолошки труд. Ако ви треба помош, ве молиме контактирајте не (сите видови на работа во психологијата; статистички пресметки).

Пред да собираат и проучуваат податоци, експерименталните психолози обично одлучуваат како податоците ќе се анализираат статистички. Честопати истражувачот поставува ниво на значајност дефинирано како статистичка вредност, повисоко ( или пониско) кој содржи вредности кои ни овозможуваат да го разгледаме влијанието на факторите неслучајно. Истражувачите обично го претставуваат ова ниво во форма на веројатност.

Во многу психолошки експериментиможе да се изрази како " ниво 0,05"или" ниво 0,01" Ова значи дека случајните резултати ќе се појават само со фреквенција 0,05 (1 од пати)или 0,01 (1 од 100 пати). резултати Статистичка анализаподатоци што исполнуваат однапред утврден критериум ( било да е тоа 0,05, 0,01 или дури 0,001), подолу се наведени како статистички значајни.

Треба да се напомене дека резултатот можеби не е статистички значаен, но сепак е од одреден интерес. Често, особено во прелиминарни студии или експерименти кои вклучуваат мал број субјекти или со ограничен број на набљудувања, резултатите може да не го достигнат нивото на статистичка значајност, но сугерираат дека понатамошни истражувањасо попрецизна контрола и повеќенабљудувања тие ќе добијат поголема сигурност. Во исто време, експериментаторот мора да биде многу внимателен во својата желба намерно да ги промени експерименталните услови за да постигне посакуваниот резултатпо секоја цена.

Во друг пример на план 2x2 Џи користел два вида предмети и два вида задачи за проучување на влијанието на специјализираното знаење врз меморирањето на информациите.

Во своето истражување Џи студирал меморирање броеви и шаховски фигури ( променлива А) деца на столчиња RECARO Young Sportи возрасни ( променлива Б), односно според планот 2х2. Децата имаа 10 години и беа добри во шах, додека возрасните беа нови во играта. Во првата задача, требаше да ја запомните локацијата на фигурите на таблата, како што може да биде за време на нормална игра, и да ја вратите откако ќе се отстранат фигурите. Друг дел од оваа задача бараше меморирање на стандардна серија броеви, како што обично се прави при одредување на коефициентот на интелигенција.

Излегува, специјализирано знаење, како што е учењето да се игра шах, го олеснуваат запомнувањето на информациите поврзани со оваа област, но имаат мал ефект врз запомнувањето на броевите. Возрасни кои не се премногу искусни во мудроста најстарата игра, запомни помалку фигури, но се поуспешни во меморирањето броеви.

Во текстот на извештајот Џи обезбедува статистичка анализа која математички ги потврдува презентираните резултати.

Дизајнот 2x2 е наједноставниот од сите факторилни дизајни. Зголемувањето на бројот на фактори или нивоа на поединечни фактори во голема мера ја зголемува сложеноста на овие планови.

ПЛАТЕНА ФУНКЦИЈА.Функцијата за статистичка значајност е достапна само на одредени планови. Проверете дали е во.

Можете да дознаете дали има статистички значајни разлики во одговорите добиени од различни групииспитаниците на прашањата од анкетата. За да ја користите карактеристиката за статистичка значајност во SurveyMonkey, мора:

  • Овозможете ја карактеристиката за статистичка значајност кога додавате правило за споредба на прашање во вашето истражување. Изберете групи на испитаници за споредување за да ги сортирате резултатите од истражувањето во групи за визуелна споредба.
  • Испитајте ги табелите со податоци за вашите прашања од анкетата за да го идентификувате присуството на статистички податоци значајни разликиво одговорите добиени од различни групииспитаниците.

Прикажи статистичка значајност

Следејќи ги чекорите подолу, можете да креирате анкета што ќе се прикажува статистичка значајност.

1. Додајте прашања од затворен тип во вашата анкета

Со цел да се прикаже статистичка значајност при анализата на резултатите, ќе треба да примените правило за споредба на кое било прашање во вашето истражување.

Можете да го примените правилото за споредба и да пресметате статистичка значајност во одговорите ако користите едно од следниве во дизајнот на вашето истражување: следните типовипрашања:

Неопходно е да се осигураме дека предложените опции за одговори можат да се поделат во целосни групи. Опциите за одговор што ќе ги изберете за споредба кога ќе креирате правило за споредба ќе се користат за организирање на податоците во вкрстени јазичиња во текот на истражувањето.

2. Соберете одговори

Откако ќе ја завршите вашата анкета, создадете колекционер кој ќе го дистрибуира. Постојат неколку начини.

Мора да добиете најмалку 30 одговори за секоја опција за одговор што планирате да ја користите во вашето правило за споредба за да ја активирате и видите статистичката значајност.

Пример за анкета

Сакате да откриете дали мажите се значително позадоволни од вашите производи отколку жените.

  1. Додајте две прашања со повеќекратен избор во вашата анкета:
    Кој е вашиот пол? (машко женско)
    Дали сте задоволни или незадоволни од нашиот производ? (задоволен, незадоволен)
  2. Погрижете се најмалку 30 испитаници да изберат „машки“ за родовото прашање И најмалку 30 испитаници да изберат „женски“ како свој пол.
  3. Додадете правило за споредба на прашањето „Кој е вашиот пол?“ и изберете ги двете опции за одговор како ваши групи.
  4. Користете ја табелата со податоци под табелата со прашања „Дали сте задоволни или незадоволни од нашиот производ? за да се види дали некои опции за одговор покажуваат статистички значајна разлика

Што е статистички значајна разлика?

Статистички значајна разлика значи дека статистичката анализа утврдила дека постојат значителни разлики помеѓу одговорите на една група испитаници и одговорите на друга група. Статистичката значајност значи дека добиените бројки се значително различни. Ваквото знаење многу ќе ви помогне во анализата на податоците. Сепак, вие ја одредувате важноста на добиените резултати. Вие сте тие кои одлучувате како да ги толкувате резултатите од истражувањето и какви активности треба да се преземат врз основа на нив.

На пример, добивате повеќе поплаки од женски клиенти отколку од машки клиенти. Како можеме да утврдиме дали таквата разлика е реална и дали треба да се преземе акција во врска со неа? Еден од одлични начиниДа ги проверите вашите набљудувања значи да спроведете анкета што ќе ви покаже дали машките купувачи се навистина многу позадоволни од вашиот производ. Со користење на статистичка формулаФункцијата за статистичка значајност што ја нудиме ќе ви даде можност да одредите дали вашиот производ навистина им се допаѓа значително повеќе на мажите отколку на жените. Ова ќе ви овозможи да преземете акција заснована на факти наместо на претпоставки.

Статистички значајна разлика

Ако вашите резултати се истакнати во табелата со податоци, тоа значи дека двете групи на испитаници се значително различни една од друга. Терминот „значајни“ не значи дека добиените бројки имаат некоја посебна важност или значајност, само дека меѓу нив постои статистичка разлика.

Нема статистички значајна разлика

Ако вашите резултати не се означени во соодветната табела со податоци, тоа значи дека, и покрај можна разликаво двете бројки што се споредуваат, нема статистичка разлика меѓу нив.

Одговорите без статистички значајни разлики покажуваат дека нема значајна разлика помеѓу двете ставки што се споредуваат со оглед на големината на примерокот што ја користите, но тоа не мора да значи дека тие не се значајни. Можеби со зголемување на големината на примерокот, ќе можете да идентификувате статистички значајна разлика.

Големина на примерокот

Ако имате многу мала големина на примерокот, само многу големи разлики меѓу двете групи ќе бидат значајни. Ако имате многу голема големина на примерокот, и малите и големите разлики ќе се сметаат за значајни.

Меѓутоа, само затоа што два броја се статистички различни не значи дека разликата помеѓу резултатите прави некаква разлика за вас. практично значење. Ќе треба сами да одлучите кои разлики се значајни за вашата анкета.

Пресметување на статистичка значајност

Ние ја пресметуваме статистичката значајност користејќи стандардно ниво на доверба од 95%. Ако опцијата за одговор е прикажана како статистички значајна, тоа значи дека само случајно или поради грешка при земање примероци постои помала од 5% веројатност разликата помеѓу двете групи да се појави (често се прикажува како: стр.<0,05).

За да ги пресметаме статистички значајните разлики помеѓу групите, ги користиме следните формули:

Параметар

Опис

а1Процентот на учесници од првата група кои одговориле на прашањето на одреден начин, помножен со големината на примерокот од оваа група.
б1Процентот на учесници од втората група кои одговориле на прашањето на одреден начин, помножен со големината на примерокот од оваа група.
Пропорција на здружен примерок (p)Комбинацијата на две акции од двете групи.
Стандардна грешка (SE)Показател за тоа колку вашиот удел се разликува од вистинскиот удел. Пониска вредност значи дека дропот е блиску до вистинската дропка, повисоката вредност значи дека фракцијата е значително различна од вистинската дропка.
Тест статистика (t)Тест статистика. Бројот на стандардни отстапувања со кои дадената вредност се разликува од средната вредност.
Статистичка значајностАко апсолутната вредност на статистиката за тестирање е поголема од 1,96* стандардни отстапувања од средната вредност, тоа се смета за статистички значајна разлика.

*1,96 е вредноста што се користи за нивото на доверба од 95%, бидејќи 95% од опсегот со кој се справува функцијата за т-дистрибуција на Student се наоѓа во рамките на 1,96 стандардни отстапувања од средната вредност.

Пример за пресметка

Продолжувајќи со примерот користен погоре, ајде да откриеме дали процентот на мажи кои велат дека се задоволни со вашиот производ е значително поголем од процентот на жени.

Да речеме дека 1.000 мажи и 1.000 жени учествувале во вашето истражување, а резултатот од истражувањето бил дека 70% од мажите и 65% од жените велат дека се задоволни од вашиот производ. Дали нивото од 70% е значително повисоко од нивото од 65%?

Заменете ги следните податоци од истражувањето во дадените формули:

  • p1 (% од мажите задоволни од производот) = 0,7
  • p2 (% од жените задоволни од производот) = 0,65
  • n1 (број на анкетирани мажи) = 1000
  • n2 (број на интервјуирани жени) = 1000

Бидејќи апсолутната вредност на статистиката на тестот е поголема од 1,96, тоа значи дека разликата помеѓу мажите и жените е значајна. Во споредба со жените, мажите имаат поголема веројатност да бидат задоволни од вашиот производ.

Сокривање на статистичка значајност

Како да се скрие статистичкото значење за сите прашања

  1. Кликнете на стрелката надолу десно од правилото за споредба во левата странична лента.
  2. Изберете ставка Уреди правило.
  3. Оневозможете ја функцијата Прикажи статистичка значајносткористејќи прекинувач.
  4. Кликнете на копчето Пријавете се.

За да ја скриете статистичката значајност за едно прашање, треба:

  1. Кликнете на копчето Мелодијанад дијаграмот на овој број.
  2. Отворете го јазичето Опции за прикажување.
  3. Отштиклирајте го полето до Статистичка значајност.
  4. Кликнете на копчето Зачувај.

Опцијата за прикажување автоматски се вклучува кога е овозможен приказот на статистичка значајност. Ако ја избришете оваа опција за прикажување, ќе се оневозможи и приказот на статистичка значајност.

Вклучете ја карактеристиката за статистичка значајност кога додавате правило за споредба на прашање во вашето истражување. Испитајте ги табелите со податоци за вашите прашања од анкетата за да одредите дали има статистички значајни разлики во одговорите добиени од различни групи на испитаници.

Ниво на значајност - ова е веројатноста дека разликите ги сметавме за значајни, но тие се всушност случајни.

Кога ќе укажеме дека разликите се значајни на ниво на значајност од 5%, или кога Р< 0,05 , тогаш мислиме дека веројатноста тие да се неверодостојни е 0,05.

Кога ќе укажеме дека разликите се значајни на ниво на значајност од 1%, или кога Р< 0,01 , тогаш мислиме дека веројатноста тие да се неверодостојни е 0,01.

Ако сето ова го преведеме на поформализиран јазик, тогаш нивото на значајност е веројатноста да се отфрли нултата хипотеза, додека таа е вистинита.

Грешка,која се состои одонојшто ниеодбиенонулта хипотезадодека е точно, се нарекува грешка од типот 1.(Види Табела 1)

Табела 1. Нулта и алтернативни хипотези и можни услови за тестирање.

Веројатноста за таква грешка обично се означува како α. Во суштина, би требало да означиме во загради не стр < 0,05 или стр < 0,01 и α < 0,05 или α < 0,01.

Ако веројатноста за грешка е α , тогаш веројатноста за правилно решение: 1-α. Колку е помал α, толку е поголема веројатноста за правилна одлука.

Историски гледано, во психологијата е општо прифатено дека најниското ниво на статистичка значајност е нивото од 5% (p≤0,05): доволно е нивото од 1% (p≤0,01), а највисокото е нивото од 0,1% (p≤0,001) , затоа, табелите на критичните вредности обично ги содржат вредностите на критериумите што одговараат на нивоата на статистичка значајност p≤0,05 и p≤0,01, понекогаш - p≤0,001. За некои критериуми, табелите го покажуваат точното ниво на значајност на нивните различни емпириски вредности. На пример, за φ*=1,56 p=O.06.

Сепак, додека нивото на статистичка значајност не достигне p=0,05, сè уште немаме право да ја отфрлиме нултата хипотеза. Ќе се придржуваме до следното правило за отфрлање на хипотезата за немање разлики (Ho) и прифаќање на хипотезата за статистичка значајност на разликите (H 1).

Правило за отфрлање на Хо и прифаќање на h1

Ако емпириската вредност на тестот е еднаква или поголема од критичната вредност што одговара на p≤0,05, тогаш H 0 се отфрла, но сè уште не можеме дефинитивно да го прифатиме H 1 .

Ако емпириската вредност на критериумот е еднаква на критичната вредност што одговара на p≤0,01 или ја надминува, тогаш H 0 се отфрла и H 1 се прифаќа.

Исклучоци : G знак тест, Wilcoxon T тест и Mann-Whitney U тест. За нив се воспоставени инверзни односи.

Ориз. 4. Пример за „оска на значајност“ за Розенбаумовиот Q критериум.

Критичните вредности на критериумот се означени како Q o, o5 и Q 0,01, емпириската вредност на критериумот како Q em. Затворен е во елипса.

Десно од критичната вредност Q 0,01 се протега „зоната на значење“ - ова вклучува емпириски вредности кои надминуваат Q 0,01 и, според тоа, секако значајни.

Лево од критичната вредност Q 0,05, се протега „зоната на безначајност“ - ова вклучува емпириски Q вредности кои се под Q 0,05 и, според тоа, се секако незначителни.

Го гледаме тоа П 0,05 =6; П 0,01 =9; П ем. =8;

Емпириската вредност на критериумот паѓа во регионот помеѓу Q 0,05 и Q 0,01. Ова е зона на „неизвесност“: веќе можеме да ја отфрлиме хипотезата за неверодостојноста на разликите (H 0), но сè уште не можеме да ја прифатиме хипотезата за нивната веродостојност (H 1).

Меѓутоа, во пракса, истражувачот може да ги смета за веродостојни оние разлики кои не спаѓаат во зоната на безначајност, изјавувајќи дека се сигурни на стр. < 0,05, или со укажување на точното ниво на значајност на добиената емпириска критериумска вредност, на пример: p=0,02. Користејќи стандардни табели, кои се во сите учебници по математички методи, тоа може да се направи во однос на критериумите Крускал-Валис H, χ 2 р Фридман, Л на Пејџ, φ* на Фишер .

Нивото на статистичка значајност, или критичните тест вредности, различно се одредуваат при тестирање на насочени и ненасочни статистички хипотези.

Со насочена статистичка хипотеза се користи тест со една опашка, со ненасочна хипотеза се користи тест со две опашки. Тестот со две опашки е построг бидејќи ги тестира разликите во двете насоки, а со тоа и емпириската вредност на тестот што претходно одговараше на нивото на значајност p < 0,05, сега одговара само на нивото p < 0,10.

Нема да мора секој пат сами да одлучуваме дали користи едностран или двостран критериум. Табелите на критичните вредности на критериумите се избрани на таков начин што хипотезите за насочување одговараат на едностран критериум, а ненасочните хипотези одговараат на двостран критериум, а дадените вредности ги задоволуваат барањата што се однесуваат на секој од нив. Истражувачот треба само да се погрижи неговите хипотези да се совпаѓаат по значење и форма со хипотезите предложени во описот на секој од критериумите.