Параметриски и непараметриски методи за тестирање на статистички хипотези.

Сите параметарски методи на статистика работат со интервална скала, за разлика од непараметриските методи, кои се фокусираат првенствено на првите две скали. Дозволете ни да ги објасниме разликите помеѓу овие методи.

Кога се разгледуваат повеќето статистички методи, се претпоставува дека предметните набљудувања се изразени на интервална скала и се реализација на случајна променлива чија дистрибуција припаѓа на некоја параметарска фамилија на распределби. На пример, случајна променлива има нормална или Поасон или друга дистрибуција. Односно, претпоставуваме дека формата на распределбата е позната, на пример, можеме да претпоставиме нормална Н (μ, δ ) модел, но со непознати параметри μ И δ . Методите на проценка и тестирање на хипотези ни овозможуваат да извлечеме заклучоци за непознати параметри, а вредноста на сите заклучоци мора до одреден степен да зависи од соодветноста на почетната претпоставка за параметарското семејство, односно за обликот на распределбата. Сепак, постојат случајни променливи кои не следат една од вообичаените форми на дистрибуција. Следствено, на нив не може да се применат математичките методи развиени за параметарски распределби. Затоа, за такви карактеристики се развиени посебни математички модели, кои се нарекуваат непараметриски или без дистрибуција.

Така, може да се разликуваат две групи на статистички методи: параметарски и непараметриски.

Предноста на параметарските методи е што за нив постои добро развиен математички апарат. Меѓутоа, употребата на овие методи, меѓу другото, бара голема големина на примерокот. За квантитативни карактеристики се користат параметриски методи.

За да се анализираат номиналните и рангираните променливи, се користат само непараметриски методи кои не бараат прелиминарни претпоставки во однос на типот на оригиналната дистрибуција. Ова е нивното достоинство. Но, има и недостаток - намалување на т.н. моќност (чувствителност на разлики во предметите). Да го објасниме ова.

Да потсетиме дека пред да почне да ги анализира резултатите од експериментот, истражувачот поставува две меѓусебно исклучувачки хипотези. Една од нив е статистичка хипотеза која истражувачот обично очекува да ја отфрли (т.н. нулта хипотеза H 0: на пример, проучуваните сорти не се разликуваат по принос). Алтернативна хипотеза ( H 1) всушност ја отфрла нултата хипотеза. Алтернативната хипотеза обично содржи претпоставки направени од истражувачот (има разлики).

Постојат два вида статистички грешки во анализата. Грешка од првиот тип (грешка α – тип): нултата хипотеза, која е всушност вистинита, се отфрла. Грешка од вториот тип (грешка β – тип): ја прифаќаме нултата хипотеза, која всушност е неточна.

Моќта или чувствителноста на статистичкиот критериум (метод) е веројатноста дека ќе се донесе правилна одлука како резултат на неговата примена ( H 1) под навистина лажна нулта хипотеза. Моќта на тестот зависи од големината на примерокот, нивото на значајност, насоката на нултата и алтернативната хипотеза, веродостојноста на експерименталните податоци, инструментите и самиот статистички метод. Под еднакви услови, параметарските методи се помоќни од непараметриските. Но, моќта на непараметриските методи се зголемува со зголемување на големината на примерокот.

Секој тип на скала има своја статистичка техника. За номиналните скали, често се користи тестот χ 2 (хи-квадрат). За редни скали – ранг статистика. За интервални скали - целиот арсенал на статистички критериуми.

Алгоритми и примери за пресметување на непараметриски критериуми.

Кога започнува статистичка обработка на неговото истражување, психологот мора да одлучи кои методи му се посоодветни врз основа на карактеристиките на неговиот материјал - параметарски или непараметриски. Разликата меѓу нив е лесно да се разбере.

Веќе разговаравме за мерење на брзината на моторот на шестоодделенците.

Како да се обработат овие податоци?

Неопходно е да се запишат сите направени мерења - во овој случај, ова ќе биде бројот на точки поставени од секој субјект - потоа пресметајте ја аритметичката средина за секој предмет врз основа на неговите резултати. После тоа, подредете ги сите податоци во нивната низа, на пример, почнувајќи од најмалите до најголемите. За да се олесни видливоста на овие податоци, тие обично се комбинираат во групи; во овој случај, можете да комбинирате 5-9 мерења во група. Во принцип, со таква комбинација, пожелно е ако вкупниот број на случаи не надминува сто, вкупниот број на групи треба да биде околу дванаесет.

Следно, треба да утврдите колку пати во експериментите се сретнале нумеричките вредности што одговараат на секоја група. Откако ќе го направите ова, за секоја група запишете ја нејзината големина. Податоците добиени во таква табела се нарекуваат распределба на броеви или фреквенции. Се препорачува оваа дистрибуција да се прикаже во форма на дијаграм кој прикажува дистрибутивен полигон или хистограм на дистрибуција. Контурите на овој многуаголник ќе помогнат да се реши проблемот со методите на статистичка обработка.

Често овие контури личат на контурите на ѕвончето, со највисока точка во центарот на многуаголникот и со симетрични гранки кои се протегаат во која било насока. Оваа контура одговара на кривата на нормалната дистрибуција. Овој концепт беше воведен во математичката статистика од K. F. Gauss (1777-1855), затоа кривата се нарекува и Гаусова крива. Тој исто така даде математички опис на оваа крива. Зацртувањето на Гаусова крива (или крива на ѕвонче) теоретски бара бесконечен број случаи. Во пракса, треба да се биде задоволен со фактичкиот материјал што е акумулиран во студијата. Доколку податоците со кои располага истражувачот, по внимателно испитување или по нивно пренесување на дијаграм, се разликуваат само малку од кривата на нормалната дистрибуција, тогаш тоа му дава право на истражувачот да користи параметарски методи во статистичката обработка, чии појдовни точки се засноваат на нормална Гаусова крива на дистрибуција.

Нормалната распределба се нарекува параметарска затоа што за да се конструира и анализира Гаусовата крива доволно е да има само два параметри: просечната вредност, која мора да одговара на висината на нормалната обновена во центарот на кривата и т.н. квадрат или стандардно отстапување на вредноста што ја карактеризира дисперзијата на вредностите околу средната вредност; Методите за пресметување на двете количини ќе бидат разгледани подолу.

Параметриските методи имаат многу предности за истражувачот, но не смееме да заборавиме дека нивната употреба е оправдана само кога обработените податоци покажуваат дистрибуција која само незначително се разликува од Гаусовата.

Ако е невозможно да се применат параметарски, треба да се јавите непараметриски методи. Овие методи се успешно развиени во последните 3-4 децении, а нивниот развој беше предизвикан пред се од потребите на голем број науки, особено психологијата. Тие ја покажаа својата висока ефикасност. Сепак, тие не бараат сложена компјутерска работа.

Современиот психолошки истражувач мора да продолжи од фактот дека „... има голема количина на податоци кои или воопшто не можат да се анализираат со помош на кривата на ѕвончето, или не ги задоволуваат основните предуслови неопходни за нејзина употреба“.

ПопулацијаИ пример. Психологот постојано мора да се занимава со овие два концепта.

Во современите истражувања на педагошките проблеми, широко се користат методите на математичка обработка на податоци. Методите за обработка на квантитативните податоци вклучуваат статистички техники за сумирање на резултатите од студијата, идентификување на одредени врски меѓу нив и тестирање на веродостојноста на поставената хипотеза.

Математичката обработка на резултатите од истражувањето обезбедува нивна доказ и репрезентативност. Во комбинација со квалитативните показатели, квантитативната обработка на податоците значително ја зголемува објективноста на студијата. Статистичката обработка на резултатите, запишувањето на проучувањето на поединечните појави, овозможува да се направат генерализации и заклучоци во врска со целиот сет на феномени што се проучуваат. Важна карактеристика на употребата на статистичките методи во педагошкото истражување е тоа што овозможува користење на квантитативно проучување дури и кога е невозможно да се одредат самите својства на предметите што се проучуваат. На пример, невозможно е директно да се измери нивото на развој на моралните квалитети на учениците, степенот на ефективност на одреден наставен метод итн. Но, со евидентирање на релевантни настани, акции, манифестации, можно е да се добијат одредени квалитативни карактеристики на сите овие карактеристики, ги одредуваат можните обрасци на нивното манифестирање и ја потврдуваат исправноста на искажаните хипотези.

Во статистиката, тестирањето на хипотезите се врши со користење на критериуми за статичко оценување на разликите. Статистички критериум е одлучувачко правило кое обезбедува сигурно однесување, т.е. прифаќање на вистинска хипотеза и отфрлање на лажна со голема веројатност (G.V. Sukhodolsky). Статистичките критериуми го означуваат и методот за пресметување на одреден број и самиот број.

Статистичките критериуми што се користат во педагогијата се поделени на параметарски и непараметриски. Параметриските критериуми вклучуваат критериуми кои вклучуваат параметри на дистрибуција во формулата за пресметка, т.е. средна вредност и варијанса (студент, Фишер, хи-квадрат тестови). Непараметриските критериуми ги вклучуваат оние кои се засноваат на работа со фреквенции или рангови и не вклучуваат параметри на дистрибуција во формулата за пресметување на параметрите на дистрибуција (тестови за знаци, Колмогоров-Смирнов, Вилкоксон, Ман-Витни). Двете групи критериуми имаат свои предности и недостатоци. Компаративен опис на можностите и ограничувањата на параметарските и непараметриските критериуми е даден во следната табела.



Параметриски критериуми Непараметриски тестови
Овозможува директна проценка на разликите во средствата добиени во два примерока (студентски t тест) Ви овозможува да оцените само просечни трендови (на пример, да одговорите на прашањето дали повисоките вредности на карактеристиката се почести во примерокот А, а пониските вредности на карактеристиката се наоѓаат во примерокот Б (критериуми Q, U, итн. .)
Овозможува директна проценка на разликите во варијансите (Фишер тест) Овозможува да се проценат само разликите во опсегот на варијабилност на особина
Овозможува да се идентификуваат трендовите во промените во особина кога се движите од состојба во состојба (униваријатна анализа на варијансата), но само под услов на нормална дистрибуција на особината Ви овозможува да ги идентификувате трендовите во промените на некоја карактеристика кога се движите од состојба во состојба за каква било дистрибуција на карактеристиката (критериуми за трендовите L и S)
Ви овозможува да ја оцените интеракцијата на два или повеќе фактори во нивното влијание врз промените во некоја карактеристика (двофакторна анализа на варијанса) Оваа опција не е достапна
Експерименталните податоци мора да исполнуваат два, а понекогаш и три услови: а) вредностите на карактеристиката се мерат на интервална скала; б) распределбата на карактеристиката е нормална; в) при анализата на варијансата мора да се исполни барањето за еднаквост на варијансите во клетките на комплексот Експерименталните податоци може да не исполнуваат ниту еден од условите: а) вредностите на атрибутите можат да се претстават на која било скала, почнувајќи од скалата на имиња; б) распределбата на карактеристиката може да биде која било и нејзиното совпаѓање со кој било теоретски закон за распределба не е неопходно и не треба да се потврди; в) не постои барање за еднаквост на варијанси
Доколку се исполнети наведените услови, параметарските критериуми се помоќни во споредба со непараметриските критериуми Доколку не се исполнети наведените услови, непараметриските критериуми се посигурни, бидејќи тие се помалку чувствителни на „затнувањето“
Математиката е доста комплицирана Математичките пресметки се главно едноставни и одземаат малку време

Параметриски методи

Студентски т тест

За да се споредат просечните вредности на примерокот што припаѓаат на две групи податоци и да се одлучи дали просечните вредности статистички значајно се разликуваат една од друга во психолошките и педагошките експерименти, тие често користат т-Студентски критериум чија пресметана вредност се одредува со формулата:

,

каде е просечната вредност на примерокот на променливата за еден примерок на податоци; - просечна вредност на примерокот врз основа на друг примерок на податоци; m 1И m 2 -интегрирани индикатори за отстапувања на парцијални вредности од два примероци од нивните соодветни просечни вредности.

Ако тпресметката е поголема или еднаква на табелата, тогаш тие заклучуваат дека споредените просечни вредности од двата примерока се навистина статистички значително различни со веројатност за прифатлива грешка.

Оваа техника се користи кога е неопходно да се утврди дали експериментот успеал или не успеал, дали имал или немал влијание врз нивото на квалитетот што требало да го промени.

Ако тсе проценува помалку ттабеларно, тогаш во овој случај не постои убедлива причина дека експериментот бил успешен, дури и ако просечните вредности самите на почетокот и на крајот на експериментот се различни во нивните апсолутни вредности.

Критериумиφ* - Аголна Фишер трансформација

Овој метод е опишан во многу прирачници (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992, итн.) Овој опис се базира на верзијата на методот што беше развиен и претставен од E.V. Гублер.

Фишер-тестот е дизајниран да спореди два примероци според зачестеноста на појавата на ефектот од интерес за истражувачот. Критериумот ја оценува веродостојноста на разликите помеѓу процентите на два примерока во кои е забележан ефектот од интерес за истражувачот.

Суштината на аголната трансформација на Фишер е да се претворат процентите во вредности на централниот агол, кои се мерат во радијани. Поголем процент ќе одговара на поголем агол φ, а помал процент ќе одговара на помал агол, но односите овде не се линеарни:

φ = 2 лаксин(),

каде е процентот изразен во дропки од единица.

Како што се зголемува несовпаѓањето помеѓу аглите φ 1 и φ 2 и се зголемува бројот на примероци, вредноста на критериумот се зголемува. Колку е поголема вредноста на φ*, толку е поголема веројатноста дека разликите се значајни.

2.1. Основни концепти

Параметриските методи за обработка на експериментални податоци се засноваат на фундаменталниот факт според кој својствата на резултатите од експерименталните студии, кои се сметаат како случајни објекти, се опишани со некој закон за дистрибуција. Се претпоставува дека анализата на експерименталните податоци овозможува со доволен степен на точност да се одреди типот и специфичната форма на законот за дистрибуција или вредностите на неговите параметри, доколку нема потреба да се користи самиот закон. Ваквите информации овозможуваат целосно користење на методите на теоријата на веројатност за решавање на проблемите со обработката.

Бидејќи вистинскиот закон за дистрибуција и вредностите на неговите параметри се непознати, параметарските методи работат со нивните апроксимации - закони за статистичка дистрибуција и проценки на параметрите на дистрибуција.

Статистички закон за распределба на случајна променлива се нарекува закон за распределба на дадена количина, воспоставен со помош на статистички методи за обработка на податоци.

Законот за статистичка дистрибуција може да се дефинира како функција на статистичка дистрибуција, густина на статистичка дистрибуција или серија на статистичка дистрибуција П * (x i), .

Статистички проценки на параметрите на законот за распределба на случајна променлива се приближните вредности на овие параметри (статистички податоци), добиени со помош на статистички методи за обработка на податоци.

Во она што следи, статистичките проценки едноставно се нарекуваат проценки за краткост.

Ако некој закон за распределба се карактеризира со параметрите а 1 , а 2 ,…, м, тогаш нивните проценки ќе бидат означени во форма , ,…,. Најчести типови на параметри на законите за дистрибуција при обработка на експериментални податоци се математичкото очекување, дисперзијата или стандардното отстапување, а за систем на случајни променливи - моментот на корелација или коефициентот на корелација. Понекогаш се користат централни моменти од трет и четврти ред. Соодветно на тоа, при обработката на податоците се користат нивните статистички аналози - проценки на математичко очекување, момент на корелација итн.

Така, ако има збир на експериментални податоци x 1 , x 2 ,…, x n, тогаш и законот за статистичка дистрибуција, на пример функцијата, и проценките на неговите параметри претставуваат некои функции на овие податоци:

, . (2.1.2)

Вид на статистика y и f jго одредува квалитетот на проценките и . Во тој поглед, се јавуваат низа проблеми, од кои главен е проблемот на определување на условите под кои проценките (2.1.1) и (2.1.2) можат да ги претставуваат теоретските закони за распределба и нивните параметри со потребната веродостојност. Овие услови се формираат гранични теореми теорија на веројатност. Тие служат како основа на параметарски методи за обработка на експериментални податоци, врз основа на кои може да се добијат соодветни проценки на законите и параметрите на распределбата на набљудуваните карактеристики.

Вториот проблем е изборот доволно статистика, т.е. такви статистички податоци што овозможуваат, под специфични услови, да се добијат проценки за даден квалитет. Бидејќи врз основа на резултатите од набљудувањето x 1 , x 2 ,…, x nможе да се формира голем спектар на статистички податоци (2.1.1) и (2.1.2) овој проблем се сведува на избор од нив на статистиките кои се оптимални во одредена смисла; Проблемот е решен со помош на методите на статистичка теорија на одлуки.

Како што може да се види од Сл. 1.1, проблемот на одлучување при обработката на експерименталните податоци не е само проблемот на избор на доволно статистика. Повеќето задачи за обработка на податоци, во различен степен, може да се класифицираат како задачи за донесување одлуки. Во врска со ова, основа на методите на параметарска обработка се и принципите на статистичкото одлучување, врз основа на кои се формираат критериуми за донесување одлуки кои се оптимални во одредена смисла. Посебна улога меѓу овие принципи има принципот на максимална веројатност и методот на најмали квадрати, што произлегува од него за случајот со нормален закон за распределба.

Оваа брошура ги разгледува прашањата за параметарска обработка на експериментални податоци.

2.2. Гранични теореми на теоријата на веројатност

Употребата на параметарски методи за обработка на податоци вклучува идентификување на условите што ја одредуваат валидноста на априори претпоставките за формата на законот за распределба на случајната променлива што се проучува и својствата на нејзините параметри. Овие услови се формулирани во форма на гранични теореми во теоријата на веројатност. Подолу ја прикажуваме содржината и суштината на теоремите без доказ, како и неколку препораки за нивна практична примена.