Која е валидноста на методологијата? Проценката на валидноста на методологијата може да биде квантитативна и квалитативна.

Прашањето за валидноста се решава откако ќе се утврди веродостојноста, бидејќи несигурната техника не може да биде валидна.

Валидноста на тестот е концепт кој ни кажува што мери тестот и колку добро го прави тоа (А. Анастаси). Валидноста во неговото јадро е сложена карактеристика која вклучува, од една страна, информации за тоа дали техниката е погодна за мерење за што е создадена, а од друга страна, каква е нејзината ефикасност, ефикасност и практична корисност.

Поради оваа причина, не постои единствен универзален пристап за дефинирање на валидноста. Во зависност од тоа кој аспект на валидноста сака да го разгледа истражувачот, се користат различни методи на докази. Со други зборови, концептот на валидност ги вклучува неговите различни видови, кои имаат свое посебно значење. Проверката на валидноста на методологијата се нарекува валидација.

Валидноста е усогласеност на одредена студија со прифатените стандарди (беспрекорен експеримент).

Валидноста во нејзиното прво разбирање има врска со самата методологија, т.е. ова е валидноста на мерниот инструмент. Овој тип на тестирање се нарекува теоретска валидација. Валидноста во неговото второ разбирање се однесува не толку на методологијата колку на целта на нејзината употреба. Ова е прагматично потврдување.

За време на теоретската валидација, истражувачот е заинтересиран за самото својство мерено со техниката.

Бидејќи, за да се одреди теоретска валидација, тешко е да се најде некој независен критериум што лежи надвор од методологијата, и затоа неоснованите изјави за валидноста на оваа методологија претходно беа земени здраво за готово. Бидејќи теоретската валидација е насочена кон докажување дека техниката го мери токму особината што треба да ја измери. За теоретска валидација, главниот проблем е односот помеѓу психолошките појави и нивните индикатори, со помош на кои овие психолошки појави се обидуваат да бидат познати. Тоа покажува дека намерата на авторот и резултатите од методологијата се совпаѓаат.

Не е толку тешко да се спроведе теоретска валидација на нова техника ако веќе постои техника со позната, докажана валидност за мерење на дадено својство. Присуството на корелација помеѓу нова и слична стара техника покажува дека развиената техника го мери истиот психолошки квалитет како и референтната.

За да се провери теоретската валидност, важно е, од една страна, да се утврди степенот на поврзаност со поврзаната техника (конвергентна валидност), а од друга, отсуството на оваа врска со техники кои имаат различна теоретска основа (дискриминаторска валидност ).

Важна улога во разбирањето на мерките на методологијата се игра со споредување на нејзините индикатори со практичните форми на активност. Важно е методологијата да се разработи теоретски.

Прагматична валидација

Практичната ефективност, значењето и корисноста на методологијата се проверуваат, бидејќи методологијата може да се користи само кога ќе се докаже дека имотот што се мери се манифестира во одредени видови Активности.

За да се тестира прагматичната валидност, се користи независен надворешен критериум - индикатор за манифестацијата на проучуваната сопственост во секојдневниот живот. Таков критериум може да биде академските перформанси (за тестови за способности за учење, тестови за постигнување, тестови за интелигенција), производствени достигнувања (за методи на професионална ориентација), ефективност на реалните активности - цртање, моделирање и така натаму (за тестови за посебни способности ), субјективни проценки (за тестови на личноста).

Американските истражувачи Тифин и Мекормик идентификуваа 4 типа на надворешни критериуми:

  • 1) Критериум за успешност (количина на извршена работа, академски успех, време, стапка на раст на квалификациите).
  • 2) Субјективни критериуми (вклучуваат различни видови одговори кои го одразуваат ставот на една личност кон нешто, неговите мислења, ставови).
  • 3) Физиолошки критериум (се користи при проучување на влијанието на надворешната средина што влијае на телото и психата).
  • 4) Критериум за случајност (на пример, кога целта се однесува на проблемот на избор за работа на оние лица кои се помалку склони кон несреќи).

Надворешниот критериум мора да има 3 главни барања: 1) Мора да биде релевантен, односно да постои доверба дека критериумот ги вклучува токму оние карактеристики на индивидуалната психа што ги мери дијагностичката техника. Надворешниот критериум и дијагностичкиот модел мора да бидат во внатрешна семантичка кореспонденција. 2) Мора да биде ослободен од пречки (контаминација). За истражување треба да се изберат групи на луѓе кои се во повеќе или помалку идентични услови 3) Мора да бидат сигурни. Постојаност и стабилност на функцијата што се проучува.

Проценката на валидноста на методологијата може да биде квантитативна и квалитативна.

За да се пресмета квантитативен индикатор (коефициент на важност), резултатите добиени од примената на дијагностички техники се споредуваат со податоците на истите лица добиени со помош на надворешен критериум. Се користат различни типови на линеарна корелација (според Спирман, според Пирсен).

Квалитативен опис на суштината на имотот што се мери. Овде не се користи статистичка обработка. Постојат неколку видови на валидност, определени од карактеристиките на дијагностичката техника, како и од привремениот статус на надворешниот критериум: 1) Валидност „по содржина“ (се користи во тестовите за постигнување): 3 - 4 прашања од голема тема може да го покаже вистинското знаење на ученикот. За да го направите ова, дијагностичките резултати се споредуваат со стручните проценки на наставникот. 2) „Истовремена“ важност или тековна важност - се собираат податоци поврзани со сегашното време: академски перформанси, продуктивност итн. Резултатите од успехот на тестот се во корелација со нив. 3) „Предвидлива“ валидност („предвидлива“). Се одредува со сигурен надворешен критериум, но информациите за него се собираат некое време по тестот. Точноста на прогнозата е обратно поврзана со времето одредено за таквото прогнозирање. 4) „Ретроспективна“ важност. Утврдено врз основа на критериум што ги одразува настаните или состојбата на квалитетот во минатото. Може да се користи за брзо добивање информации за предвидувачките способности на техниката.

По веродостојноста, уште еден клучен критериум за проценка на квалитетот на методите е валидноста. Прашањето за валидноста на техниката се решава само откако ќе се утврди нејзината доволна веродостојност, бидејќи несигурната техника не може да биде валидна. Но, најсигурната техника без знаење за нејзината важност е практично бескорисна.

Треба да се напомене дека прашањето за валидноста сè уште се чини дека е едно од најтешките. Најутврдената дефиниција за овој концепт е онаа дадена во книгата на А. Анастаси: „Валидноста на тестот е концепт што ни кажува што мери тестот и колку добро го прави тоа“.

Валидноста во неговото јадро е сложена карактеристика која вклучува, од една страна, информации за тоа дали техниката е погодна за мерење за што е создадена, а од друга страна, каква е нејзината ефикасност, ефикасност и практична корисност.

Поради оваа причина, не постои единствен универзален пристап за дефинирање на валидноста. Во зависност од тоа кој аспект на валидноста сака да го разгледа истражувачот, се користат различни методи на докази. Со други зборови, концептот на валидност ги вклучува неговите различни видови, кои имаат свое посебно значење. Проверката на валидноста на методологијата се нарекува валидација.

Валидноста во нејзиното прво разбирање е поврзана со самата методологија, односно тоа е валидноста на мерниот инструмент. Овој тип на тестирање се нарекува теоретска валидација. Валидноста во второто разбирање не се однесува толку на методологијата колку на целта на нејзината употреба. Ова е прагматично потврдување.

Сумирајќи, можеме да го кажеме следново:

„За време на теоретската валидација, истражувачот е заинтересиран за самиот имот измерен со техниката. Ова во суштина значи дека самата психолошка валидација се спроведува;

„Со прагматична валидација, суштината на предметот на мерење (психолошкото својство) е надвор од видното поле. Главниот акцент е на докажувањето дека „нештото“ мерено со техниката има поврзаност со одредени области на пракса.

Спроведувањето на теоретска валидација, наспроти прагматичното потврдување, понекогаш излегува дека е многу потешко. Засега, без да навлегуваме во конкретни детали, да се задржиме генерално на тоа како се проверува прагматичката валидност: се избира некој надворешен критериум, независен од методологијата, кој го одредува успехот во одредена активност (образовна, професионална итн.) и со се споредуваат резултатите од дијагностичката техника. Ако врската меѓу нив се смета за задоволителна, тогаш се донесува заклучок за практичното значење, ефективноста и ефикасноста на дијагностичката техника.

За да се одреди теоретската валидност, многу е потешко да се најде некој независен критериум што лежи надвор од методологијата. Затоа, во раните фази на развојот на тестологијата, кога концептот на валидност штотуку се обликуваше, постоеше интуитивна идеја за тоа што точно мери дадениот тест:

1) техниката беше наречена валидна, бидејќи она што го мери е едноставно „очигледно“;

2) доказот за валидност се заснова на увереноста на истражувачот дека неговиот метод му овозможува „да ја разбере темата“;

3) техниката се сметаше за валидна (т.е. беше прифатена изјавата дека таков тест мери таков и таков квалитет) само затоа што теоријата врз основа на која се засноваше техниката беше „многу добра“.

Прифаќањето на неоснованите изјави за валидноста на методологијата не можеше да продолжи долго време. Првите манифестации на вистинска научна критика го разоткриа овој пристап: започна потрагата по научно засновани докази.

Така, да се спроведе теоретска валидација на методологијата значи да се докаже дека методологијата точно го мери својствата, квалитетот што истражувачот сакал да го измери.

Така, на пример, ако некој тест е развиен со цел да се дијагностицира менталниот развој на децата, потребно е да се анализира дали тој навистина го мери овој развој, а не некои други карактеристики (на пример, личност, карактер итн.). Затоа, за теоретска валидација, главниот проблем е односот помеѓу психолошките феномени и нивните показатели преку кои се обидуваат да бидат познати овие психолошки појави. Таквата проверка покажува до кој степен се совпаѓаат намерите на авторот и резултатите од методологијата.

Не е толку тешко да се спроведе теоретска валидација на нова техника ако веќе постои техника со докажана валидност за мерење на дадено својство. Присуството на корелација помеѓу нова и слична, веќе тестирана техника покажува дека развиената техника го мери истиот психолошки квалитет како и референтната. И ако новиот метод во исто време се покаже дека е покомпактен и поекономичен во спроведувањето и обработката на резултатите, тогаш психодијагностичарите имаат можност да користат нова алатка наместо старата. Оваа техника особено често се користи во диференцијалната психофизиологија кога се создаваат методи за дијагностицирање на основните својства на човечкиот нервен систем (види Поглавје 16).

Но, теоретската валидност се докажува со споредба не само со поврзаните индикатори, туку и со оние каде што, врз основа на хипотезата, не треба да има значајни врски. Така, за да се провери теоретската валидност, важно е, од една страна, да се утврди степенот на поврзаност со поврзаната техника (конвергентна валидност), а од друга, отсуството на оваа врска со техники кои имаат различна теоретска основа ( дискриминаторска важност).

Многу е потешко да се спроведе теоретска валидација на метод кога таков метод на верификација е невозможен. Најчесто, ова е ситуацијата со која се соочува истражувачот. Во такви околности, само постепеното акумулирање на различни информации за имотот што се проучува, анализата на теоретските простории и експерименталните податоци и значителното искуство со техниката овозможуваат да се открие неговото психолошко значење.

Важна улога во разбирањето на мерките на методологијата се игра со споредување на нејзините показатели со практичните форми на активност. Но, тука е особено важно теоретски внимателно да се разработи методологијата, односно да постои солидна, добро заснована научна основа. Потоа, со споредување на техниката со надворешен критериум земен од секојдневната практика што одговара на она што го мери, може да се добијат информации кои поддржуваат теоретски идеи за нејзината суштина.

Важно е да се запамети дека ако се докаже теоретската валидност, тогаш толкувањето на добиените индикатори станува појасно и понедвосмислено, а името на техниката одговара на обемот на нејзината примена.

Што се однесува до прагматичното потврдување, тоа вклучува тестирање на техниката од гледна точка на нејзината практична ефективност, значење и корисност, бидејќи има смисла да се користи дијагностичка техника само кога ќе се докаже дека имотот што се мери се манифестира во одредени животни ситуации. , во одредени видови активности. Нему му се дава големо значење особено кога се поставува прашањето за селекција.

Ако повторно се свртиме кон историјата на развојот на тестологијата, можеме да истакнеме период (20-30-ти) кога научната содржина на тестовите и нивниот теоретски „багаж“ биле од помал интерес. Важно беше тестот да функционира и да помогне брзо да се изберат најподготвените луѓе. Емпирискиот критериум за оценување на тест задачи се сметаше за единствено правилно упатство во решавањето на научни и применети проблеми.

Употребата на дијагностички техники со чисто емпириско оправдување, без јасна теоретска основа, честопати доведуваше до псевдонаучни заклучоци и неоправдани практични препораки. Беше невозможно точно да се именуваат карактеристиките и квалитетите што ги открија тестовите. Б. М. Теплов, анализирајќи ги тестовите од тој период, ги нарече „слепи тестови“.

Овој пристап кон проблемот на валидноста на тестот беше типичен до раните 50-ти. не само во САД, туку и во други земји. Теоретската слабост на методите за емпириска валидација не можеше, а да не предизвика критики од оние научници кои, во развојот на тестовите, повикаа да се потпираат не само на „голи“ емпирии и практика, туку и на теоретски концепт. Практиката без теорија, како што знаеме, е слепа, а теоријата без практика е мртва. Во моментов, теоретската и прагматичната проценка на валидноста на методите се смета за најпродуктивна.

За да се спроведе прагматично потврдување на техниката, т.е., да се процени нејзината ефикасност, ефикасност и практично значење, обично се користи независен надворешен критериум - индикатор за манифестацијата на имотот што се проучува во секојдневниот живот. Таквите критериуми може да бидат:

1) академски перформанси (за тестови за способност за учење, тестови за постигнување, тестови за интелигенција);

2) производствени достигнувања (за професионално ориентирани методи);

3) ефективноста на реалните активности - цртање, моделирање итн. (за тестови на посебни способности);

4) субјективни проценки (за тестови на личноста). Американските истражувачи Д. Тифин и Е. Мекормик, кои спроведоа

Анализата на надворешните критериуми што се користат за докажување на валидноста, беа идентификувани четири типа:

1) критериуми за успешност (тие може да вклучуваат како што се обемот на завршената работа, академските перформанси, времето поминато на обука, стапката на раст на квалификациите итн.);

2) субјективни критериуми (тие вклучуваат различни видови одговори кои го одразуваат ставот на една личност кон нешто или некого, неговото мислење, ставови, преференции; обично субјективните критериуми се добиваат со помош на интервјуа, прашалници, прашалници);

3) физиолошки критериуми (се користат за проучување на влијанието на околината и други ситуациони променливи врз човечкото тело и психа; се мерат пулсот, крвниот притисок, електричен отпор на кожата, симптомите на замор итн.);

4) критериуми за несреќи (се применуваат кога целта на студијата се однесува, на пример, со проблемот на избор за работа на такви лица кои се помалку подложни на несреќи).

Надворешниот критериум мора да исполнува три основни барања:

1) мора да биде релевантно;

2) без пречки (контаминација);

3) сигурен].

Релевантноста се однесува на семантичката кореспонденција на дијагностичката алатка со независен витален критериум. Со други зборови, мора да постои доверба дека критериумот ги вклучува токму оние карактеристики на индивидуалната психа кои се мерат со дијагностичката техника. Надворешниот критериум и дијагностичката техника мора да бидат во внатрешна семантичка кореспонденција еден со друг и да бидат квалитативно хомогени по психолошка суштина.

Ако, на пример, тестот ги мери индивидуалните карактеристики на размислувањето, способноста за изведување логички дејства со одредени предмети и концепти, тогаш критериумот треба да бара и манифестација на токму овие вештини. Ова подеднакво важи и за професионалните активности. Таа има не една, туку неколку цели и цели, од кои секоја е специфична и наметнува свои услови за имплементација. Тоа подразбира постоење на повеќе критериуми за вршење професионална дејност. Затоа, успехот во дијагностичките техники не треба да се споредува со ефикасноста на производството воопшто. Потребно е да се најде критериум кој, врз основа на природата на извршените операции, е споредлив со методологијата.

Ако не е познато во однос на надворешен критериум дали тој е релевантен за имотот што се мери или не, тогаш споредувањето на резултатите од психодијагностичката техника со него станува практично бескорисно. Тоа не дозволува да се дојде до заклучоци кои би можеле да ја проценат валидноста на методологијата.

Барањата за слобода од мешање (контаминација) се предизвикани од фактот што, на пример, образовниот или индустрискиот успех зависи од две варијабли: од самата личност, неговите индивидуални карактеристики, мерени со методи и од ситуацијата, студирањето и работните услови. , што може да воведе пречки, „контаминира“ » применетиот критериум. За да се избегне ова до одреден степен, треба да се изберат групи на луѓе кои се во повеќе или помалку идентични услови за истражување. Може да се користи друг метод. Се состои од корекција на влијанието на пречки. Ова прилагодување е обично статистичка по природа. На пример, продуктивноста не треба да се зема во апсолутна смисла, туку во однос на просечната продуктивност на работниците кои имаат слични работни услови.

Кога велат дека критериумот мора да има статистички значајна веродостојност, тоа значи дека тој мора да ја одразува постојаноста и стабилноста на функцијата што се проучува.

Потрагата по адекватен и лесно идентификуван критериум е многу важна и сложена задача на валидација. Во западното тестирање, многу методи се дисквалификувани само затоа што не беше можно да се најде соодветен критериум за нивно тестирање. Особено, повеќето прашалници имаат сомнителни податоци за валидност, бидејќи е тешко да се најде соодветен надворешен критериум што одговара на она што тие го мерат.

Проценката на валидноста на методите може да биде квантитативна и квалитативна.

За да се пресмета квантитативен индикатор - коефициентот на валидност - резултатите добиени при примена на дијагностичката техника се споредуваат со податоците добиени според надворешниот критериум на истите лица. Се користат различни типови на линеарна корелација (според Спирман, според Пирсон).

Колку предмети се потребни за да се пресмета валидноста?

Праксата покажа дека не треба да има помалку од 50, но најдобро е повеќе од 200. Често се поставува прашањето: која треба да биде вредноста на коефициентот на важност за да се смета за прифатлив? Генерално, се забележува дека е доволно коефициентот на валидност да биде статистички значаен. Коефициентот на важност од околу 0,2-0,3 се смета за низок, просечен - 0,3-0,5 и висок - над 0,6.

Но, како што нагласуваат А. Анастаси, К. М. Гуревич и други, не е секогаш легитимно да се користи линеарна корелација за да се пресмета коефициентот на валидност. Оваа техника е оправдана само кога ќе се докаже дека успехот во некоја активност е директно пропорционален со успехот во извршувањето на дијагностички тест. Позицијата на странските тестолози, особено на оние кои се занимаваат со професионалната подобност и селекција, најчесто се сведува на безусловно признавање дека тој што завршил повеќе задачи во тестот е посоодветен за професијата. Но, исто така, може да биде дека за да успеете во некоја активност треба да имате својство на ниво од 40% од тест решението. Повисокиот резултат на тестот веќе нема никакво значење за професијата. Јасен пример од монографијата на К.М. Гуревич: поштарот мора да знае да чита, но без разлика дали чита со нормална брзина или со многу голема брзина - ова веќе нема професионално значење. Со таква корелација помеѓу индикаторите на методот и надворешниот критериум, најадекватен начин за утврдување на валидноста може да биде критериумот на разлики.

Можен е и друг случај: повисокото ниво на имот од она што го бара професијата го попречува професионалниот успех. Значи, уште во зората на 20 век. Американскиот истражувач Ф. Тејлор откри дека најразвиените работнички во производството имаат ниска продуктивност на трудот. Односно, нивното високо ниво на ментален развој ги спречило да работат високо продуктивно. Во овој случај, за пресметување на коефициентот на валидност би била посоодветна анализа на варијанса или пресметување на корелација.

Како што покажа искуството на странските тестолози, ниту една статистичка постапка не може целосно да ја одрази различноста на поединечните проценки. Затоа, често се користи друг модел за докажување на валидноста на методите - клинички проценки. Ова не е ништо повеќе од квалитативен опис на суштината на имотот што се проучува. Во овој случај, зборуваме за употреба на техники кои не се потпираат на статистичка обработка.

Постојат неколку видови на валидност, поради карактеристиките на дијагностичките техники, како и привремениот статус на надворешниот критериум. Сепак, најчесто се нарекуваат следниве.

1. Валидност „по содржина“. Оваа техника се користи, на пример, во тестовите за постигнување. Вообичаено, тестовите за постигања не го вклучуваат целиот материјал што го опфатиле учениците, туку мал дел од него (3-4 прашања). Можете ли да бидете сигурни дека точните одговори на овие неколку прашања покажуваат дека сте го совладале целиот материјал? Ова е она што треба да одговори тестот за валидност на содржината. За да го направите ова, се врши споредба на успехот на тестот со стручни проценки на наставниците (врз основа на овој материјал). Валидноста на содржината исто така важи и за тестовите засновани на критериум. Оваа техника понекогаш се нарекува логичка валидност.

2. Истовремената валидност, или тековната валидност, се одредува со користење на надворешен критериум со кој информациите се собираат истовремено со експериментите со користење на методот што се тестира. Со други зборови, се собираат податоци кои се однесуваат на сегашното време: перформанси за време на тест периодот,

перформанси во истиот период итн. Резултатите од успехот на тестот се споредуваат со нив.

3. „Предвидлива“ важност (друго име е „предвидлива“ валидност). Се одредува и со надворешен критериум, но информациите за него се собираат некое време по тестот. Надворешен критериум е обично способноста на една личност, изразена во некој вид на проценка, за видот на активност за која е оценета врз основа на резултатите од дијагностички тестови. Иако оваа техника е најконзистентна со задачата на дијагностички техники - предвидување на идниот успех - многу е тешко да се примени. Точноста на дијагнозата е обратно поврзана со времето одредено за такво предвидување. Колку повеќе време поминува по мерењето, толку е поголем бројот на фактори кои треба да се земат предвид при проценката на прогностичкото значење на техниката. Сепак, речиси е невозможно да се земат предвид сите фактори кои влијаат на предвидувањето.

4. „Ретроспективна“ важност. Се одредува врз основа на критериум кој ги одразува настаните или состојбата на квалитетот во минатото. Може да се користи за брзо добивање информации за предвидувачките способности на техниката. Така, за да се тестира степенот до кој резултатите од тестот за добри способности одговараат на брзото учење, минатите проценки на перформансите, минати експертски мислења итн., може да се споредат помеѓу поединци со високи и ниски тековни дијагностички резултати.

При презентирање на податоци за валидноста на развиената методологија, важно е јасно да се наведе за каков тип на валидност се мисли (содржински, во смисла на истовременост и сл.). Исто така, препорачливо е да се обезбедат информации за бројот и карактеристиките на поединците врз кои е извршена валидацијата. Ваквите информации му овозможуваат на истражувачот што ја користи техниката да одлучи колку техниката е валидна за групата на која има намера да ја примени. Како и со веродостојноста, мора да се запомни дека техниката може да има висока валидност во еден примерок и мала важност во друг. Затоа, ако истражувачот планира да користи техника на примерок од предмети што значително се разликува од онаа на која е спроведен тестот за валидност, тој треба повторно да спроведе таков тест. Коефициентот на валидност даден во прирачникот се однесува само на групи на предмети слични на оние на кои е утврден.

ВАЖНОСТ- една од најважните карактеристики на психодијагностичките методи и тестови, еден од главните критериуми за нивниот квалитет. Овој концепт е близок до концептот на доверливост, но не е целосно идентичен.

Проблемот на валидноста се јавува при развивањето и практичната примена на тест или техника, кога е неопходно да се воспостави кореспонденција помеѓу степенот на изразување на својството на личност од интерес и начинот на мерење. Валидноста се однесува на тоа што го мери тестот или техниката и колку добро го прави тоа; Колку се повалидни, толку подобро го одразуваат квалитетот (имотот) за кој се создадени. Квантитативно, валидноста може да се изрази преку корелации на резултатите добиени со помош на тест или техника со други показатели, на пример, со успешноста на извршувањето на соодветната активност. Валидноста може да се оправда на различни начини, најчесто сложено. Се користат и дополнителни концепти на концептуална, критериумска, конструктивна и други видови валидност - со свои начини на утврдување на нивното ниво. Барањето за валидност е многу важно, а многу поплаки за тестови или други психодијагностички техники се поврзани со сомнителноста на нивната валидност. На пример, валидноста на разузнавачката мерка зависи од:

1) од дефиницијата на концептот на интелигенција, кој претставува еден или друг концепт на овој феномен;

2) за составот на тест задачи развиени според овој концепт;

3) од емпириски критериуми. Различните концепти бараат различен состав на задачите, па затоа е важно прашањето за концептуалната валидност. Колку повеќе задачите одговараат на дадениот концепт за интелигенција на авторот, толку посигурно можеме да зборуваме за валидноста на концептуалниот тест. Корелацијата на тестот со емпириски критериум укажува на неговата можна валидност во однос на тој критериум. Утврдувањето на валидноста на тестот секогаш бара поставување дополнителни прашања: валидност за што? за која цел? по кој критериум? Значи, концептот на валидност не се однесува само на тестот, туку и на критериумот за оценување на неговиот квалитет. Колку е поголем коефициентот на корелација помеѓу тестот и критериумот, толку е поголема валидноста. Развојот на факторската анализа овозможи да се создадат тестови кои се валидни во однос на идентификуваниот фактор. Само тестови тестирани за валидност може да се користат во професионалната ориентација, професионална селекција и научно истражување.

ВАЛИДНОСТ: КРИТЕРИОН- во однос на методите, значи независни показатели и знаци според кои може да се процени неговата валидност. Овие критериуми се користат за евалуација на резултатите добиени од практичната примена на техниката. Критериумите може да бидат:

1) показатели на однесување - реакции, дејства и дејства на субјектот во различни животни ситуации;

2) постигањата на предметот во разни видови дејности - образовни, трудови и сл.;

3) податоци за извршување на различни контролни тестови и задачи;

4) податоците добиени од други методи, чија валидност или поврзаност со методот што се тестира се смета за цврсто утврдена.

НАДВОРЕШНА ВАЖНОСТ- во однос на психодијагностичките методи, тоа значи дека резултатите од психодијагностиката спроведена со овој метод одговараат на надворешни знаци независни од методот и поврзани со предметот на испитувањето. Тоа значи приближно исто што и емпириската валидност, со таа разлика што овде зборуваме за поврзаноста на индикаторите на методот и најважните, клучни надворешни знаци поврзани со однесувањето на субјектот. Психодијагностичката техника се смета за надворешно валидна ако, на пример, ги проценува карактерните црти на поединецот и неговото надворешно набљудувано однесување е во согласност со резултатите од тестирањето.

ВНАТРЕШНА ВАЖНОСТ- во однос на психодијагностичките методи се подразбира усогласеност на задачите, поттестовите и другите работи содржани во него со општата цел и намера на методот; усогласеност на резултатите од психодијагностиката спроведена со користење на оваа техника со дефиницијата на оценетите психолошки својства што се користат во самата техника. Техниката се смета за внатрешно неважечка или нема валидност кога сите или дел од прашањата, задачите или поттестовите вклучени во неа не го мерат она што се бара од техниката.

КОНЦЕПТУАЛНА ВАЖНОСТ- се подразбира како оправдување од позицијата на усогласеност со идеите на авторот за карактеристиките на својствата што се дијагностицираат, како мерка за усогласеност на тест задачите со концептот на авторот за овие својства.

КРИТЕРИЈАЛНА ВАЖНОСТ(валидност на критериумот) - Сфатено како образложение за корелацијата помеѓу резултатите од тестот и емпирискиот критериум. Можната валидност на тестот во однос на овој критериум е означена со корелацијата на тестот со него; колку е поголем коефициентот на корелација, толку е поголема валидноста. Развојот на факторската анализа овозможи да се создадат тестови кои се валидни во однос на идентификуваниот фактор.

ВАЛИДИТЕТ ТЕОРЕТСКИ(конструктивна валидност, концептуална валидност) - во однос на психодијагностичките методи, тоа значи дека резултатите од психодијагностиката спроведена со овој метод одговараат на индикаторите на оние психолошки квалитети кои теоретски се поврзани со имотот што се оценува. Тоа се определува со кореспонденцијата на индикаторите за квалитет добиени со овој метод со индикаторите добиени преку други методи - со нивната теоретски оправдана зависност. Така, ако техниката го промени нивото на развој на мотивот за постигнување, тогаш таа ќе биде теоретски валидна доколку добиените индикатори веродостојно корелираат со податоците за самодовербата, анксиозноста и нивото на аспирации теоретски поврзани со мотивацијата за постигнување.

ВАЛИДИТЕТ ЕМПИРИЧНА(практична важност) - во однос на психодијагностичките методи, тоа значи дека резултатите од психодијагностиката спроведена со овој метод одговараат на искуството на една личност, неговото вистинско однесување, како и набљудуваните дејства и реакции на субјектот. Тоа се одредува со споредување на неговите показатели со однесувањето во реалниот живот или со резултатите од практичните активности на луѓето. Така, доколку се проценат карактерните црти на одреден субјект, тогаш употребената техника се смета за емпириски валидна кога ќе се утврди дека субјектот се однесува во животот токму онака како што предвидува техниката.

(Головин С.Ју. Речник на практичен психолог - Минск, 1998)

ВАЖНОСТ НА ТЕСТ(Англиски) валидностнатест) - најважниот критериум за добар квалитет тест, карактеризирање на точноста на мерењето на имотот што се проучува; проценка на соодветноста на тестот на проблемот што се проучува. V. t. се определува со корелација на неговите резултати со други критериуми на имотот што се мери (на пример, V. t. способностите се одредуваат со корелација на резултатите од тестот со успехот на извршување на соодветната активност). Се нарекува проверка на V. t валидација(валидација). Дозволени се различни видови валидација и V.t.: 1) суштински ( содржина); 2) по критериум (емпириски; критериуми-поврзани): 3) концептуален (конструктивен; конструкција); 4) дискриминаторски ( дискриминаторски) итн Види Психодијагностика,Психолошка дијагностика. (В.И. Лубовски.)

(Зинченко В.П., Мешчерјаков Б.Г. Голем психолошки речник - 3-то издание, 2002 година)

Пред да може психодијагностичките техники да се користат за практични цели, тие мора да се тестираат според бројни формални критериуми кои го докажуваат нивниот висок квалитет и ефективност.

Главните критериуми за евалуација на психодијагностичките техники вклучуваат веродостојност и валидност. Странските психолози дадоа голем придонес во развојот на овие концепти (А. Анастаси, Е. Гисели, Ј. Гилфорд, Л. Кронбах, Р. Торндајк и Е. Хаген итн.). Тие развија и формално-логички и математичко-статистички апарат (првенствено методот на корелација и факторската анализа) за да се потврди степенот на усогласеност на методите со наведените критериуми.

Валидност- Ова сеопфатна карактеристика која вклучува, од една страна, информации за тоа дали техниката е погодна за мерење за што е создадена, а од друга страна, каква е нејзината ефикасност, ефикасност и практична корисност.

Валидност- степенот до кој техниката го мери она што е наменето да го измери. Нивото на валидност се нарекува коефициент на валидност. Систематските фактори влијаат на валидноста на тестот. Тие внесуваат нарушувања во резултатите. Овие фактори се други ментални својства кои спречуваат особината кон која е насочен тестот да се манифестира во резултатите од тестот.

На пример, сакаме да го измериме „потенцијал за учење“, но на субјектот му даваме тест со строго временско ограничување и без можност да се вратиме назад и да ја поправиме грешката. Во овој поглед, посакуваното ментално својство се испоставува дека е измешано со друго - „отпорност на стрес“: субјектите со високи нивоа на отпорност на стрес ќе го извршат тестот подобро. Ова ќе го манифестира ефектот на систематско нарушување.

Поради оваа причина, не постои единствен универзален пристап за дефинирање на валидноста. Во зависност од тоа кој аспект на валидноста сака да го разгледа истражувачот, се користат различни методи на докази. Со други зборови, концептот на валидност ги вклучува неговите различни видови, кои имаат свое посебно значење. Проверката на валидноста на методологијата се нарекува валидација.

Валидноста во нејзиното прво разбирање е поврзана со самата методологија, односно тоа е валидноста на мерниот инструмент. Оваа проверка се нарекува теоретска валидација.Валидноста во второто разбирање не се однесува толку на методологијата колку на целта на нејзината употреба. Ова е прагматично потврдување.



Во модерната психометрика, развиени се буквално десетици различни теоретски и експериментални методи за тестирање на валидноста на тестовите. Главниот елемент на скоро сите овие методи е таканаречениот „критериум“. Критериум за валидносте независен извор на информации за менталното својство што се мери, надвор од тестот. Не можеме да судиме за валидноста на тестот додека не ги споредиме неговите резултати со извор на вистинити (или барем очигледно валидни) информации за имотот што се мери - со критериум.

Во пракса, многу често прагматичните критериуми се користат како критериум за валидност - ова е очигледен знак дека субјектот го покажува без оглед на квалитетот што го проучуваме. На пример, индикатори за ефективноста на активноста заради предвидување кое тестирање е преземено. Или податоци за извршување на различни задачи, контролни тестови, како и податоци добиени со други методи, чија валидност е докажана. Техниката има толку важност колку што има критериуми.



Теоретска валидностсе определува со кореспонденцијата на индикаторите на изучените квалитети добиени со помош на креираната методологија, индикатори добиени со други методи или со индикатори за кои веќе постојат теоретски оправдувања. Тестирано со корелација на исто својство мерено со различни методи.

Во рамките на теоретската валидност се разликуваат:

- Конвергентна валидност. Најповолна ситуација се јавува кога психологијата веќе има валидна методологија која го тестира квалитетот што го изучувате. Во овој случај, високата корелација помеѓу индикаторите на овие методи укажува дека новиот метод има конвергентна валидност во однос на стариот.

- Конструирај валидност. Во многу случаи, не постои потврден тест со позната валидност за мерење на дадено својство. Во овој случај, истражувачот формира серија хипотези за тоа како новиот тест ќе корелира со други тестови. Овие хипотези се изнесени врз основа на теоретски идеи за имотот што се мери. Нивната потврда укажува на валидноста на предложениот конструкт, т.е. конструира валидност (или воочена валидност).

Емпириска валидност– се проверува со кореспонденција на индикаторите на дијагностичката техника со вистинското однесување, набљудуваните дејства и реакции на субјектот, т.е. гледаме колку во реалниот живот клиентот се однесува во согласност со резултатите од студијата.

Внатрешна важност– односот во методологијата на содржината на поединечни задачи, поттестови, судови за севкупната цел на планот. Се смета дека методот не е внатрешно валиден кога не сите делови од методот го мерат квалитетот што го бара целта. Внатрешна важност е внатрешната конзистентност на задачите на методологијата.

Исто така постои лажна валидност– го доловува изгледот на соодветноста на техниката.

Очигледна валидност– понекогаш навистина истражува факти и обрасци од реалниот живот, но соодветствува на реалниот само во дидактичките тестови (на пример, тестови за образовни достигнувања).

Валидност од искуство– се заснова на личното чувство на психологот дека оваа техника е погодна за мерење на секој квалитет, бидејќи се заснова на добра теорија или дава добри резултати.

Валидност заснована на желба– се заснова на желбата да се види нечија методологија како валидна и добра, притоа да не се забележат очигледните факти кои се во спротивност со ова.

Валидноста на сите методи на тестирање, освен дидактичките, мора да се мери со помош на психометриски методи. Колку предмети треба да има за да се пресмета валидноста? Според практиката, не треба да има помалку од 50, но најдобро од сè повеќе од 200. Често се поставува прашањето: која треба да биде вредноста на коефициентот на важност за тој да се смета за прифатлив? Доволно е што коефициентот на валидност е статистички значаен. Коефициентот на важност од околу 0,20-0,30 се смета за низок, просечен - 0,30-0,50 и висок - над 0,60.

Билет број 9

Прашалници за мотивација и нивните карактеристики.

Мотивираните прашалници се група прашалници дизајнирани да ја дијагностицираат сферата на мотивационите потреби на поединецот, што овозможува да се утврди кон што е насочена активноста на поединецот (мотиви како причини што го одредуваат изборот на насоката на однесување). Дополнително, од значајно значење е прашањето како се регулира динамиката на однесување. Во овој случај, тие често прибегнуваат кон мерење на ставовите. Развојот на прашалници за мотиви во психодијагностиката е во голема мера поврзан со потребата да се процени влијанието на факторот „општествена пожелност“, кој има став и ја намалува веродостојноста на податоците добиени со помош на прашалници за личноста. Најпознатите прашалници за мотиви ја вклучуваат „Списокот на лични преференци“ развиен од А. Едвардс (1954), кој е дизајниран да ја мери „јачината“ на потребите, позајмен од списокот предложен од Г. Мареј за тематскиот тест за перцепција. Овие потреби ги вклучуваат, на пример, потребите за успех, почит, лидерство итн. „Силата“ на секоја потреба не се изразува во апсолутни вредности, туку во однос на „силата“ на другите потреби, т.е. се користат лични индикатори. За да ја проучи улогата на факторот „социјална пожелност“, А. Едвардс (1957) предложи посебен прашалник. Широко се користат и други прашалници за мотиви, на пример, „Форма за проучување на личноста“ од Д. Џексон (1967), прашалници од А. Мехрабјан (1970) итн.

По веродостојноста, уште еден клучен критериум за проценка на квалитетот на методите е валидноста. Прашањето за валидноста на техниката се решава само откако ќе се утврди нејзината доволна веродостојност, бидејќи несигурната техника не може да биде валидна. Но, најсигурната техника без знаење за нејзината важност е практично бескорисна.

Треба да се напомене дека прашањето за валидноста до неодамна се чини дека е едно од најтешките. Најутврдената дефиниција за овој концепт е онаа дадена во книгата на А. Анастаси: „Валидноста на тестот е концепт што ни кажува што мери тестот и колку добро го прави тоа“.

Поради оваа причина, не постои единствен универзален пристап за дефинирање на валидноста. Во зависност од тоа кој аспект на валидноста сака да го разгледа истражувачот, се користат различни методи на докази. Со други зборови, концептот на валидност ги вклучува неговите различни видови, кои имаат свое посебно значење. Проверката на валидноста на методологијата се нарекува валидација.



Валидноста во нејзиното прво разбирање е поврзана со самата методологија, односно тоа е валидноста на мерниот инструмент. Овој тип на тестирање се нарекува теоретска валидација. Валидноста во второто разбирање не се однесува толку на методологијата колку на целта на нејзината употреба. Ова е прагматично потврдување.

Сумирајќи, можеме да го кажеме следново:

при теоретска валидација, истражувачот се интересира за самото својство мерено со техниката. Ова во суштина значи дека самата психолошка валидација се спроведува;

со прагматична валидација, суштината на предметот на мерење (психолошко својство) е надвор од видното поле. Главниот акцент е на докажување дека нешто што се мери со техника има врска со одредени области на пракса.

Спроведувањето на теоретска валидација, наспроти прагматичното потврдување, понекогаш излегува дека е многу потешко. Засега, без да навлегуваме во конкретни детали, да се задржиме генерално на тоа како се проверува прагматичката валидност: се избира некој надворешен критериум, независен од методологијата, кој го одредува успехот во одредена активност (образовна, професионална итн.) и со се споредуваат резултатите од дијагностичката техника. Ако врската меѓу нив се смета за задоволителна, тогаш се донесува заклучок за практичното значење, ефективноста и ефикасноста на дијагностичката техника.

За да се одреди теоретската валидност, многу е потешко да се најде некој независен критериум што лежи надвор од методологијата. Затоа, во раните фази на развојот на тестологијата, кога концептот на валидност штотуку се обликуваше, постоеше интуитивна идеја дека тестот мери:

1) техниката беше наречена валидна, бидејќи она што го мери е едноставно очигледно;

2) доказот за валидност се заснова на увереноста на истражувачот дека неговиот метод му овозможува да ја разбере темата;

3) техниката се сметаше за валидна (т.е. беше прифатена изјавата дека таков тест мери таков и таков квалитет) само затоа што теоријата врз основа на која се засноваше техниката беше многу добра.

Прифаќањето на неоснованите изјави за валидноста на методологијата не можеше да продолжи долго време. Првите манифестации на вистинска научна критика го разоткриа овој пристап: започна потрагата по научно засновани докази.

Така, да се спроведе теоретска валидација на методологијата значи да се докаже дека методологијата точно го мери својствата, квалитетот што истражувачот сакал да го измери.

Така, на пример, ако некој тест е развиен со цел да се дијагностицира менталниот развој на децата, потребно е да се анализира дали тој навистина го мери овој развој, а не некои други карактеристики (на пример, личност, карактер итн.). Така, за теоретска валидација, главниот проблем е односот помеѓу психолошките појави и нивните индикатори преку кои се бара да се знаат овие психолошки појави. Ова покажува колку се совпаѓаат намерите на авторот и резултатите од методологијата.

Не е толку тешко да се спроведе теоретска валидација на нова техника ако веќе постои техника со докажана валидност за мерење на дадено својство. Присуството на корелација помеѓу нов и сличен веќе тестиран метод покажува дека развиениот метод го мери истиот психолошки квалитет како и референтниот. И ако новиот метод во исто време се покаже дека е покомпактен и поекономичен во спроведувањето и обработката на резултатите, тогаш психодијагностичарите имаат можност да користат нова алатка наместо старата.

Но, теоретската валидност се докажува не само со споредба со поврзаните индикатори, туку и со оние каде што, врз основа на хипотезата, не треба да има значајни врски. Така, за да се провери теоретската валидност, важно е, од една страна, да се утврди степенот на поврзаност со поврзаната техника (конвергентна валидност) и отсуството на оваа поврзаност со техники кои имаат различна теоретска основа (дискриминаторска валидност).

Многу е потешко да се спроведе теоретска валидација на метод кога таков метод на верификација е невозможен. Најчесто, ова е ситуацијата со која се соочува истражувачот. Во такви околности, само постепеното акумулирање на различни информации за имотот што се проучува, анализата на теоретските простории и експерименталните податоци и значителното искуство во работата со техниката овозможуваат да се открие неговото психолошко значење.

Важна улога во разбирањето на мерките на методологијата се игра со споредување на нејзините показатели со практичните форми на активност. Но, тука е особено важно теоретски внимателно да се разработи методологијата, односно да постои солидна, добро заснована научна основа. Потоа, со споредување на техниката со надворешен критериум земен од секојдневната практика што одговара на она што го мери, може да се добијат информации кои поддржуваат теоретски идеи за нејзината суштина.

Важно е да се запамети дека ако се докаже теоретската валидност, тогаш толкувањето на добиените индикатори станува појасно и понедвосмислено, а името на техниката одговара на обемот на нејзината примена. Што се однесува до прагматичното потврдување, тоа вклучува тестирање на техниката од гледна точка на нејзината практична ефективност, значење и корисност, бидејќи има смисла да се користи дијагностичка техника само кога ќе се докаже дека имотот што се мери се манифестира во одредени животни ситуации. , во одредени видови активности. Нему му се дава големо значење особено кога се поставува прашањето за селекција.

Ако повторно се свртиме кон историјата на развојот на тестологијата, можеме да истакнеме период (20-30-тите години на 20 век) кога научната содржина на тестовите и нивниот теоретски багаж биле од помал интерес. Важно беше тестот да функционира и да помогне брзо да се изберат најподготвените луѓе. Емпирискиот критериум за оценување на тест задачи се сметаше за единствено правилно упатство во решавањето на научни и применети проблеми.

Употребата на дијагностички техники со чисто емпириско оправдување, без јасна теоретска основа, честопати доведуваше до псевдонаучни заклучоци и неоправдани практични препораки. Беше невозможно точно да се именуваат карактеристиките и квалитетите што ги открија тестовите. Тие во суштина беа слепи тестови.

Овој пристап кон проблемот на валидноста на тестот беше типичен до раните 50-ти. XX век не само во САД, туку и во други земји. Теоретската слабост на методите за емпириска валидација не можеше, а да не предизвика критики од оние научници кои, во развојот на тестовите, повикаа да се потпираат не само на голи емпирии и практика, туку и на теоретски концепт. Практиката без теорија, како што знаеме, е слепа, а теоријата без практика е мртва. Во моментов, теоретската и практичната проценка на валидноста на методите се смета за најпродуктивна.

За да се спроведе прагматично потврдување на техниката, т.е., да се процени нејзината ефикасност, ефикасност и практично значење, обично се користи независен надворешен критериум - индикатор за манифестацијата на имотот што се проучува во секојдневниот живот. Таков критериум може да бидат академските перформанси (за тестови за способности за учење, тестови за постигнување, тестови за интелигенција) и производствени достигнувања (за методи ориентирани кон професионално ниво), и ефективноста на реалните активности - цртање, моделирање итн. (за тестови на специјални способности), субјективни проценки (за тестови на личноста).

Американските истражувачи Д. Тифин и Е. МекКормик, анализирајќи ги надворешните критериуми што се користат за докажување на валидноста, идентификуваат четири типа [31 секој:

1) критериуми за успешност (тие може да вклучуваат како што се обемот на завршената работа, академските перформанси, времето поминато на обука, стапката на раст на квалификациите итн.);

2) субјективни критериуми (тие вклучуваат различни видови одговори кои го одразуваат ставот на една личност кон нешто или некого, неговото мислење, ставови, преференции; обично субјективните критериуми се добиваат со помош на интервјуа, прашалници, прашалници);

3) физиолошки критериуми (се користат за проучување на влијанието на околината и други ситуациони променливи врз човечкото тело и психа; се мерат пулсот, крвниот притисок, електричен отпор на кожата, симптомите на замор итн.);

4) критериуми за несреќи (се применуваат кога целта на студијата се однесува, на пример, со проблемот на избор за работа на такви лица кои се помалку подложни на несреќи).

Надворешниот критериум мора да исполнува три основни барања:

мора да биде релевантно;

без пречки;

сигурен.

Релевантноста се однесува на семантичката кореспонденција на дијагностичката алатка со независен витален критериум. Со други зборови, мора да постои доверба дека критериумот ги вклучува токму оние карактеристики на индивидуалната психа кои се мерат со дијагностичката техника. Надворешниот критериум и дијагностичката техника мора да бидат во внатрешна семантичка кореспонденција еден со друг и да бидат квалитативно хомогени по психолошка суштина. Ако, на пример, тестот ги мери индивидуалните карактеристики на размислувањето, способноста за изведување логички дејства со одредени предмети и концепти, тогаш критериумот треба да бара и манифестација на токму овие вештини. Ова подеднакво важи и за професионалните активности. Таа има не една, туку неколку цели и цели, од кои секоја е специфична и наметнува свои услови за имплементација. Тоа подразбира постоење на повеќе критериуми за вршење професионална дејност. Затоа, успехот во дијагностичките техники не треба да се споредува со ефикасноста на производството воопшто. Потребно е да се најде критериум кој, врз основа на природата на извршените операции, е споредлив со методологијата.

Ако не е познато во однос на надворешен критериум дали тој е релевантен за имотот што се мери или не, тогаш споредувањето на резултатите од психодијагностичката техника со него станува практично бескорисно. Тоа не дозволува да се дојде до заклучоци кои би можеле да ја проценат валидноста на методологијата.

Барањата за слобода од мешање се предизвикани од фактот што, на пример, образовниот или индустрискиот успех зависи од две варијабли: од самата личност, неговите индивидуални карактеристики, мерени со методи и од ситуацијата, студирањето и работните услови, кои можат да воведе интерференција и „контаминира“ применетиот критериум . За да се избегне ова до одреден степен, треба да се изберат групи на луѓе кои се во повеќе или помалку идентични услови за истражување. Може да се користи друг метод. Се состои од корекција на влијанието на пречки. Ова прилагодување е обично статистичка по природа. Така, на пример, продуктивноста не треба да се зема во апсолутна вредност, туку во однос на просечната продуктивност на работниците кои работат под слични услови.

Кога велат дека критериумот мора да има статистички значајна веродостојност, тоа значи дека тој мора да ја одразува постојаноста и стабилноста на функцијата што се проучува.

Потрагата по адекватен и лесно идентификуван критериум е многу важна и сложена задача на валидација. Во западното тестирање, многу методи се дисквалификувани само затоа што не беше можно да се најде соодветен критериум за нивно тестирање. На пример, повеќето прашалници имаат сомнителни податоци за валидност бидејќи е тешко да се најде соодветен надворешен критериум што одговара на она што тие го мерат.

Проценката на валидноста на методите може да биде квантитативна и квалитативна.

За да се пресмета квантитативен индикатор - коефициентот на валидност - резултатите добиени при примена на дијагностичката техника се споредуваат со податоците добиени со помош на надворешен критериум за истите поединци. Се користат различни типови на линеарна корелација (според Спирман, според Пирсон).

Колку предмети се потребни за да се пресмета валидноста?

Праксата покажа дека не треба да има помалку од 50, но најдобро е повеќе од 200. Често се поставува прашањето: која треба да биде вредноста на коефициентот на важност за да се смета за прифатлив? Генерално, се забележува дека е доволно коефициентот на валидност да биде статистички значаен. Коефициентот на важност од околу 0,20-0,30 се смета за низок, просечен - 0,30-0,50 и висок - над 0,60.

Но, како што нагласуваат А. Анастаси, К. М. Гуревич и други, не е секогаш легитимно да се користи линеарна корелација за да се пресмета коефициентот на валидност. Оваа техника е оправдана само кога ќе се докаже дека успехот во некоја активност е директно пропорционален со успехот во извршувањето на дијагностички тест. Позицијата на странските тестолози, особено на оние кои се занимаваат со професионалната подобност и селекција, најчесто се сведува на безусловно признавање дека тој што завршил повеќе задачи во тестот е посоодветен за професијата. Но, исто така, може да биде дека за да успеете во некоја активност треба да имате својство на ниво од 40% од тест решението. Понатамошниот успех на тестот веќе нема никакво значење за професијата. Јасен пример од монографијата на К.М. Гуревич: поштарот мора да знае да чита, но без разлика дали чита со нормална брзина или со многу голема брзина - ова веќе нема професионално значење. Со таква корелација помеѓу индикаторите на методот и надворешниот критериум, најадекватен начин за утврдување на валидноста може да биде критериумот на разлики.

Можен е и друг случај: повисокото ниво на имот од она што го бара професијата го попречува професионалниот успех. Значи, уште во зората на 20 век. Американскиот истражувач Ф. Тејлор откри дека најразвиените работнички во производството имаат ниска продуктивност на трудот. Односно, нивното високо ниво на ментален развој ги спречило да работат високо продуктивно. Во овој случај, за пресметување на коефициентот на валидност би била посоодветна анализа на варијанса или пресметување на корелација.

Како што покажа искуството на странските тестолози, ниту една статистичка постапка не може целосно да ја одрази различноста на поединечните проценки. Затоа, често се користи друг модел за докажување на валидноста на методите - клинички проценки. Ова не е ништо повеќе од квалитативен опис на суштината на имотот што се проучува. Во овој случај, зборуваме за употреба на техники кои не се потпираат на статистичка обработка.

Видови на важност

Валидноста во неговото јадро е сложена карактеристика која вклучува, од една страна, информации за тоа дали техниката е погодна за мерење за што е создадена, а од друга страна, каква е нејзината ефикасност, ефикасност и практична корисност.

Проверката на валидноста на методологијата се нарекува валидација.

За да се спроведе прагматично потврдување на техниката, т.е., да се процени нејзината ефикасност, ефикасност и практично значење, обично се користи независен надворешен критериум - индикатор за манифестацијата на имотот што се проучува во секојдневниот живот. Таков критериум може да бидат академските перформанси (за тестови за способности за учење, тестови за постигања, тестови за интелигенција) и производствени достигнувања (за методи ориентирани кон професионално ниво), и ефективноста на реалните активности - цртање, моделирање итн. (за тестови на специјални способности), субјективни проценки (за тестови на личноста).

4 типа на надворешни критериуми:

критериуми за изведба (тие може да вклучуваат како што се обемот на завршената работа, академските перформанси, времето поминато на обука, стапката на раст на квалификациите итн.);

субјективни критериуми (тие вклучуваат различни видови одговори кои го одразуваат ставот на една личност кон нешто или некого, неговото мислење, ставови, преференции; обично субјективните критериуми се добиваат со помош на интервјуа, прашалници, прашалници);

физиолошки критериуми (се користат за проучување на влијанието на околината и другите ситуациони варијабли врз човечкото тело и психа; се мерат пулсот, крвниот притисок, електричен отпор на кожата, симптоми на замор итн.);

критериуми за несреќа (се користи кога целта на истражувањето се однесува на, на пример, проблемот со изборот за работа на оние поединци кои се помалку подложни на несреќи).

Емпириска валидност.

Ако, во случај на валидност на содржината, тестот се оценува на сметка на експерти (кои ја утврдуваат кореспонденцијата на ставките од тестот со содржината на предметот на мерење), тогаш емпириската валидност секогаш се мери со помош на статистичка корелација: корелација на две се пресметуваат серии на вредности - оценки на тестот и индикатори на надворешниот параметар избран како критериум за валидност.

Конструирај валидност.

Валидноста на конструкцијата се однесува на самиот теоретски конструкт и вклучува пребарување на фактори кои го објаснуваат однесувањето при полагањето тестови. Како посебен тип, валидноста на конструктот беше канонизирана во една статија од Кронбах и Мехл (1955). Авторите ги оценија со користење на овој тип на валидност сите тест студии кои не беа директно насочени кон предвидување на некој релевантен критериум. Студијата содржела информации за психолошките конструкции.

Валидност на содржината.

Валидноста на содржината бара секоја ставка, задача или прашање што припаѓа на одреден домен да има еднакви шанси да се тестира на тест. Валидноста на содржината ја проценува конзистентноста на содржината на тестот (задачи, прашања) со измерената област на однесување. Тестовите, составени од два развојни тима, се спроведуваат на примерок од предмети. Веродостојноста на тестот се пресметува со поделба на ставките на два дела, што резултира со индекс на валидност на содржината.

„Предвидувачка“ валидност.

„Предвидувачката“ валидност се одредува и со прилично сигурен надворешен критериум, но информациите за тоа се собираат некое време по тестот. Надворешен критериум обично е способноста на една личност, изразена во некаква проценка, за видот на активност за која е избран врз основа на резултатите од дијагностички тестови. Иако оваа техника е најконзистентна со задачата на дијагностички техники - предвидување на идниот успех, многу е тешко да се примени. Точноста на прогнозата е обратно поврзана со времето одредено за таквото прогнозирање. Колку повеќе време поминува по мерењето, толку е поголем бројот на фактори кои треба да се земат предвид при проценката на прогностичкото значење на техниката. Сепак, речиси е невозможно да се земат предвид сите фактори кои влијаат на предвидувањето.

„Ретроспективна“ важност.

Се одредува врз основа на критериум кој ги одразува настаните или состојбата на квалитетот во минатото. Може да се користи за брзо добивање информации за предвидувачките способности на техниката. Така, за да се провери степенот до кој резултатите од тестот за добри способности кореспондираат со брзото учење, може да се споредат минатите проценки на перформансите, минати експертски мислења итн. кај индивидуи со дијагностички индикатори со висока и мала струја.

Конвергентна и дискриминантна валидност.

Стратегијата за вклучување на одредени ставки во тестот зависи од тоа како психологот ја дефинира дијагностичката конструкција. Ако Ајзенк го дефинира својството „невротичност“ како независно од екстраверзија-интровертност, тогаш тоа значи дека неговиот прашалник треба да содржи приближно подеднакво ставки со кои би се согласиле невротичните интроверти и невротичните екстроверти. Ако во пракса се покаже дека на тестот ќе доминираат ставки од квадрантот „невротизам-интровертност“, тогаш, од гледна точка на теоријата на Ајзенк, тоа значи дека факторот „невротизам“ се покажува како оптоварен со ирелевантен фактор - „интроверзија“. (Токму истиот ефект се јавува ако примерокот стане искривен - ако содржи повеќе невротични интроверти отколку невротични екстроверти.)

За да се избегнат ваквите тешкотии, психолозите би сакале да се занимаваат со емпириски индикатори (ставки) кои јасно информираат само за еден фактор. Но, ова барање никогаш всушност не е исполнето: секој емпириски индикатор се покажува дека е одреден не само од факторот што ни треба, туку и од другите - неважни за мерната задача.

Така, за факторите кои концептуално се дефинирани како ортогонални на она што се мери (се јавува во сите комбинации), пишувачот на тестот мора да примени вештачка стратегија за балансирање при изборот на ставки.

Соодветноста на ставките со факторот што се мери обезбедува конвергентна валидност на тестот. Урамнотежувањето на ставките против ирелевантните фактори обезбедува дискриминаторска важност. Емпириски се изразува во отсуство на значајна корелација со тест кој мери концептуално независно својство.

Видови на важност

Постојат неколку видови на валидност, поради карактеристиките на дијагностичките техники, како и привремениот статус на надворешниот критериум. Кулагин, 1984; Во Черни, 1983 година; „Општа психодијагностика“, 1987 година, итн.) најчесто се споменуваат следново:

1. Валидност на содржината. Оваа техника се користи првенствено во тестовите за постигнување. Вообичаено, тестовите за постигања не го вклучуваат целиот материјал што го опфатиле учениците, туку мал дел од него (3-4 прашања). Можете ли да бидете сигурни дека точните одговори на овие неколку прашања покажуваат дека сте го совладале целиот материјал? Ова е она што треба да одговори тестот за валидност на содржината. За да го направите ова, се врши споредба на успехот на тестот со стручни проценки на наставниците (врз основа на овој материјал). Валидноста на содржината исто така важи и за тестовите засновани на критериум. Оваа техника понекогаш се нарекува логичка валидност.

2. Истовремената валидност, или тековната валидност, се одредува со надворешен критериум со кој информациите се собираат истовремено со експериментите на постапката што се тестира. Со други зборови, се собираат податоци кои се однесуваат на сегашните перформанси за време на тест периодот, перформансите во истиот период итн. Резултатите од успехот на тестот се во корелација со него.

3. „Предвидлива“ важност (друго име е „предвидлива“ валидност). Исто така, се одредува со прилично сигурен надворешен критериум, но информациите за него се собираат некое време по тестот. Надворешен критериум обично е способноста на една личност, изразена во некаква проценка, за видот на активност за која е избран врз основа на резултатите од дијагностички тестови. Иако оваа техника е најконзистентна со задачата на дијагностички техники - предвидување на идниот успех, многу е тешко да се примени. Точноста на прогнозата е обратно поврзана со времето одредено за таквото прогнозирање. Колку повеќе време поминува по мерењето, толку е поголем бројот на фактори кои треба да се земат предвид при проценката на прогностичкото значење на техниката. Сепак, речиси е невозможно да се земат предвид сите фактори кои влијаат на предвидувањето.

4. „Ретроспективна“ важност. Се одредува врз основа на критериум кој ги одразува настаните или состојбата на квалитетот во минатото. Може да се користи за брзо добивање информации за предвидувачките способности на техниката. Така, за да се провери степенот до кој резултатите од тестот за добри способности кореспондираат со брзото учење, може да се споредат минатите проценки на перформансите, минати експертски мислења итн. кај индивидуи со дијагностички индикатори со висока и мала струја.

Корелација

Корелација (зависност од корелација) е статистичка врска помеѓу две или повеќе случајни променливи (или вредности што може да се сметаат како такви со одреден прифатлив степен на точност). Во овој случај, промените во вредностите на една или повеќе од овие количини доведуваат до систематска промена на вредностите на друга или други количини. Математичка мерка за корелација на две случајни променливи е односот на корелација, или коефициентот на корелација (или). Ако промената на една случајна променлива не води до природна промена на друга случајна променлива, туку води до промена на друга статистичка карактеристика на оваа случајна променлива, тогаш таквата врска не се смета за корелациска, иако е статистичка.

Терминот „корелација“ првпат беше воведен во научна употреба од францускиот палеонтолог Жорж Кувие во 18 век. Тој го разви „законот на корелација“ на делови и органи на живи суштества, со помош на кој е можно да се врати изгледот на фосилно животно, имајќи на располагање само дел од неговите остатоци. Зборот „корелација“ првпат бил употребен во статистиката од англискиот биолог и статистичар Френсис Галтон на крајот на 19 век.

Некои типови на коефициенти на корелација може да бидат позитивни или негативни (исто така е можно да нема статистичка врска - на пример, за независни случајни променливи). Ако се претпостави дека на вредностите на променливите е одредена врска со строг редослед, тогаш негативна корелација е корелација во која зголемувањето на една променлива е поврзано со намалување на друга променлива, а коефициентот на корелација може да биде негативен ; позитивна корелација во такви услови е корелација во која зголемувањето на една променлива е поврзано со зголемување на друга променлива, а коефициентот на корелација може да биде позитивен.