Основни концепти на теоријата на тестови.

Математички основи на теоријата на тест конструкција

Видови на тест ставки

Постојат два значително различни форми на задачи: затворени (кога на испитаникот му се нудат опции за одговор да избере) и отворени (полагачот мора сам да го добие одговорот). Отворените задачи, пак, може да се поделат во две групи:

задачи со краток, регулиран одговор, чија формулација треба да генерира само еден одговор, планиран од развивачот;

задачи со слободно конструиран одговор, без никакви ограничувања на содржината и формата на презентирање на одговорите.

Постојат пет главни типа на задачи. Сите други видови се варијации или комбинации на овие пет типа.

Задача за избор.Текстот на задачата се состои од прашање. Постојат неколку опции за одговор од кои можете да изберете, од кои една или повеќе се точни.

Задача за додавање.Во формулацијата на задачата недостасува одреден фрагмент од текстот, кој се означува со долна црта (или неколку долни црти со иста должина, ако недостасуваат неколку зборови). Јазот може да биде во кој било дел од текстот, но се препорачува тоа да се направи на крајот. Во одговорот, испитувачот мора да ги напише зборовите што недостасуваат.

Задачата е да се утврди правилната низа.

Задача за усогласеност.Формулацијата на задачата содржи две листи. Лево, по правило, се елементите на множеството што ја содржи изјавата за проблемот, десно се елементите што треба да се изберат. Елементите од левиот сет се нумерирани, елементите од десниот сет се означени со букви. Пожелно е вториот сет да содржи поголем број на елементи во однос на првиот сет. Во овој случај, секој елемент од првиот сет одговара на еден или повеќе елементи од вториот сет.

Задача со детален одговор.

Фази на развој на тестот

Формулирање на целта и предметот на истражувањето.

Кој, што и зошто треба да се тестира

Развој на содржина за тестирање.

Проучување на барањата на образовниот стандард, содржината на учебниците.

Пишување спецификација за тест:

Избор на делови (теми) и нивната процентуална содржина во тестот

Избор на типови работни места

Определување на нивоа на совладување на знаења и вештини:

Ниво 1	Познавање на дефиниции на основни поими на дисциплината, како и основни изјави за методите на дисциплината
Ниво 2	Познавање на основни формули и алгоритми; способност за нивна примена при решавање на стандардни проблеми
Ниво 3	Примена на стекнатото знаење за решавање на нетипични проблеми

Одредување на приближниот број на задачи во тестот и распределување на овој број по тип на задача.

Развој на задачи.

Со оглед на тоа што првата верзија на тестот треба да ги открие недостатоците на задачите (вклучувајќи ги и предложените оттргнувачи), во секоја задача беа понудени најголем можен број одвлекувачи на внимание, така што при отфрлање, остануваше доволен број од нив.

Испитување на сурово тесто.

Целта на испитувањето е да се идентификуваат и коригираат неточни и нејасни формулации. Како резултат на тоа, некои задачи може да се отстранат од тестот (оттука, се препорачуваат задачи).

Одобрување.

Пресметка на карактеристики на задачи и тестови.

Врз основа на резултатите од тестирањето, се пресметуваат следните статистички карактеристики на задачите и тестот.

Опсег на индивидуални резултатиго мери растојанието во кое се менуваат сите вредности на индикаторите во дистрибуцијата (индивидуални оценки).

СО просечен примерок(просек) за збир на поединечни бодови X 1 , X 2 , …, X Кгрупи Кпредметите се пресметуваат со формулата

брои варијансисе заснова на пресметување на отстапувањата на секоја вредност на индикаторот од аритметичката средина во распределбата:

Ниската дисперзија укажува на низок квалитет на тестот, бидејќи слабата варијација во резултатите укажува на слаба диференцијација на учесниците на тестот по ниво на обука. Премногу висока дисперзија е типична за случајот кога сите ученици се различни по бројот на завршени задачи, што исто така бара преработка на тестот.

Пресметката на карактеристиките на тестот се завршува со проценка на веродостојноста на тестот. За да го пресметате коефициентот на сигурност, можете да ја користите формулата Коефициент Кудер-Ричардсон(само во случај кога сите тежини на задачи се еднакви на една):

За да дадете квалитативна проценка на веродостојноста на тестот врз основа на вредноста на коефициентот, користете ја следната табела:

Вредност на коефициентот на сигурност	Проценка на доверливост
	незадоволителен
	задоволително

	одлично

Проценка на тежината на j-та задачапресметано со формулата

Забележете дека колку е полесна задачата, толку поголем ќе биде процентот на точни одговори на неа ( стр ј), затоа би било поприродно оваа пропорција да се толкува како леснотија на задачата. Добро избалансиран тест во однос на тежината треба да има неколку тешки задачи, неколку лесни, но најголемиот дел од задачите треба да имаат тежина од 0,3 до 0,7; во овој случај, пожелно е задачите да се подредат по редослед на зголемена тежина.

Валидност на тест предметиопределена со степенот на усогласеност на задачата со целта на диференцијација на предметите. За да се направи ова, се одредуваат коефициентите на корелација на оценувањето за задачата со резултатот за целиот тест. Ова се прави со користење на коефициентот на корелација според формулата

Каде X јас резултат од тестот јас-ти предмет, Y јас- точка јас-ти предмет за задачата. Забележете дека во случај на дихотомно оценување на задача, пресметката на коефициентот е малку поедноставена. Ако р< 0, то задание следует удалить из теста, т. к. в нем побеждают слабые ученики, а сильные выбирают неверный ответ либо пропускают задание при выполнении теста. Положительные значения, но близкие к нулю (незначимые), указывают на низкую прогностическую способность задания теста; такие задания требуют доработки содержания.

Способноста да се разликуваат предметите како најдобри и најлоши покажува коефициент на диференцијација(или дискриминативен индекс) задачи. Наједноставниот начин за пресметување на таков индекс се нарекува метод на контрастна група и е како што следува. Од целата група субјекти се идентификувани едни од најдобрите субјекти врз основа на резултатите од тестот (ќе ги наречеме силна подгрупа) и исто толку најлоши (слаба подгрупа). Процентот на точни одговори во подгрупата потоа се пресметува за секоја од овие подгрупи. Да означиме со стр 1 јпропорција на точни одговори на ј-та задача во силна подгрупа, а потоа стр 0 ј– пропорција на точни одговори во слабата подгрупа. Потоа индексот на дискриминативност јас-задачата се одредува со формулата:

(рдис) ј = стр 1 ј – стр 0 ј .

За задача со која се справија сите силни субјекти, а ниту еден од слабите, индексот на дискриминативност р dis ќе биде еднаква на 1; во овој случај, задачата има максимален ефект на диференцијација. За задача со која се справија сите слаби и ниту еден од силните, индексот на дискриминативност ќе биде еднаков на –1. Во други случаи, индексот ќе зема вредности помеѓу –1 и 1. Ставките со нула и негативни вредности на дискриминативен индекс не ги разликуваат учениците добро, па затоа треба да се отстранат од тестот. Ако индексот е позитивен, но помал од 0,2, тогаш таквата задача бара внимателна анализа на содржината.

Според овие карактеристики, некои задачи може да се отстранат од тестот, додека други мора да се поправат. По ова, чекорите 5 и 6 мора да се повторат.

Формули за пресметување на веројатноста за погодување

Кога дизајнирате тест, треба да одредите колку одговори треба да се понудат за секое прашање, така што веројатноста за полагање на тестот едноставно со погодување на точните одговори е помала од 0,05 (т.е. помалку од 5%). Тестирањето ќе се смета за успешно завршено доколку испитателот точно одговори не помалку од П% од прашањата. Доколку тестот вклучува Нпрашања, а потоа за да се пресмета веројатноста за „успешно погодување“ се користи следнава формула:

Каде м- бројот на понудени одговори за секое прашање.

Во случај кога бројот на предложени одговори на прашања во различни задачи е различен, формулата има посложена форма:

Каде - веројатност за погодување на одговорите на јпрашања, што се пресметува на следниов начин. Сите прашања од тестот нека се поделат на ргрупи така што прашањата со иста веројатност за погодување се комбинираат во една група. Да означиме стр јас , 0< стр јас <1 - вероятность угадывания и к јас - број на прашања во јас- таа група (
), и

Потоа за јод
до N:

Каде т р = ј  (т 1 + т 2 +…+ т р-1), и ако т р > к р, тогаш ќе претпоставиме
= 0 .

Примери.

N=10, Q=2/3: m=2, P<0,2; m=3, P<0,02; m=4, P<0,004

Литература

Челишкова М.Б. Теорија и практика на конструирање на педагошки тестови: Учебник. – М.: Логос, 2002. – 432 стр.

Malygin A. A., Svetsov V. I., Shchanitsina S. V. Практични препораки за подготовка на контролни и мерни материјали: Метод. додаток / Иван. држава хем.-техн. уни. – Иваново, 2005. – 30 стр.

Како да се напише тест // Sloyer K. Математички фантазии. - М.: Мир, 1993. - стр. 116-118.

ПОГЛАВЈЕ 3. СТАТИСТИЧКА ОБРАБОТКА НА РЕЗУЛТАТИТЕ ОД ТЕСТИРАЊЕТО

Статистичката обработка на резултатите од тестот овозможува, од една страна, објективно да се утврдат резултатите на субјектите, од друга страна, да се процени квалитетот на самиот тест, задачите за тестирање, особено да се процени неговата веродостојност. Проблемот на доверливост привлече големо внимание во класичната теорија на тестови. Оваа теорија не ја изгуби својата важност денес. И покрај појавата на помодерни теории, класичната теорија продолжува да ја одржува својата позиција.

3.1. ОСНОВНИ ОДРЕДБИ НА ТЕОРИЈАТА НА КЛАСИЧНИОТ ТЕСТ

3.2. МАТРИЦА НА РЕЗУЛТАТИ ОД ТЕСТОТ

3.3. ГРАФИЧКО ПРЕТСТАВУВАЊЕ НА РЕЗУЛТАТ НА ТЕСТОТ

3.4. МЕРКИ НА ЦЕНТРАЛНА ТЕНДЕНЦИЈА

3.5. НОРМАЛНА РАСПРЕДЕЛБА

3.6. ВАРИЈАЦИЈА НА ТЕСТОВИТЕ НА ПРЕДМЕТИ

3.7. МАТРИЦА НА КОРЕЛАЦИЈА

3.8. СИГУРНОСТ НА ТЕСТ

3.9. ВАЖНОСТ НА ТЕСТ

ЛИТЕРАТУРА

ОСНОВНИ ОДРЕДБИ НА ТЕОРИЈАТА НА КЛАСИЧНИОТ ТЕСТ

Креатор на Класичната теорија на менталните тестови е познатиот британски психолог, автор на факторска анализа, Чарлс Едвард Спирман (1863-1945) 1. Роден е на 10 септември 1863 година и служел во британската армија четвртина од својот живот. Поради оваа причина, тој докторирал дури на 41-годишна возраст. Чарлс Спирман го спроведе своето истражување за дисертација во Лајпцишката лабораторија за експериментална психологија под раководство на Вилхелм Вунд. Во тоа време, Чарлс Спирман беше под силно влијание на работата на Френсис Галтон за тестирање на човечката интелигенција. Учениците на Чарлс Спирман биле Р. Кател и Д. Векслер. Меѓу неговите следбеници се А. Анастаси, Џ. П. Гилфорд, П. Вернон, Ц. Бурт, А. Џенсен.

Луис Гутман (1916-1987) даде голем придонес во развојот на класичната теорија на тестови.

Теоријата на класичниот тест за прв пат беше сеопфатно и целосно претставена во фундаменталното дело на Харолд Гуликсен (Gulliksen H., 1950) 4 . Оттогаш, теоријата е малку изменета, особено математичкиот апарат е подобрен. Теоријата за класична тест во модерна презентација е дадена во книгата Crocker L., Aligna J. (1986) 5. Меѓу домашните истражувачи, V. Avanesov (1989) 6 беше првиот што ја опиша оваа теорија. Во делото на Челишкова М.Б. (2002) 7 дава информации за статистичката оправданост на квалитетот на тестот.

Теоријата на класичните тестови се заснова на следните пет основни принципи.

1. Емпириски добиениот резултат од мерењето (X) е збир на вистинскиот резултат од мерењето (T) и мерната грешка (Е) 8:

X = T + E (3.1.1)

Вредностите на Т и Е обично се непознати.

2. Вистинскиот резултат од мерењето може да се изрази како математичко очекување E(X):

3. Корелацијата на вистинити и неточни компоненти низ множеството субјекти е нула, односно ρ TE = 0.

4. Погрешните компоненти на кои било два теста не се во корелација:

5. Погрешните компоненти на еден тест не се во корелација со вистинските компоненти на кој било друг тест:

Покрај тоа, основата на класичната теорија на тестови се формира со две дефиниции - паралелни и еквивалентни тестови.

ПАРАЛЕЛНИТЕ тестови мора да ги исполнуваат барањата (1-5), вистинските компоненти на еден тест (Т 1) мора да бидат еднакви со вистинските компоненти на другиот тест (Т 2) во секој примерок од субјекти што одговараат на двата теста. Се претпоставува дека T 1 = T 2 и, покрај тоа, се еднакви на варијансата s 1 2 = s 2 2.

Еквивалентни тестови мора да ги исполнуваат сите барања на паралелните тестови со еден исклучок: вистинските компоненти на еден тест не мора да бидат еднакви со вистинските компоненти на друг паралелен тест, но тие мора да се разликуваат за истата константа Со.

Условот за еквивалентност на два теста е запишан на следниов начин:

каде што c 12 е константа помеѓу резултатите од првиот и вториот тест.

Врз основа на горенаведените одредби, конструирана е теорија на веродостојност на тестот 9,10.

т.е.

Ајде да го преработиме овој израз на следниов начин:

(3.1.3)

Десната страна на оваа еднаквост ја претставува веродостојноста на тестот ( р). Така, веродостојноста на тестот може да се запише како:

Врз основа на оваа формула, потоа беа предложени различни изрази за пронаоѓање на коефициентот на веродостојност на тестот. Веродостојноста на тестот е неговата најважна карактеристика. Ако веродостојноста е непозната, резултатите од тестот не може да се толкуваат. Веродостојноста на тестот ја карактеризира неговата точност како мерен инструмент. Висока сигурност значи висока повторливост на резултатите од тестот под исти услови.

Во класичната теорија на тестот, најважниот проблем е одредувањето на вистинскиот резултат на тестот на предметот (Т). Резултатот од емпирискиот тест (X) зависи од многу услови - степенот на тежина на задачите, нивото на подготвеност на испитувачите, бројот на задачи, условите за тестирање итн. Во група на силни, добро подготвени субјекти, резултатите од тестот обично ќе бидат подобри. отколку кај група слабо обучени субјекти. Во овој поглед, останува отворено прашањето за големината на мерката за тешкотија на задачата за општата популација на субјекти. Проблемот е што вистински емпириски податоци се добиваат од сосема случајни примероци на субјекти. По правило, тоа се студиски групи кои претставуваат мноштво студенти кои доста силно комуницираат меѓу себе во процесот на учење и учат во услови кои често не се повторуваат за другите групи.

Ќе најдеме и Еод равенката (3.1.4)

Овде е експлицитно прикажана зависноста на точноста на мерењето од стандардното отстапување s Xи за веродостојноста на тестот р.

Клучни прашања: Тестот како мерна алатка. Основни теории за тестирање. Функции, можности и ограничувања на тестирањето. Примена на тестови при проценка на персоналот. Предности и недостатоци на користење на тестови. Форми и видови на тест задачи. Технологија за изградба на задачи. Проценка на квалитетот на тестот. Сигурност и валидност. Тест софтвер за развој. 2

Тестот како мерна алатка Основни поими во тестологијата: мерење, тест, содржина и форма на задачи, веродостојност и валидност на резултатите од мерењето. Дополнително, тестологијата користи такви концепти на статистичката наука како примерок и општа популација, просечни индикатори, варијација, корелација, регресија итн. 4

Тест-задача е дидактички и технолошки ефикасна единица на контролен материјал, дел од тестот што ги исполнува барањата за суштинска чистота на содржината (или еднодимензионалност), суштинска и логичка исправност, исправност на формата и прифатливост на геометриската слика. на задачата. 6

Традиционалниот тест е стандардизиран метод за дијагностицирање на нивото и структурата на подготвеноста. Во таков тест, сите субјекти одговараат на исти задачи, во исто време, под исти услови и со исти правила за оценување на одговорите. За да се постигне целта за тестирање, може да се создадат безброј тестови и сите тие можат да бидат релевантни за постигнување на целта. 8

Професиограмот (од латински: Professio speciality + Gramma record) е систем на карактеристики кои опишуваат одредена професија, а исто така вклучува листа на норми и барања што оваа професија или специјалност ги наметнува на вработен. Конкретно, професиограмот може да вклучува листа на психолошки карактеристики што претставниците на одредени професионални групи мора да ги исполнат. 9

Основни теории за тестирање Првите научни трудови за теоријата на тестови се појавија на почетокот на дваесеттиот век, на пресекот на психологијата, социологијата, педагогијата и другите т.н. бихејвиорални науки. Странските психолози оваа наука ја нарекуваат психометрика (Психометрика), а наставниците педагошко мерење (Образовно мерење). Незаматено од идеологија и политика, толкувањето на името „тестологија“ е едноставно и транспарентно: наука за тестовите. 10

Првата фаза е праисторијата - од антиката до крајот на 19 век, кога биле широко распространети преднаучните облици на контрола на знаењата и способностите; вториот период, класичен, траеше од раните 20-ти до крајот на 60-тите, при што беше создадена класичната теорија на тестови; третиот период - технолошки - започна во 70-тите - време на развој на методи на адаптивно тестирање и обука, методологија за ефективен развој на тестови и тест ставки за параметарско оценување на предметите според измерениот латентен квалитет. единаесет

Функции, способности и ограничувања на тестирањето Тестовите што се користат при изборот се дизајнирани да добијат психолошки портрет на кандидатот, да ги проценат неговите способности, како и професионалните знаења и вештини. Тестовите ви овозможуваат да ги споредувате кандидатите едни со други или со стандардите, односно идеалниот кандидат. Тестовите се користат за мерење на квалитетите што му се потребни на едно лице за ефикасно да ја изврши работата. Некои тестови се дизајнирани така што работодавачот го спроведува тестот и ги пресметува резултатите. Други бараат услуги од искусни консултанти за да обезбедат правилна примена. 12

Ограничувањата на употребата на тестовите се поврзани со нивната скапа администрација; - со соодветност за оценување на човечките способности; - тестовите се поуспешни во предвидувањето на успехот во работата што содржи краткорочни професионални задачи, а не се многу погодни во случаи кога задачите што се решаваат на работа траат неколку дена или недели. 13

2. Користената терминологија треба да биде прилагодена на специфичната целна публика. Исто така, неопходно е да се исклучат непотребни написи или написи кои вклучуваат две или повеќе прашања, бидејќи понекогаш го збунуваат испитаникот и го отежнуваат толкувањето. 17

3. За да ги задоволите сите овие барања, треба да ја разгледате целата банка на прашања член по член и да анализирате за каква цел служи секој од нив. На пример, ако се развива тест за мерење на аналитичката способност на сметководителите приправници, вреди да се размисли што значи „аналитичка способност“ во овој случај. 18

5. Откако ќе се изберат прашањата и форматите за бодување, тие треба да се претворат во формат погодна за корисниците, со јасно напишани упатства и пример прашања; за кандидатите кои го полагаат тестот целосно да разберат што се бара од нив. 20

6. Многу често во оваа фаза на развој, во тестот се вклучени повеќе прашања отколку што е потребно. Според некои проценки, три пати повеќе од она што ќе остане во последниот тест или мерниот систем. Првичната мерка потоа ќе биде тестирање на тестот што се развива на релативно широк примерок од постоечки работници за да се осигура дека сите прашања се лесно разбирливи. 21

7. Тестовите на знаење обично започнуваат со едноставни прашања кои кон крајот постепено стануваат потешки. Кога тестовите се наменети да ги измерат социјалните ставови и карактеристиките на личноста, може да биде корисно да се менуваат негативно и позитивно формулирани ставки за да се избегнат лошо замислените одговори. 22

8. Последниот чекор вклучува спроведување на тестот на широко репрезентативен примерок за да се воспостават стандарди за изведба, доверливост и валидност пред да се користи како алатка за селекција. Дополнително, неопходно е да се одреди валидноста на тестот за да се осигура дека тој не дискриминира ниту една подгрупа на населението (на пример, етнички разлики). 23

Проценка на квалитетот на тестот За методите на селекција да бидат доволно ефективни, тие мора да бидат сигурни, валидни и доверливи. Веродостојноста на методот на селекција се карактеризира со неговиот имунитет на систематски грешки во мерењето, односно неговата конзистентност под различни услови. 24

Во пракса, веродостојноста во донесувањето проценки се постигнува со споредување на резултатите од два или повеќе слични тестови спроведени во различни денови. Друг начин да се зголеми веродостојноста е да се споредат резултатите од неколку алтернативни методи за селекција (на пример, тест и интервју). Ако резултатите се слични или исти, тие може да се сметаат за точни. 25

Веродостојноста значи дека преземените мерења ќе го дадат истиот резултат како и претходните, односно дека резултатите од проценката не се под влијание на фактори од трета страна. Валидноста значи дека методот го мери токму она што е наменето да го измери. Максималната можна точност на информациите добиени со специјално развиени методи во научното истражување е ограничена од технички фактори и не надминува 0,8. 26

Во практиката на селекција на кадри, се забележува дека веродостојноста на различните методи на оценување се наоѓа во интервалите: 0,1 – 0,2 – традиционално интервју; 0,2 – 0,3 – препораки; 0,3 – 0,5 – стручни тестови; 0,5 – 0,6 – структурирано интервју, интервју засновано на компетентност; 0,5 – 0,7 – тестови за когнитивни и личности; 0,6 – 0,7 – пристап заснован на компетенции (центар за оценување). 27

Валидноста се однесува на степенот до кој даден резултат, метод или критериум ги „предвидува“ идните перформанси на лицето што се тестира. Валидноста на методите се однесува на заклучоците извлечени од одредена постапка, а не на самата постапка. Односно, самиот метод на селекција може да биде сигурен, но може да не одговара на одредена задача: можеби нема да го мери она што е потребно во овој случај. 28

Софтвер за развој на тестови Во домашната пракса се претставени различни сеопфатни програми со модулот „Психодијагностика“, на пример, програмата „1 C: Управување со плата и персонал 8.0“ со модулот „Психодијагностика“, развиена заедно со група наставници од Одделот за психологија на личноста и општа психологија на Факултетот за психологија Московскиот државен универзитет именуван по М.В.Ломоносов под водство на доктор по психијатрија. науки, проф. А.Н.Гушева. Симулатор за обука за развој на системи за проценка на персоналот и прилагодување на методите на тестирање на Факултетот за психологија на ТСУ, исто така развиен врз основа на „1 C: Enterprise 8.2“ од Personnel Soft. 29

Литература: Избор и регрутирање: технологии за тестирање и оценување / Доминик Купер, Иван Т. Робертсон, Гордон Тинлајн. – М., издавачка куќа „Вершина“, – 156 стр. Психолошка поддршка на професионалната активност: теорија и пракса / Ед. Проф. G. S. Никифорова. – Санкт Петербург: Говор, – 816 стр. триесет

Проблемот на тестирање на човековата физичка подготвеност развиен во теоријата и методологијата на физичкото образование, спортската метрологија, антропомоториката, биомеханиката, спортската медицина и другите науки. Во текот на приближно 130-140 години од историјата на овој проблем, акумулиран е огромен и разновиден материјал, кој отсекогаш предизвикувал и продолжува да предизвикува голем интерес не само кај научниците, туку и кај наставниците по физичко образование, тренерите, учениците и нивните родителите.

Првата статија посветена на проблемот што се разгледува е воведен. Ги открива основите на теоријата на тестови и тестирање, без запознавање со кои на наставникот му е тешко да ги реши проблемите со користење на тестови во практиката на неговата работа. Да наведеме барем некои од проблемите што се појавуваат. Што е „тест“? Која е класификацијата на тестовите? Зошто и дали е потребно да се тестира физичката подготвеност на учениците? Како да се одреди нивото (високо, средно, ниско) на развој на физичките квалитети и подготвеност? Што се смета за норма при тестирање и како да се постави? Ако наставникот смислил нов моторен тест или батерија од тестови за да ја утврди физичката подготвеност на децата, тогаш на што треба да внимава или кои неопходни услови (барања, критериуми) треба да ги исполни? Тестирањето на физичката состојба на учениците бара задолжително запознавање на наставникот со елементарните методи на математичка статистика. Кои?

Во нашите написи ќе презентираме и историски информации за појавата на тестови и теоријата за тестирање на човечката физичка подготвеност. Да речеме кога и каде се појавија првите тестови, вклучително и батерии од тестови за проценка на физичката подготвеност. Кои се најчестите тестови за одредување на кондиционирањето (сила, брзина, издржливост, флексибилност) и координативните способности на децата на училишна возраст? Кои батерии (програми) тестови за проценка на физичката подготвеност на децата и адолесцентите се најпопуларни во различни земји? Ќе разговараме и за толку важен практичен проблем како што е односот помеѓу резултатите од тестот и оценките (оценките) во предметот „Физичко образование“. Поконкретно, ако студентот постојано настапува на високо ниво на тестовите, дали тоа автоматски значи и одлична оценка по нашиот предмет? И така натаму.

Во оваа статија ќе разговараме за: 1) задачи за тестирање; 2) концептот на „тест“ и класификација на тестови на мотори (моторни); 3) критериуми за факторот на квалитет на моторните тестови; 4) организација на тестирање на физичката подготвеност на деца на училишна возраст.

1. Задачи за тестирање. Тестирањето на човечките моторни способности е една од најважните области на активност на научниците и наставниците во областа на физичкото образование и спортот. Помага во решавање на голем број сложени педагошки проблеми при идентификување на нивоата на развој на способности за кондиционирање и координација, оценување на квалитетот на техничката и тактичката подготвеност. Врз основа на резултатите од тестот, можно е да се спореди подготвеноста и на поединечни ученици и на цели групи студенти кои живеат во различни региони и земји; врши соодветна селекција за вежбање на еден или друг спорт, за учество на натпревари; спроведе прилично објективна контрола врз образованието (тренингот) на учениците и младите спортисти; да ги идентификуваат предностите и недостатоците на употребените средства, наставните методи и формите на организирање на наставата; конечно, да се поткрепат нормите (специфични за возраста, индивидуални) за физичката подготвеност на децата и адолесцентите.

а) научете ги самите ученици да го одредат нивото на нивната физичка подготвеност и да ги планираат потребните групи физички вежби за себе;

б) поттикнете ги учениците дополнително да ја подобрат својата физичка кондиција
(обрасци);

в) го знаат не толку почетното ниво на развој на моторната способност, туку неговата промена во одредено време;

г) стимулирајте ги учениците кои постигнале високи резултати, но не толку за постигнатото високо ниво на физичка подготвеност, колку за спроведување на планираното зголемување на личните резултати.

Експертите нагласуваат дека традиционалниот пристап кон тестирањето, кога податоците од стандардизираните тестови и стандарди се споредуваат со прикажаните резултати, предизвикува негативен став кај многу ученици, особено кај оние со ниски и просечни нивоа на физичка подготвеност. Тестирањето треба да помогне да се зголеми интересот на учениците, да им донесе радост и да не доведе до развој на комплекс на инфериорност. Во овој поглед, ги предлагаме следниве пристапи:

1) резултатите од тестот на студентот се утврдуваат не врз основа на споредба со стандардите, туку врз основа на промените што се случиле во одреден временски период;

2) сите компоненти на тестот се изменети, се користат лесни верзии на вежбите (задачите што ја сочинуваат содржината на тестот мора да бидат доволно лесни, така што веројатноста за нивно успешно завршување е голема);

3) нула оценки или оние со знак минус се исклучени, само позитивни резултати се подобни.

Значи, при тестирањето, важно е да се спојат научни (теоретски) задачи и лично значајни, позитивни мотиви за ученикот да учествува во оваа постапка.

2. Концептот на „тест“ и класификација на моторни (моторни) тестови.Терминот тест преведен од англиски значи примерок, тест. Тестовите се користат за решавање на многу научни и практични проблеми. Меѓу методите за проценка на физичката состојба на една личност (набљудување, стручни проценки), методот на тестирање (во нашиот случај, мотор или мотор) е главниот метод што се користи во спортската метрологија и другите научни дисциплини - „проучување на движењата“, теорија и методологија на физичко образование.

Тесте мерење или тест што се прави за да се утврди способноста или состојбата на една личност. Може да има многу такви мерења, вклучително и врз основа на употреба на широк спектар на физички вежби. Сепак, не секоја физичка вежба или тест може да се смета за тест. Само оние тестови (примероци) кои ги исполнуваат посебните барања и во согласност со кои мора да бидат:

а) се одредува целта на користење на кој било тест (или тестови);

б) развиена е стандардизирана методологија за мерење на резултатите од тестот и процедура за тестирање;

в) беше утврдена веродостојноста и информациската содржина на тестовите;

г) е имплементирана способноста да се презентираат резултатите од тестот во соодветниот систем за оценување.

Системот на користење тестови во врска со дадена задача, организирање услови, изведување тестови по предмети, вреднување и анализа на резултатите се нарекува. тестирање.Нумеричката вредност добиена при мерењата е резултати од тестот.

На пример, стоечкиот скок во далечина е тест; постапка за изведување на скокови и мерење резултати - тестирање; должина на скок - резултат од тестот.

Тестовите што се користат во физичкото образование се засноваат на моторни дејства (физички вежби, моторни задачи). Таквите тестови се нарекуваат мотор или мотор.

Во моментов, не постои унифицирана класификација на моторните тестови. Постои позната класификација на тестовите според нивната структура и преферираните индикации (види Табела 1).

Разликувајте единицаИ комплекстестови. Единица тестслужи за мерење и оценување на една особина (способност за координација или условување). Бидејќи структурата на секоја способност за координација или кондиционирање е сложена, таков тест обично проценува само една компонента на оваа способност (на пример, способност за рамнотежа, едноставна брзина на реакција, сила на мускулите на раката).

Со користење на едукативниТестот ја проценува способноста за моторно учење (врз основа на разликата помеѓу конечните и почетните резултати за одреден период на обука за техники на движење).

Тест серијаовозможува да се користи истиот тест долго време, кога измерената способност значително се подобрува. Во исто време, задачите за тестирање постојано се зголемуваат во тежина. За жал, овој тип на единечен тест сè уште не е широко користен и во науката и во практиката.

Со користење на комплексен тестоцени неколку знаци или компоненти на различни способности или иста способност (на пример, скокање од место - со бран на рацете, без бран на рацете, до дадена висина). Врз основа на таков тест, можете да добиете информации за нивото на способности за брзина и јачина (врз основа на висината на скокот), способности за координација (врз основа на точноста на диференцијација на напорите за моќ, разликата во висината на скокот со и без замав на рацете).

Тест профилсе состои од неколку посебни тестови врз основа на кои се оценуваат неколку различни физички способности (хетерогенатест профил) или повеќекратни манифестации на иста физичка способност (хомогенатест профил). Резултатите од тестот може да се претстават во форма на профил, што го овозможува тоа

Форми на тестови и можности за нивна употреба (според D.-D. Blume, 1987)

Табела 1

Тип	Мерлива способност	Знак на структура	Пример
Единица тест
Елементарен тест кој содржи една моторна задача		Еден тест цел, еден конечен тест резултат	Тест за рамнотежа, тремометар, тест за поврзување, тест за ритам, скок на точност на слетување
Тест за вежбање	Една способност или аспект (компонента) на способноста	Една или повеќе тест задачи. Еден последен резултат од тестот (наставен период)	Тест за општа студија
Тест серија	Една способност или аспект (компонента) на способноста	Еден тест проблем со опции или неколку проблеми со зголемена тежина	Тест за проценка на способноста за поврзување (комуникација)
Комплексен тест
Комплексен тест кој содржи една задача	Повеќе способности или аспекти (компоненти) на една способност	Една тест задача, повеќе завршни оценки	Тест за скокање
Тест со задача за повеќекратна употреба		Повеќе тест задачи се извршуваат последователно, повеќекратни финални евалуации	Тест за реакција за повеќекратна употреба
Тест профил	Повеќе способности или аспекти на една способност	Повеќе тестови, повеќе финални проценки	Координативна ѕвезда
Тестирајте ја батеријата	Повеќе способности или аспекти на една способност	Повеќе тестови, еден тест резултат	Тест батерија за проценка на способноста за моторно учење

брзо споредете ги индивидуалните и групните резултати.

Тестирајте ја батеријатаисто така се состои од неколку посебни тестови, чии резултати се комбинираат во една конечна оценка, разгледана во една од скалите за оценување (повеќе за ова во втората статија). Како и во профилот на тестот, тука разликуваме хомогенаИ хетерогенибатерии.

хомогена батерија,или хомоген профил се користат при оценувањето на сите компоненти на сложената способност (на пр., одзивност). Во овој случај, резултатите од поединечните тестови мора да бидат тесно поврзани (поврзани).

Хетероген тест профил или хетерогена батерија служи за проценка на комплекс (сет) на различни моторни способности. На пример, таквите тест батерии се користат за проценка на силата, брзината и способностите на издржливост - ова се батерии за тестови за физичка кондиција.

Во тестовите задачи за повеќекратна употребасубјектите извршуваат моторни задачи последователно и добиваат посебни оценки за секое решение на моторна задача. Овие проценки може да бидат тесно поврзани една со друга. Преку соодветни статистички пресметки може да се добијат дополнителни информации за способностите кои се оценуваат. Пример се последователно извршените задачи за тест за скок (Табела 2).

Дефиницијата за моторни тестови наведува дека тие ги проценуваат моторните способности и делумно моторните вештини. Затоа, во најопшт облик, се издвојуваат тестови за кондиционирање, тестови за координација и тестови за оценување на моторните способности и вештини (техники на движење). Оваа систематизација е сепак премногу општа.

Класификација на моторните тестови според нивните доминантни индикациипроизлегува од систематизацијата на физичките (моторните) способности. Во овој поглед, постојат тестови за кондиционирање(да се процени силата: максимална, брзина, издржливост на силата; да се процени издржливоста; да се проценат способностите за брзина; да се процени флексибилноста: активна и пасивна) и тестови за координација(да се процени коор

динамични способности поврзани со посебни независни групи на моторни дејства кои мерат посебни координативни способности; да се проценат специфичните координативни способности - способност за балансирање, просторна ориентација, одговор, диференцијација на параметрите на движењето, ритам, преуредување на моторните дејства, координација (комуникација), вестибуларна стабилност, доброволна мускулна релаксација.

Развиени се голем број тестови за проценка на моторичките вештини во различни спортови. Тие се дадени во соодветните учебници и прирачници и не се дискутирани во оваа статија.

Така, секоја класификација служи како еден вид насоки за избор (или креирање) на типот на тестови што најмногу одговара на целите на тестирањето.

3. Критериуми за квалитет за моторни тестови. Како што е наведено погоре, концептот на „тест на моторот“ ја исполнува својата цел доколку тестот ги задоволува релевантните основни критериуми: доверливост, стабилност, еквивалентност, објективност, содржина на информации, како и дополнителни критериуми: стандардизација, споредливост и економичност.

Тестовите кои ги исполнуваат барањата за доверливост и информациска содржина се нарекуваат добри или автентични (сигурни).

Веродостојноста на тестот се однесува на степенот на точност со кој тој проценува одредена моторна способност, без оглед на барањата на лицето кое го оценува. Доверливост е степенот до кој резултатите се конзистентни кога истите луѓе се тестираат постојано под исти услови; тоа е стабилност или стабилност на резултатот од тестот на поединецот кога се повторува тест вежбата. Со други зборови, ученик во група предмети, врз основа на резултатите од повтореното тестирање (на пример, индикатори за скокање, време на трчање, растојание за фрлање), постојано го задржува своето рангирање.

Веродостојноста на тестот се одредува со помош на корелациско-статистичка анализа со пресметување на коефициентот на веродостојност. Во овој случај, се користат различни методи за да се процени веродостојноста на тестот.

Стабилноста на тестот се заснова на односот помеѓу првиот и вториот обид, повторени по одредено време под исти услови од истиот експериментатор. Методот на повторено тестирање за да се одреди веродостојноста се нарекува повторно тестирање. Стабилноста на тестот зависи од видот на тестот, возраста и полот на субјектите и временскиот интервал помеѓу тестот и повторното тестирање. На пример, перформансите на тестовите за кондиционирање или морфолошките особини во кратки временски интервали се постабилни од перформансите на тестовите за координација; Кај постарите ученици резултатите се постабилни отколку кај помладите. Повторен тест обично се врши не подоцна од една недела подоцна. На подолги интервали (на пример, по еден месец), стабилноста на дури и такви тестови како трчање на 1000 m или скок во далечина станува значително помала.

Еквивалентноста на тестот лежи во корелацијата на резултатот од тестот со резултатите од другите тестови од ист тип. На пример, критериумот за еквивалентност се користи кога е неопходно да се избере кој тест посоодветно ги одразува брзинските способности: трчање на 30, 50, 60 или 100 m.

Овој или оној став кон еквивалентни (хомогени) тестови зависи од многу причини. Доколку е неопходно да се зголеми веродостојноста на проценките или заклучоците од студијата, тогаш препорачливо е да се користат два или повеќе еквивалентни тестови. И ако задачата е да се создаде батерија која содржи минимум тестови, тогаш треба да се користи само еден од еквивалентните тестови.

Табела 2 Секвенцијално извршени задачи од тестот за скок (според D.-D. Blume, 1987)

№№	Цел на тестот	Евалуација на резултатите	Способност
	Скокни до максимална висина без замавнувачки раце	Висина, см	Скокачка сила
	Скокни до максимална висина со замавнување на раката	Висина, см	Скокачка моќ и способност за поврзување
	Скокни до максимална висина со замавнување на раката и скокање	Висина, см	Поврзување и јачина на скокање
	10 скокови со замавнувања на рацете на растојание еднакво на 2/3 од максималната висина на скок, како во задача 2	Збир на отстапувања од дадена ознака	Способност да се разликуваат параметрите на моќноста на движењата
	Разликата помеѓу резултатите од решавање на еден проблем и два проблема	... цм	Способност за поврзување (комуникација)

Таквата батерија, како што е наведено, е хетерогена, бидејќи тестовите вклучени во неа мерат различни моторни способности. Пример за хетерогена тест батерија е возењето од 30 m, влечење, свиткување напред и трчање од 1000 m. Други примери на такви комплекси ќе бидат претставени во посебна публикација.

Веродостојноста на тестовите се одредува и со споредување на просечните резултати на парните и непарните обиди вклучени во тестот. На пример, просечната прецизност на фрлање топка во цел од 1, 3, 5, 7 и 9 обиди се споредува со просечната точност на фрлањата од 2, 4, 6, 8 и 10 обиди. Овој метод на проценка на веродостојноста се нарекува метод на удвојување или разделување и се користи првенствено при проценка на способностите за координација и во случај бројот на обиди што го формираат резултатот од тестот да биде најмалку шест.

Под објективност(конзистентност) на тестот се однесува на степенот на конзистентност на резултатите добиени на исти предмети од различни експериментатори (наставници, судии, експерти).

а) време, место, временски услови на тестирање;

б) унифицирана материјална и хардверска поддршка;

в) психофизиолошки фактори (волумен и интензитет на оптоварување, мотивација);

г) презентација на информации (прецизна вербална изјава на тест задачата, објаснување и демонстрација).

Усогласеноста со овие услови создава т.н објективноста на тестот.Зборуваат и за интерпретативна објективност,во врска со степенот на независност на толкувањето на резултатите од тестот од различни експериментатори.

Генерално, како што забележуваат експертите, веродостојноста на тестовите може да се зголеми на различни начини: построга стандардизација на тестирањето (види погоре), зголемување на бројот на обиди, подобра мотивација на субјектите, зголемување на бројот на оценувачи (судии , експерти), зголемување на конзистентноста на нивните мислења, зголемување на бројот на еквивалентни тестови.

Нема фиксни вредности за индикаторите за доверливост на тестот. Во повеќето случаи, се користат следните препораки: 0,95-0,99 - одлична сигурност; 0,90-0,94 - добро; 0,80-0,89 - прифатливо; 0,70-0,79 - лошо; 0,60-0,69 - сомнително за поединечни проценки, тестот е погоден само за карактеризирање на група субјекти. Информативна содржинана тестот е степенот на точност со кој се мери моторната способност или вештината што се оценува. Во странската и домашната литература, наместо зборот „информативност“, се користи терминот „валидност“ (од англискиот валидност - валидност, реалност, законитост). Всушност, во однос на информациската содржина, истражувачот одговара на две прашања: што мери овој конкретен тест (батерија на тестови) и кој е степенот на точност на мерењето.

Разликувајте валидностлогички (суштински), емпириски (врз основа на експериментални податоци) и предвидувачки. Подетални информации за оваа тема се содржани во сега веќе класичните учебници за студенти на универзитетите за физичко образование (Спортска метрологија / Уреди V.M. Zatsiorsky. - M.: FiS, 1982. - P. 73-80; Godik M.A. Sports metrology. - M. .: FiS, 1988), како и во голем број современи прирачници.

Важни дополнителни критериуми за тестирање, како што е наведено, се стандардизација, споредливост и ефикасност.

Суштината рационализирањее дека, врз основа на резултатите од тестот, можно е да се создадат стандарди кои се од особено значење за практиката (за ова ќе се дискутира во посебна статија).

Споредливосттест е способност да се споредат резултатите добиени од еден тест или неколку форми на паралелни (хомогени) тестови. Во практична смисла, употребата на споредливи моторни тестови ја намалува веројатноста дека, како резултат на редовна употреба на истиот тест, степенот на вештина се оценува не само и не толку колку и нивото на способност. Во исто време, споредливите резултати од тестот ја зголемуваат веродостојноста на заклучоците.

Суштината ефикасносткако критериум за квалитетот на тестот е тоа што за спроведување на тестот не е потребно долго време, големи материјални трошоци и учество на многу асистенти. На пример, батерија од шест тестови за одредување физичка подготвеност, препорачана во „Сеопфатна програма за физичко образование за ученици од I-XI одделение“ (М.: Prosveshcheniye, 2005-2006), може да ја спроведе наставник со две асистенти во една лекција, испитувајќи 25-30 деца.

Организација на тестирање на физичката подготвеност на деца на училишна возраст Вториот важен проблем за тестирање на моторните способности (потсетиме дека првиот - изборот на информативни тестови - беше дискутиран претходно) е организацијата на нивната употреба.

Наставникот по физичко образование мора да одреди кога е најдобро да се организира тестирање, како да се спроведе во училницата и колку често треба да се спроведува тестирањето.

Зачувај тестирањесе воспоставени во согласност со училишната програма, која предвидува задолжително тестирање на физичката подготвеност на учениците двапати дневно. Пожелно е првиот тест да се спроведе во втората или третата недела од септември (откако образовниот процес ќе се врати во нормала), а вториот две недели пред крајот на учебната година (подоцна може да има организациски потешкотии предизвикани од претстојните испити и празници).

Познавањето на годишните промени во развојот на моторните способности на учениците му овозможува на наставникот да направи соодветни прилагодувања на процесот на физичко образование за следната учебна година. Меѓутоа, наставникот може и треба да спроведува почесто тестирање и да врши таканаречена оперативна контрола. Препорачливо е да се изврши оваа постапка, на пример, за да се утврдат промените во нивото на брзина, способности за сила и издржливост под влијание на часовите по атлетика во текот на првиот квартал итн. За таа цел, наставникот може да користи тестови за да ги процени координативните способности на децата на почетокот и на крајот од совладувањето на образовниот материјал од училишната програма, на пример, во спортски игри, за да ги идентификува промените во индикаторите за развој на овие способности. .

Треба да се земе предвид дека разновидноста на педагошките проблеми што се решаваат не овозможуваат на наставникот да му се обезбеди унифицирана методологија за тестирање, исти правила за спроведување на тестови и оценување на резултатите од тестот. Ова бара експериментаторите (наставниците) да покажат независност во решавањето на теоретски, методолошки и организациски прашања за тестирање.

Тестирање на часмора да биде поврзан со неговата содржина. Со други зборови, употребениот тест (или тестови), предмет на соодветните барања за него како метод на истражување, треба (треба) органски да се вклучи во планираните физички вежби. Ако, на пример, учениците треба да го одредат нивото на развој на брзински способности или издржливост, тогаш треба да се закажат потребните тестови во оној дел од часот во кој ќе се решат задачите за развивање на соодветните физички способности.

Тест фреквенцијаво голема мера е определено од темпото на развој на специфичните физички способности, возраста, полот и индивидуалните карактеристики на нивниот развој.

На пример, за да се постигне значително зголемување на брзината, издржливоста или силата, потребни се неколку месеци редовно вежбање (тренинг). Во исто време, за да се добие значително зголемување на флексибилноста или индивидуалните координативни способности, потребни се само 4-12 тренинзи. Ако почнете од нула, може да постигнете подобрување на еден или друг физички квалитет за пократок временски период. Но, за да се подобри истиот квалитет, кога ќе достигне високо ниво кај ученикот, потребно е повеќе време. Во овој поглед, наставникот мора подлабоко да ги проучува карактеристиките на развојот и подобрувањето на различните моторни способности кај децата во различни периоди на возраст и пол.

Кога ја оценувате општата физичка подготвеност на учениците, како што е наведено, можете да користите широк спектар на тест батерии, чиј избор зависи од специфичните цели на тестирањето и достапноста на потребните услови. Сепак, поради фактот што добиените резултати од тестот може да се проценат само со споредба, препорачливо е да се изберат тестови кои се широко застапени во теоријата и практиката на физичкото образование на децата. На пример, потпирајте се на препорачаните во „Сеопфатна програма за физичко образование за ученици од I-XI одделение на сеопфатно училиште“ (М.: Просвешченије, 2004-2006).

За да се спореди општото ниво на физичка подготвеност на студент или група студенти кои користат сет тестови, тие прибегнуваат кон претворање на резултатите од тестот во поени или резултати (ќе зборуваме за ова подетално во следната статија). Промената на бројот на поени при повторено тестирање овозможува да се процени напредокот и на поединечно дете и на група деца.

Физичко воспитување на училиште, 2007 година, бр.6

Вовед

Релевантност. Проблемот со тестирање на физичката подготвеност на една личност е еден од најразвиените во теоријата и методологијата на физичкото образование. Во текот на изминатите децении, акумулирана е огромна и разновидна количина на материјал: дефинирање на задачи за тестирање; условеност на резултатите од тестот од различни фактори; развој на тестови за проценка на индивидуалните способности за условување и координација; тест програми кои ја карактеризираат физичката подготвеност на деца и адолесценти од 11 до 15 години, усвоени во Руската Федерација, во други земји од ЗНД и во многу странски земји.

Тестирањето на моторните квалитети на учениците е еден од најважните и основните методи на педагошка контрола.

Тоа помага да се решат голем број сложени педагошки проблеми: да се идентификуваат нивоата на развој на способности за кондиционирање и координација, да се процени квалитетот на техничката и тактичката подготвеност. Врз основа на резултатите од тестот, можете:

споредете ја подготвеноста и на индивидуалните ученици и на цели групи кои живеат во различни региони и земји;

спроведе спортска селекција за вежбање на еден или друг спорт, за учество на натпревари;

остваруваат во голема мера објективна контрола врз образованието (тренингот) на учениците и младите спортисти;

да ги идентификуваат предностите и недостатоците на употребените средства, наставните методи и формите на организирање на наставата;

конечно, да се поткрепат нормите (специфични за возраста, индивидуални) за физичката подготвеност на децата и адолесцентите.

Заедно со научните задачи во пракса во различни земји, задачите за тестирање се сведуваат на следново:

научете ги самите ученици да го одредат нивото на нивната физичка подготвеност и да ги планираат потребните комплети физички вежби за себе;

поттикнување на учениците дополнително да ја подобрат својата физичка кондиција (форма);

да се знае не толку почетното ниво на развој на моторната способност, туку неговата промена во одредено време;

поттикнете ги учениците кои постигнале високи резултати, но не толку за високо ниво, колку за планирано зголемување на личните резултати.

Во оваа работа ќе се потпреме на оние тестови што се препорачани во „Сеопфатна програма за физичко образование за ученици од 1-11 одделение од сеопфатно училиште“ подготвена од В.И. Лајах и Г.Б. Макссон.

Цел на студијата: да се поткрепи методологијата за тестирање на физичките квалитети на основците.

Истражувачка хипотеза: употребата на тестирање е точен, информативен метод за одредување на развојот на физичките квалитети.

Предмет на проучување: тестирањето како метод на педагошка контрола.

Предмет на истражување: тестирање на квалитетите на учениците.

Поглавје 1. ПОГЛЕДОВИ ЗА ТЕОРИЈАТА НА ТЕСТОВИ ЗА ФИЗИЧКА ФИТИНЕС

1.1 Кратки историски информации за теоријата на тестирање на моторните способности

Луѓето веќе долго време се заинтересирани за мерење на човечките моторни достигнувања. Првите информации за мерење на растојанието над кое се направени далечни скокови датираат од 664 п.н.е. д. На XXIX Олимписки игри од антиката во Олимпија, Хионис од Спарта прескокна растојание од 52 стапки, што е приближно 16,66 м. Јасно е дека зборуваме за повторен скок.

Познато е дека еден од основачите на физичкото образование, Ј.Ч.Ф. И за подобрување на нивните достигнувања, тој им додели „награди“ - дабови венци (Г. Сорм, 1977). Во триесеттите години на XIX век. Ајселен, вработена во познатиот германски учител Ф. Како што можете да видите, содржи три градации (Табела 1).

Табела 1. - Резултати во скокови (во см) за мажи (извор: К. Мекота, П. Блахус, 1983)

елементарен

Преку козата

Забележете дека веќе во средината на 19 век. во Германија, при одредување на должината или висината на скокот, се препорачува да се земат предвид параметрите на телото.

Точни мерења на спортските достигнувања, вклучувајќи ги и рекордните, се спроведуваат од средината на 19 век, а редовно од 1896 година, од Олимписките игри на наше време.

Долго време луѓето се обидуваат да ги измерат способностите на силата. Првата интересна информација за ова прашање датира од 1741 година, кога со помош на едноставни инструменти беше можно да се измери силата на борачот Томас Тофам. Тој подигнал тег чија маса надминува 830 кг (Г. Сорм, 1977). Јачините способности на учениците веќе беа измерени од Гутс-Мутс и Јан, користејќи едноставни мерачи на силата. Но, првиот динамометар, родоначалник на модерниот динамометар, го дизајнирал Рајнигер во Франција во 1807 година. Во практиката на физичко образование на учениците од гимназијата во Париз, тој бил користен од Ф. За мерење на силата користевме и кревање на телото додека висиме на шипка, свиткување и исправување на рацете како потпора и кревање тегови.

Претходниците на модерните батерии на тестови за одредување на физичката подготвеност се спортски и гимнастички сеопфатни настани. Првиот е античкиот петобој, воведен во пракса на XVIII Олимписки игри во антиката во 708 п.н.е. д. Тоа вклучуваше фрлање диск, фрлање копје, скокање, трчање и борење. Декатолонот каков што го знаеме првпат бил вклучен во натпреварувачката програма на III Олимписки игри (Сент Луис, САД, 1904 г.), а модерниот петобој на V Олимписки игри (Стокхолм, Шведска, 1912). Составот на вежбите во овие натпревари е хетероген; спортистот треба да покаже подготвеност во различни дисциплини. Значи, тој мора да биде физички разноврсен.

Веројатно, земајќи ја предвид оваа идеја, приближно во исто време (почеток на 20 век), во пракса беа воведени комплети вежби за деца, млади и возрасни, кои сеопфатно ја одредуваа физичката подготвеност на една личност. За прв пат, вакви сложени тестови беа воведени во Шведска (1906), потоа во Германија (1913), па дури и подоцна - во Австрија и СССР (Русија) - комплексот „Подготвен за труд и одбрана“ (1931).

Претходниците на современите моторни тестови се појавија кон крајот на 19 и почетокот на 20 век. Сарџент го воведе „тестот на силата“ во пракса на Универзитетот Харвард, кој, покрај динамометријата и спирометријата, вклучуваше туркање на рацете, кревање и спуштање на телото. Од 1890 година, овој тест се користи во 15 американски универзитети. Французинот Г. Хеберт создаде тест, чие објавување се појави во 1911 година. Тој вклучува 12 моторни задачи: трчање на различни растојанија, стоење и трчање скок, фрлање, повеќекратно подигање проектил од 40 килограми (тежина), пливање и нуркање. .

Да ги погледнеме накратко изворите на информации кои ги испитуваат резултатите од научните истражувања на лекарите и психолозите. Истражување на лекарите до крајот на 19 век. најчесто биле фокусирани на менување на надворешните морфолошки податоци, како и идентификување на асиметрија. Антропометријата што се користеше за овие цели одржуваше чекор со употребата на динамометријата. Така, белгискиот лекар A. Quetelet, откако извршил опсежно истражување, објавил дело во 1838 година, според кое просечните резултати на 'рбетот (рбетот) на 25-годишните жени и мажи се 53, односно 82 kg. Во 1884 година, Италијанецот А. Мосо ја проучувал издржливоста на мускулите. За да го направи тоа, тој користел ергограф, кој му овозможил да го набљудува развојот на замор со постојано свиткување на прстот.

Модерната ергометрија датира од 1707 година. Во тоа време беше создаден уред кој овозможи мерење на пулсот во минута. Прототипот на денешниот ергометар бил дизајниран од страна на G. A. Him во 1858 година. Циклоергометрите и трките за трчање биле создадени подоцна, во 1889-1913 година.

Кон крајот на 19 - почеток на 20 век. Започнува систематско истражување на психолози. Се проучува времето на реакција, а се развиваат тестови за да се одреди моторната координација и ритамот. Концептот на „време на реакција“ беше воведен во науката од австрискиот физиолог С. Екснер во 1873 година. Студентите на основачот на експерименталната психологија В. Вунт во лабораторијата создадена во 1879 година во Лајпциг извршија обемни мерења на времето на мирување и сложените реакции. Првите тестови за координација на моторот вклучуваа тапкање и различни типови на нишанење. Еден од првите обиди за проучување на целта е тестот на X. Frenkel, предложен од него во 1900 година. Неговата суштина беше да се држи показалецот во сите видови дупки, прстени итн. Ова е прототип на современи тестови "за статички и динамичен тремор“.

Обидувајќи се да го одреди музичкиот талент, во 1915 година S. E. Seashore ја испитуваше способноста за ритам.

Меѓутоа, теоријата на тестирање датира од крајот на 19 и почетокот на 20 век. Тогаш беа поставени основите на математичката статистика, без која модерната теорија на тестови не може да направи. На овој пат, несомнени заслуги имаат генетичарот и антрополог Ф. Галтон, математичарите Пирсон и У. Јул и математичарот-психолог С. Спирман. Токму овие научници создадоа нова гранка на биологијата - биометрика, која се заснова на мерења и статистички методи, како што се корелација, регресија, итн. фактор анализа - дозволено англиски научник Барт (С. Бурт) го примени во 1925 година за анализа на резултатите од моторните тестови на учениците во училиштата во Лондон. Како резултат на тоа, беа идентификувани физичките способности како сила, брзина, агилност и издржливост. Се истакна и факторот наречен „општа физичка подготвеност“. Нешто подоцна, беше објавено едно од најпознатите дела на американскиот научник МекКлој (S.N. McCloy, 1934) - „Мерење на општите моторни способности“. До почетокот на 40-тите. научниците доаѓаат до заклучок за сложената структура на човечките моторни способности. Користејќи различни моторни тестови во комбинација со употреба на паралелно развиени математички модели (единечна и повеќеваријатна анализа), теоријата на тестирање цврсто ги вклучи концептите на пет моторни способности: сила, брзина, моторна координација, издржливост и флексибилност.

Моторните тестови во поранешниот СССР беа користени за да се развијат контролни стандарди за комплексот „Подготвен за труд и одбрана“ (1931). Постои добро познат тест за моторни способности (главно координација на движењата), кој беше предложен за деца и млади од Н.И. Озерецки (1923). Работата за мерење на моторните способности на децата и младите се појави во исто време во Германија, Полска, Чехословачка и други земји.

Значителен напредок во развојот на теоријата за тестирање на физичката кондиција на човекот се случи во доцните 50-ти и 60-ти. XX век Основачот на оваа теорија најверојатно е Американецот МекКлој, кој во 1954 година заедно со М.

Книгата „Структура и мерење на физичките способности“ од познатиот американски истражувач Е.А. беше и сè уште е од големо теоретско значење. Флешман (1964). Книгата не само што ги отсликува теоретските и методолошките прашања на проблемот со тестирањето на овие способности, туку и ги прикажува конкретните резултати, опциите за пристапи, студиите за веродостојноста, информациската содржина (валидноста) на тестовите, а исто така презентира важен фактички материјал за структурата на факторите. на моторни тестови на различни моторни способности.

Од големо значење за теоријата на тестирање на физичките способности се книгите на В.М. Зациорски „Физички квалитети на спортист“ (1966) и „Кибернетика, математика, спорт“ (1969).

Кратки историски информации за тестирањето на физичката кондиција во поранешниот СССР може да се најдат во публикациите на E.Ya. Бондаревски, В.В. Кудрјавцев, Ју.И. Сбруева, В.Г. Панаева, Б.Г. Фадеева, П.А. Виноградова и други.

Конвенционално, може да се разликуваат три фази на тестирање во СССР (Русија):

Фаза 1 - 1920-1940 година - период на масовни прегледи со цел да се проучат главните показатели за физичкиот развој и нивото на моторна подготвеност, појавата врз основа на тоа на стандардите на комплексот „Подготвени за труд и одбрана“.

Фаза 2 -- 1946-1960 година -- проучување на моторната подготвеност во зависност од морфофункционалните карактеристики со цел да се создадат предуслови за научно и теоретско поткрепување на нивната врска.

Фаза 3 - од 1961 година до денес - период на сеопфатни студии за физичката состојба на населението во зависност од климатските и географските карактеристики на регионите на земјата.

Истражувањата спроведени во овој период покажуваат дека показателите за физичкиот развој и моторната кондиција на луѓето кои живеат во различни региони на земјата се детерминирани од влијанието на биолошките, климатско-географските, социо-економските и други постојани и променливи фактори. Според развиената унифицирана сеопфатна програма, која се состои од четири дела (физичка подготвеност, физички развој, функционална состојба на главните телесни системи, социолошки информации), во 1981 година се спроведе сеопфатно истражување на физичката состојба на населението од различни возрасти и полови во различни беа спроведени региони на СССР.

Нешто подоцна, нашите експерти забележаа дека нивото на физички развој и подготвеност на една личност се изучува повеќе од 100 години. Сепак, и покрај релативно големиот број на работи во оваа насока, не е можно да се спроведе длабока и сеопфатна анализа на добиените податоци, бидејќи студиите се вршени со различни контингенти, во различни сезонски периоди, користејќи различни методи, програми за тестирање. и математичка и статистичка обработка на добиените информации .

Во оваа насока, главниот акцент беше ставен на развивање методологија и организирање на унифициран систем за собирање податоци, земајќи ги предвид метролошките и методолошките барања и креирањето на банка на податоци на компјутер.

Во средината на 80-тите. минатиот век беше спроведена масовна анкета на Унијата на околу 200.000 луѓе на возраст од 6 до 60 години, што ги потврди заклучоците од претходната студија.

Од самиот почеток на појавата на научни пристапи за тестирање на човечката физичка подготвеност, истражувачите се обидоа да добијат одговори на две главни прашања:

кои тестови треба да се изберат за да се процени нивото на развој на одредена моторна (физичка) способност и нивото на физичка подготвеност на децата, адолесцентите и возрасните;

Колку тестови се потребни за да се добијат минимални и во исто време доволно информации за физичката состојба на една личност?

Во светот сè уште нема заеднички идеи за овие прашања. Во исто време, идеите за програмите за тестирање (батерии) кои ја карактеризираат физичката подготвеност на децата и адолесцентите од 6 до 17 години, усвоени во различни земји, стануваат сè поблиски.

1.2 Концептот на „тест“ и класификација на тестови на мотори (моторни).

Терминот тест преведен од англиски значи „примерок, тест“.

Тестовите се користат за решавање на многу научни и практични проблеми. Меѓу другите методи за проценка на физичката состојба на една личност (набљудување, стручни проценки), методот на тестирање (во нашиот случај, мотор или мотор) е главниот метод што се користи во спортската метрологија и другите научни дисциплини („проучување на движењата“, теорија и методи на физичко образование) .

Тест е мерење или тест што се прави за да се утврди способноста или состојбата на една личност. Може да има многу такви мерења, вклучително и врз основа на употреба на широк спектар на физички вежби. Сепак, не секоја физичка вежба или тест може да се смета за тест. Само оние тестови (примероци) кои ги исполнуваат посебните барања може да се користат како тестови:

целта на секој тест (или тестови) мора да биде дефинирана;

Треба да се развие стандардизирана методологија за мерење на тестот и процедура за тестирање;

неопходно е да се одреди веродостојноста и информациската содржина на тестовите;

резултатите од тестот може да се претстават во соодветниот систем за евалуација.

Системот на користење тестови во согласност со задачата, организацијата на условите, извршувањето на тестовите по предмети, вреднувањето и анализата на резултатите се нарекува тестирање, а нумеричката вредност добиена при мерењата е резултат на тестирање (тест). На пример, стоечкиот скок во далечина е тест; постапка на скокање и мерење на резултати - тестирање; должината на скокот е резултат од тестот.

Тестовите што се користат во физичкото образование се засноваат на моторни дејства (физички вежби, моторни задачи). Таквите тестови се нарекуваат тестови за движење или мотор.

Во моментов, не постои унифицирана класификација на моторните тестови. Постои позната класификација на тестовите според нивната структура и нивните примарни индикации (Табела 2).

Како што следува од табелата, се прави разлика помеѓу единечни и сложени тестови. Еден тест се користи за мерење и оценување на една особина (способност за координација или условување). Бидејќи, како што гледаме, структурата на секоја способност за координација или условување е сложена, таков тест, по правило, оценува само една компонента на таквата способност (на пример, способноста за балансирање, брзината на едноставна реакција, силата на мускулите на раката).

Табела 2. - Форми на тестови и можности за нивна употреба (според D.D. Blume, 1987)

Мерлива способност

Знак на структура

Единица тест

Елементарен тест кој содржи една моторна задача

Една способност или аспект (компонента) на способноста

Еден тест цел, еден конечен тест резултат

Тест за рамнотежа, тремометрија, тест за поврзување, тест за ритам

Тест за вежбање

Една или повеќе тест задачи. Еден последен резултат од тестот

Тест за општа студија

Тест серија

Една тест задача со опции или неколку задачи со зголемена тежина

Тест за проценка на способноста за поврзување (комуникација)

Комплексен тест

Комплексен тест кој содржи една задача

Повеќе способности или аспекти (компоненти) на една способност

Една тест задача, повеќе завршни оценки

Тест за скокање

Тест со задача за повеќекратна употреба

Повеќе тест задачи се извршуваат последователно, повеќекратни финални евалуации

Тест за реакција за повеќекратна употреба

Тест профил

Повеќе тестови, повеќе финални проценки

Задача за координација

Тестирајте ја батеријата

Повеќе тестови, еден тест резултат

Тест батерија за проценка на способноста за учење при движење

Со помош на тест за обука се проценува способноста за моторно учење (врз основа на разликата помеѓу конечните и почетните резултати за одреден период на обука во техники на движење).

Серијата тестови овозможува да се користи истиот тест во подолг временски период, кога способноста за мерење значително се подобрува. Во исто време, задачите за тестирање постојано се зголемуваат во тежина. За жал, овој тип на тест сè уште не е доволно користен и во науката и во практиката.

Со помош на сложен тест, се оценуваат неколку знаци или компоненти со различна или иста способност, на пример, скокање од место (со бран на рацете, без бран на рацете, до одредена висина). Врз основа на овој тест, можете да добиете информации за нивото на способности за брзина и јачина (врз основа на висината на скокот), способностите за координација (врз основа на точноста на диференцијација на напорите за моќ, разликата во висината на скокот со и без замав на рацете).

Профилот на тестот се состои од индивидуални тестови кои проценуваат или неколку различни физички способности (хетероген тест профил) или различни манифестации на иста физичка способност (хомоген тест профил). Резултатите од тестот може да се претстават во форма на профил, што овозможува споредба на индивидуалните и групните резултати.

Тест батеријата исто така се состои од неколку индивидуални тестови, чии резултати се комбинираат во една конечна оценка, разгледана во една од скалите за оценување (види Поглавје 2). Како и во профилот за тестирање, се прави разлика помеѓу хомогени и хетерогени батерии. Хомогената батерија, или хомогениот профил, наоѓа примена во проценката на сите компоненти на сложената способност (на пр. способност за реакција). Во овој случај, резултатите од поединечните тестови мора да бидат тесно меѓусебно поврзани (мора да корелираат).

Во тестовите на повеќе задачи, субјектите извршуваат моторни задачи последователно и добиваат посебни оценки за секое решение на моторна задача. Овие проценки може да бидат тесно поврзани една со друга. Преку соодветни статистички пресметки може да се добијат дополнителни информации за способностите кои се оценуваат. Пример се последователно решените задачи за тест за скок (Табела 3).

Табела 3. - Секвенцијално решени задачи за скок тест

Цел на тестот

Евалуација на резултатите

Способност

Максимален скок без замавнувачки раце

Скокачка сила

Максимален скок нагоре со замавнување на раката

Скокачка моќ и способност за поврзување

Максимален скок нагоре со бран на рацете и скок

Поврзување и јачина на скокање

10 скокови со замавнувања на рацете на растојание еднакво на 2/3 од максималната висина на скок, како во задача 2

Збир на отстапувања од дадена ознака

Способност да се разликуваат параметрите на моќноста на движењата

Разликата помеѓу резултатите за решавање на еден проблем и два проблема

Способност за поврзување (комуникација)

(според Д.Д. Блуме, 1987)

Дефиницијата за моторни тестови наведува дека тие ги проценуваат моторните способности и делумно моторните вештини. Во најопштата форма, постојат тестови за кондиционирање, тестови за координација и тестови за оценување на моторните способности и вештини (техники на движење). Оваа систематизација е сепак премногу општа. Класификацијата на моторните тестови според нивните примарни индикации произлегува од систематизацијата на физичките (моторните) способности.

Во овој поглед, постојат:

1) тестови за состојбата:

да се процени силата: максимална, брзина, издржливост на силата;

да се процени издржливоста;

да се проценат способностите за брзина;

да се процени флексибилноста - активна и пасивна;

2) тестови за координација:

да се проценат координативните способности поврзани со поединечни независни групи на моторни дејства кои мерат посебни координативни способности;

да се проценат специфичните координативни способности - способности за рамнотежа, ориентација во просторот, одговор, диференцијација на параметрите на движење, ритам, преструктуирање на моторните дејства, координација (комуникација),

вестибуларна стабилност, доброволна мускулна релаксација.

Концептот на „тестови за оценување на моторичките вештини“ не е дискутиран во оваа работа. Примери на тестови се дадени во Додаток 2.

Така, секоја класификација е еден вид насоки за избор (или креирање) на типот на тестови кои се поконзистентни со задачите за тестирање.

1.3 Критериуми за квалитет за моторни тестови

Концептот на „тест на моторот“ ја служи својата цел кога тестот ги задоволува релевантните барања.

Веродостојноста на тестот се однесува на степенот на точност со кој се проценува одредена моторна способност, без оглед на барањата на лицето кое го оценува. Доверливост е степенот до кој резултатите се конзистентни кога истите луѓе се тестираат постојано под исти услови; Ова е стабилност или стабилност на резултатот од тестот на поединецот кога се повторува контролната вежба. Со други зборови, детето во група предмети, врз основа на резултатите од повтореното тестирање (на пример, перформанси во скокање, време на трчање, растојание за фрлање), постојано го задржува своето рангирање.

Стабилноста на тестот се заснова на односот помеѓу првиот и вториот обид, повторени по одредено време под исти услови од истиот експериментатор. Методот на повторено тестирање за да се одреди веродостојноста се нарекува повторно тестирање. Стабилноста на тестот зависи од видот на тестот, возраста и полот на субјектите и временскиот интервал помеѓу тестот и повторното тестирање. На пример, перформансите на тестовите за кондиционирање или морфолошките особини во кратки временски интервали се постабилни од перформансите на тестовите за координација; Постарите деца имаат постабилни резултати од помладите. Повторниот тест обично се врши не подоцна од една недела подоцна. На подолги интервали (на пример, по еден месец), стабилноста на дури и такви тестови како трчање на 1000 m или скок во далечина станува значително помала.

Еквивалентноста на тестот лежи во корелацијата на резултатот од тестот со резултатите од другите тестови од ист тип (на пример, кога е неопходно да се избере кој тест посоодветно ги одразува брзинските способности: трчање 30, 50, 60 или 100 m).

Односот кон еквивалентни (хомогени) тестови зависи од многу причини. Доколку е неопходно да се зголеми веродостојноста на проценките или заклучоците од истражувањето, тогаш препорачливо е да се користат два или повеќе еквивалентни тестови. И ако задачата е да се создаде батерија која содржи минимум тестови, треба да се користи само еден од еквивалентните тестови. Таквата батерија, како што е наведено, е хетерогена, бидејќи тестовите вклучени во неа мерат различни моторни способности. Пример за хетерогена батерија на тестови е трчање од 30 m, повлекување, свиткување напред и трчање од 1000 m.

Веродостојноста на тестовите се одредува и со споредување на просечните резултати на парните и непарните обиди вклучени во тестот. На пример, просечната прецизност на ударите кон целта од 1, 3, 5, 7 и 9 обиди се споредува со просечната прецизност на ударите од 2, 4, 6, 8 и 10 обиди. Овој метод за проценка на веродостојноста се нарекува метод на удвојување или разделување. Се користи првенствено при проценка на координативните способности и во случај бројот на обиди што го формираат резултатот од тестот да биде најмалку 6.

Објективноста (конзистентноста) на тестот се подразбира како степен на конзистентност на резултатите добиени на исти предмети од различни експериментатори (наставници, судии, експерти).

За да се зголеми објективноста на тестирањето, неопходно е да се усогласат со стандардните услови за тестирање:

време на тестирање, локација, временски услови;

унифицирана материјална и хардверска поддршка;

психофизиолошки фактори (волумен и интензитет на оптоварување, мотивација);

презентација на информации (прецизна вербална изјава на тест задачата, објаснување и демонстрација).

Ова е таканаречената објективност на тестот. Тие зборуваат и за интерпретативна објективност, која се однесува на степенот на независност во толкувањето на резултатите од тестот од различни експериментатори.

Нема фиксни вредности за индикаторите за доверливост на тестот. Во повеќето случаи, се користат следните препораки: 0,95--0,99 - одлична сигурност; 0,90--0,94 - добро; 0,80--0,89 - прифатливо; 0,70--0,79 - лошо; 0,60-- 0,69 - сомнително за индивидуални проценки, тестот е погоден само за карактеризирање група субјекти.

Валидноста на тестот е степенот на точност со кој се мери моторната способност или вештината што се оценува. Во странската (и домашната) литература, наместо зборот „информативност“ се користи терминот „валидност“ (од англискиот валидност - валидност, реалност, законитост). Всушност, кога се зборува за информациска содржина, истражувачот одговара на две прашања: што мери овој конкретен тест (батерија на тестови) и кој е степенот на точност на мерењето?

Постојат неколку видови на валидност: логична (суштинска), емпириска (заснована на експериментални податоци) и предвидлива (2)

Важни дополнителни критериуми за тестирање се стандардизација, споредливост и ефикасност.

Суштината на стандардизацијата е дека, врз основа на резултатите од тестовите, можно е да се создадат стандарди кои се од особено значење за практиката.

Споредливост на тестот е способност да се споредат резултатите добиени од една или повеќе форми на паралелни (хомогени) тестови. Во практична смисла, употребата на споредливи моторни тестови ја намалува веројатноста дека, како резултат на редовна употреба на истиот тест, степенот на вештина се оценува не само и не толку колку и нивото на способност. Во исто време, споредливите резултати од тестот ја зголемуваат веродостојноста на заклучоците.

Суштината на економичноста како критериум за квалитетот на тестот е дека спроведувањето на тестот не бара долго време, големи материјални трошоци и учество на многу асистенти.

Заклучок

Претходниците на современите моторни тестови се појавија кон крајот на 19 и почетокот на 20 век. Од 1920 година, во нашата земја се спроведуваат масовни прегледи за проучување на главните показатели за физичкиот развој и нивото на моторна подготвеност. Врз основа на овие податоци, беа развиени стандардите на комплексот „Подготвени за труд и одбрана“.

Теоријата за тестирање цврсто ги вклучи концептите на пет моторни способности: сила, брзина, координација, издржливост и флексибилност. Развиени се голем број различни батерии за тестирање за да се проценат.

Меѓу методите за проценка на физичката состојба на една личност, методот на тестирање е главниот. Постојат единечни и сложени тестови. Исто така, во врска со систематизацијата на физичките (моторни) способности, тестовите се класифицираат на кондиционирање и координација.

Сите тестови мора да исполнуваат специфични барања. Главните критериуми вклучуваат: доверливост, стабилност, еквивалентност, објективност, информациска содржина (валидност). Дополнителните критериуми вклучуваат: стандардизација, споредливост и ефикасност.

Затоа, при изборот на одредени тестови, сите овие барања мора да бидат исполнети. За да се зголеми објективноста на тестовите, треба да се придржува до построга стандардизација на тестирањето, зголемување на бројот на обиди, подобра мотивација на субјектите, зголемување на бројот на оценувачи (судии, експерти), зголемување на конзистентноста на нивните мислења и зголемување на бројот на еквивалентни тестови.

Поглавје 2. Цели, методи и организација на студијата

2.1 Цели на истражувањето:

1. Проучи информации за теоријата на тестирање според литературни извори;

2. Анализирајте ја методологијата за тестирање на физичките квалитети;

3. Споредете ги показателите за моторна подготвеност на учениците од 7а и 7б одделение.

2.2 Истражувачки методи:

1. Анализа и синтеза на литературни извори.

Спроведено во текот на целата студија. Решавањето на овие проблеми на теоретско ниво се врши со проучување на литература за: теорија и методологија на физичко образование и спорт, едукација на физички квалитети, спортска метрологија. Анализирани се 20 литературни извори.

2. Вербално влијание.

Беа дадени инструкции за редоследот на изведување моторни тестови и мотивациски разговор за да се постави расположение за постигнување подобар резултат.

3. Тестирање на физичките квалитети.

30 метри трчање (од висок старт),

шатл трчање 3 x 10 метри,

стоечки скок во далечина,

6 минути трчање (м),

свиткување напред од седечка положба (cm),

влечење на шипката (девојки на ниско ниво).

4. Методи на математичка статистика.

Се користи за извршување на пресметки кои беа користени во компаративна анализа на учениците од 7а и 7б одделение.

2.3 Организација на студијата

Во првата фаза, во април 2009 година, беше извршена анализа на научната и методолошка литература:

· проучување на содржината на програмите за физичко образование за ученици од општо образование

Првата компонента, теоријата на тестот, содржи опис на статистички модели за обработка на дијагностички податоци. Содржи модели за анализа на одговорите во тест задачи и модели за пресметување на вкупните резултати од тестот. Муленберг (1980, 1990) го нарече ова „психометрија“. Класична теорија на тест, модерна теорија на тест (или модел за анализа на одговор на ставки - IRT), и

примероците на ставки ги сочинуваат трите најважни типови на модели на теорија на тест. Предмет на разгледување на психодијагностика се првите два модели.

Класична тест теорија. Повеќето интелектуални тестови и тестови на личноста се развиени врз основа на оваа теорија. Централниот концепт на оваа теорија е концептот на „сигурност“. Веродостојноста се однесува на конзистентноста на резултатите во повторените проценки. Во референтните книги, овој концепт обично се прикажува многу кратко, а потоа се дава детален опис на апаратот за математичка статистика. Во ова воведно поглавје ќе презентираме концизен опис на основното значење на забележаниот концепт. Во класичната теорија на тестови, веродостојноста се однесува на повторливоста на резултатите од неколку мерни постапки (главно мерења со помош на тестови). Концептот на доверливост вклучува пресметување на мерната грешка. Резултатите добиени за време на процесот на тестирање може да се претстават како збир на вистинскиот резултат и грешка во мерењето:

Кси = Ти+ Еј

Каде Ксие проценка на добиените резултати, Ti е вистинскиот резултат и Еј- грешка при мерење.

Оценката на добиените резултати е, по правило, бројот на точни одговори на задачите од тестот. Вистинскиот исход може да се смета како вистинска евалуација во платонска смисла (Gulliksen, 1950). Концептот на очекувани резултати е широко распространет, т.е. идеи за оценките што може да се добијат како резултат на голем број повторувања на процедури за мерење (Господ & Нович, 1968). Но, спроведувањето на истата процедура за оценување со едно лице не е можно. Затоа, неопходно е да се бараат други опции за решавање на проблемот (Witlman, 1988).

Овој концепт прави одредени претпоставки за вистински резултати и грешки во мерењето. Последните се земаат како независен фактор, што, се разбира, е сосема разумна претпоставка, бидејќи случајните флуктуации во резултатите не даваат коваријанси: r EE =0.

Се претпоставува дека не постои корелација помеѓу вистинските резултати и грешките во мерењето: rEE =0.

Вкупната грешка е 0, бидејќи Аритметичката средина се зема како вистинска проценка:

Овие претпоставки на крајот нè водат до добро познатата дефиниција за веродостојност како однос на вистинскиот резултат со вкупната варијанса или изразот: 1 минус соодносот, чиј броител е грешката на мерењето, а именителот е вкупната варијанса:

, ИЛИ

Од оваа формула за одредување на веродостојноста добиваме дека варијансата на грешката S 2 (E)еднаква на вкупната варијанса во бројот на случаи (1 - r XX "); така, стандардната грешка на мерењето се одредува со формулата:

По теоретско оправдување на веродостојноста и неговите деривати, потребно е да се одреди индексот на доверливост на одреден тест. Постојат практични процедури за оценување на веродостојноста на тестот, како што се користење на заменливи форми (паралелни тестови), поделба на ставките на два дела, повторно тестирање и мерење на внатрешната конзистентност. Секоја референтна книга содржи индекси на конзистентност на резултатите од тестот:

r XX ’ =r(x 1 , x 2)

Каде r XX' - коефициент на стабилност, и x 1 И x 2 - резултати од две мерења.

Концептот на доверливост на заменливи форми беше воведен и развиен од Гуликсен (1950). Оваа постапка е доста трудоинтензивна, бидејќи е поврзана со потребата да се создаде паралелна серија задачи

r XX ’ =r(x 1 , x 2)

Каде r XX' - коефициент на еквивалентност и x 1 И x 2 - два паралелни теста.

Следната постапка - делење на главното тесто на два дела А и Б - е полесна за употреба. Резултатите добиени од двата дела на тестот се во корелација. Користејќи ја формулата Спирман-Браун, се проценува веродостојноста на тестот како целина:

каде A и B се два паралелни делови од тестот.

Следниот метод е да се одреди внатрешната конзистентност на тест задачите. Овој метод се заснова на одредување на коваријансите на поединечните задачи. Sg е варијанса на случајно избрана задача, а Sgh е коваријанса на две случајно избрани задачи. Најчесто користен коефициент за одредување на внатрешната конзистентност е Кронбаховата алфа. Се користи и формулата KR20 и λ-2(ламбда-2).

Класичниот концепт на доверливост ги дефинира мерните грешки кои се јавуваат и за време на тестирањето и за време на набљудувањата. Изворите на овие грешки се различни: тоа може да бидат лични карактеристики, карактеристики на условите за тестирање и самите тест задачи. Постојат специфични методи за пресметување на грешки. Знаеме дека нашите набљудувања може да испаднат погрешни, нашите методолошки алатки се несовршени, исто како што и самите луѓе се несовршени. (Како да не се сеќаваме на Шекспир: „Недоверлив си ти, чие име е човек“). Фактот дека во класичната теорија на тестовите грешките во мерењето се експлицитни и објаснети е важна позитивна точка.

Теоријата на класичните тестови има голем број значајни карактеристики кои исто така може да се сметаат како нејзини недостатоци. Некои од овие карактеристики се забележани во референтните книги, но нивната важност (од секојдневна гледна точка) не е често нагласена, ниту пак се забележува дека од теоретска или методолошка гледна точка тие треба да се сметаат за недостатоци.

Прво. Теоријата на класичните тестови и концептот на веродостојност се фокусирани на пресметување на вкупните резултати од тестовите, кои се резултат на собирање на резултатите добиени во поединечни задачи. Да, кога работите

Второ. Коефициентот на доверливост вклучува проценка на количината на дисперзија на измерените индикатори. Следи дека коефициентот на доверливост ќе биде помал ако (другите индикатори се еднакви) примерокот е похомоген. Не постои единствен коефициент на внатрешна конзистентност на тестовите; овој коефициент е секогаш „контекстуален“. Крокер и Алгина (1986), на пример, предлагаат специјална формула за „хомогена корекција на примерокот“ дизајнирана за највисоките и најниските резултати добиени од испитаниците. Важно е дијагностичарот да ги знае карактеристиките на варијација во популацијата на примерокот, инаку нема да може да ги користи коефициентите на внатрешна конзистентност наведени во прирачникот за овој тест.

Трето. Феноменот на редукција на аритметичка средина е логична последица на класичниот концепт на доверливост. Ако резултатот од тестот варира (т.е. не е доволно сигурен), тогаш можно е кога постапката ќе се повтори, субјектите со ниски оценки да добијат повисоки оценки, а обратно, субјектите со високи оценки да добијат низок резултат. Овој артефакт на процедурата за мерење не треба да се смета за вистинска промена или манифестација на развојните процеси. Но, во исто време не е лесно да се направи разлика меѓу нив, бидејќи ... никогаш не може да се исклучи можноста за промена во текот на развојот. За да бидете целосно сигурни, неопходна е споредба со контролната група.

Четвртата карактеристика на тестовите развиени во согласност со принципите на класичната теорија е присуството на нормативни податоци. Познавањето на нормите на тестот му овозможува на истражувачот адекватно да ги толкува резултатите на испитаниците. Надвор од нормите, резултатите од тестовите се бесмислени. Развивањето стандарди за тестови е прилично скапа работа, бидејќи психологот мора да ги добие резултатите од тестот од репрезентативен примерок.

2 Да тер Лаак

Ако зборуваме за недостатоците на класичниот концепт на доверливост, тогаш е соодветно да се цитира изјавата на Siytsma (1992, стр. 123-125). Тој забележува дека првата и главна претпоставка на класичната теорија на тестот е дека резултатите од тестовите го следат принципот на интервал. Сепак, не постојат студии за поддршка на оваа претпоставка. Во суштина, тоа е „мерење според произволно воспоставено правило“. Оваа карактеристика ја става класичната теорија на тест во неповолна положба во споредба со скалите за мерење на ставови и, се разбира, во споредба со модерната теорија на тестови. Многу методи на анализа на податоци (варијансна анализа, регресивна анализа, корелација и факторска анализа) се засноваат на претпоставката за постоење на интервална скала. Сепак, тоа нема цврста основа. Разгледувањето на скалата на вистински резултати како скала на вредности на психолошки карактеристики (на пример, аритметички способности, интелигенција, невротичност) може само да се претпостави.

Втората забелешка се однесува на фактот дека резултатите од тестот не се апсолутни показатели за една или друга психолошка карактеристика на лицето што се тестира, тие треба да се сметаат само како резултати од еден или друг тест. Два теста може да имаат намера да ги испитаат истите психолошки карактеристики (на пример, интелигенција, вербална способност, екстраверзија), но тоа не значи дека двата теста се еквивалентни или имаат исти способности. Споредувањето на перформансите на две лица тестирани со различни тестови е неточно. Истото важи и за истиот испитувач кој пополнува два различни теста. Третата точка се однесува на претпоставката дека стандардната грешка во мерењето е иста за кое било ниво на индивидуална способност што се мери. Сепак, не постои емпириски тест за оваа претпоставка. На пример, не постои гаранција дека испитувачот со добри математички вештини ќе постигне високи резултати на релативно едноставен аритметички тест. Во овој случај, лице со ниски или просечни способности е поверојатно да добие висок рејтинг.

Во рамките на модерната теорија на тест или теоријата на анализа на одговорите, ставките од тестот содржат опис на голем

број на модели на можни одговори од испитаниците. Овие модели се разликуваат по претпоставките што се во основата на нив, како и по барањата за добиените податоци. Моделот Раш често се смета за синоним за теории за анализа на одговор на ставки (1RT). Всушност, ова е само еден од моделите. Формулата претставена во неа за опишување на карактеристичната крива на задачата g е следна:

Каде е- посебна тест задача; експ- експоненцијална функција (нелинеарна зависност); δ („делта“) - нивото на тежина на тестот.

Други тест ставки, на пр. ч,добиваат и свои карактеристични кривини. Исполнет услов δ h >δ g (gзначи дека ч- потешка задача. Затоа, за која било вредност на индикаторот Θ („тета“ - латентни својства на способностите на испитаниците) веројатност за успешно завршување на задачата чпомалку. Овој модел се нарекува строг бидејќи е очигледно дека со низок степен на изразување на особини, веројатноста за завршување на задачата е блиску до нула. Во овој модел нема простор за погодување или нагаѓање. За задачите со повеќекратен избор, нема потреба да се прават претпоставки за веројатноста за успех. Покрај тоа, овој модел е строг во смисла дека сите ставки за тестирање мора да имаат иста дискриминаторска способност (високата дискриминативност се рефлектира во стрмнината на кривата; овде е можно да се конструира Гутманова скала, според која во секоја точка од карактеристична крива веројатноста за завршување на задачата варира од О до 1). Поради оваа состојба, не сите ставки можат да бидат вклучени во тестовите базирани на моделот Rasch.

Постојат неколку варијанти на овој модел (на пример, Birnbaura, 1968; Види Lord & Novik). Овозможува постоење на задачи со различна дискриминација

способност.

Холандскиот истражувач Мокен (1971) разви два модели за анализирање на одговорите на тест ставките кои се помалку строги од моделот Раш и затоа можеби пореални. Како основен услов

Via Mokken го поставува предлогот дека карактеристичната крива на задачата треба да следи монотоно, без прекини. Сите тест задачи се насочени кон проучување на истата психолошка карактеристика, која треба да се мери В.Секоја форма на оваа зависност е дозволена додека не се прекине. Според тоа, обликот на карактеристичната крива не се одредува со некоја специфична функција. Оваа „слобода“ ви овозможува да користите повеќе тест ставки, а нивото на оценување не е повисоко од вообичаеното.

Методологијата на моделите на одговор на ставки (IRT) се разликува од онаа на повеќето експериментални и корелациски студии. Математичкиот модел е дизајниран да ги проучува бихејвиоралните, когнитивните, емоционалните карактеристики, како и развојните феномени. Овие феномени за кои станува збор често се ограничени на одговори на ставки, што го наведува Меленберг (1990) да го нарече ИРТ „мини-теорија на однесување“. Резултатите од студијата може, до одреден степен, да се претстават како криви на конзистентност, особено во случаи кога недостасува теоретско разбирање на карактеристиките што се проучуваат. Досега ни стојат на располагање само неколку тестови за интелигенција, способност и личност создадени врз основа на бројни модели на теоријата на ИРТ. Варијантите на Rasch моделот почесто се користат во развојот на тестовите за постигања (Verhelst, 1993), додека моделите на Mokken се посоодветни за развојни феномени (види, исто така, Поглавје 6).

Одговорот на испитувачот на ставките за тестирање е основната единица на IRT моделите. Типот на одговор се одредува според степенот на изразување на карактеристиката што се изучува кај една личност. Таква карактеристика може да биде, на пример, аритметички или просторни способности. Во повеќето случаи, ова е еден или друг аспект на интелигенција, карактеристики на достигнувања или особини на личноста. Се претпоставува дека постои нелинеарна врска помеѓу положбата на дадена личност во одреден опсег на карактеристиките што се проучуваат и веројатноста за успешно завршување на одредена задача. Нелинеарноста на оваа зависност е во одредена смисла интуитивна. Познати фрази „Секој почеток е тежок“ (бавно не-

линеарен почеток) и „Да се стане светец не е толку лесно“ значи дека понатамошното подобрување по достигнувањето одредено ниво е тешко. Кривата полека се приближува, но речиси никогаш не достигнува 100% стапка на успех.

Некои модели прилично противречат на нашето интуитивно разбирање. Да го земеме овој пример. Лице со доброволен карактеристичен индекс на интензитет од 1,5 има 60 проценти веројатност за успех во извршувањето на задачата. Ова е во спротивност со нашето интуитивно разбирање на таквата ситуација, бидејќи можете или успешно да се справите со задачата или воопшто да не се справите со неа. Да го земеме овој пример: човек се обидува 100 пати да достигне висина од 1m 50 cm Успехот го придружува 60 пати, т.е. има стапка на успех од 60 проценти.

За да се процени сериозноста на некоја карактеристика, потребни се најмалку две задачи. Моделот Раш вклучува одредување на сериозноста на карактеристиките без оглед на тежината на задачата. Ова исто така е спротивно на нашата интуиција: да претпоставиме дека некое лице има 80% шанси да скокне над 1,30 m. на скокање над 1,50 м веројатност за скок над 1,70 м Затоа, без оглед на вредноста на независната променлива (висина), можно е да се процени способноста на лицето да скока високо.

Постојат околу 50 IRT модели (Goldstein & Wood, 1989).Постојат многу нелинеарни функции кои ја опишуваат (објаснуваат) веројатноста за успех при завршување на задача или група задачи. Барањата и ограничувањата на овие модели се различни, а овие разлики може да се откријат со споредување на моделот Rasch и скалата Mokken. Барањата на овие модели вклучуваат:

1) потребата да се одреди карактеристиката што се проучува и да се процени положбата на личноста во опсегот на оваа особина;

2) оценување на редоследот на задачите;

3) проверка на специфични модели. Во психометријата, развиени се многу процедури за тестирање на моделот.

Некои референтни книги ја дискутираат теоријата на ИРТ како форма на анализа на ставките за тестирање (види, на пример,

Крокер и Алгина, Ј 986). Сепак, може да се тврди дека IRT е „мини-теорија за мини-однесување“. Застапниците на теоријата на ИРТ забележуваат дека ако концептите (моделите) на средно ниво се несовршени, тогаш што може да се каже за посложените конструкции во психологијата?

Класични и модерни тест теории. Луѓето не можат а да не ги споредат работите кои изгледаат речиси исто. (Можеби секојдневниот еквивалент на психометријата главно се состои од споредување на луѓето за значајни карактеристики и избор меѓу нив.) Секоја од презентираните теории - теоријата за мерење на грешките во проценката и математичкиот модел на одговорите на тестот - има свои поддржувачи (Голдштајн и Вуд, 1986).

IRT моделите не се обвинети дека се „проценки засновани на правила“ како класичната теорија на тестови. IRT моделот е фокусиран на анализа на карактеристиките што се оценуваат. Карактеристиките на личноста и карактеристиките на задачата се оценуваат со помош на скали (редни или интервални). Покрај тоа, можно е да се споредат перформансите на различни тестови насочени кон проучување на слични карактеристики. Конечно, доверливоста не е иста за секоја вредност на скалата, а просечните резултати се генерално посигурни од оценките на почетокот и на крајот на скалата. Така, IRT моделите се чини дека се теоретски посупериорни. Исто така, постојат разлики во практичната употреба на модерната теорија на тест и класичната теорија (Sijstma, 1992, стр. 127-130). Модерната теорија на тестови е посложена во споредба со класичната, па затоа поретко ја користат неспецијалисти. Покрај тоа, IRT има специфични барања за задачи. Ова значи дека предметите мора да бидат исклучени од тестот доколку не ги исполнуваат барањата на моделот. Ова правило понатаму се однесува на оние задачи кои биле дел од широко користените тестови изградени врз принципите на класичната теорија. Тестот станува пократок и, според тоа, неговата сигурност се намалува.

IRT обезбедува математички модели за проучување на феномени од реалниот свет. Моделите треба да ни помогнат да ги разбереме клучните аспекти на овие феномени. Сепак, тука лежи главното теоретско прашање. Моделите може да се земат предвид

како пристап кон проучување на сложената реалност во која живееме. Но, моделот и реалноста не се иста работа. Според песимистичкото гледиште, можно е да се моделираат само изолирани (а не најинтересните) типови на однесување. Може да се сретнете и со изјавата дека реалноста воопшто не може да се моделира, бидејќи тој се покорува повеќе од само причинско-последични закони. Во најдобар случај, можно е да се моделираат индивидуалните (идеални) феномени на однесувањето. Постои уште еден, пооптимистички поглед на можностите за моделирање. Горенаведената позиција ја блокира можноста за длабоко разбирање на природата на феномените на човековото однесување. Примената на еден или друг модел покренува некои општи, фундаментални прашања. Според наше мислење, нема сомнеж дека IRT е концепт теоретски и технички супериорен во однос на класичната теорија на тестови.

Практичната цел на тестовите, без разлика на која теоретска основа се создадени, е да се утврдат значајни критериуми и врз нивна основа да се утврдат карактеристиките на одредени психолошки конструкти. Дали моделот IRT има предности и во овој поглед? Можно е тестовите засновани на овој модел да не предвидуваат попрецизно од тестовите засновани на класичната теорија и можно е нивниот придонес во развојот на психолошките конструкции да не е позначаен. Дијагностичарите претпочитаат критериуми кои се директно релевантни за поединецот, институцијата или заедницата. Моделот кој е научно понапреден „ipso facto“* не дефинира посоодветен критериум и е до одреден степен ограничен во објаснувањето на научните конструкции. Очигледно е дека ќе продолжи развојот на тестови засновани на класична теорија, но истовремено ќе се создадат нови IRT модели кои ќе се прошират на проучување на поголем број психолошки феномени.

Во класичната теорија на тестот, се разликуваат концептите на „сигурност“ и „валидност“. Резултатите од тестот мора да бидат сигурни, т.е. резултатите од првичното и повторното тестирање треба да бидат конзистентни. Освен тоа,

* ipso facto(лак) - само по себе (приближно превод.).

резултатите треба да бидат ослободени (колку што е можно) од грешки во проценката. Валидноста е еден од барањата за добиените резултати. Во овој случај, веродостојноста се смета како неопходен, но сè уште не доволен услов за валидноста на тестот.

Концептот на валидност сугерира дека наодите се однесуваат на нешто важно во практична или теоретска смисла. Заклучоците извлечени од резултатите од тестовите мора да бидат валидни. Најчесто зборуваат за два вида валидност: предвидувачка (критериум) и конструктивна. Постојат и други видови на валидност (види Поглавје 3). Покрај тоа, валидноста може да се утврди во случај на квази-експерименти (Cook & Campbell, 1976, Cook & Шадиш, 1994). Сепак, главниот тип на валидност е сепак предвидувачката валидност, која се подразбира како способност да се предвиди нешто значајно за идното однесување од резултатот од тестот, како и можност за подлабоко разбирање на одредена психолошка особина или квалитет.

Видовите на валидност презентирани се дискутирани во секоја референтна книга и се придружени со опис на методите за анализа на валидноста на тестот. Факторската анализа е посоодветна за одредување на валидноста на конструкцијата, а линеарните регресивни равенки се користат за анализа на предвидувачката валидност. Одредени карактеристики (академски перформанси, ефективност на терапијата) може да се предвидат врз основа на еден или повеќе индикатори добиени при работа со интелектуални или тестови на личноста. Техниките за обработка на податоци како што се корелација, регресија, анализа на варијанса, анализа на парцијални корелации и варијанси се користат за одредување на предвидувачката валидност на тестот.

Исто така често се опишува валидноста на содржината. Се претпоставува дека сите задачи и задачи на тестот мора да припаѓаат на одредена област (ментални својства, однесување итн.). Концептот на валидност на содржината ја карактеризира кореспонденцијата на секој тест ставка со измерениот домен. Валидноста на содржината понекогаш се гледа како дел од веродостојноста или „генерализирањето“ (Кронбах, Глесер, Нанда & Раџаратнам, 1972). Меѓутоа, кога

При изборот на задачи за тестови за постигања во одредена предметна област, важно е да се внимава и на правилата за вклучување задачи во тестот.

Во класичната теорија на тестови, веродостојноста и валидноста се третираат релативно независно една од друга. Но, постои друго разбирање за односот помеѓу овие концепти. Модерната теорија на тестови се заснова на употреба на модели. Параметрите се проценуваат во рамките на одреден модел. Доколку некоја задача не ги исполнува барањата на моделот, тогаш во рамките на овој модел таа се смета за неважечка. Потврдувањето на конструкцијата е дел од верификацијата на самиот модел. Оваа валидација првенствено се однесува на тестирање на постоење на еднодимензионална латентна карактеристика од интерес со познати карактеристики на размер. Резултатите од скалата секако може да се користат за да се утврдат соодветните мерки и тие можат да се поврзат со мерки на други конструкции за да се соберат информации за конвергентната и дивергентната валидност на конструкцијата.

Психодијагностиката е слична на јазикот, опишана како единство на четири компоненти претставени на три нивоа. Првата компонента, теоријата на тестот, е аналогна на синтаксата, граматиката на јазикот. Генеративната граматика е, од една страна, генијален модел, а од друга, систем кој ги почитува правилата. Со помош на овие правила, сложените реченици се градат врз основа на едноставни потврдни реченици. Во исто време, сепак, овој модел остава настрана опис на тоа како е организиран комуникацискиот процес (што се пренесува и што се перципира), и за кои цели се спроведува. Разбирањето на ова бара дополнително знаење. Истото може да се каже и за теоријата на тестови: таа е неопходна во психодијагностиката, но не е во состојба да објасни што прави психодијагностичарот и кои се неговите цели.

1.3.2. Психолошки теории и психолошки конструкции

Психодијагностиката е секогаш дијагноза на нешто специфично: лични карактеристики, однесување, размислување, емоции. Тестовите се дизајнирани да ги проценат индивидуалните разлики. Постојат неколку концепти

индивидуални разлики, од кои секоја има свои карактеристични карактеристики. Ако се препознае дека психодијагностиката не е ограничена само на проценка на индивидуалните разлики, тогаш другите теории стануваат суштински за психодијагностика. Пример е проценката на разликите во процесите на менталниот развој и разликите во социјалната средина. Иако проценката на индивидуалните разлики не е неопходен атрибут на психодијагностиката, сепак постојат одредени традиции на истражување во оваа област. Психодијагностиката започна со проценка на разликите во интелигенцијата. Главната цел на тестовите беше „да се утврди наследното пренесување на генијот“ (Галон) или изборот на деца за обука (Бине, Сајмон). Мерењето на коефициентот на интелигенција доби теоретско разбирање и практичен развој во делата на Спирман (Велика Британија) и Тарстон (САД). Рејмонд Б. Кател направи слична работа за да ги процени карактеристиките на личноста. Психодијагностиката станува нераскинливо поврзана со теориите и идеите за индивидуалните разлики во достигнувањата (проценка на максималните способности) и формите на однесување (ниво на типично функционирање). Оваа традиција продолжува да биде ефективна и денес. Во учебниците за психодијагностика, многу поретко се оценуваат разликите во социјалната средина во споредба со разгледувањето на карактеристиките на самите развојни процеси. Нема разумно објаснување за ова. Од една страна, дијагностиката не е ограничена на одредени теории и концепти. Од друга страна, потребни се теории, бидејќи токму во нив се одредува содржината што се дијагностицира (т.е. „што“ се дијагностицира). На пример, интелигенцијата може да се смета и како општа карактеристика и како основа за многу способности независни една од друга. Ако психодијагностиката се обиде да „избега“ од оваа или онаа теорија, тогаш основата на психодијагностичкиот процес станува идеи за здрав разум. Истражувањето користи различни методи на анализа на податоци, а општата логика на истражувањето го одредува изборот на еден или друг математички модел и ја одредува структурата на употребените психолошки концепти. Ваквите методи на математичка статистика

ki, како што се анализа на варијанса, регресивна анализа, факторска анализа и пресметка на корелации, претпоставуваат постоење на линеарни зависности. Доколку овие методи се користат погрешно, тие ја „воведуваат“ својата структура во добиените податоци и употребените конструкции.

Идеите за разликите во социјалната средина и развојот на личноста речиси и да немаа влијание врз психодијагностиката. Учебниците (види, на пример, Murphy & Davidshofer, 1988) ја испитуваат класичната теорија на тестови и дискутираат за релевантните методи на статистичка обработка, опишуваат добро познати тестови и дискутираат за употребата на психодијагностика во пракса: во психологијата на менаџментот, во изборот на персоналот, во оценувањето човечки психолошки карактеристики.

Теориите за индивидуалните разлики (како и идеите за разликите меѓу социјалните средини и менталниот развој) се аналогни на проучувањето на семантиката на јазикот. Ова е проучување на суштината, содржината и значењето. Значењата се структурирани на одреден начин (слично на психолошките конструкции), на пример, со сличност или контраст (аналогија, конвергенција, дивергенција).

1.3.3. Психолошки тестови и други методолошки алатки

Третата компонента на предложената шема се тестови, процедури и методолошки средства со помош на кои се собираат информации за карактеристиките на личноста. Дрене и Сијтсма (1990, стр. 31) ги дефинираат тестовите на следниов начин: „Психолошкиот тест се смета како класификација според одреден систем или како постапка на мерење што овозможува да се донесе одреден суд за еден или повеќе емпириски изолирани или теоретски базирани карактеристики на специфичен аспект на човековото однесување (за во рамките на тест-ситуацијата). Во овој случај, се испитува одговорот на испитаниците на одреден број внимателно избрани стимули, а добиените одговори се споредуваат со нормите за тестирање.

Дијагностиката бара тестови и техники за собирање сигурни, точни и валидни информации за карактеристиките

и карактеристични особини на личноста, за човечкото размислување, емоции и однесување. Покрај развојот на процедурите за тестирање, оваа компонента ги вклучува и следниве прашања: како се креираат тестовите, како се формулираат и избираат задачите, како се одвива процесот на тестирање, кои се барањата за условите за тестирање, како се земаат предвид грешките при мерењето , како се пресметуваат и толкуваат резултатите од тестот.

Процесот на развој на тестот прави разлика помеѓу рационални и емпириски стратегии. Примената на рационална стратегија започнува со дефинирање на основните концепти (на пример, концептот на интелигенција, екстраверзија), а задачите за тестирање се формулираат во согласност со овие концепти. Пример за таква стратегија е концептот на анализа на аспекти (теоријата на аспект) на Гутман (1957, 1968, 1978). Прво, се одредуваат различни аспекти на главните конструкции, потоа задачите и задачите се избираат на таков начин што секој од овие аспекти се зема предвид. Втората стратегија е дека задачите се избираат на емпириска основа. На пример, ако истражувачот се обидува да создаде тест за професионален интерес што ќе ги разликува лекарите од инженерите, ова ќе биде процедурата. Двете групи на испитаници мора да одговорат на сите тестови, а оние ставки за кои се пронајдени статистички значајни разлики се вклучени во финалниот тест. Ако, на пример, постојат разлики меѓу групите во одговорите на изјавата „Сакам да рибам“, тогаш таа изјава станува елемент на тестот. Централната премиса на оваа книга е дека тестот е поврзан со концептуална или таксономска теорија која ги дефинира овие карактеристики.

Целта на тестот обично е дефинирана во упатствата за неговата употреба. Тестот мора да биде стандардизиран за да може да ги процени разликите помеѓу поединци наместо помеѓу условите за тестирање. Меѓутоа, постојат отстапувања од стандардизацијата во постапките наречени „тестирање на границите“ и „тестови за учење потенцијал“. Во овие услови, на испитаникот му се помага во процесот

тестирање и потоа проценете го ефектот на таквата постапка врз резултатот. Објективно е бодувањето за одговорите на задачите, т.е. спроведено во согласност со стандардна процедура. Толкувањето на добиените резултати исто така е строго дефинирано и се врши врз основа на стандардите за тестирање.

Третата компонента на психодијагностиката - психолошки тестови, инструменти, процедури - содржи одредени задачи кои се најмали единици на психодијагностика и во оваа смисла задачите се слични на фонемите на еден јазик. Бројот на можни комбинации на фонеми е ограничен. Само одредени фонемски структури можат да формираат зборови и реченици кои обезбедуваат информацијата да му се пренесе на слушателот. Исто така Итест задачи: само во одредена комбинација едни со други можат да станат ефективно средство за проценка на соодветниот конструкт.