Презентирање на основата на теоријата на тестови по физичко образование. Теорија на тест и тестирање на физичката подготвеност на учениците

ИЗВЕШТАЈ

ученик 137 гр. Иванова И.

за тестирање на ефективноста на методите за обука
користејќи методи на математичка статистика

Деловите од извештајот се составуваат во согласност со примероците дадени во овој прирачник на крајот од секоја фаза од играта. Пополнетите извештаи се чуваат на Катедрата за биомеханика до консултација пред испитот. Учениците кои не се пријавиле за сработеното и не ја доставиле тетратката со извештајот до наставникот, не смеат да полагаат испит по спортска метрологија.


Фаза I од деловната игра
Контрола и мерење во спортот

Цел:

1. Запознајте се со теоретските основи на контрола и мерење во спортот и физичкото образование.

2. Стекнувајте вештини за мерење на индикаторите за изведба на брзина кај спортистите.

1. Физичка контрола
образование и спорт

Физичкото образование и спортската обука не е спонтан, туку контролиран процес. Во секој момент, едно лице е во одредена физичка состојба, која главно се одредува според здравјето (усогласеност на виталните знаци со нормата, степенот на отпорност на телото на неповолни ненадејни влијанија), физиката и состојбата на физичките функции. .

Препорачливо е да се управува со физичката состојба на една личност менувајќи ја во вистинската насока. Ова управување се врши со помош на физичко образование и спорт, кои, особено, вклучуваат физички вежби.

Се чини само дека наставникот (или тренерот) ја контролира физичката состојба, влијаејќи на однесувањето на спортистот, т.е. нудење на одредени физички вежби, како и следење на исправноста на нивното спроведување и добиените резултати. Во реалноста, однесувањето на спортистот не го контролира тренерот, туку самиот спортист. За време на спортските тренинзи се влијае на системот на самоуправување (човечкото тело). Индивидуалните разлики во состојбата на спортистите не даваат доверба дека истото влијание ќе предизвика ист одговор. Затоа, прашањето за повратни информации е релевантно: информации за состојбата на спортистот добиени од тренерот за време на контролата на процесот на обука.

Контролата во физичкото образование и спортот се заснова на мерење на индикатори, избирање на најзначајните и нивна математичка обработка.

Управувањето со процесот на образование и обука вклучува три фази:

1) собирање информации;

2) негова анализа;

3) одлучување (планирање).

Собирањето информации обично се врши при сеопфатна контрола, чии цели се:

1) натпреварувачка активност;

2) оптоварувања за обука;

3) состојбата на спортистот.



Постојат (В.А. Запорожанов) три типа на состојби на спортист во зависност од времетраењето на интервалот потребен за премин од една во друга состојба.

1. Исценирано(постојана) состојба. Зачувано релативно долго -недели или месеци. Комплексна карактеристика на етапната состојба на спортистот, што ја одразува неговата способност да покаже спортски достигнувања, се нарекува подготвеност, а состојбата на оптимална (најдобра за даден тренинг циклус) подготвеност се нарекува спортска униформа. Очигледно, состојба на атлетска кондиција не може да се постигне или изгуби во рок од еден или неколку дена.

2. Актуелнодржава. Промени под влијание на еден или неколку класи. Честопати, последиците од учеството на натпревари или обуката извршена во една од часовите се одолговлекуваат неколку дена. Во овој случај, спортистот обично забележува феномени и од неповолна природа (на пример, болки во мускулите) и позитивни (на пример, состојба на зголемени перформанси). Ваквите промени се нарекуваат ефект на одложен тренинг.

Тековната состојба на спортистот ја одредува природата на следните тренинзи и големината на оптоварувањата во нив. Посебен случај на моменталната состојба, кој се карактеризира со подготвеност да се изврши натпреварувачка вежба во наредните денови со резултат близок до максимумот, се нарекува моментална подготвеност.

3. Оперативнидржава. Промени под влијание еднократно извршувањефизичка вежба и е привремена (на пример, замор предизвикан од трчање на растојание еднаш; привремено зголемување на перформансите по загревањето). Оперативната состојба на спортистот се менува за време на тренинг сесијата и треба да се земе предвид при планирање на интервали за одмор помеѓу приоди, повторени трки, кога се одлучува за препорачливоста за дополнително загревање итн. Посебен случај на оперативна состојба, која се карактеризира со непосредна подготвеност да се изврши натпреварувачка вежба со резултат близок до максимумот, се нарекува оперативна готовност.

Во согласност со горенаведената класификација, постојат три главни типа на следење на состојбата на спортистот:

1) контрола на сцената. Неговата цел е да ја процени сценската состојба (подготвеност) на спортистот;

2) тековната контрола. Неговата главна задача е да ги одреди секојдневните (тековни) флуктуации во состојбата на спортистот;

3) оперативна контрола. Неговата цел е брза проценка на состојбата на спортистот во моментот.

Мерењето или тестот извршен за да се одреди состојбата или способноста на спортистот се нарекува тест. Постапката за мерење или тестирање се нарекува тестирање.

Секој тест вклучува мерење. Но, не секое мерење служи како тест. Како тестови може да се користат само оние што ги задоволуваат следните метролошки барања: барања:

2) стандардизација;

3) присуство на систем за оценување;

4) веродостојност и информациска содржина (фактор за квалитет) на тестовите;

5) вид на контрола (фаза по фаза, тековна или оперативна).

Тестот заснован на моторни задачи се нарекува мотор. Постојат три групи на моторни тестови:

1. Контролни вежби, во кои спортистот има задача да покаже максимални резултати. Резултатот од тестот е моторно достигнување. На пример, времето кое му е потребно на спортистот да истрча на растојание од 100 m.

2. Стандардни функционални тестови, при кои задачата, иста за сите, се дозира или според обемот на извршената работа, или според големината на физиолошките промени. Резултатот од тестот е физиолошки или биохемиски индикатори за време на стандардна работа или моторни достигнувања со стандардна количина на физиолошки промени. На пример, процентуалното зголемување на отчукувањата на срцето по 20 сквотови или брзината со која спортистот трча со фиксен пулс од 160 отчукувања во минута.

3. Максимални функционални тестови, при што спортистот мора да покаже максимални резултати. Резултатот од тестот е физиолошки или биохемиски индикатори при максимална работа. На пример, максимална потрошувачка на кислород или максимален долг за кислород.

Тестирањето со висок квалитет бара познавање на теоријата на мерење.


Клучни прашања: Тестот како мерна алатка. Основни теории за тестирање. Функции, можности и ограничувања на тестирањето. Примена на тестови при проценка на персоналот. Предности и недостатоци на користење на тестови. Форми и видови на тест задачи. Технологија за изградба на задачи. Проценка на квалитетот на тестот. Сигурност и валидност. Тест софтвер за развој. 2




Тестот како мерна алатка Основни поими во тестологијата: мерење, тест, содржина и форма на задачи, веродостојност и валидност на резултатите од мерењето. Дополнително, тестологијата користи такви концепти на статистичката наука како примерок и општа популација, просечни индикатори, варијација, корелација, регресија итн. 4




Тест-задача е дидактички и технолошки ефикасна единица на контролен материјал, дел од тестот што ги исполнува барањата за суштинска чистота на содржината (или еднодимензионалност), суштинска и логичка исправност, исправност на формата и прифатливост на геометриската слика. на задачата. 6




Традиционалниот тест е стандардизиран метод за дијагностицирање на нивото и структурата на подготвеноста. Во таков тест, сите субјекти одговараат на исти задачи, во исто време, под исти услови и со исти правила за оценување на одговорите. За да се постигне целта за тестирање, може да се создадат безброј тестови и сите тие можат да бидат релевантни за постигнување на целта. 8


Професиограмот (од латински: Professio speciality + Gramma record) е систем на карактеристики кои опишуваат одредена професија, а исто така вклучува листа на норми и барања што оваа професија или специјалност ги наметнува на вработен. Конкретно, професиограмот може да вклучува листа на психолошки карактеристики што претставниците на одредени професионални групи мора да ги исполнат. 9


Основни теории за тестирање Првите научни трудови за теоријата на тестови се појавија на почетокот на дваесеттиот век, на пресекот на психологијата, социологијата, педагогијата и другите т.н. бихејвиорални науки. Странските психолози оваа наука ја нарекуваат психометрика (Психометрика), а наставниците педагошко мерење (Образовно мерење). Незаматено од идеологија и политика, толкувањето на името „тестологија“ е едноставно и транспарентно: наука за тестовите. 10


Првата фаза е праисторијата - од антиката до крајот на 19 век, кога биле широко распространети преднаучните облици на контрола на знаењата и способностите; вториот период, класичен, траеше од раните 20-ти до крајот на 60-тите, при што беше создадена класичната теорија на тестови; третиот период - технолошки - започна во 70-тите - време на развој на методи на адаптивно тестирање и обука, методологија за ефективен развој на тестови и тест ставки за параметарско оценување на предметите според измерениот латентен квалитет. единаесет


Функции, способности и ограничувања на тестирањето Тестовите што се користат при изборот се дизајнирани да добијат психолошки портрет на кандидатот, да ги проценат неговите способности, како и професионалните знаења и вештини. Тестовите ви овозможуваат да ги споредувате кандидатите едни со други или со стандардите, односно идеалниот кандидат. Тестовите се користат за мерење на квалитетите што му се потребни на едно лице за ефикасно да ја изврши работата. Некои тестови се дизајнирани така што работодавачот го спроведува тестот и ги пресметува резултатите. Други бараат услуги од искусни консултанти за да обезбедат правилна примена. 12


Ограничувањата на употребата на тестовите се поврзани со нивната скапа администрација; - со соодветност за оценување на човечките способности; - тестовите се поуспешни во предвидувањето на успехот во работата што содржи краткорочни професионални задачи, а не се многу погодни во случаи кога задачите што се решаваат на работа траат неколку дена или недели. 13








2. Користената терминологија треба да биде прилагодена на специфичната целна публика. Исто така, неопходно е да се исклучат непотребни написи или написи кои вклучуваат две или повеќе прашања, бидејќи понекогаш го збунуваат испитаникот и го отежнуваат толкувањето. 17


3. За да ги задоволите сите овие барања, треба да ја разгледате целата банка на прашања член по член и да анализирате за каква цел служи секој од нив. На пример, ако се развива тест за мерење на аналитичката способност на сметководителите приправници, вреди да се размисли што значи „аналитичка способност“ во овој случај. 18




5. Откако ќе се изберат прашањата и форматите за бодување, тие треба да се претворат во формат погодна за корисниците, со јасно напишани упатства и пример прашања; за кандидатите кои го полагаат тестот целосно да разберат што се бара од нив. 20


6. Многу често во оваа фаза на развој, во тестот се вклучени повеќе прашања отколку што е потребно. Според некои проценки, три пати повеќе од она што ќе остане во последниот тест или мерниот систем. Првичната мерка потоа ќе биде тестирање на тестот што се развива на релативно широк примерок од постоечки работници за да се осигура дека сите прашања се лесно разбирливи. 21


7. Тестовите на знаење обично започнуваат со едноставни прашања кои кон крајот постепено стануваат потешки. Кога тестовите се наменети да ги измерат социјалните ставови и карактеристиките на личноста, може да биде корисно да се менуваат негативно и позитивно формулирани ставки за да се избегнат лошо замислените одговори. 22


8. Последниот чекор вклучува спроведување на тестот на широко репрезентативен примерок за да се воспостават стандарди за изведба, доверливост и валидност пред да се користи како алатка за селекција. Дополнително, неопходно е да се одреди валидноста на тестот за да се осигура дека тој не дискриминира ниту една подгрупа на населението (на пример, етнички разлики). 23


Проценка на квалитетот на тестот За методите на селекција да бидат доволно ефективни, тие мора да бидат сигурни, валидни и доверливи. Веродостојноста на методот на селекција се карактеризира со неговиот имунитет на систематски грешки во мерењето, односно неговата конзистентност под различни услови. 24


Во пракса, веродостојноста во донесувањето проценки се постигнува со споредување на резултатите од два или повеќе слични тестови спроведени во различни денови. Друг начин да се зголеми веродостојноста е да се споредат резултатите од неколку алтернативни методи за селекција (на пример, тест и интервју). Ако резултатите се слични или исти, тие може да се сметаат за точни. 25


Веродостојноста значи дека преземените мерења ќе го дадат истиот резултат како и претходните, односно дека резултатите од проценката не се под влијание на фактори од трета страна. Валидноста значи дека методот го мери токму она што е наменето да го измери. Максималната можна точност на информациите добиени со специјално развиени методи во научното истражување е ограничена од технички фактори и не надминува 0,8. 26


Во практиката на селекција на кадри, се забележува дека веродостојноста на различните методи на оценување се наоѓа во интервалите: 0,1 – 0,2 – традиционално интервју; 0,2 – 0,3 – препораки; 0,3 – 0,5 – стручни тестови; 0,5 – 0,6 – структурирано интервју, интервју засновано на компетентност; 0,5 – 0,7 – тестови за когнитивни и личности; 0,6 – 0,7 – пристап заснован на компетенции (центар за оценување). 27


Валидноста се однесува на степенот до кој даден резултат, метод или критериум ги „предвидува“ идните перформанси на лицето што се тестира. Валидноста на методите се однесува на заклучоците извлечени од одредена постапка, а не на самата постапка. Односно, самиот метод на селекција може да биде сигурен, но може да не одговара на одредена задача: можеби нема да го мери она што е потребно во овој случај. 28


Софтвер за развој на тестови Во домашната пракса се претставени различни сеопфатни програми со модулот „Психодијагностика“, на пример, програмата „1 C: Управување со плата и персонал 8.0“ со модулот „Психодијагностика“, развиена заедно со група наставници од Одделот за психологија на личноста и општа психологија на Факултетот за психологија Московскиот државен универзитет именуван по М.В.Ломоносов под водство на доктор по психијатрија. науки, проф. А.Н. Гушева. Симулатор за обука за развој на системи за проценка на персоналот и прилагодување на методите на тестирање на Факултетот за психологија на ТСУ, исто така развиен врз основа на „1 C: Enterprise 8.2“ од Personnel Soft. 29


Литература: Избор и регрутирање: технологии за тестирање и оценување / Доминик Купер, Иван Т. Робертсон, Гордон Тинлајн. – М., издавачка куќа „Вершина“, – 156 стр. Психолошка поддршка на професионалната активност: теорија и пракса / Ед. Проф. G. S. Никифорова. – Санкт Петербург: Говор, – 816 стр. триесет

Апликациите, целите и целите на тестирањето на софтверот се различни, така што тестирањето се оценува и објаснува на различни начини. Понекогаш им е тешко на самите тестери да објаснат што е тестирање на софтвер „како што е“. Настанува конфузија.

За да ја разреши оваа конфузија, Алексеј Баранцев (практичар, тренер и консултант за тестирање на софтвер; родум од Институтот за системско програмирање на Руската академија на науките) му претходи на неговите обуки за тестирање со воведно видео за главните одредби за тестирање.

Ми се чини дека во овој извештај предавачот можеше најадекватно и најбалансирано да објасни „што е тестирање“ од гледна точка на научник и програмер. Чудно е што овој текст сè уште не се појавил на Хабре.

Овде давам кондензирано прераскажување на овој извештај. На крајот од текстот има линкови до целосната верзија, како и до споменатото видео.

Основи за тестирање

Драги колеги,

Прво, да се обидеме да разбереме што НЕ е тестирањето.

Тестирањето не е развој,

Дури и ако тестерите знаат како да програмираат, вклучувајќи тестови (тестирање на автоматизација = програмирање), тие можат да развијат некои помошни програми (за себе).

Сепак, тестирањето не е активност за развој на софтвер.

Тестирањето не е анализа,

А не активноста на собирање и анализа на барањата.

Иако, за време на процесот на тестирање, понекогаш треба да ги разјасните барањата, а понекогаш да ги анализирате. Но, оваа активност не е главната, туку треба да се направи едноставно од потреба.

Тестирањето не е управување,

И покрај фактот дека во многу организации постои таква улога како „тест менаџер“. Се разбира, тестерите треба да се управуваат. Но, тестирањето само по себе не е управување.

Тестирањето не е техничко пишување,

Сепак, тестерите треба да ги документираат своите тестови и нивната работа.

Тестирањето не може да се смета за една од овие активности само затоа што за време на процесот на развој (или анализирање на барањата или пишување документација за нивните тестови), тестерите ја вршат целата оваа работа за мене, а не за некој друг.

Една активност е значајна само кога е барана, односно тестерите мора да произведат нешто „за извоз“. Што прават „за извоз“?

Дефекти, описи на дефекти или извештаи за тестирање? Ова е делумно точно.

Но, ова не е целата вистина.

Главните активности на тестерите

е тоа што на учесниците во проект за развој на софтвер им обезбедуваат негативни повратни информации за квалитетот на софтверскиот производ.

„Негативните повратни информации“ немаат никаква негативна конотација и не значи дека тестерите прават нешто лошо или дека прават нешто лошо. Тоа е само технички термин што значи прилично едноставна работа.

Но, оваа работа е многу значајна, и веројатно единствената најзначајна компонента на активностите на тестерите.

Постои наука - „теорија на системи“. Тој го дефинира концептот на „повратна информација“.

„Повратни информации“ се некои податоци што се враќаат на влезот од излезот, или некој дел од податоците што се враќаат на влезот од излезот. Овој фидбек може да биде позитивен или негативен.

И двата типа на повратни информации се подеднакво важни.

Во развојот на софтверски системи, позитивните повратни информации се, се разбира, некој вид на информации што ги добиваме од крајните корисници. Тоа се барања за некоја нова функционалност, ова е зголемување на продажбата (ако пуштиме квалитетен производ).

Негативните повратни информации можат да дојдат и од крајните корисници во форма на некои негативни критики. Или може да дојде од тестери.

Колку побрзо се обезбеди негативна повратна информација, толку помалку енергија е потребна за да се измени тој сигнал. Тоа е причината зошто тестирањето треба да започне што е можно порано, во најраните фази на проектот, и да ги обезбеди овие повратни информации и во фазата на дизајнирање и, можеби, дури и порано, во фазата на собирање и анализа на барањата.

Патем, тука расте разбирањето дека тестерите не се одговорни за квалитетот. Тие им помагаат на оние кои се одговорни за тоа.

Синоними за терминот „тестирање“

Од гледна точка дека тестирањето е обезбедување на негативни повратни информации, светски познатата кратенка QA (Quality Assurance) дефинитивно НЕ е синоним за терминот „тестирање“.

Само давање негативни повратни информации не може да се смета за обезбедување на квалитет, бидејќи гаранцијата е некои позитивни мерки. Разбирливо е дека во овој случај обезбедуваме квалитет и преземаме навремени мерки за да обезбедиме подобрување на квалитетот на развојот на софтверот.

Но, „контрола на квалитет“ - Контрола на квалитет, може да се смета во широка смисла како синоним за терминот „тестирање“, бидејќи контролата на квалитетот е обезбедување на повратни информации во нејзините најразновидни сорти, во различни фази на софтверски проект.

Понекогаш тестирањето се подразбира како посебна форма на контрола на квалитетот.

Конфузијата доаѓа од историјата на развојот на тестирањето. Во различни времиња, терминот „тестирање“ значеше различни дејства кои можат да се поделат во 2 големи класи: надворешни и внатрешни.

Надворешни дефиниции

Дефинициите кои Мајерс, Бејзер и Канер ги дадоа во различни времиња го опишуваат тестирањето токму од гледна точка на неговото НАДВОРЕШНО значење. Односно, од нивна гледна точка, тестирањето е активност која е наменета ЗА нешто, а не се состои од нешто. Сите три од овие дефиниции може да се сумираат како давање негативна повратна информација.

Внатрешни дефиниции

Ова се дефиниции кои се содржани во стандард за терминологија што се користи во софтверското инженерство, како што е де факто стандардот наречен SWEBOK.

Ваквите дефиниции конструктивно објаснуваат КАКВА е активноста за тестирање, но не даваат ни најмала идеја за тоа ЗОШТО е потребно тестирање, за што потоа ќе се користат сите резултати добиени од проверката на кореспонденцијата помеѓу вистинското однесување на програмата и нејзиното очекувано однесување. .

тестирањето е

  • проверка на усогласеноста на програмата со барањата,
  • врши со набљудување на неговата работа
  • во посебни, вештачки создадени ситуации, избрани на одреден начин.
Оттука натаму, ова ќе го сметаме за работна дефиниција за „тестирање“.

Општата шема за тестирање е приближно како што следува:

  1. Тестерот ја добива програмата и/или барањата на влезот.
  2. Тој прави нешто со нив, ја набљудува работата на програмата во одредени ситуации вештачки создадени од него.
  3. На излезот добива информации за совпаѓања и несовпаѓања.
  4. Овие информации потоа се користат за подобрување на постоечката програма. Или со цел да се променат барањата за програма што сè уште се развива.

Што е тест

  • Ова е посебна, вештачки создадена ситуација, избрана на одреден начин,
  • и опис на тоа какви забелешки да се направат за работата на програмата
  • да провери дали исполнува некои барања.
Нема потреба да се претпоставува дека ситуацијата е нешто моментално. Тестот може да биде доста долг, на пример, при тестирање на перформансите, оваа вештачки создадена ситуација може да биде оптоварување на системот што продолжува доста долго. А набљудувањата што треба да се направат се збир од различни графикони или метрики што ги мериме за време на извршувањето на овој тест.

Развивачот на тестови е ангажиран во изборот на ограничен сет од огромен, потенцијално бесконечен сет на тестови.

Па, така можеме да заклучиме дека тестерот прави две работи за време на тестирањето.

1. Прво, го контролира извршувањето на програмата и ги создава овие многу вештачки ситуации во кои ќе го провериме однесувањето на програмата.

2. И, второ, го набљудува однесувањето на програмата и го споредува она што го гледа со она што се очекува.

Ако тестерот ги автоматизира тестовите, тогаш тој самиот не го набљудува однесувањето на програмата - тој ја делегира оваа задача на посебна алатка или специјална програма што тој самиот ја напишал. Таа е таа што набљудува, го споредува набљудуваното однесување со очекуваното, а на тестерот му дава само некој конечен резултат - дали набљудуваното однесување се совпаѓа со очекуваното или не се совпаѓа.

Секоја програма е механизам за обработка на информации. Влезот е информација во една форма, а излезот е информација во некоја друга форма. Во исто време, програмата може да има многу влезови и излези, тие можат да бидат различни, односно програмата може да има неколку различни интерфејси, а овие интерфејси може да имаат различни типови:

  • Кориснички интерфејс (UI)
  • Програмски интерфејс за апликации (API)
  • Мрежен протокол
  • Датотечниот систем
  • Состојба на животната средина
  • Настани
Најчестите интерфејси се
  • обичај,
  • графички,
  • текст,
  • конзолен,
  • и говорот.
Користејќи ги сите овие интерфејси, тестерот:
  • некако создава вештачки ситуации,
  • и проверува како се однесува програмата во овие ситуации.

Ова е тестирање.

Други класификации на типови на тестирање

Најчесто користена поделба на три нивоа е
  1. единица тестирање,
  2. интеграциско тестирање,
  3. системско тестирање.
Тестирањето на единици обично значи тестирање на прилично ниско ниво, односно тестирање на поединечни операции, методи и функции.

Системското тестирање се однесува на тестирање на ниво на кориснички интерфејс.

Понекогаш се користат и некои други термини, како што е „тестирање на компоненти“, но јас претпочитам да ги истакнам овие три, поради фактот што технолошката поделба помеѓу тестирањето на единицата и системот нема многу смисла. Истите алатки и истите техники може да се користат на различни нивоа. Поделбата е условена.

Практиката покажува дека алатките што се позиционирани од производителот како алатки за тестирање на единици може да се користат со еднаков успех на ниво на тестирање на целата апликација како целина.

И алатките што ја тестираат целата апликација на ниво на кориснички интерфејс понекогаш сакаат да погледнат, на пример, во базата на податоци или да повикаат некоја посебна зачувана процедура таму.

Односно, поделбата на тестирање на системот и единицата е генерално кажано чисто условно, зборувајќи од техничка гледна точка.

Се користат истите алатки, и тоа е нормално, се користат истите техники, на секое ниво можеме да зборуваме за тестирање од различен тип.

Ние комбинираме:

Односно, можеме да зборуваме за единечно тестирање на функционалноста.

Можеме да зборуваме за системско тестирање на функционалноста.

Можеме да зборуваме за тестирање на единицата, на пример, ефикасност.

Можеме да зборуваме за тестирање на ефективноста на системот.

Или ја разгледуваме ефективноста на еден алгоритам, или ја разгледуваме ефективноста на целиот систем како целина. Односно, технолошката поделба на единица и системско тестирање нема многу смисла. Бидејќи истите алатки, истите техники може да се користат на различни нивоа.

Конечно, за време на тестирањето за интеграција, проверуваме дали модулите во системот правилно комуницираат едни со други. Односно, ние всушност ги извршуваме истите тестови како за време на тестирањето на системот, само што дополнително обрнуваме внимание на тоа како точно модулите комуницираат едни со други. Вршиме дополнителни проверки. Тоа е единствената разлика.

Дозволете ни уште еднаш да се обидеме да ја разбереме разликата помеѓу тестирањето на системот и единицата. Бидејќи оваа поделба се случува доста често, оваа разлика треба да постои.

И оваа разлика се манифестира кога не вршиме технолошка класификација, туку класификација по наменатестирање.

Класификацијата по голови може лесно да се направи со помош на „волшебниот квадрат“, кој првично беше измислен од Брајан Марик, а потоа подобрен од Ари Тенен.

Во овој магичен квадрат, сите видови тестирања се сместени во четири квадранти, во зависност од тоа на што повеќе внимание посветуваат тестовите.

Вертикално - колку е повисок типот на тестирање, толку повеќе внимание се посветува на некои надворешни манифестации на однесувањето на програмата; колку е пониско, толку повеќе внимание посветуваме на нејзината внатрешна технолошка структура на програмата.

Хоризонтално - колку лево се нашите тестови, толку повеќе внимание посветуваме на нивното програмирање, толку подалеку се тие надесно, толку повеќе внимание посветуваме на рачното тестирање и човечките истражувања на програмата.

Конкретно, термините како што се тестирање за прифаќање, тестирање за прифаќање и тестирање единица може лесно да се внесат во овој квадрат во смисла во која најчесто се користи во литературата. Ова е тестирање на ниско ниво со голем, огромно учество на програмирање. Односно, сите тестови се програмирани, се вршат целосно автоматски, а внимание се посветува првенствено на внатрешната структура на програмата, токму на нејзините технолошки карактеристики.

Во горниот десен агол ќе имаме рачни тестови насочени кон некое надворешно однесување на програмата, особено, тестирање на употребливост, а во долниот десен агол најверојатно ќе имаме тестови за различни нефункционални својства: перформанси, безбедност итн. на.

Значи, врз основа на класификацијата по намена, тестирањето на единицата е во долниот лев квадрант, а сите други квадранти се системско тестирање.

Ви благодариме за вниманието.

Основни концепти на теоријата на тестови.

Мерењето или тестот земен за да се одреди состојбата или способноста на спортистот се нарекува тест. Секој тест вклучува мерење. Но, не секоја промена служи како тест. Постапката за мерење или тестирање се нарекува тестирање.

Тестот заснован на моторни задачи се нарекува мотор. Постојат три групи на моторни тестови:

  • 1. Контролни вежби, во кои спортистот има задача да покаже максимални резултати.
  • 2. Стандардни функционални тестови, при кои задачата, иста за сите, се дозира или според обемот на извршената работа, или според големината на физиолошките промени.
  • 3. Максимални функционални тестови, при што спортистот мора да покаже максимални резултати.

Тестирањето со висок квалитет бара познавање на теоријата на мерење.

Основни концепти на теоријата на мерење.

Мерењето е идентификација на кореспонденцијата помеѓу феноменот што се проучува, од една страна, и бројките, од друга страна.

Основите на теоријата на мерење се три концепти: мерни скали, мерни единици и точност на мерењето.

Мерни ваги.

Мерната скала е закон со кој се доделува нумеричка вредност на измерениот резултат додека се зголемува или намалува. Ајде да погледнеме некои од вагите што се користат во спортот.

Скала за имиња (номинална скала).

Ова е наједноставниот од сите размери. Во него, броевите делуваат како ознаки и служат за откривање и разликување на предметите што се проучуваат (на пример, нумерирање на играчи во фудбалски тим). Броевите што ја сочинуваат скалата за именување се дозволени да се менуваат со мета. Нема повеќе-помалку врски во оваа скала, па некои веруваат дека употребата на скала за именување не треба да се смета за мерење. Кога користите скала, имиња, може да се извршат само некои математички операции. На пример, неговите броеви не можат да се додаваат или одземаат, но можете да броите колку пати (колку често) се појавува одреден број.

Нарачка скала.

Постојат спортови каде што резултатот на спортистот се одредува само од местото заземено на натпреварот (на пример, боречки вештини). По ваквите натпревари јасно е кој од спортистите е посилен, а кој послаб. Но, колку посилно или послабо е невозможно да се каже. Ако тројца спортисти го зазедоа првото, второто и третото место, соодветно, тогаш која е разликата во нивниот спортски дух останува нејасно: вториот спортист може да биде речиси еднаков на првиот, или може да биде послаб од него и да биде речиси идентичен со третиот. Местата зафатени во скалата на редот се нарекуваат рангови, а самата скала се нарекува ранг или неметрички. Во таква скала, неговите составни броеви се подредени по ранг (т.е. зафатени места), но интервалите меѓу нив не можат точно да се измерат. За разлика од скалата за именување, скалата на редот овозможува не само да се утврди фактот за еднаквост или нееднаквост на измерените предмети, туку и да се одреди природата на нееднаквоста во форма на пресуди: „повеќе е помалку“, „подобро е полошо“ итн. .

Користејќи скали за нарачки, можете да измерите квалитативни индикатори кои немаат строга квантитативна мерка. Овие скали особено се користат во хуманистичките науки: педагогија, психологија, социологија.

Поголем број математички операции може да се применат на рангот на скалата на редот отколку на броевите на скалата за име.

Интервална скала.

Ова е скала во која броевите не само што се подредени по ранг, туку и се одделуваат со одредени интервали. Карактеристиката што го разликува од скалата на соодносот опишана подолу е тоа што нултата точка е произволно избрана. Примерите вклучуваат календарско време (почетокот на хронологијата во различни календари беше поставен од случајни причини), аголот на зглобот (аголот на зглобот на лактот со целосно продолжување на подлактицата може да се земе еднаков на нула или 180 °), температура, потенцијална енергија на подигнат товар, потенцијал на електрично поле и сл.

Резултатите од мерењата на интервална скала може да се обработат со сите математички методи, освен за пресметување на коефициенти. Овие интервални скали даваат одговор на прашањето: „колку повеќе“, но не ни дозволуваат да кажеме дека една вредност на измерената количина е толку пати поголема или помала од друга. На пример, ако температурата се зголеми од 10 на 20 C, тогаш не може да се каже дека станала двојно потопла.

Скала за односи.

Оваа скала се разликува од интервалната скала само по тоа што строго ја дефинира позицијата на нултата точка. Благодарение на ова, скалата на сооднос не наметнува никакви ограничувања на математичкиот апарат што се користи за обработка на резултатите од набљудувањето.

Во спортот, соодносните скали го мерат растојанието, силата, брзината и десетици други променливи. Скалата на сооднос ги мери и оние величини кои се формираат како разлики помеѓу броевите измерени на интервалната скала. Така, календарското време се брои на скала на интервали, а временските интервали - на скала на соодноси. Кога се користи скала на сооднос (и само во овој случај!), мерењето на која било количина се сведува на експериментално определување на односот на оваа количина со друга слична, земена како единица. Со мерење на должината на скокот, дознаваме колку пати оваа должина е поголема од должината на друго тело земена како единица должина (метарски линијар во одреден случај); Со мерење на мрена, го одредуваме односот на неговата маса со масата на друго тело - единечен „килограм“ тежина итн. Ако се ограничиме само на употребата на скали на сооднос, тогаш можеме да дадеме друга (потесна, поконкретна) дефиниција за мерење: да се измери количина значи експериментално да се најде нејзиниот однос со соодветната мерна единица.

Мерни единици.

За да може резултатите од различни мерења да се споредат едни со други, тие мора да бидат изразени во исти единици. Во 1960 година, на Меѓународната генерална конференција за тежини и мерки, беше усвоен Меѓународниот систем на единици, скратено како SI (од почетните букви на зборовите System International). Во моментов, претпочитаната примена на овој систем е воспоставена во сите области на науката и технологијата, во националната економија, како и во наставата.

SI моментално вклучува седум основни единици независни една од друга (види табела 2.1.)

Табела 1.1.

Од посочените основни единици како деривати се изведуваат единиците на другите физички величини. Изведените единици се одредуваат врз основа на формули кои меѓусебно ги поврзуваат физичките величини. На пример, единицата за должина (метар) и единицата за време (секунда) се основни единици, а единицата за брзина (метар во секунда) е извод.

Покрај основните, SI разликува две дополнителни единици: радијан, единица за рамнински агол и стерадијан, единица за цврст агол (агол во просторот).

Точност на мерењата.

Ниту едно мерење не може да се направи апсолутно точно. Резултатот од мерењето неизбежно содржи грешка, чија големина е помала, толку е попрецизен методот на мерење и мерниот уред. На пример, со користење на редовен владетел со милиметарски поделби, невозможно е да се измери должината со точност од 0,01 mm.

Основна и дополнителна грешка.

Основна грешка е грешката на методот на мерење или мерниот инструмент што се јавува при нормални услови на употреба.

Дополнителна грешка е грешка на мерниот уред предизвикана од отстапување на неговите работни услови од нормалните. Јасно е дека инструментите дизајнирани да работат на собна температура нема да даваат точни отчитувања ако се користат во лето на стадион под жешкото сонце или во зима на студ. Грешките во мерењето може да се појават кога напонот на електричната мрежа или напојувањето од батеријата е помал од нормалниот или не е константен во вредност.

Апсолутни и релативни грешки.

Вредноста E = A--Ao, еднаква на разликата помеѓу отчитувањето на мерниот уред (A) и вистинската вредност на измерената големина (Ao), се нарекува апсолутна мерна грешка. Се мери во исти единици како и самата измерена големина.

Во пракса, често е погодно да се користи не апсолутната, туку релативната грешка. Релативната мерна грешка е од два вида - реална и намалена. Вистинската релативна грешка е односот на апсолутната грешка со вистинската вредност на измерената количина:

A D =---------* 100%

Дадената релативна грешка е односот на апсолутната грешка со максималната можна вредност на измерената количина:

Нагоре =----------* 100%

Систематски и случајни грешки.

Систематски е грешка чија вредност не се менува од мерење до мерење. Поради оваа карактеристика, систематската грешка често може однапред да се предвиди или, во екстремни случаи, да се открие и елиминира на крајот од процесот на мерење.

Методот за елиминирање на систематската грешка зависи првенствено од неговата природа. Систематските грешки во мерењето може да се поделат во три групи:

грешки од познато потекло и позната големина;

грешки од познато потекло, но непозната големина;

грешки од непознато потекло и непозната големина. Најбезопасни се грешките од првата група. Тие лесно се отстрануваат

со воведување соодветни корекции на резултатот од мерењето.

Втората група вклучува, пред сè, грешки поврзани со несовршеноста на методот на мерење и мерната опрема. На пример, грешката во мерењето на физичките перформанси со помош на маска за собирање на издишаниот воздух: маската го отежнува дишењето, а спортистот природно покажува физички перформанси кои се потценети во споредба со вистинските измерени без маска. Големината на оваа грешка не може однапред да се предвиди: тоа зависи од индивидуалните способности на спортистот и неговата здравствена состојба во времето на студијата.

Друг пример за систематска грешка во оваа група е грешка поврзана со несовршена опрема, кога мерниот уред свесно ја преценува или потценува вистинската вредност на измерената вредност, но големината на грешката е непозната.

Грешките од третата група се најопасни, нивната појава е поврзана и со несовршеноста на методот на мерење и со карактеристиките на предметот на мерење - спортистот.

Случајните грешки се јавуваат под влијание на различни фактори кои не можат да се предвидат однапред или точно да се земат предвид. Случајните грешки во принцип не можат да се отстранат. Меѓутоа, со користење на методите на математичка статистика, можно е да се процени големината на случајната грешка и да се земе предвид при толкување на резултатите од мерењето. Без статистичка обработка, резултатите од мерењето не може да се сметаат за сигурни.

Основи на теоријата на тестот 1. Основни концепти на теоријата на тестот 2. Тест на веродостојност и начини за нејзино одредување

Тест прашања 1. Како се нарекува тестот? 2. Кои се барањата за тестот? 3. Кои тестови се нарекуваат автентични? 4. Која е веродостојноста на тестот? 5. Наведете ги причините кои предизвикуваат варијации во резултатите при повторено тестирање. 6. Како се разликува меѓукласната варијација од меѓукласната варијација? 7. Како практично да се одреди веродостојноста на тестот? 8. Која е разликата помеѓу конзистентноста на тестот и стабилноста? 9. Која е еквивалентноста на тестовите? 10. Што е хомогена група на тестови? 11. Што е хетероген сет на тестови? 12. Начини за подобрување на веродостојноста на тестовите.

Тест е мерење или тест што се врши за да се утврди состојбата или способноста на една личност. Не сите мерења можат да се користат како тестови, туку само оние кои ги исполнуваат посебните барања. Тие вклучуваат: 1. стандардизација (процедурата и условите за тестирање мора да бидат исти во сите случаи на користење на тестот); 2. сигурност; 3. информативна содржина; 4. Достапност на систем за оценување.

Барања за тестот: n Информативна содржина - степенот на точност со кој се мери својствата (квалитет, способност, карактеристика) за која се користи за оценување. n Доверливост е степенот до кој резултатите се конзистентни кога истите луѓе се тестираат постојано под исти услови. Конзистентност - (различни луѓе, но исти уреди и исти услови). n n Стандардност на условите - (исти услови за повторени мерења). n Достапност на систем за оценување - (превод во систем за оценување. Како во училиште 5 -4 -3...).

Тестовите што ги исполнуваат барањата за доверливост и информациска содржина се нарекуваат звучни или автентични (грчки автентико - на сигурен начин)

Процесот на тестирање се нарекува тестирање; добиената нумеричка вредност добиена како резултат на мерењето е резултатот од тестот (или резултатот од тестот). На пример, трчањето на 100 метри е тест, постапката за водење на трки и тајмингот е тестирање, а времето на трката е резултат од тестот.

Тестовите засновани на моторни задачи се нарекуваат моторни или моторни тестови. Нивните резултати можат да бидат или моторни достигнувања (време за завршување на растојанието, број на повторувања, поминато растојание итн.), или физиолошки и биохемиски индикатори.

Понекогаш се користат не еден, туку неколку тестови кои имаат единствена конечна цел (на пример, проценка на состојбата на спортистот за време на натпреварувачкиот период на обука). Таквата група на тестови се нарекува збир или батерија на тестови.

Истиот тест, применет на исти предмети, треба да даде идентични резултати под исти услови (освен ако самите предмети не се променети). Сепак, дури и со најстрога стандардизација и прецизна опрема, резултатите од тестот секогаш се разликуваат малку. На пример, субјект кој штотуку покажал резултат од 215 кг во тестот за динамометрија на мртво кревање, кога се повторува, покажува само 190 кг.

Веродостојност на тестовите и начини за нејзино одредување Веродостојноста на тестот е степенот на усогласеност на резултатите при повторено тестирање на исти луѓе (или други предмети) под исти услови.

Варијацијата во резултатите од тест-повторното тестирање се нарекува внатре-поединец, или внатре-група, или внатре-класа. Четири главни причини ја предизвикуваат оваа варијација: 1. Промена на состојбата на субјектите (замор, обука, „учење“, промена во мотивацијата, концентрацијата итн.). 2. Неконтролирани промени во надворешните услови и опрема (температура, ветер, влажност, напон во електричната мрежа, присуство на неовластени лица итн.), т.е., сè што е обединето со терминот „случајна мерна грешка“.

Четири главни причини ја предизвикуваат оваа варијација: 3. Промена во состојбата на лицето кое го спроведува или дава бодови на тестот (и, се разбира, замена на еден експериментатор или судија со друг). 4. Несовршеност на тестот (има тестови кои очигледно се неверодостојни. На пример, ако испитаниците изведуваат слободни фрлања во кошаркарски кош, тогаш дури и кошаркар со висок процент на удари може случајно да направи грешка при првите фрлања ).

Концептот на вистински резултат од тестот е апстракција (не може да се мери експериментално). Затоа, мораме да користиме индиректни методи. Најпожелен метод за проценка на веродостојноста е анализата на варијансата проследена со пресметка на коефициентите на корелација меѓу класите. Анализата на варијансата овозможува да се разложи експериментално забележаната варијација во резултатите од тестот на компоненти утврдени со влијанието на поединечни фактори.

Ако ги регистрираме резултатите од испитаниците во кој било тест, повторувајќи го овој тест во различни денови и правиме неколку обиди секој ден, периодично менувајќи ги експериментаторите, тогаш ќе се појават варијации: а) од предмет до предмет; n б) од ден на ден; n в) од експериментатор до експериментатор; г) од обид за обид. Анализата на варијансата овозможува да се изолираат и проценат овие варијации. n

Така, за да се процени практичната веродостојност на тестот, потребно е, n прво, да се изврши анализа на варијансата, n второ, да се пресмета коефициентот на корелација меѓу класите (коефициент на веродостојност).

Зборувајќи за веродостојноста на тестовите, неопходно е да се направи разлика помеѓу нивната стабилност (репродуктивност), конзистентност и еквивалентност. n n Стабилноста на тестот се однесува на репродуктивноста на резултатите кога се повторуваат по одредено време под исти услови. Повтореното тестирање обично се нарекува повторен тест. Конзистентноста на тестот се карактеризира со независност на резултатите од тестот од личните квалитети на лицето кое го спроведува или оценува тестот.

Ако сите тестови вклучени во тест сет се многу еквивалентни, тој се нарекува хомоген. Целиот овој комплекс мери една особина на човековите моторни вештини (на пример, комплекс кој се состои од стоење долги, нагоре и тројни скокови; се проценува нивото на развиеност на квалитети за брзина и сила). Ако во комплексот нема еквивалентни тестови, односно тестовите вклучени во него мерат различни својства, тогаш тој се нарекува хетероген (на пример, комплекс кој се состои од динамометрија на мртво кревање, скок Абалаков, трчање на 100 m).

Доверливоста на тестот може да се подобри до одреден степен со: n n n а) построга стандардизација на тестирањето; б) зголемување на бројот на обиди; в) зголемување на бројот на оценувачи (судии, експерименти) и зголемување на доследноста на нивните мислења; г) зголемување на бројот на еквивалентни тестови; д) подобра мотивација на субјектите.