Testimise teoreetilised alused.

Tarkvara testimise rakendused, eesmärgid ja eesmärgid on erinevad, mistõttu testimist hinnatakse ja selgitatakse erinevalt. Mõnikord on testijatel endil raske selgitada, mis on tarkvara testimine "nagu on". Tekib segadus.

Selle segaduse lahtiharutamiseks eelneb Aleksei Barantsev (tarkvaratestimise praktik, koolitaja ja konsultant; Vene Teaduste Akadeemia Süsteemi Programmeerimise Instituudi põliselanik) oma testimiskoolitustele tutvustava videoga testimise põhisätetest.

Mulle tundub, et selles ettekandes oskas õppejõud kõige adekvaatsemalt ja tasakaalustatumalt seletada “mis on testimine” teadlase ja programmeerija vaatenurgast. Kummaline, et see tekst pole veel Habrel ilmunud.

Esitan siin selle raporti kokkuvõtliku ümberjutustuse. Teksti lõpus on lingid täisversioonile, samuti mainitud videole.

Testimise põhitõed

Kallid kolleegid,

Esiteks proovime mõista, mis testimine EI OLE.

Testimine ei ole arendus,

Isegi kui testijad oskavad programmeerida, sealhulgas teste (automaatika testimine = programmeerimine), saavad nad mõned abiprogrammid (enda jaoks) välja töötada.

Testimine ei ole aga tarkvara arendustegevus.

Testimine ei ole analüüs,

Ja mitte nõuete kogumise ja analüüsimise tegevus.

Kuigi testimise käigus tuleb vahel nõudeid selgeks teha, vahel aga analüüsida. Kuid see tegevus pole peamine, pigem tuleb seda teha lihtsalt vajadusest.

Testimine ei ole juhtimine,

Hoolimata asjaolust, et paljudes organisatsioonides on selline roll nagu "testijuht". Loomulikult tuleb testijaid juhtida. Kuid testimine iseenesest ei ole juhtimine.

Testimine ei ole tehniline kirjutamine,

Testijad peavad aga oma testid ja töö dokumenteerima.

Testimist ei saa pidada üheks selliseks tegevuseks lihtsalt seetõttu, et arendusprotsessi käigus (või nõudeid analüüsides või oma testide jaoks dokumentatsiooni kirjutades) teevad testijad kogu selle töö ära. enda jaoks, ja mitte kellegi teise jaoks.

Tegevus on märkimisväärne ainult siis, kui selle järele on nõudlus, st testijad peavad tootma midagi “ekspordiks”. Mida nad "ekspordiks" teevad?

Defektid, defektide kirjeldused või katsearuanded? See on osaliselt tõsi.

Kuid see pole kogu tõde.

Testijate põhitegevused

on see, et nad annavad tarkvaraprojektis osalejatele negatiivset tagasisidet tarkvaratoote kvaliteedi kohta.

"Negatiivne tagasiside" ei oma negatiivset varjundit ja see ei tähenda, et testijad teevad midagi halvasti või et nad teevad midagi halba. See on lihtsalt tehniline termin, mis tähendab üsna lihtsat asja.

Kuid see asi on väga oluline ja ilmselt kõige olulisem komponent testijate tegevuses.

On olemas teadus - "süsteemiteooria". See määratleb "tagasiside" mõiste.

"Tagasiside" on mõned andmed, mis naasevad väljundist sisendisse, või osa andmetest, mis naasevad väljundist sisendisse. See tagasiside võib olla positiivne või negatiivne.

Mõlemat tüüpi tagasiside on võrdselt oluline.

Tarkvarasüsteemide arenduses on positiivne tagasiside loomulikult mingisugune info, mida lõppkasutajatelt saame. Need on mõne uue funktsionaalsuse taotlused, see on müügi kasv (kui anname välja kvaliteetse toote).

Negatiivne tagasiside võib tulla ka lõppkasutajatelt mõne negatiivse arvustuse kujul. Või see võib tulla testijatelt.

Mida varem negatiivne tagasiside antakse, seda vähem energiat on selle signaali muutmiseks vaja. Seetõttu tuleb testimist alustada võimalikult varakult, projekti varases staadiumis ning anda tagasisidet nii projekteerimisel kui ka võib-olla isegi varem, nõuete kogumise ja analüüsimise etapis.

Muide, siit kasvab arusaam, et testijad ei vastuta kvaliteedi eest. Nad aitavad neid, kes selle eest vastutavad.

Mõiste "testimine" sünonüümid

Sellest seisukohast, et testimine on negatiivse tagasiside andmine, EI OLE kindlasti maailmakuulus lühend QA (Quality Assurance) mõiste “testimine” sünonüüm.

Ainuüksi negatiivse tagasiside andmist ei saa pidada kvaliteedi tagamiseks, sest tagamine on mõned positiivsed meetmed. Arusaadavalt tagame sel juhul kvaliteedi ja võtame õigeaegselt kasutusele meetmed, et tagada tarkvaraarenduse kvaliteedi paranemine.

Kuid "kvaliteedikontrolli" - kvaliteedikontrolli võib laiemas mõttes pidada termini "testimine" sünonüümiks, kuna kvaliteedikontroll on tagasiside andmine selle kõige erinevamates vormides tarkvaraprojekti erinevates etappides.

Mõnikord on testimine mõeldud kui eraldiseisev kvaliteedikontrolli vorm.

Segadus tuleneb testimise arendamise ajaloost. Erinevatel aegadel tähendas termin "testimine" erinevaid toiminguid, mida saab jagada kahte suurde klassi: välised ja sisemised.

Välised määratlused

Definitsioonid, mille Myers, Beiser ja Kaner eri aegadel andsid, kirjeldavad testimist just selle VÄLISE tähtsuse vaatenurgast. St nende vaatenurgast on testimine tegevus, mis on millekski mõeldud, mitte ei koosne millestki. Kõik need kolm määratlust võib kokku võtta negatiivse tagasiside andmisena.

Sisemised määratlused

Need on definitsioonid, mis sisalduvad tarkvaratehnikas kasutatava terminoloogia standardis, näiteks de facto standardis nimega SWEBOK.

Sellised määratlused selgitavad konstruktiivselt, MIS on testimistegevus, kuid ei anna vähimatki ettekujutust, MIKS on testimine vajalik, milleks kasutatakse siis kõiki programmi tegeliku käitumise ja selle eeldatava käitumise vahelise vastavuse kontrollimise tulemusi. .

testimine on

  • programmi nõuetele vastavuse kontrollimine,
  • läbi selle tööd jälgides
  • erilistes, kunstlikult loodud olukordades, mis on teatud viisil valitud.
Siit edasi käsitleme seda "testimise" töömääratlusena.

Üldine testimisskeem on ligikaudu järgmine:

  1. Testija saab programmi ja/või nõuded kätte sissepääsu juures.
  2. Ta teeb nendega midagi, jälgib programmi tööd teatud enda kunstlikult loodud olukordades.
  3. Väljundis saab ta teavet vastete ja mittevastavuste kohta.
  4. Seda teavet kasutatakse seejärel olemasoleva programmi täiustamiseks. Või selleks, et muuta veel väljatöötamisel oleva programmi nõudeid.

Mis on test

  • See on eriline, kunstlikult loodud olukord, mis on teatud viisil valitud,
  • ja kirjeldus selle kohta, milliseid tähelepanekuid programmi toimimise kohta teha
  • kontrollida, kas see vastab mõnele nõudele.
Pole vaja eeldada, et olukord on midagi hetkelist. Test võib olla päris pikk, näiteks jõudlust testides võib see kunstlikult loodud olukord olla süsteemile koormus, mis jätkub päris pikaks ajaks. Ja tähelepanekud, mida tuleb teha, on erinevate graafikute või mõõdikute kogum, mida me selle testi täitmise ajal mõõdame.

Testi arendaja valib tohutu hulga, potentsiaalselt lõputu testide hulgast piiratud komplekti.

Seega võime järeldada, et testija teeb testimise ajal kahte asja.

1. Esiteks kontrollib see programmi täitmist ja loob need väga kunstlikud olukorrad, kus me hakkame programmi käitumist kontrollima.

2. Ja teiseks jälgib ta programmi käitumist ja võrdleb nähtut sellega, mida oodatakse.

Kui testija automatiseerib teste, siis ta ise programmi käitumist ei jälgi - ta delegeerib selle ülesande spetsiaalsele tööriistale või spetsiaalsele programmile, mille ta ise kirjutas. Just tema jälgib, ta võrdleb vaadeldud käitumist oodatud käitumisega ja annab testijale vaid mingi lõpptulemuse – kas vaadeldav käitumine langeb kokku oodatud käitumisega või ei lange kokku.

Iga programm on teabe töötlemise mehhanism. Sisend on teave ühel kujul, väljund on teave mingil muul kujul. Samal ajal võib programmil olla palju sisendeid ja väljundeid, need võivad olla erinevad, see tähendab, et programmil võib olla mitu erinevat liidest ja need liidesed võivad olla erinevat tüüpi:

  • Kasutajaliides (UI)
  • Rakenduse programmeerimisliides (API)
  • Võrguprotokoll
  • Failisüsteem
  • Keskkonnaseisund
  • Sündmused
Kõige tavalisemad liidesed on
  • kohandatud,
  • graafiline,
  • tekst,
  • konsoolne,
  • ja kõne.
Kõiki neid liideseid kasutades testija:
  • loob kuidagi kunstlikke olukordi,
  • ja kontrollib, kuidas programm sellistes olukordades käitub.

See on testimine.

Muud katsetüüpide klassifikatsioonid

Kõige sagedamini kasutatav jaotus kolmeks tasandiks on
  1. ühiku testimine,
  2. integratsiooni testimine,
  3. süsteemi testimine.
Ühiktestimine tähendab tavaliselt üsna madalal tasemel testimist ehk üksikute toimingute, meetodite ja funktsioonide testimist.

Süsteemi testimine viitab kasutajaliidese tasemel testimisele.

Mõnikord kasutatakse mõnda muud mõistet, näiteks "komponentide testimine", kuid eelistan neid kolme esile tõsta, kuna tehnoloogiline jaotus seadme ja süsteemi testimise vahel ei ole eriti mõttekas. Erinevatel tasanditel saab kasutada samu tööriistu ja samu tehnikaid. Jaotus on tingimuslik.

Praktika näitab, et tööriistu, mille tootja on positsioneerinud ühikutestimise tööriistadena, saab kasutada sama edukalt kogu rakenduse kui terviku testimise tasemel.

Ja kogu rakendust kasutajaliidese tasemel testivad tööriistad tahavad vahel vaadata näiteks andmebaasi või kutsuda sinna mõni eraldi salvestatud protseduur.

See tähendab, et jaotus süsteemi- ja ühikutestideks on üldiselt puhtalt tingimuslik, rääkides tehnilisest aspektist.

Kasutatakse samu tööriistu ja see on normaalne, kasutatakse samu tehnikaid, igal tasemel saame rääkida erinevat tüüpi testimisest.

Kombineerime:

See tähendab, et võime rääkida funktsionaalsuse ühikutestimisest.

Võime rääkida süsteemi funktsionaalsuse testimisest.

Ühikutestimisest saame rääkida näiteks efektiivsusest.

Võime rääkida süsteemi tõhususe testimisest.

Arvestame kas ühe algoritmi või kogu süsteemi kui terviku tõhusust. See tähendab, et tehnoloogilisel jaotamisel ühiku- ja süsteemitestimiseks pole erilist mõtet. Kuna samu tööriistu ja samu tehnikaid saab kasutada erinevatel tasanditel.

Lõpuks kontrollime integratsiooni testimise ajal, kas süsteemi moodulid suhtlevad üksteisega õigesti. See tähendab, et me teeme tegelikult samu teste, mis süsteemi testimisel, ainult täiendavalt pöörame tähelepanu sellele, kuidas moodulid täpselt omavahel suhtlevad. Teeme mõned täiendavad kontrollid. See on ainus erinevus.

Proovime veel kord mõista süsteemi ja üksuse testimise erinevust. Kuna see jagunemine toimub üsna sageli, peaks see erinevus olema.

Ja see erinevus avaldub siis, kui me teostame mitte tehnoloogilist, vaid klassifikatsiooni eesmärgi järgi testimine.

Eesmärkide järgi klassifitseerimist saab mugavalt teha kasutades “võluruutu”, mille algselt leiutas Brian Marik ja seejärel täiustas Ari Tennen.

Sellel maagilisel ruudul paiknevad kõik testimise liigid neljas kvadrandis, olenevalt sellest, millele testid rohkem tähelepanu pööravad.

Vertikaalselt - mida kõrgem on testimise tüüp, seda rohkem pööratakse tähelepanu mõnele programmi käitumise välisele ilmingule; mida madalam see on, seda rohkem pöörame tähelepanu programmi sisemisele tehnoloogilisele struktuurile.

Horisontaalselt – mida vasakule jäävad meie testid, seda rohkem tähelepanu pöörame nende programmeerimisele, mida paremal pool need on, seda rohkem pöörame tähelepanu programmi käsitsi testimisele ja inimuuringutele.

Eelkõige saab sellesse ruutu hõlpsasti sisestada sellised terminid nagu aktsepteerimistestimine, vastuvõtutestimine ja ühikutestimine selles tähenduses, nagu seda kirjanduses kõige sagedamini kasutatakse. See on madala tasemega testimine suure ja valdava osa programmeerimisega. See tähendab, et kõik testid on programmeeritud, viiakse läbi täiesti automaatselt ja tähelepanu pööratakse eelkõige programmi sisemisele struktuurile, just selle tehnoloogilistele omadustele.

Paremas ülanurgas on meil käsitsi testid, mis on suunatud programmi mõnele välisele käitumisele, eriti kasutatavuse testimisele, ja paremas alanurgas on meil tõenäoliselt erinevate mittefunktsionaalsete omaduste testid: jõudlus, turvalisus jne. peal.

Seega on üksuse testimine eesmärgipõhise klassifikatsiooni põhjal alumises vasakpoolses kvadrandis ja kõik muud kvadrandid on süsteemi testimine.

Tänan tähelepanu eest.

Saada oma head tööd teadmistebaasi on lihtne. Kasutage allolevat vormi

Üliõpilased, magistrandid, noored teadlased, kes kasutavad teadmistebaasi oma õpingutes ja töös, on teile väga tänulikud.

postitatud http://www.allbest.ru/

1. PÕHIMÕISTED

Test on mõõtmine või test, mis tehakse sportlase seisundi või võimete kindlakstegemiseks. Testimise protsessi nimetatakse testimiseks: saadud arvväärtus on testimise tulemus (või testitulemus). Näiteks 100m jooks on proovikivi, jooksude läbiviimise kord ja ajavõtt on testimine, jooksuaeg on testi tulemus.

Motoorsetel ülesannetel põhinevaid teste nimetatakse mootori (või mootori) testideks. Nendes testides võivad tulemused olla kas motoorilised saavutused (vahemaa läbimise aeg, korduste arv, läbitud vahemaa jne) või füsioloogilised ja biokeemilised näitajad. Sõltuvalt sellest, aga ka subjekti ees olevast ülesandest, eristatakse kolme motoorsete testide rühma (tabel A).

Tabel A. Motoorsete testide tüübid.

Testi nimi

Ülesanne sportlasele

Testi tulemused

Testharjutused

Mootori saavutus

1500m jooks, jooksuaeg

Standardsed funktsionaalsed testid

Kõigile sama, doseeritakse kas: a) vastavalt tehtud töö mahule või: b) vastavalt füsioloogiliste muutuste suurusele

Füsioloogilised või biokeemilised näitajad standardtöö ajal Motoorsed näitajad standardse hulga füsioloogiliste muutuste ajal

Pulsi registreerimine standardtöö ajal 1000 km/min Jooksukiirus pulsisagedusel 160 lööki/min, PVC näidis (170)

Maksimaalsed funktsionaalsed testid

Kuva maksimaalne tulemus

Füsioloogilised või biokeemilised näitajad

Maksimaalse hapnikuvõla või maksimaalse hapnikutarbimise määramine

Mõnikord kasutatakse mitte ühte, vaid mitut testi, millel on üks lõplik eesmärk (näiteks sportlase seisundi hindamine võistlustreeningu perioodil). Sellist rühma nimetatakse testide kompleksiks või komplektiks. Kõiki mõõtmisi ei saa testidena kasutada. Selleks peavad nad vastama erinõuetele. Nende hulka kuuluvad: 1) testi usaldusväärsus; 2) testi infosisu; 3) reitingusüsteemi olemasolu (vt järgmist peatükki); 4) standardimine - testimise protseduur ja tingimused peavad olema kõigil testi rakendamise juhtudel samad. Usaldusväärsuse ja infosisu nõuetele vastavaid teste nimetatakse headeks ehk autentseteks testideks.

2. TESTI USALDUSVÄÄRSUST

2.1 Testi usaldusväärsuse kontseptsioon

füüsilise jooksulindi testimine

Testi usaldusväärsus on samade inimeste (või muude objektide) korduva testimise samadel tingimustel tulemuste kokkulangevuse aste. Ideaalis peaks samadele katsealustele samadel tingimustel tehtud sama test andma samad tulemused. Kuid isegi kõige rangema testimise standardimise ja täpse varustuse korral on katsetulemused alati mõnevõrra erinevad. Näiteks sportlane, kes on äsja randmedünamomeetril 55 kg pingis surunud, näitab 50 kg vaid mõne minutiga. Sellist varieerumist nimetatakse indiviidisiseseks või (kasutades matemaatilise statistika üldisemat terminoloogiat) klassisiseseks varieerumiseks. Selle põhjuseks on neli peamist põhjust:

katsealuste seisundi muutus (väsimus, treenitus, õppimine, motivatsiooni muutus, keskendumine jne);

välistingimuste ja seadmete kontrollimatud muutused (temperatuur ja niiskus, toitepinge, kõrvaliste isikute kohalolek, tuul jne);

testi läbiviija või hindaja seisundi muutumine, ühe katsetaja või kohtuniku asendamine teisega;

testi ebatäiuslikkus (on teste, mis on ilmselgelt ebausaldusväärsed, nt vabavisked korvpallikorvi enne esimest möödalasku; isegi suure tabamusprotsendiga sportlane võib esimestel visetel kogemata eksida).

Järgmine lihtsustatud näide aitab mõista testide usaldusväärsuse hindamiseks kasutatavate meetodite ideed. Oletame, et tahetakse võrrelda kahe sportlase püsti kaugushüppe tulemusi kahe sooritatud katse põhjal. Kui soovite teha täpseid järeldusi, ei saa te piirduda ainult parimate tulemuste salvestamisega. Oletame, et iga sportlase tulemused erinevad keskmisest väärtusest ± 10 cm piires ja on vastavalt 220 ± 10 cm (st 210 ja 230 cm) ja 320 ± 10 cm (st 310 ja 330 cm). Sel juhul on järeldus muidugi täiesti ühemõtteline: teine ​​​​sportlane on esimesest parem. Tulemuste erinevus (320 cm - 220 cm = 100 cm) on selgelt suurem kui juhuslikud kõikumised (±10 cm). See on palju vähem kindel

Riis. 1. Klassidevahelise ja -sisese variatsiooni suhe kõrge (ülemine) ja madala (alumine) usaldusväärsusega.

Lühikesed vertikaalsed tõmbed - üksikkatsete andmed, X ja A" 2, X 3 - kolme katsealuse keskmised tulemused

järeldus, kui sama klassisisese variatsiooni (võrdne ±10 cm) korral on erinevus õppeainete vahel (klassidevaheline varieeruvus) väike. Oletame, et keskmised väärtused on 220 cm (ühel katsel 210 cm, teisel 230 cm) ja 222 (212 ja 232 cm). Siis võib juhtuda näiteks, et esimesel katsel hüppab esimene sportlane 230 cm ja teine ​​vaid 212 ning jääb mulje, et esimene on teisest oluliselt tugevam.

Näide näitab, et peamine tähtsus ei ole klassisisene varieeruvus ise, vaid selle seos klassidevaheliste erinevustega. Sama klassisisene varieeruvus annab erineva usaldusväärsuse erinevate klasside erinevustega (konkreetsetel ainete puhul joonis 1).

Testi usaldusväärsuse teooria põhineb asjaolul, et mis tahes inimesel tehtud mõõtmise tulemus - X ( - on kahe suuruse summa:

X^Hoo + heh, (1)

kus X x on nn tegelik tulemus, mida nad soovivad salvestada;

X e - viga, mis on põhjustatud katsealuse seisundi kontrollimatust muutumisest, mis on põhjustatud mõõteseadmest jne.

Definitsiooni järgi mõistetakse tõelist tulemust kui X^ keskmist väärtust lõpmatult suure hulga vaatluste puhul identsetes tingimustes (sellepärast pannakse lõpmatuse märk oo X-le).

Kui vead on juhuslikud (nende summa on null ja erinevatel katsetel nad üksteisest ei sõltu), siis matemaatilisest statistikast järeldub:

O/ = Ooo T<З е,

st katses registreeritud tulemuste dispersioon (st/ 2) võrdub tegelike tulemuste ((Xm 2) ja vigade (0 e 2) dispersioonide summaga.

Ooo 2 iseloomustab idealiseeritud (st veavaba) klassidevahelist varieerumist ja e 2 klassisisest varieerumist. o e 2 mõju muudab katsetulemuste jaotust (joonis 2).

Definitsiooni järgi on usaldusväärsuse koefitsient (Hz) võrdne tegeliku dispersiooni ja katses registreeritud dispersiooni suhtega:

Teisisõnu, r p on lihtsalt kogemuses registreeritud variatsiooni tõelise variatsiooni osakaal.

Lisaks usaldusväärsuse koefitsiendile kasutatakse ka usaldusväärsuse indeksit:

mida peetakse teoreetiliseks korrelatsioonikordajaks registreeritud testiväärtuste ja tõeliste väärtuste vahel. Nad kasutavad ka usaldusväärsuse standardvea mõistet, mille all mõistetakse registreeritud testitulemuste (X () standardhälvet regressioonijoonest, mis ühendab X g väärtust tegelike tulemustega (X") - joonis 3.

2.2 Usaldusväärsuse hindamine katseandmete põhjal

Tõelise testitulemuse kontseptsioon on abstraktsioon. Motikat ei saa eksperimentaalselt mõõta (reaalsuses on ju võimatu identsetes tingimustes lõputult palju vaatlusi läbi viia). Seetõttu peame kasutama kaudseid meetodeid.

Eelistatuim meetod usaldusväärsuse hindamiseks on dispersioonanalüüs, millele järgneb nn klassisiseste korrelatsioonikordajate arvutamine.

Dispersioonanalüüs, nagu on teada, võimaldab katsetulemustes katseliselt registreeritud varieeruvuse jaotada komponentideks, mis on tingitud üksikute tegurite mõjust. Näiteks kui registreerime katsealuste tulemused mis tahes testis, korrates seda testi erinevatel päevadel ja tehes iga päev mitu katset, vahetades perioodiliselt katsetajaid, siis ilmneb variatsioon:

a) teemalt subjektile (individuaalne variatsioon),

b) päevast päeva,

c) katsetajalt katsetajale,

d) katsest katseni.

Dispersioonanalüüs võimaldab eraldada ja hinnata nende tegurite põhjustatud variatsioone.

Lihtsustatud näide näitab, kuidas seda tehakse. Oletame, et kahe katse tulemusi mõõdeti 5 katsealusel (k = 5, n = 2)

Dispersioonanalüüsi tulemused (vt matemaatilise statistika kursus, samuti raamatu esimese osa lisa 1) on toodud traditsioonilisel kujul tabelis. 2.

tabel 2

Usaldusväärsust hinnatakse nn klassisisese korrelatsioonikordaja abil:

kus r "i on klassisisene korrelatsioonikordaja (usaldusväärsuse koefitsient, mida tavapärasest korrelatsioonikordaja (r) eristamiseks tähistatakse täiendava algarvuga (r")\

n -- testis kasutatud katsete arv;

n" - katsete arv, mille jaoks usaldusväärsust hinnatakse.

Näiteks kui nad soovivad näites toodud andmete põhjal hinnata kahe katse keskmise usaldusväärsust, siis

Kui piirdume ainult ühe katsega, on usaldusväärsus võrdne:

ja kui suurendate katsete arvu neljani, suureneb ka usaldusväärsuse koefitsient veidi:

Seega on usaldusväärsuse hindamiseks vajalik esiteks teha dispersioonanalüüs ja teiseks arvutada klassisisene korrelatsioonikordaja (usaldusväärsuse koefitsient).

Mõned raskused tekivad siis, kui esineb nn trend, st tulemuste süstemaatiline suurenemine või vähenemine katsest katseni (joonis 4). Sel juhul kasutatakse usaldusväärsuse hindamiseks keerukamaid meetodeid (neid selles raamatus ei kirjeldata).

Kahe katse korral ja trendi puudumisel langevad klassisisese korrelatsioonikordaja väärtused praktiliselt kokku tavalise korrelatsioonikordaja väärtustega esimese ja teise katse tulemuste vahel. Seetõttu saab sellistes olukordades usaldusväärsuse hindamiseks kasutada tavalist korrelatsioonikordajat (see hindab pigem ühe kui kahe katse usaldusväärsust). Kui aga korduskatsete arv testis on suurem kui kaks ja eriti kui kasutatakse keerulisi testilahendusi,

Riis. 4. Kuuest katsest koosnev seeria, millest kolm esimest (vasakul) või kolm viimast (paremal) alluvad trendile

(näiteks 2 katset päevas kahe päeva jooksul), on vajalik klassisisese koefitsiendi arvutamine.

Usaldusväärsuse koefitsient ei ole testi iseloomustav absoluutne näitaja. See koefitsient võib varieeruda olenevalt katsealuste populatsioonist (näiteks algajate ja vilunud sportlaste puhul), katsetingimustest (kas korduvaid katseid tehakse üksteise järel või näiteks nädalaste intervallidega) ja muudest põhjustest. . Seetõttu on alati vaja kirjeldada, kuidas ja kelle peal test tehti.

2.3 Usaldusväärsus katsepraktikas

Eksperimentaalsete andmete ebausaldusväärsus vähendab korrelatsioonikoefitsientide hinnangute suurust. Kuna ükski test ei saa korreleerida rohkem teise testiga kui iseendaga, ei ole siin korrelatsioonikordaja hindamise ülempiir enam ±1,00, vaid usaldusväärsusindeks.

g (oo = Y~g ja

Empiiriliste andmete vaheliste korrelatsioonikordajate hindamiselt tõeväärtuste vahelise korrelatsiooni hindamisele liikumiseks võite kasutada avaldist

kus r xy on korrelatsioon X ja Y tegelike väärtuste vahel;

1~xy -- korrelatsioon empiiriliste andmete vahel; HzI^ - X ja Y usaldusväärsuse hindamine.

Näiteks kui r xy = 0,60, r xx = 0,80 ja r yy = 0,90, siis on tegelike väärtuste korrelatsioon 0,707.

Antud valemit (6) nimetatakse reduktsiooniparanduseks (või Spearmani-Browni valemiks), seda kasutatakse praktikas pidevalt.

Testi vastuvõetavaks tunnistamiseks ei ole kindlat usaldusväärsuse väärtust. Kõik oleneb testi rakendamisel tehtud järelduste tähtsusest. Ja siiski võib enamikul juhtudel spordis kasutada järgmisi ligikaudseid juhiseid: 0,95--0,99 --¦ suurepärane töökindlus, 0,90-^0,94 - - hea, 0,80--0,89 - vastuvõetav, 0,70--0,79 - halb, 0,60--0,69 - kaheldav individuaalhinnangute puhul, test sobib ainult katsealuste rühma iseloomustamiseks.

Testi usaldusväärsust saate mõnevõrra parandada, kui suurendate korduskatsete arvu. Siit saate teada, kuidas näiteks katses katse usaldusväärsus (350 g granaadi viskamine jooksva stardiga) suurenes katsete arvu suurenedes: 1 katse - 0,53, 2 katset - 0,72, 3 katset - 0,78, 4 katsed -- 0,80, 5 katset -- 0,82, 6 katset -- 0,84. Näide näitab, et kui algul suureneb töökindlus kiiresti, siis 3-4 katse järel aeglustub tõus oluliselt.

Mitme korduva katsega saab tulemusi määrata erineval viisil: a) parima katse, b) aritmeetilise keskmise, c) mediaani, d) kahe või kolme parima katse keskmise järgi jne. on näidatud, et enamikul juhtudel on kõige usaldusväärsem kasutada aritmeetilist keskmist, mediaan on mõnevõrra vähem usaldusväärne ja parim katse on veelgi vähem usaldusväärne.

Rääkides testide usaldusväärsusest, eristatakse nende stabiilsust (reprodutseeritavust), järjepidevust ja samaväärsust.

2.4 Katse stabiilsus

Testi stabiilsus viitab tulemuste reprodutseeritavusele, kui seda korratakse teatud aja pärast samades tingimustes. Korduvat testimist nimetatakse tavaliselt kordustestiks. Katse stabiilsuse hindamise skeem on järgmine: 1

Sel juhul eristatakse kahte juhtumit. Ühes viiakse läbi kordustest, et saada usaldusväärseid andmeid katsealuse seisundi kohta kogu testi ja kordustesti vahelise aja jooksul (näiteks juunis suusatajate funktsionaalsete võimete kohta usaldusväärsete andmete saamiseks mõõdetakse neid kaks korda nädalase vahega). Sel juhul on täpsed testitulemused olulised ja usaldusväärsust tuleks hinnata dispersioonanalüüsi abil.

Teisel juhul võib olla oluline vaid grupis olevate uuritavate järjestuse säilitamine (kas esimene jääb esimeseks, viimane jääb viimaste hulka). Sel juhul hinnatakse stabiilsust testi ja kordustesti vahelise korrelatsioonikoefitsiendiga.

Testi stabiilsus sõltub:

testi tüüp

subjektide kontingent,

ajavahemik testi ja kordustesti vahel. Näiteks morfoloogilised omadused väikestel

ajaintervallid on väga stabiilsed; liigutuste täpsuse testid (näiteks sihtmärki viskamine) on kõige väiksema stabiilsusega.

Täiskasvanutel on testi tulemused stabiilsemad kui lastel; sportlaste seas on nad stabiilsemad kui nende seas, kes spordiga ei tegele.

Kui katse ja kordustesti vaheline ajavahemik pikeneb, väheneb testi stabiilsus (tabel 3).

2.5 Testige järjepidevust

Testi järjepidevust iseloomustab testi tulemuste sõltumatus testi läbiviija või hindaja isikuomadustest." Järjepidevuse määrab erinevate eksperimenteerijate, kohtunike, samadel katsealustel saadud tulemuste kokkusobivuse määr. ja eksperdid. Sel juhul on võimalik kaks võimalust.

Testi läbiviija hindab ainult testi tulemusi, mõjutamata selle sooritamist. Näiteks võivad erinevad eksamineerijad hinnata sama kirjalikku tööd erinevalt. Sageli erinevad kohtunike hinnangud iluvõimlemises, iluuisutamises, poksis, käsitsi ajavõtunäitajates, erinevate arstide elektrokardiogrammi või radiograafia hinnangutes jne.

Testi tegija mõjutab tulemusi. Näiteks on mõned katsetajad püsivamad ja nõudlikumad kui teised ning oskavad paremini katsealuseid motiveerida. See mõjutab tulemusi (mida saab üsna objektiivselt mõõta).

Testi järjepidevus on sisuliselt testi skooride usaldusväärsus, kui testi viivad läbi erinevad inimesed.

1 Mõiste "järjepidevus" asemel kasutatakse sageli mõistet "objektiivsus". Selline sõnakasutus on kahetsusväärne, kuna erinevate eksperimenteerijate või kohtunike (ekspertide) tulemuste kokkulangevus ei viita sugugi nende objektiivsusele. Koos võivad nad teadlikult või alateadlikult teha vigu, moonutades objektiivset tõde.

2.6 Testi samaväärsus

Sageli on test teatud arvu sarnaste testide hulgast tehtud valiku tulemus.

Näiteks võib korvpallikorvi visata erinevatest punktidest, sprintida näiteks 50, 60 või 100 m distantsil, jõutõmbeid rõngastel või kangil, üle- või althaardega. , jne.

Sellistel juhtudel võib kasutada nn paralleelvormide meetodit, kui katsealustel palutakse sooritada kaks versiooni ühest ja samast testist ning seejärel hinnatakse tulemuste ühtivusastet. Siinne testimisskeem on järgmine:

Katsetulemuste vahel arvutatud korrelatsioonikoefitsienti nimetatakse ekvivalentsuskoefitsiendiks. Suhtumine testi samaväärsusesse sõltub konkreetsest olukorrast. Ühest küljest, kui kaks või enam testi on samaväärsed, suurendab nende kombineeritud kasutamine hinnangute usaldusväärsust; teisest küljest võib olla kasulik jätta akusse ainult üks samaväärne test – see lihtsustab testimist ja vähendab testikomplekti infosisu vaid veidi. Selle probleemi lahendus sõltub sellistest põhjustest nagu testide keerukus ja kohmakus, nõutava testimise täpsuse aste jne.

Kui kõik testikomplekti kuuluvad testid on väga samaväärsed, nimetatakse seda homogeenseks. Kogu see kompleks mõõdab ühte inimese motoorsete oskuste omadust. Oletame, et kompleks, mis koosneb seisvatest pikkadest, vertikaalsetest ja kolmikhüpetest, on tõenäoliselt homogeenne. Vastupidi, kui kompleksis puuduvad samaväärsed testid, siis kõik selles sisalduvad testid mõõdavad erinevaid omadusi. Sellist kompleksi nimetatakse heterogeenseks. Heterogeense testide aku näide: jõutõmbed kangil, ettepoole painutamine (painduvuse testimiseks), 1500 m jooks.

2.7 Testi usaldusväärsuse parandamise viisid

Testide usaldusväärsust saab teatud määral suurendada:

a) testimise rangem standardimine,

b) katsete arvu suurendamine,

c) hindajate (kohtunike, ekspertide) arvu suurendamine ja nende arvamuste järjepidevuse suurendamine;

d) samaväärsete testide arvu suurendamine,

e) õppeainete parem motivatsioon.

3. INFORMATIIVSED TESTID

3.1 Põhimõisted

Testi informatiivsus on täpsusaste, millega ta mõõdab seda omadust (kvaliteeti, võimet, omadust jne), mille hindamiseks seda kasutatakse. Informatiivsust nimetatakse sageli ka kehtivuseks (inglise keelest uaNaNu - validity, validity, legality). Oletame, et sprinterite - jooksjate ja ujujate - erijõuvalmiduse taseme määramiseks tahetakse kasutada järgmisi näitajaid: 1) randme dünamomeetria, 2) jalalaba plantaarne paindetugevus, 3) õla sirutajate tugevus. liiges (need lihased kannavad krooli ujumisel suurt koormust), 4) kaela sirutajalihaste tugevus. Nende testide põhjal tehakse ettepanek juhtida treeningprotsessi, eelkõige motoorsete süsteemide nõrkade lülide leidmiseks ja nende sihipäraseks tugevdamiseks. Kas testid on hästi valitud? Kas need on informatiivsed? Isegi ilma spetsiaalseid katseid tegemata võib aimata, et teine ​​test on ilmselt informatiivne sprinteritele ja jooksjatele, kolmas ujujatele ning esimene ja neljas ilmselt ei näita midagi huvitavat ei ujujatele ega jooksjatele (kuigi need võivad olla väga kasulik muudel spordialadel, näiteks maadluses). Erinevatel juhtudel võivad samad testid olla erineva teabe sisuga.

Küsimus testi informatiivsuse kohta jaguneb kaheks konkreetseks küsimuseks:

Mida see test mõõdab?

Kuidas ta seda täpselt teeb?

Näiteks, kas pikamaajooksjate sobivust on võimalik hinnata sellise näitaja nagu maksimaalne hapnikukulu (MOC) põhjal ja kui jah, siis millise täpsusega? Teisisõnu, milline on STK infosisu jääjate seas? Kas seda testi saab kasutada kontrolliprotsessis?

Kui testi kasutatakse sportlase seisundi määramiseks (diagnoosimiseks) uuringu ajal, siis räägitakse diagnostilisest informatiivsusest. Kui testitulemuste põhjal tahetakse teha järeldusi sportlase võimaliku edasise soorituse kohta, peab testil olema ennustav informatsioon. Test võib olla diagnostiliselt informatiivne, kuid mitte prognostiline ja vastupidi.

Infosisu astet saab iseloomustada kvantitatiivselt – eksperimentaalsete andmete (nn empiiriline infosisu) alusel ja kvalitatiivselt – sisulise olukorra analüüsi (sisuline ehk loogiline infosisu) põhjal.

3.2 Empiiriline teabesisu (esimene juhtum – on mõõdetav kriteerium)

Empiirilise teabe sisu määramise idee seisneb selles, et testi tulemusi võrreldakse mõne kriteeriumiga. Selleks arvutatakse kriteeriumi ja testi vaheline korrelatsioonikordaja (seda koefitsienti nimetatakse informatiivsuse koefitsiendiks ja tähistatakse r gk, kus I on esimene täht sõnas “test”, k sõnas “kriteerium”).

Kriteeriumiks peetakse näitajat, mis ilmselgelt ja vaieldamatult peegeldab omadust, mida testiga mõõdetakse.

Sageli juhtub, et on olemas täpselt määratletud kriteerium, millega pakutavat testi saab võrrelda. Näiteks objektiivselt mõõdetud tulemustega sportlaste erivalmiduse hindamisel spordis on selliseks kriteeriumiks enamasti tulemus ise: informatiivsem on test, mille korrelatsioon sportliku tulemusega on suurem. Prognoosilise teabe sisu määramisel on kriteeriumiks näitaja, mille prognoosimine tuleb läbi viia (näiteks kui ennustatakse lapse keha pikkust, on kriteeriumiks tema keha pikkus täiskasvanueas).

Kõige tavalisemad spordimetroloogia kriteeriumid on:

Sportlik tulemus.

Spordi põhiharjutuse mis tahes kvantitatiivne tunnus (näiteks sammupikkus jooksus, tõukejõud hüppamisel, edu korvpallis tagalaua all võitluses, serveerimine tennises või võrkpallis, täpsete kaugsöötude protsent jalgpallis).

Teise testi tulemused, mille infosisu on tõestatud (seda tehakse juhul, kui kriteeriumitesti läbiviimine on tülikas ja keeruline ning saab valida mõne muu testi, mis on sama informatiivne, kuid lihtsam. Näiteks gaasivahetuse asemel määrake südame löögisagedus). Seda erijuhtumit, kui kriteeriumiks on mõni muu test, nimetatakse konkureerivaks teabesisuks.

Teatud rühma kuulumine. Näiteks saate võrrelda rahvuskoondise liikmeid, spordimeistreid ja esmaklassilisi sportlasi; kriteeriumiks on kuulumine mõnda neist rühmadest. Sel juhul kasutatakse korrelatsioonianalüüsi eritüüpe.

Niinimetatud liitkriteerium, näiteks punktide summa kõikvõimalikus. Sel juhul võib kõikehõlmavad tüübi- ja punktitabelid olla kas üldtunnustatud või katsetaja poolt äsja koostatud (tabelite koostamise kohta vaata järgmist peatükki). Liitkriteeriumit kasutatakse siis, kui ühtset kriteeriumi pole (näiteks kui ülesandeks on hinnata üldfüüsilist vormi, mängija oskusi spordimängudes vms, ei saa kriteeriumiks olla ükski iseenesest võetud näitaja).

Näide sama testi - meeste jooksukiirus 30 m liikvel - infosisu määramisest erinevate kriteeriumidega on toodud tabelis 4.

Kriteeriumi valiku küsimus on testi tegeliku tähenduse ja informatiivsuse määramisel sisuliselt kõige olulisem. Näiteks kui ülesandeks on määrata sellise testi infosisu nagu sprinterite kaugushüpe püsti, siis saab valida erinevaid kriteeriume: tulemus 100 m jooksus, sammu pikkus, sammu pikkuse ja jala pikkuse suhe. või kõrgusele jne. Testi teabe sisu sel juhul muutub (toodud näites tõusis see 0,558-lt jooksukiiruse puhul 0,781-ni sammu pikkuse ja jala pikkuse suhte puhul).

Spordialadel, kus sportlikkust pole võimalik objektiivselt mõõta, püütakse sellest raskusest mööda saada kunstlike kriteeriumide kehtestamisega. Näiteks võistkondlikes spordimängudes järjestavad eksperdid kõik mängijad vastavalt nende oskustele kindlasse järjekorda (st koostavad nimekirjad 20, 50 või näiteks 100 tugevama mängija kohta). Sportlase hõivatud kohta (nagu öeldakse, tema auastet) peetakse kriteeriumiks, millega võrreldakse testi tulemusi, et määrata nende informatiivsus.

Tekib küsimus: milleks kasutada teste, kui kriteerium on teada? Kas pole näiteks lihtsam korraldada kontrollvõistlusi ja määrata sportlikke tulemusi kui määrata saavutusi kontrollharjutustes? Testide kasutamisel on järgmised eelised:

sportlikku tulemust ei ole alati võimalik ega soovitav määrata (näiteks maratonijooksuvõistlusi ei saa sageli pidada; talvel ei saa enamasti tulemust registreerida odaviskes, suvel aga murdmaasuusatamises);

sporditulemus sõltub paljudest põhjustest (faktoritest), nagu sportlase jõud, vastupidavus, tehnika jne. Testide kasutamine võimaldab välja selgitada sportlase tugevad ja nõrgad küljed ning hinnata igat neist teguritest eraldi

3.3 Empiiriline informatiivsus (teine ​​juhtum - pole ühtset kriteeriumi; faktoriaalne informatiivsus)

Sageli juhtub, et pole ühtegi kriteeriumi, millega pakutud testide tulemusi võrrelda. Oletame, et noorte jõuvalmiduse hindamiseks tahetakse leida kõige informatiivsemad testid. Mida eelistada: jõutõmbeid kangil või surumist, kükki kangiga, kangi ridu või lamavasse asendist kükki minekut? Mis võiks olla siinkohal õige testi valiku kriteeriumiks?

Saate pakkuda katsealustele suurt hulka erinevaid tugevusteste ja seejärel valida nende hulgast need, mis annavad kogu kompleksi tulemustega suurima korrelatsiooni (lõppude lõpuks ei saa te kogu kompleksi süstemaatiliselt kasutada - see on liiga tülikas ja ebamugav). Need testid on kõige informatiivsemad: need annavad teavet katsealuste võimalike tulemuste kohta kogu esialgse testide komplekti kohta. Kuid testide komplekti tulemusi ei väljendata ühe numbriga. Muidugi on võimalik moodustada mingisugune liitkriteerium (näiteks määrata mingil skaalal kogutud punktide summa). Kuid teine ​​viis, mis põhineb faktoranalüüsi ideedel, on palju tõhusam.

Faktoranalüüs on üks mitmemõõtmelise statistika meetodeid (sõna “mitmemõõtmeline” viitab sellele, et üheaegselt uuritakse paljusid erinevaid näitajaid, näiteks katsealuste tulemusi paljudes testides). See on üsna keeruline meetod, nii et siin on soovitatav piirduda ainult selle põhiidee esitamisega.

Faktoranalüüs lähtub tõsiasjast, et mis tahes testi tulemus on mitme otseselt mittejälgitava (teise nimetusega latentsete) tegurite samaaegse toime tagajärg. Näiteks 100, 800 ja 5000 m jooksu tulemused sõltuvad sportlase kiirusest, jõust, vastupidavusest jne. Nende tegurite olulisus igal distantsil ei ole võrdselt oluline. Kui valite kaks testi, mida mõjutavad ligikaudu võrdselt samad tegurid, on nende testide tulemused üksteisega tugevas korrelatsioonis (näiteks 800 ja 1000 m distantsidel jooksmisel). Kui testidel ei ole ühiseid tegureid või need mõjutavad tulemusi vähe, on nende testide vaheline korrelatsioon madal (näiteks korrelatsioon 100 m ja 5000 m jooksu sooritamise vahel). Kui tehakse suur hulk erinevaid teste ja arvutatakse nendevahelised korrelatsioonikoefitsiendid, siis faktoranalüüsi abil on võimalik kindlaks teha, kui palju tegureid nendel testidel koos mõjuvad ja milline on nende panuse määr igasse testi. Ja siis on lihtne valida teste (või nende kombinatsioone), mis hindavad kõige täpsemalt üksikute tegurite taset. See on testide faktilise teabe sisu idee. Järgmine konkreetse katse näide näitab, kuidas seda tehakse.

Ülesandeks oli leida kõige informatiivsemad testid erinevate spordialadega tegelevate kolmanda ja esimese klassi õpilassportlaste üldise jõuvalmiduse hindamiseks. Sel eesmärgil uuriti seda. (N.V. Averkovich, V.M. Zatsiorsky, 1966) 15 testi järgi 108 inimest. Faktoranalüüsi tulemusena tuvastati kolm tegurit: 1) ülajäsemete tugevus, 2) alajäsemete tugevus, 3) kõhulihaste ja puusa painutajate tugevus. Testitavate seas olid kõige informatiivsemad testid: esimese teguri puhul - surumised, teise jaoks - seistes kaugushüpe, kolmanda jaoks - sirgete jalgade tõstmine rippudes ja maksimaalne üleminekute arv seliliasendist kükile. 1 minut . Kui piirduda vaid ühe testiga, siis kõige informatiivsem oli jõulöök põiktalal (hinnati korduste arvu).

3.4 Empiiriline informaatika praktilises töös

Empiiriliste informatiivsusnäitajate praktikas kasutamisel tuleb silmas pidada, et need kehtivad ainult nende õppeainete ja tingimuste osas, mille kohta neid arvutatakse. Algajate rühmas informatiivne test võib osutuda täiesti ebainformatiivseks, kui proovite seda kasutada spordimeistrite rühmas.

Testi infosisu ei ole erinevates rühmades ühesugune. Eelkõige on rühmades, mis on koostiselt homogeensemad, test tavaliselt vähem informatiivne. Kui mõnes grupis tehakse kindlaks testi infosisu ja seejärel võetakse selle tugevamad koondisesse, siis koondises on sama testi infosisu oluliselt madalam. Selle põhjused on selged jooniselt fig. 5: valik vähendab tulemuste üldist dispersiooni rühmas ja vähendab korrelatsioonikordaja suurust. Näiteks kui määrata sellise testi infosisu nagu 400 m ujujate MPC, kellel on järsult erinevad tulemused (näiteks 3,55 kuni 6,30), siis on teabesisalduse koefitsient väga kõrge (Y 4th>0,90); kui teeme samad mõõtmised ujujate rühmas tulemustega 3,55 kuni 4,30, siis g nr absoluutväärtuses ei ületa 0,4--0,6; kui määrata sama näitaja maailma tugevaimate ujujate seas (3,53>, 5=4,00), võib teabesisalduse koefitsient üldiselt "" olla võrdne nulliga: ainuüksi selle testi abil on võimatu eristada ujujate vahel, näiteks 3,55 ja 3,59: ja neil ja teistel on MIC väärtused. on kõrge ja ligikaudu sama.

Informatiivsuskoefitsiendid sõltuvad väga palju testi ja kriteeriumi usaldusväärsusest. Madala usaldusväärsusega test ei ole alati väga informatiivne, mistõttu pole mõtet madala usaldusväärsusega teste teabesisu osas kontrollida. Kriteeriumi ebapiisav usaldusväärsus toob kaasa ka informatiivsuse koefitsientide vähenemise. Ent sellisel juhul oleks vale jätta test ebainformatiivsena tähelepanuta - pole ju testi võimaliku korrelatsiooni ülempiir mitte ±1, vaid selle usaldusväärsuse indeks. Seetõttu on vaja võrrelda teabe sisu koefitsienti selle indeksiga. Tegelik teabesisaldus (korrigeeritud kriteeriumi ebausaldusväärsuse tõttu) arvutatakse järgmise valemi abil:

Nii pandi ühes töös 4 eksperdi hinnangu põhjal välja sportlase auaste veepallis (oskuse kriteeriumiks peeti auastet). Klassisisese korrelatsioonikordaja abil määratud kriteeriumi usaldusväärsus (järjepidevus) oli 0,64. Infokoefitsient oli 0,56. Teabe sisu tegelik koefitsient (korrigeeritud kriteeriumi ebausaldusväärsusega) on võrdne:

Testi informatiivsuse ja usaldusväärsusega on tihedalt seotud selle eristusvõime kontseptsioon, mille all mõistetakse testi abil diagnoositud minimaalset erinevust katsealuste vahel (see mõiste on tähenduselt sarnane seadme tundlikkuse mõistega). . Testi eristamisvõime sõltub:

Individuaalne erinevus tulemustes. Näiteks selline test nagu "korvpalli maksimaalne korduvate visete arv vastu seina 4 m kauguselt 10 sekundi jooksul" on hea algajatele, kuid ei sobi vilunud korvpalluritele, kuna need kõik näitavad ligikaudu sama tulemust. muutuma eristamatuks. Paljudel juhtudel saab hindajatevahelist variatsiooni (klassidevahelist variatsiooni) suurendada, suurendades testi raskust. Näiteks kui teha erineva kvalifikatsiooniga sportlastele neile lihtne funktsionaalne test (näiteks 20 kükki või töötamine veloergomeetril, mille võimsus on 200 kgm/min), siis on füsioloogiliste muutuste ulatus kõigil ligikaudu sama ja valmisoleku astet on võimatu hinnata. Kui neile pakkuda raske ülesanne, siis muutuvad sportlastevahelised erinevused suureks ning testitulemuste põhjal saab hinnata sportlaste valmisolekut.

Testi ja kriteeriumi usaldusväärsus (st seos indiviididevahelise ja -sisese variatsiooni vahel). Kui sama subjekti tulemused seistes kaugushüppes on erinevad, näiteks

Juhtudel ±10 cm, siis kuigi hüppe pikkust saab määrata ±1 cm täpsusega, on võimatu kindlalt eristada katsealuseid, kelle “tõelised” tulemused on 315 ja 316 cm.

Testi infosisul ei ole fikseeritud väärtust, mille järel saab testi sobivaks lugeda.Palju sõltub konkreetsest olukorrast: prognoosimise soovitav täpsus, vajadus saada sportlase kohta vähemalt mingit lisainfot jne. Praktikas kasutatakse diagnostikaks teste, mille infosisu ei ole väiksem kui 0,3 Prognoosi jaoks on reeglina vaja suuremat infosisaldust – vähemalt 0,6.

Testide aku infosisu on loomulikult suurem kui ühe testi infosisu. Tihti juhtub, et ühe üksiku testi infosisu on selle testi kasutamiseks liiga madal. Testide kogumi teabesisu võib olla täiesti piisav.

Testi infosisu ei ole alati võimalik määrata katse ja selle tulemuste matemaatilise töötlemise abil. Näiteks kui ülesandeks on välja töötada eksamipiletid või lõputöö teemad (see on ka testimise liik), tuleb valida kõige informatiivsemad küsimused, mille abil saab kõige täpsemalt hinnata lõpetajate teadmisi ja teemasid. nende valmisolekut praktiliseks tööks. Seni tuginevad nad sellistel puhkudel vaid olukorra loogilisele, sisukale analüüsile.

Mõnikord juhtub, et testi infosisu on selge ilma igasuguste eksperimentideta, eriti kui test on lihtsalt osa tegevustest, mida sportlane võistlustel sooritab. Selliste näitajate informatiivsuse tõestamiseks pole katseid vaja, nagu ujumises pöörete sooritamiseks kuluv aeg, kiirus kaugushüppe jooksu viimastel sammudel, vabavisete protsent korvpallis, mängu kvaliteet. teenida tennises või võrkpallis.

Kuid mitte kõik sellised testid ei ole võrdselt informatiivsed. Näiteks pealeviset jalgpallis, kuigi mängu element, võib vaevalt pidada üheks kõige olulisemaks jalgpallurite oskuse näitajaks. Kui selliseid teste on palju ja peate valima kõige informatiivsemad, ei saa te ilma testiteooria matemaatiliste meetoditeta.

Testi infosisu sisuanalüüs ning selle eksperimentaalne ja matemaatiline põhjendus peaksid üksteist täiendama. Ükski neist meetoditest üksi ei ole piisav. Eelkõige juhul, kui katse tulemusel määratakse testi kõrge infosisalduse koefitsient, tuleb kontrollida, kas see ei ole nn valekorrelatsiooni tagajärg. Teatavasti ilmnevad valekorrelatsioonid, kui mõlema korrelatsioonitunnuse tulemusi mõjutab mõni kolmas näitaja, mis iseenesest ei esinda

huvi. Näiteks gümnaasiumiõpilaste seas võib leida olulise seose 100 m jooksu tulemuse ja geomeetria tundmise vahel, kuna neil on võrreldes põhikooliõpilastega keskmiselt kõrgem sooritus nii jooksus kui ka geomeetria tundmises. Kolmas, kõrvaline tunnus, mis põhjustas korrelatsiooni tekkimise, oli katsealuste vanus. Muidugi eksiks teadlane, kes seda ei märganud ja soovitas geomeetriaeksamit 100 m jooksjate testiks, selliste vigade vältimiseks on vaja analüüsida põhjus-tagajärg seoseid, mis põhjustasid kriteeriumi ja testi vaheline korrelatsioon. Eelkõige on kasulik ette kujutada, mis juhtuks, kui testitulemused paraneksid. Kas see toob kaasa kriteeriumide tulemuste suurenemise? Ülaltoodud näites tähendab see: kui õpilane tunneb geomeetriat paremini, kas ta on 100 m jooksus kiirem? Ilmselge eitav vastus viib loomuliku järelduseni: geomeetria tundmine ei saa olla sprinteritele proovikiviks. Leitud korrelatsioon on vale. Muidugi on tegelikud olukorrad palju keerulisemad kui see teadlikult rumal näide.

Testide sisuka informatiivsuse erijuhtum on informatiivsus juba definitsiooni järgi. Sel juhul lepivad nad lihtsalt kokku, mis tähendus sellele või teisele sõnale (terminile) panna. Näiteks öeldakse: "seisvat kõrgushüpet iseloomustab hüppevõime." Õigem oleks öelda nii: "Leppigem kokku, et hüppamisvõimeks nimetatakse seda, mida mõõdetakse kohast üleshüppamise tulemusega." Selline vastastikune kokkulepe on vajalik, kuna see hoiab ära tarbetuid arusaamatusi (lõppude lõpuks võib keegi hüppevõimest aru saada, mille tulemuseks on kümnekordne hüpe ühel jalal, ja pidada kõrgushüpet seistes näiteks "plahvatusliku" jala jõu prooviks. ).

56.0 Testide standardimine

Füüsilise vormisoleku testide standardimine inimese aeroobse töövõime hindamiseks saavutatakse järgmiste põhimõtete järgimisega.

Testimismetoodika peab võimaldama otseselt mõõta või kaudselt arvutada keha maksimaalset hapnikutarbimist (aeroobset võimekust), kuna see inimese füüsilise vormi füsioloogiline näitaja on kõige olulisem. Seda tähistatakse sümboliga gpax1ggsht U 0g ja seda väljendatakse milliliitrites subjekti kehakaalu kilogrammi kohta minutis (ml/kg-min.).

Üldiselt peaks katsemetoodika olema sama nii labori- kui ka välimõõtmiste puhul, kuid:

1. Laboritingimustes (statsionaarsetes ja mobiilsetes laborites) saab üsna keerukate seadmete ja suure hulga mõõtmiste abil otseselt määrata inimese aeroobset sooritust.

2. Põllul hinnatakse aeroobset töövõimet kaudselt piiratud arvu füsioloogiliste mõõtmiste põhjal.

Katsemetoodika peaks võimaldama nende tulemusi võrrelda.

Testimine tuleks läbi viia ühe päeva jooksul ja eelistatavalt ilma katkestusteta. See võimaldab otstarbekalt jaotada aega, seadmeid ja jõupingutusi esialgse ja kordustestimise ajal.

Testimismetoodika peab olema piisavalt paindlik, et võimaldada testida erineva kehalise võimekusega, erineva vanuse, soo, erineva aktiivsustasemega jne inimeste gruppe.

57,0. Seadmete valik

Kõiki ülaltoodud füsioloogilise testimise põhimõtteid saab jälgida eelkõige järgmiste tehniliste vahendite õige valiku korral:

jooksulint,

veloergomeeter,

stepergomeeter,

vajalikud abiseadmed, mida saab kasutada mis tahes tüüpi katsetes.

57.1. Jooksurada saab kasutada väga erinevates uuringutes. See seade on aga kõige kallim. Isegi väikseim versioon on liiga mahukas, et seda põllul laialdaselt kasutada. Jooksulint peaks võimaldama kiirust 3 kuni (vähemalt) 8 km/h (2-5 miili tunnis) ja kaldeid 0 kuni 30%. Jooksuraja kalle määratletakse vertikaalse tõusu protsendina läbitud horisontaalse vahemaa suhtes.

Kaugus ja vertikaalne kõrgus tuleb väljendada meetrites, kiirust meetrites sekundis (m/sek) või kilomeetrites tunnis (km/h).

57.2. Jalgratta ergomeeter. Seda seadet on lihtne kasutada nii laboris kui ka välitingimustes. See on üsna mitmekülgne, seda saab kasutada erineva intensiivsusega tööde tegemiseks - minimaalsest kuni maksimaalse tasemeni.

Veloergomeetril on mehaaniline või elektriline pidurisüsteem. Elektrilist pidurisüsteemi saab toita kas välisest allikast või ergomeetril asuvast generaatorist.

Reguleeritav mehaaniline takistus on väljendatud kilogrammides meetrites minutis (kgm/min) ja vattides. Kilomeetrid minutis teisendatakse vattideks järgmise valemi abil:

1 vatt = 6 kgm/min. 2

Veloergomeetril peab olema liikuvalt fikseeritud iste, et selle asendi kõrgust saaks iga inimese jaoks eraldi reguleerida. Testimisel paigaldatakse iste nii, et sellel istuja pääseb peaaegu täielikult sirgendatud jalaga alumise pedaalini. Keskmiselt peaks maksimaalselt langetatud asendis istme ja pedaali vaheline kaugus olema 109% katsealuse jala pikkusest.

Jalgrattaergomeetrit on erineva kujundusega. Samas ei mõjuta ergomeetri tüüp katse tulemusi, kui määratud takistus vattides või kilogrammides minutis vastab täpselt kogu väliskoormusele.

Stepergomeeter. See on suhteliselt odav seade, mille astme kõrgused on reguleeritavad vahemikus 0 kuni 50 cm. Sarnaselt veloergomeetriga saab seda hõlpsasti kasutada nii laboris kui ka põllul.

Kolme testimisvõimaluse võrdlus. Igal neist instrumentidest on oma eelised ja puudused (olenevalt sellest, kas seda kasutatakse laboris või välitingimustes). Tavaliselt on jooksulindil töötades max1ggsht U07 väärtus veidi suurem kui veloergomeetril töötades; veloergomeetri näidud omakorda ületavad stepergomeetri näitu.

Katseisikute energiakulu tase puhkeolekus või gravitatsiooni ületamiseks ülesannet täitvate isikute energiakulu on otseselt võrdeline nende kaaluga. Seetõttu loovad harjutused jooksulindil ja stepergomeetril kõigile katsealustele ühesuguse suhtelise töökoormuse tõstmisel (keha. – Toim.) etteantud kõrgusele: etteantud kiiruse ja jooksulindi kalde, sammude sageduse ja sammude kõrguse juures. stepergomeeter, kere kõrgust tõstetakse – on sama (aga tehtud töö on erinev. – Toim.). Seevastu veloergomeeter teatud koormuse fikseeritud väärtusel nõuab peaaegu sama energiakulu, sõltumata uuritava soost ja vanusest.

58.0, Üldised märkused testimisprotseduuride kohta

Testide rakendamiseks suurtele inimrühmadele on vaja lihtsaid ja ajasäästlikke testimismeetodeid. Katsealuse füsioloogiliste omaduste üksikasjalikumaks uurimiseks on aga vaja põhjalikumaid ja töömahukamaid teste. Testidest suurema väärtuse saamiseks ja nende paindlikumaks kasutamiseks on vaja leida nende kahe nõude vahel optimaalne kompromiss.

58.1. Töö intensiivsus. Testimine peab algama väikeste koormustega, millega katsealustest nõrgemad hakkama saavad. Kardiovaskulaar- ja hingamissüsteemide kohanemisvõime hindamine tuleks läbi viia töö ajal järk-järgult kasvavate koormustega. Seetõttu tuleb funktsionaalsed piirid kindlaks määrata piisava täpsusega. Praktilised kaalutlused soovitavad võtta teatud tegevuse sooritamiseks vajaliku energiahulga mõõtühikuna metaboolse kiiruse algväärtus (st puhkeoleku metaboolne kiirus). Algkoormus ja selle järgnevad etapid on väljendatud metana, mis on täieliku puhkeolekus inimese ainevahetuse kiiruse kordades. Meta aluseks olevad füsioloogilised näitajad on inimese puhkeolekus tarbitud hapniku hulk (milliliitrites minutis) või selle kalorite ekvivalent (kilokalorites minutis).

Koormuste Met-ühikutes või samaväärsete hapnikutarbimise väärtuste jälgimiseks vahetult katsetamise ajal on vaja keerulisi elektroonilisi arvutusseadmeid, mis on praegu veel suhteliselt kättesaamatud. Seetõttu on teatud tüüpi ja intensiivsusega koormuste sooritamiseks organismile vajaliku hapnikuhulga määramisel praktiliselt mugav kasutada empiirilisi valemeid. Hapnikutarbimise prognoositavad (empiiriliste valemite põhjal. - Toim.) hapnikutarbimise väärtused jooksulindil töötades - kiiruse ja kalde järgi, sammutesti ajal - kõrguse ja sammude sageduse järgi on hästi kooskõlas otsemõõtmiste tulemustega ja seda saab kasutada füüsilise pingutuse füsioloogilise ekvivalendina, millega on korrelatsioonis kõik testimise käigus saadud füsioloogilised näitajad.

58.2. Testide kestus. Testimise protsessi lühendamise soov ei tohiks kahjustada testi eesmärke ja eesmärke. Liiga lühikesed testid ei anna piisavalt eristatavaid tulemusi ja nende eristamisvõime on väike; liiga pikad testid aktiveerivad suuremal määral termoregulatsiooni mehhanisme, mis segab maksimaalse aeroobse töövõime saavutamist. Soovitatava testimisprotseduuri korral hoitakse iga koormustaset 2 minutit. Keskmine katseaeg on 10 kuni 16 minutit.

58.3. Näidustused testi peatamiseks. Testimine tuleks peatada, välja arvatud juhul, kui:

pulsirõhk langeb pidevalt vaatamata suurenenud töökoormusele;

süstoolne vererõhk ületab 240--250 mmHg. Art.;

diastoolne vererõhk tõuseb üle 125 mm Hg. Art.;

ilmnevad halva enesetunde sümptomid, nagu tugevnev valu rinnus, tugev õhupuudus, vahelduv lonkamine;

ilmnevad anoksia kliinilised tunnused: näo kahvatus või tsüanoos, pearinglus, psühhootilised nähtused, ärritusreaktsiooni puudumine;

Elektrokardiogrammi näidud näitavad paroksüsmaalset superventrikulaarset või ventrikulaarset arütmiat, ventrikulaarsete ekstrasüstoolsete komplekside ilmnemist, mis tekivad enne T-laine lõppu, juhtivuse häireid, välja arvatud kerge L V blokaad, /?--5G horisontaalse või kahaneva tüübi vähenemist rohkem kui 0,3 võrra. mV . .;";, -

58.4. Ettevaatusabinõud.

Katsealuse tervis. Enne läbivaatust peab uuritav läbima tervisekontrolli ja saama tõendi, mis kinnitab, et ta on terve. Väga soovitav on teha elektrokardiogramm (vähemalt üks rindkere juhe). Üle 40-aastastele meestele on elektrokardiogramm kohustuslik. Regulaarselt korduv vererõhu mõõtmine peaks olema kogu testimisprotseduuri lahutamatu osa. Testimise lõpus tuleb katsealuseid teavitada meetmetest, mis takistavad vere ohtlikku kogunemist alajäsemetesse.

Vastunäidustused. Katsealusel ei ole lubatud teste sooritada järgmistel juhtudel:

arsti loa puudumine maksimaalse koormusega testides osalemiseks;

suu temperatuur ületab 37,5 ° C;

südame löögisagedus pärast pikka puhkust on üle 100 löögi / min;

südame aktiivsuse ilmne langus;

müokardiinfarkti või müokardiidi juhtum viimase 3 kuu jooksul; sümptomid ja elektrokardiogrammi näidud, mis näitavad nende haiguste esinemist; stenokardia nähud;

nakkushaigused, sealhulgas külmetushaigused.

Menstruatsioon ei ole testides osalemise vastunäidustuseks. Mõnel juhul on siiski soovitatav nende pidamise ajakava muuta.

B. STANDARDTESTID

59,0. Standardi läbiviimise peamise metoodika kirjeldus

Kõigi kolme tüüpi harjutuste puhul ja sõltumata sellest, kas test tehakse maksimaalse või submaksimaalse koormuse juures, on testimise põhiprotseduur sama.

Uuritav tuleb laborisse kerges spordiriietuses ja pehmetes jalanõudes. 2 tunni jooksul. Enne testi alustamist ei tohi ta süüa, kohvi juua ega suitsetada.

Puhka. Testile eelneb puhkeaeg, mis kestab 15 minutit. Sel ajal, füsioloogiliste mõõteriistade paigaldamise ajal, istub uuritav mugavalt toolil.

Majutusperiood. Iga katsealuse kõige esimene testimine, nagu kõik korduvad testid, annab üsna usaldusväärseid tulemusi, kui põhikatsele eelneb lühike treeningperiood väikese koormusega - majutusperiood. See kestab 3 minutit. ja teenib järgmisi eesmärke:

viima katseisikut kurssi seadmete ja töö liigiga, mida ta peab tegema;

katsealuse füsioloogilise reaktsiooni eeluuring koormusele ligikaudu 4 Meta, mis vastab pulsisagedusele ligikaudu 100 lööki/min;

kiirendada keha kohanemist tegeliku testiga.

Puhka. Majutusperioodile järgneb lühike (2 min.) puhkeperiood; katsealune istub mugavalt toolil, samal ajal kui katsetaja teeb vajalikke tehnilisi ettevalmistusi.

Test. Testi alguses seatakse akommodatsiooniperioodi koormusega võrdne koormus ja katsealune sooritab harjutusi segamatult kuni testi sooritamiseni. Iga 2 min. töökoormus suureneb 1 meetri võrra.

Testimine peatub, kui ilmneb üks järgmistest tingimustest:

uuritav ei suuda ülesande täitmist jätkata;

esinevad füsioloogilise dekompensatsiooni tunnused (vt 58.3);

koormuse viimasel etapil saadud andmed võimaldavad maksimaalse aeroobse jõudluse ekstrapoleerimist järjestikuste füsioloogiliste mõõtmiste põhjal (teostatakse testimise käigus. – Toimetaja märkus).

59.5. Mõõdud. Maksimaalset hapnikutarbimist milliliitrites kilogrammi kohta minutis mõõdetakse otse või arvutatakse. Hapnikutarbimise määramise meetodid on väga erinevad, nagu ka lisatehnikad, mida kasutatakse iga inimese füsioloogiliste võimete analüüsimiseks. Sellest tuleb täpsemalt juttu hiljem.

59.6. Taastumine. Katse lõpus jätkub füsioloogiline vaatlus vähemalt 3 minutit. Katsealune puhkab jälle toolil, tõstes veidi jalgu.

Märge. Kirjeldatud testimistehnika annab võrreldavaid füsioloogilisi andmeid, mis on saadud jooksulindil, veloergomeetril ja stepergomeetril sama koormuse suurendamise järjestusega. Allpool kirjeldatakse iga kolme seadme testimismetoodikat eraldi.

60,0. Jooksuraja test

Varustus. Jooksurada ja vajalikud abivahendid.

Kirjeldus. Punktis 59.0 kirjeldatud põhilisi testimisprotseduure järgitakse hoolikalt.

Jooksuri kiirus, kui katsealune sellel kõnnib, on 80 m/min (4,8 km/h ehk 3 mph). Sellel kiirusel on horisontaalselt liikumiseks vajalik energia ligikaudu 3 Meta; Iga 2,5% kalde suurenemine lisab energiakulule ühe algse ainevahetuse kiiruse ühiku, st 1 Met. Esimese 2 min lõpus. jooksulindi kalle tõuseb kiiresti 5% -ni, järgmise 2 minuti lõpus - 7,5%, seejärel 10%, 12,5% jne. Täielik skeem on toodud tabelis. 1.

Sarnased dokumendid

    Kontrolltestide läbiviimine kontrollharjutuste või testide abil, et teha kindlaks valmisolek füüsiliseks treeninguks. Testide standardimise probleem. Testide väline ja sisemine kehtivus. Kontrolluuringu protokolli pidamine.

    abstraktne, lisatud 12.11.2009

    Motoorsete võimete tunnused ja meetodid painduvuse, vastupidavuse, väleduse, jõu ja kiiruse arendamiseks. Koolinoorte motoorsete võimete testimine kehalise kasvatuse tundides. Motoorsete testide rakendamine praktilises tegevuses.

    lõputöö, lisatud 25.02.2011

    Antropomeetriliste andmete muutumise dünaamika hindamine süstemaatiliselt kergejõustikuga tegelevatel koolilastel ja koolinoortel, kes spordisektsioonides ei osale. Üldfüüsilise vormi määramise testide väljatöötamine; tulemuste analüüs.

    lõputöö, lisatud 07.07.2015

    Testide kasutamise põhisuunad, nende klassifikatsioon. Valikukatsed maadluses. Spordisaavutuste hindamise meetodid. Maadleja erilise vastupidavuse proovilepanek. Katsenäitajate seos vabamaadlejate tehnilise oskusega.

    lõputöö, lisatud 03.03.2012

    Ujuja erilise vastupidavuse hindamine kontrollharjutuste abil. Füsioloogiliste süsteemide põhireaktsioonide kohanemisvõime veekeskkonnas. Ujuja testimisel kasutatavate meditsiiniliste ja bioloogiliste näitajate hindamise põhimõtete väljatöötamine.

    artikkel, lisatud 08.03.2009

    Tervisliku energia käsitlemine tervise põhialusena. Tutvumine qigongi süsteemi järgi tehtavate võimlemisharjutuste omadustega. Harjutuste komplekti valik kodusteks harjutusteks. Testide koostamine tehtud töö kohta järelduste tegemiseks.

    lõputöö, lisatud 07.07.2015

    Spordimetroloogia on füüsiliste suuruste uurimine kehalises kasvatuses ja spordis. Mõõtmise alused, testide teooria, hinnangud ja normid. Näitajate kvaliteedi kvantitatiivse hindamise teabe saamise meetodid; kvaliteet. Matemaatilise statistika elemendid.

    esitlus, lisatud 12.02.2012

    Kontrolli olemus ja tähtsus kehalises kasvatuses ja selle liigid. Kehalise kasvatuse tundides omandatud motoorsete oskuste testimine ja hindamine. Füüsilise vormi testimine. Õpilaste funktsionaalse seisundi jälgimine.

    kursusetöö, lisatud 06.06.2014

    Absoluutsete ja suhteliste mõõtmisvigade arvutamine. Testitulemuste teisendamine hinneteks, kasutades regressiivseid ja proportsionaalseid skaalasid. Testitulemuste pingerida. Muudatused rühmade paigutustes võrreldes varasemate hindamistega.

    test, lisatud 11.02.2013

    Motoorse aktiivsuse režiim. Jalgpallurite füüsilist jõudlust määravate tegurite roll pikaajalise treeningu erinevatel etappidel. Ergogeensete abivahendite tüübid. Füüsilise töövõime taseme määramise testide läbiviimise metoodika.

3. PEATÜKK. TESTIMISTULEMUSTE STATISTILINE TÖÖTLEMINE

Testitulemuste statistiline töötlemine võimaldab ühelt poolt objektiivselt määrata katsealuste tulemusi, teisalt hinnata testi enda kvaliteeti, testimisülesandeid, eelkõige hinnata selle usaldusväärsust. Usaldusväärsuse probleem on saanud klassikalises testiteoorias palju tähelepanu. See teooria ei ole kaotanud oma aktuaalsust tänapäeval. Vaatamata moodsamate teooriate esilekerkimisele säilitab klassikaline teooria jätkuvalt oma positsiooni.

3.1. KLASSIKALISE TESTITEOORIA PÕHISÄTTED

3.2. TESTISTULEMUSTE MATRIKS

3.3. TESTI Skoori GRAAFILINE ESITUS

3.4. KESKSENDENTSUSE MEETMED

3.5. NORMAALNE JAOTUS

3.6. ÕPPEAINETE KONTROLLI HINNITE MUUDATUS

3.7. KORRELAATSIOONIMAATRIKS

3.8. TESTI USALDUSVÄÄRSUST

3.9. TEST KEHTIVUS

KIRJANDUS

KLASSIKALISE TESTITEOORIA PÕHISÄTTED

Vaimsete testide klassikalise teooria looja on kuulus Briti psühholoog, faktoranalüüsi autor Charles Edward Spearman (1863-1945) 1. Ta sündis 10. septembril 1863 ja teenis veerandi oma elust Briti armees. Sel põhjusel sai ta doktorikraadi alles 41-aastaselt. Charles Spearman tegi oma väitekirja uurimistööd Leipzigi eksperimentaalpsühholoogia laboris Wilhelm Wundti juhtimisel. Tol ajal mõjutas Charles Spearmani tugevalt Francis Galtoni töö inimese intelligentsuse testimisel. Charles Spearmani õpilased olid R. Cattell ja D. Wechsler. Tema järgijate hulgas on A. Anastasi, J. P. Guilford, P. Vernon, C. Burt, A. Jensen.

Lewis Guttman (1916-1987) andis suure panuse klassikalise testiteooria arendamisse.

Klassikaline testiteooria esitati esmakordselt terviklikult ja täielikult Harold Gullikseni põhiteoses (Gulliksen H., 1950) 4 . Sellest ajast alates on teooriat mõnevõrra muudetud, eriti on täiustatud matemaatilist aparaati. Klassikaline testiteooria kaasaegses esitluses on toodud raamatus Crocker L., Aligna J. (1986) 5. Kodu-uurijatest kirjeldas seda teooriat esimesena V. Avanesov (1989) 6. Tšelškova töös M.B. (2002) 7 annab teavet testi kvaliteedi statistilise põhjendatuse kohta.

Klassikaline testiteooria põhineb järgmisel viiel põhiprintsiibil.

1. Empiiriliselt saadud mõõtmistulemus (X) on tegeliku mõõtetulemuse (T) ja mõõtevea (E) 8 summa:

X = T + E (3.1.1)

T ja E väärtused on tavaliselt teadmata.

2. Tegelikku mõõtmistulemust saab väljendada matemaatilise ootusena E(X):

3. Õigete ja valekomponentide korrelatsioon katsealuste kogumi lõikes on null, see tähendab, ρ TE = 0.

4. Kahe testi ekslikud komponendid ei ole korrelatsioonis:

5. Ühe testi ekslikud komponendid ei korreleeru ühegi teise testi tegelike komponentidega:

Lisaks moodustavad klassikalise testiteooria aluse kaks definitsiooni – paralleel- ja ekvivalenttestid.

PARALLEELSED testid peavad vastama nõuetele (1-5), ühe testi tõelised komponendid (T 1) peavad olema võrdsed teise testi tõekomponentidega (T 2) mõlemale testile vastanud katsealuste igas valimis. Eeldatakse, et T 1 =T 2 ja lisaks võrdub dispersiooniga s 1 2 = s 2 2.

Samaväärsed testid peavad vastama kõigile paralleelkatsete nõuetele, välja arvatud üks erand: ühe katse tegelikud komponendid ei pea olema võrdsed teise paralleelkatse tegelike komponentidega, kuid need peavad erinema sama konstandi võrra. Koos.

Kahe testi samaväärsuse tingimus on kirjutatud järgmiselt:

kus c 12 on esimese ja teise testi tulemuste vaheline konstant.

Ülaltoodud sätete põhjal on konstrueeritud testi usaldusväärsuse teooria 9,10.

see tähendab, et saadud testitulemuste dispersioon on võrdne tõe- ja veakomponentide dispersioonide summaga.

Kirjutame selle avaldise ümber järgmiselt:

(3.1.3)

Selle võrdsuse parem pool tähistab testi usaldusväärsust ( r). Seega saab testi usaldusväärsuse kirjutada järgmiselt:

Selle valemi põhjal pakuti hiljem erinevaid avaldisi testi usaldusväärsuse koefitsiendi leidmiseks. Testi usaldusväärsus on selle kõige olulisem omadus. Kui usaldusväärsus on teadmata, ei saa testi tulemusi tõlgendada. Testi kui mõõtevahendi täpsust iseloomustab testi usaldusväärsus. Kõrge usaldusväärsus tähendab katsetulemuste suurt korratavust samadel tingimustel.

Klassikalises testiteoorias on kõige olulisem probleem katsealuse tõelise testiskoori (T) määramine. Empiirilise testi hinne (X) sõltub paljudest tingimustest – ülesannete raskusastmest, testi sooritajate valmisoleku tasemest, ülesannete arvust, testimistingimustest jne. Tugevate ja hästi ettevalmistatud katsealuste rühmas on testi tulemused tavaliselt paremad. kui halvasti koolitatud subjektide rühmas. Sellega seoses jääb lahtiseks küsimus ülesande raskusastme ulatuse kohta üldkogumite jaoks. Probleem on selles, et tõelised empiirilised andmed saadakse täiesti juhuslikest katsealuste valimitest. Reeglina on need õpperühmad, mis esindavad paljusid õpilasi, kes suhtlevad õppeprotsessis üksteisega üsna tugevalt ja õpivad tingimustes, mis teiste rühmade puhul sageli ei kordu.

Me leiame s E võrrandist (3.1.4)

Siin on selgelt näidatud mõõtmistäpsuse sõltuvus standardhälbest s X ja testi usaldusväärsuse kohta r.

Esimene komponent, testiteooria, sisaldab diagnostiliste andmete töötlemise statistiliste mudelite kirjeldust. See sisaldab mudeleid testülesannete vastuste analüüsimiseks ja kogutesti tulemuste arvutamise mudeleid. Mullenberg (1980, 1990) nimetas seda "psühhomeetriaks". Klassikaline testiteooria, kaasaegne testiteooria (või üksuse vastuse analüüsi mudel – IRT) ja


üksuste valimid moodustavad kolm kõige olulisemat testiteooria mudeli tüüpi. Psühhodiagnostika käsitlemise objektiks on kaks esimest mudelit.

Klassikaline testiteooria. Enamik intellektuaalseid ja isiksuseteste on välja töötatud selle teooria põhjal. Selle teooria keskne mõiste on "usaldusväärsuse" mõiste. Usaldusväärsus viitab korduvate hindamiste tulemuste järjepidevusele. Teatmeteostes esitatakse see mõiste tavaliselt väga lühidalt ja seejärel kirjeldatakse üksikasjalikult matemaatilise statistika aparaadi. Selles sissejuhatavas peatükis kirjeldame kokkuvõtlikult märgitud mõiste põhitähendust. Klassikalises testiteoorias tähendab usaldusväärsus mitmete mõõtmisprotseduuride (peamiselt teste kasutades mõõtmiste) tulemuste korratavust. Usaldusväärsuse mõiste hõlmab mõõtmisvea arvutamist. Testimisprotsessi käigus saadud tulemused võib esitada tõelise tulemuse ja mõõtmisvea summana:

Xi = Ti+ Ej

Kus Xi on saadud tulemuste hinnang, Ti on tegelik tulemus ja Ej- mõõtmisviga.

Saadud tulemuste hindamine on reeglina testiülesannete õigete vastuste arv. Tõelist tulemust võib pidada tõeliseks hinnanguks platoonilises mõttes (Gulliksen, 1950). Levinud on eeldatavate tulemuste mõiste, s.t. ideid skooride kohta, mida on võimalik saada suure hulga mõõtmisprotseduuride korduste tulemusena (Issand & Novitš, 1968). Kuid sama hindamisprotseduuri läbiviimine ühe inimesega ei ole võimalik. Seetõttu tuleb probleemi lahendamiseks otsida muid võimalusi (Witlman, 1988).

See kontseptsioon teeb teatud eeldused tõeste tulemuste ja mõõtmisvigade kohta. Viimaseid võetakse iseseisva tegurina, mis on muidugi täiesti mõistlik eeldus, kuna juhuslikud tulemuste kõikumised ei anna kovariatsioone: r EE =0.

Eeldatakse, et tegelike skooride ja mõõtmisvigade vahel puudub seos: rEE = 0.


Kogu viga on 0, sest Aritmeetiline keskmine võetakse tõeliseks hinnanguks:

Need eeldused viivad meid lõpuks üldtuntud usaldusväärsuse määratluseni kui tõelise tulemuse ja kogu dispersiooni suhe või avaldis: 1 miinus suhe, mille lugejaks on mõõtmisviga ja nimetajaks kogu dispersioon:


, VÕI

Sellest usaldusväärsuse määramise valemist saame vea dispersiooni S 2 (E) võrdne juhtumite arvu summaarse dispersiooniga (1 – r XX "); seega määratakse mõõtmise standardviga valemiga:

Pärast usaldusväärsuse ja selle tuletiste teoreetilist põhjendamist on vaja kindlaks määrata konkreetse testi usaldusväärsuse indeks. Testi usaldusväärsuse hindamiseks on olemas praktilised protseduurid, näiteks vahetatavate vormide kasutamine (paralleeltestid), üksuste jagamine kaheks osaks, kordustestimine ja sisemise järjepidevuse mõõtmine. Iga teatmeteos sisaldab testitulemuste järjepidevuse indekseid:

r XX’ =r(x 1, x 2)

Kus r XX' - stabiilsuskoefitsient ja x 1 Ja x 2 - kahe mõõtmise tulemused.

Vahetatavate vormide usaldusväärsuse kontseptsiooni võttis kasutusele ja arendas Gulliksen (1950). See protseduur on üsna töömahukas, kuna see on seotud vajadusega luua paralleelsed ülesanded

r XX’ =r(x 1, x 2)

Kus r XX' - ekvivalentsustegur ja x 1 Ja x 2 - kaks paralleelset testi.

Järgmist protseduuri – põhitaigna jagamist kaheks osaks A ja B – on lihtsam kasutada. Testi mõlemast osast saadud hinded on korrelatsioonis. Spearmani-Browni valemi abil hinnatakse testi kui terviku usaldusväärsust:

kus A ja B on testi kaks paralleelset osa.

Järgmine meetod on testimisülesannete sisemise järjepidevuse määramine. See meetod põhineb üksikute ülesannete kovariatsioonide määramisel. Sg on juhuslikult valitud ülesande dispersioon ja Sgh on kahe juhuslikult valitud ülesande kovariatsioon. Kõige sagedamini kasutatav koefitsient sisemise järjepidevuse määramiseks on Cronbachi alfa. Kasutatakse ka valemit KR20 ja λ-2(lambda-2).

Klassikaline usaldusväärsuse kontseptsioon määratleb mõõtmisvead, mis tekivad nii testimise kui ka vaatluste käigus. Nende vigade allikad on erinevad: need võivad olla isikuomadused, testimistingimuste omadused ja testimisülesanded ise. Vigade arvutamiseks on olemas spetsiifilised meetodid. Teame, et meie tähelepanekud võivad osutuda ekslikeks, meie metoodilised vahendid on ebatäiuslikud, nagu ka inimesed ise on ebatäiuslikud. (Kuidas mitte meeles pidada Shakespeare’i: “Ebausaldusväärne oled sa, kelle nimi on mees”). Asjaolu, et klassikalises testiteoorias tehakse mõõtmisvead selgeks ja selgitatakse, on oluline positiivne punkt.

Klassikalisel testiteoorial on mitmeid olulisi tunnuseid, mida võib pidada ka selle puudusteks. Mõnda neist omadustest on teatmeteostes märgitud, kuid nende olulisust (igapäevasest vaatenurgast) sageli ei rõhutata, samuti ei märgita, et teoreetilisest või metodoloogilisest vaatenurgast tuleks neid pidada puudusteks.

Esiteks. Klassikaline testiteooria ja usaldusväärsuse kontseptsioon on keskendunud testi koondhinnete arvutamisele, mis saadakse üksikülesannetes saadud punktisummade liitmisel. Jah, töötades


Teiseks. Usaldusväärsuse koefitsient hõlmab mõõdetud näitajate hajuvuse hindamist. Sellest järeldub, et usaldusväärsuse koefitsient on madalam, kui valim on homogeensem (kui muud näitajad on võrdsed). Testüksuste sisemise järjepidevuse koefitsienti pole olemas, see koefitsient on alati "kontekstipõhine". Näiteks Crocker ja Algina (1986) pakuvad välja spetsiaalse "homogeense valimi korrigeerimise" valemi, mis on loodud testijate kõrgeimate ja madalaimate skooride jaoks. Diagnostiku jaoks on oluline teada valimipopulatsiooni variatsiooni tunnuseid, vastasel juhul ei saa ta selle testi jaoks kasutada juhendis määratud sisemisi konsistentsi koefitsiente.

Kolmandaks. Aritmeetiliseks keskmiseks taandamise nähtus on klassikalise usaldusväärsuse kontseptsiooni loogiline tagajärg. Kui testi skoor kõigub (st see ei ole piisavalt usaldusväärne), siis on võimalik, et protseduuri kordamisel saavad madala punktisummaga katsealused kõrgema hinde ja vastupidi, kõrge punktisummaga katsealused saavad madala hinde. Seda mõõtmisprotseduuri artefakti ei tohiks segi ajada arenguprotsesside tõelise muutuse või ilminguga. Kuid samas pole neil lihtne vahet teha, sest... arengu käigus muutumise võimalust ei saa kunagi välistada. Et olla täiesti kindel, on vajalik võrdlus kontrollrühmaga.

Klassikalise teooria põhimõtete kohaselt välja töötatud testide neljas tunnus on normatiivsete andmete olemasolu. Testinormide tundmine võimaldab uurijal testijate tulemusi adekvaatselt tõlgendada. Väljaspool norme on testide tulemused mõttetud. Testistandardite väljatöötamine on küllaltki kulukas ettevõtmine, kuna psühholoog peab saama testitulemused esinduslikust valimist.

2 Ya ter Laak

Kui rääkida klassikalise usaldusväärsuse kontseptsiooni puudujääkidest, siis on paslik tsiteerida Siytsma väidet (1992, lk 123-125). Ta märgib, et klassikalise testiteooria esimene ja peamine eeldus on, et testide tulemused järgivad intervalliprintsiipi. Siiski puuduvad uuringud, mis seda oletust toetaksid. Sisuliselt on see "mõõtmine meelevaldselt kehtestatud reegli järgi". See funktsioon seab klassikalise testiteooria ebasoodsasse olukorda võrreldes suhtumise mõõtmise skaaladega ja loomulikult võrreldes kaasaegse testiteooriaga. Paljud andmeanalüüsi meetodid (variantsusanalüüs, regressioonanalüüs, korrelatsioon- ja faktoranalüüs) põhinevad intervallskaala olemasolu eeldusel. Sellel pole aga kindlat alust. Arvestades tõeliste tulemuste skaalat psühholoogiliste omaduste (näiteks aritmeetilised võimed, intelligentsus, neurootilisus) väärtuste skaalana, võib ainult oletada.

Teine märkus puudutab asjaolu, et testi tulemused ei ole testitava isiku ühe või teise psühholoogilise omaduse absoluutsed näitajad, neid tuleks käsitleda ainult ühe või teise testi tulemustena. Kahe testiga võidakse uurida samu psühholoogilisi omadusi (nt intelligentsus, verbaalne võime, ekstravertsus), kuid see ei tähenda, et need kaks testi on samaväärsed või neil on samad võimed. Kahe testitud inimese jõudluse võrdlemine erinevate testidega on vale. Sama kehtib ka sama testi sooritaja kohta, kes sooritab kaks erinevat testi. Kolmas punkt puudutab eeldust, et mõõtmise standardviga on iga mõõdetava individuaalse võimekuse taseme puhul sama. Selle eelduse empiirilist testi siiski ei ole. Näiteks pole mingit garantiid, et heade matemaatikaoskustega testi sooritaja saab suhteliselt lihtsas aritmeetilises testis kõrge tulemuse. Sel juhul on madala või keskmiste võimetega inimene suurema tõenäosusega kõrge hinnangu saanud.

Moodsa testiteooria või vastuste analüüsi teooria raames sisaldavad testielemendid kirjeldust suure


vastajate võimalike vastuste mudelite arv. Need mudelid erinevad nii nende aluseks olevate eelduste kui ka saadud andmetele esitatavate nõuete poolest. Raschi mudelit peetakse sageli üksuste vastuse analüüsi (1RT) teooriate sünonüümiks. Tegelikult on see vaid üks mudelitest. Selles esitatud valem g ülesande tunnuskõvera kirjeldamiseks on järgmine:

Kus g- eraldi katseülesanne; eksp- eksponentsiaalfunktsioon (mittelineaarne sõltuvus); δ ("delta") - testi raskusaste.

Muud testitavad esemed, nt. h, saada ka oma iseloomulikud kõverad. Tingimus täidetud δ h > δ g (g tähendab seda h- raskem ülesanne. Seega indikaatori mis tahes väärtuse puhul Θ (“teeta” – testijate võimete varjatud omadused) ülesande eduka sooritamise tõenäosus h vähem. Seda mudelit nimetatakse rangeks, kuna on ilmne, et tunnuse madala väljendusastme korral on ülesande täitmise tõenäosus nullilähedane. Selles mudelis pole ruumi oletamiseks ega oletamiseks. Valikvastustega ülesannete puhul ei ole vaja edu tõenäosuse kohta oletusi teha. Lisaks on see mudel range selles mõttes, et kõikidel katseobjektidel peab olema sama eristusvõime (kõrge eristusvõime peegeldub kõvera järsuses; siin on võimalik koostada Guttmani skaala, mille järgi igas punktis tunnuskõver ülesande täitmise tõenäosus varieerub O kuni 1). Selle tingimuse tõttu ei saa kõiki üksusi Raschi mudelil põhinevatesse testidesse kaasata.

Sellel mudelil on mitu varianti (nt Birnbaura, 1968; vt Lord & Novik). See võimaldab erinevate diskrimineerivate ülesannete olemasolu

võime.

Hollandi teadlane Mokken (1971) töötas välja kaks mudelit testitavate üksuste vastuste analüüsimiseks, mis on vähem ranged kui Raschi mudel ja seetõttu võib-olla realistlikumad. Põhitingimusena

Via Mokken esitab väite, et ülesande tunnuskõver peaks järgnema monotoonselt, ilma pausideta. Kõik testiülesanded on suunatud sama psühholoogilise omaduse uurimisele, mida tuleks mõõta V. Selle sõltuvuse mis tahes vorm on lubatud kuni selle katkestamiseni. Seetõttu ei määra tunnuskõvera kuju ükski konkreetne funktsioon. See “vabadus” võimaldab kasutada rohkem katseobjekte ja hinnangutase ei ole tavapärasest kõrgem.

Üksuste vastuse mustrite (IRT) metoodika erineb enamiku eksperimentaalsete ja korrelatsiooniuuringute metoodikast. Matemaatiline mudel on mõeldud käitumuslike, kognitiivsete, emotsionaalsete omaduste, aga ka arengunähtuste uurimiseks. Need kõnealused nähtused piirduvad sageli üksuste vastustega, mistõttu Mellenberg (1990) nimetas IRT-d "mini-käitumise teooriaks". Uuringu tulemusi saab teatud määral esitada järjepidevuskõveratena, eriti juhtudel, kui teoreetiline arusaam uuritavatest tunnustest puudub. Seni on meie käsutuses vaid mõned intelligentsuse, sobivuse ja isiksuse testid, mis on loodud arvukate IRT-teooria mudelite põhjal. Saavutustestide väljatöötamisel kasutatakse sagedamini Raschi mudeli variante (Verhelst, 1993), arengunähtuste puhul on aga sobivamad Mokkeni mudelid (vt ka ptk 6).

Testi sooritaja vastus testimisobjektidele on IRT-mudelite põhiüksus. Reaktsiooni tüübi määrab uuritava tunnuse väljendusaste inimeses. Selliseks tunnuseks võivad olla näiteks aritmeetilised või ruumilised võimed. Enamasti on see intelligentsuse üks või teine ​​aspekt, saavutuste omadused või isiksuseomadused. Eeldatakse, et antud isiku positsiooni teatud uuritavate omaduste vahemikus ja konkreetse ülesande eduka täitmise tõenäosuse vahel on mittelineaarne seos. Selle sõltuvuse mittelineaarsus on teatud mõttes intuitiivne. Kuulsad fraasid "Iga algus on raske" (aeglane mitte-


lineaarne algus) ja "Pühakuks saamine pole nii lihtne" tähendavad, et edasine paranemine pärast teatud taseme saavutamist on keeruline. Kõver läheneb aeglaselt, kuid peaaegu kunagi ei saavuta 100% edukuse määra.

Mõned mudelid on pigem vastuolus meie intuitiivse arusaamaga. Võtame selle näite. Inimesel, kelle vabatahtliku iseloomustava intensiivsuse indeks on 1,5, on 60-protsendiline tõenäosus ülesande täitmisel õnnestuda. See läheb vastuollu meie intuitiivse arusaamaga sellisest olukorrast, sest sa saad ülesandega edukalt hakkama või ei tule sellega üldse toime. Võtame selle näite: inimene proovib 100 korda jõuda 1m 50 cm kõrgusele Edu saadab teda 60 korda, s.o. selle õnnestumisprotsent on 60 protsenti.

Tunnuse tõsiduse hindamiseks on vaja vähemalt kahte ülesannet. Raschi mudel hõlmab tunnuste tõsiduse määramist olenemata ülesande raskusest. See läheb vastuollu ka meie intuitsiooniga: oletame, et inimesel on 80% tõenäosus hüpata kõrgemale 1,30 m. Kui see on nii, siis ülesande tunnuskõvera järgi on tal 60% tõenäosus hüpata kõrgemale 1,50 m ja 40% üle 1,50 m hüppamise tõenäosus üle 1,70 m. Seetõttu on sõltumata sõltumatu muutuja (kõrguse) väärtusest võimalik hinnata inimese võimet hüpata kõrgusele.

IRT-mudeleid on umbes 50 (Goldstein & Wood, 1989.) On palju mittelineaarseid funktsioone, mis kirjeldavad (selgitavad) ülesande või ülesannete rühma õnnestumise tõenäosust. Nende mudelite nõuded ja piirangud on erinevad ning need erinevused ilmnevad Raschi mudeli ja Mokkeni skaala võrdlemisel. Nende mudelite nõuded hõlmavad järgmist:

1) vajadus määrata uuritav tunnus ja hinnata isiku positsiooni selle tunnuse piires;

2) ülesannete järjestuse hindamine;

3) konkreetsete mudelite kontrollimine. Psühhomeetrias on mudeli testimiseks välja töötatud palju protseduure.

Mõned teatmeteosed käsitlevad IRT-teooriat kui testobjektide analüüsi vormi (vt näiteks

Croker & Algina, J 986). Võib aga väita, et IRT on "mini-käitumise miniteooria". IRT teooria pooldajad märgivad, et kui kesktaseme mõisted (mudelid) on ebatäiuslikud, siis mida saab öelda psühholoogia keerukamate konstruktsioonide kohta?

Klassikalised ja kaasaegsed testiteooriad. Inimesed ei saa jätta võrdlemata asju, mis näevad välja peaaegu ühesugused. (Võib-olla seisneb psühhomeetria igapäevane vaste peamiselt inimeste võrdlemises oluliste omaduste järgi ja nende vahel valiku tegemises.) Igal esitatud teoorial – hinnanguvigade mõõtmise teoorial ja testivastuste matemaatilisel mudelil – on oma toetajad (Goldstein & Wood, 1986).

IRT-mudeleid ei ole süüdistatud selles, et need on "reeglipõhised hinnangud" nagu klassikaline testiteooria. IRT mudel on keskendunud hinnatavate tunnuste analüüsile. Isiksuseomadusi ja ülesandeomadusi hinnatakse skaalade (järg- või intervall) abil. Lisaks on võimalik võrrelda erinevate testide tulemuslikkust, mille eesmärk on uurida sarnaseid omadusi. Lõpuks ei ole usaldusväärsus skaala iga väärtuse puhul sama ja keskmised hinded on üldiselt usaldusväärsemad kui skaala alguses ja lõpus olevad hinded. Seega näivad IRT mudelid olevat teoreetiliselt paremad. Erinevused on ka kaasaegse testiteooria ja klassikalise teooria praktilises kasutamises (Sijstma, 1992, lk 127-130). Kaasaegne testiteooria on klassikalisega võrreldes keerulisem, mistõttu kasutavad seda harvemini mittespetsialistid. Lisaks on IRT-l spetsiifilised ülesanded. See tähendab, et esemed tuleb testist välja jätta, kui need ei vasta mudeli nõuetele. See reegel kehtib ka nende ülesannete kohta, mis olid osa laialt kasutatavatest klassikalise teooria põhimõtetel üles ehitatud testidest. Test muutub lühemaks ja seetõttu väheneb selle usaldusväärsus.

IRT pakub matemaatilisi mudeleid reaalmaailma nähtuste uurimiseks. Mudelid peaksid aitama meil mõista nende nähtuste põhiaspekte. Siin peitub aga peamine teoreetiline küsimus. Võib kaaluda mudeleid


kui lähenemist selle keerulise reaalsuse uurimisele, milles me elame. Kuid mudel ja tegelikkus ei ole sama asi. Pessimistliku vaate kohaselt on võimalik modelleerida vaid üksikuid (ja mitte kõige huvitavamaid) käitumistüüpe. Samuti võib kohata väidet, et tegelikkust ei saa üldse modelleerida, sest see järgib enamat kui lihtsalt põhjuse ja tagajärje seadusi. Parimal juhul on võimalik modelleerida individuaalseid (ideaalseid) käitumisnähtusi. Modelleerimise võimalustele on veel üks, optimistlikum vaade. Ülaltoodud seisukoht blokeerib inimese käitumise nähtuste olemuse sügava mõistmise võimaluse. Ühe või teise mudeli rakendamine tõstatab mõned üldised, põhimõttelised küsimused. Meie arvates pole kahtlust, et IRT on klassikalisest testiteooriast teoreetiliselt ja tehniliselt parem kontseptsioon.

Testide praktiline eesmärk, olenemata sellest, millisel teoreetilisel alusel need on loodud, on määrata kindlaks olulised kriteeriumid ja nende põhjal kindlaks teha teatud psühholoogiliste konstruktsioonide omadused. Kas IRT mudelil on ka selles osas eeliseid? Võimalik, et sellel mudelil põhinevad testid ei ennusta täpsemini kui klassikalisel teoorial põhinevad testid ning võimalik, et nende panus psühholoogiliste konstruktsioonide väljatöötamisse polegi olulisem. Diagnostikud eelistavad kriteeriume, mis on otseselt seotud üksikisiku, institutsiooni või kogukonnaga. Mudel, mis on teaduslikult arenenum “ipso facto”*, ei määratle sobivamat kriteeriumi ja on teaduslike konstruktsioonide selgitamisel teatud määral piiratud. On ilmne, et klassikalisel teoorial põhinevate testide väljatöötamine jätkub, kuid samas luuakse uusi IRT mudeleid, mis laienevad suurema hulga psühholoogiliste nähtuste uurimisele.

Klassikalises testiteoorias eristatakse mõisteid “usaldusväärsus” ja “validsus”. Katsetulemused peavad olema usaldusväärsed, s.t. esmase ja kordustesti tulemused peaksid olema järjepidevad. Pealegi,

* ipso facto(lakk) - iseenesest (umbes tõlge).

tulemused peaksid olema vabad (nii palju kui võimalik) hindamisvigadest. Valiidsus on üks saavutatud tulemuste nõue. Sel juhul peetakse usaldusväärsust testi kehtivuse vajalikuks, kuid mitte veel piisavaks tingimuseks.

Kehtivuse mõiste viitab sellele, et leiud on seotud millegi olulise praktilise või teoreetilisega. Testitulemuste põhjal tehtud järeldused peavad olema kehtivad. Enamasti räägitakse kahte tüüpi kehtivusest: ennustav (kriteerium) ja konstruktiivne. On ka teist tüüpi kehtivust (vt 3. peatükk). Lisaks saab kvaasieksperimentide puhul määrata kehtivuse (Cook & Campbell, 1976, Cook & Shadish, 1994). Peamine valiidsuse tüüp on siiski ennustav valiidsus, mille all mõistetakse võimet ennustada testitulemuse põhjal midagi olulist tulevase käitumise kohta, samuti võimalust sügavamalt mõista konkreetset psühholoogilist omadust või kvaliteeti.

Esitatud valiidsuse tüüpe käsitletakse igas teatmeteoses ja neile on lisatud testi kehtivuse analüüsi meetodite kirjeldus. Faktoranalüüs on sobivam konstruktsiooni valiidsuse määramiseks ja ennustava valiidsuse analüüsimiseks kasutatakse lineaarset regressioonivõrrandit. Teatud tunnuseid (õpeedukus, teraapia efektiivsus) saab ennustada ühe või mitme intellektuaalsete või isiksusetestidega töötamisel saadud näitaja põhjal. Testi ennustava kehtivuse määramiseks kasutatakse selliseid andmetöötlustehnikaid nagu korrelatsioon, regressioon, dispersioonanalüüs, osakorrelatsioonide ja dispersioonide analüüs.

Sageli kirjeldatakse ka sisu kehtivust. Eeldatakse, et kõik testi ülesanded ja ülesanded peavad kuuluma kindlasse valdkonda (vaimsed omadused, käitumine jne). Sisu kehtivuse mõiste iseloomustab iga testüksuse vastavust mõõdetavale domeenile. Sisu kehtivust peetakse mõnikord osaks usaldusväärsusest või "ülditatavusest" (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Siiski, millal


Konkreetse ainevaldkonna saavutuskatseteks ülesandeid valides on oluline tähelepanu pöörata ka ülesannete testi kaasamise reeglitele.

Klassikalises testiteoorias käsitletakse usaldusväärsust ja valiidsust üksteisest suhteliselt sõltumatult. Kuid nende mõistete suhetest on teine ​​arusaam. Kaasaegne testiteooria põhineb mudelite kasutamisel. Parameetrid on hinnatud kindla mudeli piires. Kui ülesanne ei vasta mudeli nõuetele, siis selle mudeli raames loetakse see kehtetuks. Konstruktsiooni valideerimine on osa mudeli enda kontrollimisest. See valideerimine viitab peamiselt teadaolevate skaalaomadustega ühemõõtmelise varjatud huvipakkuva tunnuse olemasolu testimisele. Sobivate mõõtude määramiseks saab kindlasti kasutada skaala skoori ja neid saab korreleerida teiste konstruktsioonide mõõtmistega, et koguda teavet konstruktsiooni koonduva ja lahkneva kehtivuse kohta.

Psühhodiagnostika sarnaneb keelega, mida kirjeldatakse kui nelja komponendi ühtsust, mis on esitatud kolmel tasandil. Esimene komponent, testiteooria, on analoogne süntaksiga, keele grammatikaga. Generatiivne grammatika on ühest küljest geniaalne mudel, teisalt aga reeglitele alluv süsteem. Nende reeglite abil ehitatakse lihtsate jaatavate lausete põhjal keerulised laused. Samas jätab see mudel kõrvale kirjelduse, kuidas suhtlusprotsess on korraldatud (mida edastatakse ja mida tajutakse) ja mis eesmärkidel seda läbi viiakse. Selle mõistmine nõuab lisateadmisi. Sama võib öelda ka testiteooria kohta: see on psühhodiagnostikas vajalik, kuid ei suuda selgitada, mida psühhodiagnostik teeb ja mis on tema eesmärgid.

1.3.2. Psühholoogilised teooriad ja psühholoogilised konstruktsioonid

Psühhodiagnostika on alati millegi konkreetse diagnoos: isikuomadused, käitumine, mõtlemine, emotsioonid. Testid on mõeldud individuaalsete erinevuste hindamiseks. On mitmeid mõisteid

individuaalsed erinevused, millest igaühel on oma eripärad. Kui tunnistatakse, et psühhodiagnostika ei piirdu ainult individuaalsete erinevuste hindamisega, siis muutuvad psühhodiagnostika jaoks hädavajalikuks teised teooriad. Näitena võib tuua vaimse arengu protsesside erinevuste ja sotsiaalse keskkonna erinevuste hindamise. Kuigi individuaalsete erinevuste hindamine ei ole psühhodiagnostika hädavajalik atribuut, on selles valdkonnas siiski teatud uurimistraditsioonid. Psühhodiagnostika sai alguse intelligentsuse erinevuste hindamisest. Testide põhieesmärk oli "geeniuse päriliku edasikandumise kindlakstegemine" (Gallon) või laste valimine treeninguteks (Binet, Simon). IQ mõõtmine sai teoreetilise arusaama ja praktilise arengu Spearmani (Suurbritannia) ja Thurstone'i (USA) töödes. Raymond B. Cattell tegi samamoodi isiksuseomaduste hindamiseks. Psühhodiagnostika on lahutamatult seotud teooriate ja ideedega individuaalsete erinevuste kohta saavutustes (maksimaalsete võimete hindamine) ja käitumisvormides (tüüpilise toimimise tase). See traditsioon kehtib ka tänapäeval. Psühhodiagnostika õpikutes hinnatakse sotsiaalse keskkonna erinevusi palju harvemini, kui arvestada arenguprotsesside endi iseärasusi. Sellele pole mõistlikku seletust. Ühest küljest ei piirdu diagnostika teatud teooriate ja kontseptsioonidega. Teisest küljest vajab see teooriaid, kuna just nendes määratakse diagnoositav sisu (st „mida“ diagnoositakse). Näiteks intelligentsust võib pidada nii üldiseks tunnuseks kui ka paljude üksteisest sõltumatute võimete aluseks. Kui psühhodiagnostika püüab sellest või teisest teooriast “põgeneda”, siis saavad psühhodiagnostilise protsessi aluseks terve mõistuse ideed. Uurimistöös kasutatakse erinevaid andmeanalüüsi meetodeid ning uurimistöö üldine loogika määrab ühe või teise matemaatilise mudeli valiku ning määrab kasutatavate psühholoogiliste mõistete struktuuri. Sellised matemaatilise statistika meetodid


ki, nagu dispersioonanalüüs, regressioonanalüüs, faktoranalüüs ja korrelatsioonide arvutamine, eeldavad lineaarsete sõltuvuste olemasolu. Kui neid meetodeid kasutatakse valesti, siis „sisestavad“ saadud andmetesse ja kasutatud konstruktsioonidesse oma struktuuri.

Ideed sotsiaalse keskkonna ja isiksuse arengu erinevustest ei avaldanud psühhodiagnostikale peaaegu mingit mõju. Õpikutes (vt nt Murphy & Davidshofer, 1988) uuritakse klassikalist testiteooriat ja käsitletakse asjakohaseid statistilise töötlemise meetodeid, kirjeldatakse üldtuntud teste ning käsitletakse psühhodiagnostika kasutamist praktikas: juhtimispsühholoogias, personalivalikus, hindamisel. inimese psühholoogilised omadused.

Individuaalsete erinevuste teooriad (nagu ka ideed sotsiaalsete keskkondade ja vaimse arengu erinevuste kohta) on analoogsed keele semantika uurimisega. See on olemuse, sisu ja tähenduse uurimine. Tähendusi struktureeritakse teatud viisil (sarnaselt psühholoogilistele konstruktsioonidele), näiteks sarnasuse või kontrasti (analoogia, konvergents, lahknemine) abil.

1.3.3. Psühholoogilised testid ja muud metoodilised vahendid

Kavandatava skeemi kolmas komponent on testid, protseduurid ja metoodilised vahendid, mille abil kogutakse teavet isiksuseomaduste kohta. Drene ja Sijtsma (1990, lk 31) defineerivad teste järgmiselt: „Psühholoogilise testi peetakse klassifikatsiooniks teatud süsteemi järgi või mõõtmisprotseduuriks, mis võimaldab teha teatud hinnangu ühe või mitme empiiriliselt isoleeritud või teoreetiliselt eraldatud isiku kohta. inimkäitumise konkreetse aspekti tunnused (katseolukorras). Sel juhul uuritakse vastajate reaktsiooni teatud hulgale hoolikalt valitud stiimulitele ning saadud vastuseid võrreldakse testinormidega.

Diagnostika nõuab teste ja tehnikaid, et koguda funktsioonide kohta usaldusväärset, täpset ja kehtivat teavet

ja iseloomulikud isiksuseomadused inimese mõtlemise, emotsioonide ja käitumise kohta. Lisaks testimisprotseduuride väljatöötamisele sisaldab see komponent ka järgmisi küsimusi: kuidas luuakse teste, kuidas formuleeritakse ja valitakse ülesandeid, kuidas kulgeb testimisprotsess, millised on nõuded testimistingimustele, kuidas võetakse arvesse mõõtmisvigu , kuidas testitulemusi arvutatakse ja tõlgendatakse.

Testi arendusprotsessis eristatakse ratsionaalset ja empiirilist strateegiat. Ratsionaalse strateegia rakendamine algab põhimõistete määratlemisest (näiteks intelligentsuse, ekstravertsuse mõiste) ning nende mõistete järgi formuleeritakse testiülesanded. Sellise strateegia näide on Guttmani (1957, 1968, 1957, 1968, 1957, 1968, 1957, 1968, 1978). Esiteks määratakse peamiste konstruktsioonide erinevad aspektid, seejärel valitakse ülesanded ja ülesanded nii, et iga aspekti võetakse arvesse. Teine strateegia seisneb selles, et ülesanded valitakse empiiriliselt. Näiteks kui teadlane üritaks luua kutsehuvitesti, mis eristaks arste inseneridest, oleks see protseduur. Mõlemad vastajate rühmad peavad vastama kõikidele testiküsimustele ning need punktid, mille puhul leitakse statistiliselt olulisi erinevusi, kaasatakse lõpptesti. Kui näiteks väitele “Mulle meeldib kala püüda” on rühmade vahel erinevusi, saab sellest väitest testi osa. Selle raamatu keskne eeldus on, et test on seotud kontseptuaalse või taksonoomilise teooriaga, mis määratleb need omadused.

Testi eesmärk on tavaliselt määratletud selle kasutusjuhendis. Test peab olema standardiseeritud, et see saaks hinnata erinevusi üksikisikute, mitte katsetingimuste vahel. Siiski esineb standardiseerimisest kõrvalekaldeid protseduurides, mida nimetatakse "piiride testimiseks" ja "õppimispotentsiaali testimiseks". Nendel tingimustel abistatakse vastajat protsessis


testida ja seejärel hinnata sellise protseduuri mõju tulemusele. Ülesannete vastuste hindamine on objektiivne, s.t. teostatakse vastavalt standardprotseduurile. Saadud tulemuste tõlgendamine on samuti rangelt määratletud ja viiakse läbi katsestandardite alusel.

Psühhodiagnostika kolmas komponent - psühholoogilised testid, instrumendid, protseduurid - sisaldab teatud ülesandeid, mis on psühhodiagnostika väikseimad ühikud ja selles mõttes on ülesanded sarnased keele foneemidega. Võimalike foneemide kombinatsioonide arv on piiratud. Ainult teatud foneemilised struktuurid suudavad moodustada sõnu ja lauseid, mis tagavad teabe edastamise kuulajale. Samuti Ja testülesanded: ainult teatud kombinatsioonis üksteisega võivad need saada tõhusaks vahendiks vastava konstruktsiooni hindamisel.

Esitluse kirjeldus üksikute slaidide kaupa:

1 slaid

Slaidi kirjeldus:

2 slaidi

Slaidi kirjeldus:

Füüsilisi omadusi nimetatakse tavaliselt kaasasündinud (geneetiliselt päritud) morfofunktsionaalseteks omadusteks, tänu millele on võimalik füüsiline (materiaalselt väljendatud) inimtegevus, mis avaldub täielikult sihipärases motoorses tegevuses. Peamised füüsilised omadused on tugevus, kiirus, vastupidavus, paindlikkus ja agility.

3 slaidi

Slaidi kirjeldus:

Motoorsed võimed on individuaalsed omadused, mis määravad inimese motoorsete võimete taseme (V.I. Lyakh, 1996). Inimese motoorsete võimete aluseks on füüsilised omadused ning avaldumisvormiks motoorsed võimed ja oskused. Motoorsete võimete hulka kuuluvad tugevus, kiirus, kiirus-tugevus, motoorne koordinatsioonivõime, üldine ja spetsiifiline vastupidavus

4 slaidi

Slaidi kirjeldus:

Füüsiliste (motoorsete) võimete süstematiseerimise skeem Füüsilised (motoorsed) võimed Tingimuslikud (energia) Tugevus Konditsioneerimisvõimete kombinatsioonid Vastupidavus Kiirus Paindlikkus Koordinatsioon (informatsioon) CS, mis on seotud üksikute motoorsete tegevuste rühmadega, spetsiaalne CS Spetsiifiline CS Koordinatsioonivõimete kombinatsioonid Kombinatsioonid konditsioneerimis- ja koordinatsioonivõimet

5 slaidi

Slaidi kirjeldus:

MOTORIA VÕIMETE ARENGUTASE /kõrge, keskmine, madal/ SAAD TÄPSET INFO TESTIDE /või kontrollharjutuste/ abil.

6 slaidi

Slaidi kirjeldus:

Kontrolltestide (testide) abil on võimalik tuvastada nende võimete absoluutsed (eksplitsiitsed) ja suhtelised (varjatud, varjatud) näitajad. Absoluutnäitajad iseloomustavad teatud motoorsete võimete arengutaset, võtmata arvesse nende mõju üksteisele. Suhtelised näitajad võimaldavad hinnata motoorsete võimete avaldumist, võttes arvesse seda mõju.

7 slaidi

Slaidi kirjeldus:

Ülalmainitud füüsilisi võimeid saab kujutada potentsiaalselt olemasolevatena, st enne mis tahes motoorse tegevuse või tegevuste algust (neid võib nimetada potentsiaalseteks võimeteks) ja reaalselt avalduvatena alguses (ka motoorsete testide tegemisel) selle tegevuse sooritamise protsess (praegused füüsilised võimed).

8 slaidi

Slaidi kirjeldus:

Teatud kokkuleppega saame rääkida ELEMENTAARILISTEST ja füüsilistest võimetest KOMPLEKSIlistest füüsilistest võimetest

Slaid 9

Slaidi kirjeldus:

UURIMISTULEMUSED VÕIMALDAVAD ERISTADA JÄRGMISI FÜÜSILISI VÕIMEID ERIKONKREETSID ÜLDOSA KS

10 slaidi

Slaidi kirjeldus:

Spetsiaalsed füüsilised võimed viitavad terviklike motoorsete tegevuste või tegevuste homogeensetele rühmadele: jooksmine, akrobaatilised ja võimlemisharjutused aparaadil, viskamine motoorsete toimingutega, spordimängud (korvpall, võrkpall).

11 slaidi

Slaidi kirjeldus:

Võime rääkida füüsiliste võimete spetsiifilistest ilmingutest kui komponentidest, mis moodustavad nende sisemise struktuuri.

12 slaidi

Slaidi kirjeldus:

Seega on inimese koordinatsioonivõimete põhikomponendid: võime navigeerida, tasakaalu hoida, reageerida, liikumisparameetreid eristada; rütmivõime, motoorsete tegevuste ümberkorraldamine, vestibulaarne stabiilsus, vabatahtlik lihaste lõdvestumine. Need võimed on spetsiifilised.

Slaid 13

Slaidi kirjeldus:

Kiirusvõimete struktuuri peamisteks komponentideks loetakse reageerimiskiirust, üksiku liigutuse kiirust, liigutuste sagedust ja terviklikes motoorsetes tegevustes avalduvat kiirust.

Slaid 14

Slaidi kirjeldus:

Tugevusvõimete ilminguteks on: staatiline (isomeetriline) tugevus, dünaamiline (isotooniline) tugevus - plahvatusohtlik, lööki neelav jõud.

15 slaidi

Slaidi kirjeldus:

Vastupidavuse struktuur on väga keeruline: aeroobne, mille avaldumiseks on vaja hapniku allikaid energia lagunemiseks; anaeroobsed (glükolüütilised, kreatiinfosfaadi energiaallikad - ilma hapniku osaluseta); erinevate lihasrühmade vastupidavus staatilistes poosides - staatiline vastupidavus; vastupidavus dünaamilistes harjutustes, mida sooritatakse kiirusega 20-90% maksimumist.

16 slaidi

Slaidi kirjeldus:

Vähem keerukad on paindlikkuse ilmingud (vormid), kus eristatakse aktiivset ja passiivset painduvust.

Slaid 17

Slaidi kirjeldus:

Üldfüüsilisi võimeid tuleks mõista kui inimese potentsiaali ja realiseeritud võimeid, mis määravad tema valmisoleku erineva päritolu ja tähendusega motoorseid toiminguid edukalt läbi viia. Erilised füüsilised võimed on inimese võimed, mis määravad tema valmisoleku sooritada edukalt sarnase päritolu ja tähendusega motoorseid toiminguid. Seetõttu annavad testid infot eelkõige eri- ja spetsiifiliste füüsiliste (kiirus, koordinatsioon, jõud, vastupidavus, painduvus) kujunemisastme kohta.

18 slaidi

Slaidi kirjeldus:

Erilised füüsilised võimed on inimese võimed, mis määravad tema valmisoleku sooritada edukalt sarnase päritolu ja tähendusega motoorseid toiminguid. Seetõttu annavad testid infot eelkõige eri- ja spetsiifiliste füüsiliste (kiirus, koordinatsioon, jõud, vastupidavus, painduvus) kujunemisastme kohta.

Slaid 19

Slaidi kirjeldus:

Testimise eesmärk on välja selgitada tingimis- ja koordinatsioonivõimete arengutasemed, hinnata tehnilise ja taktikalise valmisoleku kvaliteeti. Testitulemuste põhjal saab: võrrelda nii üksikute õpilaste kui ka tervete erinevates piirkondades ja riikides elavate rühmade valmisolekut; viia läbi spordialade valikut ühe või teise spordiala harrastamiseks, võistlustel osalemiseks; teostama suures osas objektiivset kontrolli koolinoorte ja noorsportlaste hariduse (treeningu) üle; selgitada välja kasutatavate vahendite, õppemeetodite ja tundide korraldamise vormide eelised ja puudused; lõpuks põhjendada laste ja noorukite füüsilise vormi normid (eakohased, individuaalsed).

20 slaidi

Slaidi kirjeldus:

Koos eelnimetatud ülesannetega taanduvad erinevate riikide praktikas testimisülesanded järgmiselt: õpetada kooliõpilasi ise määrama oma füüsilise vormi taset ja planeerima endale vajalikud kehaliste harjutuste komplektid; julgustada õpilasi oma füüsilist vormi (vormi) veelgi parandama; teadma mitte niivõrd motoorsete võimete esialgset arengutaset, vaid selle muutumist teatud aja jooksul; julgustada õpilasi, kes on saavutanud kõrgeid tulemusi, kuid mitte niivõrd kõrgele tasemele, kuivõrd isiklike tulemuste planeeritud tõusule.

21 slaidi

Slaidi kirjeldus:

Test on mõõtmine või test, mis tehakse inimese võimete või seisundi kindlakstegemiseks.

22 slaidi

Slaidi kirjeldus:

Katsetena saab kasutada ainult neid katseid (proove), mis vastavad erinõuetele: tuleb määrata mis tahes testi (või testide) kasutamise eesmärk; Tuleks välja töötada standardiseeritud katsemõõtmismetoodika ja katsemenetlus; on vaja määrata testide usaldusväärsus ja infosisu; testitulemusi saab esitada vastavas hindamissüsteemis

Slaid 23

Slaidi kirjeldus:

Test. Testimine. Testimise tulemus Testide kasutamise süsteemi vastavalt ülesandele, tingimuste korraldamist, katsete sooritamist katsealuste kaupa, tulemuste hindamist ja analüüsi nimetatakse testimiseks. Mõõtmiste käigus saadud arvväärtus on testimise (testi) tulemus.

24 slaidi

Slaidi kirjeldus:

Kehalises kasvatuses kasutatavad testid põhinevad motoorsel tegevusel (füüsilised harjutused, motoorsed ülesanded). Selliseid teste nimetatakse liikumis- või motoorikatestideks.

25 slaidi

Slaidi kirjeldus:

Teada on testide klassifikatsioon nende struktuuri järgi ja nende esmaste näidustuste järgi eristatakse üksik- ja kompleksteste. Ühe tunnuse (koordinatsiooni- või konditsioneerimisvõime) mõõtmiseks ja hindamiseks kasutatakse ühte testi.

26 slaidi

Slaidi kirjeldus:

Slaid 27

Slaidi kirjeldus:

Komplekstesti abil hinnatakse mitut erineva või sama võimega tunnust või komponenti. näiteks kohast üles hüppamine (käte lainetusega, ilma käteviivitamata, etteantud kõrgusele).

28 slaidi

Slaidi kirjeldus:

Slaid 29

Slaidi kirjeldus:

TESTID võivad olla konditsioneerimistestid, et hinnata jõuvõimet ja hinnata vastupidavust; hinnata kiirusvõimeid; painduvuse hindamiseks, koordinatsioonitestid, et hinnata koordinatsioonivõimeid, mis on seotud üksikute iseseisvate motoorsete tegevuste rühmadega, mis mõõdavad erikoordinatsioonivõimeid; hinnata spetsiifilisi koordinatsioonivõimeid - tasakaaluvõimet, ruumilist orientatsiooni, reageerimisvõimet, liikumisparameetrite eristamist, rütmi, motoorsete toimingute ümberkorraldusi, koordinatsiooni (suhtlemist), vestibulaarset stabiilsust, tahtlikku lihaste lõdvestumist).

30 slaidi

Slaidi kirjeldus:

Iga klassifikatsioon on omamoodi juhis selliste testide valimiseks (või loomiseks), mis on testimisülesannetega paremini kooskõlas.

31 slaidi

Slaidi kirjeldus:

MOOTORTESTIDE KVALITEEDIKRITEERIUMID Mõiste “mootorite test” täidab oma eesmärki, kui test vastab asjakohastele põhikriteeriumidele: usaldusväärsus, stabiilsus, samaväärsus, objektiivsus, informatiivsus (kehtivus), aga ka lisakriteeriumid: standardiseeritus, võrreldavus ja ökonoomsus. Usaldusväärsuse ja infosisu nõuetele vastavaid teste nimetatakse heaks ehk autentseks (usaldusväärseks).

32 slaidi

Slaidi kirjeldus:

Testi usaldusväärsus viitab täpsusastmele, millega see konkreetset motoorset võimet hindab, sõltumata seda hindava isiku nõuetest. Usaldusväärsus on tulemuste järjepidevuse ulatus, kui samu inimesi testitakse korduvalt samades tingimustes; See on indiviidi testitulemuse stabiilsus või stabiilsus kontrollharjutuse kordamisel. Teisisõnu säilitab laps katsealuste rühmas korduva testimise tulemuste põhjal (näiteks hüppetulemused, jooksuaeg, viskekaugus) järjekindlalt oma pingerea. Testi usaldusväärsus määratakse korrelatsioonistatistilise analüüsi abil, arvutades usaldusväärsuse koefitsiendi. Sel juhul kasutatakse testi usaldusväärsuse hindamiseks erinevaid meetodeid.

Slaid 33

Slaidi kirjeldus:

Testi stabiilsus põhineb seosel esimese ja teise katse vahel, mida korratakse teatud aja pärast samadel tingimustel sama katsetaja poolt. Usaldusväärsuse määramiseks korduva testimise meetodit nimetatakse kordustestiks. Testi stabiilsus sõltub testi tüübist, katsealuste vanusest ja soost ning testi ja kordustesti vahelisest ajavahemikust. Näiteks konditsioneerimistestide või morfoloogiliste tunnuste tulemused lühikeste ajavahemike jooksul on stabiilsemad kui koordinatsioonitestide tulemused; vanematel lastel on tulemused stabiilsemad kui noorematel. Kordustest tehakse tavaliselt hiljemalt nädala pärast. Pikemate intervallidega (näiteks kuu aja pärast) langeb isegi selliste katsete nagu 1000 m jooks või paigalt kaugushüpe stabiilsus märgatavalt madalamaks.

Slaid 34

Slaidi kirjeldus:

Testi ekvivalentsus Testi ekvivalentsus on katsetulemuse korrelatsioon teiste sama tüüpi testide tulemustega. Näiteks kui on vaja valida, milline test peegeldab adekvaatsemalt kiirusvõimeid: 30, 50, 60 või 100 m jooksmine Suhtumine samaväärsetesse (homogeensetesse) testidesse sõltub paljudest põhjustest. Kui on vaja tõsta hinnangute või uuringu järelduste usaldusväärsust, siis on soovitav kasutada kahte või enamat samaväärset testi. Ja kui ülesandeks on luua minimaalselt teste sisaldav aku, tuleks kasutada ainult ühte samaväärsetest testidest. Selline aku, nagu märgitud, on heterogeenne, kuna selles sisalduvad testid mõõdavad erinevaid motoorseid võimeid. Heterogeense katsepatarei näiteks on 30 m jooks, jõutõmbed, ettekõverdus ja 1000 m jooks.

35 slaidi

Slaidi kirjeldus:

Testide usaldusväärsus määratakse ka testi kaasatud paaris ja paaritu katsete keskmiste skooride võrdlemisel. Näiteks võrreldakse 1, 3, 5, 7 ja 9 katsel sooritatud löögi keskmist täpsust 2, 4, 6, 8 ja 10 katsel sooritatud laskude keskmise täpsusega. Seda usaldusväärsuse hindamise meetodit nimetatakse kahekordistamiseks ehk splittingiks. Seda kasutatakse eelkõige koordinatsioonivõime hindamisel ja juhul, kui testi tulemuse moodustavate katsete arv on vähemalt kuus.

36 slaidi

Slaidi kirjeldus:

Testi objektiivsuse (järjepidevuse) all Testi objektiivsuse (järjepidevuse) all mõistetakse erinevate eksperimenteerijate (õpetajad, kohtunikud, eksperdid) samade subjektide kohta saadud tulemuste järjepidevuse määra. Testimise objektiivsuse suurendamiseks on vaja järgida standardseid katsetingimusi: testimise aeg, asukoht, ilmastikutingimused; ühtne materjali- ja riistvaratugi; psühhofüsioloogilised tegurid (koormuse maht ja intensiivsus, motivatsioon); teabe esitamine (testiülesande täpne sõnaline sõnastus, selgitus ja demonstratsioon). See on testi nn objektiivsus. Samuti räägitakse tõlgendusobjektiivsusest, mis puudutab sõltumatuse määra katsetulemuste tõlgendamisel erinevate eksperimenteerijate poolt.

Slaid 37

Slaidi kirjeldus:

Üldiselt, nagu eksperdid märgivad, saab testide usaldusväärsust tõsta mitmel viisil: testimise rangem standardimine, katsete arvu kasv, katsealuste parem motivatsioon, hindajate (kohtunike, ekspertide) arvu suurendamine, nende arvamuste järjepidevuse suurendamine ja samaväärsete testide arvu suurenemine. Testi usaldusväärsuse näitajate jaoks pole fikseeritud väärtusi. Enamikul juhtudel kasutatakse järgmisi soovitusi: 0,95 - 0,99 - suurepärane töökindlus; 0,90 -- 0,94 -- hea; 0,80 -- 0,89 -- vastuvõetav; 0,70 - 0,79 - halb; 0,60 - 0,69 - üksikute hinnangute puhul kaheldav, test sobib ainult katsealuste rühma iseloomustamiseks.

Slaid 38

Slaidi kirjeldus:

Testi kehtivus on täpsusaste, millega see mõõdab hinnatavat motoorset võimet või oskust. Välismaises (ja kodumaises) kirjanduses kasutatakse sõna “informatiivsus” asemel terminit “validity” (inglise keelest validity - validity, validity, legality). Tegelikult vastab teadlane infosisust rääkides kahele küsimusele: mida see konkreetne test (testide aku) mõõdab ja milline on mõõtmise täpsusaste. Valiidsust on mitut tüüpi: loogiline (sisuline), empiiriline (katseandmetel põhinev) ja ennustav.

Slaid 39

Slaidi kirjeldus:

Nagu märgitud, on olulised täiendavad katsekriteeriumid standardimine, võrreldavus ja tõhusus. Standardimise olemus seisneb selles, et testitulemuste põhjal on võimalik luua standardeid, mis on praktika jaoks eriti olulised. Testi võrreldavus on võime võrrelda ühe või mitme paralleelse (homogeense) testi vormiga saadud tulemusi. Praktilises mõttes vähendab võrreldavate motoorsete testide kasutamine tõenäosust, et sama testi regulaarse kasutamise tulemusena hinnatakse mitte ainult oskuste taset ja mitte niivõrd võimekuse taset. Samas tõstavad võrreldavad testitulemused järelduste usaldusväärsust. Säästlikkuse kui testi kvaliteedi kriteeriumi olemus seisneb selles, et testi läbiviimine ei nõua pikka aega, suuri materjalikulusid ja paljude abiliste osalemist.

40 slaidi

Slaidi kirjeldus:

KOOLISEALISTE LASTE VALMISVALMISTUSE KONTROLLI KORRALDAMINE Motoorsete võimete testimise (tuletame meelde, et esimene on informatiivsete testide valik) teiseks oluliseks probleemiks on nende kasutamise korraldus Kehalise kasvatuse õpetaja peab kindlaks tegema: millise aja jooksul on parem korraldada testimist, kuidas seda tunnis läbi viia ja kui sageli tuleks testimist läbi viia Testimise ajastus on kooskõlas kooliprogrammiga, mis näeb ette õpilaste füüsilise vormi kohustusliku testimise kaks korda päevas.

41 slaidi

Slaidi kirjeldus:

Teadmised iga-aastastest muutustest laste motoorsete võimete arengus võimaldavad õpetajal järgmiseks õppeaastaks kehalise kasvatuse protsessis asjakohaseid kohandusi teha. Küll aga peab ja saab õpetaja läbi viia tihedamini testimist ja läbi viia nn operatiivkontrolli. Soovitav on seda teha, et teha kindlaks näiteks esimese veerandi jooksul toimunud kergejõustikutundide mõjul toimunud muutused kiiruse, jõuvõimete ja vastupidavuse tasemes. Selleks saab õpetaja testide abil hinnata laste koordinatsioonivõimeid programmimaterjali valdamise alguses ja lõpus, näiteks spordimängudes, et tuvastada muutusi nende võimete arengunäitajates.

42 slaidi

Slaidi kirjeldus:

Arvestada tuleb sellega, et lahendatavate pedagoogiliste probleemide mitmekesisus ei võimalda anda õpetajale ühtset testimise metoodikat, ühesuguseid kontrolltööde läbiviimise ja kontrolltööde tulemuste hindamise reegleid. See eeldab eksperimenteerijatelt (õpetajatelt) iseseisvuse demonstreerimist teoreetiliste, metoodiliste ja organisatsiooniliste testimisküsimuste lahendamisel. Tunnis testimine peab olema seotud selle sisuga. Teisisõnu, kasutatav test või testid, vastavalt vastavatele nõuetele (uurimismeetodina), tuleks orgaaniliselt kaasata planeeritud kehaliste harjutuste hulka. Kui lastel on vaja näiteks määrata kiirusvõimete või vastupidavuse arengutase, siis tuleks vajalikud testid planeerida sellesse tunniossa, milles lahendatakse vastavate kehaliste võimete arendamise ülesandeid.

43 slaidi

Slaidi kirjeldus:

Testimise sageduse määravad suuresti konkreetsete füüsiliste võimete arengutempo, vanus, sugu ja nende arengu individuaalsed omadused. Näiteks kiiruse, vastupidavuse või jõu oluliseks kasvuks on vaja mitu kuud regulaarset treeningut (treeningut). Samal ajal on paindlikkuse või individuaalse koordinatsioonivõime oluliseks suurendamiseks vaja ainult 4-12 treeningut. Kui alustate nullist, võite saavutada füüsilise kvaliteedi paranemise lühema aja jooksul. Ja sama kvaliteedi parandamiseks, kui lapsel on kõrge tase, kulub rohkem aega. Sellega seoses peab õpetaja sügavamalt uurima laste erinevate motoorsete võimete arengu ja paranemise tunnuseid erinevas vanuses ja soost erineval ajal.

44 slaidi

Slaidi kirjeldus:

Laste üldfüüsilise vormisoleku hindamisel saab kasutada väga erinevaid testpatareisid, mille valik sõltub konkreetsetest testieesmärkidest ja vajalike tingimuste olemasolust. Kuna aga saadud testitulemusi saab hinnata vaid võrdluse teel, on soovitatav valida testid, mis on laste kehalise kasvatuse teoorias ja praktikas laialdaselt esindatud. Näiteks toetuge neile, mida soovitatakse FC programmis. Testide komplekti kasutades õpilase või õpilaste rühma üldise füüsilise vormisoleku võrdlemiseks kasutavad nad testitulemuste teisendamist punktideks või skoorideks. Punktide summa muutumine korduva testimise käigus võimaldab hinnata nii üksiku lapse kui ka lasterühma edusamme.

Slaid 49

Slaidi kirjeldus:

Testimise oluline aspekt on konkreetse füüsilise võimekuse ja üldfüüsilise vormisoleku hindamiseks testi valimise probleem.

50 slaidi

Slaidi kirjeldus:

Praktilised soovitused ja nõuanded. TÄHTIS: määrake (valige) vajalike testide aku (või komplekt) koos kõigi nende rakendamise üksikasjade üksikasjaliku kirjeldusega; Määrake testimise kuupäevad (parem - 2-3 nädalat september - 1. testimine, 2-3 nädalat mai - 2. testimine); Vastavalt soovitusele määrake täpselt kindlaks laste vanus testimise päeval ja nende sugu; Töötada välja ühtsed andmesalvestusprotokollid (võimalusel põhinevad IKT kasutamisel); Määrake assistentide ring ja viige testimisprotseduur ise läbi; Viivitamatult teostada testimisandmete matemaatiline töötlemine – põhiliste statistiliste parameetrite arvutamine (aritmeetiline keskmine, aritmeetilise keskmise viga, standardhälve, variatsioonikoefitsient ja aritmeetiliste keskmiste erinevuste usaldusväärsuse hindamine, näiteks sama ja erineva paralleelklassid teatud vanuses ja soost laste koolid ); Töö üheks oluliseks etapiks võib olla testitulemuste tõlkimine punktideks või hinneteks. Regulaarsel testimisel (2 korda aastas, mitme aasta jooksul) annab see õpetajal aimu tulemuste edenemisest.

51 slaidi

Slaidi kirjeldus:

Moskva “Valgustus” 2007 Raamat sisaldab levinumaid motoorseid teste õpilaste tingimis- ja koordinatsioonivõime hindamiseks. Käsiraamat näeb ette kehalise kasvatuse õpetaja individuaalse lähenemise igale konkreetsele õpilasele, arvestades tema vanust ja kehaehitust.