Przedstawienie podstaw teorii sprawdzianu w wychowaniu fizycznym. Teoria testu i badanie sprawności fizycznej uczniów

RAPORT

uczeń 137 gr. Iwanowa I.

w sprawie badania efektywności metod szkoleniowych
z wykorzystaniem metod statystyki matematycznej

Sekcje raportu sporządzane są zgodnie z wzorami podanymi w niniejszej instrukcji na koniec każdego etapu gry. Wypełnione protokoły przechowywane są w Katedrze Biomechaniki do czasu konsultacji przed egzaminem. Uczniowie, którzy nie zgłosili się z wykonanej pracy i nie złożyli zeszytu ze sprawozdaniem prowadzącemu zajęcia, nie są dopuszczeni do egzaminu z metrologii sportowej.


I etap gry biznesowej
Sterowanie i pomiar w sporcie

Cel:

1. Zapoznać się z teoretycznymi podstawami kontroli i pomiaru w sporcie i wychowaniu fizycznym.

2. Nabycie umiejętności pomiaru wskaźników szybkości u sportowców.

1. Kontrola fizyczna
edukacja i sport

Wychowanie fizyczne i trening sportowy nie jest procesem spontanicznym, ale kontrolowanym. W każdym momencie człowiek znajduje się w określonym stanie fizycznym, o którym decyduje głównie stan zdrowia (zgodność parametrów życiowych z normą, stopień odporności organizmu na niekorzystne nagłe wpływy), budowa ciała i stan funkcji fizycznych .

Wskazane jest kontrolowanie stanu fizycznego człowieka poprzez zmianę go we właściwym kierunku. Zarządzanie to odbywa się poprzez wychowanie fizyczne i sport, do których zalicza się w szczególności ćwiczenia fizyczne.

Wydaje się tylko, że nauczyciel (lub trener) kontroluje stan fizyczny, wpływając na zachowanie sportowca, tj. proponowanie określonych ćwiczeń fizycznych, a także monitorowanie poprawności ich wykonania i uzyskanych wyników. W rzeczywistości zachowanie sportowca nie jest kontrolowane przez trenera, ale przez samego sportowca. Podczas treningu sportowego wywierany jest wpływ na układ samorządowy (organizm ludzki). Indywidualne różnice w kondycji sportowców nie dają pewności, że to samo oddziaływanie wywoła taką samą reakcję. Dlatego istotna jest kwestia informacji zwrotnej: informacji o stanie zawodnika otrzymywanej przez trenera podczas kontroli procesu treningowego.

Kontrola w wychowaniu fizycznym i sporcie polega na pomiarze wskaźników, wyborze najważniejszych i ich matematycznym przetwarzaniu.

Zarządzanie procesem edukacyjno-szkoleniowym obejmuje trzy etapy:

1) zbieranie informacji;

2) jego analizę;

3) podejmowanie decyzji (planowanie).

Zbieranie informacji zwykle odbywa się w ramach kompleksowej kontroli, której przedmiotem jest:

1) działalność konkurencyjna;

2) obciążenia treningowe;

3) stan zawodnika.



Istnieją (V.A. Zaporozhanov) trzy rodzaje stanów sportowca, w zależności od czasu trwania przerwy potrzebnej do przejścia z jednego stanu do drugiego.

1. Wystawiany na scenie(stały) stan. Zapisano stosunkowo długi – tygodnie lub miesiące. Złożona cecha stanu etapowego sportowca, odzwierciedlająca jego zdolność do wykazania się osiągnięciami sportowymi, nazywana jest gotowością, a stan optymalnej (najlepszej w danym cyklu treningowym) gotowością nazywa się mundur sportowy. Oczywiście stanu sprawności sportowej nie da się osiągnąć ani utracić w ciągu jednego czy kilku dni.

2. Aktualny państwo. Zmiany pod wpływem jednego lub kilka klas. Często konsekwencje udziału w zawodach lub pracy szkoleniowej wykonywanej na jednych z zajęć ciągną się przez kilka dni. W tym przypadku sportowiec zwykle zauważa zjawiska zarówno o charakterze niekorzystnym (na przykład ból mięśni), jak i pozytywnym (na przykład stan zwiększonej wydajności). Takie zmiany nazywane są opóźniony efekt treningu.

Aktualny stan sportowca determinuje charakter kolejnych sesji treningowych i wielkość występujących w nich obciążeń. Szczególnym przypadkiem stanu obecnego, charakteryzującego się gotowością do wykonania w najbliższych dniach ćwiczenia wyczynowego z wynikiem bliskim maksymalnemu, jest tzw. aktualna gotowość.

3. Operacyjny państwo. Zmiany pod wpływem jednorazowe wykonanie wysiłkiem fizycznym i ma charakter przejściowy (np. zmęczenie spowodowane jednorazowym przebiegnięciem danego dystansu; przejściowy wzrost wydajności po rozgrzewce). Stan operacyjny zawodnika zmienia się w trakcie sesji treningowej i należy to wziąć pod uwagę planując przerwy między podejściami, powtarzaniem biegów, podejmując decyzję o celowości dodatkowej rozgrzewki itp. Szczególny przypadek stanu operacyjnego, charakteryzujący się natychmiastową gotowością do wykonania ćwiczenia wyczynowego z wynikiem zbliżonym do maksymalnego, nazywa się gotowość operacyjna.

Zgodnie z powyższą klasyfikacją istnieją trzy główne rodzaje monitorowania kondycji sportowca:

1) kontrola sceniczna. Jego celem jest ocena stanu etapowego (gotowości) zawodnika;

2) kontrola prądu. Jego głównym zadaniem jest określenie codziennych (bieżących) wahań kondycji sportowca;

3) kontrola operacyjna. Jego celem jest szybka ocena aktualnego stanu zdrowia sportowca.

Pomiar lub test przeprowadzany w celu określenia stanu lub zdolności sportowca nazywa się test. Procedura pomiaru lub testu nazywa się testowaniem.

Każde badanie wiąże się z pomiarem. Ale nie każdy pomiar służy jako test. Do badań można stosować wyłącznie te, które spełniają następujące wymagania metrologiczne: wymagania:

2) standaryzacja;

3) obecność systemu ocen;

4) rzetelność i zawartość informacyjna (współczynnik jakości) testów;

5) rodzaj kontroli (stopniowa, bieżąca lub operacyjna).

Test oparty na zadaniach motorycznych nazywa się motoryką. Wyróżnia się trzy grupy testów motorycznych:

1. Ćwiczenia kontrolne, w których zadaniem sportowca jest wykazanie się maksymalnymi wynikami. Wynik testu jest osiągnięciem motorycznym. Na przykład czas potrzebny sportowcowi na przebiegnięcie dystansu 100 m.

2. Standardowe badania funkcjonalne, podczas których zadanie, jednakowe dla wszystkich, dozowane jest albo w zależności od ilości wykonanej pracy, albo według wielkości zmian fizjologicznych. Wynikiem badania są wskaźniki fizjologiczne lub biochemiczne podczas standardowej pracy lub osiągnięć motorycznych przy standardowej ilości zmian fizjologicznych. Na przykład procentowy wzrost tętna po 20 przysiadach lub prędkość, z jaką biegnie sportowiec ze stałym tętnem wynoszącym 160 uderzeń na minutę.

3. Maksymalne testy funkcjonalne, podczas których zawodnik musi wykazać się maksymalnymi wynikami. Wynikiem testu są wskaźniki fizjologiczne lub biochemiczne przy maksymalnej pracy. Na przykład maksymalne zużycie tlenu lub maksymalny dług tlenowy.

Testowanie wysokiej jakości wymaga znajomości teorii pomiaru.


Zagadnienia kluczowe: Test jako narzędzie pomiarowe. Podstawowe teorie testowania. Funkcje, możliwości i ograniczenia testowania. Zastosowanie testów w ocenie personelu. Zalety i wady stosowania testów. Formy i rodzaje zadań testowych. Technologia budowy zadań. Ocena jakości testu. Rzetelność i ważność. Testuj oprogramowanie do tworzenia oprogramowania. 2




Test jako narzędzie pomiaru Podstawowe pojęcia testologii: pomiar, test, treść i forma zadań, rzetelność i ważność wyników pomiarów. Ponadto testologia wykorzystuje takie pojęcia nauk statystycznych, jak próba i populacja ogólna, wskaźniki średnie, zmienność, korelacja, regresja itp. 4




Zadanie testowe to skuteczna dydaktycznie i technologicznie jednostka materiału kontrolnego, część egzaminu spełniająca wymogi czystości merytorycznej treści (lub jednowymiarowości), poprawności merytorycznej i logicznej, poprawności formy oraz akceptowalności obrazu geometrycznego zadania. 6




Test tradycyjny jest standaryzowaną metodą diagnozowania poziomu i struktury gotowości. W takim teście wszyscy badani rozwiązują te same zadania, w tym samym czasie, na tych samych warunkach i według tych samych zasad oceny odpowiedzi. Aby osiągnąć cel testowania, można stworzyć niezliczoną ilość testów i każdy z nich może mieć znaczenie dla osiągnięcia celu. 8


Professionogram (z łac.: specjalność Professio + zapis gramatyczny) to system cech opisujących dany zawód, a także zawierający wykaz norm i wymagań, jakie ten zawód lub specjalność nakłada na pracownika. W szczególności professionalogram może zawierać zestawienie cech psychologicznych, jakie muszą spełniać przedstawiciele określonych grup zawodowych. 9


Podstawowe teorie testowania Pierwsze prace naukowe dotyczące teorii testów pojawiły się na początku XX wieku, na styku psychologii, socjologii, pedagogiki i innych tzw. nauk behawioralnych. Zagraniczni psychologowie nazywają tę naukę psychometrią (Psychometrika), a nauczyciele nazywają ją pomiarem pedagogicznym (pomiarem edukacyjnym). Niezaburzona ideologią i polityką interpretacja nazwy „testologia” jest prosta i przejrzysta: nauka o testach. 10


Pierwszy etap to prehistoria - od starożytności do końca XIX wieku, kiedy rozpowszechniły się przednaukowe formy kontroli wiedzy i umiejętności; drugi okres, klasyczny, trwał od początku lat 20. do końca lat 60., podczas którego powstała klasyczna teoria testów; trzeci okres – technologiczny – rozpoczął się w latach 70. XX wieku – czas rozwoju metod testów adaptacyjnych i treningu, metodologii efektywnego opracowywania testów i elementów testów do parametrycznej oceny przedmiotów według mierzonej jakości ukrytej. jedenaście


Funkcje, możliwości i ograniczenia testowania Testy stosowane w selekcji mają na celu uzyskanie portretu psychologicznego kandydata, ocenę jego zdolności oraz wiedzy i umiejętności zawodowych. Testy pozwalają porównać kandydatów między sobą lub ze standardami, czyli kandydatem idealnym. Testy służą do pomiaru cech potrzebnych danej osobie do skutecznego wykonywania pracy. Niektóre testy są zaprojektowane w taki sposób, że pracodawca zarządza testem i oblicza jego wyniki. Inne wymagają usług doświadczonych konsultantów, aby zapewnić właściwą aplikację. 12


Ograniczenia w stosowaniu testów wiążą się z kosztownym ich administrowaniem; - z przydatnością do oceny zdolności człowieka; - testy skuteczniej przewidują sukces w pracy, która zawiera doraźne zadania zawodowe, a są mało wygodne w przypadkach, gdy zadania rozwiązywane w pracy zajmują kilka dni lub tygodni. 13








2. Stosowaną terminologię należy dostosować do konkretnej grupy docelowej. Należy także wykluczyć artykuły zbędne lub zawierające dwa lub więcej pytań, gdyż czasami wprowadzają respondenta w błąd i utrudniają jego interpretację. 17


3. Aby spełnić wszystkie te wymagania, powinieneś przejrzeć cały bank pytań artykuł po artykule i przeanalizować, czemu służy każdy z nich. Na przykład, jeśli opracowywany jest test sprawdzający zdolności analityczne kandydatów na księgowych, warto zastanowić się, co w tym przypadku oznacza „zdolność analityczna”. 18




5. Po wybraniu pytań i formatów punktacji należy je przekonwertować na format przyjazny dla użytkownika, z jasno napisanymi instrukcjami i przykładowymi pytaniami; tak, aby kandydaci przystępujący do egzaminu w pełni zrozumieli, czego się od nich wymaga. 20


6. Bardzo często na tym etapie rozwoju w teście pojawia się więcej pytań niż jest to konieczne. Według niektórych szacunków trzy razy więcej, niż pozostanie w końcowym systemie testowym lub pomiarowym. Początkowym środkiem byłoby zatem przetestowanie opracowywanego testu na stosunkowo dużej próbie istniejących pracowników, aby upewnić się, że wszystkie pytania są łatwe do zrozumienia. 21


7. Testy wiedzy zwykle rozpoczynają się od prostych pytań, które pod koniec stają się coraz trudniejsze. Jeżeli testy mają na celu zmierzenie postaw społecznych i cech osobowości, przydatne może być naprzemienne formułowanie stwierdzeń o charakterze negatywnym i pozytywnym, aby uniknąć nieprzemyślanych odpowiedzi. 22


8. Ostatni krok obejmuje przeprowadzenie testu na szeroko reprezentatywnej próbie w celu ustalenia standardów wydajności, wiarygodności i ważności przed użyciem go jako narzędzia selekcji. Ponadto konieczne jest określenie ważności testu, aby upewnić się, że nie dyskryminuje on żadnej podgrupy populacji (np. różnic etnicznych). 23


Ocena jakości testu Aby metody selekcji były wystarczająco skuteczne, muszą być rzetelne, aktualne i wiarygodne. Wiarygodność metody selekcji charakteryzuje się odpornością na błędy systematyczne pomiaru, czyli spójnością w różnych warunkach. 24


W praktyce wiarygodność oceny osiąga się poprzez porównanie wyników dwóch lub większej liczby podobnych badań przeprowadzonych w różnych dniach. Innym sposobem na zwiększenie wiarygodności jest porównanie wyników kilku alternatywnych metod selekcji (na przykład testu i rozmowy kwalifikacyjnej). Jeśli wyniki są podobne lub takie same, można je uznać za prawidłowe. 25


Rzetelność oznacza, że ​​wykonane pomiary dadzą taki sam wynik jak poprzednie, to znaczy na wyniki oceny nie mają wpływu czynniki zewnętrzne. Trafność oznacza, że ​​metoda mierzy dokładnie to, co ma mierzyć. Maksymalna możliwa dokładność informacji uzyskanych specjalnie opracowanymi metodami w badaniach naukowych jest ograniczona czynnikami technicznymi i nie przekracza 0,8. 26


W praktyce doboru personelu zauważa się, że rzetelność różnych metod oceny mieści się w przedziałach: 0,1 – 0,2 – rozmowa tradycyjna; 0,2 – 0,3 – zalecenia; 0,3 – 0,5 – testy zawodowe; 0,5 – 0,6 – wywiad ustrukturyzowany, wywiad kompetencyjny; 0,5 – 0,7 – testy poznawcze i osobowości; 0,6 – 0,7 – podejście oparte na kompetencjach (ośrodek oceny). 27


Trafność odnosi się do stopnia, w jakim dany wynik, metoda lub kryterium „przewiduje” przyszłe wyniki testowanej osoby. Ważność metod odnosi się do wniosków wyciągniętych z konkretnej procedury, a nie do samej procedury. Oznacza to, że sama metoda selekcji może być niezawodna, ale może nie odpowiadać konkretnemu zadaniu: może nie mierzyć tego, co jest wymagane w tym przypadku. 28


Oprogramowanie do tworzenia testów W praktyce krajowej prezentowane są różne kompleksowe programy z modułem „Psychodiagnostyka”, na przykład program „1 C: Zarządzanie płacami i personelem 8.0” z modułem „Psychodiagnostyka”, opracowany wspólnie z grupą nauczycieli z kl. Katedra Psychologii Osobowości i Psychologii Ogólnej Wydziału Psychologii Moskiewskiego Uniwersytetu Państwowego im M.V. Łomonosow pod kierunkiem doktora psychiatrii. nauki, prof. A. N. Gusiewa. Symulator szkoleniowy do tworzenia systemów oceny personelu i adaptacji metod testowych na Wydziale Psychologii UJ, również opracowany na podstawie „1 C: Enterprise 8.2” firmy Personnel Soft. 29


Literatura: Selekcja i rekrutacja: technologie testowania i oceny / Dominic Cooper, Ivan T. Robertson, Gordon Tinline. – M., wydawnictwo „Wierszyna”, – 156 s. Psychologiczne wsparcie działalności zawodowej: teoria i praktyka / wyd. prof. G. S. Nikiforova. – St. Petersburg: Przemówienie, – 816 s. trzydzieści

Zastosowania, cele i zadania testowania oprogramowania są zróżnicowane, dlatego testowanie jest oceniane i wyjaśniane na różne sposoby. Czasami samym testerom trudno jest wyjaśnić, czym jest testowanie oprogramowania „tak jak jest”. Następuje zamieszanie.

Aby rozwikłać to zamieszanie, Aleksiej Barantsev (praktyk, trener i konsultant ds. testowania oprogramowania; pochodzący z Instytutu Programowania Systemów Rosyjskiej Akademii Nauk) poprzedza swoje szkolenia z testowania filmem wprowadzającym na temat głównych założeń testowania.

Wydaje mi się, że w tym raporcie wykładowca potrafił najdokładniej i najtrafniej wyjaśnić, „czym jest testowanie” z punktu widzenia naukowca i programisty. Aż dziwne, że ten tekst nie pojawił się jeszcze na Habré.

Poniżej przedstawiam skróconą wersję tego raportu. Na końcu tekstu znajdują się linki do pełnej wersji, a także do wspomnianego filmu.

Podstawy testowania

Drodzy koledzy,

Najpierw spróbujmy zrozumieć, czym testowanie NIE jest.

Testowanie to nie rozwój,

Nawet jeśli testerzy wiedzą, jak programować, w tym także przeprowadzać testy (testowanie automatyczne = programowanie), mogą opracować (dla siebie) pewne programy pomocnicze.

Jednakże testowanie nie jest działalnością polegającą na tworzeniu oprogramowania.

Testowanie to nie analiza,

A nie czynność polegająca na zbieraniu i analizowaniu wymagań.

Chociaż podczas procesu testowania czasami trzeba doprecyzować wymagania, a czasami trzeba je przeanalizować. Ale ta czynność nie jest najważniejsza; należy ją raczej wykonać po prostu z konieczności.

Testowanie to nie zarządzanie,

Pomimo tego, że w wielu organizacjach istnieje taka rola jak „menedżer testów”. Oczywiście testerami trzeba zarządzać. Ale testowanie samo w sobie nie jest zarządzaniem.

Testowanie to nie pisanie o charakterze technicznym,

Testerzy muszą jednak dokumentować swoje testy i swoją pracę.

Testowania nie można uznać za jedną z tych czynności tylko dlatego, że podczas procesu programowania (lub analizy wymagań lub pisania dokumentacji do testów) całą tę pracę wykonują testerzy dla siebie, a nie dla kogoś innego.

Działalność ma znaczenie tylko wtedy, gdy jest na nią popyt, to znaczy testerzy muszą wyprodukować coś „na eksport”. Co robią „na eksport”?

Wady, opisy usterek czy raporty z testów? Jest to częściowo prawdą.

Ale to nie jest cała prawda.

Główne działania testerów

polega na tym, że dostarczają uczestnikom projektu tworzenia oprogramowania negatywną opinię na temat jakości oprogramowania.

„Negatywny feedback” nie ma żadnej negatywnej konotacji i nie oznacza, że ​​testerzy robią coś złego lub że robią coś złego. To tylko termin techniczny, który oznacza dość prostą rzecz.

Ale ta rzecz jest bardzo istotna i prawdopodobnie najważniejszy element działań testerów.

Istnieje nauka - „teoria systemów”. Definiuje pojęcie „informacji zwrotnej”.

„Sprzężenie zwrotne” to pewne dane, które wracają na wejście z wyjścia lub pewna część danych, która wraca z powrotem na wejście z wyjścia. Ta informacja zwrotna może być pozytywna lub negatywna.

Obydwa rodzaje informacji zwrotnej są równie ważne.

W rozwoju systemów oprogramowania pozytywny feedback to oczywiście pewnego rodzaju informacja, którą otrzymujemy od użytkowników końcowych. Są to prośby o jakąś nową funkcjonalność, jest to wzrost sprzedaży (jeśli wypuścimy produkt wysokiej jakości).

Negatywne opinie mogą również pochodzić od użytkowników końcowych w formie negatywnych recenzji. Lub może pochodzić od testerów.

Im szybciej zostanie zapewnione ujemne sprzężenie zwrotne, tym mniej energii potrzeba do modyfikacji tego sygnału. Dlatego testowanie należy rozpocząć jak najwcześniej, na najwcześniejszych etapach projektu i przekazać tę informację zwrotną zarówno na etapie projektowania, jak i być może nawet wcześniej, na etapie zbierania i analizowania wymagań.

Swoją drogą, tu właśnie rośnie zrozumienie, że testerzy nie odpowiadają za jakość. Pomagają tym, którzy są za to odpowiedzialni.

Synonimy do słowa „testowanie”

Z punktu widzenia, że ​​testowanie polega na przekazywaniu negatywnej informacji zwrotnej, znany na całym świecie skrót QA (Quality Assurance) zdecydowanie NIE jest synonimem terminu „testowanie”.

Samo przekazywanie negatywnej opinii nie może być uważane za zapewnienie jakości, ponieważ zapewnienie to pewne pozytywne mierniki. Rozumie się, że w tym przypadku zapewniamy jakość i podejmujemy terminowe działania w celu zapewnienia poprawy jakości tworzenia oprogramowania.

Jednak „kontrolę jakości” – kontrolę jakości, można uznać w szerokim znaczeniu za synonim terminu „testowanie”, ponieważ kontrola jakości to dostarczanie informacji zwrotnej w jej najróżniejszych odmianach, na różnych etapach projektu oprogramowania.

Czasami testowanie rozumie się jako odrębną formę kontroli jakości.

Zamieszanie wynika z historii rozwoju testów. W różnych momentach termin „testowanie” oznaczał różne działania, które można podzielić na 2 duże klasy: zewnętrzną i wewnętrzną.

Definicje zewnętrzne

Definicje podawane w różnym czasie przez Myersa, Beisera i Kanera opisują testowanie dokładnie z punktu widzenia jego ZEWNĘTRZNEGO znaczenia. Oznacza to, że z ich punktu widzenia testowanie jest działaniem przeznaczonym na coś i z czegoś się nie składa. Wszystkie trzy definicje można podsumować jako dostarczające negatywnego sprzężenia zwrotnego.

Definicje wewnętrzne

Są to definicje zawarte w standardzie terminologii stosowanej w inżynierii oprogramowania, takim jak de facto standard o nazwie SWEBOK.

Takie definicje konstruktywnie wyjaśniają CZYM jest działanie testowe, ale nie dają zielonego pojęcia DLACZEGO potrzebne jest testowanie, do którego zostaną następnie wykorzystane wszystkie wyniki uzyskane ze sprawdzenia zgodności pomiędzy rzeczywistym zachowaniem programu a jego oczekiwanym zachowaniem .

testowanie jest

  • sprawdzenie zgodności programu z wymaganiami,
  • przeprowadzić poprzez obserwację jego pracy
  • w sytuacjach szczególnych, sztucznie stworzonych, wybranych w określony sposób.
Od tej chwili będziemy uważać to za roboczą definicję „testowania”.

Ogólny schemat testowania jest w przybliżeniu następujący:

  1. Tester otrzymuje na wejściu program i/lub wymagania.
  2. Coś z nimi robi, obserwuje działanie programu w określonych, sztucznie przez siebie stworzonych sytuacjach.
  3. Na wyjściu otrzymuje informację o dopasowaniach i niedopasowaniach.
  4. Informacje te są następnie wykorzystywane do udoskonalania istniejącego programu. Lub w celu zmiany wymagań programu, który jest wciąż w fazie rozwoju.

Co to jest test

  • Jest to sytuacja szczególna, sztucznie stworzona, wybrana w określony sposób,
  • oraz opis uwag, jakie należy poczynić na temat działania programu
  • aby sprawdzić, czy spełnia jakieś wymagania.
Nie ma potrzeby zakładać, że sytuacja jest chwilowa. Test może trwać dość długo, np. podczas testowania wydajności ta sztucznie stworzona sytuacja może stanowić obciążenie systemu, które będzie trwało dość długo. Obserwacje, które należy poczynić, to zestaw różnych wykresów lub wskaźników, które mierzymy podczas wykonywania tego testu.

Twórca testów zajmuje się wyborem ograniczonego zestawu z ogromnego, potencjalnie nieskończonego zestawu testów.

Cóż, możemy zatem stwierdzić, że tester podczas testowania robi dwie rzeczy.

1. Po pierwsze kontroluje wykonanie programu i tworzy te bardzo sztuczne sytuacje, w których będziemy sprawdzać zachowanie programu.

2. Po drugie, obserwuje zachowanie programu i porównuje to, co widzi, z tym, czego się oczekuje.

Jeśli tester automatyzuje testy, to sam nie obserwuje zachowania programu - deleguje to zadanie specjalnemu narzędziu lub specjalnemu programowi, który sam napisał. To ona obserwuje, porównuje zaobserwowane zachowanie z oczekiwanym i daje testerowi jedynie ostateczny wynik – czy zaobserwowane zachowanie pokrywa się z oczekiwanym, czy też nie.

Każdy program jest mechanizmem przetwarzania informacji. Dane wejściowe to informacja w jednej formie, wyjście to informacja w innej formie. Jednocześnie program może mieć wiele wejść i wyjść, mogą być one różne, to znaczy program może mieć kilka różnych interfejsów, a interfejsy te mogą mieć różne typy:

  • Interfejs użytkownika
  • Interfejs programowania aplikacji (API)
  • Protokół sieciowy
  • System plików
  • Stan środowiska
  • Wydarzenia
Najpopularniejsze interfejsy to
  • zwyczaj,
  • graficzny,
  • tekst,
  • wspornikowy,
  • i mowa.
Korzystając ze wszystkich tych interfejsów, tester:
  • w jakiś sposób stwarza sztuczne sytuacje,
  • i sprawdza, jak program zachowuje się w takich sytuacjach.

To jest testowanie.

Inne klasyfikacje typów testów

Najczęściej stosowanym podziałem na trzy poziomy jest
  1. testów jednostkowych,
  2. testy integracyjne,
  3. testowanie systemu.
Testowanie jednostkowe zwykle oznacza testowanie na dość niskim poziomie, czyli testowanie poszczególnych operacji, metod i funkcji.

Testowanie systemu odnosi się do testowania na poziomie interfejsu użytkownika.

Czasem używa się też innych terminów, np. „testowanie komponentowe”, ale ja wolę wyróżnić te trzy, gdyż technologiczny podział na testowanie jednostkowe i systemowe nie ma większego sensu. Te same narzędzia i te same techniki można stosować na różnych poziomach. Podział jest warunkowy.

Praktyka pokazuje, że narzędzia pozycjonowane przez producenta jako narzędzia do testów jednostkowych, z równym powodzeniem można wykorzystać na poziomie testowania całej aplikacji jako całości.

A narzędzia testujące całą aplikację na poziomie interfejsu użytkownika czasami chcą zajrzeć na przykład do bazy danych lub wywołać tam jakąś osobną procedurę składowaną.

Oznacza to, że podział na testy systemowe i jednostkowe jest ogólnie rzecz biorąc czysto warunkowy, mówiąc z technicznego punktu widzenia.

Używane są te same narzędzia i jest to normalne, stosowane są te same techniki, na każdym poziomie możemy mówić o testowaniu innego typu.

Łączymy:

Oznacza to, że możemy mówić o jednostkowych testach funkcjonalności.

Możemy mówić o systemowych testach funkcjonalności.

Możemy mówić o testach jednostkowych, na przykład wydajnościowych.

Można mówić o testowaniu efektywności systemu.

Albo bierzemy pod uwagę skuteczność pojedynczego algorytmu, albo rozważamy skuteczność całego systemu jako całości. Czyli technologiczny podział na testy jednostkowe i systemowe nie ma większego sensu. Ponieważ te same narzędzia i te same techniki mogą być stosowane na różnych poziomach.

Na koniec podczas testów integracyjnych sprawdzamy, czy moduły w systemie poprawnie współdziałają ze sobą. Oznacza to, że właściwie wykonujemy te same testy, co podczas testów systemu, tylko dodatkowo zwracamy uwagę na to, jak dokładnie moduły współdziałają ze sobą. Przeprowadzamy dodatkowe kontrole. To jedyna różnica.

Spróbujmy jeszcze raz zrozumieć różnicę między testowaniem systemowym a testowaniem jednostkowym. Ponieważ podział ten występuje dość często, różnica ta powinna istnieć.

I ta różnica objawia się, gdy nie dokonujemy klasyfikacji technologicznej, ale klasyfikację według celu testowanie.

Klasyfikację według bramek można wygodnie przeprowadzić za pomocą „magicznego kwadratu”, który został pierwotnie wynaleziony przez Briana Marika, a następnie ulepszony przez Ariego Tennena.

W tym magicznym kwadracie wszystkie rodzaje testów są umieszczone w czterech ćwiartkach, w zależności od tego, na co testy zwracają większą uwagę.

Pionowo – im wyższy rodzaj testów, tym więcej uwagi poświęcamy niektórym zewnętrznym przejawom zachowania programu, im jest on niższy, tym większą uwagę poświęcamy jego wewnętrznej strukturze technologicznej programu.

Poziomo – im dalej na lewo są nasze testy, tym większą uwagę poświęcamy ich programowaniu, im dalej na prawo, tym więcej uwagi poświęcamy testowaniu ręcznemu i badaniom programu przez ludzi.

W szczególności terminy takie jak testowanie akceptacyjne, testowanie akceptacyjne i testowanie jednostkowe można łatwo wpisać w to pole w znaczeniu, w jakim jest ono najczęściej używane w literaturze. Jest to testowanie niskiego poziomu z dużą, przytłaczającą częścią programowania. Oznacza to, że wszystkie testy są programowane, przeprowadzane całkowicie automatycznie, a uwagę zwraca się przede wszystkim na wewnętrzną strukturę programu, a dokładnie na jego cechy technologiczne.

W prawym górnym rogu będziemy mieli testy ręczne mające na celu pewne zewnętrzne zachowanie programu, w szczególności testy użyteczności, a w prawym dolnym rogu najprawdopodobniej będziemy mieli testy różnych właściwości niefunkcjonalnych: wydajności, bezpieczeństwa i tak dalej NA.

Zatem w oparciu o klasyfikację według celu testy jednostkowe znajdują się w lewym dolnym kwadrancie, a wszystkie pozostałe ćwiartki to testy systemowe.

Dziękuję za uwagę.

Podstawowe pojęcia teorii testów.

Pomiar lub test przeprowadzany w celu określenia stanu lub zdolności sportowca nazywany jest testem. Każde badanie wiąże się z pomiarem. Ale nie każda zmiana służy jako test. Procedura pomiaru lub testu nazywa się testowaniem.

Test oparty na zadaniach motorycznych nazywa się motoryką. Wyróżnia się trzy grupy testów motorycznych:

  • 1. Ćwiczenia kontrolne, w których zadaniem sportowca jest wykazanie się maksymalnymi wynikami.
  • 2. Standardowe badania funkcjonalne, podczas których zadanie, jednakowe dla wszystkich, dozowane jest albo w zależności od ilości wykonanej pracy, albo według wielkości zmian fizjologicznych.
  • 3. Maksymalne testy funkcjonalne, podczas których zawodnik musi wykazać się maksymalnymi wynikami.

Testowanie wysokiej jakości wymaga znajomości teorii pomiaru.

Podstawowe pojęcia teorii pomiaru.

Pomiar polega na określeniu zgodności pomiędzy badanym zjawiskiem z jednej strony a liczbami z drugiej.

Podstawą teorii pomiaru są trzy pojęcia: skale pomiarowe, jednostki miary i dokładność pomiaru.

Wagi pomiarowe.

Skala pomiarowa to prawo, według którego zmierzonemu wynikowi przypisuje się wartość liczbową w miarę jego wzrostu lub spadku. Przyjrzyjmy się niektórym skalom używanym w sporcie.

Skala nazw (skala nominalna).

Jest to najprostsza ze wszystkich skal. Liczby pełnią w nim rolę etykiet i służą do wykrywania i rozróżniania badanych obiektów (na przykład numeracja zawodników drużyny piłkarskiej). Liczby tworzące skalę nazewnictwa mogą być zmieniane przez meta. W tej skali nie ma relacji więcej-mniej, dlatego niektórzy uważają, że stosowania skali nazewnictwa nie należy uważać za miarę. Korzystając ze skali, nazw, można wykonywać tylko niektóre operacje matematyczne. Na przykład nie można dodawać ani odejmować jej liczb, ale można policzyć, ile razy (jak często) pojawia się dana liczba.

Skala zamówienia.

Są sporty, w których o wyniku zawodnika decyduje wyłącznie miejsce zajęte w zawodach (np. sztuki walki). Po takich zawodach widać, który z zawodników jest silniejszy, a który słabszy. Ale o ile silniejszy lub słabszy, nie da się powiedzieć. Jeśli trzech zawodników zajęło odpowiednio pierwsze, drugie i trzecie miejsce, jaka jest różnica w ich sportowej rywalizacji, pozostaje niejasna: drugi zawodnik może być prawie równy pierwszemu lub może być od niego słabszy i prawie identyczny z trzecim. Miejsca zajęte na skali porządkowej nazywane są rangami, a sama skala nazywana jest rangą lub niemetryczną. W takiej skali jej liczby składowe są uporządkowane według rangi (tj. Zajętych miejsc), ale odstępów między nimi nie można dokładnie zmierzyć. W przeciwieństwie do skali nazewnictwa, skala porządkowa pozwala nie tylko ustalić fakt równości lub nierówności mierzonych obiektów, ale także określić charakter nierówności w formie sądów: „więcej znaczy mniej”, „lepiej jest gorzej” itp. .

Za pomocą skal zamówień można mierzyć wskaźniki jakościowe, które nie mają ścisłej miary ilościowej. Skale te są szczególnie szeroko stosowane w naukach humanistycznych: pedagogice, psychologii, socjologii.

Większą liczbę operacji matematycznych można zastosować na stopniach skali porządkowej niż na liczbach skali nazw.

Skala interwałowa.

Jest to skala, w której liczby są nie tylko uporządkowane według rangi, ale także oddzielone określonymi odstępami. Cechą odróżniającą ją od opisanej poniżej skali ilorazowej jest arbitralny wybór punktu zerowego. Przykładami są czas kalendarzowy (początek chronologii w różnych kalendarzach został ustalony z przypadkowych powodów), kąt stawu (kąt w stawie łokciowym przy pełnym wyprostu przedramienia można przyjąć jako równy zero lub 180°), temperaturę, energię potencjalną podniesionego ładunku, potencjału pola elektrycznego itp.

Wyniki pomiarów na skali przedziałowej można przetwarzać wszystkimi metodami matematycznymi, z wyjątkiem obliczania współczynników. Te skale interwałowe dają odpowiedź na pytanie: „o ile więcej”, ale nie pozwalają na stwierdzenie, że jedna wartość mierzonej wielkości jest tyle razy większa lub mniejsza od drugiej. Na przykład, jeśli temperatura wzrosła z 10 do 20 C, nie można powiedzieć, że stała się dwukrotnie cieplejsza.

Skala relacji.

Skala ta różni się od skali przedziałowej jedynie tym, że ściśle określa położenie punktu zerowego. Dzięki temu skala ilorazowa nie nakłada żadnych ograniczeń na aparat matematyczny służący do przetwarzania wyników obserwacji.

W sporcie skale proporcji mierzą dystans, siłę, prędkość i dziesiątki innych zmiennych. Skala ilorazowa mierzy również te wielkości, które powstają jako różnice między liczbami mierzonymi na skali przedziałowej. Zatem czas kalendarzowy liczony jest na skali przedziałów, a przedziały czasowe - na skali wskaźników. Stosując skalę ilorazową (i tylko w tym przypadku!) pomiar dowolnej wielkości sprowadza się do eksperymentalnego określenia stosunku tej wielkości do innej podobnej wielkości, przyjmowanej jako jednostka. Mierząc długość skoku, dowiadujemy się, ile razy długość ta jest większa od długości innego ciała przyjętej jako jednostka długości (w konkretnym przypadku linijka metra); Ważąc sztangę, określamy stosunek jej masy do masy innego ciała - pojedynczego „kilogramowego” ciężaru itp. Jeżeli ograniczymy się jedynie do stosowania skal ilorazowych, wówczas możemy podać inną (węższą, bardziej szczegółową) definicję miary: zmierzyć wielkość oznacza eksperymentalnie znaleźć jej stosunek do odpowiedniej jednostki miary.

Jednostki miary.

Aby wyniki różnych pomiarów mogły być ze sobą porównywane, muszą być wyrażone w tych samych jednostkach. W 1960 roku na Międzynarodowej Generalnej Konferencji Miar i Wag przyjęto Międzynarodowy Układ Jednostek Miar, w skrócie SI (od pierwszych liter słów System International). Obecnie ugruntowało się preferowane zastosowanie tego systemu we wszystkich obszarach nauki i techniki, w gospodarce narodowej, a także w dydaktyce.

SI obejmuje obecnie siedem podstawowych, niezależnych od siebie jednostek (patrz tabela 2.1.)

Tabela 1.1.

Ze wskazanych jednostek podstawowych wyprowadza się jednostki innych wielkości fizycznych w formie pochodnych. Jednostki pochodne wyznacza się na podstawie wzorów wiążących ze sobą wielkości fizyczne. Na przykład jednostka długości (metr) i jednostka czasu (sekunda) są jednostkami podstawowymi, a jednostka prędkości (metr na sekundę) jest pochodną.

Oprócz podstawowych jednostek SI wyróżnia dwie dodatkowe jednostki: radian, jednostkę kąta płaskiego i steradian, jednostkę kąta przestrzennego (kąta w przestrzeni).

Dokładność pomiarów.

Nie można dokonać absolutnie dokładnego pomiaru. Wynik pomiaru nieuchronnie zawiera błąd, którego wielkość jest tym mniejsza, im dokładniejsza jest metoda pomiaru i urządzenie pomiarowe. Przykładowo, używając zwykłej linijki z podziałką milimetrową, nie da się zmierzyć długości z dokładnością do 0,01 mm.

Błąd podstawowy i dodatkowy.

Błąd podstawowy to błąd metody pomiarowej lub przyrządu pomiarowego, który pojawia się w normalnych warunkach użytkowania.

Błąd dodatkowy to błąd urządzenia pomiarowego spowodowany odchyleniem jego warunków pracy od normalnych. Oczywiste jest, że przyrządy zaprojektowane do pracy w temperaturze pokojowej nie dadzą dokładnych odczytów, jeśli będą używane latem na stadionie w palącym słońcu lub zimą na mrozie. Błędy pomiaru mogą wystąpić, gdy napięcie w sieci elektrycznej lub zasilaniu akumulatorowym jest niższe niż normalnie lub nie ma stałej wartości.

Błędy bezwzględne i względne.

Wartość E = A-Ao, równa różnicy między odczytem urządzenia pomiarowego (A) a rzeczywistą wartością mierzonej wielkości (Ao), nazywana jest bezwzględnym błędem pomiaru. Mierzy się ją w tych samych jednostkach, co sama wielkość mierzona.

W praktyce często wygodnie jest stosować nie błąd bezwzględny, ale względny. Względny błąd pomiaru jest dwojakiego rodzaju – rzeczywisty i zmniejszony. Rzeczywisty błąd względny to stosunek błędu bezwzględnego do prawdziwej wartości mierzonej wielkości:

A D =-------------* 100%

Podany błąd względny jest stosunkiem błędu bezwzględnego do maksymalnej możliwej wartości mierzonej wielkości:

W górę =--------------* 100%

Błędy systematyczne i losowe.

Systematyczny to błąd, którego wartość nie zmienia się z pomiaru na pomiar. Dzięki tej właściwości często błąd systematyczny można przewidzieć z wyprzedzeniem lub w skrajnych przypadkach wykryć i wyeliminować na końcu procesu pomiarowego.

Sposób eliminacji błędu systematycznego zależy przede wszystkim od jego charakteru. Błędy systematyczne pomiaru można podzielić na trzy grupy:

błędy o znanym pochodzeniu i znanej wielkości;

błędy o znanym pochodzeniu, ale nieznanej skali;

błędy nieznanego pochodzenia i nieznanej wielkości. Najbardziej nieszkodliwe są błędy pierwszej grupy. Można je łatwo usunąć

poprzez wprowadzenie odpowiednich poprawek do wyniku pomiaru.

Do drugiej grupy zaliczają się przede wszystkim błędy związane z niedoskonałością metody pomiarowej i sprzętu pomiarowego. Na przykład błąd w pomiarze wydolności fizycznej przy użyciu maski do zbierania wydychanego powietrza: maska ​​utrudnia oddychanie, a sportowiec w naturalny sposób wykazuje niedocenianą sprawność fizyczną w porównaniu z rzeczywistą mierzoną bez maski. Wielkości tego błędu nie można przewidzieć z góry: zależy to od indywidualnych możliwości sportowca i jego stanu zdrowia w momencie badania.

Innym przykładem błędu systematycznego w tej grupie jest błąd związany z niedoskonałym sprzętem, gdy urządzenie pomiarowe w sposób oczywisty przeszacowuje lub zaniża rzeczywistą wartość mierzonej wartości, ale wielkość błędu nie jest znana.

Najbardziej niebezpieczne są błędy trzeciej grupy; ich występowanie wiąże się zarówno z niedoskonałością metody pomiaru, jak i z charakterystyką obiektu pomiaru – sportowca.

Błędy losowe powstają pod wpływem różnych czynników, których nie można z góry przewidzieć ani dokładnie uwzględnić. Błędów losowych w zasadzie nie da się wyeliminować. Stosując jednak metody statystyki matematycznej można oszacować wielkość błędu losowego i uwzględnić ją przy interpretacji wyników pomiarów. Bez obróbki statystycznej wyników pomiarów nie można uznać za wiarygodne.

Podstawy teorii testów 1. Podstawowe pojęcia teorii testów 2. Wiarygodność testów i sposoby jej wyznaczania

Pytania testowe 1. Jak nazywa się test? 2. Jakie są wymagania dotyczące testu? 3. Jakie testy nazywane są autentycznymi? 4. Jaka jest wiarygodność testu? 5. Wymień przyczyny powodujące różnice w wynikach podczas powtarzanych testów. 6. Czym różni się zmienność wewnątrzklasowa od zmienności międzyklasowej? 7. Jak w praktyce określić rzetelność testu? 8. Jaka jest różnica pomiędzy spójnością a stabilnością testu? 9. Jaka jest równoważność testów? 10. Co to jest jednorodny zestaw testów? 11. Co to jest heterogeniczny zestaw testów? 12. Sposoby poprawy wiarygodności testów.

Test to pomiar lub test przeprowadzany w celu określenia stanu lub zdolności danej osoby. Nie wszystkie pomiary można wykorzystać jako testy, ale tylko te, które spełniają specjalne wymagania. Należą do nich: 1. standaryzacja (procedura i warunki badania muszą być takie same we wszystkich przypadkach stosowania testu); 2. niezawodność; 3. treść informacyjna; 4. Dostępność systemu ratingowego.

Wymagania testu: n Treść informacji – stopień dokładności, z jaką mierzy właściwość (jakość, zdolność, cecha), dla której jest wykorzystywana do oceny. n Wiarygodność to stopień, w jakim wyniki są spójne, gdy te same osoby są testowane wielokrotnie w tych samych warunkach. Spójność - (różni ludzie, ale te same urządzenia i te same warunki). n n Standardowość warunków - (te same warunki dla powtarzanych pomiarów). n Dostępność systemu oceniania - (przekład na system oceniania. Jak w szkole 5 -4 -3...).

Testy spełniające wymogi rzetelności i zawartości informacyjnej nazywane są rzetelnymi lub autentycznymi (gr. authentiko – w sposób rzetelny)

Proces testowania nazywany jest testowaniem; wynikowa wartość liczbowa uzyskana w wyniku pomiaru jest wynikiem badania (lub wynikiem badania). Na przykład bieg na 100 m jest testem, procedura prowadzenia wyścigów i pomiaru czasu jest testem, a czas biegu jest wynikiem testu.

Testy oparte na zadaniach motorycznych nazywane są testami motorycznymi lub motorycznymi. Ich wynikiem mogą być zarówno osiągnięcia motoryczne (czas pokonania dystansu, liczba powtórzeń, przebyty dystans itp.), jak i wskaźniki fizjologiczne i biochemiczne.

Czasami stosuje się nie jeden, ale kilka testów, które mają jeden ostateczny cel (na przykład ocena kondycji sportowca w okresie treningu wyczynowego). Taka grupa testów nazywana jest zbiorem lub baterią testów.

Ten sam test, zastosowany na tych samych osobach, powinien dać identyczne wyniki w tych samych warunkach (chyba że sami badani się zmienili). Jednak nawet przy najbardziej rygorystycznej standaryzacji i precyzyjnym sprzęcie wyniki testów zawsze się nieco różnią. Przykładowo osoba, która właśnie wykazała wynik 215 kG w teście dynamometrycznym martwego ciągu, po powtórzeniu wykazuje jedynie 190 kG.

Wiarygodność testów i sposoby jej wyznaczania Wiarygodność testu to stopień zgodności wyników przy wielokrotnym badaniu tych samych osób (lub innych obiektów) w tych samych warunkach.

Różnice w wynikach testu-powtórnika nazywane są wewnątrzindywidualnymi, wewnątrzgrupowymi lub wewnątrzklasowymi. Cztery główne przyczyny powodują to zróżnicowanie: 1. Zmiana stanu badanych (zmęczenie, trening, „uczenie się”, zmiana motywacji, koncentracji itp.). 2. Niekontrolowane zmiany warunków zewnętrznych i sprzętu (temperatura, wiatr, wilgotność, napięcie w sieci elektrycznej, obecność osób nieuprawnionych itp.), czyli wszystko, co łączy określenie „losowego błędu pomiaru”.

Cztery główne przyczyny powodują tę różnicę: 3. Zmiana stanu osoby przeprowadzającej test lub oceniającej test (i oczywiście zastąpienie jednego eksperymentatora lub sędziego innym). 4. Niedoskonałość testu (istnieją testy, które są oczywiście niewiarygodne. Przykładowo, jeśli badani wykonują rzuty wolne do kosza, to nawet koszykarz z dużym procentem trafień może przypadkowo popełnić błąd przy pierwszych rzutach ).

Pojęcie prawdziwego wyniku testu jest abstrakcją (nie można go zmierzyć eksperymentalnie). Dlatego musimy zastosować metody pośrednie. Najbardziej preferowaną metodą oceny wiarygodności jest analiza wariancji, a następnie obliczenie współczynników korelacji wewnątrzklasowej. Analiza wariancji umożliwia dekompozycję zarejestrowanej eksperymentalnie zmienności wyników badań na składowe określone wpływem poszczególnych czynników.

Jeśli zarejestrujemy wyniki badanych w jakimkolwiek teście, powtarzając ten test w różne dni i podejmując kilka prób każdego dnia, okresowo zmieniając eksperymentatorów, wówczas wystąpią różnice: a) w zależności od podmiotu; n b) z dnia na dzień; c) od eksperymentatora do eksperymentatora; d) od próby do próby. Analiza wariancji umożliwia wyizolowanie i ocenę tych wariancji. N

Zatem, aby ocenić rzetelność praktyczną testu, należy po pierwsze przeprowadzić analizę wariancji, n po drugie obliczyć współczynnik korelacji wewnątrzklasowej (współczynnik rzetelności).

Mówiąc o wiarygodności testów, należy rozróżnić ich stabilność (powtarzalność), spójność i równoważność. n n Stabilność testu odnosi się do odtwarzalności wyników przy powtarzaniu ich po pewnym czasie w tych samych warunkach. Powtarzane testowanie nazywa się zwykle ponownym testem. Spójność testu charakteryzuje się niezależnością wyników testu od cech osobistych osoby przeprowadzającej lub oceniającej test.

Jeśli wszystkie testy zawarte w zestawie testowym są wysoce równoważne, nazywa się to jednorodnym. Cały ten kompleks mierzy jedną właściwość motoryki człowieka (na przykład kompleks składający się z długich skoków z miejsca, skoków w górę i potrójnych; oceniany jest poziom rozwoju cech szybkościowo-siłowych). Jeżeli w kompleksie nie ma równoważnych testów, to znaczy zawarte w nim testy mierzą różne właściwości, wówczas nazywa się to heterogenicznym (na przykład kompleks składający się z dynamometrii martwego ciągu, skoku Abałakowa, biegu na 100 m).

Wiarygodność testów można w pewnym stopniu poprawić poprzez: n n n a) bardziej rygorystyczną standaryzację testów; b) zwiększenie liczby prób; c) zwiększenie liczby ewaluatorów (sędziów, eksperymentów) i zwiększenie spójności ich opinii; d) zwiększenie liczby badań równoważnych; e) lepsza motywacja badanych.