Co oznacza wyrażenie, że grupy różnią się istotnie statystycznie. Znaczenie statystyczne: definicja, koncepcja, istotność, równania regresji i testowanie hipotez

W tabelach wyników obliczeń statystycznych z zajęć, prac dyplomowych i magisterskich z psychologii zawsze występuje wskaźnik „p”.

Na przykład według cele badań Obliczono różnice w poziomie sensowności życia wśród nastoletnich chłopców i dziewcząt.

Średnia wartość

Test U Manna-Whitneya

Poziom istotności statystycznej (p)

Chłopcy (20 osób)

Dziewczyny

(5 ludzi)

Cele

28,9

35,2

17,5

0,027*

Proces

30,1

32,0

38,5

0,435

Wynik

25,2

29,0

29,5

0,164

Poczucie kontroli – „ja”

20,3

23,6

0,067

Poczucie kontroli – „Życie”

30,4

33,8

27,5

0,126

Znaczące życie

98,9

111,2

0,103

* - różnice są istotne statystycznie (s0,05)

Prawa kolumna wskazuje wartość „p” i to po jej wartości można określić, czy różnice w sensowności przyszłego życia pomiędzy chłopcami i dziewczętami są istotne, czy też nie. Zasada jest prosta:

  • Jeżeli poziom istotności statystycznej „p” jest mniejszy lub równy 0,05, wówczas stwierdzamy, że różnice są istotne. W poniższej tabeli różnice pomiędzy chłopcami i dziewczętami są istotne w odniesieniu do wskaźnika „Cele” – sens życia w przyszłości. W przypadku dziewcząt wskaźnik ten jest statystycznie istotnie wyższy niż w przypadku chłopców.
  • Jeżeli poziom istotności statystycznej „p” jest większy niż 0,05, wówczas uznaje się, że różnice nie są istotne. W poniższej tabeli różnice między chłopcami i dziewczętami nie są istotne dla wszystkich pozostałych wskaźników, z wyjątkiem pierwszego.

Skąd bierze się poziom istotności statystycznej „p”?

Obliczany jest poziom istotności statystycznej programu statystycznego wraz z kalkulacją kryterium statystyczne. W programach tych można także ustawić granicę krytyczną poziomu istotności statystycznej, a odpowiednie wskaźniki zostaną podświetlone przez program.

Przykładowo w programie STATISTICA przy obliczaniu korelacji można ustawić granicę „p”, np. 0,05, a wszystkie zależności istotne statystycznie zostaną podświetlone na czerwono.

Jeżeli kryterium statystyczne obliczane jest ręcznie, wówczas poziom istotności „p” wyznacza się poprzez porównanie wartości otrzymanego kryterium z wartością krytyczną.

Co pokazuje poziom istotności statystycznej „p”?

Wszystkie obliczenia statystyczne są przybliżone. Poziom tego przybliżenia wyznacza „p”. Poziom istotności zapisuje się jako miejsca dziesiętne, na przykład 0,023 lub 0,965. Jeśli pomnożymy tę liczbę przez 100, otrzymamy wskaźnik p w procentach: 2,3% i 96,5%. Te wartości procentowe odzwierciedlają prawdopodobieństwo, że nasze założenia dotyczące związku między na przykład agresją i lękiem będą błędne.

To jest, Współczynnik korelacji Wartość 0,58 pomiędzy agresją a lękiem uzyskano przy poziomie istotności statystycznej 0,05 i prawdopodobieństwie błędu 5%. Co to dokładnie oznacza?

Zidentyfikowana przez nas korelacja oznacza, że ​​w naszej próbie obserwujemy następujący schemat: im większa agresywność, tym większy lęk. Oznacza to, że jeśli weźmiemy dwójkę nastolatków i jeden będzie miał wyższy poziom lęku od drugiego, to wiedząc o dodatniej korelacji, możemy powiedzieć, że ten nastolatek będzie również charakteryzował się wyższą agresywnością. Ale ponieważ wszystko w statystyce jest przybliżone, to stwierdzając to, przyznajemy, że możemy się mylić, a prawdopodobieństwo błędu wynosi 5%. Oznacza to, że po dokonaniu 20 takich porównań w tej grupie nastolatków możemy popełnić jeden błąd w przewidywaniu poziomu agresywności, znając lęk.

Który poziom istotności statystycznej jest lepszy: 0,01 czy 0,05

Poziom istotności statystycznej odzwierciedla prawdopodobieństwo błędu. Zatem wynik przy p=0,01 jest dokładniejszy niż przy p=0,05.

W badania psychologiczne przyjął dwa dopuszczalne poziomy istotność statystyczna wyników:

p=0,01 – wysoka wiarygodność wyniku analiza porównawcza lub analiza relacji;

p=0,05 - dokładność wystarczająca.

Mam nadzieję, że ten artykuł pomoże Ci samodzielnie napisać pracę o psychologii. Jeśli potrzebujesz pomocy, skontaktuj się z nami (wszystkie rodzaje prac z zakresu psychologii; obliczenia statystyczne).

Jeśli nie zaczniesz działać, to zabezpieczenie będzie bezużyteczne. (Shota Rustaveli)

Podstawowe pojęcia i pojęcia statystyki medycznej

W tym artykule przedstawimy niektóre kluczowe idee statystyki istotne dla badań medycznych. Warunki zostały omówione bardziej szczegółowo w odpowiednich artykułach.

Zmiana

Definicja. Stopień rozproszenia danych (wartości atrybutów) w zakresie wartości

Prawdopodobieństwo

Definicja. Prawdopodobieństwo - stopień możliwości przejawienia się czegoś pewne wydarzenie w pewnych warunkach.

Przykład. Wyjaśnijmy definicję terminu w zdaniu „Prawdopodobieństwo odzyskania podczas stosowania produkt leczniczy Arimidex wynosi 70%. Zdarzenie to „wyzdrowienie pacjenta”, stan „pacjent przyjmuje Arimidex”, stopień prawdopodobieństwa wynosi 70% (w przybliżeniu na 100 osób przyjmujących Arimidex, 70 wyzdrowieje).

Skumulowane prawdopodobieństwo

Definicja. Skumulowane prawdopodobieństwo przeżycia w chwili t jest takie samo, jak odsetek pacjentów żyjących w tym momencie.

Przykład. Jeśli powiedzieć, że skumulowane prawdopodobieństwo przeżycia po pięcioletnim leczeniu wynosi 0,7, oznacza to, że 70% rozważanej grupy pacjentów pozostało przy życiu. ilość początkowa, a 30% zmarło. Innymi słowy, na każde sto osób 30 zmarło w ciągu pierwszych 5 lat.

Czas przed wydarzeniem

Definicja. Czas przed zdarzeniem to czas wyrażony w niektórych jednostkach, który upłynął od pewnego początkowego punktu w czasie do wystąpienia jakiegoś zdarzenia.

Wyjaśnienie. Jako jednostki czasu w badania medyczne pojawiają się dni, miesiące i lata.

Typowe przykłady początkowe chwile czas:

    rozpocząć monitorowanie pacjenta

    leczenie chirurgiczne

Typowe przykłady rozważanych zdarzeń:

    postęp choroby

    wystąpienie nawrotu

    śmierć pacjenta

Próbka

Definicja. Część populacji uzyskana w drodze selekcji.

Na podstawie wyników analizy próby wyciągane są wnioski dotyczące całej populacji, które są ważne tylko wtedy, gdy dobór był losowy. Ponieważ dobór losowy z populacji jest praktycznie niemożliwy, należy dołożyć starań, aby próba była co najmniej reprezentatywna dla populacji.

Próbki zależne i niezależne

Definicja. Próby, w których badani byli rekrutowani niezależnie od siebie. Alternatywny niezależne próbki- próbki zależne (połączone, sparowane).

Hipoteza

Hipotezy dwustronne i jednostronne

Na początek wyjaśnijmy zastosowanie terminu hipoteza w statystyce.

Celem większości badań jest sprawdzenie prawdziwości jakiegoś stwierdzenia. Celem testowania leków jest najczęściej sprawdzenie hipotezy, że jeden lek jest skuteczniejszy od drugiego (na przykład Arimidex jest skuteczniejszy niż Tamoksyfen).

Aby zapewnić rzetelność badania, sprawdzane stwierdzenie wyrażone jest matematycznie. Na przykład, jeśli A to liczba lat, jakie przeżyje pacjent przyjmujący Arimidex, a T to liczba lat, jakie przeżyje pacjent przyjmujący Tamoksyfen, wówczas testowaną hipotezę można zapisać jako A>T.

Definicja. Hipotezę nazywamy dwustronną, jeśli polega na równości dwóch wielkości.

Przykład hipotezy dwustronnej: A=T.

Definicja. Hipotezę nazywamy jednostronną (1-stronną), jeśli polega na nierówności dwóch wielkości.

Przykłady hipotez jednostronnych:

Dane dychotomiczne (binarne).

Definicja. Dane wyrażone tylko przez dwie ważne wartości alternatywne

Przykład: Pacjent jest „zdrowy” - „chory”. Obrzęk „jest” - „nie”.

Przedział ufności

Definicja. Przedział ufności dla wielkości to zakres wokół wartości wielkości, w którym leży prawdziwa wartość tej wielkości (przy pewien poziom zaufanie).

Przykład. Niech badana ilość będzie liczbą pacjentów rocznie. Średnio ich liczba wynosi 500, a 95% - przedział ufności- (350, 900). Oznacza to, że najprawdopodobniej (z prawdopodobieństwem 95%) z poradnią skontaktuje się w ciągu roku co najmniej 350 i nie więcej niż 900 osób.

Przeznaczenie. Bardzo powszechnie używanym skrótem jest: CI 95% to przedział ufności z poziomem ufności 95%.

Rzetelność, istotność statystyczna (poziom P)

Definicja. Znaczenie statystyczne wynik jest miarą zaufania do jego „prawdy”.

Wszelkie badania przeprowadzane są na podstawie jedynie części obiektów. Badanie skuteczności leku nie jest przeprowadzane na podstawie wszystkich pacjentów na świecie, ale tylko na określonej grupie pacjentów (po prostu nie da się przeprowadzić analizy na podstawie wszystkich pacjentów).

Załóżmy, że w wyniku analizy wyciągnięto określony wniosek (np. zastosowanie Arimidexu jako odpowiedniej terapii jest 2 razy skuteczniejsze niż Tamoksyfen).

Pytanie, które należy zadać, brzmi: „Na ile można ufać temu wynikowi?”

Wyobraźcie sobie, że przeprowadziliśmy badanie tylko z udziałem dwóch pacjentów. Oczywiście w tym przypadku do wyników należy podchodzić z ostrożnością. Jeżeli zbadano dużą liczbę pacjentów (np. wartość numeryczna « duża ilość„zależy od sytuacji), to wyciągniętym wnioskom można już ufać.

Zatem stopień zaufania zależy od wartości poziomu p (wartość p).

Wyższy poziom p odpowiada więcej niski poziom zaufanie do wyników uzyskanych z analizy próbki. Przykładowo poziom p równy 0,05 (5%) oznacza, że ​​wniosek wyciągnięty z analizy pewnej grupy jest jedynie przypadkową cechą tych obiektów z prawdopodobieństwem zaledwie 5%.

Innymi słowy, z bardzo wysokie prawdopodobieństwo(95%) wniosek można rozszerzyć na wszystkie obiekty.

W wielu badaniach uznano 5% za akceptowalną wartość poziomu p. Oznacza to, że jeśli na przykład p = 0,01, to można ufać wynikom, ale jeśli p = 0,06, to nie.

Badanie

Badanie prospektywne to badanie, w którym próbki są dobierane na podstawie czynnika początkowego, a w próbkach analizowany jest pewien czynnik wynikowy.

Badanie retrospektywne to badanie, w którym próbki są wybierane na podstawie otrzymanego czynnika, a w próbkach analizowany jest pewien czynnik początkowy.

Przykład. Czynnikiem początkowym jest kobieta w ciąży młodsza/powyżej 20 roku życia. Wynikowy czynnik jest taki, że dziecko jest lżejsze/cięższe niż 2,5 kg. Analizujemy, czy masa ciała dziecka zależy od wieku mamy.

Jeśli zrekrutujemy 2 próbki, jedną obejmującą matki do 20. roku życia, drugą matki starsze, a następnie przeanalizujemy masę dzieci w każdej grupie, będzie to badanie prospektywne.

Jeśli zrekrutujemy 2 próby, w jednej matki, które urodziły dzieci o masie ciała mniejszej niż 2,5 kg, w drugiej cięższe, a następnie przeanalizujemy wiek matek w każdej grupie, to jest to badanie retrospektywne (oczywiście takie badanie można przeprowadzić dopiero po zakończeniu eksperymentu, tj. urodzeniu się wszystkich dzieci).

Exodus

Definicja. Zjawisko istotne klinicznie wartość laboratoryjna lub cecha, która służy jako obiekt zainteresowania badacza. Podczas prowadzenia badań klinicznych wyniki służą jako kryteria oceny skuteczności interwencji terapeutycznej lub zapobiegawczej.

Epidemiologia kliniczna

Definicja. Nauka umożliwiająca przewidzenie konkretnego wyniku u każdego konkretnego pacjenta w oparciu o badanie przebiegu klinicznego choroby w podobnych przypadkach przy zastosowaniu ścisłych metody naukowe badanie pacjentów w celu zapewnienia dokładności prognoz.

Kohorta

Definicja. Grupa uczestników badania zjednoczona przez niektórych wspólną cechą w momencie jej powstania i przez cały czas ją studiowano długi okres czas.

Kontrola

Kontrola historyczna

Definicja. Grupa kontrolna, utworzone i badane w okresie poprzedzającym badanie.

Sterowanie równoległe

Definicja. Grupa kontrolna powstała jednocześnie z utworzeniem grupy głównej.

Korelacja

Definicja. Statystyczna zależność między dwiema cechami (ilościowa lub porządkowa), pokazująca to wyższa wartość Jedna cecha w pewnej części przypadków odpowiada większej wartości – w przypadku korelacji dodatniej (bezpośredniej) – wartości innej cechy, lub mniejszej wartości – w przypadku korelacji ujemnej (odwrotnej).

Przykład. Stwierdzono istotną korelację pomiędzy poziomem płytek krwi i leukocytów we krwi pacjenta. Współczynnik korelacji wynosi 0,76.

Współczynnik ryzyka (RR)

Definicja. Współczynnik ryzyka to stosunek prawdopodobieństwa wystąpienia jakiegoś („złego”) zdarzenia dla pierwszej grupy obiektów do prawdopodobieństwa wystąpienia tego samego zdarzenia dla drugiej grupy obiektów.

Przykład. Jeśli prawdopodobieństwo zachorowania na raka płuc u osób niepalących wynosi 20%, a u palaczy - 100%, wówczas CR będzie równe jednej piątej. W tym przykładzie pierwszą grupę obiektów stanowią osoby niepalące, drugą grupę stanowią palacze, a wystąpienie raka płuc uznawane jest za „złe” wydarzenie.

To oczywiste, że:

1) jeśli KR = 1, to prawdopodobieństwo wystąpienia zdarzenia w grupach jest takie samo

2) jeśli KP>1, to zdarzenie występuje częściej w przypadku obiektów z pierwszej grupy niż z drugiej

3) jeżeli KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Metaanaliza

Definicja. Z analiza statystyczna podsumowująca wyniki kilku badań dotyczących tego samego problemu (zwykle skuteczność leczenia, profilaktyka, metody diagnostyczne). Łączenie badań zapewnia większą próbkę do analizy i większą moc statystyczną połączonych badań. Stosowane w celu zwiększenia dowodów lub pewności wniosków na temat skuteczności badanej metody.

Metoda Kaplana-Meiera (oszacowania mnożników Kaplana-Meiera)

Metodę tę wynaleźli statystycy E.L. Kaplan i Paul Meyer.

Metoda ta służy do obliczania różnych wielkości związanych z czasem obserwacji pacjenta. Przykłady takich ilości:

    prawdopodobieństwo wyzdrowienia w ciągu jednego roku podczas stosowania leku

    ryzyko nawrotu choroby po operacji w ciągu trzech lat od operacji

    skumulowane prawdopodobieństwo przeżycia po pięciu latach wśród pacjentów z rakiem prostaty po amputacji narządu

Wyjaśnijmy zalety stosowania metody Kaplana-Meiera.

Wartości wartości w analizie „konwencjonalnej” (nie wykorzystującej metody Kaplana-Meiera) oblicza się w oparciu o podzielenie rozpatrywanego przedziału czasu na przedziały.

Na przykład, jeśli badamy prawdopodobieństwo śmierci pacjenta w ciągu 5 lat, wówczas przedział czasu można podzielić na 5 części (mniej niż 1 rok, 1-2 lata, 2-3 lata, 3-4 lata, 4- 5 lat), tak i przez 10 (po sześć miesięcy) lub przez inną liczbę odstępów czasu. Wyniki dla różnych partycji będą różne.

Wybór najodpowiedniejszej partycji nie jest łatwym zadaniem.

Oszacowania wartości uzyskane metodą Kaplana-Meiera nie zależą od podziału czasu obserwacji na przedziały, ale zależą jedynie od czasu życia każdego indywidualnego pacjenta.

Dlatego badaczowi łatwiej jest przeprowadzić analizę, a wyniki są często lepsze niż wyniki analizy „konwencjonalnej”.

Krzywa Kaplana-Meiera jest wykresem krzywej przeżycia otrzymanej metodą Kaplana-Meiera.

Model Coxa

Model ten został wymyślony przez Sir Davida Roxby Coxa (ur. 1924), znanego angielskiego statystyka, autora ponad 300 artykułów i książek.

Model Coxa stosuje się w sytuacjach, gdy wielkości badane w analizie przeżycia zależą od funkcji czasu. Na przykład prawdopodobieństwo nawrotu choroby po t latach (t=1,2,...) może zależeć od logarytmu czasu log(t).

Istotną zaletą metody zaproponowanej przez Coxa jest możliwość jej zastosowania w dużej liczbie sytuacji (model nie nakłada ścisłych ograniczeń co do charakteru i kształtu rozkładu prawdopodobieństwa).

W oparciu o model Coxa można przeprowadzić analizę (zwaną analizą Coxa), której wynikiem jest wartość współczynnika ryzyka oraz przedział ufności dla współczynnika ryzyka.

Nieparametryczne metody statystyczne

Definicja. Klasa metod statystycznych, które służą przede wszystkim do analizy danych ilościowych nie tworzących rozkładu normalnego, a także do analizy danych jakościowych.

Przykład. Aby określić istotność różnic w ciśnieniu skurczowym pacjentów w zależności od rodzaju leczenia, posłużymy się nieparametrycznym testem Manna-Whitneya.

Znak (zmienna)

Definicja. X charakterystyka obiektu badań (obserwacji). Istnieją cechy jakościowe i ilościowe.

Randomizacja

Definicja. Metoda losowego podziału obiektów badawczych na grupę główną i kontrolną za pomocą specjalnych środków (tablice lub licznik liczb losowych, rzut monetą i inne metody losowego przypisywania numeru grupy do uwzględnionej obserwacji). Randomizacja minimalizuje różnice między grupami pod względem znanych i nieznanych cech, które potencjalnie wpływają na badany wynik.

Ryzyko

Atrybutywny- dodatkowe ryzyko niekorzystnego wyniku (na przykład choroby) w związku z obecnością określonej cechy (czynnika ryzyka) u osoby badanej. Jest to część ryzyka rozwoju choroby, która jest powiązana, wyjaśniona i można ją wyeliminować, jeśli wyeliminowany zostanie czynnik ryzyka.

Ryzyko względne- stosunek ryzyka wystąpienia niekorzystnego stanu w jednej grupie do ryzyka wystąpienia tego stanu w innej grupie. Stosowany w badaniach prospektywnych i obserwacyjnych, gdy grupy są tworzone z wyprzedzeniem, a wystąpienie badanego schorzenia jeszcze nie nastąpiło.

Egzamin rolkowy

Definicja. Metoda sprawdzania stabilności, wiarygodności, wydajności (ważności) modelu statystycznego poprzez sekwencyjne usuwanie obserwacji i ponowne obliczanie modelu. Im bardziej podobne są otrzymane modele, tym bardziej stabilny i niezawodny jest model.

Wydarzenie

Definicja. Wynik kliniczny zaobserwowany w badaniu, taki jak wystąpienie powikłań, nawrót, wyzdrowienie lub śmierć.

Stratyfikacja

Definicja. M technika doboru próby, w której populacja wszystkich uczestników spełniających kryteria włączenia do badania jest najpierw dzielona na grupy (warstwy) w oparciu o jedną lub więcej cech (zwykle płeć, wiek) potencjalnie wpływających na wynik będący przedmiotem zainteresowania, a następnie z każdej z nich uczestnicy tych grup (warstwy) są rekrutowani niezależnie do grupy eksperymentalnej i kontrolnej. Pozwala to badaczowi zrównoważyć ważne cechy pomiędzy grupą eksperymentalną i kontrolną.

Tabela awaryjnych

Definicja. Tabela bezwzględnych częstotliwości (liczb) obserwacji, których kolumny odpowiadają wartościom jednej cechy, a wiersze - wartościom innej cechy (w przypadku dwuwymiarowej tabeli kontyngencji). Bezwzględne wartości częstotliwości znajdują się w komórkach na przecięciu wierszy i kolumn.

Podajmy przykład tabeli kontyngencji. Operację tętniaka przeprowadzono u 194 pacjentów. Znane jest nasilenie obrzęków u pacjentów przed operacją.

Obrzęk \ Wynik

brak obrzęku 20 6 26
umiarkowany obrzęk 27 15 42
wyraźny obrzęk 8 21 29
m j 55 42 194

Zatem z 26 chorych bez obrzęków po operacji przeżyło 20 chorych, a 6 chorych zmarło. Spośród 42 pacjentów z umiarkowanym obrzękiem 27 pacjentów przeżyło, 15 zmarło itd.

Test chi-kwadrat dla tabel kontyngencji

Aby określić znaczenie (wiarygodność) różnic w jednym znaku w zależności od innego (na przykład wynik operacji w zależności od nasilenia obrzęku), w tabelach kontyngencji stosuje się test chi-kwadrat:


Szansa

Niech prawdopodobieństwo jakiegoś zdarzenia będzie równe p. Wtedy prawdopodobieństwo, że zdarzenie nie nastąpi, wynosi 1-p.

Na przykład, jeśli prawdopodobieństwo, że pacjent przeżyje po pięciu latach, wynosi 0,8 (80%), to prawdopodobieństwo, że pacjent umrze w tym okresie wynosi 0,2 (20%).

Definicja. Szansa to stosunek prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa, że ​​zdarzenie nie nastąpi.

Przykład. W naszym przykładzie (dotyczącym pacjenta) szansa wynosi 4, ponieważ 0,8/0,2 = 4

Zatem prawdopodobieństwo wyzdrowienia jest 4 razy większe bardziej prawdopodobne smierci.

Interpretacja wartości wielkości.

1) Jeżeli Szansa=1, to prawdopodobieństwo wystąpienia zdarzenia jest równe prawdopodobieństwu, że zdarzenie nie nastąpi;

2) jeżeli Szansa >1, to prawdopodobieństwo wystąpienia zdarzenia jest większe od prawdopodobieństwa, że ​​zdarzenie nie nastąpi;

3) jeśli szansa<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Iloraz szans

Definicja. Iloraz szans to iloraz szans dla pierwszej grupy obiektów do ilorazu szans dla drugiej grupy obiektów.

Przykład. Załóżmy, że leczeniu poddawani są zarówno mężczyźni, jak i kobiety.

Prawdopodobieństwo, że pacjent płci męskiej przeżyje po pięciu latach wynosi 0,6 (60%); prawdopodobieństwo, że umrze w tym okresie wynosi 0,4 (40%).

Podobne prawdopodobieństwa dla kobiet wynoszą 0,8 i 0,2.

Iloraz szans w tym przykładzie wynosi

Interpretacja wartości wielkości.

1) Jeśli iloraz szans = 1, to szansa dla pierwszej grupy jest równa szansie dla drugiej grupy

2) Jeżeli iloraz szans wynosi >1, to szansa dla pierwszej grupy więcej szans dla drugiej grupy

3) Jeśli iloraz szans<1, то шанс для первой группы меньше шанса для второй группы

WIARYGODNOŚĆ STATYSTYCZNA

- język angielski wiarygodność/ważność, statystyczna; Niemiecki Walidacja, statystyka. Spójność, obiektywizm i brak dwuznaczności w teście statystycznym lub w k.l. zestaw pomiarów. D. s. można sprawdzić, powtarzając ten sam test (lub kwestionariusz) na tym samym przedmiocie, aby sprawdzić, czy uzyskano takie same wyniki; lub porównując różne części testu, które mają mierzyć ten sam obiekt.

Antynaziści. Encyklopedia socjologii, 2009

Zobacz, co oznacza „RZETELNOŚĆ STATYSTYCZNA” w innych słownikach:

    WIARYGODNOŚĆ STATYSTYCZNA- Język angielski wiarygodność/ważność, statystyczna; Niemiecki Walidacja, statystyka. Spójność, obiektywizm i brak dwuznaczności w teście statystycznym lub w k.l. zestaw pomiarów. D. s. można zweryfikować, powtarzając ten sam test (lub... Słownik objaśniający socjologii

    W statystyce wartość nazywa się statystycznie istotną, jeśli prawdopodobieństwo jej przypadkowego wystąpienia lub nawet bardziej ekstremalnych wartości jest niskie. Tutaj przez ekstremum rozumiemy stopień odchylenia statystyki testowej od hipotezy zerowej. Różnica nazywa się... ...Wikipedią

    Fizyczne zjawisko stabilności statystycznej polega na tym, że wraz ze wzrostem wielkości próby częstotliwość zdarzenia losowego lub średnia wartość wielkości fizycznej dąży do pewnej ustalonej liczby. Zjawisko statystyczne... ...Wikipedia

    WIARYGODNOŚĆ RÓŻNIC (podobieństwa)- analityczna procedura statystyczna służąca do ustalenia poziomu istotności różnic lub podobieństw między próbami według badanych wskaźników (zmiennych) ... Nowoczesny proces edukacyjny: podstawowe pojęcia i terminy

    RAPORTOWANIE, STATYSTYCZNE Świetny słownik rachunkowości

    RAPORTOWANIE, STATYSTYCZNE- forma państwowej obserwacji statystycznej, w której właściwe organy otrzymują od przedsiębiorstw (organizacji i instytucji) potrzebne im informacje w postaci prawnie ustalonych dokumentów sprawozdawczych (sprawozdań statystycznych) dla... Duży słownik ekonomiczny

    Nauka zajmująca się badaniem metod systematycznej obserwacji zjawisk masowych w życiu społecznym człowieka, opracowywaniem ich opisów numerycznych i naukowym przetwarzaniem tych opisów. Zatem statystyka teoretyczna jest nauką... ... Słownik encyklopedyczny F.A. Brockhausa i I.A. Efrona

    Współczynnik korelacji- (Współczynnik korelacji) Współczynnik korelacji jest statystycznym wskaźnikiem zależności dwóch zmiennych losowych. Definicja współczynnika korelacji, rodzaje współczynników korelacji, właściwości współczynnika korelacji, obliczanie i zastosowanie... ... Encyklopedia inwestorów

    Statystyka- (Statystyka) Statystyka jest ogólną nauką teoretyczną, która bada ilościowe zmiany w zjawiskach i procesach. Statystyka państwowa, usługi statystyczne, Rosstat (Goskomstat), dane statystyczne, statystyki zapytań, statystyki sprzedaży,... ... Encyklopedia inwestorów

    Korelacja- (Korelacja) Korelacja to statystyczna zależność pomiędzy dwiema lub więcej zmiennymi losowymi. Pojęcie korelacji, rodzaje korelacji, współczynnik korelacji, analiza korelacji, korelacja cen, korelacja par walutowych na Forex Contents... ... Encyklopedia inwestorów

Książki

  • Badania w matematyce i matematyce w badaniach: Zbiór metodologiczny dotyczący działalności badawczej studentów, Borzenko V.I.. Zbiór prezentuje osiągnięcia metodologiczne mające zastosowanie w organizowaniu studenckiej działalności badawczej. Pierwsza część zbioru poświęcona jest zastosowaniu podejścia badawczego w...

Przed zebraniem i zbadaniem danych psychologowie eksperymentalni zazwyczaj decydują, w jaki sposób dane będą analizowane statystycznie. Często badacz ustala poziom istotności, definiowany jako wartość statystyczna, wyższy niż ( lub niżej), który zawiera wartości, które pozwalają nam uwzględnić wpływ czynników nielosowych. Badacze zazwyczaj przedstawiają ten poziom w formie wyrażenia probabilistycznego.

W wielu eksperymentach psychologicznych można to wyrazić jako „ poziom 0,05" Lub " poziom 0,01" Oznacza to, że losowe wyniki będą pojawiać się tylko z określoną częstotliwością 0,05 (1 raz) Lub 0,01 (1 na 100 razy). Wyniki analizy danych statystycznych spełniające z góry ustalone kryterium ( czy to 0,05, 0,01, czy nawet 0,001), są określane poniżej jako istotne statystycznie.

Należy zauważyć, że wynik może nie być istotny statystycznie, ale nadal może być interesujący. Często, zwłaszcza w badaniach wstępnych lub eksperymentach na małej liczbie osób lub przy ograniczonej liczbie obserwacji, wyniki mogą nie osiągnąć poziomu istotności statystycznej, ale sugerują, że w dalszych badaniach, przy bardziej precyzyjnej kontroli i przy większej liczbie obserwacje staną się bardziej wiarygodne. Jednocześnie eksperymentator musi być bardzo ostrożny w swoim pragnieniu celowej zmiany warunków eksperymentu, aby za wszelką cenę osiągnąć pożądany rezultat.

W innym przykładzie planu 2x2 Ji wykorzystali dwa rodzaje przedmiotów i dwa rodzaje zadań do badania wpływu wiedzy specjalistycznej na zapamiętywanie informacji.

W swoim gabinecie Ji uczył się zapamiętywania liczb i figur szachowych ( zmienna A) dzieci na krzesłach RECARO Młody Sport i dorośli ( zmienna B), czyli zgodnie z planem 2x2. Dzieci miały 10 lat i były dobre w szachy, podczas gdy dorośli dopiero zaczynali przygodę z tą grą. W pierwszym zadaniu trzeba było zapamiętać położenie elementów na planszy, tak jak to ma miejsce podczas normalnej gry, i przywrócić je po usunięciu elementów. Inna część tego zadania wymagała zapamiętania standardowej serii liczb, jak to zwykle ma miejsce przy określaniu IQ.

Okazuje się, że specjalistyczna wiedza, np. umiejętność gry w szachy, ułatwia zapamiętywanie informacji istotnych z tego zakresu, ale nie ma większego wpływu na zapamiętywanie liczb. Dorośli, którzy nie są zbyt doświadczeni w zawiłościach starożytnej gry, zapamiętują mniej cyfr, ale lepiej zapamiętują liczby.

W tekście raportu Ji zapewnia analizę statystyczną, która matematycznie potwierdza prezentowane wyniki.

Projekt 2x2 jest najprostszym ze wszystkich projektów czynnikowych. Zwiększanie liczby czynników lub poziomów poszczególnych czynników znacznie zwiększa złożoność tych planów.

W każdej naukowej i praktycznej sytuacji eksperymentu (ankiety) badacze mogą badać nie wszystkie osoby (populację ogólną, populację), ale tylko określoną próbkę. Na przykład, nawet jeśli badamy stosunkowo małą grupę osób, na przykład cierpiących na konkretną chorobę, nadal jest bardzo mało prawdopodobne, abyśmy dysponowali odpowiednimi zasobami lub potrzebowali przebadać każdego pacjenta. Zamiast tego powszechne jest badanie próbki z populacji, ponieważ jest to wygodniejsze i mniej czasochłonne. Jeśli tak, to skąd wiemy, że wyniki uzyskane z próby są reprezentatywne dla całej grupy? Albo, używając fachowej terminologii, czy możemy być pewni, że nasze badania poprawnie opisują całość populacja, próbka, której użyliśmy?

Aby odpowiedzieć na to pytanie, należy określić istotność statystyczną wyników badań. Znaczenie statystyczne (Znaczący poziom, w skrócie sygn.), lub /7-poziom istotności (poziom p) - to prawdopodobieństwo, że dany wynik prawidłowo reprezentuje populację, z której wybrano próbę do badania. Pamiętaj, że to tylko prawdopodobieństwo- nie można z całkowitą pewnością stwierdzić, że dane badanie poprawnie opisuje całą populację. W najlepszym razie na poziomie istotności można jedynie stwierdzić, że jest to bardzo prawdopodobne. Nieuchronnie pojawia się zatem kolejne pytanie: jaki poziom istotności musi być, aby dany wynik można było uznać za prawidłową charakterystykę populacji?

Na przykład, przy jakiej wartości prawdopodobieństwa jesteś skłonny stwierdzić, że takie szanse są wystarczające, aby podjąć ryzyko? A co jeśli szanse wynoszą 10 na 100 lub 50 na 100? A co jeśli to prawdopodobieństwo jest większe? A co z szansami takimi jak 90 na 100, 95 na 100 lub 98 na 100? W sytuacji ryzyka wybór ten jest dość problematyczny, ponieważ zależy od cech osobowych danej osoby.

W psychologii tradycyjnie uważa się, że szansa 95 lub większa na 100 oznacza, że ​​prawdopodobieństwo poprawności wyników jest na tyle wysokie, że można je uogólnić na całą populację. Liczba ta została ustalona w procesie działalności naukowej i praktycznej - nie ma prawa, zgodnie z którym należy ją wybrać jako wytyczną (a rzeczywiście w innych naukach czasami wybiera się inne wartości poziomu istotności).

W psychologii prawdopodobieństwo to operuje się w dość nietypowy sposób. Zamiast prawdopodobieństwa, że ​​próbka reprezentuje populację, prawdopodobieństwo, że próbka nie reprezentuje populacja. Innymi słowy, jest to prawdopodobieństwo, że zaobserwowana zależność lub różnice mają charakter przypadkowy i nie są własnością populacji. Zamiast więc twierdzić, że istnieje 95 na 100 szans, że wyniki badania są prawidłowe, psychologowie twierdzą, że istnieje 5 na 100 szans, że wyniki są błędne (podobnie jak 40 na 100 szans, że wyniki są prawidłowe oznacza szansa 60 na 100 na korzyść ich błędności). Wartość prawdopodobieństwa jest czasami wyrażana w procentach, ale częściej jest zapisywana jako ułamek dziesiętny. Na przykład 10 szans na 100 wyraża się jako ułamek dziesiętny 0,1; 5 na 100 zapisuje się jako 0,05; 1 na 100 - 0,01. Przy tej formie rejestracji wartość graniczna wynosi 0,05. Aby wynik można było uznać za prawidłowy, jego poziom istotności musi taki być poniżej ta liczba (pamiętaj, że jest to prawdopodobieństwo, że wynik zło opisuje populację). Aby uniknąć terminologii, dodajmy, że „prawdopodobieństwo, że wynik będzie nieprawidłowy” (co bardziej poprawnie nazywa się poziom istotności) zwykle oznaczane literą łacińską R. Opisy wyników eksperymentów zwykle zawierają podsumowanie, takie jak „wyniki były znaczące na poziomie ufności (R(p) mniej niż 0,05 (tj. mniej niż 5%).

Zatem poziom istotności ( R) wskazuje prawdopodobieństwo, że wyniki Nie reprezentują populację. Tradycyjnie w psychologii uważa się, że wyniki wiarygodnie odzwierciedlają ogólny obraz wartości R mniej niż 0,05 (tj. 5%). Jest to jednak jedynie probabilistyczne stwierdzenie, a wcale nie bezwarunkowa gwarancja. W niektórych przypadkach wniosek ten może nie być słuszny. W rzeczywistości możemy obliczyć, jak często może się to zdarzyć, jeśli spojrzymy na wielkość poziomu istotności. Na poziomie istotności 0,05 w 5 przypadkach na 100 wyniki mogą być nieprawidłowe. 11a na pierwszy rzut oka wydaje się, że nie jest to zbyt częste, ale jeśli się nad tym zastanowić, to 5 szans na 100 to to samo, co 1 na 20. Innymi słowy, w jednym na 20 przypadków wynik będzie błędny. Takie szanse nie wydają się szczególnie korzystne i badacze powinni wystrzegać się angażowania błędy pierwszego rodzaju. Tak nazywa się błąd, który pojawia się, gdy badacze myślą, że znaleźli prawdziwe wyniki, ale w rzeczywistości tak nie jest. Błąd odwrotny, polegający na tym, że badacze sądzą, że nie znaleźli wyniku, podczas gdy w rzeczywistości taki istnieje, nazywa się błędy drugiego typu.

Błędy te powstają, ponieważ nie można wykluczyć możliwości, że przeprowadzona analiza statystyczna nie zostanie wykluczona. Prawdopodobieństwo błędu zależy od poziomu istotności statystycznej wyników. Zauważyliśmy już, że aby wynik można było uznać za prawidłowy, poziom istotności musi być niższy niż 0,05. Oczywiście niektóre wyniki są niższe i nierzadko można zobaczyć wyniki tak niskie, jak 0,001 (wartość 0,001 oznacza, że ​​istnieje ryzyko 1 na 1000, że wyniki będą błędne). Im mniejsza wartość p, tym większa nasza pewność co do poprawności wyników.

W tabeli 7.2 przedstawia tradycyjną interpretację poziomów istotności dotyczącą możliwości wnioskowania statystycznego oraz uzasadnienie decyzji o istnieniu związku (różnic).

Tabela 7.2

Tradycyjna interpretacja poziomów istotności stosowana w psychologii

Opierając się na doświadczeniach badań praktycznych, zaleca się: aby w miarę możliwości uniknąć błędów pierwszego i drugiego rodzaju, przy wyciąganiu ważnych wniosków należy podejmować decyzje o występowaniu różnic (powiązań), koncentrując się na poziomie R znak n.

Test statystyczny(Test statystyczny - jest narzędziem służącym do określenia poziomu istotności statystycznej. Jest to decydująca zasada, która zapewnia przyjęcie prawdziwej hipotezy i odrzucenie fałszywej hipotezy z dużym prawdopodobieństwem.

Kryteria statystyczne oznaczają również sposób obliczenia określonej liczby i samą liczbę. Wszystkie kryteria służą jednemu głównemu celowi: określeniu poziom istotności dane, które analizują (tj. prawdopodobieństwo, że dane odzwierciedlają prawdziwy efekt, który prawidłowo reprezentuje populację, z której pobierana jest próba).

Niektóre testy można stosować tylko dla danych o rozkładzie normalnym (oraz jeśli cecha jest mierzona na skali przedziałowej) – testy te są zwykle nazywane parametryczny. Stosując inne kryteria, można analizować dane z niemal każdym prawem dystrybucyjnym – są to tzw nieparametryczny.

Kryteria parametryczne to kryteria, które uwzględniają we wzorze obliczeniowym parametry rozkładu, tj. średnie i wariancje (test t-Studenta, test F Fishera itp.).

Kryteria nieparametryczne to kryteria, które nie uwzględniają parametrów rozkładu we wzorze na obliczenie parametrów rozkładu i opierają się na operowaniu częstotliwościami lub rangami (kryterium Q Kryterium Rosenbauma U Manna – Whitney

Przykładowo, gdy mówimy, że istotność różnic została określona za pomocą testu t-Studenta, mamy na myśli, że do obliczenia wartości empirycznej wykorzystano metodę testu t-Studenta, którą następnie porównano z wartością tabelaryczną (krytyczną).

Na podstawie stosunku empirycznych (obliczonych przez nas) i krytycznych wartości kryterium (tabelarycznych) możemy ocenić, czy nasza hipoteza została potwierdzona, czy odrzucona. W większości przypadków, abyśmy uznali różnice za istotne, konieczne jest, aby wartość empiryczna kryterium przekraczała wartość krytyczną, choć istnieją kryteria (np. test Manna-Whitneya czy test znaków), w których musimy przestrzegać odwrotnej zasady.

W niektórych przypadkach we wzorze obliczeniowym kryterium uwzględnia się liczbę obserwacji w badanej próbie, oznaczoną jako P. Za pomocą specjalnej tabeli określamy, jakiemu poziomowi istotności statystycznej różnic odpowiada dana wartość empiryczna. W większości przypadków ta sama wartość empiryczna kryterium może być istotna lub nieistotna w zależności od liczby obserwacji w badanej próbie ( P ) lub z tzw liczba stopni swobody , co jest oznaczone jako w (g>) lub jak zm (Czasami D).

Porozumiewawczy P lub liczbę stopni swobody możemy określić za pomocą specjalnych tabel (główne podano w dodatku 5) wartości krytyczne kryteriów i porównać z nimi uzyskaną wartość empiryczną. Zwykle zapisuje się to w ten sposób: „kiedy n = 22 wartości krytyczne kryterium to t St = 2,07” lub „przy w (D) = 2 wartości krytyczne testu Studenta wynoszą = 4,30” itd.

Zwykle nadal preferuje się kryteria parametryczne i tego stanowiska się trzymamy. Są uważane za bardziej wiarygodne i mogą dostarczyć więcej informacji i głębszej analizy. Jeśli chodzi o trudność obliczenia matematyczne, a następnie podczas używania programy komputerowe ta trudność znika (ale niektóre inne wydają się być całkiem do pokonania).

  • W tym podręczniku nie rozważamy szczegółowo problemu statystyki
  • hipotezy (zerowe – R0 i alternatywne – Hj) i przyjęte rozwiązania statystyczne, ponieważ studenci psychologii studiują to osobno w dyscyplinie „Metody matematyczne w psychologii”. Ponadto należy zauważyć, że podczas rejestracji raport z badań(zajęcia lub Praca dyplomowa, publikacje) hipotez statystycznych i rozwiązań statystycznych z reguły nie podaje się. Zwykle przy opisie wyników wskazuje się kryterium, które jest konieczne opisowe statystyki(średnie, sigma, współczynniki korelacji itp.), empiryczne wartości kryteriów, stopnie swobody i koniecznie poziom istotności p. Następnie formułuje się znaczący wniosek dotyczący testowanej hipotezy, wskazując (zwykle w formie nierówności) poziom istotności osiągnięty lub nieosiągnięty.