İfadesi ne anlama geliyor? Gruplar istatistiksel olarak anlamlı derecede farklıdır. İstatistiksel Önem: Tanım, Kavram, Anlamlılık, Regresyon Denklemleri ve Hipotez Testi

Psikolojide ders, diploma ve yüksek lisans tezlerindeki istatistiksel hesaplamaların sonuç tablolarında “p” göstergesi her zaman mevcuttur.

Örneğin, göre araştırma hedefleri Genç erkek ve kızlar arasında yaşamın anlamlılık düzeyindeki farklılıklar hesaplandı.

	Ortalama değer		Mann-Whitney U testi	İstatistiksel anlamlılık düzeyi (p)
	Erkekler (20 kişi)	Kızlar (5 kişi)	Mann-Whitney U testi	İstatistiksel anlamlılık düzeyi (p)
Hedefler	28,9	35,2	17,5	0,027*
İşlem	30,1	32,0	38,5	0,435
Sonuç	25,2	29,0	29,5	0,164
Kontrol odağı - "ben"	20,3	23,6		0,067
Kontrol Odağı - "Hayat"	30,4	33,8	27,5	0,126
Anlamlı yaşam	98,9	111,2		0,103

* - farklar istatistiksel olarak anlamlıdır (p≤ 0,05)

Sağdaki sütun "p" değerini gösterir ve kız ve erkek çocuklar arasındaki gelecekteki yaşamın anlamlılığı arasındaki farkların önemli olup olmadığı bu değere göre belirlenebilir. Kural basit:

İstatistiksel anlamlılık düzeyi “p” 0,05'ten küçük veya ona eşitse, farkların anlamlı olduğu sonucuna varırız. Aşağıdaki tabloda, kız ve erkek çocuklar arasındaki farklar “Hedefler” göstergesi - gelecekteki yaşamın anlamı açısından önemlidir. Kızlarda bu gösterge istatistiksel olarak erkeklere göre anlamlı derecede daha yüksektir.
İstatistiksel anlamlılık düzeyi “p” 0,05’ten büyükse farkların anlamlı olmadığı sonucuna varılır. Aşağıdaki tabloda, kız ve erkek çocuklar arasındaki farklar, birincisi hariç diğer tüm göstergeler açısından anlamlı değildir.

İstatistiksel anlamlılık düzeyi “p” nereden geliyor?

İstatistiksel anlamlılık düzeyi hesaplanır istatistik programı hesaplamayla birlikte istatistiksel kriter. Bu programlarda istatistiksel anlamlılık düzeyi için de kritik bir sınır belirleyebilirsiniz; ilgili göstergeler program tarafından vurgulanacaktır.

Örneğin, STATISTICA programında korelasyonları hesaplarken “p” sınırını örneğin 0,05 olarak ayarlayabilirsiniz; istatistiksel olarak anlamlı tüm ilişkiler kırmızı renkle vurgulanacaktır.

İstatistiksel kriter manuel olarak hesaplanıyorsa, ortaya çıkan kriterin değeri kritik değerle karşılaştırılarak anlamlılık düzeyi “p” belirlenir.

İstatistiksel anlamlılık düzeyi “p” neyi gösterir?

Tüm istatistiksel hesaplamalar yaklaşık değerlerdir. Bu yaklaşımın düzeyi “p”yi belirler. Anlamlılık düzeyi şu şekilde yazılır: ondalık sayılarörneğin 0,023 veya 0,965. Bu sayıyı 100 ile çarparsak yüzde olarak p göstergesini elde ederiz: %2,3 ve %96,5. Bu yüzdeler, örneğin saldırganlık ve kaygı arasındaki ilişkiye ilişkin varsayımlarımızın yanlış olma olasılığını yansıtıyor.

Yani, korelasyon katsayısı Saldırganlık ile kaygı arasında 0,58 istatistiksel anlamlılık düzeyinde 0,05 veya %5 hata olasılığı elde edildi. Bu tam olarak ne anlama geliyor?

Belirlediğimiz korelasyon, örneğimizde şu kalıbın gözlemlendiği anlamına geliyor: Saldırganlık ne kadar yüksek olursa, kaygı da o kadar yüksek olur. Yani iki genci ele alırsak ve birinin kaygısı diğerinden daha yüksekse, o zaman pozitif korelasyonu bilerek bu gencin saldırganlığının da daha yüksek olacağını söyleyebiliriz. Ancak istatistikte her şey yaklaşık olduğundan, bunu belirterek yanıldığımızı ve hata olasılığının %5 olduğunu kabul etmiş oluyoruz. Yani bu ergen grubunda bu tür 20 karşılaştırma yaptıktan sonra saldırganlık düzeyini tahmin etmede, kaygıyı bilmede bir hata yapabiliriz.

Hangi istatistiksel anlamlılık düzeyi daha iyidir: 0,01 veya 0,05

İstatistiksel anlamlılık düzeyi hata olasılığını yansıtır. Bu nedenle p=0,01'deki sonuç, p=0,05'teki sonuçtan daha doğrudur.

İÇİNDE psikolojik araştırma iki tane kabul edildi izin verilen seviyeler sonuçların istatistiksel önemi:

p=0,01 - sonucun yüksek güvenilirliği karşılaştırmalı analiz veya ilişkilerin analizi;

p=0,05 - yeterli doğruluk.

Umarım bu makale kendi başınıza bir psikoloji makalesi yazmanıza yardımcı olur. Yardıma ihtiyacınız varsa lütfen bizimle iletişime geçin (psikolojideki her türlü çalışma; istatistiksel hesaplamalar).

Eğer harekete geçmezsen koğuşun hiçbir faydası olmayacak. (Şota Rustaveli)

Tıbbi istatistiğin temel terim ve kavramları

Bu yazımızda bazılarını sunacağız anahtar kavramlar tıbbi araştırmalarla ilgili istatistikler. Terimler ilgili makalelerde daha ayrıntılı olarak ele alınmaktadır.

Varyasyon

Tanım. Değer aralığı boyunca verilerin (öznitelik değerleri) dağılım derecesi

Olasılık

Tanım. Olasılık - bir şeyin ortaya çıkma olasılığının derecesi belirli olay belirli koşullar altında.

Örnek. “Kullanıldığında iyileşme olasılığı” cümlesindeki terimin tanımını açıklayalım. tıbbi ürün Arimidex %70'tir." Olay “hastanın iyileşmesi”, “hastanın Arimidex alması” durumudur, olasılık derecesi %70'tir (kabaca konuşursak, Arimidex alan 100 kişiden 70'i iyileşir).

Kümülatif olasılık

Tanım. T zamanında hayatta kalmanın Kümülatif Olasılığı, o sırada hayatta olan hastaların oranıyla aynıdır.

Örnek. Beş yıllık tedaviden sonra kümülatif hayatta kalma olasılığının 0,7 olduğu söylenirse, bu, söz konusu hasta grubunun% 70'inin hayatta kaldığı anlamına gelir. başlangıç miktarı ve %30'u öldü. Yani her yüz kişiden 30'u ilk 5 yıl içinde öldü.

Olaydan önceki zaman

Tanım. Bir olaydan önceki zaman, bazı birimlerle ifade edilen, zamanın herhangi bir başlangıç noktasından bir olayın meydana gelmesine kadar geçen süredir.

Açıklama. Zaman birimleri olarak tıbbi araştırma günler, aylar ve yıllar ortaya çıkıyor.

Tipik örnekler ilk anlar zaman:

hastayı izlemeye başlayın

cerrahi tedavi

Ele alınan olayların tipik örnekleri:

hastalığın ilerlemesi

nüksetme meydana gelmesi

hasta ölümü

Örnek

Tanım. Bir popülasyonun seçilim yoluyla elde edilen kısmı.

Numune analizinin sonuçlarına dayanarak, tüm popülasyon hakkında, yalnızca seçimin rastgele olması durumunda geçerli olan sonuçlara varılır. Bir popülasyondan rastgele seçim yapmak neredeyse imkansız olduğundan, numunenin en azından popülasyonu temsil etmesini sağlamak için çaba gösterilmelidir.

Bağımlı ve bağımsız örnekler

Tanım.Çalışma deneklerinin birbirinden bağımsız olarak alındığı örnekler. Alternatif bağımsız örnekler- bağımlı (bağlı, eşleştirilmiş) örnekler.

Hipotez

İki taraflı ve tek taraflı hipotezler

Öncelikle hipotez teriminin istatistikteki kullanımını açıklayalım.

Çoğu araştırmanın amacı bazı ifadelerin doğruluğunu test etmektir. İlaç testinin amacı çoğunlukla bir ilacın diğerinden daha etkili olduğu hipotezini test etmektir (örneğin Arimidex, Tamoksifen'den daha etkilidir).

Çalışmanın titizliğini sağlamak için doğrulanan ifade matematiksel olarak ifade edilir. Örneğin, Arimidex alan bir hastanın yaşayacağı yıl sayısı A ise ve Tamoksifen alan bir hastanın yaşayacağı yıl sayısı T ise, test edilen hipotez A>T olarak yazılabilir.

Tanım. Bir hipotez, iki miktarın eşitliğinden oluşuyorsa iki taraflı olarak adlandırılır.

İki taraflı hipotez örneği: A=T.

Tanım. Bir hipotez, iki miktarın eşitsizliğinden oluşuyorsa, tek taraflı (1 taraflı) olarak adlandırılır.

Tek taraflı hipotez örnekleri:

İkili (ikili) veriler

Tanım. Yalnızca iki geçerli alternatif değerle ifade edilen veriler

Örnek: Hasta “sağlıklı” - “hasta”. Ödem “vardır” - “hayır”.

Güven aralığı

Tanım. Bir miktar için güven aralığı, bu miktarın gerçek değerinin yer aldığı miktarın değeri etrafındaki aralıktır (burada belli bir seviye güven).

Örnek. İncelenen miktar yıllık hasta sayısı olsun. Ortalama olarak sayıları 500 ve %95'i - güven aralığı-(350, 900). Bu, büyük olasılıkla (%95 olasılıkla) yıl içinde en az 350, en fazla 900 kişinin kliniğe başvuracağı anlamına geliyor.

Tanım. Çok yaygın olarak kullanılan bir kısaltma şudur: CI %95, %95 güven düzeyine sahip bir güven aralığıdır.

Güvenilirlik, istatistiksel anlamlılık (P - düzeyi)

Tanım. İstatistiksel önem sonuç onun “doğruluğuna” olan güvenin bir ölçüsüdür.

Herhangi bir araştırma, nesnelerin yalnızca bir kısmı temel alınarak gerçekleştirilir. İlacın etkinliğine ilişkin bir çalışma, gezegendeki tüm hastalar temelinde değil, yalnızca belirli bir hasta grubu üzerinde gerçekleştirilmektedir (tüm hastalar temelinde bir analiz yapmak kesinlikle imkansızdır).

Analiz sonucunda belli bir sonuca varıldığını varsayalım (örneğin Arimidex'in yeterli tedavi olarak kullanılması Tamoksifen'den 2 kat daha etkilidir).

Sorulması gereken soru şu: “Bu sonuca ne kadar güvenebilirsiniz?”

Sadece iki hasta üzerinden bir çalışma yaptığımızı düşünün. Tabii ki, bu durumda sonuçlara dikkatle yaklaşılmalıdır. Çok sayıda hasta muayene edildiyse ( sayısal değer « büyük miktarlar“duruma göre değişir), o zaman çıkarılan sonuçlara zaten güvenilebilir.

Yani güven derecesi p-seviyesi değeri (p-değeri) tarafından belirlenir.

Daha yüksek bir p seviyesi daha fazlasına karşılık gelir düşük seviye numunenin analizinden elde edilen sonuçlara güven. Örneğin, 0,05'e (%5) eşit bir p düzeyi, belirli bir grubun analizinden elde edilen sonucun, yalnızca %5 olasılıkla bu nesnelerin yalnızca rastgele bir özelliği olduğunu gösterir.

Başka bir deyişle, çok yüksek olasılık(%95) sonuç tüm nesnelere genişletilebilir.

Birçok çalışma %5'i kabul edilebilir bir p düzeyi değeri olarak kabul etmektedir. Bu, örneğin p = 0,01 ise sonuçlara güvenilebileceği, ancak p = 0,06 ise güvenilemeyeceği anlamına gelir.

Çalışmak

Prospektif çalışmaÖrneklerin bir başlangıç faktörüne göre seçildiği ve sonuçta ortaya çıkan bazı faktörlerin örneklerde analiz edildiği bir çalışmadır.

Retrospektif çalışmaÖrneklerin sonuçtaki bir faktöre göre seçildiği ve örneklerde bazı başlangıç faktörlerinin analiz edildiği bir çalışmadır.

Örnek. Başlangıç faktörü 20 yaş üstü/genç hamile bir kadındır. Sonuçta ortaya çıkan faktör, çocuğun 2,5 kg'dan daha hafif/ağır olmasıdır. Çocuğun ağırlığının annenin yaşına bağlı olup olmadığını analiz ediyoruz.

Biri 20 yaşın altındaki annelerden, diğeri daha yaşlı annelerden olmak üzere 2 örnek alır ve her gruptaki çocuk kitlesini analiz edersek bu ileriye dönük bir çalışma olur.

Birinde 2,5 kg'dan hafif çocuk doğuran anneler, diğerinde ise daha ağır 2 örnek alırsak ve sonra her gruptaki annelerin yaşını analiz edersek, bu geriye dönük bir çalışmadır (doğal olarak böyle bir çalışma) yalnızca deney tamamlandığında gerçekleştirilebilir, yani tüm çocuklar doğmuştur).

Çıkış

Tanım. Klinik olarak anlamlı fenomen laboratuvar değeri veya araştırmacının ilgi nesnesi olarak hizmet eden bir özellik. Klinik araştırmalar yürütülürken sonuçlar, terapötik veya önleyici müdahalenin etkinliğini değerlendirmede kriter görevi görür.

Klinik epidemiyoloji

Tanım. Benzer vakalarda hastalığın klinik seyrini katı yöntemler kullanarak incelemeye dayalı olarak her bir hasta için belirli bir sonucun tahmin edilmesini mümkün kılan bilim. bilimsel yöntemler Tahminlerin doğruluğunu sağlamak için hastaları incelemek.

Kohort

Tanım. Bazıları tarafından birleştirilmiş bir grup çalışma katılımcısı ortak özellik oluşumu sırasında ve boyunca incelenen uzun süre zaman.

Kontrol

Tarihsel kontrol

Tanım. Kontrol grubuçalışmadan önceki dönemde oluşturulmuş ve araştırılmıştır.

Paralel kontrol

Tanım. Ana grubun oluşumuyla eş zamanlı olarak bir kontrol grubu oluşturuldu.

Korelasyon

Tanım.İki özellik (niceliksel veya sıralı) arasındaki istatistiksel ilişki, şunu gösterir: daha yüksek değer Vakaların belirli bir kısmındaki bir özellik, pozitif (doğrudan) korelasyon durumunda daha büyük bir değere, başka bir özelliğin değerine veya negatif (ters) korelasyon durumunda daha küçük bir değere karşılık gelir.

Örnek. Hastanın kanındaki trombosit ve lökosit düzeyleri arasında anlamlı bir korelasyon bulundu. Korelasyon katsayısı 0,76'dır.

Risk katsayısı (RR)

Tanım. Risk oranı, birinci grup nesneler için bazı (“kötü”) olayların meydana gelme olasılığının, aynı olayın ikinci grup nesneler için meydana gelme olasılığına oranıdır.

Örnek. Sigara içmeyenlerde akciğer kanserine yakalanma olasılığı% 20 ve sigara içenlerde -% 100 ise, CR beşte bire eşit olacaktır. Bu örnekte, ilk gruptaki nesneler sigara içmeyenler, ikinci grup ise sigara içenlerdir ve akciğer kanserinin ortaya çıkması “kötü” bir olay olarak değerlendirilmektedir.

Şu açıktır:

1) CR=1 ise bir olayın gruplar halinde meydana gelme olasılığı aynıdır

2) KP>1 ise, olay birinci gruptaki nesnelerde ikinci gruba göre daha sık meydana gelir

3) eğer KR ise<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analiz

Tanım. İLE Aynı sorunu araştıran çeşitli çalışmaların sonuçlarını özetleyen istatistiksel analiz (genellikle tedavinin etkinliği, önleme, teşhis yöntemleri). Havuzlama çalışmaları, analiz için daha büyük bir örnek ve birleştirilmiş çalışmalar için daha büyük istatistiksel güç sağlar. Çalışılan yöntemin etkinliğine ilişkin bir sonuca ilişkin kanıtları veya güveni artırmak için kullanılır.

Kaplan-Meier yöntemi (Kaplan-Meier çarpan tahminleri)

Bu yöntem istatistikçiler E.L. Kaplan ve Paul Meyer tarafından icat edildi.

Yöntem, bir hastanın gözlem süresiyle ilişkili çeşitli miktarları hesaplamak için kullanılır. Bu miktarlara örnekler:

ilacı kullanırken bir yıl içinde iyileşme olasılığı

Ameliyattan sonraki üç yıl içinde ameliyattan sonra nüksetme olasılığı

Organ ampütasyonunu takiben prostat kanseri olan hastalarda beş yılda kümülatif hayatta kalma olasılığı

Kaplan-Meier yöntemini kullanmanın avantajlarını açıklayalım.

“Geleneksel” analizdeki (Kaplan-Meier yöntemini kullanmayan) değerlerin değerleri, söz konusu zaman aralığının aralıklara bölünmesiyle hesaplanır.

Örneğin bir hastanın 5 yıl içinde ölme ihtimalini araştırıyorsak bu zaman aralığını 5 parçaya bölebiliriz (1 yıldan az, 1-2 yıl, 2-3 yıl, 3-4 yıl, 4-4 yıl). 5 yıl), yani 10 (her biri altı ay) veya başka sayıda aralıklarla. Farklı bölümlerin sonuçları farklı olacaktır.

En uygun bölümü seçmek kolay bir iş değildir.

Kaplan-Meier yöntemi kullanılarak elde edilen değerlerin tahminleri, gözlem süresinin aralıklara bölünmesine bağlı değildir, yalnızca her bir hastanın yaşam süresine bağlıdır.

Bu nedenle araştırmacının analizi gerçekleştirmesi daha kolaydır ve sonuçlar çoğu zaman “geleneksel” analiz sonuçlarından daha iyidir.

Kaplan-Meier eğrisi, Kaplan-Meier yöntemi kullanılarak elde edilen hayatta kalma eğrisinin bir grafiğidir.

Cox'un modeli

Bu model, 300'den fazla makale ve kitabın yazarı olan ünlü İngiliz istatistikçi Sir David Roxby Cox (d. 1924) tarafından icat edildi.

Cox modeli, hayatta kalma analizinde incelenen niceliklerin zamanın fonksiyonlarına bağlı olduğu durumlarda kullanılır. Örneğin, t yıl sonra tekrarlama olasılığı (t=1,2,...) log(t) zamanının logaritmasına bağlı olabilir.

Cox tarafından önerilen yöntemin önemli bir avantajı, bu yöntemin çok sayıda duruma uygulanabilir olmasıdır (model, olasılık dağılımının doğası veya şekli üzerinde katı kısıtlamalar getirmez).

Cox modeline dayanarak, sonucu risk katsayısının değeri ve risk katsayısı için güven aralığı olan bir analiz yapılabilir (Cox analizi denir).

Parametrik olmayan istatistiksel yöntemler

Tanım. Nitel verilerin analizinin yanı sıra, öncelikle normal dağılım oluşturmayan niceliksel verilerin analizi için kullanılan bir istatistiksel yöntemler sınıfı.

Örnek. Tedavi türüne bağlı olarak hastaların sistolik basıncındaki farklılıkların önemini belirlemek için parametrik olmayan Mann-Whitney testini kullanacağız.

İşaret (değişken)

Tanım. Xçalışma nesnesinin özellikleri (gözlem). Niteliksel ve niceliksel özellikler vardır.

Rastgeleleştirme

Tanım. Araştırma nesnelerini özel araçlar (tablolar veya rastgele sayı sayacı, yazı tura atma ve dahil edilen bir gözleme rastgele bir grup numarası atamanın diğer yöntemleri) kullanarak ana ve kontrol gruplarına rastgele dağıtma yöntemi. Rastgeleleştirme, üzerinde çalışılan sonucu potansiyel olarak etkileyen bilinen ve bilinmeyen özellikler açısından gruplar arasındaki farklılıkları en aza indirir.

Risk

Nitelikli- Çalışma konusunda belirli bir özelliğin (risk faktörünün) varlığı nedeniyle olumsuz bir sonucun (örneğin hastalık) ek riski. Bu, bir hastalığın gelişme riskinin risk faktörüyle ilişkili, onunla açıklanabilen ve risk faktörü ortadan kaldırıldığında ortadan kaldırılabilen kısmıdır.

Göreceli risk- bir gruptaki olumsuz durum riskinin başka bir gruptaki bu durum riskine oranı. Grupların önceden oluşturulduğu ve incelenen durumun henüz ortaya çıkmadığı ileriye dönük ve gözlemsel çalışmalarda kullanılır.

Devamlı sınav

Tanım. Gözlemleri sırayla kaldırarak ve modeli yeniden hesaplayarak istatistiksel bir modelin kararlılığını, güvenilirliğini, performansını (geçerliliğini) kontrol etmeye yönelik bir yöntem. Ortaya çıkan modeller ne kadar benzer olursa, model o kadar kararlı ve güvenilir olur.

Etkinlik

Tanım. Bir komplikasyonun ortaya çıkması, nüksetme, iyileşme veya ölüm gibi çalışmada gözlemlenen klinik sonuç.

tabakalaşma

Tanım. M Bir çalışmaya dahil edilme kriterlerini karşılayan tüm katılımcıların popülasyonunun, öncelikle ilgilenilen sonucu potansiyel olarak etkileyen bir veya daha fazla özelliğe (genellikle cinsiyet, yaş) dayalı olarak gruplara (tabakalara) bölündüğü ve ardından bunların her birinden oluşan bir örnekleme tekniği. bu grupların (tabaka) katılımcıları bağımsız olarak deney ve kontrol gruplarına alınır. Bu, araştırmacının deney ve kontrol grupları arasındaki önemli özellikleri dengelemesine olanak tanır.

Acil durum tablosu

Tanım. Sütunları bir özelliğin değerlerine ve satırları başka bir özelliğin değerlerine (iki boyutlu bir beklenmedik durum tablosu durumunda) karşılık gelen gözlemlerin mutlak frekansları (sayıları) tablosu. Mutlak frekans değerleri satır ve sütunların kesişimindeki hücrelerde bulunur.

Bir acil durum tablosu örneği verelim. 194 hastaya anevrizma ameliyatı yapıldı. Hastalarda ameliyat öncesi ödemin şiddeti bilinmektedir.

Ödem\ Sonuç
şişlik yok	20	6	26
orta derecede şişlik	27	15	42
belirgin ödem	8	21	29
mj	55	42	194

Böylece ödemi olmayan 26 hastadan 20'si ameliyat sonrası hayatta kaldı, 6'sı ise hayatını kaybetti. Orta derecede ödemi olan 42 hastadan 27'si hayatta kaldı, 15'i öldü vb.

Olasılık tabloları için ki-kare testi

Bir işaretteki diğerine bağlı farklılıkların önemini (güvenilirliğini) belirlemek için (örneğin, ödemin ciddiyetine bağlı olarak bir ameliyatın sonucu), beklenmedik durum tablolarında ki-kare testi kullanılır:

Şans

Bir olayın olasılığı p'ye eşit olsun. O halde olayın gerçekleşmeme olasılığı 1-p'dir.

Örneğin bir hastanın beş yıl sonra hayatta kalma olasılığı 0,8 (%80) ise bu süre içinde ölme olasılığı 0,2 (%20) olur.

Tanım.Şans, bir olayın gerçekleşme olasılığının, o olayın gerçekleşmeme olasılığına oranıdır.

Örnek. Örneğimizde (bir hasta hakkında), 0,8/0,2=4 olduğundan şans 4'tür.

Yani iyileşme olasılığı 4 kat daha muhtemelölüm.

Bir miktarın değerinin yorumlanması.

1) Şans=1 ise, bir olayın meydana gelme olasılığı, gerçekleşmeme olasılığına eşittir;

2) Şans >1 ise, olayın gerçekleşme olasılığı, olayın gerçekleşmeme olasılığından daha yüksektir;

3) Şans varsa<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Oran oranı

Tanım. Olasılık oranı, birinci nesne grubu için ikinci nesne grubu için olasılık oranıdır.

Örnek. Hem erkeklerin hem de kadınların bir takım tedavilerden geçtiğini varsayalım.

Bir erkek hastanın beş yıl sonra hayatta kalma olasılığı 0,6 (%60); bu süre zarfında ölme olasılığı 0,4 (%40)'tür.

Kadınlar için benzer olasılıklar 0,8 ve 0,2'dir.

Bu örnekteki olasılık oranı

Bir miktarın değerinin yorumlanması.

1) Oran oranı = 1 ise birinci grubun şansı ikinci grubun şansına eşittir

2) Oran >1 ise ilk grubun şansı daha fazla şans ikinci grup için

3) Oran oranı ise<1, то шанс для первой группы меньше шанса для второй группы

İSTATİSTİKSEL GÜVENİLİRLİK

- İngilizce güvenilirlik/geçerlilik, istatistiksel; Almanca Doğrulama, istatistik. İstatistiksel bir testte veya Q.l.'de tutarlılık, nesnellik ve belirsizlik eksikliği. ölçüm seti. D. s. aynı sonuçların elde edilip edilmediğini görmek için aynı testin (veya anketin) aynı denek üzerinde tekrarlanmasıyla test edilebilir; veya aynı nesneyi ölçmesi gereken bir testin farklı bölümlerini karşılaştırarak.

Antinazi. Sosyoloji Ansiklopedisi, 2009

Diğer sözlüklerde “İSTATİSTİKSEL GÜVENİLİRLİK” in ne olduğuna bakın:

İSTATİSTİKSEL GÜVENİLİRLİK- İngilizce güvenilirlik/geçerlilik, istatistiksel; Almanca Doğrulama, istatistik. İstatistiksel bir testte veya Q.l.'de tutarlılık, nesnellik ve belirsizlik eksikliği. ölçüm seti. D. s. aynı testi tekrarlayarak doğrulanabilir (veya... Açıklayıcı sosyoloji sözlüğü

İstatistikte bir değerin tesadüfen ortaya çıkma olasılığı veya daha uç değerlerin düşük olması durumunda istatistiksel olarak anlamlı denir. Burada aşırılık terimiyle, test istatistiklerinin sıfır hipotezinden sapma derecesini kastediyoruz. Farkın adı... ...Wikipedia

İstatistiksel kararlılığın fiziksel olgusu, örneklem büyüklüğü arttıkça rastgele bir olayın sıklığının veya fiziksel bir miktarın ortalama değerinin sabit bir sayıya yönelmesidir. İstatistik olgusu... ... Vikipedi

FARKLILIKLARIN GÜVENİLİRLİĞİ (Benzerlikler)- incelenen göstergelere (değişkenlere) göre örnekler arasındaki farklılıkların veya benzerliklerin önem düzeyini belirlemek için analitik istatistiksel prosedür ... Modern eğitim süreci: temel kavramlar ve terimler

RAPORLAMA, İSTATİSTİK Büyük Muhasebe Sözlüğü

RAPORLAMA, İSTATİSTİK- ilgili organların işletmelerden (kuruluşlar ve kurumlar) ihtiyaç duydukları bilgileri yasal olarak oluşturulmuş raporlama belgeleri (istatistiksel raporlar) biçiminde aldıkları bir tür devlet istatistiksel gözlemi... Büyük ekonomi sözlüğü

İnsanın sosyal yaşamındaki kitlesel olayların sistematik olarak gözlemlenmesi, bunların sayısal tanımlarının derlenmesi ve bu tanımların bilimsel olarak işlenmesi yöntemlerini inceleyen bir bilim. Dolayısıyla teorik istatistik bir bilimdir... ... Ansiklopedik Sözlük F.A. Brockhaus ve I.A. Efron

Korelasyon katsayısı- (Korelasyon katsayısı) Korelasyon katsayısı, iki rastgele değişkenin bağımlılığının istatistiksel bir göstergesidir. Korelasyon katsayısının tanımı, korelasyon katsayılarının türleri, korelasyon katsayısının özellikleri, hesaplanması ve uygulanması... ... Yatırımcı Ansiklopedisi

İstatistikler- (İstatistik) İstatistik, olgu ve süreçlerdeki niceliksel değişiklikleri inceleyen genel bir teorik bilimdir. Devlet istatistikleri, istatistiksel hizmetler, Rosstat (Goskomstat), istatistiksel veriler, sorgu istatistikleri, satış istatistikleri,... ... Yatırımcı Ansiklopedisi

Korelasyon- (Korelasyon) Korelasyon, iki veya daha fazla rastgele değişken arasındaki istatistiksel ilişkidir. Korelasyon kavramı, korelasyon türleri, korelasyon katsayısı, korelasyon analizi, fiyat korelasyonu, Forex İçeriklerindeki döviz çiftlerinin korelasyonu... ... Yatırımcı Ansiklopedisi

Kitaplar

Araştırmada matematik ve matematik araştırması: Öğrenci araştırma faaliyetlerine ilişkin metodolojik koleksiyon, Borzenko V.I.. Koleksiyon, öğrenci araştırma faaliyetlerinin düzenlenmesinde uygulanabilir metodolojik gelişmeleri sunmaktadır. Koleksiyonun ilk bölümü araştırma yaklaşımının uygulanmasına ayrılmıştır...

Deneysel psikologlar, verileri toplamadan ve incelemeden önce genellikle verilerin istatistiksel olarak nasıl analiz edileceğine karar verirler. Çoğu zaman araştırmacı istatistiksel bir değer olarak tanımlanan anlamlılık düzeyini ( veya daha düşük) faktörlerin etkisini rastgele olmayan şekilde değerlendirmemize izin veren değerleri içerir. Araştırmacılar genellikle bu düzeyi olasılıksal bir ifade biçiminde temsil ederler.

Birçok psikolojik deneyde şu şekilde ifade edilebilir: seviye 0.05" veya " seviye 0.01" Bu, rastgele sonuçların yalnızca sıklıkta ortaya çıkacağı anlamına gelir 0,05 (1 kere) veya 0,01 (100 defada 1). Önceden belirlenmiş bir kriteri karşılayan istatistiksel veri analizinin sonuçları ( 0,05, 0,01 veya hatta 0,001 olsun), aşağıda istatistiksel olarak anlamlı olarak anılacaktır.

Sonucun istatistiksel olarak anlamlı olmayabileceği ancak yine de ilgi çekici olabileceği unutulmamalıdır. Çoğu zaman, özellikle az sayıda denek içeren veya sınırlı sayıda gözlem içeren ön çalışmalarda veya deneylerde, sonuçlar istatistiksel anlamlılık düzeyine ulaşamayabilir, ancak daha hassas kontrol ve daha fazla sayıda gözlemle yapılacak ileriki çalışmalarda, bunun daha iyi sonuç verebileceğini düşündürür. gözlemler daha güvenilir hale gelecektir. Aynı zamanda deneyci, ne pahasına olursa olsun istenen sonucu elde etmek için deney koşullarını bilinçli olarak değiştirme arzusunda çok dikkatli olmalıdır.

2x2 planın başka bir örneğinde Ji uzmanlık bilgisinin bilginin ezberlenmesi üzerindeki etkisini incelemek için iki tür konu ve iki tür görev kullandı.

Araştırmasında Ji sayıları ve satranç taşlarını ezberlemeye çalıştı ( değişken A) sandalyelerdeki çocuklar RECARO Genç Spor ve yetişkinler ( değişken B), yani 2x2 planına göre. Çocuklar 10 yaşındaydı ve satrançta iyiydiler, yetişkinler ise satrançta yeniydi. İlk görevde, normal bir oyun sırasında olduğu gibi tahtadaki taşların yerini hatırlamanız ve parçalar çıkarıldıktan sonra eski haline getirmeniz gerekiyordu. Bu görevin bir başka kısmı, genellikle IQ'yu belirlerken yapıldığı gibi, standart bir sayı dizisini ezberlemeyi gerektiriyordu.

Satranç oynamayı bilmek gibi uzmanlık bilgisinin, bu alanla ilgili bilgilerin hatırlanmasını kolaylaştırdığı, ancak sayıların hatırlanması üzerinde fazla bir etkisinin olmadığı ortaya çıktı. Antik oyunun inceliklerinde pek tecrübeli olmayan yetişkinler, daha az rakamı hatırlar, ancak sayıları ezberlemede daha başarılıdırlar.

Raporun metninde Ji Sunulan sonuçları matematiksel olarak doğrulayan istatistiksel analiz sağlar.

2x2 tasarımı tüm faktöriyel tasarımların en basitidir. Faktörlerin sayısını veya bireysel faktörlerin seviyelerini artırmak, bu planların karmaşıklığını büyük ölçüde artırır.

Bir deneyin (anketin) herhangi bir bilimsel ve pratik durumunda, araştırmacılar tüm insanları (genel nüfus, nüfus) değil, yalnızca belirli bir örneği inceleyebilir. Örneğin, belirli bir hastalıktan muzdarip olanlar gibi nispeten küçük bir insan grubu üzerinde çalışıyor olsak bile, uygun kaynaklara sahip olmamız veya her hastayı test etme ihtiyacı duymamız pek olası değildir. Bunun yerine, daha uygun ve daha az zaman alıcı olduğundan popülasyondan bir numuneyi test etmek yaygındır. Eğer öyleyse, örneklemden elde edilen sonuçların tüm grubu temsil ettiğini nasıl bileceğiz? Ya da profesyonel terminolojiyi kullanırsak, araştırmamızın konunun tamamını doğru şekilde tanımladığından emin olabilir miyiz? nüfus, kullandığımız örnek?

Bu soruyu cevaplamak için test sonuçlarının istatistiksel anlamlılığının belirlenmesi gerekir. İstatistiksel önem (Önemli seviye kısaltılmış Sig.), veya /7 anlamlılık düzeyi (p düzeyi) - belirli bir sonucun, çalışmanın örneklendiği popülasyonu doğru şekilde temsil etme olasılığıdır. Bunun yalnızca olduğunu unutmayın olasılık- belirli bir çalışmanın tüm popülasyonu doğru şekilde tanımladığını kesin olarak söylemek imkansızdır. En iyi ihtimalle, önem düzeyi bunun çok muhtemel olduğu sonucuna varabilir. Dolayısıyla kaçınılmaz olarak bir sonraki soru ortaya çıkıyor: Belirli bir sonucun popülasyonun doğru bir karakterizasyonu olarak kabul edilebilmesi için hangi önem düzeyine sahip olması gerekir?

Örneğin, hangi olasılık değerinde bu tür şansların risk almak için yeterli olduğunu söylemeye isteklisiniz? Ya oranlar 100 üzerinden 10 ya da 100 üzerinden 50 ise? Peki ya bu olasılık daha yüksekse? 100 üzerinden 90, 100 üzerinden 95 veya 100 üzerinden 98 gibi oranlara ne dersiniz? Risk içeren bir durum için bu seçim oldukça sorunludur çünkü kişinin kişisel özelliklerine bağlıdır.

Psikolojide, geleneksel olarak 100 üzerinden 95 veya daha fazla şansın, sonuçların doğru olma olasılığının, tüm popülasyona genellenebilecek kadar yüksek olduğu anlamına geldiğine inanılır. Bu rakam bilimsel ve pratik faaliyet sürecinde oluşturulmuştur - kılavuz olarak seçilmesi gereken bir yasa yoktur (ve aslında diğer bilimlerde bazen önem seviyesinin diğer değerleri seçilir).

Psikolojide bu olasılık oldukça alışılmadık bir şekilde işlenir. Örneğin popülasyonu temsil etme olasılığı yerine, örneğin popülasyonu temsil etme olasılığı temsil etmiyor nüfus. Başka bir deyişle, gözlemlenen ilişkinin veya farklılıkların rastgele olması ve popülasyonun bir özelliği olmaması olasılığıdır. Dolayısıyla psikologlar, bir çalışmanın sonuçlarının doğru olma ihtimalinin 100'de 95 olduğunu söylemek yerine, sonuçların yanlış olma ihtimalinin 100'de 5 olduğunu söylüyorlar (tıpkı sonuçların doğru olma ihtimalinin 100'de 40 olduğu anlamına geldiği gibi) Yanlışlık lehine 100'de 60 şans). Olasılık değeri bazen yüzde olarak ifade edilir, ancak daha sıklıkla ondalık kesir olarak yazılır. Örneğin, 100 üzerinden 10 şans, 0,1'lik ondalık kesir olarak ifade edilir; 100 üzerinden 5 0,05 olarak yazılır; 100 üzerinden 1 - 0,01. Bu kayıt biçiminde sınır değeri 0,05'tir. Bir sonucun doğru sayılabilmesi için anlamlılık düzeyinin yüksek olması gerekir. altında bu sayı (unutmayın, bu sonucun olasılığıdır) yanlış nüfusu tanımlar). Terminolojiyi aradan çıkarmak için, “sonucun yanlış olma ihtimalini” (buna daha doğrusu) ekleyelim. önem düzeyi) genellikle Latin harfiyle gösterilir R. Deneysel sonuçların açıklamaları genellikle "sonuçlar güven düzeyinde anlamlıydı" gibi bir özet beyanı içerir. (P(p) 0,05'ten az (yani %5'ten az).

Böylece anlamlılık düzeyi ( R) sonuçların olasılığını gösterir Olumsuz nüfusu temsil eder. Geleneksel olarak psikolojide, sonuçların genel tabloyu güvenilir bir şekilde yansıttığı kabul edilir. R 0,05'ten az (yani %5). Ancak bu yalnızca olasılıksal bir ifadedir ve kesinlikle koşulsuz bir garanti değildir. Bazı durumlarda bu sonuç doğru olmayabilir. Aslında anlamlılık düzeyinin büyüklüğüne bakarsak bunun ne sıklıkta olabileceğini hesaplayabiliriz. 0,05 anlamlılık düzeyinde, sonuçların 100 katından 5'inin hatalı olması muhtemeldir. 11a ilk bakışta bu çok yaygın değil gibi görünüyor, ancak düşündüğünüzde 100 üzerinden 5 şans 20 üzerinden 1 ile aynı. Yani her 20 vakadan birinde sonuç şu olacak: yanlış. Bu tür olasılıklar özellikle olumlu görünmüyor ve araştırmacılar bu tür risklere girmekten kaçınmalıdır. Birinci türden hatalar. Araştırmacıların gerçek sonuçlara ulaştıklarını düşündükleri halde aslında bulamadıkları zaman ortaya çıkan hatanın adıdır. Araştırmacıların bir sonuç bulamadıklarına inanmaları ama aslında bir sonuç olduğuna inanmalarından oluşan tam tersi hataya ne ad verilir? ikinci tip hatalar.

Bu hatalar, yapılan istatistiksel analizin göz ardı edilememesi nedeniyle ortaya çıkar. Hata olasılığı, sonuçların istatistiksel anlamlılık düzeyine bağlıdır. Bir sonucun doğru sayılması için anlamlılık düzeyinin 0,05'in altında olması gerektiğini daha önce belirtmiştik. Elbette bazı sonuçlar bundan daha düşüktür ve sonuçların 0,001 kadar düşük olduğunu görmek alışılmadık bir durum değildir (0,001 değeri, sonuçların yanlış olma ihtimalinin 1000'de 1 olduğu anlamına gelir). P değeri ne kadar küçük olursa sonuçların doğruluğuna olan güvenimiz o kadar güçlü olur.

Tabloda Şekil 7.2, istatistiksel çıkarım olasılığına ilişkin anlamlılık düzeylerinin geleneksel yorumunu ve bir ilişkinin (farklılıkların) varlığına ilişkin kararın gerekçesini göstermektedir.

Tablo 7.2

Psikolojide kullanılan anlamlılık düzeylerinin geleneksel yorumu

Pratik araştırma deneyimine dayanarak, şu şekilde tavsiye edilir: birinci ve ikinci türdeki hatalardan mümkün olduğunca kaçınmak için, önemli sonuçlar çıkarırken, seviyelere odaklanarak farklılıkların (bağlantıların) varlığı hakkında kararlar alınmalıdır. R n işareti.

İstatistiksel test(İstatistiksel Test - istatistiksel anlamlılık düzeyini belirlemek için bir araçtır. Bu, yüksek olasılıkla doğru bir hipotezin kabul edilmesini, yanlış bir hipotezin ise reddedilmesini sağlayan belirleyici bir kuraldır.

İstatistiksel kriterler aynı zamanda belirli bir sayıyı ve sayının kendisini hesaplama yöntemini de belirtir. Tüm kriterler tek bir amaç için kullanılır: belirlemek önem düzeyi analiz ettikleri veriler (yani verilerin, numunenin alındığı popülasyonu doğru şekilde temsil eden gerçek bir etkiyi yansıtma olasılığı).

Bazı testler yalnızca normal olarak dağıtılan veriler için kullanılabilir (ve özellik aralık ölçeğinde ölçülüyorsa) - bu testlere genellikle denir. parametrik. Diğer kriterleri kullanarak verileri hemen hemen her dağıtım yasasıyla analiz edebilirsiniz - bunlara denir parametrik olmayan.

Parametrik kriterler, hesaplama formülünde dağılım parametrelerini içeren kriterlerdir; ortalamalar ve varyanslar (Student's t-testi, Fisher's F-testi, vb.).

Parametrik olmayan kriterler, dağılım parametrelerinin hesaplanmasına ilişkin formülde dağılım parametrelerini içermeyen ve frekanslar veya sıralar (kriter) ile çalışmaya dayalı kriterlerdir. Q Rosenbaum kriteri sen Manna-Whitney

Örneğin, farklılıkların anlamlılığının Öğrenci t-testi ile belirlendiğini söylediğimizde, ampirik değeri hesaplamak için Öğrenci t-testi yönteminin kullanıldığını ve bu değerin daha sonra tablodaki (kritik) değerle karşılaştırıldığını kastediyoruz.

Kriterin ampirik (bizim tarafımızdan hesaplanan) ve kritik değerlerinin (tablo) oranına göre hipotezimizin doğrulanıp doğrulanmadığına karar verebiliriz. Çoğu durumda, farklılıkları anlamlı olarak tanıyabilmemiz için, kriterin ampirik değerinin kritik değeri aşması gerekir, ancak bazı kriterler (örneğin, Mann-Whitney testi veya işaret testi) vardır. tam tersi kurala uymalıyız.

Bazı durumlarda, kritere ilişkin hesaplama formülü, incelenen örnekteki gözlem sayısını içerir; bu sayı şu şekilde gösterilir: P. Özel bir tablo kullanarak, belirli bir ampirik değerin farklılıkların hangi istatistiksel anlamlılık düzeyine karşılık geldiğini belirleriz. Çoğu durumda, kriterin aynı ampirik değeri, incelenen örnekteki gözlem sayısına bağlı olarak önemli veya önemsiz olabilir ( N ) veya sözde serbestlik derecesi sayısı , olarak gösterilir v (g>) veya nasıl df (Bazen D).

bilmek N veya serbestlik derecesi sayısını özel tablolar kullanarak belirleyebiliriz (ana tablolar Ek 5'te verilmiştir) kritik değerler kriterleri belirleyin ve elde edilen ampirik değeri onlarla karşılaştırın. Bu genellikle şu şekilde yazılır: “ne zaman n = Kriterin 22 kritik değeri tst = 2,07" veya "de v (D) = Öğrenci testinin 2 kritik değeri = 4,30” vb.

Tipik olarak, tercih hala parametrik kriterlere verilmektedir ve biz de bu pozisyona bağlı kalıyoruz. Daha güvenilir oldukları kabul edilir ve daha fazla bilgi ve daha derin analiz sağlayabilirler. Zorlukla ilgili matematiksel hesaplamalar, daha sonra kullanırken bilgisayar programları bu zorluk ortadan kalkar (ancak bazı zorluklar oldukça aşılabilir görünmektedir).

Bu ders kitabında istatistik sorununu ayrıntılı olarak ele almıyoruz.
hipotezler (boş - R0 ve alternatif - Hj) ve kabul edildi istatistiksel çözümlerçünkü psikoloji öğrencileri bunu “Psikolojide matematiksel yöntemler” disiplininde ayrı olarak inceliyorlar. Ayrıca kayıt olurken şunu da belirtmekte fayda var. araştırma raporu(ders çalışması veya tez, yayınlar) istatistiksel hipotezler ve istatistiksel çözümler kural olarak verilmemiştir. Genellikle sonuçları açıklarken bir kriter belirtilir ve gerekli olan tanımlayıcı istatistikler(ortalamalar, sigma, korelasyon katsayıları vb.), kriterlerin ampirik değerleri, serbestlik dereceleri ve mutlaka p anlamlılık düzeyi. Daha sonra, test edilen hipotezle ilgili olarak, ulaşılan veya ulaşılamayan önem düzeyini gösteren (genellikle eşitsizlik biçiminde) anlamlı bir sonuç formüle edilir.