Metodolojinin geçerliliği nedir? Metodolojinin geçerliliğinin değerlendirilmesi niceliksel ve niteliksel olabilir.

Güvenilir olmayan bir teknik geçerli olamayacağından geçerlilik konusuna güvenilirlik oluşturulduktan sonra karar verilir.

Test geçerliliği, testin neyi ölçtüğünü ve bunu ne kadar iyi yaptığını bize anlatan bir kavramdır (A. Anastasi). Geçerlilik özünde, bir yandan tekniğin ne için oluşturulduğunu ölçmeye uygun olup olmadığı, diğer yandan etkinliğinin, verimliliğinin ve pratik kullanışlılığının ne olduğuna ilişkin bilgileri içeren karmaşık bir özelliktir.

Bu nedenle geçerliliği tanımlamaya yönelik tek bir evrensel yaklaşım yoktur. Araştırmacının geçerliliğin hangi yönünü dikkate almak istediğine bağlı olarak farklı kanıt yöntemleri kullanılır. Bir başka ifadeyle geçerlik kavramı, kendine özel anlam taşıyan farklı türlerini içermektedir. Bir metodolojinin geçerliliğinin kontrol edilmesine doğrulama denir.

Geçerlilik, belirli bir çalışmanın kabul edilen standartlara (kusursuz bir deney) uygunluğudur.

Geçerlilik, ilk anlayışında metodolojinin kendisiyle ilgilidir; bu, ölçüm aracının geçerliliğidir. Bu tür testlere teorik doğrulama denir. İkinci anlayışında geçerlilik, metodolojiden çok kullanım amacına atıfta bulunur. Bu pragmatik doğrulamadır.

Teorik doğrulama sırasında araştırmacı, teknikle ölçülen özelliğin kendisi ile ilgilenir.

Teorik doğrulamayı belirlemek için metodolojinin dışında kalan herhangi bir bağımsız kriter bulmak zor olduğundan, bu metodolojinin geçerliliğine ilişkin temelsiz ifadeler daha önce olduğu gibi kabul ediliyordu. Teorik doğrulama, tekniğin ölçmesi gereken özelliği tam olarak ölçtüğünü kanıtlamayı amaçladığından. Teorik doğrulama için temel sorun, psikolojik fenomenler ile onların göstergeleri arasındaki ilişkidir ve bu psikolojik fenomenler aracılığıyla bu fenomenler kavranmaya çalışılır. Bu, yazarın niyeti ile metodolojinin sonuçlarının örtüştüğünü gösterir.

Belirli bir özelliği ölçmek için halihazırda bilinen, kanıtlanmış geçerliliği olan bir teknik varsa, yeni bir tekniğin teorik doğrulamasını gerçekleştirmek o kadar da zor değildir. Yeni ve benzer bir eski teknik arasında korelasyonun varlığı, geliştirilen tekniğin referans teknikle aynı psikolojik kaliteyi ölçtüğünü göstermektedir.

Teorik geçerliliği kontrol etmek için, bir yandan ilgili teknikle bağlantının derecesini (yakınsak geçerlilik) belirlemek, diğer yandan ise farklı bir teorik temele sahip tekniklerle bu bağlantının yokluğunu (ayırt edici geçerlilik) belirlemek önemlidir. ).

Göstergelerinin pratik Faaliyet biçimleriyle karşılaştırılması, metodolojinin neyi ölçtüğünün anlaşılmasında önemli bir rol oynar. Metodolojinin teorik olarak geliştirilmesi önemlidir.

Pragmatik Doğrulama

Metodolojinin pratik etkinliği, önemi ve kullanışlılığı kontrol edilir, çünkü metodoloji yalnızca ölçülen özelliğin belirli Faaliyet türlerinde ortaya çıktığı kanıtlandığında kullanılabilir.

Pragmatik geçerliliği test etmek için bağımsız bir dış kriter kullanılır - incelenen özelliğin günlük yaşamdaki tezahürünün bir göstergesi. Böyle bir kriter akademik performans (öğrenme yetenekleri testleri, başarı testleri, zeka testleri için), üretim başarıları (mesleki yönelim yöntemleri için), gerçek aktivitelerin etkinliği - çizim, modelleme vb. (özel yetenek testleri için) olabilir. ), öznel değerlendirmeler (kişilik testleri için).

Amerikalı araştırmacılar Tiffin ve McCormick 4 tür dış kriter belirledi:

1) Performans kriteri (gerçekleştirilen iş miktarı, akademik performans, zaman, yeterliliklerin büyüme hızı).
2) Öznel kriterler (bir kişinin bir şeye karşı tutumunu, görüşlerini, görüşlerini yansıtan çeşitli cevap türlerini içerir).
3) Fizyolojik kriter (bedeni ve ruhu etkileyen dış çevrenin etkisini incelerken kullanılır).
4) Rastgelelik kriteri (örneğin, amaç iş için kazalara daha az eğilimli bireylerin seçilmesi sorunuyla ilgili olduğunda).

Bir dış kriterin 3 ana gereksinimi olmalıdır: 1) İlgili olmalıdır, yani kriterin, teşhis tekniğinin ölçtüğü bireysel ruhun tam olarak özelliklerini içerdiğine dair güven olmalıdır. Dış kriter ve teşhis modeli dahili anlamsal yazışmada olmalıdır. 2) Girişimden (kirlenmeden) arındırılmış olmalıdır. Araştırma için aşağı yukarı aynı koşullarda olan insan grupları seçilmelidir. 3) Güvenilir olmalıdır. İncelenen fonksiyonun sabitliği ve kararlılığı.

Metodolojinin geçerliliğinin değerlendirilmesi niceliksel ve niteliksel olabilir.

Niceliksel bir göstergeyi (geçerlilik katsayısı) hesaplamak için, teşhis tekniklerinin uygulanmasından elde edilen sonuçlar, aynı kişilerin harici bir kritere göre elde edilen verileriyle karşılaştırılır. Farklı doğrusal korelasyon türleri kullanılır (Spearman'a göre, Piersen'e göre).

Ölçülen özelliğin özünün nitel açıklaması. Burada herhangi bir istatistiksel işlem kullanılmamaktadır. Teşhis tekniğinin özelliklerine ve ayrıca dış kriterin geçici durumuna göre belirlenen çeşitli geçerlilik türleri vardır: 1) “İçeriğe göre” geçerlilik (başarı testlerinde kullanılır): Geniş bir konudan 3-4 soru Öğrencinin gerçek bilgisini gösterin. Bunu yapmak için teşhis sonuçları öğretmenin uzman değerlendirmeleriyle karşılaştırılır. 2) “Eşzamanlı” geçerlilik veya güncel geçerlilik – şu andaki zamana ilişkin veriler toplanır: akademik performans, üretkenlik vb. Test başarı sonuçları bunlarla ilişkilidir. 3) “Tahmin edici” geçerlilik (“tahmin edici”). Güvenilir bir dış kriter tarafından belirlenir, ancak bununla ilgili bilgiler testten bir süre sonra toplanır. Tahminin doğruluğu, bu tahmin için belirlenen zamanla ters orantılıdır. 4) “Geçmişe dönük” geçerlilik. Geçmişteki olayları veya kalite durumunu yansıtan bir kritere göre belirlenir. Tekniğin öngörü yetenekleri hakkında hızlı bir şekilde bilgi edinmek için kullanılabilir.

Güvenilirlikten sonra, yöntemlerin kalitesini değerlendirmek için bir diğer önemli kriter geçerliliktir. Bir tekniğin geçerliliği sorunu, güvenilmez bir tekniğin geçerli olamayacağı için, ancak onun yeterli güvenilirliği sağlandıktan sonra çözülür. Ancak geçerliliği hakkında bilgi sahibi olunmayan en güvenilir teknik pratikte işe yaramaz.

Geçerlilik konusunun hala en zor konulardan biri gibi göründüğünü belirtmek gerekir. Bu kavramın en köklü tanımı A. Anastasi'nin kitabında şu şekilde verilmiştir: "Test geçerliliği, testin neyi ölçtüğünü ve bunu ne kadar iyi yaptığını bize anlatan bir kavramdır."

Geçerlilik özünde, bir yandan tekniğin ne için oluşturulduğunu ölçmeye uygun olup olmadığı, diğer yandan etkinliğinin, verimliliğinin ve pratik kullanışlılığının ne olduğuna ilişkin bilgileri içeren karmaşık bir özelliktir.

Geçerlilik ilk anlamıyla metodolojinin kendisiyle ilgilidir, yani ölçme aracının geçerliliğidir. Bu tür testlere teorik doğrulama denir. İkinci anlayışta geçerlilik, metodolojiden çok kullanım amacına ilişkindir. Bu pragmatik doğrulamadır.

Özetlemek gerekirse şunları söyleyebiliriz:

“Teorik doğrulama sırasında araştırmacı, teknikle ölçülen özelliğin kendisiyle ilgilenir. Bu aslında psikolojik doğrulamanın kendisinin gerçekleştirildiği anlamına gelir;

“Pragmatik doğrulama ile ölçüm konusunun özü (psikolojik özellik) gözden kaybolur. Temel vurgu, teknikle ölçülen “bir şeyin” belirli uygulama alanlarıyla bağlantısının olduğunun kanıtlanmasıdır.

Pragmatik doğrulamanın aksine teorik doğrulamayı gerçekleştirmek bazen çok daha zor olabilir. Şimdilik özel ayrıntılara girmeden, pragmatik geçerliliğin nasıl kontrol edildiğine genel hatlarıyla değinelim: Metodolojiden bağımsız olarak, belirli bir faaliyetteki (eğitimsel, mesleki vb.) başarıyı belirleyen bazı dış kriterler seçilir ve Tanı tekniğinin sonuçları karşılaştırılır. Aralarındaki bağlantının tatmin edici olduğu düşünülürse, teşhis tekniğinin pratik önemi, etkinliği ve verimliliği hakkında bir sonuca varılır.

Teorik geçerliliği belirlemek için metodolojinin dışında kalan herhangi bir bağımsız kriteri bulmak çok daha zordur. Bu nedenle, testolojinin gelişiminin ilk aşamalarında, geçerlilik kavramı henüz şekillenmeye başladığında, belirli bir testin tam olarak neyi ölçtüğüne dair sezgisel bir fikir vardı:

1) Tekniğin ölçtüğü şey basitçe "açık" olduğu için geçerli olarak adlandırıldı;

2) geçerliliğin kanıtı, araştırmacının yönteminin "konuyu anlamasına" izin verdiğine dair güvenine dayanıyordu;

3) tekniğin geçerli olduğu kabul edildi (yani, şu veya bu testin şu veya bu kaliteyi ölçtüğü ifadesi kabul edildi), çünkü tekniğin dayandığı teori "çok iyi" idi.

Metodolojinin geçerliliğine ilişkin asılsız ifadelerin kabulü uzun süre devam edemedi. Gerçekten bilimsel eleştirinin ilk tezahürleri bu yaklaşımı çürüttü: bilimsel temelli kanıt arayışı başladı.

Dolayısıyla, bir metodolojinin teorik doğrulamasını gerçekleştirmek, metodolojinin, araştırmacının ölçmeyi amaçladığı özelliği, kaliteyi tam olarak ölçtüğünü kanıtlamak anlamına gelir.

Yani örneğin çocukların zihinsel gelişimini teşhis etmek için bir test geliştirildiyse, bu testin diğer bazı özellikleri (örneğin kişilik, karakter vb.) değil de gerçekten bu gelişimi ölçüp ölçmediğini analiz etmek gerekir. Bu nedenle, teorik doğrulama için temel sorun, psikolojik fenomenler ile bu psikolojik fenomenlerin bilinmeye çalışıldığı göstergeler arasındaki ilişkidir. Böyle bir kontrol, yazarın niyetleri ile metodolojinin sonuçlarının ne ölçüde örtüştüğünü gösterir.

Belirli bir özelliği ölçmek için geçerliliği kanıtlanmış bir teknik zaten mevcutsa, yeni bir tekniğin teorik doğrulamasını gerçekleştirmek o kadar da zor değildir. Yeni ve benzer, önceden test edilmiş bir teknik arasında bir korelasyonun varlığı, geliştirilen tekniğin referans teknikle aynı psikolojik kaliteyi ölçtüğünü gösterir. Ve eğer yeni yöntem aynı zamanda sonuçların gerçekleştirilmesinde ve işlenmesinde daha kompakt ve ekonomik olursa, psikoteşhis uzmanları eski araç yerine yeni bir araç kullanma fırsatına sahip olur. Bu teknik, özellikle insan sinir sisteminin temel özelliklerini teşhis etmek için yöntemler oluştururken diferansiyel psikofizyolojide sıklıkla kullanılır (bkz. Bölüm 16).

Ancak teorik geçerlilik, yalnızca ilgili göstergelerle değil, aynı zamanda hipoteze dayalı olarak anlamlı bağlantıların olmaması gereken göstergelerle de karşılaştırılarak kanıtlanır. Bu nedenle, teorik geçerliliği kontrol etmek için, bir yandan ilgili teknikle bağlantının derecesini (yakınsak geçerlilik) belirlemek, diğer yandan ise farklı bir teorik temele sahip tekniklerle bu bağlantının yokluğunu belirlemek önemlidir ( ayırt edici geçerlilik).

Böyle bir doğrulama yönteminin imkansız olduğu durumlarda, bir yöntemin teorik doğrulamasını gerçekleştirmek çok daha zordur. Çoğu zaman bu, bir araştırmacının karşılaştığı durumdur. Bu gibi durumlarda, yalnızca incelenen mülkle ilgili çeşitli bilgilerin kademeli olarak birikmesi, teorik öncüllerin ve deneysel verilerin analizi ve teknikle ilgili önemli deneyim, psikolojik anlamının ortaya çıkmasına izin verir.

Göstergelerini pratik faaliyet biçimleriyle karşılaştırarak metodolojinin neyi ölçtüğünü anlamada önemli bir rol oynanır. Ancak burada metodolojinin teorik olarak dikkatli bir şekilde geliştirilmesi, yani sağlam, sağlam temellere dayanan bir bilimsel temelin bulunması özellikle önemlidir. Daha sonra tekniğin, ölçtüğü şeye karşılık gelen günlük pratikten alınan dış bir kriterle karşılaştırılması yoluyla, tekniğin özüne ilişkin teorik fikirleri destekleyen bilgiler elde edilebilir.

Pragmatik doğrulamaya gelince, bir tekniğin pratik etkinliği, önemi ve kullanışlılığı açısından test edilmesini içerir, çünkü bir teşhis tekniğini kullanmak yalnızca ölçülen özelliğin belirli yaşam koşullarında ortaya çıktığı kanıtlandığında mantıklı olur. , belirli türdeki faaliyetlerde. Özellikle seçim sorununun ortaya çıktığı yerlerde buna büyük önem verilmektedir.

Tekrar testolojinin gelişim tarihine dönersek, testlerin bilimsel içeriğinin ve teorik “bagajının” daha az ilgi çekici olduğu bir dönemi (20-30'lar) vurgulayabiliriz. Testin işe yaraması ve en hazırlıklı kişilerin hızla seçilmesine yardımcı olması önemliydi. Test görevlerini değerlendirmeye yönelik ampirik kriter, bilimsel ve uygulamalı sorunların çözümünde tek doğru kılavuz olarak kabul edildi.

Teşhis tekniklerinin, açık bir teorik temel olmadan, tamamen ampirik gerekçelerle kullanılması, çoğu zaman sözde bilimsel sonuçlara ve gerekçesiz pratik önerilere yol açmıştır. Testlerin ortaya çıkardığı özellikleri ve nitelikleri doğru bir şekilde adlandırmak imkansızdı. O dönemin testlerini analiz eden B. M. Teplov, bunları "kör testler" olarak adlandırdı.

Test geçerliliği sorununa yönelik bu yaklaşım 50'li yılların başlarına kadar tipikti. sadece ABD'de değil, diğer ülkelerde de. Ampirik doğrulama yöntemlerinin teorik zayıflığı, testlerin geliştirilmesinde yalnızca "çıplak" ampiriklere ve uygulamaya değil, aynı zamanda teorik bir kavrama da güvenilmesi çağrısında bulunan bilim adamlarının eleştirilerine yol açmaktan başka bir şey yapamazdı. Bildiğimiz gibi teorisiz pratik kördür, pratiksiz teori ise ölüdür. Şu anda, yöntemlerin geçerliliğinin teorik ve pragmatik değerlendirmesi en verimli olarak algılanmaktadır.

1) akademik performans (öğrenme yeteneği testleri, başarı testleri, zeka testleri için);

2) üretim başarıları (profesyonel odaklı yöntemler için);

3) gerçek faaliyetlerin etkinliği - çizim, modelleme vb. (özel yetenek testleri için);

4) öznel değerlendirmeler (kişilik testleri için). Amerikalı araştırmacılar D. Tiffin ve E. McCormick,

geçerliliği kanıtlamak için kullanılan dış kriterlerin analizinde dört tür belirlendi:

1) performans kriterleri (bunlar tamamlanan işin miktarı, akademik performans, eğitime harcanan süre, niteliklerin büyüme oranı vb. içerebilir);

2) öznel kriterler (bir kişinin bir şeye veya birine karşı tutumunu, fikrini, görüşlerini, tercihlerini yansıtan çeşitli cevap türlerini içerir; genellikle öznel kriterler röportajlar, anketler, anketler kullanılarak elde edilir);

3) fizyolojik kriterler (çevrenin ve diğer durumsal değişkenlerin insan vücudu ve ruhu üzerindeki etkisini incelemek için kullanılırlar; nabız hızı, kan basıncı, cildin elektriksel direnci, yorgunluk belirtileri vb. ölçülür);

4) kaza kriterleri (araştırmanın amacı, örneğin kazalara daha az duyarlı kişilerin iş için seçilmesi sorunuyla ilgili olduğunda uygulanır).

Dış kriterin üç temel gereksinimi karşılaması gerekir:

1) alakalı olmalı;

2) müdahaleden (kirlenmeden) arınmış;

3) güvenilir].

Örneğin, bir test düşünmenin bireysel özelliklerini, belirli nesneler ve kavramlarla mantıksal eylemler gerçekleştirme yeteneğini ölçerse, o zaman kriter aynı zamanda tam olarak bu becerilerin tezahürünü de aramalıdır. Bu aynı şekilde mesleki faaliyetler için de geçerlidir. Bir değil, her biri spesifik olan ve uygulama için kendi koşullarını dayatan birkaç amaç ve hedefi vardır. Bu, mesleki faaliyetlerin gerçekleştirilmesine yönelik çeşitli kriterlerin varlığını ima eder. Bu nedenle teşhis tekniklerindeki başarı genel olarak üretim verimliliği ile karşılaştırılmamalıdır. Gerçekleştirilen operasyonların niteliğine göre metodoloji ile ilişkilendirilen bir kriterin bulunması gerekmektedir.

Eğer harici bir kriterin ölçülen özellik ile ilgili olup olmadığı bilinmiyorsa, psikodiagnostik tekniğin sonuçlarının onunla karşılaştırılması pratik olarak işe yaramaz hale gelir. Metodolojinin geçerliliğini değerlendirebilecek herhangi bir sonuca varılmasına izin vermez.

Müdahaleden (kirlenmeden) korunma gereklilikleri, örneğin eğitimsel veya endüstriyel başarının iki değişkene bağlı olmasından kaynaklanmaktadır: kişinin kendisine, yöntemlerle ölçülen bireysel özelliklerine ve duruma, çalışma ve çalışma koşullarına bağlı girişime neden olabilecek, uygulanan kriteri “kirletebilir”. Bunu bir dereceye kadar önlemek için, araştırma için aşağı yukarı aynı koşullarda olan insan gruplarının seçilmesi gerekir. Başka bir yöntem kullanılabilir. Parazit etkisinin düzeltilmesinden oluşur. Bu ayarlama genellikle doğası gereği istatistikseldir. Örneğin, üretkenlik mutlak anlamda alınmamalı, benzer çalışma koşullarına sahip işçilerin ortalama üretkenliğiyle ilişkili olarak alınmalıdır.

Bir kriterin istatistiksel olarak anlamlı bir güvenilirliğe sahip olması gerektiğini söylediklerinde, bu onun incelenen fonksiyonun sabitliğini ve istikrarını yansıtması gerektiği anlamına gelir.

Yeterli ve kolayca belirlenebilen bir kriterin araştırılması çok önemli ve karmaşık bir doğrulama görevidir. Batı testlerinde birçok yöntem, yalnızca onları test etmek için uygun bir kriter bulmak mümkün olmadığı için diskalifiye edilir. Özellikle çoğu anketin geçerlilik verileri şüphelidir, çünkü ölçtükleri şeye karşılık gelen yeterli bir dış kriter bulmak zordur.

Yöntemlerin geçerliliğinin değerlendirilmesi niceliksel ve niteliksel olabilir.

Nicel bir göstergeyi - geçerlilik katsayısını - hesaplamak için, teşhis tekniği uygulanırken elde edilen sonuçlar, aynı kişilerin dış kriterlerine göre elde edilen verilerle karşılaştırılır. Farklı doğrusal korelasyon türleri kullanılır (Spearman'a göre, Pearson'a göre).

Geçerliliği hesaplamak için kaç denek gereklidir?

Uygulama, 50'den az olmaması gerektiğini, ancak 200'den fazlasının en iyisi olduğunu göstermiştir. Sık sık şu soru ortaya çıkar: Kabul edilebilir sayılması için geçerlilik katsayısının değeri ne olmalıdır? Genel olarak geçerlik katsayısının istatistiksel olarak anlamlı olmasının yeterli olduğu belirtilmektedir. Yaklaşık 0,2-0,3'lük bir geçerlilik katsayısı düşük, ortalama - 0,3-0,5 ve yüksek - 0,6'nın üzerinde kabul edilir.

Ancak A. Anastasi, K. M. Gurevich ve diğerlerinin vurguladığı gibi, geçerlilik katsayısını hesaplamak için doğrusal korelasyonu kullanmak her zaman meşru değildir. Bu teknik, yalnızca bazı faaliyetlerdeki başarının, teşhis testinin gerçekleştirilmesindeki başarıyla doğru orantılı olduğu kanıtlandığında haklı çıkar. Yabancı testologların, özellikle de mesleki uygunluk ve seçimle ilgilenenlerin konumu, çoğu zaman, testte daha fazla görevi tamamlayan kişinin mesleğe daha uygun olduğunun koşulsuz olarak tanınmasına indirgenmektedir. Ancak bir aktivitede başarılı olmak için test çözümünün %40'ı düzeyinde bir özelliğe sahip olmanız da gerekebilir. Sınavdan yüksek puan almanın artık meslek açısından bir anlamı kalmıyor. K. M. Gurevich'in monografisinden açık bir örnek: Bir postacı okuyabilmelidir, ancak normal hızda mı yoksa çok yüksek hızda mı okuduğu - bunun artık profesyonel bir önemi yoktur. Yöntem göstergeleri ile dış kriter arasında böyle bir korelasyon varken, geçerliliği sağlamanın en yeterli yolu fark kriteri olabilir.

Başka bir durum da mümkündür: Mesleğin gerektirdiğinden daha yüksek düzeyde mülkiyet, mesleki başarıya müdahale eder. Yani, 20. yüzyılın şafağında bile. Amerikalı araştırmacı F. Taylor, en gelişmiş kadın üretim işçilerinin düşük emek verimliliğine sahip olduğunu buldu. Yani zihinsel gelişimlerinin yüksek olması, onların yüksek verimli çalışmalarına engel oluyordu. Bu durumda geçerlilik katsayısının hesaplanması için varyans analizi veya korelasyon ilişkilerinin hesaplanması daha uygun olacaktır.

Yabancı test uzmanlarının deneyimlerinin gösterdiği gibi, tek bir istatistiksel prosedür bireysel değerlendirmelerin çeşitliliğini tam olarak yansıtamamaktadır. Bu nedenle, yöntemlerin geçerliliğini kanıtlamak için sıklıkla başka bir model kullanılır: klinik değerlendirmeler. Bu, incelenen mülkün özünün niteliksel bir açıklamasından başka bir şey değildir. Bu durumda istatistiksel işleme dayanmayan tekniklerin kullanımından bahsediyoruz.

Teşhis tekniklerinin özelliklerine ve ayrıca dış kriterin geçici durumuna bağlı olarak çeşitli geçerlilik türleri vardır. Ancak en sık aşağıdakilere denir.

1. “İçeriğe göre” geçerlilik. Bu teknik örneğin başarı testlerinde kullanılır. Tipik olarak, başarı testleri öğrencilerin kapsadığı tüm materyalleri içermez, ancak bunların küçük bir kısmını (3-4 soru) içerir. Bu birkaç soruya verilen doğru yanıtların tüm materyale hakim olduğunuzu gösterdiğinden emin olabilir misiniz? İçerik geçerliliği testinin cevaplaması gereken şey budur. Bunu yapmak için, testteki başarının öğretmenlerin uzman değerlendirmeleriyle (bu materyale dayanarak) karşılaştırılması yapılır. İçerik geçerliliği aynı zamanda ölçüt referanslı testler için de geçerlidir. Bu tekniğe bazen mantıksal geçerlilik denir.

2. Eşzamanlı geçerlilik veya sürekli geçerlilik, test edilen yöntem kullanılarak deneylerle eş zamanlı olarak bilgilerin toplandığı harici bir kriter kullanılarak belirlenir. Başka bir deyişle, şimdiki zamanla ilgili veriler toplanır: test süresindeki performans,

aynı dönemdeki performans vb. Test başarı sonuçları bunlarla karşılaştırılır.

3. “Tahmin edici” geçerlilik (başka bir adı da “tahmin edici” geçerliliktir). Aynı zamanda harici bir kriter tarafından da belirlenir, ancak bununla ilgili bilgiler testten bir süre sonra toplanır. Dış kriter genellikle bir kişinin, teşhis testlerinin sonuçlarına göre değerlendirildiği faaliyet türü için bir tür değerlendirmede ifade edilen yeteneğidir. Her ne kadar bu teknik, teşhis tekniklerinin (gelecekteki başarıyı tahmin etme) göreviyle en tutarlı olsa da, uygulanması çok zordur. Teşhisin doğruluğu, bu tahmin için belirlenen süre ile ters orantılıdır. Ölçümden sonra ne kadar çok zaman geçerse, tekniğin prognostik önemini değerlendirirken dikkate alınması gereken faktörlerin sayısı da o kadar artar. Ancak tahmini etkileyen tüm faktörleri hesaba katmak neredeyse imkansızdır.

4. “Geriye dönük” geçerlilik. Geçmişteki olayları veya kalite durumunu yansıtan bir kritere göre belirlenir. Tekniğin öngörü yetenekleri hakkında hızlı bir şekilde bilgi edinmek için kullanılabilir. Bu nedenle, iyi yetenek testi sonuçlarının hızlı öğrenmeye ne ölçüde karşılık geldiğini test etmek için geçmiş performans değerlendirmeleri, geçmiş uzman görüşleri vb. güncel tanı puanları yüksek ve düşük olan kişiler arasında karşılaştırılabilir.

Geliştirilen metodolojinin geçerliliğine ilişkin verileri sunarken ne tür bir geçerliliğin kastedildiğini (içerik açısından, eşzamanlılık açısından vb.) açıkça belirtmek önemlidir. Doğrulamanın yapıldığı bireylerin sayısı ve özellikleri hakkında da bilgi verilmesi tavsiye edilir. Bu tür bilgiler, tekniği kullanan araştırmacının, tekniği uygulamayı düşündüğü grup için ne kadar geçerli olduğuna karar vermesine olanak tanır. Güvenilirlikte olduğu gibi, bir tekniğin bir örnekte yüksek geçerliliğe, diğerinde düşük geçerliliğe sahip olabileceği unutulmamalıdır. Bu nedenle, eğer bir araştırmacı, geçerlilik testinin yapıldığı teknikten önemli ölçüde farklı olan bir denek örneklemi üzerinde bir teknik kullanmayı planlıyorsa, böyle bir testi yeniden yapması gerekir. Kılavuzda verilen geçerlilik katsayısı yalnızca belirlendiği konu gruplarına benzerdir.

GEÇERLİLİK- Psikodiagnostik yöntem ve testlerin en önemli özelliklerinden biri, kalitelerinin ana kriterlerinden biri. Bu kavram güvenilirlik kavramına yakındır ancak tamamen aynı değildir.

Geçerlilik sorunu, bir test veya tekniğin geliştirilmesi ve pratik uygulaması sırasında, ilgilenilen kişilik özelliğinin ifade derecesi ile onu ölçme yöntemi arasında bir yazışma kurulması gerektiğinde ortaya çıkar. Geçerlilik, bir testin veya tekniğin neyi ölçtüğüne ve bunu ne kadar iyi yaptığına atıfta bulunur; Ne kadar geçerli olursa, yaratılışlarının niteliğini (özelliğini) o kadar iyi yansıtır. Niceliksel olarak geçerlilik, bir test veya teknik kullanılarak elde edilen sonuçların diğer göstergelerle (örneğin ilgili aktiviteyi gerçekleştirme başarısıyla) korelasyonu yoluyla ifade edilebilir. Geçerlilik, çoğu zaman karmaşık bir şekilde, farklı şekillerde gerekçelendirilebilir. Ek kavramsal, kriter, yapıcı ve diğer geçerlilik türleri de kendi düzeylerini belirleme yöntemleriyle birlikte kullanılır. Geçerlilik gerekliliği çok önemlidir ve testler veya diğer psikodiagnostik teknikler hakkındaki birçok şikayet, bunların geçerliliğinin şüpheli olmasıyla ilişkilidir. Örneğin, bir zeka ölçüsünün geçerliliği şunlara bağlıdır:

1) bu fenomenin şu veya bu kavramını temsil eden zeka kavramının tanımından;

2) bu kavrama göre geliştirilen test görevlerinin bileşimi;

3) ampirik kriterlerden. Farklı kavramlar farklı görev bileşimi gerektirir, dolayısıyla kavramsal geçerlilik konusu önemlidir. Görevler yazarın verdiği zeka kavramına ne kadar karşılık gelirse, kavramsal testin geçerliliği hakkında o kadar güvenle konuşabiliriz. Bir testin ampirik bir kriterle korelasyonu, testin o kritere göre olası geçerliliğini gösterir. Bir testin geçerliliğini belirlemek her zaman ek sorular sormayı gerektirir: Ne için geçerlilik? hangi amaçla? hangi kritere göre? Dolayısıyla geçerlilik kavramı sadece testi değil aynı zamanda kalitesini değerlendirme kriterini de ifade eder. Test ile kriter arasındaki korelasyon katsayısı ne kadar yüksek olursa geçerlilik de o kadar yüksek olur. Faktör analizinin gelişmesi, belirlenen faktöre ilişkin geçerliliği olan testlerin oluşturulmasını mümkün kılmıştır. Yalnızca geçerliliği test edilen testler mesleki yönlendirme, mesleki seçim ve bilimsel araştırmalarda kullanılabilir.

GEÇERLİLİK: KRİTER- yöntemlerle ilgili olarak, geçerliliğinin yargılanabileceği bağımsız göstergeler ve işaretler anlamına gelir. Bu kriterler tekniğin pratik uygulamasından elde edilen sonuçları değerlendirmek için kullanılır. Kriterler şunlar olabilir:

1) davranışsal göstergeler - konunun çeşitli yaşam durumlarındaki tepkileri, eylemleri ve eylemleri;

2) konunun çeşitli faaliyet türlerindeki başarıları - eğitim, emek vb.;

3) çeşitli kontrol testlerinin ve görevlerinin performansına ilişkin veriler;

4) geçerliliği veya test edilen yöntemle bağlantısının kesin olarak kurulduğu kabul edilen diğer yöntemlerden elde edilen veriler.

DIŞ GEÇERLİLİK- Psikodiagnostik yöntemlerle ilgili olarak, bu yöntem kullanılarak gerçekleştirilen psikodiagnostik sonuçlarının, yöntemden bağımsız ve muayene konusuyla ilgili dış işaretlere karşılık geldiği anlamına gelir. Bu, ampirik geçerlilikle yaklaşık olarak aynı anlama gelir; ancak burada yöntemin göstergeleri ile konunun davranışıyla ilgili en önemli, anahtar dış işaretler arasındaki bağlantıdan bahsediyoruz. Bir psikodiagnostik teknik, örneğin bir bireyin karakter özelliklerini değerlendiriyorsa ve onun dışarıdan gözlemlenebilir davranışı test sonuçlarıyla tutarlıysa, harici olarak geçerli kabul edilir.

İÇ GEÇERLİLİK- psikodiagnostik yöntemlerle ilgili olarak, içerdiği görevlerin, alt testlerin ve diğer şeylerin yöntemin genel amacı ve amacına uygunluğu anlamına gelir; bu teknik kullanılarak gerçekleştirilen psikodiagnostik sonuçlarının, tekniğin kendisinde kullanılan değerlendirilen psikolojik özelliğin tanımıyla uyumu. Bir tekniğin içerdiği soruların, görevlerin veya alt testlerin tamamı veya bir kısmı tekniğin gerektirdiğini ölçmüyorsa, tekniğin dahili olarak geçersiz veya geçerliliğinin eksik olduğu kabul edilir.

KAVRAMSAL GEÇERLİLİK- test görevlerinin yazarın bu özellikler kavramına uygunluğunun bir ölçüsü olarak, yazarın teşhis edilen özelliklerin özelliklerine ilişkin fikirlerine uygunluk konumunun gerekçesi olarak anlaşılmaktadır.

KRİTER GEÇERLİLİK(kriter geçerliliği) - Test sonuçları ile ampirik bir kriter arasındaki korelasyonun mantığı olarak anlaşılır. Bir testin bu kritere göre olası geçerliliği, testin bu kriterle olan korelasyonu ile gösterilir; Korelasyon katsayısı ne kadar yüksek olursa geçerlilik de o kadar yüksek olur. Faktör analizinin gelişmesi, belirlenen faktöre ilişkin geçerliliği olan testlerin oluşturulmasını mümkün kılmıştır.

GEÇERLİLİK TEORİK(yapıcı geçerlilik, kavramsal geçerlilik) - psikodiagnostik yöntemlerle ilgili olarak, bu yöntem kullanılarak gerçekleştirilen psikodiagnostik sonuçlarının, değerlendirilen mülkle teorik olarak ilişkili olan psikolojik niteliklerin göstergelerine karşılık geldiği anlamına gelir. Bu yöntemle elde edilen kalite göstergelerinin, diğer yöntemlerle elde edilen göstergelere - teorik olarak haklı bağımlılıklarıyla - uygunluğu ile belirlenir. Dolayısıyla, eğer bir teknik başarı güdüsünün gelişim düzeyini değiştiriyorsa, o zaman elde edilen göstergelerin benlik saygısı, kaygı ve teorik olarak başarı motivasyonuyla ilişkilendirilen istek düzeyine ilişkin verilerle güvenilir bir şekilde ilişkili olması durumunda teorik olarak geçerli olacaktır.

GEÇERLİLİK DENEYSEL(pratik geçerlilik) - psikodiagnostik yöntemlerle ilgili olarak, bu yöntem kullanılarak gerçekleştirilen psikodiagnostik sonuçlarının, kişinin deneyimine, gerçek davranışına ve konunun gözlemlenen eylemlerine ve tepkilerine karşılık geldiği anlamına gelir. Göstergelerini gerçek hayattaki davranışlarla veya insanların pratik faaliyetlerinin sonuçlarıyla karşılaştırarak belirlenir. Dolayısıyla, belirli bir deneğin karakter özellikleri değerlendirilirse, o zaman kullanılan teknik, deneğin yaşamda tam olarak tekniğin öngördüğü gibi davrandığı tespit edildiğinde ampirik olarak geçerli kabul edilir.

(Golovin S.Yu. Pratik psikolog sözlüğü - Minsk, 1998)

TEST GEÇERLİLİK(İngilizce) geçerlilikile ilgilitest) - İyi kalitenin en önemli kriteri test, incelenen mülkün ölçüm doğruluğunun karakterize edilmesi; Testin incelenen probleme uygunluğunun değerlendirilmesi. V. t., sonuçlarının ölçülen özelliğin diğer kriterleri ile korelasyonu ile belirlenir (örneğin, V. t. yetenekleri, test sonuçlarının ilgili aktiviteyi gerçekleştirme başarısı ile korelasyonu ile belirlenir). V. t'yi kontrol etmek denir. doğrulama(doğrulama). Farklı doğrulama türlerine ve V.t.'ye izin verilir: 1) maddi ( içerik); 2) kritere göre (ampirik; kriter-ilgili): 3) kavramsal (yapıcı; inşa etmek); 4) ayırıcı ( ayrımcı) vb. Bkz. Psikodiagnostik,Psikolojik teşhis. (V.I. Lubovsky.)

(Zinchenko V.P., Meshcheryakov B.G. Büyük psikolojik sözlük - 3. baskı, 2002)

Psikodiagnostik tekniklerin pratik amaçlarla kullanılmadan önce, yüksek kalite ve etkililiğini kanıtlayan bir dizi resmi kritere göre test edilmesi gerekir.

Psikodiagnostik teknikleri değerlendirmenin ana kriterleri güvenilirlik ve geçerliliği içerir. Bu kavramların geliştirilmesine yabancı psikologların büyük katkısı olmuştur (A. Anastasi, E. Ghiselli, J. Guilford, L. Cronbach, R. Thorndike ve E. Hagen, vb.). Yöntemlerin belirtilen kriterlere uygunluk derecesini doğrulamak için hem resmi mantıksal hem de matematiksel-istatistiksel aygıtlar (öncelikle korelasyon yöntemi ve faktör analizi) geliştirdiler.

Geçerlilik- Bu Bir yandan tekniğin ne için oluşturulduğunu ölçmeye uygun olup olmadığına ilişkin bilgileri, diğer yandan etkinliğinin, verimliliğinin ve pratik kullanışlılığının ne olduğuna ilişkin bilgileri içeren kapsamlı bir özellik.

Geçerlilik- Bir tekniğin ölçmeyi amaçladığı şeyi ne ölçüde ölçtüğü. Geçerlilik düzeyine geçerlilik katsayısı denir. Sistematik faktörler test geçerliliğini etkiler. Sonuçlara çarpıtmalar katıyorlar. Bu faktörler, testin hedeflediği özelliğin test sonuçlarında kendini göstermesini engelleyen diğer zihinsel özelliklerdir.

Örneğin, "öğrenme potansiyelini" ölçmek istiyoruz, ancak deneğe katı bir zaman sınırı olan ve geri dönüp bir hatayı düzeltme fırsatı olmayan bir test veriyoruz. Bu bağlamda, istenen zihinsel özelliğin başka bir özellik olan "stres direnci" ile karıştırıldığı ortaya çıkıyor: strese karşı direnci yüksek olan denekler testi daha iyi performans gösterecek. Bu, sistematik çarpıtmanın etkisini ortaya çıkaracaktır.

Geçerlilik ilk anlamıyla metodolojinin kendisiyle ilgilidir, yani ölçme aracının geçerliliğidir. Bu çeke denir teorik doğrulama.İkinci anlayışta geçerlilik, metodolojiden çok kullanım amacına ilişkindir. Bu pragmatik doğrulamadır.

Modern psikometride, testlerin geçerliliğini test etmek için kelimenin tam anlamıyla düzinelerce farklı teorik ve deneysel yöntem geliştirilmiştir. Bu yöntemlerin neredeyse tamamının ana unsuru “kriter” olarak adlandırılan kriterdir. Geçerlilik kriteriÖlçülen zihinsel özellik hakkında testin dışında, testten bağımsız bir bilgi kaynağıdır. Bir testin sonuçlarını, ölçülen özellik hakkındaki doğru (veya en azından açıkça geçerli) bir bilgi kaynağıyla - bir kriterle - karşılaştırıncaya kadar, testin geçerliliğine karar veremeyiz.

Uygulamada, çoğunlukla pragmatik kriterler bir geçerlilik kriteri olarak kullanılır; bu, üzerinde çalıştığımız kalite ne olursa olsun konunun sergilediği açık bir işarettir. Örneğin, hangi testin yapıldığını tahmin etmek amacıyla faaliyetin etkililiğine ilişkin göstergeler. Veya çeşitli görevlerin performansına, kontrol testlerine ve ayrıca geçerliliği kanıtlanmış diğer yöntemler kullanılarak elde edilen verilere ilişkin veriler. Bir tekniğin kriterleri olduğu kadar geçerliliği de vardır.

Teorik geçerlilik oluşturulan metodoloji kullanılarak elde edilen incelenen niteliklerin göstergelerinin, diğer yöntemler kullanılarak elde edilen göstergelerin veya halihazırda teorik gerekçelerin bulunduğu göstergelerle yazışmasıyla belirlenir. Farklı yöntemlerle ölçülen aynı özelliğin ilişkilendirilmesiyle test edilir.

Teorik geçerlilik çerçevesinde aşağıdakiler ayırt edilir:

- Yakınsak geçerlilik. En uygun durum, psikolojinin halihazırda üzerinde çalıştığınız kaliteyi test eden geçerli bir metodolojiye sahip olması durumunda ortaya çıkar. Bu durumda bu yöntemlerin göstergeleri arasındaki yüksek korelasyon, yeni yöntemin eskisine göre yakınsak geçerliliğe sahip olduğunu göstermektedir.

- Yapı geçerliliği. Çoğu durumda, belirli bir özelliği ölçmek için geçerliliği bilinen geçerli bir test yoktur. Bu durumda araştırmacı, yeni testin diğer testlerle nasıl korelasyon kuracağına dair bir dizi hipotez oluşturur. Bu hipotezler, ölçülen özellik hakkındaki teorik fikirlere dayanarak ileri sürülmektedir. Onayları önerilen yapının geçerliliğini gösterir; Yapı geçerliliği (veya algılanan geçerlilik).

Ampirik geçerlilik– teşhis tekniğinin göstergelerinin, deneğin gerçek davranışına, gözlemlenen eylemlerine ve tepkilerine uygunluğu ile kontrol edilir; Araştırma sonuçlarına göre müşterinin gerçek hayatta ne kadar davrandığına bakıyoruz.

İç geçerlilik– bireysel görevlerin içeriğinin, alt testlerin ve planın genel amacına ilişkin yargıların metodolojisindeki ilişki. Bir yöntemin tüm bölümleri amacın gerektirdiği kaliteyi ölçemediğinde, yöntemin dahili olarak geçerli olmadığı kabul edilir. İç geçerlilik, metodolojinin görevlerinin iç tutarlılığıdır.

Ayrıca var yanlış geçerlilik– Tekniğin uygunluğunun görünümünü yakalar.

Görünür geçerlilik– bazen gerçek hayattaki gerçekleri ve kalıpları gerçekten araştırır, ancak yalnızca didaktik testlerde (örneğin, eğitimsel başarı testleri) gerçek olana karşılık gelir.

Deneyimden geçerlilik– psikoloğun bu tekniğin herhangi bir kaliteyi ölçmek için uygun olduğuna dair kişisel hissine dayanmaktadır, çünkü iyi bir teoriye dayanır veya iyi sonuçlar üretir.

Arzuya dayalı geçerlilik– kişinin kendi metodolojisini geçerli ve iyi görme arzusuna dayanır ancak bununla çelişen bariz gerçekleri fark etmez.

Didaktik olanlar dışındaki tüm test yöntemlerinin geçerliliği psikometrik yöntemler kullanılarak ölçülmelidir. Geçerliliği hesaplamak için kaç konu olmalıdır? Uygulamaya göre 50'den az olmamalı, en iyisi 200'den fazla olmalıdır. Sık sık şu soru ortaya çıkar: Kabul edilebilir sayılması için geçerlilik katsayısının değeri ne olmalıdır? Geçerlilik katsayısının istatistiksel olarak anlamlı olması yeterlidir. Yaklaşık 0,20-0,30 arası bir geçerlilik katsayısı düşük, 0,30-0,50 arası ortalama ve 0,60'ın üstü yüksek olarak kabul edilir.

Bilet numarası 9

Motivasyon anketleri ve özellikleri.

Motif anketleri, bireyin motivasyonel ihtiyaç alanını teşhis etmek için tasarlanmış, bireyin faaliyetinin neyi hedeflediğini belirlemeye olanak tanıyan bir anket grubudur (davranış yönünün seçimini belirleyen nedenler olarak motivasyonlar). Ayrıca davranış dinamiklerinin nasıl düzenlendiği sorusu da büyük önem taşıyor. Bu durumda genellikle tutumları ölçmeye başvururlar. Psikodiagnostikte motivasyon anketlerinin geliştirilmesi, büyük ölçüde, tutumsal bir yapıya sahip olan ve kişilik anketleri kullanılarak elde edilen verilerin güvenilirliğini azaltan “sosyal istenirlik” faktörünün etkisini değerlendirme ihtiyacıyla ilgilidir. En ünlü güdü anketleri arasında, G. Murray tarafından tematik algılama testi için önerilen listeden ödünç alınan, ihtiyaçların "gücünü" ölçmek için tasarlanan, A. Edwards (1954) tarafından geliştirilen "Kişisel Tercihler Listesi" yer alır. Bu ihtiyaçlar, örneğin başarı, saygı, liderlik vb. ihtiyaçları içerir. Her ihtiyacın "gücü" mutlak değerlerle değil, diğer ihtiyaçların "gücüne" göre ifade edilir; kişisel göstergeler kullanılmaktadır. “Sosyal istenirlik” faktörünün rolünü incelemek için A. Edwards (1957) özel bir anket önerdi. Diğer güdü anketleri de yaygın olarak kullanılmaktadır; örneğin, D. Jackson'ın (1967) “Kişilik Araştırma Formu”, A. Mehrabyan'ın (1970) anketleri vb.

Geçerlilik sorununun yakın zamana kadar en zor konulardan biri gibi göründüğünü belirtmek gerekir. Bu kavramın en köklü tanımı A. Anastasi'nin kitabında şu şekilde verilmiştir: "Test geçerliliği, testin neyi ölçtüğünü ve bunu ne kadar iyi yaptığını bize anlatan bir kavramdır."

Özetlemek gerekirse şunları söyleyebiliriz:

Teorik doğrulama sırasında araştırmacı, teknikle ölçülen özelliğin kendisiyle ilgilenir. Bu aslında psikolojik doğrulamanın kendisinin gerçekleştirildiği anlamına gelir;

pragmatik doğrulama ile ölçüm konusunun özü (psikolojik özellik) gözden kaybolur. Temel vurgu, bir teknikle ölçülen bir şeyin belirli uygulama alanlarıyla ilişkisinin kanıtlanmasıdır.

Teorik geçerliliği belirlemek için metodolojinin dışında kalan herhangi bir bağımsız kriteri bulmak çok daha zordur. Bu nedenle, testolojinin gelişiminin ilk aşamalarında, geçerlilik kavramı henüz şekillenmeye başladığında, testin şunları ölçtüğüne dair sezgisel bir fikir vardı:

1) Tekniğin ölçtüğü şey açıkça ortada olduğundan geçerli olarak adlandırıldı;

2) geçerliliğin kanıtı, araştırmacının yönteminin konuyu anlamasına izin verdiğine olan güvenine dayanıyordu;

3) tekniğin geçerli olduğu kabul edildi (yani, şu veya bu testin şu veya bu kaliteyi ölçtüğü ifadesi kabul edildi), çünkü tekniğin dayandığı teori çok iyi idi.

Yani örneğin çocukların zihinsel gelişimini teşhis etmek için bir test geliştirildiyse, bu testin diğer bazı özellikleri (örneğin kişilik, karakter vb.) değil de gerçekten bu gelişimi ölçüp ölçmediğini analiz etmek gerekir. Dolayısıyla teorik doğrulama için temel sorun, psikolojik fenomenler ile bu psikolojik fenomenlerin bilinmeye çalışıldığı göstergeler arasındaki ilişkidir. Bu, yazarın niyetleri ile metodolojinin sonuçlarının ne kadar örtüştüğünü gösterir.

Belirli bir özelliği ölçmek için geçerliliği kanıtlanmış bir teknik zaten mevcutsa, yeni bir tekniğin teorik doğrulamasını gerçekleştirmek o kadar da zor değildir. Yeni ve daha önce test edilmiş benzer bir yöntem arasında bir korelasyonun varlığı, geliştirilen yöntemin referans yöntemle aynı psikolojik kaliteyi ölçtüğünü gösterir. Ve eğer yeni yöntem aynı zamanda sonuçların gerçekleştirilmesinde ve işlenmesinde daha kompakt ve ekonomik olursa, psikoteşhis uzmanları eski araç yerine yeni bir araç kullanma fırsatına sahip olur.

Ancak teorik geçerlilik yalnızca ilgili göstergelerle karşılaştırılarak değil, aynı zamanda hipoteze dayalı olarak anlamlı bağlantıların olmaması gereken göstergelerle de kanıtlanır. Bu nedenle, teorik geçerliliği kontrol etmek için, bir yandan ilgili teknikle bağlantının derecesini (yakınsak geçerlilik) ve farklı bir teorik temele sahip tekniklerle bu bağlantının yokluğunu (ayırt edici geçerlilik) belirlemek önemlidir.

Böyle bir doğrulama yönteminin imkansız olduğu durumlarda, bir yöntemin teorik doğrulamasını gerçekleştirmek çok daha zordur. Çoğu zaman bu, bir araştırmacının karşılaştığı durumdur. Bu gibi durumlarda, yalnızca incelenen mülkle ilgili çeşitli bilgilerin kademeli olarak birikmesi, teorik öncüllerin ve deneysel verilerin analizi ve teknikle çalışmadaki önemli deneyim, psikolojik anlamını ortaya çıkarmayı mümkün kılar.

Teorik geçerliliğin kanıtlanması durumunda elde edilen göstergelerin yorumunun daha net ve net hale geleceğini ve tekniğin adının uygulama kapsamına karşılık geldiğini unutmamak önemlidir. Pragmatik doğrulamaya gelince, bir tekniğin pratik etkinliği, önemi ve kullanışlılığı açısından test edilmesini içerir, çünkü bir teşhis tekniğini kullanmak yalnızca ölçülen özelliğin belirli yaşam koşullarında ortaya çıktığı kanıtlandığında mantıklı olur. , belirli türdeki faaliyetlerde. Özellikle seçim sorununun ortaya çıktığı yerlerde buna büyük önem verilmektedir.

Tekrar testolojinin gelişim tarihine dönersek, testlerin bilimsel içeriğinin ve teorik bagajlarının daha az ilgi çekici olduğu bir dönemi (20. yüzyılın 20-30'ları) vurgulayabiliriz. Testin işe yaraması ve en hazırlıklı kişilerin hızla seçilmesine yardımcı olması önemliydi. Test görevlerini değerlendirmeye yönelik ampirik kriter, bilimsel ve uygulamalı sorunların çözümünde tek doğru kılavuz olarak kabul edildi.

Test geçerliliği sorununa yönelik bu yaklaşım 50'li yılların başlarına kadar tipikti. XX yüzyıl sadece ABD'de değil, diğer ülkelerde de. Ampirik doğrulama yöntemlerinin teorik zayıflığı, testlerin geliştirilmesinde yalnızca çıplak ampiriklere ve uygulamaya değil, aynı zamanda teorik bir kavrama da güvenilmesi çağrısında bulunan bilim adamlarının eleştirilerine yol açmaktan başka bir şey yapamazdı. Bildiğimiz gibi teorisiz pratik kördür, pratiksiz teori ise ölüdür. Şu anda, yöntemlerin geçerliliğinin teorik ve pratik değerlendirmesi en verimli olarak algılanmaktadır.

Bir tekniğin pragmatik doğrulamasını yapmak, yani etkinliğini, verimliliğini ve pratik önemini değerlendirmek için genellikle bağımsız bir dış kriter kullanılır - incelenen özelliğin günlük yaşamdaki tezahürünün bir göstergesi. Böyle bir kriter, akademik performans (öğrenme yetenekleri testleri, başarı testleri, zeka testleri için) ve üretim başarıları (profesyonel odaklı yöntemler için) ve gerçek aktivitelerin etkinliği - çizim, modelleme vb. (özel testler için) olabilir. yetenekler), öznel değerlendirmeler (kişilik testleri için).

Amerikalı araştırmacılar D. Tiffin ve E. McCormick, geçerliliği kanıtlamak için kullanılan dış kriterleri analiz ettikten sonra dört türü tanımladılar [her biri 31 adet]:

1) performans kriterleri (bunlar tamamlanan işin miktarı, akademik performans, eğitime harcanan süre, niteliklerin büyüme oranı vb. içerebilir);

4) kaza kriterleri (araştırmanın amacı, örneğin kazalara daha az duyarlı kişilerin iş için seçilmesi sorunuyla ilgili olduğunda uygulanır).

Dış kriterin üç temel gereksinimi karşılaması gerekir:

alakalı olmalı;

müdahaleden arınmış;

güvenilir.

Uygunluk, bir teşhis aracının bağımsız bir hayati kritere anlamsal olarak uygunluğunu ifade eder. Başka bir deyişle, kriterin tam olarak bireysel ruhun teşhis tekniğiyle ölçülen özelliklerini içerdiğine dair güven olmalıdır. Dış kriter ve teşhis tekniği birbiriyle iç anlamsal uyum içinde olmalı ve psikolojik özünde niteliksel olarak homojen olmalıdır. Örneğin, bir test düşünmenin bireysel özelliklerini, belirli nesneler ve kavramlarla mantıksal eylemler gerçekleştirme yeteneğini ölçerse, o zaman kriter aynı zamanda tam olarak bu becerilerin tezahürünü de aramalıdır. Bu aynı şekilde mesleki faaliyetler için de geçerlidir. Bir değil, her biri spesifik olan ve uygulama için kendi koşullarını dayatan birkaç amaç ve hedefi vardır. Bu, mesleki faaliyetlerin gerçekleştirilmesine yönelik çeşitli kriterlerin varlığını ima eder. Bu nedenle teşhis tekniklerindeki başarı genel olarak üretim verimliliği ile karşılaştırılmamalıdır. Gerçekleştirilen operasyonların niteliğine göre metodoloji ile ilişkilendirilen bir kriterin bulunması gerekmektedir.

Müdahaleden korunma gereklilikleri, örneğin eğitimsel veya endüstriyel başarının iki değişkene bağlı olmasından kaynaklanmaktadır: kişinin kendisine, yöntemlerle ölçülen bireysel özelliklerine ve duruma, çalışma ve çalışma koşullarına bağlıdır. girişime neden olur ve uygulanan kriteri “kirletir”. Bunu bir dereceye kadar önlemek için, araştırma için aşağı yukarı aynı koşullarda olan insan gruplarının seçilmesi gerekir. Başka bir yöntem kullanılabilir. Parazit etkisinin düzeltilmesinden oluşur. Bu ayarlama genellikle doğası gereği istatistikseldir. Bu nedenle, örneğin üretkenlik mutlak anlamda değil, benzer koşullar altında çalışan işçilerin ortalama üretkenliğiyle ilişkili olarak alınmalıdır.

Yeterli ve kolayca belirlenebilen bir kriterin araştırılması çok önemli ve karmaşık bir doğrulama görevidir. Batı testlerinde birçok yöntem, yalnızca onları test etmek için uygun bir kriter bulmak mümkün olmadığı için diskalifiye edilir. Örneğin çoğu anketin geçerlilik verileri şüphelidir çünkü ölçtükleri şeye karşılık gelen yeterli bir dış kriter bulmak zordur.

Yöntemlerin geçerliliğinin değerlendirilmesi niceliksel ve niteliksel olabilir.

Nicel bir göstergeyi - geçerlilik katsayısını - hesaplamak için, teşhis tekniği uygulanırken elde edilen sonuçlar, aynı kişiler için harici bir kriter kullanılarak elde edilen verilerle karşılaştırılır. Farklı doğrusal korelasyon türleri kullanılır (Spearman'a göre, Pearson'a göre).

Geçerliliği hesaplamak için kaç denek gereklidir?

Uygulama, 50'den az olmaması gerektiğini, ancak 200'den fazlasının en iyisi olduğunu göstermiştir. Sık sık şu soru ortaya çıkar: Kabul edilebilir sayılması için geçerlilik katsayısının değeri ne olmalıdır? Genel olarak geçerlik katsayısının istatistiksel olarak anlamlı olmasının yeterli olduğu belirtilmektedir. Yaklaşık 0,20-0,30'luk bir geçerlilik katsayısı düşük, ortalama - 0,30-0,50 ve yüksek - 0,60'ın üzerinde kabul edilir.

Ancak A. Anastasi, K. M. Gurevich ve diğerlerinin vurguladığı gibi, geçerlilik katsayısını hesaplamak için doğrusal korelasyonu kullanmak her zaman meşru değildir. Bu teknik, yalnızca bazı faaliyetlerdeki başarının, teşhis testinin gerçekleştirilmesindeki başarıyla doğru orantılı olduğu kanıtlandığında haklı çıkar. Yabancı testologların, özellikle de mesleki uygunluk ve seçimle ilgilenenlerin konumu, çoğu zaman, testte daha fazla görevi tamamlayan kişinin mesleğe daha uygun olduğunun koşulsuz olarak tanınmasına indirgenmektedir. Ancak bir aktivitede başarılı olmak için test çözümünün %40'ı düzeyinde bir özelliğe sahip olmanız da gerekebilir. Sınavda daha fazla başarı elde etmenin artık meslek açısından hiçbir önemi yoktur. K. M. Gurevich'in monografisinden açık bir örnek: Bir postacı okuyabilmelidir, ancak normal hızda mı yoksa çok yüksek hızda mı okuduğu - bunun artık profesyonel bir önemi yoktur. Yöntem göstergeleri ile dış kriter arasında böyle bir korelasyon varken, geçerliliği sağlamanın en yeterli yolu fark kriteri olabilir.

Geçerlilik türleri

Bir metodolojinin geçerliliğinin kontrol edilmesine doğrulama denir.

4 tür dış kriter:

performans kriterleri (bunlar tamamlanan işin miktarı, akademik performans, eğitime harcanan süre, niteliklerin büyüme oranı vb. içerebilir);

öznel kriterler (bir kişinin bir şeye veya birine karşı tutumunu, fikrini, görüşlerini, tercihlerini yansıtan çeşitli yanıt türlerini içerir; genellikle öznel kriterler röportajlar, anketler, anketler kullanılarak elde edilir);

fizyolojik kriterler (çevrenin ve diğer durumsal değişkenlerin insan vücudu ve ruhu üzerindeki etkisini incelemek için kullanılırlar; nabız hızı, kan basıncı, cildin elektriksel direnci, yorgunluk belirtileri vb. ölçülür);

kaza kriterleri (araştırmanın amacı, örneğin kazalara daha az duyarlı kişilerin iş için seçilmesi sorunuyla ilgili olduğunda kullanılır).

Ampirik geçerlilik.

İçerik geçerliliği durumunda, test (test öğelerinin ölçüm konusunun içeriğine uygunluğunu belirleyen) uzmanların pahasına değerlendirilirse, ampirik geçerlilik her zaman istatistiksel korelasyon kullanılarak ölçülür: ikinin korelasyonu değerler dizisi hesaplanır - testteki puanlar ve geçerlilik kriteri olarak seçilen dış parametredeki göstergeler.

Yapı geçerliliği.

Yapı geçerliliği teorik yapının kendisine atıfta bulunur ve sınava girme davranışını açıklayan faktörlerin araştırılmasını içerir. Özel bir tür olarak yapı geçerliliği Cronbach ve Meehl (1955) tarafından yazılan bir makalede kanonize edilmiştir. Yazarlar, doğrudan bazı ilgili kriterleri öngörmeyi amaçlamayan tüm test çalışmalarını bu tür bir geçerliliği kullanarak değerlendirdiler. Çalışma psikolojik yapılara ilişkin bilgiler içeriyordu.

İçerik geçerliliği.

İçerik geçerliliği, belirli bir alana ait olan her öğenin, görevin veya sorunun bir testte test edilme şansının eşit olmasını gerektirir. İçerik geçerliliği, test içeriğinin (görevler, sorular) ölçülen davranış alanıyla tutarlılığını değerlendirir. İki geliştirme ekibi tarafından derlenen testler, bir denek örneği üzerinde gerçekleştirilir. Testin güvenilirliği, maddelerin iki parçaya bölünmesiyle hesaplanır ve sonuç olarak bir içerik geçerlilik indeksi elde edilir.

"Tahmini" geçerlilik.

"Tahminsel" geçerlilik de oldukça güvenilir bir dış kriter tarafından belirlenir, ancak bununla ilgili bilgiler testten bir süre sonra toplanır. Dış kriter genellikle bir kişinin, teşhis testlerinin sonuçlarına göre seçildiği faaliyet türü için bir tür değerlendirmede ifade edilen yeteneğidir. Bu teknik, teşhis tekniklerinin görevi olan gelecekteki başarıyı tahmin etme göreviyle en tutarlı olmasına rağmen, uygulanması çok zordur. Tahminin doğruluğu, bu tahmin için belirlenen zamanla ters orantılıdır. Ölçümden sonra ne kadar çok zaman geçerse, tekniğin prognostik önemini değerlendirirken dikkate alınması gereken faktörlerin sayısı da o kadar artar. Ancak tahmini etkileyen tüm faktörleri hesaba katmak neredeyse imkansızdır.

"Geçmişe dönük" geçerlilik.

Geçmişteki olayları veya kalite durumunu yansıtan bir kritere göre belirlenir. Tekniğin öngörü yetenekleri hakkında hızlı bir şekilde bilgi edinmek için kullanılabilir. Böylece, iyi yetenek testi sonuçlarının hızlı öğrenmeye ne ölçüde karşılık geldiğini kontrol etmek için geçmiş performans değerlendirmeleri, geçmiş uzman görüşleri vb. karşılaştırılabilir. yüksek ve düşük akım tanı göstergeleri olan bireylerde.

Yakınsak ve ayırt edici geçerlilik.

Teste belirli maddeleri dahil etme stratejisi, psikoloğun tanısal yapıyı nasıl tanımladığına bağlıdır. Eğer Eysenck "nevrotiklik" özelliğini dışadönüklük-içe dönüklükten bağımsız olarak tanımlıyorsa, bu, anketinin nevrotik içedönüklerin ve nevrotik dışadönüklerin aynı fikirde olacağı yaklaşık olarak eşit maddeler içermesi gerektiği anlamına gelir. Pratikte testte “Nevrotiklik-İçe Dönüklük” çeyreğindeki maddelerin hakim olacağı ortaya çıkarsa, o zaman Eysenck'in teorisi açısından bu, “nevrotiklik” faktörünün alakasız bir faktörle yüklü olduğu anlamına gelir. faktör - “içe dönüklük”. (Örneklem çarpık hale gelirse, nevrotik içedönükler nevrotik dışadönüklerden daha fazlaysa, tam olarak aynı etki ortaya çıkar.)

Bu tür zorluklardan kaçınmak için psikologlar, yalnızca tek bir faktörü açıkça bildiren ampirik göstergelerle (maddelerle) uğraşmak isterler. Ancak bu gereklilik aslında hiçbir zaman karşılanmıyor: Her ampirik göstergenin yalnızca ihtiyacımız olan faktör tarafından değil, aynı zamanda ölçüm göreviyle ilgisi olmayan başkaları tarafından da belirlendiği ortaya çıkıyor.

Bu nedenle, kavramsal olarak ölçülen şeye dik olarak tanımlanan (tüm kombinasyonlarda meydana gelen) faktörler için, test yazarının öğeleri seçerken yapay bir dengeleme stratejisi kullanması gerekir.

Maddelerin ölçülen faktöre uygunluğu testin yakınsak geçerliliğini sağlar. Maddelerin ilgisiz faktörlere göre dengelenmesi, ayırt edici geçerliliği sağlar. Ampirik olarak, kavramsal olarak bağımsız bir özelliği ölçen bir testle anlamlı bir korelasyonun yokluğunda ifade edilir.

Geçerlilik türleri

Tanı tekniklerinin özelliklerine ve dış kriterin geçici durumuna bağlı olarak çeşitli geçerlilik türleri vardır (A Anastasi, 1982; L.F. Burlachuk, S.M. Morozov, 1989; KM. Gurevich, 1970; B.V. Kulagin, 1984; Cherny'de, 1983; “Genel psikodiagnostik”, 1987, vb.) en çok aşağıdakilere denir:

1. İçerik geçerliliği. Bu teknik öncelikle başarı testlerinde kullanılır. Tipik olarak, başarı testleri öğrencilerin kapsadığı tüm materyalleri içermez, ancak bunların küçük bir kısmını (3-4 soru) içerir. Bu birkaç soruya verilen doğru yanıtların tüm materyale hakim olduğunuzu gösterdiğinden emin olabilir misiniz? İçerik geçerliliği testinin cevaplaması gereken şey budur. Bunu yapmak için, testteki başarının öğretmenlerin uzman değerlendirmeleriyle (bu materyale dayanarak) karşılaştırılması yapılır. İçerik geçerliliği aynı zamanda ölçüt referanslı testler için de geçerlidir. Bu tekniğe bazen mantıksal geçerlilik denir.

2. Eşzamanlı geçerlilik veya sürekli geçerlilik, test edilen prosedürün deneyleriyle eş zamanlı olarak bilgilerin toplandığı harici bir kriter tarafından belirlenir. Başka bir deyişle, test dönemindeki mevcut performans, aynı dönemdeki performans vb. ile ilgili veriler toplanır. Testteki başarı sonuçları bununla ilişkilendirilir.

3. “Tahmin edici” geçerlilik (başka bir adı da “tahmin edici” geçerliliktir). Aynı zamanda oldukça güvenilir bir dış kriter tarafından da belirlenir, ancak bununla ilgili bilgiler testten bir süre sonra toplanır. Dış kriter genellikle bir kişinin, teşhis testlerinin sonuçlarına göre seçildiği faaliyet türü için bir tür değerlendirmede ifade edilen yeteneğidir. Bu teknik, teşhis tekniklerinin görevi olan gelecekteki başarıyı tahmin etme göreviyle en tutarlı olmasına rağmen, uygulanması çok zordur. Tahminin doğruluğu, bu tahmin için belirlenen zamanla ters orantılıdır. Ölçümden sonra ne kadar çok zaman geçerse, tekniğin prognostik önemini değerlendirirken dikkate alınması gereken faktörlerin sayısı da o kadar artar. Ancak tahmini etkileyen tüm faktörleri hesaba katmak neredeyse imkansızdır.

4. "Geçmişe dönük" geçerlilik. Geçmişteki olayları veya kalite durumunu yansıtan bir kritere göre belirlenir. Tekniğin öngörü yetenekleri hakkında hızlı bir şekilde bilgi edinmek için kullanılabilir. Böylece, iyi yetenek testi sonuçlarının hızlı öğrenmeye ne ölçüde karşılık geldiğini kontrol etmek için geçmiş performans değerlendirmeleri, geçmiş uzman görüşleri vb. karşılaştırılabilir. yüksek ve düşük akım tanı göstergeleri olan bireylerde.

Korelasyon

Korelasyon (korelasyon bağımlılığı), iki veya daha fazla rastgele değişken (veya kabul edilebilir bir doğruluk derecesine sahip olarak kabul edilebilecek değerler) arasındaki istatistiksel bir ilişkidir. Bu durumda bu niceliklerden bir veya birkaçının değerindeki değişiklikler, diğer veya başka niceliklerin değerlerinde sistematik bir değişikliğe yol açar. İki rastgele değişkenin korelasyonunun matematiksel bir ölçüsü, korelasyon oranı veya korelasyon katsayısıdır (veya). Bir rastgele değişkendeki değişiklik başka bir rastgele değişkende doğal bir değişikliğe yol açmıyorsa ancak bu rastgele değişkenin başka bir istatistiksel özelliğinde bir değişikliğe yol açıyorsa, bu durumda böyle bir ilişki istatistiksel olmasına rağmen korelasyonel olarak kabul edilmez.

Korelasyon terimi ilk kez 18. yüzyılda Fransız paleontolog Georges Cuvier tarafından bilimsel kullanıma kazandırılmıştır. Canlıların parçalarının ve organlarının “korelasyon yasasını” geliştirdi; bunun yardımıyla fosil bir hayvanın görünümünü eski haline getirmenin mümkün olduğu, kalıntılarının yalnızca bir kısmını elinde bulundurdu. Korelasyon sözcüğü istatistikte ilk kez 19. yüzyılın sonlarında İngiliz biyolog ve istatistikçi Francis Galton tarafından kullanıldı.

Bazı korelasyon katsayıları pozitif veya negatif olabilir (örneğin, bağımsız rastgele değişkenler için istatistiksel bir ilişkinin olmaması da mümkündür). Değişkenlerin değerleri üzerinde sıkı bir sıra ilişkisinin belirtildiği varsayılırsa, negatif korelasyon, bir değişkendeki artışın başka bir değişkendeki azalmayla ilişkili olduğu ve korelasyon katsayısının negatif olabileceği bir korelasyondur. ; bu gibi durumlarda pozitif bir korelasyon, bir değişkendeki artışın başka bir değişkendeki artışla ilişkili olduğu bir korelasyondur ve korelasyon katsayısı pozitif olabilir.