Skala pengukur dan penilaian. Skala sisihan piawai


Keputusan ujian skala

Stevens (1946) mendefinisikan 4 peringkat skala pengukuran, berbeza dalam tahap di mana penarafannya mengekalkan sifat set nombor nyata. Ini adalah skala:

Nominal (atau nominatif, skala penamaan)

Ordinal

Selang waktu

Skala perhubungan.

Tafsiran keputusan ujian

Dalam ujian dengan tafsiran berorientasikan normatif Tugas utama adalah untuk menentukan tempat perbandingan setiap peserta ujian dalam kumpulan umum peserta ujian. Jelas sekali, tempat setiap mata pelajaran bergantung pada latar belakang kumpulan mana dia dinilai. Keputusan yang sama boleh diklasifikasikan sebagai agak tinggi jika kumpulan itu lemah, dan agak rendah jika kumpulan itu kuat. Itulah sebabnya adalah perlu, apabila boleh, untuk menggunakan piawaian yang mencerminkan keputusan ujian sampel mewakili subjek yang besar.

Dalam ujian dengan tafsiran berorientasikan kriteria tugasnya adalah untuk membandingkan pencapaian pendidikan setiap pelajar dengan jumlah pengetahuan, kemahiran dan kebolehan yang dirancang untuk pemerolehan. Dalam kes ini, kawasan kandungan tertentu digunakan sebagai rangka rujukan tafsiran, bukannya sampel subjek tertentu. Masalah utama ialah mewujudkan skor lulus yang memisahkan mereka yang telah menguasai bahan yang diuji daripada mereka yang belum.

Mewujudkan piawaian prestasi ujian

Untuk menghapuskan pergantungan tafsiran pada keputusan peserta ujian lain, norma prestasi ujian khas digunakan, dan dengan itu skor utama seorang pengambil ujian individu dibandingkan dengan norma prestasi ujian. Norma – ini adalah satu set penunjuk yang ditubuhkan secara empirikal berdasarkan keputusan ujian yang dilakukan oleh sampel subjek yang jelas. Pembangunan dan prosedur untuk mendapatkan penunjuk ini merupakan proses catuan(atau penyeragaman) ujian. Norma yang paling biasa ialah min dan sisihan piawai bagi berbilang skor individu. Mengaitkan skor utama subjek dengan standard prestasi membolehkan kami menetapkan tempat subjek dalam sampel yang digunakan untuk menyeragamkan ujian.

Jenis skala yang digunakan untuk menukar skor mentah

Penukaran skor utama yang paling terkenal ialah:

Kedudukan peratusan, mencerminkan peratusan subjek dalam kumpulan normatif yang keputusannya lebih rendah daripada atau sama dengan nilai tertentu bagi skor utama;

Linear Z-skor, ditakrifkan sebagai nisbah sisihan individu skor ujian kepada sisihan piawai untuk kumpulan subjek;

Anggaran yang merupakan penjelmaan linear z-skor (skala T, skor IQ standard, dll.);

Skala stanine dan sten, yang diperoleh dengan membahagikan skala titik primer kepada pelbagai selang.

Skala pangkat peratusan

Persentil memungkinkan untuk menetapkan pangkat penunjuk utama subjek dalam kumpulan normatif. Kedudukan persentil yang sepadan dengan skor utama yang diberikan menunjukkan peratusan subjek dalam sampel normatif yang keputusannya tidak lebih tinggi daripada skor utama ini.

Persentil tidak boleh dikelirukan dengan peratusan yang mewakili peratusan item yang disiapkan dengan betul oleh peserta ujian dalam kumpulan. Berbeza dengan yang terakhir - primer - persentil ialah penunjuk terbitan, menunjukkan perkadaran jumlah bilangan subjek dalam kumpulan.

Di samping kemudahan kemudahan tafsiran, kedudukan persentil mempunyai kelemahan yang ketara. Skala kedudukan persentil adalah bukan linear, i.e. dalam bidang yang berbeza dalam skala skor mentah, peningkatan 1 mata mungkin sepadan dengan peningkatan yang berbeza pada skala persentil. Oleh itu, persentil bukan sahaja tidak mencerminkan, malah memutarbelitkan perbezaan sebenar dalam keputusan ujian.

Oleh itu, penggunaan persentil agak terhad. Oleh kerana kemudahan dan kesederhanaan mereka, ia digunakan terutamanya dalam ujian normatif untuk penilaian kendiri pengetahuan pelajar, melaporkan hasilnya kepada pelajar itu sendiri dan ibu bapa mereka.

Skala Z

Menukar keputusan individu kepada skala standard dengan skor purata keseluruhan dan ukuran serakan yang sama. Z- penilaian i-th Pelajar didapati menggunakan formula:

di mana markah utama i-th subjek; - purata markah individu N kumpulan ujian ( i=1,2,…,N); -sisihan piawai berbilang markah utama.

Z-skala adalah piawai dengan min sifar dan satu sisihan piawai. Dengan bantuannya, anda boleh membawa markah pelajar yang diperoleh dalam pelbagai ujian ke dalam satu bentuk yang mudah untuk perbandingan.

Magnitud Z-skor adalah sama dengan jarak antara skor utama yang dimaksudkan dan skor purata untuk kumpulan, dinyatakan dalam unit sisihan piawai: dalam berapa banyak sisihan piawai ialah skor utama subjek di bawah atau di atas min kumpulan.

Skor Z, dengan pengecualian yang jarang berlaku, mengambil nilai daripada julat (-3+3). Walaupun mudah untuk analisis saintifik dalam proses membangunkan ujian baharu, skala Z menyusahkan untuk kegunaan praktikal apabila menilai pengetahuan subjek kumpulan. Skor Z boleh mengambil nilai pecahan dan negatif, yang sukar dikendalikan dalam pengiraan dan sukar untuk ditafsirkan untuk pengguna ujian. Membundarkan skor Z kepada nombor bulat tidak selalu boleh diterima kerana Tujuan utama membuat ujian adalah untuk mengenal pasti perbezaan dalam penyediaan mata pelajaran. Skor Z negatif, yang menunjukkan keputusan di bawah purata bagi kumpulan pelajar yang diuji, juga menyebabkan kesulitan tertentu - ia akan menyebabkan penolakan yang jelas di kalangan pelajar yang menerimanya. Secara umum, semua ini menjadikan skor Z menyusahkan untuk melaporkan keputusan kepada peserta ujian dan memaksa penggunaan kaedah penukaran khas untuk memberikan gred kepada pelajar.

Transformasi skor Z

Penukaran skor Z bertujuan untuk menterjemahkannya kepada nilai yang lebih mudah untuk ditulis dan dijelaskan. Walau bagaimanapun, penjelmaan yang digunakan mestilah linear untuk mengekalkan bentuk taburan skor Z. Formula umum untuk transformasi sedemikian mempunyai bentuk

Z 1 = M+ ?·Z ,

Di mana Z 1 ialah anggaran ditukar, M– nilai purata baharu (nilai purata anggaran selepas transformasi), - sisihan piawai baharu. Penukaran yang berbeza mempunyai makna yang berbeza M Dan . Berikut ialah beberapa transformasi skor Z yang paling terkenal.

Skala T(McCall, 1939, untuk melaporkan prestasi kanak-kanak pada ujian keupayaan mental). Nilai purata dipilih M = 50 dan sisihan piawai? = 10. Kita dapat: Z 1 =50 + 10·Z

Skala SEEV(ETS, untuk menyampaikan keputusan ujian kemasukan kolej kepada pemohon). Nilai purata dipilih M = 500 dan sisihan piawai? = 100. Kita dapat: Z 1 =500 + 100·Z

skala IQ(Weshler, 1939, untuk mentafsir skor pada skala kecerdasan dewasa). Nilai purata dipilih M = 100 dan sisihan piawai? = 15. Kita dapat: Z 1 =100 + 15·Z

Sisik Stanine dan Sten

Kadangkala apabila melaporkan keputusan, skala yang terdiri daripada integer individu digunakan, contohnya, dari 1 hingga 9 atau dari 1 hingga 10. Ini sesuai untuk melaporkan keputusan ujian, kerana Skala sedemikian mempunyai kesederhanaan yang jelas.

Membahagikan taburan normal kepada 9 selang menghasilkan skala stanin yang mempunyai 9 unit piawai. Pada skala ini, min ialah 5 dan sisihan piawai adalah lebih kurang 2. Apabila menilai prestasi subjek pada mana-mana ujian dengan sebarang bilangan item, 4% keputusan terburuk diberikan stanine 1, dan yang terbaik - stanine 9. 7% keputusan terburuk dan terbaik seterusnya diberikan stanine 1. tetapkan stanin 2 dan 8 masing-masing. 12% keputusan seterusnya ialah stanin 3 dan 7. 17% seterusnya diberikan stanin 4 dan 6, dan akhirnya 20% daripada keputusan purata diberikan stanin 5.

Dalam skala dinding, sering dipanggil skala Cattell, keseluruhan susunan keputusan dibahagikan kepada 10 bahagian dengan selang 0.5 sisihan piawai. Dalam skala dinding, min aritmetik diambil sebagai 5.5, dan jarak antara dua unit piawai bersebelahan ialah 0.5.

Kadangkala skala sebelas mata diperoleh daripada skala stanine dengan mengenal pasti satu peratus daripada subjek yang paling kuat dan paling lemah dan masing-masing memberikan mereka skor maksimum dan minimum.

Mewujudkan markah lulus

Terdapat banyak kaedah yang diketahui untuk menetapkan skor lulus dalam ujian berasaskan kriteria. Semua kaedah dibahagikan kepada mutlak dan relatif. Hampir semua kaedah melibatkan pakar dalam prosedur untuk menentukan markah lulus. Mari kita lihat beberapa kaedah yang terkenal.

Kaedah berpusatkan tugas

Kaedah Nedelsky(1954) – untuk tugasan tertutup.

Setiap pakar mesti menganalisis semua tugasan dan memotong bagi setiap tugasan bilangan jawapan yang boleh ditolak oleh subjek yang cekap minimum. Untuk setiap tugasan, pakar menunjukkan songsangan bilangan jawapan yang tinggal. Sebagai contoh, jika dalam tugasan dengan lima jawapan pakar memotong dua, maka dia akan menunjukkan nombor 1/3 untuk tugasan ini. Kemudian semua timbal balik ini disimpulkan. Nombor yang terhasil boleh dianggap sebagai penilaian kemungkinan pakar terhadap subjek yang cekap minimum. Kemudian penilaian semua pakar dipuratakan.

Kaedah Angoff(1971). Pakar diminta untuk membayangkan sekumpulan subjek yang cekap minimum dan, untuk setiap tugasan, untuk menganggarkan bahagian subjek dalam kumpulan ini yang menjawab tugasan dengan betul. (Ini adalah sama seperti menganggarkan kebarangkalian bahawa subjek yang cekap minimum akan menjawab item dengan betul.) Kebarangkalian ini dijumlahkan untuk setiap pakar dan dipuratakan merentas semua pakar.

Kaedah Ebel(1972). Kaedah ini menggunakan grid dua dimensi untuk mengkategorikan setiap tugas. Pakar diminta untuk membahagikan semua tugas dengan kesukaran (tiga tahap kesukaran ditawarkan - tugas itu mudah, kesukaran sederhana, sukar) dan mengikut kaitan kandungannya (4 tahap perkaitan ditawarkan - penting, penting, boleh diterima, kontroversi) . Oleh itu, semua tugas dibentangkan dalam sel grid ini. Pakar kemudiannya mesti menilai bagaimana pengambil ujian yang cekap minimum akan melaksanakan tugas dalam setiap sel, i.e. nyatakan peratusan bilangan tugasan dalam sel yang mesti dijawabnya dengan betul.

Kaedah berpusatkan subjek(Nedelsky, 1954; Zieky, Livingston, 1977)

Kaedah kumpulan kontras

Pakar bersetuju dengan keputusan melaksanakan ujian pada tahap kecekapan minimum. Pakar kemudian membahagikan semua subjek kepada dua kumpulan - cekap dan tidak cekap (tidak termasuk mereka yang, pada pendapat mereka, berada di sempadan). Seterusnya, graf taburan mata bagi setiap kumpulan diplot pada satu lukisan. Titik persilangan graf diambil sebagai gred lulus.

Kaedah kumpulan sempadan

Berbeza dengan kaedah sebelumnya, pakar diminta untuk mengenal pasti subjek yang, pada pendapat mereka, berada di sempadan antara dua kumpulan yang berbeza yang berbeza dalam kecekapan. Median taburan markah kumpulan terpilih diambil sebagai markah lulus.

Pengkritik pendekatan ini menunjukkan bahawa menetapkan skor lulus berdasarkan prestasi peserta ujian pada dasarnya tidak sepadan dengan matlamat utama ujian rujukan kriteria, kerana pendekatan ini tidak berkaitan dengan kandungan ujian.

Penyeragaman

– penyatuan, membawa prosedur ujian dan penilaian kepada standard yang seragam. Terima kasih kepada penyeragaman metodologi, kebolehbandingan keputusan yang diperoleh daripada subjek yang berbeza dicapai dan menjadi mungkin untuk menyatakan skor ujian dalam penunjuk berbanding sampel penyeragaman.

1) Penyeragaman – pemprosesan dan peraturan prosedur, penyatuan arahan, borang peperiksaan, kaedah merekod keputusan, syarat untuk menjalankan peperiksaan, ciri-ciri populasi subjek. Kekerapan prosedur peperiksaan yang ketat adalah prasyarat untuk memastikan kebolehpercayaan ujian dan menentukan piawaian ujian untuk menilai keputusan peperiksaan.

2) Penyeragaman – transformasi skala penarafan normal kepada skala baharu, bukan berdasarkan nilai kuantitatif penunjuk yang dikaji, tetapi pada tempat relatifnya dalam pengagihan keputusan dalam sampel subjek.

Peringkat penyeragaman

Peringkat 1. Penciptaan prosedur ujian seragam.

Ia terdiri daripada menentukan momen situasi diagnostik.

· Keadaan ujian (bilik, pencahayaan dan faktor luaran lain).

· Kandungan arahan dan ciri persembahannya (nada suara, jeda, kelajuan pertuturan, dll.).

· Ketersediaan bahan rangsangan standard (contohnya, kad Rorschach).

· Sekatan masa untuk melaksanakan ujian ini.

· Borang piawai untuk melaksanakan ujian ini.

· Mengambil kira pengaruh faktor situasi terhadap proses dan keputusan ujian.

· Mengambil kira pengaruh tingkah laku pakar diagnostik terhadap proses dan keputusan ujian

· Mengambil kira pengaruh pengalaman subjek dalam ujian.

Peringkat 2. Mewujudkan penilaian seragam prestasi ujian. DENGAN tafsiran standard keputusan yang diperolehi dan pemprosesan standard awal. Pada peringkat ini, penunjuk yang diperoleh dibandingkan dengan norma untuk melakukan ujian ini untuk umur tertentu.

Peringkat 3. Penentuan standard prestasi ujian. Piawaian dibangunkan untuk umur, profesion, jantina, dsb.

skor z-standard

Transformasi anggaran primer yang paling biasa ialah pemusatan dan penormalan menggunakan sisihan piawai. Prosedur penormalan melibatkan pemindahan ke unit pengukuran lain. Fungsi normalisasi biasanya Skor Z (penunjuk piawai), yang menyatakan sisihan keputusan individu X dalam unit yang berkadar dengan sisihan piawai.

Penunjuk piawai, dikira berdasarkan transformasi linear dan tak linear bagi penunjuk utama yang diedarkan mengikut undang-undang biasa atau hampir dengan undang-undang biasa, telah menjadi lebih meluas dalam psikodiagnostik. Dalam pengiraan ini, perubahan-z bagi anggaran dilakukan. Untuk menentukan skor z-standard, tentukan perbezaan antara hasil utama individu dan min kumpulan normal, dan kemudian bahagikan perbezaan ini dengan δ sampel normatif.

X – skor mentah (bilangan tugasan selesai)

Мх – nilai purata tugasan yang telah disiapkan untuk keseluruhan sampel

δ - sisihan piawai (dalam SD psikologi asing)

Ahli matematik Carl Gauss mencadangkan fungsi yang menerangkan taburan normal. Graf persamaan taburan normal ialah lengkung berbentuk loceng unimodal simetri (atau lengkung loceng ).

Mari kita panggil min aritmetik Mx, dan sisihan piawai δ (sigma kecil). Dengan taburan normal, semua kuantiti yang dikaji berada dalam had Mx ± 5 δ.

Dalam Mx ± δ 68.26% terletak, baki 31.74% terletak secara simetri sepanjang 15.87

Dalam Mx ± 2 δ ialah 95.44%

Dan dalam Mx ± 3 δ ialah 99.72%

PERATUSAN

Persentil – peratusan individu daripada sampel penyeragaman yang keputusannya lebih rendah daripada penunjuk utama ini. Skala persentil boleh dianggap sebagai satu set penggredan pangkat dengan bilangan pangkat ialah 100 dan bermula dari pangkat 1, sepadan dengan keputusan terendah;

persentil ke-50 ( R 50 )bersesuaian dengan median taburan keputusan

Persentil tidak boleh dikelirukan dengan peratusan biasa. Yang terakhir mewakili bahagian penyelesaian yang betul daripada jumlah bilangan item ujian dalam keputusan individu. Pangkat P 1 Dan R 100 menerima, masing-masing, keputusan terendah dan tertinggi daripada yang diperhatikan dalam sampel, bagaimanapun, kedudukan ini mungkin sepadan dengan petunjuk jauh dari sifar (bukan satu keputusan yang betul) atau mutlak (semua keputusan adalah betul). Sebagai contoh, dengan jumlah 120 tugasan, hasil minimum sepadan dengan kedudukan pertama mungkin 6 penyelesaian yang betul, manakala hasil maksimum sepadan dengan pangkat R 100 , akan berjumlah 95 tugasan yang diselesaikan dengan betul. Keadaan ini berlaku, sebagai contoh, semasa menilai ujian kelajuan.

Kelemahan utama skala persentil ialah ketidaksamaan unit ukuran. Dalam taburan normal, pembolehubah individu dikumpulkan dengan ketat di tengah-tengah taburan dan berselerak semasa ia bergerak ke arah tepi. Oleh itu, kekerapan kes yang sama berhampiran pusat sepadan dengan selang yang lebih pendek di sepanjang paksi-x, yang terletak di tepi taburan anggaran. Persentil menunjukkan kedudukan relatif setiap subjek dalam sampel biasa, tetapi bukan magnitud perbezaan antara keputusan. Ini menimbulkan sedikit kesulitan dalam mentafsir keputusan individu. Oleh itu, perbezaan dalam penunjuk utama sepadan dengan selang R 70 R 80, boleh berjumlah 10 mata, dan perbezaan dalam bilangan penyelesaian yang betul dalam julat pangkat R 50R 60, - hanya 1 – 3 mata.

Pada masa yang sama, skor persentil juga mempunyai beberapa kelebihan. Ia mudah difahami oleh pengguna maklumat psikodiagnostik, bersifat universal berhubung dengan pelbagai jenis teknik dan mudah dikira.

Norma statistik

A. Norma statistik. Nilai sempadan pada skala skor ujian, dibentuk berdasarkan taburan kekerapan skor ujian dalam sampel penyeragaman. Sebagai peraturan, nilai cutoff ini memisahkan peratusan tetap subjek daripada sampel: (decile), 25 (kuartil), 50 (median). Dengan taburan normal, norma statistik diterangkan menggunakan parameter (min sigma tambah/tolak, atau sisihan piawai). Norma statistik berfungsi untuk membuat "keputusan perbandingan" dan tidak memberikan maklumat untuk membuat "keputusan normatif"

B. Norma umur – versi peribadi norma psikodiagnostik yang dikumpul untuk kanak-kanak yang berumur berbeza.

DALAM. Norma kriteria - piawaian diagnostik, yang menentukan korespondensi antara skor ujian pada skala harta yang diukur dan tahap penunjuk kriteria. Dalam kes tingkah laku kriteria, norma kriteria menunjukkan kebarangkalian berlakunya tingkah laku kriteria untuk skor ujian yang diberikan.

G. Standard sekolah dibangunkan berdasarkan ujian pencapaian sekolah atau ujian bakat sekolah.

D. Piawaian profesional. Mereka ditubuhkan berdasarkan ujian untuk pelbagai kumpulan profesional.

E. Piawaian tempatan . Mereka ditubuhkan untuk kategori sempit orang, dibezakan dengan kehadiran ciri umum - umur, jantina, kawasan geografi, status sosioekonomi.

DAN. Piawaian kebangsaan. Dibangunkan untuk wakil sesebuah negara atau negara secara keseluruhan.

STANINES

Contoh skala tak linear yang diubah menjadi skala piawai ialah skala stanine (Bahasa Inggeris: standard nine), di mana penilaian mengambil nilai dari 1 hingga 9, M = 5, δ = 2

Skala stanin menjadi semakin meluas, menggabungkan kelebihan penunjuk skala standard dan kesederhanaan persentil. Penunjuk utama mudah ditukar kepada stanina. Untuk melakukan ini, subjek disusun mengikut susunan keputusan menaik dan daripadanya mereka dibentuk ke dalam kumpulan dengan bilangan individu yang berkadar dengan frekuensi penilaian tertentu dalam taburan normal keputusan ujian.

DINDING

Apabila menukar gred kepada skala stan (daripada bahasa Inggeris standsrt ten - standard ten) prosedur yang sama dijalankan dengan satu-satunya perbezaan bahawa skala ini adalah berdasarkan sepuluh selang piawai.

Hasil pemeriksaan kebolehan profesional mata pelajaran dimasukkan ke dalam skala khas, yang memungkinkan untuk kemudian menggunakan alat psikometrik untuk kesimpulan berasaskan saintifik tentang keutamaan calon tertentu untuk jawatan kosong.

Pengukuran ialah perubahan sifat dan kualiti tertentu kepada unit yang diketahui, mudah ditafsir dan diproses yang dipanggil nombor. Pengukuran ialah penetapan nombor kepada sifat dan kualiti subjek dan objek mengikut peraturan tertentu. Skala ialah satu bentuk merekodkan satu set ciri objek yang dikaji dan menyusunnya ke dalam sistem berangka tertentu.

I. Skala pengukur ialah satu bentuk penetapan dan kaedah menyusun keseluruhan tanda-tanda fenomena atau proses psikologi yang dikaji ke dalam sistem berangka tertentu. Penggunaan skala dikaitkan dengan keperluan untuk penilaian kualitatif dan kuantitatif

(dengan tugas perbandingan seterusnya) ciri dan pembolehubah tertentu.

Ciri dan pembolehubah adalah fenomena psikologi yang boleh diukur. Fenomena sedemikian boleh menjadi: masa untuk menyelesaikan masalah, bilangan kesilapan yang dibuat, tahap kebimbangan, penunjuk labiliti intelektual, penunjuk status sosiometrik, dll.

Pengukuran dalam penyelidikan psikologi bukanlah satu penghujungnya, ia adalah satu cara untuk mendapatkan maklumat tambahan baharu, dan ia diperlukan untuk menerangkan fenomena atau proses psikologi yang sedang dikaji, meramalkan arah dan arah kemungkinan perubahannya.

Urutan kerja ahli psikologi yang mengkaji fenomena atau proses psikologi tertentu melalui pemprosesan statistik bahan empirikal, sistematisasi dan analisis data empirikal (eksperimen) nampaknya seperti berikut: pertama sekali, adalah perlu untuk mengenal pasti dengan jelas sifat dan kualiti yang ada. dikaji (contohnya, untuk memberikan takrifan yang tepat tentang sifat watak tertentu yang sedang dikaji , kualiti penting seseorang secara profesional); pilih gradasi (tanda) yang boleh dibezakan dengan pasti bagi sifat-sifat ini, i.e. tetapkan unit ukuran untuk harta ini; untuk menetapkan nombor kepada kualiti yang dikaji atau sifatnya (diambil sebagai unit ukuran), yang akan membenarkan sama ada mengelas, menyusun objek yang diukur mengikut sifat yang ditentukan, atau menyusunnya mengikut tahap ekspresi sifat ini. Untuk tujuan ini, pelbagai kuantiti statistik digunakan: skor bersyarat, pangkat kepentingan kuantiti yang dikaji, faktor "berat", dsb.; mengukur, berdasarkan unit pengiraan terpilih, sifat atau kualiti yang sedang dikaji; menjalankan pemprosesan statistik penunjuk psikologi yang diperolehi.

Keputusan bahan statistik yang dikumpul mengenai subjek tinjauan mesti dianalisis dengan betul dari kedudukan metodologi dan psikologi. Untuk melakukan ini, adalah perlu untuk menubuhkan jenis skala pengukur dan transformasi yang dibenarkan bagi nilai statistik yang disertakan di dalamnya.

Klasifikasi skala pengukuran adalah berdasarkan tanda determinisme metrik oleh ahli psikologi Amerika S.S. Stevens. Selaras dengan ciri ini, skala pengukuran biasanya dibahagikan kepada bukan metrik (skala nama, skala tertib) dan metrik (skala selang, skala nisbah).

Skala ciri kualitatif.

1. Dalam skala penamaan (nama lain ialah nominatif), apabila merekodkan maklumat kualitatif, ia boleh diterima untuk mewujudkan atribut yang sepadan untuk kelas tertentu. Contoh skala nominatif ialah skala dikotomi, hanya terdiri daripada dua sel, contohnya: pakar "mengundi" atau "menentang". skala nominatif ialah pengelasan tiga atau lebih sel, contohnya: “pemilihan calon

A - calon B - calon C - calon D". Dalam kes ini, sambungan statistik boleh diwujudkan antara kumpulan ciri (analisis korelasi). Walau bagaimanapun, mungkin tiada hubungan antara ciri yang diukur (Jadual 11).

Jadual 11

Contoh skala penamaan

Pengurus

Gaya kepimpinan

demokratik

liberal

Untuk menganalisis hubungan antara data yang diukur pada skala nama, pekali korelasi berikut paling kerap digunakan: a) pekali 2 ? 2 (4) konjugasi sel (koefisien kontingensi Q; pekali persatuan?); b) pekali m x n (berbilang sel) konjugasi (pekali konjugasi bersama Pearson C; pekali konjugasi bersama Chuprov K).

Apabila mengenal pasti taburan dalam kelas, adalah mungkin untuk menentukan kekerapan mutlak dan relatif kejadian ciri, menentukan mod dan median.

1. Dalam skala susunan, adalah dibenarkan untuk membahagikan set ciri kepada elemen yang disambungkan oleh hubungan: "lebih-kurang" (Jadual 12).

Jadual 12

Contoh skala pesanan

Hasilnya

belakang

Keupayaan untuk menguruskan diri sendiri

Ketidakupayaan untuk menguruskan diri sendiri

Nilai peribadi yang jelas

Nilai peribadi yang kabur

Jelas matlamat peribadi

Matlamat peribadi yang tidak jelas

Meneruskan pembangunan diri

Menghentikan pembangunan diri

Kemahiran menyelesaikan masalah yang baik

Kurang kemahiran sedemikian

Kreativiti

Kurang kreativiti

Keupayaan untuk mempengaruhi orang lain

Ketidakupayaan untuk mempengaruhi orang lain

Penilaian pakar paling kerap dibentangkan pada skala ordinal, kerana, sebagai contoh, semasa tinjauan pakar, lebih mudah bagi pakar untuk menjawab soalan yang bersifat kualitatif, perbandingan (Ivanov lebih disukai daripada Petrov) daripada soalan kuantitatif. Apabila memproses bahan empirikal secara statistik, adalah mungkin untuk menentukan median taburan dan mengira pekali korelasi pangkat.

Skala ordinal mesti mempunyai sekurang-kurangnya tiga kelas, sebagai contoh, "tindak balas positif - tindak balas neutral - tindak balas negatif" atau "sesuai untuk jawatan kosong - sesuai dengan tempahan - tidak sesuai" atau X A = X B; X A< Х В; Х А >X V.

Skala sifat kuantitatif ialah skala selang dan skala nisbah.

2. Skala selang ialah skala yang menyusun, mengelas dan menilai ciri mengikut keterukan ciri yang diukur, berbanding dengan selang tertentu (standard) mengikut prinsip “lebih banyak dengan bilangan unit tertentu - kurang dengan bilangan unit tertentu.” Selang boleh menentukan tahap perkembangan parameter psikologi tertentu yang diukur. Titik rujukan sifar boleh ditetapkan sewenang-wenangnya (Jadual 13).

Jadual 13

Contoh skala selang

Mata pelajaran

IQ

kecerdasan

Tahap pematuhan

keperluan profesion

Tidak sepadan

Di bawah purata

Tidak sepadan

sepadan

Di atas purata

sepadan

Cemerlang

sepadan

Sisihan piawai digunakan sebagai selang dalam skala ini. Ciri selang boleh: masa untuk menyelesaikan masalah, berdasarkan menukar skor mentah kepada unit sisihan piawai; penunjuk standard: IQ, T - skor, persentil, dsb.

Transformasi yang boleh diterima: pengiraan purata aritmetik, sisihan piawai; pekali korelasi dua pembolehubah (Pekali korelasi Spearman r s; ukuran Goodman dan Kruskal; ukuran Kendall; ukuran Somers d; COV - kovarians; Pekali korelasi linear Pearson r xy; pekali korelasi beberapa pembolehubah: pekali konkordans W;

4. Dalam skala nisbah, ciri-ciri dikelaskan dalam perkadaran dengan tahap ekspresi sifat yang diukur, dan nilai berangka diberikan kepada ciri-ciri yang diukur berdasarkan prinsip persamaan, perkadaran, kesamarataan-ketaksamaan, dll. Dalam skala nisbah terdapat titik sifar yang ketara, yang menunjukkan ketiadaan lengkap sifat yang diukur, kualiti , dan ciri mempunyai hubungan berkadar berangka (contohnya, 2 ialah 4, 4 ialah 8, dsb.).

Catatan. Keupayaan jiwa manusia sangat hebat sehingga sukar untuk membayangkan sifar mutlak dalam mana-mana pembolehubah psikologi yang boleh diukur. Kebodohan mutlak dan kejujuran mutlak adalah konsep dan bukannya psikologi harian. Perkara yang sama berlaku untuk penubuhan hubungan yang sama: hanya metafora ucapan sehari-hari membolehkan Ivanov menjadi 2 kali (3, 5, 10) lebih pintar daripada Petrov atau sebaliknya.

Transformasi yang boleh diterima: berhubung dengan penunjuk frekuensi, adalah mungkin untuk menggunakan semua operasi aritmetik; unit ukuran dalam skala hubungan ini ialah 1 pemerhatian, 1 pilihan, 1 tindak balas, dsb.

Kadang-kadang dalam satu tinjauan adalah perlu untuk membentangkan keputusan pada skala yang berbeza. Kita akan melihat ini dalam contoh seterusnya (Jadual 14).

Jadual 14

Korelasi hasil penilaian pemikiran lisan dinyatakan dalam skala yang berbeza

Nombor

mata pelajaran

Anggaran selang

Peringkat

penilaian

Penilaian nominal

Jenis skala:

Selang waktu

pesanan

barang

Mengikut bentuk rakaman data empirikal, skala pengukuran dibahagikan kepada: lisan, berangka, grafik.

Skala verbal ialah satu bentuk penilaian penilaian tentang kehadiran (ya - tidak) atau tahap ekspresi (termasuk dalam bentuk definisi polar) ciri yang sedang dikaji (contohnya, ekstrovert - introvert, dll.).

Dalam skala berangka, data yang diukur dalam tinjauan dibentangkan menggunakan nilai berangka, yang paling mudah untuk merekod dan pemprosesan statistik bahan empirikal.

Skala grafik membolehkan anda memaparkan dengan jelas dinamik perkembangan ciri yang diukur pada paksi absis dan ordinat dan melihat arah aliran dalam perubahannya (Rajah 16).

nasi. 16. Histogram

Histogram ialah graf dalam bentuk jujukan bar, setiap satunya adalah berdasarkan selang satu digit, dan ketinggiannya mencerminkan bilangan kes, atau kekerapan, dalam digit tersebut.

Persembahan grafik data boleh dalam bentuk bar atau carta pai atau histogram (Rajah 17).

nasi. 17. Carta palang dan pai bagi taburan kebarangkalian bagi peristiwa terperingkat

Penilaian skala ialah cara menilai keputusan ujian dengan menetapkan tempatnya pada skala khas. Dalam psikodiagnostik, pelbagai bentuk penilaian keputusan ujian digunakan dengan mengaitkannya dengan data kumpulan dan menetapkan tempatnya pada skala khas.

Salah satu kaedah pemarkahan yang paling biasa ialah persentil. Persentil mencerminkan peratusan individu dalam julat penggredan pangkat dari 1 hingga 100, di mana persentil ke-50 sepadan dengan median (Me). Formula berikut digunakan untuk menentukan persentil:

dengan f com ialah kekerapan terkumpul skor yang kurang daripada skor yang diperhatikan yang persentil dikira; f ialah kekerapan anggaran yang ditukar; N ialah jumlah bilangan penilaian (Rajah 18).

nasi. 18. Taburan keputusan dalam persentil

Kelemahan skala persentil ialah ketidaksamaan unit ukuran. Dengan taburan normal, kebanyakan keputusan ujian dikumpulkan di tengah-tengah taburan dan berselerak semasa ia bergerak ke arah tepi.

Untuk mengatasi kelemahan ini, markah ujian diseragamkan, yang memungkinkan untuk membandingkan keputusan subjek yang berbeza dari segi penunjuk yang setanding dengan sampel.

Skor-Z ialah nisbah perbezaan antara nilai X dan nilai purata kepada sisihan piawai (Rajah 19).

nasi. 19. Taburan keputusan dalam skor-Z

Penukaran keputusan ujian kepada skor Z dijalankan menggunakan formula:

dengan X 1 ialah hasil individu bagi subjek, adakah min aritmetik, ? - sisihan piawai.

Kelemahan skor-Z ialah kehadiran nilai dan pecahan negatif (Rajah 20).

T - mata

nasi. 20. Taburan keputusan dalam skor-T

T - skor ialah taburan normal skor dengan min 50 dan sisihan piawai 10. Jika taburan skor yang diperhatikan adalah normal, penukaran dibuat menggunakan formula:

di mana X ialah markah yang diperhatikan; M ialah nilai purata anggaran yang diperhatikan; ? x ialah sisihan piawai bagi markah yang diperhatikan.

Jika markah yang diperhatikan tidak mematuhi taburan normal, maka ia ditukarkan kepada persentil, kemudian mengikut jadual taburan normal menjadi skor-Z, yang mana formula digunakan: T = 10 z + 50 (Jadual 15).

Jadual 15

Hubungan antara persentil, skor-Z dan skor-T

Persentil

T-skor

Persentil

T-skor

Keputusan subjek boleh dicerminkan dalam Stans (Rajah 21).

nasi. 21. Skala Stan

Skala Stan digunakan untuk menyeragamkan penunjuk psikologi yang mempunyai sebilangan kecil penggredan yang boleh dibezakan secara kualitatif.

Stan ialah unit pada skala sepuluh mata dengan min 5.5 dan sisihan piawai 2. Untuk menukar skor mutlak kepada stan, formula digunakan:

di mana? c ialah sisihan piawai skala Stan, bersamaan dengan 2; ? x ialah sisihan piawai penunjuk kaedah dalam sampel penyeragaman; Хi - nilai semasa penunjuk;

Mx ialah nilai purata penunjuk kaedah dalam sampel penyeragaman; Mc - nilai purata skala Stan bersamaan dengan 5.5;

Skala Stenine ialah transformasi linear penunjuk yang diterima umum, di mana skor mengambil nilai dari 1 hingga 9, min ialah 5.0, dan sisihan piawai? = 2.0 (Gamb. 22).

nasi. 22. Skala stenine

Subjek disenaraikan dalam susunan keputusan menaik, dan kumpulan dibentuk daripada mereka dengan beberapa individu yang sepadan dengan frekuensi penilaian tertentu dalam taburan normal keputusan ujian.

Penunjuk utama ditukarkan kepada stenine dengan menyusun nilai berangkanya mengikut lengkung normal taburan peratusan anggaran primer yang diberikan dalam Jadual 16.

Jadual 16

Penukaran kepada stenine

Peratusan responden dalam sampel penyeragaman

Markah terendah dan tertinggi akan diberikan kepada keputusan 1 dan 9.

Untuk membandingkan keputusan mengukur penunjuk psikologi yang sama (tanda), selepas membawa hasilnya ke mana-mana skala pengukuran bersatu (contohnya, skala stan), O.P. Eliseev mencadangkan formula untuk mengira semula keputusan dan memaparkannya pada skala tunggal 20-80.

Pengiraan semula keputusan ujian ke dalam jadual 20-80 dijalankan untuk setiap parameter yang dikaji secara berasingan menggunakan formula berikut:

Di mana: - Mata mentah – bilangan mata yang diterima kedua-duanya untuk menyelesaikan setiap ujian kecil secara berasingan dan jumlah keputusan untuk keseluruhan ujian; 60 - julat skala yang boleh dilihat 20-80; Maksimum – bilangan mata maksimum yang mungkin yang boleh dijaringkan oleh pengambil ujian (untuk setiap ujian kecil dan untuk ujian secara keseluruhan); 20 - julat skala tidak kelihatan 20-80 (Gamb. 23).

nasi. 23. Histogram keputusan ujian “SHTUR”.

Ini adalah prosedur pemprosesan statistik psikometrik asas yang membolehkan kami mendapatkan maklumat tambahan tentang ciri dan arah aliran hasil tinjauan.

maklumat semasa menguji pelajar - markah utamanya ("mentah"). Mereka jelas, mudah, tetapi sangat bergantung, sebagai contoh, pada kesukaran tugas. Skala yang lebih objektif untuk menilai kesediaan pelajar diperlukan untuk mengesahkan tahap latihan pada pelbagai ujian, dengan tahap kesukaran tugasan yang telah ditetapkan.

Anda juga harus menyingkirkan ketidaklinearan markah utama berhubung dengan tahap kesediaan.

Contoh. Skala penggredan di sekolah membolehkan kita membuat kesimpulan hanya bahawa pelajar Ivanov belajar lebih baik daripada pelajar Petrov. Apakah perbezaan, kejayaan, usaha, dan lain-lain mereka? – Skala ini tidak menjawab soalan sedemikian. Begitu juga, markah mentah hanya memberi kedudukan kepada pengambil ujian.

Dalam skala ordinal tersebut, statistik utama ialah median, kuantil dan korelasi pangkat.

Kedudukan subjek pada paksi berangka mengikut keputusan ujian dijalankan dengan cara yang berbeza. Oleh itu, pelbagai jenis skala penilaian digunakan, seperti berikut.

Skala penilaian akhir– skala, ditentukan oleh skor minimum dan maksimum (mata), ialah transformasi linear segmen daripada skor minimum kepada maksimum; sebagai contoh, skala ialah 100 mata.

Skala standard– skala diperkenalkan berdasarkan kesahihan hipotesis tentang hukum normal taburan mata; contohnya, penterjemahan ke dalam skala normatif menganggap bahawa pengetahuan subjek dalam sampel rawak mereka tertakluk kepada undang-undang taburan normal, oleh itu, segmen yang sama di bawah lengkung taburan normal sepadan dengan bilangan jawapan betul yang sama.

Skala ordinal, kualitatif, hubungan– skala untuk memperkenalkan hubungan pesanan ke dalam set objek boleh skala, sistem dan melaksanakan semua transformasi yang tidak melanggar peraturan pesanan ini; sebagai contoh, skala pemarkahan di sekolah menengah ialah 2, 3, 4, 5 dan di sekolah menengah - "tidak memuaskan", "memuaskan", "baik", "cemerlang".

Skala nominal (item) digunakan oleh pakar apabila mengklasifikasikan objek pengukuran empirikal. Skala ini digunakan apabila pengukuran pedagogi mengumpulkan pelajar tanpa menetapkan susunan kumpulan; contohnya membahagikan pelajar kepada kumpulan mereka yang lulus dan mereka yang tidak lulus ujian.

Contoh. Jika pengambil ujian menerima 1 (0) untuk jawapan yang betul (salah) pada tugasan, maka keputusan ujian dibentangkan pada skala nominal.

Skala selang– skala, di mana hanya fungsi transformasi linear dibenarkan, dan selalunya mustahil untuk menandakan sama ada permulaan, penghujung, atau unit ukuran (penggredan) skala; contohnya, skala suhu Fahrenheit dan Celsius dikaitkan dengan hubungan: C = 5/9 (F – 32), C – suhu (dalam darjah) pada skala Celsius, F – suhu pada skala Fahrenheit.

Skala selang ialah skala kuantitatif untuk menyusun data (objek) mengikut hubungan kesetaraan, susunan dan ketambahan. Ia mentakrifkan metrik (asal, unit ukuran dan konsep jarak antara data dan objek), jadi masalah membandingkan keputusan ujian diselesaikan.

Skala kualitatif mempunyai ketepatan pengukuran yang rendah, manakala skala kuantitatif mempunyai objektiviti yang lebih tinggi.

Struktur jenis dan aras pengukuran ditunjukkan dalam Rajah. 6.1.


nasi.

6.1.

Skala logit, sering digunakan dalam testologi, biasanya diterjemahkan ke dalam skala skor ujian.

Contoh. Jika peserta Peperiksaan Negeri Bersepadu belum menyelesaikan satu tugasan dan menerima 0 mata utama, dia menerima mata ujian sifar, tetapi jika dia telah menyelesaikan semua tugasan dan menerima markah utama tertinggi yang mungkin, dia menerima 100 mata ujian. Markah ujian peserta USE yang tinggal dikira menggunakan transformasi linear yang mengubah segmen skala logit yang dihadkan oleh skor dalam logit sepadan dengan satu skor utama dan skor dalam logit sepadan dengan skor utama yang satu unit kurang daripada maksimum mungkin ke dalam segmen pada skala titik ujian daripada enam hingga sembilan puluh empat inklusif. Sebagai contoh, formula untuk menukar skala logit kepada skala skor ujian mungkin kelihatan seperti:

di mana T ialah skor ujian, x ialah penilaian tahap kesediaan peserta Peperiksaan Negeri Bersepadu dalam logit, x min ialah skor dalam logit yang sepadan dengan satu markah primer, x max ialah skor dalam logit yang sepadan dengan skor utama , kurang satu daripada markah maksimum yang mungkin, [x ] – bahagian integer x.

Contoh. Biasanya, untuk ujian kualitatif jenis ini, kira-kira 70% daripada keputusan terletak di tengah-tengah pengedaran ("di bawah loceng" keluk pengedaran) dan mempunyai ralat pengukuran kecil, kira-kira 5% (daripada yang paling lemah dan keputusan terkuat) di bahagian rata keluk pengedaran, mereka boleh mempunyai ralat pengukuran yang sangat besar. Ujian profesional, semasa pemprosesan, membuang hujung atau bahagiannya.

Dalam ujian berasaskan kriteria, tugas ditetapkan: untuk membandingkan pencapaian pendidikan setiap subjek ujian dengan jumlah pengetahuan (kemahiran, kemahiran) yang dirancang untuk asimilasi. Ini lebih bergantung pada kandungan khusus Standard Negeri (program) yang sedang diuji.

Untuk menghapuskan pergantungan tafsiran keputusan ujian pada keputusan dalam kumpulan peserta ujian, secara empirik, piawaian yang ditetapkan secara pakar untuk prestasi ujian digunakan, yang mana markah utama pengambil ujian tertentu dibandingkan. Ini ialah proses menyeragamkan sesuatu ujian, contohnya dengan min dan sisihan piawai bagi markah individu.

Penukaran skor mentah yang biasa digunakan:

  • persentil, mencerminkan peratusan subjek daripada kumpulan normatif yang keputusannya tidak lebih tinggi daripada nilai tertentu bagi skor utama;
  • Skor Z, penilaian linear - nisbah sisihan individu skor ujian kepada sisihan piawai skor keseluruhan kumpulan subjek, serta transformasi linear skor Z (skala T, dsb.);
  • Penimbang Stanine dan Dinding (skala Cattell), diperoleh dengan membahagikan skala skor utama kepada beberapa selang.

Peratusan menetapkan pangkat penunjuk subjek dalam kumpulan normatif, menunjukkan peratusan subjek dalam sampel normatif yang mempunyai keputusan tidak lebih tinggi daripada markah utama ini. Skala persentil adalah bukan linear (tindak balas kepada perubahan satu mata dalam skor mentah adalah bukan linear), jadi ia mungkin memesongkan keadaan sebenar.

Skala Z yang dipanggil menterjemahkan hasil individu ke dalam skala standard, yang dicirikan oleh dua parameter umum utama: skor purata dan varians. Skor Z bagi orang yang diuji ke-i didapati menggunakan formula:

di mana x i ialah markah utama subjek; –

Psikodiagnostik: nota kuliah Alexey Sergeevich Luchinin

2. Penilaian skala

2. Penilaian skala

Penilaian skala– kaedah menilai keputusan ujian dengan menetapkan tempatnya pada skala khas. Skala mengandungi data tentang norma intrakumpulan untuk melaksanakan teknik ini dalam sampel penyeragaman. Oleh itu, keputusan individu menyelesaikan tugasan (penilaian utama mata pelajaran) dibandingkan dengan data dalam kumpulan normatif yang setanding (sebagai contoh, hasil yang dicapai oleh pelajar dibandingkan dengan penunjuk kanak-kanak pada umur atau tahun pengajian yang sama; hasilnya kajian tentang kebolehan umum orang dewasa dibandingkan dengan penunjuk yang diproses secara statistik bagi sampel yang mewakili individu dalam had umur yang ditentukan).

Skor skala dalam pengertian ini mempunyai kandungan kuantitatif yang jelas dan boleh digunakan dalam analisis statistik. Salah satu bentuk yang paling biasa untuk menilai keputusan ujian dalam diagnostik psikologi melalui korelasi dengan data kumpulan ialah pengiraan persentil.

Persentil ialah peratusan individu daripada sampel penyeragaman yang keputusannya lebih rendah daripada penunjuk utama yang diberikan. Skala persentil boleh dianggap sebagai satu set penggredan pangkat (lihat korelasi pangkat) dengan bilangan pangkat ialah 100 dan bermula dari peringkat 1, sepadan dengan keputusan terendah; Persentil ke-50 (PSQ) sepadan dengan median (lihat ukuran kecenderungan memusat) taburan prestasi, P ›50 dan P ‹50 masing-masing mewakili pangkat prestasi di atas dan di bawah tahap prestasi median.

Persentil tidak boleh dikelirukan dengan peratusan biasa. Yang terakhir mewakili bahagian keputusan yang betul daripada jumlah item ujian dalam keputusan individu (lihat markah utama). Kedudukan P dan P 100 masing-masing menerima keputusan terendah dan tertinggi daripada yang diperhatikan dalam sampel, walau bagaimanapun, kedudukan ini juga mungkin sepadan dengan penunjuk jauh dari sifar (bukan satu penyelesaian yang betul) atau mutlak (semua penyelesaian adalah betul) (untuk contoh, dengan jumlah 120 tugasan, hasil minimum yang sepadan dengan kedudukan pertama boleh menjadi 6 penyelesaian yang betul, manakala hasil maksimum yang sepadan dengan pangkat P 100 ialah 95 tugasan yang diselesaikan dengan betul). Keadaan ini berlaku, sebagai contoh, semasa menilai ujian kelajuan.

Kelemahan utama skala persentil ialah ketidaksamaan unit ukuran. Dalam taburan normal, pembolehubah individu dikumpulkan dengan ketat di tengah-tengah taburan dan berselerak semasa ia bergerak ke arah tepi. Oleh itu, kekerapan kes yang sama berhampiran pusat sepadan dengan selang yang lebih pendek di sepanjang paksi-x, yang terletak di tepi taburan anggaran. Persentil menunjukkan kedudukan relatif setiap subjek dalam sampel biasa, tetapi bukan magnitud perbezaan antara keputusan. Ini menimbulkan sedikit kesulitan dalam mentafsir keputusan individu. Oleh itu, perbezaan dalam penunjuk utama sepadan dengan selang P 70 -P 80 boleh menjadi 10 mata, dan perbezaan dalam bilangan keputusan yang betul dalam selang pangkat P 50 -P 60 boleh menjadi hanya 1–3 mata.

Pada masa yang sama, skor persentil juga mempunyai beberapa kelebihan. Mereka mudah difahami oleh pengguna maklumat psikodiagnostik, bersifat universal berhubung dengan pelbagai jenis teknik dan mudah dikira.

Skor peratusan bukanlah skor skala biasa. Lebih meluas digunakan dalam psikodiagnostik penunjuk piawai, dikira berdasarkan penjelmaan linear dan tak linear bagi penunjuk utama yang diedarkan mengikut undang-undang biasa atau hampir dengan undang-undang biasa. Dengan pengiraan ini, perubahan-r anggaran dijalankan (lihat penyeragaman, taburan normal). Untuk menentukan penunjuk 2 piawai, tentukan perbezaan antara hasil utama individu dan min bagi kumpulan normal, dan kemudian bahagikan perbezaan ini dengan a sampel normatif. Skala z yang diperoleh dengan cara ini mempunyai titik tengah M = 0, nilai negatif menunjukkan keputusan di bawah purata dan berkurangan apabila ia bergerak menjauhi titik sifar; Nilai positif menunjukkan keputusan melebihi purata. Unit ukuran (skala) dalam skala z adalah sama dengan 1a daripada taburan normal piawai (unit).

Untuk mengubah taburan keputusan normatif primer yang diperoleh semasa penyeragaman kepada skala z piawai, adalah perlu untuk menyiasat persoalan sifat taburan empirikal dan tahap ketekalannya dengan yang normal. Oleh kerana bagi kebanyakan kes, nilai penunjuk dalam taburan sesuai dalam M ± 3?, unit skala z mudah adalah terlalu besar. Untuk memudahkan anggaran, satu lagi transformasi jenis z = (x – ‹x›) / ? Contoh skala sedemikian ialah penilaian metodologi bateri ujian SAT (SEEB) untuk menilai keupayaan pembelajaran (lihat ujian pencapaian). Skala r ini dikira semula supaya titik tengah sepadan dengan nilai 500, ya? = 100. Contoh lain yang serupa ialah skala Wechsler untuk subujian individu (lihat skala kecerdasan Wechsler, di mana M = 10, ? = 3).

Bersama-sama dengan menentukan tempat keputusan individu dalam pengedaran standard data kumpulan, pengenalan SHO juga bertujuan untuk mencapai satu lagi matlamat penting - memastikan perbandingan hasil kuantitatif pelbagai ujian yang dinyatakan dalam skala standard, kemungkinan gabungan mereka. tafsiran, dan mengurangkan penilaian kepada satu sistem.

Jika kedua-dua taburan anggaran dalam kaedah yang dibandingkan adalah hampir kepada normal, isu kebolehbandingan anggaran diselesaikan dengan agak mudah (dalam mana-mana taburan normal, selang M ± n? sepadan dengan kekerapan kes yang sama). Untuk memastikan kebolehbandingan hasil yang dimiliki oleh pengedaran bentuk yang berbeza, gunakan transformasi tak linear, membenarkan untuk memberikan taburan bentuk lengkung teori yang diberikan. Taburan normal biasanya digunakan sebagai lengkung sedemikian. Seperti 160–150 dalam z-transform yang ringkas, skor standard yang dinormalkan boleh diberikan sebarang bentuk yang diingini. Sebagai contoh, mendarabkan penunjuk piawai ternormal dengan 10 dan menambah pemalar 50, kita dapat T-skor(lihat penyeragaman, Inventori Personaliti Multidimensi Minnesota).

Contoh bukan linear ditukar kepada skala piawai ialah dan penimbang stanine(dari bahasa Inggeris standard nine - "standard nine"), di mana penilaian mengambil nilai dari 1 hingga 9, M = 5, ?

Skala stanin menjadi semakin meluas, menggabungkan kelebihan penunjuk skala standard dan kesederhanaan persentil. Penunjuk utama mudah ditukar kepada stanina. Untuk melakukan ini, subjek disusun mengikut susunan keputusan menaik dan daripadanya mereka dibentuk ke dalam kumpulan dengan bilangan individu yang berkadar dengan frekuensi penilaian tertentu dalam taburan normal keputusan ujian (Jadual 14).

Jadual 14

Terjemahan keputusan ujian primer ke dalam skala stanine

Apabila menukar gred kepada skala stan(dari bahasa Inggeris standard ten - "standard ten") prosedur yang sama dijalankan dengan satu-satunya perbezaan ialah skala ini berdasarkan sepuluh selang standard. Biarkan terdapat 200 orang dalam sampel penyeragaman, maka 8 (4%) subjek dengan markah terendah dan tertinggi akan diberikan kepada 1 dan 9 stanin, masing-masing. Prosedur diteruskan sehingga semua selang skala diisi. Oleh itu, markah ujian yang sepadan dengan peratusan penggredan akan dipesan ke dalam skala yang sepadan dengan taburan kekerapan standard keputusan.

Salah satu bentuk penarafan skala yang paling biasa dalam ujian kecerdasan ialah skor IQ standard(M = = 100, ? = 16). Parameter ini untuk skala penilaian standard dalam psikodiagnostik dipilih sebagai rujukan. Terdapat beberapa skala yang bergantung pada penyeragaman; anggaran mereka mudah dikurangkan antara satu sama lain. Penskalaan, pada dasarnya, boleh diterima dan wajar untuk pelbagai teknik yang digunakan untuk tujuan diagnostik dan penyelidikan, termasuk untuk teknik yang hasilnya dinyatakan dalam penunjuk kualitatif. Dalam kes ini, untuk penyeragaman, anda boleh menggunakan terjemahan skala nominatif ke dalam skala pangkat (lihat skala pengukuran) atau membangunkan sistem penilaian primer kuantitatif yang berbeza.

Perlu diingat bahawa, walaupun kesederhanaan dan kejelasannya, penunjuk skala adalah ciri statistik yang hanya membenarkan seseorang untuk menunjukkan tempat hasil yang diberikan dalam sampel banyak ukuran yang serupa. Skor skala, walaupun untuk instrumen psikometrik tradisional, hanyalah satu bentuk ekspresi skor ujian yang digunakan dalam mentafsir keputusan tinjauan. Dalam kes ini, analisis kuantitatif harus sentiasa dijalankan bersama-sama dengan kajian kualitatif pelbagai hala tentang sebab-sebab berlakunya keputusan ujian yang diberikan, dengan mengambil kira kedua-dua kompleks maklumat mengenai keperibadian subjek dan data semasa. syarat peperiksaan, kebolehpercayaan dan kesahan metodologi. Idea yang dibesar-besarkan tentang kemungkinan kesimpulan yang sah berdasarkan hanya anggaran kuantitatif membawa kepada banyak idea yang salah dalam teori dan amalan diagnostik psikologi.

Daripada buku Statistik Perubatan pengarang Olga Ivanovna Zhidkova

22. Metodologi untuk penilaian kumpulan pembangunan fizikal. Penilaian Pecutan pembangunan fizikal pasukan dijalankan dengan menganalisis perubahan berkaitan umur dalam nilai purata sisihan piawai mereka, peningkatan tahunan dalam penunjuk pada pelbagai umur

Daripada buku Propaedeutics of Childhood Illnesses oleh O. V. Osipova

8. Kaedah pusat untuk menilai perkembangan fizikal Memandangkan variasi yang diperhatikan dalam pelbagai petunjuk perkembangan fizikal kanak-kanak, adalah perlu untuk mengetahui apa yang dipanggil normal, atau Gaussian-Laplacian, taburan. Ciri-ciri taburan ini ialah

Daripada buku General Hygiene pengarang Yuri Yuryevich Eliseev

50. Kaedah untuk menilai perkembangan fizikal kanak-kanak dan remaja Kaedah sisihan sigma Penunjuk perkembangan individu dibandingkan dengan ciri penunjuk purata kumpulan umur-jantina yang sepadan, perbezaan di antara mereka dinyatakan dalam saham.

Daripada buku General Hygiene: Lecture Notes pengarang Yuri Yuryevich Eliseev

51. Kaedah untuk menilai perkembangan fizikal kanak-kanak dan remaja (sambungan) Pada peringkat kedua, keadaan morfofungsi ditentukan oleh berat badan, lilitan dada semasa jeda pernafasan, kekuatan otot tangan dan kapasiti vital paru-paru (VC) . Sebagai

Daripada buku Propaedeutics of Childhood Illnesses: Lecture Notes oleh O. V. Osipova

KULIAH Bil 14. Perkembangan fizikal kanak-kanak dan remaja, kaedah menilai mereka Petunjuk perkembangan fizikal Untuk gambaran lengkap tentang status kesihatan generasi muda, sebagai tambahan kepada data morbiditi dan demografi, ia juga perlu mengkaji kriteria utama

Daripada buku Perkembangan fungsi kognitif asas menggunakan aktiviti permainan adaptif pengarang Irina Konstantinova

Kaedah untuk menilai perkembangan fizikal kanak-kanak dan remaja Apabila membangun dan memilih kaedah untuk menilai perkembangan fizikal, adalah perlu, pertama sekali, untuk mengambil kira corak asas perkembangan fizikal organisma yang semakin meningkat: 1) heteromorfisme dan heterokroni pembangunan; 2)

Dari buku Kelangsingan dari zaman kanak-kanak: bagaimana untuk memberi anak anda sosok yang cantik oleh Aman Atilov

5. Petunjuk perkembangan fizikal kanak-kanak. Kaedah centile untuk menilai perkembangan fizikal Memandangkan variasi yang diperhatikan dalam pelbagai petunjuk perkembangan fizikal kanak-kanak, adalah perlu untuk mengetahui apa yang dipanggil normal, atau Gaussian-Laplacian, taburan.

Dari buku Your Child from Birth to 6 Years. Pengenalpastian penyelewengan perkembangan dan pembetulannya. Buku yang diperlukan oleh setiap keluarga pengarang Leonid Rostislavovich Bitterlikh

Kaedah untuk menilai keberkesanan kerja Apabila bekerja dengan kanak-kanak yang mengalami gangguan perkembangan yang teruk, analisis kualitatif gangguan dan dinamik yang berterusan digunakan. Jadi, sebagai contoh, bagi seorang pakar, bilangan perkataan yang dikuasai oleh kanak-kanak tidak begitu penting sebagai keupayaannya

Daripada buku Pembentukan kesihatan kanak-kanak di institusi prasekolah pengarang Alexander Georgievich Shvetsov

Kriteria untuk menilai fleksibiliti Untuk menentukan keberkesanan proses pendidikan dan latihan, adalah perlu untuk menggunakan kriteria untuk menilai fleksibiliti, dengan mengambil kira jenis dan manifestasinya. Setiap manifestasi fleksibiliti mesti memenuhi kriteria penilaian tertentu.

Daripada buku Psikoterapi Keluarga dan Ketidakharmonian Seksual pengarang Stanislav Kratochvil

Cara-cara Menilai Perkembangan Yang Betul Bayi Prematur dan Kembar Anda boleh menggunakan dua kaedah di bawah untuk memeriksa sama ada bayi pramatang anda berada di belakang bayi cukup bulan atau tidak.

Dari buku Encyclopedia of Amosov. Algoritma kesihatan pengarang Nikolai Mikhailovich Amosov

Metodologi untuk menilai perkembangan fizikal kanak-kanak Pada masa ini, cara yang paling biasa untuk menilai perkembangan fizikal ialah kaedah mengaitkan ciri-ciri antropometrik (menggunakan skala regresi), yang memastikan keharmonian dan perkadaran mereka.

Daripada buku Dietetics: A Guide pengarang Pasukan pengarang

Dari buku My stroke was a science to me. Kisah penyakit anda sendiri, yang diceritakan oleh seorang pakar saraf pengarang Jill Bolte Taylor

Penilaian pakar terhadap jiwa Dalam tinjauan sosiologi melalui akhbar pada tahun 1990, saya cuba mendapatkan model keperibadian responden tertentu. Untuk melakukan ini, dia ditanya soalan dengan pilihan jawapan bergraduat. Mereka memungkinkan untuk menentukan mata pada model: tuntutan, yuran,

Dari buku penulis

Kaedah komprehensif untuk menilai status pemakanan Seperti berikut daripada di atas, tiada penanda berasingan yang boleh mengenal pasti kehadiran dan tahap kekurangan zat makanan protein-tenaga. Menurut cadangan Persatuan Parenteral Eropah dan

Dari buku penulis

Lampiran A Sepuluh soalan untuk menilai keadaan saya 1. Adakah anda telah memeriksa penglihatan dan pendengaran saya untuk memastikan saya tidak kehilangan pendengaran dan penglihatan saya?2. Bolehkah saya membezakan warna?3. Adakah saya melihat dunia dalam tiga dimensi?4. Adakah saya mempunyai rasa masa?5. Adakah semua bahagian badan saya adalah saya