ความถูกต้องของวิธีการเชิงคุณภาพ เกณฑ์คุณภาพวิธีการ: ความถูกต้อง ความน่าเชื่อถือ การประเมินความถูกต้องของวิธีการเชิงคุณภาพในทางจิตวิทยา

หลังจากความน่าเชื่อถือแล้ว เกณฑ์สำคัญอีกประการหนึ่งในการประเมินคุณภาพของวิธีการก็คือความถูกต้อง คำถามเกี่ยวกับความถูกต้องของวิธีการจะได้รับการแก้ไขหลังจากสร้างความน่าเชื่อถือที่เพียงพอแล้วเท่านั้น เนื่องจากวิธีการที่ไม่น่าเชื่อถือโดยปราศจากความรู้เกี่ยวกับความถูกต้องนั้นไม่มีประโยชน์ในทางปฏิบัติ

ควรสังเกตว่าคำถามเกี่ยวกับความถูกต้องจนกระทั่งเมื่อเร็ว ๆ นี้ดูเหมือนจะเป็นปัญหาที่ยากที่สุดข้อหนึ่ง คำจำกัดความที่ได้รับการยอมรับมากที่สุดของแนวคิดนี้คือคำจำกัดความที่ให้ไว้ในหนังสือของ A. Anastasi: “ความถูกต้องของการทดสอบคือแนวคิดที่บอกเราว่าการทดสอบใช้มาตรการใดและได้ผลดีเพียงใด” (1982, p. 126) ความถูกต้องที่เป็นแกนกลางเป็นคุณลักษณะที่ซับซ้อน ในด้านหนึ่ง ข้อมูลดังกล่าวรวมถึงข้อมูลว่าเทคนิคนี้เหมาะสำหรับการวัดว่าเทคนิคนี้ถูกสร้างขึ้นมาเพื่ออะไร และในทางกลับกัน ความมีประสิทธิผลและประสิทธิภาพของเทคนิคนั้นเป็นอย่างไร ด้วยเหตุนี้ จึงไม่มีแนวทางสากลเดียวในการกำหนดความถูกต้อง ขึ้นอยู่กับแง่มุมของความถูกต้องที่ผู้วิจัยต้องการพิจารณา จะใช้วิธีการแสดงหลักฐานที่แตกต่างกัน กล่าวอีกนัยหนึ่ง แนวคิดเรื่องความถูกต้องรวมถึงประเภทต่างๆ ซึ่งมีความหมายพิเศษในตัวเอง การตรวจสอบความถูกต้องของวิธีการเรียกว่าการตรวจสอบความถูกต้อง

ความถูกต้องในการทำความเข้าใจครั้งแรกนั้นเกี่ยวข้องกับวิธีการเอง กล่าวคือ ความถูกต้องของเครื่องมือวัด การทดสอบประเภทนี้เรียกว่าการตรวจสอบความถูกต้องทางทฤษฎี ความถูกต้องในความเข้าใจที่สองไม่ได้หมายถึงวิธีการมากนักเกี่ยวกับวัตถุประสงค์ของการใช้งาน นี่คือการตรวจสอบเชิงปฏิบัติ

ดังนั้น ในระหว่างการตรวจสอบความถูกต้องทางทฤษฎี ผู้วิจัยจึงสนใจในคุณสมบัติที่วัดโดยเทคนิคนั้น นี่หมายถึงว่ากำลังมีการตรวจสอบทางจิตวิทยาอยู่ ด้วยการตรวจสอบเชิงปฏิบัติ สาระสำคัญของการวัดผล (ทรัพย์สินทางจิตวิทยา) จึงไม่อยู่ในสายตา จุดเน้นหลักคือการพิสูจน์ว่า "บางสิ่ง" ที่วัดโดยเทคนิคนั้นมีความเกี่ยวข้องกับการปฏิบัติบางด้าน

การดำเนินการตรวจสอบความถูกต้องทางทฤษฎี ตรงกันข้ามกับการตรวจสอบเชิงปฏิบัติ บางครั้งกลายเป็นเรื่องยากกว่ามาก โดยไม่ต้องลงรายละเอียดเฉพาะในตอนนี้ ให้เราพิจารณาในแง่ทั่วไปเกี่ยวกับวิธีการตรวจสอบความถูกต้องเชิงปฏิบัติ: มีการเลือกเกณฑ์ภายนอกบางอย่างที่ไม่ขึ้นอยู่กับวิธีการที่กำหนดซึ่งกำหนดความสำเร็จในกิจกรรมเฉพาะ (ทางการศึกษา วิชาชีพ ฯลฯ ) และด้วย มีการเปรียบเทียบผลลัพธ์ของเทคนิคการวินิจฉัย หากการเชื่อมต่อระหว่างพวกเขาถือว่าน่าพอใจก็จะได้ข้อสรุปเกี่ยวกับประสิทธิผลในทางปฏิบัติและประสิทธิภาพของเทคนิคการวินิจฉัย

ในการพิจารณาความถูกต้องทางทฤษฎี การค้นหาเกณฑ์อิสระที่อยู่นอกระเบียบวิธีจะยากกว่ามาก ดังนั้น ในช่วงแรกของการพัฒนาระบบทดสอบ เมื่อแนวคิดเรื่องความถูกต้องเพิ่งเป็นรูปเป็นร่าง มีแนวคิดตามสัญชาตญาณว่าการวัดผลการทดสอบ:

1) วิธีการได้รับการยอมรับว่าถูกต้อง เนื่องจากสิ่งที่วัดนั้น "ชัดเจน" 2)

การพิสูจน์ความถูกต้องนั้นขึ้นอยู่กับความมั่นใจของผู้วิจัยว่าวิธีการของเขาทำให้เขา "เข้าใจหัวข้อ"; 3)

เทคนิคนี้ถือว่าใช้ได้ (เช่น ข้อความที่ได้รับการยอมรับว่าการทดสอบดังกล่าววัดคุณภาพดังกล่าว) เพียงเพราะทฤษฎีที่ใช้เทคนิคนั้น "ดีมาก"

การยอมรับข้อความที่ไม่มีมูลเกี่ยวกับความถูกต้องของวิธีการไม่สามารถดำเนินต่อไปได้เป็นเวลานาน การปรากฏตัวครั้งแรกของการวิจารณ์ทางวิทยาศาสตร์อย่างแท้จริงได้หักล้างแนวทางนี้: การค้นหาหลักฐานที่มีพื้นฐานทางวิทยาศาสตร์เริ่มต้นขึ้น

ดังที่ได้กล่าวไปแล้ว การดำเนินการตรวจสอบความถูกต้องทางทฤษฎีของเทคนิคหนึ่งๆ คือการแสดงให้เห็นว่าเทคนิคนั้นวัดคุณสมบัติได้จริงหรือไม่ และมีคุณภาพตามที่ผู้วิจัยระบุว่าควรวัดหรือไม่ ตัวอย่างเช่น หากมีการพัฒนาแบบทดสอบเพื่อวินิจฉัยพัฒนาการทางจิตของเด็กนักเรียน ก็จำเป็นต้องวิเคราะห์ว่าแบบทดสอบนั้นวัดพัฒนาการนี้ได้จริงหรือไม่ ไม่ใช่ลักษณะอื่นใด (เช่น บุคลิกภาพ อุปนิสัย ฯลฯ) ดังนั้น สำหรับการตรวจสอบความถูกต้องทางทฤษฎี ปัญหาสำคัญคือความสัมพันธ์ระหว่างปรากฏการณ์ทางจิตและตัวบ่งชี้ ซึ่งปรากฏการณ์ทางจิตเหล่านี้พยายามรับรู้ แสดงให้เห็นว่าความตั้งใจของผู้เขียนและผลลัพธ์ของวิธีการตรงกัน

การตรวจสอบความถูกต้องทางทฤษฎีของเทคนิคใหม่ไม่ใช่เรื่องยาก หากมีเทคนิคที่ทราบและพิสูจน์แล้วสำหรับการวัดคุณสมบัติที่กำหนด การมีอยู่ของความสัมพันธ์ระหว่างเทคนิคใหม่และเทคนิคเก่าที่คล้ายกันบ่งชี้ว่าเทคนิคที่พัฒนาขึ้นนั้นวัดคุณภาพทางจิตวิทยาเช่นเดียวกับเทคนิคอ้างอิง และหากวิธีการใหม่ในเวลาเดียวกันมีขนาดกะทัดรัดและประหยัดมากขึ้นในการดำเนินการและประมวลผลผลลัพธ์ นักจิตวินิจฉัยก็มีโอกาสที่จะใช้เครื่องมือใหม่แทนเครื่องมือเก่า เทคนิคนี้มักใช้ในสรีรวิทยาเชิงอนุพันธ์เมื่อสร้างวิธีการวินิจฉัยคุณสมบัติพื้นฐานของระบบประสาทของมนุษย์ (ดูบทที่ 7)

แต่ความถูกต้องทางทฤษฎีได้รับการพิสูจน์ไม่เพียงแต่โดยการเปรียบเทียบกับตัวบ่งชี้ที่เกี่ยวข้องเท่านั้น แต่ยังรวมถึงตัวบ่งชี้ที่ไม่ควรมีการเชื่อมโยงที่มีนัยสำคัญตามสมมติฐานด้วย ดังนั้น ในการตรวจสอบความถูกต้องทางทฤษฎี ในด้านหนึ่ง สิ่งสำคัญคือต้องสร้างระดับของการเชื่อมต่อกับเทคนิคที่เกี่ยวข้อง (ความถูกต้องแบบลู่เข้า) และการไม่มีความเกี่ยวข้องกับเทคนิคที่มีพื้นฐานทางทฤษฎีที่แตกต่างกัน (ความถูกต้องแบบจำแนก)

การตรวจสอบความถูกต้องทางทฤษฎีของเทคนิคนั้นยากกว่ามากเมื่อเส้นทางดังกล่าวเป็นไปไม่ได้ บ่อยครั้งนี่คือสถานการณ์ที่นักวิจัยเผชิญ ในสถานการณ์เช่นนี้ เฉพาะการสะสมข้อมูลต่างๆ เกี่ยวกับทรัพย์สินที่กำลังศึกษา การวิเคราะห์สถานที่ทางทฤษฎีและข้อมูลการทดลองอย่างค่อยเป็นค่อยไป และประสบการณ์ที่สำคัญในการทำงานกับเทคนิคนี้เท่านั้นที่ทำให้สามารถเปิดเผยความหมายทางจิตวิทยาได้

มีบทบาทสำคัญในการทำความเข้าใจว่ามาตรการวิธีการใดที่เล่นโดยการเปรียบเทียบตัวบ่งชี้กับรูปแบบกิจกรรมเชิงปฏิบัติ แต่สิ่งสำคัญอย่างยิ่งคือจะต้องใช้วิธีการทางทฤษฎีอย่างละเอียดถี่ถ้วน เช่น เพื่อให้มีพื้นฐานทางวิทยาศาสตร์ที่มั่นคงและมั่นคง แล้วเมื่อเปรียบเทียบวิธีการกับที่นำมาจาก

การปฏิบัติในชีวิตประจำวันโดยใช้เกณฑ์ภายนอกที่สอดคล้องกับสิ่งที่วัด สามารถรับข้อมูลที่สนับสนุนแนวคิดทางทฤษฎีเกี่ยวกับสาระสำคัญของมันได้

สิ่งสำคัญคือต้องจำไว้ว่าหากพิสูจน์ความถูกต้องทางทฤษฎีแล้ว การตีความตัวบ่งชี้ที่ได้รับจะมีความชัดเจนและไม่คลุมเครือมากขึ้นและชื่อของเทคนิคนั้นสอดคล้องกับขอบเขตของการประยุกต์ใช้

สำหรับการตรวจสอบเชิงปฏิบัตินั้นเกี่ยวข้องกับการทดสอบเทคนิคในแง่ของประสิทธิผลในทางปฏิบัติ ความสำคัญ และประโยชน์ ให้ความสำคัญเป็นอย่างยิ่ง โดยเฉพาะอย่างยิ่งเมื่อเกิดคำถามเกี่ยวกับการคัดเลือก การพัฒนาและการใช้เทคนิคการวินิจฉัยจะสมเหตุสมผลก็ต่อเมื่อมีสมมติฐานที่สมเหตุสมผลว่าคุณภาพที่วัดนั้นแสดงออกมาในบางสถานการณ์ในชีวิตในกิจกรรมบางประเภท

หากเราย้อนกลับไปดูประวัติความเป็นมาของการพัฒนาอัณฑะอีกครั้ง (A Anastasi, 1982; B.S. Avanesov, 1982; K.M. Gurevich, 1970; "General psychodiagnostics", 1987; B.M. Teplov, 1985 เป็นต้น) จากนั้นเราสามารถเน้นดังกล่าวได้ ช่วง (20 -30 วินาที) ซึ่งเป็นช่วงที่เนื้อหาทางวิทยาศาสตร์ของการทดสอบและ "สัมภาระ" ทางทฤษฎีไม่ค่อยน่าสนใจ สิ่งสำคัญคือการทดสอบ "งาน" และช่วยเลือกคนที่พร้อมที่สุดได้อย่างรวดเร็ว เกณฑ์เชิงประจักษ์สำหรับการประเมินงานทดสอบถือเป็นแนวทางที่ถูกต้องเพียงข้อเดียวในการแก้ปัญหาทางวิทยาศาสตร์และประยุกต์

การใช้เทคนิคการวินิจฉัยโดยอาศัยเหตุผลเชิงประจักษ์ล้วนๆ โดยไม่มีพื้นฐานทางทฤษฎีที่ชัดเจน มักนำไปสู่ข้อสรุปเชิงวิทยาศาสตร์เทียมและข้อเสนอแนะเชิงปฏิบัติที่ไม่ยุติธรรม ไม่สามารถระบุความสามารถและคุณสมบัติที่การทดสอบเปิดเผยได้แน่ชัด บี.เอ็ม. Teplov วิเคราะห์การทดสอบในช่วงเวลานั้น เรียกพวกเขาว่า "การทดสอบแบบตาบอด" (1985)

แนวทางแก้ไขปัญหาความถูกต้องของการทดสอบนี้เป็นเรื่องปกติจนถึงต้นทศวรรษที่ 50 ไม่เพียงแต่ในสหรัฐอเมริกาเท่านั้น แต่ยังรวมถึงประเทศอื่นๆ ด้วย จุดอ่อนทางทฤษฎีของวิธีการตรวจสอบเชิงประจักษ์ไม่สามารถกระตุ้นการวิพากษ์วิจารณ์จากนักวิทยาศาสตร์เหล่านั้นที่ในการพัฒนาการทดสอบ ไม่เพียงแต่อาศัยประสบการณ์และการปฏิบัติที่ "เปลือยเปล่า" เท่านั้น แต่ยังรวมถึงแนวคิดทางทฤษฎีด้วย อย่างที่เราทราบกันดีว่าการปฏิบัติโดยปราศจากทฤษฎีนั้นตาบอด และทฤษฎีที่ปราศจากการปฏิบัตินั้นก็ตายไปแล้ว ปัจจุบันการประเมินความถูกต้องของวิธีการทั้งทางทฤษฎีและเชิงปฏิบัติถูกมองว่ามีประสิทธิผลมากที่สุด

เพื่อดำเนินการตรวจสอบความถูกต้องเชิงปฏิบัติของวิธีการ เช่น ในการประเมินประสิทธิผลประสิทธิภาพและความสำคัญในทางปฏิบัติมักใช้เกณฑ์ภายนอกที่เป็นอิสระซึ่งเป็นตัวบ่งชี้การสำแดงของทรัพย์สินที่กำลังศึกษาอยู่ในชีวิตประจำวัน เกณฑ์ดังกล่าวอาจเป็นผลการเรียน (สำหรับการทดสอบความสามารถในการเรียนรู้, การทดสอบความสำเร็จ, การทดสอบสติปัญญา), ความสำเร็จในการผลิต (สำหรับวิธีการปฐมนิเทศวิชาชีพ), ประสิทธิผลของกิจกรรมจริง - การวาดภาพ, การสร้างแบบจำลอง ฯลฯ (สำหรับการทดสอบความสามารถพิเศษ) การประเมินอัตนัย (สำหรับการทดสอบบุคลิกภาพ)

นักวิจัยชาวอเมริกัน Tiffin และ McCormick (1968) หลังจากวิเคราะห์เกณฑ์ภายนอกที่ใช้ในการพิสูจน์ความถูกต้องแล้ว ให้ระบุสี่ประเภท:

1) เกณฑ์การปฏิบัติงาน (ซึ่งอาจรวมถึง เช่น จำนวนงานที่สำเร็จ ผลการเรียน เวลาที่ใช้ในการฝึกอบรม อัตราการเติบโต

คุณสมบัติ ฯลฯ );

2) เกณฑ์เชิงอัตนัย (รวมถึงคำตอบประเภทต่าง ๆ ที่สะท้อนถึงทัศนคติของบุคคลต่อบางสิ่งหรือบางคน ความคิดเห็น มุมมอง ความชอบของเขา โดยทั่วไปเกณฑ์เชิงอัตนัยจะได้มาจากการสัมภาษณ์ แบบสอบถาม แบบสอบถาม)

3) เกณฑ์ทางสรีรวิทยา (ใช้เพื่อศึกษาอิทธิพลของสภาพแวดล้อมและตัวแปรสถานการณ์อื่น ๆ ต่อร่างกายมนุษย์และจิตใจ วัดอัตราชีพจร ความดันโลหิต ความต้านทานไฟฟ้าของผิวหนัง อาการของความเมื่อยล้า ฯลฯ )

4) เกณฑ์การเกิดอุบัติเหตุ (ใช้เมื่อวัตถุประสงค์ของการศึกษาเกี่ยวข้อง เช่น ปัญหาในการคัดเลือกงานบุคคลที่มีความอ่อนไหวต่ออุบัติเหตุน้อยกว่า)

เกณฑ์ภายนอกต้องเป็นไปตามข้อกำหนดพื้นฐานสามประการ:

จะต้องมีความเกี่ยวข้อง ปราศจากการปนเปื้อน และเชื่อถือได้

ความเกี่ยวข้องหมายถึงความสอดคล้องทางความหมายของเครื่องมือวินิจฉัยกับเกณฑ์สำคัญที่เป็นอิสระ กล่าวอีกนัยหนึ่ง จะต้องมีความมั่นใจว่าเกณฑ์นั้นเกี่ยวข้องกับคุณลักษณะของจิตใจส่วนบุคคลที่วัดโดยเทคนิคการวินิจฉัยอย่างแม่นยำ เกณฑ์ภายนอกและเทคนิคการวินิจฉัยจะต้องอยู่ในการติดต่อทางความหมายภายในซึ่งกันและกันและเป็นเนื้อเดียวกันในเชิงคุณภาพในสาระสำคัญทางจิตวิทยา (K.M. Gurevich, 1985) ตัวอย่างเช่น หากการทดสอบวัดลักษณะเฉพาะของการคิด ความสามารถในการดำเนินการเชิงตรรกะกับวัตถุและแนวคิดบางอย่าง เกณฑ์ก็ควรมองหาการแสดงทักษะเหล่านี้อย่างชัดเจน สิ่งนี้ใช้ได้กับกิจกรรมทางวิชาชีพอย่างเท่าเทียมกัน ไม่ได้มีเพียงเป้าหมายเดียว แต่มีหลายเป้าหมายและวัตถุประสงค์ ซึ่งแต่ละเป้าหมายมีความเฉพาะเจาะจงและกำหนดเงื่อนไขในการดำเนินการของตนเอง นี่แสดงถึงการมีอยู่ของเกณฑ์หลายประการในการดำเนินกิจกรรมทางวิชาชีพ ดังนั้นความสำเร็จในเทคนิคการวินิจฉัยจึงไม่ควรนำมาเปรียบเทียบกับประสิทธิภาพการผลิตโดยทั่วไป มีความจำเป็นต้องค้นหาเกณฑ์ที่ขึ้นอยู่กับลักษณะของการปฏิบัติงานที่ดำเนินการ มีความสัมพันธ์กับวิธีการ

หากไม่ทราบเกี่ยวกับเกณฑ์ภายนอกไม่ว่าจะเกี่ยวข้องกับคุณสมบัติที่กำลังวัดหรือไม่ก็ตาม การเปรียบเทียบผลลัพธ์ของเทคนิคการวินิจฉัยทางจิตกับเกณฑ์นั้นก็ไร้ประโยชน์ในทางปฏิบัติ ไม่อนุญาตให้มีการสรุปใดๆ ที่สามารถประเมินความถูกต้องของวิธีการได้

ข้อกำหนดสำหรับการปลอดจากการปนเปื้อนมีสาเหตุมาจากข้อเท็จจริงที่ว่า ตัวอย่างเช่น ความสำเร็จทางการศึกษาหรืออุตสาหกรรมขึ้นอยู่กับตัวแปรสองประการ: ขึ้นอยู่กับตัวบุคคล ลักษณะเฉพาะของเขา วัดโดยวิธีการ และขึ้นอยู่กับสถานการณ์ การศึกษา และสภาพการทำงาน ซึ่งสามารถ แนะนำการรบกวนและ "ปนเปื้อน" เกณฑ์ที่ใช้ เพื่อหลีกเลี่ยงปัญหานี้ ควรเลือกกลุ่มคนที่อยู่ในสภาพที่เหมือนกันไม่มากก็น้อยเพื่อการวิจัย สามารถใช้วิธีอื่นได้ ประกอบด้วยการแก้ไขอิทธิพลของการรบกวน การปรับเปลี่ยนนี้มักจะมีลักษณะทางสถิติ ตัวอย่างเช่น ผลผลิตไม่ควรคำนึงถึงในแง่สัมบูรณ์ แต่สัมพันธ์กับผลผลิตโดยเฉลี่ยของคนงานที่ทำงานภายใต้เงื่อนไขที่คล้ายคลึงกัน

เมื่อพวกเขากล่าวว่าเกณฑ์จะต้องมีความน่าเชื่อถือที่มีนัยสำคัญทางสถิติ นั่นหมายความว่าเกณฑ์นั้นจะต้องสะท้อนถึงความคงตัวและความเสถียรของฟังก์ชันที่กำลังศึกษา

การค้นหาเกณฑ์ที่เพียงพอและระบุได้ง่ายเป็นงานตรวจสอบความถูกต้องที่สำคัญและซับซ้อน ในการทดสอบแบบตะวันตก วิธีการหลายวิธีถูกตัดสิทธิ์เพียงเพราะไม่สามารถหาเกณฑ์ที่เหมาะสมสำหรับการทดสอบได้ ตัวอย่างเช่น แบบสอบถามส่วนใหญ่มีข้อมูลความถูกต้องที่น่าสงสัย เนื่องจากเป็นการยากที่จะค้นหาเกณฑ์ภายนอกที่เพียงพอซึ่งสอดคล้องกับสิ่งที่พวกเขาวัด

การประเมินความถูกต้องของวิธีการอาจเป็นได้ทั้งเชิงปริมาณและเชิงคุณภาพ

ในการคำนวณตัวบ่งชี้เชิงปริมาณ - ค่าสัมประสิทธิ์ความถูกต้อง - ผลลัพธ์ที่ได้รับเมื่อใช้เทคนิคการวินิจฉัยจะถูกเปรียบเทียบกับข้อมูลที่ได้รับโดยใช้เกณฑ์ภายนอกสำหรับบุคคลเดียวกัน มีการใช้ความสัมพันธ์เชิงเส้นประเภทต่างๆ (อ้างอิงจาก Spearman ตาม Pearson)

ต้องใช้วิชากี่วิชาในการคำนวณความถูกต้อง? การปฏิบัติแสดงให้เห็นว่าไม่ควรน้อยกว่า 50 แต่มากกว่า 200 ดีที่สุด คำถามมักจะเกิดขึ้น ค่าสัมประสิทธิ์ความถูกต้องควรเป็นเท่าใดจึงจะถือว่ายอมรับได้ โดยทั่วไป สังเกตได้ว่าค่าสัมประสิทธิ์ความถูกต้องมีนัยสำคัญทางสถิติก็เพียงพอแล้ว ค่าสัมประสิทธิ์ความถูกต้องประมาณ 0.20-0.30 ถือว่าต่ำ เฉลี่ย - 0.30-0.50 และสูง - มากกว่า 0.60

แต่ดังที่ A. Anastasi (1982) เน้นย้ำว่า K.M. Gurevich (1970) และคนอื่นๆ การใช้ความสัมพันธ์เชิงเส้นเพื่อคำนวณค่าสัมประสิทธิ์ความถูกต้องไม่ถูกต้องเสมอไป เทคนิคนี้จะพิสูจน์ได้ก็ต่อเมื่อได้รับการพิสูจน์แล้วว่าความสำเร็จในบางกิจกรรมเป็นสัดส่วนโดยตรงกับความสำเร็จในการตรวจวินิจฉัย ตำแหน่งของนักทำข้อสอบชาวต่างชาติ โดยเฉพาะอย่างยิ่งผู้ที่เกี่ยวข้องกับความเหมาะสมและการคัดเลือกทางวิชาชีพ ส่วนใหญ่มักจะมาจากการยอมรับอย่างไม่มีเงื่อนไขว่าผู้ที่ทำข้อสอบได้สำเร็จมากกว่าจะเหมาะสมกับวิชาชีพนั้นมากกว่า แต่อาจเป็นไปได้ด้วยว่าการที่จะประสบความสำเร็จในกิจกรรมนั้น คุณต้องมีคุณสมบัติที่ระดับ 40% ของโซลูชันการทดสอบ ความสำเร็จเพิ่มเติมในการทดสอบไม่มีความสำคัญต่ออาชีพนี้อีกต่อไป ตัวอย่างที่ชัดเจนจากเอกสารของ KM Gurevich: บุรุษไปรษณีย์ต้องสามารถอ่านได้ แต่ไม่ว่าเขาจะอ่านด้วยความเร็วปกติหรือที่ความเร็วสูงมาก - สิ่งนี้ไม่มีอีกต่อไป ความสำคัญทางวิชาชีพ ด้วยความสัมพันธ์ระหว่างตัวบ่งชี้วิธีการและเกณฑ์ภายนอก วิธีที่เหมาะสมที่สุดในการสร้างความถูกต้องอาจเป็นเกณฑ์ความแตกต่าง

อีกกรณีหนึ่งก็เป็นไปได้เช่นกัน: ระดับทรัพย์สินที่สูงกว่าที่อาชีพกำหนดจะขัดขวางความสำเร็จในวิชาชีพ ดังนั้น เอฟ. เทย์เลอร์จึงพบว่าพนักงานฝ่ายผลิตหญิงที่ได้รับการพัฒนามากที่สุดมีผลิตภาพแรงงานต่ำ นั่นคือการพัฒนาจิตใจในระดับสูงขัดขวางไม่ให้พวกเขาทำงานได้อย่างมีประสิทธิผลสูง ในกรณีนี้ การวิเคราะห์ความแปรปรวนหรือการคำนวณความสัมพันธ์สหสัมพันธ์จะเหมาะสมกว่าในการคำนวณค่าสัมประสิทธิ์ความถูกต้อง

ตามที่ประสบการณ์ของนักทดสอบชาวต่างประเทศแสดงให้เห็น ไม่มีขั้นตอนทางสถิติใดที่สามารถสะท้อนความหลากหลายของการประเมินรายบุคคลได้อย่างเต็มที่ ดังนั้นจึงมักใช้แบบจำลองอื่นเพื่อพิสูจน์ความถูกต้องของวิธีการ - การประเมินทางคลินิก นี่ไม่ใช่อะไรมากไปกว่าคำอธิบายเชิงคุณภาพของสาระสำคัญของสิ่งที่กำลังศึกษา

คุณสมบัติ. ในกรณีนี้ เรากำลังพูดถึงการใช้เทคนิคที่ไม่ต้องใช้การประมวลผลทางสถิติ

ความถูกต้องมีหลายประเภทเนื่องจากลักษณะของเทคนิคการวินิจฉัยเช่นเดียวกับสถานะชั่วคราวของเกณฑ์ภายนอก ในงานหลายชิ้น (A Anastasi, 1982; L.F. Burlachuk, SM. Morozov, 1989; KM. Gurevich, 1970; B.V. Kulagin, 1984; B. Cherny, 1983; “General Psychodiagnostics”, 1987 เป็นต้น) สิ่งต่อไปนี้มักเรียกว่า: 1.

ความถูกต้องของเนื้อหา เทคนิคนี้ใช้เป็นหลักในการทดสอบวัดผลสัมฤทธิ์ โดยทั่วไปแล้ว แบบทดสอบวัดผลสัมฤทธิ์จะไม่รวมเนื้อหาทั้งหมดที่นักเรียนครอบคลุม แต่มีบางส่วนเท่านั้น (คำถาม 3-4 ข้อ) คุณแน่ใจหรือไม่ว่าคำตอบที่ถูกต้องสำหรับคำถามสองสามข้อเหล่านี้บ่งชี้ว่าคุณเชี่ยวชาญเนื้อหาทั้งหมดแล้ว นี่คือสิ่งที่การทดสอบความถูกต้องของเนื้อหาควรตอบ ในการทำเช่นนี้ จะมีการเปรียบเทียบความสำเร็จของการทดสอบกับการประเมินโดยผู้เชี่ยวชาญของครู (ตามเนื้อหานี้) ความถูกต้องของเนื้อหายังใช้กับการทดสอบที่อ้างอิงตามเกณฑ์ด้วย เทคนิคนี้บางครั้งเรียกว่าความถูกต้องเชิงตรรกะ 2.

ความถูกต้องที่เกิดขึ้นพร้อมกันหรือความถูกต้องต่อเนื่อง ถูกกำหนดโดยเกณฑ์ภายนอกซึ่งข้อมูลจะถูกเก็บรวบรวมพร้อมกับการทดลองของขั้นตอนที่กำลังทดสอบ กล่าวอีกนัยหนึ่ง ข้อมูลจะถูกเก็บรวบรวมที่เกี่ยวข้องกับประสิทธิภาพปัจจุบันระหว่างช่วงการทดสอบ ประสิทธิภาพในช่วงเวลาเดียวกัน ฯลฯ ซึ่งสัมพันธ์กับสิ่งนี้คืออัตราความสำเร็จของการทดสอบ

ความถูกต้อง "เชิงคาดการณ์" (อีกชื่อหนึ่งคือ ความถูกต้อง "เชิงคาดการณ์") นอกจากนี้ยังถูกกำหนดโดยเกณฑ์ภายนอกที่ค่อนข้างเชื่อถือได้ แต่ข้อมูลจะถูกรวบรวมหลังจากการทดสอบระยะหนึ่ง เกณฑ์ภายนอกมักจะเป็นความสามารถของบุคคลซึ่งแสดงในการประเมินบางประเภทสำหรับประเภทของกิจกรรมที่เขาได้รับเลือกตามผลการทดสอบวินิจฉัย แม้ว่าเทคนิคนี้จะสอดคล้องกับงานเทคนิคการวินิจฉัยมากที่สุด - การทำนายความสำเร็จในอนาคต แต่ก็เป็นเรื่องยากมากที่จะนำไปใช้ ความแม่นยำของการพยากรณ์จะแปรผกผันกับเวลาที่ระบุไว้สำหรับการพยากรณ์ดังกล่าว ยิ่งเวลาผ่านไปหลังการวัดนานเท่าใด จำนวนปัจจัยที่ต้องนำมาพิจารณาในการประเมินความสำคัญในการพยากรณ์ของเทคนิคก็จะยิ่งมากขึ้นเท่านั้น อย่างไรก็ตาม แทบจะเป็นไปไม่ได้เลยที่จะคำนึงถึงปัจจัยทั้งหมดที่มีอิทธิพลต่อการทำนาย 4.

กระบวนทัศน์วิทยาศาสตร์ธรรมชาติและมนุษยศาสตร์ทางจิตวิทยา

ประวัติศาสตร์ทั้งหมดของการพัฒนาจิตวิทยาสามารถอธิบายได้ว่าเป็นความสัมพันธ์ระหว่างสองแนวทางที่ขัดแย้งกัน - วิทยาศาสตร์ธรรมชาติและมนุษยศาสตร์ และในทศวรรษที่ผ่านมา มีการแทนที่แนวทางแรกทีละน้อยอย่างค่อยเป็นค่อยไป ในขั้นต้น อริสโตเติลแย้งว่าการศึกษาเรื่องจิตวิญญาณเป็นงานของนักวิทยาศาสตร์ธรรมชาติ สถานการณ์ปัจจุบันถือเป็นวิกฤตของความพยายามที่จะสร้างจิตวิทยาตามแบบจำลองของวิทยาศาสตร์ธรรมชาติ การมีอยู่ของจิตวิทยาแยกส่วนที่ไม่สามารถนำมาประกอบกับสายวิทยาศาสตร์ธรรมชาติได้ (จิตวิเคราะห์ จิตวิทยาเห็นอกเห็นใจ โลโก้บำบัด) มีแต่ทำให้สถานการณ์วิกฤตรุนแรงขึ้นเท่านั้น

แต่ในทางจิตวิทยาของรัสเซียในปัจจุบันตามที่ V.I. Slobodchikova และ E.I. Isaev แนวทางที่มีอยู่ยังคงมุ่งสู่วิทยาศาสตร์ธรรมชาติ สู่ความเป็นกลาง สู่การวัดและการทดลอง ซึ่งเป็นอุดมคติของวิทยาศาสตร์ จิตวิทยาโซเวียตได้รับการพัฒนาให้เป็นวินัยทางวิชาการและทางวิทยาศาสตร์ ในช่วงไม่กี่ปีที่ผ่านมา จิตวิทยามนุษยนิยมเริ่มเป็นรูปเป็นร่างภายใต้กรอบของการปฏิบัติทางจิตวิทยา ความจำเป็นในการสร้างทฤษฎีจิตเทคนิคพิเศษได้รับการตระหนักแล้วเช่น ทฤษฎีที่ยืนยันวิทยาศาสตร์ของมนุษย์และการปฏิบัติทางจิตวิทยา โดยพื้นฐานแล้ว นี่หมายถึงการสร้างจิตวิทยามนุษยนิยมเป็นทางเลือกแทนจิตวิทยาเชิงวิชาการด้านวิทยาศาสตร์ธรรมชาติ

วี.เอ็น. Surkov ตั้งข้อสังเกตว่าความพยายามของนักจิตวิทยาเพื่อให้เป็นไปตามมาตรฐานวิทยาศาสตร์ธรรมชาติในด้านปฏิสัมพันธ์ระหว่างทฤษฎีและการทดลองได้นำไปสู่ ​​"ความเครียดเชิงบวกเชิงบวก" ในด้านจิตวิทยา ปฏิกิริยาป้องกันของนักจิตวิทยาต่อแรงกดดันของ "พิธีกรรมเชิงบวก" คือการใช้ "วิธีการเงา" อย่างกว้างขวาง (ประเพณีของการกำหนดสมมติฐานหลังจากดำเนินการวิจัย โดยได้มาจากข้อมูลที่ได้รับและไม่ใช่จากทฤษฎี โดยเลือกเฉพาะข้อมูลเชิงประจักษ์ที่ "สะดวก" เท่านั้น ฯลฯ)

สาเหตุหลักที่ขัดขวางไม่ให้มีการสร้างจิตวิทยาในฐานะวิทยาศาสตร์ธรรมชาติคือ:

o ธรรมชาติทางจิตวิญญาณของต้นกำเนิดของมนุษย์ซึ่งไม่อนุญาตให้เราถือว่าเขาเป็นวัตถุของธรรมชาติแรกหรือกลไก

ปฏิกิริยาสะท้อนกลับและกิจกรรมของมนุษย์ ความเป็นไปไม่ได้ที่จะควบคุมบุคคล - สัมพันธ์กับบุคคล ตำแหน่งที่เข้าใจ ความรัก ความช่วยเหลือ การสนับสนุน เป็นเรื่องธรรมชาติ

เหตุผลเหล่านี้คล้ายคลึงกับลักษณะเฉพาะของความรู้ด้านมนุษยธรรมเพราะว่า บุคคลทำหน้าที่เป็นคุณค่าทางจิตวิญญาณ และไม่ใช่แค่เป็น "เป้าหมายของการวิจัย" เป้าหมายหลักของจิตวิทยาคือการเข้าใจบุคคลอื่น อธิบายปรากฏการณ์ทางจิตวิญญาณหรือวัฒนธรรมบางอย่าง และให้ความหมาย ธรรมชาติของการสะท้อนกลับของความรู้ทางจิตวิทยานั้นแสดงออกมาในอิทธิพลร่วมกันของวิชาและวัตถุของความรู้ จุดเน้นของจิตวิทยาไม่เพียงแต่สันนิษฐานว่าเป็นเพียงความเข้าใจเท่านั้น แต่เป็นบทสนทนาระหว่างผู้วิจัยกับวัตถุที่กำลังศึกษาอยู่

ดังนั้นการประยุกต์ใช้ข้อกำหนดของมาตรฐานวิทยาศาสตร์ธรรมชาติในด้านจิตวิทยาจึงมีจำกัด ตามที่ผู้เขียนหลายคนกล่าวว่าแม้แต่การทดลองทางจิตวิทยาซึ่งไม่ต้องพูดถึงความรู้ทางจิตวิทยาที่ซับซ้อนทั้งหมดก็ควรถูกสร้างขึ้นตามหลักการด้านมนุษยธรรม

บทสรุป

ส่วนสำคัญของการอภิปรายเกี่ยวกับสถานะทางวิทยาศาสตร์ของจิตวิทยานั้นเชื่อมโยงไม่มากนักกับการอภิปรายในคำถามที่ว่าจิตวิทยาเป็นวิทยาศาสตร์หรือไม่ แต่ด้วยคำถามว่ามาตรฐานใด (วิทยาศาสตร์ธรรมชาติหรือมนุษยธรรม) ควรได้รับคำแนะนำจาก (และ ควรเป็นไปตามเกณฑ์ลักษณะทางวิทยาศาสตร์)

นักจิตวิทยาชาวต่างชาติมีแนวโน้มที่จะรับรู้จิตวิทยาภายใต้กรอบของจิตวิทยามนุษยธรรมมากกว่า ในขณะที่นักจิตวิทยาในประเทศยังคงให้ความสำคัญกับความรู้ด้านจิตวิทยาด้านมนุษยธรรมน้อยกว่าเมื่อเปรียบเทียบกับวิทยาศาสตร์ธรรมชาติ แต่แนวโน้มในช่วงไม่กี่ปีที่ผ่านมายังคงเป็นความเป็นมนุษย์ของความรู้เกี่ยวกับความเป็นจริงทางจิต ดังที่ผู้เขียนหลายคนชี้ให้เห็นอย่างถูกต้อง การได้มาซึ่งความรู้ทางจิตวิทยาควรอยู่บนพื้นฐานกระบวนทัศน์ด้านมนุษยธรรม แต่เพื่อพิสูจน์ข้อเท็จจริงที่เถียงไม่ได้ จึงมีการใช้กระบวนทัศน์วิทยาศาสตร์ธรรมชาติ เช่น ทั้งสองกระบวนทัศน์ในการศึกษาความเป็นจริงทางจิตเป็นสิ่งที่จำเป็น

แต่ตามความเห็นของนักจิตวิทยาส่วนใหญ่ จากมุมมองของโอกาสสำหรับกิจกรรมการวิจัย มันอยู่ในกรอบของมนุษยธรรมของความรู้ที่มีการกำหนดงานที่ซับซ้อนอย่างแท้จริง ซึ่งเป็นความท้าทายที่คุ้มค่าสำหรับชุมชนวิทยาศาสตร์

เกณฑ์ความถูกต้องนำไปใช้กับการวิจัยเชิงคุณภาพ

ความถูกต้องของเทคนิคการวินิจฉัยทางจิต

หลังจากความน่าเชื่อถือแล้ว เกณฑ์สำคัญอีกประการหนึ่งในการประเมินคุณภาพของวิธีการก็คือความถูกต้อง คำถามเกี่ยวกับความถูกต้องของเทคนิคจะได้รับการแก้ไขหลังจากที่มีการสร้างความน่าเชื่อถือเพียงพอแล้วเท่านั้น เนื่องจากเทคนิคที่ไม่น่าเชื่อถือไม่สามารถใช้ได้ แต่เทคนิคที่น่าเชื่อถือที่สุดโดยปราศจากความรู้เกี่ยวกับความถูกต้องนั้นไม่มีประโยชน์ในทางปฏิบัติ

ควรสังเกตว่าคำถามเกี่ยวกับความถูกต้องจนกระทั่งเมื่อเร็ว ๆ นี้ดูเหมือนจะเป็นปัญหาที่ยากที่สุดข้อหนึ่ง คำจำกัดความที่ได้รับการยอมรับมากที่สุดของแนวคิดนี้คือคำจำกัดความที่ให้ไว้ในหนังสือของ A. Anastasi: "ความถูกต้องของการทดสอบคือแนวคิดที่บอกเราว่าการทดสอบใช้มาตรการอะไรและทำงานได้ดีเพียงใด"

ความถูกต้องที่เป็นแกนกลางเป็นคุณลักษณะที่ซับซ้อน ในด้านหนึ่ง ข้อมูลดังกล่าวรวมถึงข้อมูลว่าเทคนิคนี้เหมาะสมสำหรับการวัดว่าเทคนิคนี้ถูกสร้างขึ้นมาเพื่ออะไร และในทางกลับกัน ความมีประสิทธิภาพ ประสิทธิผล และประโยชน์เชิงปฏิบัติของเทคนิคนั้นเป็นอย่างไร

ด้วยเหตุนี้ จึงไม่มีแนวทางสากลเดียวในการกำหนดความถูกต้อง ขึ้นอยู่กับแง่มุมของความถูกต้องที่ผู้วิจัยต้องการพิจารณา จะใช้วิธีการแสดงหลักฐานที่แตกต่างกัน กล่าวอีกนัยหนึ่ง แนวคิดเรื่องความถูกต้องรวมถึงประเภทต่างๆ ซึ่งมีความหมายพิเศษในตัวเอง การตรวจสอบความถูกต้องของวิธีการเรียกว่าการตรวจสอบความถูกต้อง

ความถูกต้องในการทำความเข้าใจครั้งแรกนั้นเกี่ยวข้องกับวิธีการของตัวเอง กล่าวคือ ความถูกต้องของเครื่องมือวัด การทดสอบประเภทนี้เรียกว่าการตรวจสอบความถูกต้องทางทฤษฎี ความถูกต้องในความเข้าใจที่สองไม่ได้หมายถึงวิธีการมากนักเกี่ยวกับวัตถุประสงค์ของการใช้งาน นี่คือการตรวจสอบเชิงปฏิบัติ

โดยสรุปเราสามารถพูดได้ดังต่อไปนี้:

ในระหว่างการตรวจสอบความถูกต้องทางทฤษฎี ผู้วิจัยมีความสนใจในคุณสมบัติที่วัดโดยเทคนิค โดยพื้นฐานแล้วหมายความว่ากำลังมีการตรวจสอบความถูกต้องทางจิตวิทยา

ด้วยการตรวจสอบเชิงปฏิบัติ สาระสำคัญของการวัดผล (ทรัพย์สินทางจิตวิทยา) จึงไม่อยู่ในสายตา จุดเน้นหลักคือการพิสูจน์ว่าบางสิ่งที่วัดด้วยเทคนิคมีความสัมพันธ์กับขอบเขตการปฏิบัติบางประการ

การดำเนินการตรวจสอบความถูกต้องทางทฤษฎี ตรงกันข้ามกับการตรวจสอบเชิงปฏิบัติ บางครั้งกลายเป็นเรื่องยากกว่ามาก โดยไม่ต้องลงรายละเอียดเฉพาะเจาะจงในตอนนี้ ให้เราพิจารณาในแง่ทั่วไปเกี่ยวกับวิธีการตรวจสอบความถูกต้องเชิงปฏิบัติ: เกณฑ์ภายนอกบางประการ ที่ไม่ขึ้นอยู่กับวิธีการ ได้รับการคัดเลือกเพื่อกำหนดความสำเร็จในกิจกรรมเฉพาะ (ด้านการศึกษา วิชาชีพ ฯลฯ) และด้วย มีการเปรียบเทียบผลลัพธ์ของเทคนิคการวินิจฉัย หากการเชื่อมต่อระหว่างพวกเขาถือว่าน่าพอใจจะมีการสรุปเกี่ยวกับความสำคัญเชิงปฏิบัติประสิทธิผลและประสิทธิภาพของเทคนิคการวินิจฉัย

ในการพิจารณาความถูกต้องทางทฤษฎี การค้นหาเกณฑ์อิสระที่อยู่นอกระเบียบวิธีจะยากกว่ามาก ดังนั้น ในช่วงแรกของการพัฒนาระบบทดสอบ เมื่อแนวคิดเรื่องความถูกต้องเพิ่งเป็นรูปเป็นร่าง มีแนวคิดตามสัญชาตญาณว่าการวัดผลการทดสอบ:

1) เทคนิคนี้เรียกว่าใช้ได้เนื่องจากสิ่งที่วัดได้ชัดเจน 2) การพิสูจน์ความถูกต้องนั้นขึ้นอยู่กับความเชื่อมั่นของผู้วิจัยว่าวิธีการของเขาทำให้เขาเข้าใจหัวข้อนั้น 3) เทคนิคนี้ถือว่าใช้ได้ (เช่น ข้อความที่ได้รับการยอมรับว่าการทดสอบดังกล่าววัดคุณภาพดังกล่าว) เพียงเพราะทฤษฎีที่ใช้เทคนิคนั้นดีมาก

การยอมรับข้อความที่ไม่มีมูลเกี่ยวกับความถูกต้องของวิธีการไม่สามารถดำเนินต่อไปได้เป็นเวลานาน การปรากฏตัวครั้งแรกของการวิจารณ์ทางวิทยาศาสตร์อย่างแท้จริงได้หักล้างแนวทางนี้: การค้นหาหลักฐานที่มีพื้นฐานทางวิทยาศาสตร์เริ่มต้นขึ้น

ดังนั้น การดำเนินการตรวจสอบความถูกต้องทางทฤษฎีของวิธีการก็เพื่อพิสูจน์ว่าวิธีการวัดนั้นวัดคุณสมบัติได้อย่างแม่นยำ ซึ่งเป็นคุณภาพที่ผู้วิจัยตั้งใจที่จะวัด

ตัวอย่างเช่น หากมีการพัฒนาแบบทดสอบเพื่อวินิจฉัยพัฒนาการทางจิตของเด็ก ก็จำเป็นต้องวิเคราะห์ว่าแบบทดสอบนั้นวัดพัฒนาการนี้ได้จริงหรือไม่ ไม่ใช่ลักษณะอื่นใด (เช่น บุคลิกภาพ อุปนิสัย ฯลฯ) ดังนั้น สำหรับการตรวจสอบความถูกต้องทางทฤษฎี ปัญหาสำคัญคือความสัมพันธ์ระหว่างปรากฏการณ์ทางจิตวิทยาและตัวชี้วัดของพวกเขา ซึ่งใช้ในการแสวงหาปรากฏการณ์ทางจิตวิทยาเหล่านี้ สิ่งนี้แสดงให้เห็นว่าความตั้งใจของผู้เขียนและผลลัพธ์ของวิธีการตรงกันมากน้อยเพียงใด

การตรวจสอบความถูกต้องทางทฤษฎีของเทคนิคใหม่ไม่ใช่เรื่องยาก หากมีเทคนิคที่ได้รับการพิสูจน์แล้วสำหรับการวัดคุณสมบัติที่กำหนด การมีความสัมพันธ์ระหว่างวิธีการใหม่และวิธีการทดสอบที่คล้ายคลึงกันแล้วบ่งชี้ว่าวิธีการที่พัฒนาขึ้นจะวัดคุณภาพทางจิตวิทยาเช่นเดียวกับวิธีอ้างอิง และหากวิธีการใหม่ในเวลาเดียวกันมีขนาดกะทัดรัดและประหยัดมากขึ้นในการดำเนินการและประมวลผลผลลัพธ์ นักจิตวินิจฉัยก็มีโอกาสที่จะใช้เครื่องมือใหม่แทนเครื่องมือเก่า

แต่ความถูกต้องทางทฤษฎีได้รับการพิสูจน์ไม่เพียงแต่โดยการเปรียบเทียบกับตัวชี้วัดที่เกี่ยวข้องเท่านั้น แต่ยังรวมถึงตัวชี้วัดที่ไม่ควรมีความสัมพันธ์ที่มีนัยสำคัญตามสมมติฐานด้วย ดังนั้น ในการตรวจสอบความถูกต้องทางทฤษฎี ในด้านหนึ่ง สิ่งสำคัญคือต้องสร้างระดับของการเชื่อมต่อกับเทคนิคที่เกี่ยวข้อง (ความถูกต้องแบบลู่เข้า) และการไม่มีความเกี่ยวข้องกับเทคนิคที่มีพื้นฐานทางทฤษฎีที่แตกต่างกัน (ความถูกต้องแบบจำแนก)

การตรวจสอบวิธีการทางทฤษฎีนั้นยากกว่ามากเมื่อวิธีการตรวจสอบดังกล่าวเป็นไปไม่ได้ บ่อยครั้งนี่คือสถานการณ์ที่นักวิจัยเผชิญ ในสถานการณ์เช่นนี้ เฉพาะการสะสมข้อมูลต่างๆ เกี่ยวกับทรัพย์สินที่กำลังศึกษา การวิเคราะห์สถานที่ทางทฤษฎีและข้อมูลการทดลองอย่างค่อยเป็นค่อยไป และประสบการณ์ที่สำคัญในการทำงานกับเทคนิคนี้เท่านั้นที่ทำให้สามารถเปิดเผยความหมายทางจิตวิทยาได้

มีบทบาทสำคัญในการทำความเข้าใจว่ามาตรการวิธีการใดที่เล่นโดยการเปรียบเทียบตัวบ่งชี้กับรูปแบบกิจกรรมเชิงปฏิบัติ แต่ที่นี่เป็นสิ่งสำคัญอย่างยิ่งที่วิธีการจะต้องดำเนินการอย่างรอบคอบในทางทฤษฎีนั่นคือมีพื้นฐานทางวิทยาศาสตร์ที่มั่นคงและมีรากฐานมาอย่างดี จากนั้น เมื่อเปรียบเทียบเทคนิคกับเกณฑ์ภายนอกที่นำมาจากการปฏิบัติในชีวิตประจำวันซึ่งสอดคล้องกับสิ่งที่วัด ก็จะได้ข้อมูลที่สนับสนุนแนวคิดทางทฤษฎีเกี่ยวกับสาระสำคัญของเทคนิคนั้น

สิ่งสำคัญคือต้องจำไว้ว่าหากพิสูจน์ความถูกต้องทางทฤษฎีแล้ว การตีความตัวบ่งชี้ที่ได้รับจะมีความชัดเจนและไม่คลุมเครือมากขึ้นและชื่อของเทคนิคนั้นสอดคล้องกับขอบเขตของการประยุกต์ใช้ สำหรับการตรวจสอบเชิงปฏิบัตินั้นเกี่ยวข้องกับการทดสอบเทคนิคจากมุมมองของประสิทธิผลในทางปฏิบัติความสำคัญและประโยชน์ของมันเนื่องจากสมเหตุสมผลที่จะใช้เทคนิคการวินิจฉัยก็ต่อเมื่อมีการพิสูจน์ว่าคุณสมบัติที่ถูกวัดนั้นแสดงออกมาในบางสถานการณ์ชีวิต ในกิจกรรมบางประเภท ให้ความสำคัญอย่างยิ่งโดยเฉพาะอย่างยิ่งเมื่อเกิดคำถามเกี่ยวกับการคัดเลือก

หากเราย้อนกลับไปดูประวัติความเป็นมาของการพัฒนาอสุจิอีกครั้งเราสามารถเน้นช่วงเวลา (20-30 ของศตวรรษที่ 20) ที่เนื้อหาทางวิทยาศาสตร์ของการทดสอบและสัมภาระทางทฤษฎีของพวกเขามีความสนใจน้อยลง สิ่งสำคัญคือการทดสอบต้องได้ผลและช่วยให้เลือกคนที่พร้อมที่สุดได้อย่างรวดเร็ว เกณฑ์เชิงประจักษ์สำหรับการประเมินงานทดสอบถือเป็นแนวทางที่ถูกต้องเพียงข้อเดียวในการแก้ปัญหาทางวิทยาศาสตร์และประยุกต์

การใช้เทคนิคการวินิจฉัยโดยอาศัยเหตุผลเชิงประจักษ์ล้วนๆ โดยไม่มีพื้นฐานทางทฤษฎีที่ชัดเจน มักนำไปสู่ข้อสรุปเชิงวิทยาศาสตร์เทียมและข้อเสนอแนะเชิงปฏิบัติที่ไม่ยุติธรรม ไม่สามารถระบุชื่อคุณลักษณะและคุณสมบัติที่การทดสอบเปิดเผยได้อย่างถูกต้อง โดยพื้นฐานแล้วมันเป็นการทดสอบแบบตาบอด

แนวทางแก้ไขปัญหาความถูกต้องของการทดสอบนี้เป็นเรื่องปกติจนถึงต้นทศวรรษที่ 50 ศตวรรษที่ XX ไม่เพียงแต่ในสหรัฐอเมริกาเท่านั้น แต่ยังรวมถึงประเทศอื่นๆ ด้วย จุดอ่อนทางทฤษฎีของวิธีการตรวจสอบเชิงประจักษ์ไม่สามารถกระตุ้นการวิพากษ์วิจารณ์จากนักวิทยาศาสตร์เหล่านั้นในการพัฒนาแบบทดสอบได้เรียกร้องให้อาศัยไม่เพียงแต่ในเชิงประจักษ์และการปฏิบัติเท่านั้น แต่ยังรวมถึงแนวคิดทางทฤษฎีด้วย อย่างที่เราทราบกันดีว่าการปฏิบัติโดยปราศจากทฤษฎีนั้นตาบอด และทฤษฎีที่ปราศจากการปฏิบัตินั้นก็ตายไปแล้ว ปัจจุบันการประเมินความถูกต้องของวิธีการทั้งทางทฤษฎีและปฏิบัติถือเป็นประสิทธิผลสูงสุด

ในการดำเนินการตรวจสอบเชิงปฏิบัติของเทคนิคเช่นเพื่อประเมินประสิทธิผลประสิทธิภาพและนัยสำคัญในทางปฏิบัติมักใช้เกณฑ์ภายนอกที่เป็นอิสระซึ่งเป็นตัวบ่งชี้การสำแดงของทรัพย์สินที่กำลังศึกษาอยู่ในชีวิตประจำวัน เกณฑ์ดังกล่าวอาจเป็นผลการเรียน (สำหรับการทดสอบความสามารถในการเรียนรู้, การทดสอบผลสัมฤทธิ์ทางการเรียน, การทดสอบสติปัญญา) และความสำเร็จในการผลิต (สำหรับวิธีการที่มุ่งเน้นทางวิชาชีพ) และประสิทธิผลของกิจกรรมจริง - การวาดภาพ, การสร้างแบบจำลอง ฯลฯ (สำหรับการทดสอบพิเศษ ความสามารถ) การประเมินอัตนัย (สำหรับการทดสอบบุคลิกภาพ)

นักวิจัยชาวอเมริกัน D. Tiffin และ E. McCormick ได้วิเคราะห์เกณฑ์ภายนอกที่ใช้ในการพิสูจน์ความถูกต้อง โดยระบุสี่ประเภท:

1) เกณฑ์การปฏิบัติงาน (ซึ่งอาจรวมถึง เช่น จำนวนงานที่สำเร็จการศึกษา ผลการเรียน เวลาที่ใช้ในการฝึกอบรม อัตราการเติบโตของคุณวุฒิ ฯลฯ) 2) เกณฑ์เชิงอัตนัย (รวมถึงคำตอบประเภทต่าง ๆ ที่สะท้อนถึงทัศนคติของบุคคลต่อบางสิ่งหรือบางคน ความคิดเห็น มุมมอง ความชอบของเขา โดยทั่วไปเกณฑ์เชิงอัตนัยจะได้มาจากการสัมภาษณ์ แบบสอบถาม แบบสอบถาม) 3) เกณฑ์ทางสรีรวิทยา (ใช้ในการศึกษาอิทธิพลของสภาพแวดล้อมและตัวแปรสถานการณ์อื่น ๆ ต่อร่างกายมนุษย์และจิตใจ, วัดอัตราชีพจร, ความดันโลหิต, ความต้านทานไฟฟ้าของผิวหนัง, อาการของความเมื่อยล้า ฯลฯ ); 4) เกณฑ์การเกิดอุบัติเหตุ (ใช้เมื่อวัตถุประสงค์ของการศึกษาเกี่ยวข้อง เช่น ปัญหาในการคัดเลือกงานบุคคลที่มีความอ่อนไหวต่ออุบัติเหตุน้อยกว่า)

เกณฑ์ภายนอกต้องเป็นไปตามข้อกำหนดพื้นฐานสามประการ:

มันจะต้องเกี่ยวข้อง

ปราศจากการรบกวน

เชื่อถือได้.

ความเกี่ยวข้องหมายถึงความสอดคล้องทางความหมายของเครื่องมือวินิจฉัยกับเกณฑ์สำคัญที่เป็นอิสระ กล่าวอีกนัยหนึ่ง จะต้องมีความมั่นใจว่าเกณฑ์นั้นเกี่ยวข้องกับคุณลักษณะของจิตใจส่วนบุคคลที่วัดโดยเทคนิคการวินิจฉัยอย่างแม่นยำ เกณฑ์ภายนอกและเทคนิคการวินิจฉัยจะต้องอยู่ในการติดต่อทางความหมายภายในซึ่งกันและกันและเป็นเนื้อเดียวกันในเชิงคุณภาพในสาระสำคัญทางจิตวิทยา ตัวอย่างเช่น หากการทดสอบวัดลักษณะเฉพาะของการคิด ความสามารถในการดำเนินการเชิงตรรกะกับวัตถุและแนวคิดบางอย่าง เกณฑ์ก็ควรมองหาการแสดงทักษะเหล่านี้อย่างชัดเจน สิ่งนี้ใช้ได้กับกิจกรรมทางวิชาชีพอย่างเท่าเทียมกัน ไม่ได้มีเพียงเป้าหมายเดียว แต่มีหลายเป้าหมายและวัตถุประสงค์ ซึ่งแต่ละเป้าหมายมีความเฉพาะเจาะจงและกำหนดเงื่อนไขในการดำเนินการของตนเอง นี่แสดงถึงการมีอยู่ของเกณฑ์หลายประการในการดำเนินกิจกรรมทางวิชาชีพ ดังนั้นความสำเร็จในเทคนิคการวินิจฉัยจึงไม่ควรนำมาเปรียบเทียบกับประสิทธิภาพการผลิตโดยทั่วไป มีความจำเป็นต้องค้นหาเกณฑ์ที่ขึ้นอยู่กับลักษณะของการปฏิบัติงานที่ดำเนินการ มีความสัมพันธ์กับวิธีการ

หากไม่ทราบเกี่ยวกับเกณฑ์ภายนอกไม่ว่าจะเกี่ยวข้องกับคุณสมบัติที่กำลังวัดหรือไม่ก็ตาม การเปรียบเทียบผลลัพธ์ของเทคนิคการวินิจฉัยทางจิตกับเกณฑ์นั้นก็ไร้ประโยชน์ในทางปฏิบัติ ไม่อนุญาตให้มีการสรุปใดๆ ที่สามารถประเมินความถูกต้องของวิธีการได้

ข้อกำหนดสำหรับการเป็นอิสระจากการแทรกแซงมีสาเหตุจากข้อเท็จจริงที่ว่า ตัวอย่างเช่น ความสำเร็จทางการศึกษาหรืออุตสาหกรรมขึ้นอยู่กับตัวแปรสองประการ: ขึ้นอยู่กับตัวบุคคล คุณลักษณะส่วนบุคคลของเขา วัดโดยวิธีการ และขึ้นอยู่กับสถานการณ์ การศึกษา และสภาพการทำงาน ซึ่งสามารถ แนะนำการรบกวนและ "ปนเปื้อน" เกณฑ์ที่ใช้ เพื่อหลีกเลี่ยงปัญหานี้ ควรเลือกกลุ่มคนที่อยู่ในสภาพที่เหมือนกันไม่มากก็น้อยเพื่อการวิจัย สามารถใช้วิธีอื่นได้ ประกอบด้วยการแก้ไขอิทธิพลของการรบกวน การปรับเปลี่ยนนี้มักจะมีลักษณะทางสถิติ ตัวอย่างเช่น ผลผลิตไม่ควรคำนึงถึงในแง่สัมบูรณ์ แต่สัมพันธ์กับผลผลิตโดยเฉลี่ยของคนงานที่ทำงานภายใต้เงื่อนไขที่คล้ายคลึงกัน

เมื่อพวกเขากล่าวว่าเกณฑ์จะต้องมีความน่าเชื่อถือที่มีนัยสำคัญทางสถิติ นั่นหมายความว่าเกณฑ์นั้นจะต้องสะท้อนถึงความคงตัวและความเสถียรของฟังก์ชันที่กำลังศึกษา

การค้นหาเกณฑ์ที่เพียงพอและระบุได้ง่ายเป็นงานตรวจสอบความถูกต้องที่สำคัญและซับซ้อน ในการทดสอบแบบตะวันตก วิธีการหลายวิธีถูกตัดสิทธิ์เพียงเพราะไม่สามารถหาเกณฑ์ที่เหมาะสมสำหรับการทดสอบได้ ตัวอย่างเช่น แบบสอบถามส่วนใหญ่มีข้อมูลความถูกต้องที่น่าสงสัย เนื่องจากเป็นการยากที่จะค้นหาเกณฑ์ภายนอกที่เพียงพอซึ่งสอดคล้องกับสิ่งที่พวกเขาวัด

การประเมินความถูกต้องของวิธีการอาจเป็นได้ทั้งเชิงปริมาณและเชิงคุณภาพ

ในการคำนวณตัวบ่งชี้เชิงปริมาณ - ค่าสัมประสิทธิ์ความถูกต้อง - ผลลัพธ์ที่ได้รับเมื่อใช้เทคนิคการวินิจฉัยจะถูกเปรียบเทียบกับข้อมูลที่ได้รับโดยใช้เกณฑ์ภายนอกสำหรับบุคคลเดียวกัน มีการใช้ความสัมพันธ์เชิงเส้นประเภทต่างๆ (อ้างอิงจาก Spearman ตาม Pearson)

ต้องใช้วิชากี่วิชาในการคำนวณความถูกต้อง?

การปฏิบัติแสดงให้เห็นว่าไม่ควรน้อยกว่า 50 แต่มากกว่า 200 ดีที่สุด คำถามมักเกิดขึ้น: ค่าสัมประสิทธิ์ความถูกต้องควรเป็นเท่าใดจึงจะถือว่ายอมรับได้ โดยทั่วไป สังเกตได้ว่าค่าสัมประสิทธิ์ความถูกต้องมีนัยสำคัญทางสถิติก็เพียงพอแล้ว ค่าสัมประสิทธิ์ความถูกต้องประมาณ 0.20-0.30 ถือว่าต่ำ เฉลี่ย - 0.30-0.50 และสูง - มากกว่า 0.60

แต่ดังที่ A. Anastasi, K. M. Gurevich และคนอื่น ๆ เน้นย้ำว่าการใช้ความสัมพันธ์เชิงเส้นเพื่อคำนวณค่าสัมประสิทธิ์ความถูกต้องนั้นไม่ถูกต้องเสมอไป เทคนิคนี้จะพิสูจน์ได้ก็ต่อเมื่อได้รับการพิสูจน์แล้วว่าความสำเร็จในบางกิจกรรมเป็นสัดส่วนโดยตรงกับความสำเร็จในการตรวจวินิจฉัย ตำแหน่งของนักทำข้อสอบชาวต่างชาติ โดยเฉพาะอย่างยิ่งผู้ที่เกี่ยวข้องกับความเหมาะสมและการคัดเลือกทางวิชาชีพ ส่วนใหญ่มักจะมาจากการยอมรับอย่างไม่มีเงื่อนไขว่าผู้ที่ทำข้อสอบได้สำเร็จมากกว่าจะเหมาะสมกับวิชาชีพนั้นมากกว่า แต่อาจเป็นไปได้ด้วยว่าการที่จะประสบความสำเร็จในกิจกรรมนั้น คุณต้องมีคุณสมบัติที่ระดับ 40% ของโซลูชันการทดสอบ ความสำเร็จเพิ่มเติมในการทดสอบไม่มีความสำคัญต่ออาชีพนี้อีกต่อไป ตัวอย่างที่ชัดเจนจากเอกสารของ K. M. Gurevich: บุรุษไปรษณีย์ต้องสามารถอ่านได้ แต่ไม่ว่าเขาจะอ่านด้วยความเร็วปกติหรือที่ความเร็วสูงมาก สิ่งนี้ก็ไม่มีความสำคัญทางวิชาชีพอีกต่อไป ด้วยความสัมพันธ์ระหว่างตัวบ่งชี้วิธีการและเกณฑ์ภายนอก วิธีที่เหมาะสมที่สุดในการสร้างความถูกต้องอาจเป็นเกณฑ์ความแตกต่าง

อีกกรณีหนึ่งก็เป็นไปได้เช่นกัน: ระดับทรัพย์สินที่สูงกว่าที่อาชีพกำหนดจะขัดขวางความสำเร็จในวิชาชีพ ดังนั้นแม้ในรุ่งอรุณของศตวรรษที่ 20 นักวิจัยชาวอเมริกัน เอฟ. เทย์เลอร์ พบว่าพนักงานฝ่ายผลิตหญิงที่ได้รับการพัฒนามากที่สุดมีผลิตภาพแรงงานต่ำ นั่นคือการพัฒนาจิตใจในระดับสูงทำให้พวกเขาไม่สามารถทำงานได้อย่างมีประสิทธิผลสูง ในกรณีนี้ การวิเคราะห์ความแปรปรวนหรือการคำนวณความสัมพันธ์สหสัมพันธ์จะเหมาะสมกว่าในการคำนวณค่าสัมประสิทธิ์ความถูกต้อง

ตามที่ประสบการณ์ของนักทดสอบชาวต่างประเทศแสดงให้เห็น ไม่มีขั้นตอนทางสถิติใดที่สามารถสะท้อนความหลากหลายของการประเมินรายบุคคลได้อย่างเต็มที่ ดังนั้นจึงมักใช้แบบจำลองอื่นเพื่อพิสูจน์ความถูกต้องของวิธีการ - การประเมินทางคลินิก นี่ไม่ใช่อะไรมากไปกว่าคำอธิบายเชิงคุณภาพเกี่ยวกับสาระสำคัญของทรัพย์สินที่กำลังศึกษา ในกรณีนี้ เรากำลังพูดถึงการใช้เทคนิคที่ไม่ต้องใช้การประมวลผลทางสถิติ

7. แนวคิดเรื่องความน่าเชื่อถือ ความถูกต้อง ความน่าเชื่อถือของการทดสอบตาม A.G. ชเมเลฟ.

ทดสอบคุณสมบัติ

ความหมายที่สำคัญอื่นใดที่เราสามารถดึงมาจากคำอุปมาของอาวุธทดสอบ? คำอุปมานี้ช่วยให้เราเข้าใจข้อกำหนดด้านเครื่องมือจำนวนหนึ่งสำหรับการทดสอบที่การทดสอบต้องเป็นไปตามนั้นได้อย่างแม่นยำและลึกซึ้งยิ่งขึ้น รวมถึงมาตรฐานสำหรับการใช้การทดสอบด้วย ฉันจะไม่แสดงรายการคุณสมบัติทางจิตวิทยาทั้งหมดของการทดสอบที่นี่เลย แต่ก็ยังมีบางคุณสมบัติที่สำคัญที่สุดที่ควรค่าแก่การกล่าวถึง - อย่างน้อยก็ไม่เข้มงวด อย่างน้อยก็เชิงเปรียบเทียบล้วนๆ

1) ทดสอบความน่าเชื่อถือ- อาวุธที่สร้างขึ้นในโรงปฏิบัติงานกึ่งชั้นใต้ดินชั่วคราวอย่างที่พวกเขาพูดว่า "คุกเข่า" จะเชื่อถือได้หรือไม่? อาวุธนี้จะยิงได้ทุกที่ - บางครั้งก็ไปที่เป้าหมาย แต่บ่อยกว่านั้นไปด้านข้างและบางครั้งก็สามารถระเบิดได้ในมือของผู้ยิง สมควรที่จะเตือนสิ่งต่อไปนี้: การทดสอบที่เชื่อถือได้ไม่ได้ถูกสร้างขึ้นในห้องปฏิบัติการขนาดเล็ก (และโดยเฉพาะอย่างยิ่งไม่ใช่ที่โต๊ะโดยผู้เขียนคนเดียว) ความน่าเชื่อถือของการทดสอบไม่เพียงตรวจสอบกับตัวอย่างตัวแทน (มวล) เท่านั้น แต่ยังไม่สามารถพัฒนาได้หากไม่มีสถิติที่ครอบคลุม ตัวอย่างที่เป็นตัวแทนสำหรับการกำหนดมาตรฐานการทดสอบถือเป็นพื้นที่ทดสอบอาวุธใหม่ หลังจากการทดสอบภาคสนามดังกล่าวเท่านั้น ผู้ออกแบบการทดสอบจึงจะปรับเปลี่ยนการออกแบบอาวุธตามเป้าหมาย (“แบบมองเห็น”) ได้ ดังนั้นในตัวอย่างของคุณสมบัติหนึ่งของการทดสอบนี้ - ความน่าเชื่อถือ - เราเห็นอะไร? คำอุปมา "อาวุธทดสอบ" ให้ความหมายแก่เราในบริบทนี้ อาวุธที่ไม่ดีไม่ได้เสริมความแข็งแกร่ง แต่ในทางกลับกัน ทำให้ผู้ใช้อ่อนแอลงและทำให้เขาตกอยู่ในความเสี่ยง แต่เป็นไปได้ไหมที่จะตัดสินคุณภาพของอาวุธโดยทั่วไปด้วยตัวอย่างอาวุธหัตถกรรม? ไม่ใช่การทดสอบโดยทั่วไปที่ไม่ดี แต่เป็นการทดสอบที่ไม่น่าเชื่อถือ

2) ทดสอบความถูกต้อง- ขอให้เราระลึกว่านี่เป็นการวัดความเหมาะสมของการทดสอบเพื่อวัตถุประสงค์ของการวินิจฉัยทางจิตซึ่งเป็นการวัดการปฏิบัติตามคุณสมบัติที่กำลังวัด อาวุธจะยิงที่ไหน? สิ่งนี้ไม่เพียงขึ้นอยู่กับความน่าเชื่อถือของการทดสอบเท่านั้น แต่ยังขึ้นอยู่กับผู้ใช้ด้วย การทดสอบที่ไม่น่าเชื่อถือไม่ถูกต้อง สัจพจน์ของทฤษฎีการวัดในบริบทนี้ง่ายต่อการเข้าใจ: ถ้าคุณไม่ตีเงาด้วยห้าขั้นตอนแล้วเราจะพูดถึงความถูกต้องประเภทใดความสอดคล้องของการทดสอบกับคุณสมบัติที่วัดได้เพราะ ด้วยความช่วยเหลือของ "การทดสอบ" คุณไม่สามารถโจมตีศัตรูได้และเข้าไปใน "ของคุณ" - คนที่ยืนอยู่ข้างคุณนั่นคือคุณ "จับ" ด้วยความช่วยเหลือของการทดสอบไม่ใช่เป้าหมาย แต่เป็นอีก ทรัพย์สินทางจิต แต่ถ้ามือปืนตาบอดเอง ถ้าเขาตาบอดสี ที่ไม่แยกแยะสีของเครื่องแบบของเขาเองและของผู้อื่น ถ้าเขาเป็นคนตื่นตระหนกด้วย เขาก็จะยิงด้วยความตื่นตระหนกแม้จะเชื่อถือได้ก็ตาม อาวุธเล็กๆ ทั้งของตัวเองและของผู้อื่น ดังนั้นเราจึงสามารถกำหนดผลลัพธ์ที่สำคัญได้อย่างง่ายดาย: การทดสอบไม่สามารถใช้ได้กับผู้ที่ไม่ใช่มืออาชีพ นี่คือความจริงอีกประการหนึ่งของการทดสอบวิทยาซึ่งอนิจจาอาจเป็นเรื่องยากมากที่จะอธิบายไม่เพียง แต่กับผู้ชมจำนวนมากเท่านั้น แต่ยังรวมถึงนักจิตวิทยาด้วยเพราะด้วยคำว่า "ความน่าเชื่อถือ" และ "ความถูกต้อง" สูตรไซโครเมทริกที่แย่และเข้าใจไม่ได้ลอยอยู่ในใจของพวกเขา . ดังนั้น แนวคิดเหล่านี้ดูเหมือนเป็นแนวคิดทางคณิตศาสตร์มากกว่าจิตวิทยา กล่าวคือ ต่างจาก "สติปัญญาด้านมนุษยธรรม"

อีกครั้ง ในบริบทนี้ ขอให้เรากลับไปสู่การวิพากษ์วิจารณ์การทดสอบ เป็นไปได้ไหมที่จะตัดสินการทดสอบและโดยเฉพาะอย่างยิ่งการทดสอบโดยทั่วไปหากมีการส่งมอบอาวุธโรงงานคุณภาพสูงให้กับทหารเกณฑ์ที่ตื่นตระหนกซึ่งยิงนกกระจอกจากปืนใหญ่ (เช่น ใช้แบตเตอรี่ IQ หนักเช่นการทดสอบ Wechsler เพื่อวินิจฉัย โรคสมาธิสั้น) หรือรีบพุ่งเข้ามาด้วยปืนพก มันไม่มีประโยชน์ที่จะยิงใส่รถถังหุ้มเกราะ (พวกเขาพยายามเข้าใจธรรมชาติและความหมายที่มีความหมายของความขัดแย้งภายในด้วยการตั้งค่าสีในการทดสอบ Luscher ซึ่งในความคิดของฉันคือ เหมาะสำหรับการประเมินพื้นหลังอารมณ์คร่าวๆ เท่านั้น) ใครก็ตามที่มีความรู้ด้านการทหารไม่มากก็น้อยจะเข้าใจว่าเป็นสองและสอง: ไม่มีอาวุธสากลและในสภาวะการต่อสู้ที่แตกต่างกันจำเป็นต้องใช้สิ่งที่แตกต่างกัน แต่จิตใจของมนุษย์นั้นเป็นความจริงที่ละเอียดอ่อนซึ่งบุคคลภายนอกมองไม่เห็นมากกว่าในสนามรบ ดังนั้นเราจึงสร้างความสับสนให้กับทุกสิ่งในโลก: การสู้รบตามตำแหน่งที่เชื่องช้า การโจมตีด้วยปืนใหญ่ที่ยังคุกรุ่นอยู่ และการโจมตีด้วยดาบปลายปืนเต็มความยาวอันดุเดือด เมื่อถึงเวลาดึงระเบิดออกจากเข็มขัดของเรา เมื่อคุณทำตัวอย่างสั้น ๆ ของงานสองสามอย่าง (ตัวเลขที่ซ่อนอยู่บางส่วนจากการทดสอบ Gottschald, จุดหมึกของ Rorschach สองสามงาน) คุณควรตระหนักว่าคุณมีแนวโน้มที่จะสะดุดกับข้อมูลที่มีค่าในการวินิจฉัยเท่าที่สามารถทำได้ โจมตีบังเกอร์เหล็กด้วยระเบิดทหารราบเบา มีแนวโน้มว่าจะไม่ได้ผล! แต่เราควรสรุปไหมว่าการทดสอบทั้งหมดไม่ได้ผล? ฉันจะบอกว่าการทดสอบทางจิตวิทยาหลายครั้งเป็นอาวุธที่อ่อนแอมากในการต่อต้านป้อมปราการที่พรางตัวได้ดี ต่อต้านการป้องกันในเชิงลึกของจิตใจมนุษย์ที่มีหลายชั้น ซึ่งเมื่อถึงเวลาของวุฒิภาวะทางสังคมได้พัฒนากลไกการป้องกันทางจิตวิทยาที่ซับซ้อนมากหลายชั้น ที่นี่เรามาถึงปัญหาของความน่าเชื่อถือ - ปัญหาของความสัมพันธ์ระหว่างกลไกที่มีสติและหมดสติของการป้องกันทางจิตวิทยาจากการทดสอบ R. Cattell เคยเรียกสิ่งนี้ว่าปัญหาของการบิดเบือนแรงจูงใจ มันฟังดูสวยงามแม้ว่าเรากำลังพูดถึงสิ่งที่น่าเกลียด - เกี่ยวกับการโกหกอย่างมีสติไม่มากก็น้อย

3) ความน่าเชื่อถือ- นี่เป็นปัญหาของการปลอมแปลง ในบริบทนี้ ขอให้เรากำหนดมาตรฐานทางวิชาชีพและจริยธรรมที่ค่อนข้างขัดแย้งกันดังต่อไปนี้: “บุคคลนั้นมีสิทธิ์ที่จะโกหก” ในความเป็นจริงหากการทดสอบเป็นอาวุธในการเจาะเข้าไปในจิตใจของมนุษย์ผู้ทดสอบก็มีสิทธิ์ในการป้องกันตัวเอง - เพื่อต่อต้านการแทรกซึมนี้ ในท้ายที่สุด ก็เป็นไปได้ที่จะพิสูจน์ผู้ถูกทดสอบที่สามารถซ่อนปัญหาและข้อบกพร่องของเขาได้โดยการระดมพลเพื่อการทดสอบที่เป็นที่ต้องการทางสังคม ด้วยวิธีนี้ ในช่วงเวลาของการทดสอบ เขาแสดงให้เห็นถึงความแข็งแกร่งของกลไกการชดเชยของเขา ความสามารถในการแก้ปัญหาเพื่อการพัฒนาศีลธรรม ความสามารถในการแก้ไขปัญหาเพื่อการพัฒนาทางปัญญา เป็นต้น 5 แม้ว่าบางทีในชีวิตประจำวันเขาจะประพฤติแตกต่างออกไป ความแข็งแกร่งของตัวเรือหุ้มเกราะซึ่งรับประกันความไม่สามารถจมได้นั้นแข็งแกร่งกว่าการโจมตีที่นักจิตวิทยาจัดการกับอาวุธของเขา ให้เกียรติและยกย่องในเรื่องดังกล่าว แต่วิทยานิพนธ์นี้ยังให้ผลลัพธ์ที่สำคัญเช่นกัน: ผลการทดสอบเชิงบวกมีค่าน้อยกว่าและมีพลังในการทำนายน้อยกว่าผลลัพธ์เชิงลบ

ดังนั้น หากเราเข้าใจแนวคิดพื้นฐานเกี่ยวกับแก่นแท้ของการทดสอบในที่สุด เราจะเรียนรู้ที่จะนำไปใช้ในการปฏิบัติทางสังคมอย่างเพียงพอ ตราบใดที่เราตีความสาระสำคัญของการทดสอบผิดและไม่เห็นข้อจำกัดในการใช้งานอย่างเพียงพอ เราก็ทำผิดพลาดร้ายแรง จำเป็นหรือไม่ที่จะห้ามการแพร่ขยายอาวุธในสังคมที่ไม่มีใครรู้วิธีใช้อาวุธอย่างมีประสิทธิภาพ? เห็นได้ชัดว่า จะเป็นการฉลาดกว่าที่จะไม่แบนมันเลย แต่จำกัดให้อยู่ในกลุ่มผู้ใช้ที่ผ่านการฝึกอบรมและได้รับการรับรองที่แคบลง! และควรจัดเตรียมเครื่องมือที่ผ่านการรับรองเท่านั้น ไม่ใช่เครื่องมือสุ่มใดๆ หากผู้สร้างที่โชคร้ายสร้างอาคารหลายชั้นบนหนองน้ำหรือทรายดูดโดยไม่ได้วางรากฐานที่มั่นคงนั่นคือพวกเขาละเมิดกฎทั้งหมดของเทคโนโลยีการก่อสร้างที่ปลอดภัยก็ไม่ควรสร้างอาคารในลักษณะนี้เลย นี่ไม่ได้หมายความว่าสถาบันสถาปัตยกรรม โรงงานทั้งหมดที่ผลิตวัสดุก่อสร้าง และองค์กรก่อสร้างทั้งหมดควรถูกแบน หากมีคนใช้ยาบางชนิดในทางที่ผิดโดยเปลี่ยนเป็นยา ก็ไม่ได้หมายความว่าอุตสาหกรรมยาควรถูกสั่งห้าม แม้ว่าจะต้องเพิ่มความเข้มงวดในการควบคุมการกระจายยาอันตรายก็ตาม

การทดสอบและการประเมินโดยผู้เชี่ยวชาญ

ในความคิดของฉัน การทดสอบที่ได้มาตรฐานไม่ได้จัดเตรียมพื้นฐานสำหรับการวินิจฉัยเชิงบวกขั้นสุดท้าย (เช่น การวินิจฉัยความเหมาะสมสำหรับกิจกรรมบางอย่าง) สำหรับสิ่งนี้ การทดสอบเหล่านั้นจะต้องได้รับการเสริมด้วยการประเมินโดยผู้เชี่ยวชาญ (หรือขั้นตอนการวินิจฉัยอื่น ๆ ที่มีมาตรฐานน้อยกว่า รวมถึงการประเมินโดยผู้เชี่ยวชาญ ในระดับใดระดับหนึ่ง เช่น เกิดขึ้นในเทคนิคการฉายภาพ)

ดังนั้น ผลลัพธ์ที่เป็นบวกของการทดลองทดสอบจึงมีความจำเป็นในเชิงตรรกะ แต่ยังไม่เพียงพอสำหรับการสรุปผลเชิงบวกขั้นสุดท้าย เนื่องจากฉันในฐานะนักทดสอบ โชคไม่ดีที่ตระหนักดีว่าบางครั้งเพื่อนร่วมชาติของเรามีปัญหาร้ายแรงเกี่ยวกับตรรกะเบื้องต้น 5 ขอให้เราจัดทำแผนผังสิ่งที่กล่าวไว้ในรูปแบบของแท็บเล็ตต่อไปนี้:

ให้เราอธิบายเรื่องนี้ด้วยตัวอย่างที่มีความหมาย ก่อนอื่นเรามาดูกรณีที่ไม่สำคัญที่สุดซึ่งห่างไกลจากจิตวิทยา - ข้อสอบความรู้เกี่ยวกับกฎจราจรที่กล่าวถึงแล้ว หากผู้สมัครผ่านการทดสอบตามกฎแล้ว ยังไม่สามารถออกใบอนุญาตได้ - จากนั้นเขาจะต้องผ่านการทดสอบขับรถภาคปฏิบัติที่เป็นทางการน้อยกว่า หากผู้สอบไม่ผ่านการทดสอบจะไม่ได้รับอนุญาตให้ทำการทดสอบครั้งต่อไป ในบริบทนี้ ถึงเวลาที่ต้องแสดงข้อจำกัดความรับผิดชอบต่อไปนี้: ผลการทดสอบที่เป็นลบไม่ใช่โทษประหารชีวิต ทุกคนเข้าใจว่าเรียนกฎได้ก็กลับมาสอบใหม่ได้

ตอนนี้ให้เราใช้ขั้นตอนที่ชัดเจนน้อยลง (ยังไม่เป็นทางการตามกฎระเบียบ) ในการทดสอบผู้สมัครเมื่อสมัครงานในระดับที่เรียกว่า "ความภักดีขององค์กร" สมมติว่าหัวข้อนี้นำเสนอด้วยแบบสอบถามทดสอบแบบดั้งเดิมที่มีคำถามตรงไปตรงมา เช่น “คุณเคยหลอกครูเมื่อทำการสอบที่โรงเรียนหรือไม่?” ดังที่เราได้กล่าวไว้ข้างต้น ผู้ถูกกระทำในกรณีนี้ใช้สิทธิ์ในการปลอมแปลงและตอบว่า “ถูกต้อง ฉันไม่ได้” และเราจะได้ข้อสรุปอะไรในกรณีนี้? เลขที่! แต่หากจู่ๆ ผู้ถูกถามตอบอย่างตรงไปตรงมาว่า “ผิด มันเกิดขึ้น” อย่างน้อยก็ควรมีคนระวัง

หลักการนี้ใช้กับการทดสอบความรู้พื้นฐานทางวิชาชีพขั้นพื้นฐานในระดับที่มากยิ่งขึ้น หากผู้สมัครบัญชีไม่สามารถตอบคำถามในแบบสอบถามทดสอบการแข่งขันเกี่ยวกับ "ผังบัญชี" คืออะไร เราควรทำงานร่วมกับผู้สมัครรายนี้ต่อไปหรือไม่ ควรใช้เวลาที่แพงของผู้เชี่ยวชาญที่มีคุณสมบัติเหมาะสมในการสัมภาษณ์ผู้สมัครอย่างละเอียดหรือไม่? แน่นอนว่าไม่ใช่ 6

ดังนั้น ฉันเสนออย่างแท้จริงทุกที่ ในทุกสาขาของการปฏิบัติ เพื่อใช้การทดสอบเป็นตัวกรองหลักที่มีราคาถูกและเป็นทางการ ก่อนที่จะใช้กระบวนการของผู้เชี่ยวชาญที่ซับซ้อนและมีราคาแพงมากขึ้น ผู้เชี่ยวชาญด้านการประเมินบุคลากรที่ใช้เทคโนโลยีศูนย์การประเมินในปัจจุบันได้รับคำแนะนำจากตรรกะที่คล้ายกันในระดับหนึ่ง

ดังนั้นควรแก้ไขเพลตด้านบนให้เป็นดังนี้:

ผลลัพธ์เชิงบวกของการประเมินโดยผู้เชี่ยวชาญ ผลลัพธ์เชิงลบของการประเมินผู้เชี่ยวชาญ
ผลการทดสอบเป็นบวก บทสรุปของความเหมาะสม บทสรุปของความไม่เหมาะสม
ผลการทดสอบเป็นลบ บทสรุปของความไม่เหมาะสม บทสรุปของความไม่เหมาะสม

ดังที่เราเห็น สำหรับข้อสรุปทั่วไปที่เป็นบวก จำเป็นต้องมีการเชื่อมโยง (ตรรกะ “AND”) ของเหตุการณ์อิสระสองเหตุการณ์ - ผลการทดสอบเชิงบวกและผลลัพธ์เชิงบวกของการประเมินโดยผู้เชี่ยวชาญ การไม่มีผลลัพธ์เชิงบวกอย่างน้อยหนึ่งรายการไม่ได้ทำให้สามารถสรุปผลเชิงบวกโดยทั่วไปได้

คุณภาพของระบบการเลือกตัวกรองสองตัวดังกล่าวไม่ว่าในกรณีใดก็ตามจะสูงกว่าระบบตัวกรองเดี่ยวใดๆ โดยขึ้นอยู่กับการประเมินของผู้เชี่ยวชาญหรือจากการทดสอบเท่านั้น และการพูดคุยที่ผลการทดสอบในประเทศของเรานั้นหาซื้อได้ง่ายมาก (อนิจจาการพูดคุยดังกล่าวมักเริ่มต้นเช่นในฟอรัมการสนทนาของพอร์ทัล Unified State Exam ege.edu.ru) ถือเป็นการจงใจทำลายล้างในธรรมชาติหรือ เผยให้เห็นข้อบกพร่องในการคิดเชิงตรรกะอีกครั้ง ตามกฎแล้วคุณสามารถซื้อผลการทดสอบได้ คุณสามารถซื้อผลการประเมินโดยผู้เชี่ยวชาญได้ และคุณยังต้องศึกษาเป็นพิเศษว่าตัวกรองตัวใดขายได้น้อยกว่าจริงๆ แม้ว่าคีย์จะรั่วไหลแม้ว่าการทดสอบจะมีการกระจายอย่างกว้างขวาง แต่ผลการทดสอบเชิงลบยังคงรักษาคุณค่าของมันไว้ แต่สิ่งสำคัญอย่างยิ่งคือผู้เชี่ยวชาญที่ไม่เน่าเปื่อยจะเข้ามามีบทบาทหลังจากผลลัพธ์ที่เป็นบวก หากเราเชื่อมโยงผลลัพธ์ของสองขั้นตอนด้วยตรรกะ "และ" ดังนั้นผลลัพธ์เชิงตัวเลขของการทดสอบและการประเมินโดยผู้เชี่ยวชาญจะถูกต้องมากกว่าที่จะไม่สรุป แต่เป็นการคูณนั่นคือเพื่อรวมไม่บวก แต่คูณ:

โดยที่ T คือผลการทดสอบ E คือผลลัพธ์ของการประเมินโดยผู้เชี่ยวชาญ O คือคะแนนรวม หากปัจจัยใดมีค่าเป็นศูนย์ (ต่ำกว่าเกณฑ์ขั้นต่ำ) ผลลัพธ์โดยรวมจะกลายเป็นศูนย์โดยไม่คำนึงถึงค่าของปัจจัยที่สอง ด้วยค่าที่ไม่เป็นศูนย์ของทั้งสององค์ประกอบของสูตร ผลลัพธ์สูงสุดจะเกิดขึ้นได้หากค่าของ T และ E อยู่ใกล้กัน - สิ่งนี้มาจากไหน? และจำนวนเงินเกี่ยวข้องกับมันอย่างไร? แนวทางนี้ค่อนข้างเป็นกลางกับผลกระทบของการประเมินค่าสูงไปของตัวบ่งชี้ตัวหนึ่งอันเนื่องมาจาก "การซื้อ"


ข้อมูลที่เกี่ยวข้อง.


ในความหมายกว้างๆ ความถูกต้อง เช่น ความถูกต้องของวิธีการ หมายถึงการเชื่อมโยงระหว่างข้อมูลเชิงประจักษ์ที่ได้รับจากความช่วยเหลือกับเป้าหมายหลักของการศึกษา คำถามเกี่ยวกับความถูกต้องของวิธีการเชิงคุณภาพในปีก่อน ๆ สับสนอย่างมากโดยผู้เชี่ยวชาญทางสถิติทางคณิตศาสตร์ ซึ่งขยายเกณฑ์ทางสถิติที่เฉพาะเจาะจงมากของความถูกต้องไปยังประเภทของปัญหาและสถานการณ์การวิจัยที่ไม่มีอะไรเหมือนกันกับวัตถุในอุดมคติ เช่น ลูกบอลหลากสีที่ถ่าย ออกจากตะกร้า ซึ่งใช้ทฤษฎีความน่าจะเป็น

ก่อนที่จะอธิบายการวิจัยเชิงคุณภาพโดยเฉพาะการวิจัยกลุ่มจำเป็นต้องอธิบายว่าแตกต่างจากการวิจัยเชิงปริมาณอย่างไร เพื่อให้เข้าใจความแตกต่างเหล่านี้ได้ครบถ้วนมากขึ้น สิ่งสำคัญอย่างยิ่งคือต้องเข้าใจว่าอะไรคือ "ข้อผิดพลาด" ของการศึกษาวิจัยนี้

การวิจัยทางสังคมวิทยาเชิงปริมาณจะเป็นการวิจัยประเภทหนึ่งที่อิงตามทฤษฎีความน่าจะเป็นทางคณิตศาสตร์ ในบรรดาหลักสัจพจน์ของทฤษฎีนี้มีหลักฐานที่สำคัญมากว่าความแตกต่างระหว่างวัตถุที่วิเคราะห์นั้นจำกัดอยู่เพียงชุดคุณลักษณะที่ไม่ต่อเนื่องคงที่ ตัวอย่างเช่น ลูกบอลที่วางอยู่ในตะกร้าจะมีสี ขนาด และตัวเลขที่วาดไว้แตกต่างกัน แน่นอนว่า ผู้คนอาจแตกต่างกันในลักษณะทางประชากรศาสตร์ ทัศนคติ ฯลฯ และสิ่งสำคัญคือต้องทราบว่าในแบบสอบถามที่กำหนด ชุดคุณลักษณะจะถูกจำกัดด้วยจำนวนคำถามเชิงปริมาณในแบบสอบถาม และคุณลักษณะอื่นๆ ทั้งหมดที่เป็นไปได้ ถือว่าเหมือนกัน

เกณฑ์หลักที่กำหนดลักษณะของการศึกษาประเภททางสถิติคือความน่าเชื่อถือ เช่น ความสามารถในการทำซ้ำของผลลัพธ์ที่ได้รับ หากคุณทำการสำรวจซ้ำโดยใช้วิธีการเดียวกันในกลุ่มโซเชียลเดียวกัน และผลลัพธ์ของการสำรวจทั้งสองเหมือนกัน แสดงว่าเชื่อถือได้ ทุกวันนี้ ไม่มีใครโต้แย้งความจริงที่ว่าด้วยการสำรวจตัวแทนจำนวนมากที่ดำเนินการอย่างถูกต้องโดยใช้แบบสอบถามที่เป็นทางการ ความสามารถในการทำซ้ำของผลลัพธ์ในระดับสูงจะเกิดขึ้นโดยอัตโนมัติ ในเวลาเดียวกัน คำถามเกี่ยวกับความถูกต้องของข้อมูลยังไม่หมดสิ้นไป

ในสังคมวิทยาคณิตศาสตร์ ความถูกต้องของการศึกษามักจะตีความว่าเป็นระดับที่วิธีการวัดสอดคล้องกับสิ่งที่จะวัด พจนานุกรมอธิบายเพิ่มเติมว่า ในความหมายที่เข้มงวดของคำนี้ การตรวจสอบความถูกต้องจะเกิดขึ้นได้ก็ต่อเมื่อมีเกณฑ์ภายนอกที่เป็นอิสระเท่านั้น แต่สถานการณ์เช่นนี้หาได้ยากในสังคมวิทยา ในกรณีอื่น ๆ ทั้งหมด ความถูกต้องของผลการสำรวจเชิงปริมาณจะเป็นเพียงสมมติฐาน การประเมินระดับความน่าจะเป็นซึ่งไม่เกี่ยวข้องกับกระบวนการทางคณิตศาสตร์และสถิติ ระดับความน่าเชื่อถือที่ต่ำของสมมติฐานสำคัญโดยนัยหลายข้อที่นักวิจัยฝังลึกอยู่ในถ้อยคำและโครงสร้างของคำถามที่เป็นทางการ และบางครั้งการไม่มีความน่าเชื่อถือเลยโดยสิ้นเชิง จะกลายเป็นปัญหาที่ร้ายแรงมากและเป็นที่เข้าใจได้ไม่ดี

ดังนั้นไม่ควรสับสนระหว่างความน่าเชื่อถือทางสถิติของผลการวิจัยเชิงปริมาณกับความน่าเชื่อถือและความถูกต้องในความหมายกว้างๆ หากพูดอย่างเคร่งครัด การวิจัยเชิงปริมาณจะเชื่อถือได้เฉพาะในกรณีที่ปัญหาด้านความน่าเชื่อถือสามารถลดลงเหลือเพียงการตีความทางสถิติเท่านั้น หากการลดลงดังกล่าวล้มเหลวหรือเป็นไปไม่ได้ตามหลักการ ข้อมูลเชิงปริมาณจะกลายเป็นพื้นฐานในการสรุปที่ไม่น่าเชื่อถืออย่างยิ่ง

เมื่อเปรียบเทียบวิธีการเชิงปริมาณและเชิงคุณภาพจากมุมมองของความถูกต้อง ประการแรกควรสังเกตว่าขอบเขตการใช้งานที่ถูกต้องไม่ตรงกัน ซึ่งทำให้การเปรียบเทียบโดยทั่วไปตามเกณฑ์ความถูกต้องไม่มีความหมาย มีปัญหาหลายประเภทซึ่งวิธีเชิงปริมาณมีสูง และวิธีการเชิงคุณภาพมีความถูกต้องต่ำ ในเวลาเดียวกันก็มี - และแง่มุมนี้มักจะถูกเน้นไม่ดีแม้แต่ในวรรณกรรมเฉพาะทาง - ปัญหาประเภทอื่น ๆ ที่ความสัมพันธ์ที่ระบุอยู่ตรงกันข้ามโดยตรง

วัตถุประสงค์ของหนังสือเรียนของเราคือไม่พิจารณาประเด็นวิธีการของวิธีการเชิงคุณภาพโดยทั่วไป ความเฉพาะเจาะจงของกลุ่มสนทนา เช่นเดียวกับการสัมภาษณ์เชิงลึกรายบุคคล หากดำเนินการเป็นชุดใหญ่ โดยพื้นฐานแล้ว อย่างน้อยในทางทฤษฎี เกณฑ์ความถูกต้องทางสถิติก็สามารถนำมาใช้กับเกณฑ์เหล่านี้ได้เช่นกัน แม้ว่าจะแตกต่างจากการวิจัยเชิงปริมาณก็ตาม

โปรดทราบว่าข้อความถอดเสียงของชุดการสัมภาษณ์กลุ่มที่ดำเนินการในหัวข้อเฉพาะจะก่อให้เกิดอาร์เรย์ของข้อมูลหลักจำนวนหลายร้อยหน้า อาร์เรย์นี้ค่อนข้างเหมาะสำหรับการวิเคราะห์โดยใช้วิธีทางสถิติ ทั้งในแง่ของขนาดและความแตกต่าง ความหลากหลายของอาเรย์นั้นมั่นใจได้โดยการมีส่วนร่วมของผู้ตอบแบบสอบถามหลายสิบคน ซึ่งได้ให้เหตุผลสำหรับการกระจายคำตอบที่คล้ายกันโดยประมาณในระดับสมาชิกสามหรือห้าคน: ชนกลุ่มน้อยที่ชัดเจน, ชนกลุ่มน้อย, ประมาณเท่ากัน, ส่วนใหญ่, a ส่วนใหญ่ที่ชัดเจน อย่างไรก็ตามสิ่งสำคัญไม่ใช่เรื่อง ความจำเพาะของอาร์เรย์ข้อมูลหลักของการสัมภาษณ์กลุ่มโดยพื้นฐานแล้วคือ:

1. หน่วยของการวิเคราะห์จะไม่ใช่ผู้ถูกกล่าวหา แต่เป็นคำพูด เนื่องจากผู้ตอบแบบสอบถามแต่ละคนจะเป็นผู้ถือข้อความหลายข้อความ สิ่งนี้จึงเพิ่มอาร์เรย์ของหน่วยการวิเคราะห์หลักอย่างน้อยตามลำดับความสำคัญ ทำให้มีนัยสำคัญทางสถิติ

2. งานวิจัยเชิงคุณภาพไม่รวมถึงการกำหนดจำนวนหรือสัดส่วนของผู้ให้บริการในตำแหน่งใดตำแหน่งหนึ่งในสังคมหรือส่วนของสังคม สำหรับปัญหาประเภทนี้ วิธีการเชิงคุณภาพไม่ถูกต้อง

งานของวิธีการเชิงคุณภาพคือการสร้างรายการที่เรียกว่า "สมมติฐานการดำรงอยู่" นั่นคือรายการความคิดเห็น การประเมิน หรือข้อความที่มีอยู่ในสังคม และสันนิษฐานว่ามีระดับการกระจายที่ไม่เป็นศูนย์ ในกรณีนี้ ตามที่ D. ตั้งข้อสังเกต เราสังเกตว่า Templeton การทำผิดพลาดโดยการระบุปัจจัยที่ไม่มีอยู่จริงหรือไม่มีนัยสำคัญนั้นดีกว่าการพลาดปัจจัยที่มีนัยสำคัญมาก

โดยหลักการแล้วเครื่องมือทางคณิตศาสตร์ที่ดัดแปลงสำหรับการแก้ปัญหาประเภทนี้เป็นที่รู้จักกันดี เป็นที่น่าสังเกตว่ามันใช้ในภาษาศาสตร์เมื่อรวบรวมรายการเสียงและพยางค์รวมถึงพจนานุกรมความถี่ของคำและวลี เครื่องมือเดียวกันนี้ยังใช้ในการวิจัยทางสังคมวิทยาที่ดำเนินการโดยใช้การวิเคราะห์เนื้อหา ในส่วนที่เกี่ยวข้องกับกรณีหลังนี้ การกำหนดทางคณิตศาสตร์ของปัญหามีลักษณะดังนี้: “มีผู้สมัครชิงตำแหน่งประธานาธิบดี ก คนหนึ่ง ซึ่งถูกเขียนถึงในหนังสือพิมพ์ จำเป็นต้องรวบรวมรายชื่อคำคุณศัพท์ให้สมบูรณ์ที่สุดเท่าที่จะเป็นไปได้ซึ่งผู้เขียนบทความระบุลักษณะของผู้สมัครรายนี้ ควรศึกษาข้อความในหนังสือพิมพ์มากน้อยเพียงใดเพื่อให้ความน่าจะเป็น 95% จำนวนคำคุณศัพท์ที่ไม่ปรากฏชื่อไม่เกิน 5%

เช่นเดียวกับปัญหาทางสถิติประยุกต์ส่วนใหญ่ ปัญหานี้ไม่สามารถแก้ไขได้หากไม่มีความรู้เบื้องต้นบางประการเกี่ยวกับธรรมชาติของการกระจายความถี่ของคำคุณศัพท์ที่ต้องการ รวมทั้งปราศจากสมมติฐานเบื้องต้นที่แน่นอน เมื่อคำนึงถึงการพึ่งพาความสะดวกในทางปฏิบัติในการเลือกระบบสมมติฐานอย่างใดอย่างหนึ่งการกำหนดปัญหาอาจแตกต่างกันไป การเจาะลึกประเด็นนี้อยู่นอกเหนือขอบเขตของหัวข้อของเรา เนื่องจากในการวิจัยประยุกต์ที่ดำเนินการโดยใช้วิธีสนทนากลุ่ม เครื่องมือทางสถิติที่คล้ายคลึงกับที่อธิบายไว้ข้างต้น หากใช้ที่ไหนสักแห่ง จะเป็นการวิจัยเฉพาะทางโดยเฉพาะ ซึ่งห่างไกลจากขอบเขตของการประยุกต์ใช้ ของกลุ่มเน้นการตลาด
เป็นที่น่าสังเกตว่ามีสองเหตุผลหลักสำหรับเรื่องนี้ ประการแรกคือการใช้อุปกรณ์ดังกล่าวทำให้ต้นทุนการวิจัยเพิ่มขึ้นอย่างมากและลูกค้าเชิงพาณิชย์ไม่ต้องการจ่ายเงินสำหรับ "ความงาม" ทางคณิตศาสตร์หากพวกเขาไม่ส่งผลกระทบต่อข้อสรุปขั้นสุดท้าย แต่อย่างใด ด้วยเหตุผลหลายประการซึ่งจะอธิบายไว้ด้านล่าง ทั้งลูกค้าและนักวิจัยพิจารณาว่าการมุ่งเน้นไปที่เกณฑ์ส่วนตัวต่อไปนี้ค่อนข้างเพียงพอ: หากปริมาณข้อมูลใหม่ที่ได้รับจากแต่ละกลุ่มต่อมาลดลงอย่างรวดเร็ว การศึกษาควรหยุดลง

เหตุผลที่สองเป็นพื้นฐานมากกว่ามาก เป็นที่น่าสังเกตว่ามันเชื่อมโยงกับความจริงที่ว่าทุกวันนี้การดำเนินงานอย่างเคร่งครัดและคล้อยตามระบบอัตโนมัติการแยกหน่วยความหมายจากข้อความสามารถทำได้ในระดับคำและวลีที่มั่นคงเท่านั้น การแยกการจัดกลุ่มและโทโพโลยีของหน่วยความหมายที่ซับซ้อนมากขึ้นซึ่งดำเนินการในขั้นตอนการวิเคราะห์ของการวิจัยทางสังคมวิทยาเชิงคุณภาพสามารถทำได้โดยบุคคลเท่านั้นบนพื้นฐานของอัลกอริธึมทางปัญญาที่ยังไม่ได้ศึกษาที่ยังไม่ได้ศึกษา ความก้าวหน้าอย่างรวดเร็วในการพัฒนาโปรแกรมการแปลโดยใช้คอมพิวเตอร์ช่วยแสดงให้เห็นว่า เมื่อเวลาผ่านไป การจดจำหน่วยความหมายที่ซับซ้อนมากขึ้นโดยอัตโนมัติจะเป็นไปได้ อย่างไรก็ตาม งานนี้ยังไม่มีผลกระทบต่อการปฏิบัติงานวิจัยการสนทนากลุ่มแต่อย่างใด ในการศึกษาวรรณกรรมเกี่ยวกับกลุ่มเป้าหมายทางการตลาด เราไม่เคยพบเห็นการกล่าวถึงการใช้การวิเคราะห์เนื้อหาในรูปแบบใดๆ เลย มีการอ้างอิงดังกล่าวในสาขาการวิจัยทางวิชาการ แต่การศึกษาประเด็นนี้จำเป็นต้องมีการทำงานพิเศษ โปรดทราบว่าในช่วงต้นทศวรรษที่ 90 งานที่ทันสมัยที่สุดในวิธีวิเคราะห์เนื้อหาคอมพิวเตอร์ถือเป็นงานของเวเบอร์

โดยสรุป ให้เรามาดูประเด็นในการระบุขอบเขตของการวิจัยเชิงปริมาณและเชิงคุณภาพที่ถูกต้อง แสดงให้เห็นข้างต้นว่าพื้นที่เหล่านี้มีความแตกต่างกันโดยพื้นฐาน เนื่องจากประเภทของปัญหาที่พวกเขาแก้ไขนั้นแตกต่างกันอย่างสิ้นเชิง พื้นที่ของการประยุกต์ใช้แบบสำรวจอย่างเป็นทางการที่ถูกต้องนั้นดูไร้ขีดจำกัดหรือกว้างมากเพียงมองแวบแรกเท่านั้น ในความเป็นจริง มันถูกจำกัดอยู่เพียงการระบุระดับความแพร่หลายของความรู้ ความคิดเห็น หรือทัศนคติบางอย่าง ซึ่ง:

ก) ต้องทราบล่วงหน้า เช่น ก่อนการสำรวจ

b) ไม่ควรเป็นนิยายที่บังคับใช้กับผู้ถูกร้องหรือการตัดสินหลอกซึ่งไม่มีอยู่ในจิตสำนึกของเขา

วิธีการเชิงปริมาณไม่เหมาะสำหรับการระบุข้อเท็จจริงของการมีอยู่ของความรู้ ความคิดเห็น หรือทัศนคติ ดังจะเห็นได้ชัดเจนจากการเปรียบเทียบผลการสำรวจต่อไปนี้

ก. การวิจัยเชิงปริมาณ

คำถาม: คุณชอบอะไร - พายแอปเปิ้ลหรือคัพเค้กช็อคโกแลต? (% ของจำนวนผู้ตอบแบบสอบถาม)

พายแอปเปิ้ล - 26%

คัพเค้กช็อคโกแลต - 22%

ทั้งสอง - 43%

ตอบยาก - 9%

ข. การวิจัยเชิงคุณภาพ

คำถาม: คุณชอบอะไร - พายแอปเปิ้ลหรือคัพเค้กช็อคโกแลต?

คำตอบ: ฉันไม่รู้. ฉันรักทั้งสอง

คำถาม : คือถ้าไม่ลืมว่าต้องเอาสิ่งหนึ่งจะเป็นอย่างไร? ลองคิดดูสิ

คำตอบ: แน่นอนว่าพายนั้นแตกต่างกัน ถ้าฉันมีโอกาสเอาพายแอปเปิ้ลของแม่ ฉันจะชอบมันมากกว่าคัพเค้กช็อคโกแลต หากเป็นเรื่องสำคัญอย่างยิ่งที่จะต้องทานพายแอปเปิ้ลฉันก็ไม่แน่ใจ

คำถาม: มันอาจจะขึ้นอยู่กับอะไรอีก อย่าลืมว่าคุณเลือกอะไร?

คำตอบ: เช่น ขึ้นอยู่กับว่าฉันกินอะไรเป็นมื้อกลางวัน เผื่อฉันกินข้าวเที่ยงอิ่ม ฉันคิดว่าฉันจะกินพายแอปเปิ้ล พายแอปเปิ้ลเป็นอาหารอันโอชะที่ยิ่งใหญ่ในครอบครัวของฉัน แต่หากฉันกินอะไรเบาๆ เป็นมื้อกลางวัน เช่น ปลา ก็ควรกินมัฟฟินจะดีกว่า ถ้าอากาศหนาวฉันจะไม่ปฏิเสธคัพเค้กช็อคโกแลต

บทสนทนาข้างต้นแสดงให้เห็นอย่างชัดเจนถึงความจริงที่ว่าคำตอบง่ายๆ “ฉันเลือกพายแอปเปิ้ล” ขึ้นอยู่กับหลายปัจจัย ในกรณีนี้ - ใครเป็นคนเตรียมพาย ระดับความหิว ความหนาแน่นของอาหารกลางวัน และอุณหภูมิโดยรอบ รายการนี้น่าจะดำเนินต่อไปได้ แต่เช่นเดียวกับในกรณีอื่นๆ จำนวนของปัจจัยดังกล่าวหรืออย่างน้อยก็ปัจจัยที่พบบ่อยที่สุดดูเหมือนจะไม่มากนัก ภารกิจของการวิจัยเชิงคุณภาพดังที่ได้กล่าวไปแล้วคือการระบุรายการปัจจัยเหล่านี้ด้วยความสมบูรณ์ในระดับที่เหมาะสม ในด้านนี้ การวิจัยเชิงคุณภาพมีความถูกต้องในระดับสูง สมควรที่จะทราบว่าการพิจารณาการกระจายความถี่ของผลกระทบของปัจจัยที่ระบุในประชากรที่กำลังศึกษานั้นเป็นเรื่องของการวิจัยเชิงปริมาณ อย่าลืมว่ามีข้อแม้สองประการที่สำคัญ:

ก) จากมุมมองเชิงปฏิบัติ ค่าใช้จ่ายในการดำเนินการศึกษาเชิงปริมาณอาจเกินความเสี่ยงที่คาดหวังจากการตัดสินใจอย่างมุ่งมั่นโดยอาศัยข้อมูลที่แม่นยำน้อยกว่า

b) การเปลี่ยนแปลงปัจจัยที่ระบุให้เป็นคำถามอย่างเพียงพอในแบบสอบถามที่เป็นทางการมักจะยากหรือเป็นไปไม่ได้ และมักจะเป็นเรื่องยากอย่างยิ่งที่จะกำหนดระดับของความไม่เพียงพอที่เป็นไปได้

สถานการณ์เหล่านี้มักจะลดความถูกต้องของการวิจัยเชิงปริมาณลงจนไม่สามารถดำเนินการได้

เฉพาะในกรณีที่สมมติฐานเกี่ยวกับความถูกต้องของถ้อยคำของคำถามในแบบสอบถามที่เป็นทางการดูเหมือนสมเหตุสมผลหรือเป็นไปได้ การวิจัยเชิงปริมาณจึงสามารถสร้างผลลัพธ์ที่ถูกต้องซึ่งช่วยให้การตัดสินใจขึ้นอยู่กับข้อมูลที่แม่นยำยิ่งขึ้น

ความถูกต้องของวิธีการความถูกต้องของวิธีการวิจัยและการวินิจฉัย (หมายถึง "สมบูรณ์ เหมาะสม เหมาะสม") แสดงให้เห็นว่ามีการวัดคุณภาพ (ทรัพย์สิน คุณลักษณะ) ที่มีวัตถุประสงค์เพื่อประเมินมากน้อยเพียงใด ความถูกต้อง (ความเพียงพอ) พูดถึงระดับที่วิธีการนั้นสอดคล้องกับวัตถุประสงค์ ยิ่งมีการเปิดเผยคุณลักษณะการวินิจฉัยที่ใกล้ชิดยิ่งขึ้นซึ่งวิธีการดังกล่าวมีจุดประสงค์เพื่อตรวจจับและวัดผล ความเที่ยงตรงของมันก็จะยิ่งสูงขึ้นตามไปด้วย

แนวคิดเรื่องความถูกต้องไม่เพียงแต่หมายถึงวิธีการเท่านั้น แต่ยังรวมถึงเกณฑ์ในการประเมินคุณภาพด้วย เกณฑ์ความถูกต้องนี่เป็นสัญญาณหลักที่ทำให้เราสามารถตัดสินได้ว่าเทคนิคที่กำหนดนั้นถูกต้องหรือไม่

เทคนิคการวินิจฉัยมีความถูกต้องหลายประเภท

ความถูกต้องทางทฤษฎี (แนวความคิด)ถูกกำหนดโดยความสอดคล้องของตัวบ่งชี้คุณภาพที่กำลังศึกษาซึ่งได้รับโดยใช้เทคนิคนี้กับตัวบ่งชี้ที่ได้รับโดยใช้เทคนิคอื่น ๆ (โดยตัวบ่งชี้ที่ควรมีความสัมพันธ์ที่สมเหตุสมผลทางทฤษฎี) ความถูกต้องทางทฤษฎีได้รับการทดสอบโดยความสัมพันธ์ของตัวบ่งชี้ของคุณสมบัติเดียวกันที่ได้รับโดยใช้วิธีการต่าง ๆ ที่เกี่ยวข้องกับทฤษฎีเดียวกัน

ความถูกต้องเชิงประจักษ์ (เชิงปฏิบัติ)ได้รับการตรวจสอบโดยความสอดคล้องของตัวบ่งชี้การวินิจฉัยกับพฤติกรรมในชีวิตจริง การกระทำที่สังเกตได้ และปฏิกิริยาของวัตถุ ตัวอย่างเช่น หากเราประเมินลักษณะนิสัยของวิชาที่กำหนดโดยใช้เทคนิคบางอย่าง เทคนิคที่ใช้จะถือว่าใช้ได้จริงหรือเชิงประจักษ์เมื่อเราพิสูจน์ได้ว่าบุคคลนี้ประพฤติตนในชีวิตตรงตามที่เทคนิคทำนายไว้ กล่าวคือ ตามลักษณะนิสัยของเขา

ความถูกต้องภายในหมายถึงการปฏิบัติตามงาน การทดสอบย่อย การตัดสิน ฯลฯ ที่มีอยู่ในระเบียบวิธี เป้าหมายโดยรวมและความตั้งใจของวิธีการโดยรวม จะถือว่าไม่ถูกต้องเป็นการภายในหรือไม่เพียงพอเมื่อคำถาม งาน หรือการทดสอบย่อยทั้งหมดหรือบางส่วนที่รวมอยู่ในนั้นไม่ได้วัดสิ่งที่จำเป็นของเทคนิคนี้

ความถูกต้องภายนอก- สิ่งนี้ใกล้เคียงกับความถูกต้องเชิงประจักษ์โดยประมาณ โดยมีความแตกต่างเพียงอย่างเดียวที่ในกรณีนี้ เรากำลังพูดถึงความเชื่อมโยงระหว่างตัวชี้วัดของวิธีการและสัญญาณภายนอกที่สำคัญและสำคัญที่สุดที่เกี่ยวข้องกับพฤติกรรมของวิชา

ความถูกต้องที่ชัดเจนอธิบายแนวคิดของวิธีการที่ผู้เรียนมีเช่น มันเป็นความถูกต้องจากมุมมองของเรื่อง ผู้เข้าร่วมควรมองว่าเทคนิคนี้เป็นเครื่องมือที่สำคัญในการทำความเข้าใจบุคลิกภาพของเขาซึ่งค่อนข้างคล้ายกับเครื่องมือวินิจฉัยทางการแพทย์

ความถูกต้องตามการคาดการณ์ถูกสร้างขึ้นโดยใช้ความสัมพันธ์ระหว่างตัวบ่งชี้ของวิธีการและเกณฑ์บางอย่างที่แสดงลักษณะของคุณสมบัติที่กำลังวัด แต่ในภายหลัง L. Cronbach ถือว่าความถูกต้องตามการคาดการณ์เป็นหลักฐานที่น่าเชื่อถือที่สุดว่าเทคนิคจะวัดสิ่งที่ตั้งใจจะวัดได้อย่างแม่นยำ



ความถูกต้องของเนื้อหากำหนดโดยการยืนยันว่างานของวิธีการสะท้อนถึงทุกด้านของพฤติกรรมที่ศึกษา ความถูกต้องของเนื้อหามักเรียกว่า "ความถูกต้องเชิงตรรกะ" หรือ "ความถูกต้องขั้นสุดท้าย" หมายความว่าวิธีการดังกล่าวถูกต้องตามผู้เชี่ยวชาญ โดยปกติแล้วจะถูกกำหนดโดยการทดสอบวัดผลสัมฤทธิ์ ในทางปฏิบัติ เพื่อกำหนดความถูกต้องของเนื้อหา ผู้เชี่ยวชาญจะถูกเลือกเพื่อระบุว่าขอบเขตของพฤติกรรมใดที่สำคัญที่สุด

จากการอธิบายประเภทของความถูกต้องเป็นไปตามว่าไม่มีตัวบ่งชี้เดียวที่มีการสร้างความถูกต้องของเทคนิคการวินิจฉัย อย่างไรก็ตาม นักพัฒนาจะต้องจัดเตรียมหลักฐานที่สำคัญเพื่อสนับสนุนความถูกต้องของวิธีการที่นำเสนอ

เป็นเรื่องง่ายที่จะเห็นความเชื่อมโยงโดยตรงระหว่างความถูกต้องและความน่าเชื่อถือ เทคนิคที่มีความน่าเชื่อถือต่ำไม่สามารถมีความถูกต้องสูงได้ เนื่องจากเครื่องมือวัดไม่ถูกต้องและลักษณะที่วัดได้ไม่เสถียร เทคนิคนี้เมื่อเปรียบเทียบกับเกณฑ์ภายนอก สามารถแสดงให้เห็นข้อตกลงที่สูงในกรณีหนึ่ง และข้อตกลงที่ต่ำมากในอีกกรณีหนึ่ง เป็นที่ชัดเจนว่าด้วยข้อมูลดังกล่าวเป็นไปไม่ได้ที่จะสรุปผลใด ๆ เกี่ยวกับความเหมาะสมของเทคนิคตามวัตถุประสงค์ที่ตั้งใจไว้

การได้มาซึ่งค่าสัมประสิทธิ์ความถูกต้องเป็นขั้นตอนที่ใช้แรงงานเข้มข้นซึ่งไม่จำเป็นในกรณีที่ผู้วิจัยใช้เทคนิคนี้ในขอบเขตที่จำกัด และไม่ได้มีวัตถุประสงค์เพื่อใช้ในวงกว้าง ค่าสัมประสิทธิ์ความถูกต้องจะขึ้นอยู่กับข้อกำหนดเดียวกันกับค่าสัมประสิทธิ์ความน่าเชื่อถือ: ยิ่งเกณฑ์มีระเบียบวิธีสมบูรณ์แบบมากเท่าใด ค่าสัมประสิทธิ์ความถูกต้องควรสูงขึ้นเท่านั้น ค่าสัมประสิทธิ์ความถูกต้องต่ำมักถูกระบุไว้เมื่อมุ่งเน้นไปที่ประเด็นเล็กๆ น้อยๆ

ความน่าเชื่อถือของวิธีการวิจัยความน่าเชื่อถือเป็นหนึ่งในเกณฑ์สำหรับคุณภาพของผลการวินิจฉัย ซึ่งเกี่ยวข้องกับระดับความแม่นยำและความเสถียรของตัวบ่งชี้อาการที่กำลังวินิจฉัย ยิ่งความน่าเชื่อถือของเทคนิคมากเท่าไรก็ยิ่งมีอิสระจากข้อผิดพลาดในการวัดมากขึ้นเท่านั้น ในความหมายที่กว้างที่สุด ความน่าเชื่อถือเป็นคุณลักษณะของขอบเขตที่ความแตกต่างที่ระบุระหว่างอาสาสมัครในผลลัพธ์ของเทคนิคเป็นการสะท้อนของความแตกต่างที่แท้จริงของคุณสมบัติที่กำลังวัด และขอบเขตที่สามารถจัดว่าเป็นข้อผิดพลาดแบบสุ่มได้

ในทฤษฎีการวินิจฉัย แนวคิดเรื่องความน่าเชื่อถือมีสองความหมาย: ความน่าเชื่อถือของเทคนิคในฐานะเครื่องมือเฉพาะ (เช่น การใช้มิเตอร์ เรามั่นใจว่าจะไม่เปลี่ยนแปลงไม่ว่าเราจะวัดค่าใดก็ตาม) และความไม่เปลี่ยนรูปสัมพัทธ์ของ วัตถุการวินิจฉัย (เราต้องแน่ใจว่าภายใต้สภาวะปกติค่าที่วัดได้จะไม่เปลี่ยนแปลง)

แนวคิดเรื่องความน่าเชื่อถือเกี่ยวข้องกับความถูกต้องของการวัด หรือค่อนข้างเกี่ยวข้องกับการประเมินข้อผิดพลาดและการกำหนดบนพื้นฐานมูลค่าที่แท้จริงของปริมาณ

มีเทคนิคหลักสามประการในการประเมินความน่าเชื่อถือของเทคนิคการวินิจฉัย

การยอมรับการทดสอบซ้ำหรือการวินิจฉัยซ้ำ ช่วยให้คุณสามารถประมวลผลงานเดียวกันที่ทำโดยวิชาเดียวกันในเวลาที่ต่างกัน และคำนวณความสัมพันธ์ระหว่างผลลัพธ์ที่แสดงเป็นค่าสัมประสิทธิ์สหสัมพันธ์ในตัวเอง

การรับการลดลงครึ่งหนึ่ง– การเลือกงานเมื่อเสร็จสิ้นจะถูกแบ่งครึ่ง (เช่น การทดสอบครึ่งแรกรวมงานที่มีเลขลำดับคี่ และการทดสอบครึ่งหลังรวมงานที่เป็นเลขคู่) จากนั้นจึงกำหนดผลลัพธ์ของแต่ละวิชา สำหรับทั้งครึ่งการทดสอบและค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างผลลัพธ์ที่ได้รับจะถูกคำนวณ

ทำการทดสอบแบบขนาน -เพื่อวัดความรู้เดียวกัน มีการสร้างชุดงานที่แตกต่างกันสองชุด ซึ่งในเนื้อหามีลักษณะคล้ายฝาแฝด ทั้งสองชุดงานขนานกันจะถูกเสนอต่อกันทันทีหรือตามความเหมาะสม

ในทุกกรณีโดยมีค่าสัมประสิทธิ์สหสัมพันธ์ของวิธี ร> 0.7 เทคนิคนี้ถือว่าเชื่อถือได้ (สำหรับค่าสัมประสิทธิ์สหสัมพันธ์ดูหัวข้อ 4.2)

ในวิธีการทดสอบ เป็นเรื่องปกติที่จะต้องคำนึงถึงค่าสัมประสิทธิ์ความน่าเชื่อถือสามประการ:

1) ค่าสัมประสิทธิ์ความมั่นคงหรือความคงตัวเป็นตัวบ่งชี้ความสัมพันธ์ระหว่างผลลัพธ์ของการทดสอบครั้งแรกและการทดสอบซ้ำโดยใช้การทดสอบเดียวกันของกลุ่มตัวอย่างเดียวกัน

2) สัมประสิทธิ์ความเท่าเทียมกันหรือค่าสัมประสิทธิ์สหสัมพันธ์ ผลการทดสอบกลุ่มวิชาเดียวกันโดยใช้รูปแบบการทดสอบเดียวกันหรือต่างกันแต่มีรูปแบบและวัตถุประสงค์เท่ากัน

3) ค่าสัมประสิทธิ์ความมั่นคงภายในหรือความเป็นเนื้อเดียวกันภายในซึ่งสอดคล้องกับความสัมพันธ์ของผลลัพธ์ของการทดสอบส่วนต่างๆ ที่ดำเนินการโดยวิชาเดียวกัน

3. การจำแนกวิธีการวิจัยเชิงการสอน

วิธีการวิจัยเชิงการสอนแบ่งได้หลายประเภท ขึ้นอยู่กับพื้นฐานของการจำแนกประเภท วิธีการวิจัยในการสอนแบ่งออกเป็น:

· เชิงประจักษ์และเชิงทฤษฎี

· สืบค้นและเปลี่ยนแปลง;

· เชิงคุณภาพและเชิงปริมาณ

· ส่วนตัวและทั่วไป

· วิธีการรวบรวมข้อมูลเชิงประจักษ์ การทดสอบและการหักล้างสมมติฐานและทฤษฎี

· วิธีการอธิบาย คำอธิบาย และการพยากรณ์

· วิธีการพิเศษที่ใช้ในวิทยาศาสตร์การสอนเฉพาะบุคคล

· วิธีการประมวลผลผลการวิจัย ฯลฯ

ถึง วิธีการทางวิทยาศาสตร์ทั่วไป (ใช้ตามศาสตร์ต่างๆ) ได้แก่

· ทฤษฎีทั่วไป(นามธรรมและการทำให้เป็นรูปธรรม การวิเคราะห์และการสังเคราะห์ การเปรียบเทียบ คอนทราสต์ การเหนี่ยวนำและการนิรนัย เช่น วิธีการเชิงตรรกะ)

· สังคมวิทยา(แบบสอบถาม การสัมภาษณ์ แบบสำรวจผู้เชี่ยวชาญ การให้คะแนน)

· สังคมจิตวิทยา(สังคมมิติ การทดสอบ การฝึกอบรม);

· ทางคณิตศาสตร์(การจัดอันดับ การปรับขนาด การจัดทำดัชนี ความสัมพันธ์)

ถึง วิทยาศาสตร์ที่เป็นรูปธรรม (การสอนเฉพาะ)รวมไปถึงวิธีการต่างๆ ซึ่งจะแบ่งออกเป็น เชิงทฤษฎีและเชิงประจักษ์ (เชิงปฏิบัติ)

วิธีการทางทฤษฎีทำหน้าที่ในการตีความ การวิเคราะห์ และการวางนัยทั่วไปของตำแหน่งทางทฤษฎีและข้อมูลเชิงประจักษ์ นี่คือการวิเคราะห์ทางทฤษฎีของวรรณกรรม เอกสารสำคัญ และเอกสารต่างๆ การวิเคราะห์แนวคิดพื้นฐานและเงื่อนไขการวิจัย วิธีการเปรียบเทียบ การสร้างสมมติฐานและการทดลองทางความคิด การพยากรณ์ การสร้างแบบจำลอง ฯลฯ

วิธีการเชิงประจักษ์มีไว้สำหรับการสร้างรวบรวมและจัดระเบียบสื่อเชิงประจักษ์ - ข้อเท็จจริงของเนื้อหาการสอนผลิตภัณฑ์ของกิจกรรมการศึกษา

วิธีเชิงประจักษ์ ได้แก่ การสังเกต การสนทนา การสัมภาษณ์ การตั้งคำถาม วิธีการศึกษาผลงานของกิจกรรมของนักเรียน เอกสารของโรงเรียน วิธีการประเมิน (การให้คะแนน การให้คำปรึกษาด้านการสอน การประเมินตนเอง ฯลฯ) วิธีการวัดและควบคุม (การปรับขนาด , ภาพตัดขวาง, การทดสอบ ฯลฯ) รวมถึงการทดลองเชิงการสอนและการทวนสอบผลการวิจัยในโรงเรียนของรัฐ โดยปกติทั้งวิธีทางทฤษฎีและเชิงประจักษ์จะใช้ร่วมกับวิธีทางคณิตศาสตร์และทางสถิติ ซึ่งใช้ในการประมวลผลข้อมูลที่ได้รับในระหว่างการศึกษา ตลอดจนสร้างความสัมพันธ์เชิงปริมาณระหว่างปรากฏการณ์ที่กำลังศึกษาอยู่

วิธีการทางคณิตศาสตร์ใช้ในการประมวลผลข้อมูลที่ได้จากการสำรวจและวิธีทดลอง ตลอดจนสร้างความสัมพันธ์เชิงปริมาณระหว่างปรากฏการณ์ที่กำลังศึกษา

ที่พบบ่อยที่สุด วิธีการทางคณิตศาสตร์ ที่ใช้ในการเรียนการสอน ได้แก่

· การลงทะเบียน – ระบุการมีอยู่ของคุณภาพที่แน่นอนในสมาชิกกลุ่มแต่ละราย และจำนวนทั่วไปของผู้ที่มีหรือไม่มีคุณสมบัตินี้ (เช่น จำนวนนักเรียนที่ทำงานอย่างแข็งขันในชั้นเรียน และจำนวนของผู้ที่ไม่โต้ตอบ)

· ตั้งแต่ (คะแนนอันดับ)– การจัดเรียงข้อมูลที่รวบรวมในลำดับที่แน่นอน (ตามลำดับจากมากไปน้อยหรือน้อยไปหามากของตัวบ่งชี้บางตัว) และตามลำดับ กำหนดสถานที่ในชุดนี้ของแต่ละคนที่กำลังศึกษา (เช่น รวบรวมรายชื่อเพื่อนร่วมชั้นที่ต้องการมากที่สุด)

· การปรับขนาด – การแนะนำตัวบ่งชี้ดิจิทัลในการประเมินแต่ละแง่มุมของปรากฏการณ์การสอน เพื่อจุดประสงค์นี้ ผู้เรียนจะถูกถามคำถามโดยตอบว่าจะต้องเลือกหนึ่งในการประเมินที่ระบุ (เช่น ในคำถามเกี่ยวกับการมีส่วนร่วมในกิจกรรมใด ๆ ในเวลาว่าง ให้เลือกหนึ่งในคำตอบของการประเมิน: ฉันสนใจ ฉันสนใจ ข้าพเจ้าทำเป็นประจำ ข้าพเจ้าทำเป็นประจำ ข้าพเจ้ามิได้ทำสิ่งใดเลย)

วิธีการทางสถิติใช้ในการแปรรูปวัสดุเทกอง– การกำหนดค่าเฉลี่ยของตัวบ่งชี้ที่ได้รับ: ค่าเฉลี่ยเลขคณิต, ค่ามัธยฐาน - ตัวบ่งชี้ที่อยู่ตรงกลางของอนุกรม, คำนวณระดับการกระจายตัวรอบค่าเหล่านี้ - การกระจายตัว, สัมประสิทธิ์ของการแปรผัน ฯลฯ

ความถูกต้องของการวิจัยถูกกำหนดโดย Cook และ Campbell ในปี 1979 ว่าเป็นการประมาณข้อความที่เป็นจริงได้ดีที่สุด รวมถึงข้อความที่เกี่ยวข้องกับความสัมพันธ์ระหว่างเหตุและผล คำจำกัดความนี้เกี่ยวข้องกับการสร้างความถูกต้องแม่นยำของผลการวิจัย และเน้นถึงลักษณะสัมพัทธ์ของความจริงที่สามารถทำได้ในสาขาสังคมศาสตร์ ในการศึกษาทางวิทยาศาสตร์ใด ๆ ผู้วิจัยจะต้องสามารถตอบคำถามต่อไปนี้:

1) มีความสัมพันธ์ระหว่างตัวแปรสองตัวหรือไม่

2) การพึ่งพาอาศัยกันนี้เป็นสาเหตุโดยธรรมชาติหรือไม่

3) ความสัมพันธ์นี้มีนัยสำคัญหรือไม่

4) ขั้นตอนการวัดและการสังเกตเกี่ยวข้องกับโครงสร้างที่กำลังศึกษาหรือไม่

5) ว่าการพึ่งพาเชิงสาเหตุที่ระบุในระหว่างการศึกษาสามารถสรุปได้หรือไม่

ให้เราเน้นความถูกต้องประเภทต่อไปนี้ที่เกี่ยวข้องกับปัญหาเหล่านี้

1. ความถูกต้องของการอนุมานทางสถิติ

ความถูกต้องประเภทนี้สอดคล้องกับการทดสอบนัยสำคัญทางสถิติของความสัมพันธ์ระหว่างตัวแปรสองตัว ข้อสรุปดังกล่าวมีความน่าจะเป็นอยู่เสมอ แท้จริงแล้ว เราสามารถสร้างข้อผิดพลาดได้สองประเภท: การตัดสินใจว่าความสัมพันธ์มีความสำคัญเมื่อไม่มี หรือการตัดสินใจว่าจะไม่มีความสัมพันธ์ที่มีนัยสำคัญระหว่างตัวแปรเมื่อตรงกันข้าม

มีปัจจัยบางประการที่สามารถลดความถูกต้องของข้อสรุปทางสถิติได้:

1) ความอ่อนไหวในการวิจัยที่ไม่ดี ซึ่งแสดงออกเมื่อขนาดตัวอย่างไม่เพียงพอหรือเมื่อมีความแปรปรวนมากในกลุ่มที่ถูกเปรียบเทียบ กล่าวคือ หัวข้อมีความแตกต่างกันมากเกินไปและแตกต่างกันอย่างมากจากตัวแปรบางตัว

2) ความน่าเชื่อถือต่ำของเทคนิคการวัดหรือขั้นตอนการจัดการตัวแปรที่ใช้ในการศึกษา

3) ปัจจัยรบกวนที่มีอยู่ในเงื่อนไขการทดลอง

4) การละเมิดกฎการดำเนินการและการประมวลผลที่เป็นที่ยอมรับซึ่งกำหนดขึ้นสำหรับวิธีการทางสถิติต่างๆ

กลยุทธ์ในการเพิ่มความถูกต้องของการอนุมานทางสถิติคือการลดความแปรปรวนของข้อผิดพลาดโดยใช้ ตัวอย่างเช่น การออกแบบตัวอย่างซ้ำ หรือการใช้กลุ่มที่เป็นเนื้อเดียวกัน ความถูกต้องทางสถิติของการศึกษาสามารถวินิจฉัยได้ทั้งในขั้นตอนการออกแบบการวิจัย (เช่น การตรวจสอบการคำนวณขนาดตัวอย่าง) และหลังการศึกษาเพื่อประเมินผลลัพธ์

2. ความถูกต้องภายใน

ความถูกต้องภายในเป็นหนึ่งในความถูกต้องที่สำคัญที่สุด และเกี่ยวข้องกับความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ ความถูกต้องนี้เกี่ยวข้องกับขั้นตอนเฉพาะที่ช่วยให้เราสามารถกำหนดขอบเขตที่ข้อสรุปในการศึกษาที่กำหนดมีความน่าเชื่อถือ เมื่อความสัมพันธ์ระหว่างตัวแปร X และตัวแปร Y เกิดขึ้นแล้ว จำเป็นต้องตัดสินใจว่าตัวแปรใดเป็นสาเหตุและผลกระทบใดคือกำหนดทิศทางของความสัมพันธ์นี้ หากสังเกต Y หลังจาก X แล้ว X ก็อาจกล่าวได้ว่าเป็นสาเหตุของ Y


อย่างไรก็ตาม อาจเป็นไปได้ว่าความสัมพันธ์แบบพึ่งพาระหว่าง X และ Y เกิดจากตัวแปรตัวที่สาม C เพื่อสร้างความถูกต้องภายใน จำเป็นต้องพิจารณาความเป็นไปได้ทั้งหมดสำหรับอิทธิพลของตัวแปรตัวที่สาม C บนตัวแปร X และ Y และกำจัดพวกมันออกไป การศึกษาจะถือว่ามีความถูกต้องภายในหากแสดงให้เห็นว่ามีความสัมพันธ์แบบเหตุและผลระหว่างตัวแปรตามและตัวแปรอิสระ

เหตุผลในการลดความถูกต้องภายในของการศึกษา:

1. การผสมตัวแปรนี่เป็นหนึ่งในอันตรายที่ยิ่งใหญ่ที่สุดต่อความถูกต้องของการทดสอบ ในระหว่างการทดลอง หากปัจจัยสุ่มบางตัว (ตัวแปรที่ไม่ใช่การทดลอง) มีปฏิสัมพันธ์กับตัวแปรตาม และปฏิสัมพันธ์นี้ไม่สามารถวัดแยกจากปฏิสัมพันธ์ของตัวแปรตามและตัวแปรอิสระได้ อิทธิพลของตัวแปรสุ่มและตัวแปรอิสระจะแยกไม่ออก ปัญหาการทำให้สับสนนั้นรุนแรงมากในการศึกษาที่ผู้ทดลองไม่สามารถควบคุมตัวแปรอิสระได้

2. การเปลี่ยนแปลงที่เกี่ยวข้องกับวิชาเมื่อทดสอบตัวแปรตาม การเปลี่ยนแปลงที่เกิดขึ้นระหว่างสองช่วงเวลาของการสังเกตอาจไม่เกิดจากตัวแปรอิสระ แต่เกิดจากการเปลี่ยนแปลงที่เกิดขึ้นกับตัวแบบเอง (เช่น เหตุการณ์ในชีวิตส่วนตัว การเปลี่ยนแปลงลักษณะบุคลิกภาพบางอย่าง เป็นต้น) นั่นคือ ปัจจัย "วุฒิภาวะ" และ "ประวัติศาสตร์"

คำว่า "ครบกำหนด" หมายถึงการเปลี่ยนแปลงที่เกิดขึ้นในหัวข้อระหว่างการทดสอบก่อนและหลังการทดสอบ และไม่เกี่ยวข้องกับอิทธิพลของตัวแปรอิสระ ตัวอย่างเช่น ในการทดลองเกี่ยวกับการประสานงานของมอเตอร์ ผู้เข้าร่วมอาจได้รับประสบการณ์ที่ดีขึ้นเนื่องจากการฝึกอบรมในช่วงเวลาระหว่างการทดลอง ไม่ควรสับสนระหว่างอิทธิพลนี้กับอิทธิพลของตัวแปรอิสระ ปัจจัย "ประวัติศาสตร์" หมายถึงเหตุการณ์ที่เกิดขึ้นกับอาสาสมัครและมีอิทธิพลต่อผลลัพธ์ของการทดลอง

3. อิทธิพลก่อนการทดสอบการทดสอบก่อนทำให้เกิดการเปลี่ยนแปลงในวิชาต่างๆ ดังนั้นในบางกรณีผลลัพธ์ของการทดลองอาจขึ้นอยู่กับการทดสอบก่อนมากกว่าขึ้นอยู่กับตัวแปรตาม

4. การเปลี่ยนทักษะของนักวิจัยตัวอย่างเช่น นักวิจัยอาจมีประสบการณ์ในการสังเกตมากขึ้นหลังจากผ่านไประยะหนึ่ง ดังนั้น จึงตีความพฤติกรรมของอาสาสมัครแตกต่างออกไป นอกจากนี้ ผู้วิจัยอาจได้รับอิทธิพลจากปัจจัยต่างๆ เช่น ความเหนื่อยล้า ซึ่งอาจนำไปสู่ข้อผิดพลาดในการทดลองได้

5. การถดถอยสู่ค่าเฉลี่ยปรากฏการณ์นี้เกิดขึ้นเมื่อบุคคลถูกทดสอบซ้ำๆ กับตัวแปรเดียวกัน เป็นที่ยอมรับกันว่าหากผู้เข้าร่วมได้รับผลลัพธ์ในการทดสอบครั้งแรกซึ่งมีขนาดใกล้เคียงกับตัวบ่งชี้สูงสุดของสเกล จากนั้นในระหว่างการทดลองซ้ำ ผลลัพธ์ของพวกเขาจะลดลงและเข้าใกล้ค่าเฉลี่ยมากขึ้น ในขณะที่ผู้เข้าร่วมที่ได้รับผลลัพธ์ใกล้เคียงกับ ต่ำสุดในการทดสอบครั้งแรกด้วยการวัดซ้ำๆ จะทำให้ได้ผลลัพธ์ที่ดีกว่า การถดถอยของค่าเฉลี่ยยังสังเกตได้ในกรณีของข้อผิดพลาดที่เกี่ยวข้องกับการเปลี่ยนแปลงในตัวแปร

6. การออกกลางคันเป็นที่รู้กันว่าระหว่างเรียนมีบางวิชาออกจากกลุ่มไป วิชาที่เหลือย่อมแตกต่างไปจากวิชาที่หลุดออกไปโดยธรรมชาติ

สมมติว่ามีการตรวจสอบเทคนิคการปรับเปลี่ยนพฤติกรรมสองวิธีเพื่อควบคุมน้ำหนักตัว กลุ่มที่ 1 ได้รับการกำหนดอาหาร นอกจากนี้ ผู้เข้ารับการทดสอบในกลุ่มแรกจะต้องจดบันทึกทุกสิ่งที่พวกเขากินทุกวันลงในไดอารี่ ชั่งน้ำหนักอาหารทุกมื้ออย่างแม่นยำ และนับปริมาณแคลอรี่ของอาหาร กลุ่มที่ 2 ได้รับการกำหนดให้รับประทานอาหาร แน่นอนว่ากลุ่มทดสอบบางกลุ่มที่มีงานหนักกว่าจะออกจากการทดสอบ เมื่อสิ้นสุดการทดลอง เปอร์เซ็นต์ของวิชาที่มีแรงจูงใจสูงในกลุ่มนี้จะมากขึ้น ผู้ที่มีแรงจูงใจสูงมีแนวโน้มที่จะลดน้ำหนักได้มากกว่า ดังนั้นผู้วิจัยจึงอาจสรุปผิดพลาดได้ว่าภาวะในกลุ่มแรกมีประสิทธิภาพในการลดน้ำหนักมากกว่า

ผู้เขียนบางคนยังพูดถึง สร้างความถูกต้อง- ความถูกต้องของโครงสร้างมีความคล้ายคลึงกับความถูกต้องภายใน และหมายถึงความสอดคล้องกันระหว่างสิ่งที่ค้นพบกับทฤษฎีที่เป็นรากฐานของการศึกษา เพื่อประเมินความถูกต้องของโครงสร้าง จำเป็นต้องตัดคำอธิบายทางทฤษฎีอื่นๆ ที่เป็นไปได้สำหรับผลลัพธ์ออก หากมีข้อสงสัยว่าผลการทดลองเปรียบเทียบกับผลลัพธ์ทางทฤษฎีอย่างไร จำเป็นต้องออกแบบการทดลองใหม่เพื่อให้สามารถเลือกคำอธิบายทางทฤษฎีหลายประการสำหรับผลลัพธ์ได้ ความถูกต้องประเภทนี้เป็นสิ่งที่ได้มายากที่สุดเนื่องจากมีทฤษฎีมากมายที่สามารถใช้เพื่ออธิบายความสัมพันธ์ของตัวแปรที่ได้รับในการทดลอง

ลองพิจารณาเหตุผลสองประการที่ทำให้ความถูกต้องของโครงสร้างลดลง ประการแรกคือความเชื่อมโยงที่อ่อนแอระหว่างทฤษฎีและการทดลอง แท้จริงแล้ว การศึกษาทางจิตวิทยาจำนวนมากให้คำจำกัดความการดำเนินงานที่คลุมเครือของแนวคิดทางทฤษฎี เหตุผลที่สองถูกกำหนด ประการแรก โดยข้อเท็จจริงที่ว่าอาสาสมัครมักจะเริ่มมีบทบาทเป็นวัตถุวิจัยที่ "ดี" และประพฤติตนในลักษณะที่ทำให้ผู้ทดลองพอใจ และประการที่สอง โดยข้อเท็จจริงที่ว่าอาสาสมัคร โดยเฉพาะอย่างยิ่งใน การทดลองวัดความสามารถทางจิตหรือความมั่นคงทางอารมณ์ ความวิตกกังวลสูงเกี่ยวกับการประเมินที่คาดหวัง

3. ความถูกต้องของขั้นตอน

ความถูกต้องประเภทที่สามคือความถูกต้องของขั้นตอนที่ช่วยให้ตัวแปรสามารถเปลี่ยนแปลงและวัดได้ แม้แต่ความจำเป็นในการกำหนดเงื่อนไขการปฏิบัติงาน ตัวแปรทางแนวคิดที่เกี่ยวข้องกับการศึกษาก็ยังเป็นแหล่งของความเสี่ยง แท้จริงแล้ว “การแปล” แนวคิดไปสู่ระดับปฏิบัติการเฉพาะอาจสะท้อนหลักการทางทฤษฎีของการศึกษาได้ไม่เพียงพอ

บ่อยครั้งที่ผู้วิจัยกระตุ้นคำตอบที่เขาคาดหวังจะได้รับโดยไม่รู้ตัว ซึ่งสามารถหลีกเลี่ยงได้โดยใช้กลยุทธ์การวิจัยแบบลงมือปฏิบัติและวิธีการวัดผลที่เหมาะสม ในกรณีนี้ ผู้เข้ารับการทดสอบไม่ควรรู้ว่ากำลังถูกสังเกตอยู่ ซึ่งทำให้สามารถขจัดแรงจูงใจที่ไม่ต้องการที่เกี่ยวข้องกับการทดลองได้

4. ความถูกต้องภายนอก

ความถูกต้องภายนอกหมายถึงความสามารถในการสรุปผลการศึกษา กล่าวคือ ขยายข้อสรุปที่ได้รับจากตัวอย่างทดลองไปยังประชากรทั้งหมด ความถูกต้องภายนอกขึ้นอยู่กับวิธีการสุ่มตัวอย่างเป็นอย่างมาก การสุ่มตัวอย่างมีสามประเภทหลัก:

1. การสุ่มตัวอย่างตัวอย่างเช่น ผลการศึกษาของกลุ่มวัยรุ่นที่ได้รับการสุ่มเลือกจะมีความถูกต้องในระดับความน่าจะเป็นสำหรับวัยรุ่นชาวอิตาลีทุกคน อย่างไรก็ตาม การศึกษาดังกล่าวอาจซับซ้อนและมีราคาแพง เนื่องจากตัวอย่างต้องมีขนาดใหญ่และเป็นเนื้อเดียวกัน

2. ตัวอย่างที่แตกต่างกัน (ต่างกัน)ตามวัตถุประสงค์ของการศึกษา จะมีการระบุกลุ่มประชากรต่างๆ ที่คาดว่าจะได้รับผลการศึกษา จากนั้นนำตัวอย่างแบบสุ่มมาวิเคราะห์เพื่อให้แน่ใจว่ามีจำนวนตัวแทนจากแต่ละกลุ่มเพียงพอ

3. ตัวอย่างกรณีทั่วไปตัวอย่างเช่น ให้คำจำกัดความของคนหนุ่มสาวชาวอิตาลีโดยเฉลี่ย การศึกษานี้ใช้กลุ่มตัวอย่างที่ประกอบด้วยบุคคลที่ตรงตามคำจำกัดความนี้ จากนั้น หากมีการทดลองกับนักศึกษามหาวิทยาลัย เช่น ความสามารถในการเจรจาต่อรอง ก็ไม่มีใครคาดหวังได้ว่าข้อค้นพบนี้จะสามารถนำไปใช้กับประมุขแห่งรัฐได้

ความถูกต้องภายนอกยังลดลงเนื่องจากความแตกต่างระหว่างปรากฏการณ์ที่สังเกตได้ในห้องปฏิบัติการและปรากฏการณ์ที่สังเกตได้ในสภาพแวดล้อมทางธรรมชาติ เป็นการยากที่จะระบุได้ว่าการพึ่งพาอาศัยกันที่ระบุนั้นเกิดขึ้นเฉพาะในห้องปฏิบัติการเท่านั้นหรือไม่ว่าจะพบนอกห้องปฏิบัติการด้วยหรือไม่ รับประกันความถูกต้องภายนอกโดยการทดลองซ้ำในสภาวะที่ต่างกัน

มีความจำเป็นต้องตัดสินใจว่าความถูกต้องประเภทใดเป็นศูนย์กลางของการศึกษาที่กำหนด แท้จริงแล้ว ขั้นตอนที่ใช้เพื่อเพิ่มความถูกต้องประเภทหนึ่งอาจลดความถูกต้องประเภทอื่นลง

ตัวอย่างเช่น เพื่อเพิ่มความถูกต้องของการอนุมานทางสถิติ นักวิจัยควรใช้ออบเจ็กต์ที่มีความต่างกันมากที่สุดเท่าที่จะเป็นไปได้ ซึ่งจะช่วยลดโอกาสที่จะเกิดข้อผิดพลาดได้ ในขณะเดียวกัน ความถูกต้องภายนอกจะลดลง

ประเภทของความถูกต้องตามลำดับความสำคัญขึ้นอยู่กับประเภทของการวิจัยที่กำลังดำเนินการ ตัวอย่างเช่น หากการศึกษาเชิงทดลองสร้างความสัมพันธ์ระหว่างเหตุและผลระหว่างตัวแปร ความถูกต้องภายในก็เป็นสิ่งจำเป็น ในทางตรงกันข้าม เมื่อคำนวณความสัมพันธ์ระหว่างตัวแปร เป็นไปไม่ได้ที่จะกำหนดทิศทางของความสัมพันธ์ระหว่างเหตุและผล ดังนั้นในกรณีนี้ ความถูกต้องภายในจึงไม่น่าสนใจเมื่อเทียบกับความถูกต้องประเภทอื่นๆ

ที่เกี่ยวข้องกับแนวคิดเรื่องความถูกต้องคือแนวคิด ควบคุม- การควบคุมหมายถึงวิธีการใดๆ ที่ใช้ในการขจัดความเป็นไปได้ในการลดความถูกต้องของการศึกษา ในทางปฏิบัติ ผู้วิจัยจะตรวจสอบว่าปัจจัยใดบ้างที่อาจลดความถูกต้องของการศึกษา และวิธีการใดที่สามารถใช้เพื่อต่อต้านปัจจัยเหล่านี้ได้

มีวิธีการควบคุมหลักหกวิธี

1. หนึ่งในวิธีการควบคุมที่ใช้กันมากที่สุดคือทำการทดลองกับกลุ่มวิชาที่ไม่ได้รับอิทธิพลจากตัวแปรที่กำลังศึกษาและเปรียบเทียบกับกลุ่มวิชาที่ได้รับอิทธิพลนี้ ตัวอย่างเช่น มีการตรวจสอบสองกลุ่มเกี่ยวกับตัวแปรอิสระ กลุ่มที่ 1 ได้รับการแทรกแซงและเรียกว่าการทดลอง กลุ่มที่ 2 ไม่ได้รับการรักษา เรียกว่ากลุ่มควบคุม ผลลัพธ์ของกลุ่มทดลองจะถูกเปรียบเทียบกับผลลัพธ์ของกลุ่มควบคุม หากสองกลุ่มเหมือนกันก่อนการแทรกแซงเชิงทดลอง ความแตกต่างระหว่างกลุ่มทั้งสองที่สังเกตได้หลังการทดลองสามารถนำมาประกอบกับการแทรกแซงนั้นได้