Giá trị của phương pháp luận là gì? Đánh giá tính đúng đắn của phương pháp luận có thể là định lượng và định tính.

Vấn đề về tính hợp lệ được quyết định sau khi độ tin cậy đã được thiết lập, vì một kỹ thuật không đáng tin cậy thì không thể hợp lệ.

Hiệu lực của bài kiểm tra là một khái niệm cho chúng ta biết bài kiểm tra đo lường những gì và nó thực hiện tốt như thế nào (A. Anastasi). Giá trị cốt lõi của nó là một đặc điểm phức tạp, một mặt bao gồm thông tin về việc liệu kỹ thuật này có phù hợp để đo lường mục đích của nó hay không và mặt khác, hiệu quả, hiệu quả và tính hữu ích thực tế của nó là gì.

Vì lý do này, không có cách tiếp cận phổ quát duy nhất để xác định tính hợp lệ. Tùy thuộc vào khía cạnh giá trị nào mà nhà nghiên cứu muốn xem xét, các phương pháp chứng cứ khác nhau sẽ được sử dụng. Nói cách khác, khái niệm giá trị bao gồm nhiều loại khác nhau và có ý nghĩa đặc biệt riêng. Kiểm tra tính hợp lệ của một phương pháp được gọi là xác nhận.

Hiệu lực là sự tuân thủ của một nghiên cứu cụ thể với các tiêu chuẩn được chấp nhận (một thử nghiệm hoàn hảo).

Tính giá trị theo cách hiểu đầu tiên của nó liên quan đến chính phương pháp luận, tức là. đây là giá trị của dụng cụ đo lường. Loại thử nghiệm này được gọi là xác nhận lý thuyết. Tính giá trị theo cách hiểu thứ hai không đề cập nhiều đến phương pháp luận cũng như mục đích sử dụng nó. Đây là sự xác nhận thực tế.

Trong quá trình xác nhận lý thuyết, nhà nghiên cứu quan tâm đến đặc tính được đo bằng kỹ thuật.

Vì, để xác định giá trị xác thực về mặt lý thuyết, rất khó tìm thấy bất kỳ tiêu chí độc lập nào nằm ngoài phương pháp luận, và do đó những tuyên bố vô căn cứ về tính hợp lệ của phương pháp này trước đây được coi là đương nhiên. Vì việc xác nhận về mặt lý thuyết nhằm mục đích chứng minh rằng kỹ thuật này đo lường chính xác đặc tính mà nó cần đo. Để xác thực về mặt lý thuyết, vấn đề cốt yếu là mối quan hệ giữa các hiện tượng tâm lý và các dấu hiệu của chúng, qua đó những hiện tượng tâm lý này đang cố gắng được biết đến. Nó cho thấy ý đồ của tác giả và kết quả của phương pháp luận là trùng hợp.

Sẽ không quá khó để thực hiện việc xác nhận tính hợp lệ về mặt lý thuyết của một kỹ thuật mới nếu đã có sẵn một kỹ thuật có giá trị đã được chứng minh và đã biết để đo lường một đặc tính nhất định. Sự hiện diện của mối tương quan giữa kỹ thuật mới và kỹ thuật cũ tương tự cho thấy rằng kỹ thuật đã phát triển đo lường chất lượng tâm lý giống như kỹ thuật tham khảo.

Để kiểm tra giá trị lý thuyết, một mặt, điều quan trọng là phải thiết lập mức độ kết nối với một kỹ thuật liên quan (giá trị hội tụ), mặt khác là không có mối liên hệ này với các kỹ thuật có cơ sở lý thuyết khác (giá trị phân biệt). ).

Một vai trò quan trọng trong việc hiểu được các thước đo của phương pháp luận được thực hiện bằng cách so sánh các chỉ số của nó với các hình thức Hoạt động thực tế. Điều quan trọng là phương pháp luận phải được thực hiện về mặt lý thuyết.

Xác thực thực dụng

Hiệu quả, tầm quan trọng và tính hữu dụng thực tế của phương pháp này được kiểm tra vì phương pháp này chỉ có thể được sử dụng khi chứng minh được rằng đặc tính được đo lường được thể hiện trong một số loại Hoạt động nhất định.

Để kiểm tra tính giá trị thực dụng, một tiêu chí độc lập bên ngoài được sử dụng - một chỉ báo biểu hiện tính chất được nghiên cứu trong cuộc sống hàng ngày. Tiêu chí đó có thể là kết quả học tập (đối với các bài kiểm tra khả năng học tập, kiểm tra thành tích, kiểm tra trí thông minh), thành tích sản xuất (đối với các phương pháp định hướng nghề nghiệp), hiệu quả của các hoạt động thực tế - vẽ, làm mẫu, v.v. (đối với các bài kiểm tra khả năng đặc biệt). ), đánh giá chủ quan (đối với trắc nghiệm tính cách).

Các nhà nghiên cứu người Mỹ Tiffin và McCormick đã xác định 4 loại tiêu chí bên ngoài:

  • 1) Tiêu chí thực hiện (số lượng công việc đã thực hiện, kết quả học tập, thời gian, tốc độ phát triển trình độ chuyên môn).
  • 2) Tiêu chí chủ quan (bao gồm nhiều loại câu trả lời khác nhau phản ánh thái độ của một người đối với điều gì đó, ý kiến, quan điểm của người đó).
  • 3) Tiêu chí sinh lý (dùng khi nghiên cứu ảnh hưởng của môi trường bên ngoài tác động đến cơ thể và tâm thần).
  • 4) Tiêu chí về tính ngẫu nhiên (ví dụ, khi mục tiêu liên quan đến vấn đề lựa chọn làm việc những người ít gặp tai nạn hơn).

Tiêu chí bên ngoài phải có 3 yêu cầu chính: 1) Nó phải phù hợp, nghĩa là phải có niềm tin rằng tiêu chí đó liên quan chính xác đến những đặc điểm tâm lý cá nhân mà kỹ thuật chẩn đoán đo lường. Tiêu chí bên ngoài và mô hình chẩn đoán phải tương ứng với ngữ nghĩa bên trong. 2) Phải không bị nhiễu (ô nhiễm). Nên chọn những nhóm người có điều kiện ít nhiều giống nhau để nghiên cứu. 3) Phải đáng tin cậy. Tính ổn định và ổn định của hàm đang nghiên cứu.

Đánh giá tính đúng đắn của phương pháp luận có thể là định lượng và định tính.

Để tính toán một chỉ số định lượng (hệ số giá trị), kết quả thu được từ việc áp dụng các kỹ thuật chẩn đoán được so sánh với dữ liệu của cùng một cá nhân thu được bằng cách sử dụng tiêu chí bên ngoài. Các loại tương quan tuyến tính khác nhau được sử dụng (theo Spearman, theo Piersen).

Mô tả định tính về bản chất của đặc tính được đo lường. Không có xử lý thống kê được sử dụng ở đây. Có một số loại giá trị, được xác định bởi đặc điểm của kỹ thuật chẩn đoán, cũng như trạng thái tạm thời của tiêu chí bên ngoài: 1) Giá trị “theo nội dung” (được sử dụng trong các bài kiểm tra thành tích): 3 - 4 câu hỏi từ một chủ đề lớn có thể thể hiện đúng kiến ​​thức của học sinh. Để làm điều này, kết quả chẩn đoán được so sánh với đánh giá của chuyên gia giáo viên. 2) Giá trị “đồng thời” hoặc giá trị hiện tại - dữ liệu liên quan đến thời điểm hiện tại được thu thập: kết quả học tập, năng suất, v.v. Kết quả thử nghiệm thành công tương quan với chúng. 3) Hiệu lực “dự đoán” (“dự đoán”). Nó được xác định bởi một tiêu chí bên ngoài đáng tin cậy, nhưng thông tin về nó sẽ được thu thập một thời gian sau khi thử nghiệm. Độ chính xác của dự báo tỷ lệ nghịch với thời gian được chỉ định cho dự báo đó. 4) Hiệu lực “hồi cứu”. Được xác định trên cơ sở tiêu chí phản ánh các sự kiện hoặc trạng thái chất lượng trong quá khứ. Có thể được sử dụng để nhanh chóng có được thông tin về khả năng dự đoán của kỹ thuật.

Sau độ tin cậy, một tiêu chí quan trọng khác để đánh giá chất lượng của phương pháp là tính giá trị. Câu hỏi về tính đúng đắn của một kỹ thuật chỉ được giải quyết sau khi nó đã được thiết lập đủ độ tin cậy, vì một kỹ thuật không đáng tin cậy thì không thể có giá trị. Nhưng kỹ thuật đáng tin cậy nhất mà không biết về giá trị của nó thì thực tế là vô dụng.

Cần lưu ý rằng vấn đề hiệu lực dường như vẫn là một trong những vấn đề khó khăn nhất. Định nghĩa được xác nhận rõ ràng nhất về khái niệm này là định nghĩa được đưa ra trong cuốn sách của A. Anastasi: “Tính hiệu lực của bài kiểm tra là một khái niệm cho chúng ta biết bài kiểm tra đo lường những gì và nó hoạt động tốt như thế nào”.

Giá trị cốt lõi của nó là một đặc điểm phức tạp, một mặt bao gồm thông tin về việc liệu kỹ thuật này có phù hợp để đo lường mục đích của nó hay không và mặt khác, hiệu quả, hiệu quả và tính hữu ích thực tế của nó là gì.

Vì lý do này, không có cách tiếp cận phổ quát duy nhất để xác định tính hợp lệ. Tùy thuộc vào khía cạnh giá trị nào mà nhà nghiên cứu muốn xem xét, các phương pháp chứng cứ khác nhau sẽ được sử dụng. Nói cách khác, khái niệm giá trị bao gồm nhiều loại khác nhau và có ý nghĩa đặc biệt riêng. Kiểm tra tính hợp lệ của một phương pháp được gọi là xác nhận.

Hiệu lực theo cách hiểu đầu tiên có liên quan đến chính phương pháp luận, tức là nó liên quan đến hiệu lực của công cụ đo lường. Loại thử nghiệm này được gọi là xác nhận lý thuyết. Tính giá trị theo cách hiểu thứ hai không đề cập nhiều đến phương pháp luận cũng như mục đích sử dụng nó. Đây là sự xác nhận thực tế.

Tóm lại, chúng ta có thể nói như sau:

“Trong quá trình xác nhận lý thuyết, nhà nghiên cứu quan tâm đến đặc tính được đo bằng kỹ thuật. Về cơ bản, điều này có nghĩa là việc xác nhận tâm lý đang được thực hiện;

“Với sự xác nhận thực dụng, bản chất của đối tượng đo lường (thuộc tính tâm lý) sẽ không còn được nhìn thấy. Điểm nhấn chính là chứng minh rằng “thứ gì đó” được đo bằng kỹ thuật này có mối liên hệ với một số lĩnh vực thực hành nhất định.

Việc tiến hành xác nhận lý thuyết, trái ngược với xác nhận thực tế, đôi khi trở nên khó khăn hơn nhiều. Hiện tại, không đi sâu vào chi tiết cụ thể, chúng ta hãy tập trung vào các thuật ngữ chung về cách kiểm tra giá trị thực dụng: một số tiêu chí bên ngoài, độc lập với phương pháp luận, được chọn để xác định sự thành công trong một hoạt động cụ thể (giáo dục, nghề nghiệp, v.v.) và với nó Các kết quả của kỹ thuật chẩn đoán được so sánh. Nếu mối liên hệ giữa chúng được coi là thỏa đáng thì sẽ rút ra kết luận về ý nghĩa thực tế, hiệu quả và hiệu quả của kỹ thuật chẩn đoán.

Để xác định giá trị lý thuyết, việc tìm ra bất kỳ tiêu chí độc lập nào nằm ngoài phương pháp luận sẽ khó hơn nhiều. Do đó, trong giai đoạn đầu của quá trình phát triển xét nghiệm, khi khái niệm về tính hợp lệ mới hình thành, đã có một ý tưởng trực quan về chính xác những gì một bài kiểm tra nhất định đo lường:

1) kỹ thuật này được gọi là hợp lệ, vì những gì nó đo lường chỉ đơn giản là “rõ ràng”;

2) bằng chứng về tính hợp lệ dựa trên sự tin tưởng của nhà nghiên cứu rằng phương pháp của anh ta cho phép anh ta “hiểu được chủ đề”;

3) kỹ thuật này được coi là hợp lệ (nghĩa là tuyên bố được chấp nhận rằng thử nghiệm đó đo lường chất lượng như vậy) chỉ vì lý thuyết làm cơ sở cho kỹ thuật này là “rất tốt”.

Việc chấp nhận những tuyên bố vô căn cứ về tính hợp lệ của phương pháp này không thể tiếp tục trong một thời gian dài. Những biểu hiện đầu tiên của phê bình khoa học thực sự đã vạch trần cách tiếp cận này: việc tìm kiếm bằng chứng dựa trên cơ sở khoa học đã bắt đầu.

Vì vậy, việc thực hiện việc xác nhận tính hợp lý về mặt lý thuyết của một phương pháp là để chứng minh rằng phương pháp đó đo lường chính xác đặc tính, chất lượng mà nhà nghiên cứu dự định đo lường.

Vì vậy, ví dụ, nếu một số bài kiểm tra được phát triển để chẩn đoán sự phát triển tinh thần của trẻ em, thì cần phải phân tích xem liệu nó có thực sự đo lường sự phát triển này chứ không phải một số đặc điểm khác (ví dụ: tính cách, tính cách, v.v.). Do đó, để xác nhận về mặt lý thuyết, vấn đề cốt yếu là mối quan hệ giữa các hiện tượng tâm lý và các dấu hiệu của chúng mà qua đó những hiện tượng tâm lý này được cố gắng nhận biết. Việc kiểm tra như vậy cho thấy ý định của tác giả và kết quả của phương pháp luận trùng khớp đến mức nào.

Sẽ không quá khó để thực hiện việc xác nhận tính hợp lệ về mặt lý thuyết của một kỹ thuật mới nếu đã có sẵn một kỹ thuật có giá trị đã được chứng minh để đo lường một đặc tính nhất định. Sự hiện diện của mối tương quan giữa một kỹ thuật mới và một kỹ thuật tương tự đã được thử nghiệm cho thấy rằng kỹ thuật đã phát triển đo lường chất lượng tâm lý giống như kỹ thuật tham khảo. Và nếu phương pháp mới đồng thời nhỏ gọn và tiết kiệm hơn trong việc thực hiện và xử lý kết quả, thì các nhà chẩn đoán tâm lý có cơ hội sử dụng một công cụ mới thay vì công cụ cũ. Kỹ thuật này đặc biệt thường được sử dụng trong tâm sinh lý học vi phân khi tạo ra các phương pháp chẩn đoán các đặc tính cơ bản của hệ thần kinh con người (xem Chương 16).

Nhưng giá trị về mặt lý thuyết được chứng minh bằng cách so sánh không chỉ với các chỉ số liên quan mà còn với những chỉ số mà dựa trên giả thuyết, không nên có mối liên hệ đáng kể nào. Vì vậy, để kiểm tra tính giá trị về mặt lý thuyết, một mặt, điều quan trọng là phải thiết lập mức độ kết nối với một kỹ thuật liên quan (giá trị hội tụ), mặt khác là không có mối liên hệ này với các kỹ thuật có cơ sở lý thuyết khác ( giá trị biệt thức).

Việc thực hiện xác nhận lý thuyết của một phương pháp sẽ khó khăn hơn nhiều khi phương pháp xác minh đó là không thể thực hiện được. Thông thường, đây là tình huống mà một nhà nghiên cứu phải đối mặt. Trong những trường hợp như vậy, chỉ việc tích lũy dần dần các thông tin khác nhau về đặc tính đang được nghiên cứu, phân tích các tiền đề lý thuyết và dữ liệu thực nghiệm cũng như kinh nghiệm đáng kể với kỹ thuật mới cho phép bộc lộ ý nghĩa tâm lý của nó.

Một vai trò quan trọng trong việc hiểu những gì phương pháp đo lường được thực hiện bằng cách so sánh các chỉ số của nó với các hình thức hoạt động thực tế. Nhưng ở đây, điều đặc biệt quan trọng là phương pháp luận phải được nghiên cứu kỹ lưỡng về mặt lý thuyết, tức là phải có cơ sở khoa học vững chắc, có cơ sở. Sau đó, bằng cách so sánh kỹ thuật này với một tiêu chí bên ngoài lấy từ thực tiễn hàng ngày tương ứng với những gì nó đo lường, có thể thu được thông tin hỗ trợ các ý tưởng lý thuyết về bản chất của nó.

Điều quan trọng cần nhớ là nếu giá trị lý thuyết được chứng minh, thì việc giải thích các chỉ số thu được sẽ trở nên rõ ràng và rõ ràng hơn và tên của kỹ thuật tương ứng với phạm vi ứng dụng của nó.

Đối với việc xác nhận thực tế, nó liên quan đến việc thử nghiệm một kỹ thuật từ quan điểm về tính hiệu quả, tầm quan trọng và tính hữu ích thực tế của nó, vì việc sử dụng kỹ thuật chẩn đoán chỉ có ý nghĩa khi nó được chứng minh rằng đặc tính được đo lường được biểu hiện trong một số tình huống cuộc sống nhất định. , trong một số loại hoạt động nhất định. Nó được coi trọng đặc biệt khi nảy sinh vấn đề lựa chọn.

Nếu chúng ta quay lại lịch sử phát triển của xét nghiệm, chúng ta có thể nêu bật một giai đoạn (20-30) khi nội dung khoa học của các bài kiểm tra và “hành trang” lý thuyết của chúng ít được quan tâm hơn. Điều quan trọng là bài kiểm tra đã thành công và giúp nhanh chóng chọn ra những người có sự chuẩn bị tốt nhất. Tiêu chí thực nghiệm để đánh giá nhiệm vụ kiểm tra được coi là kim chỉ nam đúng đắn duy nhất trong việc giải quyết các vấn đề khoa học và ứng dụng.

Việc sử dụng các kỹ thuật chẩn đoán thuần túy dựa trên kinh nghiệm, không có cơ sở lý thuyết rõ ràng, thường dẫn đến những kết luận giả khoa học và những khuyến nghị thực tế thiếu căn cứ. Không thể gọi tên chính xác những đặc điểm, phẩm chất mà các bài kiểm tra bộc lộ. B. M. Teplov, khi phân tích các bài kiểm tra vào thời kỳ đó, đã gọi chúng là “các bài kiểm tra mù”.

Cách tiếp cận này đối với vấn đề giá trị của bài kiểm tra là điển hình cho đến đầu những năm 50. không chỉ ở Mỹ mà còn ở các nước khác. Điểm yếu về mặt lý thuyết của các phương pháp xác nhận thực nghiệm không thể không khơi dậy sự chỉ trích từ những nhà khoa học, những người trong quá trình phát triển các thử nghiệm đã kêu gọi không chỉ dựa vào kinh nghiệm và thực tiễn “trần trụi” mà còn dựa vào một khái niệm lý thuyết. Thực hành mà không có lý thuyết thì như chúng ta biết là mù quáng, lý thuyết mà không thực hành thì chết. Hiện nay, đánh giá lý thuyết và thực tế về tính hợp lệ của các phương pháp được coi là hiệu quả nhất.

Để tiến hành xác nhận tính thực tế của một kỹ thuật, tức là để đánh giá tính hiệu lực, hiệu suất và ý nghĩa thực tiễn của nó, một tiêu chí độc lập bên ngoài thường được sử dụng - một chỉ báo biểu hiện đặc tính đang được nghiên cứu trong cuộc sống hàng ngày. Những tiêu chí đó có thể là:

1) kết quả học tập (đối với các bài kiểm tra khả năng học tập, bài kiểm tra thành tích, bài kiểm tra trí thông minh);

2) thành tích sản xuất (đối với phương pháp định hướng chuyên nghiệp);

3) tính hiệu quả của các hoạt động thực tế - vẽ, làm mẫu, v.v. (đối với các bài kiểm tra khả năng đặc biệt);

4) đánh giá chủ quan (đối với các bài kiểm tra tính cách). Các nhà nghiên cứu người Mỹ D. Tiffin và E. McCormick, đã tiến hành

phân tích các tiêu chí bên ngoài được sử dụng để chứng minh tính hợp lệ, bốn loại được xác định:

1) tiêu chí thực hiện (những tiêu chí này có thể bao gồm như khối lượng công việc đã hoàn thành, kết quả học tập, thời gian dành cho đào tạo, tốc độ phát triển trình độ, v.v.);

2) tiêu chí chủ quan (chúng bao gồm nhiều loại câu trả lời khác nhau phản ánh thái độ của một người đối với điều gì đó hoặc ai đó, ý kiến, quan điểm, sở thích của anh ta; tiêu chí chủ quan thường có được bằng cách sử dụng các cuộc phỏng vấn, bảng câu hỏi, bảng câu hỏi);

3) tiêu chí sinh lý (chúng được sử dụng để nghiên cứu ảnh hưởng của môi trường và các biến số tình huống khác đến cơ thể và tâm lý con người; nhịp tim, huyết áp, điện trở của da, triệu chứng mệt mỏi, v.v. được đo);

4) tiêu chí về tai nạn (áp dụng khi mục đích của nghiên cứu liên quan đến vấn đề lựa chọn những người ít bị tai nạn hơn để làm việc).

Tiêu chí bên ngoài phải đáp ứng ba yêu cầu cơ bản:

1) nó phải phù hợp;

2) không bị nhiễu (nhiễm bẩn);

3) đáng tin cậy].

Mức độ liên quan đề cập đến sự tương ứng về mặt ngữ nghĩa của một công cụ chẩn đoán với một tiêu chí quan trọng độc lập. Nói cách khác, phải có niềm tin rằng tiêu chí liên quan chính xác đến những đặc điểm của tâm lý cá nhân được đo lường bằng kỹ thuật chẩn đoán. Tiêu chí bên ngoài và kỹ thuật chẩn đoán phải tương ứng về mặt ngữ nghĩa bên trong với nhau và đồng nhất về mặt chất lượng về bản chất tâm lý.

Ví dụ, nếu một bài kiểm tra đo lường các đặc điểm tư duy cá nhân, khả năng thực hiện các hành động logic với các đối tượng và khái niệm nhất định, thì tiêu chí cũng phải tìm kiếm biểu hiện của chính xác những kỹ năng này. Điều này cũng áp dụng cho các hoạt động nghề nghiệp. Nó không phải có một mà có nhiều mục tiêu và mục tiêu, mỗi mục tiêu đều cụ thể và đặt ra các điều kiện riêng để thực hiện. Điều này ngụ ý sự tồn tại của một số tiêu chí để thực hiện các hoạt động chuyên môn. Vì vậy, thành công trong kỹ thuật chẩn đoán không nên so sánh với hiệu quả sản xuất nói chung. Cần phải tìm ra một tiêu chí, dựa trên tính chất của các hoạt động được thực hiện, có thể so sánh được với phương pháp luận.

Nếu không biết tiêu chí bên ngoài có liên quan đến tài sản được đo hay không, thì việc so sánh kết quả của kỹ thuật chẩn đoán tâm lý với nó thực tế trở nên vô dụng. Nó không cho phép người ta đưa ra bất kỳ kết luận nào có thể đánh giá tính hợp lệ của phương pháp luận.

Các yêu cầu về không bị can thiệp (ô nhiễm) là do thực tế là, ví dụ, thành công trong giáo dục hoặc công nghiệp phụ thuộc vào hai biến số: vào bản thân con người, đặc điểm cá nhân của anh ta, được đo bằng các phương pháp, và vào tình hình, điều kiện học tập và làm việc , có thể gây ra sự can thiệp, “làm ô nhiễm” » tiêu chí được áp dụng. Để tránh điều này ở một mức độ nào đó, nên chọn những nhóm người có điều kiện ít nhiều giống nhau để nghiên cứu. Một phương pháp khác có thể được sử dụng. Nó bao gồm việc điều chỉnh ảnh hưởng của nhiễu. Sự điều chỉnh này thường có tính chất thống kê. Vì vậy, ví dụ, năng suất không nên được xem xét một cách tuyệt đối mà trong mối tương quan với năng suất trung bình của những người lao động có điều kiện làm việc tương tự.

Khi họ nói rằng một tiêu chí phải có độ tin cậy có ý nghĩa thống kê, điều này có nghĩa là nó phải phản ánh tính không đổi và ổn định của hàm số đang được nghiên cứu.

Việc tìm kiếm một tiêu chí đầy đủ và dễ xác định là một nhiệm vụ xác nhận rất quan trọng và phức tạp. Trong thử nghiệm của phương Tây, nhiều phương pháp bị loại chỉ vì không thể tìm được tiêu chí phù hợp để thử nghiệm chúng. Đặc biệt, hầu hết các bảng câu hỏi đều có dữ liệu có giá trị đáng nghi vấn, vì rất khó để tìm ra một tiêu chí bên ngoài đầy đủ tương ứng với những gì chúng đo lường.

Đánh giá tính đúng đắn của các phương pháp có thể là định lượng và định tính.

Để tính toán một chỉ số định lượng - hệ số hiệu lực - kết quả thu được khi áp dụng kỹ thuật chẩn đoán được so sánh với dữ liệu thu được theo tiêu chí bên ngoài của cùng một người. Các loại tương quan tuyến tính khác nhau được sử dụng (theo Spearman, theo Pearson).

Cần bao nhiêu môn học để tính giá trị?

Thực tiễn đã chỉ ra rằng không nên ít hơn 50, nhưng tốt nhất là hơn 200. Câu hỏi thường được đặt ra: giá trị của hệ số hiệu lực phải là bao nhiêu để được coi là chấp nhận được? Nói chung, cần lưu ý rằng chỉ cần hệ số giá trị có ý nghĩa thống kê là đủ. Hệ số hiệu lực khoảng 0,2-0,3 được coi là thấp, trung bình - 0,3-0,5 và cao - trên 0,6.

Tuy nhiên, như A. Anastasi, K. M. Gurevich và những người khác nhấn mạnh, việc sử dụng mối tương quan tuyến tính để tính hệ số hiệu lực không phải lúc nào cũng hợp lý. Kỹ thuật này chỉ hợp lý khi chứng minh được rằng thành công trong một số hoạt động tỷ lệ thuận với thành công trong việc thực hiện xét nghiệm chẩn đoán. Quan điểm của các nhà kiểm tra nước ngoài, đặc biệt là những người liên quan đến sự phù hợp và lựa chọn nghề nghiệp, thường xuất phát từ sự thừa nhận vô điều kiện rằng người hoàn thành nhiều nhiệm vụ hơn trong bài kiểm tra là phù hợp hơn với nghề. Nhưng cũng có thể là để thành công trong một hoạt động, bạn cần phải có đặc tính ở mức 40% của giải pháp thử nghiệm. Điểm cao hơn trong bài kiểm tra không còn ý nghĩa gì đối với nghề nghiệp. Một ví dụ rõ ràng từ chuyên khảo của K. M. Gurevich: người đưa thư phải có khả năng đọc, nhưng dù anh ta đọc ở tốc độ bình thường hay tốc độ rất cao - điều này không còn ý nghĩa chuyên môn nữa. Với mối tương quan như vậy giữa các chỉ số của phương pháp và tiêu chí bên ngoài, cách đầy đủ nhất để thiết lập giá trị có thể là tiêu chí về sự khác biệt.

Một trường hợp khác cũng có thể xảy ra: mức tài sản cao hơn mức yêu cầu của nghề nghiệp sẽ cản trở sự thành công trong nghề nghiệp. Vì vậy, trở lại buổi bình minh của thế kỷ 20. Nhà nghiên cứu người Mỹ F. Taylor nhận thấy rằng những nữ công nhân sản xuất phát triển nhất có năng suất lao động thấp. Nghĩa là, mức độ phát triển tinh thần cao đã ngăn cản họ làm việc đạt năng suất cao. Trong trường hợp này, phân tích phương sai hoặc tính toán mối quan hệ tương quan sẽ phù hợp hơn để tính hệ số giá trị.

Như kinh nghiệm của các nhà kiểm nghiệm nước ngoài đã chỉ ra, không một quy trình thống kê nào có thể phản ánh đầy đủ tính đa dạng của các đánh giá riêng lẻ. Vì vậy, một mô hình khác thường được sử dụng để chứng minh tính đúng đắn của các phương pháp - đánh giá lâm sàng. Đây không gì khác hơn là một mô tả định tính về bản chất của tài sản đang được nghiên cứu. Trong trường hợp này, chúng ta đang nói về việc sử dụng các kỹ thuật không dựa vào xử lý thống kê.

Có một số loại giá trị, do đặc điểm của kỹ thuật chẩn đoán, cũng như trạng thái tạm thời của tiêu chí bên ngoài. Tuy nhiên, những điều sau đây thường được gọi nhất.

1. Hiệu lực “theo nội dung”. Kỹ thuật này được sử dụng, ví dụ, trong các bài kiểm tra thành tích. Thông thường, các bài kiểm tra thành tích không bao gồm tất cả tài liệu mà học sinh đã học mà chỉ bao gồm một phần nhỏ trong đó (3-4 câu hỏi). Bạn có thể chắc chắn rằng câu trả lời đúng cho một số câu hỏi này cho thấy rằng bạn đã nắm vững tất cả tài liệu không? Đây là những gì một bài kiểm tra tính hợp lệ của nội dung sẽ trả lời. Để làm điều này, việc so sánh thành công trong bài kiểm tra với đánh giá của chuyên gia giáo viên (dựa trên tài liệu này) được thực hiện. Giá trị nội dung cũng áp dụng cho các bài kiểm tra tham chiếu theo tiêu chí. Kỹ thuật này đôi khi được gọi là giá trị logic.

2. Giá trị đồng thời hoặc giá trị liên tục được xác định bằng cách sử dụng tiêu chí bên ngoài theo đó thông tin được thu thập đồng thời với các thử nghiệm sử dụng phương pháp đang được thử nghiệm. Nói cách khác, dữ liệu được thu thập liên quan đến thời điểm hiện tại: hiệu suất trong giai đoạn thử nghiệm,

hiệu suất trong cùng thời gian, v.v. Kết quả thành công của thử nghiệm được so sánh với chúng.

3. Giá trị “dự đoán” (tên gọi khác là giá trị “dự đoán”). Nó cũng được xác định bởi một tiêu chí bên ngoài, nhưng thông tin về nó sẽ được thu thập một thời gian sau khi kiểm tra. Tiêu chí bên ngoài thường là khả năng của một người, được thể hiện dưới dạng đánh giá nào đó, đối với loại hoạt động mà anh ta được đánh giá dựa trên kết quả của các xét nghiệm chẩn đoán. Mặc dù kỹ thuật này phù hợp nhất với nhiệm vụ của các kỹ thuật chẩn đoán - dự đoán thành công trong tương lai - nhưng lại rất khó áp dụng. Độ chính xác của chẩn đoán tỷ lệ nghịch với thời gian được chỉ định cho dự đoán đó. Thời gian trôi qua càng lâu sau khi đo, số lượng yếu tố cần được tính đến khi đánh giá ý nghĩa tiên lượng của kỹ thuật càng nhiều. Tuy nhiên, hầu như không thể tính đến tất cả các yếu tố ảnh hưởng đến dự đoán.

4. Hiệu lực “hồi cứu”. Nó được xác định trên cơ sở tiêu chí phản ánh các sự kiện hoặc trạng thái chất lượng trong quá khứ. Có thể được sử dụng để nhanh chóng có được thông tin về khả năng dự đoán của kỹ thuật. Do đó, để kiểm tra mức độ điểm kiểm tra năng khiếu tốt tương ứng với khả năng học tập nhanh, đánh giá hiệu suất trong quá khứ, ý kiến ​​chuyên gia trước đây, v.v., có thể được so sánh giữa những cá nhân có điểm chẩn đoán hiện tại cao và thấp.

Khi trình bày dữ liệu về giá trị của phương pháp đã phát triển, điều quan trọng là phải chỉ rõ loại giá trị đó là gì (về nội dung, về tính đồng thời, v.v.). Cũng nên cung cấp thông tin về số lượng và đặc điểm của các cá nhân được thực hiện xác nhận. Thông tin như vậy cho phép nhà nghiên cứu sử dụng kỹ thuật này để quyết định xem kỹ thuật đó có giá trị như thế nào đối với nhóm mà anh ta dự định áp dụng nó. Về độ tin cậy, cần phải nhớ rằng một kỹ thuật có thể có giá trị cao ở mẫu này và giá trị thấp ở mẫu khác. Do đó, nếu một nhà nghiên cứu có kế hoạch sử dụng một kỹ thuật trên một mẫu đối tượng khác biệt đáng kể so với mẫu đối tượng đã tiến hành kiểm tra tính hợp lệ, thì anh ta cần phải tiến hành lại cuộc kiểm tra đó. Hệ số hiệu lực được đưa ra trong hướng dẫn chỉ áp dụng cho các nhóm đối tượng tương tự như đối tượng đã được xác định.

HIỆU LỰC- một trong những đặc điểm quan trọng nhất của các phương pháp và xét nghiệm chẩn đoán tâm lý, một trong những tiêu chí chính đánh giá chất lượng của chúng. Khái niệm này gần với khái niệm về độ tin cậy nhưng không hoàn toàn giống nhau.

Vấn đề về giá trị nảy sinh trong quá trình phát triển và áp dụng thực tế một bài kiểm tra hoặc kỹ thuật, khi cần thiết lập sự tương ứng giữa mức độ biểu hiện đặc tính tính cách được quan tâm và phương pháp đo lường nó. Độ giá trị đề cập đến nội dung mà một bài kiểm tra hoặc kỹ thuật đo lường và nó thực hiện tốt như thế nào; Chúng càng có giá trị thì chúng càng phản ánh tốt hơn chất lượng (thuộc tính) mà chúng được tạo ra. Về mặt định lượng, giá trị có thể được thể hiện thông qua mối tương quan giữa kết quả thu được bằng cách sử dụng bài kiểm tra hoặc kỹ thuật với các chỉ số khác, chẳng hạn như với sự thành công khi thực hiện hoạt động liên quan. Hiệu lực có thể được chứng minh bằng nhiều cách khác nhau, thường là phức tạp nhất. Các khái niệm bổ sung về khái niệm, tiêu chí, tính xây dựng và các loại giá trị khác cũng được sử dụng - với những cách riêng để thiết lập mức độ của chúng. Yêu cầu về tính hợp lệ là rất quan trọng, và nhiều phàn nàn về các xét nghiệm hoặc các kỹ thuật chẩn đoán tâm lý khác có liên quan đến sự nghi ngờ về tính hợp lệ của chúng. Ví dụ, giá trị của một thước đo trí tuệ phụ thuộc vào:

1) từ định nghĩa của khái niệm trí thông minh, đại diện cho khái niệm này hay khái niệm khác về hiện tượng này;

2) về thành phần của các nhiệm vụ kiểm tra được phát triển theo khái niệm này;

3) từ tiêu chí thực nghiệm. Các khái niệm khác nhau đòi hỏi sự cấu thành các nhiệm vụ khác nhau, vì vậy vấn đề về giá trị của khái niệm là rất quan trọng. Các nhiệm vụ càng tương ứng với khái niệm trí thông minh mà tác giả đưa ra thì chúng ta càng có thể tự tin nói về tính hợp lệ của bài kiểm tra khái niệm. Mối tương quan của một bài kiểm tra với một tiêu chí thực nghiệm cho thấy giá trị có thể có của nó đối với tiêu chí đó. Việc xác định tính hợp lệ của một bài kiểm tra luôn đòi hỏi phải đặt thêm các câu hỏi: tính hợp lệ để làm gì? cho mục đích gì? theo tiêu chí nào? Vì vậy, khái niệm độ giá trị không chỉ đề cập đến bài kiểm tra mà còn đề cập đến tiêu chí đánh giá chất lượng của bài kiểm tra. Hệ số tương quan giữa bài kiểm tra và tiêu chí càng cao thì độ giá trị càng cao. Sự phát triển của phân tích nhân tố đã giúp tạo ra các thử nghiệm có giá trị liên quan đến yếu tố được xác định. Chỉ các bài kiểm tra được kiểm tra tính hợp lệ mới có thể được sử dụng trong định hướng nghề nghiệp, tuyển chọn chuyên môn và nghiên cứu khoa học.

HIỆU LỰC: TIÊU CHUẨN- liên quan đến phương pháp, có nghĩa là các chỉ số và dấu hiệu độc lập mà qua đó người ta có thể đánh giá tính hợp lệ của nó. Các tiêu chí này được sử dụng để đánh giá kết quả thu được từ việc áp dụng kỹ thuật này vào thực tế. Các tiêu chí có thể là:

1) chỉ số hành vi - phản ứng, hành động, hành động của chủ thể trong các tình huống cuộc sống khác nhau;

2) thành tích của môn học trong các loại hoạt động khác nhau - giáo dục, lao động, v.v.;

3) dữ liệu về việc thực hiện các nhiệm vụ và thử nghiệm kiểm soát khác nhau;

4) dữ liệu thu được từ các phương pháp khác, giá trị hoặc mối liên hệ của dữ liệu đó với phương pháp đang được thử nghiệm được coi là đã được thiết lập chắc chắn.

GIÁ TRỊ BÊN NGOÀI- liên quan đến các phương pháp chẩn đoán tâm lý, điều đó có nghĩa là kết quả của các chẩn đoán tâm lý được thực hiện bằng phương pháp này tương ứng với các dấu hiệu bên ngoài không phụ thuộc vào phương pháp và liên quan đến đối tượng khám. Nó có ý nghĩa gần giống như giá trị thực nghiệm, với điểm khác biệt là ở đây chúng ta đang nói về mối liên hệ giữa các chỉ số của phương pháp và các dấu hiệu bên ngoài quan trọng nhất, quan trọng nhất liên quan đến hành vi của đối tượng. Ví dụ, một kỹ thuật chẩn đoán tâm lý được coi là có giá trị bên ngoài nếu nó đánh giá các đặc điểm tính cách của một cá nhân và hành vi được quan sát bên ngoài của anh ta phù hợp với kết quả kiểm tra.

GIÁ TRỊ NỘI TẠI- liên quan đến các phương pháp chẩn đoán tâm lý, nó có nghĩa là sự tuân thủ các nhiệm vụ, bài kiểm tra nhỏ và những thứ khác có trong đó với mục đích và mục đích chung của phương pháp; sự tuân thủ các kết quả chẩn đoán tâm lý được thực hiện bằng kỹ thuật này với định nghĩa về đặc tính tâm lý được đánh giá được sử dụng trong chính kỹ thuật đó. Một kỹ thuật được coi là không hợp lệ nội bộ hoặc thiếu giá trị khi tất cả hoặc một phần câu hỏi, nhiệm vụ hoặc bài kiểm tra phụ có trong kỹ thuật đó không đo lường được những gì kỹ thuật đó yêu cầu.

GIÁ TRỊ KHÁI NIỆM- được hiểu là sự biện minh từ quan điểm tuân thủ quan điểm của tác giả về đặc điểm của các đặc tính được chẩn đoán, là thước đo mức độ tuân thủ của các nhiệm vụ kiểm tra với quan niệm của tác giả về các đặc tính này.

GIÁ TRỊ TIÊU CHUẨN(giá trị tiêu chí) - Được hiểu là cơ sở lý luận cho mối tương quan giữa kết quả kiểm nghiệm và một tiêu chí thực nghiệm. Giá trị có thể có của một bài kiểm tra đối với tiêu chí này được biểu thị bằng mối tương quan của bài kiểm tra với nó; hệ số tương quan càng cao thì giá trị càng cao. Sự phát triển của phân tích nhân tố đã giúp tạo ra các thử nghiệm có giá trị liên quan đến yếu tố được xác định.

GIÁ TRỊ LÝ THUYẾT(giá trị mang tính xây dựng, giá trị về mặt khái niệm) - liên quan đến các phương pháp chẩn đoán tâm lý, điều đó có nghĩa là kết quả của chẩn đoán tâm lý được thực hiện bằng phương pháp này tương ứng với các chỉ số về phẩm chất tâm lý đó về mặt lý thuyết có liên quan đến tài sản được đánh giá. Nó được xác định bởi sự tương ứng của các chỉ số chất lượng thu được bằng phương pháp này với các chỉ số thu được thông qua các phương pháp khác - với sự phụ thuộc hợp lý về mặt lý thuyết của chúng. Do đó, nếu một kỹ thuật thay đổi mức độ phát triển của động cơ thành tích, thì nó sẽ có giá trị về mặt lý thuyết nếu các chỉ số thu được có mối tương quan đáng tin cậy với dữ liệu về lòng tự trọng, sự lo lắng và mức độ khát vọng về mặt lý thuyết liên quan đến động lực thành tích.

HIỆU LỰC THỰC NGHIỆM(giá trị thực tế) - liên quan đến các phương pháp chẩn đoán tâm lý, điều đó có nghĩa là kết quả của chẩn đoán tâm lý được thực hiện bằng phương pháp này tương ứng với trải nghiệm của một người, hành vi thực tế của anh ta, cũng như các hành động và phản ứng được quan sát của đối tượng. Nó được xác định bằng cách so sánh các chỉ tiêu của nó với hành vi thực tế đời sống hoặc kết quả hoạt động thực tiễn của con người. Do đó, nếu các đặc điểm tính cách của một đối tượng nhất định được đánh giá, thì kỹ thuật được sử dụng được coi là có giá trị về mặt thực nghiệm khi chứng minh được rằng đối tượng đó hành xử trong cuộc sống đúng như kỹ thuật đó dự đoán.

(Golovin S.Yu. Từ điển nhà tâm lý học thực hành - Minsk, 1998)

HIỆU LỰC KIỂM TRA(Tiếng Anh) hiệu lựccủaBài kiểm tra) - tiêu chí quan trọng nhất của chất lượng tốt Bài kiểm tra, mô tả tính chính xác của phép đo tài sản đang được nghiên cứu; đánh giá tính phù hợp của bài kiểm tra đối với vấn đề đang nghiên cứu. V. t. được xác định bởi mối tương quan giữa kết quả của nó với các tiêu chí khác của thuộc tính được đo lường (ví dụ: khả năng của V. t. được xác định bởi mối tương quan giữa kết quả kiểm tra với sự thành công của việc thực hiện hoạt động tương ứng). Kiểm tra V. t được gọi là Thẩm định(Thẩm định). Được phép sử dụng các loại xác nhận và V.t. khác nhau: 1) nội dung ( nội dung); 2) theo tiêu chí (theo kinh nghiệm; tiêu chuẩn-có liên quan): 3) khái niệm (mang tính xây dựng; xây dựng); 4) phân biệt đối xử ( phân biệt đối xử) v.v. Xem Tâm lý chẩn đoán,Chẩn đoán tâm lý. (V.I. Lubovsky.)

(Zinchenko V.P., Meshcherykov B.G. Từ điển tâm lý lớn - tái bản lần thứ 3, 2002)

Trước khi các kỹ thuật chẩn đoán tâm lý có thể được sử dụng cho mục đích thực tế, chúng phải được kiểm tra dựa trên một số tiêu chí chính thức chứng minh chất lượng và hiệu quả cao của chúng.

Tiêu chí chính để đánh giá các kỹ thuật chẩn đoán tâm lý bao gồm độ tin cậy và giá trị. Các nhà tâm lý học nước ngoài đã có đóng góp to lớn vào việc phát triển các khái niệm này (A. Anastasi, E. Ghiselli, J. Guilford, L. Cronbach, R. Thorndike và E. Hagen, v.v.). Họ đã phát triển cả bộ máy thống kê hình thức-logic và toán học-thống kê (chủ yếu là phương pháp tương quan và phân tích nhân tố) để chứng minh mức độ tuân thủ của các phương pháp với các tiêu chí đã nêu.

hiệu lực- Cái này một đặc điểm toàn diện, một mặt bao gồm thông tin về việc liệu kỹ thuật này có phù hợp để đo lường mục đích của nó hay không và mặt khác, hiệu lực, hiệu quả và tính hữu dụng thực tế của nó là gì.

hiệu lực- mức độ mà một kỹ thuật đo lường được những gì nó dự định đo lường. Mức độ hiệu lực được gọi là hệ số hiệu lực. Các yếu tố mang tính hệ thống ảnh hưởng đến tính giá trị của bài kiểm tra. Họ đưa ra những biến dạng trong kết quả. Những yếu tố này là những đặc tính tinh thần khác ngăn cản đặc tính mà bài kiểm tra hướng tới thể hiện trong kết quả bài kiểm tra.

Ví dụ: chúng tôi muốn đo lường “tiềm năng học tập”, nhưng chúng tôi cho đối tượng một bài kiểm tra với thời gian giới hạn nghiêm ngặt và không có cơ hội quay lại và sửa lỗi. Về vấn đề này, đặc tính tinh thần mong muốn hóa ra lại bị trộn lẫn với một đặc tính khác - “khả năng chống căng thẳng”: những đối tượng có mức độ chống căng thẳng cao sẽ thực hiện bài kiểm tra tốt hơn. Điều này sẽ thể hiện tác động của sự biến dạng hệ thống.

Vì lý do này, không có cách tiếp cận phổ quát duy nhất để xác định tính hợp lệ. Tùy thuộc vào khía cạnh giá trị nào mà nhà nghiên cứu muốn xem xét, các phương pháp chứng cứ khác nhau sẽ được sử dụng. Nói cách khác, khái niệm giá trị bao gồm nhiều loại khác nhau và có ý nghĩa đặc biệt riêng. Kiểm tra tính hợp lệ của một phương pháp được gọi là xác nhận.

Hiệu lực theo cách hiểu đầu tiên có liên quan đến chính phương pháp luận, tức là nó liên quan đến hiệu lực của công cụ đo lường. Việc kiểm tra này được gọi xác nhận lý thuyết. Tính giá trị theo cách hiểu thứ hai không đề cập nhiều đến phương pháp luận cũng như mục đích sử dụng nó. Đây là sự xác nhận thực tế.



Trong tâm lý học hiện đại, hàng chục phương pháp lý thuyết và thực nghiệm khác nhau để kiểm tra tính hợp lệ của các bài kiểm tra đã được phát triển. Yếu tố chính của hầu hết các phương pháp này được gọi là “tiêu chí”. Tiêu chí hợp lệ là nguồn thông tin độc lập với bài kiểm tra về đặc tính tinh thần đang được đo lường, bên ngoài bài kiểm tra. Chúng ta không thể đánh giá tính hợp lệ của một bài kiểm tra cho đến khi chúng ta so sánh kết quả của nó với nguồn thông tin đúng (hoặc ít nhất là hợp lệ rõ ràng) về đặc tính được đo - với một tiêu chí.

Trong thực tế, các tiêu chí thực dụng rất thường được sử dụng làm tiêu chí có giá trị - đây là một dấu hiệu rõ ràng cho thấy chủ đề đó thể hiện bất kể chất lượng mà chúng ta đang nghiên cứu. Ví dụ: các chỉ số về tính hiệu quả của hoạt động nhằm dự đoán thử nghiệm nào đã được thực hiện. Hoặc dữ liệu về việc thực hiện các nhiệm vụ khác nhau, kiểm tra kiểm soát, cũng như dữ liệu thu được bằng các phương pháp khác, tính hợp lệ của chúng đã được chứng minh. Một kỹ thuật có nhiều giá trị vì nó có các tiêu chí.



giá trị lý thuyếtđược xác định bởi sự tương ứng của các chỉ số về chất lượng nghiên cứu thu được bằng phương pháp đã tạo, các chỉ số thu được bằng các phương pháp khác hoặc với các chỉ số đã có căn cứ lý thuyết. Được kiểm tra bằng cách so sánh cùng một thuộc tính được đo bằng các phương pháp khác nhau.

Trong khuôn khổ giá trị lý thuyết, có:

- Giá trị còn lại. Tình huống thuận lợi nhất xảy ra khi tâm lý học đã có sẵn một phương pháp hợp lý để kiểm tra chất lượng bạn đang học. Trong trường hợp này, mối tương quan cao giữa các chỉ số của các phương pháp này cho thấy phương pháp mới có giá trị hội tụ so với phương pháp cũ.

- Xây dựng hợp lệ. Trong nhiều trường hợp, không có bài kiểm tra nào được xác nhận có giá trị đã biết để đo lường một đặc tính nhất định. Trong trường hợp này, nhà nghiên cứu hình thành một loạt giả thuyết về mối tương quan giữa bài kiểm tra mới với các bài kiểm tra khác. Những giả thuyết này được đưa ra trên cơ sở những ý tưởng lý thuyết về tài sản được đo lường. Xác nhận của họ cho thấy tính hợp lệ của cấu trúc được đề xuất, tức là xây dựng giá trị (hoặc giá trị nhận thức).

giá trị thực nghiệm– được kiểm tra bằng sự tương ứng của các chỉ số của kỹ thuật chẩn đoán với hành vi thực tế, các hành động và phản ứng được quan sát của đối tượng, tức là. chúng tôi xem xét mức độ hành xử của khách hàng trong cuộc sống thực theo kết quả nghiên cứu.

Giá trị nội tại– mối quan hệ về phương pháp luận của nội dung các nhiệm vụ riêng lẻ, các tiểu luận, nhận định về mục tiêu tổng thể của kế hoạch. Một phương pháp được coi là không có giá trị nội bộ khi không phải tất cả các phần của phương pháp đó đều đo lường được chất lượng mà mục đích yêu cầu. Giá trị nội tại là tính nhất quán nội tại của các nhiệm vụ của phương pháp luận.

Ngoài ra còn có giá trị sai– nó thể hiện được vẻ bề ngoài của sự phù hợp của kỹ thuật.

Hiệu lực rõ ràng– đôi khi nó thực sự khám phá các sự kiện và mô hình trong đời thực, nhưng chỉ tương ứng với thực tế trong các bài kiểm tra giáo khoa (ví dụ: bài kiểm tra thành tích giáo dục).

Hiệu lực từ kinh nghiệm– dựa trên cảm nhận cá nhân của nhà tâm lý học rằng kỹ thuật này phù hợp để đo lường bất kỳ phẩm chất nào, bởi vì nó dựa trên một lý thuyết tốt hoặc tạo ra kết quả tốt.

Hiệu lực dựa trên mong muốn– dựa trên mong muốn xem phương pháp luận của một người là hợp lệ và tốt, trong khi không nhận thấy những sự thật hiển nhiên mâu thuẫn với điều này.

Hiệu lực của tất cả các phương pháp kiểm tra, ngoại trừ các phương pháp mô phạm, phải được đo lường bằng các phương pháp đo tâm lý. Cần có bao nhiêu môn học để tính giá trị? Theo thực tế, không được nhỏ hơn 50, nhưng tốt nhất là trên 200. Câu hỏi thường đặt ra: giá trị của hệ số hiệu lực phải là bao nhiêu để được coi là chấp nhận được? Chỉ cần hệ số giá trị có ý nghĩa thống kê là đủ. Hệ số hiệu lực khoảng 0,20–0,30 được coi là thấp, trung bình – 0,30–0,50 và cao – trên 0,60.

Vé số 9

Câu hỏi về động lực và đặc điểm của chúng.

Bảng câu hỏi động cơ là một nhóm bảng câu hỏi được thiết kế để chẩn đoán phạm vi nhu cầu động lực của cá nhân, cho phép người ta xác định mục đích hoạt động của cá nhân đó (động cơ là lý do quyết định lựa chọn hướng hành vi). Ngoài ra, câu hỏi làm thế nào động lực của hành vi được điều chỉnh có tầm quan trọng đáng kể. Trong trường hợp này, họ thường dùng đến việc đo lường thái độ. Sự phát triển của bảng câu hỏi động cơ trong chẩn đoán tâm lý phần lớn liên quan đến nhu cầu đánh giá ảnh hưởng của yếu tố “mong muốn xã hội”, yếu tố này có tính chất thái độ và làm giảm độ tin cậy của dữ liệu thu được bằng bảng câu hỏi tính cách. Các câu hỏi nổi tiếng nhất về động cơ bao gồm “Danh sách sở thích cá nhân” do A. Edwards (1954) phát triển, được thiết kế để đo lường “sức mạnh” của nhu cầu, mượn từ danh sách do G. Murray đề xuất cho bài kiểm tra nhận thức theo chủ đề. Ví dụ, những nhu cầu này bao gồm nhu cầu thành công, sự tôn trọng, khả năng lãnh đạo, v.v. “Sức mạnh” của mỗi nhu cầu không được thể hiện bằng giá trị tuyệt đối mà liên quan đến “sức mạnh” của các nhu cầu khác, tức là. các chỉ số cá nhân được sử dụng. Để nghiên cứu vai trò của yếu tố “mong muốn xã hội”, A. Edwards (1957) đã đề xuất một bảng câu hỏi đặc biệt. Các bảng câu hỏi khác về động cơ cũng được sử dụng rộng rãi, ví dụ “Mẫu nghiên cứu về tính cách” của D. Jackson (1967), bảng câu hỏi của A. Mehrabyan (1970), v.v.

Sau độ tin cậy, một tiêu chí quan trọng khác để đánh giá chất lượng của phương pháp là tính giá trị. Câu hỏi về tính đúng đắn của một kỹ thuật chỉ được giải quyết sau khi nó đã được thiết lập đủ độ tin cậy, vì một kỹ thuật không đáng tin cậy thì không thể có giá trị. Nhưng kỹ thuật đáng tin cậy nhất mà không biết về giá trị của nó thì thực tế là vô dụng.

Cần lưu ý rằng câu hỏi về tính hợp lệ cho đến gần đây dường như là một trong những câu hỏi khó nhất. Định nghĩa được xác nhận rõ ràng nhất về khái niệm này là định nghĩa được đưa ra trong cuốn sách của A. Anastasi: “Tính hiệu lực của bài kiểm tra là một khái niệm cho chúng ta biết bài kiểm tra đo lường những gì và nó hoạt động tốt như thế nào”.

Vì lý do này, không có cách tiếp cận phổ quát duy nhất để xác định tính hợp lệ. Tùy thuộc vào khía cạnh giá trị nào mà nhà nghiên cứu muốn xem xét, các phương pháp chứng cứ khác nhau sẽ được sử dụng. Nói cách khác, khái niệm giá trị bao gồm nhiều loại khác nhau và có ý nghĩa đặc biệt riêng. Kiểm tra tính hợp lệ của một phương pháp được gọi là xác nhận.



Hiệu lực theo cách hiểu đầu tiên có liên quan đến chính phương pháp luận, tức là nó liên quan đến hiệu lực của công cụ đo lường. Loại thử nghiệm này được gọi là xác nhận lý thuyết. Tính giá trị theo cách hiểu thứ hai không đề cập nhiều đến phương pháp luận cũng như mục đích sử dụng nó. Đây là sự xác nhận thực tế.

Tóm lại, chúng ta có thể nói như sau:

trong quá trình xác nhận lý thuyết, nhà nghiên cứu quan tâm đến đặc tính được đo bằng kỹ thuật. Về cơ bản, điều này có nghĩa là việc xác nhận tâm lý đang được thực hiện;

với sự xác nhận thực dụng, bản chất của đối tượng đo lường (thuộc tính tâm lý) sẽ bị khuất tầm nhìn. Điểm nhấn chính là chứng minh rằng điều gì đó được đo bằng kỹ thuật có mối quan hệ với các lĩnh vực thực hành cụ thể.

Việc tiến hành xác nhận lý thuyết, trái ngược với xác nhận thực tế, đôi khi trở nên khó khăn hơn nhiều. Hiện tại, không đi sâu vào chi tiết cụ thể, chúng ta hãy tập trung vào các thuật ngữ chung về cách kiểm tra giá trị thực dụng: một số tiêu chí bên ngoài, độc lập với phương pháp luận, được chọn để xác định sự thành công trong một hoạt động cụ thể (giáo dục, nghề nghiệp, v.v.) và với nó Các kết quả của kỹ thuật chẩn đoán được so sánh. Nếu mối liên hệ giữa chúng được coi là thỏa đáng thì sẽ rút ra kết luận về ý nghĩa thực tế, hiệu quả và hiệu quả của kỹ thuật chẩn đoán.

Để xác định giá trị lý thuyết, việc tìm ra bất kỳ tiêu chí độc lập nào nằm ngoài phương pháp luận sẽ khó hơn nhiều. Do đó, trong giai đoạn đầu của quá trình phát triển xét nghiệm, khi khái niệm về độ giá trị mới hình thành, đã có một ý tưởng trực quan rằng bài kiểm tra đo lường:

1) kỹ thuật này được gọi là hợp lệ, vì những gì nó đo lường đơn giản là hiển nhiên;

2) bằng chứng về tính hợp lệ dựa trên sự tin tưởng của nhà nghiên cứu rằng phương pháp của anh ta cho phép anh ta hiểu được chủ đề;

3) kỹ thuật này được coi là hợp lệ (nghĩa là tuyên bố được chấp nhận rằng thử nghiệm đó đo lường chất lượng như vậy) chỉ vì lý thuyết làm cơ sở cho kỹ thuật đó là rất tốt.

Việc chấp nhận những tuyên bố vô căn cứ về tính hợp lệ của phương pháp này không thể tiếp tục trong một thời gian dài. Những biểu hiện đầu tiên của phê bình khoa học thực sự đã vạch trần cách tiếp cận này: việc tìm kiếm bằng chứng dựa trên cơ sở khoa học đã bắt đầu.

Vì vậy, việc thực hiện việc xác nhận tính hợp lý về mặt lý thuyết của một phương pháp là để chứng minh rằng phương pháp đó đo lường chính xác đặc tính, chất lượng mà nhà nghiên cứu dự định đo lường.

Vì vậy, ví dụ, nếu một số bài kiểm tra được phát triển để chẩn đoán sự phát triển tinh thần của trẻ em, thì cần phải phân tích xem liệu nó có thực sự đo lường sự phát triển này chứ không phải một số đặc điểm khác (ví dụ: tính cách, tính cách, v.v.). Vì vậy, để xác nhận về mặt lý thuyết, vấn đề cốt yếu là mối quan hệ giữa các hiện tượng tâm lý và các dấu hiệu của chúng mà qua đó những hiện tượng tâm lý này được tìm cách nhận biết. Điều này cho thấy ý định của tác giả và kết quả của phương pháp luận trùng khớp đến mức nào.

Sẽ không quá khó để thực hiện việc xác nhận tính hợp lệ về mặt lý thuyết của một kỹ thuật mới nếu đã có sẵn một kỹ thuật có giá trị đã được chứng minh để đo lường một đặc tính nhất định. Sự hiện diện của mối tương quan giữa một phương pháp mới và một phương pháp tương tự đã được thử nghiệm cho thấy rằng phương pháp đã phát triển đo lường chất lượng tâm lý giống như phương pháp tham khảo. Và nếu phương pháp mới đồng thời nhỏ gọn và tiết kiệm hơn trong việc thực hiện và xử lý kết quả, thì các nhà chẩn đoán tâm lý có cơ hội sử dụng một công cụ mới thay vì công cụ cũ.

Nhưng giá trị về mặt lý thuyết được chứng minh không chỉ bằng cách so sánh với các chỉ số liên quan mà còn với những chỉ số mà dựa trên giả thuyết, không nên có mối liên hệ đáng kể nào. Vì vậy, để kiểm tra giá trị lý thuyết, một mặt, điều quan trọng là phải thiết lập mức độ kết nối với một kỹ thuật liên quan (giá trị hội tụ) và sự vắng mặt của mối liên hệ này với các kỹ thuật có cơ sở lý thuyết khác (giá trị phân biệt).

Việc thực hiện xác nhận lý thuyết của một phương pháp sẽ khó khăn hơn nhiều khi phương pháp xác minh đó là không thể thực hiện được. Thông thường, đây là tình huống mà một nhà nghiên cứu phải đối mặt. Trong những trường hợp như vậy, chỉ có sự tích lũy dần dần các thông tin khác nhau về tài sản đang được nghiên cứu, việc phân tích các tiền đề lý thuyết và dữ liệu thực nghiệm cũng như kinh nghiệm đáng kể khi làm việc với kỹ thuật mới có thể tiết lộ ý nghĩa tâm lý của nó.

Một vai trò quan trọng trong việc hiểu những gì phương pháp đo lường được thực hiện bằng cách so sánh các chỉ số của nó với các hình thức hoạt động thực tế. Nhưng ở đây, điều đặc biệt quan trọng là phương pháp luận phải được nghiên cứu kỹ lưỡng về mặt lý thuyết, tức là phải có cơ sở khoa học vững chắc, có cơ sở. Sau đó, bằng cách so sánh kỹ thuật này với một tiêu chí bên ngoài lấy từ thực tiễn hàng ngày tương ứng với những gì nó đo lường, có thể thu được thông tin hỗ trợ các ý tưởng lý thuyết về bản chất của nó.

Điều quan trọng cần nhớ là nếu giá trị lý thuyết được chứng minh, thì việc giải thích các chỉ số thu được sẽ trở nên rõ ràng và rõ ràng hơn và tên của kỹ thuật tương ứng với phạm vi ứng dụng của nó. Đối với việc xác nhận thực tế, nó liên quan đến việc thử nghiệm một kỹ thuật từ quan điểm về tính hiệu quả, tầm quan trọng và tính hữu ích thực tế của nó, vì việc sử dụng kỹ thuật chẩn đoán chỉ có ý nghĩa khi nó được chứng minh rằng đặc tính được đo lường được biểu hiện trong một số tình huống cuộc sống nhất định. , trong một số loại hoạt động nhất định. Nó được coi trọng đặc biệt khi nảy sinh vấn đề lựa chọn.

Nếu chúng ta quay lại lịch sử phát triển của xét nghiệm một lần nữa, chúng ta có thể nêu bật một giai đoạn (những năm 20-30 của thế kỷ 20) khi nội dung khoa học của các bài kiểm tra và hành trang lý thuyết của chúng ít được quan tâm hơn. Điều quan trọng là bài kiểm tra đã thành công và giúp nhanh chóng chọn ra những người có sự chuẩn bị tốt nhất. Tiêu chí thực nghiệm để đánh giá nhiệm vụ kiểm tra được coi là kim chỉ nam đúng đắn duy nhất trong việc giải quyết các vấn đề khoa học và ứng dụng.

Việc sử dụng các kỹ thuật chẩn đoán thuần túy dựa trên kinh nghiệm, không có cơ sở lý thuyết rõ ràng, thường dẫn đến những kết luận giả khoa học và những khuyến nghị thực tế thiếu căn cứ. Không thể gọi tên chính xác những đặc điểm, phẩm chất mà các bài kiểm tra bộc lộ. Về cơ bản chúng là những bài kiểm tra mù.

Cách tiếp cận này đối với vấn đề giá trị của bài kiểm tra là điển hình cho đến đầu những năm 50. Thế kỷ XX không chỉ ở Mỹ mà còn ở các nước khác. Điểm yếu về mặt lý thuyết của các phương pháp xác nhận thực nghiệm không thể không khơi dậy sự chỉ trích từ những nhà khoa học, những người trong quá trình phát triển các thử nghiệm đã kêu gọi không chỉ dựa vào kinh nghiệm và thực tiễn đơn thuần mà còn dựa vào một khái niệm lý thuyết. Thực hành mà không có lý thuyết thì như chúng ta biết là mù quáng, lý thuyết mà không thực hành thì chết. Hiện nay, đánh giá lý thuyết và thực tiễn về tính hợp lệ của các phương pháp được coi là hiệu quả nhất.

Để tiến hành xác nhận tính thực tế của một kỹ thuật, tức là để đánh giá tính hiệu lực, hiệu suất và ý nghĩa thực tiễn của nó, một tiêu chí độc lập bên ngoài thường được sử dụng - một chỉ báo biểu hiện đặc tính đang được nghiên cứu trong cuộc sống hàng ngày. Tiêu chí đó có thể là kết quả học tập (đối với các bài kiểm tra khả năng học tập, kiểm tra thành tích, kiểm tra trí thông minh) và thành tích sản xuất (đối với các phương pháp định hướng nghề nghiệp) và hiệu quả của các hoạt động thực tế - vẽ, làm mẫu, v.v. (đối với các bài kiểm tra đặc biệt). năng lực), đánh giá chủ quan (đối với bài kiểm tra tính cách).

Các nhà nghiên cứu người Mỹ D. Tiffin và E. McCormick, sau khi phân tích các tiêu chí bên ngoài được sử dụng để chứng minh tính hợp lệ, đã xác định được bốn loại [mỗi loại 31):

1) tiêu chí thực hiện (những tiêu chí này có thể bao gồm như khối lượng công việc đã hoàn thành, kết quả học tập, thời gian dành cho đào tạo, tốc độ phát triển trình độ, v.v.);

2) tiêu chí chủ quan (chúng bao gồm nhiều loại câu trả lời khác nhau phản ánh thái độ của một người đối với điều gì đó hoặc ai đó, ý kiến, quan điểm, sở thích của anh ta; tiêu chí chủ quan thường có được bằng cách sử dụng các cuộc phỏng vấn, bảng câu hỏi, bảng câu hỏi);

3) tiêu chí sinh lý (chúng được sử dụng để nghiên cứu ảnh hưởng của môi trường và các biến số tình huống khác đến cơ thể và tâm lý con người; nhịp tim, huyết áp, điện trở của da, triệu chứng mệt mỏi, v.v. được đo);

4) tiêu chí về tai nạn (áp dụng khi mục đích của nghiên cứu liên quan đến vấn đề lựa chọn những người ít bị tai nạn hơn để làm việc).

Tiêu chí bên ngoài phải đáp ứng ba yêu cầu cơ bản:

nó phải phù hợp;

không bị can thiệp;

đáng tin cậy.

Mức độ liên quan đề cập đến sự tương ứng về mặt ngữ nghĩa của một công cụ chẩn đoán với một tiêu chí quan trọng độc lập. Nói cách khác, phải có niềm tin rằng tiêu chí liên quan chính xác đến những đặc điểm của tâm lý cá nhân được đo lường bằng kỹ thuật chẩn đoán. Tiêu chí bên ngoài và kỹ thuật chẩn đoán phải tương ứng về mặt ngữ nghĩa bên trong với nhau và đồng nhất về mặt chất lượng về bản chất tâm lý. Ví dụ, nếu một bài kiểm tra đo lường các đặc điểm tư duy cá nhân, khả năng thực hiện các hành động logic với các đối tượng và khái niệm nhất định, thì tiêu chí cũng phải tìm kiếm biểu hiện của chính xác những kỹ năng này. Điều này cũng áp dụng cho các hoạt động nghề nghiệp. Nó không phải có một mà có nhiều mục tiêu và mục tiêu, mỗi mục tiêu đều cụ thể và đặt ra các điều kiện riêng để thực hiện. Điều này ngụ ý sự tồn tại của một số tiêu chí để thực hiện các hoạt động chuyên môn. Vì vậy, thành công trong kỹ thuật chẩn đoán không nên so sánh với hiệu quả sản xuất nói chung. Cần phải tìm ra một tiêu chí, dựa trên tính chất của các hoạt động được thực hiện, có thể so sánh được với phương pháp luận.

Nếu không biết tiêu chí bên ngoài có liên quan đến tài sản được đo hay không, thì việc so sánh kết quả của kỹ thuật chẩn đoán tâm lý với nó thực tế trở nên vô dụng. Nó không cho phép người ta đưa ra bất kỳ kết luận nào có thể đánh giá tính hợp lệ của phương pháp luận.

Các yêu cầu về quyền không bị can thiệp là do thực tế là, ví dụ, thành công trong giáo dục hoặc công nghiệp phụ thuộc vào hai biến số: vào bản thân con người, các đặc điểm cá nhân của anh ta, được đo lường bằng các phương pháp, và vào tình huống, điều kiện học tập và làm việc, có thể gây ra sự can thiệp và “làm ô nhiễm” tiêu chí được áp dụng. Để tránh điều này ở một mức độ nào đó, nên chọn những nhóm người có điều kiện ít nhiều giống nhau để nghiên cứu. Một phương pháp khác có thể được sử dụng. Nó bao gồm việc điều chỉnh ảnh hưởng của nhiễu. Sự điều chỉnh này thường có tính chất thống kê. Vì vậy, ví dụ, năng suất không nên được coi là tuyệt đối mà phải được xét trong mối tương quan với năng suất trung bình của những người lao động làm việc trong những điều kiện tương tự.

Khi họ nói rằng một tiêu chí phải có độ tin cậy có ý nghĩa thống kê, điều này có nghĩa là nó phải phản ánh tính không đổi và ổn định của hàm số đang được nghiên cứu.

Việc tìm kiếm một tiêu chí đầy đủ và dễ xác định là một nhiệm vụ xác nhận rất quan trọng và phức tạp. Trong thử nghiệm của phương Tây, nhiều phương pháp bị loại chỉ vì không thể tìm được tiêu chí phù hợp để thử nghiệm chúng. Ví dụ, hầu hết các bảng câu hỏi đều có dữ liệu có giá trị đáng nghi ngờ vì rất khó tìm được tiêu chí bên ngoài đầy đủ tương ứng với những gì chúng đo lường.

Đánh giá tính đúng đắn của các phương pháp có thể là định lượng và định tính.

Để tính toán một chỉ số định lượng - hệ số hiệu lực - kết quả thu được khi áp dụng kỹ thuật chẩn đoán được so sánh với dữ liệu thu được bằng cách sử dụng tiêu chí bên ngoài cho cùng một cá nhân. Các loại tương quan tuyến tính khác nhau được sử dụng (theo Spearman, theo Pearson).

Cần bao nhiêu môn học để tính giá trị?

Thực tiễn đã chỉ ra rằng không nên ít hơn 50, nhưng tốt nhất là hơn 200. Câu hỏi thường được đặt ra: giá trị của hệ số hiệu lực phải là bao nhiêu để được coi là chấp nhận được? Nói chung, cần lưu ý rằng chỉ cần hệ số giá trị có ý nghĩa thống kê là đủ. Hệ số hiệu lực khoảng 0,20-0,30 được coi là thấp, trung bình - 0,30-0,50 và cao - trên 0,60.

Tuy nhiên, như A. Anastasi, K. M. Gurevich và những người khác nhấn mạnh, việc sử dụng mối tương quan tuyến tính để tính hệ số hiệu lực không phải lúc nào cũng hợp lý. Kỹ thuật này chỉ hợp lý khi chứng minh được rằng thành công trong một số hoạt động tỷ lệ thuận với thành công trong việc thực hiện xét nghiệm chẩn đoán. Quan điểm của các nhà kiểm tra nước ngoài, đặc biệt là những người liên quan đến sự phù hợp và lựa chọn nghề nghiệp, thường xuất phát từ sự thừa nhận vô điều kiện rằng người hoàn thành nhiều nhiệm vụ hơn trong bài kiểm tra là phù hợp hơn với nghề. Nhưng cũng có thể là để thành công trong một hoạt động, bạn cần phải có đặc tính ở mức 40% của giải pháp thử nghiệm. Thành công hơn nữa trong bài kiểm tra không còn ý nghĩa gì đối với nghề nghiệp nữa. Một ví dụ rõ ràng từ chuyên khảo của K. M. Gurevich: người đưa thư phải có khả năng đọc, nhưng dù anh ta đọc ở tốc độ bình thường hay tốc độ rất cao - điều này không còn ý nghĩa chuyên môn nữa. Với mối tương quan như vậy giữa các chỉ số của phương pháp và tiêu chí bên ngoài, cách đầy đủ nhất để thiết lập giá trị có thể là tiêu chí về sự khác biệt.

Một trường hợp khác cũng có thể xảy ra: mức tài sản cao hơn mức yêu cầu của nghề nghiệp sẽ cản trở sự thành công trong nghề nghiệp. Vì vậy, trở lại buổi bình minh của thế kỷ 20. Nhà nghiên cứu người Mỹ F. Taylor nhận thấy rằng những nữ công nhân sản xuất phát triển nhất có năng suất lao động thấp. Nghĩa là, mức độ phát triển tinh thần cao đã ngăn cản họ làm việc đạt năng suất cao. Trong trường hợp này, phân tích phương sai hoặc tính toán mối quan hệ tương quan sẽ phù hợp hơn để tính hệ số giá trị.

Như kinh nghiệm của các nhà kiểm nghiệm nước ngoài đã chỉ ra, không một quy trình thống kê nào có thể phản ánh đầy đủ tính đa dạng của các đánh giá riêng lẻ. Vì vậy, một mô hình khác thường được sử dụng để chứng minh tính đúng đắn của các phương pháp - đánh giá lâm sàng. Đây không gì khác hơn là một mô tả định tính về bản chất của tài sản đang được nghiên cứu. Trong trường hợp này, chúng ta đang nói về việc sử dụng các kỹ thuật không dựa vào xử lý thống kê.

Các loại hiệu lực

Giá trị cốt lõi của nó là một đặc điểm phức tạp, một mặt bao gồm thông tin về việc liệu kỹ thuật này có phù hợp để đo lường mục đích của nó hay không và mặt khác, hiệu quả, hiệu quả và tính hữu ích thực tế của nó là gì.

Kiểm tra tính hợp lệ của một phương pháp được gọi là xác nhận.

Để tiến hành xác nhận tính thực tế của một kỹ thuật, tức là để đánh giá tính hiệu lực, hiệu suất và ý nghĩa thực tiễn của nó, một tiêu chí độc lập bên ngoài thường được sử dụng - một chỉ báo biểu hiện đặc tính đang được nghiên cứu trong cuộc sống hàng ngày. Tiêu chí đó có thể là kết quả học tập (đối với các bài kiểm tra khả năng học tập, kiểm tra thành tích, kiểm tra trí thông minh) và thành tích sản xuất (đối với các phương pháp định hướng nghề nghiệp) và hiệu quả của các hoạt động thực tế - vẽ, làm mẫu, v.v. (đối với các bài kiểm tra đặc biệt). năng lực), đánh giá chủ quan (đối với bài kiểm tra tính cách).

4 loại tiêu chí bên ngoài:

tiêu chí thực hiện (những tiêu chí này có thể bao gồm như khối lượng công việc đã hoàn thành, kết quả học tập, thời gian dành cho đào tạo, tốc độ phát triển trình độ, v.v.);

tiêu chí chủ quan (chúng bao gồm nhiều loại câu trả lời khác nhau phản ánh thái độ của một người đối với điều gì đó hoặc ai đó, ý kiến, quan điểm, sở thích của anh ta; tiêu chí chủ quan thường có được bằng cách sử dụng các cuộc phỏng vấn, bảng câu hỏi, bảng câu hỏi);

tiêu chí sinh lý (chúng được sử dụng để nghiên cứu ảnh hưởng của môi trường và các biến số tình huống khác đến cơ thể và tâm lý con người; nhịp tim, huyết áp, điện trở của da, triệu chứng mệt mỏi, v.v. được đo);

tiêu chí tai nạn (được sử dụng khi mục đích nghiên cứu liên quan đến vấn đề lựa chọn công việc những cá nhân ít bị tai nạn hơn).

Giá trị thực nghiệm.

Trong trường hợp giá trị nội dung, bài kiểm tra được đánh giá bằng chi phí của các chuyên gia (những người thiết lập sự tương ứng của các hạng mục kiểm tra với nội dung của đối tượng đo), thì giá trị thực nghiệm luôn được đo bằng cách sử dụng tương quan thống kê: tương quan giữa hai chuỗi giá trị được tính toán - điểm số trong bài kiểm tra và các chỉ số trên tham số bên ngoài được chọn làm tiêu chí hợp lệ.

Xây dựng hợp lệ.

Tính giá trị của cấu trúc đề cập đến bản thân cấu trúc lý thuyết và liên quan đến việc tìm kiếm các yếu tố giải thích hành vi làm bài kiểm tra. Là một loại đặc biệt, tính giá trị của cấu trúc đã được Cronbach và Meehl (1955) chuẩn hóa trong một bài báo. Các tác giả đã đánh giá bằng cách sử dụng loại giá trị này cho tất cả các nghiên cứu thử nghiệm không trực tiếp nhằm mục đích dự đoán một số tiêu chí liên quan. Nghiên cứu chứa thông tin về các cấu trúc tâm lý.

Hiệu lực nội dung.

Tính hợp lệ của nội dung yêu cầu mọi mục, nhiệm vụ hoặc câu hỏi thuộc một miền cụ thể đều có cơ hội được kiểm tra trong một bài kiểm tra như nhau. Giá trị nội dung đánh giá tính nhất quán của nội dung bài kiểm tra (nhiệm vụ, câu hỏi) với lĩnh vực hành vi được đo lường. Các bài kiểm tra do hai nhóm phát triển biên soạn, được tiến hành trên một mẫu đối tượng. Độ tin cậy của bài kiểm tra được tính bằng cách chia các mục thành hai phần, dẫn đến chỉ số giá trị nội dung.

"Giá trị dự đoán.

Giá trị “dự đoán” cũng được xác định bởi một tiêu chí bên ngoài khá đáng tin cậy, nhưng thông tin về nó sẽ được thu thập một thời gian sau khi thử nghiệm. Tiêu chí bên ngoài thường là khả năng của một người, được thể hiện dưới dạng đánh giá nào đó, đối với loại hoạt động mà người đó được chọn dựa trên kết quả xét nghiệm chẩn đoán. Mặc dù kỹ thuật này phù hợp nhất với nhiệm vụ của các kỹ thuật chẩn đoán - dự đoán thành công trong tương lai nhưng lại rất khó áp dụng. Độ chính xác của dự báo tỷ lệ nghịch với thời gian được chỉ định cho dự báo đó. Thời gian trôi qua càng lâu sau khi đo, số lượng yếu tố cần được tính đến khi đánh giá ý nghĩa tiên lượng của kỹ thuật càng nhiều. Tuy nhiên, hầu như không thể tính đến tất cả các yếu tố ảnh hưởng đến dự đoán.

Hiệu lực "hồi tưởng".

Nó được xác định trên cơ sở tiêu chí phản ánh các sự kiện hoặc trạng thái chất lượng trong quá khứ. Có thể được sử dụng để nhanh chóng có được thông tin về khả năng dự đoán của kỹ thuật. Vì vậy, để kiểm tra xem kết quả kiểm tra năng khiếu tốt tương ứng với khả năng học tập nhanh đến mức nào, có thể so sánh các đánh giá thành tích trước đây, ý kiến ​​chuyên gia trước đây, v.v. ở những người có chỉ số chẩn đoán dòng điện cao và thấp.

Giá trị hội tụ và phân biệt.

Chiến lược đưa một số mục nhất định vào bài kiểm tra phụ thuộc vào cách nhà tâm lý học xác định cấu trúc chẩn đoán. Nếu Eysenck định nghĩa đặc tính “chủ nghĩa loạn thần kinh” là độc lập với hướng ngoại-hướng nội, thì điều này có nghĩa là bảng câu hỏi của ông nên chứa các mục gần như ngang nhau mà những người hướng nội loạn thần kinh và những người hướng ngoại loạn thần kinh sẽ đồng ý. Nếu trong thực tế, bài kiểm tra sẽ bị chi phối bởi các mục từ góc phần tư “Chứng loạn thần kinh-Hướng nội”, thì theo quan điểm lý thuyết của Eysenck, điều này có nghĩa là yếu tố “chứng loạn thần kinh” hóa ra lại chứa đựng một yếu tố không liên quan. yếu tố - “hướng nội”. (Chính xác thì hiệu ứng tương tự sẽ xảy ra nếu mẫu bị sai lệch – nếu nó chứa nhiều người hướng nội dễ bị rối loạn thần kinh hơn là người hướng ngoại dễ bị rối loạn thần kinh.)

Để tránh những khó khăn như vậy, các nhà tâm lý học muốn giải quyết các chỉ số (các mục) thực nghiệm chỉ cho biết rõ ràng một yếu tố. Nhưng yêu cầu này không bao giờ thực sự được đáp ứng: mọi chỉ số thực nghiệm hóa ra không chỉ được xác định bởi yếu tố chúng ta cần mà còn bởi những yếu tố khác - không liên quan đến nhiệm vụ đo lường.

Do đó, đối với các yếu tố được xác định về mặt khái niệm là trực giao với những gì đang được đo lường (xảy ra trong tất cả các kết hợp), người viết bài kiểm tra phải sử dụng chiến lược cân bằng nhân tạo trong việc lựa chọn các mục.

Sự tương ứng của các mục với yếu tố được đo đảm bảo tính giá trị hội tụ của phép thử. Cân bằng các mục chống lại các yếu tố không liên quan đảm bảo giá trị phân biệt. Về mặt thực nghiệm, nó được thể hiện trong trường hợp không có mối tương quan đáng kể với thử nghiệm đo lường một đặc tính độc lập về mặt khái niệm.

Các loại hiệu lực

Có một số loại giá trị, do đặc điểm của phương pháp chẩn đoán, cũng như trạng thái tạm thời của tiêu chí bên ngoài trong nhiều tác phẩm (A Anastasi, 1982; L.F. Burlachuk, S.M. Morozov, 1989; KM. Gurevich, 1970; B.V. Kulagin, 1984 ; Ở Cherny, 1983; “Chẩn đoán tâm lý tổng quát”, 1987, v.v.) những điều sau đây thường được gọi là:

1. Hiệu lực nội dung. Kỹ thuật này được sử dụng chủ yếu trong các bài kiểm tra thành tích. Thông thường, các bài kiểm tra thành tích không bao gồm tất cả tài liệu mà học sinh đã học mà chỉ bao gồm một phần nhỏ trong đó (3-4 câu hỏi). Bạn có thể chắc chắn rằng câu trả lời đúng cho một số câu hỏi này cho thấy rằng bạn đã nắm vững tất cả tài liệu không? Đây là những gì một bài kiểm tra tính hợp lệ của nội dung sẽ trả lời. Để làm điều này, việc so sánh thành công trong bài kiểm tra với đánh giá của chuyên gia giáo viên (dựa trên tài liệu này) được thực hiện. Giá trị nội dung cũng áp dụng cho các bài kiểm tra tham chiếu theo tiêu chí. Kỹ thuật này đôi khi được gọi là giá trị logic.

2. Hiệu lực đồng thời hoặc hiệu lực liên tục được xác định bởi tiêu chí bên ngoài mà theo đó thông tin được thu thập đồng thời với việc thử nghiệm quy trình đang được thử nghiệm. Nói cách khác, dữ liệu được thu thập liên quan đến hiệu suất hiện tại trong giai đoạn thử nghiệm, hiệu suất trong cùng thời gian, v.v. Kết quả thành công trong bài kiểm tra có mối tương quan với nó.

3. Giá trị “dự đoán” (tên gọi khác là giá trị “dự đoán”). Nó cũng được xác định bởi một tiêu chí bên ngoài khá đáng tin cậy, nhưng thông tin về nó sẽ được thu thập một thời gian sau khi thử nghiệm. Tiêu chí bên ngoài thường là khả năng của một người, được thể hiện dưới dạng đánh giá nào đó, đối với loại hoạt động mà người đó được chọn dựa trên kết quả xét nghiệm chẩn đoán. Mặc dù kỹ thuật này phù hợp nhất với nhiệm vụ của các kỹ thuật chẩn đoán - dự đoán thành công trong tương lai nhưng lại rất khó áp dụng. Độ chính xác của dự báo tỷ lệ nghịch với thời gian được chỉ định cho dự báo đó. Thời gian trôi qua càng lâu sau khi đo, số lượng yếu tố cần được tính đến khi đánh giá ý nghĩa tiên lượng của kỹ thuật càng nhiều. Tuy nhiên, hầu như không thể tính đến tất cả các yếu tố ảnh hưởng đến dự đoán.

4. Hiệu lực "hồi cứu". Nó được xác định trên cơ sở tiêu chí phản ánh các sự kiện hoặc trạng thái chất lượng trong quá khứ. Có thể được sử dụng để nhanh chóng có được thông tin về khả năng dự đoán của kỹ thuật. Vì vậy, để kiểm tra xem kết quả kiểm tra năng khiếu tốt tương ứng với khả năng học tập nhanh đến mức nào, có thể so sánh các đánh giá thành tích trước đây, ý kiến ​​chuyên gia trước đây, v.v. ở những người có chỉ số chẩn đoán hiện tại cao và thấp.

Tương quan

Tương quan (sự phụ thuộc tương quan) là mối quan hệ thống kê giữa hai hoặc nhiều biến ngẫu nhiên (hoặc các giá trị có thể được coi là như vậy với một số mức độ chính xác có thể chấp nhận được). Trong trường hợp này, những thay đổi về giá trị của một hoặc nhiều đại lượng này sẽ dẫn đến sự thay đổi có hệ thống về giá trị của một hoặc nhiều đại lượng khác. Một thước đo toán học về mối tương quan của hai biến ngẫu nhiên là tỷ lệ tương quan, hoặc hệ số tương quan (hoặc). Nếu sự thay đổi của một biến ngẫu nhiên không dẫn đến sự thay đổi tự nhiên ở một biến ngẫu nhiên khác mà dẫn đến sự thay đổi một đặc tính thống kê khác của biến ngẫu nhiên này, thì mối quan hệ đó không được coi là tương quan, mặc dù nó mang tính thống kê.

Thuật ngữ “tương quan” lần đầu tiên được nhà cổ sinh vật học người Pháp Georges Cuvier đưa vào sử dụng trong khoa học vào thế kỷ 18. Ông đã phát triển “định luật tương quan” của các bộ phận và cơ quan của sinh vật sống, nhờ đó có thể khôi phục lại diện mạo của một loài động vật hóa thạch, chỉ có một phần hài cốt của nó được tùy ý sử dụng. Từ “tương quan” lần đầu tiên được sử dụng trong thống kê bởi nhà sinh vật học và thống kê người Anh Francis Galton vào cuối thế kỷ 19.

Một số loại hệ số tương quan có thể dương hoặc âm (cũng có thể không có mối quan hệ thống kê - ví dụ như đối với các biến ngẫu nhiên độc lập). Nếu giả định rằng một mối quan hệ thứ tự chặt chẽ được chỉ định trên các giá trị của các biến, thì mối tương quan âm là mối tương quan trong đó sự gia tăng của một biến có liên quan đến việc giảm một biến khác và hệ số tương quan có thể âm ; mối tương quan dương trong những điều kiện như vậy là mối tương quan trong đó sự gia tăng của một biến có liên quan đến sự gia tăng của một biến khác và hệ số tương quan có thể dương.