Tính toán tương quan Spearman. Hệ số tương quan xếp hạng Spearman và Kendal

Tương quan xếp hạng Spearman(tương quan xếp hạng). Tương quan xếp hạng của Spearman là cách đơn giản nhất để xác định mức độ quan hệ giữa các yếu tố. Tên của phương pháp chỉ ra rằng mối quan hệ được xác định giữa các cấp bậc, tức là một chuỗi các giá trị định lượng thu được, được xếp theo thứ tự giảm dần hoặc tăng dần. Cần phải lưu ý rằng, trước hết, không nên tương quan thứ hạng nếu kết nối giữa các cặp nhỏ hơn bốn và lớn hơn hai mươi; thứ hai, tương quan thứ hạng giúp xác định mối quan hệ trong trường hợp khác, nếu các giá trị có bản chất bán định lượng, nghĩa là chúng không có biểu thức số và phản ánh thứ tự xuất hiện rõ ràng của các giá trị này; thứ ba, nên sử dụng tương quan thứ hạng trong trường hợp chỉ cần thu được dữ liệu gần đúng là đủ. Một ví dụ về tính hệ số tương quan xếp hạng để xác định câu hỏi: bảng câu hỏi đo lường những phẩm chất cá nhân tương tự X và Y của các đối tượng. Sử dụng hai bảng câu hỏi (X và Y), yêu cầu các câu trả lời thay thế “có” hoặc “không”, đã thu được kết quả chính - câu trả lời của 15 đối tượng (N = 10). Các kết quả được trình bày dưới dạng tổng các câu trả lời khẳng định riêng biệt cho bảng câu hỏi X và bảng câu hỏi B. Những kết quả này được tóm tắt trong bảng. 5.19.

Bảng 5.19. Lập bảng kết quả sơ cấp để tính hệ số tương quan xếp hạng Spearman (p) *

Phân tích ma trận tương quan tóm tắt. Phương pháp tương quan thiên hà.

Ví dụ. Trong bảng Hình 6.18 cho thấy cách giải thích của 11 biến được kiểm tra bằng phương pháp Wechsler. Dữ liệu được lấy từ một mẫu đồng nhất ở độ tuổi từ 18 đến 25 (n = 800).

Trước khi phân tầng, nên xếp hạng ma trận tương quan. Để làm điều này, giá trị trung bình của các hệ số tương quan của từng biến với tất cả các biến khác được tính trong ma trận gốc.

Sau đó theo bảng. 5.20 xác định mức độ phân tầng chấp nhận được của ma trận tương quan với xác suất tin cậy cho trước là 0,95 và n - đại lượng

Bảng 6.20. Ma trận tương quan tăng dần

Biến 1 2 3 4 sẽ 0 7 8 0 10 11 M(rij) Thứ hạng
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

Chỉ định: 1 - nhận thức chung; 2 - khái niệm; 3 - sự chú ý; 4 - vdataness K của khái quát hóa; b - ghi nhớ trực tiếp (bằng số) 6 - mức độ thông thạo ngôn ngữ mẹ đẻ; 7 - tốc độ thành thạo các kỹ năng cảm giác vận động (mã hóa ký hiệu) 8 - quan sát; 9 - khả năng kết hợp (để phân tích và tổng hợp) 10 - khả năng tổ chức các bộ phận thành một tổng thể có ý nghĩa; 11 - khả năng tổng hợp heuristic; M (rij) - giá trị trung bình của các hệ số tương quan của biến với các biến quan sát khác (trong trường hợp của chúng tôi là n = 800): r (0) - giá trị của mặt phẳng "Mổ xẻ" bằng 0 - giá trị tuyệt đối có ý nghĩa tối thiểu của hệ số tương quan (n - 120, r(0) = 0,236; n = 40, r(0) = 0,407) | Δr | - bước phân tầng cho phép (n = 40, | Δr | = 0,558) trong - số mức phân tầng cho phép (n = 40, s = 1; n = 120, s = 2); r(1), r(2), ..., r(9) - giá trị tuyệt đối của mặt phẳng cắt (n=40, r(1) = 0,965).

Với n = 800, chúng tôi tìm thấy giá trị của gtype và ranh giới của gi, sau đó chúng tôi phân tầng ma trận tương quan, làm nổi bật các thiên hà tương quan trong các lớp hoặc các phần riêng biệt của ma trận tương quan, vẽ các liên kết của các thiên hà tương quan cho các lớp nằm trên (Hình . 5.5).

Một phân tích có ý nghĩa về các thiên hà thu được vượt xa giới hạn của thống kê toán học. Cần lưu ý rằng có hai dấu hiệu chính thức giúp giải thích ý nghĩa của Pleiades. Một chỉ số quan trọng là bậc của một đỉnh, tức là số cạnh liền kề với một đỉnh. Biến có số cạnh lớn nhất chính là “lõi” của thiên hà và có thể coi là thước đo cho các biến còn lại của thiên hà này. Một chỉ số quan trọng khác là mật độ truyền thông. Một biến có thể có ít kết nối hơn trong một thiên hà nhưng gần hơn và có nhiều kết nối hơn trong thiên hà khác nhưng ít gần hơn.

Dự đoán và ước tính. Phương trình y = b1x + b0 được gọi là phương trình tổng quát của đường thẳng. Nó chỉ ra rằng các cặp điểm (x, y),

Cơm. 5.5. Các thiên hà tương quan thu được bằng cách phân lớp ma trận

nằm trên một đường nhất định, được kết nối sao cho với bất kỳ giá trị x nào, giá trị b ghép với nó có thể được tìm thấy bằng cách nhân x với một số nhất định b1 và cộng số thứ hai b0 vào tích này.

Hệ số hồi quy cho phép bạn xác định mức độ thay đổi của yếu tố điều tra khi yếu tố nguyên nhân thay đổi một đơn vị. Giá trị tuyệt đối mô tả mối quan hệ giữa các yếu tố biến đổi bằng giá trị tuyệt đối của chúng. Hệ số hồi quy được tính bằng công thức:

Thiết kế và phân tích thí nghiệm. Thiết kế và phân tích thí nghiệm là nhánh quan trọng thứ ba của phương pháp thống kê được phát triển để tìm và kiểm tra mối quan hệ nhân quả giữa các biến.

Để nghiên cứu sự phụ thuộc đa yếu tố, các phương pháp thiết kế thí nghiệm toán học gần đây ngày càng được sử dụng nhiều.

Khả năng thay đổi đồng thời tất cả các yếu tố cho phép bạn: a) giảm số lượng thử nghiệm;

b) giảm sai số thực nghiệm đến mức tối thiểu;

c) đơn giản hóa việc xử lý dữ liệu nhận được;

d) đảm bảo sự rõ ràng và dễ dàng so sánh các kết quả.

Mỗi yếu tố có thể thu được một số giá trị khác nhau tương ứng nhất định, được gọi là mức và ký hiệu là -1, 0 và 1. Một tập hợp cố định các mức yếu tố xác định các điều kiện của một trong các thử nghiệm khả thi.

Tổng số tất cả các kết hợp có thể được tính bằng công thức:

Một thử nghiệm giai thừa hoàn chỉnh là một thử nghiệm trong đó tất cả các tổ hợp có thể có của các cấp yếu tố đều được thực hiện. Các thí nghiệm giai thừa đầy đủ có thể có tính chất trực giao. Với quy hoạch trực giao, các yếu tố trong thử nghiệm không tương quan với nhau; các hệ số hồi quy được tính toán cuối cùng được xác định độc lập với nhau.

Ưu điểm quan trọng của phương pháp lập kế hoạch thực nghiệm toán học là tính linh hoạt và phù hợp trong nhiều lĩnh vực nghiên cứu.

Hãy xem xét một ví dụ so sánh ảnh hưởng của một số yếu tố đến sự hình thành mức độ căng thẳng tinh thần ở bộ điều khiển TV màu.

Thí nghiệm dựa trên Thiết kế trực giao 2 ba (ba yếu tố thay đổi ở hai cấp độ).

Thí nghiệm được thực hiện hoàn chỉnh theo phần 2+3 với 3 lần lặp lại.

Quy hoạch trực giao dựa trên việc xây dựng phương trình hồi quy. Đối với ba yếu tố, nó trông như thế này:

Việc xử lý kết quả trong ví dụ này bao gồm:

a) Lập bảng phương án trực giao 2+3 để tính toán;

b) tính toán các hệ số hồi quy;

c) kiểm tra tầm quan trọng của chúng;

d) diễn giải dữ liệu thu được.

Đối với các hệ số hồi quy của phương trình trên, cần đặt N = 2 3 = 8 phương án để có thể đánh giá được ý nghĩa của các hệ số, trong đó số lần lặp K là 3.

Ma trận để lập kế hoạch thí nghiệm trông như thế này:

Trong trường hợp phép đo các đặc điểm đang nghiên cứu được thực hiện theo thang bậc hoặc dạng mối quan hệ khác với tuyến tính, việc nghiên cứu mối quan hệ giữa hai biến ngẫu nhiên được thực hiện bằng cách sử dụng các hệ số tương quan xếp hạng. Hãy xem xét hệ số tương quan xếp hạng Spearman. Khi tính toán cần xếp hạng (thứ tự) các phương án mẫu. Xếp hạng là việc nhóm dữ liệu thử nghiệm theo một thứ tự nhất định, tăng dần hoặc giảm dần.

Hoạt động xếp hạng được thực hiện theo thuật toán sau:

1. Giá trị thấp hơn được gán thứ hạng thấp hơn. Giá trị cao nhất được gán một thứ hạng tương ứng với số lượng giá trị được xếp hạng. Giá trị nhỏ nhất được gán thứ hạng 1. Ví dụ: nếu n=7 thì giá trị lớn nhất sẽ nhận được thứ hạng 7, ngoại trừ các trường hợp được quy định trong quy tắc thứ hai.

2. Nếu một số giá trị bằng nhau thì chúng sẽ được ấn định một thứ hạng bằng mức trung bình của các thứ hạng mà chúng sẽ nhận được nếu không bằng nhau. Ví dụ: hãy xem xét một mẫu có thứ tự tăng dần gồm 7 phần tử: 22, 23, 25, 25, 25, 28, 30. Các giá trị 22 và 23 xuất hiện một lần, do đó thứ hạng của chúng tương ứng là R22=1, và R23=2 . Giá trị 25 xuất hiện 3 lần. Nếu các giá trị này không được lặp lại thì thứ hạng của chúng sẽ là 3, 4, 5. Do đó, thứ hạng R25 của chúng bằng trung bình số học của 3, 4 và 5: . Giá trị 28 và 30 không lặp lại nên thứ hạng của chúng lần lượt là R28=6 và R30=7. Cuối cùng ta có sự tương ứng sau:

3. Tổng số thứ hạng phải trùng với số hạng tính được xác định theo công thức:

trong đó n là tổng số giá trị được xếp hạng.

Sự khác biệt giữa tổng thứ hạng thực tế và tính toán sẽ chỉ ra lỗi xảy ra khi tính thứ hạng hoặc tổng hợp chúng. Trong trường hợp này, bạn cần tìm và sửa lỗi.

Hệ số tương quan xếp hạng của Spearman là một phương pháp cho phép người ta xác định cường độ và hướng của mối quan hệ giữa hai tính trạng hoặc hai hệ thống phân cấp tính trạng. Việc sử dụng hệ số tương quan xếp hạng có một số hạn chế:

  • a) Sự phụ thuộc tương quan giả định phải đơn điệu.
  • b) Thể tích của mỗi mẫu phải lớn hơn hoặc bằng 5. Để xác định giới hạn trên của mẫu sử dụng bảng giá trị tới hạn (Bảng 3 của Phụ lục). Giá trị tối đa của n trong bảng là 40.
  • c) Trong quá trình phân tích, có thể xuất hiện một số lượng lớn các cấp bậc giống nhau. Trong trường hợp này, cần phải sửa đổi. Trường hợp thuận lợi nhất là khi cả hai mẫu được nghiên cứu đều đại diện cho hai chuỗi giá trị khác nhau.

Để tiến hành phân tích tương quan, nhà nghiên cứu phải có hai mẫu có thể xếp hạng được, ví dụ:

  • - hai đặc điểm được đo trong cùng một nhóm đối tượng;
  • - hai hệ thống phân cấp đặc điểm riêng lẻ được xác định ở hai đối tượng sử dụng cùng một bộ đặc điểm;
  • - hai hệ thống phân cấp nhóm đặc điểm;
  • - hệ thống phân cấp cá nhân và nhóm của các đặc điểm.

Chúng tôi bắt đầu tính toán bằng cách xếp hạng các chỉ số được nghiên cứu riêng biệt cho từng đặc điểm.

Chúng ta hãy phân tích một trường hợp có hai dấu hiệu được đo trong cùng một nhóm đối tượng. Đầu tiên, các giá trị riêng lẻ mà các đối tượng khác nhau thu được được xếp hạng theo đặc điểm thứ nhất, sau đó các giá trị riêng lẻ được xếp hạng theo đặc điểm thứ hai. Nếu thứ hạng thấp hơn của một chỉ số tương ứng với thứ hạng thấp hơn của chỉ số khác và thứ hạng cao hơn của một chỉ số tương ứng với thứ hạng cao hơn của chỉ số khác, thì hai đặc điểm này có mối quan hệ tích cực. Nếu thứ hạng cao hơn của một chỉ số tương ứng với thứ hạng thấp hơn của chỉ số khác thì hai đặc điểm này có mối quan hệ nghịch biến. Để tìm rs, chúng tôi xác định sự khác biệt giữa các cấp bậc (d) cho từng môn học. Sự khác biệt giữa các thứ hạng càng nhỏ thì hệ số tương quan thứ hạng rs sẽ càng gần với “+1”. Nếu không có mối quan hệ thì sẽ không có sự tương ứng giữa chúng, do đó rs sẽ gần bằng 0. Sự khác biệt giữa thứ hạng của các đối tượng theo hai biến càng lớn thì giá trị của hệ số rs sẽ càng gần với “-1”. Do đó, hệ số tương quan xếp hạng Spearman là thước đo cho bất kỳ mối quan hệ đơn điệu nào giữa hai đặc điểm đang được nghiên cứu.

Chúng ta hãy xem xét trường hợp có hai hệ thống phân cấp đặc điểm riêng lẻ được xác định ở hai đối tượng dựa trên cùng một tập hợp các đặc điểm. Trong tình huống này, các giá trị riêng lẻ thu được của mỗi đối tượng trong số hai đối tượng được xếp hạng theo một bộ đặc điểm nhất định. Tính năng có giá trị thấp nhất sẽ được xếp hạng đầu tiên; đặc tính có giá trị cao hơn là hạng thứ hai, v.v. Cần đặc biệt chú ý để đảm bảo rằng tất cả các thuộc tính được đo bằng cùng đơn vị. Ví dụ: không thể xếp hạng các chỉ báo nếu chúng được biểu thị theo các điểm “giá” khác nhau, vì không thể xác định yếu tố nào sẽ chiếm vị trí đầu tiên về mức độ nghiêm trọng cho đến khi tất cả các giá trị được đưa về một thang đo duy nhất. Nếu các đối tượng có thứ hạng thấp ở một trong các đối tượng này cũng có thứ hạng thấp ở đối tượng kia và ngược lại, thì các hệ thống phân cấp riêng lẻ có liên quan tích cực.

Trong trường hợp có hai hệ thống phân cấp đặc điểm của nhóm, các giá trị nhóm trung bình thu được ở hai nhóm đối tượng được xếp hạng theo cùng một bộ đặc điểm cho các nhóm được nghiên cứu. Tiếp theo, chúng tôi làm theo thuật toán được đưa ra trong các trường hợp trước.

Chúng ta hãy phân tích một trường hợp với hệ thống phân cấp đặc điểm cá nhân và nhóm. Họ bắt đầu bằng cách xếp hạng riêng biệt các giá trị riêng lẻ của đối tượng và các giá trị trung bình của nhóm theo cùng một bộ đặc điểm thu được, loại trừ đối tượng không tham gia vào hệ thống phân cấp nhóm trung bình, vì hệ thống phân cấp cá nhân của anh ta sẽ so sánh với nó. Tương quan thứ hạng cho phép chúng ta đánh giá mức độ nhất quán của hệ thống phân cấp các đặc điểm cá nhân và nhóm.

Chúng ta hãy xem xét tầm quan trọng của hệ số tương quan được xác định như thế nào trong các trường hợp được liệt kê ở trên. Trong trường hợp có hai đặc điểm, nó sẽ được xác định bởi cỡ mẫu. Trong trường hợp có hai hệ thống phân cấp đối tượng riêng lẻ, tầm quan trọng phụ thuộc vào số lượng đối tượng có trong hệ thống phân cấp. Trong hai trường hợp cuối, tầm quan trọng được xác định bởi số lượng đặc điểm được nghiên cứu chứ không phải bởi số lượng nhóm. Như vậy, tầm quan trọng của rs trong mọi trường hợp được xác định bởi số giá trị được xếp hạng n.

Khi kiểm tra ý nghĩa thống kê của rs, các bảng giá trị tới hạn của hệ số tương quan xếp hạng được sử dụng, được biên soạn cho các số giá trị xếp hạng khác nhau và mức ý nghĩa khác nhau. Nếu giá trị tuyệt đối của rs đạt hoặc vượt quá giá trị tới hạn thì mối tương quan là đáng tin cậy.

Khi xem xét phương án thứ nhất (trường hợp có hai dấu hiệu được đo trong cùng một nhóm đối tượng), có thể xảy ra các giả thuyết sau.

H0: Tương quan giữa biến x và y không khác 0.

H1: Mối tương quan giữa biến x và y khác 0 đáng kể.

Nếu chúng ta xử lý bất kỳ trường hợp nào trong ba trường hợp còn lại thì cần phải đưa ra một cặp giả thuyết khác:

H0: Mối tương quan giữa các cấp bậc x và y không khác 0.

H1: Mối tương quan giữa các thứ bậc x và y khác biệt đáng kể so với 0.

Trình tự các thao tác khi tính hệ số tương quan xếp hạng Spearman rs như sau.

  • - Xác định hai đặc trưng hoặc hai phân cấp đặc trưng nào sẽ tham gia so sánh dưới dạng biến x và y.
  • - Xếp hạng các giá trị của biến x, gán hạng 1 cho giá trị nhỏ nhất, đúng quy tắc xếp hạng. Xếp thứ tự vào cột đầu tiên của bảng theo thứ tự đối tượng kiểm tra hoặc đặc điểm.
  • - Xếp hạng các giá trị của biến y. Xếp thứ hạng vào cột thứ hai của bảng theo thứ tự đối tượng kiểm tra hoặc đặc điểm.
  • - Tính chênh lệch d giữa các hạng x và y cho mỗi hàng của bảng. Đặt kết quả vào cột tiếp theo của bảng.
  • - Tính bình phương sai phân (d2). Đặt các giá trị kết quả vào cột thứ tư của bảng.
  • - Tính tổng các bình phương khác nhau? d2.
  • - Nếu xếp hạng giống nhau thì tính hiệu chỉnh:

trong đó tx là thể tích của từng nhóm cấp giống nhau trong mẫu x;

ty là thể tích của từng nhóm cấp giống nhau trong mẫu y.

Tính hệ số tương quan xếp hạng tùy thuộc vào sự hiện diện hay vắng mặt của các cấp bậc giống hệt nhau. Nếu không có cấp bậc giống nhau thì tính hệ số tương quan cấp bậc rs theo công thức:

Nếu có thứ hạng giống nhau thì tính hệ số tương quan thứ hạng rs theo công thức:

ở đâu?d2 là tổng bình phương của sự khác biệt giữa các cấp bậc;

Tx và Ty - hiệu chỉnh cho cùng cấp bậc;

n là số lượng đối tượng hoặc đặc điểm tham gia xếp hạng.

Xác định các giá trị tới hạn của rs từ Phụ lục Bảng 3 cho một số đối tượng n cho trước. Sẽ quan sát thấy sự khác biệt đáng kể so với 0 của hệ số tương quan với điều kiện rs không nhỏ hơn giá trị tới hạn.

Một sinh viên tâm lý học (nhà xã hội học, nhà quản lý, nhà quản lý, v.v.) thường quan tâm đến việc hai hoặc nhiều biến số có liên quan với nhau như thế nào trong một hoặc nhiều nhóm đang được nghiên cứu.

Trong toán học, để mô tả mối quan hệ giữa các đại lượng biến, người ta sử dụng khái niệm hàm F, hàm này liên kết từng giá trị cụ thể của biến độc lập X với một giá trị cụ thể của biến phụ thuộc Y. Sự phụ thuộc thu được được ký hiệu là Y=F( X).

Đồng thời, các loại tương quan giữa các đặc tính đo được có thể khác nhau: ví dụ, mối tương quan có thể là tuyến tính và phi tuyến, dương và âm. Nó là tuyến tính - nếu tăng hoặc giảm một biến X, thì biến thứ hai Y, trung bình, cũng tăng hoặc giảm. Nó là phi tuyến nếu, với sự gia tăng của một đại lượng, bản chất của sự thay đổi trong đại lượng thứ hai không phải là tuyến tính mà được mô tả bởi các định luật khác.

Mối tương quan sẽ dương nếu khi biến X tăng thì biến Y tính trung bình cũng tăng và nếu khi X tăng, biến Y có xu hướng giảm tính trung bình thì chúng ta nói đến sự hiện diện của một tiêu cực. sự tương quan. Một tình huống có thể xảy ra là không thể thiết lập bất kỳ mối quan hệ nào giữa các biến. Trong trường hợp này, họ nói rằng không có mối tương quan.

Nhiệm vụ của phân tích tương quan là thiết lập hướng (tích cực hoặc tiêu cực) và hình thức (tuyến tính, phi tuyến) của mối quan hệ giữa các đặc điểm khác nhau, đo lường mức độ gần gũi của nó và cuối cùng là kiểm tra mức ý nghĩa của các hệ số tương quan thu được.

Hệ số tương quan xếp hạng, do K. Spearman đề xuất, đề cập đến thước đo phi tham số về mối quan hệ giữa các biến được đo trên thang xếp hạng. Khi tính hệ số này, không cần giả định về bản chất của sự phân bố các đặc điểm trong tổng thể. Hệ số này xác định mức độ gần gũi của mối liên hệ giữa các đặc điểm thứ tự, trong trường hợp này biểu thị cấp bậc của các đại lượng được so sánh.

Hệ số tương quan tuyến tính xếp hạng của Spearman được tính bằng công thức:

trong đó n là số đặc điểm được xếp hạng (chỉ số, đối tượng);
D là sự khác biệt giữa thứ hạng của hai biến đối với từng môn học;
D2 là tổng bình phương của các cấp bậc.

Các giá trị tới hạn của hệ số tương quan xếp hạng Spearman được trình bày dưới đây:

Giá trị của hệ số tương quan tuyến tính Spearman nằm trong khoảng +1 và -1. Hệ số tương quan tuyến tính của Spearman có thể dương hoặc âm, mô tả chiều hướng của mối quan hệ giữa hai đặc điểm được đo trên thang xếp hạng.

Nếu hệ số tương quan về giá trị tuyệt đối gần bằng 1 thì điều này thể hiện mức độ liên kết cao giữa các biến. Vì vậy, cụ thể, khi một biến có tương quan với chính nó thì giá trị của hệ số tương quan sẽ bằng +1. Mối quan hệ như vậy đặc trưng cho sự phụ thuộc tỷ lệ trực tiếp. Nếu các giá trị của biến X được sắp xếp theo thứ tự tăng dần và các giá trị tương tự (hiện được chỉ định là biến Y) được sắp xếp theo thứ tự giảm dần thì trong trường hợp này mối tương quan giữa các biến X và Y sẽ chính xác là - 1. Giá trị này của hệ số tương quan đặc trưng cho mối quan hệ tỷ lệ nghịch.

Dấu của hệ số tương quan rất quan trọng để giải thích mối quan hệ thu được. Nếu dấu của hệ số tương quan tuyến tính là cộng thì mối quan hệ giữa các đặc điểm tương quan sẽ sao cho giá trị lớn hơn của một đặc điểm (biến) tương ứng với giá trị lớn hơn của đặc điểm khác (biến khác). Nói cách khác, nếu một chỉ báo (biến) tăng thì chỉ báo (biến) kia cũng tăng tương ứng. Sự phụ thuộc này được gọi là sự phụ thuộc tỷ lệ trực tiếp.

Nếu nhận được dấu trừ thì giá trị lớn hơn của một đặc tính này sẽ tương ứng với giá trị nhỏ hơn của đặc tính khác. Nói cách khác, nếu có dấu trừ thì một biến tăng (dấu, giá trị) tương ứng với việc giảm một biến khác. Sự phụ thuộc này được gọi là sự phụ thuộc tỷ lệ nghịch. Trong trường hợp này, việc lựa chọn biến để gán đặc tính (xu hướng) tăng là tùy ý. Nó có thể là biến X hoặc biến Y. Tuy nhiên, nếu biến X được coi là tăng thì biến Y sẽ giảm tương ứng và ngược lại.

Hãy xem ví dụ về mối tương quan Spearman.

Nhà tâm lý học tìm hiểu xem các chỉ số cá nhân về mức độ sẵn sàng đi học, đạt được trước khi bắt đầu đi học của 11 học sinh lớp một, có mối liên hệ với nhau như thế nào và thành tích trung bình của các em vào cuối năm học.

Để giải quyết vấn đề này, trước tiên, chúng tôi xếp hạng giá trị trung bình của các chỉ số về mức độ sẵn sàng đi học khi nhập học và thứ hai là các chỉ số cuối cùng về kết quả học tập cuối năm của chính những học sinh này. Chúng tôi trình bày kết quả ở bảng:

Chúng tôi thay thế dữ liệu thu được vào công thức trên và thực hiện phép tính. Chúng tôi nhận được:

Để tìm mức ý nghĩa, chúng ta tham khảo bảng “Các giá trị tới hạn của hệ số tương quan xếp hạng Spearman”, bảng này hiển thị các giá trị tới hạn của các hệ số tương quan xếp hạng.

Chúng ta xây dựng “trục ý nghĩa” tương ứng:

Hệ số tương quan thu được trùng với giá trị tới hạn ở mức ý nghĩa 1%. Do đó, có thể lập luận rằng các chỉ số về mức độ sẵn sàng đi học và điểm cuối kỳ của học sinh lớp một có mối tương quan dương - nói cách khác, chỉ số về mức độ sẵn sàng đi học càng cao thì việc học tập của học sinh lớp một càng tốt. Về mặt giả thuyết thống kê, nhà tâm lý học phải bác bỏ giả thuyết không (H0) về sự tương đồng và chấp nhận giả thuyết thay thế (H1) về sự hiện diện của sự khác biệt, điều này cho thấy mối quan hệ giữa các chỉ số về mức độ sẵn sàng đi học và kết quả học tập trung bình khác 0.

Tương quan Spearman. Phân tích tương quan bằng phương pháp Spearman. Cấp bậc của Spearman. Hệ số tương quan Spearman. Tương quan xếp hạng Spearman

Máy tính bên dưới tính hệ số tương quan xếp hạng Spearman giữa hai biến ngẫu nhiên. Phần lý thuyết, để không bị phân tâm khỏi máy tính, theo truyền thống được đặt bên dưới nó.

thêm vào nhập_xuất mode_edit xóa bỏ

Thay đổi các biến ngẫu nhiên

mũi tên_trở lênmũi tên_hướng xuống Xmũi tên_trở lênmũi tên_hướng xuống Y
Kích thước trang: 5 10 20 50 100 chevron_left chevron_right

Thay đổi các biến ngẫu nhiên

Nhập dữ liệu Lỗi nhập

Bạn có thể sử dụng một trong các ký hiệu này để phân tách các trường: Tab, ";" hoặc "," Ví dụ: -50,5;-50,5

Nhập Trở lại Hủy bỏ

Phương pháp tính hệ số tương quan xếp hạng Spearman thực ra được mô tả rất đơn giản. Đây là hệ số tương quan Pearson tương tự, chỉ được tính toán không phải cho kết quả đo lường của các biến ngẫu nhiên mà cho kết quả của chúng. giá trị xếp hạng.

Đó là,

Tất cả những gì còn lại là tìm ra giá trị xếp hạng là gì và tại sao tất cả những điều này lại cần thiết.

Nếu các phần tử của chuỗi biến thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần thì thứ hạng phần tử sẽ là số của nó trong chuỗi được sắp xếp này.

Ví dụ: chúng ta có một chuỗi biến thể (17,26,5,14,21). Hãy sắp xếp các phần tử của nó theo thứ tự giảm dần (26,21,17,14,5). 26 có hạng 1, 21 có hạng 2, v.v. Chuỗi biến thể của các giá trị xếp hạng sẽ trông như thế này (3,1,5,4,2).

Nghĩa là, khi tính hệ số Spearman, chuỗi biến thể ban đầu được chuyển thành chuỗi biến thể của các giá trị xếp hạng, sau đó công thức Pearson được áp dụng cho chúng.

Có một sự tinh tế - thứ hạng của các giá trị lặp lại được lấy làm mức trung bình của các thứ hạng. Nghĩa là, đối với hàng (17, 15, 14, 15), hàng giá trị xếp hạng sẽ có dạng (1, 2,5, 4, 2,5), vì phần tử đầu tiên bằng 15 có hạng 2 và phần tử thứ hai có hạng 3, và .

Nếu không có giá trị lặp lại, nghĩa là tất cả các giá trị của chuỗi xếp hạng là các số trong phạm vi từ 1 đến n, công thức Pearson có thể được đơn giản hóa thành

Nhân tiện, công thức này thường được đưa ra dưới dạng công thức tính hệ số Spearman.

Bản chất của quá trình chuyển đổi từ chính các giá trị sang giá trị xếp hạng của chúng là gì?
Vấn đề là bằng cách nghiên cứu mối tương quan của các giá trị xếp hạng, bạn có thể xác định mức độ phụ thuộc của hai biến được mô tả bằng hàm đơn điệu.

Dấu của hệ số cho biết hướng của mối quan hệ giữa các biến. Nếu dấu dương thì giá trị Y có xu hướng tăng khi giá trị X tăng; nếu dấu âm thì giá trị Y có xu hướng giảm khi giá trị X tăng. Nếu hệ số bằng 0 thì không có xu hướng. Nếu hệ số là 1 hoặc -1 thì mối quan hệ giữa X và Y có dạng hàm đơn điệu - nghĩa là khi X tăng thì Y cũng tăng hoặc ngược lại, khi X tăng thì Y giảm.

Nghĩa là, không giống như hệ số tương quan Pearson, chỉ có thể bộc lộ sự phụ thuộc tuyến tính của biến này vào biến khác, hệ số tương quan Spearman có thể bộc lộ sự phụ thuộc đơn điệu khi không phát hiện được mối quan hệ tuyến tính trực tiếp.

Hãy để tôi giải thích bằng một ví dụ. Giả sử chúng ta đang kiểm tra hàm y=10/x.
Chúng tôi có các phép đo X và Y sau đây
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Đối với những dữ liệu này, hệ số tương quan Pearson là -0,4686, nghĩa là mối quan hệ yếu hoặc không có. Nhưng hệ số tương quan Spearman hoàn toàn bằng -1, điều này dường như gợi ý cho nhà nghiên cứu rằng Y có sự phụ thuộc đơn điệu âm hoàn toàn vào X.