Tương quan xếp hạng của Spearman được tính bằng công thức. Làm thế nào để kiểm tra giá trị nhận được? Hệ số tương quan xếp hạng của Spearman

Môn học “toán học cao hơn” khiến một số người từ chối vì thực sự không phải ai cũng có thể hiểu được nó. Nhưng những người may mắn nghiên cứu chủ đề này và giải các bài toán bằng cách sử dụng các phương trình và hệ số khác nhau có thể tự hào về nhận thức gần như hoàn chỉnh về nó. Trong khoa học tâm lý, không chỉ có trọng tâm nhân đạo mà còn có những công thức và phương pháp nhất định để xác minh toán học cho giả thuyết được đưa ra trong quá trình nghiên cứu. Các hệ số khác nhau được sử dụng cho việc này.

Hệ số tương quan Spearman

Đây là phép đo phổ biến để xác định mức độ của mối quan hệ giữa hai đặc điểm bất kỳ. Hệ số này còn được gọi là phương pháp không tham số. Nó hiển thị số liệu thống kê truyền thông. Ví dụ, chúng ta biết rằng ở một đứa trẻ, tính hung hăng và cáu kỉnh có mối liên hệ với nhau và hệ số tương quan xếp hạng Spearman cho thấy mối quan hệ toán học thống kê giữa hai đặc điểm này.

Hệ số xếp hạng được tính như thế nào?

Đương nhiên, tất cả các định nghĩa hoặc đại lượng toán học đều có công thức tính toán riêng. Hệ số tương quan Spearman cũng có nó. Công thức của anh ấy như sau:

Thoạt nhìn, công thức không hoàn toàn rõ ràng, nhưng nếu bạn nhìn vào nó, mọi thứ đều rất dễ tính toán:

  • n là số tính năng hoặc chỉ số được xếp hạng.
  • d là sự chênh lệch giữa hai bậc nhất định tương ứng với hai biến số cụ thể của từng môn học.
  • ∑d 2 - tổng của tất cả các chênh lệch bình phương giữa các cấp của một đối tượng, bình phương của chúng được tính riêng cho từng cấp.

Phạm vi ứng dụng của phép đo kết nối toán học

Để áp dụng hệ số xếp hạng, điều cần thiết là dữ liệu định lượng của thuộc tính phải được xếp hạng, nghĩa là chúng được gán một số nhất định tùy thuộc vào vị trí của thuộc tính và giá trị của nó. Người ta đã chứng minh rằng hai chuỗi đặc tính được biểu diễn dưới dạng số có phần song song với nhau. Hệ số tương quan cấp bậc của Spearman quyết định mức độ song song này, mức độ chặt chẽ của mối liên hệ giữa các đặc điểm.

Đối với phép toán tính toán và xác định mối quan hệ của các đặc tính sử dụng hệ số đã chỉ định, bạn cần thực hiện một số hành động:

  1. Mỗi giá trị của bất kỳ chủ đề hoặc hiện tượng nào đều được gán một số theo thứ tự - thứ hạng. Nó có thể tương ứng với giá trị của một hiện tượng theo thứ tự tăng dần hoặc giảm dần.
  2. Tiếp theo, thứ hạng giá trị của các đặc tính của hai chuỗi định lượng được so sánh để xác định sự khác biệt giữa chúng.
  3. Đối với mỗi chênh lệch thu được, bình phương của nó được ghi vào một cột riêng của bảng và kết quả được tóm tắt bên dưới.
  4. Sau các bước này, một công thức được áp dụng để tính hệ số tương quan Spearman.

Tính chất của hệ số tương quan

Các tính chất chính của hệ số Spearman bao gồm:

  • Đo giá trị từ -1 đến 1.
  • Không có dấu hiệu của hệ số giải thích.
  • Độ chặt của kết nối được xác định theo nguyên tắc: giá trị càng cao thì kết nối càng gần.

Làm thế nào để kiểm tra giá trị nhận được?

Để kiểm tra mối quan hệ giữa các dấu hiệu, bạn cần thực hiện một số hành động nhất định:

  1. Một giả thuyết khống (H0) được đưa ra, đây cũng là giả thuyết chính, sau đó một giả thuyết thay thế khác cho giả thuyết đầu tiên (H 1) được hình thành. Giả thuyết đầu tiên sẽ là hệ số tương quan Spearman bằng 0 - điều này có nghĩa là sẽ không có mối quan hệ nào. Ngược lại, điều thứ hai nói rằng hệ số không bằng 0 thì có mối liên hệ.
  2. Bước tiếp theo là tìm giá trị quan sát được của tiêu chí. Nó được tìm thấy bằng cách sử dụng công thức cơ bản của hệ số Spearman.
  3. Tiếp theo, các giá trị tới hạn của tiêu chí đã cho được tìm thấy. Điều này chỉ có thể được thực hiện bằng cách sử dụng một bảng đặc biệt, hiển thị các giá trị khác nhau cho các chỉ báo nhất định: mức ý nghĩa (l) và số xác định (n).
  4. Bây giờ bạn cần so sánh hai giá trị thu được: giá trị có thể quan sát được đã thiết lập và giá trị quan trọng. Để làm được điều này, cần phải xây dựng một vùng quan trọng. Bạn cần vẽ một đường thẳng, đánh dấu các điểm có giá trị tới hạn của hệ số bằng dấu “-” và dấu “+”. Ở bên trái và bên phải của các giá trị tới hạn, các vùng tới hạn được vẽ theo hình bán nguyệt tính từ các điểm. Ở giữa, kết hợp hai giá trị, nó được đánh dấu bằng hình bán nguyệt OPG.
  5. Sau đó, đưa ra kết luận về mối quan hệ chặt chẽ giữa hai đặc điểm này.

Đâu là nơi tốt nhất để sử dụng giá trị này?

Khoa học đầu tiên mà hệ số này được sử dụng tích cực là tâm lý học. Suy cho cùng, đây là một môn khoa học không dựa trên những con số mà để chứng minh bất kỳ giả thuyết quan trọng nào liên quan đến sự phát triển của các mối quan hệ, đặc điểm tính cách của con người và kiến ​​​​thức của học sinh thì cần phải có sự xác nhận thống kê về kết luận. Nó cũng được sử dụng trong kinh tế, đặc biệt là trong các giao dịch ngoại hối. Ở đây các tính năng được đánh giá mà không cần số liệu thống kê. Hệ số tương quan xếp hạng Spearman rất thuận tiện trong lĩnh vực ứng dụng này ở chỗ việc đánh giá được thực hiện bất kể sự phân bố của các biến vì chúng được thay thế bằng số xếp hạng. Hệ số Spearman được sử dụng tích cực trong ngân hàng. Xã hội học, khoa học chính trị, nhân khẩu học và các ngành khoa học khác cũng sử dụng nó trong nghiên cứu của họ. Kết quả thu được nhanh chóng và chính xác nhất có thể.

Thật thuận tiện và nhanh chóng khi sử dụng hệ số tương quan Spearman trong Excel. Ở đây có các chức năng đặc biệt giúp bạn nhanh chóng nhận được các giá trị cần thiết.

Những hệ số tương quan nào khác tồn tại?

Ngoài những gì chúng ta đã học về hệ số tương quan Spearman, còn có nhiều hệ số tương quan khác nhau cho phép chúng ta đo lường và đánh giá các đặc tính định tính, mối quan hệ giữa các đặc điểm định lượng và mức độ chặt chẽ của mối quan hệ giữa chúng, được trình bày trên thang xếp hạng. Đây là các hệ số như nhị phân, đẳng cấp, nhị phân, dự phòng, liên kết, v.v. Hệ số Spearman thể hiện rất chính xác mức độ chặt chẽ của mối quan hệ, không giống như tất cả các phương pháp xác định toán học khác của nó.

Một sinh viên tâm lý học (nhà xã hội học, nhà quản lý, nhà quản lý, v.v.) thường quan tâm đến việc hai hoặc nhiều biến số có liên quan với nhau như thế nào trong một hoặc nhiều nhóm đang được nghiên cứu.

Trong toán học, để mô tả mối quan hệ giữa các đại lượng biến, người ta sử dụng khái niệm hàm F, hàm này liên kết từng giá trị cụ thể của biến độc lập X với một giá trị cụ thể của biến phụ thuộc Y. Sự phụ thuộc thu được được ký hiệu là Y=F( X).

Đồng thời, các loại tương quan giữa các đặc tính đo được có thể khác nhau: ví dụ, mối tương quan có thể là tuyến tính và phi tuyến, dương và âm. Nó là tuyến tính - nếu tăng hoặc giảm một biến X, thì biến thứ hai Y, trung bình, cũng tăng hoặc giảm. Nó là phi tuyến nếu, với sự gia tăng của một đại lượng, bản chất của sự thay đổi trong đại lượng thứ hai không phải là tuyến tính mà được mô tả bởi các định luật khác.

Mối tương quan sẽ dương nếu khi biến X tăng thì biến Y tính trung bình cũng tăng và nếu khi X tăng, biến Y có xu hướng giảm tính trung bình thì chúng ta nói đến sự hiện diện của một tiêu cực. sự tương quan. Một tình huống có thể xảy ra là không thể thiết lập bất kỳ mối quan hệ nào giữa các biến. Trong trường hợp này, họ nói rằng không có mối tương quan.

Nhiệm vụ của phân tích tương quan là thiết lập hướng (tích cực hoặc tiêu cực) và hình thức (tuyến tính, phi tuyến) của mối quan hệ giữa các đặc điểm khác nhau, đo lường mức độ gần gũi của nó và cuối cùng là kiểm tra mức ý nghĩa của các hệ số tương quan thu được.

Hệ số tương quan xếp hạng, do K. Spearman đề xuất, đề cập đến thước đo phi tham số về mối quan hệ giữa các biến được đo trên thang xếp hạng. Khi tính hệ số này, không cần giả định về bản chất của sự phân bố các đặc điểm trong tổng thể. Hệ số này xác định mức độ gần gũi của mối liên hệ giữa các đặc điểm thứ tự, trong trường hợp này biểu thị cấp bậc của các đại lượng được so sánh.

Hệ số tương quan tuyến tính xếp hạng của Spearman được tính bằng công thức:

trong đó n là số đặc điểm được xếp hạng (chỉ số, đối tượng);
D là sự khác biệt giữa thứ hạng của hai biến đối với từng môn học;
D2 là tổng bình phương của các cấp bậc.

Các giá trị tới hạn của hệ số tương quan xếp hạng Spearman được trình bày dưới đây:

Giá trị của hệ số tương quan tuyến tính Spearman nằm trong khoảng +1 và -1. Hệ số tương quan tuyến tính của Spearman có thể dương hoặc âm, mô tả chiều hướng của mối quan hệ giữa hai đặc điểm được đo trên thang xếp hạng.

Nếu hệ số tương quan về giá trị tuyệt đối gần bằng 1 thì điều này thể hiện mức độ liên kết cao giữa các biến. Vì vậy, cụ thể, khi một biến có tương quan với chính nó thì giá trị của hệ số tương quan sẽ bằng +1. Mối quan hệ như vậy đặc trưng cho sự phụ thuộc tỷ lệ trực tiếp. Nếu các giá trị của biến X được sắp xếp theo thứ tự tăng dần và các giá trị tương tự (hiện được chỉ định là biến Y) được sắp xếp theo thứ tự giảm dần thì trong trường hợp này mối tương quan giữa các biến X và Y sẽ chính xác là - 1. Giá trị này của hệ số tương quan đặc trưng cho mối quan hệ tỷ lệ nghịch.

Dấu của hệ số tương quan rất quan trọng để giải thích mối quan hệ thu được. Nếu dấu của hệ số tương quan tuyến tính là cộng thì mối quan hệ giữa các đặc điểm tương quan sẽ sao cho giá trị lớn hơn của một đặc điểm (biến) tương ứng với giá trị lớn hơn của đặc điểm khác (biến khác). Nói cách khác, nếu một chỉ báo (biến) tăng thì chỉ báo (biến) kia cũng tăng tương ứng. Sự phụ thuộc này được gọi là sự phụ thuộc tỷ lệ trực tiếp.

Nếu nhận được dấu trừ thì giá trị lớn hơn của một đặc tính này sẽ tương ứng với giá trị nhỏ hơn của đặc tính khác. Nói cách khác, nếu có dấu trừ thì một biến tăng (dấu, giá trị) tương ứng với việc giảm một biến khác. Sự phụ thuộc này được gọi là sự phụ thuộc tỷ lệ nghịch. Trong trường hợp này, việc lựa chọn biến để gán đặc tính (xu hướng) tăng là tùy ý. Nó có thể là biến X hoặc biến Y. Tuy nhiên, nếu biến X được coi là tăng thì biến Y sẽ giảm tương ứng và ngược lại.

Hãy xem ví dụ về mối tương quan Spearman.

Nhà tâm lý học tìm hiểu xem các chỉ số cá nhân về mức độ sẵn sàng đi học, đạt được trước khi bắt đầu đi học của 11 học sinh lớp một, có mối liên hệ với nhau như thế nào và thành tích trung bình của các em vào cuối năm học.

Để giải quyết vấn đề này, trước tiên, chúng tôi xếp hạng giá trị trung bình của các chỉ số về mức độ sẵn sàng đi học khi nhập học và thứ hai là các chỉ số cuối cùng về kết quả học tập cuối năm của chính những học sinh này. Chúng tôi trình bày kết quả ở bảng:

Chúng tôi thay thế dữ liệu thu được vào công thức trên và thực hiện phép tính. Chúng tôi nhận được:

Để tìm mức ý nghĩa, chúng ta tham khảo bảng “Các giá trị tới hạn của hệ số tương quan xếp hạng Spearman”, bảng này hiển thị các giá trị tới hạn của các hệ số tương quan xếp hạng.

Chúng ta xây dựng “trục ý nghĩa” tương ứng:

Hệ số tương quan thu được trùng với giá trị tới hạn ở mức ý nghĩa 1%. Do đó, có thể lập luận rằng các chỉ số về mức độ sẵn sàng đi học và điểm cuối kỳ của học sinh lớp một có mối tương quan dương - nói cách khác, chỉ số về mức độ sẵn sàng đi học càng cao thì việc học tập của học sinh lớp một càng tốt. Về mặt giả thuyết thống kê, nhà tâm lý học phải bác bỏ giả thuyết không (H0) về sự tương đồng và chấp nhận giả thuyết thay thế (H1) về sự hiện diện của sự khác biệt, điều này cho thấy mối quan hệ giữa các chỉ số về mức độ sẵn sàng đi học và kết quả học tập trung bình khác 0.

Tương quan Spearman. Phân tích tương quan bằng phương pháp Spearman. Cấp bậc của Spearman. Hệ số tương quan Spearman. Tương quan xếp hạng Spearman

Hệ số tương quan Pearson

hệ số r- Pearson được sử dụng để nghiên cứu mối quan hệ giữa hai biến số đo được đo trên cùng một mẫu. Có nhiều tình huống mà việc sử dụng nó là phù hợp. Trí thông minh có ảnh hưởng đến kết quả học tập ở những năm cuối đại học? Mức lương của một nhân viên có liên quan đến sự thân thiện của anh ta với đồng nghiệp không? Tâm trạng của học sinh có ảnh hưởng đến sự thành công khi giải một bài toán số học phức tạp không? Để trả lời những câu hỏi như vậy, nhà nghiên cứu phải đo lường hai chỉ số quan tâm đối với mỗi thành viên trong mẫu.

Giá trị của hệ số tương quan không bị ảnh hưởng bởi đơn vị đo lường trong đó các đặc tính được trình bày. Do đó, bất kỳ phép biến đổi tuyến tính nào của các đặc trưng (nhân với hằng số, cộng với hằng số) đều không làm thay đổi giá trị của hệ số tương quan. Một ngoại lệ là phép nhân một trong các dấu với hằng số âm: hệ số tương quan thay đổi dấu của nó thành dấu ngược lại.

Ứng dụng tương quan Spearman và Pearson.

Tương quan Pearson là thước đo mối quan hệ tuyến tính giữa hai biến. Nó cho phép bạn xác định mức độ biến thiên của hai biến tỷ lệ như thế nào. Nếu các biến tỷ lệ thuận với nhau thì mối quan hệ giữa chúng có thể được biểu diễn bằng đồ họa dưới dạng đường thẳng có độ dốc dương (tỷ lệ trực tiếp) hoặc âm (tỷ lệ nghịch).

Trong thực tế, mối quan hệ giữa hai biến, nếu có, có tính xác suất và về mặt đồ họa trông giống như một đám mây phân tán hình elip. Tuy nhiên, hình elip này có thể được biểu diễn (gần đúng) dưới dạng đường thẳng hoặc đường hồi quy. Đường hồi quy là một đường thẳng được xây dựng bằng phương pháp bình phương nhỏ nhất: tổng các khoảng cách bình phương (được tính dọc theo trục Y) từ mỗi điểm trên biểu đồ phân tán đến đường thẳng là nhỏ nhất.

Tầm quan trọng đặc biệt để đánh giá tính chính xác của dự đoán là phương sai của các ước tính của biến phụ thuộc. Về cơ bản, phương sai ước lượng của biến phụ thuộc Y là phần phương sai tổng của nó do ảnh hưởng của biến độc lập X. Nói cách khác, tỷ số giữa phương sai ước lượng của biến phụ thuộc và phương sai thực của nó là bằng bình phương của hệ số tương quan.

Bình phương hệ số tương quan giữa biến phụ thuộc và biến độc lập biểu thị tỷ lệ phương sai của biến phụ thuộc do ảnh hưởng của biến độc lập và được gọi là hệ số xác định. Do đó, hệ số xác định cho thấy mức độ biến thiên của một biến được gây ra (được xác định) bởi ảnh hưởng của một biến khác.

Hệ số xác định có lợi thế quan trọng so với hệ số tương quan. Tương quan không phải là một hàm tuyến tính của mối quan hệ giữa hai biến. Do đó, giá trị trung bình số học của các hệ số tương quan đối với một số mẫu không trùng với hệ số tương quan được tính ngay lập tức cho tất cả các đối tượng từ các mẫu này (tức là hệ số tương quan không có tính cộng). Ngược lại, hệ số xác định phản ánh mối quan hệ tuyến tính và do đó có tính cộng: nó có thể được tính trung bình trên một số mẫu.

Thông tin bổ sung về cường độ của kết nối được cung cấp bởi giá trị của bình phương hệ số tương quan - hệ số xác định: đây là phần phương sai của một biến có thể được giải thích do ảnh hưởng của biến khác. Không giống như hệ số tương quan, hệ số xác định tăng tuyến tính khi cường độ kết nối tăng.

Hệ số tương quan Spearman và τ - Kendall ( tương quan xếp hạng )

Nếu cả hai biến mà mối quan hệ đang được nghiên cứu được trình bày theo thang đo thứ tự hoặc một trong số chúng ở thang đo thứ tự và biến còn lại theo thang đo số liệu thì các hệ số tương quan xếp hạng sẽ được sử dụng: Spearman hoặc τ - Kendella. Cả hai hệ số đều yêu cầu xếp hạng sơ bộ của cả hai biến cho ứng dụng của chúng.

Hệ số tương quan xếp hạng của Spearman là một phương pháp phi tham số được sử dụng nhằm mục đích nghiên cứu thống kê mối quan hệ giữa các hiện tượng. Trong trường hợp này, mức độ song song thực tế giữa hai chuỗi định lượng của các đặc điểm được nghiên cứu được xác định và đánh giá mức độ gần gũi của kết nối đã thiết lập được đưa ra bằng cách sử dụng hệ số biểu thị định lượng.

Nếu các thành viên của một nhóm quy mô được xếp hạng đầu tiên theo biến x, sau đó đến biến y, thì mối tương quan giữa biến x và y có thể đạt được một cách đơn giản bằng cách tính hệ số Pearson cho hai chuỗi xếp hạng. Với điều kiện là không có mối quan hệ thứ hạng (tức là không có thứ hạng lặp lại) cho một trong hai biến, công thức Pearson có thể được đơn giản hóa rất nhiều về mặt tính toán và được chuyển đổi thành công thức được gọi là công thức Spearman.

Sức mạnh của hệ số tương quan xếp hạng Spearman có phần kém hơn sức mạnh của hệ số tương quan tham số.

Nên sử dụng hệ số tương quan xếp hạng khi có số lượng quan sát ít. Phương pháp này có thể được sử dụng không chỉ cho dữ liệu định lượng mà còn trong trường hợp các giá trị được ghi được xác định bởi các đặc điểm mô tả có cường độ khác nhau.

Hệ số tương quan xếp hạng của Spearman với một số lượng lớn các cấp bậc giống hệt nhau đối với một hoặc cả hai biến so sánh sẽ cho giá trị thô. Lý tưởng nhất là cả hai chuỗi tương quan phải biểu thị hai chuỗi có giá trị phân kỳ

Một cách thay thế cho mối tương quan Spearman cho cấp bậc là mối tương quan τ - Kendall. Mối tương quan do M. Kendall đề xuất dựa trên ý tưởng rằng hướng của mối liên hệ có thể được đánh giá bằng cách so sánh các đối tượng theo cặp: nếu một cặp đối tượng có sự thay đổi về x trùng với hướng với sự thay đổi về y, thì điều này cho thấy kết nối dương, nếu không khớp - thì về kết nối âm.

Các hệ số tương quan được thiết kế đặc biệt để định lượng cường độ và hướng của mối quan hệ giữa hai thuộc tính được đo trên thang số (hệ mét hoặc thứ hạng). Như đã đề cập, cường độ tối đa của kết nối tương ứng với các giá trị tương quan +1 (kết nối tỷ lệ thuận hoặc trực tiếp nghiêm ngặt) và -1 (kết nối tỷ lệ nghịch hoặc tỷ lệ nghịch nghiêm ngặt khi không có kết nối tương ứng với mối tương quan bằng 0); . Thông tin bổ sung về độ mạnh của mối quan hệ được cung cấp bởi hệ số xác định: đây là phần phương sai của một biến có thể được giải thích do ảnh hưởng của biến khác.

9. Phương pháp tham số để so sánh dữ liệu


Các phương pháp so sánh tham số được sử dụng nếu các biến của bạn được đo theo thang đo số liệu.

So sánh phương sai 2- x mẫu theo phép thử của Fisher .


Phương pháp này cho phép bạn kiểm tra giả thuyết rằng phương sai của 2 tổng thể chung mà các mẫu so sánh được trích xuất là khác nhau. Hạn chế của phương pháp - sự phân bố đặc tính trong cả hai mẫu không được khác biệt so với bình thường.

Một cách khác để so sánh các phương sai là thử nghiệm Levene, không cần phải kiểm tra tính chuẩn của phân phối. Phương pháp này có thể được sử dụng để kiểm tra giả định về sự bằng nhau (tính đồng nhất) của phương sai trước khi kiểm tra tầm quan trọng của sự khác biệt về phương tiện bằng cách sử dụng bài kiểm tra của Học sinh đối với các mẫu độc lập có kích thước khác nhau.

Ngày đăng: 03/09/2017 13:01

Thuật ngữ “tương quan” được sử dụng tích cực trong nhân văn và y học; thường xuyên xuất hiện trên các phương tiện truyền thông. Mối tương quan đóng một vai trò quan trọng trong tâm lý học. Đặc biệt, việc tính toán các mối tương quan là một khâu quan trọng trong việc triển khai nghiên cứu thực nghiệm khi viết luận văn về tâm lý học.

Tài liệu về tương quan trên Internet quá khoa học. Rất khó để một người không chuyên có thể hiểu được các công thức. Đồng thời, việc hiểu ý nghĩa của các mối tương quan là cần thiết đối với một nhà tiếp thị, nhà xã hội học, bác sĩ, nhà tâm lý học - bất kỳ ai tiến hành nghiên cứu về con người.

Trong bài viết này, chúng tôi sẽ giải thích bằng ngôn ngữ đơn giản bản chất của mối tương quan, các loại mối tương quan, phương pháp tính toán, đặc điểm của việc sử dụng mối tương quan trong nghiên cứu tâm lý học, cũng như khi viết luận văn về tâm lý học.

Nội dung

Tương quan là gì

Tương quan là sự kết nối. Nhưng không phải bất kỳ ai. Điểm đặc biệt của nó là gì? Hãy xem một ví dụ.

Hãy tưởng tượng rằng bạn đang lái một chiếc ô tô. Bạn nhấn chân ga và xe chạy nhanh hơn. Bạn giảm ga và xe chạy chậm lại. Ngay cả một người không quen với cấu trúc của ô tô cũng sẽ nói: “Có mối liên hệ trực tiếp giữa bàn đạp ga và tốc độ của ô tô: nhấn bàn đạp càng mạnh thì tốc độ càng cao”.

Đây là mối quan hệ chức năng - tốc độ là chức năng trực tiếp của bàn đạp ga. Chuyên gia sẽ giải thích rằng bàn đạp điều khiển việc cung cấp nhiên liệu cho xi lanh, nơi hỗn hợp được đốt cháy, dẫn đến tăng công suất cho trục, v.v. Kết nối này mang tính cứng nhắc, mang tính quyết định và không cho phép ngoại lệ (với điều kiện máy hoạt động bình thường).

Bây giờ hãy tưởng tượng bạn là giám đốc của một công ty có nhân viên bán sản phẩm. Bạn quyết định tăng doanh thu bằng cách tăng lương cho nhân viên. Bạn tăng lương thêm 10% và doanh thu trung bình của công ty tăng lên. Sau một thời gian, bạn tăng thêm 10% nữa và lại có sự tăng trưởng. Sau đó là 5% nữa, và một lần nữa lại có hiệu lực. Bản thân kết luận đã cho thấy - có mối quan hệ trực tiếp giữa doanh số bán hàng của công ty và lương của nhân viên - lương càng cao thì doanh số bán hàng của tổ chức càng cao. Đây có phải là mối liên hệ giống như giữa bàn đạp ga và tốc độ của ô tô không? Sự khác biệt chính là gì?

Đúng vậy, mối quan hệ giữa tiền lương và doanh số không hề chặt chẽ. Điều này có nghĩa là doanh số bán hàng của một số nhân viên thậm chí có thể giảm dù lương đã tăng. Một số sẽ không thay đổi. Nhưng trung bình, doanh số bán hàng của công ty đã tăng lên và chúng tôi nói rằng có mối liên hệ giữa doanh số bán hàng và lương nhân viên, và nó có mối tương quan với nhau.

Kết nối chức năng (bàn đạp ga - tốc độ) dựa trên quy luật vật lý. Cơ sở của mối quan hệ tương quan (doanh thu - tiền lương) là sự nhất quán đơn giản của những thay đổi ở hai chỉ số. Không có quy luật nào (theo nghĩa vật lý của từ này) đằng sau mối tương quan. Chỉ có một mô hình xác suất (ngẫu nhiên).

Biểu thức số của sự phụ thuộc tương quan

Vì vậy, mối quan hệ tương quan phản ánh sự phụ thuộc giữa các hiện tượng. Nếu những hiện tượng này có thể đo được thì nó sẽ nhận được một biểu thức bằng số.

Ví dụ, vai trò của việc đọc sách trong cuộc sống con người đang được nghiên cứu. Các nhà nghiên cứu lấy một nhóm gồm 40 người và đo hai chỉ số cho mỗi đối tượng: 1) anh ấy đọc bao nhiêu thời gian mỗi tuần; 2) anh ta coi mình thịnh vượng ở mức độ nào (theo thang điểm từ 1 đến 10). Các nhà khoa học đã nhập dữ liệu này vào hai cột và sử dụng chương trình thống kê để tính toán mối tương quan giữa việc đọc và sức khỏe. Giả sử họ nhận được kết quả sau -0,76. Nhưng con số này có ý nghĩa gì? Làm thế nào để giải thích nó? Hãy tìm ra nó.

Số kết quả được gọi là hệ số tương quan. Để giải thích nó một cách chính xác, điều quan trọng là phải xem xét những điều sau:

  1. Dấu “+” hoặc “-” phản ánh hướng của sự phụ thuộc.
  2. Giá trị của hệ số phản ánh độ mạnh của sự phụ thuộc.

Trực tiếp và ngược lại

Dấu cộng phía trước hệ số biểu thị mối quan hệ giữa các hiện tượng hoặc chỉ số là trực tiếp. Nghĩa là, chỉ số này càng lớn thì chỉ số kia càng lớn. Mức lương cao hơn có nghĩa là doanh số bán hàng cao hơn. Mối tương quan này được gọi là trực tiếp hoặc tích cực.

Nếu hệ số có dấu trừ, điều đó có nghĩa là mối tương quan nghịch đảo hoặc âm. Trong trường hợp này, chỉ báo này càng cao thì chỉ báo kia càng thấp. Trong ví dụ về đọc sách và sức khỏe, chúng tôi tìm thấy -0,76, có nghĩa là mọi người càng đọc nhiều thì mức độ hạnh phúc của họ càng thấp.

Mạnh và yếu

Mối tương quan về mặt số học là một số nằm trong khoảng từ -1 đến +1. Ký hiệu bằng chữ "r". Số càng cao (bỏ qua dấu), mối tương quan càng mạnh.

Giá trị số của hệ số càng thấp thì mối quan hệ giữa hiện tượng và chỉ số càng ít.

Cường độ phụ thuộc tối đa có thể là 1 hoặc -1. Làm thế nào để hiểu và trình bày điều này?

Hãy xem một ví dụ. Họ lấy 10 sinh viên và đo mức độ thông minh (IQ) cũng như kết quả học tập của họ trong học kỳ. Sắp xếp dữ liệu này dưới dạng hai cột.

Chủ thể

chỉ số IQ

Kết quả học tập (điểm)

Hãy xem kỹ dữ liệu trong bảng. Từ 1 đến 10, mức IQ của đối tượng thử nghiệm tăng lên. Nhưng mức độ thành tích cũng ngày càng tăng lên. Trong hai học sinh bất kỳ, em nào có chỉ số IQ cao hơn sẽ học tốt hơn. Và sẽ không có ngoại lệ cho quy tắc này.

Dưới đây là ví dụ về sự thay đổi hoàn toàn, nhất quán 100% ở hai chỉ số trong một nhóm. Và đây là một ví dụ về mối quan hệ tích cực nhất có thể có. Nghĩa là mối tương quan giữa trí thông minh và kết quả học tập bằng 1.

Hãy xem một ví dụ khác. 10 sinh viên tương tự được đánh giá bằng một cuộc khảo sát về mức độ họ cảm thấy thành công khi giao tiếp với người khác giới (theo thang điểm từ 1 đến 10).

Chủ thể

chỉ số IQ

Thành công trong giao tiếp với người khác giới (điểm)

Chúng ta hãy xem xét kỹ dữ liệu trong bảng. Từ 1 đến 10, mức IQ của đối tượng thử nghiệm tăng lên. Đồng thời, ở cột cuối cùng, mức độ thành công trong giao tiếp với người khác giới liên tục giảm. Trong hai học sinh bất kỳ, người có chỉ số IQ thấp hơn sẽ thành công hơn trong việc giao tiếp với người khác giới. Và sẽ không có ngoại lệ cho quy tắc này.

Đây là một ví dụ về sự nhất quán hoàn toàn trong những thay đổi của hai chỉ số trong một nhóm - mối quan hệ tiêu cực tối đa có thể có. Mối tương quan giữa IQ và sự thành công trong giao tiếp với người khác giới là -1.

Làm thế nào chúng ta có thể hiểu ý nghĩa của mối tương quan bằng 0 (0)? Điều này có nghĩa là không có kết nối giữa các chỉ số. Chúng ta hãy quay lại với các học sinh của chúng ta một lần nữa và xem xét một chỉ số khác mà các em đo được - độ dài bước nhảy khi đứng của các em.

Chủ thể

chỉ số IQ

Chiều dài nhảy đứng (m)

Không có sự nhất quán nào được quan sát thấy giữa sự khác biệt giữa người này với người khác về chỉ số IQ và chiều dài bước nhảy. Điều này cho thấy sự vắng mặt của mối tương quan. Hệ số tương quan giữa IQ và chiều dài bước nhảy đứng của học sinh là 0.

Chúng tôi đã xem xét các trường hợp khó khăn. Trong các phép đo thực tế, các hệ số hiếm khi chính xác bằng 1 hoặc 0. Thang đo sau được áp dụng:

  • nếu hệ số lớn hơn 0,70 thì mối quan hệ giữa các chỉ số rất chặt chẽ;
  • từ 0,30 đến 0,70 - kết nối vừa phải,
  • dưới 0,30 - mối quan hệ yếu.

Nếu chúng ta đánh giá mối tương quan giữa việc đọc và sức khỏe mà chúng ta thu được ở trên trên thang đo này, thì hóa ra mối quan hệ này rất mạnh và âm -0,76. Nghĩa là, có một mối quan hệ tiêu cực mạnh mẽ giữa việc đọc nhiều và hạnh phúc. Điều này một lần nữa khẳng định sự khôn ngoan trong Kinh thánh về mối quan hệ giữa sự khôn ngoan và nỗi buồn.

Sự phân cấp đã cho đưa ra những ước tính rất sơ bộ và hiếm khi được sử dụng trong nghiên cứu ở dạng này.

Việc phân loại các hệ số theo mức ý nghĩa thường được sử dụng nhiều hơn. Trong trường hợp này, hệ số thực tế thu được có thể có hoặc không có ý nghĩa. Điều này có thể được xác định bằng cách so sánh giá trị của nó với giá trị tới hạn của hệ số tương quan được lấy từ một bảng đặc biệt. Hơn nữa, các giá trị tới hạn này phụ thuộc vào kích thước của mẫu (thể tích càng lớn thì giá trị tới hạn càng thấp).

Phân tích tương quan trong tâm lý học

Phương pháp tương quan là một trong những phương pháp chính trong nghiên cứu tâm lý. Và điều này không phải ngẫu nhiên, bởi vì tâm lý học luôn cố gắng trở thành một môn khoa học chính xác. Nó có hoạt động không?

Đặc điểm của các quy luật trong khoa học chính xác là gì? Ví dụ, định luật hấp dẫn trong vật lý vận hành không có ngoại lệ: khối lượng của một vật thể càng lớn thì nó càng hút các vật thể khác mạnh hơn. Định luật vật lý này phản ánh mối quan hệ giữa khối lượng cơ thể và trọng lực.

Trong tâm lý học, tình hình lại khác. Ví dụ, các nhà tâm lý học công bố dữ liệu về mối liên hệ giữa mối quan hệ nồng ấm thời thơ ấu với cha mẹ và mức độ sáng tạo ở tuổi trưởng thành. Phải chăng điều này có nghĩa là bất kỳ đối tượng nào có mối quan hệ rất nồng ấm với cha mẹ thời thơ ấu sẽ có khả năng sáng tạo rất cao? Câu trả lời rất rõ ràng - không. Không có quy luật nào giống quy luật vật chất. Không có cơ chế nào về ảnh hưởng của trải nghiệm thời thơ ấu đến khả năng sáng tạo của người lớn. Đây là những tưởng tượng của chúng tôi! Có sự nhất quán về dữ liệu (các mối quan hệ - sự sáng tạo), nhưng lại không có luật lệ đằng sau nó. Nhưng chỉ có một mối tương quan. Các nhà tâm lý học thường gọi các mối quan hệ đã được xác định là mô hình tâm lý, nhấn mạnh bản chất xác suất của chúng chứ không phải tính cứng nhắc.

Ví dụ nghiên cứu của sinh viên ở phần trước minh họa rõ ràng việc sử dụng các mối tương quan trong tâm lý học:

  1. Phân tích mối liên hệ giữa các chỉ số tâm lý. Trong ví dụ của chúng tôi, IQ và khả năng giao tiếp với người khác giới là những thông số tâm lý. Xác định mối tương quan giữa chúng sẽ mở rộng sự hiểu biết về tổ chức tinh thần của một người, mối quan hệ giữa các khía cạnh khác nhau trong tính cách của anh ta - trong trường hợp này là giữa trí tuệ và lĩnh vực giao tiếp.
  2. Phân tích mối quan hệ giữa IQ với thành tích học tập và khả năng nhảy là một ví dụ về mối liên hệ giữa thông số tâm lý và phi tâm lý. Kết quả thu được cho thấy những đặc điểm ảnh hưởng của trí thông minh đến hoạt động giáo dục và thể thao.

Đây là bản tóm tắt về nghiên cứu được sắp xếp của sinh viên có thể trông như thế nào:

  1. Một mối quan hệ tích cực đáng kể giữa trí thông minh của học sinh và kết quả học tập của họ đã được tiết lộ.
  2. Có một mối quan hệ tiêu cực giữa IQ và sự thành công trong giao tiếp với người khác giới.
  3. Không có mối liên hệ nào giữa chỉ số IQ của học sinh và khả năng nhảy.

Như vậy, mức độ thông minh của học sinh đóng vai trò là yếu tố tích cực đến kết quả học tập của các em, đồng thời ảnh hưởng tiêu cực đến mối quan hệ với người khác giới và không ảnh hưởng đáng kể đến thành công trong thể thao, đặc biệt là khả năng nhảy.

Như chúng ta thấy, trí thông minh giúp học sinh học tập nhưng lại cản trở các em xây dựng mối quan hệ với người khác giới. Tuy nhiên, điều đó không ảnh hưởng tới thành công thể thao của họ.

Ảnh hưởng không rõ ràng của trí thông minh đến tính cách và hoạt động của học sinh phản ánh sự phức tạp của hiện tượng này trong cấu trúc các đặc điểm cá nhân và tầm quan trọng của việc tiếp tục nghiên cứu theo hướng này. Đặc biệt, điều quan trọng là phải phân tích mối quan hệ giữa trí thông minh với các đặc điểm và hoạt động tâm lý của học sinh, có tính đến giới tính của họ.

Hệ số Pearson và Spearman

Hãy xem xét hai phương pháp tính toán.

Hệ số Pearson là một phương pháp đặc biệt để tính toán mối quan hệ giữa các chỉ số giữa mức độ nghiêm trọng của các giá trị số trong một nhóm. Rất đơn giản, nó tóm tắt như sau:

  1. Giá trị của hai tham số trong một nhóm đối tượng được lấy (ví dụ: sự hung hăng và chủ nghĩa cầu toàn).
  2. Các giá trị trung bình của từng tham số trong nhóm được tìm thấy.
  3. Sự khác biệt giữa các tham số của từng đối tượng và giá trị trung bình được tìm thấy.
  4. Những khác biệt này được thay thế thành một dạng đặc biệt để tính hệ số Pearson.

Hệ số tương quan xếp hạng của Spearman được tính theo cách tương tự:

  1. Các giá trị của hai chỉ số trong nhóm đối tượng được lấy.
  2. Thứ hạng của từng yếu tố trong nhóm được tìm thấy, tức là vị trí trong danh sách theo thứ tự tăng dần.
  3. Sự khác biệt về thứ hạng được tìm thấy, bình phương và tính tổng.
  4. Tiếp theo, sự khác biệt về thứ hạng được thay thế thành một dạng đặc biệt để tính hệ số Spearman.

Trong trường hợp của Pearson, việc tính toán được thực hiện bằng cách sử dụng giá trị trung bình. Do đó, các ngoại lệ ngẫu nhiên trong dữ liệu (sự khác biệt đáng kể so với mức trung bình), ví dụ do lỗi xử lý hoặc phản hồi không đáng tin cậy, có thể làm sai lệch đáng kể kết quả.

Trong trường hợp của Spearman, các giá trị tuyệt đối của dữ liệu không đóng vai trò gì vì chỉ tính đến các vị trí tương đối của chúng trong mối quan hệ với nhau (cấp bậc). Nghĩa là, các dữ liệu ngoại lệ hoặc những điểm không chính xác khác sẽ không có tác động nghiêm trọng đến kết quả cuối cùng.

Nếu kết quả kiểm tra là chính xác thì sự khác biệt giữa hệ số Pearson và Spearman là không đáng kể, trong khi hệ số Pearson cho thấy giá trị chính xác hơn về mối quan hệ giữa dữ liệu.

Cách tính hệ số tương quan

Hệ số Pearson và Spearman có thể được tính toán thủ công. Điều này có thể cần thiết cho nghiên cứu chuyên sâu về các phương pháp thống kê.

Tuy nhiên, trong hầu hết các trường hợp, khi giải các bài toán ứng dụng, kể cả trong tâm lý học, có thể thực hiện các phép tính bằng các chương trình đặc biệt.

Tính toán bằng bảng tính Microsoft Excel

Hãy quay lại ví dụ với học sinh và xem xét dữ liệu về mức độ thông minh cũng như độ dài bước nhảy đứng của họ. Hãy nhập dữ liệu này (hai cột) vào bảng Excel.

Di chuyển con trỏ đến một ô trống, nhấp vào tùy chọn “Chèn chức năng” và chọn “CORREL” từ phần “Thống kê”.

Định dạng của hàm này liên quan đến việc lựa chọn hai mảng dữ liệu: CORREL (mảng 1; mảng"). Chúng tôi đánh dấu cột có chỉ số IQ và độ dài bước nhảy tương ứng.

Bảng tính Excel chỉ thực hiện công thức tính hệ số Pearson.

Tính toán bằng chương trình STATISTICA

Chúng ta nhập dữ liệu về trí thông minh và độ dài bước nhảy vào trường dữ liệu ban đầu. Tiếp theo, chọn tùy chọn “Kiểm tra phi tham số”, “Spearman”. Ta chọn tham số để tính toán và thu được kết quả như sau.


Như bạn có thể thấy, phép tính cho kết quả là 0,024, khác với kết quả Pearson - 0,038, thu được ở trên bằng Excel. Tuy nhiên, sự khác biệt là nhỏ.

Sử dụng phân tích tương quan trong luận án tâm lý học (ví dụ)

Hầu hết các chủ đề của các bài báo đủ điều kiện cuối cùng về tâm lý học (bằng cấp, khóa học, thạc sĩ) liên quan đến việc tiến hành nghiên cứu tương quan (phần còn lại liên quan đến việc xác định sự khác biệt trong các chỉ số tâm lý ở các nhóm khác nhau).

Bản thân thuật ngữ “tương quan” hiếm khi được nghe thấy trong tên của các chủ đề - nó ẩn sau các công thức sau:

  • “Mối quan hệ giữa cảm giác cô đơn chủ quan và khả năng tự hiện thực hóa bản thân ở phụ nữ ở độ tuổi trưởng thành”;
  • “Đặc điểm ảnh hưởng của khả năng phục hồi của người quản lý đến sự thành công trong tương tác của họ với khách hàng trong các tình huống xung đột”;
  • “Các yếu tố cá nhân về khả năng chống chịu căng thẳng của nhân viên Bộ Tình trạng khẩn cấp.”

Vì vậy, các từ “mối quan hệ”, “ảnh hưởng” và “các yếu tố” là những dấu hiệu chắc chắn cho thấy phương pháp phân tích dữ liệu trong nghiên cứu thực nghiệm phải là phân tích tương quan.

Chúng ta hãy xem xét ngắn gọn các giai đoạn thực hiện nó khi viết luận văn tâm lý học về chủ đề: “Mối quan hệ giữa sự lo lắng cá nhân và tính hung hăng ở thanh thiếu niên”.

1. Để tính toán, cần có dữ liệu thô, thường là kết quả kiểm tra của các môn học. Chúng được nhập vào bảng tổng hợp và đặt vào ứng dụng. Bảng này được tổ chức như sau:

  • mỗi dòng chứa dữ liệu cho một chủ đề;
  • mỗi cột chứa các chỉ số trên một thang đo cho tất cả các môn học.

Chủ đề số

Lo lắng về tính cách

Sự hung hăng

2. Cần phải quyết định loại hệ số nào trong hai loại - Pearson hoặc Spearman - sẽ được sử dụng. Chúng tôi xin nhắc bạn rằng Pearson đưa ra kết quả chính xác hơn nhưng nó nhạy cảm với các giá trị ngoại lệ trong dữ liệu. Hệ số Spearman có thể được sử dụng với bất kỳ dữ liệu nào (ngoại trừ thang đo danh nghĩa), đó là lý do tại sao chúng thường được sử dụng nhiều nhất trong các cấp độ tâm lý học.

3. Nhập bảng số liệu thô vào chương trình thống kê.

4. Tính giá trị.



5. Bước tiếp theo là xác định xem mối quan hệ này có quan trọng hay không. Chương trình thống kê đánh dấu các kết quả bằng màu đỏ, có nghĩa là mối tương quan có ý nghĩa thống kê ở mức ý nghĩa 0,05 (đã nêu ở trên).

Tuy nhiên, sẽ rất hữu ích khi biết cách xác định mức độ quan trọng theo cách thủ công. Để làm điều này, bạn sẽ cần một bảng các giá trị tới hạn của Spearman.

Bảng giá trị tới hạn của hệ số Spearman

Mức ý nghĩa thống kê

Số môn học

p=0,05

p=0,01

p=0,001

0,88

0,96

0,99

0,81

0,92

0,97

0,75

0,88

0,95

0,71

0,83

0,93

0,67

0,63

0,77

0,87

0,74

0,85

0,58

0,71

0,82

0,55

0,68

0,53

0,66

0,78

0,51

0,64

0,76

Chúng tôi quan tâm đến mức ý nghĩa 0,05 và cỡ mẫu của chúng tôi là 10 người. Tại điểm giao nhau của những dữ liệu này, chúng ta tìm thấy giá trị tới hạn của Spearman: Rcr=0,63.

Quy tắc là: nếu giá trị Spearman thực nghiệm thu được lớn hơn hoặc bằng giá trị tới hạn thì nó có ý nghĩa thống kê. Trong trường hợp của chúng tôi: Ramp (0,66) > Rcr (0,63), do đó, mối quan hệ giữa tính hung hăng và lo lắng ở nhóm thanh thiếu niên có ý nghĩa thống kê.

5. Trong văn bản luận án, bạn cần chèn dữ liệu vào bảng ở định dạng word chứ không phải bảng từ chương trình thống kê. Dưới bảng chúng tôi mô tả kết quả thu được và giải thích nó.

Bảng 1

Hệ số Spearman về sự gây hấn và lo lắng ở một nhóm thanh thiếu niên

Sự hung hăng

Lo lắng về tính cách

0,665*

* - có ý nghĩa thống kê (p0,05)

Phân tích dữ liệu được trình bày trong Bảng 1 cho thấy có mối quan hệ tích cực có ý nghĩa thống kê giữa sự gây hấn và lo lắng ở thanh thiếu niên. Điều này có nghĩa là mức độ lo lắng cá nhân của thanh thiếu niên càng cao thì mức độ hung hăng của họ càng cao. Kết quả này cho thấy sự gây hấn ở thanh thiếu niên là một trong những cách để giảm bớt lo lắng. Trải qua sự nghi ngờ bản thân và lo lắng do bị đe dọa đến lòng tự trọng, điều này đặc biệt nhạy cảm ở tuổi thiếu niên, thanh thiếu niên thường có hành vi hung hăng, giảm bớt lo lắng một cách không hiệu quả.

6. Có thể nói đến ảnh hưởng khi giải thích các kết nối được không? Chúng ta có thể nói rằng sự lo lắng ảnh hưởng đến tính hung hăng? Nói đúng ra thì không. Ở trên chúng tôi đã chỉ ra rằng mối tương quan giữa các hiện tượng có bản chất xác suất và chỉ phản ánh tính nhất quán của những thay đổi về đặc điểm trong nhóm. Đồng thời, chúng ta không thể nói rằng sự nhất quán này là do hiện tượng này là nguyên nhân của hiện tượng kia và ảnh hưởng đến nó. Nghĩa là, sự hiện diện của mối tương quan giữa các tham số tâm lý không có cơ sở để nói về sự tồn tại của mối quan hệ nhân quả giữa chúng. Tuy nhiên, thực tế cho thấy thuật ngữ “ảnh hưởng” thường được sử dụng khi phân tích kết quả phân tích tương quan.

Máy tính bên dưới tính hệ số tương quan xếp hạng Spearman giữa hai biến ngẫu nhiên. Phần lý thuyết, để không bị phân tâm khỏi máy tính, theo truyền thống được đặt bên dưới nó.

thêm vào nhập_xuất mode_edit xóa bỏ

Thay đổi các biến ngẫu nhiên

mũi tên_trở lênmũi tên_hướng xuống Xmũi tên_trở lênmũi tên_hướng xuống Y
Kích thước trang: 5 10 20 50 100 chevron_left chevron_right

Thay đổi các biến ngẫu nhiên

Nhập dữ liệu Lỗi nhập

Bạn có thể sử dụng một trong các ký hiệu này để phân tách các trường: Tab, ";" hoặc "," Ví dụ: -50,5;-50,5

Nhập Trở lại Hủy bỏ

Phương pháp tính hệ số tương quan xếp hạng Spearman thực ra được mô tả rất đơn giản. Đây là hệ số tương quan Pearson tương tự, chỉ được tính toán không phải cho kết quả đo lường của các biến ngẫu nhiên mà cho kết quả của chúng. giá trị xếp hạng.

Đó là,

Tất cả những gì còn lại là tìm ra giá trị xếp hạng là gì và tại sao tất cả những điều này lại cần thiết.

Nếu các phần tử của chuỗi biến thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần thì thứ hạng phần tử sẽ là số của nó trong chuỗi được sắp xếp này.

Ví dụ: chúng ta có một chuỗi biến thể (17,26,5,14,21). Hãy sắp xếp các phần tử của nó theo thứ tự giảm dần (26,21,17,14,5). 26 có hạng 1, 21 có hạng 2, v.v. Chuỗi biến thể của các giá trị xếp hạng sẽ trông như thế này (3,1,5,4,2).

Nghĩa là, khi tính hệ số Spearman, chuỗi biến thể ban đầu được chuyển thành chuỗi biến thể của các giá trị xếp hạng, sau đó công thức Pearson được áp dụng cho chúng.

Có một sự tinh tế - thứ hạng của các giá trị lặp lại được lấy làm mức trung bình của các thứ hạng. Nghĩa là, đối với hàng (17, 15, 14, 15), hàng giá trị xếp hạng sẽ có dạng (1, 2,5, 4, 2,5), vì phần tử đầu tiên bằng 15 có hạng 2 và phần tử thứ hai có hạng 3, và .

Nếu không có giá trị lặp lại, nghĩa là tất cả các giá trị của chuỗi xếp hạng là các số trong phạm vi từ 1 đến n, công thức Pearson có thể được đơn giản hóa thành

Nhân tiện, công thức này thường được đưa ra dưới dạng công thức tính hệ số Spearman.

Bản chất của quá trình chuyển đổi từ chính các giá trị sang giá trị xếp hạng của chúng là gì?
Vấn đề là bằng cách nghiên cứu mối tương quan của các giá trị xếp hạng, bạn có thể xác định mức độ phụ thuộc của hai biến được mô tả bằng hàm đơn điệu.

Dấu của hệ số cho biết hướng của mối quan hệ giữa các biến. Nếu dấu dương thì giá trị Y có xu hướng tăng khi giá trị X tăng; nếu dấu âm thì giá trị Y có xu hướng giảm khi giá trị X tăng. Nếu hệ số bằng 0 thì không có xu hướng. Nếu hệ số là 1 hoặc -1 thì mối quan hệ giữa X và Y có dạng hàm đơn điệu - nghĩa là khi X tăng thì Y cũng tăng hoặc ngược lại, khi X tăng thì Y giảm.

Nghĩa là, không giống như hệ số tương quan Pearson, chỉ có thể bộc lộ sự phụ thuộc tuyến tính của biến này vào biến khác, hệ số tương quan Spearman có thể bộc lộ sự phụ thuộc đơn điệu khi không phát hiện được mối quan hệ tuyến tính trực tiếp.

Hãy để tôi giải thích bằng một ví dụ. Giả sử chúng ta đang kiểm tra hàm y=10/x.
Chúng tôi có các phép đo X và Y sau đây
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Đối với những dữ liệu này, hệ số tương quan Pearson là -0,4686, nghĩa là mối quan hệ yếu hoặc không có. Nhưng hệ số tương quan Spearman hoàn toàn bằng -1, điều này dường như gợi ý cho nhà nghiên cứu rằng Y có sự phụ thuộc đơn điệu âm hoàn toàn vào X.