Các phương pháp tham số và phi tham số để kiểm tra các giả thuyết thống kê.

Tất cả các phương pháp thống kê tham số đều hoạt động với thang đo khoảng, trái ngược với các phương pháp phi tham số, tập trung chủ yếu vào hai thang đo đầu tiên. Hãy để chúng tôi giải thích sự khác biệt giữa các phương pháp này.

Khi xem xét hầu hết các phương pháp thống kê, người ta giả định rằng các quan sát được đề cập được biểu thị theo thang khoảng và là sự thể hiện của một biến ngẫu nhiên có phân phối thuộc về một số họ phân phối tham số. Ví dụ: một biến ngẫu nhiên có phân phối chuẩn hoặc Poisson hoặc phân phối khác. Nghĩa là, chúng ta giả sử rằng hình dạng của phân bố đã biết, ví dụ, chúng ta có thể giả định phân phối chuẩn N (μ, δ ), nhưng với các tham số chưa biết μ δ . Các phương pháp ước tính và kiểm tra giả thuyết cho phép chúng ta rút ra kết luận về các tham số chưa biết và giá trị của bất kỳ kết luận nào phải phụ thuộc ở một mức độ nào đó vào tính thỏa đáng của giả định ban đầu về họ tham số, nghĩa là về hình dạng của phân bố. Tuy nhiên, có những biến ngẫu nhiên không tuân theo một trong các dạng phân phối chung. Do đó, các phương pháp toán học được phát triển cho phân bố tham số không thể áp dụng được cho chúng. Do đó, các mô hình toán học đặc biệt đã được phát triển cho các đặc điểm như vậy, được gọi là không tham số hoặc không phân phối.

Vì vậy, có thể phân biệt hai nhóm phương pháp thống kê: tham số và phi tham số.

Ưu điểm của phương pháp tham số là có một bộ máy toán học được phát triển tốt cho chúng. Tuy nhiên, việc sử dụng các phương pháp này đòi hỏi cỡ mẫu lớn. Phương pháp tham số được sử dụng cho các đặc tính định lượng.

Để phân tích các biến danh nghĩa và xếp hạng, chỉ sử dụng các phương pháp phi tham số không yêu cầu các giả định sơ bộ về loại phân phối ban đầu. Đây là phẩm giá của họ. Nhưng cũng có một nhược điểm - cái gọi là giảm. sức mạnh (độ nhạy cảm với sự khác biệt trong các đối tượng). Hãy giải thích điều này.

Chúng ta hãy nhớ lại rằng trước khi bắt đầu phân tích kết quả thí nghiệm, nhà nghiên cứu đưa ra hai giả thuyết loại trừ lẫn nhau. Một trong số đó là giả thuyết thống kê mà nhà nghiên cứu thường mong muốn bác bỏ (cái gọi là giả thuyết không H 0: ví dụ: các giống nghiên cứu không khác nhau về năng suất). Giả thuyết thay thế ( H 1) thực sự bác bỏ giả thuyết không. Một giả thuyết thay thế thường chứa các giả định do nhà nghiên cứu đưa ra (có những khác biệt).

Có hai loại lỗi thống kê trong phân tích. Lỗi loại thứ nhất (lỗi α – loại): giả thuyết không, thực tế là đúng, bị bác bỏ. Lỗi loại thứ hai (lỗi β – type): chúng tôi chấp nhận giả thuyết khống, giả thuyết này thực sự sai.

Sức mạnh hoặc độ nhạy của một tiêu chí (phương pháp) thống kê là xác suất mà quyết định đúng sẽ được đưa ra nhờ áp dụng nó ( H 1) theo giả thuyết không thực sự sai. Sức mạnh của thử nghiệm phụ thuộc vào cỡ mẫu, mức ý nghĩa, hướng của các giả thuyết không và giả thuyết thay thế, độ tin cậy của dữ liệu thực nghiệm, công cụ và phương pháp thống kê. Trong các điều kiện như nhau, các phương pháp tham số mạnh hơn các phương pháp không tham số. Nhưng sức mạnh của các phương pháp phi tham số tăng lên khi kích thước mẫu tăng lên.

Mỗi loại thang đo có kỹ thuật thống kê riêng. Đối với thang đo danh nghĩa, phép thử χ 2 (chi-square) thường được sử dụng. Đối với thang đo thứ tự - thống kê xếp hạng. Đối với thang đo khoảng - toàn bộ kho tiêu chí thống kê.

Các thuật toán và ví dụ về tính toán tiêu chí phi tham số.

Khi bắt đầu xử lý thống kê nghiên cứu của mình, nhà tâm lý học phải quyết định phương pháp nào phù hợp hơn với mình dựa trên đặc điểm của tài liệu - tham số hoặc phi tham số. Sự khác biệt giữa chúng là dễ hiểu.

Chúng ta đã nói về việc đo tốc độ động cơ của học sinh lớp sáu.

Làm thế nào để xử lý dữ liệu này?

Cần phải ghi lại tất cả các phép đo đã thực hiện - trong trường hợp này, đây sẽ là số điểm mà mỗi môn học đặt ra - sau đó tính giá trị trung bình số học cho từng môn học dựa trên kết quả của môn đó. Sau đó, sắp xếp tất cả dữ liệu theo trình tự của chúng, chẳng hạn như bắt đầu từ nhỏ nhất đến lớn nhất. Để tạo điều kiện thuận lợi cho việc hiển thị dữ liệu này, chúng thường được kết hợp thành các nhóm; trong trường hợp này, bạn có thể kết hợp 5-9 phép đo trong một nhóm. Nói chung, với sự kết hợp như vậy, điều mong muốn là nếu tổng số trường hợp không vượt quá một trăm thì tổng số nhóm sẽ vào khoảng mười hai.

Tiếp theo, bạn cần xác định số lần gặp phải các giá trị số tương ứng với từng nhóm trong các thử nghiệm. Sau khi thực hiện việc này, mỗi nhóm hãy viết ra kích thước của mình. Dữ liệu thu được trong bảng như vậy được gọi là phân bố số hoặc tần số. Nên trình bày phân phối này dưới dạng sơ đồ mô tả đa giác phân phối hoặc biểu đồ phân phối. Các đường nét của đa giác này sẽ giúp giải quyết vấn đề về phương pháp xử lý thống kê.

Thông thường những đường viền này giống với đường viền của một chiếc chuông, với điểm cao nhất ở trung tâm của đa giác và có các nhánh đối xứng kéo dài theo một trong hai hướng. Đường viền này tương ứng với đường cong phân phối chuẩn. Khái niệm này được K. F. Gauss (1777-1855 đưa vào thống kê toán học) nên đường cong còn được gọi là đường cong Gaussian. Ông cũng đưa ra một mô tả toán học về đường cong này. Về mặt lý thuyết, việc vẽ một đường cong Gaussian (hoặc đường cong hình chuông) đòi hỏi vô số trường hợp. Trong thực tế, người ta phải hài lòng với những tài liệu thực tế đã được tích lũy trong quá trình nghiên cứu. Nếu dữ liệu có sẵn cho nhà nghiên cứu, sau khi kiểm tra cẩn thận hoặc sau khi chuyển chúng sang sơ đồ, chỉ khác một chút so với đường cong phân phối chuẩn, thì điều này mang lại cho nhà nghiên cứu quyền sử dụng các phương pháp tham số trong xử lý thống kê, điểm khởi đầu của chúng dựa trên trên đường cong phân phối Gaussian chuẩn.

Phân phối chuẩn được gọi là tham số vì để xây dựng và phân tích đường cong Gauss chỉ cần có hai tham số: giá trị trung bình, phải tương ứng với chiều cao của đường vuông góc được khôi phục tại tâm của đường cong và cái gọi là giá trị trung bình. bình phương hoặc độ lệch chuẩn của giá trị đặc trưng cho sự phân tán của các giá trị xung quanh giá trị trung bình; Các phương pháp tính toán cả hai đại lượng sẽ được thảo luận dưới đây.

Các phương pháp tham số có nhiều ưu điểm cho nhà nghiên cứu, nhưng chúng ta không được quên rằng việc sử dụng chúng chỉ hợp lý khi dữ liệu đã xử lý cho thấy một phân bố chỉ khác biệt không đáng kể so với phân bố Gaussian.

Nếu không thể áp dụng tham số, bạn nên liên hệ phương pháp phi tham số. Những phương pháp này đã được phát triển thành công trong 3-4 thập kỷ qua và sự phát triển của chúng chủ yếu là do nhu cầu của một số ngành khoa học, đặc biệt là tâm lý học. Họ đã cho thấy hiệu quả cao của mình. Tuy nhiên, chúng không yêu cầu công việc tính toán phức tạp.

Nhà nghiên cứu tâm lý hiện đại phải xuất phát từ thực tế là “... có một lượng lớn dữ liệu hoàn toàn không thể phân tích được bằng cách sử dụng đường cong hình chuông hoặc không đáp ứng các điều kiện tiên quyết cơ bản cần thiết cho việc sử dụng nó.”

Dân sốvật mẫu. Nhà tâm lý học liên tục phải giải quyết hai khái niệm này.

Trong nghiên cứu hiện đại về các vấn đề sư phạm, các phương pháp xử lý dữ liệu toán học được sử dụng rộng rãi. Các phương pháp xử lý dữ liệu định lượng bao gồm các kỹ thuật thống kê để tổng hợp kết quả nghiên cứu, xác định các mối liên hệ nhất định giữa chúng và kiểm tra độ tin cậy của giả thuyết đưa ra.

Việc xử lý toán học các kết quả nghiên cứu đảm bảo bằng chứng và tính đại diện của chúng. Kết hợp với các chỉ số định tính, việc xử lý dữ liệu định lượng làm tăng đáng kể tính khách quan của nghiên cứu. Việc xử lý thống kê các kết quả, ghi lại việc nghiên cứu các hiện tượng riêng lẻ cho phép người ta đưa ra những khái quát và kết luận về toàn bộ tập hợp các hiện tượng đang được nghiên cứu. Một đặc điểm quan trọng của việc sử dụng phương pháp thống kê trong nghiên cứu sư phạm là nó cho phép sử dụng nghiên cứu định lượng ngay cả khi không thể xác định chính đặc điểm của đối tượng đang nghiên cứu. Ví dụ, không thể đo lường trực tiếp mức độ phát triển phẩm chất đạo đức của học sinh, mức độ hiệu quả của một phương pháp dạy học cụ thể, v.v. Nhưng bằng cách ghi lại các sự kiện, hành động, biểu hiện có liên quan, có thể thu được những đặc điểm định tính nhất định của tất cả những dấu hiệu này, xác định các mô hình biểu hiện có thể có của chúng và xác nhận tính đúng đắn của các giả thuyết được đưa ra.

Trong thống kê, việc kiểm tra giả thuyết được thực hiện bằng cách sử dụng các tiêu chí đánh giá tĩnh về sự khác biệt. Tiêu chí thống kê là quy tắc mang tính quyết định đảm bảo hành vi đáng tin cậy, tức là chấp nhận một giả thuyết đúng và bác bỏ giả thuyết sai với xác suất cao (G.V. Sukhodolsky). Tiêu chí thống kê cũng biểu thị phương pháp tính một số nhất định và chính số đó.

Các tiêu chí thống kê được sử dụng trong sư phạm được chia thành tham số và phi tham số. Tiêu chí tham số bao gồm các tiêu chí bao gồm các tham số phân phối trong công thức tính toán, tức là. giá trị trung bình và phương sai (Student, Fisher, Chi-square test). Tiêu chí phi tham số bao gồm các tiêu chí dựa trên hoạt động với tần số hoặc cấp bậc và không bao gồm các tham số phân phối trong công thức tính toán các tham số phân phối (kiểm tra dấu hiệu, Kolmogorov-Smirnov, Wilcoxon, Mann-Whitney). Cả hai nhóm tiêu chí đều có ưu điểm và nhược điểm. Một mô tả so sánh về khả năng và hạn chế của tiêu chí tham số và phi tham số được đưa ra trong bảng sau.



Tiêu chí tham số Kiểm tra phi tham số
Cho phép đánh giá trực tiếp sự khác biệt về giá trị trung bình thu được trong hai mẫu (Bài kiểm tra t của sinh viên) Cho phép bạn chỉ đánh giá các xu hướng trung bình (ví dụ: để trả lời câu hỏi liệu các giá trị cao hơn của một đặc tính có phổ biến hơn trong mẫu A hay không và các giá trị thấp hơn của một đặc tính có được tìm thấy trong mẫu B hay không (tiêu chí Q, U, v.v.) .)
Cho phép đánh giá trực tiếp sự khác biệt về phương sai (thử nghiệm Fisher) Cho phép bạn chỉ đánh giá sự khác biệt trong phạm vi biến đổi của một đặc điểm
Cho phép xác định xu hướng thay đổi của một đặc điểm khi chuyển từ điều kiện này sang điều kiện khác (phân tích phương sai đơn biến), nhưng chỉ trong điều kiện phân bố chuẩn của đặc điểm đó Cho phép bạn xác định xu hướng thay đổi của một đặc tính khi chuyển từ điều kiện này sang điều kiện khác đối với bất kỳ phân bố nào của đặc tính đó (tiêu chí cho xu hướng L và S)
Cho phép bạn đánh giá sự tương tác của hai hoặc nhiều yếu tố về mức độ ảnh hưởng của chúng đối với những thay đổi về một đặc điểm (phân tích phương sai hai yếu tố) Tính năng này không có sẵn
Dữ liệu thực nghiệm phải đáp ứng hai và đôi khi ba điều kiện: a) các giá trị của đặc tính được đo theo thang đo khoảng; b) sự phân bố của đặc tính là chuẩn; c) trong phân tích phương sai, phải đáp ứng yêu cầu về sự bằng nhau của các phương sai trong các ô của phức hợp Dữ liệu thử nghiệm có thể không đáp ứng bất kỳ điều kiện nào: a) các giá trị thuộc tính có thể được trình bày theo bất kỳ thang đo nào, bắt đầu từ thang đo tên; b) sự phân bố của đặc tính có thể là bất kỳ và sự trùng hợp của nó với bất kỳ quy luật phân bố lý thuyết nào là không cần thiết và không cần phải xác minh; c) không có yêu cầu về sự bằng nhau của phương sai
Nếu đáp ứng các điều kiện đã chỉ định, tiêu chí tham số sẽ mạnh hơn so với tiêu chí không tham số Nếu các điều kiện đã chỉ định không được đáp ứng, tiêu chí phi tham số sẽ đáng tin cậy hơn, bởi vì chúng ít nhạy cảm hơn với việc “tắc nghẽn”
Toán học khá phức tạp Các phép tính toán học hầu hết đều đơn giản và mất ít thời gian

Phương pháp tham số

Bài kiểm tra t của sinh viên

Để so sánh các giá trị trung bình mẫu thuộc hai bộ dữ liệu và để quyết định xem các giá trị trung bình có khác biệt có ý nghĩa thống kê với nhau trong các thí nghiệm tâm lý và sư phạm hay không, người ta thường sử dụng t- Tiêu chí sinh viên, giá trị tính toán được xác định theo công thức:

,

đâu là giá trị mẫu trung bình của biến đối với một mẫu dữ liệu; ‑giá trị mẫu trung bình dựa trên mẫu dữ liệu khác; tôi 1m 2 - các chỉ số tích hợp về độ lệch của các giá trị từng phần từ hai mẫu so với giá trị trung bình tương ứng của chúng.

Nếu như t phép tính lớn hơn hoặc bằng bảng thì họ kết luận rằng các giá trị trung bình so sánh từ hai mẫu thực sự khác biệt có ý nghĩa thống kê với xác suất xảy ra sai số có thể chấp nhận được.

Kỹ thuật này được sử dụng khi cần thiết để xác định xem một thử nghiệm đã thành công hay thất bại, liệu nó có tác động hay không đến mức chất lượng mà nó dự định thay đổi.

Nếu như tước tính ít hơn t dạng bảng, thì trong trường hợp này không có lý do thuyết phục nào cho thấy thử nghiệm thành công, ngay cả khi bản thân các giá trị trung bình ở đầu và khi kết thúc thử nghiệm khác nhau về giá trị tuyệt đối.

Tiêu chíφ* - Biến đổi góc Fisher

Phương pháp này được mô tả trong nhiều sách hướng dẫn (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992, v.v.). Mô tả này dựa trên phiên bản của phương pháp được E.V. Gubler.

Thử nghiệm Fisher được thiết kế để so sánh hai mẫu theo tần suất xuất hiện tác động mà nhà nghiên cứu quan tâm. Tiêu chí này đánh giá độ tin cậy của sự khác biệt giữa tỷ lệ phần trăm của hai mẫu trong đó tác động đến sự quan tâm của nhà nghiên cứu được ghi lại.

Bản chất của phép biến đổi góc Fisher là chuyển đổi tỷ lệ phần trăm thành giá trị góc ở tâm, được đo bằng radian. Tỷ lệ phần trăm lớn hơn sẽ tương ứng với góc φ lớn hơn và tỷ lệ phần trăm nhỏ hơn sẽ tương ứng với góc nhỏ hơn, nhưng các mối quan hệ ở đây không phải là tuyến tính:

φ = 2 arcsin(),

ở đâu là tỷ lệ phần trăm được biểu thị bằng phân số của một đơn vị.

Khi sự khác biệt giữa các góc φ 1 và φ 2 tăng lên và số lượng mẫu tăng lên thì giá trị của tiêu chí cũng tăng lên. Giá trị φ* càng lớn thì càng có nhiều khả năng sự khác biệt là đáng kể.

2.1. Khái niệm cơ bản

Các phương pháp tham số để xử lý dữ liệu thực nghiệm dựa trên thực tế cơ bản, theo đó các đặc tính của kết quả nghiên cứu thực nghiệm, được coi là đối tượng ngẫu nhiên, được mô tả bởi một số luật phân phối. Người ta giả định rằng việc phân tích dữ liệu thực nghiệm có thể xác định với mức độ chính xác vừa đủ về loại và dạng cụ thể của luật phân phối hoặc các giá trị của các tham số của nó, nếu không cần sử dụng chính luật đó. Thông tin như vậy cho phép sử dụng đầy đủ các phương pháp của lý thuyết xác suất để giải quyết các vấn đề xử lý.

Do luật phân phối thực tế và các giá trị của các tham số của nó chưa được biết nên các phương pháp tham số hoạt động với các giá trị gần đúng của chúng - luật phân phối thống kê và ước tính các tham số phân phối.

Luật thống kê phân phối của một biến ngẫu nhiên được gọi là quy luật phân phối của một đại lượng nhất định, được thiết lập bằng các phương pháp xử lý dữ liệu thống kê.

Luật phân phối thống kê có thể được định nghĩa là hàm phân phối thống kê, mật độ phân phối thống kê hoặc chuỗi phân phối thống kê P * (x tôi), .

Ước lượng thống kê các tham số của luật phân phối biến ngẫu nhiên là các giá trị gần đúng của các tham số (thống kê) này, thu được bằng các phương pháp xử lý dữ liệu thống kê.

Trong phần tiếp theo, ước tính thống kê được gọi đơn giản là ước tính ngắn gọn.

Nếu một số luật phân phối được đặc trưng bởi các tham số Một 1 , Một 2 ,…, , thì ước lượng của chúng sẽ được ký hiệu dưới dạng , ,…,. Các loại tham số phổ biến nhất của luật phân phối khi xử lý dữ liệu thực nghiệm là kỳ vọng toán học, độ phân tán hoặc độ lệch chuẩn và đối với hệ thống các biến ngẫu nhiên - mômen tương quan hoặc hệ số tương quan. Đôi khi các khoảnh khắc trung tâm cấp ba và thứ tư được sử dụng. Theo đó, khi xử lý dữ liệu, các chất tương tự thống kê của chúng được sử dụng - ước tính kỳ vọng toán học, thời điểm tương quan, v.v.

Vì vậy, nếu có một tập dữ liệu thực nghiệm x 1 , x 2 ,…, x n, thì cả luật phân phối thống kê, ví dụ như hàm và ước tính các tham số của nó đều biểu thị một số hàm của những dữ liệu này:

, . (2.1.2)

Loại thống kê y và fj quyết định chất lượng của các đánh giá và . Về vấn đề này, một số vấn đề nảy sinh, trong đó vấn đề chính là vấn đề xác định các điều kiện theo đó các ước lượng (2.1.1) và (2.1.2) có thể biểu diễn các luật phân bố lý thuyết và các tham số của chúng với độ tin cậy cần thiết. Những điều kiện này được hình thành định lý giới hạn lý thuyết xác suất. Chúng đóng vai trò là nền tảng của các phương pháp tham số để xử lý dữ liệu thực nghiệm, trên cơ sở đó có thể thu được các ước tính phù hợp về các quy luật và thông số phân bố của các đặc tính quan sát được.

Vấn đề thứ hai là lựa chọn đủ số liệu thống kê, tức là những thống kê như vậy cho phép, trong những điều kiện cụ thể, có được ước tính về chất lượng nhất định. Vì dựa trên kết quả quan sát x 1 , x 2 ,…, x n một phổ lớn các số liệu thống kê (2.1.1) và (2.1.2) có thể được hình thành. Vấn đề này bắt nguồn từ việc lựa chọn từ chúng những số liệu thống kê tối ưu theo một nghĩa nào đó; Vấn đề được giải quyết bằng cách sử dụng các phương pháp của lý thuyết quyết định thống kê.

Như có thể thấy trên hình 1.1, vấn đề ra quyết định khi xử lý dữ liệu thực nghiệm không chỉ là vấn đề chọn số liệu thống kê đầy đủ. Hầu hết các nhiệm vụ xử lý dữ liệu, ở các mức độ khác nhau, có thể được phân loại là nhiệm vụ ra quyết định. Liên quan đến vấn đề này, nền tảng của các phương pháp xử lý tham số cũng là các nguyên tắc ra quyết định thống kê, trên cơ sở đó hình thành các tiêu chí đưa ra quyết định tối ưu theo một nghĩa nào đó. Một vai trò đặc biệt trong số các nguyên tắc này được thực hiện bởi nguyên tắc khả năng tối đa và phương pháp bình phương tối thiểu, theo sau nó đối với trường hợp luật phân phối chuẩn.

Tài liệu này thảo luận về các vấn đề xử lý tham số của dữ liệu thực nghiệm.

2.2. Định lý giới hạn của lý thuyết xác suất

Việc sử dụng các phương pháp tham số trong xử lý dữ liệu liên quan đến việc xác định các điều kiện xác định tính hợp lệ của các giả định tiên nghiệm về dạng luật phân phối của biến ngẫu nhiên đang được nghiên cứu và các tính chất của các tham số của nó. Những điều kiện này được xây dựng dưới dạng định lý giới hạn trong lý thuyết xác suất. Dưới đây chúng tôi phác thảo nội dung và bản chất của các định lý không cần chứng minh, cũng như một số khuyến nghị cho ứng dụng thực tế của chúng.