Bài kiểm tra T của sinh viên cho công thức mẫu độc lập. Phân phối t-test của sinh viên để kiểm tra giả thuyết về giá trị trung bình và tính khoảng tin cậy trong MS Excel

Một cách tiếp cận tương đương để diễn giải kết quả kiểm tra là giả định rằng giả thuyết không là đúng, chúng ta có thể tính toán mức độ lớn của xác suất lấy t- tiêu chí bằng hoặc lớn hơn giá trị thực mà chúng tôi đã tính toán từ dữ liệu mẫu có sẵn. Nếu xác suất này hóa ra nhỏ hơn mức ý nghĩa được chấp nhận trước đó (ví dụ: P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Giả sử chúng ta có dữ liệu về năng lượng tiêu thụ hàng ngày từ thức ăn (kJ/ngày) của 11 phụ nữ (ví dụ lấy từ cuốn sách Altman D. G. (1981) Thống kê thực hành cho nghiên cứu y học, Chapman & Hall, London):


Giá trị trung bình của 11 quan sát này là:


Câu hỏi: Mức trung bình của mẫu này có khác với định mức đã được thiết lập là 7725 kJ/ngày không? Sự khác biệt giữa giá trị mẫu của chúng tôi và tiêu chuẩn này là khá đáng kể: 7725 - 6753,6 = 971,4. Nhưng sự khác biệt này lớn đến mức nào về mặt thống kê? Một mẫu duy nhất sẽ giúp trả lời câu hỏi này. t-Bài kiểm tra. Giống như các lựa chọn khác t-test, thử nghiệm t một mẫu được thực hiện trong R bằng cách sử dụng hàm t.test():


Câu hỏi: Những giá trị trung bình này có khác nhau về mặt thống kê không? Hãy kiểm tra giả thuyết rằng không có sự khác biệt bằng cách sử dụng t-Bài kiểm tra:

Nhưng trong những trường hợp như vậy, làm thế nào chúng ta có thể đánh giá sự hiện diện của tác động từ một biện pháp can thiệp bằng thống kê? Nói chung, bài kiểm tra t của Học sinh có thể được biểu diễn dưới dạng

Phương pháp này cho phép bạn kiểm tra giả thuyết rằng các giá trị trung bình của hai quần thể chung mà từ đó các quần thể so sánh được trích xuất sự phụ thuộc sự lựa chọn khác nhau. Giả định về sự phụ thuộc thường có nghĩa là đặc điểm đó được đo lường trên cùng một mẫu hai lần, chẳng hạn như trước và sau can thiệp. Trong trường hợp chung, mỗi đại diện của một mẫu được gán một đại diện từ một mẫu khác (chúng được kết hợp theo cặp) sao cho hai chuỗi dữ liệu có mối tương quan thuận với nhau. Loại phụ thuộc mẫu yếu hơn: mẫu 1 - chồng, mẫu 2 - vợ của họ; mẫu 1 - trẻ một tuổi, mẫu 2 gồm các trẻ sinh đôi ở mẫu 1, v.v.

Giả thuyết thống kê có thể kiểm chứng được, như trong trường hợp trước, H 0: M1 = M2(giá trị trung bình ở mẫu 1 và 2 bằng nhau). Nếu nó bị bác bỏ, giả thuyết thay thế được chấp nhận rằng M 1 nhiều hơn (ít hơn) M 2.

Giả định ban đầuđể kiểm tra thống kê:

Mỗi đại diện của một mẫu (từ một tổng thể chung) được liên kết với một đại diện của một mẫu khác (từ một tổng thể khác);

Dữ liệu từ hai mẫu có mối tương quan dương (cặp mẫu);

Sự phân bố của đặc tính nghiên cứu trong cả hai mẫu đều tuân theo quy luật chuẩn tắc.

Cấu trúc dữ liệu nguồn: có hai giá trị của đặc điểm được nghiên cứu cho từng đối tượng (cho mỗi cặp).

Hạn chế: sự phân bố đặc tính trong cả hai mẫu không được khác biệt đáng kể so với bình thường; dữ liệu của hai phép đo tương ứng với mẫu này và mẫu kia có mối tương quan dương.

Các lựa chọn thay thế: Thử nghiệm Wilcoxon T, nếu phân bố của ít nhất một mẫu khác biệt đáng kể so với bình thường; t-Bài kiểm tra của học sinh đối với các mẫu độc lập - nếu dữ liệu của hai mẫu không tương quan dương.

Công thức vì giá trị thực nghiệm của bài kiểm tra t của Sinh viên phản ánh thực tế rằng đơn vị phân tích sự khác biệt là sự khác biệt (sự thay đổi) giá trị thuộc tính cho từng cặp quan sát. Theo đó, đối với mỗi N cặp giá trị thuộc tính, độ chênh lệch được tính trước tiên d tôi = x 1 tôi - x 2 tôi.

trong đó M d là chênh lệch trung bình của các giá trị; σ d - độ lệch chuẩn của chênh lệch.

Ví dụ tính toán:

Giả sử rằng trong quá trình kiểm tra tính hiệu quả của việc đào tạo, mỗi người trong số 8 thành viên của nhóm được hỏi câu hỏi “Ý kiến ​​của bạn có thường trùng khớp với ý kiến ​​của nhóm không?” - hai lần, trước và sau đào tạo. Thang điểm 10 được sử dụng cho các câu trả lời: 1 - không bao giờ, 5 - một nửa thời gian, 10 - luôn luôn. Giả thuyết đã được kiểm tra là kết quả của quá trình đào tạo, lòng tự trọng về sự tuân thủ (mong muốn được giống những người khác trong nhóm) của những người tham gia sẽ tăng lên (α = 0,05). Hãy tạo một bảng để tính toán trung gian (Bảng 3).


Bảng 3

Giá trị trung bình số học của chênh lệch M d = (-6)/8 = -0,75. Trừ giá trị này khỏi mỗi d (cột áp chót của bảng).

Công thức tính độ lệch chuẩn chỉ khác ở chỗ d xuất hiện trong đó thay vì X. Chúng tôi thay thế tất cả các giá trị cần thiết, chúng tôi nhận được:

σ d = = 0,886.

Bước 1. Tính giá trị thực nghiệm của chỉ tiêu theo công thức (3): sai phân trung bình Md= -0,75; độ lệch chuẩn σ d = 0,886; t e = 2,39; df = 7.

Bước 2. Sử dụng bảng giá trị tới hạn của tiêu chí t-Student, chúng ta xác định mức ý nghĩa p. Vì df = 7 giá trị thực nghiệm nằm giữa các giá trị tới hạn đối với r= 0,05 và P - 0,01. Kể từ đây, r< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Bước 3. Chúng tôi đưa ra quyết định thống kê và đưa ra kết luận. Giả thuyết thống kê về sự bằng nhau của các giá trị trung bình bị bác bỏ. Kết luận: chỉ số tự đánh giá sự phù hợp của học viên sau đào tạo tăng có ý nghĩa thống kê (ở mức ý nghĩa p< 0,05).

Các phương pháp tham số bao gồm so sánh phương sai của hai mẫu theo tiêu chí F-Fisher. Đôi khi phương pháp này đưa đến những kết luận có giá trị và có ý nghĩa, và trong trường hợp so sánh các giá trị trung bình của các mẫu độc lập, việc so sánh phương sai được thực hiện bắt buộc thủ tục.

Để tính toán F em bạn cần tìm tỷ lệ phương sai của hai mẫu và sao cho phương sai lớn hơn nằm ở tử số và phương sai nhỏ hơn nằm ở mẫu số.

So sánh phương sai. Phương pháp này cho phép bạn kiểm tra giả thuyết rằng phương sai của hai tổng thể chung mà từ đó các mẫu so sánh được rút ra là khác nhau. Kiểm định giả thuyết thống kê H 0: σ 1 2 = σ 2 2 (phương sai ở mẫu 1 bằng phương sai ở mẫu 2). Nếu nó bị bác bỏ, giả thuyết thay thế được chấp nhận là phương sai này lớn hơn phương sai kia.

Giả định ban đầu: hai mẫu được lấy ngẫu nhiên từ các quần thể khác nhau có phân bố chuẩn của đặc tính đang được nghiên cứu.

Cấu trúc dữ liệu nguồn:đặc tính đang nghiên cứu được đo ở các đối tượng (chủ thể), mỗi đối tượng thuộc một trong hai mẫu được so sánh.

Hạn chế: sự phân bố tính trạng trong cả hai mẫu không khác biệt đáng kể so với bình thường.

Phương pháp thay thế: Thử nghiệm Levene, việc sử dụng thử nghiệm này không yêu cầu kiểm tra giả định về tính quy tắc (được sử dụng trong chương trình SPSS).

Công thức về giá trị thực nghiệm của phép thử Fisher's F:

(4)

ở đâu σ 1 2 độ phân tán lớn, và σ 2 2 - độ phân tán nhỏ hơn. Vì không biết trước độ phân tán nào lớn hơn nên người ta sử dụng để xác định mức p Bảng các giá trị quan trọng cho các lựa chọn thay thế không định hướng. Nếu như F e > F Kp với số bậc tự do tương ứng thì r< 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Ví dụ tính toán:

Những đứa trẻ được giao các bài toán số học thông thường, sau đó một nửa số học sinh được chọn ngẫu nhiên được thông báo rằng chúng đã trượt bài kiểm tra, và số còn lại được thông báo ngược lại. Sau đó, mỗi đứa trẻ được hỏi chúng sẽ mất bao nhiêu giây để giải quyết một vấn đề tương tự. Người làm thí nghiệm đã tính toán sự khác biệt giữa thời gian trẻ gọi và kết quả của nhiệm vụ đã hoàn thành (tính bằng giây). Người ta cho rằng thông điệp về sự thất bại sẽ gây ra sự thiếu tự tin nào đó ở trẻ. Giả thuyết được kiểm định (ở mức α = 0,005) là phương sai của lòng tự trọng tổng hợp không phụ thuộc vào báo cáo thành công hay thất bại (H 0: σ 1 2 = σ 2 2).

Dữ liệu sau đây đã thu được:

Bước 1. Tính giá trị thực nghiệm của tiêu chí và số bậc tự do bằng công thức (4):

Bước 2. Theo bảng giá trị tới hạn của tiêu chí Fisher f cho không định hướng các lựa chọn thay thế chúng tôi tìm thấy giá trị quan trọng cho số df= 11; df biết= 11. Tuy nhiên, chỉ có giá trị tới hạn đối với số df= 10 và df biết = 12. Không thể lấy được số bậc tự do lớn hơn nên ta lấy giá trị tới hạn của số df= 10: Đối với r= 0,05 F Kp = 3,526; Vì r= 0,01 F Kp = 5,418.

Bước 3. Đưa ra quyết định thống kê và kết luận có ý nghĩa. Vì giá trị thực nghiệm vượt quá giá trị tới hạn cho r= 0,01 (và thậm chí còn hơn thế nữa đối với p = 0,05), thì trong trường hợp này p< 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (P< 0,01). Hệ quả là, sau một thông điệp về sự thất bại, mức độ thiếu lòng tự trọng sẽ cao hơn sau một thông điệp về sự thành công.

Câu chuyện

Tiêu chí này được William Gossett phát triển để đánh giá chất lượng bia tại Guinness. Liên quan đến nghĩa vụ với công ty liên quan đến việc không tiết lộ bí mật thương mại (ban quản lý Guinness đã cân nhắc việc sử dụng bộ máy thống kê trong công việc của mình), bài báo của Gosset được xuất bản vào năm 1908 trên tạp chí Biometrics với bút danh “Sinh viên”.

Yêu cầu dữ liệu

Để áp dụng tiêu chí này, dữ liệu gốc cần có phân phối chuẩn. Trong trường hợp áp dụng phép thử hai mẫu cho các mẫu độc lập cũng cần phải tuân thủ điều kiện phương sai bằng nhau. Tuy nhiên, có những lựa chọn thay thế cho bài kiểm tra t của Học sinh đối với các tình huống có phương sai không bằng nhau.

T-test hai mẫu cho các mẫu độc lập

Trong trường hợp cỡ mẫu hơi khác một chút, công thức đơn giản hóa để tính toán gần đúng được sử dụng:

Nếu cỡ mẫu khác nhau đáng kể thì áp dụng công thức phức tạp và chính xác hơn:

Ở đâu M 1 ,M 2 - trung bình số học, σ 1, σ 2 - độ lệch chuẩn và N 1 ,N 2 - cỡ mẫu.

T-test hai mẫu cho các mẫu phụ thuộc

Để tính giá trị thực nghiệm của phép thử t trong trường hợp kiểm tra một giả thuyết về sự khác biệt giữa hai mẫu phụ thuộc (ví dụ: hai mẫu của cùng một phép thử có khoảng thời gian), công thức sau được sử dụng:

Ở đâu M d là chênh lệch trung bình về giá trị và σ d- độ lệch chuẩn của sự khác biệt.

Số bậc tự do được tính bằng

Kiểm tra t một mẫu

Dùng để kiểm tra giả thuyết về sự khác biệt giữa giá trị trung bình và một số giá trị đã biết:

Số bậc tự do được tính bằng

Tương tự không tham số

Một dạng tương tự của thử nghiệm hai mẫu đối với các mẫu độc lập là thử nghiệm Mann-Whitney U. Đối với trường hợp các mẫu phụ thuộc, các phép tương tự là kiểm tra dấu hiệu và kiểm tra T Wilcoxon

Tự động tính toán t-test của Sinh viên


Quỹ Wikimedia.

  • 2010.
  • Guinness

Hồ chứa địa hóa

    Xem “T-test của học sinh” là gì trong các từ điển khác: Bài kiểm tra t-c của sinh viên - Tiêu chí của học sinh hoặc t c. hoặc thử nghiệm S. t là một tiêu chí thống kê về tầm quan trọng của sự khác biệt giữa các phương tiện được so sánh. Được xác định bằng tỷ lệ của chênh lệch này với sai số chênh lệch: Đối với các giá trị của t... ...

    Di truyền học. Từ điển bách khoa Bài kiểm tra t của sinh viên

    - Kiểm định t của sinh viên là tên gọi chung cho một lớp phương pháp kiểm định thống kê các giả thuyết (kiểm định thống kê) dựa trên so sánh với phân bố Sinh viên. Các trường hợp phổ biến nhất của việc sử dụng bài kiểm tra t có liên quan đến việc kiểm tra đẳng thức... ... Wikipedia Bài kiểm tra t của sinh viên - Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Váyumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas váyumo ir jo paklaidos santykiu. atitikmenys: tiếng anh. Bài kiểm tra của học sinh. Bài kiểm tra của học sinh...

    - Kiểm định t của sinh viên là tên gọi chung cho một lớp phương pháp kiểm định thống kê các giả thuyết (kiểm định thống kê) dựa trên so sánh với phân bố Sinh viên. Các trường hợp phổ biến nhất của việc sử dụng bài kiểm tra t có liên quan đến việc kiểm tra đẳng thức... ... WikipediaŽemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas - Một phép kiểm định thống kê trong đó, theo giả định giả thuyết không, số liệu thống kê được sử dụng tương ứng với phân phối t (Phân phối sinh viên). Ghi chú. Dưới đây là ví dụ về việc áp dụng tiêu chí này: 1. kiểm tra sự bằng nhau của trung bình cộng của... ...

    Từ điển thống kê xã hội học TIÊU CHÍ SINH VIÊN - Chỉ số sinh trắc học về độ tin cậy của chênh lệch (td) giữa giá trị trung bình của hai nhóm động vật so với nhau (M1 và M2) đối với bất kỳ đặc điểm nào. Độ tin cậy của chênh lệch được xác định theo công thức: Giá trị td thu được được so sánh với… ...

    Từ điển thống kê xã hội học- đánh giá mức độ gần nhau của hai giá trị trung bình theo quan điểm liệu nó có được phân loại là ngẫu nhiên hay không (ở một mức ý nghĩa nhất định), trả lời câu hỏi liệu các giá trị trung bình có khác biệt đáng kể về mặt thống kê với nhau không)