Xác định tầm quan trọng của kết quả giữa họ. Độ tin cậy và ý nghĩa thống kê

Độ tin cậy thống kê là điều cần thiết trong thực hành tính toán của FCC. Người ta đã lưu ý trước đó rằng từ cùng một dân số có thể chọn nhiều mẫu:

Nếu chúng được chọn chính xác, thì các chỉ số trung bình của chúng và các chỉ số của dân số nói chung sẽ hơi khác nhau về mức độ sai số đại diện, có tính đến độ tin cậy được chấp nhận;

Nếu chúng được chọn từ các quần thể khác nhau, sự khác biệt giữa chúng sẽ rất đáng kể. Thống kê chỉ là so sánh các mẫu;

Nếu chúng khác nhau một cách không đáng kể, không có nguyên tắc, không đáng kể, tức là chúng thực sự thuộc về cùng một dân số nói chung, thì sự khác biệt giữa chúng được gọi là không đáng tin cậy về mặt thống kê.

Đáng tin cậy về mặt thống kê Sự khác biệt về mẫu là một mẫu có sự khác biệt đáng kể và cơ bản, nghĩa là nó thuộc về các quần thể chung khác nhau.

Tại FCC, việc đánh giá ý nghĩa thống kê của sự khác biệt giữa các mẫu có nghĩa là giải quyết một tập hợp vấn đề thực tế. Ví dụ, việc áp dụng các phương pháp giảng dạy mới, chương trình, bộ bài tập, bài kiểm tra, bài tập điều khiểnđược liên kết với thử nghiệm thử nghiệm của họ, điều này sẽ cho thấy rằng nhóm thử nghiệm về cơ bản khác với nhóm đối chứng. Vì vậy, đặc biệt phương pháp thống kê, được gọi là tiêu chí có ý nghĩa thống kê, cho phép chúng tôi phát hiện sự hiện diện hay vắng mặt của sự khác biệt có ý nghĩa thống kê giữa các mẫu.

Tất cả các tiêu chí được chia thành hai nhóm: tham số và phi tham số. Tiêu chí tham số yêu cầu sự hiện diện của luật phân phối chuẩn, tức là điều này có nghĩa là việc xác định bắt buộc các chỉ số chính của quy luật thông thường - giá trị trung bình giá trị số học và độ lệch chuẩn s. Tiêu chí tham số là chính xác và chính xác nhất. Các thử nghiệm phi tham số dựa trên sự khác biệt về thứ hạng (thứ tự) giữa các phần tử mẫu.

Hãy để chúng tôi trình bày các tiêu chí chính về ý nghĩa thống kê được sử dụng trong thực tiễn của FCC: Bài kiểm tra của sinh viên và bài kiểm tra của Fisher.

Bài kiểm tra t của sinh viênđược đặt theo tên của nhà khoa học người Anh K. Gosset (Sinh viên - bút danh), người đã phát hiện ra phương pháp này. Bài kiểm tra t của sinh viên là tham số và được sử dụng để so sánh chỉ số tuyệt đối mẫu. Các mẫu có thể khác nhau về kích thước.

Bài kiểm tra t của sinh viên được định nghĩa như thế này.

1. Tìm bài kiểm tra t của Sinh viên bằng công thức sau:


trung bình số học của các mẫu được so sánh ở đâu; t 1, t 2 - sai số về tính đại diện được xác định dựa trên các chỉ tiêu của mẫu so sánh.

2. Thực tiễn tại FCC đã chỉ ra rằng đối với công tác thể thao chấp nhận độ tin cậy của tài khoản P = 0,95 là đủ.

Đối với độ tin cậy đếm: P = 0,95 (a = 0,05), với số bậc tự do

k = n 1 + n 2 - 2 từ bảng ở Phụ lục 4 ta tìm được giá trị giá trị giới hạn của tiêu chí ( t gr).

3. Dựa vào tính chất của luật phân phối chuẩn, tiêu chí của Học sinh so sánh t và t gr.

Chúng tôi rút ra kết luận:

nếu t t gr thì sự khác biệt giữa các mẫu so sánh có ý nghĩa thống kê;

nếu t t gr thì sự khác biệt không có ý nghĩa thống kê.

Đối với các nhà nghiên cứu trong lĩnh vực FCS, việc đánh giá ý nghĩa thống kê là bước đầu tiên để giải quyết một vấn đề cụ thể: liệu các mẫu được so sánh có khác biệt cơ bản hay không cơ bản với nhau. Bước tiếp theo là đánh giá sự khác biệt này bằng điểm sư phạm tầm nhìn, được xác định bởi các điều kiện của vấn đề.

Hãy xem xét việc áp dụng Bài kiểm tra học sinh bằng một ví dụ cụ thể.

Ví dụ 2.14. Một nhóm gồm 18 đối tượng được đánh giá nhịp tim (bpm) trước x i và sau ừ tôi khởi động.

Đánh giá hiệu quả của việc khởi động dựa trên nhịp tim. Dữ liệu và tính toán ban đầu được trình bày trong bảng. 2,30 và 2,31.

Bảng 2.30

Xử lý chỉ số nhịp tim trước khi khởi động


Sai số của cả hai nhóm trùng khớp nhau vì cỡ mẫu bằng nhau (cùng một nhóm được nghiên cứu tại điều kiện khác nhau) và trung bình độ lệch chuẩn lên tới s x = s y = 3 nhịp/phút. Hãy chuyển sang việc xác định bài kiểm tra của Học sinh:

Chúng tôi đặt độ tin cậy của tài khoản: P = 0,95.

Số bậc tự do k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Từ bảng ở Phụ lục 4 ta tìm được t gr= 2,02.

Suy luận thống kê. Vì t = 11,62 và biên t gr = 2,02 nên 11,62 > 2,02, tức là t > t gr, do đó sự khác biệt giữa các mẫu có ý nghĩa thống kê.

Kết luận sư phạm. Người ta nhận thấy rằng về mặt nhịp tim, sự khác biệt giữa trạng thái của nhóm trước và sau khi khởi động là có ý nghĩa thống kê, tức là. quan trọng, cơ bản. Vì vậy, dựa trên chỉ số nhịp tim, chúng ta có thể kết luận rằng việc khởi động có hiệu quả.

tiêu chí Fisher là tham số. Nó được sử dụng khi so sánh tốc độ phân tán mẫu. Điều này thường có nghĩa là sự so sánh về độ ổn định của thành tích thể thao hoặc độ ổn định của các chỉ số chức năng và kỹ thuật trong thực tế. văn hóa thể chất và thể thao. Các mẫu có thể có kích cỡ khác nhau.

Tiêu chí Fisher được xác định theo trình tự sau.

1. Tìm tiêu chí Fisher F bằng công thức


trong đó , là phương sai của các mẫu được so sánh.

Các điều kiện của tiêu chuẩn Fisher quy định rằng ở tử số của công thức F có sự phân tán lớn, tức là số F luôn lớn hơn một.

Chúng tôi đặt độ tin cậy của số đếm: P = 0,95 - và xác định số bậc tự do cho cả hai mẫu: k 1 = n 1 - 1, k 2 = n 2 - 1.

Sử dụng bảng ở Phụ lục 4, ta tìm được giá trị giới hạn của chỉ tiêu F gr.

So sánh tiêu chí F và F gr cho phép chúng ta đưa ra kết luận:

nếu F > F gr thì sự khác biệt giữa các mẫu có ý nghĩa thống kê;

nếu F< F гр, то различие между выборками статически недо­стоверно.

Hãy đưa ra một ví dụ cụ thể.

Ví dụ 2.15. Hãy phân tích hai nhóm người chơi bóng ném: x tôi (n 1= 16 người) và y i (p 2 = 18 người). Các nhóm vận động viên này đã được nghiên cứu về thời gian cất cánh khi ném bóng vào khung thành.

Các chỉ báo lực đẩy có cùng loại không?

Số liệu ban đầu và các tính toán cơ bản được trình bày trong bảng. 2,32 và 2,33.

Bảng 2.32

Xử lý chỉ số lực đẩy của nhóm người chơi bóng ném thứ nhất


Chúng ta hãy xác định tiêu chí Fisher:





Theo số liệu trình bày ở bảng Phụ lục 6, ta tìm được Fgr: Fgr = 2,4

Chúng ta hãy chú ý đến thực tế là trong bảng Phụ lục 6, số bậc tự do của cả độ phân tán lớn hơn và nhỏ hơn được liệt kê khi tiếp cận số lượng lớn trở nên thô hơn. Do đó, số bậc tự do của độ phân tán lớn hơn tuân theo thứ tự sau: 8, 9, 10, 11, 12, 14, 16, 20, 24, v.v., và số bậc nhỏ hơn - 28, 29, 30, 40 , 50, v.v. d.

Điều này được giải thích là do khi cỡ mẫu tăng lên thì sự khác biệt trong F-test giảm đi và có thể sử dụng các giá trị dạng bảng gần với dữ liệu gốc. Vì vậy, trong ví dụ 2,15 =17 không có và giá trị gần nhất với nó có thể lấy là k = 16, từ đó ta thu được Fgr = 2,4.

Suy luận thống kê. Vì thử nghiệm của Fisher F= 2,5 > F= 2,4 nên các mẫu có thể phân biệt được một cách có ý nghĩa thống kê.

Kết luận sư phạm. Giá trị của (các) thời gian cất cánh khi ném bóng vào khung thành đối với các cầu thủ chơi bóng ném của cả hai nhóm khác nhau đáng kể. Những nhóm này nên được coi là khác nhau.

Nghiên cứu sâu hơn sẽ tiết lộ lý do cho sự khác biệt này.

Ví dụ 2.20.(về độ tin cậy thống kê của mẫu ). Trình độ của cầu thủ bóng đá có được cải thiện không nếu thời gian từ khi ra hiệu cho đến khi đá bóng khi bắt đầu tập là x i và khi kết thúc buổi tập là y i .

Dữ liệu ban đầu và tính toán cơ bản được đưa ra trong bảng. 2,40 và 2,41.

Bảng 2.40

Xử lý các chỉ số thời gian từ ra hiệu đến đánh bóng khi bắt đầu tập


Chúng ta hãy xác định sự khác biệt giữa các nhóm chỉ số bằng tiêu chí của Sinh viên:

Với độ tin cậy P = 0,95 và bậc tự do k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, sử dụng bảng ở Phụ lục 4 ta tìm được t gr= 2,02. Vì t = 8,3 > t gr= 2,02 - sự khác biệt có ý nghĩa thống kê.

Chúng ta hãy xác định sự khác biệt giữa các nhóm chỉ số bằng tiêu chí Fisher:


Theo bảng ở Phụ lục 2, với độ tin cậy P = 0,95 và bậc tự do k = 22-1 = 21 thì giá trị F gr = 21. Vì F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Suy luận thống kê. Theo phương pháp bình quân số học, sự khác biệt giữa các nhóm chỉ tiêu là có ý nghĩa thống kê. Xét về độ phân tán (dispersion), sự khác biệt giữa các nhóm chỉ tiêu là không đáng tin cậy về mặt thống kê.

Kết luận sư phạm. Trình độ của cầu thủ bóng đá đã được cải thiện đáng kể, nhưng cần chú ý đến tính ổn định trong lời khai của anh ta.

Chuẩn bị cho công việc

Trước chuyện này công việc trong phòng thí nghiệm bằng kỷ luật” Đo lường thể thao» tới tất cả học sinh nhóm học tập cần thành lập các nhóm làm việc gồm 3-4 sinh viên trong mỗi, cùng nhau hoàn thành công việc được giao của tất cả các công việc trong phòng thí nghiệm.

Để chuẩn bị cho công việc đọc các phần liên quan của tài liệu được đề xuất (xem phần 6 của tài liệu hướng dẫn phương pháp) và ghi chú bài giảng. Nghiên cứu phần 1 và 2 cho công việc thí nghiệm này, cũng như phân công công việc cho nó (phần 4).

Chuẩn bị mẫu báo cáo trên các tờ giấy viết khổ A4 tiêu chuẩn và điền vào đó những vật liệu cần thiết cho công việc.

Báo cáo phải có :

Trang đầu cho biết khoa (UC và TR), nhóm nghiên cứu, họ, tên, họ của sinh viên, số và tên công việc trong phòng thí nghiệm, ngày hoàn thành, cũng như họ, bằng cấp học thuật, học hàm, chức vụ của giáo viên nhận việc;

Mục đích của công việc;

Công thức với giá trị số, giải thích kết quả tính toán trung gian và cuối cùng;

Bảng giá trị đo và tính toán;

Tài liệu đồ họa theo yêu cầu của bài tập;

Kết luận ngắn gọn căn cứ vào kết quả từng giai đoạn của công việc và nói chung theo công việc đã thực hiện.

Tất cả các biểu đồ và bảng biểu đều được vẽ cẩn thận bằng các công cụ vẽ. Các ký hiệu đồ họa và chữ cái thông thường phải tuân thủ GOST. Được phép lập báo cáo bằng công nghệ máy tính.

Phân công công việc

Trước khi thực hiện mọi phép đo, mỗi thành viên trong nhóm phải nghiên cứu nội quy sử dụng trò chơi thể thao Phi tiêu được nêu trong Phụ lục 7, cần thiết để thực hiện các giai đoạn nghiên cứu sau.

Giai đoạn I của nghiên cứu“Nghiên cứu kết quả đánh trúng mục tiêu môn thể thao Phi tiêu của từng thành viên trong đội về việc tuân thủ luật thông thường phân bổ theo tiêu chí χ 2 Pearson và tiêu chí ba sigma"

1. đo (kiểm tra) tốc độ (cá nhân) và sự phối hợp hành động của bạn, bằng cách ném phi tiêu 30-40 lần vào mục tiêu hình tròn trong trò chơi thể thao Phi tiêu.

2. Kết quả đo (kiểm tra) x tôi(có kính) sắp xếp theo mẫu chuỗi biến thể và nhập vào bảng 4.1 (cột , làm tất cả tính toán cần thiết, điền vào các bảng cần thiết và đưa ra kết luận thích hợp về việc tuân thủ các yêu cầu nhận được phân phối thực nghiệm luật phân phối chuẩn, bằng cách tương tự với các phép tính, bảng và kết luận tương tự của ví dụ 2.12, được đưa ra trong phần 2 của hướng dẫn này ở trang 7 -10.

Bảng 4.1

Sự tương ứng giữa tốc độ và sự phối hợp hành động của các chủ thể với quy luật phân phối chuẩn

KHÔNG. làm tròn
Tổng cộng

II – Giai đoạn nghiên cứu

“Đánh giá các chỉ số trung bình của tổng thể các cú đánh vào mục tiêu của trò chơi thể thao Phi tiêu của tất cả học sinh trong nhóm nghiên cứu dựa trên kết quả đo của các thành viên trong một đội”

Đánh giá các chỉ số trung bình về tốc độ và sự phối hợp hành động của tất cả học sinh trong nhóm học (theo danh sách nhóm học trong tạp chí của lớp) dựa trên kết quả ném trúng mục tiêu Phi tiêu của tất cả các thành viên trong nhóm đạt được ở chặng đầu tiên nghiên cứu của công việc thí nghiệm này.

1. Ghi lại kết quả đo tốc độ và phối hợp các hành động khi ném phi tiêu vào mục tiêu hình tròn trong trò chơi thể thao Phi tiêu của tất cả các thành viên trong đội của bạn (2 - 4 người), những người đại diện cho một mẫu kết quả đo từ dân số nói chung (kết quả đo của tất cả học sinh trong một nhóm nghiên cứu - ví dụ: 15 người), nhập vào cột thứ hai và thứ ba Bảng 4.2.

Bảng 4.2

Xử lý các chỉ số về tốc độ và phối hợp hành động

thành viên lữ đoàn

KHÔNG.
Tổng cộng

Trong bảng 4.2 dưới nên được hiểu , điểm trung bình phù hợp (xem kết quả tính toán ở bảng 4.1) thành viên trong nhóm của bạn ( , thu được ở giai đoạn nghiên cứu đầu tiên. Cần lưu ý rằng, như một quy luật, Bảng 4.2 chứa giá trị trung bình tính toán của các kết quả đo mà một thành viên trong nhóm thu được ở giai đoạn nghiên cứu đầu tiên , vì xác suất mà kết quả đo thành viên khác nhau các lữ đoàn sẽ trùng nhau rất nhỏ. Sau đó, theo nguyên tắc, các giá trị trong cột Bảng 4.2 cho mỗi hàng - bằng 1, MỘT ở dòng “Tổng " cột " ", được viết số lượng thành viên trong nhóm của bạn.

2. Thực hiện tất cả các phép tính cần thiết để điền vào bảng 4.2, cũng như các phép tính và kết luận khác tương tự như các phép tính và kết luận của ví dụ 2.13 nêu ở phần 2 của phần này. phát triển phương pháp luậnở trang 13-14. Cần lưu ý khi tính sai số đại diện "m" cần sử dụng công thức 2.4 ở trang 13 của phần phát triển phương pháp này, vì mẫu nhỏ (n và số phần tử của tổng thể N đã biết và bằng số sinh viên trong nhóm nghiên cứu, theo danh sách tạp chí của nhóm nghiên cứu.

III – giai đoạn nghiên cứu

Đánh giá hiệu quả khởi động theo chỉ số “Tốc độ và sự phối hợp hành động” của từng thành viên trong nhóm bằng t-test của Học sinh

Để đánh giá hiệu quả của việc khởi động ném phi tiêu vào mục tiêu của trò chơi thể thao "Phi tiêu", được thực hiện ở giai đoạn đầu nghiên cứu của công việc trong phòng thí nghiệm này, bởi mỗi thành viên trong đội theo chỉ số "Tốc độ và phối hợp các hành động", sử dụng tiêu chí của Sinh viên - một tiêu chí tham số cho độ tin cậy thống kê của luật phân phối thực nghiệm với luật phân phối chuẩn.

… Tổng cộng

2. phương sai và RMS , kết quả đo chỉ số “Tốc độ và sự phối hợp các hành động” dựa trên kết quả khởi động, cho trong bảng 4.3, (xem các tính toán tương tự được đưa ra ngay sau bảng 2.30 của ví dụ 2.14 ở trang 16 của phần phát triển phương pháp này).

3. Mỗi thành viên trong nhóm làm việc đo (kiểm tra) tốc độ (cá nhân) của bạn và sự phối hợp các hành động sau khi khởi động,

… Tổng cộng

5. Thực hiện tính toán trung bình phương sai và RMS ,kết quả đo chỉ số “Tốc độ và sự phối hợp hành động” sau khi khởi động, cho trong bảng 4.4, ghi lại kết quả đo tổng thể dựa trên kết quả khởi động (xem các tính toán tương tự được đưa ra ngay sau bảng 2.31 của ví dụ 2.14 ở trang 17 của phần phát triển phương pháp này).

6. Thực hiện tất cả các tính toán và kết luận cần thiết tương tự như các tính toán và kết luận của ví dụ 2.14 được nêu ở phần 2 của phần phát triển phương pháp này ở trang 16-17. Cần lưu ý khi tính sai số đại diện "m" cần phải sử dụng công thức 2.1 ở trang 12 của phần phát triển phương pháp này, vì mẫu là n, và số phần tử của tổng thể N ( là không xác định.

IV – giai đoạn nghiên cứu

Đánh giá tính đồng nhất (ổn định) của các chỉ số “Tốc độ và sự phối hợp hành động” của hai thành viên trong nhóm theo tiêu chí Fisher

Đánh giá tính đồng nhất (tính ổn định) của các chỉ số “Tốc độ và sự phối hợp hành động” của hai thành viên trong nhóm bằng tiêu chí Fisher, dựa trên kết quả đo lường thu được ở giai đoạn nghiên cứu thứ ba trong công việc thí nghiệm này.

Để làm điều này, bạn phải làm như sau.

Sử dụng số liệu ở bảng 4.3 và 4.4, kết quả tính toán phương sai từ các bảng này thu được ở giai đoạn nghiên cứu thứ 3, cũng như phương pháp tính toán và áp dụng tiêu chí Fisher để đánh giá tính đồng nhất (ổn định) hiệu suất thể thao lấy ví dụ 2.15 trang 18-19 của phần phát triển phương pháp luận này, rút ​​ra kết luận thống kê và sư phạm phù hợp.

V – giai đoạn nghiên cứu

Đánh giá các nhóm chỉ số “Tốc độ và sự phối hợp hành động” của một thành viên trong nhóm trước và sau khi khởi động

Trong các bảng kết quả tính toán thống kê các môn học, văn bằng và luận văn thạc sĩ tâm lý học luôn có chỉ số “p”.

Ví dụ, theo mục tiêu nghiên cứu Sự khác biệt về mức độ ý nghĩa trong cuộc sống giữa các chàng trai và cô gái tuổi teen đã được tính toán.

Giá trị trung bình

Phép thử Mann-Whitney U

Mức ý nghĩa thống kê (p)

Nam (20 người)

cô gái

(5 người)

Bàn thắng

28,9

35,2

17,5

0,027*

Quá trình

30,1

32,0

38,5

0,435

Kết quả

25,2

29,0

29,5

0,164

Vị trí kiểm soát - "Tôi"

20,3

23,6

0,067

Vị trí kiểm soát - "Cuộc sống"

30,4

33,8

27,5

0,126

Cuộc sống ý nghĩa

98,9

111,2

0,103

* - sự khác biệt có ý nghĩa thống kê (p0,05)

Cột bên phải thể hiện giá trị của “p” và qua giá trị của nó có thể xác định được liệu sự khác biệt về ý nghĩa cuộc sống trong tương lai giữa bé trai và bé gái có đáng kể hay không. Quy tắc rất đơn giản:

  • Nếu mức ý nghĩa thống kê “p” nhỏ hơn hoặc bằng 0,05 thì chúng ta kết luận rằng sự khác biệt là đáng kể. Trong bảng dưới đây, sự khác biệt giữa bé trai và bé gái rất đáng kể liên quan đến chỉ số “Mục tiêu” - ý nghĩa cuộc sống trong tương lai. Đối với trẻ em gái, chỉ số này cao hơn có ý nghĩa thống kê so với trẻ em trai.
  • Nếu mức ý nghĩa thống kê “p” lớn hơn 0,05 thì kết luận rằng sự khác biệt là không đáng kể. Trong bảng dưới đây, sự khác biệt giữa bé trai và bé gái không đáng kể đối với tất cả các chỉ số khác, ngoại trừ chỉ số đầu tiên.

Mức ý nghĩa thống kê “p” đến từ đâu?

Mức ý nghĩa thống kê được tính toán chương trình thống kê cùng với việc tính toán tiêu chí thống kê. Trong các chương trình này, bạn cũng có thể đặt giới hạn tới hạn cho mức ý nghĩa thống kê và các chỉ số tương ứng sẽ được chương trình làm nổi bật.

Ví dụ: trong chương trình STATISTICA, khi tính toán các mối tương quan, bạn có thể đặt giới hạn “p”, ví dụ: 0,05 và tất cả các mối quan hệ có ý nghĩa thống kê sẽ được tô sáng màu đỏ.

Nếu tiêu chí thống kê được tính toán thủ công thì mức ý nghĩa “p” được xác định bằng cách so sánh giá trị của tiêu chí kết quả với giá trị tới hạn.

Mức ý nghĩa thống kê “p” cho thấy điều gì?

Tất cả các tính toán thống kê là gần đúng. Mức độ gần đúng này xác định “p”. Mức ý nghĩa được viết là số thập phân, ví dụ 0,023 hoặc 0,965. Nếu chúng ta nhân số này với 100, chúng ta sẽ nhận được chỉ số p dưới dạng phần trăm: 2,3% và 96,5%. Những tỷ lệ phần trăm này phản ánh khả năng các giả định của chúng tôi về mối quan hệ giữa sự gây hấn và lo lắng là sai.

Đó là, hệ số tương quan 0,58 giữa sự gây hấn và lo lắng đạt được ở mức ý nghĩa thống kê là 0,05 hoặc xác suất sai sót là 5%. Chính xác điều này có nghĩa là gì?

Mối tương quan mà chúng tôi đã xác định có nghĩa là trong mẫu của chúng tôi có mô hình sau: mức độ hung hăng càng cao thì mức độ lo lắng càng cao. Nghĩa là, nếu chúng ta lấy hai thanh thiếu niên và một thanh thiếu niên có mức độ lo lắng cao hơn thanh thiếu niên kia, thì khi biết về mối tương quan tích cực, chúng ta có thể nói rằng thanh thiếu niên này cũng sẽ có tính hung hăng cao hơn. Nhưng vì mọi thứ trong thống kê đều là gần đúng, nên khi nêu điều này, chúng tôi thừa nhận rằng mình có thể nhầm lẫn và xác suất sai sót là 5%. Nghĩa là, sau khi thực hiện 20 so sánh như vậy ở nhóm thanh thiếu niên này, chúng ta có thể mắc một sai lầm khi dự đoán mức độ hung hăng, biết lo lắng.

Mức ý nghĩa thống kê nào tốt hơn: 0,01 hoặc 0,05

Mức ý nghĩa thống kê phản ánh xác suất xảy ra sai sót. Do đó, kết quả ở p=0,01 chính xác hơn ở p=0,05.

TRONG nghiên cứu tâm lý chấp nhận hai mức cho phépý nghĩa thống kê của kết quả:

p=0,01 - độ tin cậy cao của kết quả phân tích so sánh hoặc phân tích các mối quan hệ;

p=0,05 - đủ độ chính xác.

Tôi hy vọng bài viết này sẽ giúp bạn viết một bài báo tâm lý của riêng bạn. Nếu bạn cần trợ giúp, vui lòng liên hệ với chúng tôi (tất cả các loại công việc về tâm lý học; tính toán thống kê).

Trước khi thu thập và nghiên cứu dữ liệu, các nhà tâm lý học thực nghiệm thường quyết định cách phân tích dữ liệu theo thống kê. Thông thường nhà nghiên cứu đặt ra một mức ý nghĩa được xác định là giá trị thống kê, cao hơn ( hoặc thấp hơn) chứa các giá trị cho phép chúng ta xem xét ảnh hưởng của các yếu tố không ngẫu nhiên. Các nhà nghiên cứu thường biểu diễn cấp độ này dưới dạng biểu thức xác suất.

Ở nhiều nơi thí nghiệm tâm lý nó có thể được diễn đạt là " mức 0,05" hoặc " mức 0,01" Điều này có nghĩa là kết quả ngẫu nhiên sẽ chỉ xảy ra với tần suất 0,05 (1 lần) hoặc 0,01 (1 trên 100 lần). Kết quả phân tích thống kê dữ liệu đáp ứng một tiêu chí được thiết lập trước ( có thể là 0,05, 0,01 hoặc thậm chí 0,001), được gọi dưới đây là có ý nghĩa thống kê.

Cần lưu ý rằng kết quả có thể không có ý nghĩa thống kê nhưng vẫn đáng quan tâm. Thông thường, đặc biệt là trong các nghiên cứu hoặc thí nghiệm sơ bộ liên quan đến một số lượng nhỏ đối tượng hoặc với số lượng quan sát hạn chế, kết quả có thể không đạt đến mức có ý nghĩa thống kê, nhưng cho thấy rằng nghiên cứu sâu hơn với sự kiểm soát chính xác hơn và hơn những quan sát họ sẽ đạt được độ tin cậy cao hơn. Đồng thời, người thực nghiệm phải hết sức cẩn thận với mong muốn thay đổi có mục đích các điều kiện thí nghiệm để đạt được kết quả mong muốn bằng mọi giá.

Trong một ví dụ khác về kế hoạch 2x2 Kỷ sử dụng hai loại môn học và hai loại nhiệm vụ để nghiên cứu ảnh hưởng của kiến ​​thức chuyên ngành đến việc ghi nhớ thông tin.

Trong nghiên cứu của ông Kỷ học ghi nhớ các con số và quân cờ ( biến A) trẻ em ngồi trên ghế RECARO Thể thao trẻ và người lớn ( biến B), tức là theo sơ đồ 2x2. Trẻ em đã 10 tuổi và chơi cờ rất giỏi, trong khi người lớn mới làm quen với trò chơi này. Trong nhiệm vụ đầu tiên, bạn phải nhớ vị trí của các quân cờ trên bàn cờ, giống như trong một trò chơi bình thường và khôi phục vị trí đó sau khi các quân cờ được lấy ra. Một phần khác của nhiệm vụ này yêu cầu ghi nhớ một dãy số tiêu chuẩn, như thường được thực hiện khi xác định chỉ số IQ.

Hóa ra, kiến thức chuyên ngành Chẳng hạn như học chơi cờ vua, giúp bạn dễ dàng ghi nhớ những thông tin liên quan đến lĩnh vực này hơn nhưng lại ít ảnh hưởng đến việc ghi nhớ các con số. Người lớn chưa có nhiều kinh nghiệm về trí tuệ trò chơi cổ nhất, nhớ ít số hơn nhưng lại thành công hơn trong việc ghi nhớ các con số.

Trong văn bản báo cáo Kỷ cung cấp phân tích thống kê xác nhận về mặt toán học các kết quả được trình bày.

Thiết kế 2x2 là thiết kế đơn giản nhất trong tất cả các thiết kế giai thừa. Việc tăng số lượng các yếu tố hoặc mức độ của các yếu tố riêng lẻ sẽ làm tăng đáng kể độ phức tạp của các kế hoạch này.

TÍNH NĂNG TRẢ TIỀN. Tính năng có ý nghĩa thống kê chỉ khả dụng trên các gói được chọn. Kiểm tra xem nó có ở trong không.

Bạn có thể tìm hiểu xem liệu có sự khác biệt có ý nghĩa thống kê trong các câu trả lời nhận được từ các nhóm khác nhau người trả lời các câu hỏi khảo sát. Để sử dụng tính năng có ý nghĩa thống kê trong SurveyMonkey, bạn phải:

  • Bật tính năng ý nghĩa thống kê khi thêm quy tắc so sánh vào câu hỏi trong khảo sát của bạn. Chọn nhóm người trả lời để so sánh nhằm sắp xếp kết quả khảo sát thành các nhóm để so sánh trực quan.
  • Kiểm tra các bảng có dữ liệu về các câu hỏi khảo sát của bạn để xác định sự hiện diện của các số liệu thống kê sự khác biệt đáng kể trong các câu trả lời nhận được từ nhiều nhóm khác nhau người trả lời.

Xem ý nghĩa thống kê

Bằng cách làm theo các bước bên dưới, bạn có thể tạo một cuộc khảo sát hiển thị ý nghĩa thống kê.

1. Thêm câu hỏi đóng vào khảo sát của bạn

Để hiển thị ý nghĩa thống kê khi phân tích kết quả, bạn sẽ cần áp dụng quy tắc so sánh cho bất kỳ câu hỏi nào trong khảo sát của mình.

Bạn có thể áp dụng quy tắc so sánh và tính toán ý nghĩa thống kê trong các câu trả lời nếu bạn sử dụng một trong những điều sau đây trong thiết kế khảo sát của mình: các loại sau câu hỏi:

Cần đảm bảo rằng các phương án trả lời được đề xuất có thể được chia thành các nhóm hoàn chỉnh. Các tùy chọn phản hồi bạn chọn để so sánh khi tạo quy tắc so sánh sẽ được sử dụng để sắp xếp dữ liệu thành các bảng chéo trong suốt cuộc khảo sát.

2. Thu thập câu trả lời

Khi bạn đã hoàn thành khảo sát của mình, hãy tạo một người thu thập để phân phối nó. Có một số cách.

Bạn phải nhận được ít nhất 30 phản hồi cho mỗi tùy chọn phản hồi mà bạn dự định sử dụng trong quy tắc so sánh của mình để kích hoạt và xem ý nghĩa thống kê.

Ví dụ khảo sát

Bạn muốn tìm hiểu xem nam giới có hài lòng với sản phẩm của bạn hơn phụ nữ hay không.

  1. Thêm hai câu hỏi trắc nghiệm vào khảo sát của bạn:
    Giới tính của bạn là gì? (nam, nữ)
    Bạn có hài lòng hay không hài lòng với sản phẩm của chúng tôi? (thỏa mãn, không hài lòng)
  2. Đảm bảo rằng ít nhất 30 người trả lời chọn “nam” cho câu hỏi về giới tính VÀ ít nhất 30 người trả lời chọn “nữ” làm giới tính của họ.
  3. Thêm quy tắc so sánh cho câu hỏi "Giới tính của bạn là gì?" và chọn cả hai phương án trả lời làm nhóm của bạn.
  4. Sử dụng bảng dữ liệu bên dưới biểu đồ câu hỏi “Bạn hài lòng hay không hài lòng với sản phẩm của chúng tôi?” để xem liệu có bất kỳ tùy chọn phản hồi nào cho thấy sự khác biệt có ý nghĩa thống kê hay không

Sự khác biệt có ý nghĩa thống kê là gì?

Sự khác biệt có ý nghĩa thống kê có nghĩa là phân tích thống kê đã xác định rằng có sự khác biệt đáng kể giữa câu trả lời của một nhóm người trả lời và câu trả lời của nhóm khác. Ý nghĩa thống kê có nghĩa là các con số thu được là khác nhau đáng kể. Những kiến ​​thức như vậy sẽ giúp ích rất nhiều cho bạn trong việc phân tích dữ liệu. Tuy nhiên, bạn xác định được tầm quan trọng của kết quả thu được. Chính bạn là người quyết định cách diễn giải kết quả khảo sát và những hành động nào nên được thực hiện dựa trên chúng.

Ví dụ: bạn nhận được nhiều khiếu nại từ khách hàng nữ hơn từ khách hàng nam. Làm thế nào chúng ta có thể xác định liệu sự khác biệt đó có thật hay không và liệu có cần thực hiện hành động liên quan đến nó hay không? Một trong những cách tuyệt vờiĐể kiểm tra quan sát của bạn, hãy tiến hành một cuộc khảo sát để cho bạn biết liệu người mua nam có thực sự hài lòng hơn với sản phẩm của bạn hay không. Bằng cách sử dụng công thức thống kê Hàm ý nghĩa thống kê mà chúng tôi cung cấp sẽ cho bạn khả năng xác định xem sản phẩm của bạn có thực sự thu hút nam giới nhiều hơn nữ giới hay không. Điều này sẽ cho phép bạn hành động dựa trên thực tế thay vì phỏng đoán.

Sự khác biệt có ý nghĩa thống kê

Nếu kết quả của bạn được đánh dấu trong bảng dữ liệu, điều đó có nghĩa là hai nhóm người trả lời có sự khác biệt đáng kể với nhau. Thuật ngữ “đáng kể” không có nghĩa là các con số thu được có tầm quan trọng hoặc tầm quan trọng đặc biệt nào đó, mà chỉ có nghĩa là có sự khác biệt về mặt thống kê giữa chúng.

Không có sự khác biệt có ý nghĩa thống kê

Nếu kết quả của bạn không được đánh dấu trong bảng dữ liệu tương ứng, điều này có nghĩa là, mặc dù sự khác biệt có thể trong hai số liệu được so sánh, không có sự khác biệt thống kê giữa chúng.

Các câu trả lời không có sự khác biệt có ý nghĩa thống kê chứng tỏ rằng không có sự khác biệt đáng kể giữa hai mục được so sánh dựa trên cỡ mẫu bạn sử dụng, nhưng điều này không nhất thiết có nghĩa là chúng không có ý nghĩa. Có lẽ bằng cách tăng cỡ mẫu, bạn sẽ có thể xác định được sự khác biệt có ý nghĩa thống kê.

Cỡ mẫu

Nếu bạn có cỡ mẫu rất nhỏ thì chỉ có sự khác biệt rất lớn giữa hai nhóm mới có ý nghĩa. Nếu bạn có cỡ mẫu rất lớn, cả những khác biệt nhỏ và lớn đều sẽ được coi là có ý nghĩa.

Tuy nhiên, chỉ vì hai con số khác nhau về mặt thống kê không có nghĩa là sự khác biệt giữa các kết quả sẽ tạo ra bất kỳ sự khác biệt nào đối với bạn. ý nghĩa thực tiễn. Bạn sẽ phải tự mình quyết định những khác biệt nào có ý nghĩa đối với cuộc khảo sát của bạn.

Tính ý nghĩa thống kê

Chúng tôi tính toán ý nghĩa thống kê bằng cách sử dụng mức độ tin cậy tiêu chuẩn 95%. Nếu một phương án trả lời được hiển thị là có ý nghĩa thống kê, điều đó có nghĩa là do tình cờ hoặc do lỗi lấy mẫu nên có ít hơn 5% xác suất xảy ra sự khác biệt giữa hai nhóm (thường được biểu thị là: p<0,05).

Để tính toán sự khác biệt có ý nghĩa thống kê giữa các nhóm, chúng tôi sử dụng các công thức sau:

tham số

Sự miêu tả

a1Tỷ lệ phần trăm người tham gia từ nhóm đầu tiên trả lời câu hỏi theo một cách nhất định nhân với cỡ mẫu của nhóm này.
b1Tỷ lệ phần trăm người tham gia từ nhóm thứ hai trả lời câu hỏi theo một cách nhất định nhân với cỡ mẫu của nhóm này.
Tỷ lệ mẫu gộp (p)Sự kết hợp của hai cổ phiếu từ cả hai nhóm.
Sai số chuẩn (SE)Một chỉ báo cho biết chia sẻ của bạn khác bao nhiêu so với chia sẻ thực tế. Giá trị thấp hơn có nghĩa là phân số gần với phân số thực, giá trị cao hơn có nghĩa là phân số khác biệt đáng kể so với phân số thực.
Thống kê kiểm tra (t)Kiểm tra thống kê. Số độ lệch chuẩn mà một giá trị đã cho khác với giá trị trung bình.
Ý nghĩa thống kêNếu giá trị tuyệt đối của thống kê kiểm tra lớn hơn 1,96* độ lệch chuẩn so với giá trị trung bình thì đó được coi là sự khác biệt có ý nghĩa thống kê.

*1,96 là giá trị được sử dụng cho mức độ tin cậy 95% vì 95% phạm vi được xử lý bởi hàm phân phối t của Học sinh nằm trong phạm vi 1,96 độ lệch chuẩn của giá trị trung bình.

Ví dụ tính toán

Tiếp tục với ví dụ được sử dụng ở trên, hãy tìm hiểu xem tỷ lệ nam giới nói rằng họ hài lòng với sản phẩm của bạn có cao hơn đáng kể so với tỷ lệ phụ nữ hay không.

Giả sử có 1.000 nam giới và 1.000 phụ nữ tham gia khảo sát của bạn và kết quả khảo sát cho thấy 70% nam giới và 65% phụ nữ nói rằng họ hài lòng với sản phẩm của bạn. Mức 70% có cao hơn đáng kể so với mức 65% không?

Thay thế dữ liệu sau từ cuộc khảo sát vào các công thức đã cho:

  • p1 (% nam giới hài lòng với sản phẩm) = 0,7
  • p2 (% phụ nữ hài lòng với sản phẩm) = 0,65
  • n1 (số nam giới được khảo sát) = 1000
  • n2 (số phụ nữ được phỏng vấn) = 1000

Vì giá trị tuyệt đối của thống kê kiểm tra lớn hơn 1,96, điều đó có nghĩa là sự khác biệt giữa nam và nữ là đáng kể. So với phụ nữ, nam giới có xu hướng hài lòng với sản phẩm của bạn hơn.

Ẩn ý nghĩa thống kê

Cách ẩn ý nghĩa thống kê cho tất cả các câu hỏi

  1. Nhấp vào mũi tên xuống ở bên phải quy tắc so sánh ở thanh bên trái.
  2. Chọn một mục Chỉnh sửa quy tắc.
  3. Vô hiệu hóa tính năng Hiển thị ý nghĩa thống kê sử dụng một công tắc.
  4. Bấm vào nút Áp dụng.

Để ẩn ý nghĩa thống kê cho một câu hỏi, bạn cần:

  1. Bấm vào nút Điều chỉnh phía trên sơ đồ của vấn đề này.
  2. Mở tab Tùy chọn hiển thị.
  3. Bỏ chọn hộp bên cạnh Ý nghĩa thống kê.
  4. Bấm vào nút Cứu.

Tùy chọn hiển thị được bật tự động khi bật hiển thị ý nghĩa thống kê. Nếu bạn xóa tùy chọn hiển thị này, hiển thị ý nghĩa thống kê cũng sẽ bị tắt.

Bật tính năng ý nghĩa thống kê khi thêm quy tắc so sánh vào câu hỏi trong khảo sát của bạn. Kiểm tra bảng dữ liệu cho các câu hỏi khảo sát của bạn để xác định xem liệu có sự khác biệt đáng kể về mặt thống kê trong câu trả lời nhận được từ các nhóm người trả lời khác nhau hay không.

Mức ý nghĩa - đây là xác suất mà chúng tôi coi sự khác biệt là đáng kể, nhưng thực tế chúng là ngẫu nhiên.

Khi chúng tôi chỉ ra rằng sự khác biệt là có ý nghĩa ở mức ý nghĩa 5% hoặc khi r< 0,05 , thì chúng tôi muốn nói rằng xác suất chúng không đáng tin cậy là 0,05.

Khi chúng tôi chỉ ra rằng sự khác biệt có ý nghĩa ở mức ý nghĩa 1% hoặc khi r< 0,01 , thì chúng tôi muốn nói rằng xác suất chúng không đáng tin cậy là 0,01.

Nếu chúng ta dịch tất cả những điều này sang ngôn ngữ chính thức hơn, thì mức ý nghĩa là xác suất bác bỏ giả thuyết khống, trong khi nó đúng.

Lỗi,bao gồmcái mộtnhững gì chúng tôivật bị loại bỏgiả thuyết vô giá trịtrong khi nó đúng thì được gọi là lỗi loại 1.(Xem Bảng 1)

Bàn 1. Các giả thuyết không có giá trị và thay thế cũng như các điều kiện thử nghiệm có thể có.

Xác suất xảy ra lỗi như vậy thường được ký hiệu là α. Về bản chất, chúng ta sẽ phải chỉ ra trong ngoặc không phải p < 0,05 hoặc p < 0,01 và α < 0,05 hoặc α < 0,01.

Nếu xác suất xảy ra lỗi là α , thì xác suất của một quyết định đúng: 1-α. α càng nhỏ thì xác suất đưa ra quyết định đúng càng lớn.

Về mặt lịch sử, trong tâm lý học người ta thường chấp nhận mức thấp nhất có ý nghĩa thống kê là mức 5% (p<0,05): đủ là mức 1% (p<0,01) và cao nhất là mức 0,1% (p<0,001). do đó, các bảng giá trị tới hạn thường chứa các giá trị của tiêu chí tương ứng với mức ý nghĩa thống kê p<0,05 và p<0,01, đôi khi - p<0,001. Đối với một số tiêu chí, các bảng biểu thị mức ý nghĩa chính xác của các giá trị thực nghiệm khác nhau của chúng. Ví dụ: với φ*=1,56 p=O,06.

Tuy nhiên, cho đến khi mức ý nghĩa thống kê đạt p=0,05, chúng ta vẫn không có quyền bác bỏ giả thuyết khống.

Chúng ta sẽ tuân theo quy tắc sau để bác bỏ giả thuyết không có sự khác biệt (Ho) và chấp nhận giả thuyết về ý nghĩa thống kê của sự khác biệt (H 1).

Quy tắc bác bỏ Ho và chấp nhận h1

Nếu giá trị thực nghiệm của phép kiểm định bằng hoặc lớn hơn giá trị tới hạn tương ứng với p<0,05 thì H 0 bị bác bỏ, nhưng chúng ta chưa thể chấp nhận chắc chắn H 1.

Nếu giá trị thực nghiệm của tiêu chí bằng giá trị tới hạn tương ứng với p<0,01 hoặc vượt quá giá trị đó thì H 0 bị bác bỏ và H 1 được chấp nhận. : Ngoại lệ

Xét nghiệm dấu hiệu G, xét nghiệm Wilcoxon T và xét nghiệm Mann-Whitney U. Mối quan hệ nghịch đảo được thiết lập cho họ.

Cơm. 4. Ví dụ về “trục ý nghĩa” cho tiêu chí Q của Rosenbaum.

Các giá trị tới hạn của tiêu chí được ký hiệu là Q o, o5 và Q 0,01, giá trị thực nghiệm của tiêu chí là Q em. Nó được bao bọc trong một hình elip.

Ở bên phải giá trị tới hạn Q 0,01 mở rộng “vùng có ý nghĩa” - vùng này bao gồm các giá trị thực nghiệm vượt quá Q 0,01 và do đó, chắc chắn có ý nghĩa.

Ở bên trái của giá trị tới hạn Q 0,05, “vùng không đáng kể” mở rộng - vùng này bao gồm các giá trị Q theo kinh nghiệm thấp hơn Q 0,05 và do đó, chắc chắn là không đáng kể. Chúng tôi thấy điều đó 0,05 =6; Chúng tôi thấy điều đó 0,01 =9; Chúng tôi thấy điều đó Q =8;

Giá trị thực nghiệm của tiêu chí nằm trong khoảng giữa Q 0,05 và Q 0,01. Đây là vùng “không chắc chắn”: chúng ta có thể bác bỏ giả thuyết về tính không đáng tin cậy của các khác biệt (H 0), nhưng chúng ta chưa thể chấp nhận giả thuyết về độ tin cậy của chúng (H 1).

Tuy nhiên, trong thực tế, nhà nghiên cứu có thể coi những khác biệt không rơi vào vùng không đáng kể là đáng tin cậy, tuyên bố rằng chúng đáng tin cậy ở mức p. < 0,05 hoặc bằng cách chỉ ra mức ý nghĩa chính xác của giá trị tiêu chí thực nghiệm thu được, ví dụ: p=0,02. Bằng cách sử dụng các bảng tiêu chuẩn có trong tất cả các sách giáo khoa về phương pháp toán học, điều này có thể được thực hiện theo tiêu chí Kruskal-Wallis H, χ 2 r Friedman, Page's L, Fisher's φ* .

Mức ý nghĩa thống kê hoặc các giá trị kiểm tra quan trọng được xác định khác nhau khi kiểm tra các giả thuyết thống kê có định hướng và không định hướng.

Với giả thuyết thống kê định hướng, thử nghiệm một phía được sử dụng, với giả thuyết không định hướng, thử nghiệm hai phía được sử dụng. Kiểm định hai đuôi nghiêm ngặt hơn vì nó kiểm tra sự khác biệt theo cả hai hướng và do đó kiểm tra giá trị thực nghiệm của kiểm định trước đây tương ứng với mức ý nghĩa p < 0,05, hiện chỉ tương ứng với mức p < 0,10.

Chúng ta sẽ không phải tự quyết định mỗi khi anh ta sử dụng tiêu chí một phía hay hai phía. Các bảng giá trị quan trọng của tiêu chí được chọn sao cho các giả thuyết định hướng tương ứng với tiêu chí một phía và các giả thuyết không định hướng tương ứng với tiêu chí hai mặt và các giá trị đã cho thỏa mãn các yêu cầu mà áp dụng cho mỗi người trong số họ. Nhà nghiên cứu chỉ cần đảm bảo rằng các giả thuyết của mình trùng khớp về ý nghĩa và hình thức với các giả thuyết được đưa ra khi mô tả từng tiêu chí.