Thống kê khoảng tin cậy.

Trang chủ Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết MỘT Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết một con số. Đây được gọi là ước tính “điểm”. Trong một số nhiệm vụ, bạn không chỉ cần tìm tham số Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết giá trị số phù hợp mà còn để đánh giá độ chính xác và độ tin cậy của nó. Bạn cần biết việc thay thế một tham số có thể dẫn đến lỗi gì Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biếtước tính điểm của nó

và với mức độ tin cậy nào chúng ta có thể mong đợi rằng những sai số này sẽ không vượt quá giới hạn đã biết? Những vấn đề thuộc loại này đặc biệt phù hợp với một số lượng nhỏ các quan sát, khi ước lượng điểm và trong

phần lớn là sự thay thế ngẫu nhiên và gần đúng của a bằng a có thể dẫn đến sai sót nghiêm trọng. Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết,

Để đưa ra ý tưởng về tính chính xác và độ tin cậy của ước tính

Trong thống kê toán học, cái gọi là khoảng tin cậy và xác suất tin cậy được sử dụng. Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết Cho tham số ước tính khách quan thu được từ kinh nghiệm MỘT.

Chúng tôi muốn ước tính lỗi có thể xảy ra trong trường hợp này. Chúng ta hãy gán một số xác suất p đủ lớn (ví dụ: p = 0,9, 0,95 hoặc 0,99) sao cho một sự kiện có xác suất p có thể được coi là đáng tin cậy trên thực tế và tìm một giá trị s sao cho Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết Sau đó, phạm vi giá trị thực tế có thể xảy ra của lỗi phát sinh trong quá trình thay thế Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết TRÊN

, sẽ là ± s; Các sai số lớn về giá trị tuyệt đối sẽ chỉ xuất hiện với xác suất thấp a = 1 - p. Hãy viết lại (14.3.1) thành: Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biếtĐẳng thức (14.3.2) có nghĩa là với xác suất p giá trị chưa biết của tham số

rơi vào khoảng Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết Cần lưu ý một trường hợp. Trước đây, chúng ta đã nhiều lần xem xét xác suất của một biến ngẫu nhiên rơi vào một khoảng không ngẫu nhiên nhất định. Ở đây tình hình lại khác: độ lớn Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết không phải là ngẫu nhiên, nhưng khoảng /p là ngẫu nhiên. Vị trí của nó trên trục x là ngẫu nhiên, được xác định bởi tâm của nó. Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết; Nói chung, độ dài của khoảng 2s cũng là ngẫu nhiên, vì giá trị của s thường được tính từ dữ liệu thực nghiệm. Do đó, trong trường hợp này, sẽ tốt hơn nếu hiểu giá trị p không phải là xác suất “đạt” điểm Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết trong khoảng / p và xác suất mà khoảng / p ngẫu nhiên sẽ bao trùm điểm

(Hình 14.3.1).

Cơm. 14.3.1 Xác suất p thường được gọi là xác suất tin cậy và khoảng / p - khoảng tin cậy. Ranh giới khoảng Nếu như. a x = a- cát một 2 = một + và được gọi

Hãy đưa ra một cách giải thích khác cho khái niệm khoảng tin cậy: nó có thể được coi là khoảng của các giá trị tham số MỘT, tương thích với dữ liệu thực nghiệm và không mâu thuẫn với chúng. Thật vậy, nếu chúng ta đồng ý xem xét một sự kiện có xác suất a = 1-p trên thực tế là không thể xảy ra, thì các giá trị của tham số a mà một - một> s phải được thừa nhận là mâu thuẫn với dữ liệu thực nghiệm và những dữ liệu |a - Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biếtà t na 2 .

Trong thống kê toán học, cái gọi là khoảng tin cậy và xác suất tin cậy được sử dụng. Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết có một ước tính không thiên vị ước tính khách quan thu được từ kinh nghiệm Nếu chúng ta biết luật phân phối số lượng Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết, nhiệm vụ tìm khoảng tin cậy sẽ rất đơn giản: chỉ cần tìm một giá trị s sao cho

Khó khăn nằm ở chỗ quy luật phân phối ước lượng Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết phụ thuộc vào định luật phân bố đại lượng X và do đó, trên các tham số chưa biết của nó (cụ thể là trên chính tham số đó MỘT).

Để giải quyết khó khăn này, bạn có thể sử dụng kỹ thuật gần đúng sau đây: thay thế các tham số chưa biết trong biểu thức của s bằng ước tính điểm của chúng. Với số lượng thí nghiệm tương đối lớn N(khoảng 20...30) kỹ thuật này thường cho kết quả đạt yêu cầu về độ chính xác.

Ví dụ, hãy xem xét bài toán về khoảng tin cậy cho kỳ vọng toán học.

Hãy để nó được sản xuất N X, có đặc điểm là kỳ vọng toán học T và phương sai D- không rõ. Các ước tính sau đây đã thu được cho các tham số này:

Cần xây dựng khoảng tin cậy/p tương ứng với xác suất tin cậy p cho kỳ vọng toán học T số lượng X.

Khi giải bài toán này ta sẽ vận dụng tính chất đại lượng Tđại diện cho tổng N các biến ngẫu nhiên được phân phối độc lập giống hệt nhau Xh và theo định lý giới hạn trung tâm, với một số đủ lớn N luật phân phối của nó gần với chuẩn. Trong thực tế, ngay cả với số lượng số hạng tương đối nhỏ (khoảng 10...20), quy luật phân phối của tổng có thể được coi là gần đúng chuẩn. Chúng ta sẽ giả sử rằng giá trị T phân bố theo quy luật thông thường. Các đặc điểm của định luật này - kỳ vọng toán học và phương sai - tương ứng là bằng nhau T

(xem chương 13 tiểu mục 13.3). Chúng ta hãy giả sử rằng giá trị D chúng ta biết và sẽ tìm thấy giá trị Ep mà

Sử dụng công thức (6.3.5) của Chương 6, chúng ta biểu thị xác suất ở vế trái của (14.3.5) thông qua hàm phân phối chuẩn

độ lệch chuẩn của ước tính ở đâu T.

Từ phương trình.

tìm giá trị của Sp:

trong đó arg Ф* (х) là hàm nghịch đảo của Ф* (X), những thứ kia. giá trị của đối số mà hàm phân phối chuẩn bằng X.

phân tán D, qua đó số lượng được thể hiện Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết 1P, chúng tôi không biết chính xác; làm giá trị gần đúng của nó, bạn có thể sử dụng ước tính D(14.3.4) và đặt xấp xỉ:

Như vậy, bài toán xây dựng khoảng tin cậy đã được giải gần đúng, bằng:

trong đó gp được xác định theo công thức (14.3.7).

Để tránh nội suy ngược trong các bảng của hàm Ф* (l) khi tính s p, nên lập một bảng đặc biệt (Bảng 14.3.1), đưa ra các giá trị của đại lượng

tùy thuộc vào r. Giá trị (p xác định theo định luật thông thường số lượng độ lệch chuẩn phải được vẽ ở bên phải và bên trái tính từ tâm phân tán sao cho xác suất đi vào vùng kết quả bằng p.

Sử dụng giá trị 7 p, khoảng tin cậy được biểu thị bằng:

Bảng 14.3.1

Ví dụ 1. 20 thí nghiệm được thực hiện trên đại lượng X; kết quả được thể hiện trong bảng. 14.3.2.

Bảng 14.3.2

Cần phải tìm một ước tính từ kỳ vọng toán học của đại lượng X và xây dựng khoảng tin cậy tương ứng với xác suất tin cậy p = 0,8.

Giải pháp. Chúng tôi có:

Chọn l: = 10 làm điểm tham chiếu, sử dụng công thức thứ ba (14.2.14) ta tìm được ước lượng không chệch D :

Theo bảng 14.3.1 chúng tôi tìm thấy

Giới hạn tin cậy:

Khoảng tin cậy:

Giá trị tham số T, nằm trong khoảng này phù hợp với số liệu thực nghiệm cho trong bảng. 14.3.2.

Khoảng tin cậy cho phương sai có thể được xây dựng theo cách tương tự.

Hãy để nó được sản xuất N thí nghiệm độc lập trên một biến ngẫu nhiên X với các tham số chưa biết cho cả A và độ phân tán Dđã thu được một ước tính khách quan:

Cần phải xây dựng khoảng tin cậy gần đúng cho phương sai.

Từ công thức (14.3.11) rõ ràng là đại lượng Dđại diện cho

số lượng N biến ngẫu nhiên có dạng . Những giá trị này không

độc lập, vì bất kỳ trong số chúng bao gồm số lượng T, phụ thuộc vào mọi người khác. Tuy nhiên, có thể thấy rằng với sự gia tăng N luật phân phối tổng của chúng cũng tiến tới mức bình thường. Gần như lúc N= 20...30 thì có thể coi là bình thường rồi.

Hãy giả sử rằng điều này là như vậy và tìm các đặc điểm của định luật này: kỳ vọng và phân tán toán học. Kể từ khi đánh giá D- vậy là khách quan rồi M[D] = D.

Tính toán phương sai D Dđược liên kết với các phép tính tương đối phức tạp, vì vậy chúng tôi trình bày biểu thức của nó mà không cần dẫn xuất:

trong đó q 4 là mômen trung tâm thứ tư của độ lớn X.

Để sử dụng biểu thức này, bạn cần thay thế các giá trị \u003d 4 và D(ít nhất là những người thân thiết). Thay vì D bạn có thể sử dụng đánh giá của anh ấy D. Về nguyên tắc, mômen trung tâm thứ tư cũng có thể được thay thế bằng ước tính, ví dụ: giá trị có dạng:

nhưng sự thay thế như vậy sẽ cho độ chính xác cực kỳ thấp, vì nhìn chung, với số lượng thử nghiệm hạn chế, các khoảnh khắc bậc cao được xác định với sai số lớn. Tuy nhiên, trong thực tế thường xảy ra trường hợp loại luật phân bố số lượng X biết trước: chỉ có các tham số của nó là chưa biết. Sau đó bạn có thể thử biểu diễn μ 4 thông qua D.

Hãy lấy trường hợp phổ biến nhất, khi giá trị X phân bố theo quy luật thông thường. Sau đó, mômen trung tâm thứ tư của nó được thể hiện dưới dạng phân tán (xem Chương 6, tiểu mục 6.2);

và công thức (14.3.12) cho hoặc

Thay thế ẩn số vào (14.3.14) Dđánh giá của anh ấy D, chúng tôi nhận được: từ đâu

Khoảnh khắc μ 4 có thể được biểu thị thông qua D còn trong một số trường hợp khác, khi việc phân phối giá trị X là không bình thường, nhưng sự xuất hiện của nó được biết đến. Ví dụ, đối với định luật về mật độ đồng đều (xem Chương 5), chúng ta có:

trong đó (a, P) là khoảng mà định luật được xác định.

Kể từ đây,

Sử dụng công thức (14.3.12) ta có: chúng ta tìm thấy khoảng đâu

Trong trường hợp chưa biết loại định luật phân bố cho đại lượng 26, khi ước tính gần đúng giá trị a/), vẫn nên sử dụng công thức (14.3.16), trừ khi có lý do đặc biệt để tin rằng định luật này rất khác so với bình thường (có độ nhọn dương hoặc âm rõ rệt).

Nếu giá trị gần đúng a/) thu được bằng cách này hay cách khác thì chúng ta có thể xây dựng khoảng tin cậy cho phương sai giống như cách chúng ta xây dựng nó cho kỳ vọng toán học:

trong đó giá trị tùy thuộc vào xác suất p đã cho được tìm thấy theo bảng. 14.3.1.

Ví dụ 2. Tìm khoảng tin cậy xấp xỉ 80% cho phương sai của một biến ngẫu nhiên X theo các điều kiện của ví dụ 1, nếu biết rằng giá trị Xđược phân phối theo một quy luật gần với chuẩn mực.

Giải pháp. Giá trị vẫn giữ nguyên như trong bảng. 14.3.1:

Theo công thức (14.3.16)

Sử dụng công thức (14.3.18) chúng ta tìm được khoảng tin cậy:

Khoảng giá trị độ lệch chuẩn tương ứng: (0,21; 0,29).

14.4. Phương pháp chính xác để xây dựng khoảng tin cậy cho các tham số của biến ngẫu nhiên được phân phối theo luật chuẩn tắc

Trong tiểu mục trước, chúng ta đã xem xét các phương pháp gần đúng để xây dựng khoảng tin cậy cho kỳ vọng và phương sai toán học. Ở đây chúng tôi sẽ đưa ra ý tưởng về các phương pháp chính xác để giải quyết cùng một vấn đề. Chúng tôi nhấn mạnh rằng để tìm chính xác khoảng tin cậy nhất thiết phải biết trước dạng luật phân bố của đại lượng X, trong khi đó đối với việc áp dụng các phương pháp gần đúng thì điều này là không cần thiết.

Ý tưởng về các phương pháp chính xác để xây dựng khoảng tin cậy được đưa ra như sau. Bất kỳ khoảng tin cậy nào được tìm thấy từ một điều kiện biểu thị xác suất đáp ứng các bất đẳng thức nhất định, bao gồm ước tính mà chúng ta quan tâm ước tính khách quan thu được từ kinh nghiệm Luật phân bổ giá trị Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biết trong trường hợp tổng quát phụ thuộc vào các tham số chưa biết của đại lượng X. Tuy nhiên, đôi khi có thể truyền bất đẳng thức từ một biến ngẫu nhiên Trong các phần trước chúng ta đã xem xét vấn đề ước lượng một tham số chưa biếtđến một số chức năng khác của các giá trị quan sát được X p X 2, ..., X tr. luật phân phối không phụ thuộc vào các tham số chưa biết mà chỉ phụ thuộc vào số lượng thí nghiệm và loại luật phân phối số lượng X. Những loại biến ngẫu nhiên này đóng một vai trò quan trọng trong thống kê toán học; chúng đã được nghiên cứu chi tiết nhất cho trường hợp phân phối chuẩn của số lượng X.

Ví dụ, người ta đã chứng minh rằng với phân phối chuẩn của giá trị X biến ngẫu nhiên

tuân theo cái gọi là Luật phân bố sinh viên Với N- 1 bậc tự do; mật độ của định luật này có dạng

trong đó G(x) là hàm gamma đã biết:

Người ta cũng đã chứng minh rằng biến ngẫu nhiên

có "phân phối %2" với N- 1 bậc tự do (xem Chương 7), mật độ được biểu thị bằng công thức

Không tập trung vào đạo hàm của phân bố (14.4.2) và (14.4.4), chúng tôi sẽ chỉ ra cách chúng có thể được áp dụng khi xây dựng khoảng tin cậy cho các tham số ty D.

Hãy để nó được sản xuất N thí nghiệm độc lập trên một biến ngẫu nhiên X, phân phối chuẩn với các tham số chưa biết ĐẾN.Đối với các tham số này, ước tính đã thu được

Cần xây dựng khoảng tin cậy cho cả hai tham số tương ứng với xác suất tin cậy p.

Trước tiên chúng ta hãy xây dựng khoảng tin cậy cho kỳ vọng toán học. Điều tự nhiên là lấy khoảng này đối xứng với T; gọi s p biểu thị một nửa độ dài của khoảng. Giá trị s p phải được chọn sao cho điều kiện được thỏa mãn

Hãy thử di chuyển về phía bên trái của đẳng thức (14.4.5) từ biến ngẫu nhiên Tđến một biến ngẫu nhiên T,được phân phối theo luật Sinh viên. Để làm điều này, hãy nhân cả hai vế của bất đẳng thức |m-w?|

bằng giá trị dương: hoặc, sử dụng ký hiệu (14.4.1),

Hãy tìm một số /p sao cho có thể tìm được giá trị /p từ điều kiện

Từ công thức (14.4.2) rõ ràng (1) là hàm chẵn, do đó (14.4.8) cho

Đẳng thức (14.4.9) xác định giá trị /p tùy thuộc vào p. Nếu bạn có sẵn một bảng các giá trị tích phân

thì giá trị của /p có thể được tìm thấy bằng phép nội suy ngược trong bảng. Tuy nhiên, sẽ thuận tiện hơn nếu lập trước một bảng giá trị /p. Bảng như vậy được đưa ra trong Phụ lục (Bảng 5). Bảng này hiển thị các giá trị tùy thuộc vào mức độ tin cậy p và số bậc tự do N- 1. Đã xác định được /p từ bảng. 5 và giả sử

chúng ta sẽ tìm thấy một nửa chiều rộng của khoảng tin cậy / p và chính khoảng đó

Ví dụ 1. Thực hiện 5 thí nghiệm độc lập trên một biến ngẫu nhiên X, phân phối chuẩn với các tham số chưa biết T và ô. Kết quả thí nghiệm được cho trong bảng. 14.4.1.

Bảng 14.4.1

Tìm xếp hạng T cho kỳ vọng toán học và xây dựng khoảng tin cậy 90% / p cho nó (tức là khoảng tương ứng với xác suất tin cậy p = 0,9).

Giải pháp. Chúng tôi có:

Theo bảng 5 của hồ sơ xin cấp P - 1 = 4 và p = 0,9 ta tìm được Ở đâu

Khoảng tin cậy sẽ là

Ví dụ 2. Đối với điều kiện của ví dụ 1 tiểu mục 14.3, giả sử giá trị X có phân phối chuẩn, hãy tìm khoảng tin cậy chính xác.

Giải pháp. Theo bảng 5 của phụ lục chúng ta thấy khi P - 1 = 19ir =

0,8/p = 1,328; từ đây

So sánh với cách giải ví dụ 1 của tiểu mục 14.3 (e p = 0,072), chúng tôi tin rằng sự khác biệt là rất không đáng kể. Nếu chúng ta duy trì độ chính xác đến chữ số thập phân thứ hai thì khoảng tin cậy được tìm bằng phương pháp chính xác và gần đúng sẽ trùng nhau:

Hãy chuyển sang xây dựng khoảng tin cậy cho phương sai. Hãy xem xét công cụ ước tính phương sai không thiên vị

và biểu thị biến ngẫu nhiên D thông qua độ lớn V.(14.4.3), có phân phối x 2 (14.4.4):

Biết định luật phân bố số lượng V, bạn có thể tìm khoảng /(1) mà nó rơi vào với xác suất p cho trước.

Luật phân phối kn_x(v) cường độ I 7 có dạng như hình 2. 14.4.1.

Cơm. 14.4.1

Câu hỏi đặt ra: làm thế nào để chọn khoảng / p? Nếu định luật phân bố độ lớn V. là đối xứng (như luật chuẩn hoặc phân phối Sinh viên), sẽ là điều tự nhiên nếu lấy khoảng /p đối xứng với kỳ vọng toán học. Trong trường hợp này pháp luật k p_x (v) không đối xứng. Chúng ta hãy đồng ý chọn khoảng /p sao cho xác suất của giá trị đó là V. ngoài khoảng bên phải và bên trái (các vùng được tô bóng trong Hình 14.4.1) đều giống nhau và bằng nhau

Để xây dựng một khoảng /p với thuộc tính này, chúng ta sử dụng bảng. 4 ứng dụng: nó chứa số y) như vậy

cho giá trị V, có phân phối x 2 với r bậc tự do. Trong trường hợp của chúng tôi r = n- 1. Hãy sửa chữa r = n- 1 và tìm ở hàng tương ứng của bảng. 4 hai ý nghĩa x 2 - cái này tương ứng với xác suất cái kia - xác suất Hãy để chúng tôi biểu thị những điều này

giá trị lúc 2 giờxl? Khoảng thời gian có năm 2, với bên trái của bạn, và y~ cuối bên phải.

Bây giờ, hãy tìm từ khoảng / p khoảng tin cậy mong muốn /|, cho độ phân tán có ranh giới D, và D2, bao gồm điểm D với xác suất p:

Chúng ta hãy xây dựng một khoảng / (, = (?> ь А) bao hàm điểm D khi và chỉ khi giá trị V. rơi vào khoảng /r. Hãy chứng minh rằng khoảng

thỏa mãn điều kiện này. Thật vậy, những bất bình đẳng tương đương với bất đẳng thức

và những bất đẳng thức này được thỏa mãn với xác suất p. Như vậy, khoảng tin cậy cho phương sai đã được tìm thấy và được biểu thị bằng công thức (14.4.13).

Ví dụ 3. Tìm khoảng tin cậy cho phương sai theo điều kiện của ví dụ 2 mục 14.3, nếu biết giá trị Xđược phân phối bình thường.

Giải pháp. chúng tôi có . Theo bảng 4 phụ lục

chúng tôi tìm thấy ở r = n - 1 = 19

Sử dụng công thức (14.4.13) chúng ta tìm được khoảng tin cậy cho phương sai

Khoảng tương ứng cho độ lệch chuẩn là (0,21; 0,32). Khoảng này chỉ vượt quá một chút khoảng (0,21; 0,29) thu được trong ví dụ 2 của tiểu mục 14.3 bằng phương pháp gần đúng.

  • Hình 14.3.1 xét một khoảng tin cậy đối xứng về a. Nói chung, như chúng ta sẽ thấy sau, điều này là không cần thiết.

Hãy xây dựng khoảng tin cậy trong MS EXCEL để ước tính giá trị trung bình của phân bố trong trường hợp giá trị phân tán đã biết.

Tất nhiên sự lựa chọn mức độ tin cậy hoàn toàn phụ thuộc vào vấn đề đang được giải quyết. Do đó, mức độ tin cậy của hành khách hàng không vào độ tin cậy của máy bay chắc chắn phải cao hơn mức độ tin cậy của người mua vào độ tin cậy của bóng đèn điện.

Xây dựng vấn đề

Chúng ta hãy giả sử rằng từ dân sốđã được thực hiện vật mẫu kích thước n. Người ta cho rằng độ lệch chuẩn sự phân bố này đã được biết. Nó là cần thiết dựa trên điều này mẫuđánh giá những điều chưa biết trung bình phân phối(μ, ) và xây dựng tương ứng hai mặt khoảng tin cậy.

Ước tính điểm

Như đã biết từ thống kê(hãy ký hiệu nó X trung bình) là ước tính không chệch của giá trị trung bình cái này dân số và có phân phối N(μ;σ 2 /n).

Ghi chú: Phải làm gì nếu bạn cần xây dựng khoảng tin cậy trong trường hợp phân phối không phải Bình thường? Trong trường hợp này, cần có sự giải cứu, trong đó nói rằng với kích thước đủ lớn mẫu n từ phân phối không tồn tại Bình thường, phân phối mẫu thống kê X trung bình sẽ khoảng tương ứng phân phối bình thường với tham số N(μ;σ 2 /n).

Vì thế, ước tính điểm trung bình giá trị phân phối chúng tôi có - cái này ý nghĩa mẫu, tức là X trung bình. Bây giờ hãy bắt đầu khoảng tin cậy.

Xây dựng khoảng tin cậy

Thông thường, khi biết phân bố và các tham số của nó, chúng ta có thể tính xác suất để biến ngẫu nhiên nhận một giá trị từ khoảng mà chúng ta chỉ định. Bây giờ hãy làm ngược lại: tìm khoảng mà biến ngẫu nhiên sẽ rơi với một xác suất cho trước. Ví dụ, từ thuộc tính phân phối bình thườngđược biết rằng với xác suất 95%, một biến ngẫu nhiên được phân phối trên luật thông thường, sẽ nằm trong khoảng +/- 2 từ giá trị trung bình(xem bài viết về). Khoảng thời gian này sẽ đóng vai trò là nguyên mẫu cho chúng ta khoảng tin cậy.

Bây giờ hãy xem liệu chúng ta có biết cách phân phối , để tính khoảng này? Để trả lời câu hỏi, chúng ta phải chỉ ra hình dạng của phân bố và các tham số của nó.

Chúng tôi biết hình thức phân phối - đây là phân phối bình thường(hãy nhớ rằng chúng ta đang nói về phân phối mẫu thống kê X trung bình).

Chúng tôi chưa biết tham số μ (nó chỉ cần được ước tính bằng cách sử dụng khoảng tin cậy), nhưng chúng tôi có ước tính về nó X trung bình, tính toán dựa trên mẫu, có thể được sử dụng.

Tham số thứ hai - độ lệch chuẩn của giá trị trung bình mẫu chúng tôi sẽ coi như nó đã được biết, nó bằng σ/√n.

Bởi vì chúng ta không biết μ thì chúng ta sẽ xây dựng khoảng +/- 2 độ lệch chuẩn không phải từ giá trị trung bình và từ ước tính đã biết của nó X trung bình. Những thứ kia. khi tính toán khoảng tin cậy chúng tôi sẽ KHÔNG cho rằng X trung bình nằm trong phạm vi +/- 2 độ lệch chuẩn từ μ với xác suất là 95% và chúng ta sẽ giả sử rằng khoảng đó là +/- 2 độ lệch chuẩn từ X trung bình với xác suất 95% nó sẽ bao phủ μ - mức trung bình của dân số nói chung, từ đó nó được lấy vật mẫu. Hai câu lệnh này tương đương nhau, nhưng câu lệnh thứ hai cho phép chúng ta xây dựng khoảng tin cậy.

Ngoài ra, chúng ta hãy làm rõ khoảng: một biến ngẫu nhiên được phân bổ trên luật thông thường, với xác suất 95% nằm trong khoảng +/- 1,960 độ lệch chuẩn, không phải +/- 2 độ lệch chuẩn. Điều này có thể được tính bằng công thức =NORM.ST.REV((1+0,95)/2),cm. tập tin ví dụ Khoảng thời gian trang tính.

Bây giờ chúng ta có thể xây dựng một phát biểu xác suất sẽ giúp chúng ta hình thành khoảng tin cậy:
“Xác suất đó dân số trung bình nằm từ mẫu trung bình trong vòng 1.960" độ lệch chuẩn của giá trị trung bình mẫu", bằng 95%.

Giá trị xác suất được đề cập trong câu lệnh có tên đặc biệt , được liên kết với mức ý nghĩa α (alpha) bằng một biểu thức đơn giản mức độ tin cậy =1 . Trong trường hợp của chúng tôi mức ý nghĩa α =1-0,95=0,05 .

Bây giờ, dựa trên tuyên bố xác suất này, chúng ta viết một biểu thức để tính khoảng tin cậy:

trong đó Z α/2 tiêu chuẩn phân phối bình thường(giá trị này của biến ngẫu nhiên z, Cái gì P(z>=Z α/2 )=α/2).

Ghi chú: Lượng tử α/2 trên xác định chiều rộng khoảng tin cậy V. độ lệch chuẩn trung bình mẫu. Lượng tử α/2 trên tiêu chuẩn phân phối bình thường luôn lớn hơn 0, điều này rất thuận tiện.

Trong trường hợp của chúng tôi, với α=0,05, lượng tử α/2 trên bằng 1,960. Đối với các mức ý nghĩa khác α (10%; 1%) lượng tử α/2 trên Z α/2 có thể được tính bằng công thức =NORM.ST.REV(1-α/2) hoặc, nếu biết mức độ tin cậy, =NORM.ST.OBR((1+mức độ tin cậy)/2).

Thông thường khi xây dựng khoảng tin cậy để ước tính giá trị trung bình chỉ sử dụng trên α/2-lượng tử và không sử dụng thấp hơn/2-lượng tử. Điều này là có thể bởi vì tiêu chuẩn phân phối bình thườngđối xứng qua trục x ( mật độ phân bố của nóđối xứng về trung bình, tức là 0). Vì vậy, không cần phải tính toán lượng tử α/2 thấp hơn(nó được gọi đơn giản là α /2-phân vị), bởi vì nó bằng nhau trên α/2-lượng tử bằng dấu trừ.

Chúng ta hãy nhớ lại rằng, mặc dù hình dạng phân bố của giá trị x, biến ngẫu nhiên tương ứng X trung bình phân phối khoảng Khỏe N(μ;σ 2 /n) (xem bài viết về). Do đó, nói chung, biểu thức trên cho khoảng tin cậy chỉ là một sự gần đúng. Nếu giá trị x được phân phối trên luật thông thường N(μ;σ 2 /n), thì biểu thức của khoảng tin cậy là chính xác.

Tính khoảng tin cậy trong MS EXCEL

Hãy giải quyết vấn đề.
Thời gian đáp ứng của linh kiện điện tử với tín hiệu đầu vào là một đặc tính quan trọng của thiết bị. Một kỹ sư muốn xây dựng khoảng tin cậy cho thời gian phản hồi trung bình ở mức tin cậy 95%. Từ kinh nghiệm trước đây, người kỹ sư biết rằng độ lệch chuẩn của thời gian đáp ứng là 8 ms. Được biết, để đánh giá thời gian phản hồi, kỹ sư đã thực hiện 25 phép đo, giá trị trung bình là 78 ​​ms.

Giải pháp: Một kỹ sư muốn biết thời gian phản hồi của một thiết bị điện tử, nhưng anh ta hiểu rằng thời gian phản hồi không phải là một giá trị cố định mà là một biến ngẫu nhiên có phân bố riêng. Vì vậy, điều tốt nhất anh ta có thể hy vọng là xác định được các tham số và hình dạng của phân bố này.

Thật không may, từ các điều kiện của vấn đề, chúng ta không biết hình dạng của sự phân bố thời gian đáp ứng (không nhất thiết phải như vậy). Bình thường). , sự phân bố này cũng chưa được biết. Chỉ có anh ấy được biết độ lệch chuẩnσ=8. Vì vậy, trong khi chúng ta không thể tính toán xác suất và xây dựng khoảng tin cậy.

Tuy nhiên, mặc dù thực tế là chúng ta không biết sự phân bố thời gian phản ứng riêng biệt, chúng tôi biết rằng theo CPT, phân phối mẫu thời gian phản hồi trung bình xấp xỉ Bình thường(Chúng ta sẽ giả sử rằng các điều kiện CPTđược thực hiện, bởi vì kích cỡ mẫu khá lớn (n=25)) .

Hơn thế nữa, trung bình sự phân phối này bằng giá trị trung bình phân phối một phản hồi duy nhất, tức là μ. MỘT độ lệch chuẩn của phân phối này (σ/√n) có thể được tính bằng công thức =8/ROOT(25) .

Người ta cũng biết rằng người kỹ sư đã nhận được ước tính điểm tham số μ bằng 78 ms (X avg). Vì vậy, bây giờ chúng ta có thể tính xác suất, bởi vì chúng ta biết hình thức phân phối ( Bình thường) và các tham số của nó (X avg và σ/√n).

Kỹ sư muốn biết kỳ vọng toán họcμ phân phối thời gian đáp ứng. Như đã nêu ở trên, μ này bằng kỳ vọng toán học của phân bố mẫu của thời gian phản hồi trung bình. Nếu chúng ta sử dụng phân phối bình thường N(Х avg; σ/√n), thì μ mong muốn sẽ nằm trong phạm vi +/-2*σ/√n với xác suất xấp xỉ 95%.

Mức ý nghĩa bằng 1-0,95=0,05.

Cuối cùng chúng ta tìm đường viền trái và phải khoảng tin cậy.
Biên giới bên trái: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Biên giới bên phải: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

Biên giới bên trái: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Biên giới bên phải: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Trả lời: khoảng tin cậy Tại mức độ tin cậy 95% và σ=8mili giây bằng 78+/-3,136 mili giây.

TRONG tập tin ví dụ trên bảng Sigmađã biết, tạo hình thức tính toán và xây dựng hai mặt khoảng tin cậy tùy ý mẫu với σ đã cho và mức độ quan trọng.

Hàm CONFIDENCE.NORM()

Nếu các giá trị mẫu nằm trong phạm vi B20:B79 , MỘT mức ý nghĩa bằng 0,05; thì công thức MS EXCEL:
=AVERAGE(B20:B79)-CONFIDENCE.NORM(0,05;σ; COUNT(B20:B79))
sẽ trả lại đường viền bên trái khoảng tin cậy.

Giới hạn tương tự có thể được tính bằng công thức:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

Ghi chú: Hàm CONFIDENCE.NORM() xuất hiện trong MS EXCEL 2010. Trong các phiên bản trước của MS EXCEL, hàm TRUST() đã được sử dụng.

KHOẢNG TIN CẬY CHO TẦN SỐ VÀ PHÂN SỐ

© 2008

Viện Y tế Công cộng Quốc gia, Oslo, Na Uy

Bài báo mô tả và thảo luận việc tính khoảng tin cậy cho tần số và tỷ lệ bằng phương pháp Wald, Wilson, Clopper - Pearson, sử dụng phép biến đổi góc và phương pháp Wald với hiệu chỉnh Agresti - Coull. Tài liệu được trình bày cung cấp thông tin chung về các phương pháp tính khoảng tin cậy cho tần số và tỷ lệ, đồng thời nhằm khơi dậy sự quan tâm của độc giả tạp chí không chỉ trong việc sử dụng khoảng tin cậy khi trình bày kết quả nghiên cứu của riêng họ mà còn trong việc đọc tài liệu chuyên ngành trước khi bắt đầu công việc. về các ấn phẩm trong tương lai.

Từ khóa: khoảng tin cậy, tần suất, tỷ lệ

Một trong những ấn phẩm trước đây đã đề cập ngắn gọn về mô tả dữ liệu định tính và báo cáo rằng ước tính khoảng của chúng thích hợp hơn ước tính điểm để mô tả tần suất xuất hiện của đặc điểm đang được nghiên cứu trong dân số. Thật vậy, vì nghiên cứu được tiến hành bằng cách sử dụng dữ liệu mẫu, nên việc dự đoán kết quả lên tổng thể phải chứa đựng yếu tố lấy mẫu không chính xác. Khoảng tin cậy là thước đo độ chính xác của tham số được ước tính. Điều thú vị là một số cuốn sách về thống kê cơ bản dành cho bác sĩ hoàn toàn bỏ qua chủ đề về khoảng tin cậy đối với tần số. Trong bài viết này, chúng ta sẽ xem xét một số cách để tính khoảng tin cậy cho tần số, ngụ ý các đặc điểm của mẫu như không lặp lại và tính đại diện, cũng như tính độc lập của các quan sát với nhau. Trong bài viết này, tần số được hiểu không phải là một con số tuyệt đối cho biết số lần một giá trị cụ thể xuất hiện trong tổng thể, mà là một giá trị tương đối xác định tỷ lệ những người tham gia nghiên cứu xuất hiện đặc điểm được nghiên cứu.

Trong nghiên cứu y sinh, khoảng tin cậy 95% được sử dụng phổ biến nhất. Khoảng tin cậy này là vùng trong đó tỷ lệ thực rơi vào 95%. Nói cách khác, chúng ta có thể nói với độ tin cậy 95% rằng giá trị thực của tần suất xuất hiện một tính trạng trong quần thể sẽ nằm trong khoảng tin cậy 95%.

Hầu hết các sổ tay thống kê dành cho các nhà nghiên cứu y học đều báo cáo rằng sai số tần số được tính bằng công thức

trong đó p là tần suất xuất hiện của đặc tính trong mẫu (giá trị từ 0 đến 1). Hầu hết các bài báo khoa học trong nước đều chỉ ra tần suất xuất hiện của một tính trạng trong mẫu (p), cũng như (các) lỗi của nó ở dạng p ± s. Tuy nhiên, sẽ thích hợp hơn khi đưa ra khoảng tin cậy 95% cho tần suất xuất hiện của một đặc điểm trong quần thể, khoảng này sẽ bao gồm các giá trị từ

ĐẾN.

Một số hướng dẫn khuyến nghị rằng đối với các mẫu nhỏ, hãy thay giá trị 1,96 bằng giá trị t cho N – 1 bậc tự do, trong đó N là số lượng quan sát trong mẫu. Giá trị t được tìm thấy bằng cách sử dụng các bảng phân bố t, có sẵn trong hầu hết các sách giáo khoa thống kê. Việc sử dụng phân phối t cho phương pháp Wald không mang lại lợi ích rõ ràng so với các phương pháp khác được thảo luận dưới đây và do đó không được một số tác giả khuyến nghị.

Phương pháp được trình bày ở trên để tính khoảng tin cậy cho tần suất hoặc tỷ lệ được đặt tên là Wald để vinh danh Abraham Wald (1902–1950), vì nó được sử dụng rộng rãi sau khi Wald và Wolfowitz xuất bản năm 1939. Tuy nhiên, phương pháp này đã được Pierre Simon Laplace (1749–1827) đề xuất vào năm 1812.

Phương pháp Wald rất phổ biến, nhưng việc áp dụng nó có nhiều vấn đề nghiêm trọng. Phương pháp này không được khuyến nghị sử dụng cho cỡ mẫu nhỏ, cũng như trong trường hợp tần suất xuất hiện của một đặc tính có xu hướng bằng 0 hoặc 1 (0% hoặc 100%) và đơn giản là không thể áp dụng được đối với tần số 0 và 1. Ngoài ra, phương pháp này không được khuyến nghị sử dụng cho các cỡ mẫu nhỏ. xấp xỉ phân phối chuẩn, được sử dụng khi tính toán sai số, “không có tác dụng” trong trường hợp n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Vì biến mới có phân phối chuẩn nên giới hạn dưới và giới hạn trên của khoảng tin cậy 95% cho biến φ sẽ là φ-1,96 và φ+1,96left">

Thay vì 1,96 đối với các mẫu nhỏ, nên thay giá trị t cho N – 1 bậc tự do. Phương pháp này không tạo ra giá trị âm và cho phép ước tính chính xác hơn khoảng tin cậy cho tần số so với phương pháp Wald. Ngoài ra, nó được mô tả trong nhiều sách tham khảo trong nước về thống kê y tế, tuy nhiên, điều này không dẫn đến việc sử dụng rộng rãi trong nghiên cứu y học. Việc tính toán khoảng tin cậy sử dụng phép biến đổi góc không được khuyến nghị cho các tần số tiến gần đến 0 hoặc 1.

Đây là nơi thường kết thúc phần mô tả các phương pháp ước tính khoảng tin cậy trong hầu hết các cuốn sách về cơ sở thống kê dành cho các nhà nghiên cứu y học, và vấn đề này không chỉ điển hình đối với văn học trong nước mà còn đối với văn học nước ngoài. Cả hai phương pháp đều dựa trên định lý giới hạn trung tâm, trong đó hàm ý một mẫu lớn.

Cân nhắc những thiếu sót trong việc ước tính khoảng tin cậy bằng các phương pháp trên, Clopper và Pearson đã đề xuất vào năm 1934 một phương pháp tính toán cái gọi là khoảng tin cậy chính xác, dựa trên phân bố nhị thức của tính trạng đang được nghiên cứu. Phương pháp này có sẵn trong nhiều máy tính trực tuyến, nhưng khoảng tin cậy thu được theo cách này trong hầu hết các trường hợp quá rộng. Đồng thời, phương pháp này được khuyến khích sử dụng trong trường hợp cần đánh giá thận trọng. Mức độ bảo toàn của phương pháp tăng khi cỡ mẫu giảm, đặc biệt khi N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Theo nhiều nhà thống kê, việc đánh giá khoảng tin cậy tần số tối ưu nhất được thực hiện bằng phương pháp Wilson, được đề xuất vào năm 1927, nhưng thực tế không được sử dụng trong nghiên cứu y sinh trong nước. Phương pháp này không chỉ cho phép ước tính khoảng tin cậy cho cả tần số rất nhỏ và rất lớn mà còn có thể áp dụng cho một số lượng nhỏ các quan sát. Nói chung, khoảng tin cậy theo công thức Wilson có dạng



trong đó lấy giá trị 1,96 khi tính khoảng tin cậy 95%, N là số lượng quan sát và p là tần suất xuất hiện của đặc tính trong mẫu. Phương pháp này có sẵn trên các máy tính trực tuyến nên việc sử dụng nó không có vấn đề gì. và không khuyến khích sử dụng phương pháp này cho n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Ngoài phương pháp Wilson, phương pháp Wald với hiệu chỉnh Agresti–Coll cũng được cho là mang lại ước tính tối ưu về khoảng tin cậy cho tần số. Hiệu chỉnh Agresti-Coll là sự thay thế trong công thức Wald về tần suất xuất hiện của một đặc tính trong mẫu (p) bằng p`, khi tính 2 nào được thêm vào tử số và 4 được thêm vào mẫu số, nghĩa là, p` = (X + 2) / (N + 4), trong đó X là số lượng người tham gia nghiên cứu có đặc điểm đang được nghiên cứu và N là cỡ mẫu. Việc sửa đổi này tạo ra kết quả rất giống với công thức Wilson, ngoại trừ khi tần suất sự kiện đạt tới 0% hoặc 100% và mẫu nhỏ. Ngoài các phương pháp tính toán khoảng tin cậy cho tần số ở trên, việc hiệu chỉnh tính liên tục đã được đề xuất cho cả phương pháp Wald và Wilson cho các mẫu nhỏ, nhưng các nghiên cứu đã chỉ ra rằng việc sử dụng chúng là không phù hợp.

Hãy xem xét việc áp dụng các phương pháp trên để tính khoảng tin cậy bằng hai ví dụ. Trong trường hợp đầu tiên, chúng tôi nghiên cứu một mẫu lớn gồm 1.000 người tham gia nghiên cứu được chọn ngẫu nhiên, trong đó 450 người có đặc điểm đang được nghiên cứu (đây có thể là yếu tố rủi ro, kết quả hoặc bất kỳ đặc điểm nào khác), đại diện cho tần số 0,45 hoặc 45 %. Trong trường hợp thứ hai, nghiên cứu được thực hiện bằng cách sử dụng một mẫu nhỏ, chẳng hạn như chỉ 20 người và chỉ 1 người tham gia nghiên cứu (5%) có đặc điểm được nghiên cứu. Khoảng tin cậy sử dụng phương pháp Wald, phương pháp Wald với hiệu chỉnh Agresti–Coll và phương pháp Wilson được tính toán bằng máy tính trực tuyến do Jeff Sauro phát triển (//www. /wald. htm). Khoảng tin cậy được điều chỉnh liên tục của Wilson được tính toán bằng máy tính do Wassar Stats cung cấp: Trang web tính toán thống kê (http://faculty.vassar.edu/lowry/prop1.html). Các phép tính biến đổi góc Fisher được thực hiện thủ công bằng cách sử dụng giá trị t tới hạn tương ứng là 19 và 999 bậc tự do. Kết quả tính toán được trình bày trong bảng cho cả hai ví dụ.

Khoảng tin cậy được tính theo sáu cách khác nhau cho hai ví dụ được mô tả trong văn bản

Phương pháp tính khoảng tin cậy

P=0,0500 hoặc 5%

CI 95% cho X=450, N=1000, P=0,4500 hoặc 45%

–0,0455–0,2541

Wald với hiệu chỉnh Agresti–Coll

<,0001–0,2541

Wilson với hiệu chỉnh liên tục

Clopper–Pearson "phương pháp chính xác"

Phép biến đổi góc

<0,0001–0,1967

Như có thể thấy từ bảng, trong ví dụ đầu tiên, khoảng tin cậy được tính bằng phương pháp Wald “được chấp nhận chung” sẽ đi vào vùng âm, điều này không thể xảy ra đối với tần số. Thật không may, những sự việc như vậy không phải là hiếm trong văn học Nga. Cách trình bày dữ liệu truyền thống về mặt tần suất và lỗi của nó phần nào che giấu vấn đề này. Ví dụ: nếu tần suất xuất hiện của một đặc điểm (tính bằng phần trăm) được trình bày là 2,1 ± 1,4 thì điều này không “gây khó chịu cho mắt” bằng 2,1% (KTC 95%: –0,7; 4,9), mặc dù và có nghĩa là điều tương tự. Phương pháp Wald với hiệu chỉnh và tính toán Agresti–Coll sử dụng phép biến đổi góc cho giới hạn dưới có xu hướng bằng 0. Phương pháp hiệu chỉnh liên tục của Wilson và "phương pháp chính xác" tạo ra khoảng tin cậy rộng hơn phương pháp Wilson. Đối với ví dụ thứ hai, tất cả các phương pháp đều cho khoảng tin cậy gần như nhau (sự khác biệt chỉ xuất hiện ở phần nghìn), điều này không có gì đáng ngạc nhiên, vì tần suất xuất hiện của sự kiện trong ví dụ này không khác nhiều so với 50% và cỡ mẫu là khá lớn.

Đối với những độc giả quan tâm đến vấn đề này, chúng tôi có thể giới thiệu các tác phẩm của R. G. Newcombe và Brown, Cai và Dasgupta, trong đó đưa ra những ưu và nhược điểm của việc sử dụng 7 và 10 phương pháp khác nhau để tính khoảng tin cậy tương ứng. Trong số các sách hướng dẫn trong nước, chúng tôi đề xuất cuốn sách, ngoài phần mô tả chi tiết về lý thuyết, còn trình bày các phương pháp của Wald và Wilson, cũng như phương pháp tính khoảng tin cậy có tính đến phân bố tần số nhị thức. Ngoài các máy tính trực tuyến miễn phí (http://www. /wald.htm và http://faculty.vassar.edu/lowry/prop1.html), khoảng tin cậy cho tần số (và không chỉ!) có thể được tính bằng cách sử dụng công thức Chương trình CIA ( Phân tích khoảng tin cậy), có thể tải xuống từ http://www. medschool. soton. ac. anh/cia/ .

Bài viết tiếp theo sẽ xem xét các cách đơn biến để so sánh dữ liệu định tính.

Tài liệu tham khảo

Banerji A. Thống kê y tế bằng ngôn ngữ rõ ràng: khóa học giới thiệu / A. Banerjee. – M.: Y học thực hành, 2007. – 287 tr. Thống kê y tế / . – M.: Cơ quan Thông tin Y tế, 2007. – 475 tr. Glanz S. Thống kê y học và sinh học / S. Glanz. – M.: Praktika, 1998. Các loại dữ liệu, kiểm tra phân phối và thống kê mô tả // Sinh thái con người – 2008. – Số 1. – P. 52–58. Zhizhin K. S.. Thống kê y tế: sách giáo khoa/. – Rostov n/d: Phoenix, 2007. – 160 tr. Thống kê y học ứng dụng / , . – St.Petersburg. : Foliot, 2003. – 428 tr. Lakin G.F. Sinh trắc học / . – M.: Trường trung học, 1990. – 350 tr. Bác sĩ V. A. Thống kê toán học trong y học / , . – M.: Tài chính và Thống kê, 2007. – 798 tr. Thống kê toán học trong nghiên cứu lâm sàng / , . – M.: GEOTAR-MED, 2001. – 256 tr. Junkerov V. . Xử lý y tế và thống kê dữ liệu nghiên cứu y học / , . – St.Petersburg. : VmedA, 2002. – 266 tr. Agresti A.Ước tính gần đúng tốt hơn chính xác trong ước tính khoảng của tỷ lệ nhị thức / A. Agresti, B. Coull // Nhà thống kê người Mỹ. – 1998. – N 52. – P. 119–126. Altman D. Thống kê đáng tin cậy // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Luân Đôn: BMJ Books, 2000. – 240 tr. Brown L.D.Ước lượng khoảng cho tỷ lệ nhị thức / L. D. Brown, T. T. Cai, A. Dasgupta // Khoa học thống kê. – 2001. – N 2. – P. 101–133. Clopper C. J. Việc sử dụng các giới hạn tin cậy hoặc chuẩn được minh họa trong trường hợp nhị thức / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. Garcia-Perez M.A. Về khoảng tin cậy cho tham số nhị thức / M. A. Garcia-Perez // Chất lượng và số lượng. – 2005. – N 39. – P. 467–481. Motulsky H. Thống kê sinh học trực quan // H. Motulsky. – Oxford: Nhà xuất bản Đại học Oxford, 1995. – 386 tr. Newcombe R. G. Khoảng tin cậy hai mặt cho tỷ lệ đơn: So sánh bảy phương pháp / R. G. Newcombe // Thống kê trong y học. – 1998. – N. 17. – P. 857–872. Sauro J.Ước tính tỷ lệ hoàn thành từ các mẫu nhỏ sử dụng khoảng tin cậy nhị thức: so sánh và khuyến nghị / J. Sauro, J. R. Lewis // Kỷ yếu cuộc họp thường niên của xã hội về yếu tố con người và công thái học. – Orlando, FL, 2005. Wald A. Giới hạn tin cậy cho các hàm phân phối liên tục // A. Wald, J. Wolfovitz // Biên niên sử về thống kê toán học. – 1939. – N 10. – P. 105–118. Wilson E.B. Suy luận có thể xảy ra, quy luật kế thừa và suy luận thống kê / E. B. Wilson // Tạp chí của Hiệp hội Thống kê Hoa Kỳ. – 1927. – N 22. – P. 209–212.

KHOẢNG TIN CẬY CHO TỶ LỆ

MỘT. M. Grjibovski

Viện Y tế Công cộng Quốc gia, Oslo, Na Uy

Bài báo trình bày một số phương pháp tính khoảng tin cậy của tỷ lệ nhị thức, cụ thể là phương pháp Wald, Wilson, arcsine, Agresti-Coull và phương pháp chính xác Clopper-Pearson. Bài viết chỉ giới thiệu khái quát về vấn đề ước lượng khoảng tin cậy của tỷ lệ nhị thức và mục đích của nó không chỉ là khuyến khích người đọc sử dụng khoảng tin cậy khi trình bày kết quả nghiên cứu thực nghiệm của mình mà còn khuyến khích họ tham khảo sách thống kê. trước khi phân tích dữ liệu của chính mình và chuẩn bị bản thảo.

Từ khóa: khoảng tin cậy, tỷ lệ

Thông tin liên hệ:

Cố vấn cấp cao, Viện Y tế Công cộng Quốc gia, Oslo, Na Uy

Khoảng tin cậy.

Việc tính toán khoảng tin cậy dựa trên sai số trung bình của tham số tương ứng. Khoảng tin cậy cho thấy giá trị thực của tham số ước tính nằm trong giới hạn nào với xác suất (1-a). Ở đây a là mức ý nghĩa, (1-a) còn được gọi là xác suất tin cậy.

Trong chương đầu tiên, chúng tôi đã chỉ ra rằng, ví dụ, đối với trung bình số học, trung bình tổng thể thực sự trong khoảng 95% trường hợp nằm trong khoảng 2 sai số chuẩn của giá trị trung bình. Do đó, ranh giới của khoảng tin cậy 95% đối với giá trị trung bình sẽ được tách khỏi giá trị trung bình mẫu bằng hai lần sai số trung bình của giá trị trung bình, tức là chúng tôi nhân sai số trung bình của giá trị trung bình với một hệ số nhất định tùy thuộc vào mức độ tin cậy. Đối với mức trung bình và chênh lệch của các mức trung bình, hệ số Sinh viên (giá trị tới hạn của bài kiểm tra của Sinh viên) được lấy, đối với tỷ lệ và chênh lệch cổ phần, giá trị tới hạn của tiêu chí z. Tích của hệ số và sai số trung bình có thể được gọi là sai số tối đa của một tham số nhất định, tức là mức tối đa mà chúng ta có thể đạt được khi đánh giá nó.

Khoảng tin cậy cho trung bình số học : .

Đây là giá trị trung bình mẫu;

Sai số trung bình của giá trị trung bình số học;

s –độ lệch chuẩn mẫu;

N

f = n-1 (Hệ số sinh viên).

Khoảng tin cậy cho sự khác biệt của phương tiện số học :

Đây là sự khác biệt giữa các phương tiện mẫu;

- sai số trung bình của chênh lệch giữa các trung bình số học;

s 1 , s 2 –độ lệch chuẩn mẫu;

n1,n2

Giá trị tới hạn của bài kiểm tra của Học sinh đối với mức ý nghĩa a cho trước và số bậc tự do f=n 1 +n 2-2 (Hệ số sinh viên).

Khoảng tin cậy cho cổ phần :

.

Ở đây d là phần mẫu;

– sai số phân số trung bình;

N- cỡ mẫu (cỡ nhóm);

Khoảng tin cậy cho chênh lệch cổ phiếu :

Đây là sự khác biệt về chia sẻ mẫu;

- sai số trung bình của chênh lệch giữa các trung bình số học;

n1,n2- khối lượng mẫu (số lượng nhóm);

Giá trị tới hạn của tiêu chí z ở mức ý nghĩa cho trước a ( , , ).

Bằng cách tính toán khoảng tin cậy cho sự khác biệt giữa các chỉ số, trước tiên, chúng tôi trực tiếp nhìn thấy các giá trị có thể có của hiệu ứng chứ không chỉ ước tính điểm của nó. Thứ hai, chúng ta có thể rút ra kết luận về việc chấp nhận hay bác bỏ giả thuyết không và thứ ba, chúng ta có thể rút ra kết luận về độ hiệu quả của phép thử.

Khi kiểm tra các giả thuyết bằng khoảng tin cậy, bạn phải tuân thủ quy tắc sau:

Nếu khoảng tin cậy 100(1-a) phần trăm của chênh lệch về giá trị trung bình không chứa số 0 thì sự khác biệt có ý nghĩa thống kê ở mức ý nghĩa a; ngược lại, nếu khoảng này chứa số 0 thì sự khác biệt không có ý nghĩa thống kê.

Thật vậy, nếu khoảng này chứa 0, điều đó có nghĩa là chỉ báo được so sánh có thể lớn hơn hoặc nhỏ hơn ở một trong các nhóm so với nhóm kia, tức là sự khác biệt quan sát được là do ngẫu nhiên.

Sức mạnh của bài kiểm tra có thể được đánh giá bằng vị trí của số 0 trong khoảng tin cậy. Nếu số 0 gần với giới hạn dưới hoặc giới hạn trên của khoảng thì có lẽ với số lượng nhóm được so sánh lớn hơn, sự khác biệt sẽ đạt được ý nghĩa thống kê. Nếu số 0 ở gần giữa khoảng, thì điều đó có nghĩa là cả việc tăng và giảm chỉ số trong nhóm thử nghiệm đều có khả năng xảy ra như nhau và có lẽ thực sự không có sự khác biệt.

Ví dụ:

Để so sánh tỷ lệ tử vong do phẫu thuật khi sử dụng hai loại gây mê khác nhau: 61 người được phẫu thuật với loại gây mê thứ nhất, 8 người tử vong, với loại thứ hai – 67 người, 10 người tử vong.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,008.

Sự khác biệt về mức độ sát thương của các phương pháp được so sánh sẽ nằm trong khoảng (-0,018 - 0,122; -0,018 + 0,122) hoặc (-0,14; 0,104) với xác suất 100(1-a) = 95%. Khoảng chứa số 0, tức là giả thuyết về tỷ lệ tử vong như nhau với hai loại gây mê khác nhau không thể bị bác bỏ.

Do đó, tỷ lệ tử vong có thể và sẽ giảm xuống 14% và tăng lên 10,4% với xác suất là 95%, tức là. số 0 xấp xỉ ở giữa khoảng thời gian, vì vậy có thể lập luận rằng, rất có thể, hai phương pháp này thực sự không khác nhau về mức độ sát thương.

Trong ví dụ đã thảo luận trước đó, thời gian nhấn trung bình trong bài kiểm tra gõ nhẹ được so sánh giữa bốn nhóm học sinh có điểm thi khác nhau. Hãy tính khoảng tin cậy cho thời gian ép trung bình của những học sinh đậu kỳ thi lớp 2 và lớp 5 và khoảng tin cậy cho chênh lệch giữa các điểm trung bình này.

Hệ số của Sinh viên được tìm bằng bảng phân phối Sinh viên (xem phụ lục): đối với nhóm thứ nhất: = t(0,05;48) = 2,011; đối với nhóm thứ hai: = t(0,05;61) = 2,000. Như vậy, khoảng tin cậy cho nhóm thứ nhất: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), cho nhóm thứ hai (156,55- 2.000*1,88 ; 156,55+2.000*1,88) = (152,8 ; 160,3). Vì vậy, đối với những người vượt qua bài kiểm tra với 2, thời gian nhấn trung bình dao động từ 157,8 ms đến 166,6 ms với xác suất là 95%, đối với những người vượt qua bài kiểm tra với 5 – từ 152,8 ms đến 160,3 ms với xác suất là 95%. .

Bạn cũng có thể kiểm tra giả thuyết không bằng cách sử dụng khoảng tin cậy cho phương tiện chứ không chỉ cho sự khác biệt về phương tiện. Ví dụ, như trong trường hợp của chúng tôi, nếu khoảng tin cậy cho các giá trị trung bình trùng nhau thì giả thuyết không không thể bị bác bỏ. Để bác bỏ một giả thuyết ở mức ý nghĩa đã chọn, các khoảng tin cậy tương ứng không được trùng nhau.

Hãy tìm khoảng tin cậy cho sự khác biệt về thời gian ép trung bình ở các nhóm thi đạt lớp 2 và lớp 5. Chênh lệch trung bình: 162,19 – 156,55 = 5,64. Hệ số của học sinh: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Độ lệch chuẩn của nhóm sẽ bằng: ; . Chúng tôi tính toán sai số trung bình của sự khác biệt giữa các phương tiện: . Khoảng tin cậy: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Như vậy, sự chênh lệch về thời gian nhấn trung bình ở các nhóm vượt qua bài kiểm tra thứ 2 và 5 sẽ nằm trong khoảng từ -0,044 ms đến 11,33 ms. Khoảng này bao gồm số không, tức là Thời gian ép trung bình của những người thi tốt có thể tăng hoặc giảm so với những người thi không đạt yêu cầu, tức là. giả thuyết không không thể bị bác bỏ. Nhưng số 0 rất gần với giới hạn dưới, và thời gian ép có nhiều khả năng sẽ giảm đi đối với những người vượt qua tốt. Do đó, chúng tôi có thể kết luận rằng vẫn có sự khác biệt về thời gian nhấn trung bình giữa những người vượt qua mức 2 và 5, chúng tôi chỉ không thể phát hiện ra chúng do có sự thay đổi về thời gian trung bình, độ chênh lệch của thời gian trung bình và kích thước mẫu.



Sức mạnh của phép thử là xác suất bác bỏ một giả thuyết không sai, tức là tìm thấy sự khác biệt nơi chúng thực sự tồn tại.

Sức mạnh của phép thử được xác định dựa trên mức ý nghĩa, mức độ khác biệt giữa các nhóm, mức độ lan truyền của các giá trị trong nhóm và cỡ mẫu.

Đối với bài kiểm tra t của Sinh viên và phân tích phương sai, có thể sử dụng biểu đồ độ nhạy.

Sức mạnh của tiêu chí có thể được sử dụng để xác định sơ bộ số lượng nhóm cần thiết.

Khoảng tin cậy cho thấy giới hạn trong đó giá trị thực của tham số ước tính nằm ở một xác suất nhất định.

Sử dụng khoảng tin cậy, bạn có thể kiểm tra các giả thuyết thống kê và rút ra kết luận về độ nhạy của tiêu chí.

VĂN HỌC.

Glanz S. – Chương 6,7.

Rebrova O.Yu. – tr.112-114, tr.171-173, tr.234-238.

Sidorenko E.V. – tr.32-33.

Câu hỏi tự kiểm tra của học sinh.

1. Sức mạnh của tiêu chí là gì?

2. Trong trường hợp nào cần đánh giá sức mạnh của tiêu chí?

3. Phương pháp tính công suất.

6. Làm thế nào để kiểm tra một giả thuyết thống kê bằng khoảng tin cậy?

7. Có thể nói gì về sức mạnh của tiêu chí khi tính khoảng tin cậy?

Nhiệm vụ.

Khoảng tin cậy

Khoảng tin cậy- thuật ngữ được sử dụng trong thống kê toán học để ước lượng khoảng (ngược lại với điểm) của các tham số thống kê, thuật ngữ này thích hợp hơn khi cỡ mẫu nhỏ. Khoảng tin cậy là khoảng tin cậy bao trùm một tham số chưa biết với độ tin cậy nhất định.

Phương pháp khoảng tin cậy được phát triển bởi nhà thống kê người Mỹ Jerzy Neumann, dựa trên ý tưởng của nhà thống kê người Anh Ronald Fisher.

Sự định nghĩa

Khoảng tin cậy của tham số θ phân phối biến ngẫu nhiên X với mức độ tin cậy 100 P%, được tạo bởi mẫu ( x 1 ,…,x n), được gọi là khoảng có ranh giới ( x 1 ,…,x n) và ( x 1 ,…,x n), đó là sự thể hiện của các biến ngẫu nhiên L(X 1 ,…,X n) và bạn(X 1 ,…,X n), sao cho

.

Các điểm biên của khoảng tin cậy được gọi là giới hạn tin cậy.

Cách giải thích dựa trên trực giác về khoảng tin cậy sẽ là: nếu P lớn (ví dụ 0,95 hoặc 0,99), thì khoảng tin cậy gần như chắc chắn chứa giá trị thực θ .

Một cách giải thích khác về khái niệm khoảng tin cậy: nó có thể được coi là khoảng của các giá trị tham số θ tương thích với dữ liệu thực nghiệm và không mâu thuẫn với chúng.

Ví dụ

  • Khoảng tin cậy cho kỳ vọng toán học của một mẫu bình thường;
  • Khoảng tin cậy cho phương sai mẫu bình thường.

Khoảng tin cậy Bayes

Trong thống kê Bayes, có một định nghĩa tương tự nhưng khác nhau ở một số chi tiết chính về khoảng tin cậy. Ở đây, bản thân tham số ước tính được coi là một biến ngẫu nhiên với một số phân phối trước đó cho trước (trong trường hợp đơn giản nhất là phân bố đều) và mẫu là cố định (trong thống kê cổ điển, mọi thứ hoàn toàn ngược lại). Khoảng tin cậy Bayes là khoảng bao gồm giá trị của tham số có xác suất sau:

.

Nói chung, khoảng tin cậy cổ điển và Bayesian là khác nhau. Trong tài liệu tiếng Anh, khoảng tin cậy Bayes thường được gọi là thuật ngữ khoảng tin cậy, và cái cổ điển - khoảng tin cậy.

Ghi chú

Nguồn

Quỹ Wikimedia.

  • 2010.
  • Những đứa trẻ (phim)

thực dân

    Khoảng tin cậy Xem “Khoảng tin cậy” là gì trong các từ điển khác: - khoảng được tính toán từ dữ liệu mẫu, với xác suất (độ tin cậy) cho trước bao gồm giá trị thực chưa biết của tham số phân phối ước tính. Nguồn: GOST 20522 96: Đất. Phương pháp xử lý thống kê kết quả...

    khoảng tin cậy Sách tham khảo từ điển thuật ngữ quy chuẩn và tài liệu kỹ thuật - đối với tham số vô hướng của tổng thể, đây là phân đoạn có nhiều khả năng chứa tham số này nhất. Cụm từ này là vô nghĩa nếu không giải thích thêm. Vì các giới hạn của khoảng tin cậy được ước tính từ mẫu nên việc... ...

    Từ điển thống kê xã hội học Khoảng tin cậy - một phương pháp ước lượng các tham số khác với ước lượng điểm. Đặt mẫu x1, . . ., xn từ một phân bố có mật độ xác suất f(x, α) và ước tính a*=a*(x1, . . ., xn) ước tính mật độ xác suất α, g(a*, α). Chúng tôi đang tìm kiếm... ...

    Từ điển thống kê xã hội học Bách khoa toàn thư địa chất - (khoảng tin cậy) Khoảng trong đó độ tin cậy của giá trị tham số đối với tổng thể thu được trên cơ sở khảo sát mẫu có một mức xác suất nhất định, ví dụ 95%, là do chính mẫu đó. Chiều rộng… …

    khoảng tin cậy Từ điển kinh tế - – là khoảng trong đó giá trị thực của đại lượng xác định được xác định với xác suất tin cậy cho trước. Hóa học đại cương: sách giáo khoa / A. V. Zholnin ...

    Thuật ngữ hóa học Khoảng tin cậy CI - Khoảng tin cậy, khoảng tin cậy CI* dữ liệu, khoảng tin cậy CI* của giá trị đặc tính, tính cho k.l. tham số phân phối (ví dụ: giá trị trung bình của một đặc tính) trên mẫu và với xác suất nhất định (ví dụ: 95% cho 95% ...

    Từ điển thống kê xã hội học Di truyền học. Từ điển bách khoa - một khái niệm nảy sinh khi ước tính một tham số thống kê. phân phối theo khoảng giá trị. D. và. đối với tham số q tương ứng với hệ số này. niềm tin P, bằng một khoảng (q1, q2) sao cho với bất kỳ phân bố xác suất nào của sự bất bình đẳng... ...

    khoảng tin cậy Bách khoa toàn thư vật lý - - Chủ đề viễn thông, khái niệm cơ bản Khoảng tin cậy EN ...

    khoảng tin cậy- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: tiếng Anh. khoảng tin cậy vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

    khoảng tin cậy- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: tiếng Anh. khoảng tin cậy rus. khu vực tin cậy; khoảng tin cậy... Chemijos terminų aiškinamasis žodynas