Định nghĩa khoảng tin cậy và xác suất tin cậy. Xác suất tin cậy và độ tin cậy

Khi đã đạt được ước tính điểm, cần có dữ liệu về độ tin cậy của ước tính đó. Rõ ràng giá trị này chỉ là giá trị gần đúng của tham số q. Ước tính điểm được tính toán có thể gần với tham số được ước tính hoặc có thể rất khác với tham số đó. Ước tính điểm không cung cấp thông tin về tính chính xác của quy trình ước tính. Điều đặc biệt quan trọng là phải có thông tin về độ tin cậy của ước tính đối với các mẫu nhỏ. Trong những trường hợp như vậy, nên sử dụng ước tính khoảng thời gian.

Bài toán ước lượng khoảng ở dạng tổng quát nhất có thể được hình thành như sau: sử dụng dữ liệu mẫu, xây dựng một khoảng số tương ứng với xác suất được chọn trước, chúng ta có thể nói rằng tham số ước tính nằm trong khoảng này. Có một số cách tiếp cận ở đây. Phương pháp ước lượng khoảng phổ biến nhất là phương pháp khoảng tin cậy.

Khoảng tin cậycho tham số q là khoảng chứa giá trị chưa biết của tham số tổng thể với xác suất cho trước g , tức là

.

Số g được gọi là xác suất tin cậy, và số a=1–g – mức độ tin cậy. Xác suất tin cậy được đặt trước và được xác định bởi các điều kiện cụ thể. Thông thường g=0,9 được sử dụng; 0,95; 0,99 (tương ứng, a=0,1; 0,05; 0,01).

Độ dài của khoảng tin cậy, đặc trưng cho độ chính xác của ước tính khoảng, phụ thuộc vào cỡ mẫu N và xác suất tin cậy g. Với giá trị ngày càng tăng Nđộ dài của khoảng tin cậy giảm và khi xác suất g tiến đến mức thống nhất, nó sẽ tăng lên.

Thông thường khoảng tin cậy được xây dựng đối xứng với ước tính điểm, tức là ở dạng

, (3.15)

Ở đây số D được gọi là tối thượng(hoặc tiêu chuẩn) lỗi lấy mẫu. Tuy nhiên, không phải lúc nào cũng có thể xây dựng được các khoảng đối xứng, hơn nữa, đôi khi người ta phải giới hạn mình vào các khoảng tin cậy một phía:

hoặc .

Vì trong các bài toán kinh tế lượng thường cần xây dựng khoảng tin cậy cho các tham số của các biến ngẫu nhiên có phân phối bình thường, chúng tôi trình bày sơ đồ vị trí của họ.



3.4.2. Khoảng tin cậy của tổng quát
trung bình với phương sai chung đã biết

Hãy để thuộc tính định lượng X dân số có phân phối chuẩn với phương sai s 2 cho trước và kỳ vọng toán học chưa biết Một. Để ước tính tham số Một mẫu được chiết xuất X 1 , X 2 , …, Xn, bao gồm N các biến ngẫu nhiên phân phối chuẩn độc lập với các tham số Một và s, và s đã biết và giá trị Mộtước tính theo mẫu:

.

Chúng ta hãy đánh giá tính chính xác của đẳng thức gần đúng này. Để làm điều này, hãy đặt xác suất g và cố gắng tìm số D sao cho mối quan hệ được thỏa mãn

.

Tiếp theo, chúng ta sẽ sử dụng các thuộc tính của phân phối chuẩn. Được biết, tổng các đại lượng có phân phối chuẩn cũng có phân phối chuẩn. Do đó, giá trị trung bình có phân phối chuẩn, kỳ vọng toán học và phương sai bằng nhau

Kể từ đây,

.

Bây giờ chúng ta hãy sử dụng công thức tìm xác suất sai lệch của một biến ngẫu nhiên có phân phối chuẩn so với kỳ vọng toán học:

,

trong đó F( x) – Hàm Laplace. Thay thế X tiếp tục , chúng ta nhận được

,

Ở đâu . Từ đẳng thức cuối cùng chúng ta thấy rằng lỗi lấy mẫu cận biên sẽ bằng nhau

.

Có tính đến xác suất tin cậy đã cho và bằng g, chúng ta thu được kết quả cuối cùng.

Ước tính khoảng của trung bình chung (kỳ vọng toán học) có dạng

, (3.17)

hoặc ngắn gọn hơn

trong đó số t g được xác định từ đẳng thức .

Hãy đưa ra những giá trị t g đối với các giá trị độ tin cậy được chấp nhận rộng rãi:

, , .

Hãy để chúng tôi thảo luận về cách nó ảnh hưởng đến độ chính xác của ước tính tham số Một cỡ mẫu N, giá trị của độ lệch chuẩn s, cũng như giá trị của xác suất tin cậy g.

a) Khi tăng Nđộ chính xác của đánh giá tăng lên. Thật không may, sự gia tăng độ chính xác (tức là sự giảm độ dài của khoảng tin cậy) tỷ lệ thuận với , chứ không phải 1/ N, tức là xảy ra chậm hơn nhiều so với sự gia tăng số lượng quan sát. Ví dụ: nếu chúng ta muốn tăng độ chính xác của các suy luận lên hệ số 10 hoàn toàn bằng phương pháp thống kê thì chúng ta phải tăng cỡ mẫu lên hệ số 100.

b) s càng lớn thì độ chính xác càng thấp. Sự phụ thuộc của độ chính xác vào tham số này là tuyến tính.

c) Xác suất tin cậy g càng cao thì giá trị của tham số càng lớn t g, tức là độ chính xác càng thấp. Hơn nữa, giữa g và t g có mối quan hệ phi tuyến tính. Với giá trị g ngày càng tăng t g tăng mạnh (at). Vì vậy, với độ tin cậy cao (có xác suất tin cậy cao), chúng ta chỉ có thể đảm bảo độ chính xác tương đối thấp. (Khoảng tin cậy sẽ rộng.) Và ngược lại: khi chúng ta chỉ ra một tham số chưa biết Một giới hạn tương đối hẹp, chúng ta có nguy cơ mắc sai lầm—với xác suất tương đối cao.

Lưu ý rằng giá trị

gọi điện lỗi lấy mẫu trung bình. Đối với lấy mẫu không lặp lại, công thức này sẽ có dạng

. (3.20)

Khi đó sai số lấy mẫu tối đa D sẽ là t- sai số trung bình bội:

Ví dụ 3.7. Dựa trên việc theo dõi cân nặng lâu dài X các gói đai ốc được nạp tự động, xác định rằng độ lệch chuẩn của trọng lượng của các gói là s=10 G. Người ta cân 25 gói hàng và trọng lượng trung bình của chúng là 0,12. Giá trị thực của trọng lượng gói trung bình nằm trong khoảng nào với độ tin cậy 95%?

.

Để xác định khoảng tin cậy 95%, chúng tôi tính sai số lấy mẫu tối đa

Do đó, khoảng tin cậy 95% cho giá trị thực của trọng lượng gói trung bình sẽ là

,

Thoạt nhìn, có vẻ như kết quả thu được chỉ đại diện cho kết quả lý thuyết, vì độ lệch chuẩn s, theo quy luật, cũng không xác định và được tính toán từ dữ liệu mẫu. Tuy nhiên, nếu mẫu đủ lớn thì kết quả thu được hoàn toàn có thể chấp nhận được khi sử dụng thực tế vì hàm phân phối sẽ khác rất ít so với bình thường và ước tính phương sai sẽ S 2 sẽ khá gần với giá trị thực s 2. Hơn nữa, kết quả thu được thường được sử dụng trong trường hợp sự phân bố của dân số khác với bình thường. Điều này là do tổng các biến ngẫu nhiên độc lập, theo định lý giới hạn trung tâm, với mẫu lớn có phân bố gần với chuẩn. Một

Ví dụ 3.8. Chúng ta hãy giả sử rằng do kết quả của một cuộc khảo sát mẫu về điều kiện nhà ở của cư dân thành phố dựa trên mẫu lặp lại ngẫu nhiên, chúng ta đã thu được chuỗi biến thể sau:

Bảng 3.5

Xây dựng khoảng tin cậy 95% cho đặc tính đang được nghiên cứu.

Giải pháp. Hãy tính giá trị trung bình mẫu và phương sai của đặc tính đang được nghiên cứu.

Bảng 3.6

Tổng diện tích nhà ở/người tôi 2 Số lượng cư dân và tôi Giữa khoảng thời gian x tôi
Lên tới 5.0 2,5 20,0 50,0
5,0–10,0 7,5 712,5 5343,8
10,0–15,0 12,5 2550,0 31875,0
15,0–20,0 17,5 4725,0 82687,5
20,0–25,0 22,5 4725,0 106312,5
25,0–30,0 27,5 3575,0 98312,5
30,0 trở lên 32,5 2697,5 87668,8
Tổng cộng 19005,0 412250,0

; ; .

Sai số lấy mẫu trung bình sẽ là

.

Hãy xác định sai số lấy mẫu lớn nhất với xác suất 0,95 ():

Hãy thiết lập ranh giới của mức trung bình chung

.

Do đó, dựa trên khảo sát mẫu được thực hiện với xác suất 0,95, chúng ta có thể kết luận rằng quy mô trung bình của tổng diện tích trên mỗi người trong toàn thành phố dao động từ 18,6 đến 19,4 tôi 2. Một

3.4.3. Khoảng tin cậy của tổng quát
trung bình với phương sai chung chưa biết

Ở trên, chúng ta đã giải quyết vấn đề xây dựng ước tính khoảng cho kỳ vọng toán học của phân phối chuẩn khi biết phương sai của nó. Tuy nhiên, trong thực tế, phương sai cũng thường không xác định và được tính từ cùng một mẫu với kỳ vọng toán học. Điều này dẫn đến nhu cầu sử dụng một công thức khác khi xác định khoảng tin cậy cho kỳ vọng toán học của một biến ngẫu nhiên có phân phối chuẩn. Công thức của vấn đề này đặc biệt phù hợp với cỡ mẫu nhỏ.

Hãy để thuộc tính định lượng X dân số có phân bố chuẩn N(Một,s) và cả hai tham số Một và s chưa được biết. Dựa trên dữ liệu mẫu X 1 , X 2 , …, Xn, tính giá trị trung bình số học và phương sai đã hiệu chỉnh:

, .

Để tìm khoảng tin cậy trong trường hợp này, số liệu thống kê được xây dựng

có phân phối Sinh viên với số bậc tự do n=n–1, bất kể giá trị của tham số a và s. Bằng cách chọn xác suất tin cậy g và biết cỡ mẫu n, bạn có thể tìm được số t sao cho đẳng thức

,

.

Từ đây chúng ta tìm thấy

ước tính khoảng cho mức trung bình chung (kỳ vọng toán học) với s chưa biết:

, (3.22)

hoặc ngắn gọn hơn

Con số t (hệ số sinh viên) được tìm thấy từ các bảng phân phối Sinh viên. Lưu ý rằng đó là hàm của hai đối số: xác suất tin cậy g và số bậc tự do k=N–1, tức là t=t(g, n).

Bạn nên hết sức cẩn thận khi sử dụng các bảng để phân phối Sinh viên. Thứ nhất, các bảng thường sử dụng mức độ tin cậy a=1–g thay vì xác suất tin cậy g. Thứ hai, rất thường xuyên các bảng chứa các giá trị của cái gọi là. bài kiểm tra t của sinh viên một đuôi

Hoặc .

Trong trường hợp này, các bảng sẽ lấy giá trị nếu bảng sử dụng mức độ tin cậy hoặc nếu bảng sử dụng mức độ tin cậy.

Mặc dù có sự giống nhau rõ ràng giữa các công thức (3.17) và (3.22), nhưng có sự khác biệt đáng kể giữa chúng, đó là hệ số Sinh viên t không chỉ phụ thuộc vào mức độ tin cậy mà còn phụ thuộc vào cỡ mẫu. Sự khác biệt này đặc biệt đáng chú ý trong các mẫu nhỏ. (Hãy nhớ rằng với các mẫu lớn, sự khác biệt giữa phân phối Sinh viên và phân phối chuẩn trên thực tế biến mất.) Trong trường hợp này, việc sử dụng phân phối chuẩn dẫn đến việc thu hẹp khoảng tin cậy một cách vô lý, tức là. đến sự gia tăng không chính đáng về độ chính xác. Ví dụ, nếu N=5 và g=0,99, khi đó, sử dụng phân phối Sinh viên, chúng ta nhận được t= 4,6 và sử dụng phân phối chuẩn, – t= 2,58, tức là khoảng tin cậy trong trường hợp sau gần như hẹp gấp đôi khoảng tin cậy khi sử dụng phân phối Sinh viên.

Ví dụ 3.9. Một nhà phân tích thị trường chứng khoán ước tính lợi nhuận trung bình của một số cổ phiếu nhất định. Một mẫu ngẫu nhiên trong 15 ngày cho thấy lợi nhuận trung bình (hàng năm) với độ lệch chuẩn là . Giả sử rằng lợi nhuận cổ phiếu tuân theo phân phối chuẩn, hãy xây dựng khoảng tin cậy 95% cho lợi nhuận trung bình của loại cổ phiếu mà nhà phân tích quan tâm.

Giải pháp. Vì cỡ mẫu N=15 thì cần phải áp dụng phân phối Sinh viên có bậc tự do. Sử dụng các bảng phân phối Sinh viên, chúng tôi tìm thấy

.

Sử dụng giá trị này, chúng tôi xây dựng khoảng tin cậy 95%:

.

Do đó, một nhà phân tích có thể tin tưởng 95% rằng lợi nhuận trung bình hàng năm của cổ phiếu là từ 8,44% đến 12,3%. Một

Thông thường, người định giá phải phân tích thị trường bất động sản của phân khúc mà tài sản được định giá tọa lạc. Nếu thị trường phát triển, có thể khó phân tích toàn bộ tập hợp đối tượng được trình bày, do đó, một mẫu đối tượng được sử dụng để phân tích. Mẫu này không phải lúc nào cũng đồng nhất; đôi khi cần phải loại bỏ các điểm cực đoan - chào hàng thị trường quá cao hoặc quá thấp. Với mục đích này nó được sử dụng khoảng tin cậy. Mục đích của nghiên cứu này là tiến hành phân tích so sánh hai phương pháp tính khoảng tin cậy và chọn phương án tính toán tối ưu khi làm việc với các mẫu khác nhau trong hệ thống estimatetica.pro.

Khoảng tin cậy là khoảng giá trị thuộc tính được tính toán trên cơ sở một mẫu, với xác suất đã biết chứa tham số ước tính của tổng thể nói chung.

Mục đích của việc tính toán khoảng tin cậy là xây dựng khoảng tin cậy dựa trên dữ liệu mẫu sao cho có thể xác định được với xác suất cho trước rằng giá trị của tham số ước tính nằm trong khoảng này. Nói cách khác, khoảng tin cậy chứa giá trị chưa biết của giá trị ước tính với một xác suất nhất định. Khoảng cách càng rộng thì độ chính xác càng cao.

Có nhiều phương pháp khác nhau để xác định khoảng tin cậy. Trong bài này chúng ta sẽ xem xét 2 phương pháp:

  • thông qua độ lệch trung bình và độ lệch chuẩn;
  • thông qua giá trị tới hạn của thống kê t (hệ số Sinh viên).

Các giai đoạn phân tích so sánh của các phương pháp tính CI khác nhau:

1. tạo mẫu dữ liệu;

2. chúng tôi xử lý nó bằng các phương pháp thống kê: chúng tôi tính toán giá trị trung bình, trung vị, phương sai, v.v.;

3. tính khoảng tin cậy theo hai cách;

4. phân tích các mẫu đã được làm sạch và khoảng tin cậy thu được.

Giai đoạn 1. Lấy mẫu dữ liệu

Mẫu được hình thành bằng hệ thống estimatetica.pro. Mẫu bao gồm 91 lời đề nghị bán căn hộ 1 phòng ở vùng giá thứ 3 với kiểu bố trí “Khrushchev”.

Bảng 1. Mẫu ban đầu

Giá 1m2, căn

Hình.1. Mẫu ban đầu



Giai đoạn 2. Xử lý mẫu ban đầu

Xử lý mẫu bằng phương pháp thống kê yêu cầu tính toán các giá trị sau:

1. Trung bình số học

2. Trung vị - một số đặc trưng cho mẫu: chính xác một nửa số phần tử mẫu lớn hơn trung vị, nửa còn lại nhỏ hơn trung vị

(đối với mẫu có số giá trị lẻ)

3. Phạm vi - sự khác biệt giữa giá trị tối đa và tối thiểu trong mẫu

4. Phương sai - được sử dụng để ước tính chính xác hơn độ biến thiên của dữ liệu

5. Độ lệch chuẩn của mẫu (sau đây gọi là SD) là chỉ báo phổ biến nhất về độ phân tán của các giá trị điều chỉnh xung quanh giá trị trung bình số học.

6. Hệ số biến thiên - phản ánh mức độ phân tán của các giá trị điều chỉnh

7. hệ số dao động - phản ánh sự biến động tương đối của các giá trị cực trị trong mẫu xung quanh mức trung bình

Bảng 2. Các chỉ tiêu thống kê của mẫu ban đầu

Hệ số biến thiên đặc trưng cho tính đồng nhất của dữ liệu là 12,29% nhưng hệ số dao động quá cao. Vì vậy, chúng ta có thể nói rằng mẫu ban đầu không đồng nhất, vì vậy hãy chuyển sang tính khoảng tin cậy.

Giai đoạn 3. Tính khoảng tin cậy

Phương pháp 1. Tính toán sử dụng giá trị trung bình và độ lệch chuẩn.

Khoảng tin cậy được xác định như sau: giá trị tối thiểu - độ lệch chuẩn được trừ khỏi giá trị trung bình; giá trị tối đa - độ lệch chuẩn được thêm vào trung vị.

Như vậy, khoảng tin cậy (47179 CU; 60689 CU)

Cơm. 2. Các giá trị nằm trong khoảng tin cậy 1.



Cách 2. Xây dựng khoảng tin cậy sử dụng giá trị tới hạn của thống kê t (Hệ số sinh viên)

S.V. Gribovsky trong cuốn sách “Các phương pháp toán học để ước tính giá trị tài sản” mô tả phương pháp tính khoảng tin cậy thông qua hệ số Sinh viên. Khi tính toán bằng phương pháp này, người ước tính phải tự đặt mức ý nghĩa ∝, mức này xác định xác suất xây dựng khoảng tin cậy. Thông thường, mức ý nghĩa 0,1 được sử dụng; 0,05 và 0,01. Chúng tương ứng với xác suất tin cậy là 0,9; 0,95 và 0,99. Với phương pháp này, các giá trị thực của kỳ vọng và phương sai toán học được giả định là chưa biết trên thực tế (điều này hầu như luôn đúng khi giải các bài toán ước lượng thực tế).

Công thức khoảng tin cậy:

n - cỡ mẫu;

Giá trị tới hạn của thống kê t (Phân phối sinh viên) với mức ý nghĩa ∝, số bậc tự do n-1, được xác định từ các bảng thống kê đặc biệt hoặc sử dụng MS Excel (→"Thống kê"→ STUDIST);

∝ - mức ý nghĩa, lấy ∝=0,01.

Cơm. 2. Các giá trị nằm trong khoảng tin cậy 2.

Giai đoạn 4. Phân tích các phương pháp khác nhau để tính khoảng tin cậy

Hai phương pháp tính khoảng tin cậy - thông qua hệ số trung vị và sinh viên - dẫn đến các giá trị khác nhau của khoảng tin cậy. Theo đó, chúng tôi có hai mẫu được làm sạch khác nhau.

Bảng 3. Thống kê cho ba mẫu.

Chỉ số

Mẫu ban đầu

1 lựa chọn

Tùy chọn 2

Giá trị trung bình

phân tán

Coef. biến thể

Coef. dao động

Số lượng đồ vật bị loại bỏ, chiếc.

Dựa trên các tính toán được thực hiện, chúng ta có thể nói rằng các giá trị khoảng tin cậy thu được bằng các phương pháp khác nhau giao nhau, do đó bạn có thể sử dụng bất kỳ phương pháp tính toán nào theo quyết định của người thẩm định.

Tuy nhiên, chúng tôi tin rằng khi làm việc trong hệ thống estimatetica.pro, nên chọn phương pháp tính khoảng tin cậy tùy thuộc vào mức độ phát triển của thị trường:

  • nếu thị trường chưa phát triển thì sử dụng phương pháp tính toán sử dụng trung vị và độ lệch chuẩn, vì số lượng đối tượng bị loại bỏ trong trường hợp này là ít;
  • nếu thị trường phát triển thì áp dụng phép tính thông qua giá trị tới hạn của thống kê t (hệ số Sinh viên), vì có thể hình thành mẫu ban đầu lớn.

Khi chuẩn bị bài viết, những điều sau đây đã được sử dụng:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Các phương pháp toán học để đánh giá giá trị tài sản. Mátxcơva, 2014

2. Dữ liệu hệ thống estimatetica.pro

Việc phân tích các sai số ngẫu nhiên dựa trên lý thuyết về các sai số ngẫu nhiên, điều này giúp có thể tính toán giá trị thực của giá trị đo được với một sự đảm bảo nhất định và đánh giá các sai số có thể xảy ra.

Lý thuyết về sai số ngẫu nhiên dựa trên các giả định sau:

với số lượng phép đo lớn, các sai số ngẫu nhiên có cùng độ lớn nhưng có dấu hiệu khác nhau xảy ra thường xuyên như nhau;

lỗi lớn ít gặp hơn lỗi nhỏ (xác suất xảy ra lỗi giảm khi độ lớn của nó tăng);

với số lượng phép đo lớn vô hạn thì giá trị thực của đại lượng đo được bằng trung bình số học của tất cả các kết quả đo;

sự xuất hiện của một hoặc một kết quả đo khác như một sự kiện ngẫu nhiên được mô tả bằng luật phân phối chuẩn.

Trong thực tế, có sự khác biệt giữa tập hợp các phép đo chung và tập hợp mẫu.

Dưới dân số ngụ ý toàn bộ tập hợp các giá trị đo có thể có hoặc các giá trị lỗi có thể xảy ra
.

Đối với dân số mẫu số lần đo hạn chế và được xác định chặt chẽ trong từng trường hợp cụ thể. Họ cho rằng nếu
, thì giá trị trung bình của tập hợp số đo này đủ gần với giá trị thực của nó.

1. Ước lượng khoảng sử dụng xác suất tin cậy

Đối với mẫu lớn và phân bố chuẩn, đặc tính đánh giá chung của phép đo là độ phân tán
và hệ số biến thiên :

;
. (1.1)

Độ phân tán đặc trưng cho tính đồng nhất của phép đo. Càng cao
, độ phân tán của phép đo càng lớn.

Hệ số biến thiên đặc trưng cho tính biến thiên. Càng cao , độ biến thiên của phép đo càng lớn so với giá trị trung bình.

Để đánh giá độ tin cậy của kết quả đo, người ta đưa ra khái niệm khoảng tin cậy và xác suất tin cậy.

đáng tin cậy gọi là khoảng giá trị , mà giá trị thực sự rơi vào đại lượng đo được với một xác suất nhất định.

Xác suất tin cậy (độ tin cậy) của phép đo là xác suất để giá trị thực của giá trị đo được nằm trong khoảng tin cậy nhất định, tức là đến khu vực
. Giá trị này được xác định theo phân số của đơn vị hoặc phần trăm

,

Ở đâu
- Hàm tích phân Laplace ( bảng 1.1 )

Hàm tích phân Laplace được xác định bởi biểu thức sau:

.

Đối số cho hàm này là yếu tố đảm bảo :

Bảng 1.1

Hàm tích phân Laplace

Nếu, trên cơ sở dữ liệu nhất định, xác suất tin cậy được thiết lập (nó thường được lấy bằng
), sau đó nó được thiết lập độ chính xác đo lường (khoảng tin cậy
) dựa vào tỉ số

.

Một nửa khoảng tin cậy là

, (1.3)

Ở đâu
- đối số của hàm Laplace, nếu
(bảng 1.1 );

- Hàm sinh viên nếu
(bảng 1.2 ).

Do đó, khoảng tin cậy đặc trưng cho độ chính xác của phép đo của một mẫu nhất định và xác suất tin cậy đặc trưng cho độ tin cậy của phép đo.

Ví dụ

Xong
Các phép đo cường độ mặt đường của đoạn đường cao tốc có mô đun đàn hồi trung bình
và giá trị tính toán của độ lệch chuẩn
.

Cần thiết xác định độ chính xác cần thiết phép đo cho các mức độ tin cậy khác nhau
, lấy các giá trị Qua bảng 1.1 .

Trong trường hợp này, tương ứng |

Do đó, đối với một phương tiện và phương pháp đo nhất định, khoảng tin cậy tăng lên khoảng lần nếu bạn tăng chỉ trên
.

Định lý 1 và 2, mặc dù chúng mang tính tổng quát, tức là chúng được xây dựng theo các giả định khá rộng, nhưng chúng không giúp xác định mức độ gần gũi của các ước tính với các tham số ước tính. Từ thực tế là các ước lượng - là nhất quán, chỉ ra rằng khi cỡ mẫu tăng lên, giá trị P(|θ * – θ | < δ), δ < 0, приближается к 1.

Các câu hỏi sau đây phát sinh.

1) Cỡ mẫu nên là bao nhiêu? P, sao cho độ chính xác được chỉ định
|θ * – θ | = δ đã được đảm bảo với xác suất được chấp nhận trước đó?

2) Độ chính xác của ước tính là bao nhiêu nếu biết cỡ mẫu và xác suất đưa ra kết luận không có lỗi?

3) Xác suất để đảm bảo độ chính xác của ước lượng đã chỉ định với cỡ mẫu đã cho là bao nhiêu?

Hãy để chúng tôi giới thiệu một số định nghĩa mới.

Sự định nghĩa. Xác suất γ thỏa mãn bất đẳng thức,|θ *– θ | < δ được gọi là mức độ tin cậy hoặc độ tin cậy của ước tính θ.

Hãy tiến lên từ sự bất bình đẳng | θ *–θ | < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

Bởi vì θ (tham số ước tính) là một số không đổi và θ * – giá trị ngẫu nhiên, khái niệm xác suất tin cậy có thể được phát biểu như sau: xác suất tin cậy γ là xác suất để khoảng ( θ *– δ, θ *+ δ) bao gồm tham số ước tính.

Sự định nghĩa. Khoảng ngẫu nhiên(θ *–δ , θ *+δ ), trong đó tham số ước lượng chưa biết nằm với xác suất γ được gọi là khoảng tin cậy İ, tương ứng với hệ số tin cậy γ,

İ= (θ*– δ, θ*+ δ ). (3)

Độ tin cậy của đánh giá γ có thể được chỉ định trước, sau đó, khi biết luật phân phối của biến ngẫu nhiên đang được nghiên cứu, người ta có thể tìm được khoảng tin cậy İ . Bài toán nghịch đảo cũng được giải khi cho trước một İ độ tin cậy tương ứng của ước tính được tìm thấy.

Hãy để, ví dụ, γ = 0,95; sau đó là số r= 1 – y = 0,05 cho thấy xác suất kết luận về độ tin cậy của đánh giá là sai. Con số р=1–γ gọi điện mức độ quan trọng. Mức ý nghĩa được ấn định trước tùy từng trường hợp cụ thể. Thường xuyên r lấy bằng 0,05; 0,01; 0,001.

Hãy cùng tìm hiểu cách xây dựng khoảng tin cậy cho kỳ vọng toán học của một đặc tính có phân phối chuẩn. Nó đã được chứng minh rằng

Hãy ước tính kỳ vọng toán học bằng cách sử dụng giá trị trung bình mẫu, có tính đến việc nó cũng có phân phối chuẩn*. Chúng tôi có

(4)

và từ công thức (12.9.2) ta có

Có tính đến (13.5.12), chúng tôi có được

(5)

Cho biết xác suất γ . Sau đó

Để thuận tiện cho việc sử dụng bảng hàm Laplace, chúng ta đặt một

Khoảng thời gian

(7)

bao gồm tham số một = M(X) với xác suất γ .

Trong hầu hết các trường hợp độ lệch chuẩn σ(X)đặc tính đang được nghiên cứu chưa được biết. Vì vậy, thay vì σ (X) với một mẫu lớn ( N> 30) áp dụng độ lệch chuẩn mẫu đã hiệu chỉnh S, do đó là một ước tính σ (X), khoảng tin cậy sẽ như thế nào

İ =

Ví dụ. Với xác suất γ = 0,95, hãy tìm khoảng tin cậy cho M(X) – chiều dài bông của giống lúa mạch “Moskovsky 121”. Sự phân bố được xác định bằng một bảng trong đó "thay vì các khoảng thay đổi (x Tôi, X Tôi+ 1) số được lấy, xem Coi đó là biến ngẫu nhiên X tuân theo phân phối chuẩn.

Giải pháp. Mẫu lớn ( N= 50). Chúng tôi có

Hãy tìm độ chính xác của ước tính

Hãy xác định giới hạn tin cậy:

Như vậy, với độ tin cậy γ = 0,95 kỳ vọng toán học được chứa trong khoảng tin cậy TÔI= (9,5; 10,3).

Vì vậy, trong trường hợp mẫu lớn ( N> 30), khi độ lệch chuẩn đã hiệu chỉnh hơi lệch so với độ lệch chuẩn của giá trị đặc trưng trong tổng thể thì có thể tìm thấy khoảng tin cậy. Nhưng không phải lúc nào cũng có thể tạo được một mẫu lớn và không phải lúc nào cũng nên làm như vậy. Từ (7) rõ ràng rằng giá trị nhỏ hơn P, khoảng tin cậy càng rộng, tức là TÔI phụ thuộc vào kích thước mẫu P.

Nhà thống kê người Anh Gosset (bút danh Sinh viên) đã chứng minh rằng trong trường hợp phân phối chuẩn của một đặc tính X trong dân số chung của chuẩn hóa một biến ngẫu nhiên

(8)

chỉ phụ thuộc vào kích thước mẫu. Hàm phân phối của biến ngẫu nhiên đã được tìm thấy T và xác suất P(T < t γ), t γ- độ chính xác của đánh giá Hàm được xác định bởi đẳng thức

S (N, t γ) = P(|T| < t γ) = γ (9)

được đặt tên Phân phối t của sinh viên Với N- 1 bậc tự do. Công thức (9) liên hệ biến ngẫu nhiên T, khoảng tin cậy İ và xác suất tin cậy γ . Biết hai trong số họ, bạn có thể tìm thấy thứ ba. Xét (8), ta có

(10)

Ta thay bất đẳng thức vế trái của (13.7.10) bằng bất đẳng thức tương đương . Kết quả là chúng tôi nhận được

(11)

Ở đâu t γ=t(γ ,N). Đối với chức năng t γ các bảng đã được tổng hợp (xem Phụ lục 5). Tại N>thứ 30 t γt, Các hàm Laplace tìm được trong bảng gần như trùng khớp với nhau.

Khoảng tin cậy để ước tính độ lệch chuẩn σ x trong trường hợp phân phối chuẩn.

Định lý.Biết rằng biến ngẫu nhiên có phân phối chuẩn. Khi đó để ước tính tham số σ x của định luật này, đẳng thức đúng

(12)

Ở đâuγ – xác suất tin cậy tùy thuộc vào cỡ mẫu n và độ chính xác của ước lượng β.

Chức năng γ = Ψ (N, β ) đã được nghiên cứu kỹ lưỡng. Nó được sử dụng để xác định β = β (γ ,N). Vì β = β (γ ,N) các bảng đã được biên soạn theo những gì đã biết N(cỡ mẫu) và γ (xác suất tin cậy) được xác định β .

Ví dụ.Để ước lượng tham số của biến ngẫu nhiên có phân phối chuẩn, người ta lấy một mẫu (sản lượng sữa hàng ngày của 50 con bò) và tính toán S= 1,5. Tìm khoảng tin cậy phủ xác suất γ = 0,95.

Giải pháp. Theo bảng β (γ , P)N= 50 và γ = 0,95 ta tìm được β = 0,21 (xem Phụ lục 6).

Theo bất đẳng thức (13), ta tìm được ranh giới của khoảng tin cậy. Chúng tôi có

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21 1,5 = 1,185;

Khoảng thời gian

Các ước tính điểm được xem xét của các tham số phân phối đưa ra ước tính ở dạng số gần nhất với giá trị của tham số chưa biết. Những ước tính như vậy chỉ được sử dụng cho một số lượng lớn các phép đo. Cỡ mẫu càng nhỏ thì càng dễ mắc sai lầm khi chọn tham số. Đối với thực hành, điều quan trọng không chỉ là đạt được ước tính điểm mà còn phải xác định khoảng thời gian, được gọi là tin tưởng, giữa ranh giới của nó với một giá trị nhất định xác suất đáng tin cậy

trong đó q là mức ý nghĩa; x n, x b - ranh giới dưới và ranh giới trên của khoảng, tìm thấy giá trị thực của tham số ước tính.

Nói chung, khoảng tin cậy có thể được xây dựng dựa trên Bất đẳng thức Chebyshev.Đối với bất kỳ định luật phân phối nào của một biến ngẫu nhiên có mômen hai bậc đầu tiên, giới hạn trên về xác suất sai lệch của biến ngẫu nhiên x so với tâm phân phối X c rơi vào khoảng tS x được mô tả bởi bất đẳng thức Chebyshev

trong đó S x là ước tính độ lệch chuẩn của phân bố; t là một số dương.

Để tìm khoảng tin cậy, bạn không cần biết luật phân phối kết quả quan sát, nhưng bạn cần biết ước tính độ lệch chuẩn. Các khoảng thu được khi sử dụng bất đẳng thức Chebyshev hóa ra lại quá rộng để thực hành. Do đó, xác suất tin cậy là 0,9 đối với nhiều luật phân phối tương ứng với khoảng tin cậy là 1,6S X. Bất đẳng thức Chebyshev trong trường hợp này cho kết quả là 3,16S X. Bởi vì điều này, nó đã không trở nên phổ biến.

Trong thực hành đo lường chúng chủ yếu được sử dụng ước tính lượng tử khoảng tin cậy. Dưới Phân lượng phần trăm 100P x p được hiểu là trục hoành của đường thẳng đứng đó, bên trái có diện tích dưới đường cong mật độ phân bố bằng P%. Nói cách khác, lượng tử- đây là giá trị của một biến ngẫu nhiên (lỗi) với xác suất tin cậy P cho trước. Ví dụ: trung vị của phân phối là lượng tử 50% x 0,5.

Trong thực tế, các lượng tử 25 và 75% thường được gọi là nếp gấp, hoặc lượng tử của sự phân phối. Giữa chúng nằm 50% tất cả các giá trị có thể có của biến ngẫu nhiên và 50% còn lại nằm bên ngoài chúng. Khoảng giá trị của một biến ngẫu nhiên x giữa x 0 05 và x 0 95 bao gồm 90% tất cả các giá trị có thể có của nó và được gọi là khoảng liên lượng tử với xác suất 90%.Độ dài của nó là d 0,9 = x 0,95 - x 0,05.

Dựa trên cách tiếp cận này, khái niệm này được đưa ra giá trị lỗi lượng tử, những thứ kia. giá trị lỗi với xác suất tin cậy cho trước P - ranh giới của khoảng không chắc chắn ± D D = ± (x p - x 1-p)/2 = ± d p /2. Dọc theo chiều dài của nó, xảy ra P% giá trị của biến ngẫu nhiên (lỗi) và q = (1- P)% tổng số của chúng vẫn nằm ngoài khoảng này.

Để có được ước tính khoảng của một biến ngẫu nhiên có phân phối chuẩn, cần phải:

Xác định ước lượng điểm của MO x̅ và độ lệch chuẩn S x của biến ngẫu nhiên lần lượt bằng các công thức (6.8) và (6.11);

Tìm giới hạn x trên và giới hạn x n dưới theo phương trình

thu được có tính đến (6.1). Các giá trị của x n và x b được xác định từ bảng giá trị của hàm phân phối tích phân F(t) hoặc hàm Laplace Ф(1).

Khoảng tin cậy thu được thỏa mãn điều kiện

trong đó n là số lượng giá trị đo được; z p là đối số của hàm Laplace Ф(1), tương ứng với xác suất Р/2. Trong trường hợp này, z p được gọi là hệ số lượng tử. Một nửa độ dài khoảng tin cậy được gọi là giới hạn tin cậy của sai số của kết quả đo.

Ví dụ 6.1. 50 phép đo điện trở không đổi đã được thực hiện. Xác định khoảng tin cậy cho giá trị MO của điện trở không đổi nếu định luật phân bố chuẩn với các thông số m x = R = 590 Ohm, S x = 90 Ohm với xác suất tin cậy P = 0,9.

Vì giả thuyết về tính chuẩn tắc của luật phân phối không mâu thuẫn với dữ liệu thực nghiệm nên khoảng tin cậy được xác định theo công thức

Do đó Ф(z р) = 0,45. Từ bảng ở Phụ lục 1, ta thấy z p = 1,65. Do đó, khoảng tin cậy sẽ được viết là

Hoặc 590 - 21< R < 590 + 21. Окончательно 509 Ом < R < 611 Ом.

Nếu luật phân phối của một biến ngẫu nhiên khác với chuẩn, cần xây dựng mô hình toán học của nó và xác định khoảng tin cậy sử dụng nó.

Phương pháp tìm khoảng tin cậy được xem xét có giá trị đối với số lượng quan sát n đủ lớn, khi s = S x. Cần nhớ rằng ước lượng tính toán của độ lệch chuẩn S x chỉ là một giá trị gần đúng nào đó với giá trị thực của s. Việc xác định khoảng tin cậy cho một xác suất nhất định hóa ra kém tin cậy hơn, số lượng quan sát càng nhỏ. Không thể sử dụng các công thức phân phối chuẩn với số lượng quan sát nhỏ nếu về mặt lý thuyết không thể xác định được độ lệch chuẩn dựa trên các thí nghiệm sơ bộ với số lượng quan sát đủ lớn.

Tính toán khoảng tin cậy cho trường hợp phân phối của kết quả quan sát là chuẩn nhưng phương sai của chúng chưa xác định, tức là với số lượng quan sát n nhỏ, có thể thực hiện bằng cách sử dụng phân phối Sinh viên S(t,k). Nó mô tả mật độ phân phối của tỷ lệ (Phân số của sinh viên):

trong đó Q là giá trị thực của đại lượng đo được. Số lượng x̅, S x. và S x ̅ được tính toán trên cơ sở dữ liệu thực nghiệm và biểu diễn các ước lượng điểm của MO, độ lệch chuẩn của kết quả đo và độ lệch chuẩn của giá trị trung bình số học.

Xác suất mà phân số Sinh viên, do kết quả của các quan sát được thực hiện, sẽ nhận một giá trị nhất định trong khoảng (- t p ; + t p)

trong đó k là số bậc tự do bằng (n - 1). Các giá trị của t p (được gọi trong trường hợp này hệ số của sinh viên),được tính toán bằng hai công thức cuối cùng cho các giá trị xác suất tin cậy và số lần đo khác nhau, được lập bảng (xem bảng trong Phụ lục 1). Do đó, bằng cách sử dụng phân phối Sinh viên, bạn có thể tìm thấy xác suất độ lệch của trung bình số học so với giá trị thực của giá trị đo được không vượt quá

Trong trường hợp phân bố của các lỗi ngẫu nhiên không chuẩn, phân phối Sinh viên thường được sử dụng với giá trị gần đúng, mức độ của nó vẫn chưa được biết. Phân phối Sinh viên được sử dụng cho một số phép đo n< 30, поскольку уже при n = 20, ...,30 оно переходит в нормальное и вместо уравнения (6.14) можно использовать уравнение (6.13). Результат измерения записывается в виде: ; P = Р d, trong đó Р d là giá trị xác suất tin cậy cụ thể. Hệ số t đối với số lượng lớn phép đo n bằng hệ số lượng tử z p. Đối với n nhỏ nó bằng hệ số Sinh viên.

Kết quả đo thu được không phải là một con số cụ thể mà biểu thị một khoảng trong đó, với xác suất nhất định Pd, giá trị thực của giá trị đo được nằm trong đó. Việc làm nổi bật phần giữa của khoảng x hoàn toàn không có nghĩa là giá trị thực gần với nó hơn các điểm khác của khoảng. Nó có thể ở bất kỳ đâu trong khoảng và với xác suất 1 - Р d thậm chí nằm ngoài khoảng đó.

Ví dụ 6.2. Xác định tổn hao từ riêng cho các mẫu khác nhau của một lô thép điện loại 2212 cho kết quả: 1,21; 1,17; 1,18; 1,13; 1,19; 1,14; 1,20 và 1,18 W/kg. Giả sử không có sai số hệ thống và sai số ngẫu nhiên có phân bố chuẩn thì cần xác định khoảng tin cậy ở các giá trị xác suất tin cậy là 0,9 và 0,95. Để giải quyết vấn đề, hãy sử dụng công thức Laplace và phân phối Sinh viên.

Sử dụng công thức (6.8) trong (6.11), chúng ta tìm được ước lượng giá trị trung bình số học và độ lệch chuẩn của kết quả đo. Chúng lần lượt bằng 1,18 và 0,0278 W/kg. Giả sử rằng ước tính MSD bằng chính độ lệch, chúng ta thấy:

Từ đây, sử dụng các giá trị của hàm Laplace cho trong bảng ở Phụ lục 1, ta xác định được z p= 1,65. Với P = 0,95, hệ số z p = 1,96. Khoảng tin cậy tương ứng với P = 0,9 và 0,95 là 1,18 ± 0,016 và 1,18 ± 0,019 W/kg.

Theo bảng ở Phụ lục 1, ta thấy t 0,9 = 1,9 và t 0,95 = 2,37. Do đó, khoảng tin cậy lần lượt là 1,18±0,019 và 1,18±0,023 W/kg.