Làm thế nào để tìm phương sai nếu biết kỳ vọng toán học. Kỳ vọng và phương sai của một biến ngẫu nhiên

Tài sản quan trọng tiếp theo biến ngẫu nhiên theo kỳ vọng toán học là phương sai của nó, được định nghĩa là hình vuông ở giữađộ lệch so với mức trung bình:

Nếu biểu thị bằng thì phương sai VX sẽ là giá trị kỳ vọng. Đây là đặc điểm của sự “phân tán” của phân bố X.

BẰNG ví dụ đơn giảnĐể tính toán phương sai, giả sử rằng chúng ta vừa nhận được một lời đề nghị mà chúng ta không thể từ chối: ai đó đã đưa cho chúng ta hai giấy chứng nhận tham gia một cuộc xổ số. Ban tổ chức xổ số bán 100 vé mỗi tuần, tham gia rút thăm riêng. Một trong những vé này được lựa chọn để lưu hành bởi thống nhất quá trình ngẫu nhiên- mỗi vé đều có cơ hội được chọn như nhau - và chủ sở hữu của vé này vé hạnh phúc nhận được một trăm triệu đô la. 99 chủ sở hữu còn lại vé số họ không giành được gì cả.

Chúng ta có thể sử dụng quà tặng theo hai cách: mua hai vé trong một xổ số hoặc mua một vé để tham gia hai loại xổ số khác nhau. Chiến lược nào tốt hơn? Hãy thử phân tích nó. Để làm điều này, chúng ta hãy biểu thị bằng các biến ngẫu nhiên biểu thị quy mô tiền thắng của chúng ta trên vé thứ nhất và thứ hai. Giá trị kỳ vọng tính bằng triệu là

và điều này cũng đúng đối với các Giá trị kỳ vọng có tính cộng, vì vậy tổng lợi nhuận trung bình của chúng tôi sẽ là

bất kể chiến lược được áp dụng.

Tuy nhiên, hai chiến lược này có vẻ khác nhau. Hãy vượt xa các giá trị mong đợi và nghiên cứu phân bố xác suất đầy đủ

Nếu chúng ta mua hai vé trong một lần xổ số thì khả năng chúng ta không trúng giải nào là 98% và 2% - khả năng trúng 100 triệu. Nếu chúng ta mua vé cho các đợt rút thăm khác nhau, con số sẽ như sau: 98,01% - khả năng không trúng thưởng gì, cao hơn một chút so với trước đây; 0,01% - cơ hội trúng 200 triệu, cũng nhiều hơn trước một chút; và cơ hội trúng 100 triệu hiện nay là 1,98%. Do đó, trong trường hợp thứ hai, sự phân bố cường độ có phần phân tán hơn; giá trị trung bình, 100 triệu USD, ít có khả năng xảy ra hơn, trong khi giá trị cực đoan lại có nhiều khả năng xảy ra hơn.

Chính khái niệm về sự phân tán của một biến ngẫu nhiên mà sự phân tán nhằm phản ánh. Chúng tôi đo mức độ chênh lệch thông qua bình phương độ lệch của một biến ngẫu nhiên so với kỳ vọng toán học của nó. Như vậy, trong trường hợp 1 phương sai sẽ là

trong trường hợp 2 phương sai là

Như chúng ta mong đợi, giá trị sau lớn hơn một chút, vì phân bố trong trường hợp 2 có phần dàn trải hơn.

Khi chúng ta làm việc với phương sai, mọi thứ đều bình phương nên kết quả có thể là những con số khá lớn. (Hệ số nhân là một nghìn tỷ, điều đó thật ấn tượng

ngay cả những người chơi đã quen với việc đặt cược lớn.) Để chuyển đổi các giá trị thành thang đo ban đầu có ý nghĩa hơn, họ thường trích xuất căn bậc hai khỏi sự phân tán. Số kết quả được gọi là độ lệch chuẩn và thường được ký hiệu chữ cái Hy Lạp MỘT:

Độ lệch chuẩn của độ lớn cho hai chiến lược xổ số của chúng tôi là . Ở một khía cạnh nào đó, lựa chọn thứ hai rủi ro hơn khoảng 71.247 USD.

Sự khác biệt giúp ích như thế nào trong việc lựa chọn chiến lược? Nó không rõ ràng. Một chiến lược có phương sai cao hơn sẽ rủi ro hơn; nhưng điều gì tốt hơn cho ví tiền của chúng ta - chơi rủi ro hay chơi an toàn? Hãy để chúng tôi có cơ hội mua không phải hai vé mà là cả trăm vé. Khi đó chúng ta có thể đảm bảo trúng một lần xổ số (và phương sai sẽ bằng 0); hoặc bạn có thể chơi hàng trăm trận hòa khác nhau, xác suất không nhận được gì, nhưng có cơ hội khác 0 để giành được số tiền lên tới đô la. Việc lựa chọn một trong những lựa chọn thay thế này nằm ngoài phạm vi của cuốn sách này; tất cả những gì chúng ta có thể làm ở đây là giải thích cách thực hiện các phép tính.

Thực sự có một cách dễ dàng hơn để tính phương sai hơn là sử dụng trực tiếpđịnh nghĩa (8.13). (Có mọi lý do để nghi ngờ một loại toán học ẩn nào đó ở đây; nếu không, tại sao phương sai trong các ví dụ xổ số lại trở thành bội số nguyên? Chúng ta có

kể từ - không đổi; kể từ đây,

“Phương sai là giá trị trung bình của bình phương trừ đi bình phương của giá trị trung bình.”

Ví dụ, trong bài toán xổ số, giá trị trung bình hóa ra là hoặc Phép trừ (bình phương của giá trị trung bình) cho kết quả mà chúng ta đã thu được trước đó theo một cách khó hơn.

Tuy nhiên, thậm chí còn có nhiều hơn công thức đơn giản, áp dụng được khi tính X và Y độc lập. Ta có

vì, như chúng ta biết, đối với các biến ngẫu nhiên độc lập.

“Phương sai của tổng các biến ngẫu nhiên độc lập bằng tổng phương sai của chúng.” Vì vậy, ví dụ, phương sai của số tiền có thể trúng được với một tờ vé số là bằng

Do đó, độ phân tán của tổng số tiền trúng thưởng của hai tờ vé số ở hai giải xổ số (độc lập) khác nhau sẽ là Giá trị phân tán tương ứng của vé số độc lập sẽ là

Phương sai của tổng số điểm tung trên hai con xúc xắc có thể được tính bằng cách sử dụng cùng một công thức, vì nó là tổng của hai biến ngẫu nhiên độc lập. chúng tôi có

cho đúng khối; do đó, trong trường hợp khối tâm bị dịch chuyển

do đó, nếu cả hai hình lập phương đều có khối tâm dịch chuyển. Xin lưu ý rằng trong trường hợp sau phương sai lớn hơn, mặc dù nó thường lấy giá trị trung bình là 7 nhiều hơn so với trường hợp xúc xắc thông thường. Nếu mục tiêu của chúng ta là tạo ra nhiều số bảy may mắn hơn thì phương sai không phải là dấu hiệu thành công tốt nhất.

Được rồi, chúng ta đã thiết lập được cách tính phương sai. Nhưng chúng tôi vẫn chưa đưa ra câu trả lời cho câu hỏi tại sao cần tính phương sai. Mọi người đều làm điều đó, nhưng tại sao? Lý do chính là sự bất bình đẳng của Chebyshev trong đó nêu rõ tài sản quan trọng phương sai:

(Bất đẳng thức này khác với bất đẳng thức Chebyshev đối với tổng mà chúng ta gặp trong Chương 2.) Ở mức độ định tính, (8.17) phát biểu rằng biến ngẫu nhiên X hiếm khi nhận các giá trị xa giá trị trung bình của nó nếu phương sai VX của nó nhỏ. Bằng chứng

việc quản lý cực kỳ đơn giản. Thật sự,

phép chia để hoàn thành việc chứng minh.

Nếu chúng ta biểu thị kỳ vọng toán học bằng một độ lệch chuẩn- qua a và thay vào (8.17) với điều kiện đó sẽ trở thành nên ta thu được từ (8.17)

Như vậy, X sẽ nằm trong khoảng - lần độ lệch chuẩn của giá trị trung bình của nó trừ trường hợp xác suất không vượt quá Biến ngẫu nhiên sẽ nằm trong khoảng 2a của ít nhất 75% số lần thử; từ đến - ít nhất là cho 99%. Đây là những trường hợp bất đẳng thức Chebyshev.

Nếu bạn tung một vài viên xúc xắc một lần thì tổng số tiền hầu như luôn luôn có điểm trong tất cả các lần ném, với những lần ném lớn thì nó sẽ gần bằng. Lý do cho điều này là như sau: độ phân tán của các lần ném độc lập sẽ là Độ phân tán có nghĩa là độ lệch chuẩn của tất cả

Do đó, từ bất đẳng thức Chebyshev ta thu được tổng các điểm sẽ nằm giữa

ít nhất là cho 99% số lần tung xúc xắc đúng. Ví dụ: kết quả của một triệu lần tung có xác suất trên 99% sẽ nằm trong khoảng từ 6,976 triệu đến 7,024 triệu.

TRONG trường hợp chung, cho X là biến ngẫu nhiên bất kỳ trên không gian xác suất P, có kỳ vọng toán học hữu hạn và độ lệch chuẩn hữu hạn a. Sau đó, chúng ta có thể đưa vào xem xét không gian xác suất Pn, các sự kiện cơ bản của nó là các chuỗi trong đó mỗi , và xác suất được định nghĩa là

Nếu bây giờ chúng ta xác định các biến ngẫu nhiên bằng công thức

sau đó giá trị

sẽ là tổng của các biến ngẫu nhiên độc lập, tương ứng với quá trình tính tổng các giá trị thực hiện độc lập của giá trị X trên P. Kỳ vọng sẽ bằng và độ lệch chuẩn là ; do đó, giá trị trung bình của việc thực hiện,

sẽ dao động từ đến trong ít nhất 99% khoảng thời gian. Nói cách khác, nếu bạn chọn một giá trị trung bình số học đủ lớn kiểm tra độc lập hầu như sẽ luôn rất gần với giá trị kỳ vọng (Trong sách giáo khoa lý thuyết xác suất, một định lý thậm chí còn mạnh hơn đã được chứng minh, gọi là định luật mạnh. số lượng lớn; nhưng hệ quả đơn giản của bất đẳng thức Chebyshev mà chúng ta vừa rút ra là đủ đối với chúng ta.)

Đôi khi chúng ta không biết các đặc tính của không gian xác suất, nhưng chúng ta cần ước tính kỳ vọng toán học của một biến ngẫu nhiên X bằng cách sử dụng các quan sát lặp lại giá trị của nó. (Ví dụ: chúng ta có thể muốn nhiệt độ trung bình vào buổi trưa tháng Giêng ở San Francisco; hoặc chúng ta có thể muốn biết tuổi thọ mà các đại lý bảo hiểm sẽ dựa vào đó để tính toán.) Nếu chúng ta có độc lập quan sát thực nghiệm thì chúng ta có thể giả sử rằng kỳ vọng toán học thực sự xấp xỉ bằng

Bạn cũng có thể ước tính phương sai bằng công thức

Nhìn vào công thức này, bạn có thể nghĩ rằng có lỗi đánh máy trong đó; có vẻ như nó sẽ ở đó như trong (8.19), vì giá trị thực của độ phân tán được xác định trong (8.15) thông qua các giá trị kỳ vọng. Tuy nhiên, thay thế ở đây bằng cho phép chúng ta có được đánh giá tốt nhất, vì từ định nghĩa (8.20) nó suy ra rằng

Đây là bằng chứng:

(Trong phép tính này chúng ta dựa vào tính độc lập của các quan sát khi thay thế bằng )

Trong thực tế, để đánh giá kết quả của một phép thử với biến ngẫu nhiên X, người ta thường tính giá trị trung bình thực nghiệm và độ lệch chuẩn thực nghiệm rồi viết kết quả dưới dạng. Ví dụ, đây là kết quả của việc ném một cặp xúc xắc, có lẽ đúng.

Các biến ngẫu nhiên, ngoài luật phân phối, còn có thể được mô tả đặc điểm số .

Kỳ vọng toán học M(x) của một biến ngẫu nhiên được gọi là giá trị trung bình của nó.

Kỳ vọng toán học của một biến ngẫu nhiên rời rạc được tính bằng công thức

Ở đâu giá trị biến ngẫu nhiên, p Tôi- xác suất của chúng.

Hãy xem xét các tính chất của kỳ vọng toán học:

1. Kỳ vọng toán học của một hằng số bằng chính hằng số đó

2. Nếu nhân một biến ngẫu nhiên với một số k nhất định thì kỳ vọng toán học sẽ được nhân với cùng một số đó

M(kx) = km(x)

3. Kỳ vọng toán học của tổng các biến ngẫu nhiên bằng tổng kỳ vọng toán học của chúng

M (x 1 + x 2 + … + x n) = M (x 1) + M (x 2) +…+ M (x n)

4. M(x1 - x2) = M(x1) - M(x2)

5. Đối với các biến ngẫu nhiên độc lập x 1, x 2,… x n thì kỳ vọng toán học của tích bằng tích kỳ vọng toán học của chúng

M (x 1, x 2, ... x n) = M (x 1) M (x 2) ... M (x n)

6. M(x - M(x)) = M(x) - M(M(x)) = M(x) - M(x) = 0

Hãy tính kỳ vọng toán học cho biến ngẫu nhiên từ Ví dụ 11.

M(x) = = .

Ví dụ 12. Cho các biến ngẫu nhiên x 1, x 2 được xác định tương ứng theo quy luật phân phối:

x 1 Bảng 2

x 2 Bảng 3

Hãy tính M (x 1) và M (x 2)

M (x 1) = (- 0,1) 0,1 + (- 0,01) 0,2 + 0 0,4 + 0,01 0,2 + 0,1 0,1 = 0

M (x 2) = (- 20) 0,3 + (- 10) 0,1 + 0 0,2 + 10 0,1 + 20 0,3 = 0

Kỳ vọng toán học của cả hai biến ngẫu nhiên đều giống nhau - chúng bằng 0. Tuy nhiên, bản chất phân phối của chúng là khác nhau. Nếu các giá trị x 1 khác một chút so với kỳ vọng toán học của chúng thì các giá trị x 2 trong ở một mức độ lớn khác với kỳ vọng toán học của họ và xác suất xảy ra những sai lệch như vậy là không nhỏ. Những ví dụ này cho thấy rằng không thể xác định từ giá trị trung bình những sai lệch nào xảy ra so với nó, cả nhỏ hơn và lớn hơn. mặt lớn. Vì vậy, với cùng một trung bình Dựa vào lượng mưa hàng năm ở hai khu vực, không thể nói rằng những khu vực này đều thuận lợi như nhau cho công việc nông nghiệp. Tương tự với mức trung bình tiền lương không thể phán xét được trọng lượng riêng người lao động được trả lương cao và thấp. Do đó, một đặc tính số được đưa ra - sự phân tán D(x) , đặc trưng cho mức độ sai lệch của một biến ngẫu nhiên so với giá trị trung bình của nó:

D(x) = M(x - M(x)) 2 . (2)

Độ phân tán là kỳ vọng toán học của độ lệch bình phương của một biến ngẫu nhiên so với kỳ vọng toán học. Đối với biến ngẫu nhiên rời rạc, phương sai được tính bằng công thức:

D(x)= = (3)

Từ định nghĩa độ phân tán suy ra D(x) 0.

Đặc tính phân tán:

1. Phương sai của hằng số bằng 0

2. Nếu nhân một biến ngẫu nhiên với một số k nhất định thì phương sai sẽ được nhân với bình phương của số này

D(kx) = k2D(x)

3. D(x) = M(x2) – M2(x)

4. Đối với các biến ngẫu nhiên độc lập theo cặp x 1 , x 2 , … x n phương sai của tổng bằng tổng của các phương sai.

D(x 1 + x 2 + … + x n) = D(x 1) + D(x 2) +…+ D(x n)

Hãy tính phương sai của biến ngẫu nhiên từ Ví dụ 11.

Kỳ vọng toán học M(x) = 1. Do đó, theo công thức (3) ta có:

D (x) = (0 – 1) 2 1/4 + (1 – 1) 2 1/2 + (2 – 1) 2 1/4 =1 1/4 +1 1/4= 1/2

Lưu ý rằng việc tính phương sai sẽ dễ dàng hơn nếu bạn sử dụng thuộc tính 3:

D(x) = M(x2) – M2(x).

Hãy tính phương sai của các biến ngẫu nhiên x 1 , x 2 từ Ví dụ 12 bằng công thức này. Kỳ vọng toán học của cả hai biến ngẫu nhiên đều bằng không.

D (x 1) = 0,01 0,1 + 0,0001 0,2 + 0,0001 0,2 + 0,01 0,1 = 0,001 + 0,00002 + 0,00002 + 0,001 = 0,00204

D (x 2) = (-20) 2 0,3 + (-10) 2 0,1 + 10 2 0,1 + 20 2 0,3 = 240 +20 = 260

Làm sao giá trị gần hơnđộ phân tán về 0 thì độ phân tán của biến ngẫu nhiên so với giá trị trung bình càng nhỏ.

Đại lượng đó được gọi là độ lệch chuẩn. Chế độ biến ngẫu nhiên x loại rời rạc Md Giá trị của biến ngẫu nhiên có xác suất cao nhất được gọi.

Chế độ biến ngẫu nhiên x loại liên tục Md, gọi điện số thực, được định nghĩa là điểm phân bố mật độ xác suất cực đại f(x).

Trung vị của một biến ngẫu nhiên x loại liên tục Mn là số thực thỏa mãn phương trình

Kỳ vọng

phân tán biến ngẫu nhiên liên tục X, các giá trị có thể thuộc về toàn bộ trục Ox, được xác định bởi đẳng thức:

Mục đích của dịch vụ. Máy tính trực tuyếnđược thiết kế để giải quyết các vấn đề trong đó một trong hai mật độ phân bố f(x) hoặc hàm phân phối F(x) (xem ví dụ). Thông thường trong những nhiệm vụ như vậy bạn cần tìm kỳ vọng toán học, trung bình độ lệch chuẩn, vẽ đồ thị các hàm f(x) và F(x).

Hướng dẫn. Chọn loại dữ liệu nguồn: mật độ phân bố f(x) hoặc hàm phân bố F(x).

Mật độ phân bố f(x) đã cho Hàm phân phối F(x) đã cho

Mật độ phân bố f(x) được cho:

Hàm phân phối F(x) được cho:

Một biến ngẫu nhiên liên tục được xác định bởi mật độ xác suất
(Định luật phân bố Rayleigh - dùng trong kỹ thuật vô tuyến). Tìm M(x) , D(x) .

Biến ngẫu nhiên X được gọi là liên tục , nếu hàm phân phối của nó F(X)=P(X< x) непрерывна и имеет производную.
Hàm phân phối của một biến ngẫu nhiên liên tục được sử dụng để tính xác suất một biến ngẫu nhiên rơi vào một khoảng cho trước:
P(α< X < β)=F(β) - F(α)
Hơn nữa, đối với một biến ngẫu nhiên liên tục, việc ranh giới của nó có nằm trong khoảng này hay không không quan trọng:
P(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Mật độ phân bố một biến ngẫu nhiên liên tục được gọi là hàm
f(x)=F’(x) , đạo hàm của hàm phân phối.

Tính chất của mật độ phân bố

1. Mật độ phân bố của biến ngẫu nhiên không âm (f(x) ≥ 0) với mọi giá trị của x.
2. Điều kiện chuẩn hóa:

Ý nghĩa hình học của điều kiện chuẩn hóa: diện tích dưới đường cong mật độ phân bố bằng đơn vị.
3. Xác suất để biến ngẫu nhiên X rơi vào khoảng từ α đến β có thể tính bằng công thức

Về mặt hình học, xác suất để biến ngẫu nhiên liên tục X rơi vào khoảng (α, β) bằng diện tích hình thang cong dưới đường cong mật độ phân phối dựa trên khoảng này.
4. Hàm phân bố được biểu thị dưới dạng mật độ như sau:

Giá trị của mật độ phân bố tại điểm x không bằng xác suất chấp nhận giá trị này; đối với một biến ngẫu nhiên liên tục chúng ta chỉ có thể nói đến xác suất rơi vào một khoảng cho trước. Cho phép)