Phân bố hình học có tham số. Phân bố hình học

Trong phân bố hình học, các thí nghiệm trong sơ đồ Bernoulli được thực hiện cho đến lần thành công đầu tiên, với xác suất thành công p trong một thí nghiệm duy nhất.
Ví dụ về số lượng như vậy có thể là:

  • số lần bắn trước cú đánh đầu tiên;
  • số lần kiểm tra thiết bị cho đến lần thất bại đầu tiên;
  • số lượng bóng cho đến khi màu trắng xuất hiện đầu tiên. xem giải pháp;
  • số lần tung đồng xu cho đến lần hạ cánh đầu tiên là mặt ngửa, v.v.
Chuỗi phân bố hình học của DSV có dạng:
X 1 2 3 tôi
P P qp q 2 trang q m-1 p

Các xác suất tạo thành một cấp số nhân với số hạng đầu tiên p và mẫu số q.
Kỳ vọng và phương sai toán học của biến ngẫu nhiên X, có phân bố hình học với tham số p, bằng:

Phân phối siêu hình học

Một biến ngẫu nhiên rời rạc có phân bố siêu hình học với các tham số n, k, m nếu nó nhận các giá trị 0, 1, 2,... với xác suất .
Một phân bố siêu hình học có một biến ngẫu nhiên X bằng số lượng đối tượng có một thuộc tính nhất định trong số m đối tượng được rút ngẫu nhiên (không trả về) từ một tập hợp gồm n đối tượng, k trong số đó có thuộc tính này.
Ví dụ:
  • Trong một lô 10 sản phẩm thì có 3 sản phẩm bị lỗi. 4 phần được loại bỏ. X là số phần có thể sử dụng được trong số những phần được trích xuất. (m = 4, n = 10, k = 3). xem giải pháp
Kỳ vọng toán học của biến ngẫu nhiên X có phân bố siêu bội và phương sai của nó bằng:

Ví dụ số 1. Trong bình có 2 bi trắng và 3 bi đen. Các quả bóng được rút ngẫu nhiên từ bình và không quay trở lại cho đến khi xuất hiện một quả bóng trắng. Ngay khi điều này xảy ra, quá trình dừng lại. Lập bảng phân bố của biến ngẫu nhiên X - số phép thử thực hiện, tìm F(x), P(X ≤ 2), M(X), D(X).·
Giải pháp: Chúng ta hãy biểu thị bằng A sự xuất hiện của một quả bóng màu trắng. Thí nghiệm chỉ có thể được thực hiện một lần nếu quả bóng trắng xuất hiện ngay lập tức: . Nếu bi trắng không xuất hiện lần đầu mà xuất hiện ở lần lấy thứ hai thì X = 2. Xác suất của một sự kiện như vậy là bằng nhau. Tương tự: , , . Hãy ghi dữ liệu vào bảng:


X

1

2

3

4

P

0,4

0,3

0,2

0,1

Hãy tìm F(x):

Hãy tìm P(X 2) = P(X = 1 hoặc X = 2) = 0,4 + 0,3 = 0,7
M(X) = 1 0,4 + 2 0,3 +3 0,2 + 4 0,1 = 2.
D(X) = (1-2) 2 0,4 + (2-2) 2 0,3 +(3-2) 2 0,2 ​​+ (4-2) 2 0,1 = 1 .

Ví dụ số 2. Hộp gồm 11 bộ phận, trong đó có 5 bộ phận bị lỗi. Người lắp ráp chọn ngẫu nhiên 4 phần.
1. Tìm xác suất để trong số các phần được trích xuất: Một) 4 khuyết tật; b) một chiếc bị lỗi; c) hai khuyết tật; d) ít nhất một chiếc bị lỗi.
2. Vẽ luật phân phối biến ngẫu nhiên X- số lượng bộ phận bị lỗi trong số những bộ phận bị loại bỏ.
3. Tìm M(X), D(X), σ(X).
4. Tính toán P(1
Giải pháp:
1. Tìm xác suất để trong số các phần được trích xuất:
Một) 4 khuyết tật;

b) một chiếc bị lỗi;
Tổng số kết quả cơ bản có thể có của các thử nghiệm này bằng số cách rút ra 4 phần từ 11:

Hãy đếm số kết quả có lợi cho sự kiện này (trong 4 phần có đúng 1 phần bị lỗi):

3 phần còn lại có thể chọn từ 7 phần:

Do đó số kết quả thuận lợi là: 5*20 = 100
Xác suất cần thiết bằng tỷ lệ giữa số kết quả thuận lợi cho sự kiện và số tất cả các kết quả cơ bản: P(1) = 100/330 = 0,303
c) hai khuyết tật;

d) ít nhất một chiếc bị lỗi.
Xác suất để không có bộ phận nào bị lỗi. X = 0.

Khi đó xác suất để có ít nhất một chiếc bị lỗi là:
P = 1 – P(0) = 1 – 0,0455 = 0,95

2. Hãy lập luật phân phối P(x), X là số phần bị lỗi trong số những phần bị loại bỏ.
Hãy tìm xác suất để có ba sản phẩm bị lỗi.


X

0

1

2

3

4

P

0,0455

0,303

0,4545

0,182

0,015

2. Hãy tìm M(X), D(X),σ(X).
Chúng ta tìm kỳ vọng toán học bằng công thức m = ∑x i pi .
Kỳ vọng M[X].
M[x] = 0*0,0455 + 1*0,303 + 2*0,4545 + 3*0,182 + 4*0,015 = 1,818
Chúng tôi tìm phương sai bằng cách sử dụng công thức d = ∑x 2 i p i - M[x] 2 .
Phương sai D[X].
D[X] = 0 2 *0,0455 + 1 2 *0,303 + 2 2 *0,4545 + 3 2 *0,182 + 4 2 *0,015 - 1,818 2 = 0,694
Độ lệch chuẩn σ(x).

3. Tính P(1 F(x 0) = 0
F(0< x ≤1) = 0.0455
F(1< x ≤2) = 0.303 + 0.0455 = 0.349
F(2< x ≤3) = 0.455 + 0.349 = 0.803
F(3< x ≤4) = 0.182 + 0.803 = 0.985
F(x>4) = 1
Xác suất để SW rơi vào khoảng này hay khoảng khác được tính theo công thức:
P(a ≤ X< b) = F(b) - F(a)
Hãy tìm xác suất để SV nằm trong khoảng 1 ≤ X< 4
P(1 ≤ X< 4) = F(4) - F(1) = 0.985 - 0.0455 = 0.9395

Ví dụ số 3. Có 7 phần trong một lô, có 3 phần bị lỗi. Bộ điều khiển lấy ngẫu nhiên 4 phần. Vẽ luật phân phối biến ngẫu nhiên X - số phần phù hợp trong mẫu. Tìm kỳ vọng và phương sai toán học của X. Vẽ hàm phân phối.
Tổng số bộ phận có thể sử dụng được: 7-3 = 4
1. Tìm xác suất để trong số 4 phần được chọn có một phần hoạt động tốt.
Tổng số kết quả cơ bản có thể có của các thử nghiệm này bằng số cách rút ra 4 phần từ 7:

Hãy đếm số kết quả có lợi cho sự kiện này.

Thống kê giúp chúng ta giải quyết nhiều vấn đề, ví dụ: khi không thể xây dựng mô hình xác định, khi có quá nhiều yếu tố hoặc khi chúng ta cần đánh giá khả năng của mô hình được xây dựng có tính đến dữ liệu có sẵn. Thái độ đối với thống kê là mơ hồ. Có ý kiến ​​cho rằng có ba loại nói dối: nói dối, nói dối chết tiệt và thống kê. Mặt khác, nhiều “người dùng” thống kê quá tin vào nó mà không hiểu đầy đủ về cách thức hoạt động của nó: ví dụ: áp dụng thử nghiệm cho bất kỳ dữ liệu nào mà không kiểm tra tính quy phạm của nó. Sự sơ suất như vậy có thể gây ra những lỗi nghiêm trọng và biến những “người hâm mộ” thử nghiệm thành những kẻ ghét thống kê. Chúng ta hãy thử đặt dòng điện qua i và tìm ra mô hình biến ngẫu nhiên nào sẽ được sử dụng để mô tả các hiện tượng nhất định và mối liên hệ di truyền nào tồn tại giữa chúng.

Trước hết, tài liệu này sẽ được sinh viên nghiên cứu lý thuyết xác suất và thống kê quan tâm, mặc dù các chuyên gia “trưởng thành” sẽ có thể sử dụng nó làm tài liệu tham khảo. Trong một trong những tác phẩm sau đây, tôi sẽ trình bày một ví dụ về việc sử dụng số liệu thống kê để xây dựng bài kiểm tra đánh giá tầm quan trọng của các chỉ báo trong chiến lược giao dịch trao đổi.

Công việc sẽ xem xét:


Cuối bài sẽ có câu hỏi để suy ngẫm. Tôi sẽ trình bày suy nghĩ của mình về vấn đề này trong bài viết tiếp theo.

Một số phân phối liên tục ở trên là trường hợp đặc biệt.

Phân phối rời rạc

Phân phối rời rạc được sử dụng để mô tả các sự kiện có đặc điểm không thể phân biệt được xác định tại các điểm cô lập. Nói một cách đơn giản, đối với các sự kiện mà kết quả của nó có thể được phân loại thành một số loại riêng biệt: thành công hay thất bại, số nguyên (ví dụ: trò chơi roulette, xúc xắc), mặt ngửa hoặc mặt sấp, v.v.

Một phân bố rời rạc về xác suất xảy ra của từng kết quả có thể xảy ra của một sự kiện được mô tả. Đối với bất kỳ phân phối nào (bao gồm cả liên tục), các khái niệm kỳ vọng và phân tán được xác định cho các sự kiện rời rạc. Tuy nhiên, cần hiểu rằng kỳ vọng toán học đối với một sự kiện ngẫu nhiên rời rạc là một giá trị trong trường hợp tổng quát không thể được coi là kết quả của một sự kiện ngẫu nhiên duy nhất, mà là một giá trị mà trung bình số học của các kết quả của các sự kiện. sẽ có xu hướng khi số lượng của chúng tăng lên.

Trong mô hình hóa các sự kiện ngẫu nhiên rời rạc, tổ hợp đóng một vai trò quan trọng, vì xác suất xảy ra kết quả của một sự kiện có thể được định nghĩa là tỷ lệ giữa số lượng kết hợp mang lại kết quả cần thiết trên tổng số kết hợp. Ví dụ: trong rổ có 3 quả bóng trắng và 7 quả bóng đen. Khi chọn 1 quả bóng từ rổ, chúng ta có thể thực hiện theo 10 cách khác nhau (tổng số cách kết hợp), nhưng chỉ có 3 phương án chọn bóng trắng (3 cách kết hợp cho ra kết quả theo yêu cầu). Vậy xác suất để chọn được bi trắng là: ().

Người ta cũng nên phân biệt giữa các mẫu có và không có trả lại. Ví dụ, để mô tả xác suất chọn được hai quả bóng trắng, điều quan trọng là phải xác định xem quả bóng đầu tiên có được đưa trở lại rổ hay không. Nếu không, thì chúng ta đang xử lý một mẫu không trả về () và xác suất sẽ như sau: - xác suất chọn được một quả bóng trắng từ mẫu ban đầu nhân với xác suất chọn lại một quả bóng trắng từ những quả bóng còn lại trong rổ . Nếu quả bóng đầu tiên quay trở lại rổ thì đây là lần lấy bóng bằng return(). Trong trường hợp này, xác suất chọn được hai bi trắng là .

Nếu chúng ta chính thức hóa ví dụ với một giỏ như sau: đặt kết quả của một sự kiện lấy một trong hai giá trị 0 hoặc 1 với xác suất tương ứng, thì phân bố xác suất để đạt được từng kết quả được đề xuất sẽ được gọi là phân phối Bernoulli :

Theo truyền thống lâu đời, kết quả có giá trị 1 được gọi là “thành công” và kết quả có giá trị 0 được gọi là “thất bại”. Rõ ràng, việc đạt được kết quả “thành công hay thất bại” xảy ra đều có xác suất.

Kỳ vọng và phương sai của phân phối Bernoulli:


Số lần thành công trong các thử nghiệm, kết quả của thử nghiệm này được phân phối theo xác suất thành công (ví dụ về việc trả bóng vào rổ), được mô tả bằng phân phối nhị thức:


Nói cách khác, chúng ta có thể nói rằng phân phối nhị thức mô tả tổng các biến ngẫu nhiên độc lập có thể được phân phối với xác suất thành công.
Kỳ vọng và phương sai:



Phân phối nhị thức chỉ có giá trị đối với một mẫu có kết quả trả về, nghĩa là khi xác suất thành công không đổi trong toàn bộ chuỗi thử nghiệm.

Nếu các đại lượng và có phân phối nhị thức với các tham số và , thì tổng của chúng cũng sẽ được phân phối nhị thức với các tham số .

Hãy tưởng tượng tình huống chúng ta rút bóng ra khỏi rổ và trả lại cho đến khi rút được bóng trắng. Số lượng các hoạt động như vậy được mô tả bằng phân bố hình học. Nói cách khác: phân bố hình học mô tả số lần thử cho đến lần thành công đầu tiên cùng với xác suất thành công trong mỗi lần thử. Nếu số lượng thử nghiệm xảy ra thành công thì sự phân bổ hình học sẽ được mô tả bằng công thức sau:


Kỳ vọng và phương sai của phân bố hình học:

Phân bố hình học có liên quan về mặt di truyền với phân bố mô tả một biến ngẫu nhiên liên tục: thời gian trước khi xảy ra sự kiện, với cường độ sự kiện không đổi. Phân bố hình học cũng là một trường hợp đặc biệt.

Phân bố Pascal là một dạng tổng quát của phân bố: nó mô tả sự phân bố số lần thất bại trong các thử nghiệm độc lập, kết quả của nó được phân bổ theo xác suất thành công trước khi tổng số thành công xảy ra. Khi nào , chúng tôi có được sự phân phối cho số lượng .


số lượng kết hợp từ by .

Kỳ vọng và phương sai của phân phối nhị thức âm:



Tổng các biến ngẫu nhiên độc lập được phân phối theo Pascal cũng được phân phối theo Pascal: cho nó có phân phối , và - . Giả sử chúng cũng độc lập thì tổng của chúng sẽ có phân phối

Cho đến nay chúng ta đã xem xét các ví dụ về các mẫu có sự đảo ngược, nghĩa là xác suất của kết quả không thay đổi từ lần thử này sang lần thử khác.

Bây giờ hãy xem xét tình huống không quay trở lại và mô tả xác suất của số lượng lựa chọn thành công từ một quần thể có số lần thành công và thất bại đã biết trước (số lượng bi trắng và đen đã biết trước trong rổ, quân át chủ bài trong bộ bài, các bộ phận bị lỗi trong trò chơi, v.v.).

Đặt toàn bộ bộ sưu tập chứa các đối tượng, một số trong số chúng được đánh dấu là “1” và “0”. Chúng tôi sẽ coi việc lựa chọn một đối tượng có nhãn “1” là thành công và có nhãn “0” là thất bại. Chúng tôi sẽ thực hiện n thử nghiệm và các đối tượng được chọn sẽ không tham gia vào các thử nghiệm tiếp theo nữa. Xác suất thành công sẽ tuân theo phân bố siêu bội:


số lượng kết hợp từ by .

Kỳ vọng và phương sai:


Phân bố Poisson


(lấy từ đây)

Phân bố Poisson khác biệt đáng kể so với các phân bố được thảo luận ở trên trong lĩnh vực “chủ đề” của nó: bây giờ người ta xem xét không phải xác suất xảy ra của một hoặc một kết quả thử nghiệm khác mà là cường độ của các sự kiện, tức là số lượng sự kiện trung bình trên một đơn vị thời gian.

Phân phối Poisson mô tả xác suất xảy ra các sự kiện độc lập theo thời gian ở cường độ trung bình của các sự kiện:


Kỳ vọng và phương sai của phân phối Poisson:

Phương sai và kỳ vọng của phân phối Poisson là như nhau.

Phân phối Poisson, kết hợp với , mô tả khoảng thời gian giữa các lần xuất hiện của các sự kiện độc lập, tạo thành cơ sở toán học của lý thuyết độ tin cậy.

Mật độ xác suất của tích các biến ngẫu nhiên x và y() có phân phối và có thể tính như sau:

Một số phân phối dưới đây là trường hợp đặc biệt của phân phối Pearson, do đó là một nghiệm của phương trình:


ở đâu và là các tham số phân phối. Có 12 loại phân phối Pearson đã biết, tùy thuộc vào giá trị tham số.

Các phân phối sẽ được thảo luận trong phần này có mối quan hệ chặt chẽ với nhau. Những mối liên hệ này được thể hiện ở chỗ một số phân phối là trường hợp đặc biệt của các phân phối khác hoặc mô tả các phép biến đổi của các biến ngẫu nhiên có phân phối khác.

Sơ đồ dưới đây cho thấy mối quan hệ giữa một số phân bố liên tục sẽ được xem xét trong bài viết này. Trong sơ đồ, các mũi tên liền chỉ sự biến đổi của các biến ngẫu nhiên (đầu mũi tên biểu thị phân phối ban đầu, phần cuối mũi tên chỉ kết quả) và các mũi tên chấm biểu thị mối quan hệ tổng quát (đầu mũi tên biểu thị phân phối, đây là trường hợp đặc biệt của phân phối mà phần cuối của mũi tên chỉ vào). Đối với các trường hợp đặc biệt của phân phối Pearson, loại phân phối Pearson tương ứng được biểu thị phía trên các mũi tên chấm.


Tổng quan về các phân bố được đề xuất dưới đây bao gồm nhiều trường hợp xảy ra trong phân tích dữ liệu và mô hình hóa quy trình, mặc dù tất nhiên, nó không chứa tất cả các phân bố mà khoa học đã biết.

Phân phối chuẩn (phân phối Gaussian)


(lấy từ đây)

Mật độ xác suất của phân phối chuẩn với các tham số và được mô tả bằng hàm Gaussian:

Nếu và , thì sự phân bố như vậy được gọi là tiêu chuẩn.

Kỳ vọng và phương sai của phân phối chuẩn:



Miền định nghĩa của phân phối chuẩn là tập hợp các số thực.

Phân phối chuẩn là phân phối loại VI.

Tổng bình phương của các đại lượng chuẩn độc lập có , và tỷ số của các đại lượng Gauss độc lập được phân bố trên .

Phân phối chuẩn có thể chia hết vô hạn: tổng của các đại lượng phân phối chuẩn và có tham số và theo đó, cũng có phân bố chuẩn với tham số , ở đâu và .

Giếng phân phối chuẩn mô hình hóa các đại lượng mô tả các hiện tượng tự nhiên, tiếng ồn có tính chất nhiệt động và sai số đo lường.

Ngoài ra, theo định lý giới hạn trung tâm, tổng của một số lượng lớn các số hạng độc lập cùng cấp sẽ hội tụ về phân phối chuẩn, bất kể sự phân bố của các số hạng đó. Do đặc tính này, phân phối chuẩn rất phổ biến trong phân tích thống kê; nhiều thử nghiệm thống kê được thiết kế cho dữ liệu có phân phối chuẩn.

Kiểm định z dựa trên tính chia hết vô hạn của phân phối chuẩn. Thử nghiệm này được sử dụng để kiểm tra xem giá trị mong đợi của một mẫu có giá trị phân phối chuẩn có bằng một giá trị nhất định hay không. Giá trị phương sai phải là được biết đến. Nếu giá trị phương sai không xác định và được tính toán dựa trên mẫu được phân tích thì phép thử t dựa trên .

Giả sử rằng chúng ta có một mẫu gồm n giá trị phân phối chuẩn độc lập từ tổng thể với độ lệch chuẩn, chúng ta hãy đưa ra giả thuyết rằng . Khi đó giá trị sẽ có phân phối chuẩn chuẩn. Bằng cách so sánh giá trị z thu được với các lượng tử của phân bố chuẩn, bạn có thể chấp nhận hoặc bác bỏ giả thuyết với mức ý nghĩa yêu cầu.

Do việc sử dụng rộng rãi phân phối Gaussian, nhiều nhà nghiên cứu không rành về thống kê đã quên kiểm tra tính quy phạm của dữ liệu hoặc đánh giá biểu đồ mật độ phân phối “bằng mắt”, tin tưởng một cách mù quáng rằng họ đang xử lý dữ liệu Gaussian. Theo đó, bạn có thể yên tâm sử dụng các thử nghiệm được thiết kế để phân phối bình thường và nhận được kết quả hoàn toàn không chính xác. Đây có lẽ là nơi bắt nguồn tin đồn về số liệu thống kê là loại lời nói dối khủng khiếp nhất.

Hãy xem xét một ví dụ: chúng ta cần đo điện trở của một bộ điện trở có giá trị nhất định. Điện trở có bản chất vật lý; thật hợp lý khi giả định rằng sự phân bố độ lệch điện trở so với giá trị danh nghĩa sẽ bình thường. Chúng tôi đo và thu được hàm mật độ xác suất hình chuông cho các giá trị đo được với chế độ gần với giá trị điện trở. Đây có phải là một phân phối bình thường? Nếu có, thì chúng ta sẽ tìm kiếm các điện trở bị lỗi bằng cách sử dụng , hoặc phép thử z, nếu chúng ta biết trước sự phân tán của phân bố. Tôi nghĩ rằng nhiều người sẽ làm điều đó.

Nhưng chúng ta hãy xem xét kỹ hơn công nghệ đo điện trở: Điện trở được định nghĩa là tỷ số giữa điện áp đặt vào và dòng điện. Chúng tôi đo dòng điện và điện áp bằng các dụng cụ đo, do đó chúng có sai số phân bố chuẩn. Tức là các giá trị đo được của dòng điện và điện áp là biến ngẫu nhiên có phân phối chuẩn với kỳ vọng toán học tương ứng với giá trị thực của đại lượng đo được. Điều này có nghĩa là các giá trị điện trở thu được được phân phối theo , chứ không theo Gaussian.

Phân phối mô tả tổng bình phương của các biến ngẫu nhiên, mỗi biến được phân phối theo luật chuẩn chuẩn:

Đâu là số bậc tự do, .

Kỳ vọng và sự phân tán của phân phối:



Miền định nghĩa là tập hợp các số tự nhiên không âm. là một phân phối chia hết vô hạn. Nếu và được phân phối theo thứ tự và có bậc tự do tương ứng, thì tổng của chúng cũng sẽ được phân phối và có bậc tự do.

Đây là trường hợp đặc biệt (và do đó là phân phối Loại III) và mang tính tổng quát. Tỷ lệ số lượng phân phối trên phân phối trên .

Bài kiểm tra mức độ phù hợp của Pearson dựa trên sự phân bổ. Sử dụng tiêu chí này, bạn có thể kiểm tra độ tin cậy của mẫu biến ngẫu nhiên thuộc một phân bố lý thuyết nhất định.

Giả sử rằng chúng ta có một mẫu gồm một số biến ngẫu nhiên. Dựa trên mẫu này, chúng tôi tính toán xác suất các giá trị rơi vào các khoảng (). Giả sử cũng có một giả định về biểu thức phân tích của phân bố, theo đó xác suất rơi vào các khoảng đã chọn sẽ là . Sau đó số lượng sẽ được phân phối theo quy luật thông thường.

Chúng ta hãy rút gọn về phân phối chuẩn chuẩn: ,
ở đâu và .

Các giá trị kết quả có phân phối chuẩn với các tham số (0, 1) và do đó, tổng bình phương của chúng được phân phối theo một mức độ tự do. Việc giảm mức độ tự do có liên quan đến một hạn chế bổ sung về tổng xác suất của các giá trị rơi vào các khoảng: nó phải bằng 1.

Bằng cách so sánh giá trị với các lượng tử của phân bố, bạn có thể chấp nhận hoặc bác bỏ giả thuyết về phân bố lý thuyết của dữ liệu với mức ý nghĩa yêu cầu.

Phân phối Sinh viên được sử dụng để tiến hành kiểm định t: kiểm định sự bằng nhau của giá trị kỳ vọng của một mẫu gồm các biến ngẫu nhiên có phân phối với một giá trị nhất định, hoặc sự bằng nhau của giá trị kỳ vọng của hai mẫu có cùng phương sai (đẳng thức) phải kiểm tra các phương sai). Phân phối Sinh viên mô tả tỷ lệ của một biến ngẫu nhiên được phân phối với một biến được phân phối trên .

Cho và là các biến ngẫu nhiên độc lập có bậc tự do và tương ứng. Khi đó đại lượng sẽ có phân phối Fisher với bậc tự do và đại lượng sẽ có phân phối Fisher với bậc tự do.
Phân phối Fisher được xác định cho các đối số thực không âm và có mật độ xác suất:


Kỳ vọng và phương sai của phân phối Fisher:



Giá trị kỳ vọng được xác định cho , và phương sai được xác định cho .

Một số kiểm định thống kê dựa trên phân bố Fisher, chẳng hạn như đánh giá tầm quan trọng của các tham số hồi quy, kiểm định tính không đồng nhất và kiểm định sự bằng nhau của các phương sai mẫu (kiểm định f, nên được phân biệt với kiểm định chính xác Phép thử Fisher).

F-test: giả sử có hai mẫu độc lập và khối lượng dữ liệu phân tán tương ứng. Chúng ta hãy đưa ra một giả thuyết về sự bằng nhau của các phương sai mẫu và kiểm tra nó bằng thống kê.

Hãy tính giá trị. Nó sẽ có phân phối Fisher với bậc tự do.

Bằng cách so sánh giá trị với các lượng tử của phân phối Fisher tương ứng, chúng ta có thể chấp nhận hoặc bác bỏ giả thuyết về sự bằng nhau của phương sai mẫu với mức ý nghĩa yêu cầu.

Phân phối theo cấp số nhân (theo cấp số nhân) và phân phối Laplace (theo cấp số nhân, theo cấp số nhân)


(lấy từ đây)

Phân bố hàm mũ mô tả khoảng thời gian giữa các sự kiện độc lập xảy ra ở cường độ trung bình. Số lần xuất hiện của một sự kiện như vậy trong một khoảng thời gian nhất định được mô tả là rời rạc. Sự phân bố theo cấp số nhân và tạo thành cơ sở toán học của lý thuyết về độ tin cậy.

Ngoài lý thuyết về độ tin cậy, phân phối mũ còn được sử dụng trong mô tả các hiện tượng xã hội, trong kinh tế, trong lý thuyết xếp hàng, trong hậu cần vận tải - bất cứ nơi nào cần mô hình hóa dòng sự kiện.

Phân phối mũ là trường hợp đặc biệt (với n=2), và do đó . Vì đại lượng phân bố theo cấp số nhân là đại lượng chi bình phương với 2 bậc tự do, nên nó có thể được hiểu là tổng bình phương của hai đại lượng độc lập có phân bố chuẩn.

Ngoài ra, phân phối theo cấp số nhân là một trường hợp công bằng

BÀI 8

Phân phối xác suất của các biến ngẫu nhiên rời rạc.Phân phối nhị thức. Phân phối Poisson. Phân bố hình học. Chức năng tạo.

6. PHÂN PHỐI XÁC SUẤT
BIẾN RẰNG NGẪU NHIÊN RÁC BIỆT

Phân phối nhị thức

Hãy để nó được sản xuất N các thử nghiệm độc lập, trong mỗi thử nghiệm đó sự kiện MỘT Nó có thể xuất hiện hoặc không. Xác suất P sự xuất hiện của một sự kiện MỘT trong tất cả các bài kiểm tra là không đổi và không thay đổi từ bài kiểm tra này sang bài kiểm tra khác. Coi như một biến ngẫu nhiên X số lần xuất hiện của sự kiện MỘT trong những thử nghiệm này. Công thức tính xác suất xảy ra sự kiện MỘT
trơn tru k mỗi lần một lần N các bài kiểm tra, như đã biết, được mô tả Công thức Bernoulli

Phân bố xác suất được xác định bởi công thức Bernoulli được gọi là nhị thức .

Định luật này được gọi là “nhị thức” vì vế phải có thể coi là một số hạng tổng quát trong khai triển nhị thức Newton

Hãy viết định luật nhị thức dưới dạng bảng

X N N–1 k
P p n np n –1 q qn

Chúng ta hãy tìm các đặc tính số của phân phối này.

.

Chúng ta hãy viết ra phương trình nhị phân của Newton

.

và lấy đạo hàm của nó theo p. Kết quả là chúng tôi nhận được

.

Nhân vế trái và vế phải với P:

.

Xem xét rằng p+q=1, chúng ta có

(6.2)

Vì thế, kỳ vọng toán học về số lần xuất hiện của các sự kiện trong n phép thử độc lập bằng tích của số lần thử n với xác suất p xảy ra một sự kiện trong mỗi phép thử.

Hãy tính phương sai bằng công thức

Đối với điều này, chúng tôi sẽ tìm thấy

.

Trước tiên chúng ta hãy phân biệt công thức nhị thức Newton hai lần đối với P:

và nhân cả hai vế của đẳng thức với P 2:

Kể từ đây,

Vì vậy, phương sai của phân phối nhị thức là

. (6.3)

Những kết quả này cũng có thể thu được từ lý luận định tính thuần túy. Tổng số X lần xuất hiện của sự kiện A trong tất cả các thử nghiệm là tổng số lần xuất hiện của sự kiện trong các thử nghiệm riêng lẻ. Do đó, nếu X 1 là số lần xuất hiện của sự kiện trong lần thử đầu tiên, X 2 – trong lần thử thứ hai, v.v., thì tổng số lần xuất hiện của sự kiện A trong tất cả các lần thử là bằng X = X 1 +X 2 +…+X N. Theo tính chất kỳ vọng toán học:



Mỗi số hạng ở vế phải của đẳng thức là kỳ vọng toán học của số sự kiện trong một phép thử, bằng xác suất của sự kiện đó. Như vậy,

Theo tính chất phân tán:

Vì , và kỳ vọng toán học của một biến ngẫu nhiên, chỉ có thể nhận hai giá trị, cụ thể là 1 2 với xác suất P và 0 2 với xác suất q, Cái đó . Như vậy, Kết quả là, chúng tôi nhận được

Sử dụng khái niệm mômen ban đầu và mômen trung tâm, chúng ta có thể thu được các công thức tính độ bất đối xứng và độ nhọn:

. (6.4)

Đa giác của phân bố nhị thức có dạng sau (xem Hình 6.1). Xác suất P N(k) đầu tiên tăng khi tăng k, đạt giá trị cao nhất và sau đó bắt đầu giảm. Phân phối nhị thức bị lệch trừ trường hợp P= 0,5. Lưu ý rằng với số lượng lớn các bài kiểm tra N Phân phối nhị thức rất gần với phân bố chuẩn. (Cơ sở căn bản của đề xuất này liên quan đến định lý địa phương của Moivre-Laplace.)

Số m 0 lần xuất hiện của một sự kiện được gọi là rất có thể, nếu xác suất của một sự kiện xảy ra với số lần nhất định trong chuỗi thử nghiệm này là lớn nhất (tối đa trong đa giác phân phối). Đối với phân phối nhị thức

. (6.5)

Bình luận. Bất đẳng thức này có thể được chứng minh bằng cách sử dụng công thức hồi quy cho xác suất nhị thức:

(6.6)

Ví dụ 6.1. Thị phần sản phẩm cao cấp tại doanh nghiệp này là 31%. Kỳ vọng và phương sai toán học cũng như số lượng sản phẩm cao cấp có thể xảy ra nhất trong một lô 75 sản phẩm được chọn ngẫu nhiên là gì?

Giải pháp. Từ P=0,31, q=0,69, N=75 thì

M[ X] = n.p.= 75×0,31 = 23,25; Đ[ X] = npq= 75×0,31×0,69 = 16,04.

Để tìm số có xác suất lớn nhất tôi 0, hãy tạo bất đẳng thức kép

Nó theo sau đó tôi 0 = 23.

Phân bố Poisson

Như đã lưu ý, phân phối nhị thức tiến tới chuẩn khi N®¥. Tuy nhiên, điều này không xảy ra nếu cùng với sự gia tăng N một trong những số lượng P hoặc q có xu hướng bằng không. Trong trường hợp này, công thức Poisson tiệm cận đúng, tức là Tại N®¥, P®0

, (6.7)

ở đâu tôi = n.p.. Công thức này xác định Luật phân phối Poisson , có ý nghĩa độc lập và không chỉ là trường hợp đặc biệt của phân phối nhị thức. Không giống như phân phối nhị thức, ở đây biến ngẫu nhiên k có thể nhận vô số giá trị: k=0,1,2,…

Định luật Poisson mô tả số lượng sự kiện k xảy ra trong những khoảng thời gian bằng nhau, với điều kiện là các sự kiện xảy ra độc lập với nhau với cường độ trung bình không đổi, được đặc trưng bởi tham số l. Đa giác phân phối Poisson được hiển thị trong Hình. 6.2. Lưu ý rằng đối với các cuộc đua l lớn
Phân phối Poisson tiến tới bình thường. Do đó, phân phối Poisson được sử dụng, như một quy luật, trong trường hợp l có thứ tự thống nhất và số lần thử N phải lớn và xác suất xảy ra sự kiện đó P trong mỗi bài kiểm tra là nhỏ. Về vấn đề này, định luật Poisson thường được gọi là quy luật phân bố hiện tượng hiếm gặp.

Ví dụ về các tình huống phát sinh phân bố Poisson là phân bố của: 1) số lượng vi khuẩn nhất định trên một đơn vị thể tích; 2) số lượng electron phát ra từ cực âm bị đốt nóng trong một đơn vị thời gian; 3) số lượng hạt a phát ra từ nguồn phóng xạ trong một khoảng thời gian nhất định; 4) số lượng cuộc gọi đến tổng đài điện thoại vào một thời điểm nhất định trong ngày, v.v.

Hãy viết định luật Poisson dưới dạng bảng

X k
P

Hãy kiểm tra xem tổng của tất cả các xác suất có bằng 1 không:

Chúng ta hãy tìm các đặc tính số của phân phối này. Theo định nghĩa về kỳ vọng toán học của DSV, chúng ta có

Lưu ý rằng trong tổng cuối cùng, tổng bắt đầu bằng k=1, vì số hạng đầu tiên của tổng tương ứng với k=0, bằng 0.

Để tìm phương sai, trước tiên chúng ta tìm kỳ vọng toán học của bình phương ngẫu nhiên:

Như vậy, kỳ vọng và phương sai toán học của một biến ngẫu nhiên được phân phối theo định luật Poisson trùng khớp và bằng tham số của phân phối này

. (6.8)

Đây là đặc điểm nổi bật của phân phối Poisson. Do đó, nếu dựa trên dữ liệu thực nghiệm, người ta thấy rằng kỳ vọng toán học và phương sai của một giá trị nhất định gần nhau thì có lý do để cho rằng biến ngẫu nhiên này được phân phối theo định luật Poisson.

Sử dụng khái niệm mômen ban đầu và mô men trung tâm, chúng ta có thể chỉ ra rằng đối với phân bố Poisson, hệ số độ lệch và độ nhọn bằng nhau:

. (6.9)

Vì tham số l luôn dương nên phân phối Poisson luôn có độ lệch dương và độ nhọn.

Bây giờ chúng ta hãy chứng minh rằng công thức Poisson có thể được coi là một mô hình toán học của dòng sự kiện đơn giản nhất.

Dòng chảy sự kiện gọi một chuỗi các sự kiện xảy ra vào những thời điểm ngẫu nhiên. Luồng được gọi là đơn giản nhất, nếu nó có tính chất tính cố định, không có hậu quảsự tầm thường.

Cường độ dòng chảy l là số sự kiện trung bình xảy ra trong một đơn vị thời gian.

Nếu biết hằng số cường độ dòng chảy l thì xác suất xảy ra k các sự kiện có dòng chảy đơn giản nhất theo thời gian tđược xác định theo công thức Poisson:

. (6.10)

Công thức này phản ánh tất cả các thuộc tính của luồng đơn giản nhất. Hơn nữa, mọi luồng đơn giản nhất đều được mô tả bằng công thức Poisson, do đó các luồng đơn giản nhất thường được gọi là Poisson.

Tính chất cố định k các sự kiện trong bất kỳ khoảng thời gian nào chỉ phụ thuộc vào số lượng k và theo thời hạn t khoảng thời gian và không phụ thuộc vào thời điểm bắt đầu đếm. Nói cách khác, nếu dòng chảy có tính chất dừng thì xác suất xảy ra k sự kiện trong một khoảng thời gian t có một hàm số chỉ phụ thuộc vào k và từ t.

Trong trường hợp luồng đơn giản nhất, theo công thức Poisson (6.10) thì xác suất k sự kiện trong thời gian t, ở một cường độ nhất định, là một hàm chỉ có hai đối số: kt, đặc trưng cho tính chất dừng.

Không có đặc tính hậu quảđó là xác suất xảy ra k các sự kiện trong bất kỳ khoảng thời gian nào phụ thuộc vào việc các sự kiện xuất hiện hay không xuất hiện tại các thời điểm trước thời điểm bắt đầu của khoảng thời gian được đề cập. Nói cách khác, lịch sử của dòng chảy không ảnh hưởng đến xác suất của các sự kiện xảy ra trong tương lai gần.

Trong trường hợp dòng đơn giản nhất, công thức Poisson (6.10) không sử dụng thông tin về sự xuất hiện của các sự kiện trước khi bắt đầu khoảng thời gian đang được xem xét, điều này đặc trưng cho đặc tính không có hậu quả.

Tính chất thông thường là việc xảy ra hai hoặc nhiều sự kiện trong một khoảng thời gian ngắn là điều thực tế không thể xảy ra. Nói cách khác, xác suất xảy ra nhiều sự kiện trong một khoảng thời gian ngắn là không đáng kể so với xác suất chỉ xảy ra một sự kiện.

Chúng ta hãy chỉ ra rằng công thức Poisson (6.10) phản ánh tính chất bình thường. Đặt k= 0 và k=1, chúng ta lần lượt tìm thấy xác suất để không có sự kiện nào xảy ra và khả năng xảy ra một sự kiện:

Do đó, xác suất xảy ra nhiều sự kiện là

Sử dụng khai triển hàm số trong chuỗi Maclaurin, sau các phép biến đổi cơ bản ta thu được

.

So sánh P t(1) và P t(k>1), chúng tôi kết luận rằng với các giá trị nhỏ t xác suất xảy ra nhiều hơn một sự kiện là không đáng kể so với xác suất xảy ra một sự kiện, đặc trưng cho tính chất bình thường.

Ví dụ 6.2. Theo quan sát của Rutherford và Geiger, một chất phóng xạ trong khoảng thời gian 7,5 giây phát ra trung bình 3,87 hạt a. Tìm xác suất để có 1 giây chất này sẽ phát ra ít nhất một hạt.

Giải pháp. Như chúng ta đã lưu ý, sự phân bố số lượng hạt a phát ra từ nguồn phóng xạ trong một khoảng thời gian nhất định được mô tả bằng công thức Poisson, tức là tạo thành dòng sự kiện đơn giản nhất. Vì cường độ phát xạ của hạt a trong 1 giây bằng

,

thì công thức Poisson (6.10) có dạng

Như vậy, xác suất mà t=1 giây chất đó sẽ phát ra ít nhất một hạt sẽ bằng nhau

Phân bố hình học

Hãy để việc bắn được thực hiện vào một mục tiêu nhất định cho đến lần bắn trúng đầu tiên và xác suất P Việc bắn trúng mục tiêu ở mỗi lần bắn là như nhau và không phụ thuộc vào kết quả của những lần bắn trước đó. Nói cách khác, trong thí nghiệm đang xem xét, sơ đồ Bernoulli được thực hiện. Là một biến ngẫu nhiên X, chúng ta sẽ xem xét số phát bắn. Rõ ràng các giá trị có thể có của biến ngẫu nhiên X là các số tự nhiên: x 1 =1, x 2 =2, ... thì xác suất cần đến nó k các cú đánh sẽ bằng nhau

. (6.11)

Giả sử trong công thức này k=1,2, ... ta thu được cấp số nhân với số hạng đầu tiên P và một số nhân q:

Vì lý do này, phân bố xác định theo công thức (6.11) được gọi là hình học .

Sử dụng công thức tính tổng của cấp số nhân giảm vô hạn, dễ dàng chứng minh được rằng

.

Hãy tìm các đặc tính số của phân bố hình học.

Theo định nghĩa về kỳ vọng toán học của DSV, chúng ta có

.

Hãy tính phương sai bằng công thức

.

Đối với điều này, chúng tôi sẽ tìm thấy

.

Kể từ đây,

.

Vì vậy, kỳ vọng toán học và phương sai của phân bố hình học bằng

. (6.12)

6.4.* Hàm tạo

Khi giải các bài toán liên quan đến DSV, phương pháp tổ hợp thường được sử dụng. Một trong những phương pháp lý thuyết phát triển nhất của phân tích tổ hợp là phương pháp tạo hàm, đây là một trong những phương pháp mạnh mẽ nhất trong các ứng dụng. Chúng ta hãy làm quen với anh ấy một cách ngắn gọn.

Nếu biến ngẫu nhiên x chỉ nhận các giá trị nguyên không âm, tức là

,

Cái đó hàm tạo phân phối xác suất của một biến ngẫu nhiên x được gọi là hàm

, (6.13)

Ở đâu z– biến thực hoặc biến phức. Lưu ý rằng giữa nhiều hàm tạo j x ( x)và nhiều bản phân phối(P(x= k)} có một sự tương ứng một-một.

Cho biến ngẫu nhiên x có phân phối nhị thức

.

Sau đó, sử dụng công thức nhị thức Newton, chúng ta có được

,

những thứ kia. hàm tạo phân phối nhị thức trông giống như

. (6.14)

Phép cộng. Hàm tạo Poisson

trông giống như

. (6.15)

Tạo hàm phân bố hình học

trông giống như

. (6.16)

Sử dụng các hàm sinh, sẽ thuận tiện hơn khi tìm ra các đặc tính số chính của DSV. Ví dụ: khoảnh khắc ban đầu thứ nhất và thứ hai có liên quan đến hàm sinh bằng các đẳng thức sau:

, (6.17)

. (6.18)

Phương pháp sinh hàm thường thuận tiện vì trong một số trường hợp hàm phân phối của DSV rất khó xác định, trong khi hàm sinh đôi khi lại dễ tìm. Ví dụ, hãy xem xét thiết kế thử nghiệm độc lập tuần tự của Bernoulli, nhưng thực hiện một thay đổi đối với nó. Cho xác suất xảy ra sự kiện MỘT thay đổi tùy theo từng phiên tòa. Điều này có nghĩa là công thức Bernoulli trở nên không thể áp dụng được cho sơ đồ như vậy. Nhiệm vụ tìm hàm phân phối trong trường hợp này gặp khó khăn đáng kể. Tuy nhiên, đối với sơ đồ này, hàm sinh rất dễ tìm và do đó, các đặc tính số tương ứng cũng dễ tìm.

Việc sử dụng rộng rãi các hàm sinh dựa trên thực tế là việc nghiên cứu tổng các biến ngẫu nhiên có thể được thay thế bằng việc nghiên cứu tích của các hàm sinh tương ứng. Vậy nếu x 1, x 2, …, x N thì độc lập

Cho phép p k=Pk(MỘT) – xác suất “thành công” trong k-kiểm tra thứ trong mạch Bernoulli (tương ứng, q k=1–p k– xác suất “thất bại” trong k bài kiểm tra thứ ). Khi đó, theo công thức (6.19), hàm sinh sẽ có dạng

. (6.20)

Sử dụng hàm tạo này, chúng ta có thể viết

.

Nó được tính đến ở đây rằng p k +q k=1. Bây giờ, sử dụng công thức (6.1), chúng ta tìm được thời điểm ban đầu thứ hai. Để làm điều này, trước tiên chúng ta tính toán

.

Trong trường hợp đặc biệt P 1 =P 2 =…=p n=P(tức là trong trường hợp phân phối nhị thức) từ các công thức thu được, Mx= n.p., Dx= npq.


Những thứ kia. ngẫu nhiên rời rạc giá trị của X có một geom. nhà phân phối với tham số r và mẫu số q, nếu lấy giá trị 1,2,3,… k, ... với xác suất

P(X) = pq k-1, ở đâu q=1-r.

Sự phân bố này được gọi là geom., bởi vì. sự thật p 1, p 2, ... tạo thành một cấp số nhân, thành viên đầu tiên của nó là r, và mẫu số là q.

Nếu số lượng bài kiểm tra không bị giới hạn, tức là. nếu một biến ngẫu nhiên có thể lấy các giá trị 1, 2, ..., ∞ thì giá trị kỳ vọng và phương sai có tính chất hình học. phân phối có thể được tìm thấy bằng cách sử dụng các công thức Mх = 1/p, Dх = q/p 2

Ví dụ. Súng bắn vào mục tiêu cho đến khi thực hiện được phát bắn đầu tiên. Xác suất bắn trúng mục tiêu là p = 0,6 cho mỗi lần bắn. S.v. X là số lần bắn có thể thực hiện được trước cú đánh đầu tiên.

A) Biên dịch chuỗi phân phối, tìm hàm phân phối, xây dựng biểu đồ của nó và tìm tất cả các đặc điểm số. b) Tìm kỳ vọng và phương sai toán học trong trường hợp người bắn có ý định bắn không quá ba phát.

MỘT) Biến ngẫu nhiên có thể nhận các giá trị 1, 2, 3, 4,..., ∞
P(1) = p = 0,6
P(2) = qp = 0,4 0,6 = 0,24
P(3) = q 2 p = 0,4 2 0,6 = 0,096 ...
P(k) = q k-1 p = 0,4 k-1 0,6 ...
Phạm vi phân phối:



Kiểm soát: Σp i = 0,6/(1-0,4) = 1 (tổng cấp số nhân)

Hàm phân phối là xác suất mà r.v. X sẽ nhận giá trị nhỏ hơn giá trị số cụ thể của x. Các giá trị của hàm phân phối được tìm thấy bằng cách tính tổng các xác suất.

Nếu x 1 thì F(x) = 0

Nếu 1< x ≤ 2, то F(x) = 0,6
Nếu 2< x ≤ 3, то F(x) = 0,6 + 0,24 = 0,84
Nếu 3< x ≤ 4, то F(x) = 0,84 + 0,096 = 0,936 ...
Nếu k-1< x ≤ k, то F(x) = 0,6(1-0,4 k-1)/(1-0,4) = 1-0,4 k-1 (частичная сумма геом-ой прогрессии) ...

Mx = 1/p = 1/0,6 ≈ 1,667
Dх = q/p 2 = 0,4/0,36 ≈ 1,111
σ = √Dх ≈ 1,054

X
r 0,6 0,24 0,16

b) Biến ngẫu nhiên có thể nhận các giá trị 1, 2, 3.
P(1) = p = 0,6
P(2) = qp = 0,4 0,6 = 0,24
P(3) = q 2 p + q 3 = 0,4 2 0,6 + 0,4 3 = 0,16
Phạm vi phân phối:

Kiểm soát: Σp i = 0,6 + 0,24 + 0,16 = 1
Chức năng phân phối.

Nếu x 1 thì F(x) = 0
Nếu 1< x ≤ 2, то F(x) = 0,6
Nếu 2< x ≤ 3, то F(x) = 0,6 + 0,24 = 0,84
Nếu x > 3 thì F(x) = 0,84 + 0,16 = 1
M(X) = 1 0,6 + 2 0,24 + 3 0,16 = 1,56
D(X) = 1 2 0,6 + 2 2 0,24 + 3 2 0,16 - 1,56 2 = 0,5664
σ(Х) ≈ 0,752

Độ lệch và độ nhọn

Bất đối xứng là một thuộc tính của phân bố mẫu đặc trưng cho tính bất đối xứng của phân bố của một biến ngẫu nhiên. Trong thực tế, sự phân bố đối xứng rất hiếm và để xác định và đánh giá mức độ bất đối xứng, khái niệm bất đối xứng được đưa ra. Trong trường hợp hệ số bất đối xứng âm, sự “giảm dần” nhẹ nhàng hơn được quan sát ở bên trái, nếu không thì ở bên phải. Trong trường hợp đầu tiên, sự bất đối xứng được gọi là mặt trái và trong trường hợp thứ hai - mặt phải.

hệ số bất đối xứng rời rạc biến ngẫu nhiên được tính bằng công thức:
Vì(X) = (x 1-M X) 3 p 1 + (x 2 - M X) 3 p 2 + ... + ( x n-M X) 3 p n

Coeff. sự bất đối xứng liên tục sl.vel. được tính theo công thức:

Thặng dư là thước đo độ dốc của đường cong phân phối. Hệ số kurtosis của biến ngẫu nhiên rời rạc được tính theo công thức:

Ví dụ(X) = [(x 1 - M X) 4 p 1 + (x 2 - M X) 4 p 2 + ... + (x n - M X) 4 p n ] / σ 4 - 3

Hệ số kurtosis của biến ngẫu nhiên liên tục được tính theo công thức:

Ví dụ.

Luật phân phối của biến ngẫu nhiên rời rạc X là danh sách tất cả các giá trị có thể có của biến tiếp theo. X mà nó có thể chấp nhận và xác suất tương ứng. Tổng của tất cả các niềm tin phải bằng 1. Kiểm tra: 0,1 + 0,2 + 0,5 + 0,1 + 0,1 = 1.

  1. Kỳ vọng: M(X) = -2 0,1 - 1 0,2 + 0 0,5 + 1 0,1 + 2 0,1 = -0,1
  2. phân tán là kỳ vọng toán học của độ lệch bình phương của các giá trị của tốc độ tiếp theo. X từ mat.ozh. của cô ấy: D(X) = (-2 + 0,1) 2 0,1 + (- 1 + 0,1) 2 0,2 ​​+ (0 + 0,1) 2 0,5 + (1 + 0,1) 2 0,1 + (2 + 0,1) 2 0,1 = 1,09
    hoặc D(X) = (-2) 2 0,1 + (-1) 2 0,2 ​​+ 0 2 0,5 + 1 2 0,1 + 2 2 0,1 - (-0 ,1) 2 = 1,1 - 0,01 = 1,09
  3. Thứ Tư. vuông. tắt là căn bậc hai của phương sai: σ = √1,09 ≈ 1,044
  4. Coef. sự bất đối xứng As(X) = [(-2 + 0,1) 3 0,1 + (- 1 + 0,1) 3 0,2 + (0 + 0,1) 3 0,5 + (1 + 0,1) 3 0,1 + (2 + 0,1) 3 0,1] / 1,044 3 = 0,200353
  5. Coef. thặng dư E x(X) = [(-2 + 0,1) 4 0,1 + (- 1 + 0,1) 4 0,2 + (0 + 0,1) 4 0,5 + (1 + 0 ,1) 4 ·0,1 + (2 + 0,1) 4 ·0,1 ]/1,044 4 - 3 = 0,200353
  6. Hàm phân phối là xác suất để biến ngẫu nhiên X sẽ nhận giá trị nhỏ hơn một giá trị số nào đó x: F(X) = P(X< x). Hàm phân phối là hàm không giảm. Nó nhận các giá trị trong khoảng từ 0 đến 1.

P(X< -0,1) = F(-0,1) = 0,3 P(X >-0,05) = P(0) + P(1) + P(2) = 0,5 + 0,1 + 0,1 = 0,7

2) Biến ngẫu nhiên liên tục. Phân phối bình thường.

liên tục một biến ngẫu nhiên không nhận bất kỳ giá trị số cụ thể nào mà nhận bất kỳ giá trị nào trên một khoảng số. Việc mô tả luật phân phối trong trường hợp liên tục phức tạp hơn nhiều so với trường hợp rời rạc.

liên tụcđược gọi là biến ngẫu nhiên có thể lấy bất kỳ giá trị nào từ một khoảng nhất định, ví dụ: thời gian chờ vận chuyển, nhiệt độ không khí trong một tháng cụ thể, độ lệch kích thước thực tế của một bộ phận so với kích thước danh nghĩa, v.v. Khoảng thời gian mà nó được đặt có thể là vô hạn theo một hoặc cả hai hướng.

Sự khác biệt chính trong bài toán tính xác suất cho trường hợp rời rạc và liên tục như sau. Trong trường hợp rời rạc cho các sự kiện như x = c(biến ngẫu nhiên nhận một giá trị nhất định) xác suất được tìm kiếm R(Với). Trong trường hợp liên tục xác suất kiểu này đều bằng 0, do đó, xác suất của các sự kiện thuộc loại “một biến ngẫu nhiên lấy giá trị từ một phân đoạn nhất định” được quan tâm, tức là. MỘTXb. Hoặc cho các sự kiện như XVới tìm kiếm xác suất r(XVới). Ta thu được đồ thị của hàm phân phối F( XVới).

r
7 / 8
4 / 8
3 / 8
1 / 8
X

Vì vậy, sự đa dạng của các biến ngẫu nhiên là rất lớn. Số lượng giá trị mà chúng chấp nhận có thể là hữu hạn, đếm được hoặc không đếm được; các giá trị có thể được định vị riêng biệt hoặc điền đầy đủ các khoảng. Để xác định xác suất của các giá trị của các biến ngẫu nhiên có bản chất rất khác nhau và hơn nữa, để xác định chúng theo cùng một cách, khái niệm về hàm phân phối của một biến ngẫu nhiên.

Cho là một biến ngẫu nhiên và X- một số thực tùy ý. Xác suất để nó nhận giá trị nhỏ hơn X, gọi điện hàm phân phối xác suất biến ngẫu nhiên: F(x)= P(<х}.

Hãy tóm tắt những gì đã được nói: biến ngẫu nhiên là đại lượng có giá trị phụ thuộc vào trường hợp và hàm phân phối xác suất được xác định.

Đối với các biến ngẫu nhiên liên tục (khi tập hợp các giá trị có thể có của một biến ngẫu nhiên là không đếm được), luật phân phối được chỉ định bằng hàm. Thông thường nhất điều này hàm phân phối :F( x) = P(X<X) .

Hàm F( x) có các đẳng thức sau của cải:

1. 0 ≤ F( x) ≤ 1 ;

2.F( x) không giảm;

3.F( x) trái liên tục;

4.F(- ) = 0, F( ) = 1.

Sử dụng hàm phân phối, bạn có thể tính xác suất gặp một biến ngẫu nhiên Xở những khoảng thời gian khác nhau như x 1x 2 P( x 1x 2) = F( x 2)-F( x 1)

Ví dụ. Người ta biết rằng . Tìm F(2).

Theo định nghĩa . Dấu vết, . .

Ví dụ. phân phối F-i sl.vel.X có dạng:
. Tìm xác suất để lần tiếp theo dẫn đến X sẽ nhận một giá trị trong khoảng:

Độ tin cậy của giá trị không ngẫu nhiên rơi vào (- ; X]:

Đối với sl.vel rời rạc. chúng tôi đã tìm thấy bạn đời. dự kiến, phương sai, rms. sai lệch. Tương tự của chúng cho non-sl.vel. là:

Ví dụ. Ngẫu nhiên X được cho bởi mật độ phân bố trên đoạn: f(x) = 1.



Mật độ xác suất biến ngẫu nhiên liên tục hoặc hàm phân phối xác suất- một sự tương tự của luật phân phối của r.v rời rạc Nhưng nếu luật phân phối của một r.v rời rạc. được mô tả bằng đồ họa dưới dạng các điểm được kết nối cho rõ ràng bằng một đường đứt nét, khi đó mật độ xác suất được biểu diễn bằng đồ họa dưới dạng một đường thẳng liên tục. Phân tích được đưa ra bởi công thức.

Nếu luật phân phối của một r.v rời rạc. gán mỗi giá trị x cho một xác suất nhất định thì không thể nói như vậy về mật độ phân bố. Đối với r.v liên tục bạn chỉ có thể tìm thấy xác suất rơi vào bất kỳ khoảng nào. Người ta tin rằng đối với mỗi giá trị riêng lẻ của r.v liên tục. xác suất là bằng không.

Thuộc tính chính của mật độ xác suất: tích phân không chính xác của mật độ xác suất trong phạm vi từ -∞ đến +∞ bằng thống nhất (về mặt hình học, điều này được biểu thị bằng thực tế là diện tích của hình được giới hạn phía trên bởi biểu đồ mật độ xác suất và phía dưới bởi trục OX bằng 1).

Hàm phân phối biến ngẫu nhiên là hàm xác định với mỗi giá trị x xác suất mà biến ngẫu nhiên (ξ) sẽ nhận giá trị nhỏ hơn x: F(x) = P(ξ< x). Численно функция распределения равна площади фигуры, ограниченной сверху графиком плотности вероятности, снизу осью ОХ, с боков - рассматриваемым интервалом.

Hãy xem xét phân bố hình học, tính toán kỳ vọng và phương sai toán học của nó. Sử dụng hàm MS EXCEL OTRBINOM.DIST(), chúng ta sẽ xây dựng đồ thị hàm phân bố và mật độ xác suất.

Phân bố hình học(Tiếng Anh) Phân bố hình học) là trường hợp đặc biệt (với r=1).

Hãy thực hiện các thử nghiệm, trong đó chỉ có sự kiện “thành công” mới có thể xảy ra với xác suất P hoặc một sự kiện “thất bại” có xác suất q =1-p().

Hãy xác định x như số lượng thử nghiệm mà nó đã được đăng ký Đầu tiên thành công. Trong trường hợp này, biến ngẫu nhiên x sẽ có Phân bố hình học:

Phân bố hình học trong MS EXCEL

Trong MS EXCEL, bắt đầu từ phiên bản 2010, dành cho Tiêu cực Phân phối nhị thức có hàm NEGBINOM.DIST(), tên tiếng Anh NEGBINOM.DIST(), hàm này giúp bạn tính xác suất xảy ra số lần thất bại cho đến khi đạt được một số thành công nhất định với một xác suất thành công nhất định.

Phân bố hình họcđối số thứ hai của hàm này phải là 1, bởi vì chúng tôi chỉ quan tâm đến thành công đầu tiên.

Định nghĩa này hơi khác so với công thức ở trên, công thức tính xác suất thành công đầu tiên sẽ xảy ra sau xkiểm tra. Sự khác biệt nằm ở phạm vi thay đổi phạm vi x: nếu xác suất được xác định theo số lần thử thì X có thể lấy các giá trị bắt đầu từ 1, còn nếu thông qua số lần thất bại thì bắt đầu từ 0. Do đó, công thức hợp lệ: p(x_ thất bại)= p(x_ kiểm tra-1). Cm. tập tin bảng ví dụ Ví dụ, trong đó đưa ra 2 phương pháp tính toán.

Dưới đây chúng tôi sử dụng phương pháp được áp dụng trong hàm MS EXCEL: thông qua số lần thất bại.

Để tính toán hàm mật độ xác suất p(x), hãy xem công thức trên, bạn cần đặt đối số thứ tư trong hàm TRANSFER.DIST() thành FALSE. Để tính toán , bạn phải đặt đối số thứ tư thành TRUE.

Ghi chú : Trước MS EXCEL 2010, EXCEL có hàm OPTIONDIST(), hàm này chỉ cho phép bạn tính toán mật độ xác suất. Tệp ví dụ chứa công thức dựa trên hàm TRBINOMDIST() để tính toán hàm phân phối tích lũy. Ngoài ra còn có công thức tính xác suất thông qua định nghĩa.

Tệp ví dụ chứa biểu đồ phân bố mật độ xác suấthàm phân phối tích lũy.

Ghi chú: Để thuận tiện cho việc viết công thức cho tham số p, a .

Ghi chú: Đang hoạt động TÙY CHỌN.DIST( ) cho một giá trị không nguyên X, . Ví dụ: các công thức sau sẽ trả về cùng một giá trị:
TÙY CHỌN.DIST( 2 ; 1; 0,4; ĐÚNG)=
TÙY CHỌN.DIST( 2,9 ; 1; 0,4; ĐÚNG VẬY)

Nhiệm vụ

Giải pháp cho vấn đề được đưa ra trong tập tin ví dụ trên bảng tính Ví dụ.

Vấn đề 1. Một công ty dầu mỏ khoan giếng để khai thác dầu. Xác suất tìm thấy dầu trong giếng là 20%.
Xác suất để lần thứ ba lấy được dầu đầu tiên là bao nhiêu?
Xác suất để phải mất ba lần thử mới phát hiện ra lượng dầu đầu tiên là bao nhiêu?
Giải pháp 1:
=TRBINOM.DIST(3-1, 1, 0,2, FALSE)
=TRBINOM.DIST(3-1, 1, 0,2, TRUE)

Vấn đề 2. Cơ quan xếp hạng tiến hành một cuộc khảo sát ngẫu nhiên những người qua đường trong thành phố về thương hiệu xe hơi yêu thích của họ. Hãy biết rằng 1% người dân có một chiếc ô tô yêu thích. LadaGranta. Xác suất để gặp được người hâm mộ đầu tiên của thương hiệu xe hơi này sau khi phỏng vấn 10 người là bao nhiêu?
Giải pháp2: =OTRBINOM.DIST(10-1, 1, 0,01; ĐÚNG VẬY)=9,56%