Momen tương quan của các biến ngẫu nhiên. Đặc tính số của hệ hai biến ngẫu nhiên

Trong Chương 5, chúng ta đã xem xét các đặc tính số của một biến ngẫu nhiên - mômen ban đầu và mômen trung tâm của các bậc khác nhau. Trong số những đặc điểm này, có hai đặc điểm quan trọng nhất: kỳ vọng toán học và độ phân tán.

Các đặc tính số tương tự - mômen ban đầu và mômen trung tâm theo các bậc khác nhau - có thể được đưa ra cho hệ hai biến ngẫu nhiên.

Thời điểm trật tự ban đầu của hệ thống là kỳ vọng toán học của tích bằng:

. (8.6.1)

Mômen trung tâm của bậc của hệ là kỳ vọng toán học của tích lũy thừa th và th của các đại lượng tâm tương ứng:

, (8.6.2)

Chúng ta hãy viết ra các công thức được sử dụng để tính toán trực tiếp các khoảnh khắc. Đối với các biến ngẫu nhiên không liên tục

, (8.6.3)

, (8.6.4)

Ở đâu - xác suất mà hệ thống sẽ lấy các giá trị và tổng mở rộng trên tất cả các giá trị có thể có của các biến ngẫu nhiên, .

Đối với các biến ngẫu nhiên liên tục:

, (8.6.5)

, (8.6.6)

mật độ phân bố của hệ thống ở đâu.

Ngoài và , đặc trưng cho thứ tự của thời điểm so với các đại lượng riêng lẻ, tổng thứ tự của thời điểm cũng được xem xét, bằng tổng các số mũ của và . Theo tổng thứ tự, các khoảnh khắc được phân loại thành thứ nhất, thứ hai, v.v. Trong thực tế, người ta thường chỉ sử dụng khoảnh khắc thứ nhất và thứ hai.

Những khoảnh khắc ban đầu đầu tiên thể hiện những kỳ vọng toán học về các đại lượng và được đưa vào hệ thống mà chúng ta đã biết:

Tập hợp các kỳ vọng toán học là một đặc tính của vị trí của hệ thống. Về mặt hình học, đây là tọa độ của điểm giữa trên mặt phẳng mà điểm nằm rải rác xung quanh.

Ngoài mômen ban đầu thứ nhất, mômen trung tâm thứ hai của hệ thống cũng được sử dụng rộng rãi trong thực tế. Hai trong số chúng đại diện cho sự phân tán của số lượng và , mà chúng ta đã biết:

mô tả sự phân tán của một điểm ngẫu nhiên theo hướng của trục và.

Mô men trung tâm hỗn hợp thứ hai đóng vai trò đặc biệt như một đặc tính của hệ thống:

,

những thứ kia. kỳ vọng toán học của tích của các đại lượng tập trung.

Do thời điểm này đóng một vai trò quan trọng trong lý thuyết nên chúng tôi đưa ra một ký hiệu đặc biệt cho nó:

. (8.6.7)

Đặc tính này được gọi là mômen tương quan (nếu không thì là “mômen kết nối”) của các biến ngẫu nhiên, .

Đối với các biến ngẫu nhiên không liên tục, mômen tương quan được biểu thị bằng công thức

, (8.6.8)

và đối với những cái liên tục - theo công thức

. (8.6.9)

Hãy cùng chúng tôi tìm hiểu ý nghĩa và mục đích của đặc điểm này nhé.

Momen tương quan là một đặc tính của hệ thống các biến ngẫu nhiên, mô tả sự phân tán của các biến và cả mối liên hệ giữa chúng. Để xác minh điều này, chúng ta hãy chứng minh rằng đối với các biến ngẫu nhiên độc lập, mômen tương quan bằng 0.

Ta sẽ tiến hành chứng minh cho biến ngẫu nhiên liên tục. Giả sử , là các đại lượng liên tục độc lập với mật độ phân bố . Trong 8.5 chúng ta đã chứng minh rằng với các đại lượng độc lập

. (8.6.10)

trong đó , lần lượt là mật độ phân bố của các giá trị và .

Thay biểu thức (8.6.10) vào công thức (8.6.9), ta thấy tích phân (8.6.9) trở thành tích của hai tích phân:

.

tích phân

không biểu thị gì khác hơn mômen trung tâm đầu tiên của đại lượng , và do đó bằng 0; vì lý do tương tự, hệ số thứ hai cũng bằng 0; do đó, đối với các biến ngẫu nhiên độc lập.

Vì vậy, nếu mômen tương quan của hai biến ngẫu nhiên khác 0 thì đây là dấu hiệu cho thấy sự phụ thuộc giữa chúng.

Từ công thức (8.6.7), rõ ràng là mômen tương quan không chỉ đặc trưng cho sự phụ thuộc của các đại lượng mà còn đặc trưng cho sự phân tán của chúng. Thật vậy, chẳng hạn, nếu một trong các đại lượng sai lệch rất ít so với kỳ vọng toán học của nó (hầu như không phải ngẫu nhiên), thì mômen tương quan sẽ nhỏ, bất kể các đại lượng đó có liên quan chặt chẽ với nhau đến đâu. Do đó, để mô tả mối quan hệ giữa các đại lượng ở dạng thuần túy, chúng ta chuyển từ đặc tính thời điểm sang đặc tính không thứ nguyên

trong đó , là độ lệch chuẩn của các giá trị, . Đặc tính này được gọi là hệ số tương quan của đại lượng và. Rõ ràng, hệ số tương quan tiến về 0 đồng thời với thời điểm tương quan; do đó, đối với các biến ngẫu nhiên độc lập thì hệ số tương quan bằng 0.

Các biến ngẫu nhiên có mômen tương quan (và do đó hệ số tương quan) bằng 0 được gọi là không tương quan (đôi khi là “không liên quan”).

Chúng ta hãy tìm hiểu xem khái niệm biến ngẫu nhiên không tương quan có tương đương với khái niệm độc lập hay không. Ở trên chúng tôi đã chứng minh rằng hai biến ngẫu nhiên độc lập luôn không tương quan. Vẫn còn phải xem: điều ngược lại có đúng không, liệu tính độc lập của chúng có xuất phát từ tính không tương quan của các đại lượng không? Hóa ra - không. Có thể xây dựng các ví dụ về các biến ngẫu nhiên không tương quan nhưng phụ thuộc. Sự bằng nhau của hệ số tương quan về 0 là điều kiện cần nhưng chưa đủ cho tính độc lập của các biến ngẫu nhiên. Tính độc lập của các biến ngẫu nhiên ngụ ý rằng chúng không tương quan; ngược lại, việc các đại lượng không tương quan không nhất thiết có nghĩa là chúng độc lập. Điều kiện độc lập của các biến ngẫu nhiên chặt chẽ hơn điều kiện không tương quan.

Hãy xem điều này với một ví dụ. Hãy xem xét một hệ thống các biến ngẫu nhiên được phân bố với mật độ đồng đều bên trong một đường tròn bán kính có tâm ở gốc (Hình 8.6.1).

Mật độ phân bố của các giá trị được biểu thị bằng công thức

Từ điều kiện chúng tôi tìm thấy .

Dễ dàng thấy rằng trong ví dụ này các đại lượng phụ thuộc. Thật vậy, rõ ràng ngay rằng nếu một đại lượng lấy giá trị 0 chẳng hạn, thì đại lượng đó có thể nhận tất cả các giá trị với xác suất bằng nhau từ đến ; nếu đại lượng đã nhận một giá trị thì đại lượng đó chỉ được nhận một giá trị duy nhất, đúng bằng 0; nói chung, phạm vi giá trị có thể có phụ thuộc vào giá trị nào .

Hãy xem liệu những đại lượng này có tương quan với nhau không. Hãy tính thời điểm tương quan. Hãy nhớ rằng vì lý do đối xứng, chúng tôi nhận được:

. (8.6.12)

Để tính tích phân, chúng ta chia diện tích tích phân (hình tròn) thành bốn phần tương ứng với bốn góc tọa độ. Trong các ngành và số nguyên là dương, trong các ngành và nó là âm; về giá trị tuyệt đối, tích phân trên các phần này bằng nhau; do đó, tích phân (8.6.12) bằng 0 và các đại lượng không tương quan với nhau.

Vì vậy, chúng ta thấy rằng bản chất không tương quan của các biến ngẫu nhiên không phải lúc nào cũng hàm ý tính độc lập của chúng.

Hệ số tương quan không đặc trưng cho bất kỳ sự phụ thuộc nào mà chỉ mô tả cái gọi là sự phụ thuộc tuyến tính. Sự phụ thuộc xác suất tuyến tính của các biến ngẫu nhiên là khi một biến ngẫu nhiên tăng thì biến ngẫu nhiên kia có xu hướng tăng (hoặc giảm) theo quy luật tuyến tính. Xu hướng phụ thuộc tuyến tính này có thể ít nhiều rõ rệt, ít nhiều tiếp cận hàm số, tức là sự phụ thuộc tuyến tính gần nhất. Hệ số tương quan đặc trưng cho mức độ gần gũi của mối quan hệ tuyến tính giữa các biến ngẫu nhiên. Nếu các biến ngẫu nhiên có liên hệ với nhau bằng một mối quan hệ hàm tuyến tính chính xác:

thì , và lấy dấu “cộng” hoặc “trừ” tùy thuộc vào hệ số dương hay âm. Trong trường hợp tổng quát, khi các đại lượng và có liên hệ với nhau bằng sự phụ thuộc xác suất tùy ý thì hệ số tương quan có thể có giá trị trong giới hạn sau: chỉ có phạm vi thay đổi là thay đổi và giá trị trung bình của nó là không thay đổi; Đương nhiên, số lượng hóa ra không tương quan.

Cơm. 8.6.2 Hình.8.6.3

Hãy để chúng tôi đưa ra một số ví dụ về các biến ngẫu nhiên có mối tương quan tích cực và tiêu cực.

1. Cân nặng và chiều cao của một người có mối tương quan thuận chiều với nhau.

2. Thời gian điều chỉnh thiết bị để chuẩn bị vận hành và thời gian vận hành không gặp sự cố có liên quan đến mối tương quan tích cực (tất nhiên nếu thời gian được sử dụng một cách khôn ngoan). Ngược lại, thời gian dành cho việc chuẩn bị và số lượng lỗi được phát hiện trong quá trình vận hành thiết bị có mối tương quan nghịch.

3. Khi bắn trong một loạt đạn, tọa độ các điểm va chạm của từng viên đạn được kết nối với nhau bằng một mối tương quan dương (vì có những lỗi ngắm bắn phổ biến đối với tất cả các phát bắn, khiến mỗi viên đạn đều lệch khỏi mục tiêu như nhau).

4. Bắn hai phát vào mục tiêu; điểm tác động của phát bắn đầu tiên được ghi lại và một hiệu chỉnh được đưa vào tầm nhìn, tỷ lệ thuận với sai số của phát bắn đầu tiên có dấu ngược lại. Tọa độ các điểm va chạm của phát bắn thứ nhất và thứ hai sẽ có mối tương quan nghịch.

Nếu chúng ta có sẵn kết quả của một số thí nghiệm trên một hệ biến ngẫu nhiên, thì sự hiện diện hay vắng mặt của mối tương quan đáng kể giữa chúng có thể dễ dàng được đánh giá theo phép tính gần đúng đầu tiên bằng một biểu đồ trên đó tất cả các cặp giá trị của các biến ngẫu nhiên thu được từ thí nghiệm được mô tả dưới dạng điểm. Ví dụ: nếu các cặp giá trị đại lượng quan sát được định vị như trong Hình. 8.6.2 thì điều này cho thấy sự hiện diện của mối tương quan thuận được thể hiện rõ ràng giữa các đại lượng. Một mối tương quan dương thậm chí còn rõ ràng hơn, gần với sự phụ thuộc hàm tuyến tính, được quan sát thấy trong Hình 2. 8.6.3. Trong hình. Hình 8.6.4 cho thấy trường hợp tương quan âm tương đối yếu. Cuối cùng, trong hình. 8.6.5 minh họa trường hợp các biến ngẫu nhiên thực tế không tương quan. Trong thực tế, trước khi kiểm tra mối tương quan của các biến ngẫu nhiên, việc vẽ đồ thị các cặp giá trị quan sát được trên biểu đồ luôn hữu ích để đưa ra phán đoán định tính đầu tiên về loại tương quan.

ỦY BAN NHÀ NƯỚC VỀ KHOA HỌC VÀ CÔNG NGHỆ CỘNG HÒA AZERBAIJAN

TRUNG TÂM NGHIÊN CỨU VÀ ĐÀO TẠO BAKU

SINH VIÊN CAO CẤP Khoa Phẫu thuật Nhi khoa

AMU được đặt theo tên của N. NARIMANOV

MUKHTAROVA EMIL GASAN yêu quái

KHOẢNH KHẮC TƯƠNG QUAN. TƯƠNG QUAN HỆ SỐ

GIỚI THIỆU

Lý thuyết xác suất là một môn khoa học toán học nghiên cứu các mô hình trong các hiện tượng ngẫu nhiên.

Hiện tượng ngẫu nhiên có ý nghĩa gì?

Trong nghiên cứu khoa học về các vấn đề vật lý và kỹ thuật, người ta thường gặp phải những hiện tượng thuộc loại đặc biệt thường được gọi là ngẫu nhiên. Hiện tượng ngẫu nhiên- đây là một hiện tượng mà khi cùng một trải nghiệm được tái tạo nhiều lần thì sẽ diễn ra hơi khác một chút.

Hãy đưa ra một ví dụ về một hiện tượng ngẫu nhiên.

Cùng một vật thể được cân nhiều lần trên cân phân tích: kết quả của các lần cân lặp lại có phần khác nhau. Những khác biệt này là do ảnh hưởng của các yếu tố nhỏ khác nhau đi kèm với hoạt động cân, chẳng hạn như sự rung động ngẫu nhiên của thiết bị, lỗi đọc thiết bị, v.v.

Rõ ràng là không có một hiện tượng vật lý nào trong tự nhiên mà trong đó các yếu tố ngẫu nhiên không xuất hiện ở mức độ này hay mức độ khác. Cho dù các điều kiện thí nghiệm được cố định chính xác và chi tiết đến đâu cũng không thể đảm bảo rằng khi lặp lại thí nghiệm, kết quả sẽ trùng khớp hoàn toàn và chính xác.

Tai nạn chắc chắn đi kèm với bất kỳ hiện tượng tự nhiên nào. Tuy nhiên, trong một số bài toán thực tế, các phần tử ngẫu nhiên này có thể bị bỏ qua, xem xét sơ đồ đơn giản hóa của nó thay vì xem xét một hiện tượng thực tế, tức là xem xét một hiện tượng thực tế. người mẫu, và giả sử rằng trong những điều kiện thí nghiệm đã cho, hiện tượng này xảy ra theo một cách rất rõ ràng. Đồng thời, trong vô số yếu tố ảnh hưởng đến hiện tượng này, những yếu tố quan trọng, cơ bản và mang tính quyết định nhất sẽ được chỉ ra. Ảnh hưởng của các yếu tố nhỏ khác chỉ đơn giản là bị bỏ qua. Khi nghiên cứu các mô hình trong khuôn khổ của một lý thuyết nhất định, các yếu tố chính ảnh hưởng đến một hiện tượng cụ thể đều được đưa vào các khái niệm hoặc định nghĩa mà lý thuyết đó vận hành.

Giống như bất kỳ ngành khoa học nào phát triển một lý thuyết tổng quát về bất kỳ phạm vi hiện tượng nào, lý thuyết xác suất cũng chứa đựng một số khái niệm cơ bản làm cơ sở cho nó. Đương nhiên, không phải tất cả các khái niệm cơ bản đều có thể được định nghĩa một cách chặt chẽ, vì định nghĩa một khái niệm có nghĩa là quy giản nó thành những khái niệm khác, nổi tiếng hơn. Quá trình này phải hữu hạn và kết thúc bằng những khái niệm cơ bản chỉ được giải thích.

Một trong những khái niệm đầu tiên trong lý thuyết xác suất là khái niệm về một sự kiện.

Dưới sự kiện bất kỳ thực tế nào có thể xảy ra hoặc không thể xảy ra do kinh nghiệm đều được hiểu.

Hãy cho ví dụ về các sự kiện.

A - sinh con trai hay con gái;

B - lựa chọn cách khai cuộc này hoặc cách khai cuộc khác trong ván cờ;

C - thuộc cung hoàng đạo này hoặc cung hoàng đạo khác.

Xem xét các sự kiện trên, chúng ta thấy rằng mỗi sự kiện đều có một mức độ khả năng nào đó: một số lớn hơn, số khác ít hơn. Để so sánh một cách định lượng các sự kiện với nhau theo mức độ khả năng xảy ra của chúng, rõ ràng cần phải liên kết một con số nhất định với mỗi sự kiện, con số nào càng lớn thì sự kiện đó càng có khả năng xảy ra. Con số này được gọi là xác suất của một sự kiện. Vì vậy, xác suất của một sự kiện là một đặc tính số học về mức độ khả năng khách quan của một sự kiện.

Đơn vị xác suất được coi là xác suất của một sự kiện đáng tin cậy bằng 1 và phạm vi thay đổi về xác suất của bất kỳ sự kiện nào là một số từ 0 đến 1.

Xác suất thường được ký hiệu bằng chữ P.

Chúng ta hãy xem ví dụ về vấn đề muôn thuở trong Hamlet của Shakespeare “tồn tại hay không tồn tại?” Làm thế nào bạn có thể xác định xác suất của một sự kiện?

Một điều khá rõ ràng là một người, một vật thể và bất kỳ hiện tượng nào khác có thể ở một trong hai trạng thái và không còn nữa: hiện diện (“tồn tại”) và vắng mặt (“không tồn tại”). Nghĩa là có hai sự kiện có thể xảy ra nhưng chỉ có một sự kiện có thể xảy ra. Điều này có nghĩa là xác suất tồn tại chẳng hạn là 1/2.

Ngoài khái niệm sự kiện và xác suất, một trong những khái niệm chính của lý thuyết xác suất là khái niệm biến ngẫu nhiên.

Biến ngẫu nhiên là một đại lượng mà do kết quả của thí nghiệm, có thể nhận giá trị này hoặc giá trị khác và không biết trước đó là giá trị nào.

Các biến ngẫu nhiên chỉ lấy các giá trị tách biệt với nhau và có thể được liệt kê trước được gọi là biến ngẫu nhiên liên tục hoặc rời rạc.

Ví dụ:

1. Số bệnh nhân còn sống và đã chết.

2. Tổng số trẻ từ bệnh nhân nhập viện qua đêm.

Các biến ngẫu nhiên có giá trị có thể liên tục lấp đầy một khoảng nhất định được gọi là biến ngẫu nhiên liên tục.

Ví dụ, lỗi cân trên cân phân tích.

Lưu ý rằng lý thuyết xác suất hiện đại chủ yếu hoạt động với các biến ngẫu nhiên, chứ không phải các sự kiện mà lý thuyết xác suất “cổ điển” chủ yếu dựa vào.

KHOẢNH KHẮC TƯƠNG QUAN. HỆ SỐ TƯƠNG QUAN.

Momen tương quan, hệ số tương quan - đây là những đặc trưng số học có liên quan chặt chẽ đến khái niệm biến ngẫu nhiên đã giới thiệu ở trên, hay chính xác hơn là với hệ thống các biến ngẫu nhiên. Vì vậy, để giới thiệu và xác định ý nghĩa, vai trò của chúng cần phải làm rõ khái niệm hệ biến ngẫu nhiên và một số tính chất vốn có của chúng.

Hai hoặc nhiều biến ngẫu nhiên mô tả một hiện tượng nào đó được gọi là hệ thống hoặc phức hợp các biến ngẫu nhiên.

Hệ thống gồm nhiều biến ngẫu nhiên X, Y, Z, …, W thường được ký hiệu là (X, Y, Z, …, W).

Ví dụ, một điểm trên mặt phẳng được mô tả không phải bằng một tọa độ mà bằng hai tọa độ và trong không gian - thậm chí bằng ba.

Các thuộc tính của hệ thống nhiều biến ngẫu nhiên không chỉ giới hạn ở các thuộc tính của các biến ngẫu nhiên riêng lẻ có trong hệ thống mà còn bao gồm các mối liên hệ lẫn nhau (phụ thuộc) giữa các biến ngẫu nhiên. Vì vậy, khi nghiên cứu một hệ biến ngẫu nhiên cần chú ý đến bản chất và mức độ phụ thuộc. Sự phụ thuộc này có thể ít nhiều rõ rệt, gần gũi hơn hoặc ít hơn. Và trong các trường hợp khác, các biến ngẫu nhiên thực tế lại độc lập.

Biến ngẫu nhiên Y được gọi là độc lập từ một biến ngẫu nhiên X, nếu luật phân phối của biến ngẫu nhiên Y không phụ thuộc vào giá trị của biến X.

Cần lưu ý rằng sự phụ thuộc và độc lập của các biến ngẫu nhiên luôn là hiện tượng tương hỗ: nếu Y không phụ thuộc vào X thì giá trị X không phụ thuộc vào Y. Khi tính đến điều này, chúng ta có thể đưa ra định nghĩa về tính độc lập sau đây của các biến ngẫu nhiên.

Các biến ngẫu nhiên X và Y được gọi là độc lập nếu luật phân phối của mỗi biến không phụ thuộc vào giá trị của biến kia. Ngược lại, giá trị của X và Y được gọi là sự phụ thuộc.

Luật phân phối Biến ngẫu nhiên là bất kỳ mối quan hệ nào thiết lập mối liên hệ giữa các giá trị có thể có của biến ngẫu nhiên và xác suất tương ứng của chúng.

Khái niệm “sự phụ thuộc” của các biến ngẫu nhiên được sử dụng trong lý thuyết xác suất hơi khác với khái niệm “phụ thuộc” thông thường của các biến được sử dụng trong toán học. Vì vậy, một nhà toán học khi nói đến “sự phụ thuộc” chỉ có nghĩa là một loại phụ thuộc - hoàn toàn, cứng nhắc, cái gọi là sự phụ thuộc hàm. Hai đại lượng X và Y được gọi là phụ thuộc hàm nếu biết giá trị của một trong số chúng, bạn có thể xác định chính xác giá trị của đại lượng kia.

Trong lý thuyết xác suất, có một loại phụ thuộc hơi khác - sự phụ thuộc xác suất. Nếu giá trị Y liên quan đến giá trị X theo sự phụ thuộc xác suất, thì khi biết giá trị của X, không thể chỉ ra chính xác giá trị của Y, nhưng bạn có thể chỉ ra quy luật phân phối của nó, tùy thuộc vào giá trị của X. lấy.

Mối quan hệ xác suất có thể ít nhiều gần gũi; Khi độ gần của sự phụ thuộc xác suất tăng lên, nó sẽ ngày càng gần với hàm số hơn. Vì vậy, sự phụ thuộc hàm có thể được coi là một trường hợp cực đoan, giới hạn của sự phụ thuộc xác suất gần nhất. Một trường hợp cực đoan khác là sự độc lập hoàn toàn của các biến ngẫu nhiên. Giữa hai trường hợp cực đoan này có tất cả các mức độ phụ thuộc xác suất - từ mạnh nhất đến yếu nhất.

Sự phụ thuộc xác suất giữa các biến ngẫu nhiên thường gặp trong thực tế. Nếu các biến ngẫu nhiên X và Y có mối quan hệ xác suất, điều này không có nghĩa là khi giá trị của X thay đổi thì giá trị của Y sẽ thay đổi theo một cách rất rõ ràng; điều này chỉ có nghĩa là khi có sự thay đổi về giá trị của X thì giá trị của Y

cũng có xu hướng thay đổi (tăng hoặc giảm khi X tăng). Xu hướng này chỉ được quan sát thấy trong điều kiện chung và trong mỗi trường hợp riêng lẻ đều có thể có những sai lệch so với nó.

Ví dụ về sự phụ thuộc xác suất.

Hãy chọn ngẫu nhiên một bệnh nhân bị viêm phúc mạc. biến ngẫu nhiên T là thời gian từ khi phát bệnh, biến ngẫu nhiên O là mức độ rối loạn cân bằng nội môi. Có mối quan hệ rõ ràng giữa các giá trị này vì giá trị T là một trong những lý do quan trọng nhất quyết định giá trị O.

Đồng thời, có mối quan hệ xác suất yếu hơn giữa biến ngẫu nhiên T và biến ngẫu nhiên M, phản ánh tỷ lệ tử vong trong một bệnh lý nhất định, vì biến ngẫu nhiên, mặc dù nó ảnh hưởng đến biến ngẫu nhiên O, nhưng không phải là yếu tố quyết định chính.

Hơn nữa, nếu chúng ta xem xét giá trị T và giá trị B (tuổi của bác sĩ phẫu thuật), thì các giá trị này trên thực tế là độc lập.

Cho đến nay chúng ta đã thảo luận về các tính chất của hệ thống biến ngẫu nhiên và chỉ đưa ra lời giải thích bằng lời nói. Tuy nhiên, có những đặc điểm số học qua đó các thuộc tính của cả các biến ngẫu nhiên riêng lẻ và hệ thống các biến ngẫu nhiên được nghiên cứu.

Để mô tả một hệ thống gồm hai biến ngẫu nhiên, ngoài các kỳ vọng toán học và phương sai của các thành phần, các đặc điểm khác được sử dụng, bao gồm thời điểm tương quanhệ số tương quan(được đề cập ngắn gọn ở cuối T.8.p.8.6) .

Khoảnh khắc tương quan(hoặc hiệp phương sai, hoặc khoảnh khắc kết nối) hai biến ngẫu nhiên X Y gọi là m.o. tích của độ lệch của các đại lượng này (xem đẳng thức (5) điều 8.6):

Hệ quả 1.Đối với thời điểm tương quan r.v. X Y các đẳng thức sau đây cũng đúng:

,

nơi r.v tập trung tương ứng X Y (xem khoản 8.6.).

Trong trường hợp này: nếu
là d.s.v. hai chiều thì hiệp phương sai được tính theo công thức

(8)
;

Nếu như
là n.s.v. hai chiều thì hiệp phương sai được tính theo công thức

(9)

Công thức (8) và (9) thu được dựa trên công thức (6) tại đoạn 12.1. Có công thức tính toán

(10)

được bắt nguồn từ định nghĩa (9) và dựa trên các tính chất của MO, thực sự,

Do đó, công thức (36) và (37) có thể viết lại dưới dạng

(11)
;

Momen tương quan dùng để mô tả mối quan hệ giữa các đại lượng X Y.

Như sẽ được trình bày dưới đây, mômen tương quan bằng 0 nếu XY độc lập;

Do đó, nếu mômen tương quan không bằng 0 thìXYlà các biến ngẫu nhiên phụ thuộc.

Định lý 12.1.Momen tương quan của hai biến ngẫu nhiên độc lậpXYbằng 0, tức là cho r.v độc lậpXY,

Bằng chứng. Bởi vì X Y các biến ngẫu nhiên độc lập thì độ lệch của chúng


T cũng độc lập. Sử dụng tính chất của kỳ vọng toán học (kỳ vọng toán học của tích các rv độc lập bằng tích kỳ vọng toán học của các thừa số)
,
, Đó là lý do tại sao

Bình luận. Từ định lý này suy ra rằng nếu
sau đó s.v. X Y phụ thuộc và trong những trường hợp như vậy r.v. X Y gọi điện tương quan. Tuy nhiên, từ thực tế đó
không tuân theo sự độc lập r.v. X Y.

Trong trường hợp này (
s.v. X Y gọi điện không tương quan, Như vậy, từ sự độc lập theo sau không tương quan; nói chung, tuyên bố ngược lại là sai (xem ví dụ 2 bên dưới.)

Chúng ta hãy xem xét các tính chất chính của thời điểm tương quan.

Ctính chất hiệp phương sai:

1. Hiệp phương sai là đối xứng, tức là
.

Điều này được suy ra trực tiếp từ công thức (38).

2. Có sự bình đẳng: tức là phân tán r.v. là hiệp phương sai của nó với chính nó.

Các đẳng thức này tuân theo trực tiếp từ định nghĩa về độ phân tán và đẳng thức (38), tương ứng với

3. Các đẳng thức sau đây là hợp lệ:

Những đẳng thức này bắt nguồn từ định nghĩa phương sai và hiệp phương sai của r.v.
, tính chất 2.

Theo định nghĩa về độ phân tán (có tính đến tính trung tâm của r.v.
) chúng tôi có

Bây giờ, dựa trên (33) và tính chất 2 và 3, chúng ta thu được thuộc tính 3 đầu tiên (có dấu cộng).

Tương tự, phần thứ hai của tính chất 3 được suy ra từ đẳng thức

4. Cho phép
số không đổi,
thì các đẳng thức có giá trị:

Thông thường những thuộc tính này được gọi là thuộc tính đồng nhất bậc một và tính tuần hoàn trong các đối số.

Chúng ta hãy chứng minh đẳng thức đầu tiên và chúng ta sẽ sử dụng các tính chất của m.o.
.

Định lý 12.2.Giá trị tuyệt đốimômen tương quan của hai biến ngẫu nhiên tùy ýXYkhông vượt quá giá trị trung bình hình học của phương sai của chúng: tức là

Bằng chứng. Lưu ý rằng đối với r.v độc lập. bất đẳng thức đúng (xem Định lý 12.1.). Vì vậy, hãy để r.v. X Y sự phụ thuộc. Chúng ta hãy xem xét tiêu chuẩn r.v.

và tính toán độ phân tán của r.v.
Xét tính chất 3, ta có: một mặt
Ở phía bên kia

Vì vậy, có tính đến thực tế là
- chuẩn hóa (chuẩn hóa) r.v., sau đó đối với họ m.o. bằng 0 và phương sai bằng 1, do đó, sử dụng tính chất của m.o.
chúng tôi nhận được

và do đó, dựa trên thực tế là
chúng tôi nhận được

Nó theo sau đó tức là.

=

Tuyên bố đã được chứng minh.

Từ định nghĩa và tính chất của hiệp phương sai, nó mô tả cả mức độ phụ thuộc của r.v và sự phân tán của chúng xung quanh một điểm.
Thứ nguyên của hiệp phương sai bằng tích của thứ nguyên của các biến ngẫu nhiên XY. Nói cách khác, độ lớn của mômen tương quan phụ thuộc vào đơn vị đo của các biến ngẫu nhiên. Vì lý do này, với cùng hai đại lượng XY, độ lớn của mômen tương quan sẽ có các giá trị khác nhau tùy thuộc vào đơn vị đo các giá trị.

Hãy để, ví dụ, XY được đo bằng cm và
; nếu đo XY tính bằng milimét thì
Đặc điểm này của mômen tương quan là nhược điểm của đặc tính số này, vì việc so sánh mômen tương quan của các hệ biến ngẫu nhiên khác nhau trở nên khó khăn.

Để loại bỏ nhược điểm này, một đặc tính số mới được giới thiệu - “ hệ số tương quan».

Hệ số tương quan
biến ngẫu nhiên
được gọi là tỷ số giữa mô men tương quan và tích độ lệch chuẩn của các đại lượng này:

(13)
.

Vì kích thước
bằng tích của kích thước của đại lượng
,
có thứ nguyên độ lớn
σ y có thứ nguyên độ lớn , Cái đó
chỉ là một con số (tức là " đại lượng không thứ nguyên"). Như vậy, giá trị của hệ số tương quan không phụ thuộc vào việc lựa chọn đơn vị đo r.v., đây là lợi thế hệ số tương quan trước thời điểm tương quan.

Ở T.8. khoản 8.3 chúng tôi đã giới thiệu khái niệm bình thường hóa s.v.
, công thức (18) và định lý đã được chứng minh rằng

(Xem thêm Định lý 8.2.). Ở đây chúng ta chứng minh khẳng định sau.

Định lý 12.3.hai biến ngẫu nhiên bất kỳ
bình đẳng là đúng
.Nói cách khác, hệ số tương quan
bất kỳ hai với
.V..XYbằng với mômen tương quan của chuẩn hóa tương ứng của chúng s.v.
.

Bằng chứng. Theo định nghĩa của các biến ngẫu nhiên chuẩn hóa


.

Có tính đến tính chất của kỳ vọng toán học: và đẳng thức (40), chúng tôi có được

Tuyên bố đã được chứng minh.

Chúng ta hãy xem xét một số tính chất thường gặp của hệ số tương quan.

Tính chất của hệ số tương quan:

1. Hệ số tương quan về giá trị tuyệt đối không vượt quá 1, tức là.

Tính chất này suy ra trực tiếp từ công thức (41) - định nghĩa hệ số tương quan và Định lý 13.5. (xem bình đẳng (40)).

2. Nếu biến ngẫu nhiên
độc lập, hệ số tương quan hiện tại bằng 0, tức là
.

Tính chất này là hệ quả trực tiếp của đẳng thức (40) và Định lý 13.4.

Chúng ta hãy xây dựng tính chất sau đây như một định lý riêng biệt.

Định lý 12.4.

Nếu r.v.
được kết nối với nhau bằng sự phụ thuộc hàm tuyến tính, tức là
Cái đó

cùng lúc

ngược lại, nếu
,
Cái đó s.v.
được kết nối với nhau bằng sự phụ thuộc hàm tuyến tính, tức là có hằng số
sao cho sự bình đẳng được giữ

Bằng chứng. Cho phép
Sau đó Dựa vào tính chất 4 của hiệp phương sai, chúng ta có

và vì, , do đó

Kể từ đây,
. Bình đẳng theo một hướng có được. Hãy tiếp tục
, Sau đó

hai trường hợp cần được xem xét: 1)
và 2)
Vì vậy, hãy xem xét trường hợp đầu tiên. Khi đó theo định nghĩa
và do đó từ đẳng thức
, Ở đâu
.
Trong trường hợp của chúng tôi

=
,

, do đó từ đẳng thức (xem chứng minh Định lý 13.5.)
chúng tôi hiểu điều đó
, Có nghĩa
là không đổi. Bởi vì
và kể từ đó

.

Thực ra,


.

Kể từ đây,
Tương tự, người ta chứng minh rằng đối với

,
.

diễn ra (hãy tự kiểm tra!)

Một số kết luận:
1. Nếu

độc lập.v., sau đó
2. Nếu r.v.
.

thì có quan hệ tuyến tính với nhau
:

3. Trong các trường hợp khác
Trong trường hợp này họ nói rằng r.v. liên kết với nhau mối tương quan tích cực,
Nếu như
trong trường hợp tương quan âm
. Càng gần
đối với một người thì càng có nhiều lý do để tin rằng r.v.

có mối quan hệ tuyến tính. ma trận tương quan:

.

Rõ ràng định thức của ma trận tương quan thỏa mãn:

Như đã lưu ý, nếu hai biến ngẫu nhiên phụ thuộc thì chúng có thể giống như tương quan, Vì thế không tương quan. Nói cách khác, mômen tương quan của hai đại lượng phụ thuộc có thể là không bằng 0, nhưng có lẽ bằng không.

Ví dụ 1. Luật phân phối của r.v rời rạc được đưa ra bởi bảng


Tìm hệ số tương quan

Giải pháp. Tìm quy luật phân bố của các thành phần
:


Bây giờ hãy tính toán mo.o. thành phần:

Những giá trị này có thể được tìm thấy trên cơ sở bảng phân phối r.v.

Tương tự như vậy,
hãy tự tìm nó.

Hãy tính phương sai của các thành phần và sử dụng công thức tính toán:

Hãy tạo ra luật phân phối
, và sau đó chúng tôi tìm thấy
:

Khi biên soạn bảng luật phân phối, bạn nên thực hiện các bước sau:

1) chỉ để lại ý nghĩa khác nhau của tất cả các sản phẩm có thể
.

2) để xác định xác suất của một giá trị nhất định
, cần phải

cộng tất cả các xác suất tương ứng nằm ở giao điểm của bảng chính có lợi cho sự xuất hiện của một giá trị nhất định.

Trong ví dụ của chúng tôi, r.v. chỉ nhận ba giá trị khác nhau
. Đây là giá trị đầu tiên (
) tương ứng với sản phẩm
từ dòng thứ hai và
từ cột đầu tiên, vậy tại giao điểm của chúng có một số xác suất
tương tự

được lấy từ tổng các xác suất nằm tại giao điểm của hàng đầu tiên và cột đầu tiên tương ứng (0,15; 0,40; 0,05) và một giá trị
, nằm ở giao điểm của hàng thứ hai và cột thứ hai, và cuối cùng,
, nằm ở giao điểm của hàng thứ hai và cột thứ ba.

Từ bảng của chúng tôi, chúng tôi tìm thấy:

Chúng tôi tìm thời điểm tương quan bằng công thức (38):

Tìm hệ số tương quan bằng công thức (41)

Vì vậy, một mối tương quan tiêu cực.

Bài tập. Luật phân phối r.v rời rạc được đưa ra bởi bảng


Tìm hệ số tương quan

Hãy xem một ví dụ trong đó có hai biến ngẫu nhiên phụ thuộc có thể có không tương quan.

Ví dụ 2. Biến ngẫu nhiên hai chiều
)
được cho bởi hàm mật độ

Hãy chứng minh điều đó
sự phụ thuộc , Nhưng không tương quan các biến ngẫu nhiên.

Giải pháp. Chúng ta hãy sử dụng mật độ phân bố được tính toán trước đó của các thành phần
:

Kể từ đó
số lượng phụ thuộc. Để chứng minh không tương quan
, chỉ cần đảm bảo rằng

Hãy tìm thời điểm tương quan bằng công thức:

Vì hàm vi phân
đối xứng qua trục ôi, Cái đó
tương tự
, do tính đối xứng
so với trục CON BÒ ĐỰC. Vì vậy, việc loại bỏ một yếu tố không đổi

Tích phân bên trong bằng 0 (tích phân là số lẻ, các giới hạn tích phân đối xứng với gốc tọa độ), do đó,
, tức là biến ngẫu nhiên phụ thuộc
không có mối tương quan với nhau.

Vì vậy, từ mối tương quan của hai biến ngẫu nhiên, sự phụ thuộc của chúng tuân theo, nhưng từ tính không tương quan vẫn không thể kết luận rằng các biến này là độc lập.

Tuy nhiên, đối với r.v. kết luận như vậy là ngoại trừ những thứ kia. từ không tương quan phân phối chuẩn s.v. chảy chúng ra ngoài độc lập.

Đoạn tiếp theo được dành cho vấn đề này.

Hiệp phương sai và hệ số tương quan.

Có thể có mối quan hệ hàm số hoặc ngẫu nhiên (xác suất) giữa các biến ngẫu nhiên. Sự phụ thuộc ngẫu nhiên được thể hiện ở chỗ quy luật phân phối có điều kiện của một biến ngẫu nhiên thay đổi tùy thuộc vào các giá trị được một biến ngẫu nhiên khác chấp nhận. Một trong những đặc điểm của sự phụ thuộc ngẫu nhiên của hai biến ngẫu nhiên là hiệp phương sai các biến ngẫu nhiên.

Hiệp phương sai biến ngẫu nhiên ( X,Y) là số bằng kỳ vọng toán học của tích độ lệch của các biến ngẫu nhiên XY từ những kỳ vọng toán học của bạn:

Đôi khi hiệp phương sai được gọi thời điểm tương quan hoặc khoảnh khắc trung tâm hỗn hợp thứ hai biến ngẫu nhiên ( X,Y).

Sử dụng định nghĩa kỳ vọng toán học, ta có:

để phân phối rời rạc

để phân phối liên tục

Tại Y= X hiệp phương sai cũng giống như phương sai X.

Độ lớn của mômen tương quan phụ thuộc vào đơn vị đo của các biến ngẫu nhiên. Điều này gây khó khăn cho việc so sánh các khoảnh khắc tương quan của các hệ thống biến ngẫu nhiên khác nhau. Để loại bỏ nhược điểm này, một đặc tính số mới được giới thiệu - hệ số tương quan, đó là

đại lượng không thứ nguyên.

Để tính toán nó, chúng tôi thay thế độ lệch của các biến ngẫu nhiên so với kỳ vọng toán học bằng độ lệch chuẩn hóa của chúng, tức là.

Tính chất của hệ số tương quan:

Cho phép t – một biến theo nghĩa phân tích toán học. Xét phương sai của biến ngẫu nhiên D(Y – tX) là hàm của một biến t.

Theo tính chất phân tán. Giá trị phân biệt trong trường hợp này phải nhỏ hơn hoặc bằng 0, tức là

Chúng ta lấy nó từ đâu?

2. Mô đun của hệ số tương quan không thay đổi trong quá trình biến đổi tuyến tính của các biến ngẫu nhiên: , trong đó , , là các số tùy ý.

3. , khi và chỉ khi các biến ngẫu nhiên XYđược kết nối tuyến tính, tức là có những con số như vậy một, b, Cái gì .

Nếu , thì phân biệt được xem xét ở đoạn 1 bằng 0 và do đó đối với một số giá trị . Vì vậy, giá trị và đối với một số VỚIđẳng thức cần chứng minh là đúng.

4. Nếu XY thì độc lập về mặt thống kê.

Thuộc tính 2.4 được xác minh trực tiếp.

4.5.2. Mối tương quan và sự phụ thuộc của hệ thống các biến ngẫu nhiên.

Điều kiện cần cho tính độc lập của biến ngẫu nhiên XY là sự bằng 0 của mô men tương quan (hoặc hệ số tương quan) của chúng. Tuy nhiên, sự bình đẳng (hoặc ) chỉ là điều kiện cần chứ chưa đủ cho sự độc lập.

Ví dụ 1.

Hình vẽ thể hiện các điểm nằm trên một parabol , MỘT .

Về vấn đề này, một khái niệm hẹp hơn về các biến ngẫu nhiên không tương quan (if ) hoặc tương quan (if ) được đưa ra. Đó là lý do tại sao tính độc lập của các biến ngẫu nhiên cũng có nghĩa là không có tương quan() và ngược lại, sự tương quan () – nghiện.

Trong trường hợp tổng quát, khi , các điểm (X,Y) sẽ nằm rải rác xung quanh đường thẳng thì giá trị càng gần nhau thì giá trị càng lớn. Như vậy, hệ số tương quan đặc trưng không bất kỳ mối quan hệ giữa XY, MỘT mức độ chặt chẽ của mối quan hệ tuyến tính giữa họ.

Vì vậy, đặc biệt, ngay cả với , tức là. trong trường hợp hoàn toàn không có mối quan hệ tuyến tính giữa XY Có thể tồn tại sự phụ thuộc hàm thống kê mạnh và thậm chí phi tuyến tùy ý (xem ví dụ 1).

Khi các giá trị biểu thị mối tương quan dương giữa XY, nghĩa là cả hai biến đều có xu hướng tăng hoặc giảm như nhau. Khi họ nói về mối tương quan nghịch, nghĩa là xu hướng ngược lại trong sự thay đổi của các biến ngẫu nhiên XY, tức là cái này tăng thì cái kia giảm hoặc ngược lại.

Nếu biến ngẫu nhiên XY có phân phối chuẩn thì tính không tương quan của chúng hàm ý tính độc lập của chúng, vì

Nếu thì.

Để tính hệ số tương quan, chúng ta tiếp tục Ví dụ 2 từ §4.1. Hãy sử dụng công thức

.

M(X× Y)=(-200)×(-100)×0,2 + (-200)×0×0,1 + (-200)×(100)×0,05 + 0×(-100)×0,05 + 0×0×0,25 + 0 ×100×0,02 + 200×(-100)×0,01 + 200×0×0,02 + 200×100×0,3 = 8800 USD;

; ;

.

Ví dụ 2. Luật phân phối của hệ hai biến ngẫu nhiên được cho bởi bảng phân phối

X Y
-1 0,01 0,06 0,05 0,04
0,04 0,24 0,15 0,07
0,05 0,01 0,01 0,09

Tìm luật phân phối một chiều (cận biên) XY, kỳ vọng toán học, phương sai và hệ số tương quan giữa XY.

Giải pháp. Xác suất các giá trị có thể có của một biến ngẫu nhiên rời rạc X, nằm trong hệ thống, được xác định theo công thức

, ĐẾN=1, 2, 3, 4.

Do đó, sự phân bố một chiều của số lượng X có dạng sau

Kỳ vọng toán học của các biến ngẫu nhiên XY:

M(X)=1,6; M(Y)=0,18.

Phương sai của biến ngẫu nhiên XY:

D(X)=0,84; D(Y)=0,47.

Hệ số tương quan giữa XY tính theo công thức

; ;

; ;

Câu hỏi tự kiểm tra.

1. Định nghĩa hàm phân bố xác suất và biến ngẫu nhiên đa biến.

2. Cái được gọi là phân phối chung của biến ngẫu nhiên rời rạc hai chiều ( X,Y)? Nó được viết như thế nào?

3. Đối với phân bố chung đã biết của biến ngẫu nhiên hai chiều ( X,Y) tìm phân bố cận biên của các thành phần XY?

4. Cái gọi là phân bố có điều kiện của thành phần Xđại lượng rời rạc hai chiều ( X,Y)?

5. Thế nào được gọi là hiệp phương sai?

6. Hệ số tương quan là gì?

7. Xác định tính chất của hệ số tương quan.

8. Hệ số tương quan của các biến ngẫu nhiên là gì? XY = 1 – 2X?

9. Hiệp phương sai của hai biến ngẫu nhiên có giá trị như thế nào? XY, Nếu như X = Y?

10. Khái niệm độc lập và không tương quan có tương đương nhau không?

Nhiệm vụ

4.1. Ba loại ô tô được bán ở hai khu chợ khác nhau trong thành phố ( A, B, C). Dưới đây là số liệu về số lượng xe bán ra trong năm:



Tìm các xác suất sau: R(một, một), P(một, B), P(một, C), P(b,A), P(b, B), P(b,C), P(MỘT), P(một/A), P(A/a). Lập bảng xác suất chung.

4.2. Những người đi nghỉ tại một khu nghỉ dưỡng nhất định thường là doanh nhân ( B) hoặc những người có nghề nghiệp tự do ( P)(luật sư, nghệ sĩ, bác sĩ, v.v.). Chủ sở hữu của một khu nghỉ dưỡng muốn xác định xem liệu việc thực hiện hai loại quảng cáo thay vì một loại có mang lại nhiều lợi nhuận hơn cho anh ta hay không. Để làm được điều này, ông đã chỉ đạo bộ phận quảng cáo của mình chuẩn bị hai loại hình quảng cáo - một loại dành cho doanh nhân (loại I), một loại dành cho những người làm nghề tự do (loại II). Các quảng cáo đã được chuẩn bị, tài liệu đã được gửi đến các khách hàng tiềm năng và 800 đơn đăng ký đã được nhận. Chúng được phân phối như sau.

MỘT). Tìm xác suất P(B, tôi); P(B,II); P(Tôi/B).

Bạn có thường xuyên nghe những câu nói rằng hiện tượng này có mối tương quan với hiện tượng khác không?

Theo các chuyên gia từ dịch vụ thăm dò Gallup, “Tăng trưởng cao có tương quan với giáo dục tốt và hạnh phúc”.

“Giá dầu có tương quan với tỷ giá hối đoái.”

“Đau nhức cơ sau tập luyện không tương quan với chứng phì đại sợi cơ.”

Có vẻ như khái niệm “tương quan” đã được sử dụng rộng rãi không chỉ trong khoa học mà còn trong đời sống hàng ngày. Mối tương quan phản ánh mức độ quan hệ tuyến tính giữa hai hiện tượng ngẫu nhiên. Vì vậy, khi giá dầu bắt đầu giảm, tỷ giá hối đoái giữa đồng đô la và đồng rúp bắt đầu tăng.

Từ tất cả những điều trên, chúng ta có thể kết luận rằng khi mô tả các biến ngẫu nhiên hai chiều, các đặc điểm nổi tiếng như kỳ vọng toán học, độ phân tán và độ lệch chuẩn đôi khi không đủ. Do đó, hai đặc điểm rất quan trọng hơn thường được sử dụng để mô tả chúng: hiệp phương saisự tương quan.

hiệp phương sai

Hiệp phương sai$cov\left(X,\ Y\right)$ của các biến ngẫu nhiên $X$ và $Y$ là kỳ vọng toán học của tích các biến ngẫu nhiên $X-M\left(X\right)$ và $Y-M\left(Y \right)$, tức là:

$$cov\left(X,\ Y\right)=M\left(\left(X-M\left(X\right)\right)\left(Y-M\left(Y\right)\right)\right). $$

Có thể thuận tiện để tính hiệp phương sai của các biến ngẫu nhiên $X$ và $Y$ bằng công thức sau:

$$cov\left(X,\ Y\right)=M\left(XY\right)-M\left(X\right)M\left(Y\right),$$

có thể thu được từ công thức đầu tiên sử dụng các tính chất của kỳ vọng toán học. Hãy liệt kê chính tính chất hiệp phương sai.

1 . Hiệp phương sai của một biến ngẫu nhiên với chính nó là phương sai của nó.

$$cov\left(X,\ X\right)=D\left(X\right).$$

2 . Hiệp phương sai là đối xứng.

$$cov\left(X,\ Y\right)=cov\left(Y,\ X\right).$$

3 . Nếu các biến ngẫu nhiên $X$ và $Y$ là độc lập thì:

$$cov\left(X,\ Y\right)=0.$$

4 . Hệ số không đổi có thể được loại bỏ khỏi dấu hiệp phương sai.

$$cov\left(cX,\ Y\right)=cov\left(X,\ cY\right)=c\cdot cov\left(X,\ Y\right).$$

5 . Hiệp phương sai sẽ không thay đổi nếu một giá trị không đổi được thêm vào một trong các biến ngẫu nhiên (hoặc hai biến cùng một lúc):

$$cov\left(X+c,\ Y\right)=cov\left(X,\ Y+c\right)=cov\left(X+x,\ Y+c\right)=cov\left( X,\Y\phải).$$

6 . $cov\left(aX+b,\ cY+d\right)=ac\cdot cov\left(X,\ Y\right)$.

7 . $\left|cov\left(X,\ Y\right)\right|\le \sqrt(D\left(X\right)D\left(Y\right))$.

8 . $\left|cov\left(X,\ Y\right)\right|=\sqrt(D\left(X\right)D\left(Y\right))\Leftrightarrow Y=aX+b$.

9 . Phương sai của tổng (chênh lệch) của các biến ngẫu nhiên bằng tổng phương sai của chúng cộng (trừ) hai lần hiệp phương sai của các biến ngẫu nhiên này:

$$D\left(X\pm Y\right)=D\left(X\right)+D\left(Y\right)\pm 2cov\left(X,\ Y\right).$$

Ví dụ 1 . Một bảng tương quan của một vectơ ngẫu nhiên $\left(X,\ Y\right)$ được đưa ra. Tính hiệp phương sai $cov\left(X,\ Y\right)$.

$\begin(array)(|c|c|)
\hline

\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 & 0,05 & p_(22) & 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\end(mảng)$

Các sự kiện $\left(X=x_i,\ Y=y_j\right)$ tạo thành một nhóm sự kiện hoàn chỉnh, do đó tổng của tất cả các xác suất $p_(ij)$ được chỉ ra trong bảng phải bằng 1. Khi đó $0,1 +0+0 ,2+0,05+p_(22)+0+0+0,2+0,05+0,1+0+0,1=1$, do đó $p_(22)=0,2$.

$\begin(array)(|c|c|)
\hline
X\dấu gạch chéo ngược Y & -6 & 0 & 3 \\
\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 & 0,05 & 0,2 & 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\end(mảng)$

Sử dụng công thức $p_(i) =\sum _(j)p_(ij) $, chúng ta tìm được chuỗi phân phối của biến ngẫu nhiên $X$.

$\begin(array)(|c|c|)
\hline
X & -2 & 0 & 1 & 7 \\
\hline
p_i & 0,3 & 0,25 & 0,25 & 0,2 \\
\hline
\end(mảng)$

$$M\left(X\right)=\sum^n_(i=1)(x_ip_i)=-2\cdot 0.3+0\cdot 0.25+1\cdot 0.25+7\cdot 0 ,2=1.05.$ $

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2)=0.3\cdot ( \left (-2-1.05\right))^2+0.25\cdot (\left(0-1.05\right))^2+0.25\cdot (\left(1-1, 05\right))^2+$$

$$+\ 0,2\cdot (\left(7-1,05\right))^2=10.1475.$$

$$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(10.1475)\approx 3,186.$$

Sử dụng công thức $q_(j) =\sum _(i)p_(ij) $, chúng ta tìm được chuỗi phân phối của biến ngẫu nhiên $Y$.

$\begin(array)(|c|c|)
\hline
Y & -6 & 0 & 3 \\
\hline
p_i & 0,25 & 0,4 & 0,35 \\
\hline
\end(mảng)$

$$M\left(Y\right)=\sum^n_(i=1)(y_ip_i)=-6\cdot 0,25+0\cdot 0,4+3\cdot 0,35=-0,45 .$$

$$D\left(Y\right)=\sum^n_(i=1)(p_i(\left(y_i-M\left(Y\right)\right))^2)=0.25\cdot ( \left (-6+0,45\right))^2+0,4\cdot (\left(0+0,45\right))^2+0,35\cdot (\left(3+0, 45\right))^2=11,9475. $$

$$\sigma \left(Y\right)=\sqrt(D\left(Y\right))=\sqrt(11.9475)\khoảng 3,457.$$

Vì $P\left(X=-2,\ Y=-6\right)=0.1\ne 0.3\cdot 0.25$, nên các biến ngẫu nhiên $X,\ Y$ là phụ thuộc.

Chúng ta hãy xác định hiệp phương sai $cov\ \left(X,\ Y\right)$ của các biến ngẫu nhiên $X,\ Y$ theo công thức $cov\left(X,\ Y\right)=M\left(XY\ right)-M\ left(X\right)M\left(Y\right)$. Kỳ vọng toán học của tích các biến ngẫu nhiên $X,\Y$ bằng:

$$M\left(XY\right)=\sum_(i,\ j)(p_(ij)x_iy_j)=0.1\cdot \left(-2\right)\cdot \left(-6\right) +0.2 \cdot \left(-2\right)\cdot 3+0.05\cdot 1\cdot 3+0.1\cdot 7\cdot \left(-6\right)+0.1\cdot 7\cdot 3=-1.95.$$

Sau đó $cov\left(X,\ Y\right)=M\left(XY\right)-M\left(X\right)M\left(Y\right)=-1.95-1.05\cdot \left(- 0,45\right)=-1,4775.$ Nếu các biến ngẫu nhiên là độc lập thì hiệp phương sai của chúng bằng 0. Trong trường hợp của chúng tôi, $cov(X,Y)\ne 0$.

Tương quan

Hệ số tương quan biến ngẫu nhiên $X$ và $Y$ được gọi là số:

$$\rho \left(X,\ Y\right)=((cov\left(X,\ Y\right))\over (\sqrt(D\left(X\right)D\left(Y\right )))).$$

Hãy liệt kê chính tính chất của hệ số tương quan.

1 . $\rho \left(X,\ X\right)=1$.

2 . $\rho \left(X,\ Y\right)=\rho \left(Y,\ X\right)$.

3 . $\rho \left(X,\ Y\right)=0$ cho các biến ngẫu nhiên độc lập $X$ và $Y$.

4 . $\rho \left(aX+b,\ cY+d\right)=(sgn \left(ac\right)\rho \left(X,\ Y\right)\ )$, trong đó $(sgn \left( ac\right)\ )$ là ký hiệu của sản phẩm $ac$.

5 . $\left|\rho \left(X,\ Y\right)\right|\le 1$.

6 . $\left|\rho \left(X,\ Y\right)\right|=1\Leftrightarrow Y=aX+b$.

Trước đây người ta nói rằng hệ số tương quan $\rho \left(X,\ Y\right)$ phản ánh mức độ phụ thuộc tuyến tính giữa hai biến ngẫu nhiên $X$ và $Y$.

Khi $\rho \left(X,\ Y\right)>0$ chúng ta có thể kết luận rằng khi biến ngẫu nhiên $X$ tăng thì biến ngẫu nhiên $Y$ có xu hướng tăng. Điều này được gọi là tương quan tích cực. Ví dụ: chiều cao và cân nặng của một người có mối tương quan dương.

Khi $\rho \left(X,\ Y\right)<0$ можно сделать вывод о том, что с ростом случайной величины $X$ случайная величина $Y$ имеет тенденцию к уменьшению. Это называется отрицательной корреляционной зависимостью. Например, температура и время сохранности продуктов питания связаны между собой отрицательной корреляционной зависимостью.

Khi $\rho \left(X,\ Y\right)=0$, các biến ngẫu nhiên $X$ và $Y$ được gọi là không tương quan. Điều đáng chú ý là tính không tương quan của các biến ngẫu nhiên $X$ và $Y$ không có nghĩa là chúng độc lập về mặt thống kê, nó chỉ có nghĩa là không có mối quan hệ tuyến tính giữa chúng.

Ví dụ 2 . Chúng ta hãy xác định hệ số tương quan $\rho \left(X,\ Y\right)$ cho biến ngẫu nhiên hai chiều $\left(X,\ Y\right)$ từ Ví dụ 1.

Hệ số tương quan của các biến ngẫu nhiên $X,\Y$ bằng $r_(XY) =(cov(X,Y)\over \sigma (X)\sigma (Y)) =(-1.4775\over 3.186\cdot 3,457) =-0,134.$ Vì $r_(XY)<0$, то с ростом $X$ случайная величина $Y$ имеет тенденцию к уменьшению (отрицательная корреляционная зависимость).