Công thức độ lệch chuẩn. Độ lệch tuyến tính trung bình

Kỳ vọng và phương sai

Chúng ta hãy đo một biến ngẫu nhiên N lần, chẳng hạn, chúng tôi đo tốc độ gió mười lần và muốn tìm giá trị trung bình. Giá trị trung bình liên quan đến hàm phân phối như thế nào?

Chúng ta sẽ tung xúc xắc nhiều lần. Số điểm sẽ xuất hiện trên xúc xắc sau mỗi lần ném xúc xắc là một biến ngẫu nhiên và có thể nhận bất kỳ giá trị tự nhiên nào từ 1 đến 6. Giá trị trung bình số học của số điểm rơi được tính cho tất cả các lần ném xúc xắc cũng là một biến ngẫu nhiên, nhưng đối với số điểm lớn. N nó hướng đến một con số rất cụ thể - kỳ vọng toán học M x. Trong trường hợp này M x = 3,5.

Làm thế nào bạn có được giá trị này? Cho vào N kiểm tra, khi bạn được 1 điểm, khi bạn được 2 điểm, v.v. Rồi khi nào N→ ∞ số kết quả trong đó một điểm được tung ra, Tương tự, Do đó

Mô hình 4.5. Xúc xắc

Bây giờ chúng ta giả sử rằng chúng ta biết luật phân phối của biến ngẫu nhiên x, nghĩa là chúng ta biết rằng biến ngẫu nhiên x có thể nhận các giá trị x 1 , x 2 , ..., x k với xác suất P 1 , P 2 , ..., p k.

Kỳ vọng M x biến ngẫu nhiên x bằng:

Trả lời. 2,8.

Kỳ vọng toán học không phải lúc nào cũng là ước tính hợp lý của một số biến ngẫu nhiên. Vì vậy, để ước tính mức lương trung bình, sẽ hợp lý hơn nếu sử dụng khái niệm trung vị, tức là giá trị sao cho số người nhận được mức lương thấp hơn mức trung vị và số người nhận mức lương cao hơn trùng khớp với nhau.

trung bình biến ngẫu nhiên được gọi là số x 1/2 là như vậy P (x < x 1/2) = 1/2.

Nói cách khác, xác suất P 1 rằng biến ngẫu nhiên x sẽ nhỏ hơn x 1/2 và xác suất P 2 rằng biến ngẫu nhiên x sẽ lớn hơn x 1/2 giống nhau và bằng 1/2. Giá trị trung vị không được xác định duy nhất cho tất cả các phân phối.

Hãy quay lại biến ngẫu nhiên x, có thể nhận các giá trị x 1 , x 2 , ..., x k với xác suất P 1 , P 2 , ..., p k.

Phương sai biến ngẫu nhiên x Giá trị trung bình của độ lệch bình phương của một biến ngẫu nhiên so với kỳ vọng toán học của nó được gọi là:

Ví dụ 2

Theo điều kiện của ví dụ trước, hãy tính phương sai và độ lệch chuẩn của biến ngẫu nhiên x.

Trả lời. 0,16, 0,4.

Mô hình 4.6. Bắn vào mục tiêu

Ví dụ 3

Tìm phân bố xác suất của số điểm đạt được trong lần tung xúc xắc đầu tiên, giá trị trung bình, kỳ vọng toán học, phương sai và độ lệch chuẩn.

Bất kỳ cạnh nào cũng có khả năng bị rơi ra như nhau, vì vậy sự phân bổ sẽ như sau:

Độ lệch chuẩn Có thể thấy độ lệch của giá trị so với giá trị trung bình là rất lớn.

Tính chất của kỳ vọng toán học:

  • Kỳ vọng toán học của tổng các biến ngẫu nhiên độc lập bằng tổng kỳ vọng toán học của chúng:

Ví dụ 4

Tìm kỳ vọng toán học của tổng và tích số điểm gieo trên hai con xúc xắc.

Trong ví dụ 3, chúng tôi thấy rằng đối với một khối M (x) = 3,5. Vì vậy, đối với hai hình khối

Đặc tính phân tán:

  • Phương sai của tổng các biến ngẫu nhiên độc lập bằng tổng các phương sai:

Dx + y = Dx + Dy.

Hãy để cho N cuộn xúc xắc lăn yđiểm. Sau đó

Kết quả này đúng không chỉ với việc tung xúc xắc. Trong nhiều trường hợp, nó quyết định tính chính xác của việc đo lường kỳ vọng toán học theo kinh nghiệm. Có thể thấy rằng với số lần đo ngày càng tăng N sự chênh lệch của các giá trị xung quanh mức trung bình, nghĩa là độ lệch chuẩn, giảm tỷ lệ thuận

Phương sai của một biến ngẫu nhiên có liên hệ với kỳ vọng toán học của bình phương của biến ngẫu nhiên này theo hệ thức sau:

Hãy tìm kỳ vọng toán học của cả hai vế của đẳng thức này. Theo định nghĩa,

Kỳ vọng toán học của vế phải của đẳng thức, theo tính chất của kỳ vọng toán học, bằng

Độ lệch chuẩn

Độ lệch chuẩn bằng căn bậc hai của phương sai:
Khi xác định độ lệch chuẩn cho một lượng tổng thể đủ lớn đang được nghiên cứu (n > 30), các công thức sau được sử dụng:

Thông tin liên quan.


Sự phân tán. Độ lệch chuẩn

phân tán là giá trị trung bình số học của độ lệch bình phương của từng giá trị thuộc tính so với mức trung bình tổng thể. Tùy thuộc vào dữ liệu nguồn, phương sai có thể không có trọng số (đơn giản) hoặc có trọng số.

Phương sai được tính bằng các công thức sau:

· cho dữ liệu chưa được nhóm

· cho dữ liệu được nhóm

Quy trình tính phương sai có trọng số:

1. xác định trung bình cộng số học

2. độ lệch của biến thể so với mức trung bình được xác định

3. bình phương độ lệch của mỗi phương án so với mức trung bình

4. nhân bình phương độ lệch với trọng số (tần số)

5. tóm tắt các sản phẩm thu được

6. số tiền thu được được chia cho tổng của thang đo

Công thức xác định phương sai có thể được chuyển đổi thành công thức sau:

- đơn giản

Quy trình tính phương sai rất đơn giản:

1. xác định giá trị trung bình số học

2. bình phương trung bình số học

3. bình phương mỗi tùy chọn trong hàng

4. tìm tùy chọn tổng bình phương

5. chia tổng bình phương cho số của chúng, tức là xác định bình phương trung bình

6. xác định sự khác biệt giữa bình phương trung bình của đặc tính và bình phương của giá trị trung bình

Ngoài ra, công thức xác định phương sai có trọng số có thể được chuyển đổi thành công thức sau:

những thứ kia. độ phân tán bằng hiệu giữa giá trị trung bình của các giá trị bình phương của thuộc tính và bình phương của giá trị trung bình số học. Khi sử dụng công thức được chuyển đổi, quy trình bổ sung để tính độ lệch của các giá trị riêng lẻ của một đặc tính từ x sẽ bị loại bỏ và lỗi trong phép tính liên quan đến làm tròn độ lệch sẽ bị loại bỏ

Độ phân tán có một số tính chất, một số tính chất giúp tính toán dễ dàng hơn:

1) phương sai của một giá trị không đổi bằng 0;

2) nếu tất cả các biến thể của giá trị thuộc tính được giảm cùng một số thì phương sai sẽ không giảm;

3) nếu tất cả các biến thể của giá trị thuộc tính được giảm cùng một số lần (gấp), thì phương sai sẽ giảm theo một hệ số

Độ lệch chuẩn S- biểu thị căn bậc hai của phương sai:

· đối với dữ liệu chưa được nhóm:

;

· đối với dãy biến thiên:

Khoảng biến thiên, giá trị trung bình tuyến tính và độ lệch chuẩn được gọi là các đại lượng. Chúng có cùng đơn vị đo lường với các giá trị đặc trưng riêng lẻ.

Phương sai và độ lệch chuẩn là những thước đo biến thiên được sử dụng rộng rãi nhất. Điều này được giải thích là do chúng được đưa vào hầu hết các định lý của lý thuyết xác suất, vốn đóng vai trò là nền tảng của thống kê toán học. Ngoài ra, phương sai có thể được phân tách thành các phần tử thành phần của nó, cho phép người ta đánh giá ảnh hưởng của các yếu tố khác nhau quyết định sự biến đổi của một đặc điểm.

Việc tính toán các chỉ số biến động cho các ngân hàng phân nhóm theo tỷ suất lợi nhuận được trình bày trong bảng.

Số tiền lãi, triệu rúp. Số lượng ngân hàng chỉ số tính toán
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Tổng cộng: 121,70 17,640 23,126

Độ lệch tuyến tính và độ lệch chuẩn trung bình cho thấy giá trị trung bình của một đặc tính dao động bao nhiêu giữa các đơn vị và tổng thể được nghiên cứu. Vì vậy, trong trường hợp này, biến động trung bình của lợi nhuận là: theo độ lệch tuyến tính trung bình là 0,882 triệu rúp; theo độ lệch chuẩn - 1,075 triệu rúp. Độ lệch chuẩn luôn lớn hơn độ lệch tuyến tính trung bình. Nếu phân bố của đặc tính gần với chuẩn thì có mối quan hệ giữa S và d: S=1,25d hoặc d=0,8S. Độ lệch chuẩn cho thấy phần lớn các đơn vị tổng thể được định vị như thế nào so với giá trị trung bình số học. Bất kể hình dạng của phân bố, 75 giá trị của thuộc tính rơi vào khoảng x 2S và ít nhất 89 giá trị trong số tất cả các giá trị rơi vào khoảng x 3S (định lý P.L. Chebyshev).

Chương trình Excel được cả chuyên gia và người nghiệp dư đánh giá cao vì người dùng ở mọi cấp độ kỹ năng đều có thể làm việc với nó. Ví dụ: bất kỳ ai có kỹ năng “giao tiếp” tối thiểu trong Excel đều có thể vẽ một biểu đồ đơn giản, tạo một cái đĩa đẹp mắt, v.v.

Đồng thời, chương trình này thậm chí còn cho phép bạn thực hiện nhiều loại phép tính khác nhau, chẳng hạn như tính toán, nhưng điều này đòi hỏi một mức độ đào tạo hơi khác. Tuy nhiên, nếu bạn mới bắt đầu làm quen với chương trình này và quan tâm đến mọi thứ sẽ giúp bạn trở thành người dùng nâng cao hơn thì bài viết này là dành cho bạn. Hôm nay tôi sẽ cho bạn biết công thức độ lệch chuẩn trong Excel là gì, tại sao nó lại cần thiết và nói đúng ra là khi nào nó được sử dụng. Đi thôi!

nó là gì vậy

Hãy bắt đầu với lý thuyết. Độ lệch chuẩn thường được gọi là căn bậc hai thu được từ giá trị trung bình số học của tất cả các chênh lệch bình phương giữa các đại lượng có sẵn, cũng như giá trị trung bình số học của chúng.

Nhân tiện, giá trị này thường được gọi là chữ cái Hy Lạp “sigma”. Độ lệch chuẩn được tính bằng công thức STANDARDEVAL, tương ứng, chương trình thực hiện việc này cho chính người dùng.

Bản chất của khái niệm này là xác định mức độ biến đổi của một công cụ, nghĩa là, theo cách riêng của nó, nó là một chỉ báo bắt nguồn từ thống kê mô tả. Nó xác định những thay đổi về độ biến động của một công cụ trong bất kỳ khoảng thời gian nào. Công thức STDEV có thể được sử dụng để ước tính độ lệch chuẩn của mẫu, bỏ qua giá trị Boolean và văn bản.

Công thức

Công thức được cung cấp tự động trong Excel giúp tính độ lệch chuẩn trong Excel. Để tìm thấy nó, bạn cần tìm phần công thức trong Excel, sau đó chọn phần có tên STANDARDEVAL, vì vậy rất đơn giản.

Sau đó, một cửa sổ sẽ xuất hiện trước mặt bạn, trong đó bạn sẽ cần nhập dữ liệu để tính toán. Đặc biệt, hai số phải được nhập vào các trường đặc biệt, sau đó chương trình sẽ tự tính độ lệch chuẩn cho mẫu.

Không còn nghi ngờ gì nữa, các công thức và phép tính toán học là một vấn đề khá phức tạp và không phải người dùng nào cũng có thể giải quyết ngay lập tức. Tuy nhiên, nếu bạn tìm hiểu sâu hơn một chút và xem xét vấn đề chi tiết hơn một chút, thì hóa ra không phải mọi thứ đều đáng buồn như vậy. Tôi hy vọng bạn bị thuyết phục về điều này khi sử dụng ví dụ tính độ lệch chuẩn.

Theo khảo sát mẫu, người gửi tiền được nhóm theo quy mô tiền gửi của họ tại Sberbank của thành phố:

Định nghĩa:

1) phạm vi thay đổi;

2) quy mô tiền gửi trung bình;

3) độ lệch tuyến tính trung bình;

4) sự phân tán;

5) độ lệch chuẩn;

6) hệ số biến thiên của đóng góp.

Giải pháp:

Chuỗi phân phối này chứa các khoảng thời gian mở. Trong chuỗi như vậy, giá trị khoảng của nhóm đầu tiên được giả định theo quy ước bằng giá trị khoảng của nhóm tiếp theo và giá trị khoảng của nhóm cuối cùng bằng giá trị khoảng của nhóm cuối cùng. cái trước đó.

Giá trị khoảng của nhóm thứ hai bằng 200 nên giá trị của khoảng của nhóm thứ nhất cũng bằng 200. Giá trị khoảng của nhóm áp chót bằng 200 nghĩa là khoảng cuối cùng cũng sẽ có giá trị là 200.

1) Chúng ta hãy xác định phạm vi biến đổi là chênh lệch giữa giá trị lớn nhất và nhỏ nhất của thuộc tính:

Phạm vi thay đổi của kích thước tiền gửi là 1000 rúp.

2) Quy mô trung bình của khoản đóng góp sẽ được xác định bằng cách sử dụng công thức trung bình số học có trọng số.

Đầu tiên chúng ta hãy xác định giá trị rời rạc của thuộc tính trong mỗi khoảng. Để làm điều này, bằng cách sử dụng công thức trung bình số học đơn giản, chúng ta tìm được điểm giữa của các khoảng.

Giá trị trung bình của khoảng đầu tiên sẽ là:

thứ hai - 500, v.v.

Hãy nhập kết quả tính toán vào bảng:

Số tiền gửi, chà.Số người gửi tiền, fGiữa khoảng, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Tổng cộng 400 - 312000

Khoản tiền gửi trung bình tại Sberbank của thành phố sẽ là 780 rúp:

3) Độ lệch tuyến tính trung bình là giá trị trung bình số học của độ lệch tuyệt đối của các giá trị riêng lẻ của một đặc tính so với mức trung bình tổng thể:

Quy trình tính độ lệch tuyến tính trung bình trong chuỗi phân bố khoảng như sau:

1. Giá trị trung bình số học có trọng số được tính toán như trong đoạn 2).

2. Độ lệch tuyệt đối so với giá trị trung bình được xác định:

3. Độ lệch thu được được nhân với tần số:

4. Tìm tổng các độ lệch có trọng số mà không tính đến dấu:

5. Tổng các sai lệch có trọng số được chia cho tổng tần số:

Thật thuận tiện khi sử dụng bảng dữ liệu tính toán:

Số tiền gửi, chà.Số người gửi tiền, fGiữa khoảng, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Tổng cộng 400 - - - 81280

Độ lệch tuyến tính trung bình của quy mô tiền gửi của khách hàng Sberbank là 203,2 rúp.

4) Độ phân tán là giá trị trung bình số học của độ lệch bình phương của từng giá trị thuộc tính so với giá trị trung bình số học.

Việc tính toán phương sai trong chuỗi phân bố khoảng được thực hiện theo công thức:

Quy trình tính phương sai trong trường hợp này như sau:

1. Xác định giá trị trung bình số học có trọng số như trong đoạn 2).

2. Tìm độ lệch so với mức trung bình:

3. Bình phương độ lệch của mỗi phương án so với mức trung bình:

4. Nhân bình phương của độ lệch với trọng số (tần số):

5. Tổng hợp các sản phẩm thu được:

6. Số tiền thu được được chia cho tổng các trọng số (tần số):

Hãy đặt các phép tính vào một bảng:

Số tiền gửi, chà.Số người gửi tiền, fGiữa khoảng, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Tổng cộng 400 - - - 23040000

Một phương pháp gần đúng để đánh giá độ biến thiên của chuỗi biến thể là xác định giới hạn và biên độ, nhưng các giá trị của biến thể trong chuỗi không được tính đến. Thước đo chính được chấp nhận rộng rãi về độ biến thiên của một đặc tính định lượng trong một chuỗi biến thể là độ lệch chuẩn (σ - sigma). Độ lệch chuẩn càng lớn thì mức độ biến động của chuỗi này càng cao.

Phương pháp tính độ lệch chuẩn bao gồm các bước sau:

1. Tìm giá trị trung bình số học (M).

2. Xác định độ lệch của từng phương án so với giá trị trung bình số học (d=V-M). Trong thống kê y tế, độ lệch so với mức trung bình được ký hiệu là d (độ lệch). Tổng của tất cả các sai lệch bằng không.

3. Bình phương mỗi độ lệch d 2.

4. Nhân bình phương của độ lệch với tần số tương ứng d 2 *p.

5. Tìm tổng các tích å(d 2 *p)

6. Tính độ lệch chuẩn bằng công thức:

Khi n lớn hơn 30 hoặc khi n nhỏ hơn hoặc bằng 30, trong đó n là số lượng tất cả các lựa chọn.

Giá trị độ lệch chuẩn:

1. Độ lệch chuẩn đặc trưng cho mức độ phân tán của biến thể so với giá trị trung bình (tức là độ biến thiên của chuỗi biến thể). Sigma càng lớn thì mức độ đa dạng của chuỗi này càng cao.

2. Độ lệch chuẩn được sử dụng để đánh giá so sánh mức độ tương ứng của trung bình số học với chuỗi biến thiên mà nó được tính toán.

Các biến thể của hiện tượng khối lượng tuân theo quy luật phân phối chuẩn. Đường cong biểu thị sự phân bố này trông giống như một đường cong đối xứng hình chuông trơn tru (đường cong Gaussian). Theo lý thuyết xác suất, trong những hiện tượng tuân theo quy luật phân phối chuẩn có mối quan hệ toán học chặt chẽ giữa giá trị trung bình số học và độ lệch chuẩn. Sự phân bố lý thuyết của một biến thể trong chuỗi biến thể đồng nhất tuân theo quy tắc ba sigma.

Nếu trong hệ tọa độ hình chữ nhật, các giá trị của đặc tính định lượng (các biến thể) được biểu thị trên trục hoành và tần suất xuất hiện của biến thể trong chuỗi biến thể được biểu thị trên trục tọa độ, thì các biến thể có giá trị lớn hơn và nhỏ hơn các giá trị nằm đều ở các cạnh của giá trị trung bình số học.



Người ta đã chứng minh rằng với sự phân bố bình thường của tính trạng:

68,3% giá trị biến thể nằm trong M±1s

95,5% giá trị biến thể nằm trong M±2s

99,7% giá trị biến thể nằm trong M±3s

3. Độ lệch chuẩn cho phép bạn thiết lập các giá trị bình thường cho các thông số lâm sàng và sinh học. Trong y học, khoảng M±1s thường được coi là khoảng bình thường cho hiện tượng đang được nghiên cứu. Độ lệch của giá trị ước tính so với giá trị trung bình số học hơn 1 giây cho thấy độ lệch của tham số nghiên cứu so với định mức.

4. Trong y học, quy tắc ba sigma được sử dụng trong nhi khoa để đánh giá từng cá nhân về mức độ phát triển thể chất của trẻ (phương pháp sai lệch sigma), để xây dựng các tiêu chuẩn về quần áo trẻ em

5. Độ lệch chuẩn là cần thiết để mô tả mức độ đa dạng của đặc tính đang được nghiên cứu và để tính sai số của giá trị trung bình số học.

Giá trị độ lệch chuẩn thường được sử dụng để so sánh độ biến thiên của các chuỗi cùng loại. Nếu so sánh hai chuỗi có các đặc điểm khác nhau (chiều cao và cân nặng, thời gian điều trị trung bình tại bệnh viện và tỷ lệ tử vong tại bệnh viện, v.v.), thì việc so sánh trực tiếp kích thước sigma là không thể , bởi vì độ lệch chuẩn là một giá trị được đặt tên được biểu thị bằng số tuyệt đối. Trong những trường hợp này, hãy sử dụng hệ số biến thiên (Cv), là giá trị tương đối: phần trăm của độ lệch chuẩn so với giá trị trung bình số học.

Hệ số biến thiên được tính theo công thức:

Hệ số biến thiên càng cao , sự biến đổi của chuỗi này càng lớn. Người ta tin rằng hệ số biến thiên trên 30% cho thấy sự không đồng nhất về chất của dân số.