Giá trị trung bình số học của độ lệch bình phương. Phương pháp và phương pháp hình thành quần thể mẫu

Theo khảo sát mẫu, người gửi tiền được nhóm theo quy mô tiền gửi của họ tại Sberbank của thành phố:

Định nghĩa:

1) phạm vi thay đổi;

2) quy mô tiền gửi trung bình;

3) độ lệch tuyến tính trung bình;

4) sự phân tán;

5) độ lệch chuẩn;

6) hệ số biến thiên của đóng góp.

Giải pháp:

Chuỗi phân phối này chứa các khoảng thời gian mở. Trong chuỗi như vậy, giá trị khoảng của nhóm đầu tiên được giả định theo quy ước bằng giá trị khoảng của nhóm tiếp theo và giá trị khoảng của nhóm cuối cùng bằng giá trị khoảng của nhóm cuối cùng. cái trước đó.

Giá trị khoảng của nhóm thứ hai bằng 200 nên giá trị của khoảng của nhóm thứ nhất cũng bằng 200. Giá trị khoảng của nhóm áp chót bằng 200 nghĩa là khoảng cuối cùng cũng sẽ có giá trị là 200.

1) Chúng ta hãy xác định phạm vi biến đổi là chênh lệch giữa giá trị lớn nhất và nhỏ nhất của thuộc tính:

Phạm vi thay đổi của kích thước tiền gửi là 1000 rúp.

2) Quy mô trung bình của khoản đóng góp sẽ được xác định bằng cách sử dụng công thức trung bình số học có trọng số.

Đầu tiên chúng ta hãy xác định giá trị rời rạc của thuộc tính trong mỗi khoảng. Để làm điều này, bằng cách sử dụng công thức trung bình số học đơn giản, chúng ta tìm được điểm giữa của các khoảng.

Giá trị trung bình của khoảng đầu tiên sẽ là:

thứ hai - 500, v.v.

Hãy nhập kết quả tính toán vào bảng:

Số tiền gửi, chà.	Số người gửi tiền, f	Giữa khoảng, x	xf
200-400	32	300	9600
400-600	56	500	28000
600-800	120	700	84000
800-1000	104	900	93600
1000-1200	88	1100	96800
Tổng cộng	400	-	312000

Khoản tiền gửi trung bình tại Sberbank của thành phố sẽ là 780 rúp:

3) Độ lệch tuyến tính trung bình là giá trị trung bình số học của độ lệch tuyệt đối của các giá trị riêng lẻ của một đặc tính so với mức trung bình tổng thể:

Quy trình tính độ lệch tuyến tính trung bình trong chuỗi phân bố khoảng như sau:

1. Giá trị trung bình số học có trọng số được tính toán như trong đoạn 2).

2. Độ lệch tuyệt đối so với giá trị trung bình được xác định:

3. Độ lệch thu được được nhân với tần số:

4. Tìm tổng các độ lệch có trọng số mà không tính đến dấu:

5. Tổng các sai lệch có trọng số được chia cho tổng tần số:

Thật thuận tiện khi sử dụng bảng dữ liệu tính toán:

Số tiền gửi, chà.	Số người gửi tiền, f	Giữa khoảng, x
200-400	32	300	-480	480	15360
400-600	56	500	-280	280	15680
600-800	120	700	-80	80	9600
800-1000	104	900	120	120	12480
1000-1200	88	1100	320	320	28160
Tổng cộng	400	-	-	-	81280

Độ lệch tuyến tính trung bình của quy mô tiền gửi của khách hàng Sberbank là 203,2 rúp.

4) Độ phân tán là giá trị trung bình số học của độ lệch bình phương của từng giá trị thuộc tính so với giá trị trung bình số học.

Việc tính toán phương sai trong chuỗi phân bố khoảng được thực hiện theo công thức:

Quy trình tính phương sai trong trường hợp này như sau:

1. Xác định giá trị trung bình số học có trọng số như trong đoạn 2).

2. Tìm độ lệch so với mức trung bình:

3. Bình phương độ lệch của mỗi phương án so với mức trung bình:

4. Nhân bình phương của độ lệch với trọng số (tần số):

5. Tổng hợp các sản phẩm thu được:

6. Số tiền thu được được chia cho tổng các trọng số (tần số):

Hãy đặt các phép tính vào một bảng:

Số tiền gửi, chà.	Số người gửi tiền, f	Giữa khoảng, x
200-400	32	300	-480	230400	7372800
400-600	56	500	-280	78400	4390400
600-800	120	700	-80	6400	768000
800-1000	104	900	120	14400	1497600
1000-1200	88	1100	320	102400	9011200
Tổng cộng	400	-	-	-	23040000

Chương trình Excel được cả chuyên gia và người nghiệp dư đánh giá cao vì người dùng ở mọi cấp độ kỹ năng đều có thể làm việc với nó. Ví dụ: bất kỳ ai có kỹ năng “giao tiếp” tối thiểu trong Excel đều có thể vẽ một biểu đồ đơn giản, tạo một cái đĩa đẹp mắt, v.v.

Đồng thời, chương trình này thậm chí còn cho phép bạn thực hiện nhiều loại phép tính khác nhau, chẳng hạn như tính toán, nhưng điều này đòi hỏi một mức độ đào tạo hơi khác. Tuy nhiên, nếu bạn mới bắt đầu làm quen với chương trình này và quan tâm đến mọi thứ sẽ giúp bạn trở thành người dùng nâng cao hơn thì bài viết này là dành cho bạn. Hôm nay tôi sẽ cho bạn biết công thức độ lệch chuẩn trong Excel là gì, tại sao nó lại cần thiết và nói đúng ra là khi nào nó được sử dụng. Đi thôi!

nó là gì vậy

Hãy bắt đầu với lý thuyết. Độ lệch chuẩn thường được gọi là căn bậc hai thu được từ giá trị trung bình số học của tất cả các chênh lệch bình phương giữa các đại lượng có sẵn, cũng như giá trị trung bình số học của chúng.

Nhân tiện, giá trị này thường được gọi là chữ cái Hy Lạp “sigma”. Độ lệch chuẩn được tính bằng công thức STANDARDEVAL, tương ứng, chương trình thực hiện việc này cho chính người dùng.

Bản chất của khái niệm này là xác định mức độ biến đổi của một công cụ, nghĩa là, theo cách riêng của nó, nó là một chỉ báo bắt nguồn từ thống kê mô tả. Nó xác định những thay đổi về độ biến động của một công cụ trong bất kỳ khoảng thời gian nào. Công thức STDEV có thể được sử dụng để ước tính độ lệch chuẩn của mẫu, bỏ qua giá trị Boolean và văn bản.

Công thức

Công thức được cung cấp tự động trong Excel giúp tính độ lệch chuẩn trong Excel. Để tìm thấy nó, bạn cần tìm phần công thức trong Excel, sau đó chọn phần có tên STANDARDEVAL, vì vậy rất đơn giản.

Không còn nghi ngờ gì nữa, các công thức và phép tính toán học là một vấn đề khá phức tạp và không phải người dùng nào cũng có thể giải quyết ngay lập tức. Tuy nhiên, nếu bạn tìm hiểu sâu hơn một chút và xem xét vấn đề chi tiết hơn một chút, thì hóa ra không phải mọi thứ đều đáng buồn như vậy. Tôi hy vọng bạn bị thuyết phục về điều này khi sử dụng ví dụ tính độ lệch chuẩn.

Video giúp đỡ

Điều đáng lưu ý là cách tính phương sai này có một nhược điểm - nó có tính sai lệch, tức là. kỳ vọng toán học của nó không bằng giá trị thực của phương sai. Đọc thêm về điều này. Đồng thời, không phải mọi thứ đều tệ như vậy. Khi kích thước mẫu tăng lên, nó vẫn đạt đến mức tương tự về mặt lý thuyết, tức là là tiệm cận không thiên lệch. Vì vậy, khi làm việc với cỡ mẫu lớn, bạn có thể sử dụng công thức trên.

Sẽ rất hữu ích nếu dịch ngôn ngữ ký hiệu sang ngôn ngữ của từ ngữ. Hóa ra phương sai là bình phương trung bình của các độ lệch. Nghĩa là, giá trị trung bình được tính toán đầu tiên, sau đó chênh lệch giữa mỗi giá trị ban đầu và trung bình được lấy, bình phương, cộng lại, sau đó chia cho số giá trị trong tổng thể. Sự khác biệt giữa một giá trị riêng lẻ và giá trị trung bình phản ánh thước đo độ lệch. Nó được bình phương sao cho tất cả các độ lệch chỉ trở thành số dương và tránh sự phá hủy lẫn nhau của các độ lệch dương và âm khi tổng hợp chúng. Sau đó, với độ lệch bình phương, chúng ta chỉ cần tính giá trị trung bình số học. Trung bình - bình phương - độ lệch. Độ lệch được bình phương và tính giá trị trung bình. Giải pháp chỉ nằm trong ba từ.

Tuy nhiên, ở dạng thuần túy, chẳng hạn như trung bình số học hoặc chỉ số, độ phân tán không được sử dụng. Nó đúng hơn là một chỉ báo phụ trợ và trung gian cần thiết cho các loại phân tích thống kê khác. Nó thậm chí không có đơn vị đo lường bình thường. Đánh giá theo công thức, đây là bình phương của đơn vị đo của dữ liệu gốc. Như người ta nói, nếu không có chai, bạn không thể hiểu được.

(mô-đun 111)

Để đưa phương sai về thực tế, tức là sử dụng nó cho những mục đích thông thường hơn, căn bậc hai được rút ra từ nó. Hóa ra cái gọi là độ lệch chuẩn (RMS). Có những cái tên “độ lệch chuẩn” hoặc “sigma” (từ tên của chữ cái Hy Lạp). Công thức độ lệch chuẩn là:

Để có được chỉ số này cho mẫu, hãy sử dụng công thức:

Giống như phương sai, có một tùy chọn tính toán hơi khác. Nhưng khi mẫu phát triển, sự khác biệt sẽ biến mất.

Rõ ràng, độ lệch chuẩn cũng đặc trưng cho thước đo độ phân tán dữ liệu, nhưng bây giờ (không giống như độ phân tán) nó có thể được so sánh với dữ liệu gốc vì chúng có cùng đơn vị đo (điều này rõ ràng từ công thức tính toán). Nhưng ngay cả chỉ báo này ở dạng thuần túy cũng không có nhiều thông tin vì nó chứa quá nhiều phép tính trung gian gây nhầm lẫn (độ lệch, bình phương, tổng, trung bình, căn). Tuy nhiên, bạn đã có thể làm việc trực tiếp với độ lệch chuẩn vì các đặc tính của chỉ báo này đã được nghiên cứu và biết rõ. Ví dụ, có cái này quy tắc ba sigma, cho biết dữ liệu có 997 giá trị trong số 1000 giá trị trong phạm vi ±3 sigma của giá trị trung bình số học. Độ lệch chuẩn, như một thước đo độ không đảm bảo, cũng liên quan đến nhiều tính toán thống kê. Với sự trợ giúp của nó, mức độ chính xác của các ước tính và dự báo khác nhau được xác định. Nếu độ biến thiên rất lớn thì độ lệch chuẩn cũng sẽ lớn và do đó dự báo sẽ không chính xác, chẳng hạn như điều này sẽ được biểu thị trong khoảng tin cậy rất rộng.

Hệ số biến thiên

Độ lệch chuẩn đưa ra ước tính tuyệt đối về thước đo độ phân tán. Do đó, để hiểu mức độ phân tán lớn như thế nào so với chính các giá trị (tức là bất kể tỷ lệ của chúng), cần phải có một chỉ báo tương đối. Chỉ số này được gọi hệ số biến thiên và được tính bằng công thức sau:

Hệ số biến thiên được đo bằng phần trăm (nếu nhân với 100%). Sử dụng chỉ báo này, bạn có thể so sánh nhiều hiện tượng khác nhau, bất kể quy mô và đơn vị đo lường của chúng. Thực tế này là lý do khiến hệ số biến thiên trở nên phổ biến.

Trong thống kê, người ta chấp nhận rằng nếu giá trị của hệ số biến thiên nhỏ hơn 33% thì quần thể được coi là đồng nhất; nếu lớn hơn 33% thì quần thể đó không đồng nhất. Thật khó để tôi bình luận về bất cứ điều gì ở đây. Tôi không biết ai đã định nghĩa điều này và tại sao, nhưng nó được coi là một tiên đề.

Tôi cảm thấy mình bị cuốn theo lý thuyết khô khan và cần đưa ra một cái gì đó trực quan và tượng hình. Mặt khác, tất cả các chỉ số biến thể đều mô tả gần giống nhau, chỉ có điều chúng được tính toán khác nhau. Vì vậy, rất khó để đưa ra nhiều ví dụ khác nhau, chỉ có giá trị của các chỉ số mới có thể khác nhau chứ không phải bản chất của chúng. Vì vậy, hãy so sánh giá trị của các chỉ báo biến thể khác nhau như thế nào đối với cùng một bộ dữ liệu. Hãy lấy ví dụ tính độ lệch tuyến tính trung bình (từ ). Dưới đây là dữ liệu nguồn:

Và một lịch trình để nhắc nhở bạn.

Sử dụng những dữ liệu này, chúng tôi tính toán các chỉ số biến đổi khác nhau.

Giá trị trung bình là giá trị trung bình số học thông thường.

Phạm vi biến đổi là sự khác biệt giữa mức tối đa và tối thiểu:

Độ lệch tuyến tính trung bình được tính bằng công thức:

Độ lệch chuẩn:

Hãy tóm tắt phép tính trong một bảng.

Có thể thấy, giá trị trung bình tuyến tính và độ lệch chuẩn cho các giá trị tương tự nhau về mức độ biến đổi của dữ liệu. Phương sai là bình phương sigma, vì vậy nó sẽ luôn là một con số tương đối lớn, trên thực tế, con số này không có ý nghĩa gì cả. Phạm vi biến đổi là sự khác biệt giữa các giá trị cực trị và có thể nói lên nhiều điều.

Hãy tóm tắt một số kết quả.

Sự biến đổi của một chỉ số phản ánh sự biến đổi của một quá trình hoặc hiện tượng. Mức độ của nó có thể được đo bằng cách sử dụng một số chỉ số.

1. Phạm vi biến đổi - sự khác biệt giữa mức tối đa và tối thiểu. Phản ánh phạm vi của các giá trị có thể.
2. Độ lệch tuyến tính trung bình – phản ánh mức trung bình của độ lệch tuyệt đối (modulo) của tất cả các giá trị của tổng thể được phân tích so với giá trị trung bình của chúng.
3. Độ phân tán - bình phương độ lệch trung bình.
4. Độ lệch chuẩn là gốc của độ phân tán (bình phương trung bình của độ lệch).
5. Hệ số biến thiên là chỉ số phổ biến nhất, phản ánh mức độ phân tán của các giá trị, bất kể quy mô và đơn vị đo lường của chúng. Hệ số biến thiên được đo bằng phần trăm và có thể được sử dụng để so sánh sự biến thiên của các quá trình và hiện tượng khác nhau.

Như vậy, trong phân tích thống kê có hệ thống các chỉ tiêu phản ánh tính đồng nhất của các hiện tượng và tính ổn định của các quá trình. Thông thường, các chỉ số biến thiên không có ý nghĩa độc lập và được sử dụng để phân tích dữ liệu sâu hơn (tính khoảng tin cậy).

Việc tiến hành bất kỳ phân tích thống kê nào là không thể tưởng tượng được nếu không tính toán. Trong bài viết này, chúng ta sẽ xem xét cách tính phương sai, độ lệch chuẩn, hệ số biến thiên và các chỉ số thống kê khác trong Excel.

Giá trị tối đa và tối thiểu

Độ lệch tuyến tính trung bình

Độ lệch tuyến tính trung bình là giá trị trung bình của độ lệch tuyệt đối (modulo) trong tập dữ liệu được phân tích. Công thức toán học là:

Một- độ lệch tuyến tính trung bình,

X– chỉ số được phân tích,

X̅- giá trị trung bình của chỉ số,

Trong Excel hàm này được gọi là srotcl.

Sau khi chọn hàm SROTCL, chúng tôi chỉ ra phạm vi dữ liệu mà phép tính sẽ diễn ra. Nhấp vào "OK".

phân tán

(mô-đun 111)

Có lẽ không phải ai cũng biết điều gì, nên tôi sẽ giải thích, đó là thước đo đặc trưng cho mức độ lan truyền dữ liệu xung quanh kỳ vọng toán học. Tuy nhiên, thường chỉ có sẵn một mẫu nên công thức phương sai sau đây được sử dụng:

s 2– phương sai mẫu được tính toán từ dữ liệu quan sát,

X– các giá trị riêng lẻ,

X̅- trung bình số học của mẫu,

N– số lượng giá trị trong tập dữ liệu được phân tích.

Hàm Excel tương ứng là HIỂN THỊ.G. Khi phân tích các mẫu tương đối nhỏ (tối đa khoảng 30 quan sát), bạn nên sử dụng , được tính theo công thức sau.

Sự khác biệt, như bạn có thể thấy, chỉ nằm ở mẫu số. Excel có hàm tính phương sai không thiên vị mẫu HIỂN THỊ.B.

Chọn tùy chọn mong muốn (chung hoặc chọn lọc), cho biết phạm vi và nhấp vào nút “OK”. Giá trị thu được có thể rất lớn do bình phương sơ bộ của độ lệch. Độ phân tán trong thống kê là một chỉ báo rất quan trọng, nhưng nó thường không được sử dụng ở dạng thuần túy mà để tính toán thêm.

Độ lệch chuẩn

Độ lệch chuẩn (RMS) là gốc của phương sai. Chỉ báo này còn được gọi là độ lệch chuẩn và được tính bằng công thức:

theo dân số nói chung

theo mẫu

Bạn có thể chỉ cần lấy gốc của phương sai, nhưng Excel có các hàm tạo sẵn cho độ lệch chuẩn: STDEV.G Và STDEV.V(tương ứng với quần thể chung và quần thể mẫu).

Tôi nhắc lại, độ lệch chuẩn và độ lệch chuẩn là từ đồng nghĩa.

Tiếp theo, như thường lệ, chỉ ra phạm vi mong muốn và nhấp vào “OK”. Độ lệch chuẩn có cùng đơn vị đo với chỉ số được phân tích và do đó có thể so sánh được với dữ liệu gốc. Thêm về điều này dưới đây.

Hệ số biến thiên

Tất cả các chỉ số được thảo luận ở trên đều gắn liền với quy mô của dữ liệu nguồn và không cho phép người ta có được ý tưởng tượng hình về sự biến đổi của dân số được phân tích. Để có được thước đo tương đối về độ phân tán dữ liệu, hãy sử dụng hệ số biến thiên, được tính bằng cách chia độ lệch chuẩn TRÊN trung bình số học. Công thức tính hệ số biến thiên rất đơn giản:

Không có hàm tạo sẵn để tính hệ số biến thiên trong Excel, đây không phải là vấn đề lớn. Việc tính toán có thể được thực hiện bằng cách chia độ lệch chuẩn cho giá trị trung bình. Để làm điều này, hãy viết vào thanh công thức:

ĐỘ ĐỘ TIÊU CHUẨN.G()/AVERAGE()

Phạm vi dữ liệu được chỉ định trong ngoặc đơn. Nếu cần, hãy sử dụng độ lệch chuẩn mẫu (STDEV.B).

Hệ số biến thiên thường được biểu thị dưới dạng phần trăm, vì vậy bạn có thể đóng khung một ô bằng công thức ở định dạng phần trăm. Nút bắt buộc nằm trên dải băng trên tab “Trang chủ”:

Bạn cũng có thể thay đổi định dạng bằng cách chọn từ menu ngữ cảnh sau khi đánh dấu ô mong muốn và nhấp chuột phải.

Hệ số biến thiên, không giống như các chỉ báo phân tán giá trị khác, được sử dụng như một chỉ báo độc lập và rất hữu ích về biến thiên dữ liệu. Trong thống kê, người ta thường chấp nhận rằng nếu hệ số biến thiên nhỏ hơn 33% thì tập dữ liệu là đồng nhất, nếu lớn hơn 33% thì tập dữ liệu là không đồng nhất. Thông tin này có thể hữu ích cho việc mô tả sơ bộ dữ liệu và xác định các cơ hội để phân tích sâu hơn. Ngoài ra, hệ số biến thiên, được đo bằng phần trăm, cho phép bạn so sánh mức độ phân tán của các dữ liệu khác nhau, bất kể quy mô và đơn vị đo lường của chúng. Tài sản hữu ích.

Hệ số dao động

Một chỉ báo khác về sự phân tán dữ liệu ngày nay là hệ số dao động. Đây là tỷ lệ của phạm vi biến thiên (chênh lệch giữa giá trị tối đa và tối thiểu) so với mức trung bình. Không có công thức Excel làm sẵn nên bạn sẽ phải kết hợp 3 hàm: MAX, MIN, AVERAGE.

Hệ số dao động cho thấy mức độ biến đổi so với mức trung bình, hệ số này cũng có thể được sử dụng để so sánh các tập dữ liệu khác nhau.

Nhìn chung, sử dụng Excel thì nhiều chỉ tiêu thống kê được tính toán rất đơn giản. Nếu có điều gì đó không rõ ràng, bạn luôn có thể sử dụng hộp tìm kiếm trong phần chèn chức năng. Vâng, Google sẵn sàng trợ giúp.

Một trong những công cụ chính của phân tích thống kê là tính toán độ lệch chuẩn. Chỉ báo này cho phép bạn ước tính độ lệch chuẩn cho một mẫu hoặc cho một tổng thể. Hãy cùng tìm hiểu cách sử dụng công thức độ lệch chuẩn trong Excel.

Hãy xác định ngay độ lệch chuẩn là gì và công thức của nó trông như thế nào. Đại lượng này là căn bậc hai của trung bình số học của bình phương của hiệu giữa tất cả các đại lượng trong chuỗi và trung bình số học của chúng. Có một tên giống hệt cho chỉ báo này - độ lệch chuẩn. Cả hai tên đều hoàn toàn tương đương.

Tuy nhiên, tất nhiên, trong Excel, người dùng không phải tính toán điều này vì chương trình sẽ làm mọi thứ cho anh ta. Hãy cùng tìm hiểu cách tính độ lệch chuẩn trong Excel.

Tính toán trong Excel

Bạn có thể tính giá trị được chỉ định trong Excel bằng hai hàm đặc biệt STDEV.V(dựa trên dân số mẫu) và STDEV.G(dựa trên dân số nói chung). Nguyên lý hoạt động của chúng hoàn toàn giống nhau, nhưng chúng có thể được gọi theo ba cách mà chúng ta sẽ thảo luận dưới đây.

Cách 1: Trình hướng dẫn hàm

Cách 2: Tab Công thức

Cách 3: Nhập công thức thủ công

Ngoài ra còn có một cách mà bạn không cần phải gọi cửa sổ đối số. Để làm điều này, bạn phải nhập công thức theo cách thủ công.

Như các bạn thấy, cơ chế tính độ lệch chuẩn trong Excel rất đơn giản. Người dùng chỉ cần nhập số từ tổng thể hoặc tham chiếu đến các ô chứa chúng. Tất cả các tính toán được thực hiện bởi chính chương trình. Khó hơn nhiều để hiểu chỉ số được tính toán là gì và làm thế nào để áp dụng kết quả tính toán vào thực tế. Nhưng việc hiểu điều này liên quan nhiều đến lĩnh vực thống kê hơn là học cách làm việc với phần mềm.