Phương pháp biểu đồ phân tán và độ chính xác. Các thông số thống kê cơ bản của quần thể mẫu lớn và nhỏ và đặc điểm của chúng Công thức mẫu nhỏ

Khi kiểm soát chất lượng hàng hóa trong nghiên cứu kinh tế, có thể tiến hành thử nghiệm trên cơ sở một mẫu nhỏ.

Dưới mẫu nhỏđề cập đến một cuộc khảo sát thống kê không liên tục trong đó dân số mẫu được hình thành từ một số lượng tương đối nhỏ các đơn vị trong dân số nói chung. Khối lượng của một mẫu nhỏ thường không vượt quá 30 đơn vị và có thể đạt tới 4 - 5 đơn vị.

Sai số trung bình của một mẫu nhỏ được tính bằng công thức:

Ở đâu
- phương sai mẫu nhỏ.

Khi xác định phương sai số bậc tự do là n-1:

Sai số mẫu nhỏ cận biên
được xác định bởi công thức

Trong trường hợp này, giá trị của hệ số tin cậy t không chỉ phụ thuộc vào xác suất tin cậy đã cho mà còn phụ thuộc vào số lượng đơn vị lấy mẫu n. Đối với các giá trị riêng lẻ của t và n, xác suất tin cậy của một mẫu nhỏ được xác định bằng cách sử dụng các bảng Sinh viên đặc biệt (Bảng 9.1.), bảng này đưa ra phân bố độ lệch chuẩn:

Vì khi tiến hành một mẫu nhỏ, giá trị 0,59 hoặc 0,99 trên thực tế được chấp nhận là xác suất tin cậy, sau đó để xác định sai số tối đa của mẫu nhỏ
Các bài đọc phân phối học sinh sau đây được sử dụng:

Các cách khái quát hóa các đặc điểm của mẫu cho tổng thể.

Phương pháp lấy mẫu thường được sử dụng nhiều nhất để thu được các đặc điểm của dân số theo các chỉ tiêu mẫu tương ứng. Tùy thuộc vào mục đích nghiên cứu, việc này được thực hiện bằng cách tính toán lại trực tiếp các chỉ số mẫu cho dân số nói chung hoặc bằng cách tính toán các hệ số hiệu chỉnh.

Phương pháp tính toán lại trực tiếp. Nó bao gồm thực tế là các chỉ số chia sẻ mẫu hoặc trung bình áp dụng cho dân số nói chung, có tính đến lỗi lấy mẫu.

Do đó, trong thương mại, số lượng sản phẩm phi tiêu chuẩn nhận được trong một chuyến hàng được xác định. Để làm điều này (có tính đến mức độ xác suất được chấp nhận), các chỉ số về tỷ lệ sản phẩm không đạt tiêu chuẩn trong mẫu được nhân với số lượng sản phẩm trong toàn bộ lô hàng.

Phương pháp hiệu chỉnh hệ số. Nó được sử dụng trong trường hợp mục đích của phương pháp lấy mẫu là để làm rõ kết quả tính toán liên tục.

Trong thực hành thống kê, phương pháp này được sử dụng để làm rõ dữ liệu từ các cuộc điều tra dân số hàng năm về vật nuôi thuộc sở hữu của người dân. Để làm điều này, sau khi khái quát hóa dữ liệu từ cuộc điều tra dân số hoàn chỉnh, một cuộc khảo sát mẫu 10% được sử dụng để xác định cái gọi là “tỷ lệ phần trăm đếm thiếu”.

Các phương pháp lựa chọn đơn vị từ tổng thể.

Trong thống kê, các phương pháp hình thành quần thể mẫu khác nhau được sử dụng, được xác định bởi mục tiêu nghiên cứu và phụ thuộc vào đặc thù của đối tượng nghiên cứu.

Điều kiện chính để tiến hành khảo sát mẫu là ngăn ngừa xảy ra các lỗi hệ thống phát sinh do vi phạm nguyên tắc cơ hội bình đẳng cho mỗi đơn vị dân số nói chung được đưa vào mẫu. Việc ngăn ngừa các lỗi hệ thống đạt được thông qua việc sử dụng các phương pháp dựa trên cơ sở khoa học để hình thành một quần thể mẫu.

Có các phương pháp sau để chọn các đơn vị từ tổng thể:

1) lựa chọn riêng lẻ - các đơn vị riêng lẻ được chọn cho mẫu;

2) lựa chọn nhóm - mẫu bao gồm các nhóm hoặc loạt đơn vị đồng nhất về mặt chất lượng đang được nghiên cứu;

3) chọn lọc kết hợp là sự kết hợp giữa chọn lọc cá nhân và chọn lọc nhóm.

Phương pháp lựa chọn được xác định bởi các quy tắc hình thành một quần thể mẫu.

Mẫu có thể là:

Đúng ngẫu nhiên;

Cơ khí;

Đặc trưng;

nối tiếp;

Kết hợp.

Lấy mẫu ngẫu nhiên thích hợp thực tế là quần thể mẫu được hình thành do sự lựa chọn ngẫu nhiên (không chủ ý) của các đơn vị riêng lẻ từ tổng thể chung. Trong trường hợp này, số lượng đơn vị được chọn trong tổng thể mẫu thường được xác định dựa trên tỷ lệ mẫu được chấp nhận.

Tỷ lệ mẫu là tỷ lệ giữa số lượng đơn vị trong quần thể mẫu n với số lượng đơn vị trong tổng thể N nói chung, tức là.

Vì vậy, với mẫu 5% từ lô hàng 2.000 đơn vị. cỡ mẫu n là 100 đơn vị. (5*2000:100), và với mẫu 20% sẽ là 400 đơn vị. (20*2000:100), v.v.

Lấy mẫu cơ học thực tế là việc lựa chọn các đơn vị trong quần thể mẫu được thực hiện từ tổng thể chung, được chia thành các khoảng (nhóm) bằng nhau. Trong trường hợp này, kích thước của khoảng trong tổng thể bằng nghịch đảo của tỷ lệ mẫu.

Vì vậy, với mẫu 2%, mỗi đơn vị thứ 50 được chọn (1:0,02), với mẫu 5%, mỗi đơn vị thứ 20 (1:0,05), v.v.

Do đó, theo tỷ lệ chọn lọc được chấp nhận, dân số nói chung được chia một cách máy móc thành các nhóm có quy mô bằng nhau. Từ mỗi nhóm chỉ chọn một đơn vị làm mẫu.

Một đặc điểm quan trọng của lấy mẫu cơ học là việc hình thành một quần thể mẫu có thể được thực hiện mà không cần phải tổng hợp danh sách. Trong thực tế, thứ tự sắp xếp các đơn vị của tổng thể thường được sử dụng. Ví dụ: trình tự xuất thành phẩm từ băng tải hoặc dây chuyền sản xuất, trình tự sắp xếp các đơn vị của một lô hàng trong quá trình bảo quản, vận chuyển, bán hàng, v.v.

Mẫu điển hình. Trong lấy mẫu điển hình, dân số đầu tiên được chia thành các nhóm điển hình đồng nhất. Sau đó, từ mỗi nhóm điển hình, một mẫu hoàn toàn ngẫu nhiên hoặc cơ học được sử dụng để chọn riêng các đơn vị vào quần thể mẫu.

Lấy mẫu mẫu thường được sử dụng khi nghiên cứu các quần thể thống kê phức tạp. Ví dụ, trong một cuộc khảo sát mẫu về năng suất lao động của công nhân thương mại, gồm các nhóm riêng biệt theo trình độ chuyên môn.

Một đặc điểm quan trọng của mẫu điển hình là nó cho kết quả chính xác hơn so với các phương pháp chọn đơn vị khác trong quần thể mẫu.

Để xác định sai số trung bình của một mẫu điển hình, các công thức sau được sử dụng:

lựa chọn lại

lựa chọn lặp lại

Phương sai được xác định bằng các công thức sau:

Tại giai đoạn duy nhất Trong một mẫu, mỗi đơn vị được chọn sẽ được nghiên cứu ngay theo một đặc điểm nhất định. Đây là trường hợp lấy mẫu hoàn toàn ngẫu nhiên và nối tiếp.

Tại nhiều giai đoạn Trong mẫu, các nhóm riêng lẻ được chọn từ tổng thể chung và các đơn vị riêng lẻ được chọn từ các nhóm. Đây là cách một mẫu điển hình được tạo ra bằng phương pháp cơ học để chọn các đơn vị vào quần thể mẫu.

kết hợp lấy mẫu có thể là hai giai đoạn. Trong trường hợp này, dân số đầu tiên được chia thành các nhóm. Sau đó, các nhóm được chọn và trong nhóm sau, các đơn vị riêng lẻ được chọn.

Xử lý dữ liệu thống kê trên máy tính cá nhân và máy tính lớn. Có những chương trình đặc biệt được thiết kế để dạy học sinh, trong đó có giải thích chi tiết về tất cả các quy trình và bài kiểm tra để kiểm tra khả năng thành thạo của học sinh.

Như đã lưu ý, trong trường hợp mẫu nhỏ, cả xác suất tin cậy và giới hạn tin cậy của giá trị trung bình chung chỉ có thể được tính cho tổng thể có phân bố chuẩn.

Đối với các mẫu nhỏ, việc tính toán sai số trung bình có thể xảy ra dựa trên phương sai mẫu, do đó

Các mẫu nhỏ được sử dụng rộng rãi để giải các bài toán liên quan đến việc kiểm định các giả thuyết thống kê, đặc biệt là các giả thuyết về giá trị trung bình.

Ví dụ: đối với một mẫu gồm 32 đơn vị, thu được hệ số tương quan cặp là 0,319. Số bậc tự do của nó là 30, vì việc tính r bao gồm hai đại lượng có giá trị cố định - J và y. Do đó, chúng ta mất hai bậc tự do 32 - 2. Vì giá trị tới hạn của 30 bậc tự do bằng (ở mức ý nghĩa 0,05) đến 0,3494, nên giá trị thu được thấp hơn giá trị tới hạn trong giá trị tuyệt đối. Theo đó, giả thuyết về mối quan hệ của các dấu hiệu chưa được chứng minh một cách đáng tin cậy. Kết luận về việc không có kết nối cũng không chính xác - nó cũng chưa được chứng minh một cách đáng tin cậy. Từ bàn Phụ lục 5 cho thấy rằng với một mẫu nhỏ, chỉ những kết nối chặt chẽ mới có thể được thiết lập một cách đáng tin cậy và với quy mô dân số lớn, ví dụ 102 đơn vị, các kết nối yếu cũng có thể được đo lường một cách đáng tin cậy. Kết luận này rất quan trọng đối với công việc thực tế về phân tích tương quan.

Điều này cho thấy rằng, trung bình, số lượng bệnh nhân thực tế gấp 1,5 lần giá trị dự đoán, nghĩa là mô hình dự báo được sử dụng thường đánh giá thấp số lượng bệnh nhân đến khám. Trong trường hợp này, có thể cần phân tích mô hình được áp dụng và điều chỉnh nó. Lý tưởng nhất là sai số trung bình bằng 0, tức là các giá trị lỗi âm và dương triệt tiêu lẫn nhau. Tuy nhiên, chúng ta phải nói rằng trong ví dụ của chúng ta, giá trị trung bình thu được từ một mẫu rất nhỏ. Cỡ mẫu lớn hơn, chẳng hạn như dữ liệu cả năm, sẽ cho phép chúng ta xác định độ chính xác có thể có của dự báo với mức độ tin cậy cao hơn.

Sai số trung bình và sai số tối đa của một mẫu nhỏ được xác định bằng công thức

Đối với một chuỗi hoàn chỉnh gồm 15 giá trị, việc kiểm tra tiêu chí đồng nhất (Var) Normality cho một tập hợp dữ liệu bị cắt bớt (đối với 7 cửa hàng còn lại) cho thấy cả ba chuỗi giá trị đều bình thường. Tuy nhiên, điều này làm dấy lên nghi ngờ về tính hợp pháp của. sử dụng các thủ tục thống kê trên một mẫu nhỏ như vậy. Tuy nhiên, nếu chúng ta bỏ qua thực tế này thì trong trường hợp này sự phụ thuộc có dạng z = a + b x + b2y sẽ không cung cấp cho nhà phân tích thông tin quan trọng, vì có sự phụ thuộc lẫn nhau mạnh mẽ (đa cộng tuyến). ) giữa các yếu tố xn - điều này được chứng minh bằng giá trị cao của hệ số tương quan cặp (trên mẫu bị cắt cụt z = -0 ,88).

Sau khi biên soạn sơ bộ bảng hỏi, phải tiến hành kiểm tra trên mẫu nhỏ để xác định những sai sót có thể xảy ra. Kiểm tra khác với tìm kiếm sơ bộ. Việc tìm kiếm giúp làm rõ kế hoạch nghiên cứu; khi thử nghiệm, kế hoạch đã phát triển sẽ được thử nghiệm và chi phí thực hiện nó sẽ được đánh giá. Nếu kết quả kiểm tra được coi là đạt yêu cầu, bảng câu hỏi đã hoàn thành sẽ được sử dụng để tiến hành nghiên cứu mẫu thích hợp.

Dựa trên dữ liệu được trình bày, việc đánh giá sự phụ thuộc hồi quy Рк(рп), đã được đề cập ở trên, có thể được trình bày dưới dạng phương trình tương quan, dựa trên bất kỳ dạng kết nối thống kê nào được thiết lập trong toàn bộ khoảng thời gian đã chọn là 26 năm . Việc xây dựng các hồi quy cho khoảng thời gian ngắn hơn sẽ không đáng tin cậy vì kích thước mẫu nhỏ (mẫu nhỏ).

Phân phối độ lệch chuẩn hóa trong một mẫu nhỏ. Giá trị của t cho xác suất nào) = p

Nếu Ek> O thì đường cong đạt đỉnh; đối với Ek, Phương pháp Mô men, theo quy luật, dẫn đến ước tính nhất quán. Tuy nhiên, với mẫu nhỏ, ước tính có thể bị sai lệch đáng kể và không hiệu quả. Phương pháp mômen khá hiệu quả để ước tính các tham số của các biến ngẫu nhiên có phân phối chuẩn.

Trong một số trường hợp, chi phí thực hiện khảo sát được sử dụng làm căn cứ chính để xác định cỡ mẫu. Do đó, ngân sách nghiên cứu tiếp thị cung cấp chi phí thực hiện một số cuộc khảo sát nhất định và không thể vượt quá. Rõ ràng, giá trị của thông tin nhận được không được tính đến. Tuy nhiên, trong một số trường hợp, một mẫu nhỏ có thể cho kết quả khá chính xác.

Nếu dựa trên kết quả của một mẫu nhỏ, có thể kết luận rõ ràng rằng lô đó phù hợp hoặc ngược lại, không phù hợp, thì việc kiểm soát chất lượng tốn rất ít chi phí. Nếu mẫu đầu tiên không đưa ra câu trả lời rõ ràng, bạn có thể lấy mẫu khác - một mẫu mẫu lớn hơn sẽ cho kết quả chính xác hơn. Nguyên tắc điều khiển có thể như sau

Dựa trên giả định rằng tổng thể mà mẫu được nghiên cứu được lấy có đường cong phân bố trơn tru, điều tự nhiên là cho rằng các điểm thấp và ngoại lệ xuất hiện trong quá trình phân nhóm là “nhiễu” ngẫu nhiên được tạo ra bởi tính ngẫu nhiên của các giá trị nhất định rơi vào một mẫu nhỏ. Việc tăng cường các khoảng thời gian nhóm là một phương pháp lọc ra “nhiễu” ngẫu nhiên này. Tuy nhiên, khi các khoảng thời gian quá dài, không còn “nhiễu” được “lọc” nữa mà chính “tín hiệu”, tức là các đặc điểm của luật phân phối mong muốn bắt đầu được làm mịn đi.

Đối với từng loại và loại tài liệu đã nêu, các bản sao của chúng được thu thập bằng cách tạo một bản sao bổ sung khi chuẩn bị tài liệu tương ứng trên máy viết hoặc máy tính. Trong mẫu nhỏ thu thập được có khoảng 30 bản tài liệu cho từng loài, giống, bao gồm các nội dung chính

Cách xử lý các mẫu nhỏ

Do đó, khoảng tin cậy hai phía cho một mẫu nhỏ sẽ được biểu diễn như sau:

Gốc rễ của những khó khăn của chúng tôi nằm ở việc lấy mẫu. Như Leibniz đã từng nhắc nhở Bernoulli, thiên nhiên rất đa dạng và phức tạp đến mức chúng ta khó có thể rút ra kết luận chính xác từ những gì chúng ta quan sát được. Chúng ta chỉ tiếp cận được những mảnh vụn của thực tế và điều này dẫn chúng ta đến những kết luận sai lầm, hoặc chúng ta giải thích những mẫu nhỏ là sự phản ánh đầy đủ các đặc điểm của dân số lớn hơn.

Chất lượng của các tiêu chuẩn tiến bộ đang có hiệu lực tại doanh nghiệp được đặc trưng bởi mức độ cường độ của chúng. Sự phân tán số lượng công nhân theo năng suất lao động cá nhân thường gần với cái gọi là phân phối chuẩn và lệch gần như đối xứng (với một số điểm bất đối xứng ở bên phải) theo cả hai hướng so với mức hiệu suất trung bình của họ. Hơn nữa, với sự gia tăng số lượng công nhân, những sai lệch về năng suất lao động cá nhân so với mức trung bình ngày càng được bù đắp và hoàn trả. Dựa trên công thức tính sai số lấy mẫu tối đa, chúng ta có thể khẳng định một cách chắc chắn rằng nếu độ lệch tối đa của năng suất lao động cá nhân của từng người lao động so với mức trung bình của ngành không vượt quá M% thì theo lý thuyết xác suất, giới hạn độ lệch của năng suất lao động trung bình của n công nhân được chọn ngẫu nhiên từ mức trung bình sẽ bằng M/n % hoặc được điều chỉnh cho một mẫu nhỏ từ tổng thể N lớn

Lý do cuối cùng đôi khi có thể được loại bỏ bằng cách đưa ra những điều chỉnh phù hợp. Do đó, để ước tính khoảng sai số trên một phân bố chuẩn (n) nhỏ (xem trang 50), các phân vị của phân bố thống kê của Học sinh (Bảng 6), đặc trưng của một mẫu nhỏ từ một quần thể bình thường (không biết m và a), được sử dụng.

Một cái nhìn hời hợt về vấn đề, các mẫu nhỏ để nghiên cứu, khi các bộ phận riêng lẻ thay thế toàn bộ vấn đề.

Tuy nhiên, cách tính yt, xt dẫn đến mất đi quan sát đầu tiên (nếu ta không có quan sát trước đó). Số bậc tự do sẽ giảm đi một, điều này không đáng kể đối với các mẫu lớn, nhưng đối với các mẫu nhỏ, nó có thể dẫn đến giảm hiệu quả. Vấn đề này thường được khắc phục bằng cách sử dụng hiệu chỉnh Price-Vynosen

Để ước tính một mẫu nhỏ, độ lệch chuẩn đã hiệu chỉnh của mẫu nhỏ và định luật phân bố xác suất của Sinh viên được sử dụng.

Lý thuyết về các mẫu nhỏ được phát triển bởi nhà thống kê người Anh W. Gosset (người viết dưới bút danh Sinh viên) vào đầu thế kỷ 20. Năm 1908, ông đã xây dựng một phân bố đặc biệt cho phép tương quan giữa / và xác suất tin cậy F(t) ngay cả với các mẫu nhỏ. Với n > 100, bảng phân phối Sinh viên cho kết quả tương tự như bảng tích phân xác suất Laplace, ở mức 30

Kiểm tra khả năng là không thiên vị và nhất quán; đối với các mẫu lớn, -2-log X có phân bố bình phương cao với r

6. Các loại nhóm thống kê, ý nghĩa nhận thức của chúng.

7.Bảng thống kê: các loại, quy tắc xây dựng, kỹ thuật đọc

8. Đại lượng tuyệt đối: chủng loại, ý nghĩa nhận thức. Điều kiện sử dụng khoa học các chỉ tiêu tuyệt đối và tương đối.

9. Giá trị trung bình: nội dung, chủng loại, chủng loại, điều kiện khoa học áp dụng.

11. Thuộc tính phân tán. Quy tắc cộng (phân tách) phương sai và cách sử dụng nó trong phân tích thống kê.

12. Các loại biểu đồ thống kê theo nội dung bài toán cần giải quyết và cách xây dựng.

13. Chuỗi động lực học: chủng loại, chỉ số phân tích.

14. Phương pháp xác định xu hướng chuỗi thời gian.

15. Chỉ số: định nghĩa, thành phần chính của chỉ số, bài toán giải bằng chỉ số, hệ thống chỉ số trong thống kê.

16. Nguyên tắc xây dựng các chỉ số động, lãnh thổ.

17. Cơ sở lý luận về phương pháp lấy mẫu.

18. Lý thuyết mẫu nhỏ.

19. Phương pháp lựa chọn đơn vị trong quần thể mẫu.

20.Các loại kết nối, phương pháp thống kê để phân tích mối quan hệ, khái niệm về tương quan.

21. Nội dung phân tích tương quan, mô hình tương quan.

22.Đánh giá độ bền (mức độ gần gũi) của mối liên hệ tương quan.

23. Hệ thống chỉ tiêu thống kê kinh tế - xã hội.

24. Các nhóm, phân loại cơ bản trong thống kê kinh tế - xã hội.

25. Của cải quốc gia: nội dung và thành phần thể loại.

26. Nội dung địa chính đất đai. Các chỉ tiêu về thành phần đất đai theo loại hình sở hữu, mục đích sử dụng và loại đất.

27. Phân loại tài sản cố định, phương pháp đánh giá, đánh giá lại, chỉ tiêu di chuyển, tình trạng, mục đích sử dụng.

28. Mục tiêu của thống kê lao động. Khái niệm và nội dung của các loại hình chính của thị trường lao động.

29. Thống kê việc sử dụng lao động và thời gian làm việc.

30. Các chỉ tiêu năng suất lao động và phương pháp phân tích.

31. Các chỉ tiêu về sản lượng cây trồng và sản lượng nông nghiệp. Cây trồng và đất đai.

32. Các chỉ tiêu về chăn nuôi và năng suất vật nuôi trang trại.

33. Thống kê chi phí công và chi phí sản xuất.

34. Thống kê tiền lương, chi phí nhân công.

35. Thống kê tổng sản lượng và thu nhập.

36. Các chỉ số về lưu chuyển và tiêu thụ nông sản.

37. Nhiệm vụ phân tích thống kê của doanh nghiệp nông nghiệp.

38. Thống kê giá cả, hàng hóa các ngành của nền kinh tế quốc dân: nhiệm vụ và phương pháp phân tích.

39. Thống kê thị trường hàng hóa, dịch vụ.

40. Thống kê các chỉ tiêu sản xuất xã hội.

41. Phân tích thống kê giá cả thị trường tiêu dùng.

42. Thống kê lạm phát và các chỉ số đánh giá chính.

43. Nhiệm vụ thống kê tài chính của doanh nghiệp.

44. Các chỉ tiêu chủ yếu về kết quả tài chính của doanh nghiệp.

45. Nhiệm vụ thống kê ngân sách nhà nước.

46. Hệ thống chỉ tiêu thống kê ngân sách nhà nước.

47. Hệ thống chỉ tiêu thống kê lưu thông tiền tệ.

48. Thống kê thành phần và cơ cấu cung tiền trong nước.

49. Nhiệm vụ chủ yếu của thống kê ngân hàng.

50. Các chỉ tiêu chính của thống kê ngân hàng.

51. Khái niệm và phân loại tín dụng. Mục tiêu nghiên cứu thống kê của nó.

52.Hệ thống chỉ tiêu thống kê tín dụng.

53. Các chỉ tiêu và phương pháp phân tích chủ yếu về kinh doanh tiết kiệm.

54. Nhiệm vụ thống kê thị trường chứng khoán và chứng khoán.

56. Thống kê các sàn giao dịch hàng hóa: mục tiêu và hệ thống chỉ tiêu.

57. Hệ thống tài khoản quốc gia: khái niệm, các hạng mục chính và phân loại.

58. Nguyên tắc cơ bản xây dựng snc.

59. Các chỉ tiêu kinh tế vĩ mô cơ bản – nội dung, phương pháp xác định.

60. Cân bằng giữa các ngành: khái niệm, nhiệm vụ, loại đám đông.

62. Thống kê thu nhập và chi tiêu của dân cư

18. Lý thuyết mẫu nhỏ.

Với số lượng lớn các đơn vị trong quần thể mẫu (n>100), sự phân bố sai số ngẫu nhiên của trung bình mẫu theo định lý A.M. Lyapunov là chuẩn hoặc gần chuẩn khi số lượng quan sát tăng lên.

Tuy nhiên, trong thực tiễn nghiên cứu thống kê trong nền kinh tế thị trường, người ta ngày càng phải xử lý các mẫu nhỏ.

Mẫu nhỏ là một quan sát mẫu có số lượng đơn vị không vượt quá 30.

Khi đánh giá kết quả của một mẫu nhỏ, quy mô dân số không được sử dụng. Để xác định giới hạn lỗi có thể xảy ra, bài kiểm tra của Học sinh được sử dụng.

Giá trị của σ được tính toán dựa trên dữ liệu quan sát mẫu.

Giá trị này chỉ được sử dụng cho dân số đang được nghiên cứu chứ không phải là ước tính gần đúng của σ trong dân số.

Đánh giá xác suất của kết quả của một mẫu nhỏ khác với đánh giá trong một mẫu lớn ở chỗ với số lượng quan sát nhỏ, phân bố xác suất cho giá trị trung bình phụ thuộc vào số lượng đơn vị được chọn.

Tuy nhiên, đối với một mẫu nhỏ, giá trị của hệ số tin cậy t có liên quan đến đánh giá xác suất khác với mẫu lớn (vì luật phân phối khác với bình thường).

Theo luật phân phối do Sinh viên thiết lập, sai số phân phối có thể xảy ra phụ thuộc cả vào giá trị của hệ số tin cậy t và cỡ mẫu B.

Sai số trung bình của một mẫu nhỏ được tính bằng công thức:

phương sai mẫu nhỏ ở đâu.

Trong MV, hệ số n/(n-1) phải được tính đến và phải điều chỉnh. Khi xác định độ phân tán S2, số bậc tự do bằng:

Sai số biên của một mẫu nhỏ được xác định theo công thức

Đánh giá xác suất của kết quả MV khác với đánh giá ở BB ở chỗ với số lượng quan sát nhỏ, phân bố xác suất cho giá trị trung bình phụ thuộc vào số lượng đơn vị được chọn

19. Phương pháp lựa chọn đơn vị trong quần thể mẫu.

1. Quần thể mẫu phải có kích thước đủ lớn.

2. Cấu trúc của tổng thể mẫu phải phản ánh tốt nhất cấu trúc của tổng thể chung

3. Phương pháp lựa chọn phải ngẫu nhiên

Tùy thuộc vào việc các đơn vị được chọn có tham gia vào mẫu hay không, sẽ có sự khác biệt giữa phương pháp không lặp lại và phương pháp lặp lại.

Lựa chọn không lặp lại là lựa chọn trong đó một đơn vị có trong mẫu không quay trở lại quần thể mà từ đó việc lựa chọn tiếp theo được thực hiện.

Tính sai số trung bình của mẫu ngẫu nhiên không lặp lại:

Tính toán sai số tối đa của mẫu ngẫu nhiên không lặp lại:

Trong trường hợp chọn lọc lặp lại, đơn vị có trong mẫu sau khi ghi lại các đặc điểm quan sát được sẽ được trả về quần thể ban đầu (chung) để tham gia vào quy trình chọn lọc tiếp theo.

Sai số trung bình của việc lấy mẫu ngẫu nhiên đơn giản lặp lại được tính như sau:

Tính toán sai số tối đa của việc lấy mẫu ngẫu nhiên lặp lại:

Kiểu hình thành của quần thể mẫu được chia thành cá nhân, nhóm và kết hợp.

Phương pháp lựa chọn - xác định cơ chế cụ thể để lựa chọn các đơn vị từ tổng thể và được chia thành: thực tế - ngẫu nhiên; cơ khí; đặc trưng; nối tiếp; kết hợp.

Thật ra - ngẫu nhiên Phương pháp lựa chọn phổ biến nhất trong một mẫu ngẫu nhiên, nó còn được gọi là phương pháp xổ số, trong đó một vé có số sê-ri được chuẩn bị cho từng đơn vị của tổng thể thống kê. Tiếp theo, số lượng đơn vị cần thiết của tổng thể thống kê được chọn ngẫu nhiên. Trong những điều kiện này, mỗi người trong số họ có cùng xác suất được đưa vào mẫu.

Lấy mẫu cơ học. Nó được sử dụng trong trường hợp tổng thể được sắp xếp theo một cách nào đó, tức là có một trình tự nhất định trong việc sắp xếp các đơn vị.

Để xác định sai số trung bình của lấy mẫu cơ học, công thức tính sai số trung bình trong lấy mẫu ngẫu nhiên không lặp lại thực tế được sử dụng.

Lựa chọn điển hình. Nó được sử dụng khi tất cả các đơn vị trong tổng thể nói chung có thể được chia thành nhiều nhóm điển hình. Lựa chọn điển hình bao gồm việc lựa chọn các đơn vị từ mỗi nhóm theo cách hoàn toàn ngẫu nhiên hoặc máy móc.

Đối với một mẫu điển hình, sai số chuẩn phụ thuộc vào độ chính xác của phương tiện nhóm. Do đó, trong công thức tính sai số tối đa của một mẫu điển hình, giá trị trung bình của phương sai nhóm được tính đến, tức là.

Lựa chọn nối tiếp. Nó được sử dụng trong trường hợp các đơn vị dân số được kết hợp thành các nhóm nhỏ hoặc chuỗi. Bản chất của việc lấy mẫu nối tiếp nằm ở việc lựa chọn ngẫu nhiên hoặc cơ học thực tế các chuỗi, trong đó việc kiểm tra liên tục các đơn vị được thực hiện.

Với lấy mẫu nối tiếp, mức độ sai số lấy mẫu không phụ thuộc vào số lượng đơn vị được nghiên cứu mà phụ thuộc vào số lượng (các) chuỗi được kiểm tra và mức độ phân tán giữa các nhóm:

Lựa chọn kết hợp có thể trải qua một hoặc nhiều giai đoạn. Một mẫu được gọi là một giai đoạn nếu một khi các đơn vị dân số được chọn được nghiên cứu.

Mẫu được gọi là nhiều giai đoạn, nếu việc chọn lọc quần thể diễn ra theo từng giai đoạn, các giai đoạn kế tiếp nhau và mỗi giai đoạn, giai đoạn chọn lọc có đơn vị chọn lọc riêng.

Phương pháp mẫu nhỏ

Ưu điểm chính của phương pháp mẫu nhỏ là khả năng đánh giá động thái của quá trình theo thời gian, giảm thời gian cho các thủ tục tính toán.

Các mẫu tức thời được chọn ngẫu nhiên trong khoảng thời gian nhất định từ 5 đến 20 đơn vị. Khoảng thời gian lấy mẫu được thiết lập theo kinh nghiệm và phụ thuộc vào tính ổn định của quá trình, được xác định bằng cách phân tích thông tin tiên nghiệm.

Đối với mỗi mẫu tức thời, các đặc tính thống kê chính được xác định. Các mẫu tức thời và các đặc tính thống kê chính của chúng được trình bày trong Phụ lục B.

Giả thuyết về tính đồng nhất của quá trình phân tán mẫu được đưa ra và kiểm tra bằng cách sử dụng một trong các tiêu chí có thể (tiêu chí Fisher).

Kiểm định giả thuyết về tính đồng nhất của các đặc tính mẫu.

Để kiểm tra ý nghĩa của sự khác biệt giữa các trung bình số học trong 2 dãy đo, độ đo G được đưa ra trong Phụ lục B.

Nguyên tắc quyết định được xây dựng như sau:

trong đó tr là giá trị của phân vị của phân bố chuẩn hóa tại một xác suất tin cậy P cho trước, ? = 0,095, n = 10, tр =2,78.

Khi bất đẳng thức được thỏa mãn, giả thuyết được khẳng định rằng sự khác biệt giữa các trung bình mẫu là không đáng kể.

Vì bất đẳng thức được thỏa mãn trong mọi trường hợp nên giả thuyết cho rằng sự khác biệt giữa các giá trị trung bình của mẫu là không đáng kể được xác nhận.

Để kiểm định giả thuyết về tính đồng nhất của phương sai mẫu, thước đo F0 được đưa vào là tỷ số ước lượng không chệch của phương sai của kết quả của 2 loạt phép đo. Hơn nữa, ước lượng lớn hơn trong 2 ước lượng được lấy làm tử số và nếu Sx1>Sx2 thì

Kết quả tính toán được nêu tại Phụ lục B.

Sau đó, các giá trị của xác suất tin cậy P được chỉ định và các giá trị của F(K1; K2; ?/2) được xác định với K1 = n1 - 1 và K2 = n2 - 1.

Với P = 0,025 và K1 = 10-1 = 4 và K2 = 10-1 = 4 F (9;9;0,025/2) =4,1.

Nguyên tắc quyết định: nếu F(K1; K2; ?/2)>F0 thì chấp nhận giả thuyết về tính đồng nhất của phương sai trong hai mẫu.

Vì điều kiện F(K1; K2; ?/2) > F0 được thỏa mãn trong mọi trường hợp nên giả thuyết về tính đồng nhất của phương sai được chấp nhận.

Như vậy, giả thuyết về tính đồng nhất của phương sai mẫu được khẳng định, điều này cho thấy tính ổn định của quá trình; Giả thuyết về tính đồng nhất của các trung bình mẫu sử dụng phương pháp so sánh các trung bình được khẳng định, điều này có nghĩa là tâm phân tán không thay đổi và quá trình ở trạng thái ổn định.

Phương pháp vẽ biểu đồ phân tán và độ chính xác

Trong một khoảng thời gian nhất định, lấy ngay 3 đến 10 mẫu sản phẩm và xác định các đặc tính thống kê của từng mẫu.

Số liệu thu được được vẽ trên đồ thị theo thời gian trên trục hoành? hoặc số k của mẫu và trên trục tọa độ - các giá trị riêng lẻ của xk hoặc giá trị của một trong các đặc tính thống kê (trung bình số học mẫu, độ lệch chuẩn mẫu). Ngoài ra, hai đường ngang Тв và Тн được vẽ trên sơ đồ, giới hạn phạm vi dung sai của sản phẩm.

Các mẫu tức thời được nêu trong Phụ lục B.

Biểu đồ độ chính xác của Hình 1

Sơ đồ thể hiện rõ ràng tiến độ của quá trình sản xuất. Nó có thể được sử dụng để chỉ ra rằng quá trình sản xuất không ổn định

Ngoài mẫu ngẫu nhiên thực tế có cơ sở xác suất rõ ràng, còn có các mẫu khác không hoàn toàn ngẫu nhiên nhưng được sử dụng rộng rãi. Cần lưu ý rằng việc áp dụng nghiêm ngặt việc lựa chọn các đơn vị hoàn toàn ngẫu nhiên từ tổng thể không phải lúc nào cũng có thể thực hiện được trong thực tế. Các mẫu này bao gồm lấy mẫu cơ học, lấy mẫu điển hình, nối tiếp (hoặc lồng nhau), nhiều pha và một số mẫu khác.

Rất hiếm khi một quần thể đồng nhất; đây là ngoại lệ chứ không phải là quy luật. Do đó, khi có nhiều loại hiện tượng khác nhau trong tổng thể, người ta thường mong muốn đảm bảo sự thể hiện đồng đều hơn của các loại hiện tượng khác nhau trong mẫu. Mục tiêu này đạt được thành công bằng cách sử dụng mẫu điển hình. Khó khăn chính là chúng ta phải có thêm thông tin về toàn bộ dân số, điều này rất khó khăn trong một số trường hợp.

Mẫu điển hình còn được gọi là mẫu phân tầng hoặc mẫu phân tầng; nó cũng được sử dụng với mục đích thể hiện thống nhất hơn các vùng khác nhau trong mẫu và trong trường hợp này mẫu được gọi là khu vực hóa.

Vì vậy iốt đặc trưng Mẫu được hiểu là mẫu trong đó dân số nói chung được chia thành các nhóm nhỏ điển hình được hình thành theo một hoặc nhiều đặc điểm cơ bản (ví dụ: dân số được chia thành 3-4 nhóm nhỏ theo thu nhập bình quân đầu người hoặc trình độ học vấn - tiểu học). , trung học, cao hơn, v.v.). Tiếp theo, từ tất cả các nhóm điển hình, bạn có thể chọn đơn vị cho mẫu theo nhiều cách, tạo thành:

a) mẫu điển hình có vị trí đồng nhất, trong đó số lượng đơn vị bằng nhau được chọn từ các loại (lớp) khác nhau. Sơ đồ này hoạt động tốt nếu trong dân số, các lớp (loại) không khác nhau nhiều về số lượng đơn vị;
b) lấy mẫu điển hình với việc bố trí theo tỷ lệ, khi yêu cầu (ngược lại với việc bố trí đồng nhất) tỷ lệ (%) chọn cho tất cả các tầng phải giống nhau (ví dụ: 5 hoặc 10%);
c) một mẫu điển hình với vị trí tối ưu, khi tính đến mức độ biến đổi của các đặc điểm trong các nhóm khác nhau của tổng thể. Với vị trí này, tỷ lệ chọn lọc các nhóm có tính biến đổi lớn sẽ tăng lên, điều này cuối cùng dẫn đến giảm sai số ngẫu nhiên.

Công thức tính sai số trung bình trong một lựa chọn điển hình tương tự như sai số lấy mẫu thông thường đối với một mẫu hoàn toàn ngẫu nhiên, với điểm khác biệt duy nhất là thay vì tổng phương sai, người ta nhập trung bình của các phương sai cụ thể trong nhóm, điều này dẫn đến một cách tự nhiên. giảm sai số so với mẫu hoàn toàn ngẫu nhiên. Tuy nhiên, không phải lúc nào cũng có thể sử dụng được (vì nhiều lý do). Nếu không cần độ chính xác cao thì sử dụng lấy mẫu nối tiếp sẽ dễ dàng và rẻ hơn.

nối tiếp Lấy mẫu (cụm) bao gồm thực tế là không phải các đơn vị tổng thể (ví dụ: sinh viên) mà là các chuỗi riêng lẻ hoặc tổ (ví dụ: nhóm nghiên cứu) được chọn cho mẫu. Nói cách khác, với lấy mẫu nối tiếp (cụm), đơn vị quan sát và đơn vị lấy mẫu không trùng nhau: một số nhóm đơn vị (tổ) liền kề nhau được chọn và các đơn vị có trong các tổ này sẽ được kiểm tra. Vì vậy, ví dụ, trong một cuộc khảo sát mẫu về điều kiện nhà ở, chúng ta có thể chọn ngẫu nhiên một số hộ gia đình (đơn vị mẫu) nhất định và sau đó tìm hiểu điều kiện sống của các gia đình sống trong những ngôi nhà này (đơn vị quan sát).

Chuỗi (tổ) bao gồm các đơn vị được kết nối với nhau về mặt lãnh thổ (huyện, thành phố, v.v.), về mặt tổ chức (doanh nghiệp, xưởng, v.v.) hoặc theo thời gian (ví dụ: một tập hợp các đơn vị sản phẩm được sản xuất trong một khoảng thời gian nhất định ).

Lựa chọn nối tiếp có thể được tổ chức dưới hình thức lựa chọn một giai đoạn, hai giai đoạn hoặc nhiều giai đoạn.

Loạt lựa chọn ngẫu nhiên được nghiên cứu liên tục. Do đó, lấy mẫu nối tiếp bao gồm hai giai đoạn chọn ngẫu nhiên các chuỗi và nghiên cứu liên tục các chuỗi này. Lựa chọn nối tiếp giúp tiết kiệm đáng kể nhân lực và tài nguyên và do đó thường được sử dụng trong thực tế. Lỗi lựa chọn nối tiếp khác với lỗi chọn đá quý ngẫu nhiên thực tế, ở chỗ thay vì giá trị của tổng phương sai, phương sai xen kẽ (giữa các nhóm) được sử dụng và thay vì khối lượng mẫu, số chuỗi được sử dụng. Độ chính xác thường không cao lắm nhưng trong một số trường hợp có thể chấp nhận được. Một mẫu nối tiếp có thể được lặp lại hoặc không lặp lại và các chuỗi có thể có kích thước bằng nhau hoặc không bằng nhau.

Lấy mẫu nối tiếp có thể được tổ chức theo các sơ đồ khác nhau. Ví dụ: bạn có thể hình thành một quần thể mẫu theo hai giai đoạn: đầu tiên, các chuỗi cần khảo sát được chọn theo thứ tự ngẫu nhiên, sau đó từ mỗi chuỗi đã chọn, một số đơn vị nhất định cũng được chọn theo thứ tự ngẫu nhiên để được quan sát trực tiếp (đo lường, cân nhắc). , vân vân.). Sai số của mẫu như vậy sẽ phụ thuộc vào sai số của việc lựa chọn nối tiếp và sai số của việc lựa chọn riêng lẻ, tức là. Theo quy luật, lựa chọn nhiều giai đoạn cho kết quả kém chính xác hơn so với lựa chọn một giai đoạn, điều này được giải thích là do xảy ra lỗi về tính đại diện ở mỗi giai đoạn lấy mẫu. Trong trường hợp này, bạn cần sử dụng công thức sai số lấy mẫu để lấy mẫu kết hợp.

Một hình thức lựa chọn khác là lựa chọn nhiều giai đoạn (1, 2, 3 giai đoạn hoặc giai đoạn). Lựa chọn này khác về cấu trúc so với lựa chọn nhiều giai đoạn, vì trong lựa chọn nhiều giai đoạn, các đơn vị lựa chọn giống nhau được sử dụng trong mỗi giai đoạn. Sai số trong lấy mẫu nhiều pha được tính riêng cho từng pha. Đặc điểm chính của mẫu hai pha là các mẫu khác nhau theo ba tiêu chí tùy thuộc vào: 1) tỷ lệ các đơn vị được nghiên cứu trong giai đoạn đầu của mẫu và lại được đưa vào giai đoạn thứ hai và các giai đoạn tiếp theo; 2) từ việc duy trì cơ hội bình đẳng cho mỗi đơn vị mẫu của giai đoạn đầu trở thành đối tượng nghiên cứu; 3) về kích thước của khoảng cách giữa các pha với nhau.

Chúng ta hãy tập trung vào một loại lựa chọn nữa, cụ thể là cơ khí(hoặc có tính hệ thống). Lựa chọn này có lẽ là phổ biến nhất. Điều này rõ ràng được giải thích bởi thực tế là trong tất cả các kỹ thuật lựa chọn, kỹ thuật này là đơn giản nhất. Đặc biệt, nó đơn giản hơn nhiều so với lựa chọn ngẫu nhiên, đòi hỏi khả năng sử dụng bảng số ngẫu nhiên và không yêu cầu thêm thông tin về dân số và cấu trúc của nó. Ngoài ra, lựa chọn cơ học có mối liên hệ chặt chẽ với lựa chọn phân tầng theo tỷ lệ, dẫn đến giảm sai số lấy mẫu.

Ví dụ, việc sử dụng phương pháp lựa chọn cơ học các thành viên của hợp tác xã nhà ở từ danh sách được tổng hợp theo thứ tự kết nạp vào hợp tác xã này sẽ đảm bảo sự đại diện tỷ lệ của các thành viên hợp tác xã có kinh nghiệm lâu năm khác nhau. Sử dụng cùng một kỹ thuật để chọn người trả lời từ danh sách các cá nhân theo thứ tự bảng chữ cái sẽ đảm bảo cơ hội bình đẳng cho các họ bắt đầu bằng các chữ cái khác nhau, v.v. Việc sử dụng bảng chấm công hoặc các danh sách khác trong doanh nghiệp, cơ sở giáo dục, v.v. có thể đảm bảo tính cân xứng cần thiết trong việc đại diện cho những người lao động có thâm niên kinh nghiệm khác nhau. Lưu ý rằng lựa chọn máy móc được sử dụng rộng rãi trong xã hội học, trong nghiên cứu dư luận xã hội, v.v.

Để giảm mức độ sai sót và đặc biệt là chi phí khi tiến hành nghiên cứu lấy mẫu, nhiều sự kết hợp khác nhau của từng loại lựa chọn riêng lẻ (cơ học, nối tiếp, riêng lẻ, nhiều pha, v.v.) được sử dụng rộng rãi. Trong những trường hợp như vậy, cần tính toán các sai số lấy mẫu phức tạp hơn, bao gồm các sai số xảy ra ở các giai đoạn khác nhau của nghiên cứu.

Mẫu nhỏ là tập hợp các đơn vị nhỏ hơn 30. Mẫu nhỏ xuất hiện khá thường xuyên trong thực tế. Ví dụ: số bệnh hiếm gặp hoặc số đơn vị mang đặc điểm hiếm gặp; Ngoài ra, một mẫu nhỏ sẽ được sử dụng khi nghiên cứu tốn kém hoặc nghiên cứu liên quan đến việc tiêu hủy sản phẩm hoặc mẫu. Mẫu nhỏ được sử dụng rộng rãi trong lĩnh vực khảo sát chất lượng sản phẩm. Cơ sở lý thuyết để xác định sai số mẫu nhỏ được đặt ra bởi nhà khoa học người Anh W. Gosset (bút danh Sinh viên).

Cần phải nhớ rằng khi xác định sai số cho một mẫu nhỏ, thay vì cỡ mẫu, bạn nên lấy giá trị (P- 1) hoặc trước khi xác định sai số lấy mẫu trung bình, hãy tính cái gọi là phương sai mẫu đã hiệu chỉnh (bằng mẫu số thay cho N nên được đặt (P- 1)). Lưu ý rằng việc hiệu chỉnh như vậy chỉ được thực hiện một lần - khi tính toán phương sai mẫu hoặc khi xác định sai số. Kích cỡ (P- 1) được gọi là bậc tự do. Ngoài ra, phân phối chuẩn được thay thế bằng phân phối ^ (Phân phối sinh viên), được lập bảng và phụ thuộc vào số bậc tự do. Tham số duy nhất của phân phối Sinh viên là giá trị (P - 1). Chúng tôi xin nhấn mạnh một lần nữa rằng việc sửa đổi (P- 1) quan trọng và có ý nghĩa chỉ đối với quần thể mẫu nhỏ nhưng lớn; Tại yi > 30 trở lên, sự khác biệt biến mất, tiến gần đến 0.

Cho đến nay chúng ta đã nói về các mẫu ngẫu nhiên, tức là chẳng hạn như khi việc lựa chọn các đơn vị từ tổng thể là ngẫu nhiên (hoặc gần như ngẫu nhiên) và tất cả các đơn vị đều có xác suất được đưa vào mẫu bằng nhau (hoặc gần như bằng nhau). Tuy nhiên, việc lựa chọn các đơn vị có thể dựa trên nguyên tắc lựa chọn không ngẫu nhiên, trong đó nguyên tắc tiếp cận và tính mục đích được đặt lên hàng đầu. Trong những trường hợp như vậy, không thể nói về tính đại diện của mẫu thu được và việc tính toán sai số về tính đại diện chỉ có thể được thực hiện với thông tin về tổng thể nói chung.

Có một số phương án đã biết để hình thành mẫu không ngẫu nhiên, đã trở nên phổ biến và được sử dụng chủ yếu trong nghiên cứu xã hội học: lựa chọn các đơn vị quan sát có sẵn, lựa chọn theo phương pháp Nuremberg, lấy mẫu có mục tiêu khi xác định các chuyên gia, v.v. được nhà nghiên cứu hình thành từ một số lượng nhỏ, cũng là những thông số quan trọng và mang lại sự trùng khớp rất gần với dân số nói chung. Nói cách khác, việc lựa chọn hạn ngạch phải cung cấp cho nhà nghiên cứu sự trùng hợp gần như hoàn toàn giữa mẫu và tổng thể chung theo các thông số mà anh ta đã chọn. Theo quy định, đạt được mục đích về sự gần gũi của hai quần thể nhưng trong một phạm vi giới hạn các chỉ số, bằng cách sử dụng mẫu có kích thước nhỏ hơn đáng kể so với khi sử dụng lựa chọn ngẫu nhiên. Chính hoàn cảnh này khiến cho việc lựa chọn hạn ngạch trở nên hấp dẫn đối với những nhà nghiên cứu không có cơ hội tập trung vào một mẫu ngẫu nhiên có quy mô lớn tự cân nhắc. Cần nói thêm rằng việc giảm cỡ mẫu thường đi kèm với việc giảm chi phí tiền tệ và thời gian nghiên cứu, điều này làm tăng thêm ưu điểm của phương pháp lựa chọn này. Chúng ta cũng hãy lưu ý rằng với việc lấy mẫu hạn ngạch, có thông tin sơ bộ khá quan trọng về cơ cấu dân số. Ưu điểm chính ở đây là cỡ mẫu nhỏ hơn đáng kể so với lấy mẫu ngẫu nhiên. Các đặc điểm được lựa chọn (thường là nhân khẩu học xã hội - giới tính, tuổi tác, trình độ học vấn) phải tương quan chặt chẽ với các đặc điểm được nghiên cứu của dân số nói chung, tức là. đối tượng nghiên cứu.

Như đã chỉ ra, phương pháp lấy mẫu giúp có thể thu được thông tin về dân số nói chung với ít tiền, thời gian và công sức hơn nhiều so với quan sát liên tục. Cũng rõ ràng rằng không thể thực hiện được một nghiên cứu đầy đủ về toàn bộ dân số trong một số trường hợp, chẳng hạn như khi kiểm tra chất lượng sản phẩm có mẫu bị tiêu hủy.

Tuy nhiên, đồng thời cũng cần chỉ ra rằng dân số không phải là một “hộp đen” hoàn toàn và chúng ta vẫn có một số thông tin về nó. Ví dụ, tiến hành một nghiên cứu mẫu liên quan đến cuộc sống, cuộc sống hàng ngày, tình trạng tài sản, thu nhập và chi phí của sinh viên, ý kiến, sở thích của họ, v.v., chúng tôi vẫn có thông tin về tổng số, phân nhóm theo giới tính, độ tuổi, tình trạng hôn nhân, nơi cư trú, khóa học và các đặc điểm khác. Thông tin này luôn được sử dụng trong nghiên cứu mẫu.

Có một số kiểu phân bố các đặc điểm của mẫu cho tổng thể chung: phương pháp tính toán lại trực tiếp và phương pháp hiệu chỉnh hệ số. Việc tính toán lại các đặc tính của mẫu được thực hiện, theo quy luật, có tính đến các khoảng tin cậy và có thể được biểu thị bằng giá trị tuyệt đối và tương đối.

Ở đây khá thích hợp để nhấn mạnh rằng hầu hết các thông tin thống kê liên quan đến đời sống kinh tế của xã hội dưới những biểu hiện và loại hình đa dạng nhất đều dựa trên dữ liệu mẫu. Tất nhiên, chúng được bổ sung bằng dữ liệu đăng ký đầy đủ và thông tin thu được từ các cuộc điều tra dân số (dân số, doanh nghiệp, v.v.). Ví dụ: tất cả số liệu thống kê ngân sách (về thu nhập và chi tiêu của người dân) do Rosstat cung cấp đều dựa trên dữ liệu từ một nghiên cứu mẫu. Thông tin về giá cả, khối lượng sản xuất và khối lượng thương mại, được thể hiện bằng các chỉ số tương ứng, cũng chủ yếu dựa trên dữ liệu mẫu.