Dân số và mẫu. Quần thể chung và mẫu

Dân số (bằng tiếng Anh - dân số) - một tập hợp tất cả các đối tượng (đơn vị) mà nhà khoa học dự định đưa ra kết luận khi nghiên cứu một vấn đề cụ thể.

Dân số bao gồm tất cả các đối tượng có thể nghiên cứu. Thành phần của dân số phụ thuộc vào mục tiêu của nghiên cứu. Đôi khi dân số nói chung là toàn bộ dân số của một khu vực nhất định (ví dụ: khi nghiên cứu thái độ của cử tri tiềm năng đối với một ứng cử viên), thông thường một số tiêu chí được chỉ định để xác định đối tượng của nghiên cứu. Ví dụ: đàn ông 30-50 tuổi sử dụng dao cạo của một nhãn hiệu nào đó ít nhất một lần một tuần và có thu nhập ít nhất 100 USD cho mỗi thành viên trong gia đình.

Vật mẫuhoặc dân số mẫu- một tập hợp các trường hợp (đối tượng, đối tượng, sự kiện, mẫu), sử dụng một quy trình nhất định, được chọn từ dân số nói chung để tham gia nghiên cứu.

Đặc điểm mẫu:

· Đặc điểm định tính của mẫu - chúng tôi chọn chính xác ai và chúng tôi sử dụng phương pháp lấy mẫu nào cho việc này.

· Đặc điểm định lượng của mẫu - chúng ta chọn bao nhiêu trường hợp, hay nói cách khác là cỡ mẫu.

Sự cần thiết của việc lấy mẫu

· Đối tượng nghiên cứu rất rộng. Ví dụ: người tiêu dùng sản phẩm của một công ty toàn cầu được đại diện bởi một số lượng lớn các thị trường phân tán về mặt địa lý.

· Cần phải thu thập thông tin sơ cấp.

Cỡ mẫu

Cỡ mẫu- số trường hợp có trong quần thể mẫu. Vì lý do thống kê, số trường hợp được khuyến nghị ít nhất là 30 đến 35.

Mẫu phụ thuộc và độc lập

Khi so sánh hai (hoặc nhiều) mẫu, một tham số quan trọng là sự phụ thuộc của chúng. Nếu có thể thiết lập một cặp đồng hình (nghĩa là khi một trường hợp từ mẫu X tương ứng với một và chỉ một trường hợp từ mẫu Y và ngược lại) cho mỗi trường hợp trong hai mẫu (và cơ sở của mối quan hệ này rất quan trọng đối với tính trạng được đo trong các mẫu), những mẫu như vậy được gọi là sự phụ thuộc. Ví dụ về các mẫu phụ thuộc:

· cặp sinh đôi,

· hai phép đo bất kỳ tính trạng nào trước và sau khi tiếp xúc thử nghiệm,

· vợ chồng

· vân vân.

Nếu không có mối quan hệ như vậy giữa các mẫu thì các mẫu này được coi là độc lập, Ví dụ:

· đàn ông và phụ nữ,

· các nhà tâm lý học và toán học.

Theo đó, các mẫu phụ thuộc luôn có cùng kích thước, trong khi kích thước của các mẫu độc lập có thể khác nhau.

Việc so sánh các mẫu được thực hiện bằng các tiêu chí thống kê khác nhau:

· Bài kiểm tra t của sinh viên

· thử nghiệm Wilcoxon

· Phép thử Mann-Whitney U

· Tiêu chí ký hiệu

· vân vân.

Tính đại diện

Mẫu có thể được coi là mang tính đại diện hoặc không mang tính đại diện.

Ví dụ về mẫu không mang tính đại diện

Tại Hoa Kỳ, một trong những ví dụ lịch sử nổi tiếng nhất về lấy mẫu phi đại diện xảy ra trong cuộc bầu cử tổng thống năm 1936. Literary Digest, tờ báo đã dự đoán thành công diễn biến của một số cuộc bầu cử trước đó, đã dự đoán sai khi gửi đi 10 triệu phiếu bầu thử nghiệm cho những người đăng ký, cũng như những người được chọn từ danh bạ điện thoại của cả nước và những người từ đăng ký ô tô. danh sách. Trong 25% số phiếu bầu được gửi lại (gần 2,5 triệu), số phiếu được phân bổ như sau:

· Ứng cử viên Đảng Cộng hòa Alf Landon được 57% ưa thích

· 40% chọn Tổng thống Đảng Dân chủ lúc bấy giờ là Franklin Roosevelt

Trong cuộc bầu cử thực tế, như đã biết, Roosevelt đã giành chiến thắng, giành được hơn 60% số phiếu bầu. Sai lầm của Literary Digest là ở chỗ: muốn tăng tính đại diện của mẫu - vì họ biết rằng hầu hết những người đặt mua dài hạn đều coi mình là đảng viên Đảng Cộng hòa - nên họ đã mở rộng mẫu để bao gồm những người được chọn từ danh bạ điện thoại và danh sách đăng ký. Tuy nhiên, họ đã không tính đến thực tế của thời đại mình và trên thực tế còn tuyển dụng nhiều đảng viên Cộng hòa hơn: trong thời kỳ Đại suy thoái, chủ yếu là đại diện của tầng lớp trung lưu và thượng lưu có đủ khả năng sở hữu điện thoại và ô tô (tức là hầu hết những người theo Đảng Cộng hòa) , không phải đảng Dân chủ).

Các loại kế hoạch xây dựng nhóm từ mẫu

Có một số loại kế hoạch xây dựng nhóm chính:

1. Một nghiên cứu với các nhóm thử nghiệm và đối chứng, được đặt trong các điều kiện khác nhau.

2. Nghiên cứu với các nhóm thực nghiệm và đối chứng bằng cách sử dụng chiến lược lựa chọn theo cặp

3. Một nghiên cứu chỉ sử dụng một nhóm - một nhóm thử nghiệm.

4. Một nghiên cứu sử dụng thiết kế hỗn hợp (giai thừa) - tất cả các nhóm được đặt trong các điều kiện khác nhau.

Các kiểu lấy mẫu

Mẫu được chia thành hai loại:

· xác suất

· phi xác suất

Mẫu xác suất

1. Lấy mẫu xác suất đơn giản:

Lấy mẫu lại đơn giản. Việc sử dụng mẫu như vậy dựa trên giả định rằng mỗi người trả lời đều có khả năng được đưa vào mẫu như nhau. Dựa trên danh sách dân số nói chung, các thẻ có số người trả lời được tổng hợp. Chúng được đặt trong một bộ bài, xáo trộn và một lá bài được lấy ra một cách ngẫu nhiên, con số được ghi lại và sau đó được trả lại. Tiếp theo, quy trình được lặp lại nhiều lần với số lượng mẫu chúng ta cần. Nhược điểm: sự lặp lại của các đơn vị lựa chọn.

Quy trình xây dựng một mẫu ngẫu nhiên đơn giản bao gồm các bước sau:

1. Cần lập danh sách đầy đủ các thành viên của dân cư và đánh số vào danh sách này. Hãy nhớ lại, danh sách như vậy được gọi là khung lấy mẫu;

2. xác định cỡ mẫu dự kiến, tức là số lượng người trả lời dự kiến;

3. trích xuất bao nhiêu số từ bảng số ngẫu nhiên mà chúng ta cần đơn vị mẫu. Nếu cần có 100 người trong mẫu thì 100 số ngẫu nhiên sẽ được lấy từ bảng. Những số ngẫu nhiên này có thể được tạo ra bởi một chương trình máy tính.

4. chọn từ danh sách cơ sở những quan sát có số tương ứng với số ngẫu nhiên được viết

· Lấy mẫu ngẫu nhiên đơn giản có lợi thế rõ ràng. Phương pháp này cực kỳ dễ hiểu. Kết quả của nghiên cứu có thể được khái quát hóa cho dân số đang được nghiên cứu. Hầu hết các phương pháp suy luận thống kê đều liên quan đến việc thu thập thông tin bằng cách sử dụng một mẫu ngẫu nhiên đơn giản. Tuy nhiên, phương pháp lấy mẫu ngẫu nhiên đơn giản có ít nhất bốn hạn chế đáng kể:

1. Thường rất khó để tạo ra một khung lấy mẫu cho phép lấy mẫu ngẫu nhiên đơn giản.

2. Việc lấy mẫu ngẫu nhiên đơn giản có thể tạo ra một quần thể lớn hoặc một quần thể phân bố trên một khu vực địa lý rộng lớn, làm tăng đáng kể thời gian và chi phí thu thập dữ liệu.

3. Kết quả lấy mẫu ngẫu nhiên đơn giản thường có đặc điểm là độ chính xác thấp và sai số chuẩn lớn hơn kết quả của các phương pháp xác suất khác.

4. Do sử dụng SRS, mẫu không mang tính đại diện có thể được hình thành. Mặc dù các mẫu thu được bằng cách lấy mẫu ngẫu nhiên đơn giản, về trung bình, đại diện đầy đủ cho tổng thể, nhưng một số trong số đó lại thể hiện cực kỳ sai lệch về tổng thể đang được nghiên cứu. Điều này đặc biệt có thể xảy ra khi cỡ mẫu nhỏ.

· Lấy mẫu đơn giản không lặp lại. Cách thức xây dựng mẫu cũng như nhau, chỉ có những lá bài có số đáp án là không được trả lại bộ bài.

1. Lấy mẫu xác suất có hệ thống. Đây là phiên bản đơn giản của lấy mẫu xác suất đơn giản. Dựa trên danh sách dân số nói chung, người trả lời được chọn ở một khoảng nhất định (K). Giá trị của K được xác định ngẫu nhiên. Kết quả đáng tin cậy nhất đạt được với một quần thể đồng nhất, nếu không thì kích thước bước và một số kiểu tuần hoàn bên trong của mẫu có thể trùng nhau (trộn mẫu). Nhược điểm: giống như trong mẫu xác suất đơn giản.

2. Lấy mẫu nối tiếp (cụm). Đơn vị lựa chọn là chuỗi thống kê (gia đình, trường học, đội, v.v.). Các yếu tố được chọn phải được kiểm tra đầy đủ. Việc lựa chọn các đơn vị thống kê có thể được tổ chức dưới dạng lấy mẫu ngẫu nhiên hoặc hệ thống. Nhược điểm: Có khả năng đồng nhất cao hơn so với dân số nói chung.

3. Lấy mẫu khu vực. Trong trường hợp dân số không đồng nhất, trước khi sử dụng lấy mẫu xác suất với bất kỳ kỹ thuật chọn lọc nào, nên chia dân số thành các phần đồng nhất, mẫu như vậy được gọi là lấy mẫu huyện. Các nhóm phân vùng có thể bao gồm cả các thành tạo tự nhiên (ví dụ: các quận trong thành phố) và bất kỳ đặc điểm nào tạo thành cơ sở của nghiên cứu. Đặc điểm trên cơ sở thực hiện phân chia được gọi là đặc điểm phân tầng và phân vùng.

4. Mẫu "tiện lợi". Quy trình lấy mẫu “tiện lợi” bao gồm việc thiết lập mối liên hệ với các đơn vị lấy mẫu “tiện lợi” - một nhóm sinh viên, một đội thể thao, bạn bè và hàng xóm. Nếu bạn muốn biết thông tin về phản ứng của mọi người đối với một khái niệm mới thì kiểu lấy mẫu này khá hợp lý. Lấy mẫu thuận tiện thường được sử dụng để kiểm tra trước các câu hỏi.

Mẫu phi xác suất

Việc lựa chọn trong một mẫu như vậy được thực hiện không theo nguyên tắc ngẫu nhiên mà theo tiêu chí chủ quan - tính sẵn có, tính điển hình, tính đại diện ngang nhau, v.v.

1. Lấy mẫu hạn ngạch - mẫu được xây dựng như một mô hình tái tạo cấu trúc của tổng thể dưới dạng hạn ngạch (tỷ lệ) của các đặc điểm đang được nghiên cứu. Số lượng phần tử mẫu có sự kết hợp khác nhau của các đặc điểm nghiên cứu được xác định sao cho tương ứng với tỷ lệ (tỷ lệ) của chúng trong tổng thể chung. Vì vậy, ví dụ: nếu dân số chung của chúng ta bao gồm 5.000 người, trong đó 2.000 là phụ nữ và 3.000 nam, thì trong mẫu hạn ngạch, chúng ta sẽ có 20 nữ và 30 nam, hoặc 200 nữ và 300 nam. Các mẫu hạn ngạch thường dựa trên các tiêu chí nhân khẩu học: giới tính, độ tuổi, khu vực, thu nhập, trình độ học vấn và các tiêu chí khác. Nhược điểm: thông thường những mẫu như vậy không mang tính đại diện vì không thể tính đến một số thông số xã hội cùng một lúc. Ưu điểm: nguyên liệu sẵn có.

2. Phương pháp quả cầu tuyết. Mẫu được xây dựng như sau. Mỗi người trả lời, bắt đầu từ người đầu tiên, được hỏi thông tin liên lạc của bạn bè, đồng nghiệp, người quen của mình, những người phù hợp với điều kiện lựa chọn và có thể tham gia nghiên cứu. Như vậy, ngoại trừ bước đầu tiên, mẫu được hình thành với sự tham gia của chính đối tượng nghiên cứu. Phương pháp này thường được sử dụng khi cần tìm và phỏng vấn những nhóm người trả lời khó tiếp cận (ví dụ: người trả lời có thu nhập cao, người trả lời cùng nhóm nghề nghiệp, người trả lời có sở thích/mối quan tâm tương tự, v.v.)

3. Lấy mẫu tự phát – lấy mẫu của cái gọi là “người đầu tiên bạn gặp”. Thường được sử dụng trong các cuộc thăm dò trên truyền hình và đài phát thanh. Kích thước và thành phần của các mẫu tự phát không được biết trước và chỉ được xác định bởi một tham số – hoạt động của người trả lời. Nhược điểm: không thể xác định được người trả lời đại diện cho nhóm dân cư nào và do đó, không thể xác định được tính đại diện.

4. Khảo sát lộ trình – thường được sử dụng khi đơn vị nghiên cứu là gia đình. Trên bản đồ địa phương nơi tiến hành khảo sát, tất cả các đường phố đều được đánh số. Sử dụng bảng (trình tạo) số ngẫu nhiên, số lượng lớn được chọn. Mỗi số lớn được coi là gồm 3 thành phần: số nhà (2-3 số đầu), số nhà, số chung cư. Ví dụ: số 14832: 14 là số đường trên bản đồ, 8 là số nhà, 32 là số căn hộ.

5. Lấy mẫu khu vực với việc lựa chọn các đối tượng điển hình. Nếu sau khi phân vùng, một đối tượng điển hình được chọn từ mỗi nhóm, tức là. một đối tượng gần với mức trung bình về hầu hết các đặc điểm được nghiên cứu trong nghiên cứu, mẫu như vậy được gọi là khu vực hóa với việc lựa chọn các đối tượng điển hình.

Chiến lược xây dựng nhóm

Việc lựa chọn các nhóm tham gia vào một thí nghiệm tâm lý được thực hiện bằng nhiều chiến lược khác nhau để đảm bảo rằng giá trị bên trong và bên ngoài được duy trì ở mức độ lớn nhất có thể.

· Ngẫu nhiên hóa (chọn ngẫu nhiên)

· Lựa chọn theo cặp

· Lấy mẫu địa tầng

· Mô hình gần đúng

· Thu hút các nhóm thực sự

Ngẫu nhiên, hoặc lựa chọn ngẫu nhiên, được sử dụng để tạo các mẫu ngẫu nhiên đơn giản. Việc sử dụng mẫu như vậy dựa trên giả định rằng mỗi thành viên của tổng thể đều có khả năng được đưa vào mẫu như nhau. Ví dụ: để tạo một mẫu ngẫu nhiên gồm 100 sinh viên đại học, bạn có thể đặt những mảnh giấy có tên của tất cả sinh viên đại học vào một chiếc mũ, sau đó lấy 100 mảnh giấy ra khỏi đó - đây sẽ là một lựa chọn ngẫu nhiên (Goodwin J ., tr. 147).

Lựa chọn theo cặp- chiến lược xây dựng các nhóm lấy mẫu, trong đó các nhóm đối tượng được tạo thành từ các đối tượng tương đương về các thông số phụ có ý nghĩa đối với thử nghiệm. Chiến lược này hiệu quả đối với các thử nghiệm sử dụng nhóm thử nghiệm và nhóm đối chứng, với lựa chọn tốt nhất là có sự tham gia của các cặp sinh đôi (đơn sắc và cặp hợp tử), vì nó cho phép bạn tạo...

Lấy mẫu địa tầng - ngẫu nhiên hóa bằng việc phân bổ các tầng (hoặc cụm). Với phương pháp lấy mẫu này, dân số nói chung được chia thành các nhóm (tầng lớp) có những đặc điểm nhất định (giới tính, độ tuổi, sở thích chính trị, trình độ học vấn, mức thu nhập, v.v.) và các đối tượng có các đặc điểm tương ứng sẽ được chọn.

Mô hình gần đúng - rút ra các mẫu giới hạn và khái quát hóa các kết luận về mẫu này cho quần thể rộng hơn. Ví dụ, với sự tham gia của sinh viên đại học năm thứ 2 vào nghiên cứu, dữ liệu của nghiên cứu này áp dụng cho “những người từ 17 đến 21 tuổi”. Khả năng chấp nhận những khái quát hóa như vậy là vô cùng hạn chế.

Mô hình hóa gần đúng là sự hình thành một mô hình, đối với một lớp hệ thống (quy trình) được xác định rõ ràng, mô tả hành vi của nó (hoặc hiện tượng mong muốn) với độ chính xác có thể chấp nhận được.

Dân số- một tập hợp các phần tử thỏa mãn các điều kiện nhất định; còn được gọi là dân số nghiên cứu. Dân số chung (Vũ trụ) - toàn bộ tập hợp các đối tượng (đối tượng) nghiên cứu, từ đó các đối tượng (đối tượng) được chọn (có thể được chọn) để khảo sát (khảo sát).

VẬT MẪU hoặc dân số mẫu(Mẫu) là tập hợp các đối tượng (đối tượng) được lựa chọn một cách đặc biệt để khảo sát (khảo sát). Bất kỳ dữ liệu nào thu được trên cơ sở khảo sát mẫu (khảo sát) đều có tính chất xác suất. Trong thực tế, điều này có nghĩa là trong quá trình nghiên cứu, không phải một giá trị cụ thể được xác định mà là khoảng thời gian chứa giá trị được xác định.

Đặc điểm mẫu:

Đặc điểm định tính của mẫu - chính xác chúng tôi chọn gì và chúng tôi sử dụng phương pháp lấy mẫu nào cho việc này.

Đặc điểm định lượng của mẫu - chúng ta chọn bao nhiêu trường hợp, hay nói cách khác là cỡ mẫu.

Cần lấy mẫu:

Đối tượng nghiên cứu rất rộng. Ví dụ: người tiêu dùng sản phẩm của một công ty toàn cầu được đại diện bởi một số lượng lớn các thị trường phân tán về mặt địa lý.

Cần phải thu thập thông tin sơ cấp.

Cỡ mẫu- số trường hợp có trong quần thể mẫu.

Mẫu phụ thuộc và độc lập.

Khi so sánh hai (hoặc nhiều) mẫu, một tham số quan trọng là sự phụ thuộc của chúng. Nếu có thể thiết lập một cặp đồng hình (nghĩa là khi một trường hợp từ mẫu X tương ứng với một và chỉ một trường hợp từ mẫu Y và ngược lại) cho mỗi trường hợp trong hai mẫu (và cơ sở của mối quan hệ này rất quan trọng đối với tính trạng được đo trong các mẫu), những mẫu như vậy được gọi là sự phụ thuộc.

Nếu không có mối quan hệ như vậy giữa các mẫu thì các mẫu này được coi là độc lập.

Các loại lấy mẫu.

Mẫu được chia thành hai loại:

Xác suất;

Không có xác suất;

Mẫu đại diện- một quần thể mẫu trong đó các đặc điểm chính trùng khớp với các đặc điểm của dân số nói chung. Chỉ đối với loại mẫu này, kết quả khảo sát của một số đơn vị (đối tượng) mới có thể được mở rộng cho toàn bộ dân số. Điều kiện cần thiết để xây dựng một mẫu đại diện là sự sẵn có của thông tin về tổng thể nói chung, tức là hoặc là danh sách đầy đủ các đơn vị (đối tượng) của tổng thể chung hoặc thông tin về cấu trúc theo các đặc điểm có ảnh hưởng đáng kể đến mối quan hệ với đối tượng nghiên cứu.

17. Chuỗi biến thể rời rạc, thứ hạng, tần suất, đặc thù.

Chuỗi biến thể(loạt thống kê) – là dãy các tùy chọn được viết theo thứ tự tăng dần và trọng số tương ứng của chúng.

Chuỗi biến thể có thể là rời rạc(lấy mẫu các giá trị của biến ngẫu nhiên rời rạc) và liên tục (khoảng) (lấy mẫu các giá trị của biến ngẫu nhiên liên tục).

Chuỗi biến thiên rời rạc có dạng:

Các giá trị quan sát của biến ngẫu nhiên x1, x2,..., xk được gọi là tùy chọn, và việc thay đổi các giá trị này được gọi là theo biến thể.

Vật mẫu(mẫu) – một tập hợp các quan sát được chọn ngẫu nhiên từ tổng thể.

Số lượng quan sát trong một quần thể được gọi là khối lượng của nó.

N- số lượng dân số nói chung.

N– cỡ mẫu (tổng của tất cả các tần số của chuỗi).

Tính thường xuyên các tùy chọn xi được gọi là số ni (i=1,...,k), cho biết tùy chọn này xuất hiện bao nhiêu lần trong mẫu.

Tính thường xuyên(tần số tương đối, phân số) biến thể xi (i=1,...,k) là tỷ số giữa tần số ni của nó và cỡ mẫu n.
w Tôi=n Tôi/N

Xếp hạng dữ liệu thực nghiệm- một hoạt động bao gồm thực tế là kết quả quan sát trên một biến ngẫu nhiên, tức là các giá trị quan sát của một biến ngẫu nhiên, được sắp xếp theo thứ tự không giảm.

Chuỗi biến thể rời rạc phân phối là một tập hợp được xếp hạng của các tùy chọn xi với tần số hoặc thông số cụ thể tương ứng của chúng.

Nhu cầu tiến hành nghiên cứu mẫu có thể do nhiều lý do:

    thường việc nghiên cứu đầy đủ về hiện tượng đang được nghiên cứu là quá tốn kém và tốn thời gian;

    đôi khi cơ hội sử dụng thông tin nhận được trong một nghiên cứu đầy đủ có thể hết trước khi quá trình chuẩn bị hoàn tất;

    trong một số trường hợp, do kiểm tra chất lượng sản phẩm, đối tượng nghiên cứu bị phá hủy.

Ví dụ:

    Giả sử dân số là toàn bộ học sinh của trường (600 người từ 20 lớp, mỗi lớp 30 người). Đối tượng nghiên cứu là thái độ đối với việc hút thuốc.

Dân số là một tập hợp các đối tượng mà bạn cần thu thập thông tin.

Dân số nói chung bao gồm tất cả các đối tượng có phẩm chất và đặc tính mà nhà nghiên cứu quan tâm. Đôi khi dân số nói chung là toàn bộ dân số trưởng thành của một khu vực nhất định (ví dụ: khi nghiên cứu thái độ của cử tri tiềm năng đối với một ứng cử viên), thông thường một số tiêu chí được chỉ định để xác định đối tượng nghiên cứu. Ví dụ: phụ nữ từ 10-89 tuổi sử dụng một nhãn hiệu kem dưỡng da tay nào đó ít nhất một lần một tuần và có thu nhập ít nhất 5 nghìn rúp cho mỗi thành viên trong gia đình.

Vật mẫu là một tập nhỏ các đối tượng được trích ra từ tổng thể.

Một quần thể mẫu là yêu cầu tối thiểu để nghiên cứu các kết quả (trường hợp, đối tượng, đối tượng, sự kiện, mẫu) được chọn bằng cách sử dụng một quy trình nhất định từ tổng thể chung.

Ví dụ:

    xác định phản ứng của khách hàng của công ty đối với những đổi mới; Những khách hàng được gọi là mẫu.

    Khi kiểm toán các công ty có số lượng giao dịch lớn, người ta phải hài lòng với việc nghiên cứu một số giao dịch được lựa chọn. Tất cả các giao dịch của công ty đều tạo thành tổng thể chung, những giao dịch được chọn tạo thành mẫu.

    dân số nói chung bao gồm tất cả những người lính nghĩa vụ của một năm cụ thể.

    Tất cả các loại đèn được sản xuất trong một khoảng thời gian nhất định tại một doanh nghiệp nhất định tạo thành một quần thể chung. Những đèn được chọn để điều khiển sẽ được chọn.

Mẫu có thể được coi là mang tính đại diện hoặc không mang tính đại diện. Mẫu sẽ mang tính đại diện khi khảo sát một nhóm lớn người, nếu trong nhóm này có đại diện của các nhóm nhỏ khác nhau thì đây là cách duy nhất để đưa ra kết luận đúng. .

Tính đại diện là sự tương ứng giữa các đặc điểm của mẫu với các đặc điểm của tổng thể hoặc tổng thể nói chung. Tính đại diện xác định mức độ có thể khái quát hóa kết quả của một nghiên cứu sử dụng một mẫu cụ thể cho toàn bộ tổng thể mà nó được thu thập.

Tính đại diện cũng có thể được định nghĩa là đặc tính của một quần thể mẫu đại diện cho các tham số của tổng thể chung có ý nghĩa quan trọng xét theo quan điểm của các mục tiêu nghiên cứu.

Ví dụ: Một mẫu gồm 60 học sinh trung học đại diện cho dân số kém hơn nhiều so với mẫu gồm 60 người bao gồm 3 học sinh từ mỗi lớp. Nguyên nhân chính là do sự phân bố độ tuổi không đồng đều trong các lớp. Do đó, trong trường hợp đầu tiên, tính đại diện của mẫu thấp và trong trường hợp thứ hai, tính đại diện cao (tất cả các yếu tố khác đều bằng nhau) .

Nhiệm vụ 1. Tại thành phố có 253.000 cử tri đủ điều kiện, hãy nghiên cứu khuynh hướng chính trị của các cử tri tương lai.

Giải pháp

    Mẫu có thể được xây dựng bằng cách phỏng vấn từng người mua thứ 15 rời khỏi một trung tâm mua sắm lớn. Mẫu như vậy sẽ phản ánh quan điểm của khách tham quan trung tâm mua sắm nhưng khó có thể đại diện cho quan điểm của tất cả cư dân thành phố.

    Một phương pháp khác để xây dựng mẫu là tiến hành khảo sát qua điện thoại với từng cư dân thứ 100 của thành phố, lấy số từ danh bạ điện thoại. Việc lấy mẫu có hệ thống này sẽ cung cấp thông tin về quan điểm của một nhóm người có điện thoại, đang ở nhà và trả lời điện thoại. Nhưng nó không phản ánh ý kiến ​​​​của tất cả người dân thành phố.

    Một phương pháp khác để xây dựng mẫu có thể là phỏng vấn những người tham gia tại một cuộc mít tinh do một số đảng chính trị tổ chức. Mẫu như vậy sẽ cung cấp thông tin về người dân tích cực tham gia vào đời sống chính trị của thành phố.

Vì vậy, chúng ta cần những phương pháp để hình thành một mẫu đại diện cho toàn bộ tổng thể, tức là mẫu đó phải có tính đại diện (đại diện).

Nhiệm vụ 2. Xác định xem mẫu có mang tính đại diện hay không:

1) số vụ tai nạn ô tô trong tháng 6, nếu cần lập báo cáo thống kê số vụ tai nạn trên địa bàn thành phố trong năm;

2) cư dân thành thị khi tính số lượng ô tô bình quân đầu người trong cả nước;

3) những người từ 40 đến 50 tuổi khi xác định rating của một chương trình truyền hình dành cho giới trẻ.

Giải pháp

1) Mẫu không mang tính đại diện. Vào mùa hè, trên đường không có tuyết hoặc băng và đây là một trong những nguyên nhân chính gây ra tai nạn.

2) Mẫu không mang tính đại diện. Rõ ràng là ở thành phố có nhiều ô tô hơn ở nông thôn. Điều này phải được tính đến.

3) Mẫu không mang tính đại diện. Những người trong độ tuổi từ 40 đến 50 khó có thể thể hiện sự quan tâm đến một chương trình dành cho khán giả trẻ. Khi sử dụng mẫu như vậy, xếp hạng có thể giảm đáng kể, nhưng điều này sẽ không phản ánh tình hình thực tế. Để hình thành một quần thể mẫu, nhiều phương pháp lựa chọn khác nhau được sử dụng. Số liệu thống kê phải được trình bày theo cách mà chúng có thể được sử dụng.

Thông số dân số và mẫu

N là dân số nói chung, được chia thành các tầng N 1, N 2, v.v.

tầng lớpđại diện cho các đối tượng đồng nhất về các đặc điểm thống kê (ví dụ: dân số được chia thành các tầng lớp theo nhóm tuổi hoặc tầng lớp xã hội; doanh nghiệp - theo ngành). Trong trường hợp này, các mẫu được gọi là phân tầng.

N - cỡ mẫu.

Kết luận thống kê của nghiên cứu dựa trên sự phân bố của biến ngẫu nhiên X, trong khi các giá trị quan sát x 1, x 2, x 3 được gọi là hiện thực của biến ngẫu nhiên x.

Sự phân bố của một biến ngẫu nhiên X trong tổng thể nói chung là về mặt lý thuyết, lý tưởng và mẫu tương tự của nó là một phân bố thực nghiệm.

Đối với một mẫu, hàm phân bố rất khó và đôi khi không thể xác định được nên các tham số được ước tính từ dữ liệu thực nghiệm, sau đó chúng được thay thế thành biểu thức phân tích mô tả phân bố lý thuyết. Trong trường hợp này, giả định về loại phân phối có thể đúng hoặc sai về mặt thống kê.

Nhưng trong mọi trường hợp, phân bố thực nghiệm được xây dựng lại từ mẫu chỉ mô tả đại khái phân bố đúng.

Các tham số quan trọng nhất của phân phối là kỳ vọng toán họcMỘT và phương sai σ 2- đo độ phân tán dữ liệu.

Độ lệch chuẩnσ - mức độ sai lệch của dữ liệu hoặc tập hợp quan sát so với giá trị trung bình.

Nhiệm vụ 3. Mikhail và những người bạn của anh quyết định đo chiều cao của những chú chó của họ (ở phần héo). Tìm: giá trị trung bình; lệch tăng trưởng.

Giải pháp

    Kỳ vọng toán học hoặc giá trị trung bình có thể được tìm thấy bằng công thức:


    Bây giờ, hãy tính độ lệch chiều cao của mỗi con chó so với kỳ vọng trung bình hoặc toán học, nghĩa là chúng ta sẽ tính toán độ phân tán.


Độ lệch chuẩn chỉ là căn bậc hai của phương sai.

σ \ = 147,32

Vì vậy, bằng cách biết độ lệch chuẩn, chúng ta biết "chiều cao bình thường" nghĩa là gì và thế nào là một con chó rất cao và một con chó rất nhỏ.

Đáp số: 394, 21.704; 147,32.

Nhiệm vụ 4. Quan sát trong phòng thí nghiệm kiểm soát về thời hạn sử dụng của 50 đèn điện có cùng công suất, được lấy ngẫu nhiên từ một lô lớn đèn có cùng công suất do nhà máy sản xuất, đã dẫn đến dữ liệu sau về việc vi phạm chế độ bảo hành đã thiết lậpthời gian cháy:

Độ lệch trong H

10 phân phối nhỏ, phản ánh độ lệch thực tế th thời gian cháy của bóng đèn kể từ thời điểm bảo hành.

Giải pháp.

Độ lệch trung bình

Do đó, phân bố chuẩn mong muốn được đặc trưng bởi các giá trị tham số sau: a = 0,4;σ 2 = 318; σ = 17,8.

Do đó mật độ xác suất:

Hàm phân phối tương ứng với mật độ này sẽ như sau:

Dân số - tập hợp những người mà nhà xã hội học tìm cách thu thập thông tin trong nghiên cứu của mình. Tùy thuộc vào mức độ rộng của chủ đề nghiên cứu, dân số sẽ rộng như nhau.

Dân số mẫu – mô hình dân số giảm; những người mà nhà xã hội học phân phát bảng câu hỏi, những người được gọi là người trả lời, những người cuối cùng là đối tượng của nghiên cứu xã hội học.

Chính xác ai được đưa vào dân số chung được xác định bởi các mục tiêu của nghiên cứu và ai được đưa vào dân số mẫu được quyết định bằng phương pháp toán học. Nếu một nhà xã hội học có ý định nhìn cuộc chiến Afghanistan qua con mắt của những người tham gia, thì dân số nói chung sẽ bao gồm tất cả binh lính Afghanistan, nhưng anh ta sẽ phải phỏng vấn một bộ phận nhỏ - dân số mẫu. Để mẫu phản ánh chính xác dân số nói chung, nhà xã hội học tuân thủ quy tắc: bất kỳ người lính Afghanistan nào, bất kể nơi cư trú, nơi làm việc, tình trạng sức khỏe và các hoàn cảnh khác, đều phải có cùng xác suất được đưa vào mẫu dân số.

Một khi nhà xã hội học đã quyết định được người mà anh ta muốn phỏng vấn, anh ta sẽ xác định khung lấy mẫu. Sau đó, câu hỏi về loại mẫu được quyết định.

Các mẫu được chia thành ba lớp lớn:

MỘT) chất rắn(điều tra dân số, trưng cầu dân ý). Tất cả các đơn vị từ dân số đều được khảo sát;

b) ngẫu nhiên;

V) không ngẫu nhiên.

Lần lượt, các kiểu lấy mẫu ngẫu nhiên và không ngẫu nhiên được chia thành nhiều loại.

Những cái ngẫu nhiên bao gồm:

1) xác suất;

2) có tính hệ thống;

3) khoanh vùng (phân tầng);

4) làm tổ

Những cái không ngẫu nhiên bao gồm:

1) "tự phát";

2) hạn ngạch;

3) phương pháp "mảng chính".

Danh sách đầy đủ và chính xác các đơn vị trong mẫu quần thể khung lấy mẫu . Các phần tử dùng để lựa chọn được gọi là đơn vị lựa chọn . Đơn vị lấy mẫu có thể giống với đơn vị quan sát vì đơn vị quan sát được coi là một phần của tổng thể mà từ đó thông tin được thu thập trực tiếp. Thông thường đơn vị quan sát là cá nhân. Lựa chọn từ danh sách được thực hiện tốt nhất bằng cách đánh số đơn vị và sử dụng bảng số ngẫu nhiên, mặc dù phương pháp gần như ngẫu nhiên thường được sử dụng khi mọi phần tử thứ n được lấy từ một danh sách đơn giản.

Nếu khung lấy mẫu bao gồm một danh sách các đơn vị lấy mẫu thì cấu trúc lấy mẫu bao hàm việc nhóm chúng theo một số đặc điểm quan trọng, ví dụ như sự phân bổ các cá nhân theo nghề nghiệp, trình độ chuyên môn, giới tính hoặc độ tuổi. Ví dụ, nếu trong dân số nói chung có 30% người trẻ, 50% người trung niên và 20% người già, thì phải tuân theo tỷ lệ phần trăm giống nhau của ba độ tuổi trong dân số mẫu. Độ tuổi có thể được bổ sung theo tầng lớp, giới tính, quốc tịch, v.v. Đối với mỗi loại, tỷ lệ phần trăm được thiết lập trong quần thể chung và quần thể mẫu. Như vậy, khung lấy mẫu - tỷ lệ phần trăm các đặc điểm của đối tượng, trên cơ sở đó tổng thể mẫu được biên soạn.

Trong khi loại mẫu cho chúng ta biết số người được đưa vào mẫu như thế nào thì cỡ mẫu cho chúng ta biết có bao nhiêu người được đưa vào mẫu.

Cỡ mẫu – số đơn vị trong quần thể mẫu. Vì quần thể mẫu là một phần của tổng thể được chọn bằng các phương pháp đặc biệt nên khối lượng của nó luôn nhỏ hơn khối lượng của tổng thể chung. Vì vậy, điều quan trọng là bộ phận không làm sai lệch ý tưởng của tổng thể, tức là nó đại diện cho tổng thể.

Độ tin cậy của dữ liệu bị ảnh hưởng không phải bởi các đặc điểm định lượng của dân số mẫu (khối lượng của nó), mà bởi các đặc điểm định tính của dân số nói chung - mức độ đồng nhất của nó. Sự khác biệt giữa tổng thể chung và tổng thể mẫu được gọi là lỗi đại diện , sai lệch cho phép – 5%.

Dưới đây là một số cách để tránh lỗi:

    mỗi đơn vị trong tổng thể phải có xác suất được đưa vào mẫu như nhau;

    nên chọn từ các quần thể đồng nhất;

    bạn cần biết đặc điểm của dân số;

    Khi biên soạn một quần thể mẫu, phải tính đến các lỗi ngẫu nhiên và hệ thống.

Nếu dân số mẫu (mẫu) được lập chính xác thì nhà xã hội học sẽ thu được kết quả đáng tin cậy đặc trưng cho toàn bộ dân số.

Chính là gì phương pháp lấy mẫu?

Phương pháp lấy mẫu cơ học, khi số lượng người trả lời cần thiết được chọn từ danh sách chung của dân số nói chung theo các khoảng thời gian đều đặn (ví dụ: cứ sau 10 ngày).

Phương pháp lấy mẫu nối tiếp. Trong trường hợp này, dân số nói chung được chia thành các phần đồng nhất và các đơn vị phân tích được chọn theo tỷ lệ từ mỗi phần (ví dụ: 20% nam và nữ trong doanh nghiệp).

Phương pháp lấy mẫu cụm. Đơn vị lựa chọn không phải là những người trả lời riêng lẻ mà là những nhóm có hoạt động nghiên cứu liên tục sau đó. Mẫu này sẽ mang tính đại diện nếu thành phần của các nhóm tương tự nhau (ví dụ: một nhóm sinh viên từ mỗi luồng của một khoa đại học).

Phương pháp mảng chính– khảo sát 60–70% dân số nói chung.

Phương pháp lấy mẫu hạn ngạch. Phương pháp phức tạp nhất, đòi hỏi phải xác định ít nhất bốn đặc điểm để chọn người trả lời. Thường được sử dụng với số lượng lớn.

Nghiên cứu thường bắt đầu với một số giả định đòi hỏi phải kiểm tra bằng thực tế. Giả định này - một giả thuyết - được hình thành trong mối liên hệ giữa các hiện tượng hoặc tính chất trong một tập hợp đối tượng nhất định. Để kiểm tra những giả định đó với thực tế, cần phải đo lường những đặc tính tương ứng của những người mang chúng. Nhưng chẳng hạn, không thể đo lường được mức độ lo lắng ở tất cả thanh thiếu niên. Do đó, khi tiến hành nghiên cứu, nó chỉ giới hạn ở một nhóm tương đối nhỏ đại diện của các nhóm người có liên quan.

Dân số- đây là toàn bộ tập hợp các đối tượng mà giả thuyết nghiên cứu được hình thành. Về mặt lý thuyết, người ta tin rằng quy mô dân số là không giới hạn. Trong thực tế, số lượng dân số nói chung luôn bị giới hạn và có thể thay đổi tùy thuộc vào đối tượng quan sát và nhiệm vụ mà nhà tâm lý học phải giải quyết. Thông thường, dân số nói chung bao gồm một số lượng rất lớn các đối tượng - sinh viên đại học, học sinh, nhân viên doanh nghiệp, người về hưu, v.v. Một nghiên cứu đầy đủ về dân số nói chung là vô cùng khó khăn, do đó, theo quy luật, một phần nhỏ của dân số nói chung được nghiên cứu, được gọi là dân số mẫu hoặc mẫu.

Lấy mẫu -đây là một số lượng hạn chế các đối tượng (trong tâm lý học - chủ thể, người trả lời), được lựa chọn đặc biệt từ dân chúng nói chung để nghiên cứu các đặc tính của nó. Theo đó, việc nghiên cứu các đặc tính của tổng thể bằng cách sử dụng mẫu được gọi là nghiên cứu chọn mẫu. Hầu như tất cả các nghiên cứu tâm lý đều có tính chọn lọc và kết luận của chúng áp dụng cho dân số nói chung.

Một số yêu cầu bắt buộc được áp dụng cho mẫu, được xác định chủ yếu bởi mục tiêu và mục tiêu của nghiên cứu. Nó phải sao cho việc khái quát hóa các kết quả của một nghiên cứu mẫu là hợp lý - khái quát hóa, mở rộng chúng cho dân số nói chung.

Mẫu phải thỏa mãn các điều kiện sau:



1. Đây là nhóm đối tượng có sẵn để nghiên cứu. Cỡ mẫu được xác định bởi nhiệm vụ và khả năng quan sát, thực nghiệm.

2. Đó là một phần của quần thể được chỉ định trước.

3. Đó là một nhóm được chọn ngẫu nhiên sao cho bất kỳ phần tử nào trong tổng thể đều có cơ hội được đưa vào mẫu như nhau.

Tiêu chí chính về giá trị của kết quả nghiên cứu là tính đại diện của mẫu và độ tin cậy thống kê của kết quả (thực nghiệm).

Tính đại diện - nói cách khác, tính đại diện của nó là khả năng mô tả đặc điểm của quần thể tương ứng với độ chính xác nhất định và đủ độ tin cậy. Nếu mẫu đối tượng đại diện cho dân số nói chung về các đặc điểm của nó thì có lý do để mở rộng kết quả thu được từ nghiên cứu của nó ra toàn bộ dân số nói chung.

Lý tưởng nhất là một mẫu đại diện phải sao cho mỗi đặc điểm, đặc điểm, đặc điểm tính cách, v.v. chính được nhà tâm lý học nghiên cứu đều được thể hiện trong đó theo tỷ lệ với những đặc điểm tương tự này trong dân số nói chung.

Lỗi đại diện phát sinh trong hai trường hợp:

1. Một mẫu nhỏ đặc trưng cho dân số nói chung.

2. Sự khác biệt giữa các đặc tính (thông số) của mẫu và các thông số của tổng thể nói chung.

Ý nghĩa thống kêÝ nghĩa thống kê hoặc ý nghĩa thống kê của kết quả nghiên cứu được xác định bằng cách sử dụng các kỹ thuật suy luận thống kê. Những phương pháp này sẽ được thảo luận chi tiết hơn trong chủ đề “Kiểm tra giả thuyết”. Lưu ý rằng họ áp đặt các yêu cầu nhất định về kích thước hoặc kích thước của mẫu.

Cần có cỡ mẫu lớn nhất khi phát triển kỹ thuật chẩn đoán - từ 200 đến 1000-2500 người.

Nếu phải so sánh 2 mẫu thì tổng số lượng ít nhất phải là 50 người; số lượng mẫu được so sánh phải xấp xỉ nhau.

Nếu mối quan hệ giữa bất kỳ thuộc tính nào đang được nghiên cứu thì cỡ mẫu ít nhất phải là 30-35 người.

Tính chất đang được nghiên cứu có độ biến thiên càng lớn thì cỡ mẫu càng lớn. Do đó, có thể giảm tính biến thiên bằng cách tăng tính đồng nhất của mẫu, ví dụ theo giới tính, độ tuổi, v.v. Điều này đương nhiên làm giảm khả năng khái quát hóa kết luận.

Mẫu phụ thuộc và độc lập. Một tình huống nghiên cứu phổ biến là khi một đặc tính mà nhà nghiên cứu quan tâm được nghiên cứu trên hai hoặc nhiều mẫu nhằm mục đích so sánh thêm. Các mẫu này có thể có tỷ lệ khác nhau, tùy thuộc vào quy trình của tổ chức của họ. Các mẫu độc lập được đặc trưng bởi thực tế là xác suất lựa chọn bất kỳ đối tượng nào trong một mẫu không phụ thuộc vào việc lựa chọn bất kỳ đối tượng nào trong mẫu kia. Ngược lại, các mẫu phụ thuộc được đặc trưng bởi thực tế là mỗi đối tượng từ một mẫu được đối sánh theo một tiêu chí nhất định bởi một đối tượng từ mẫu khác.

Ví dụ điển hình nhất của một mẫu độc lập là so sánh nam và nữ về mặt trí thông minh.