Các giai đoạn nghiên cứu thống kê xã hội Quan sát thống kê: khái niệm, dạng cơ bản

Kết quả của giai đoạn đầu tiên của nghiên cứu thống kê - quan sát thống kê - là thông tin mô tả đặc điểm của từng đơn vị dân số thống kê. Tuy nhiên, khả năng phản ánh các mô hình và xu hướng về động lực của các hiện tượng đang được nghiên cứu bằng cách sử dụng ngay cả những mô tả đầy đủ nhất về các sự kiện riêng lẻ cũng bị hạn chế. Dữ liệu đó chỉ thu được từ kết quả của các bản tóm tắt thống kê. Tóm tắt là việc sắp xếp, hệ thống hóa và khái quát hóa các số liệu thống kê thu được trong quá trình quan sát thống kê. Chỉ có việc xử lý tài liệu thống kê đúng cách mới có thể xác định được bản chất của các hiện tượng kinh tế - xã hội, những đặc điểm và đặc điểm cơ bản của từng loại cá thể cũng như khám phá các mô hình và xu hướng phát triển của chúng. Có những báo cáo đơn giản và báo cáo nhóm, hoặc báo cáo theo nghĩa hẹp và báo cáo rộng. Một bản tóm tắt đơn giản là tính toán kết quả tổng thể theo nhóm và nhóm nhỏ và trình bày tài liệu này dưới dạng bảng. Nhờ tổng hợp số liệu thống kê đơn giản, có thể xác định được số lượng doanh nghiệp, tổng số nhân sự, khối lượng sản phẩm sản xuất ra bằng tiền. Những kết quả tổng thể này chủ yếu nhằm mục đích cung cấp thông tin. Chúng cung cấp một đặc tính tổng quát của dân số dưới dạng các giá trị tuyệt đối.

Tóm tắt nhóm, hay tóm tắt theo nghĩa rộng, là một quá trình phức tạp xử lý dữ liệu thống kê cơ bản đa phương, tức là dữ liệu thu được từ kết quả quan sát. Nó bao gồm việc phân nhóm số liệu thống kê, xây dựng hệ thống chỉ tiêu để phân loại các nhóm, tính toán kết quả nhóm và kết quả tổng thể, tính toán các chỉ tiêu khái quát hóa. Nhiệm vụ của tóm tắt thống kê là giai đoạn thứ hai của nghiên cứu thống kê là thu được các chỉ số chung cho mục đích thông tin, tham khảo và phân tích. Việc tổng hợp số liệu thống kê đại chúng được thực hiện theo chương trình, kế hoạch đã được xây dựng trước. Trong quá trình xây dựng chương trình, chủ ngữ, vị ngữ của phần tóm tắt được xác định. Chủ thể là đối tượng nghiên cứu, được chia thành các nhóm và phân nhóm. Vị ngữ - chỉ số đặc trưng cho chủ đề của bản tóm tắt. Chương trình tóm tắt được xác định bởi các mục tiêu của nghiên cứu thống kê.

Việc tổng hợp thống kê được thực hiện theo kế hoạch đã được lập sẵn. Trong kế hoạch tóm tắt, các câu hỏi được giải quyết về cách thực hiện công việc tóm tắt thông tin - thủ công hoặc máy móc, về trình tự các thao tác tóm tắt riêng lẻ. Thời hạn hoàn thành từng giai đoạn và toàn bộ bản tóm tắt cũng như các phương pháp trình bày kết quả tóm tắt được thiết lập. Đây có thể là chuỗi phân phối, bảng thống kê và đồ thị thống kê.

Các giai đoạn chính của nghiên cứu thống kê

Hãy xem xét phương pháp thống kê quan trọng nhất - quan sát thống kê.

Sử dụng các phương pháp và kỹ thuật khác nhau của phương pháp thống kê

giả định trước sự sẵn có của thông tin toàn diện và đáng tin cậy về những gì đang được nghiên cứu

sự vật. Việc nghiên cứu các hiện tượng xã hội đại chúng bao gồm các giai đoạn thu thập

thông tin thống kê và quá trình xử lý, thông tin và phân nhóm ban đầu của nó

kết quả quan sát thành các tập hợp nhất định, khái quát hóa và phân tích

vật liệu nhận được.

Ở giai đoạn đầu của nghiên cứu thống kê, sơ cấp

dữ liệu thống kê hoặc thông tin thống kê thô

là nền tảng của việc xây dựng thống kê trong tương lai. Vì vậy tòa nhà là

nền móng của nó phải vững chắc, vững chắc và có chất lượng cao. Nếu khi thu thập

có sai sót trong dữ liệu thống kê ban đầu hoặc tài liệu hóa ra là sai sót

chất lượng kém, nó sẽ ảnh hưởng đến tính chính xác và độ tin cậy của cả hai

kết luận lý luận và thực tiễn. Vì vậy, thống kê

quan sát từ giai đoạn đầu đến giai đoạn cuối - đạt được kết quả cuối cùng

tài liệu - phải được suy nghĩ cẩn thận và sắp xếp rõ ràng.

Quan sát thống kê cung cấp nguồn tài liệu cho việc khái quát hóa, khởi đầu

mà bản tóm tắt phục vụ. Nếu trong quá trình quan sát thống kê về từng

đơn vị nhận được thông tin mô tả nó từ nhiều phía, sau đó dữ liệu

các báo cáo mô tả đặc điểm của toàn bộ tổng thể thống kê và các bộ phận riêng lẻ của nó.

Ở giai đoạn này, tổng thể được phân chia theo sự khác biệt và thống nhất theo

dấu hiệu tương đồng, tổng các chỉ tiêu được tính cho các nhóm và trong

nói chung. Sử dụng phương pháp phân nhóm, các hiện tượng đang được nghiên cứu được chia thành những hiện tượng quan trọng nhất.

loại, nhóm đặc điểm, phân nhóm theo đặc điểm cơ bản. Bằng cách sử dụng

các nhóm bị giới hạn bởi tính đồng nhất về mặt chất lượng ở các khía cạnh quan trọng

tính tổng thể, là điều kiện tiên quyết cho việc xác định và áp dụng

các chỉ số tổng quát hóa

Ở giai đoạn phân tích cuối cùng sử dụng các chỉ số tổng quát

các giá trị tương đối và trung bình được tính toán và đưa ra đánh giá tóm tắt

các biến thể của dấu hiệu, động lực của hiện tượng được đặc trưng, ​​​​các chỉ số được sử dụng,

việc xây dựng bảng cân đối kế toán, các chỉ số đặc trưng cho sự đông đúc được tính toán

mối liên hệ trong những thay đổi về đặc điểm. Với mục đích hợp lý và trực quan nhất

Trình bày tài liệu kỹ thuật số được trình bày dưới dạng bảng và đồ thị.

3. Quan sát thống kê: khái niệm, hình thức cơ bản.

Đây là công việc khoa học và tổ chức về thu thập dữ liệu. Các hình thức: thống kê. 1) báo cáo, mèo. dựa trên kế toán chứng từ. Từ năm 1998, 4 hình thức giám sát thống nhất của nhà nước liên bang đã được đưa ra: FP-1 (sản xuất của doanh nghiệp), FP-2 (đầu tư), FP-3 (tình trạng tài chính của các tổ chức), FP-4 (số lượng - số lượng công nhân, lao động), 2) quan sát được tổ chức đặc biệt (điều tra dân số), 3) đăng ký - đây là tập hợp các đơn vị, cat.har-t của từng đơn vị quan sát: sổ đăng ký của các tổ chức nghiên cứu, sản xuất, xây dựng và hợp đồng, bán lẻ và bán buôn buôn bán. Các hình thức quan sát: 1) liên tục, không liên tục (chọn lọc, định lượng dựa trên phương pháp mảng chính, chuyên khảo). Việc quan sát có thể là hiện tại, định kỳ, một lần. Phương pháp quan sát: trực tiếp, tài liệu, khảo sát (thám hiểm, bảng câu hỏi, trình diện cá nhân, thư từ). Việc quan sát thống kê được thực hiện theo kế hoạch, bao gồm: các vấn đề về chương trình và phương pháp luận (mục tiêu, mục tiêu), vấn đề về tổ chức (thời gian, địa điểm). Do các quan sát được thực hiện, sẽ phát sinh các lỗi làm giảm độ chính xác của các quan sát, do đó việc kiểm soát dữ liệu được thực hiện (logic và đếm). Khi kiểm tra độ tin cậy của dữ liệu, các lỗi quan sát sau được phát hiện: ngẫu nhiên. các lỗi (lỗi đăng ký), lỗi cố ý, lỗi vô ý. (có hệ thống và không có hệ thống), lỗi về tính đại diện (tính đại diện).

Các vấn đề về chương trình và phương pháp luận của quan sát thống kê.

Các vấn đề về chương trình và phương pháp quan sát thống kê

Mỗi quan sát được thực hiện cho một mục đích cụ thể. Khi tiến hành cần xác định nội dung cần kiểm tra. Các vấn đề sau đây cần được giải quyết:

Đối tượng quan sát – một tập hợp các đối tượng và hiện tượng mà từ đó thông tin phải được thu thập. Khi xác định một đối tượng, các đặc điểm (dấu hiệu) đặc biệt chính của nó được chỉ định. Mọi đối tượng quan sát khối lượng đều bao gồm các đơn vị riêng lẻ, vì vậy cần phải giải quyết câu hỏi yếu tố nào của tổng thể sẽ đóng vai trò là đơn vị quan sát.

Đơn vị quan sát – đây là một phần tử thành phần của một đối tượng, là vật mang các đặc điểm phải đăng ký và là cơ sở của tài khoản.

điều tra dân số – đây là những hạn chế định lượng nhất định đối với đối tượng quan sát.

Dấu hiệu - đây là đặc tính mô tả một số đặc điểm và đặc điểm nhất định vốn có của các đơn vị dân số đang được nghiên cứu.

Các vấn đề về tổ chức của quan sát thống kê.

Chương trình quan sát được soạn thảo dưới dạng biểu mẫu (bảng câu hỏi, biểu mẫu) trong đó dữ liệu sơ cấp được nhập vào. Một bổ sung cần thiết cho các biểu mẫu là hướng dẫn giải thích ý nghĩa của các câu hỏi.

Các vấn đề tổ chức của chương trình bao gồm:

thời gian quan sát;

thời điểm quan trọng của quan sát;

công việc chuẩn bị;

Khoảng thời gian quan sát mà thông tin được ghi lại có liên quan. Gọi là thời gian quan sát khách quan. Đây có thể là một khoảng thời gian nhất định (ngày, thập kỷ, tháng) hoặc một thời điểm nhất định. Thời điểm mà thông tin được ghi lại liên quan được gọi là thời điểm quan trọng của quan sát.

Ví dụ, thời điểm quan trọng của cuộc điều tra dân số vi mô năm 94. là 0h đêm 13-14/2. Bằng cách thiết lập thời điểm quan sát quan trọng, có thể xác định được tình trạng thực sự của sự việc với độ chính xác như chụp ảnh.

Công việc chuẩn bị bao gồm việc cung cấp giám sát bằng các tài liệu, cũng như biên soạn danh sách các đơn vị báo cáo, biểu mẫu và hướng dẫn.

Các tài liệu sẽ được điền vào trong quá trình quan sát hoặc dựa trên kết quả của nó.

Một vị trí quan trọng trong hệ thống công tác chuẩn bị là việc lựa chọn và đào tạo nhân sự cũng như giới thiệu những người sẽ tham gia quan sát.

Bất kỳ nghiên cứu thống kê nào đều dựa trên ba giai đoạn công việc có liên quan với nhau:

1) quan sát thống kê;

2) tóm tắt và nhóm dữ liệu quan sát;

3) xử lý và phân tích khoa học các kết quả tóm tắt. Mỗi giai đoạn tiếp theo của nghiên cứu thống kê có thể được thực hiện với điều kiện là các giai đoạn công việc trước đó (trước đó) đã được thực hiện.

Quan sát thống kê là giai đoạn đầu tiên của nghiên cứu thống kê.

Quan sát thống kê là một tập hợp thông tin có hệ thống, được tổ chức khoa học về một tập hợp cụ thể các hiện tượng hoặc quá trình xã hội và đặc biệt là kinh tế.

Các quan sát thống kê rất đa dạng và khác nhau về bản chất của hiện tượng đang nghiên cứu, hình thức tổ chức, thời gian quan sát và mức độ bao quát đầy đủ của hiện tượng đang nghiên cứu. Về vấn đề này, nó đã được thực hiện phân loại các quan sát thống kê theo đặc điểm cá nhân .

1. Theo hình thức tổ chức quan sát thống kê được chia thành báo cáo và quan sát thống kê được tổ chức đặc biệt.

Báo cáo– đây là hình thức quan sát thống kê chính của tổ chức, tập trung vào việc thu thập thông tin từ các doanh nghiệp, cơ quan và tổ chức về các khía cạnh khác nhau trong hoạt động của họ trên các biểu mẫu đặc biệt gọi là báo cáo. Báo cáo là bắt buộc. Báo cáo được chia thành cơ bản và hiện tại tùy thuộc vào khoảng thời gian mà nó được chuẩn bị.

Báo cáo cơ bản còn được gọi là hàng năm và chứa phạm vi rộng nhất của các chỉ số bao trùm tất cả các khía cạnh hoạt động của doanh nghiệp.

Báo cáo hiện tạiđược trình bày trong suốt cả năm với các khoảng thời gian khác nhau.

Tuy nhiên, có những dữ liệu về cơ bản là không thể lấy được từ báo cáo và có những dữ liệu không phù hợp để đưa vào báo cáo. Để có được hai loại dữ liệu này, người ta sử dụng các quan sát thống kê được tổ chức đặc biệt - nhiều loại khảo sát và điều tra dân số khác nhau.

khảo sát thống kê- đây là những quan sát được tổ chức đặc biệt trong đó tập hợp các hiện tượng được nghiên cứu được quan sát trong một khoảng thời gian nhất định.

điều tra dân số– đây là một hình thức quan sát thống kê được tổ chức đặc biệt trong đó tập hợp các hiện tượng được nghiên cứu được quan sát vào một ngày nào đó (tại một thời điểm nào đó).

2. Dựa trên thời gian Tất cả các quan sát thống kê được chia thành liên tục và không liên tục.

Quan sát thống kê liên tục (hiện tại)- Đây là sự quan sát được thực hiện liên tục theo thời gian. Với kiểu quan sát này, các hiện tượng, sự kiện và sự kiện riêng lẻ được ghi lại khi chúng xảy ra.


Quan sát thống kê định kỳ– đây là sự quan sát trong đó các hiện tượng, sự kiện, sự kiện được quan sát được ghi lại không liên tục mà qua các khoảng thời gian bằng nhau hoặc không bằng nhau. Có hai loại giám sát không liên tục – định kỳ và một lần. định kỳđược gọi là quan sát không liên tục, được thực hiện trong những khoảng thời gian bằng nhau. Một lầnđược gọi là quan sát được thực hiện trong khoảng thời gian không bằng nhau hoặc có tính chất một lần.

3. Dựa trên mức độ bao phủ đầy đủ của khối lượng nghiên cứu hiện tượng, sự kiện, sự kiện, quan sát thống kê được chia thành liên tục và không liên tục hoặc một phần.

Quan sát liên tục nhằm mục đích tính đến tất cả, không có ngoại lệ, các hiện tượng, sự kiện, sự kiện hình thành nên tổng thể đang được nghiên cứu.

Quan sát một phần nhằm mục đích chỉ tính đến một phần nhất định của các hiện tượng, sự kiện, sự kiện hình thành nên dân số đang được nghiên cứu.

Khái niệm nghiên cứu các khía cạnh định lượng của sự vật, hiện tượng đã được hình thành từ rất lâu, ngay từ khi con người phát triển những kỹ năng cơ bản khi làm việc với thông tin. Tuy nhiên, thuật ngữ “thống kê”, có từ thời chúng ta, sau này được mượn từ ngôn ngữ Latinh nhiều hơn và xuất phát từ từ “trạng thái”, có nghĩa là “một trạng thái nhất định của sự vật”. “Trạng thái” cũng được sử dụng theo nghĩa “nhà nước chính trị” và được cố định trong hầu hết các ngôn ngữ châu Âu theo nghĩa ngữ nghĩa này: “nhà nước” tiếng Anh, “Staat” tiếng Đức, “sto” tiếng Ý và dẫn xuất của nó “ Statista” - một chuyên gia về nhà nước.

Từ “thống kê” được sử dụng rộng rãi vào thế kỷ 18 và được dùng để chỉ “chính phủ”. Thống kê là một nhánh của hoạt động thực tiễn nhằm thu thập, xử lý, phân tích và cung cấp cho công chúng những dữ liệu về các hiện tượng và quá trình của đời sống xã hội.

Phân tích là một phương pháp nghiên cứu khoa học về một đối tượng bằng cách xem xét các khía cạnh và thành phần riêng lẻ của nó.

Phân tích thống kê kinh tế là sự phát triển một phương pháp dựa trên việc sử dụng rộng rãi các phương pháp thống kê và toán học truyền thống nhằm kiểm soát sự phản ánh đầy đủ các hiện tượng và quá trình đang nghiên cứu.

Các giai đoạn nghiên cứu thống kê Nghiên cứu thống kê diễn ra trong ba giai đoạn:

  • 1) quan sát thống kê;
  • 2) tóm tắt dữ liệu thu được;
  • 3) phân tích thống kê.

Ở giai đoạn đầu tiên, dữ liệu thống kê sơ cấp được thu thập bằng phương pháp quan sát khối lượng.

Ở giai đoạn thứ hai của nghiên cứu thống kê, dữ liệu thu thập được sẽ trải qua quá trình xử lý sơ cấp, tóm tắt và phân nhóm. Phương pháp nhóm cho phép bạn xác định các quần thể đồng nhất và chia chúng thành các nhóm và nhóm nhỏ. Tóm tắt là việc thu được kết quả cho toàn bộ dân số và các nhóm và phân nhóm riêng lẻ của nó.

Kết quả phân nhóm, tổng hợp được trình bày dưới dạng bảng thống kê. Nội dung chính của giai đoạn này là sự chuyển đổi từ đặc điểm của từng đơn vị quan sát sang đặc điểm tóm tắt của toàn bộ dân số hoặc các nhóm của nó.

Ở giai đoạn thứ ba, dữ liệu tóm tắt thu được được phân tích bằng phương pháp khái quát hóa các chỉ số (giá trị tuyệt đối, tương đối và trung bình, các chỉ số biến thiên, hệ thống chỉ số, phương pháp thống kê toán học, phương pháp bảng, phương pháp đồ họa, v.v.).

Cơ sở của phân tích thống kê:

  • 1) phê duyệt các dữ kiện và thiết lập đánh giá của chúng;
  • 2) xác định đặc điểm và nguyên nhân của hiện tượng;
  • 3) so sánh hiện tượng với các hiện tượng quy chuẩn, có kế hoạch và các hiện tượng khác được lấy làm cơ sở để so sánh;
  • 4) xây dựng các kết luận, dự báo, giả định và giả thuyết;
  • 5) kiểm tra thống kê các giả định được đưa ra (giả thuyết).

Phân tích và khái quát hóa dữ liệu thống kê là giai đoạn cuối cùng của nghiên cứu thống kê, mục tiêu cuối cùng là thu được kết luận lý thuyết và kết luận thực tiễn về xu hướng và mô hình của các hiện tượng và quá trình kinh tế - xã hội đang được nghiên cứu. Mục tiêu của phân tích thống kê là: xác định và đánh giá các đặc điểm, đặc điểm của các hiện tượng và quá trình đang được nghiên cứu, nghiên cứu cấu trúc, mối quan hệ và mô hình phát triển của chúng.

Phân tích thống kê dữ liệu được thực hiện với mối liên hệ chặt chẽ với phân tích lý thuyết, định tính về bản chất của hiện tượng đang nghiên cứu và các công cụ định lượng tương ứng, nghiên cứu về cấu trúc, mối liên hệ và động lực của chúng.

Phân tích thống kê là nghiên cứu những đặc điểm về cấu trúc, mối quan hệ của các hiện tượng, xu hướng, mô hình phát triển của các hiện tượng kinh tế - xã hội, trong đó sử dụng các phương pháp thống kê - toán học và kinh tế cụ thể. Phân tích thống kê kết thúc bằng việc giải thích các kết quả thu được.

Trong phân tích thống kê, các dấu hiệu được phân chia theo tính chất ảnh hưởng của chúng lên nhau:

  • 1. Đặc điểm kết quả - đặc điểm được phân tích trong nghiên cứu này. Các chiều riêng biệt của một đặc điểm như vậy trong các thành phần riêng lẻ của tổng thể bị ảnh hưởng bởi một hoặc nhiều đặc điểm khác. Nói cách khác, thuộc tính kết quả được coi là hệ quả của sự tương tác của các yếu tố khác;
  • 2. Yếu tố dấu hiệu - dấu hiệu ảnh hưởng đến đặc tính được nghiên cứu (dấu hiệu-kết quả). Hơn nữa, mối quan hệ giữa thuộc tính-yếu tố và thuộc tính-kết quả có thể được xác định một cách định lượng. Từ đồng nghĩa với thuật ngữ này trong thống kê là “đặc tính yếu tố”, “yếu tố”. Cần phân biệt khái niệm thuộc tính yếu tố và thuộc tính trọng số. Đặc tính trọng lượng là đặc điểm phải được tính đến khi tính toán. Nhưng đặc điểm cân nặng không ảnh hưởng đến đặc điểm đang được nghiên cứu. Thuộc tính yếu tố có thể được coi là thuộc tính trọng số, tức là được tính đến trong tính toán, nhưng không phải thuộc tính trọng số nào cũng là thuộc tính yếu tố. Ví dụ, khi nghiên cứu ở một nhóm sinh viên về mối quan hệ giữa thời gian chuẩn bị cho một kỳ thi và số điểm đạt được trong kỳ thi, đặc điểm thứ ba cũng cần được tính đến: “Số người được chứng nhận cho một số điểm nhất định”. .” Dấu hiệu cuối cùng không ảnh hưởng đến kết quả, tuy nhiên, nó sẽ được đưa vào tính toán phân tích. Loại thuộc tính này được gọi là thuộc tính trọng số chứ không phải thuộc tính yếu tố.

Trước khi bắt đầu phân tích, cần kiểm tra xem các điều kiện có được đáp ứng hay không để đảm bảo độ tin cậy và tính chính xác của nó:

  • - Độ tin cậy của dữ liệu số sơ cấp;
  • - Tính đầy đủ của đối tượng được nghiên cứu;
  • - So sánh các chỉ tiêu (theo đơn vị kế toán, lãnh thổ, phương pháp tính toán).

Các khái niệm chính của phân tích thống kê là:

  • 1. Giả thuyết;
  • 2. Chức năng quyết định và quyền quyết định;
  • 3. Lấy mẫu từ dân số nói chung;
  • 4. Đánh giá đặc điểm của dân số nói chung;
  • 5. Khoảng tin cậy;
  • 6. Xu hướng;
  • 7. Mối quan hệ thống kê.

Phân tích là giai đoạn cuối cùng của nghiên cứu thống kê, bản chất của nó là xác định các mối quan hệ và mô hình của hiện tượng đang được nghiên cứu, đưa ra kết luận và đề xuất.

2.1 Thiết kế nghiên cứu thống kê

Hệ thống phân tích dữ liệu thống kê là một công cụ hiện đại, hiệu quả cho nghiên cứu thống kê. Các hệ thống phân tích thống kê đặc biệt, cũng như các công cụ phổ quát - Excel, Matlab, Mathcad, v.v., có nhiều cơ hội để xử lý dữ liệu thống kê.

Nhưng ngay cả công cụ tiên tiến nhất cũng không thể thay thế được nhà nghiên cứu, người phải xây dựng mục đích nghiên cứu, thu thập dữ liệu, lựa chọn phương pháp, cách tiếp cận, mô hình và công cụ để xử lý và phân tích dữ liệu cũng như diễn giải kết quả.

Hình 2.1 trình bày sơ đồ nghiên cứu thống kê.

Hình 2.1 - Sơ đồ nghiên cứu thống kê

Điểm khởi đầu của nghiên cứu thống kê là việc hình thành vấn đề. Khi xác định nó, mục đích của nghiên cứu sẽ được tính đến, thông tin nào là cần thiết và nó sẽ được sử dụng như thế nào khi đưa ra quyết định.

Bản thân nghiên cứu thống kê bắt đầu với giai đoạn chuẩn bị. Trong giai đoạn chuẩn bị, các nhà phân tích nghiên cứu điều khoản tham chiếu– một tài liệu được soạn thảo bởi khách hàng của nghiên cứu. Điều khoản tham chiếu phải nêu rõ mục tiêu nghiên cứu:

    đối tượng nghiên cứu được xác định;

    các giả định và giả thuyết phải được xác nhận hoặc bác bỏ trong quá trình nghiên cứu được liệt kê;

    mô tả kết quả nghiên cứu sẽ được sử dụng như thế nào;

    khung thời gian mà nghiên cứu phải được thực hiện và ngân sách cho nghiên cứu.

Dựa trên các thông số kỹ thuật, nó được phát triển cấu trúc báo cáo phân tích- Cái đó, dưới hình thức nào kết quả nghiên cứu phải được trình bày chương trình quan sát thống kê. Chương trình là danh sách các dấu hiệu phải được ghi lại trong quá trình quan sát (hoặc các câu hỏi phải có câu trả lời đáng tin cậy cho từng đơn vị quan sát được khảo sát). Nội dung của chương trình được xác định bởi cả đặc điểm của đối tượng được quan sát và mục tiêu của nghiên cứu, cũng như bởi các phương pháp được các nhà phân tích lựa chọn để xử lý thêm thông tin thu thập được.

Giai đoạn chính của nghiên cứu thống kê bao gồm việc thu thập dữ liệu cần thiết và phân tích chúng.

Giai đoạn cuối cùng của nghiên cứu là lập báo cáo phân tích và gửi cho khách hàng.

Trong hình. Hình 2.2 trình bày sơ đồ phân tích số liệu thống kê.

Hình 2.2 – Các giai đoạn chính của phân tích thống kê

2.2 Thu thập thông tin thống kê

Việc thu thập tài liệu bao gồm việc phân tích các thông số kỹ thuật của nghiên cứu, xác định các nguồn thông tin cần thiết và (nếu cần) xây dựng bảng câu hỏi. Khi nghiên cứu các nguồn thông tin, tất cả các dữ liệu cần thiết được chia thành sơ đẳng(dữ liệu không có sẵn và phải được thu thập trực tiếp cho nghiên cứu này), và thứ cấp(trước đây được thu thập cho các mục đích khác).

Việc thu thập dữ liệu thứ cấp thường được gọi là nghiên cứu “bàn làm việc” hoặc “thư viện”.

Ví dụ về thu thập dữ liệu sơ cấp: quan sát khách đến cửa hàng, khảo sát bệnh nhân trong bệnh viện, thảo luận một vấn đề tại cuộc họp.

Dữ liệu thứ cấp được chia thành nội bộ và bên ngoài.

Ví dụ về nguồn dữ liệu thứ cấp nội bộ:

    hệ thống thông tin của tổ chức (bao gồm hệ thống con kế toán, hệ thống con quản lý bán hàng, CRM (hệ thống CRM, viết tắt của Quản lý quan hệ khách hàng) - phần mềm ứng dụng dành cho các tổ chức được thiết kế để tự động hóa các chiến lược tương tác với khách hàng) và các hệ thống khác);

    các nghiên cứu trước đây;

    báo cáo bằng văn bản của nhân viên.

Ví dụ về các nguồn dữ liệu thứ cấp bên ngoài:

    báo cáo của cơ quan thống kê và các cơ quan chính phủ khác;

    báo cáo từ các cơ quan tiếp thị, hiệp hội nghề nghiệp, v.v.;

    cơ sở dữ liệu điện tử (thư mục địa chỉ, GIS, v.v.);

    thư viện;

    phương tiện truyền thông.

Các kết quả đầu ra chính ở giai đoạn thu thập dữ liệu là:

    cỡ mẫu dự kiến;

    cấu trúc mẫu (sự hiện diện và quy mô của hạn ngạch);

    loại quan sát thống kê (thu thập dữ liệu, khảo sát, bảng câu hỏi, đo lường, thí nghiệm, kiểm tra, v.v.);

    thông tin về các thông số khảo sát (ví dụ: khả năng làm sai lệch bảng câu hỏi);

    sơ đồ mã hóa các biến trong cơ sở dữ liệu của chương trình được chọn để xử lý;

    kế hoạch chuyển đổi dữ liệu;

    sơ đồ kế hoạch của các thủ tục thống kê được sử dụng.

Giai đoạn tương tự này bao gồm cả thủ tục khảo sát. Tất nhiên, bảng câu hỏi được phát triển chỉ để thu thập thông tin sơ cấp.

Dữ liệu nhận được phải được chỉnh sửa và chuẩn bị cho phù hợp. Mỗi bảng câu hỏi hoặc mẫu quan sát đều được kiểm tra và điều chỉnh nếu cần thiết. Mỗi câu trả lời được gán mã số hoặc chữ cái - thông tin được mã hóa. Chuẩn bị dữ liệu bao gồm chỉnh sửa, sao chép và kiểm tra dữ liệu, mã hóa và các chuyển đổi cần thiết.

2.3 Xác định đặc tính của mẫu

Theo quy định, dữ liệu được thu thập từ kết quả quan sát thống kê để phân tích thống kê là một quần thể mẫu. Trình tự chuyển đổi dữ liệu vào quá trình nghiên cứu thống kê có thể được biểu diễn dưới dạng sơ đồ như sau (Hình 2.3)

Hình 2.3 Sơ đồ chuyển đổi dữ liệu thống kê

Bằng cách phân tích một mẫu, có thể rút ra kết luận về tổng thể được đại diện bởi mẫu.

Xác định cuối cùng các thông số lấy mẫu chungđược thực hiện khi tất cả các câu hỏi đã được thu thập xong. Nó bao gồm:

    xác định số lượng người trả lời thực tế,

    xác định cơ cấu lấy mẫu,

    phân bố theo địa điểm khảo sát,

    thiết lập mức độ tin cậy cho độ tin cậy thống kê của mẫu,

    tính toán sai số thống kê và xác định tính đại diện của mẫu.

Số lượng thực người trả lời có thể nhiều hơn hoặc ít hơn kế hoạch. Tùy chọn đầu tiên tốt hơn cho việc phân tích nhưng lại bất lợi cho khách hàng nghiên cứu. Điều thứ hai có thể có tác động tiêu cực đến chất lượng nghiên cứu và do đó không có lợi cho cả nhà phân tích hoặc khách hàng.

Cấu trúc lấy mẫu có thể là ngẫu nhiên hoặc không ngẫu nhiên (người trả lời được chọn dựa trên tiêu chí đã biết trước đó, ví dụ: bằng phương pháp hạn ngạch). Mẫu ngẫu nhiên là một đại diện tiên nghiệm. Các mẫu không ngẫu nhiên có thể cố ý không đại diện cho tổng thể nhưng cung cấp thông tin quan trọng cho nghiên cứu. Trong trường hợp này, bạn cũng nên cân nhắc kỹ các câu hỏi lọc của bảng câu hỏi, được thiết kế đặc biệt để lọc ra những người trả lời không đáp ứng yêu cầu.

xác định tính chính xác của đánh giá Trước hết cần đặt mức độ tin cậy (95% hoặc 99%). Sau đó tối đa lỗi thống kê mẫu được tính như

hoặc
,

Ở đâu - cỡ mẫu, - xác suất xảy ra sự kiện đang được nghiên cứu (người trả lời được đưa vào mẫu), - xác suất của sự kiện ngược lại (người trả lời không được đưa vào mẫu), - hệ số tin cậy,
- phương sai của đặc tính.

Bảng 2.4 cho thấy các giá trị được sử dụng phổ biến nhất của xác suất tin cậy và hệ số tin cậy.

Bảng 2.4

2.5 Xử lý dữ liệu trên máy tính

Phân tích dữ liệu bằng máy tính bao gồm việc thực hiện một số bước cần thiết.

1. Xác định cấu trúc của dữ liệu nguồn.

2. Nhập dữ liệu vào máy tính theo đúng cấu trúc và yêu cầu của chương trình. Chỉnh sửa và chuyển đổi dữ liệu.

3. Xác định phương pháp xử lý số liệu phù hợp với mục tiêu nghiên cứu.

4. Lấy kết quả xử lý dữ liệu. Chỉnh sửa nó và lưu nó ở định dạng được yêu cầu.

5. Giải thích kết quả xử lý.

Không có chương trình máy tính nào có thể thực hiện bước 1 (chuẩn bị) và 5 (cuối cùng) - nhà nghiên cứu tự thực hiện chúng. Các bước 2-4 được nhà nghiên cứu thực hiện bằng chương trình, nhưng chính nhà nghiên cứu là người xác định các quy trình cần thiết để chỉnh sửa và chuyển đổi dữ liệu, phương pháp xử lý dữ liệu cũng như định dạng trình bày kết quả xử lý. Sự trợ giúp của máy tính (bước 2–4) cuối cùng liên quan đến việc chuyển từ một chuỗi số dài sang một chuỗi số nhỏ gọn hơn. Tại “đầu vào” của máy tính, nhà nghiên cứu gửi một mảng dữ liệu ban đầu không thể hiểu được nhưng phù hợp để máy tính xử lý (bước 2). Sau đó, nhà nghiên cứu đưa ra lệnh cho chương trình xử lý dữ liệu theo nhiệm vụ và cấu trúc dữ liệu (bước 3). Ở “đầu ra”, anh ta nhận được kết quả xử lý (bước 4) - cũng là một mảng dữ liệu, chỉ nhỏ hơn, dễ hiểu và diễn giải có ý nghĩa. Đồng thời, việc phân tích toàn diện dữ liệu thường yêu cầu xử lý lặp đi lặp lại bằng các phương pháp khác nhau.

2.6 Lựa chọn chiến lược phân tích dữ liệu

Việc lựa chọn chiến lược phân tích dữ liệu được thu thập dựa trên kiến ​​thức về các khía cạnh lý thuyết và thực tiễn của lĩnh vực chủ đề đang nghiên cứu, các chi tiết cụ thể và đặc điểm đã biết của thông tin, tính chất của các phương pháp thống kê cụ thể, cũng như kinh nghiệm và quan điểm của nhà nghiên cứu.

Cần phải nhớ rằng phân tích dữ liệu không phải là mục tiêu cuối cùng của nghiên cứu. Mục tiêu của nó là thu thập thông tin giúp giải quyết một vấn đề cụ thể và đưa ra quyết định quản lý phù hợp. Việc lựa chọn chiến lược phân tích nên bắt đầu bằng việc xem xét kết quả của các giai đoạn trước của quy trình: xác định vấn đề và phát triển kế hoạch nghiên cứu. Kế hoạch phân tích dữ liệu sơ bộ được phát triển như một phần của kế hoạch nghiên cứu được sử dụng làm "dự thảo". Sau đó, khi có thêm thông tin ở các giai đoạn sau của quá trình nghiên cứu, có thể cần phải thực hiện một số thay đổi nhất định.

Phương pháp thống kê được chia thành một và nhiều biến. Phương pháp đơn biến được sử dụng khi tất cả các yếu tố của mẫu được đánh giá bằng một chỉ báo hoặc nếu có một vài chỉ số này cho mỗi yếu tố nhưng mỗi biến được phân tích riêng biệt với tất cả các biến khác.

Kỹ thuật đa biến là tuyệt vời để phân tích dữ liệu khi hai hoặc nhiều biện pháp được sử dụng để đánh giá từng phần tử mẫu và các biến này được phân tích đồng thời. Những phương pháp như vậy được sử dụng để xác định sự phụ thuộc giữa các hiện tượng.

Các phương pháp đa biến khác với các phương pháp một biến chủ yếu ở chỗ khi chúng được sử dụng, trọng tâm chú ý sẽ chuyển từ mức độ (trung bình) và phân bố (phương sai) của các hiện tượng và tập trung vào mức độ quan hệ (tương quan hoặc hiệp phương sai) giữa các hiện tượng này.

Các phương pháp đơn biến có thể được phân loại dựa trên việc dữ liệu được phân tích là số liệu hay phi số liệu (Hình 3). Dữ liệu số liệu được đo theo thang đo khoảng hoặc thang đo tương đối. Dữ liệu phi số liệu được đánh giá theo thang danh nghĩa hoặc thứ tự

Ngoài ra, các phương pháp này được chia thành các lớp dựa trên số lượng mẫu—một, hai hoặc nhiều mẫu—được phân tích trong nghiên cứu.

Việc phân loại các phương pháp thống kê một chiều được trình bày ở hình 2.4.

Cơm. 2.4 Phân loại phương pháp thống kê đơn biến theo số liệu phân tích

Số lượng mẫu được xác định bởi cách xử lý dữ liệu cho một phân tích cụ thể, chứ không phải bởi cách thu thập dữ liệu. Ví dụ: dữ liệu về nam và nữ có thể được lấy trong cùng một mẫu, nhưng nếu phân tích nhằm mục đích xác định sự khác biệt trong nhận thức dựa trên sự khác biệt về giới tính thì nhà nghiên cứu sẽ phải thực hiện với hai mẫu khác nhau. Các mẫu được coi là độc lập nếu chúng không liên quan về mặt thực nghiệm với nhau. Các phép đo được thực hiện trong một mẫu không ảnh hưởng đến giá trị của các biến trong mẫu khác. Để phân tích, dữ liệu từ các nhóm người trả lời khác nhau, chẳng hạn như dữ liệu được thu thập từ nữ và nam, thường được coi là mẫu độc lập.

Mặt khác, nếu dữ liệu từ hai mẫu đề cập đến cùng một nhóm người trả lời thì các mẫu được coi là phụ thuộc theo cặp.

Nếu chỉ có một mẫu dữ liệu số liệu, có thể sử dụng kiểm tra z và kiểm tra t. Nếu có hai mẫu độc lập trở lên, trong trường hợp đầu tiên, bạn có thể sử dụng phép thử z và t cho hai mẫu, trong trường hợp thứ hai - phương pháp phân tích phương sai một chiều. Đối với hai mẫu liên quan, phép thử t ghép đôi được sử dụng. Nếu chúng ta đang nói về dữ liệu phi số liệu từ một mẫu duy nhất, nhà nghiên cứu có thể sử dụng các thử nghiệm phân phối tần số, thử nghiệm chi bình phương, Kolmogorov-Smirnov (K~S), thử nghiệm chuỗi và thử nghiệm nhị thức. Đối với hai mẫu độc lập có dữ liệu phi số liệu, bạn có thể sử dụng các phương pháp phân tích sau: chi bình phương, Mann-Whitney, trung vị, K-S, phân tích phương sai một chiều Kruskal-Wallis (ANOVA). Ngược lại, nếu có hai hoặc nhiều mẫu liên quan thì nên sử dụng phép thử dấu, McNemar và Wilcoxon.

Các phương pháp thống kê đa biến nhằm mục đích xác định các mô hình hiện có: sự phụ thuộc lẫn nhau của các biến, mối quan hệ hoặc chuỗi sự kiện, sự tương đồng giữa các đối tượng.

Khá thông thường, chúng ta có thể phân biệt năm loại mẫu tiêu chuẩn, nghiên cứu về loại này rất được quan tâm: liên kết, trình tự, phân loại, phân cụm và dự báo.

Một sự liên kết xảy ra khi một số sự kiện có liên quan với nhau. Ví dụ, một nghiên cứu được thực hiện trong siêu thị có thể cho thấy rằng 65% những người mua khoai tây chiên cũng mua Coca-Cola và nếu có giảm giá cho một bộ như vậy thì họ sẽ mua Coke trong 85% trường hợp. Có thông tin về hiệp hội như vậy, các nhà quản lý dễ dàng đánh giá mức độ hiệu quả của việc chiết khấu được cung cấp.

Nếu có một chuỗi các sự kiện liên quan đến thời gian thì người ta nói đến một chuỗi sự kiện. Ví dụ, sau khi mua nhà, trong 45% trường hợp, bếp mới được mua trong vòng một tháng và trong vòng hai tuần, 60% cư dân mới mua tủ lạnh.

Với sự trợ giúp của việc phân loại, các dấu hiệu được xác định đặc trưng cho nhóm mà một đối tượng cụ thể thuộc về. Điều này được thực hiện bằng cách phân tích các đối tượng đã được phân loại và xây dựng một số bộ quy tắc.

Phân cụm khác với phân loại ở chỗ bản thân các nhóm không được xác định trước. Bằng cách sử dụng phân cụm, các nhóm dữ liệu đồng nhất khác nhau được xác định.

Cơ sở cho tất cả các loại hệ thống dự báo là thông tin lịch sử được lưu trữ dưới dạng chuỗi thời gian. Nếu có thể xây dựng các mô hình phản ánh đầy đủ động lực hành vi của các chỉ báo mục tiêu thì có khả năng với sự trợ giúp của chúng, người ta có thể dự đoán hành vi của hệ thống trong tương lai.

Phương pháp thống kê đa biến có thể được chia thành phương pháp phân tích mối quan hệ và phân tích phân loại (Hình 2.5).

Hình 2.5 – Phân loại phương pháp thống kê đa biến