Etapy badań statystyki społecznej. Obserwacja statystyczna: pojęcie, podstawowe formy

Wynikiem pierwszego etapu badań statystycznych – obserwacji statystycznej – są informacje charakteryzujące każdą jednostkę zbiorowości statystycznej. Jednakże możliwość odzwierciedlenia wzorców i tendencji w dynamice badanych zjawisk przy pomocy nawet najbardziej kompletnej charakterystyki poszczególnych faktów jest ograniczona. Dane takie uzyskuje się jedynie w wyniku zestawień statystycznych. Podsumowanie to uporządkowanie, usystematyzowanie i uogólnienie danych statystycznych uzyskanych w trakcie obserwacji statystycznej. Dopiero właściwe przetworzenie materiału statystycznego pozwala na rozpoznanie istoty zjawisk społeczno-gospodarczych, cech charakterystycznych i istotnych cech poszczególnych typów oraz odkrycie wzorców i trendów w ich rozwoju. Wyróżnia się raporty proste i grupowe, czyli raporty w wąskim i szerokim znaczeniu. Prostym podsumowaniem jest obliczenie wyników ogólnych w grupach i podgrupach oraz przedstawienie tego materiału w tabelach. W wyniku prostego podsumowania danych statystycznych można określić liczbę przedsiębiorstw, całkowitą liczbę personelu i wielkość wytworzonych produktów w ujęciu pieniężnym. Powyższe ogólne wyniki służą przede wszystkim celom informacyjnym. Dostarczają uogólnionej charakterystyki populacji w postaci wartości bezwzględnych.

Podsumowanie grupowe, czyli szeroko rozumiane podsumowanie, to złożony proces wielostronnego przetwarzania pierwotnych danych statystycznych, tj. dane uzyskane w wyniku obserwacji. Obejmuje grupowanie danych statystycznych, opracowywanie systemu wskaźników charakteryzujących grupy, obliczanie wyników grupowych i ogólnych oraz obliczanie wskaźników uogólniających. Zadaniem podsumowania statystycznego jako drugiego etapu badań statystycznych jest uzyskanie ogólnych wskaźników o charakterze informacyjnym, referencyjnym i analitycznym. Podsumowanie masowych danych statystycznych odbywa się według wcześniej opracowanego programu i planu. W procesie opracowywania programu ustalany jest temat i orzeczenie podsumowania. Przedmiot jest przedmiotem badań, podzielony na grupy i podgrupy. Predykat – wskaźniki charakteryzujące temat podsumowania. Program podsumowujący wyznaczany jest celami badania statystycznego.

Podsumowanie statystyczne odbywa się według wcześniej opracowanego planu. W zakresie podsumowań poruszane są pytania o sposób przeprowadzenia pracy podsumowania informacji – ręcznie lub mechanicznie, oraz o kolejność poszczególnych operacji sumowania. Ustalane są terminy zakończenia poszczególnych etapów i podsumowania całości oraz sposoby prezentacji wyników podsumowania. Mogą to być szeregi rozkładowe, tabele statystyczne i wykresy statystyczne.

Główne etapy badań statystycznych

Rozważmy najważniejszą metodę statystyki - obserwację statystyczną.

Stosowanie różnych metod i technik metodologii statystycznej

zakłada dostępność wyczerpujących i wiarygodnych informacji na temat przedmiotu badania

obiekt. Badanie masowych zjawisk społecznych obejmuje etapy gromadzenia

informacja statystyczna i jej pierwotne przetwarzanie, informowanie i grupowanie

wyniki obserwacji na określone agregaty, uogólnianie i analizę

otrzymane materiały.

Na pierwszym etapie badań statystycznych, pierwotnych

dane statystyczne lub surowe informacje statystyczne, które

jest podstawą przyszłego budynku statystycznego. Aby budynek był

jego fundament musi być mocny, solidny i wysokiej jakości. Jeśli podczas zbierania

wystąpił błąd w pierwotnych danych statystycznych lub materiał okazał się taki

niskiej jakości, będzie to miało wpływ na poprawność i niezawodność obu

wnioski teoretyczne i praktyczne. Dlatego statystycznie

obserwacja od etapu początkowego do końcowego – uzyskania finału

materiały - muszą być dokładnie przemyślane i przejrzyście zorganizowane.

Obserwacja statystyczna dostarcza materiału źródłowego do uogólnień, początku

czemu służy podsumowanie. Jeśli podczas obserwacji statystycznej o każdym z jego

jednostka otrzymuje informacje charakteryzujące ją pod wieloma względami, następnie dane

raporty charakteryzują całą populację statystyczną i jej poszczególne części.

Na tym etapie całość jest podzielona według różnic i zjednoczona według

oznaki podobieństwa, wskaźniki całkowite są obliczane dla grup i w

ogólnie. Stosując metodę grupowania, badane zjawiska dzieli się na najważniejsze

typy, grupy charakterystyczne i podgrupy według zasadniczych cech. Używając

grupy są ograniczone jakościowo jednorodne pod istotnymi względami

całość, co jest warunkiem wstępnym definicji i zastosowania

uogólnianie wskaźników.

Na ostatnim etapie analizy przy użyciu wskaźników uogólniających

Obliczane są wartości względne i średnie oraz podawana jest ocena podsumowująca

charakteryzuje się zmienność znaków, charakteryzuje się dynamiką zjawisk, stosuje się wskaźniki,

obliczane są konstrukcje bilansów, wskaźniki charakteryzujące zagęszczenie

powiązania w zmianach charakterystyk. W celu jak najbardziej racjonalnym i wizualnym

Prezentacja materiału cyfrowego przedstawiona jest w formie tabel i wykresów.

3.Obserwacja statystyczna: pojęcie, podstawowe formy.

Są to prace naukowe i organizacyjne nad gromadzeniem danych. Formularze:stat. 1) raportowanie, kat. opiera się na rachunkowości dokumentowej. Od 1998 roku wprowadzono 4 ujednolicone formy nadzoru państwa federalnego: FP-1 (produkcja przedsiębiorstw), FP-2 (inwestycje), FP-3 (stan finansowy organizacji), PR-4 (liczba - liczba pracowników, praca), 2) specjalnie zorganizowana obserwacja (spis), 3) rejestr - jest to zbiór jednostek, cat.har-t każdej jednostki obserwacji: rejestry nas - organizacji badawczych, produkcyjnych, budowlanych i kontraktacyjnych, detalicznych i hurtowych handel. Rodzaje obserwacji: 1) ciągła, nieciągła (selektywna, kwalifikowana w oparciu o metodę tablic głównych, monografia). Obserwacja może mieć charakter bieżący, okresowy, jednorazowy. Metody obserwacji: bezpośrednia, dokumentalna, ankietowa (wyprawa, ankieta, stawienie się, korespondencja). Obserwacje statystyczne prowadzone są według planu, który obejmuje: kwestie programowe i metodyczne (cele, zadania), kwestie organizacyjne (czas, miejsce). W wyniku przeprowadzonych obserwacji powstają błędy, które zmniejszają dokładność obserwacji, dlatego przeprowadzana jest kontrola danych (logiczna i zliczeniowa). W wyniku sprawdzenia wiarygodności danych ujawniają się następujące błędy obserwacji: losowe. błędy (błędy rejestracyjne), błędy zamierzone, błędy niezamierzone. (systemowe i niesystemowe), błędy reprezentatywności (reprezentatywności).

Zagadnienia programowe i metodologiczne obserwacji statystycznej.

Zagadnienia programowe i metodologiczne obserwacji statystycznej

Każda obserwacja prowadzona jest w konkretnym celu. Podczas jego przeprowadzania należy ustalić, co podlega badaniu. Należy rozwiązać następujące kwestie:

Obiekt obserwacyjny – zbiór obiektów i zjawisk, z których należy zebrać informacje. Definiując obiekt wskazuje się jego główne cechy wyróżniające (znaki). Każdy obiekt obserwacji masy składa się z pojedynczych jednostek, dlatego należy rozstrzygnąć, jaki element agregatu będzie jednostką obserwacji.

Jednostka obserwacji – jest to element składowy przedmiotu, będący nośnikiem cech podlegających rejestracji i stanowiący podstawę konta.

Spis ludności – są to pewne ograniczenia ilościowe obiektu obserwacji.

Podpisać - jest to właściwość charakteryzująca pewne cechy i cechy właściwe jednostkom badanej populacji.

Zagadnienia organizacyjne obserwacji statystycznej.

Program obserwacji sporządzany jest w formie formularzy (kwestionariuszy, formularzy), w których wprowadzane są dane pierwotne. Niezbędnym uzupełnieniem formularzy jest instrukcja wyjaśniająca znaczenie pytań.

Kwestie organizacyjne programu obejmują:

okres obserwacji;

krytyczny moment obserwacji;

Praca przygotowawcza;

Okres obserwacji, którego dotyczą zarejestrowane informacje. Nazywany obiektywnym czasem obserwacji. To może być określony okres czasu (dzień, dekada, miesiąc) lub określony moment. Moment, którego dotyczą zapisane informacje, nazywany jest krytycznym momentem obserwacji.

Na przykład krytyczny moment mikrospisu 94. była godzina 0:00 w nocy z 13 na 14 lutego. Ustalając krytyczny moment obserwacji, można z fotograficzną dokładnością określić prawdziwy stan rzeczy.

Prace przygotowawcze obejmują wyposażenie nadzoru w dokumenty, a także opracowanie wykazu jednostek sprawozdawczych, formularzy i instrukcji.

Dokumenty będą uzupełniane w trakcie obserwacji lub na podstawie jej wyników.

Ważnym miejscem w systemie prac przygotowawczych jest dobór i szkolenie personelu oraz odprawa osób, które będą uczestniczyć w obserwacji.

Każde badanie statystyczne opiera się na trzech powiązanych ze sobą etapach pracy:

1) obserwacja statystyczna;

2) podsumowanie i grupowanie danych obserwacyjnych;

3) opracowanie naukowe i analiza podsumowujących wyników. Każdy kolejny etap badania statystycznego może być realizowany pod warunkiem zrealizowania poprzednich (poprzednich) etapów prac.

Obserwacja statystyczna jest pierwszym etapem badań statystycznych.

Obserwacja statystyczna- jest to systematyczny, naukowo zorganizowany zbiór informacji o określonym zestawie zjawisk lub procesów społecznych, a w szczególności ekonomicznych.

Obserwacje statystyczne są bardzo różnorodne i różnią się charakterem badanych zjawisk, formą organizacji, czasem obserwacji i kompletnością objęcia badanymi zjawiskami. W tym zakresie zostało to wykonane klasyfikacja obserwacji statystycznych według indywidualnych cech .

1. Według formy organizacji obserwacje statystyczne dzielą się na sprawozdawcze i specjalnie zorganizowane obserwacje statystyczne.

Raportowanie– to główna forma organizacyjna obserwacji statystycznej, która sprowadza się do gromadzenia informacji od przedsiębiorstw, instytucji i organizacji o różnych aspektach ich działalności na specjalnych formularzach zwanych raportami. Zgłaszanie jest obowiązkowe. Sprawozdawczość dzieli się na podstawową i bieżącą w zależności od długości okresu, na który jest sporządzana.

Podstawowe raportowanie nazywane również coroczny i zawiera najszerszą gamę wskaźników obejmujących wszystkie aspekty działalności przedsiębiorstwa.

Bieżące raportowanie prezentowane przez cały rok dla okresów o różnej długości.

Istnieją jednak dane, których zasadniczo nie da się uzyskać ze sprawozdań, oraz dane, których nie można w nich uwzględnić. Właśnie po to, aby pozyskać te dwa rodzaje danych, wykorzystuje się specjalnie zorganizowane obserwacje statystyczne – różnego rodzaju badania ankietowe i spisy powszechne.

Badania statystyczne- są to specjalnie zorganizowane obserwacje, podczas których obserwowany jest badany zespół zjawisk w określonym przedziale czasu.

Spis ludności– jest to forma specjalnie zorganizowanej obserwacji statystycznej, podczas której badany zbiór zjawisk obserwuje się w pewnym terminie (w pewnym momencie).

2. Na podstawie czasu Wszystkie obserwacje statystyczne dzielą się na ciągłe i nieciągłe.

Ciągła (bieżąca) obserwacja statystyczna- Jest to obserwacja prowadzona w sposób ciągły w czasie. Przy tego rodzaju obserwacji poszczególne zjawiska, fakty i zdarzenia są rejestrowane w miarę ich występowania.


Przerywana obserwacja statystyczna– jest to obserwacja, w której rejestrowane są obserwowane zjawiska, fakty, zdarzenia nie w sposób ciągły, lecz w okresach o jednakowym lub nierównym czasie trwania. Istnieją dwa rodzaje monitoringu ciągłego – okresowy i jednorazowy. Okresowy nazywa się obserwacją nieciągłą, która jest prowadzona w okresach o jednakowej długości. Jeden raz nazywa się obserwacją prowadzoną w okresach o nierównym czasie trwania lub o jednorazowym charakterze.

3. Na podstawie kompletności pokrycia badanej masy zjawiska, fakty, zdarzenia, obserwacje statystyczne dzielą się na ciągłe i nieciągłe, czyli częściowe.

Ciągła obserwacja ma na celu uwzględnienie wszystkich bez wyjątku zjawisk, faktów, zdarzeń tworzących badaną populację.

Częściowa obserwacja ma na celu uwzględnienie tylko określonej części zjawisk, faktów, wydarzeń tworzących badaną populację.

Koncepcja badania ilościowych aspektów obiektów i zjawisk powstała dawno temu, od momentu, gdy człowiek rozwinął podstawowe umiejętności pracy z informacją. Jednak termin „statystyka”, który sprowadził się do naszych czasów, został zapożyczony z języka łacińskiego znacznie później i pochodzi od słowa „status”, co oznacza „pewien stan rzeczy”. „Status” był również używany w znaczeniu „państwa politycznego” i został utrwalony w prawie wszystkich językach europejskich w tym znaczeniu semantycznym: angielskim „państwie”, niemieckim „Staat”, włoskim „stato” i jego pochodnej „ statista” – ekspert od państwa.

Słowo „statystyka” było szeroko stosowane w XVIII wieku i oznaczało „naukę państwową”. Statystyka to dziedzina działalności praktycznej, której celem jest gromadzenie, przetwarzanie, analizowanie i udostępnianie do użytku publicznego danych o zjawiskach i procesach życia społecznego.

Analiza to metoda naukowego badania obiektu poprzez rozważenie jego poszczególnych aspektów i komponentów.

Analiza ekonomiczno-statystyczna to rozwój metodologii opartej na powszechnym stosowaniu tradycyjnych metod statystycznych i matematyczno-statystycznych w celu kontroli odpowiedniego odzwierciedlenia badanych zjawisk i procesów.

Etapy badań statystycznych. Badania statystyczne przebiegają w trzech etapach:

  • 1) obserwacja statystyczna;
  • 2) podsumowanie uzyskanych danych;
  • 3) analiza statystyczna.

W pierwszym etapie zbierane są pierwotne dane statystyczne metodą obserwacji mas.

W drugim etapie badań statystycznych zebrane dane poddawane są pierwotnemu przetwarzaniu, podsumowywaniu i grupowaniu. Metoda grupowania pozwala na identyfikację populacji jednorodnych i podzielenie ich na grupy i podgrupy. Podsumowaniem jest uzyskanie wyników dla populacji jako całości oraz jej poszczególnych grup i podgrup.

Wyniki grupowania i podsumowania przedstawiono w formie tabel statystycznych. Główną treścią tego etapu jest przejście od charakterystyki każdej jednostki obserwacyjnej do sumarycznej charakterystyki populacji jako całości lub jej grup.

W trzecim etapie uzyskane dane zbiorcze analizuje się metodą wskaźników uogólniających (wartości bezwzględne, względne i średnie, wskaźniki zmienności, systemy indeksowe, metody statystyki matematycznej, metoda tabelaryczna, metoda graficzna itp.).

Podstawy analizy statystycznej:

  • 1) zatwierdzanie faktów i ustalanie ich oceny;
  • 2) określenie charakterystycznych cech i przyczyn zjawiska;
  • 3) porównanie zjawiska ze zjawiskami normatywnymi, planowanymi i innymi, które stanowią podstawę porównania;
  • 4) formułowanie wniosków, prognoz, założeń i hipotez;
  • 5) statystyczne badanie postawionych założeń (hipotez).

Analiza i uogólnienie danych statystycznych jest końcowym etapem badań statystycznych, którego ostatecznym celem jest wyciągnięcie wniosków teoretycznych i wniosków praktycznych na temat tendencji i wzorców badanych zjawisk i procesów społeczno-gospodarczych. Celem analizy statystycznej jest: określenie i ocena specyfiki i charakterystyki badanych zjawisk i procesów, badanie ich struktury, zależności i wzorców ich rozwoju.

Analiza statystyczna danych prowadzona jest nierozerwalnie w związku z teoretyczną, jakościową analizą istoty badanych zjawisk i odpowiednich narzędzi ilościowych, badaniem ich struktury, powiązań i dynamiki.

Analiza statystyczna to badanie charakterystycznych cech struktury, zależności zjawisk, trendów, wzorców rozwoju zjawisk społeczno-gospodarczych, do badania których wykorzystuje się określone metody ekonomiczno-statystyczne i matematyczno-statystyczne. Analiza statystyczna kończy się interpretacją uzyskanych wyników.

W analizie statystycznej znaki dzieli się ze względu na charakter ich wzajemnego oddziaływania:

  • 1. Cecha wynikowa – cecha analizowana w niniejszym badaniu. Na indywidualne wymiary takiej cechy w poszczególnych elementach populacji wpływa jedna lub więcej innych cech. Innymi słowy, atrybut wyniku jest uważany za konsekwencję interakcji innych czynników;
  • 2. Współczynnik znaku - znak wpływający na badaną cechę (znak-wynik). Co więcej, związek między atrybutem czynnika a atrybutem wyniku można określić ilościowo. Synonimy tego terminu w statystyce to „charakterystyka czynnikowa”, „czynnik”. Należy rozróżnić pojęcia atrybutu czynnika i atrybutu wagi. Cecha wagi jest cechą, którą należy uwzględnić w obliczeniach. Ale cecha wagi nie wpływa na badaną cechę. Atrybut czynnikowy można uznać za atrybut wagowy, czyli uwzględniany w obliczeniach, ale nie każdy atrybut wagowy jest atrybutem czynnikowym. Przykładowo, badając w grupie studentów zależność pomiędzy czasem przygotowania do egzaminu a liczbą punktów uzyskanych na egzaminie, należy wziąć pod uwagę także trzecią cechę: „Liczba osób certyfikowanych na określony wynik .” Ta ostatnia cecha nie ma wpływu na wynik, jednak zostanie uwzględniona w obliczeniach analitycznych. To właśnie ten rodzaj atrybutu nazywany jest atrybutem wagi, a nie atrybutem czynnika.

Przed przystąpieniem do analizy należy sprawdzić, czy spełnione są warunki zapewniające jej rzetelność i poprawność:

  • - Wiarygodność pierwotnych danych cyfrowych;
  • - Kompletność objęcia badaniem populacji;
  • - Porównywalność wskaźników (według jednostek rozliczeniowych, terytorium, metody obliczeniowej).

Główne pojęcia analizy statystycznej to:

  • 1. Hipoteza;
  • 2. Funkcja decyzyjna i reguła rozstrzygająca;
  • 3. Próba z populacji ogólnej;
  • 4. Ocena cech populacji ogólnej;
  • 5. Przedział ufności;
  • 6. Trend;
  • 7. Zależność statystyczna.

Analiza jest końcowym etapem badań statystycznych, którego istotą jest rozpoznanie zależności i wzorców badanego zjawiska, sformułowanie wniosków i propozycji.

2.1 Projekt badania statystycznego

Systemy statystycznej analizy danych są nowoczesnym, efektywnym narzędziem badań statystycznych. Specjalne systemy analizy statystycznej, a także uniwersalne narzędzia - Excel, Matlab, Mathcad itp., dają szerokie możliwości przetwarzania danych statystycznych.

Jednak nawet najbardziej zaawansowane narzędzie nie zastąpi badacza, który musi sformułować cel badania, zebrać dane, dobrać metody, podejścia, modele i narzędzia do przetwarzania i analizy danych oraz zinterpretować uzyskane wyniki.

Rysunek 2.1 przedstawia schemat badania statystycznego.

Ryc. 2.1 - Schematyczny diagram badań statystycznych

Punktem wyjścia badań statystycznych jest sformułowanie problemu. Przy jego ustalaniu bierze się pod uwagę cel badania, jakie informacje są potrzebne i w jaki sposób zostaną one wykorzystane przy podejmowaniu decyzji.

Samo badanie statystyczne rozpoczyna się od etapu przygotowawczego. Na etapie przygotowawczym analitycy badają zadanie techniczne– dokument sporządzony przez Klienta badania. Zakres zadań musi jasno określać cele badania:

    określa się przedmiot badań;

    wymieniono założenia i hipotezy, które należy potwierdzić lub obalić w trakcie badania;

    opisuje, w jaki sposób wyniki badań zostaną wykorzystane;

    ramy czasowe, w których należy przeprowadzić badanie, oraz budżet badania.

Na podstawie specyfikacji technicznych jest on opracowywany analityczna struktura raportu- To, w każdej formie należy przedstawić wyniki badania, jak również program obserwacji statystycznych. Program stanowi listę znaków, które należy zarejestrować w trakcie procesu obserwacji (lub pytań, na które należy uzyskać wiarygodne odpowiedzi dla każdej badanej jednostki obserwacyjnej). O zawartości programu decydują zarówno cechy obserwowanego obiektu i cele badań, jak i wybrane przez analityków metody dalszego przetwarzania zebranych informacji.

Głównym etapem badań statystycznych jest zebranie niezbędnych danych i ich analiza.

Ostatnim etapem badania jest sporządzenie raportu analitycznego i przesłanie go klientowi.

Na ryc. Rysunek 2.2 przedstawia schemat analizy danych statystycznych.

Rys.2.2 – Główne etapy analizy statystycznej

2.2 Gromadzenie informacji statystycznych

Gromadzenie materiałów polega na analizie specyfikacji technicznych badania, identyfikacji źródeł niezbędnych informacji oraz (w razie potrzeby) opracowaniu ankiet. Podczas wyszukiwania źródeł informacji wszystkie wymagane dane są dzielone na podstawowy(dane, które nie są dostępne i muszą zostać zebrane bezpośrednio na potrzeby tego badania), i wtórne(wcześniej zebrane do innych celów).

Gromadzenie danych wtórnych często określa się mianem badań „bibliotecznych” lub „bibliotecznych”.

Przykłady gromadzenia danych pierwotnych: obserwacja osób odwiedzających sklep, ankietowanie pacjentów szpitala, omawianie problemu na spotkaniu.

Dane wtórne dzielą się na wewnętrzne i zewnętrzne.

Przykłady wewnętrznych źródeł danych wtórnych:

    system informacyjny organizacji (w tym podsystem księgowy, podsystem zarządzania sprzedażą, CRM (system CRM, skrót od Customer Relationship Management) - oprogramowanie aplikacyjne dla organizacji zaprojektowane w celu automatyzacji strategii interakcji z klientami) i inne);

    poprzednie badania;

    pisemne raporty od pracowników.

Przykłady zewnętrznych źródeł danych wtórnych:

    raporty organów statystycznych i innych agencji rządowych;

    raporty agencji marketingowych, stowarzyszeń zawodowych itp.;

    elektroniczne bazy danych (katalogi adresowe, GIS itp.);

    biblioteki;

    środki masowego przekazu.

Główne wyniki na etapie gromadzenia danych to:

    planowana wielkość próby;

    struktura próby (obecność i wielkość kwot);

    rodzaj obserwacji statystycznej (zbieranie danych, ankieta, kwestionariusz, pomiar, eksperyment, badanie itp.);

    informacje o parametrach badania (np. możliwość fałszowania kwestionariuszy);

    schemat kodowania zmiennych w bazie programu wybranego do przetwarzania;

    plan konwersji danych;

    schemat planu zastosowanych procedur statystycznych.

Na tym samym etapie przeprowadzana jest sama procedura badania. Oczywiście kwestionariusze są opracowywane wyłącznie w celu uzyskania podstawowych informacji.

Otrzymane dane należy zredagować i odpowiednio przygotować. Każdy kwestionariusz lub formularz obserwacyjny jest sprawdzany i w razie potrzeby korygowany. Każdej odpowiedzi przypisany jest kod numeryczny lub literowy – informacja jest kodowana. Przygotowanie danych obejmuje edycję, transkrypcję i sprawdzenie danych, kodowanie oraz niezbędne przekształcenia.

2.3 Określenie cech próbki

Co do zasady dane zebrane w wyniku obserwacji statystycznej do analizy statystycznej stanowią populację próbną. Kolejność przekształcania danych w proces badań statystycznych można schematycznie przedstawić następująco (ryc. 2.3)

Rys. 2.3 Schemat konwersji danych statystycznych

Analizując próbę, można wyciągnąć wnioski na temat populacji reprezentowanej przez próbę.

Ostateczne określenie ogólnych parametrów pobierania próbek zostanie sporządzony po zebraniu wszystkich kwestionariuszy. Obejmuje:

    ustalenie faktycznej liczby respondentów,

    określenie struktury próby,

    rozkład według lokalizacji badania,

    ustalenie poziomu ufności statystycznej wiarygodności próby,

    obliczenie błędu statystycznego i określenie reprezentatywności próby.

Prawdziwa ilość respondentów może okazać się więcej lub mniej niż planowano. Pierwsza opcja jest lepsza do analizy, ale jest niekorzystna dla klienta badania. To drugie może mieć negatywny wpływ na jakość badań, a co za tym idzie, nie jest korzystne ani dla analityków, ani dla klientów.

Struktura próbkowania może mieć charakter losowy lub nielosowy (dobór respondentów odbywał się w oparciu o znane wcześniej kryterium, np. metodą kwotową). Próbki losowe są a priori reprezentatywne. Próbki nielosowe mogą być celowo niereprezentatywne dla populacji, ale dostarczać ważnych informacji do badań. W takim przypadku należy również dokładnie rozważyć pytania filtrujące kwestionariusza, które mają na celu specjalnie odfiltrować respondentów niespełniających wymagań.

Dla określenie trafności oceny Przede wszystkim należy ustawić poziom ufności (95% lub 99%). Potem maksimum błąd statystyczny próbkę oblicza się jako

Lub
,

Gdzie - wielkość próbki, - prawdopodobieństwo wystąpienia badanego zdarzenia (włączenie respondenta do próby), - prawdopodobieństwo zdarzenia odwrotnego (nieuwzględnienie respondenta w próbie), - współczynnik ufności,
- wariancja cechy.

Tabela 2.4 pokazuje najczęściej używane wartości prawdopodobieństwa ufności i współczynników ufności.

Tabela 2.4

2.5 Przetwarzanie danych na komputerze

Analiza danych za pomocą komputera wiąże się z wykonaniem szeregu niezbędnych kroków.

1. Określenie struktury danych źródłowych.

2. Wprowadzanie danych do komputera zgodnie z jego strukturą i wymaganiami programu. Edycja i konwersja danych.

3. Określenie sposobu przetwarzania danych zgodnie z celami badania.

4. Uzyskanie wyniku przetwarzania danych. Edytuj go i zapisz w wymaganym formacie.

5. Interpretacja wyniku przetwarzania.

Żaden program komputerowy nie jest w stanie wykonać kroku 1 (przygotowawczego) i 5 (końcowego) - badacz wykonuje je sam. Kroki 2-4 badacz wykonuje za pomocą programu, ale to badacz ustala niezbędne procedury edycji i przekształcania danych, metody przetwarzania danych, a także format prezentacji wyników przetwarzania. Pomoc komputera (kroki 2–4) ostatecznie polega na przejściu od długiego ciągu liczb do bardziej zwartego. Na „wejście” komputera badacz podaje szereg danych wyjściowych, które są niezrozumiałe, ale nadają się do komputerowego przetwarzania (krok 2). Następnie badacz wydaje programowi polecenie przetworzenia danych zgodnie z zadaniem i strukturą danych (krok 3). Na „wyjściu” otrzymuje wynik przetwarzania (krok 4) – także tablicę danych, tylko mniejszą, dostępną do zrozumienia i sensownej interpretacji. Jednocześnie wyczerpująca analiza danych zwykle wymaga wielokrotnego przetwarzania różnymi metodami.

2.6 Wybór strategii analizy danych

Wybór strategii analizy zebranych danych opiera się na znajomości teoretycznych i praktycznych aspektów badanej dziedziny, specyfice i znanych cechach informacji, właściwościach określonych metod statystycznych, a także doświadczeniu i poglądach badacz.

Należy pamiętać, że analiza danych nie jest ostatecznym celem badania. Jego celem jest uzyskanie informacji, które pomogą rozwiązać konkretny problem i podjąć właściwe decyzje zarządcze. Wybór strategii analizy należy rozpocząć od zbadania wyników poprzednich etapów procesu: zdefiniowania problemu i opracowania planu badawczego. Jako „szkic” stosowany jest wstępny plan analizy danych opracowany jako jeden z elementów planu badawczego. Następnie, gdy na późniejszych etapach procesu badawczego staną się dostępne dodatkowe informacje, może zaistnieć potrzeba wprowadzenia pewnych zmian.

Metody statystyczne dzielą się na jedno- i wielowymiarowe. Metody jednoczynnikowe stosuje się wtedy, gdy wszystkie elementy próby oceniane są za pomocą jednego wskaźnika lub gdy na każdy element przypada kilka takich wskaźników, ale każda zmienna jest analizowana oddzielnie od pozostałych.

Techniki wielowymiarowe doskonale nadają się do analizy danych, gdy do oceny każdego elementu próbki stosuje się dwie lub więcej miar, a zmienne te są analizowane jednocześnie. Metody takie służą do wyznaczania zależności pomiędzy zjawiskami.

Metody wielowymiarowe różnią się od metod jednowymiarowych przede wszystkim tym, że podczas ich stosowania uwaga przesuwa się z poziomów (średnich) i rozkładów (wariancji) zjawisk, a skupia się na stopniu powiązania (korelacji lub kowariancji) pomiędzy tymi zjawiskami.

Metody jednowymiarowe można klasyfikować na podstawie tego, czy analizowane dane są metryczne, czy niemetryczne (rysunek 3). Dane metryczne są mierzone w skali interwałowej lub skali względnej. Dane niemetryczne ocenia się w skali nominalnej lub porządkowej

Dodatkowo metody te są podzielone na klasy w zależności od tego, ile próbek – jedną, dwie lub więcej – analizuje się w badaniu.

Klasyfikację jednowymiarowych metod statystycznych przedstawiono na rys. 2.4.

Ryż. 2.4 Klasyfikacja jednoczynnikowych metod statystycznych w zależności od analizowanych danych

Liczbę próbek określa sposób postępowania z danymi w ramach konkretnej analizy, a nie sposób ich zebrania. Na przykład dane dotyczące mężczyzn i kobiet można uzyskać w ramach tej samej próby, ale jeśli analiza ma na celu identyfikację różnic w postrzeganiu ze względu na różnice płci, badacz będzie musiał operować na dwóch różnych próbach. Próbki uważa się za niezależne, jeśli nie są ze sobą powiązane eksperymentalnie. Pomiary wykonane w jednej próbce nie wpływają na wartości zmiennych w innej. Do analizy dane pochodzące z różnych grup respondentów, np. zebrane od kobiet i mężczyzn, traktuje się zwykle jako próbki niezależne.

Jeżeli natomiast dane z dwóch prób dotyczą tej samej grupy respondentów, próby uznaje się za parzysto-zależne.

Jeśli istnieje tylko jedna próbka danych metrycznych, można zastosować test z i test t. Jeżeli występują dwie lub więcej niezależnych próbek, w pierwszym przypadku można zastosować test z i t dla dwóch próbek, w drugim – metodę jednoczynnikowej analizy wariancji. W przypadku dwóch powiązanych próbek stosuje się test t dla par. Jeśli mówimy o danych niemetrycznych z pojedynczej próbki, badacz może zastosować testy rozkładu częstotliwości, test chi-kwadrat, test Kołmogorowa-Smirnowa (K~S), test szeregowy i test dwumianowy. W przypadku dwóch niezależnych próbek z danymi niemetrycznymi można zastosować następujące metody analizy: chi-kwadrat, Manna-Whitneya, mediany, K-S, jednokierunkowa analiza wariancji Kruskala-Wallisa (ANOVA). Natomiast jeśli istnieją dwie lub więcej powiązanych próbek, należy zastosować test znaku, McNemara i Wilcoxona.

Wielowymiarowe metody statystyczne mają na celu identyfikację istniejących wzorców: współzależności zmiennych, relacji lub sekwencji zdarzeń, podobieństwa międzyobiektowego.

Dość umownie możemy wyróżnić pięć standardowych typów wzorców, których badanie budzi duże zainteresowanie: asocjacja, sekwencja, klasyfikacja, grupowanie i prognozowanie

Powiązanie ma miejsce, gdy kilka zdarzeń jest ze sobą powiązanych. Przykładowo badanie przeprowadzone w supermarkecie może wykazać, że 65% osób kupujących chipsy kukurydziane kupuje także Coca-Colę, a jeśli na taki zestaw jest zniżka, to w 85% przypadków kupuje colę. Mając informację o takim powiązaniu, menedżerom łatwo jest ocenić skuteczność udzielanego rabatu.

Jeżeli istnieje łańcuch zdarzeń powiązanych w czasie, wówczas mówimy o sekwencji. Na przykład po zakupie domu w 45% przypadków w ciągu miesiąca kupuje się nowy piec kuchenny, a w ciągu dwóch tygodni 60% nowych mieszkańców kupuje lodówkę.

Za pomocą klasyfikacji identyfikowane są znaki charakteryzujące grupę, do której należy dany obiekt. Dokonuje się tego poprzez analizę już sklasyfikowanych obiektów i sformułowanie pewnego zbioru reguł.

Grupowanie różni się od klasyfikacji tym, że same grupy nie są z góry zdefiniowane. Za pomocą grupowania identyfikowane są różne jednorodne grupy danych.

Podstawą wszelkiego rodzaju systemów prognostycznych są informacje historyczne przechowywane w postaci szeregów czasowych. Jeśli uda się skonstruować wzorce, które adekwatnie odzwierciedlają dynamikę zachowania wskaźników docelowych, istnieje możliwość, że za ich pomocą możliwe będzie przewidzenie zachowania systemu w przyszłości.

Wielowymiarowe metody statystyczne można podzielić na metody analizy zależności i analizę klasyfikacyjną (rys. 2.5).

Rys. 2.5 – Klasyfikacja wielowymiarowych metod statystycznych