Stadier af socialstatistisk forskning. Statistisk observation: koncept, grundformer

Resultatet af den første fase af statistisk forskning - statistisk observation - er information, der karakteriserer hver enhed af den statistiske population. Imidlertid er evnen til at afspejle mønstre og tendenser i dynamikken i de fænomener, der undersøges, ved at bruge selv den mest komplette karakterisering af individuelle fakta begrænset. Sådanne data opnås kun som et resultat af statistiske opsummeringer. Et resumé er arrangementet, systematiseringen og generaliseringen af ​​statistiske data opnået under statistisk observation. Kun korrekt behandling af statistisk materiale gør det muligt at identificere essensen af ​​socioøkonomiske fænomener, de karakteristiske træk og væsentlige træk ved individuelle typer og at opdage mønstre og tendenser i deres udvikling. Der er simple og grupperapporter, eller rapporter i snæver og bred forstand. En simpel opsummering er beregningen af ​​de samlede resultater i grupper og undergrupper og præsentationen af ​​dette materiale i tabeller. Som et resultat af et simpelt resumé af statistiske data er det muligt at bestemme antallet af virksomheder, det samlede antal ansatte og mængden af ​​producerede produkter i monetære termer. Disse overordnede resultater er primært til informationsformål. De giver en generaliseret karakteristik af befolkningen i form af absolutte værdier.

Group summary, eller summary i bred forstand, er en kompleks proces med multilateral behandling af primære statistiske data, dvs. data opnået som følge af observation. Det omfatter gruppering af statistiske data, udvikling af et system af indikatorer til at karakterisere grupper, beregning af gruppe- og overordnede resultater og beregning af generaliserende indikatorer. Opgaven for det statistiske resumé som anden fase af statistisk forskning er at opnå generelle indikatorer til information, reference og analytiske formål. Sammenfatningen af ​​massestatistiske data udføres i henhold til et forududviklet program og plan. Under programudviklingsprocessen fastlægges resuméets emne og prædikat. Faget er genstand for undersøgelse, opdelt i grupper og undergrupper. Prædikat - indikatorer, der karakteriserer resuméets emne. Det sammenfattende program er bestemt af målene for den statistiske undersøgelse.

Den statistiske opsummering udføres efter en på forhånd optegnet plan. Opsummeringsmæssigt behandles spørgsmål om, hvordan man udfører arbejdet med at opsummere information - manuelt eller mekanisk, og om rækkefølgen af ​​individuelle summeringsoperationer. Deadlines for gennemførelse af hver etape og resuméet som helhed fastlægges, samt metoder til præsentation af resuméets resultater. Det kan være fordelingsrækker, statistiske tabeller og statistiske grafer.

Hovedstadier af statistisk forskning

Lad os overveje den vigtigste metode til statistik - statistisk observation.

Brug af forskellige statistiske metoder og teknikker

forudsætter tilgængelighed af omfattende og pålidelig information om det, der undersøges

objekt. Studiet af sociale massefænomener omfatter indsamlingsstadier

statistiske oplysninger og deres primære behandling, information og gruppering

observationsresultater i visse aggregater, generalisering og analyse

modtagne materialer.

På den første fase af statistisk forskning, primær

statistiske data, eller rå statistisk information, der

er grundlaget for den fremtidige statistiske bygning. Så bygningen er

dens fundament skal være stærkt, sundt og af høj kvalitet. Hvis ved afhentning

der var en fejl i de primære statistiske data, eller materialet viste sig at være det

af dårlig kvalitet, vil det påvirke rigtigheden og pålideligheden af ​​begge

teoretiske og praktiske konklusioner. Derfor statistisk

observation fra den indledende til den sidste fase - opnå den endelige

materialer - skal være nøje gennemtænkt og overskueligt organiseret.

Statistisk observation giver kildematerialet til generalisering, begyndelsen

som resuméet tjener. Hvis der under statistisk observation om hver af sine

enhed modtager information, der karakteriserer den fra mange aspekter, derefter dataene

rapporter karakteriserer hele den statistiske population og dens enkelte dele.

På dette stadium er helheden opdelt efter forskelle og forenet efter

tegn på lighed, samlede indikatorer beregnes for grupper og i

generelt. Ved hjælp af grupperingsmetoden opdeles de fænomener, der undersøges, i de vigtigste

typer, karakteristiske grupper og undergrupper efter væsentlige karakteristika. Ved hjælp af

grupperinger er begrænset af kvalitativt homogene i væsentlige henseender

helhed, hvilket er en forudsætning for definitionen og anvendelsen

generaliserende indikatorer.

På den sidste fase af analyse ved hjælp af generaliserende indikatorer

relative og gennemsnitlige værdier beregnes, og der gives en sammenfattende vurdering

variationer af tegn, fænomenernes dynamik karakteriseres, indekser bruges,

balancekonstruktioner beregnes indikatorer, der karakteriserer trængsel

sammenhænge i ændringer i karakteristika. Med henblik på det mest rationelle og visuelle

Præsentation af digitalt materiale præsenteres i form af tabeller og grafer.

3.Statistisk observation: koncept, grundformer.

Dette er videnskabeligt og organisatorisk arbejde med dataindsamling. Formularer:stat. 1) indberetning, kat. er baseret på bilagsregnskab. Siden 1998 er der blevet indført 4 forenede former for forbundsstatstilsyn: FP-1 (produktion af virksomheder), FP-2 (investering), FP-3 (organisationers finansielle tilstand), FP-4 (antal - antal arbejdere, arbejdskraft), 2) specielt organiseret observation (folketælling), 3) register - dette er et sæt af enheder, cat.har-t for hver observationsenhed: registre over os - forskning, produktion, byggeri og entreprenørorganisationer, detail- og engroshandel handle. Typer af observation: 1) kontinuerlig, ikke-kontinuerlig (selektiv, kvalificeret baseret på hovedarraymetoden, monografi). Observationen kan være aktuel, periodisk, engangs. Metoder til observation: direkte, dokumentarisk, undersøgelse (ekspedition, spørgeskema, personlig optræden, korrespondance). Statistiske observationer udføres i henhold til en plan, som omfatter: program- og metodiske spørgsmål (mål, mål), organisatoriske spørgsmål (tid, sted). Som følge af de udførte observationer opstår der fejl, som reducerer nøjagtigheden af ​​observationerne, så der udføres datakontrol (logisk og tællende). Som et resultat af at kontrollere pålideligheden af ​​dataene afsløres følgende observationsfejl: tilfældig. fejl (registreringsfejl), forsætlige fejl, utilsigtede fejl. (systemisk og ikke-systemisk), repræsentativitetsfejl (repræsentativitet).

Program- og metodologiske spørgsmål om statistisk observation.

Program- og metodologiske spørgsmål om statistisk observation

Hver observation udføres til et bestemt formål. Når du udfører det, er det nødvendigt at fastslå, hvad der er genstand for undersøgelse. Følgende problemer skal løses:

Observationsobjekt – et sæt af objekter og fænomener, hvorfra information skal indsamles. Når du definerer et objekt, er dets vigtigste karakteristiske træk (tegn) angivet. Ethvert objekt for masseobservation består af individuelle enheder, så det er nødvendigt at løse spørgsmålet om, hvilket element af aggregatet, der vil tjene som observationsenhed.

Observationsenhed – dette er et komponentelement i en genstand, som er bæreren af ​​kendetegn, der er underlagt registrering, og grundlaget for kontoen.

Folketælling – disse er visse kvantitative restriktioner for observationsobjektet.

Skilt - dette er en egenskab, der kendetegner visse træk og karakteristika, der er iboende i enheder af den befolkning, der undersøges.

Organisatoriske spørgsmål vedrørende statistisk observation.

Observationsprogrammet udarbejdes i form af skemaer (spørgeskemaer, skemaer), hvori primære data indtastes. En nødvendig tilføjelse til skemaerne er instruktioner, der forklarer betydningen af ​​spørgsmålene.

Organisatoriske spørgsmål i programmet omfatter:

observationsperiode;

kritisk observationsmoment;

forberedende arbejde;

Den observationsperiode, som de registrerede oplysninger vedrører. Kaldes objektiv observationstid. Dette kan være en bestemt tidsperiode (dag, årti, måned) eller et bestemt øjeblik. Det øjeblik, som den registrerede information vedrører, kaldes det kritiske observationsmoment.

For eksempel det kritiske øjeblik af mikro-folketællingen i 94. var klokken 0.00 natten til den 13.-14. februar. Ved at etablere det kritiske observationsmoment er det muligt at bestemme tingenes sande tilstand med fotografisk nøjagtighed.

Forberedende arbejde involverer at sørge for overvågning med dokumenter samt udarbejdelse af en liste over rapporteringsenheder, formularer og instruktioner.

Dokumenter vil blive udfyldt under observationen eller baseret på dens resultater.

Et vigtigt sted i systemet med forberedende arbejde er udvælgelse og uddannelse af personale samt orientering af dem, der vil deltage i observationen.

Enhver statistisk undersøgelse er baseret på tre indbyrdes forbundne stadier af arbejdet:

1) statistisk observation;

2) sammenfatning og gruppering af observationsdata;

3) videnskabelig bearbejdning og analyse af de sammenfattende resultater. Hver efterfølgende fase af en statistisk undersøgelse kan udføres, forudsat at de tidligere (forudgående) faser af arbejdet er blevet udført.

Statistisk observation er den første fase af statistisk forskning.

Statistisk observation er en systematisk, videnskabeligt organiseret indsamling af information om et bestemt sæt sociale og især økonomiske fænomener eller processer.

Statistiske observationer er meget forskellige og adskiller sig i arten af ​​de fænomener, der undersøges, organisationsformen, observationstidspunktet og fuldstændigheden af ​​dækningen af ​​de fænomener, der undersøges. I den forbindelse blev det gennemført klassificering af statistiske observationer efter individuelle karakteristika .

1. Efter organisationsformen statistiske observationer er opdelt i rapportering og særligt organiserede statistiske observationer.

Indberetning– dette er den vigtigste organisatoriske form for statistisk observation, som går ud på at indsamle oplysninger fra virksomheder, institutioner og organisationer om forskellige aspekter af deres aktiviteter på særlige formularer kaldet rapporter. Indberetning er obligatorisk. Rapportering er opdelt i basis og løbende afhængig af varigheden af ​​den periode, den udarbejdes for.

Grundlæggende rapportering også kaldet årligt og indeholder det bredeste udvalg af indikatorer, der dækker alle aspekter af virksomhedens aktiviteter.

Aktuel rapportering præsenteret i løbet af året i perioder af varierende varighed.

Der er dog data, som grundlæggende er umulige at få ud fra rapportering, og data, som er uhensigtsmæssige at medtage i dem. Det er for at indhente disse to typer data, der anvendes særligt organiserede statistiske observationer - forskellige typer undersøgelser og folketællinger.

Statistiske undersøgelser- disse er specielt organiserede observationer, hvor det undersøgte sæt af fænomener observeres over en vis periode.

Folketælling– dette er en form for specielt organiseret statistisk observation, hvor det undersøgte sæt af fænomener observeres på en eller anden dato (på et tidspunkt).

2. Baseret på tid Alle statistiske observationer er opdelt i kontinuerlige og diskontinuerlige.

Kontinuerlig (aktuel) statistisk observation- Det er en observation, der bliver gennemført løbende over tid. Med denne type observation registreres individuelle fænomener, fakta og begivenheder, efterhånden som de opstår.


Intermitterende statistisk observation- dette er en observation, hvor de observerede fænomener, kendsgerninger, begivenheder registreres ikke kontinuerligt, men gennem perioder af samme eller ulige varighed. Der er to typer kontinuerlig overvågning - periodisk og engangsovervågning. Periodisk kaldet diskontinuerlig observation, som udføres over perioder af samme varighed. En gang kaldes observation, der udføres over perioder af ulige varighed eller af engangskarakter.

3. Baseret på fuldstændigheden af ​​dækningen af ​​den undersøgte masse fænomener, fakta, begivenheder, statistiske observationer er opdelt i kontinuerlige og ikke-kontinuerlige eller delvise.

Kontinuerlig observation har til formål at tage højde for alle, uden undtagelse, fænomener, fakta, begivenheder, der udgør den undersøgte befolkning.

Delvis observation har til formål kun at tage højde for en vis del af de fænomener, fakta, begivenheder, der udgør den undersøgte befolkning.

Konceptet med at studere de kvantitative aspekter af objekter og fænomener blev dannet for længe siden, fra det øjeblik en person udviklede grundlæggende færdigheder i at arbejde med information. Begrebet "statistik", som er kommet ned til vor tid, er dog langt senere lånt fra det latinske sprog og kommer fra ordet "status", som betyder "en bestemt tilstand af tingene". "Status" blev også brugt i betydningen "politisk stat" og blev fastsat på næsten alle europæiske sprog i denne semantiske betydning: den engelske "stat", den tyske "Staat", den italienske "stato" og dens afledte "state" statista” - en ekspert i staten.

Ordet "statistik" fik udbredt brug i det 18. århundrede og blev brugt til at betyde "statsvidenskab." Statistik er en gren af ​​praktisk aktivitet, der sigter mod at indsamle, bearbejde, analysere og give offentligt brug af data om fænomener og processer i det sociale liv.

Analyse er en metode til videnskabelig undersøgelse af et objekt ved at overveje dets individuelle aspekter og komponenter.

Økonomisk-statistisk analyse er udviklingen af ​​en metodologi baseret på den udbredte brug af traditionelle statistiske og matematisk-statistiske metoder for at kontrollere den passende afspejling af de fænomener og processer, der undersøges.

Stadier af statistisk forskning. Statistisk forskning foregår i tre faser:

  • 1) statistisk observation;
  • 2) resumé af de indhentede data;
  • 3) statistisk analyse.

I første fase indsamles primære statistiske data ved hjælp af masseobservationsmetoden.

På anden fase af statistisk forskning gennemgår de indsamlede data primær behandling, sammenfatning og gruppering. Grupperingsmetoden giver dig mulighed for at identificere homogene populationer og opdele dem i grupper og undergrupper. Et resumé er opnåelsen af ​​resultater for befolkningen som helhed og dens individuelle grupper og undergrupper.

Grupperingen og sammenfattende resultater præsenteres i form af statistiske tabeller. Hovedindholdet i denne fase er overgangen fra hver observationsenheds karakteristika til de sammenfattende karakteristika for befolkningen som helhed eller dens grupper.

På tredje trin analyseres de opnåede oversigtsdata ved hjælp af metoden til generalisering af indikatorer (absolutte, relative og gennemsnitlige værdier, variationsindikatorer, indekssystemer, metoder til matematisk statistik, tabelmetode, grafisk metode osv.).

Grundlæggende om statistisk analyse:

  • 1) godkendelse af fakta og fastlæggelse af deres vurdering;
  • 2) at identificere de karakteristiske træk og årsager til fænomenet;
  • 3) sammenligning af fænomenet med normative, planlagte og andre fænomener, der tages som grundlag for sammenligning;
  • 4) formulering af konklusioner, prognoser, antagelser og hypoteser;
  • 5) statistisk test af de fremsatte antagelser (hypoteser).

Analyse og generalisering af statistiske data er den sidste fase af statistisk forskning, hvis endelige mål er at opnå teoretiske konklusioner og praktiske konklusioner om tendenserne og mønstrene for de socioøkonomiske fænomener og processer, der studeres. Målene for statistisk analyse er: at bestemme og vurdere specificiteten og karakteristika ved de fænomener og processer, der studeres, studere deres struktur, sammenhænge og mønstre for deres udvikling.

Statistisk analyse af data udføres i uløselig sammenhæng med en teoretisk, kvalitativ analyse af essensen af ​​de undersøgte fænomener og de tilsvarende kvantitative værktøjer, studiet af deres struktur, forbindelser og dynamik.

Statistisk analyse er studiet af de karakteristiske træk ved strukturen, forhold mellem fænomener, tendenser, udviklingsmønstre for socioøkonomiske fænomener, for hvilke der anvendes specifikke økonomisk-statistiske og matematisk-statistiske metoder. Statistisk analyse afsluttes med fortolkningen af ​​de opnåede resultater.

I statistisk analyse er tegn opdelt efter arten af ​​deres indflydelse på hinanden:

  • 1. Resultategenskab - egenskaben analyseret i denne undersøgelse. De individuelle dimensioner af et sådant træk i individuelle elementer af befolkningen er påvirket af et eller flere andre træk. Med andre ord betragtes resultat-attributten som en konsekvens af samspillet mellem andre faktorer;
  • 2. Tegn-faktor - et tegn, der påvirker karakteristikken under undersøgelse (tegn-resultat). Desuden kan forholdet mellem faktor-attributten og resultat-attributten bestemmes kvantitativt. Synonymer for dette udtryk i statistik er "faktorkarakteristik", "faktor". Det er nødvendigt at skelne mellem begreberne faktor-attribut og vægt-attribut. En vægtfunktion er en egenskab, der skal tages i betragtning ved beregninger. Men vægtegenskaben påvirker ikke den egenskab, der undersøges. En faktoregenskab kan betragtes som en vægtegenskab, dvs. tages i betragtning i beregninger, men ikke hver vægtegenskab er en faktoregenskab. For eksempel, når man studerer i en gruppe studerende forholdet mellem tid til at forberede sig til en eksamen og antallet af point modtaget på eksamen, bør den tredje egenskab også tages i betragtning: "Antallet af personer, der er certificeret til en bestemt score ." Den sidste funktion påvirker ikke resultatet, den vil dog indgå i de analytiske beregninger. Det er denne slags egenskaber, der kaldes en vægtegenskab, og ikke en faktoregenskab.

Før analysen påbegyndes, er det nødvendigt at kontrollere, om betingelserne er opfyldt for at sikre dens pålidelighed og korrekthed:

  • - Pålidelighed af primære digitale data;
  • - Fuldstændigheden af ​​dækningen af ​​den befolkning, der undersøges;
  • - Sammenlignelighed af indikatorer (efter regnskabsenheder, territorium, beregningsmetode).

Hovedbegreberne for statistisk analyse er:

  • 1. Hypotese;
  • 2. Afgørende funktion og afgørende regel;
  • 3. Prøve fra den generelle befolkning;
  • 4. Vurdering af karakteristika for den almindelige befolkning;
  • 5. Konfidensinterval;
  • 6. Trend;
  • 7. Statistisk sammenhæng.

Analyse er den sidste fase af statistisk forskning, hvis essens er at identificere sammenhænge og mønstre for det fænomen, der undersøges, formulere konklusioner og forslag.

2.1 Statistisk undersøgelsesdesign

Statistiske dataanalysesystemer er et moderne, effektivt værktøj til statistisk forskning. Særlige statistiske analysesystemer, samt universelle værktøjer - Excel, Matlab, Mathcad osv., har rig mulighed for at behandle statistiske data.

Men selv det mest avancerede værktøj kan ikke erstatte forskeren, som skal formulere formålet med undersøgelsen, indsamle data, udvælge metoder, tilgange, modeller og værktøjer til bearbejdning og analyse af data og fortolke de opnåede resultater.

Figur 2.1 viser et diagram over den statistiske undersøgelse.

Fig. 2.1 - Skematisk diagram af statistisk forskning

Udgangspunktet for statistisk forskning er problemformuleringen. Ved fastlæggelsen tages der hensyn til formålet med undersøgelsen, hvilke oplysninger der er nødvendige, og hvordan de vil blive brugt, når der skal træffes en beslutning.

Selve den statistiske undersøgelse begynder med den forberedende fase. I den forberedende fase studerer analytikere teknisk opgave– et dokument udarbejdet af undersøgelsens kunde. Kommissoriet skal klart angive formålene med forskningen:

    genstanden for forskningen er bestemt;

    antagelser og hypoteser, der skal bekræftes eller afkræftes i løbet af undersøgelsen, er anført;

    beskriver, hvordan forskningsresultaterne vil blive brugt;

    den tidsramme undersøgelsen skal gennemføres inden for og budgettet for undersøgelsen.

Ud fra de tekniske specifikationer er den udviklet analytisk rapportstruktur- At, i enhver form undersøgelsens resultater skal fremlægges, samt statistisk observationsprogram. Programmet er en liste over tegn, der skal registreres under observationsprocessen (eller spørgsmål, som der skal opnås pålidelige svar på for hver undersøgt observationsenhed). Indholdet af programmet bestemmes både af det observerede objekts karakteristika og undersøgelsens mål, samt af de metoder, analytikere har valgt til videre bearbejdning af den indsamlede information.

Hovedstadiet af statistisk forskning omfatter indsamling af nødvendige data og deres analyse.

Den sidste fase af undersøgelsen er at udarbejde en analytisk rapport og sende den til kunden.

I fig. Figur 2.2 viser et diagram over statistisk dataanalyse.

Fig.2.2 – Hovedstadier af statistisk analyse

2.2 Indsamling af statistiske oplysninger

Indsamling af materialer involverer at analysere undersøgelsens tekniske specifikationer, identificere kilder til nødvendig information og (om nødvendigt) udvikling af spørgeskemaer. Når man undersøger informationskilder, er alle nødvendige data opdelt i primær(data, der ikke er tilgængelige og skal indsamles direkte til denne undersøgelse), og sekundær(tidligere indsamlet til andre formål).

Sekundær dataindsamling omtales ofte som "skrivebords"- eller "biblioteks"-forskning.

Eksempler på indsamling af primære data: observation af butiksbesøgende, undersøgelse af hospitalspatienter, drøftelse af et problem på et møde.

Sekundære data er opdelt i interne og eksterne.

Eksempler på interne sekundære datakilder:

    organisationens informationssystem (herunder et regnskabsundersystem, et salgsstyringsundersystem, CRM (CRM-system, forkortelse for Customer Relationship Management) - applikationssoftware til organisationer designet til at automatisere strategier til interaktion med kunder) og andre);

    tidligere undersøgelser;

    skriftlige rapporter fra medarbejdere.

Eksempler på eksterne sekundære datakilder:

    rapporter fra statistiske organer og andre statslige organer;

    rapporter fra marketingbureauer, faglige sammenslutninger osv.;

    elektroniske databaser (adressemapper, GIS osv.);

    biblioteker;

    massemedier.

De vigtigste output på dataindsamlingsstadiet er:

    planlagt stikprøvestørrelse;

    stikprøvestruktur (tilstedeværelse og størrelse af kvoter);

    type statistisk observation (dataindsamling, undersøgelse, spørgeskema, måling, eksperiment, undersøgelse osv.);

    oplysninger om undersøgelsesparametre (for eksempel muligheden for forfalskning af spørgeskemaer);

    skema til kodning af variabler i databasen for det program, der er valgt til behandling;

    datakonverteringsplan;

    plandiagram over de anvendte statistiske procedurer.

Denne samme fase omfatter selve undersøgelsesproceduren. Spørgeskemaer udvikles naturligvis kun for at indhente primær information.

De modtagne data skal redigeres og forberedes i overensstemmelse hermed. Hvert spørgeskema eller observationsskema kontrolleres og justeres om nødvendigt. Hvert svar er tildelt numeriske eller bogstavkoder - informationen er kodet. Dataforberedelse omfatter redigering, transskribering og kontrol af data, kodning og nødvendige transformationer.

2.3 Bestemmelse af prøvens karakteristika

Som regel er data indsamlet som et resultat af statistisk observation til statistisk analyse en stikprøvepopulation. Sekvensen af ​​datatransformation til processen med statistisk forskning kan skematisk repræsenteres som følger (fig. 2.3)

Fig 2.3 Konverteringsskema for statistiske data

Ved at analysere en stikprøve er det muligt at drage konklusioner om den population, stikprøven repræsenterer.

Endelig bestemmelse af generelle prøveudtagningsparametre udarbejdet, når alle spørgeskemaer er indsamlet. Det omfatter:

    at bestemme det faktiske antal respondenter,

    bestemmelse af prøveudtagningsstrukturen,

    fordeling efter undersøgelsessted,

    etablering af et konfidensniveau for stikprøvens statistiske pålidelighed

    beregning af statistisk fejl og bestemmelse af stikprøvens repræsentativitet.

Virkelig mængde respondenterne kan vise sig at være mere eller mindre end planlagt. Den første mulighed er bedre til analyse, men er ufordelagtig for kunden af ​​undersøgelsen. Den anden kan have en negativ indvirkning på kvaliteten af ​​undersøgelsen og er derfor ikke gavnlig for hverken analytikere eller kunder.

Prøveudtagningsstruktur kan være tilfældige eller ikke-tilfældige (respondenterne blev udvalgt ud fra et tidligere kendt kriterium, for eksempel ved kvotemetoden). Stikprøver er a priori repræsentative. Ikke-tilfældige prøver kan være bevidst ikke-repræsentative for befolkningen, men giver vigtig information til forskning. I dette tilfælde bør du også nøje overveje spørgeskemaets filtreringsspørgsmål, som er designet specifikt til at bortfiltrere respondenter, der ikke opfylder kravene.

Til bestemme nøjagtigheden af ​​vurderingen Først og fremmest er det nødvendigt at indstille konfidensniveauet (95 % eller 99 %). Så det maksimale statistisk fejl prøven beregnes som

eller
,

Hvor - prøvestørrelse, - sandsynligheden for, at den undersøgte begivenhed indtræffer (respondenten er inkluderet i stikprøven) - sandsynligheden for den modsatte begivenhed (respondenten er ikke inkluderet i stikprøven) - tillidskoefficient,
- varians af karakteristikken.

Tabel 2.4 viser de mest anvendte værdier for konfidenssandsynlighed og konfidenskoefficienter.

Tabel 2.4

2.5 Databehandling på en computer

At analysere data ved hjælp af en computer involverer at udføre en række nødvendige trin.

1. Bestemmelse af strukturen af ​​kildedataene.

2. Indtastning af data i computeren i overensstemmelse med dens struktur og programkrav. Redigering og konvertering af data.

3. Angivelse af en databehandlingsmetode i overensstemmelse med undersøgelsens formål.

4. Indhentning af resultatet af databehandling. Redigering og lagring i det ønskede format.

5. Fortolkning af bearbejdningsresultatet.

Intet computerprogram kan udføre trin 1 (forberedende) og 5 (afsluttende) - forskeren gør dem selv. Trin 2-4 udføres af forskeren ved hjælp af programmet, men det er forskeren, der bestemmer de nødvendige procedurer for redigering og transformation af data, metoder til databehandling samt formatet for præsentation af bearbejdningsresultaterne. Computerens hjælp (trin 2-4) involverer i sidste ende at flytte fra en lang række tal til en mere kompakt. Ved "input" af computeren indsender forskeren en række indledende data, der er utilgængelige for forståelse, men egnet til computerbehandling (trin 2). Derefter giver forskeren programmet en kommando om at behandle dataene i overensstemmelse med opgaven og datastrukturen (trin 3). Ved "outputtet" modtager han resultatet af behandlingen (trin 4) - også en række data, kun mindre, tilgængelige for forståelse og meningsfuld fortolkning. Samtidig kræver en udtømmende analyse af data som regel gentagen bearbejdning med forskellige metoder.

2.6 Valg af dataanalysestrategi

Valget af strategi for analyse af de indsamlede data er baseret på viden om de teoretiske og praktiske aspekter af det undersøgte fagområde, oplysningernes særlige og kendte karakteristika, egenskaberne ved specifikke statistiske metoder samt erfaringer og synspunkter vedr. forskeren.

Det skal huskes, at dataanalyse ikke er det endelige mål for undersøgelsen. Dens mål er at indhente information, der hjælper med at løse et specifikt problem og træffe passende ledelsesbeslutninger. Valget af analysestrategi bør begynde med en undersøgelse af resultaterne af de foregående faser af processen: definition af problemet og udvikling af en forskningsplan. En foreløbig dataanalyseplan udviklet som et element i en forskningsplan bruges som et "udkast". Efterhånden som yderligere information bliver tilgængelig på senere stadier af forskningsprocessen, kan det være nødvendigt at foretage visse ændringer.

Statistiske metoder er opdelt i en- og multivariat. Univariate metoder anvendes, når alle elementer i prøven vurderes af én indikator, eller hvis der er flere af disse indikatorer for hvert element, men hver variabel analyseres separat fra alle de andre.

Multivariate teknikker er fremragende til dataanalyse, når to eller flere mål bruges til at evaluere hvert prøveelement, og disse variable analyseres samtidigt. Sådanne metoder bruges til at bestemme afhængigheder mellem fænomener.

Multivariate metoder adskiller sig fra univariate metoder primært ved, at når de bruges, flytter fokus for opmærksomhed fra niveauerne (gennemsnit) og distributioner (varianser) af fænomener og fokuserer på graden af ​​sammenhæng (korrelation eller kovarians) mellem disse fænomener.

Univariate metoder kan klassificeres baseret på, om de data, der analyseres, er metriske eller ikke-metriske (figur 3). Metriske data måles på en intervalskala eller en relativ skala. Ikke-metriske data vurderes på en nominel eller ordinal skala

Derudover er disse metoder opdelt i klasser baseret på hvor mange prøver - en, to eller flere - der analyseres i undersøgelsen.

Klassifikationen af ​​endimensionelle statistiske metoder er vist i fig. 2.4.

Ris. 2.4 Klassificering af univariate statistiske metoder afhængig af de analyserede data

Antallet af prøver bestemmes af, hvordan dataene håndteres til en bestemt analyse, ikke af hvordan dataene blev indsamlet. For eksempel kan data om mænd og kvinder indhentes inden for samme prøve, men hvis analysen sigter mod at identificere forskelle i opfattelse baseret på kønsforskelle, vil forskeren skulle operere med to forskellige prøver. Prøver betragtes som uafhængige, hvis de ikke er eksperimentelt relateret til hinanden. Målinger taget i en prøve påvirker ikke værdierne af variabler i en anden. Til analyse behandles data fra forskellige grupper af respondenter, såsom dem indsamlet fra kvinder og mænd, normalt som uafhængige stikprøver.

På den anden side, hvis data fra to stikprøver refererer til den samme gruppe af respondenter, betragtes prøverne som parret - afhængige.

Hvis der kun er én stikprøve af metriske data, kan z-test og t-test bruges. Hvis der er to eller flere uafhængige prøver, kan du i det første tilfælde bruge z- og t-testen til to prøver, i den anden - metoden til envejsanalyse af varians. For to relaterede prøver anvendes en parret t-test. Hvis vi taler om ikke-metriske data fra en enkelt prøve, kan forskeren bruge frekvensfordelingstest, chi-square, Kolmogorov-Smirnov (K~S) test, serietest og binomial test. For to uafhængige prøver med ikke-metriske data kan du ty til følgende analysemetoder: chi-square, Mann-Whitney, medianer, K-S, en-vejs variansanalyse Kruskal-Wallis (ANOVA). I modsætning hertil, hvis der er to eller flere relaterede prøver, skal tegnet, McNemar og Wilcoxon-testene bruges.

Multivariate statistiske metoder er rettet mod at identificere eksisterende mønstre: indbyrdes afhængighed af variable, sammenhæng eller rækkefølge af begivenheder, lighed mellem objekter.

Helt konventionelt kan vi skelne mellem fem standardtyper af mønstre, hvis undersøgelse er af væsentlig interesse: association, sekvens, klassifikation, klyngedannelse og prognose

En association opstår, når flere begivenheder er relateret til hinanden. Eksempelvis kan en undersøgelse foretaget i et supermarked vise, at 65 % af dem, der køber majschips, også køber Coca-Cola, og hvis der er rabat på sådan et sæt, køber de Cola i 85 % af tilfældene. Med oplysninger om en sådan forening er det nemt for ledere at vurdere, hvor effektiv den ydede rabat er.

Hvis der er en kæde af begivenheder relateret i tid, så taler vi om en sekvens. For eksempel, efter at have købt et hus, bliver der i 45% af tilfældene købt et nyt køkkenkomfur inden for en måned, og inden for to uger anskaffer 60% af de nye beboere et køleskab.

Ved hjælp af klassificering identificeres tegn, der karakteriserer den gruppe, som et bestemt objekt tilhører. Dette gøres ved at analysere allerede klassificerede objekter og formulere nogle regler.

Clustering adskiller sig fra klassificering ved, at grupperne i sig selv ikke er foruddefinerede. Ved hjælp af clustering identificeres forskellige homogene grupper af data.

Grundlaget for alle former for prognosesystemer er historisk information lagret i form af tidsserier. Hvis det er muligt at konstruere mønstre, der tilstrækkeligt afspejler dynamikken i målindikatorernes adfærd, er der mulighed for, at det med deres hjælp er muligt at forudsige systemets adfærd i fremtiden.

Multivariate statistiske metoder kan opdeles i relationsanalysemetoder og klassifikationsanalyse (fig. 2.5).

Fig. 2.5 – Klassifikation af multivariate statistiske metoder