Metode til sprednings- og præcisionsdiagrammer. Grundlæggende statistiske parametre for en stor og lille stikprøvepopulation og deres karakteristika Lille prøveformel

Når man kontrollerer kvaliteten af varer i økonomisk forskning, kan et eksperiment udføres på grundlag af en lille stikprøve.

Under lille prøve henviser til en ikke-kontinuerlig statistisk undersøgelse, hvor stikprøvepopulationen er dannet af et relativt lille antal enheder i den generelle befolkning. Volumenet af en lille prøve overstiger normalt ikke 30 enheder og kan nå 4 - 5 enheder.

Den gennemsnitlige fejl for en lille prøve beregnes ved hjælp af formlen:

Hvor
- lille prøvevariation.

Ved bestemmelse af varians antallet af frihedsgrader er n-1:

Marginal lille prøvefejl
bestemt af formlen

I dette tilfælde afhænger værdien af konfidenskoefficienten t ikke kun af den givne konfidenssandsynlighed, men også af antallet af stikprøveenheder n. For individuelle værdier af t og n bestemmes konfidenssandsynligheden for en lille stikprøve ved hjælp af specielle elevtabeller (tabel 9.1.), som giver fordelingen af standardiserede afvigelser:

Da når man udfører en lille prøve, er værdien af 0,59 eller 0,99 praktisk taget accepteret som en tillidssandsynlighed, så for at bestemme den maksimale fejl for en lille prøve
Følgende elevfordelingsaflæsninger bruges:

Måder at generalisere prøvekarakteristika til befolkningen.

Stikprøvemetoden bruges oftest til at opnå karakteristika for populationen i henhold til de tilsvarende stikprøveindikatorer. Afhængigt af formålet med forskningen sker dette enten ved direkte genberegning af stikprøveindikatorer for den generelle befolkning eller ved at beregne korrektionsfaktorer.

Direkte genberegningsmetode. Det består i, at stikprøven deler indikatorer eller gennemsnitlig gælder for den generelle befolkning under hensyntagen til stikprøvefejl.

I handelen bestemmes således antallet af ikke-standardprodukter modtaget i en sending. For at gøre dette (under hensyntagen til den accepterede grad af sandsynlighed) multipliceres indikatorerne for andelen af ikke-standardprodukter i stikprøven med antallet af produkter i hele varepartiet.

Metode til korrektionsfaktorer. Det bruges i tilfælde, hvor formålet med stikprøvemetoden er at afklare resultaterne af løbende regnskab.

I statistisk praksis bruges denne metode til at klarlægge data fra årlige tællinger af husdyr ejet af befolkningen. For at gøre dette, efter generalisering af data fra den komplette optælling, bruges en 10% stikprøveundersøgelse til at bestemme den såkaldte "procentdel af undertælling".

Metoder til udvælgelse af enheder fra den generelle befolkning.

I statistikker bruges forskellige metoder til at danne stikprøvepopulationer, som bestemmes af undersøgelsens mål og afhænger af undersøgelsens genstandes detaljer.

Hovedbetingelsen for at gennemføre en stikprøveundersøgelse er at forhindre forekomsten af systematiske fejl, der opstår som følge af overtrædelse af princippet om lige muligheder for hver enhed af den generelle befolkning, der skal indgå i stikprøven. Forebyggelse af systematiske fejl opnås gennem brug af videnskabeligt baserede metoder til at danne en stikprøvepopulation.

Der er følgende metoder til at vælge enheder fra populationen:

1) individuel udvælgelse - individuelle enheder udvælges til stikprøven;

2) gruppeudvælgelse - stikprøven omfatter kvalitativt homogene grupper eller serier af enheder, der undersøges;

3) kombineret udvælgelse er en kombination af individuelt og gruppeudvalg.

Udvælgelsesmetoder bestemmes af reglerne for dannelse af en prøvepopulation.

Eksemplet kunne være:

Helt tilfældigt;

Mekanisk;

Typisk;

Seriel;

Kombineret.

Korrekt stikprøveudtagning består i, at stikprøvepopulationen er dannet som et resultat af tilfældig (utilsigtet) udvælgelse af individuelle enheder fra den generelle befolkning. I dette tilfælde bestemmes antallet af udvalgte enheder i stikprøvepopulationen normalt ud fra den accepterede stikprøveandel.

Stikprøveandelen er forholdet mellem antallet af enheder i stikprøvepopulationen n og antallet af enheder i den generelle befolkning N, dvs.

Altså med en prøve på 5 % fra et parti varer på 2.000 enheder. prøvestørrelse n er 100 enheder. (5*2000:100), og med en stikprøve på 20 % vil det være 400 enheder. (20*2000:100) osv.

Mekanisk prøveudtagning består i, at udvælgelsen af enheder i stikprøvepopulationen foretages ud fra den generelle population, opdelt i lige store intervaller (grupper). I dette tilfælde er størrelsen af intervallet i populationen lig med det omvendte af stikprøveandelen.

Så med en stikprøve på 2 % vælges hver 50. enhed (1:0,02), med en stikprøve på 5 %, hver 20. enhed (1:0,05) osv.

I overensstemmelse med den accepterede andel af selektion er den almindelige befolkning således mekanisk opdelt i grupper af lige store størrelser. Fra hver gruppe vælges kun én enhed til prøven.

Et vigtigt træk ved mekanisk prøvetagning er, at dannelsen af en prøvepopulation kan udføres uden at ty til kompilering af lister. I praksis bruges ofte den rækkefølge, som befolkningens enheder faktisk er placeret i. For eksempel rækkefølgen af udgang af færdige produkter fra en transportør eller produktionslinje, rækkefølgen af placering af enheder af et parti varer under opbevaring, transport, salg osv.

Typisk prøve. Ved typisk stikprøve inddeles populationen først i homogene typiske grupper. Derefter, fra hver typisk gruppe, bruges en rent tilfældig eller mekanisk prøve til individuelt at udvælge enheder i prøvepopulationen.

Prøveudtagning bruges normalt, når man studerer komplekse statistiske populationer. For eksempel i en stikprøveundersøgelse af arbejdsproduktivitet for handelsarbejdere, bestående af separate grupper efter kvalifikationer.

Et vigtigt træk ved en typisk prøve er, at den giver mere nøjagtige resultater sammenlignet med andre metoder til at udvælge enheder i prøvepopulationen.

For at bestemme gennemsnitsfejlen for en typisk prøve bruges følgende formler:

genvalg

ikke-gentagne valg

Variansen bestemmes ved hjælp af følgende formler:

På enkelt trin I en prøve studeres hver udvalgt enhed umiddelbart efter en given karakteristik. Dette er tilfældet med rent tilfældig og seriel prøveudtagning.

På flertrins I stikprøven er individuelle grupper udvalgt fra den generelle befolkning, og individuelle enheder er udvalgt fra grupperne. Sådan laves en typisk prøve med en mekanisk metode til at udvælge enheder i prøvepopulationen.

Kombineret prøveudtagning kan være to-trins. I dette tilfælde opdeles befolkningen først i grupper. Derefter udvælges grupperne, og inden for sidstnævnte udvælges de enkelte enheder.

Statistisk databehandling på personlige computere og mainframe-computere. Der er specielle programmer designet til at undervise studerende, som indeholder detaljerede forklaringer af alle procedurer og test for at teste deres beherskelse.

Som allerede nævnt kan både tillidssandsynligheder og konfidensgrænser for det generelle gennemsnit kun beregnes for en normalfordelt population i tilfælde af en lille stikprøve.

For små stikprøver er beregningen af den gennemsnitlige mulige fejl baseret på stikprøvevarianser, dvs

Små prøver er meget brugt til at løse problemer, der involverer test af statistiske hypoteser, især hypoteser om gennemsnit.

For eksempel, for en prøve på 32 enheder, blev en parvis korrelationskoefficient på 0,319 opnået. Antallet af frihedsgrader for det er 30, da beregningen af r involverer to størrelser, hvis værdier er faste - J og y. På grund af dette mister vi to frihedsgrader 32 - 2. Da den kritiske værdi for 30 frihedsgrader er lig (ved et signifikansniveau på 0,05) med 0,3494, er den resulterende værdi lavere end den kritiske værdi i absolut værdi. Derfor er hypotesen om forholdet mellem tegn ikke blevet pålideligt bevist. Konklusionen om fraværet af en forbindelse er også forkert - den er heller ikke pålideligt bevist. Fra bordet Bilag 5 viser, at med et lille udsnit er det kun tætte forbindelser, der kan etableres pålideligt, og med en stor populationsstørrelse, for eksempel 102 enheder, kan svage forbindelser også måles pålideligt. Denne konklusion er vigtig for det praktiske arbejde med korrelationsanalyse.

Dette tyder på, at det faktiske antal patienter i gennemsnit er 1,5 gange den forudsagte værdi, hvilket betyder, at den anvendte prognosemodel typisk undervurderer antallet af fremmødte patienter. I dette tilfælde kan det være værd at analysere den anvendte model og foretage justeringer af den. Ideelt set er den gennemsnitlige fejl nul, dvs. negative og positive fejlværdier ophæver hinanden. Vi må dog sige, at i vores eksempel blev gennemsnitsværdien opnået fra en meget lille stikprøve. En større stikprøvestørrelse, såsom et helt års data, vil give os mulighed for at bestemme den sandsynlige nøjagtighed af prognosen med en større grad af tillid.

De gennemsnitlige og maksimale fejl for en lille prøve bestemmes af formlerne

For en komplet serie på 15 værdier viser homogenitetskriteriet (Var) Normalitetstjek for et afkortet datasæt (for de 7 resterende lagre), at alle tre serier af værdier er normale, men dette rejser tvivl om legitimiteten af Brug af statistiske procedurer på en så lille stikprøve Men hvis vi ignorerer dette faktum, vil en afhængighed af formen z = a + b x + b2y i dette tilfælde ikke give analytikeren signifikant information, da der er en stærk indbyrdes afhængighed (multikollinearitet). ) mellem faktorerne xn - dette fremgår af den høje værdi af parkorrelationskoefficienten (på en trunkeret prøve z = -0 ,88).

Efter foreløbig udarbejdelse af spørgeskemaet skal det testes på en lille stikprøve for at identificere mulige fejl. Test er anderledes end foreløbig søgning. Søgning hjælper med at tydeliggøre forskningsplanen, når den udviklede plan testes, og omkostningerne ved dens implementering vurderes. Hvis testresultaterne anses for tilfredsstillende, bruges det udfyldte spørgeskema til at udføre forskning på den relevante prøve.

Baseret på de præsenterede data kan vurderingen af regressionsafhængigheden Рк(рп), som blev nævnt ovenfor, præsenteres i form af en korrelationsligning, baseret på enhver etableret form for statistisk sammenhæng for hele det valgte tidsinterval på 26 år . At konstruere regressioner for kortere tidsperioder ville være upålidelig netop på grund af den lille stikprøvestørrelse (lille stikprøve).

Fordeling af normaliserede afvigelser i en lille stikprøve. Værdier af t for hvilken sandsynlighed) = p

Hvis Ek> O, så er kurven toppet for Ek, Method of Moments, som regel, fører til konsistente estimater. Men med små stikprøver kan estimater være betydeligt partiske og ineffektive. Metoden med momenter er ret effektiv til at estimere parametrene for normalfordelte stokastiske variable.

I nogle tilfælde bruges omkostningerne ved at gennemføre undersøgelsen som hovedargumentet ved bestemmelse af stikprøvestørrelsen. Markedsundersøgelsesbudgettet dækker således omkostningerne ved at gennemføre visse undersøgelser, som ikke kan overskrides. Der tages naturligvis ikke hensyn til værdien af de modtagne oplysninger. Men i nogle tilfælde kan en lille prøve give ret nøjagtige resultater.

Hvis det ud fra resultaterne af en lille prøve entydigt kan konkluderes, at et parti er egnet eller omvendt uegnet, koster kvalitetskontrol meget lidt. Hvis den første prøve ikke giver et klart svar, kan du tage en anden prøve - en enkelt større prøve af prøver giver et mere præcist resultat. Kontrolprincippet kan være som følger

Baseret på antagelsen om, at den generelle befolkning, som prøven under undersøgelsen er taget fra, har en jævn fordelingskurve, er det naturligt at antage, at de fald og afvigelser, der opstår under gruppering, er tilfældig "støj" genereret af tilfældigheden af visse værdier falder ind i en lille prøve. Konsolidering af grupperingsintervaller er en metode til at filtrere denne tilfældige "støj". Men når intervallerne er for lange, er det ikke længere "støjen", der "filtreres", men selve "signalet", det vil sige, at funktionerne i den ønskede distributionslov begynder at blive udjævnet.

For hver af de nævnte typer og varianter af dokumenter indsamles deres kopier, opnået ved at lave en ekstra kopi, når du forbereder det tilsvarende dokument på en skrive- eller computermaskine. I den lille indsamlede prøve er der omkring 30 kopier af dokumenter for hver art eller sort, der dækker de vigtigste

Hvordan man håndterer små prøver

Således vil det tosidede konfidensinterval for en lille stikprøve være repræsenteret som følger:

Roden til vores vanskeligheder ligger i stikprøver. Som Leibniz engang mindede Bernoulli om, er naturen så varieret og så kompleks, at det er svært for os at drage korrekte konklusioner ud fra det, vi observerer. Vi har kun adgang til krummer af virkeligheden, og det fører os til fejlagtige konklusioner, eller vi fortolker små stikprøver som en fuld afspejling af en større befolknings karakteristika.

Kvaliteten af de gældende progressivitetsstandarder i virksomheden er kendetegnet ved niveauet af deres intensitet. Fordelingen af antallet af arbejdere efter individuel arbejdsproduktivitet er sædvanligvis tæt på den såkaldte normalfordeling og afviger næsten symmetrisk (med en vis asymmetri til højre) i begge retninger fra det gennemsnitlige niveau for deres præstationer. Med en stigning i antallet af arbejdere bliver afvigelser i den individuelle arbejdsproduktivitet fra gennemsnittet desuden i stigende grad kompenseret og tilbagebetalt. Ud fra formlen for den maksimale stikprøvefejl kan det med rimelig sikkerhed fastslås, at hvis den maksimale afvigelse af den enkelte arbejdskrafts individuelle arbejdsproduktivitet fra branchegennemsnittet ikke overstiger M%, så er grænsen for afvigelser ifølge sandsynlighedsteorien. af den gennemsnitlige arbejdsproduktivitet for tilfældigt udvalgte n arbejdere fra gennemsnittet vil være lig med M/n % eller justeret for en lille stikprøve fra en stor N-population

Den sidste årsag kan nogle gange elimineres ved at indføre passende justeringer. For intervalestimater af fejl over en lille (n) normalfordeling (se s. 50), kvantiler af elevens statistiske fordeling (tabel 6), karakteristisk for en lille stikprøve fra en normalpopulation (med ukendt m og a), er brugt.

Et overfladisk blik på problemet, små prøver til forskning, når enkelte dele erstatter hele problemet.

Men måden yt, xt beregnes på fører til tab af den første observation (hvis vi ikke har den tidligere observation). Antallet af frihedsgrader vil falde med én, hvilket ikke er så signifikant for store prøver, men for små prøver kan det føre til tab af effektivitet. Dette problem løses normalt ved at bruge pris-Vynosen-korrektionen

For at estimere en lille stikprøve anvendes den korrigerede standardafvigelse for den lille stikprøve og Students lov om sandsynlighedsfordeling.

Teorien om små prøver blev udviklet af den engelske statistiker W. Gosset (som skrev under pseudonymet Student) i begyndelsen af det 20. århundrede. I 1908 konstruerede han en særlig fordeling, der gør det muligt at korrelere / og konfidenssandsynligheden F(t) selv med små stikprøver. For n > 100 giver elevfordelingstabellerne de samme resultater som Laplace-ved 30

Sandsynlighedstesten er upartisk og konsistent for store prøver, -2-log X har en hi-kvadratfordeling med r

6. Typer af statistiske grupperinger, deres kognitive signifikans.

7.Statistiske tabeller: typer, konstruktionsregler, læseteknikker

8.Absolutte mængder: typer, kognitiv betydning. Betingelser for videnskabelig brug af absolutte og relative indikatorer.

9. Gennemsnitsværdier: indhold, typer, typer, videnskabelige betingelser for anvendelse.

11.Spredningsegenskaber. Reglen for at tilføje (nedbrydende) varians og dens brug i statistisk analyse.

12. Typer af statistiske grafer i henhold til indholdet af de problemer, der løses, og konstruktionsmetoder.

13. Dynamik-serien: typer, analyseindikatorer.

14. Metoder til at identificere tendenser i tidsserier.

15. Indeks: definition, hovedelementer i indeks, problemer løst ved hjælp af indeks, indekssystem i statistik.

16. Regler for opbygning af dynamiske og territoriale indekser.

17. Fundamentals af teorien om prøvetagningsmetoden.

18. Lille prøve teori.

19. Metoder til udvælgelse af enheder i stikprøvepopulationen.

20. Sammenhængstyper, statistiske metoder til analyse af sammenhænge, begrebet korrelation.

21. Indhold af korrelationsanalyse, korrelationsmodeller.

22. Vurdering af styrken (nærheden) af korrelationsforbindelsen.

23. System af indikatorer for socioøkonomiske statistikker.

24. Grundgrupperinger og klassifikationer i samfundsøkonomisk statistik.

25. Nationalformue: kategoriindhold og sammensætning.

26. Matriklens indhold. Indikatorer for jordsammensætning efter ejerskabstype, formål og jordtype.

27. Klassificering af anlægsaktiver, metoder til evaluering og omvurdering, indikatorer for bevægelse, tilstand og anvendelse.

28. Mål for arbejdsmarkedsstatistikken. Begrebet og indholdet af arbejdsmarkedets hovedkategorier.

29. Statistik over brug af arbejdskraft og arbejdstid.

30. Arbejdsproduktivitetsindikatorer og analysemetoder.

31. Indikatorer for afgrødeproduktion og landbrugsudbytter. Afgrøder og jorder.

32. Indikatorer for husdyrproduktion og landbrugsdyrs produktivitet.

33. Statistik over offentlige omkostninger og produktionsomkostninger.

34. Statistik over løn og lønomkostninger.

35. Statistik over bruttoproduktion og indkomst.

36. Indikatorer for bevægelse og salg af landbrugsprodukter.

37. Opgaver med statistisk analyse af landbrugsvirksomheder.

38. Statistik over priser og varer i sektorer af den nationale økonomi: opgaver og analysemetoder.

39. Statistik over markedet for varer og tjenesteydelser.

40. Statistik over sociale produktionsindikatorer.

41.Statistisk analyse af forbrugermarkedspriser.

42.Inflationsstatistikker og hovedindikatorer for dens vurdering.

43.Opgaver vedrørende virksomheders finansielle statistik.

44. Hovedindikatorer for virksomheders økonomiske resultater.

45. Statsbudgetstatistikkens opgaver.

46. System af indikatorer for statsbudgetstatistik.

47. System af indikatorer for statistik over pengeomløb.

48. Statistik over pengemængdens sammensætning og struktur i landet.

49. Bankstatistikkens hovedopgaver.

50. Hovedindikatorer for bankstatistikker.

51. Begreb og klassificering af kredit. Målene for dens statistiske undersøgelse.

52.System af kreditstatistiske indikatorer.

53. Vigtigste indikatorer og metoder til analyse af opsparingsvirksomhed.

54.Opgaver med statistik over aktiemarkedet og værdipapirer.

56. Statistik over råvareudvekslinger: mål og system af indikatorer.

57. Nationalregnskabssystem: begreber, hovedkategorier og klassifikation.

58.Grundlæggende principper for konstruktion af en snc.

59. Makroøkonomiske vigtigste indikatorer – indhold, bestemmelsesmetoder.

60. Balance mellem industrien: koncepter, opgaver, typer af pøbel.

62. Statistik over befolkningens indtægter og udgifter

18. Lille prøve teori.

Med et stort antal enheder i stikprøvepopulationen (n>100) er fordelingen af tilfældige fejl i stikprøvegennemsnittet i overensstemmelse med A.M. Lyapunovs sætning normal eller nærmer sig normal, når antallet af observationer stiger.

Men i praksis med statistisk forskning i en markedsøkonomi er man i stigende grad nødt til at forholde sig til små stikprøver.

En lille prøve er en prøveobservation, hvis antal enheder ikke overstiger 30.

Ved vurdering af resultaterne af en lille stikprøve anvendes populationsstørrelsen ikke. For at bestemme mulige fejlgrænser bruges Elevens test.

Værdien af σ beregnes baseret på prøveobservationsdata.

Denne værdi bruges kun for den undersøgte population og ikke som et tilnærmet estimat af σ i populationen.

Den probabilistiske vurdering af resultaterne af et lille udsnit adskiller sig fra vurderingen i et stort udsnit ved, at sandsynlighedsfordelingen for gennemsnittet med et lille antal observationer afhænger af antallet af udvalgte enheder.

Men for et lille udsnit er værdien af konfidensen t relateret til sandsynlighedsvurderingen anderledes end for et stort udsnit (da fordelingsloven adskiller sig fra normalen).

Ifølge distributionsloven etableret af Student afhænger den sandsynlige fordelingsfejl både af værdien af konfidenskoefficienten t og af stikprøvestørrelsen B.

Den gennemsnitlige fejl for en lille prøve beregnes ved hjælp af formlen:

hvor er den lille stikprøvevarians.

I MV skal koefficienten n/(n-1) tages i betragtning og skal justeres. Ved bestemmelse af spredningen S2 er antallet af frihedsgrader lig med:

Den marginale fejl af en lille stikprøve bestemmes af formlen

I dette tilfælde afhænger værdien af konfidenskoefficienten t ikke kun af den givne konfidenssandsynlighed, men også af antallet af stikprøveenheder n. For individuelle værdier af t og n bestemmes konfidenssandsynligheden for en lille stikprøve ved hjælp af specielle elevtabeller, som giver fordelingen af standardiserede afvigelser:

Den probabilistiske vurdering af resultaterne af MV adskiller sig fra vurderingen i BB ved, at sandsynlighedsfordelingen for gennemsnittet med et lille antal observationer afhænger af antallet af udvalgte enheder

19. Metoder til udvælgelse af enheder i stikprøvepopulationen.

1. Stikprøvepopulationen skal være stor nok i størrelse.

2. Strukturen af stikprøvepopulationen bør bedst afspejle strukturen i den generelle population

3. Udvælgelsesmetoden skal være tilfældig

Afhængigt af om de udvalgte enheder deltager i stikprøven, skelnes der mellem de ikke-gentagede og gentagne metoder.

Ikke-repetitiv selektion er en selektion, hvor en enhed, der indgår i stikprøven, ikke vender tilbage til den population, hvorfra yderligere selektion udføres.

Beregning af den gennemsnitlige fejl for en ikke-gentagen tilfældig stikprøve:

Beregning af den maksimale fejl for en ikke-gentagen tilfældig stikprøve:

Under gentagen udvælgelse returneres den enhed, der er inkluderet i stikprøven, efter registrering af de observerede karakteristika til den oprindelige (generelle) population for at deltage i den videre udvælgelsesprocedure.

Gennemsnitsfejlen ved gentagne simple stikprøver beregnes som følger:

Beregning af den maksimale fejl ved gentagne stikprøver:

Typen af dannelse af prøvepopulationen er opdelt i individ, gruppe og kombineret.

Udvælgelsesmetode - bestemmer den specifikke mekanisme for udvælgelse af enheder fra den generelle befolkning og er opdelt i: faktisk - tilfældig; mekanisk; typisk; seriel; kombineret.

Faktisk – tilfældigt den mest almindelige metode til udvælgelse i en tilfældig stikprøve, det kaldes også lodtrækning, hvor der udarbejdes en billet med et løbenummer for hver enhed af den statistiske population. Dernæst vælges det nødvendige antal enheder af den statistiske population tilfældigt. Under disse forhold har hver af dem samme sandsynlighed for at blive inkluderet i stikprøven.

Mekanisk prøveudtagning. Det bruges i tilfælde, hvor den generelle befolkning er ordnet på en eller anden måde, dvs. der er en vis rækkefølge i arrangementet af enheder.

For at bestemme gennemsnitsfejlen ved mekanisk prøvetagning anvendes formlen for gennemsnitsfejlen i faktisk tilfældig ikke-gentagende prøvetagning.

Typisk udvalg. Det bruges, når alle enheder i den almindelige befolkning kan opdeles i flere typiske grupper. Typisk udvælgelse involverer udvælgelse af enheder fra hver gruppe på en rent tilfældig eller mekanisk måde.

For en typisk prøve afhænger standardfejlen af nøjagtigheden af gruppemiddelværdierne. I formlen for den maksimale fejl for en typisk prøve tages der således højde for gennemsnittet af gruppevarianserne, dvs.

Serievalg. Det bruges i tilfælde, hvor befolkningsenheder er kombineret i små grupper eller serier. Essensen af seriel prøveudtagning ligger i den faktiske tilfældige eller mekaniske udvælgelse af serier, inden for hvilken der udføres en kontinuerlig undersøgelse af enheder.

Ved seriel prøveudtagning afhænger størrelsen af prøvetagningsfejlen ikke af antallet af undersøgte enheder, men af antallet af undersøgte serier og af størrelsen af spredningen mellem grupperne:

Kombineret udvalg kan gennemgå et eller flere stadier. En stikprøve kaldes single-stage, hvis en gang udvalgte enheder af befolkningen er undersøgt.

Prøven kaldes flertrins, hvis udvælgelsen af en population finder sted i trin, successive trin, og hvert trin, selektionstrin har sin egen selektionsenhed.

Lille prøvemetode

Den største fordel ved den lille prøvemetode er evnen til at evaluere dynamikken i processen over tid, hvilket reducerer tiden til beregningsprocedurer.

Øjeblikkelige prøver udvælges tilfældigt i bestemte tidsrum fra 5 til 20 enheder. Prøveudtagningsperioden fastlægges empirisk og afhænger af processens stabilitet, bestemt ved at analysere a priori information.

For hver øjeblikkelig prøve bestemmes de vigtigste statistiske egenskaber. De øjeblikkelige prøver og deres vigtigste statistiske karakteristika er præsenteret i appendiks B.

En hypotese om homogeniteten af prøvespredning fremsættes og testes ved hjælp af et af de mulige kriterier (Fishers kriterium).

Test af hypotesen om homogeniteten af prøvekarakteristika.

For at kontrollere betydningen af forskellen mellem aritmetiske middelværdier i 2 måleserier introduceres mål G i appendiks B

Beslutningsreglen er formuleret som følger:

hvor tr er værdien af kvantilen af den normaliserede fordeling ved en given konfidenssandsynlighed P, ? = 0,095, n = 10, tр = 2,78.

Når uligheden er opfyldt, bekræftes hypotesen, at forskellen mellem stikprøvemiddelværdierne ikke er signifikant.

Da uligheden er opfyldt i alle tilfælde, bekræftes hypotesen om, at forskellen mellem stikprøvemiddelværdierne ikke er signifikant.

For at teste hypotesen om homogeniteten af prøvevarianser introduceres F0-målet som forholdet mellem upartiske estimater af varianserne af resultaterne af 2 serier af målinger. Desuden tages det største af de 2 estimater som tæller, og hvis Sx1>Sx2, så

Beregningsresultaterne er angivet i bilag B.

Derefter angives værdierne af konfidenssandsynligheden P, og værdierne af F(K1; K2; ?/2) bestemmes med K1 = n1 - 1 og K2 = n2 - 1.

Med P = 0,025 og K1 = 10-1 = 4 og K2 = 10-1 = 4 F (9;9;0,025/2) =4,1.

Beslutningsregel: hvis F(K1; K2; ?/2)>F0, så accepteres hypotesen om homogeniteten af varianser i de to stikprøver.

Da betingelsen F(K1; K2; ?/2) > F0 er opfyldt i alle tilfælde, accepteres hypotesen om homogenitet af varianser.

Således bekræftes hypotesen om homogeniteten af prøvevarianser, hvilket indikerer stabiliteten af processen; hypotesen om homogeniteten af prøvemidler ved hjælp af metoden til sammenligning af middel er bekræftet, dette betyder, at spredningscentret ikke har ændret sig, og processen er i en stabil tilstand.

Scatter og præcision plot metode

Over en vis periode udtages øjeblikkelige prøver på 3 til 10 produkter, og de statistiske karakteristika for hver prøve bestemmes.

De opnåede data er plottet på diagrammer med tid på abscisseaksen? eller antal k af prøver, og på ordinataksen - individuelle værdier af xk eller værdien af en af de statistiske karakteristika (arithmetisk prøvegennemsnit, prøvestandardafvigelse). Derudover er to vandrette linjer Тв og Тн tegnet på diagrammet, hvilket begrænser produktets toleranceområde.

Øjeblikkelige prøver er givet i appendiks B.

Figur 1 nøjagtighedsdiagram

Diagrammet viser tydeligt fremskridtet i produktionsprocessen. Det kan bruges til at indikere, at produktionsprocessen er ustabil

Ud over selve stikprøven med dens klare sandsynlighedsberettigelse er der andre stikprøver, som ikke er helt tilfældige, men som er meget brugte. Det skal bemærkes, at den strenge anvendelse af rent tilfældig udvælgelse af enheder fra den almindelige befolkning ikke altid er mulig i praksis. Sådanne prøver omfatter mekanisk prøveudtagning, typisk, seriel (eller indlejret), flerfaset og en række andre.

Det er sjældent, at en befolkning er homogen, dette er undtagelsen snarere end reglen. Når der er forskellige typer af fænomener i populationen, er det derfor ofte ønskeligt at sikre en mere jævn repræsentation af de forskellige typer i stikprøven. Dette mål opnås med succes ved at bruge typisk prøveudtagning. Den største vanskelighed er, at vi skal have yderligere information om hele befolkningen, hvilket i nogle tilfælde er svært.

En typisk prøve kaldes også en stratificeret eller stratificeret prøve; det bruges også med henblik på mere ensartet repræsentation af forskellige regioner i stikprøven, og i dette tilfælde kaldes stikprøven regionaliseret.

Altså jod typisk En stikprøve forstås som en stikprøve, hvor den almindelige befolkning er opdelt i typiske undergrupper dannet efter en eller flere væsentlige karakteristika (f.eks. er befolkningen opdelt i 3-4 undergrupper efter gennemsnitlig indkomst pr. indbygger eller uddannelsesniveau - primær , sekundær, højere osv.). Derefter kan du fra alle typiske grupper vælge enheder til prøven på flere måder, der danner:

a) en typisk prøve med ensartet placering, hvor et lige antal enheder er udvalgt fra forskellige typer (lag). Denne ordning fungerer godt, hvis lagene (typerne) i populationen ikke adskiller sig ret meget fra hinanden i antallet af enheder;
b) typisk prøveudtagning med proportional placering, når det kræves (i modsætning til ensartet placering), at andelen (%) af udvælgelsen for alle strata er den samme (f.eks. 5 eller 10 %);
c) en typisk prøve med optimal placering, når der tages hensyn til graden af variation af karakteristika i forskellige grupper af den generelle befolkning. Med denne placering øges andelen af selektion for grupper med stor variabilitet af egenskaben, hvilket i sidste ende fører til et fald i tilfældig fejl.

Formlen for gennemsnitsfejlen i en typisk udvælgelse svarer til den sædvanlige stikprøvefejl for en rent tilfældig stikprøve, med den eneste forskel, at i stedet for den totale varians, indtastes gennemsnittet af de bestemte interne gruppevarianser, hvilket naturligvis fører til til et fald i fejl sammenlignet med en rent tilfældig stikprøve. Det er dog ikke altid muligt (af mange årsager). Hvis der ikke er behov for stor præcision, er det nemmere og billigere at bruge seriel sampling.

Seriel(klynge) prøveudtagning består i, at ikke enheder af populationen (f.eks. studerende), men individuelle serier eller reder (f.eks. undersøgelsesgrupper) udvælges til stikprøven. Med andre ord, ved seriel (klynge) prøvetagning er observationsenheden og prøvetagningsenheden ikke sammenfaldende: visse grupper af enheder (reder), der støder op til hinanden, udvælges, og de enheder, der indgår i disse reder, skal undersøges. Så når vi for eksempel laver en stikprøveundersøgelse af boligforhold, kan vi tilfældigt udvælge et vist antal husstande (stikprøveenhed) og derefter finde ud af levevilkårene for de familier, der bor i disse huse (observationsenheder).

Serier (reder) består af enheder forbundet med hinanden territorialt (distrikter, byer osv.), organisatorisk (virksomheder, værksteder osv.) eller i tid (f.eks. et sæt af enheder af produkter produceret over en given tidsperiode ).

Seriel udvælgelse kan organiseres i form af et-trins, to-trins eller flertrins valg.

Tilfældigt udvalgte serier udsættes for kontinuerlig forskning. Seriel prøvetagning består således af to faser af tilfældig udvælgelse af serier og kontinuerlig undersøgelse af disse serier. Serievalg giver betydelige besparelser i mandskab og ressourcer og bruges derfor ofte i praksis. Fejlen ved seriel udvælgelse adskiller sig fra fejlen ved den faktiske tilfældige udvælgelse af hæmer, ved at i stedet for værdien af den totale varians, bruges interserie (intergruppe) varians, og i stedet for prøvevolumen bruges antallet af serier . Nøjagtigheden er normalt ikke særlig høj, men i nogle tilfælde er den acceptabel. En seriel prøve kan være gentaget eller ikke-repetitiv, og serier kan være lige store eller ulige.

Seriel prøveudtagning kan organiseres efter forskellige skemaer. For eksempel kan du danne en stikprøvepopulation i to trin: Først udvælges serierne, der skal undersøges, i tilfældig rækkefølge, derefter udvælges et vist antal enheder fra hver udvalgt serie i tilfældig rækkefølge, der skal observeres direkte (målt, vejet , etc.). Fejlen for en sådan prøve vil afhænge af fejlen ved seriel udvælgelse og af fejlen ved individuel udvælgelse, dvs. Flertrinsudvælgelse giver som regel mindre nøjagtige resultater sammenlignet med enkelttrinsudvælgelse, hvilket forklares ved forekomsten af repræsentativitetsfejl på hvert stikprøvetrin. I dette tilfælde skal du bruge prøveudtagningsfejlformlen til kombineret prøveudtagning.

En anden form for udvælgelse er flerfaseudvælgelse (1, 2, 3 faser eller faser). Denne udvælgelse adskiller sig i struktur fra flertrinsudvælgelse, da der ved flerfaseudvælgelse anvendes de samme udvælgelsesenheder i hver fase. Fejl i flerfaseprøvetagning beregnes for hver fase separat. Hovedtræk ved en to-faset prøve er, at prøverne adskiller sig fra hinanden i henhold til tre kriterier afhængigt af: 1) andelen af enheder, der blev undersøgt i den første fase af prøven og igen inkluderet i den anden og efterfølgende faser; 2) fra at opretholde lige chancer for hver prøveenhed i den første fase til igen at være genstand for undersøgelse; 3) på størrelsen af det interval, der adskiller faserne fra hinanden.

Lad os dvæle ved endnu en type udvalg, nemlig mekanisk(eller systematisk). Dette valg er nok det mest almindelige. Dette forklares tilsyneladende af, at af alle udvælgelsesteknikker er denne teknik den enkleste. Især er det meget enklere end tilfældig udvælgelse, som kræver evnen til at bruge tabeller med tilfældige tal, og ikke kræver yderligere information om populationen og dens struktur. Derudover er mekanisk selektion tæt sammenflettet med proportional stratificeret selektion, hvilket fører til en reduktion i stikprøvefejl.

Eksempelvis vil anvendelsen af mekanisk udvælgelse af andelshaverne i en andelsboligforening fra en liste opstillet i rækkefølgen for optagelse i denne andel sikre forholdsmæssig repræsentation af andelshavere med forskellig erfaring. Ved at bruge den samme teknik til at vælge respondenter fra en alfabetisk liste over individer sikres lige chancer for efternavne, der begynder med forskellige bogstaver osv. Anvendelse af timesedler eller andre lister på virksomheder eller uddannelsesinstitutioner mv. kan sikre den nødvendige proportionalitet i repræsentationen af arbejdstagere med forskellig lang erfaring. Bemærk, at mekanisk udvælgelse er meget brugt i sociologi, i studiet af den offentlige mening osv.

For at reducere størrelsen af fejlen og især omkostningerne ved at udføre en stikprøveundersøgelse, er forskellige kombinationer af individuelle typer af udvælgelse (mekanisk, seriel, individuel, flerfaset osv.) i vid udstrækning brugt. I sådanne tilfælde bør der beregnes mere komplekse stikprøvefejl, som består af fejl, der opstår på forskellige stadier af undersøgelsen.

En lille prøve er en samling af enheder under 30. Små prøver forekommer ret ofte i praksis. For eksempel antallet af sjældne sygdomme eller antallet af enheder med en sjælden egenskab; Derudover gribes der til en lille prøve, når forskningen er dyr, eller forskningen involverer destruktion af produkter eller prøver. Små prøver er meget brugt inden for produktkvalitetsundersøgelser. Det teoretiske grundlag for at bestemme små stikprøvefejl blev lagt af den engelske videnskabsmand W. Gosset (pseudonym Student).

Det skal huskes, at når du bestemmer fejlen for en lille prøve, skal du i stedet for prøvestørrelsen tage værdien (S- 1) eller før bestemmelse af den gennemsnitlige stikprøvefejl, beregne den såkaldte korrigerede stikprøvevarians (i nævneren i stedet for P skal sættes (S- 1)). Bemærk, at en sådan korrektion kun foretages én gang - ved beregning af prøvevariansen eller ved bestemmelse af fejlen. Størrelse (S- 1) kaldes frihedsgraden. Desuden erstattes normalfordelingen af ^-fordelingen (Stuodentfordelingen), som er tabuleret og afhænger af antallet af frihedsgrader. Den eneste parameter i Student-fordelingen er værdien (P - 1). Lad os endnu en gang understrege, at ændringsforslaget (S- 1) kun vigtig og signifikant for små, men store stikprøvepopulationer; på yi > 30 og derover, forsvinder forskellen og nærmer sig nul.

Hidtil har vi talt om stikprøver, dvs. sådan når udvælgelsen af enheder fra populationen er tilfældig (eller næsten tilfældig), og alle enheder har en lige stor (eller næsten lige stor) sandsynlighed for at blive inkluderet i stikprøven. Udvælgelsen af enheder kan dog baseres på princippet om ikke-tilfældig udvælgelse, når princippet om tilgængelighed og målrettethed er i højsædet. I sådanne tilfælde er det umuligt at tale om repræsentativiteten af den resulterende prøve, og beregningen af repræsentativitetsfejl kan kun udføres med information om den generelle befolkning.

Der er flere kendte skemaer til at danne en ikke-tilfældig stikprøve, som er blevet udbredt og anvendes hovedsageligt i sociologisk forskning: udvælgelse af tilgængelige observationsenheder, udvælgelse efter Nürnberg-metoden, målrettet stikprøve ved identifikation af eksperter osv. Kvoteprøveudtagning, som er dannet af forskeren fra et lille antal, er også vigtige væsentlige parametre og giver et meget tæt match til den generelle befolkning. Kvoteudvælgelse bør med andre ord give forskeren næsten fuldstændig sammenfald af stikprøven og generelle populationer i henhold til hans valgte parametre. Målrettet opnåelse af nærheden af to populationer, men i en begrænset række af indikatorer, opnås som regel ved at bruge en stikprøve af en væsentlig mindre størrelse end ved anvendelse af tilfældig udvælgelse. Det er denne omstændighed, der gør kvoteudvælgelse attraktiv for en forsker, der ikke har mulighed for at fokusere på en stor selvvægtende stikprøve. Det skal tilføjes, at en reduktion i stikprøvestørrelsen oftest kombineres med en reduktion i pengeomkostninger og forskningstid, hvilket øger fordelene ved denne udvælgelsesmetode. Lad os også bemærke, at der med kvoteprøvetagning er ret betydelige foreløbige oplysninger om befolkningens struktur. Den største fordel her er, at stikprøvestørrelsen er væsentligt mindre end ved tilfældig stikprøve. De udvalgte karakteristika (oftest sociodemografiske - køn, alder, uddannelse) bør være tæt korreleret med de undersøgte karakteristika for den generelle befolkning, dvs. genstand for forskning.

Som allerede nævnt gør stikprøvemetoden det muligt at opnå information om den generelle befolkning med langt færre penge, tid og kræfter end med kontinuerlig observation. Det er også klart, at en fuldstændig undersøgelse af hele befolkningen er umulig i nogle tilfælde, for eksempel ved kontrol af kvaliteten af produkter, hvoraf prøver er ødelagt.

Det skal dog samtidig pointeres, at befolkningen ikke er en helt "sort boks", og vi har stadig nogle oplysninger om det. Ved at gennemføre for eksempel en stikprøveundersøgelse vedrørende studerendes liv, hverdag, formueforhold, indtægter og udgifter, deres meninger, interesser osv., har vi stadig oplysninger om deres samlede antal, gruppering efter køn, alder, civilstand, bopæl, studieforløb og andre karakteristika. Disse oplysninger bruges altid i en prøveundersøgelse.

Der er flere typer fordeling af stikprøvekarakteristika til den generelle befolkning: metoden til direkte genberegning og metoden til korrektionsfaktorer. Genberegning af prøvekarakteristika udføres som regel under hensyntagen til konfidensintervaller og kan udtrykkes i absolutte og relative værdier.

Det er ganske passende at understrege her, at de fleste statistiske oplysninger vedrørende samfundets økonomiske liv i dets mest forskelligartede manifestationer og typer er baseret på stikprøvedata. Naturligvis suppleres de med fuldstændige registreringsdata og oplysninger opnået som følge af folketællinger (af befolkning, virksomheder osv.). For eksempel er alle budgetstatistikker (om befolkningens indtægter og udgifter) leveret af Rosstat baseret på data fra en stikprøveundersøgelse. Oplysninger om priser, produktionsmængder og handelsmængder, udtrykt i de tilsvarende indeks, er også i vid udstrækning baseret på stikprøvedata.