చి స్క్వేర్ పరీక్షను ఉపయోగించడం. MS EXCEL CH2 పంపిణీని ఉపయోగించి పనిచేస్తుంది

చి-స్క్వేర్ పరీక్ష అనేది ప్రయోగం యొక్క ఫలితాలు మరియు ఉపయోగించిన గణాంక నమూనా మధ్య ఒప్పందాన్ని తనిఖీ చేయడానికి సార్వత్రిక పద్ధతి.

పియర్సన్ దూరం X 2

Pyatnitsky A.M.

రష్యన్ స్టేట్ మెడికల్ యూనివర్సిటీ

1900లో, కార్ల్ పియర్సన్ మోడల్ అంచనాలు మరియు ప్రయోగాత్మక డేటా మధ్య ఒప్పందాన్ని పరీక్షించడానికి సరళమైన, సార్వత్రిక మరియు సమర్థవంతమైన మార్గాన్ని ప్రతిపాదించాడు. అతను ప్రతిపాదించిన "చి-స్క్వేర్ టెస్ట్" అత్యంత ముఖ్యమైన మరియు సాధారణంగా ఉపయోగించే గణాంక పరీక్ష. తెలియని మోడల్ పారామితులను అంచనా వేయడం మరియు మోడల్ మరియు ప్రయోగాత్మక డేటా మధ్య ఒప్పందాన్ని తనిఖీ చేయడం వంటి అనేక సమస్యలను దాని సహాయంతో పరిష్కరించవచ్చు.

అధ్యయనం చేయబడుతున్న వస్తువు లేదా ప్రక్రియ యొక్క ప్రియోరి (“ప్రీ-ప్రయోగాత్మక”) నమూనా (గణాంకాలలో వారు “శూన్య పరికల్పన” H 0 గురించి మాట్లాడతారు), మరియు ఈ వస్తువుతో చేసిన ప్రయోగం యొక్క ఫలితాలు ఉండనివ్వండి. మోడల్ సరిపోతుందో లేదో నిర్ణయించడం అవసరం (ఇది వాస్తవికతకు అనుగుణంగా ఉందా)? ప్రయోగాత్మక ఫలితాలు వాస్తవికత ఎలా పనిచేస్తుందనే దాని గురించిన మా ఆలోచనలకు విరుద్ధంగా ఉన్నాయా లేదా మరో మాటలో చెప్పాలంటే, H0ని తిరస్కరించాలా? తరచుగా ఈ పనిని గమనించిన (O i = గమనించిన) పోల్చడానికి తగ్గించవచ్చు మరియు మోడల్ (E i = ఆశించిన) నిర్దిష్ట సంఘటనల యొక్క సగటు పౌనఃపున్యాల ప్రకారం అంచనా వేయబడుతుంది. స్థిరమైన (!) పరిస్థితులలో చేసిన N స్వతంత్ర (!) పరిశీలనల శ్రేణిలో గమనించిన పౌనఃపున్యాలు పొందాయని నమ్ముతారు. ప్రతి పరిశీలన ఫలితంగా, M ఈవెంట్‌లలో ఒకటి నమోదు చేయబడుతుంది. ఈ సంఘటనలు ఏకకాలంలో జరగవు (అవి జంటగా సరిపోవు) మరియు వాటిలో ఒకటి తప్పనిసరిగా సంభవిస్తుంది (వాటి కలయిక నమ్మదగిన సంఘటనను ఏర్పరుస్తుంది). అన్ని పరిశీలనల మొత్తం పౌనఃపున్యాల పట్టిక (వెక్టార్)కి తగ్గించబడింది (O i )=(O 1 ,... O M ), ఇది ప్రయోగం యొక్క ఫలితాలను పూర్తిగా వివరిస్తుంది. విలువ O 2 =4 అంటే ఈవెంట్ సంఖ్య 2 4 సార్లు జరిగింది. పౌనఃపున్యాల మొత్తం O 1 +… O M =N. రెండు కేసుల మధ్య తేడాను గుర్తించడం చాలా ముఖ్యం: N - స్థిర, యాదృచ్ఛికం కాని, N - యాదృచ్ఛిక వేరియబుల్. స్థిరమైన మొత్తం ప్రయోగాల సంఖ్య N కోసం, పౌనఃపున్యాలు బహుపది పంపిణీని కలిగి ఉంటాయి. ఈ సాధారణ పథకాన్ని ఒక సాధారణ ఉదాహరణతో ఉదహరిద్దాం.

సాధారణ పరికల్పనలను పరీక్షించడానికి చి-స్క్వేర్ పరీక్షను ఉపయోగించడం.

మోడల్ (శూన్య పరికల్పన H 0) డై ఫెయిర్ అని ఉండనివ్వండి - అన్ని ముఖాలు p i =1/6, i =, M=6 సంభావ్యతతో సమానంగా తరచుగా కనిపిస్తాయి. ఒక ప్రయోగం నిర్వహించబడింది, దీనిలో డైని 60 సార్లు విసిరారు (N = 60 స్వతంత్ర ట్రయల్స్ నిర్వహించబడ్డాయి). మోడల్ ప్రకారం, అన్ని గమనించిన పౌనఃపున్యాలు O i సంభవించిన 1,2,... 6 పాయింట్లు వాటి సగటు విలువలకు దగ్గరగా ఉండాలి E i =Np i =60∙(1/6)=10. H 0 ప్రకారం, సగటు ఫ్రీక్వెన్సీల వెక్టర్ (E i )=(Np i )=(10, 10, 10, 10, 10, 10). (ప్రయోగం ప్రారంభానికి ముందు సగటు పౌనఃపున్యాలు పూర్తిగా తెలిసిన పరికల్పనలను సింపుల్ అంటారు.) గమనించిన వెక్టర్ (O i ) (34,0,0,0,0,26)కి సమానంగా ఉంటే, అది వెంటనే ఉంటుంది. నమూనా తప్పు అని స్పష్టం చేయండి - ఎముక సరైనది కాదు, ఎందుకంటే 1 మరియు 6 మాత్రమే 60 సార్లు చుట్టబడ్డాయి. సరైన పాచికల కోసం అటువంటి సంఘటన యొక్క సంభావ్యత చాలా తక్కువ: P = (2/6) 60 =2.4*10 -29. అయినప్పటికీ, మోడల్ మరియు అనుభవం మధ్య ఇటువంటి స్పష్టమైన వ్యత్యాసాలు కనిపించడం మినహాయింపు. గమనించిన పౌనఃపున్యాల వెక్టర్ (O i ) (5, 15, 6, 14, 4, 16)కి సమానంగా ఉండనివ్వండి. ఇది H0కి అనుగుణంగా ఉందా? కాబట్టి, మనం రెండు ఫ్రీక్వెన్సీ వెక్టర్స్ (E i) మరియు (O i) పోల్చాలి. ఈ సందర్భంలో, ఊహించిన పౌనఃపున్యాల వెక్టర్ (Ei) యాదృచ్ఛికంగా ఉండదు, కానీ గమనించిన పౌనఃపున్యాల వెక్టర్ (Oi) యాదృచ్ఛికంగా ఉంటుంది - తదుపరి ప్రయోగంలో (60 త్రోల కొత్త సిరీస్‌లో) ఇది భిన్నంగా ఉంటుంది. సమస్య యొక్క రేఖాగణిత వివరణను పరిచయం చేయడం ఉపయోగకరంగా ఉంటుంది మరియు ఫ్రీక్వెన్సీ స్పేస్‌లో (ఈ సందర్భంలో 6-డైమెన్షనల్) రెండు పాయింట్లు కోఆర్డినేట్‌లతో (5, 15, 6, 14, 4, 16) మరియు (10, 10,) ఇవ్వబడ్డాయి. 10, 10, 10, 10). ఇది H 0తో అననుకూలంగా పరిగణించడానికి అవి చాలా దూరంగా ఉన్నాయా? మరో మాటలో చెప్పాలంటే, మనకు అవసరం:

  1. ఫ్రీక్వెన్సీల మధ్య దూరాలను కొలవడం నేర్చుకోండి (ఫ్రీక్వెన్సీ స్థలంలో పాయింట్లు),
  2. ఏ దూరాన్ని కూడా పెద్దదిగా పరిగణించాలి ("అనుకూలంగా") అంటే, H 0కి విరుద్ధంగా పరిగణించాలి.

సాధారణ యూక్లిడియన్ దూరం యొక్క వర్గానికి సమానంగా ఉంటుంది:

X 2 యూక్లిడ్ = ఎస్(O i -E i) 2 = (5-10) 2 +(15-10) 2 + (6-10) 2 +(14-10) 2 +(4-10) 2 +(16-10) 2

ఈ సందర్భంలో, మేము E i విలువలను సరిచేసి O iని మార్చినట్లయితే X 2 Euclid = const ఉపరితలాలు ఎల్లప్పుడూ గోళాలుగా ఉంటాయి. ఫ్రీక్వెన్సీ స్పేస్‌లో యూక్లిడియన్ దూరాన్ని ఉపయోగించకూడదని కార్ల్ పియర్సన్ పేర్కొన్నాడు. అందువల్ల, పాయింట్లు (O = 1030 మరియు E = 1000) మరియు (O = 40 మరియు E = 10) ఒకదానికొకటి సమాన దూరంలో ఉన్నాయని భావించడం సరికాదు, అయితే రెండు సందర్భాల్లోనూ వ్యత్యాసం O -E = 30. అన్ని తరువాత, ఊహించిన పౌనఃపున్యం ఎక్కువ, దాని నుండి ఎక్కువ వ్యత్యాసాలు సాధ్యమేనని పరిగణించాలి. కాబట్టి, పాయింట్లు (O =1030 మరియు E =1000) "దగ్గరగా" పరిగణించబడాలి మరియు పాయింట్లు (O =40 మరియు E =10) ఒకదానికొకటి "దూరం". పరికల్పన H 0 నిజమైతే, E iకి సంబంధించి O i యొక్క ఫ్రీక్వెన్సీ హెచ్చుతగ్గులు E i యొక్క వర్గమూలం(!) క్రమానికి చెందినవని చూపవచ్చు. అందువల్ల, పియర్సన్ దూరాన్ని లెక్కించేటప్పుడు, తేడాలు (O i -E i) కాకుండా సాధారణీకరించిన తేడాలు (O i -E i)/E i 1/2ని వర్గీకరించాలని ప్రతిపాదించారు. కాబట్టి పియర్సన్ దూరాన్ని లెక్కించడానికి ఇక్కడ ఫార్ములా ఉంది (ఇది వాస్తవానికి దూరం యొక్క స్క్వేర్):

X 2 పియర్సన్ = ఎస్((O i -E i )/E i 1/2) 2 = ఎస్(O i -E i) 2 /E i

మా ఉదాహరణలో:

X 2 పియర్సన్ = (5-10) 2 /10+(15-10) 2 /10 +(6-10) 2 /10+(14-10) 2 /10+(4-10) 2 /10+( 16-10) 2 /10=15.4

సాధారణ మరణానికి, అన్ని ఆశించిన పౌనఃపున్యాలు E i ఒకే విధంగా ఉంటాయి, కానీ సాధారణంగా అవి భిన్నంగా ఉంటాయి, కాబట్టి పియర్సన్ దూరం స్థిరంగా ఉండే ఉపరితలాలు (X 2 పియర్సన్ = const) ఎలిప్సోయిడ్‌లుగా మారతాయి, గోళాలు కాదు.

ఇప్పుడు దూరాలను లెక్కించే ఫార్ములా ఎంపిక చేయబడింది, ఏ దూరాలను "చాలా పెద్దది కాదు" (H 0కి అనుగుణంగా) పరిగణించాలో కనుగొనడం అవసరం. కాబట్టి, ఉదాహరణకు, మనం 15.4ని లెక్కించిన దూరం గురించి మనం ఏమి చెప్పగలం. ? సాధారణ డైతో ప్రయోగాలు చేస్తున్నప్పుడు ఎంత శాతం కేసులలో (లేదా ఏ సంభావ్యతతో) మనం 15.4 కంటే ఎక్కువ దూరాన్ని పొందుతాము? ఈ శాతం తక్కువగా ఉంటే (<0.05), то H 0 надо отвергнуть. Иными словами требуется найти распределение длярасстояния Пирсона. Если все ожидаемые частоты E i не слишком малы (≥5), и верна H 0 , то нормированные разности (O i - E i )/E i 1/2 приближенно эквивалентны стандартным гауссовским случайным величинам: (O i - E i )/E i 1/2 ≈N (0,1). Это, например, означает, что в 95% случаев| (O i - E i )/E i 1/2 | < 1.96 ≈ 2 (правило “двух сигм”).

వివరణ. I సంఖ్యతో పట్టిక సెల్‌లో పడే కొలతల సంఖ్య, పారామీటర్‌లతో ద్విపద పంపిణీని కలిగి ఉంటుంది: m =Np i =E i,σ =(Np i (1-p i)) 1/2, ఇక్కడ N అనేది సంఖ్య కొలతల (N "1), p i అనేది ఒక కొలత ఇచ్చిన సెల్‌లోకి పడే సంభావ్యత (కొలతలు స్వతంత్రంగా ఉంటాయి మరియు స్థిరమైన పరిస్థితులలో నిర్వహించబడతాయి). p i చిన్నదైతే, అప్పుడు: σ≈(Np i ) 1/2 =E i మరియు ద్విపద పంపిణీ పాయిసన్‌కి దగ్గరగా ఉంటుంది, దీనిలో సగటు పరిశీలనల సంఖ్య E i =λ, మరియు ప్రామాణిక విచలనం σ=λ 1/2 = E i 1/2. λ≥5 కోసం, పాయిజన్ పంపిణీ సాధారణ N (m =E i =λ, σ=E i 1/2 =λ 1/2), మరియు సాధారణీకరించిన విలువ (O i - E i )/E i 1కి దగ్గరగా ఉంటుంది. /2 ≈ N (0 ,1).

పియర్సన్ యాదృచ్ఛిక వేరియబుల్ χ 2 n – “చి-స్క్వేర్ విత్ ఫ్రీడమ్ ఆఫ్ n డిగ్రీలు”, n స్వతంత్ర ప్రామాణిక సాధారణ యాదృచ్ఛిక వేరియబుల్స్ యొక్క స్క్వేర్‌ల మొత్తంగా నిర్వచించాడు:

χ 2 n = T 1 2 + T 2 2 + …+ T n 2,అందరూ ఎక్కడ ఉన్నారు T i = N(0,1) - n. ఓ. ఆర్. తో. వి.

గణాంకాలలో ఈ అత్యంత ముఖ్యమైన యాదృచ్ఛిక వేరియబుల్ యొక్క అర్థాన్ని స్పష్టంగా అర్థం చేసుకోవడానికి ప్రయత్నిద్దాం. దీన్ని చేయడానికి, విమానంలో (n = 2తో) లేదా అంతరిక్షంలో (n = 3తో) మేము పాయింట్ల క్లౌడ్‌ను ప్రదర్శిస్తాము, దీని కోఆర్డినేట్‌లు స్వతంత్రంగా ఉంటాయి మరియు ప్రామాణిక సాధారణ పంపిణీ T (x) ~exp (-x 2/2 ) ఒక విమానంలో, రెండు కోఆర్డినేట్‌లకు స్వతంత్రంగా వర్తించే “టూ సిగ్మా” నియమం ప్రకారం, 90% (0.95*0.95≈0.90) పాయింట్లు ఒక చతురస్రంలో (-2) ఉంటాయి.

f χ 2 2 (a) = Сexp(-a/2) = 0.5exp(-a/2).

తగినంత పెద్ద సంఖ్యలో స్వేచ్ఛ n (n > 30) డిగ్రీలతో, చి-స్క్వేర్ పంపిణీ సాధారణ స్థాయికి చేరుకుంటుంది: N (m = n; σ = (2n) ½). ఇది "కేంద్ర పరిమితి సిద్ధాంతం" యొక్క పరిణామం: పరిమిత వ్యత్యాసంతో ఒకే విధంగా పంపిణీ చేయబడిన పరిమాణాల మొత్తం పదాల సంఖ్య పెరిగేకొద్దీ సాధారణ చట్టాన్ని చేరుకుంటుంది.

ఆచరణలో, దూరం యొక్క సగటు చతురస్రం m (χ 2 n) = nకి సమానం అని మీరు గుర్తుంచుకోవాలి మరియు దాని వ్యత్యాసం σ 2 (χ 2 n) = 2n. ఇక్కడ నుండి ఏ చి-స్క్వేర్ విలువలు చాలా చిన్నవిగా మరియు చాలా పెద్దవిగా పరిగణించబడతాయో నిర్ధారించడం సులభం: పంపిణీలో ఎక్కువ భాగం n -2∙(2n) ½ నుండి n +2∙(2n) ½ వరకు ఉంటుంది.

కాబట్టి, పియర్సన్ దూరాలు గణనీయంగా n +2∙ (2n) ½ కంటే ఎక్కువగా ఉంటే అనూహ్యంగా పెద్దవిగా పరిగణించాలి (H 0కి విరుద్ధంగా). ఫలితం n +2∙(2n) ½కి దగ్గరగా ఉంటే, మీరు పట్టికలను ఉపయోగించాలి, దీనిలో మీరు ఏ నిష్పత్తిలో మరియు పెద్ద చి-స్క్వేర్ విలువలు కనిపించవచ్చో ఖచ్చితంగా కనుగొనవచ్చు.

స్వేచ్ఛ యొక్క డిగ్రీల సంఖ్యకు సరైన విలువను ఎలా ఎంచుకోవాలో తెలుసుకోవడం ముఖ్యం (సంక్షిప్తంగా n.d.f.). n అనేది అంకెల సంఖ్యకు సమానం అని భావించడం సహజంగా అనిపించింది: n =M. తన వ్యాసంలో, పియర్సన్ చాలా సూచించారు. పాచికల ఉదాహరణలో, దీని అర్థం n =6. అయినప్పటికీ, చాలా సంవత్సరాల తరువాత పియర్సన్ తప్పుగా భావించినట్లు చూపబడింది. యాదృచ్ఛిక వేరియబుల్స్ O i మధ్య కనెక్షన్‌లు ఉంటే స్వేచ్ఛ డిగ్రీల సంఖ్య ఎల్లప్పుడూ అంకెల సంఖ్య కంటే తక్కువగా ఉంటుంది. పాచికల ఉదాహరణ కోసం, మొత్తం O i 60, మరియు 5 పౌనఃపున్యాలు మాత్రమే స్వతంత్రంగా మార్చబడతాయి, కాబట్టి సరైన విలువ n = 6-1 = 5. n యొక్క ఈ విలువ కోసం మనకు n +2∙(2n) ½ =5+2∙(10) ½ =11.3. 15.4>11.3 నుండి, అప్పుడు పరికల్పన H 0 - డై సరైనది, తిరస్కరించబడాలి.

లోపాన్ని స్పష్టం చేసిన తర్వాత, ఇప్పటికే ఉన్న χ 2 పట్టికలు అనుబంధించబడాలి, ఎందుకంటే ప్రారంభంలో వాటికి n = 1 కేసు లేదు, ఎందుకంటే చిన్న సంఖ్యల సంఖ్య = 2. ఇప్పుడు పియర్సన్ దూరం χ 2 n =1 పంపిణీని కలిగి ఉన్నప్పుడు కేసులు ఉండవచ్చని తేలింది.

ఉదాహరణ. 100 కాయిన్ టాసులతో, తలల సంఖ్య O 1 = 65, మరియు తోకలు O 2 = 35. అంకెల సంఖ్య M = 2. నాణెం సుష్టంగా ఉంటే, అంచనా వేసిన ఫ్రీక్వెన్సీలు E 1 =50, E 2 =50.

X 2 పియర్సన్ = ఎస్(O i -E i) 2 /E i = (65-50) 2 /50 + (35-50) 2 /50 = 2*225/50 = 9.

ఫలిత విలువను యాదృచ్ఛిక వేరియబుల్ χ 2 n =1 తీసుకోగల వాటితో పోల్చాలి, ప్రామాణిక సాధారణ విలువ χ 2 n =1 =T 1 2 ≥ 9 యొక్క వర్గంగా నిర్వచించబడింది. ó T 1 ≥3 లేదా T 1 ≤-3. అటువంటి సంఘటన యొక్క సంభావ్యత చాలా తక్కువ P (χ 2 n =1 ≥9) = 0.006. అందువల్ల, నాణెం సుష్టంగా పరిగణించబడదు: H 0 తిరస్కరించబడాలి. స్వేచ్ఛ డిగ్రీల సంఖ్య అంకెల సంఖ్యకు సమానంగా ఉండదనే వాస్తవం గమనించిన పౌనఃపున్యాల మొత్తం ఎల్లప్పుడూ ఆశించిన వాటి మొత్తానికి సమానంగా ఉంటుంది, ఉదాహరణకు O 1 +O 2 =65+ 35 = E 1 +E 2 =50+50=100. అందువల్ల, O 1 మరియు O 2 కోఆర్డినేట్‌లతో యాదృచ్ఛిక పాయింట్లు సరళ రేఖలో ఉన్నాయి: O 1 +O 2 =E 1 +E 2 =100 మరియు ఈ పరిమితి లేనట్లయితే మరియు మధ్యలో ఉన్న దూరం కంటే తక్కువగా ఉంటుంది. అవి మొత్తం విమానంలో ఉన్నాయి. నిజానికి, E 1 =50, E 2 =50 గణిత అంచనాలతో ఉన్న రెండు స్వతంత్ర యాదృచ్ఛిక వేరియబుల్స్ కోసం, వాటి సాక్షాత్కారాల మొత్తం ఎల్లప్పుడూ 100కి సమానంగా ఉండకూడదు - ఉదాహరణకు, O 1 =60, O 2 =55 విలువలు ఆమోదయోగ్యంగా ఉంటుంది.

వివరణ. N స్వతంత్ర బెర్నౌలీ పరీక్షల శ్రేణిలో సంభావ్యత p కలిగి ν =K /N ఈవెంట్ సంభవించే ఫ్రీక్వెన్సీలో యాదృచ్ఛిక హెచ్చుతగ్గులను అంచనా వేసేటప్పుడు Moivre-Laplace ఫార్ములా ఇచ్చే దానితో M = 2 వద్ద పియర్సన్ ప్రమాణం యొక్క ఫలితాన్ని పోల్చి చూద్దాం ( K అనేది విజయాల సంఖ్య):

χ 2 n =1 = ఎస్(O i -E i) 2 /E i = (O 1 -E 1) 2 /E 1 + (O 2 -E 2) 2 /E 2 = (Nν -Np) 2 /(Np) + (N ( 1-ν )-N (1-p )) 2 /(N (1-p ))=

=(Nν-Np) 2 (1/p + 1/(1-p))/N=(Nν-Np) 2 /(Np(1-p))=((K-Np)/(Npq) ½ ) 2 = T 2

విలువ T =(K -Np)/(Npq) ½ = (K -m (K))/σ(K) ≈N (0.1) తో σ(K)=(Npq) ½ ≥3. ఈ సందర్భంలో పియర్సన్ యొక్క ఫలితం ద్విపద పంపిణీకి సాధారణ ఉజ్జాయింపు ఇచ్చే దానితో సరిగ్గా సరిపోతుందని మేము చూస్తాము.

ఇప్పటివరకు మేము ఊహించిన సగటు పౌనఃపున్యాలు E i పూర్తిగా ముందుగానే తెలిసిన సాధారణ పరికల్పనలను పరిగణించాము. సంక్లిష్ట పరికల్పనల కోసం సరైన స్వేచ్ఛ డిగ్రీల సంఖ్యను ఎలా ఎంచుకోవాలో సమాచారం కోసం, క్రింద చూడండి.

సంక్లిష్ట పరికల్పనలను పరీక్షించడానికి చి-స్క్వేర్ పరీక్షను ఉపయోగించడం

సాధారణ డై మరియు నాణెం ఉన్న ఉదాహరణలలో, ఊహించిన పౌనఃపున్యాలు ప్రయోగానికి ముందు(!) నిర్ణయించబడతాయి. ఇటువంటి పరికల్పనలను "సాధారణ" అని పిలుస్తారు. ఆచరణలో, "సంక్లిష్ట పరికల్పనలు" సర్వసాధారణం. అంతేకాకుండా, ఊహించిన పౌనఃపున్యాలను కనుగొనడానికి E i ముందుగా ఒకటి లేదా అనేక పరిమాణాలను (మోడల్ పారామితులు) అంచనా వేయడం అవసరం, మరియు ఇది ప్రయోగాత్మక డేటాను ఉపయోగించి మాత్రమే చేయబడుతుంది. ఫలితంగా, "సంక్లిష్ట పరికల్పనలు" కోసం ఊహించిన పౌనఃపున్యాలు E i గమనించిన పౌనఃపున్యాలపై ఆధారపడి ఉంటాయి O i అందువలన అవి యాదృచ్ఛిక వేరియబుల్స్‌గా మారతాయి, ప్రయోగం ఫలితాలను బట్టి మారుతాయి. పారామితులను ఎంచుకునే ప్రక్రియలో, పియర్సన్ దూరం తగ్గుతుంది - మోడల్ మరియు ప్రయోగం మధ్య ఒప్పందాన్ని మెరుగుపరచడానికి పారామితులు ఎంపిక చేయబడతాయి. కాబట్టి, స్వేచ్ఛ డిగ్రీల సంఖ్య తగ్గాలి.

మోడల్ పారామితులను ఎలా అంచనా వేయాలి? అనేక విభిన్న అంచనా పద్ధతులు ఉన్నాయి - “గరిష్ట సంభావ్యత పద్ధతి”, “క్షణాల పద్ధతి”, “ప్రత్యామ్నాయ పద్ధతి”. అయితే, మీరు ఏ అదనపు నిధులను ఉపయోగించలేరు మరియు పియర్సన్ దూరాన్ని తగ్గించడం ద్వారా పారామీటర్ అంచనాలను కనుగొనలేరు. పూర్వ-కంప్యూటర్ యుగంలో, ఈ విధానం చాలా అరుదుగా ఉపయోగించబడింది: ఇది మాన్యువల్ లెక్కల కోసం అసౌకర్యంగా ఉంటుంది మరియు ఒక నియమం వలె, విశ్లేషణాత్మకంగా పరిష్కరించబడదు. కంప్యూటర్‌లో లెక్కించేటప్పుడు, సంఖ్యాపరమైన కనిష్టీకరణ సాధారణంగా నిర్వహించడం సులభం, మరియు ఈ పద్ధతి యొక్క ప్రయోజనం దాని బహుముఖ ప్రజ్ఞ. కాబట్టి, “చి-స్క్వేర్ కనిష్టీకరణ పద్ధతి” ప్రకారం, మేము తెలియని పారామితుల విలువలను ఎంచుకుంటాము, తద్వారా పియర్సన్ దూరం చిన్నదిగా మారుతుంది. (మార్గం ద్వారా, కనుగొనబడిన కనిష్టానికి సంబంధించి చిన్న స్థానభ్రంశంతో ఈ దూరంలో మార్పులను అధ్యయనం చేయడం ద్వారా, మీరు అంచనా యొక్క ఖచ్చితత్వం యొక్క కొలతను అంచనా వేయవచ్చు: విశ్వాస విరామాలను నిర్మించండి.) పారామితులు మరియు ఈ కనీస దూరం కనుగొనబడిన తర్వాత, ఇది ఇది తగినంత చిన్నదా అనే ప్రశ్నకు సమాధానం ఇవ్వడానికి మళ్లీ అవసరం.

చర్యల యొక్క సాధారణ క్రమం క్రింది విధంగా ఉంటుంది:

  1. మోడల్ ఎంపిక (పరికల్పన H 0).
  2. అంకెల ఎంపిక మరియు గమనించిన పౌనఃపున్యాల వెక్టర్ యొక్క నిర్ణయం O i .
  3. తెలియని మోడల్ పారామితుల అంచనా మరియు వాటి కోసం విశ్వాస విరామాల నిర్మాణం (ఉదాహరణకు, కనీస పియర్సన్ దూరం కోసం శోధించడం ద్వారా).
  4. ఆశించిన పౌనఃపున్యాల గణన E i .
  5. చి-స్క్వేర్ χ 2 క్రిట్ యొక్క క్లిష్టమైన విలువతో పియర్సన్ దూరం X 2 యొక్క కనుగొనబడిన విలువ యొక్క పోలిక - అతిపెద్దది, ఇది ఇప్పటికీ ఆమోదయోగ్యమైనదిగా పరిగణించబడుతుంది, H 0కి అనుకూలంగా ఉంటుంది. సమీకరణాన్ని పరిష్కరించడం ద్వారా మేము పట్టికల నుండి χ 2 crit విలువను కనుగొంటాము

P (χ 2 n > χ 2 క్రిట్)=1-α,

ఇక్కడ α అనేది "ప్రాముఖ్యత స్థాయి" లేదా "ప్రమాణం యొక్క పరిమాణం" లేదా "మొదటి రకం లోపం యొక్క పరిమాణం" (సాధారణ విలువ α = 0.05).

సాధారణంగా ఫార్ములా ఉపయోగించి స్వేచ్ఛ n డిగ్రీల సంఖ్య లెక్కించబడుతుంది

n = (అంకెల సంఖ్య) – 1 – (అంచనా వేయవలసిన పారామితుల సంఖ్య)

X 2 > χ 2 crit అయితే, H 0 పరికల్పన తిరస్కరించబడుతుంది, లేకుంటే అది అంగీకరించబడుతుంది. α∙100% కేసులలో (అంటే చాలా అరుదుగా), H 0ని తనిఖీ చేసే ఈ పద్ధతి "మొదటి రకమైన లోపానికి" దారి తీస్తుంది: పరికల్పన H 0 తప్పుగా తిరస్కరించబడుతుంది.

ఉదాహరణ. 100 విత్తనాల 10 సిరీస్‌లను అధ్యయనం చేసినప్పుడు, ఆకుపచ్చ-కళ్ళు ఈగ-సోకిన వాటి సంఖ్య లెక్కించబడుతుంది. అందుకున్న డేటా: O ​​i =(16, 18, 11, 18, 21, 10, 20, 18, 17, 21);

ఇక్కడ ఊహించిన పౌనఃపున్యాల వెక్టర్ ముందుగానే తెలియదు. డేటా సజాతీయంగా ఉంటే మరియు ద్విపద పంపిణీ కోసం పొందినట్లయితే, అప్పుడు ఒక పరామితి తెలియదు: సోకిన విత్తనాల నిష్పత్తి p. అసలు పట్టికలో 10 కనెక్షన్‌లను సంతృప్తిపరిచే 10 కాదు కానీ 20 ఫ్రీక్వెన్సీలు ఉన్నాయని గమనించండి: 16+84=100, ... 21+79=100.

X 2 = (16-100p) 2 /100p +(84-100(1-p)) 2 /(100(1-p))+…+

(21-100p) 2 /100p +(79-100(1-p)) 2 /(100(1-p))

జతలలో పదాలను కలపడం (నాణెంతో ఉదాహరణలో వలె), మేము పియర్సన్ ప్రమాణాన్ని వ్రాసే రూపాన్ని పొందుతాము, ఇది సాధారణంగా వెంటనే వ్రాయబడుతుంది:

X 2 = (16-100p) 2 /(100p(1-p))+…+ (21-100p) 2 /(100p(1-p)).

ఇప్పుడు, కనీస పియర్సన్ దూరాన్ని p అంచనా వేయడానికి ఒక పద్ధతిగా ఉపయోగించినట్లయితే, X 2 =min కోసం pని కనుగొనడం అవసరం. (మోడల్ వీలైతే, ప్రయోగాత్మక డేటాకు "సర్దుబాటు" చేయడానికి ప్రయత్నిస్తుంది.)

పియర్సన్ ప్రమాణం గణాంకాలలో ఉపయోగించే అన్నింటిలో అత్యంత సార్వత్రికమైనది. ఇది ఏకరూప మరియు బహుళ డేటా, పరిమాణాత్మక మరియు గుణాత్మక లక్షణాలకు వర్తించవచ్చు. అయితే, ఖచ్చితంగా దాని బహుముఖ ప్రజ్ఞ కారణంగా, తప్పులు చేయకుండా జాగ్రత్త వహించాలి.

ముఖ్యమైన పాయింట్లు

1.వర్గాల ఎంపిక.

  • పంపిణీ వివిక్తంగా ఉంటే, అంకెల ఎంపికలో సాధారణంగా ఏకపక్షం ఉండదు.
  • పంపిణీ నిరంతరంగా ఉంటే, ఏకపక్షం అనివార్యం. గణాంకపరంగా సమానమైన బ్లాక్‌లను ఉపయోగించవచ్చు (అన్ని O ఒకే విధంగా ఉంటాయి, ఉదాహరణకు =10). అయితే, విరామాల పొడవు భిన్నంగా ఉంటాయి. మాన్యువల్ లెక్కలు చేస్తున్నప్పుడు, వారు విరామాలను ఒకే విధంగా చేయడానికి ప్రయత్నించారు. ఏకరూప లక్షణం యొక్క పంపిణీని అధ్యయనం చేసేటప్పుడు విరామాలు సమానంగా ఉండాలా? నం.
  • ఊహించిన (మరియు గమనించబడలేదు!) పౌనఃపున్యాలు చాలా చిన్నవి కాకుండా ఉండేలా అంకెలను కలపాలి (≥5). X 2ని లెక్కించేటప్పుడు హారంలో ఉండేవి (E i) అని గుర్తుచేసుకుందాం! ఒక డైమెన్షనల్ లక్షణాలను విశ్లేషించేటప్పుడు, E 1 =E max =1 అనే రెండు తీవ్ర అంకెలలో ఈ నియమాన్ని ఉల్లంఘించడానికి అనుమతించబడుతుంది. అంకెల సంఖ్య పెద్దదిగా ఉండి, ఆశించిన పౌనఃపున్యాలు దగ్గరగా ఉన్నట్లయితే, X 2 అనేది E i =2కి కూడా χ 2 యొక్క మంచి ఉజ్జాయింపు.

పారామీటర్ అంచనా. "ఇంట్లో తయారు చేయబడిన" ఉపయోగం, అసమర్థమైన అంచనా పద్ధతులు పెంచిన పియర్సన్ దూర విలువలకు దారితీయవచ్చు.

స్వేచ్ఛ యొక్క సరైన సంఖ్యను ఎంచుకోవడం. పరామితి అంచనాలు పౌనఃపున్యాల నుండి కాకుండా నేరుగా డేటా నుండి తయారు చేయబడితే (ఉదాహరణకు, అంకగణిత సగటు సగటు యొక్క అంచనాగా తీసుకోబడుతుంది), అప్పుడు స్వేచ్ఛ n డిగ్రీల ఖచ్చితమైన సంఖ్య తెలియదు. ఇది అసమానతను సంతృప్తిపరుస్తుందని మాత్రమే మాకు తెలుసు:

(అంకెల సంఖ్య – 1 – మూల్యాంకనం చేయబడుతున్న పారామితుల సంఖ్య)< n < (число разрядов – 1)

కాబట్టి, ఈ n పరిధిలో లెక్కించబడిన χ 2 crit యొక్క క్లిష్టమైన విలువలతో X 2ని సరిపోల్చడం అవసరం.

నమ్మశక్యం కాని చిన్న చి-స్క్వేర్ విలువలను ఎలా అర్థం చేసుకోవాలి?ఒక నాణెం 10,000 టాసుల తర్వాత, అది 5,000 సార్లు కోట్ ఆఫ్ ఆర్మ్స్‌పై పడినట్లయితే, దానిని సుష్టంగా పరిగణించాలా? గతంలో, చాలా మంది గణాంకవేత్తలు H 0ని కూడా తిరస్కరించాలని విశ్వసించారు. ఇప్పుడు మరొక విధానం ప్రతిపాదించబడింది: H 0ని అంగీకరించండి, అయితే డేటా మరియు వాటి విశ్లేషణ కోసం పద్దతి అదనపు ధృవీకరణకు లోబడి ఉంటుంది. రెండు అవకాశాలు ఉన్నాయి: చాలా చిన్న పియర్సన్ దూరం అంటే మోడల్ పారామితుల సంఖ్యను పెంచడం వలన స్వేచ్ఛ డిగ్రీల సంఖ్యలో సరైన తగ్గుదల లేదు, లేదా డేటా తప్పుగా మార్చబడింది (బహుశా అనుకోకుండా ఆశించిన ఫలితానికి సర్దుబాటు చేయబడింది).

ఉదాహరణ.ఇద్దరు పరిశోధకులు A మరియు B AA * aa మోనోహైబ్రిడ్ క్రాస్ యొక్క రెండవ తరంలో తిరోగమన హోమోజైగోట్స్ aa నిష్పత్తిని లెక్కించారు. మెండెల్ చట్టాల ప్రకారం, ఈ భిన్నం 0.25. ప్రతి పరిశోధకుడు 5 ప్రయోగాలు నిర్వహించారు మరియు ప్రతి ప్రయోగంలో 100 జీవులను అధ్యయనం చేశారు.

ఫలితాలు A: 25, 24, 26, 25, 24. పరిశోధకుడి ముగింపు: మెండెల్ చట్టం నిజం(?).

ఫలితాలు B: 29, 21, 23, 30, 19. పరిశోధకుడి ముగింపు: మెండెల్ చట్టం న్యాయమైనది కాదు(?).

అయితే, మెండెల్ యొక్క చట్టం గణాంక స్వభావం కలిగి ఉంది మరియు ఫలితాల పరిమాణాత్మక విశ్లేషణ ముగింపులను తిప్పికొడుతుంది! ఐదు ప్రయోగాలను ఒకటిగా కలిపి, మేము 5 డిగ్రీల స్వేచ్ఛతో చి-స్క్వేర్ పంపిణీకి చేరుకుంటాము (ఒక సాధారణ పరికల్పన పరీక్షించబడింది):

X 2 A = ((25-25) 2 +(24-25) 2 +(26-25) 2 +(25-25) 2 +(24-25) 2)/(100∙0.25∙0.75)=0.16

X 2 B = ((29-25) 2 +(21-25) 2 +(23-25) 2 +(30-25) 2 +(19-25) 2)/(100∙0.25∙0.75)=5.17

సగటు విలువ m [χ 2 n =5 ]=5, ప్రామాణిక విచలనం σ[χ 2 n =5 ]=(2∙5) 1/2 =3.2.

అందువల్ల, పట్టికలను సూచించకుండా, X 2 B యొక్క విలువ విలక్షణమైనది మరియు X 2 A విలువ అనూహ్యంగా చిన్నదని స్పష్టమవుతుంది. పట్టికల ప్రకారం P (χ 2 n =5<0.16)<0.0001.

ఈ ఉదాహరణ 1930 లలో జరిగిన నిజమైన కేసు యొక్క అనుసరణ (కోల్మోగోరోవ్ యొక్క పని "మెండెల్ చట్టాల యొక్క మరొక రుజువుపై" చూడండి). ఆసక్తికరంగా, పరిశోధకుడు A జన్యుశాస్త్రం యొక్క ప్రతిపాదకుడు, అయితే పరిశోధకుడు B దానిని వ్యతిరేకించారు.

సంజ్ఞామానంలో గందరగోళం.చి-స్క్వేర్ యాదృచ్ఛిక వేరియబుల్ యొక్క గణిత భావన నుండి దాని గణనలో అదనపు సంప్రదాయాలు అవసరమయ్యే పియర్సన్ దూరాన్ని వేరు చేయడం అవసరం. కొన్ని పరిస్థితులలో పియర్సన్ దూరం n డిగ్రీల స్వేచ్ఛతో చి-స్క్వేర్‌కు దగ్గరగా పంపిణీని కలిగి ఉంటుంది. కాబట్టి, పియర్సన్ దూరాన్ని χ 2 n గుర్తుతో సూచించడం మంచిది కాదు, కానీ సారూప్యమైన కానీ భిన్నమైన సంజ్ఞామానం X 2. .

పియర్సన్ ప్రమాణం సర్వశక్తిమంతమైనది కాదు. H 0 కోసం అనంతమైన ప్రత్యామ్నాయాలు ఉన్నాయి, వాటిని అతను పరిగణనలోకి తీసుకోలేడు. మీరు ఫీచర్ ఏకరీతి పంపిణీని కలిగి ఉన్న పరికల్పనను పరీక్షిస్తున్నారని అనుకుందాం, మీకు 10 అంకెలు ఉన్నాయి మరియు గమనించిన పౌనఃపున్యాల వెక్టర్ (130,125,121,118,116,115,114,113,111,110)కి సమానం. పియర్సన్ ప్రమాణం పౌనఃపున్యాలు మోనోటోనిక్‌గా తగ్గుతున్నాయని "గమనించలేదు" మరియు H 0 తిరస్కరించబడదు. ఇది శ్రేణి ప్రమాణంతో అనుబంధంగా ఉంటే, అవును!

ఈ ప్రమాణం యొక్క ఉపయోగం సైద్ధాంతిక మధ్య వ్యత్యాసం యొక్క అటువంటి కొలత (గణాంకాలు) వినియోగంపై ఆధారపడి ఉంటుంది F(x)మరియు అనుభావిక పంపిణీ F* n(x), ఇది సుమారుగా పంపిణీ చట్టం χకి కట్టుబడి ఉంటుంది 2 . పరికల్పన H 0ఈ గణాంకాల పంపిణీని విశ్లేషించడం ద్వారా పంపిణీల స్థిరత్వం తనిఖీ చేయబడుతుంది. ప్రమాణం యొక్క అనువర్తనానికి గణాంక శ్రేణిని నిర్మించడం అవసరం.

కాబట్టి, నమూనా సంఖ్యల సంఖ్య పక్కన గణాంకపరంగా ప్రదర్శించబడనివ్వండి ఎం. హిట్ రేటు గమనించబడింది నేను-వ ర్యాంక్ n i. సైద్ధాంతిక పంపిణీ చట్టానికి అనుగుణంగా, హిట్‌ల అంచనా ఫ్రీక్వెన్సీ i-వ వర్గం F i. గమనించిన మరియు ఊహించిన ఫ్రీక్వెన్సీ మధ్య వ్యత్యాసం ( n iF i) మధ్య వ్యత్యాసం యొక్క మొత్తం డిగ్రీని కనుగొనడానికి F(x) మరియు F* n (x) గణాంక శ్రేణిలోని అన్ని అంకెలలో స్క్వేర్డ్ వ్యత్యాసాల వెయిటెడ్ మొత్తాన్ని లెక్కించడం అవసరం

విలువ χ 2 అపరిమిత మాగ్నిఫికేషన్‌తో nχ 2 పంపిణీని కలిగి ఉంది (లక్షణరహితంగా χ 2గా పంపిణీ చేయబడింది). ఈ పంపిణీ స్వేచ్ఛ డిగ్రీల సంఖ్యపై ఆధారపడి ఉంటుంది కె, అనగా వ్యక్తీకరణలోని నిబంధనల యొక్క స్వతంత్ర విలువల సంఖ్య (3.7). స్వేచ్ఛ డిగ్రీల సంఖ్య సంఖ్యకు సమానం వైనమూనాపై విధించబడిన సరళ సంబంధాల సంఖ్య మైనస్. మిగిలిన పౌనఃపున్యాల మొత్తం నుండి ఏదైనా ఫ్రీక్వెన్సీని లెక్కించవచ్చు అనే వాస్తవం కారణంగా ఒక కనెక్షన్ ఉంది ఎం-1 అంకెలు. అదనంగా, పంపిణీ పారామితులు ముందుగానే తెలియకపోతే, నమూనాకు పంపిణీని అమర్చడం వలన మరొక పరిమితి ఉంది. నమూనా నిర్ణయిస్తే ఎస్పంపిణీ పారామితులు, అప్పుడు స్వేచ్ఛ డిగ్రీల సంఖ్య ఉంటుంది k=M –S–1.

పరికల్పన అంగీకార ప్రాంతం H 0షరతు χ ద్వారా నిర్ణయించబడుతుంది 2 < χ 2(k;a), ఎక్కడ χ 2(k;a)- ప్రాముఖ్యత స్థాయితో χ2 పంపిణీ యొక్క క్లిష్టమైన పాయింట్ a. రకం I లోపం యొక్క సంభావ్యత a, రకం II లోపం యొక్క సంభావ్యత స్పష్టంగా నిర్వచించబడదు, ఎందుకంటే పంపిణీలు సరిపోలని వివిధ మార్గాల్లో అనంతమైన పెద్ద సంఖ్యలో ఉన్నాయి. పరీక్ష యొక్క శక్తి అంకెల సంఖ్య మరియు నమూనా పరిమాణంపై ఆధారపడి ఉంటుంది. ప్రమాణం ఎప్పుడు వర్తింపజేయాలని సిఫార్సు చేయబడింది n>200, ఎప్పుడు ఉపయోగించడానికి అనుమతించబడుతుంది n>40, అటువంటి పరిస్థితులలో ప్రమాణం చెల్లుతుంది (నియమం ప్రకారం, ఇది తప్పు శూన్య పరికల్పనను తిరస్కరిస్తుంది).

ప్రమాణం ద్వారా తనిఖీ చేయడానికి అల్గోరిథం

1. సమాన సంభావ్యత పద్ధతిని ఉపయోగించి హిస్టోగ్రామ్‌ను రూపొందించండి.

2. హిస్టోగ్రాం యొక్క రూపాన్ని బట్టి, ఒక పరికల్పనను ముందుకు ఉంచండి

హెచ్ 0: f(x) = f 0(x),

హెచ్ 1: f(x) f 0(x),

ఎక్కడ f 0(x) - ఊహాజనిత పంపిణీ చట్టం యొక్క సంభావ్యత సాంద్రత (ఉదాహరణకు, ఏకరీతి, ఘాతాంక, సాధారణం).

వ్యాఖ్య. నమూనాలోని అన్ని సంఖ్యలు సానుకూలంగా ఉంటే ఘాతాంక పంపిణీ చట్టం గురించి పరికల్పనను ముందుకు తీసుకురావచ్చు.


3. సూత్రాన్ని ఉపయోగించి ప్రమాణం యొక్క విలువను లెక్కించండి

,

హిట్ ఫ్రీక్వెన్సీ ఎక్కడ ఉంది i-వ విరామం;

పై- యాదృచ్ఛిక వేరియబుల్ పడిపోవడం యొక్క సైద్ధాంతిక సంభావ్యత i- వ విరామం అందించిన పరికల్పన హెచ్ 0 నిజం.

గణన కోసం సూత్రాలు పైఘాతాంక, ఏకరీతి మరియు సాధారణ చట్టాల విషయంలో, అవి వరుసగా సమానంగా ఉంటాయి.

ఘాతాంక చట్టం

. (3.8)

ఇందులో 1 = 0, Bm= +.

ఏకరూప చట్టం

సాధారణ చట్టం

. (3.10)

ఇందులో 1 = -, B M = +.

గమనికలు. అన్ని సంభావ్యతలను లెక్కించిన తర్వాత పైసూచన సంబంధం సంతృప్తికరంగా ఉందో లేదో తనిఖీ చేయండి

ఫంక్షన్ Ф( X) - బేసి. Ф(+) = 1.

4. అపెండిక్స్‌లోని “చి-స్క్వేర్” పట్టిక నుండి, విలువ ఎంపిక చేయబడింది, పేర్కొన్న ప్రాముఖ్యత స్థాయి (= 0.05 లేదా = 0.01), మరియు కె- ఫార్ములా ద్వారా నిర్ణయించబడిన స్వేచ్ఛ డిగ్రీల సంఖ్య

కె= ఎం- 1 - ఎస్.

ఇక్కడ ఎస్- ఎంచుకున్న పరికల్పన ఆధారపడి ఉండే పారామితుల సంఖ్య హెచ్ 0 పంపిణీ చట్టం. విలువలు ఎస్ఏకరూప చట్టం కోసం ఇది 2, ఘాతాంక చట్టం కోసం ఇది 1, సాధారణ చట్టం కోసం ఇది 2.

5. అయితే , అప్పుడు పరికల్పన హెచ్ 0 విచలనం. లేకపోతే, దానిని తిరస్కరించడానికి ఎటువంటి కారణం లేదు: సంభావ్యత 1తో, ఇది నిజం, మరియు సంభావ్యతతో, ఇది తప్పు, కానీ విలువ తెలియదు.

ఉదాహరణ 3 . 1. ప్రమాణం 2ని ఉపయోగించి, యాదృచ్ఛిక వేరియబుల్ పంపిణీ చట్టం గురించి ఒక పరికల్పనను ముందుకు తెచ్చి పరీక్షించండి X, వైవిధ్య శ్రేణి, విరామ పట్టికలు మరియు పంపిణీ హిస్టోగ్రామ్‌లు ఉదాహరణ 1.2లో ఇవ్వబడ్డాయి. ప్రాముఖ్యత స్థాయి 0.05.

పరిష్కారం . హిస్టోగ్రామ్‌ల రూపాన్ని బట్టి, యాదృచ్ఛిక వేరియబుల్ అనే పరికల్పనను మేము ముందుకు తెచ్చాము Xసాధారణ చట్టం ప్రకారం పంపిణీ చేయబడింది:

హెచ్ 0: f(x) = ఎన్(m,);

హెచ్ 1: f(x) ఎన్(m,).

ప్రమాణం యొక్క విలువ సూత్రాన్ని ఉపయోగించి లెక్కించబడుతుంది.

ప్రమాణం యొక్క వివరణ

ప్రమాణం యొక్క ఉద్దేశ్యం

పియర్సన్ యొక్క చి-స్క్వేర్ పరీక్ష

ఉపన్యాస పదార్థాలు

అంశం 6. లక్షణం పంపిణీలో తేడాలను గుర్తించడం

పియర్సన్ ప్రమాణం: ప్రమాణం యొక్క ప్రయోజనం, దాని వివరణ, అప్లికేషన్ యొక్క పరిధి, గణన అల్గోరిథం.

పరిమాణాత్మక కొలతల ఫలితాలను పోల్చడానికి కోల్మోగోరోవ్-స్మిర్నోవ్ ప్రమాణం: ప్రమాణం యొక్క ప్రయోజనం, దాని వివరణ, అప్లికేషన్ యొక్క పరిధి, గణన అల్గోరిథం.

ఈ అంశాన్ని అధ్యయనం చేసేటప్పుడు, రెండు ప్రమాణాలు నాన్‌పారామెట్రిక్ అని పరిగణనలోకి తీసుకోవడం అవసరం; అవి ఫ్రీక్వెన్సీలతో పనిచేస్తాయి. పరిగణించబడిన ప్రమాణాల కోసం నిర్ణయ నియమాలకు ప్రత్యేక శ్రద్ధ వహించండి: ఈ నియమాలు విరుద్ధంగా ఉండవచ్చు. దయచేసి ప్రమాణాల దరఖాస్తులో పరిమితులను జాగ్రత్తగా సమీక్షించండి.

లెక్చర్ మెటీరియల్‌ని అధ్యయనం చేసిన తర్వాత, పరీక్ష ప్రశ్నలకు సమాధానమివ్వండి మరియు సమాధానాలను మీ నోట్స్‌లో రాయండి.

పియర్సన్ చి-స్క్వేర్ పరీక్ష పంపిణీలను పోల్చడంతోపాటు అనేక సమస్యలను పరిష్కరించగలదు.

χ 2 పరీక్ష రెండు ప్రయోజనాల కోసం ఉపయోగించబడుతుంది;

1) పోలిక కోసం అనుభావికతో లక్షణం పంపిణీ సైద్ధాంతిక -ఏకరీతి, సాధారణ లేదా ఇతరత్రా;

2) పోలిక కోసం రెండు, మూడు లేదా అంతకంటే ఎక్కువ అనుభావికమైనవిఅదే లక్షణం యొక్క పంపిణీలు, అంటే వాటి సజాతీయతను తనిఖీ చేయడం;

3) యాదృచ్ఛిక సంఘటనలు మొదలైన వాటి వ్యవస్థలో యాదృచ్ఛిక (సంభావ్యత) స్వతంత్రతను అంచనా వేయడం.

χ 2 ప్రమాణం ఒక లక్షణం యొక్క విభిన్న విలువలు అనుభావిక మరియు సైద్ధాంతిక పంపిణీలలో సమాన పౌనఃపున్యంతో లేదా రెండు లేదా అంతకంటే ఎక్కువ అనుభావిక పంపిణీలలో సంభవిస్తాయా అనే ప్రశ్నకు సమాధానం ఇస్తుంది.

పద్ధతి యొక్క ప్రయోజనం ఏమిటంటే, పేర్ల స్కేల్ నుండి ప్రారంభించి, ఏదైనా స్కేల్‌లో ప్రదర్శించబడిన లక్షణాల పంపిణీలను పోల్చడానికి ఇది అనుమతిస్తుంది. ప్రత్యామ్నాయ పంపిణీ యొక్క సరళమైన సందర్భంలో (“అవును - కాదు”, “లోపాన్ని అనుమతించారు - లోపాన్ని అనుమతించలేదు”, “సమస్యను పరిష్కరించారు - సమస్యను పరిష్కరించలేదు”, మొదలైనవి), మేము ఇప్పటికే χ 2ని వర్తింపజేయవచ్చు ప్రమాణం.

1. నమూనా పరిమాణం తగినంత పెద్దదిగా ఉండాలి: N>30. ఎప్పుడు ఎన్<30 критерий χ 2 дает весьма приближенные значения. Точность крите­рия повышается при больших N.

2. ప్రతి టేబుల్ సెల్ యొక్క సైద్ధాంతిక ఫ్రీక్వెన్సీ 5: f ≥ 5 కంటే తక్కువ ఉండకూడదు . దీనర్థం అంకెల సంఖ్య ముందుగా నిర్ణయించబడి మార్చబడకపోతే, మేము χ 2 పద్ధతిని వర్తింపజేయలేము , నిర్దిష్ట కనీస సంఖ్యలో పరిశీలనలను సేకరించకుండా. ఉదాహరణకు, ట్రస్ట్ టెలిఫోన్ సేవకు కాల్‌ల ఫ్రీక్వెన్సీ వారంలో 7 రోజుల పాటు అసమానంగా పంపిణీ చేయబడుతుందని మేము మా అంచనాలను పరీక్షించాలనుకుంటే, మాకు 5-7 = 35 కాల్‌లు అవసరం. ఈ విధంగా, అంకెల సంఖ్య ఉంటే (కె)ముందుగానే ఇవ్వబడింది, ఈ సందర్భంలో వలె, కనీస పరిశీలనల సంఖ్య (N నిమి) సూత్రం ద్వారా నిర్ణయించబడుతుంది: .



3. ఎంచుకున్న వర్గాలు తప్పనిసరిగా మొత్తం పంపిణీని "స్కూప్ అవుట్" చేయాలి, అంటే, లక్షణాల వైవిధ్యం యొక్క మొత్తం పరిధిని కవర్ చేయాలి. ఈ సందర్భంలో, అన్ని పోల్చబడిన పంపిణీలలో వర్గాలలో సమూహం తప్పనిసరిగా ఒకే విధంగా ఉండాలి.

4. 2 విలువలను మాత్రమే తీసుకునే లక్షణాల పంపిణీలను పోల్చినప్పుడు "కొనసాగింపు దిద్దుబాటు" చేయడం అవసరం. దిద్దుబాటు చేసినప్పుడు, χ 2 విలువ తగ్గుతుంది (కొనసాగింపు దిద్దుబాటుతో ఉదాహరణ చూడండి).

5. వర్గాలు తప్పనిసరిగా అతివ్యాప్తి చెందకుండా ఉండాలి: పరిశీలన ఒక వర్గానికి కేటాయించబడితే, అది ఇకపై ఏ ఇతర వర్గానికి కేటాయించబడదు. ర్యాంక్ వారీగా పరిశీలనల మొత్తం ఎల్లప్పుడూ మొత్తం పరిశీలనల సంఖ్యకు సమానంగా ఉండాలి.

χ 2 ప్రమాణాన్ని లెక్కించడానికి అల్గోరిథం

1. కింది రకానికి చెందిన ఫీచర్ విలువల పరస్పర సంయోగం యొక్క పట్టికను సృష్టించండి (ముఖ్యంగా, ఇది రెండు-డైమెన్షనల్ వైవిధ్య శ్రేణి, దీనిలో ఉమ్మడి ఫీచర్ విలువలు సంభవించే పౌనఃపున్యాలు సూచించబడతాయి) - టేబుల్ 19. పట్టిక కలిగి ఉంది షరతులతో కూడిన పౌనఃపున్యాలు, వీటిని మనం సాధారణ రూపంలో f ijగా సూచిస్తాము. ఉదాహరణకు, ఒక లక్షణం యొక్క స్థాయిల సంఖ్య X 3 (k=3)కి సమానం, లక్షణం యొక్క స్థాయిల సంఖ్య వద్దసమానం 4 (m=4); అప్పుడు i 1 నుండి k వరకు మారుతూ ఉంటుంది మరియు జె 1 నుండి మీ వరకు మారుతూ ఉంటుంది.

పట్టిక 19

x i y j x 1 x 2 x 3
1 వద్ద f 11 f 21 f 31 f –1
2 వద్ద f 12 f 22 f 32 f –2
3 వద్ద f 13 f 23 f 33 f –3
4 వద్ద f 14 f 24 f 34 f –4
f 1– f 2– f 3– ఎన్

2. తరువాత, గణనల సౌలభ్యం కోసం, మేము పరస్పర ఆకస్మిక యొక్క అసలు పట్టికను క్రింది ఫారమ్ (టేబుల్ 20) యొక్క పట్టికగా మారుస్తాము, నియత పౌనఃపున్యాలతో నిలువు వరుసలను ఒకదానికొకటి క్రింద ఉంచుతాము: వర్గాల పేర్లను పట్టికలో నమోదు చేయండి (నిలువు వరుసలు 1 మరియు 2) మరియు సంబంధిత అనుభావిక పౌనఃపున్యాలు (3వ నిలువు వరుస ).

పట్టిక 20

x i వై జె f ij f ij * f ij - f ij * (f ij – f ij *) 2 (f ij – f ij *) 2 / f ij *
1 2 3 4 5 6 7
x 1 1 వద్ద f 11 f 11*
x 1 2 వద్ద f 12 f 12*
x 1 3 వద్ద f 13 f 13*
x 1 4 వద్ద f 14 f 14*
x 2 1 వద్ద f 21 f 21 *
x 2 2 వద్ద f 22 f 22 *
x 2 3 వద్ద f 23 f 23 *
x 2 4 వద్ద f 24 f 24 *
x 3 1 వద్ద f 31 f 31 *
x 3 2 వద్ద f 32 f 32 *
x 3 3 వద్ద f 33 f 33 *
x 3 4 వద్ద f 34 f 34*
∑=………….

3. ప్రతి అనుభావిక పౌనఃపున్యం పక్కన, కింది సూత్రాన్ని ఉపయోగించి లెక్కించబడే సైద్ధాంతిక పౌనఃపున్యాన్ని (4వ కాలమ్) వ్రాయండి (సంబంధిత లైన్‌లోని మొత్తం పౌనఃపున్యాలు సంబంధిత కాలమ్‌లోని మొత్తం ఫ్రీక్వెన్సీతో గుణించబడతాయి మరియు మొత్తం సంఖ్యతో భాగించబడతాయి. పరిశీలనలు):

5. సూత్రాన్ని ఉపయోగించి స్వేచ్ఛ డిగ్రీల సంఖ్యను నిర్ణయించండి: ν=(k-1)(m-1) , ఎక్కడ k-అట్రిబ్యూట్ అంకెల సంఖ్య X, m - సంకేతం యొక్క అంకెల సంఖ్య వద్ద.

ν=1 అయితే, “కొనసాగింపు” కోసం దిద్దుబాటు చేసి, దానిని కాలమ్ 5aలో వ్రాయండి.

కొనసాగింపు దిద్దుబాటు అనేది షరతులతో కూడిన మరియు సైద్ధాంతిక పౌనఃపున్యాల మధ్య వ్యత్యాసం నుండి మరొక 0.5ను తీసివేయడం. అప్పుడు మన పట్టికలోని నిలువు వరుస శీర్షికలు ఇలా కనిపిస్తాయి (టేబుల్ 21):

పట్టిక 21

X వద్ద f ij f ij * f ij - f ij * f ij – f ij * – 0.5 (f ij – f ij * – 0.5) 2 (f ij – f ij * – 0.5) 2 / f ij *
1 2 3 4 5 5a 6 7

6. ఫలిత తేడాలను వర్గీకరించండి మరియు వాటిని 6 వ నిలువు వరుసలో నమోదు చేయండి.

7. ఫలిత స్క్వేర్డ్ తేడాలను సైద్ధాంతిక పౌనఃపున్యంతో విభజించి, ఫలితాలను 7వ నిలువు వరుసలో రాయండి.

8. 7వ నిలువు వరుస విలువలను సంకలనం చేయండి. ఫలిత మొత్తం χ 2 emగా సూచించబడుతుంది.

9. నిర్ణయ నియమం:

ప్రమాణం యొక్క లెక్కించిన విలువ తప్పనిసరిగా క్లిష్టమైన (లేదా పట్టిక చేయబడిన) విలువతో పోల్చబడాలి. క్లిష్టమైన విలువ పియర్సన్ χ 2 ప్రమాణం యొక్క క్లిష్టమైన విలువల పట్టిక ప్రకారం స్వేచ్ఛ డిగ్రీల సంఖ్యపై ఆధారపడి ఉంటుంది (అనుబంధం 1.6 చూడండి).

χ 2 calc ≥ χ 2 పట్టిక అయితే, పంపిణీల మధ్య వ్యత్యాసాలు గణాంకపరంగా ముఖ్యమైనవి, లేదా లక్షణాలు స్థిరంగా మారుతాయి లేదా లక్షణాల మధ్య సంబంధం గణాంకపరంగా ముఖ్యమైనది.

χ 2 లెక్కించినట్లయితే< χ 2 табл, то расхождения между рас­пределениями статистически недостоверны, или признаки изменяются несогласованно, или связи между признаками нет.

χ 2 ప్రమాణం యొక్క పొందిన విలువ క్లిష్టమైన విలువ కంటే ఎక్కువగా ఉంటే, మేము అధ్యయనం చేసిన ప్రమాద కారకం మరియు తగిన ప్రాముఖ్యత స్థాయిలో ఫలితం మధ్య గణాంక సంబంధం ఉందని నిర్ధారించాము.

పియర్సన్ చి-స్క్వేర్ పరీక్షను లెక్కించడానికి ఉదాహరణ

పైన చర్చించిన పట్టికను ఉపయోగించి ధమనుల రక్తపోటు సంభవంపై ధూమపాన కారకం యొక్క ప్రభావం యొక్క గణాంక ప్రాముఖ్యతను మేము నిర్ణయిస్తాము:

1. ప్రతి సెల్ కోసం ఆశించిన విలువలను లెక్కించండి:

2. పియర్సన్ చి-స్క్వేర్ పరీక్ష విలువను కనుగొనండి:

χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

3. స్వేచ్ఛ డిగ్రీల సంఖ్య f = (2-1)*(2-1) = 1. పట్టికను ఉపయోగించి, మేము పియర్సన్ చి-స్క్వేర్ పరీక్ష యొక్క క్లిష్టమైన విలువను కనుగొంటాము, ఇది ప్రాముఖ్యత స్థాయి p=0.05 మరియు స్వేచ్ఛా డిగ్రీల సంఖ్య 1 3.841.

4. మేము చి-స్క్వేర్ పరీక్ష యొక్క పొందిన విలువను క్లిష్టమైన దానితో పోల్చాము: 4.396 > 3.841, కాబట్టి, ధూమపానం యొక్క ఉనికిపై ధమనుల రక్తపోటు సంభవం యొక్క ఆధారపడటం గణాంకపరంగా ముఖ్యమైనది. ఈ సంబంధం యొక్క ప్రాముఖ్యత స్థాయి p కి అనుగుణంగా ఉంటుంది<0.05.

అలాగే, పియర్సన్ చి-స్క్వేర్ పరీక్ష సూత్రాన్ని ఉపయోగించి లెక్కించబడుతుంది

కానీ 2x2 పట్టిక కోసం, యేట్స్ దిద్దుబాటు ప్రమాణం ద్వారా మరింత ఖచ్చితమైన ఫలితాలు పొందబడతాయి

ఉంటే N(0)ఆమోదించబడిన,

ఎప్పుడు ఆమోదించబడిన H(1)

పరిశీలనల సంఖ్య తక్కువగా ఉన్నప్పుడు మరియు టేబుల్ సెల్‌లు 5 కంటే తక్కువ ఫ్రీక్వెన్సీని కలిగి ఉన్నప్పుడు, చి-స్క్వేర్ పరీక్ష వర్తించదు మరియు పరికల్పనలను పరీక్షించడానికి ఉపయోగించబడుతుంది ఫిషర్ యొక్క ఖచ్చితమైన పరీక్ష . ఈ ప్రమాణాన్ని లెక్కించే విధానం చాలా శ్రమతో కూడుకున్నది, మరియు ఈ సందర్భంలో కంప్యూటర్ స్టాటిస్టికల్ అనాలిసిస్ ప్రోగ్రామ్‌లను ఉపయోగించడం మంచిది.

ఆకస్మిక పట్టికను ఉపయోగించి, మీరు రెండు గుణాత్మక లక్షణాల మధ్య కనెక్షన్ యొక్క కొలతను లెక్కించవచ్చు - ఇది యూల్ అసోసియేషన్ గుణకం ప్ర (సహసంబంధ గుణకంతో సమానంగా)

ప్ర 0 నుండి 1 వరకు పరిధిలో ఉంటుంది. ఒకదానికి దగ్గరగా ఉండే గుణకం లక్షణాల మధ్య బలమైన సంబంధాన్ని సూచిస్తుంది. ఇది సున్నాకి సమానంగా ఉంటే, కనెక్షన్ ఉండదు .

ఫై-స్క్వేర్ కోఎఫీషియంట్ (φ 2) అదేవిధంగా ఉపయోగించబడుతుంది

బెంచ్మార్క్ టాస్క్

ఆహారం మరియు ఆహారం లేకుండా డ్రోసోఫిలా సమూహాలలో మ్యుటేషన్ ఫ్రీక్వెన్సీ మధ్య సంబంధాన్ని పట్టిక వివరిస్తుంది



ఆకస్మిక పట్టిక విశ్లేషణ

ఆకస్మిక పట్టికను విశ్లేషించడానికి, H 0 పరికల్పనను ముందుకు ఉంచారు, అనగా, అధ్యయనం యొక్క ఫలితంపై అధ్యయనం చేయబడిన లక్షణం యొక్క ప్రభావం లేకపోవడం. దీని కోసం, ఆశించిన ఫ్రీక్వెన్సీ లెక్కించబడుతుంది మరియు అంచనా పట్టిక నిర్మించబడుతుంది.

వెయిటింగ్ టేబుల్

సమూహాలు మిరప పంటలు మొత్తం
మ్యుటేషన్లు ఇచ్చారు మ్యుటేషన్లు ఇవ్వలేదు
వాస్తవ ఫ్రీక్వెన్సీ ఊహించిన ఫ్రీక్వెన్సీ వాస్తవ ఫ్రీక్వెన్సీ ఊహించిన ఫ్రీక్వెన్సీ
దాణాతో
ఆహారం లేకుండా
మొత్తం

పద్ధతి సంఖ్య 1

వేచి ఉండే ఫ్రీక్వెన్సీని నిర్ణయించండి:

2756 – X ;

2. 3561 – 3124

సమూహాలలో పరిశీలనల సంఖ్య తక్కువగా ఉంటే, X 2ని ఉపయోగిస్తున్నప్పుడు, వాస్తవమైన మరియు ఊహించిన పౌనఃపున్యాలను వివిక్త పంపిణీలతో పోల్చిన సందర్భంలో, కొంత సరికానిది అనుబంధించబడుతుంది, సరికానిదాన్ని తగ్గించడానికి, యేట్స్ దిద్దుబాటు ఉపయోగించబడుతుంది.

చి-స్క్వేర్ పరీక్ష.

చి-స్క్వేర్ పరీక్ష, z పరీక్ష వలె కాకుండా, ఎన్ని సమూహాలనైనా పోల్చడానికి ఉపయోగించబడుతుంది.

ప్రారంభ డేటా: ఆకస్మిక పట్టిక.

2*2 కనిష్ట పరిమాణంతో ఆకస్మిక పట్టిక యొక్క ఉదాహరణ క్రింద ఇవ్వబడింది. A, B, C, D - నిజమైన ఫ్రీక్వెన్సీలు అని పిలవబడేవి.

సైన్ 1 సంకేతం 2 మొత్తం
సమూహం 1 బి A+B
సమూహం 2 సి డి C+D
మొత్తం A+C B+D A+B+C+D

ప్రమాణం యొక్క గణన నిజమైన పౌనఃపున్యాలు మరియు ఊహించిన పౌనఃపున్యాల పోలికపై ఆధారపడి ఉంటుంది, ఇది ఒకదానికొకటి పోల్చబడిన లక్షణాల యొక్క పరస్పర ప్రభావం లేదని భావించి లెక్కించబడుతుంది. అందువల్ల, వాస్తవ మరియు ఊహించిన పౌనఃపున్యాలు ఒకదానికొకటి దగ్గరగా ఉంటే, అప్పుడు ఎటువంటి ప్రభావం ఉండదు మరియు లక్షణాలు సమూహాలలో దాదాపు సమానంగా పంపిణీ చేయబడతాయి.

ఈ పద్ధతిని వర్తింపజేయడానికి ప్రారంభ డేటా తప్పనిసరిగా ఆకస్మిక పట్టికలో నమోదు చేయబడాలి, వీటిలో నిలువు వరుసలు మరియు వరుసలు అధ్యయనం చేయబడిన లక్షణాల యొక్క విభిన్న విలువలను సూచిస్తాయి. ఈ పట్టికలోని సంఖ్యలను నిజమైన లేదా ప్రయోగాత్మక పౌనఃపున్యాలు అంటారు. తరువాత, లక్షణాల పంపిణీలో పోల్చబడిన సమూహాలు ఖచ్చితంగా సమానంగా ఉంటాయని ఊహ ఆధారంగా ఊహించిన పౌనఃపున్యాలను లెక్కించడం అవసరం. ఈ సందర్భంలో, మొత్తం అడ్డు వరుస లేదా నిలువు వరుస "మొత్తం" యొక్క నిష్పత్తులు తప్పనిసరిగా ఏదైనా అడ్డు వరుస మరియు నిలువు వరుసలో నిర్వహించబడాలి. దీని ఆధారంగా, ఊహించిన పౌనఃపున్యాలు నిర్ణయించబడతాయి (ఉదాహరణ చూడండి).

అప్పుడు ప్రమాణం యొక్క విలువ వాస్తవ పౌనఃపున్యం మరియు ఆశించిన పౌనఃపున్యం మరియు ఆశించిన పౌనఃపున్యం మధ్య వ్యత్యాసం యొక్క స్క్వేర్ యొక్క నిష్పత్తి యొక్క ఆకస్మిక పట్టికలోని అన్ని సెల్‌లపై మొత్తంగా లెక్కించబడుతుంది:

సెల్‌లో నిజమైన ఫ్రీక్వెన్సీ ఎక్కడ ఉంది; - సెల్‌లో ఊహించిన ఫ్రీక్వెన్సీ.

, ఎక్కడ N = A+ B + C + D.

టేబుల్ 2*2 కోసం ప్రాథమిక సూత్రాన్ని ఉపయోగించి లెక్కించేటప్పుడు ( ఈ పట్టిక కోసం మాత్రమే ), కొనసాగింపు కోసం యేట్స్ దిద్దుబాటును వర్తింపజేయడం కూడా అవసరం:

.

ప్రమాణం యొక్క క్లిష్టమైన విలువ పట్టిక నుండి నిర్ణయించబడుతుంది (అనుబంధం చూడండి) స్వేచ్ఛ యొక్క డిగ్రీల సంఖ్య మరియు ప్రాముఖ్యత స్థాయిని పరిగణనలోకి తీసుకుంటుంది. ప్రాముఖ్యత స్థాయి ప్రమాణంగా తీసుకోబడింది: 0.05; 0.01 లేదా 0.001. ఆకస్మిక పట్టిక యొక్క అడ్డు వరుసలు మరియు నిలువు వరుసల సంఖ్య యొక్క ఉత్పత్తిగా స్వేచ్ఛ డిగ్రీల సంఖ్య నిర్వచించబడింది, ప్రతి ఒక్కటి ఒకటి తగ్గించబడుతుంది:

,

ఎక్కడ ఆర్- పంక్తుల సంఖ్య (ఒక లక్షణం యొక్క స్థాయిల సంఖ్య), తో- నిలువు వరుసల సంఖ్య (మరొక లక్షణం యొక్క స్థాయిల సంఖ్య). ఈ క్లిష్టమైన విలువను మైక్రోసాఫ్ట్ ఎక్సెల్ స్ప్రెడ్‌షీట్‌లో =x2rev( ఫంక్షన్‌ని ఉపయోగించి నిర్ణయించవచ్చు. a, f), ఇక్కడ ఒక బదులుగా మీరు ప్రాముఖ్యత స్థాయిని నమోదు చేయాలి మరియు బదులుగా f- స్వేచ్ఛ డిగ్రీల సంఖ్య.

చి-స్క్వేర్ పరీక్ష యొక్క విలువ క్లిష్టమైన విలువ కంటే ఎక్కువగా ఉంటే, అప్పుడు లక్షణాల స్వతంత్రత గురించిన పరికల్పన తిరస్కరించబడుతుంది మరియు అవి ఎంచుకున్న ప్రాముఖ్యత స్థాయిపై ఆధారపడి పరిగణించబడతాయి.

ఈ పద్ధతి వర్తించడంలో పరిమితిని కలిగి ఉంది: ఊహించిన పౌనఃపున్యాలు తప్పనిసరిగా 5 లేదా అంతకంటే ఎక్కువ ఉండాలి (2*2 పట్టిక కోసం). ఏకపక్ష పట్టిక కోసం, ఈ పరిమితి తక్కువ కఠినంగా ఉంటుంది: అన్ని ఊహించిన పౌనఃపున్యాలు తప్పనిసరిగా 1 లేదా అంతకంటే ఎక్కువ ఉండాలి మరియు 5 కంటే తక్కువ పౌనఃపున్యాలు కలిగిన సెల్‌ల నిష్పత్తి 20% మించకూడదు.

పెద్ద పరిమాణాల యొక్క ఆకస్మిక పట్టిక నుండి, చిన్న పరిమాణాల పట్టికలను "వేరుచేయడం" మరియు వాటి కోసం ప్రమాణం c 2 యొక్క విలువను లెక్కించడం సాధ్యమవుతుంది. ఇవి విద్యార్థుల t పరీక్ష కోసం వివరించిన వాటికి సమానమైన బహుళ పోలికలు ప్రభావవంతంగా ఉంటాయి. ఈ సందర్భంలో, వారి సంఖ్యను బట్టి బహుళ పోలికలకు దిద్దుబాటును వర్తింపజేయడం కూడా అవసరం.

మైక్రోసాఫ్ట్ ఎక్సెల్ స్ప్రెడ్‌షీట్‌లలో సి 2 ప్రమాణాన్ని ఉపయోగించి పరికల్పనను పరీక్షించడానికి, మీరు క్రింది ఫంక్షన్‌ను ఉపయోగించవచ్చు:

HI2TEST(వాస్తవ_విరామం; ఆశించిన_విరామం).

ఇక్కడ actual_interval అనేది నిజమైన పౌనఃపున్యాలతో అసలైన ఆకస్మిక పట్టిక (ఫ్రీక్వెన్సీలు ఉన్న సెల్‌లు మాత్రమే హెడ్డింగ్‌లు లేకుండా మరియు "మొత్తం" లేకుండా సూచించబడతాయి); ఆశించిన_విరామం – ఊహించిన పౌనఃపున్యాల శ్రేణి. అందువల్ల, ఊహించిన పౌనఃపున్యాలు స్వతంత్రంగా లెక్కించబడాలి.

ఉదాహరణ:

ఒక నిర్దిష్ట నగరంలో అంటు వ్యాధి వ్యాప్తి చెందింది. కలుషితానికి మూలం తాగునీరు అని ఒక అంచనా ఉంది. పట్టణ జనాభా యొక్క నమూనా సర్వేను ఉపయోగించి ఈ ఊహను పరీక్షించాలని వారు నిర్ణయించుకున్నారు, దీని ప్రకారం త్రాగిన నీటి పరిమాణం కేసుల సంఖ్యను ప్రభావితం చేస్తుందో లేదో నిర్ణయించడం అవసరం.

మూలాధార డేటా క్రింది పట్టికలో చూపబడింది:

ఊహించిన ఫ్రీక్వెన్సీలను గణిద్దాం. పట్టికలో నిష్పత్తి అలాగే ఉండాలి. కాబట్టి, లెక్కిద్దాం, ఉదాహరణకు, మొత్తం సంఖ్యలో పంక్తులు ఏ భాగస్వామ్యాన్ని కలిగి ఉంటాయి మరియు మేము ప్రతి పంక్తికి ఒక గుణకాన్ని పొందుతాము. అదే నిష్పత్తి సంబంధిత అడ్డు వరుసలోని ప్రతి సెల్‌లో కనిపించాలి, కాబట్టి, సెల్‌లో ఊహించిన ఫ్రీక్వెన్సీని లెక్కించడానికి, మేము సంబంధిత కాలమ్‌లోని మొత్తం ద్వారా గుణకాన్ని గుణిస్తాము.

స్వేచ్ఛ డిగ్రీల సంఖ్య (3-1)*(2-1)=2. క్లిష్టమైన ప్రమాణం విలువ .

ప్రయోగాత్మక విలువ క్లిష్టమైన విలువ (61.5>13.816) కంటే ఎక్కువగా ఉంది, అనగా. 0.001 కంటే తక్కువ లోపం యొక్క సంభావ్యతతో అనారోగ్యంపై త్రాగిన నీటి పరిమాణం ప్రభావం ఉండదనే పరికల్పన తిరస్కరించబడింది. అందువల్ల, వ్యాధికి మూలం నీరు అని వాదించవచ్చు.

రెండు వివరించిన ప్రమాణాలు పరిమితులను కలిగి ఉంటాయి, అవి సాధారణంగా పరిశీలనల సంఖ్య తక్కువగా ఉంటే లేదా లక్షణాల యొక్క వ్యక్తిగత స్థాయిలు అరుదుగా ఉంటే వాటిని కలుసుకోలేరు. ఈ సందర్భంలో ఉపయోగించండి ఫిషర్ యొక్క ఖచ్చితమైన పరీక్ష . ఇది నిర్దిష్ట సంఖ్యలో సమూహాల కోసం ఆకస్మిక పట్టికను పూరించడానికి సాధ్యమయ్యే అన్ని ఎంపికల ద్వారా శోధించడంపై ఆధారపడి ఉంటుంది. అందువలన, మాన్యువల్ లెక్కింపు చాలా క్లిష్టంగా ఉంటుంది. దీన్ని లెక్కించడానికి, మీరు గణాంక అప్లికేషన్ ప్యాకేజీలను ఉపయోగించవచ్చు.

z పరీక్ష అనేది విద్యార్థుల పరీక్ష యొక్క అనలాగ్, కానీ గుణాత్మక లక్షణాలను పోల్చడానికి ఉపయోగించబడుతుంది. ప్రమాణం యొక్క ప్రయోగాత్మక విలువ నిష్పత్తులలో వ్యత్యాసం యొక్క నిష్పత్తిలో సగటు లోపానికి నిష్పత్తిలో వ్యత్యాసంగా లెక్కించబడుతుంది.

z ప్రమాణం యొక్క క్లిష్టమైన విలువలు సాధారణీకరించిన సాధారణ పంపిణీ యొక్క సంబంధిత పాయింట్లకు సమానంగా ఉంటాయి: , , .



గుణాత్మక లక్షణాల విలువల ప్రకారం ఎన్ని సమూహాలనైనా పోల్చడానికి చి-స్క్వేర్ పరీక్ష ఉపయోగించబడుతుంది. సోర్స్ డేటా తప్పనిసరిగా ఆకస్మిక పట్టిక రూపంలో సమర్పించబడాలి. ప్రమాణం యొక్క ప్రయోగాత్మక విలువ వాస్తవ పౌనఃపున్యం మరియు ఆశించిన పౌనఃపున్యం మరియు ఆశించిన పౌనఃపున్యం మధ్య వ్యత్యాసం యొక్క స్క్వేర్ యొక్క నిష్పత్తి యొక్క ఆకస్మిక పట్టికలోని అన్ని సెల్‌లపై మొత్తంగా లెక్కించబడుతుంది. ఊహించిన పౌనఃపున్యాలు అన్ని సమూహాలలో పోల్చబడిన లక్షణాలు సమానంగా ఉంటాయి అనే భావనతో లెక్కించబడతాయి. క్లిష్టమైన విలువలు చి-స్క్వేర్ పంపిణీ పట్టికల నుండి నిర్ణయించబడతాయి.

సాహిత్యం.

గ్లాంజ్ S. – అధ్యాయం 5.

రెబ్రోవా O.Yu. – అధ్యాయం 10,11.

లాకిన్ G.F. - తో. 120-123

విద్యార్థుల స్వీయ పరీక్ష కోసం ప్రశ్నలు.

1. ఏ సందర్భాలలో z ప్రమాణాన్ని ఉపయోగించవచ్చు?

2. z ప్రమాణం యొక్క ప్రయోగాత్మక విలువను లెక్కించడానికి ఆధారం ఏమిటి?

3. z ప్రమాణం యొక్క క్లిష్టమైన విలువను ఎలా కనుగొనాలి?

4. ఏ సందర్భాలలో సి 2 ప్రమాణాన్ని వర్తింపజేయవచ్చు?

5. ప్రమాణం c 2 యొక్క ప్రయోగాత్మక విలువను లెక్కించడానికి ఆధారం ఏమిటి?

6. సి 2 ప్రమాణం యొక్క క్లిష్టమైన విలువను ఎలా కనుగొనాలి?

7. పరిమితుల కారణంగా z మరియు c 2 ప్రమాణాలను వర్తింపజేయలేకపోతే నాణ్యత లక్షణాలను పోల్చడానికి ఇంకా ఏమి ఉపయోగించవచ్చు?

పనులు.