ባለብዙ መስመራዊ ትስስር። ሁለት ገለልተኛ ተለዋዋጮች

የ Excel ትንተና ጥቅል (Regression) በሚጠቀሙበት ጊዜ የመስመራዊ መመለሻ ግንባታ ፣ የመለኪያዎቹ ግምገማ እና የእነሱ ጠቀሜታ በጣም በፍጥነት ሊከናወን ይችላል። በአጠቃላይ ሁኔታ ውስጥ የተገኘውን ውጤት ትርጓሜ እንመልከት ( ገላጭ ተለዋዋጮች) በምሳሌ 3.6.

በጠረጴዛው ውስጥ የተሃድሶ ስታቲስቲክስየሚከተሉት እሴቶች ተሰጥተዋል-

ብዙ አር - ባለብዙ ትስስር ቅንጅት;

አር- ካሬ- የመወሰን ቅንጅት አር 2 ;

መደበኛ አር - ካሬ- ተስተካክሏል አር 2 ለነፃነት ዲግሪዎች ብዛት ተስተካክሏል;

መደበኛ ስህተት- የመመለሻ መደበኛ ስህተት ኤስ;

ምልከታዎች፡-ምልከታዎች ብዛት n.

በጠረጴዛው ውስጥ የልዩነት ትንተናተሰጥተዋል፡-

1. አምድ ዲኤፍ - እኩል የሆኑ የነፃነት ደረጃዎች ብዛት

ለሕብረቁምፊ መመለሻ ዲኤፍ = ;

ለሕብረቁምፊ ቀሪዲኤፍ = n – 1;

ለሕብረቁምፊ ጠቅላላዲኤፍ = n– 1.

2. አምድ ኤስኤስ -እኩል የሆነ የካሬ መዛባት ድምር

ለሕብረቁምፊ መመለሻ ;

ለሕብረቁምፊ ቀሪ ;

ለሕብረቁምፊ ጠቅላላ .

3. አምድ ወይዘሪትበቀመርው የሚወሰኑ ልዩነቶች ወይዘሪት = ኤስ.ኤስ/ዲኤፍ:

ለሕብረቁምፊ መመለሻ- የምክንያት መበታተን;

ለሕብረቁምፊ ቀሪ- ቀሪ ልዩነት.

4. አምድ ኤፍ - የተሰላ እሴት ኤፍ- መስፈርት ቀመር በመጠቀም ይሰላል

ኤፍ = ወይዘሪት(መመለስ)/ ወይዘሪት(ቀሪ)።

5. አምድ አስፈላጊነት ኤፍ - ከተሰላው ጋር የሚዛመድ ጠቀሜታ ደረጃ እሴት ኤፍ- ስታቲስቲክስ .

አስፈላጊነት ኤፍ= FDIST( ረ -ስታቲስቲክስ፣ ዲኤፍ(ወደ ኋላ መመለስ) ዲኤፍ(ቀሪ))።

ጠቀሜታ ከሆነ ኤፍ < стандартного уровня значимости, то አር 2 በስታቲስቲክስ ጉልህ ነው።

ዕድሎች መደበኛ ስህተት ቲ-ስታቲስቲክስ ፒ-እሴት የታችኛው 95% ከፍተኛ 95%
ዋይ 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

ይህ ሰንጠረዥ የሚያሳየው፡-

1. ዕድሎች- ተመጣጣኝ እሴቶች , .

2. መደበኛ ስህተት- የመመለሻ ቅንጅቶች መደበኛ ስህተቶች ኤስ.ኤ, ኤስ ለ.



3. ቲ -ስታቲስቲክስ- የተሰሉ እሴቶች በቀመር የተሰላ መስፈርት፡-

t-statistic = Coefficients/መደበኛ ስህተት።

4.አር- እሴት (አስፈላጊነት) ) ከተሰላው ጋር የሚዛመደው የትርጉም ደረጃ እሴት ነው። ቲ -ስታቲስቲክስ.

አር- እሴት = STUDIDIST(- ስታቲስቲክስ; ዲኤፍ(ቀሪ))።

ከሆነ አር- ትርጉም< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. የታችኛው 95% እና ከፍተኛ 95%- የታችኛው እና የላይኛው የ95% የመተማመን ክፍተቶች ለንድፈ-ሀሳብ መስመራዊ መመለሻ እኩልታ ቅንጅቶች።

የቀረውን ማውጣት
ምልከታ የተገመተው y ቀሪዎች ሠ
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

በጠረጴዛው ውስጥ የቀረውን ማውጣትአመልክቷል፡

በአምዱ ውስጥ ምልከታ- የመመልከቻ ቁጥር;

በአምዱ ውስጥ አስቀድሞ ተነግሯል። y - የተመካው ተለዋዋጭ ስሌት እሴቶች;

በአምዱ ውስጥ የተረፈ - በጥገኛ ተለዋዋጭ በተመለከቱት እና በተሰሉ እሴቶች መካከል ያለው ልዩነት።

ምሳሌ 3.6.በምግብ ወጪዎች ላይ መረጃ (የተለመዱ ክፍሎች) አሉ። yእና የነፍስ ወከፍ ገቢ xለዘጠኝ የቤተሰብ ቡድኖች:

x
y

የኤክሴል ትንተና ፓኬጅ (Regression) ውጤቶችን በመጠቀም የምግብ ወጪን በነፍስ ወከፍ ገቢ ላይ ያለውን ጥገኝነት እንመረምራለን።

የድጋሚ ትንተና ውጤቶች ብዙውን ጊዜ የሚጻፉት በቅጹ ነው፡-

የሪግሬሽን ኮርፖሬሽኖች መደበኛ ስህተቶች በቅንፍ ውስጥ በተገለጹበት.

የተገላቢጦሽ ቅንጅቶች = 65,92 እና ለ= 0.107. መካከል የግንኙነት አቅጣጫ yእና xየሪግሬሽን ኮፊሸንት ምልክትን ይወስናል = 0.107, ማለትም. ግንኙነቱ ቀጥተኛ እና አዎንታዊ ነው. Coefficient = 0.107 እንደሚያሳየው የነፍስ ወከፍ ገቢ በ 1 የተለመደ ነው። ክፍሎች የምግብ ወጪዎች በ 0.107 የተለመዱ ክፍሎች ይጨምራሉ. ክፍሎች

የውጤቱ ሞዴል (coefficients) አስፈላጊነትን እንገመግማለን. የቅንጅቶች አስፈላጊነት ( ሀ፣ ለ) ተረጋግጧል ሙከራ;

ፒ-እሴት ( ) = 0,00080 < 0,01 < 0,05

ፒ-እሴት ( ) = 0,00016 < 0,01 < 0,05,

ስለዚህ, የቁጥር መለኪያዎች ( ሀ፣ ለ) በ 1% ደረጃ, እና እንዲያውም በ 5% ጠቀሜታ ደረጃ ላይ ጉልህ ናቸው. ስለዚህ, የመመለሻ ቅንጅቶች ጉልህ ናቸው እና ሞዴሉ ለዋናው መረጃ በቂ ነው.

የድጋሚ ግምታዊ ውጤቶቹ ከተገኙት የሪግሬሽን ቅንጅቶች እሴቶች ጋር ብቻ ሳይሆን ከነሱ የተወሰነ ስብስብ (የመተማመን ክፍተት) ጋር ተኳሃኝ ናቸው። በ95% የመተማመን እድላቸው ለታዋቂዎች (38.16 - 93.68) ለ እና (0.0728 - 0.142) ለ ለ.

የአምሳያው ጥራት የሚለካው በቆራጥነት መለኪያ ነው አር 2 .

መጠን አር 2 = 0.884 ማለት የነፍስ ወከፍ ገቢ ምክንያት 88.4% የምግብ ወጪዎችን ልዩነት (መበታተን) ሊያብራራ ይችላል.

አስፈላጊነት አር 2 ተረጋግጧል ረ -ፈተና: ጠቀሜታ ኤፍ = 0,00016 < 0,01 < 0,05, следовательно, አር 2 በ 1% ደረጃ ጠቃሚ ነው, እና እንዲያውም በ 5% አስፈላጊነት ደረጃ ላይ.

በጥንድ አቅጣጫ መስመራዊ ሪግሬሽን ጉዳይ፣የግንኙነቱ ቅንጅት እንደሚከተለው ሊገለፅ ይችላል። . የተገኘው የጥምረት መጠን ዋጋ በምግብ ወጪዎች እና በነፍስ ወከፍ ገቢ መካከል ያለው ግንኙነት በጣም ቅርብ መሆኑን ያሳያል።

የድጋሚ ትንተና የአንድ የተወሰነ ግቤት ጥገኛ በአንድ ወይም በብዙ ገለልተኛ ተለዋዋጮች ላይ ለማሳየት የሚያስችል የስታቲስቲክስ ጥናት ዘዴ ነው። በቅድመ-ኮምፒዩተር ዘመን, አጠቃቀሙ በጣም አስቸጋሪ ነበር, በተለይም ከፍተኛ መጠን ያለው መረጃ ሲመጣ. ዛሬ በኤክሴል ውስጥ እንዴት ሪግሬሽን መገንባት እንደሚችሉ ከተማሩ በኋላ ውስብስብ ስታቲስቲካዊ ችግሮችን በጥቂት ደቂቃዎች ውስጥ መፍታት ይችላሉ። ከዚህ በታች ከኢኮኖሚክስ መስክ የተወሰኑ ምሳሌዎች አሉ።

የመልሶ ማቋቋም ዓይነቶች

ይህ ጽንሰ-ሐሳብ ራሱ በ 1886 ወደ ሂሳብ ገባ። መመለሻ ይከሰታል፡-

  • መስመራዊ;
  • ፓራቦሊክ;
  • ማስታገሻ;
  • ገላጭ;
  • ሃይፐርቦሊክ;
  • ማሳያ;
  • ሎጋሪዝም

ምሳሌ 1

በ6 የኢንዱስትሪ ኢንተርፕራይዞች አማካኝ ደሞዝ ያቋረጡ የቡድን አባላት ጥገኝነት የመወሰን ችግርን እናስብ።

ተግባር በስድስት ኢንተርፕራይዞች አማካይ ወርሃዊ ደሞዝ እና በፈቃደኝነት ያቋረጡ ሰራተኞች ብዛት ተተነተነ። በሰንጠረዥ መልክ አለን።

ያቋረጡ ሰዎች ብዛት

ደሞዝ

30,000 ሩብልስ

35,000 ሩብልስ

40,000 ሩብልስ

45,000 ሩብልስ

50,000 ሩብልስ

55,000 ሩብልስ

60,000 ሩብልስ

በ 6 ኢንተርፕራይዞች አማካኝ ደሞዝ ላይ የሰራተኞችን ቁጥር ጥገኝነት የመወሰን ተግባር ፣ የሪግሬሽን ሞዴል ቀመር Y = a 0 + a 1 x 1 +...+ a k x k ፣ እሱም x i በተለዋዋጮች ላይ ተጽዕኖ ማሳደር፣ a i የዳግም መመለሻ ቅንጅቶች ናቸው፣ እና k የምክንያቶች ብዛት ነው።

ለዚህ ችግር Y ሰራተኞችን ለማቋረጥ አመላካች ነው, እና ተፅዕኖ ፈጣሪው ደመወዝ ነው, ይህም በ X ነው.

የ Excel ተመን ሉህ ፕሮሰሰር ችሎታዎችን በመጠቀም

በ Excel ውስጥ ያለው የተሃድሶ ትንተና አብሮ የተሰሩ ተግባራትን አሁን ባለው የሰንጠረዥ መረጃ ላይ በመተግበር መቅደም አለበት። ነገር ግን, ለእነዚህ አላማዎች በጣም ጠቃሚ የሆነውን "የትንታኔ ጥቅል" ተጨማሪውን መጠቀም የተሻለ ነው. እሱን ለማግበር የሚከተሉትን ያስፈልግዎታል

  • ከ "ፋይል" ትር ወደ "አማራጮች" ክፍል ይሂዱ;
  • በሚከፈተው መስኮት ውስጥ "ተጨማሪዎች" የሚለውን መስመር ይምረጡ;
  • ከ "አስተዳደር" መስመር በስተቀኝ የሚገኘውን "ሂድ" የሚለውን ቁልፍ ጠቅ ያድርጉ;
  • ከ "ትንታኔ ፓኬጅ" ቀጥሎ ባለው ሳጥን ላይ ምልክት ያድርጉ እና "እሺ" ን ጠቅ በማድረግ ድርጊቶችዎን ያረጋግጡ.

ሁሉም ነገር በትክክል ከተሰራ, የሚፈለገው አዝራር ከ Excel የስራ ሉህ በላይ በሚገኘው "ዳታ" ትር በቀኝ በኩል ይታያል.

በ Excel ውስጥ

አሁን ኢኮኖሚያዊ ስሌቶችን ለማካሄድ ሁሉም አስፈላጊ ምናባዊ መሳሪያዎች በእጃችን አሉን, ችግራችንን መፍታት እንጀምራለን. ለዚህ:

  • "የውሂብ ትንተና" ቁልፍን ጠቅ ያድርጉ;
  • በሚከፈተው መስኮት ውስጥ "Regression" የሚለውን ቁልፍ ጠቅ ያድርጉ;
  • በሚታየው ትር ውስጥ ለ Y (የሥራ ማቆም ሠራተኞች ብዛት) እና ለ X (ደመወዛቸው) የእሴቶችን ክልል ያስገቡ።
  • "እሺ" የሚለውን ቁልፍ በመጫን ተግባራችንን እናረጋግጣለን.

በውጤቱም, ፕሮግራሙ በራስ-ሰር አዲስ የተመን ሉህ በዳግም ትንተና መረጃ ይሞላል. ማስታወሻ! ኤክሴል ለዚህ ዓላማ የመረጡትን ቦታ እራስዎ እንዲያዘጋጁ ይፈቅድልዎታል። ለምሳሌ ፣ ይህ የ Y እና X እሴቶች የሚገኙበት ተመሳሳይ ሉህ ፣ ወይም እንደዚህ ያሉ መረጃዎችን ለማከማቸት የተነደፈ አዲስ የሥራ መጽሐፍ ሊሆን ይችላል።

ለ R-squared የመመለሻ ውጤቶች ትንተና

በኤክሴል ውስጥ ፣ በምሳሌው ውስጥ ያለውን መረጃ በሚሰራበት ጊዜ የተገኘው መረጃ ቅጹ አለው ።

በመጀመሪያ ደረጃ, ለ R-squared እሴት ትኩረት መስጠት አለብዎት. እሱ የውሳኔውን ብዛት ይወክላል። በዚህ ምሳሌ, R-square = 0.755 (75.5%), ማለትም, የአምሳያው ስሌት መለኪያዎች በ 75.5% ግምት ውስጥ ባሉ ግቤቶች መካከል ያለውን ግንኙነት ያብራራሉ. የመወሰን ዋጋ ከፍ ባለ መጠን የተመረጠው ሞዴል ለአንድ የተወሰነ ተግባር የበለጠ ተስማሚ ነው። የ R-square ዋጋ ከ 0.8 በላይ በሚሆንበት ጊዜ ትክክለኛውን ሁኔታ በትክክል ለመግለጽ ይቆጠራል. R-ካሬ ከሆነ<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

የዕድል ትንተና

ቁጥር 64.1428 እያሰብናቸው ባለው ሞዴል ውስጥ ያሉት ሁሉም ተለዋዋጮች xi ወደ ዜሮ ከተቀናጁ የ Y ዋጋ ምን እንደሚሆን ያሳያል። በሌላ አገላለጽ, የተተነተነው መለኪያ ዋጋም በተወሰነ ሞዴል ውስጥ ያልተገለጹ ሌሎች ምክንያቶች ተጽዕኖ እንደሚያሳድር ሊከራከር ይችላል.

በሴል B18 ውስጥ የሚገኘው የሚቀጥለው ኮፊሸን -0.16285, የተለዋዋጭ X ተፅእኖ በ Y ላይ ያለውን ክብደት ያሳያል. ይህ ማለት ከግምት ውስጥ በሚገቡት ሞዴል ውስጥ ያሉ ሰራተኞች አማካኝ ወርሃዊ ደሞዝ ከ -0.16285, ማለትም ከክብደት -0.16285, ማለትም. የእሱ ተጽዕኖ ደረጃ ሙሉ በሙሉ ትንሽ ነው. የ "-" ምልክት ጠቋሚው አሉታዊ መሆኑን ያሳያል. ይህ ግልጽ ነው, ሁሉም በድርጅቱ ውስጥ ያለው የደመወዝ መጠን ከፍ ባለ መጠን ጥቂት ሰዎች የሥራ ስምሪት ውሉን ለማቋረጥ ወይም ለማቆም ፍላጎት እንዳላቸው ሁሉም ሰው ስለሚያውቅ ነው.

ባለብዙ ተሃድሶ

ይህ ቃል ከብዙ ነጻ የቅጹ ተለዋዋጮች ጋር ያለውን የግንኙነት እኩልታ ያመለክታል፡-

y=f(x 1 +x 2 +…x m) + ε፣ y የውጤት ባህሪ (ጥገኛ ተለዋዋጭ) ሲሆን x 1፣ x 2፣…

መለኪያ ግምት

ለብዙ ድግግሞሽ (ኤምአር) በትንሹ የካሬዎች ዘዴ (OLS) በመጠቀም ይከናወናል. ለቅጹ ቀጥተኛ እኩልታዎች Y = a + b 1 x 1 +…+b m x m + ε የመደበኛ እኩልታዎች ስርዓት እንገነባለን (ከዚህ በታች ይመልከቱ)

የአሠራሩን መርህ ለመረዳት, ባለ ሁለት ደረጃ ጉዳይን ተመልከት. ከዚያም በቀመር የተገለጸው ሁኔታ አለን

ከዚህ እናገኛለን፡-

የት σ በመረጃ ጠቋሚው ውስጥ የሚንፀባረቀው የተዛማጅ ባህሪ ልዩነት ነው.

OLS ለ MR እኩልታ በመደበኛ ሚዛን ላይ ተፈጻሚ ይሆናል። በዚህ ሁኔታ ፣ እኩልታውን እናገኛለን-

በየትኛው t y ፣ t x 1 ፣ … t xm ደረጃቸውን የጠበቁ ተለዋዋጮች ሲሆኑ አማካኝ እሴቶቹ ከ 0 ጋር እኩል ናቸው። β i ደረጃውን የጠበቀ የዳግም መመለሻ ቅንጅቶች ናቸው፣ እና መደበኛ መዛባት 1 ነው።

እባክዎን በዚህ ጉዳይ ላይ ሁሉም β i እንደ መደበኛ እና ማእከላዊ ተደርገው የተገለጹ ናቸው ፣ ስለሆነም አንዳቸው ከሌላው ጋር ያላቸው ንፅፅር ትክክል እና ተቀባይነት ያለው እንደሆነ ይቆጠራል። በተጨማሪም ዝቅተኛው βi እሴቶች ያላቸውን በመጣል ምክንያቶችን ማጣራት የተለመደ ነው።

የመስመራዊ መመለሻ እኩልታን መጠቀም ችግር

ላለፉት 8 ወራት ለአንድ የተወሰነ ምርት N የዋጋ ተለዋዋጭነት ሰንጠረዥ አለን እንበል። በ 1850 ሬብሎች / ቲ ዋጋ ላይ አንድ ስብስብ መግዛት በሚሰጠው ምክር ላይ ውሳኔ መስጠት አስፈላጊ ነው.

ወር ቁጥር

ወር ስም

የምርት ዋጋ N

በቶን 1750 ሩብልስ

በቶን 1755 ሩብልስ

በቶን 1767 ሩብልስ

በቶን 1760 ሩብልስ

በቶን 1770 ሩብልስ

በቶን 1790 ሩብልስ

በቶን 1810 ሩብልስ

በቶን 1840 ሩብልስ

ይህንን ችግር በ Excel ተመን ሉህ ፕሮሰሰር ውስጥ ለመፍታት ከዚህ በላይ ከቀረበው ምሳሌ አስቀድሞ የታወቀውን "የመረጃ ትንተና" መሳሪያ መጠቀም ያስፈልግዎታል። በመቀጠል "Regression" የሚለውን ክፍል ይምረጡ እና ግቤቶችን ያዘጋጁ. በ "የግቤት ክፍተት Y" መስክ ውስጥ ለተለዋዋጭ ተለዋዋጭ (በዚህ ጉዳይ ላይ በተወሰኑ የዓመቱ ወራት ውስጥ የሸቀጦች ዋጋ) እና በ "የግቤት ክፍተት X" ውስጥ የእሴቶች ክልል መግባት እንዳለበት መታወስ አለበት. - ለገለልተኛ ተለዋዋጭ (የወሩ ቁጥር). "እሺ" ን ጠቅ በማድረግ እርምጃውን ያረጋግጡ. በአዲስ ሉህ ላይ (ከተጠቆመ) ለድጋሚ መረጃ እናገኛለን።

እነሱን ተጠቅመን የy=ax+b ቅጽ y=ax+b መስመራዊ እኩልታ እንሰራለን፣እነዚህም መለኪያዎች ሀ እና ለ የወር ቁጥራቸው ስም ያለው የመስመሩ ድምጾች እና ከሉህ ላይ ያሉት “Y-intersection” ያሉት የመስመሩ ድምጾች ናቸው። የተሃድሶ ትንተና ውጤቶች. ስለዚህ፣ ለስራ 3 የሊኒየር ሪግሬሽን እኩልታ (LR) እንደሚከተለው ተጽፏል፡-

የምርት ዋጋ N = 11.714 * ወር ቁጥር + 1727.54.

ወይም በአልጀብራ ኖታ

y = 11.714 x + 1727.54

የውጤቶች ትንተና

የውጤቱ መስመራዊ ሪግሬሽን እኩልታ በቂ መሆን አለመሆኑን ለመወሰን የባለብዙ ትስስር (ኤምሲሲ) እና ቆራጥነት እንዲሁም የፊሸር ፈተና እና የተማሪ t ፈተና ጥቅም ላይ ይውላሉ። በ Excel ተመን ሉህ ውስጥ ከዳግም መመለሻ ውጤቶች ጋር ፣ በቅደም ተከተል ብዙ R ፣ R-squared ፣ F-statistic እና t-statistic ይባላሉ።

KMC R በገለልተኛ እና ጥገኛ ተለዋዋጮች መካከል ያለውን የፕሮባቢሊቲዝም ግንኙነት ለመገምገም ያስችላል። ከፍተኛ እሴቱ “የወሩ ቁጥር” እና “የምርት ዋጋ N በ ሩብልስ በ 1 ቶን” በተለዋዋጮች መካከል ትክክለኛ ጠንካራ ግንኙነትን ያሳያል። ሆኖም ግን, የዚህ ግንኙነት ባህሪ አይታወቅም.

የመወሰን R2 (RI) ስኩዌር የጠቅላላው የስርጭት መጠን የቁጥር ባህሪ ነው እና የትኛውን የሙከራ መረጃ ክፍል ያሳያል ፣ ማለትም። የጥገኛ ተለዋዋጭ እሴቶች ከመስመር ሪግሬሽን እኩልታ ጋር ይዛመዳሉ። እየተገመገመ ባለው ችግር, ይህ ዋጋ ከ 84.8% ጋር እኩል ነው, ማለትም, የስታቲስቲክስ መረጃዎች በውጤቱ ኤስዲ በከፍተኛ ትክክለኛነት ተገልጸዋል.

የኤፍ-ስታስቲክስ፣ እንዲሁም የፊሸር ፈተና ተብሎ የሚጠራው፣ የመስመራዊ ግንኙነትን አስፈላጊነት ለመገምገም፣ የህልውናውን መላምት ውድቅ የሚያደርግ ወይም የሚያረጋግጥ ነው።

(የተማሪ ፈተና) የመስመራዊ ግንኙነቱ ባልታወቀ ወይም ነፃ ቃል የቁጥርን አስፈላጊነት ለመገምገም ይረዳል። የ t-ሙከራ> tcr ዋጋ ከሆነ፣ስለ መስመራዊ እኩልታ ነፃ ቃል ትርጉም የሌለው መላምት ውድቅ ይሆናል።

ለነፃ ቃል ግምት ውስጥ በገባው ችግር ውስጥ የኤክሴል መሳሪያዎችን በመጠቀም t = 169.20903 እና p = 2.89E-12 ማለትም የነፃ ቃሉ ኢምንት ስለመሆኑ ትክክለኛ መላምት ውድቅ የመሆኑ ዜሮ ዕድል አለን። . ለማይታወቅ t=5.79405፣ እና p=0.001158 ለትኩረት። በሌላ አገላለጽ፣ ለማይታወቅ ስለ ኮፊፊሴቲቭ ኢምንትነት ያለው ትክክለኛ መላምት ውድቅ የማድረግ እድሉ 0.12 በመቶ ነው።

ስለዚህ, የተገኘው የመስመር መመለሻ እኩልታ በቂ ነው ብሎ መከራከር ይቻላል.

የአክሲዮን ማገጃ መግዛት የአዋጭነት ችግር

በ Excel ውስጥ ብዙ መልሶ ማቋቋም የሚከናወነው ተመሳሳይ የመረጃ ትንተና መሣሪያን በመጠቀም ነው። አንድ የተወሰነ የመተግበሪያ ችግርን እንመልከት.

የኤንኤንኤን ኩባንያ አስተዳደር በኤምኤምኤም JSC ውስጥ 20% አክሲዮን ለመግዛት ጠቃሚነት ላይ መወሰን አለበት። የጥቅሉ (SP) ዋጋ 70 ሚሊዮን ዶላር ነው. የኤንኤን ስፔሻሊስቶች በተመሳሳይ ግብይቶች ላይ መረጃን ሰብስበዋል. በሚሊዮን በሚቆጠር የአሜሪካ ዶላር በተገለፀው መሰረት የአክሲዮን ማገጃ ዋጋን ለመገምገም ተወስኗል።

  • የሚከፈሉ ሂሳቦች (VK);
  • አመታዊ የሽያጭ መጠን (VO);
  • የሂሳብ መዝገብ (ቪዲ);
  • የቋሚ ንብረቶች ዋጋ (COF).

በተጨማሪም የኢንተርፕራይዙ የደመወዝ እዳዎች መለኪያ (V3 P) በሺዎች በሚቆጠር የአሜሪካ ዶላር ጥቅም ላይ ይውላል.

የ Excel ተመን ሉህ ፕሮሰሰርን በመጠቀም መፍትሄ

በመጀመሪያ ደረጃ የምንጭ መረጃ ሰንጠረዥ መፍጠር ያስፈልግዎታል. ይህን ይመስላል።

  • "የውሂብ ትንተና" መስኮት ይደውሉ;
  • "Regression" የሚለውን ክፍል ይምረጡ;
  • በ "የግቤት ክፍተት Y" ሳጥን ውስጥ ከዓምድ G ውስጥ ያሉትን ጥገኛ ተለዋዋጮች የእሴቶችን ክልል ያስገቡ;
  • በ “የግቤት ክፍተት X” መስኮት በስተቀኝ ባለው ቀይ ቀስት አዶውን ጠቅ ያድርጉ እና በሉሁ ላይ ካሉት አምዶች B ፣ C ፣ D ፣ F ውስጥ ያሉትን ሁሉንም እሴቶች ያደምቁ።

"አዲስ የስራ ሉህ" ንጥል ላይ ምልክት ያድርጉ እና "እሺ" ን ጠቅ ያድርጉ.

ለተጠቀሰው ችግር የተሃድሶ ትንተና ያግኙ.

የውጤቶች እና መደምደሚያዎች ጥናት

ከላይ በኤክሴል የተመን ሉህ ላይ ከቀረበው የተጠጋጋ መረጃ የድጋሚ እኩልታውን “እንሰበስባለን”፡

SP = 0.103 * SOF + 0.541 * ቮ - 0.031 * ቪኬ +0.405 * ቪዲ +0.691 * VZP - 265.844.

ይበልጥ በሚታወቅ የሂሳብ ቅጽ፣ እንደሚከተለው ሊፃፍ ይችላል፡-

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

የMMM JSC ውሂብ በሰንጠረዡ ውስጥ ቀርቧል፡-

እነሱን ወደ ሪግሬሽን እኩልዮሽ በመተካት 64.72 ሚሊዮን የአሜሪካ ዶላር አኃዝ እናገኛለን። ይህ ማለት የ70 ሚሊዮን ዶላር ዋጋ በጣም የተጋነነ በመሆኑ የኤምኤምኤም JSC አክሲዮኖች ለመግዛት ዋጋ የላቸውም ማለት ነው።

እንደሚመለከቱት ፣ የ Excel ተመን ሉህ እና የሪግሬሽን እኩልታ አጠቃቀም የአንድ የተወሰነ ግብይት አዋጭነት በተመለከተ በመረጃ ላይ የተመሠረተ ውሳኔ ለማድረግ አስችሏል።

አሁን ተሃድሶ ምን እንደሆነ ታውቃለህ። ከላይ የተገለጹት የ Excel ምሳሌዎች በኢኮኖሚክስ መስክ ተግባራዊ ችግሮችን ለመፍታት ይረዳሉ.

ውስጥ የተሃድሶ ስታቲስቲክስባለብዙ ቁርኝት ቅንጅት ተጠቁሟል (ብዙ አር)እና ቁርጠኝነት (አር-ካሬ)በ Y እና በፋክተር ባህሪዎች ድርድር (ከዚህ ቀደም ከተገኙ እሴቶች ጋር በተዛመደ ትንተና ውስጥ ይዛመዳል)

የጠረጴዛው መካከለኛ ክፍል (የልዩነት ትንተና)የድጋሚውን እኩልነት አስፈላጊነት ለመፈተሽ አስፈላጊ ነው.

የጠረጴዛው የታችኛው ክፍል - ትክክለኛ

የመጨረሻ ግምቶች የአጠቃላይ የዳግም መመለሻ ጥምርታ ሁለት፣ ጠቀሜታቸውን እና የጊዜ ክፍተት ግምታቸውን በመሞከር።

የፍተሻዎች ቬክተር ግምት ለ (አምድ ዕድሎች):

ከዚያ የተሃድሶ እኩልታ ግምት ቅጹ አለው፡-

የድጋሚውን እኩልነት እና የሚያስከትለውን የማጣቀሻ ቅንጅቶችን አስፈላጊነት ማረጋገጥ አስፈላጊ ነው.

በ b=0.05 ደረጃ ላይ ያለውን የድግግሞሽ እኩልታ አስፈላጊነት እንፈትሽ, i.e. መላምት H0፡ в1=в2=в3=…=вk=0። ይህንን ለማድረግ የኤፍ-ስታቲስቲክስ የተመለከተው እሴት ይሰላል-

ኤክሴል ይህንን በውጤቶቹ ውስጥ ያሳያል የልዩነት ትንተና:

QR=527.4296; Qost=1109.8673 =>

በአምድ ውስጥ ኤፍእሴት ተጠቁሟል ኤፍየሚታይ.

ከ F-ስርጭት ሠንጠረዦች ወይም አብሮ የተሰራውን የስታቲስቲክስ ተግባር በመጠቀም ኤፍአግኝለትርጉም ደረጃ b=0.05 እና የቁጥር ብዛት n1=k=4 እና መለያ ቁጥር n2=n-k-1=45 የ F-ስታቲስቲክስ ወሳኝ ዋጋ እኩል ሆኖ እናገኘዋለን።

Fcr = 2.578739184

የተስተዋለው የኤፍ-ስታቲስቲክስ ዋጋ ከወሳኙ እሴቱ 8.1957> 2.7587 በልጦ፣ የቬክተር ኦፍ ኮፊፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍፍስ እኩልነት 0.05 ስህተት። ስለዚህ፣ ቢያንስ አንድ የቬክተር b=(b1፣b2፣b3፣b4)T ከዜሮ በእጅጉ የተለየ ነው።

የሪግሬሽን ኢኩዌሽን ግለሰባዊ ቅንጅቶችን አስፈላጊነት እንፈትሽ፣ ማለትም። መላምት .

የመልሶ ማመሳከሪያዎችን አስፈላጊነት መፈተሽ በቲ-ስታቲስቲክስ መሰረት ለትርጉም ደረጃ ይከናወናል.

የተስተዋሉ የቲ-ስታቲስቲክስ ዋጋዎች በአምዱ ውስጥ ባለው የውጤት ሠንጠረዥ ውስጥ ይታያሉ - ስታቲስቲክስ.

ቅንጅቶች (ቢ)

ቲ-ስታቲስቲክስ (ቶብ)

Y-መገናኛ

ተለዋዋጭ X5

ተለዋዋጭ X7

ተለዋዋጭ X10

ተለዋዋጭ X15

ለትርጉም ደረጃ b=0.05 እና የነጻነት ዲግሪዎች ቁጥር n=n - k - 1 ከተገኘው ወሳኝ እሴት tcr ጋር መወዳደር አለባቸው።

ይህንን ለማድረግ, አብሮ የተሰራውን የ Excel ስታቲስቲክስ ተግባርን እንጠቀማለን STUDISPOBR,ወደ የታቀደው ምናሌ ውስጥ በመግባት ፕሮባቢሊቲ b = 0.05 እና የነፃነት ዲግሪዎች ብዛት n = n-k-1 = 50-4-1 = 45. (የ tcr እሴቶችን ከሂሳብ ስታቲስቲክስ ሰንጠረዦች ማግኘት ይችላሉ።

tcr = 2.014103359 እናገኛለን.

ለታየው የቲ-ስታቲስቲክስ ዋጋ በፍፁም ዋጋ 2.0141>|-0.0872|፣ 2.0141>|0.2630|፣ 2.0141>|0.7300|፣ 2.0141>|-1.6629 |.

ስለዚህ፣ እነዚህ ውህዶች ከዜሮ ጋር እኩል ናቸው የሚለው መላምት በ0.05 የስህተት እድል ውድቅ አይደለም፣ ማለትም. ተጓዳኝ ቅንጅቶች እዚህ ግባ የማይባሉ ናቸው።

ለታየው የቲ-ስታስቲክስ ዋጋ ከወሳኙ ሞዱሎ |3.7658|>2.0141 ይበልጣል፣ስለዚህ፣ H0 የሚለው መላምት ውድቅ ተደርጓል፣ ማለትም. - ጉልህ

የድግግሞሽ ቅንጅቶች አስፈላጊነትም በሚከተለው የውጤት ሰንጠረዥ አምዶች ተረጋግጧል።

አምድ ገጽ- ትርጉምበ 5% የድንበር ደረጃ ላይ የአምሳያው መለኪያዎችን አስፈላጊነት ያሳያል, ማለትም. p≤0.05 ከሆነ፣ተዛማጁ ቅንጅት እንደ ትልቅ ይቆጠራል፣p>0.05 ከሆነ፣ከዚህም ኢምንት ነው።

እና የመጨረሻዎቹ አምዶች - ዝቅተኛ 95%እና የላይኛው 95%እና የታችኛው 98%እና ከፍተኛ 98% -እነዚህ ለ r = 0.95 (ሁልጊዜ የሚወጡት) እና r = 0.98 (ተዛማጁ ተጨማሪ አስተማማኝነት ሲዘጋጅ) የተገለጹ የአስተማማኝነት ደረጃዎች ያሏቸው የድግግሞሽ ቅንጅቶች የጊዜ ክፍተት ግምቶች ናቸው።

የታችኛው እና የላይኛው ወሰኖች ተመሳሳይ ምልክት ካላቸው (ዜሮ በራስ የመተማመን ጊዜ ውስጥ አልተካተተም) ፣ ከዚያ ተጓዳኝ የመመለሻ ቅንጅት እንደ ትልቅ ይቆጠራል ፣ ካልሆነ ግን እዚህ ግባ የማይባል ነው ተብሎ ይታሰባል።

ከሠንጠረዡ እንደሚታየው ለ Coefficient b3 p-value p=0.0005<0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям этот коэффициент является значимым.

በሂደት የተሃድሶ ትንተና ስልተ ቀመር መሠረት ጉልህ ያልሆኑ ድግግሞሾችን በማግለል ፣ በሚቀጥለው ደረጃ ላይ ጉልህ ያልሆነ የመመለሻ ቅንጅት ካለው ተለዋዋጭ ግምት ውስጥ ማስቀረት ያስፈልጋል።

በድጋሚ ግምገማ ወቅት በርካታ ኢምንት ያልሆኑ ውህደቶች ተለይተው በሚታወቁበት ጊዜ፣ የመጀመሪያው ከዳግም ግስጋሴ እኩልታ የሚገለለው የቲ-ስታቲስቲክስ () በፍፁም ዋጋ አነስተኛ ነው። በዚህ መርህ መሰረት, በሚቀጥለው ደረጃ, ተለዋዋጭውን X5 ን ማግለል አስፈላጊ ነው, ይህም አነስተኛ የመመለሻ መጠን b2 አለው.

የዳግም ለውጥ ትንተና II ደረጃ.

ሞዴሉ የፋክተር ባህርያት X7፣ X10፣ X15 ያካትታል፣ እና X5ን አያካትትም።

የውጤቶች መደምደሚያ

የተሃድሶ ስታቲስቲክስ

ብዙ አር

አር-ካሬ

መደበኛ አር-ካሬ

መደበኛ ስህተት

ምልከታዎች

የልዩነት ትንተና

(የነጻነት ዲግሪዎች ብዛት n)

(የካሬ ልዩነት ጥ)

(አማካኝ ካሬ MS=SS/n)

(Fobs = MSR/MSost)

ጠቀሜታ ኤፍ

መመለሻ

ዕድሎች

መደበኛ ስህተት

ቲ-ስታቲስቲክስ

ፒ-እሴት

ከፍተኛ 95% (ቢማክስ)

ዝቅተኛ 98% (ቢሚን)

Y-መገናኛ

ተለዋዋጭ X7

ተለዋዋጭ X10

ተለዋዋጭ X15

ዛሬ፣ በመረጃ ማዕድን ማውጣት ላይ ትንሽ ፍላጎት ያለው ማንኛውም ሰው ምናልባት ስለ ቀላል መስመራዊ መመለሻ ሰምቷል። ስለ ሀቤሬ አስቀድሞ ተጽፏል፣ እና አንድሪው ንግ እንዲሁ በታዋቂው የማሽን መማሪያ ኮርስ ላይ በዝርዝር ተናግሯል። መስመራዊ ሪግሬሽን ከማሽን መማር መሰረታዊ እና ቀላሉ ዘዴዎች አንዱ ነው, ነገር ግን የተገነባውን ሞዴል ጥራት ለመገምገም ዘዴዎች በጣም አልፎ አልፎ ይጠቀሳሉ. በዚህ ጽሑፍ ውስጥ የማጠቃለያ.lm () ተግባርን በ R ቋንቋ በመተንተን ምሳሌ በመጠቀም ይህንን የሚያበሳጭ ግድፈት በትንሹ ለማስተካከል እሞክራለሁ ። በተመሳሳይ ጊዜ አስፈላጊዎቹን ቀመሮች ለማቅረብ እሞክራለሁ ፣ ስለሆነም ሁሉም ስሌቶች። በማንኛውም ቋንቋ በቀላሉ ፕሮግራም ማድረግ ይቻላል። ይህ መጣጥፍ መስመራዊ ሪግሬሽን መገንባት እንደሚቻል ለሰሙ ሰዎች የታሰበ ነው ፣ ግን ጥራቱን ለመገምገም ስታቲስቲካዊ ሂደቶችን አላጋጠመውም።

መስመራዊ ሪግሬሽን ሞዴል

ስለዚህ ፣ በርካታ ገለልተኛ የዘፈቀደ ተለዋዋጮች X1 ፣ X2 ፣ ... ፣ Xn (ትንበያዎች) እና በእነሱ ላይ የሚመረኮዝ እሴት Y ይኑር (ሁሉም የትንበያዎቹ አስፈላጊ ለውጦች ቀድሞውኑ እንደተደረጉ ይገመታል)። ከዚህም በላይ ግንኙነቱ መስመራዊ ነው እና ስህተቶቹ በመደበኛነት ይሰራጫሉ, ማለትም

የት እኔ n x n ክፍል ካሬ ማትሪክስ.

ስለዚህ፣ የ k ምልከታዎችን ያቀፈ መረጃ አለን እና የ Xi መጠኖችን እና የቁጥር መለኪያዎችን መገመት እንፈልጋለን። ተመጣጣኝ ግምቶችን ለማግኘት የተለመደው ዘዴ ትንሹ የካሬዎች ዘዴ ነው. እና ይህንን ዘዴ በመተግበር ሊገኝ የሚችለው የትንታኔ መፍትሄ ይህንን ይመስላል።

የት ከክዳን ጋር - የፍተሻዎች ቬክተር ግምት ፣ yየጥገኛ ተለዋዋጭ እሴት ቬክተር ነው ፣ እና X የመጠን k x n+1 ማትሪክስ ነው (n የተተባዮች ቁጥር ነው ፣ k የእይታዎች ብዛት) ፣ የመጀመሪያው አምድ አንዱን ፣ ሁለተኛውን ያቀፈ ነው። - የመጀመሪያው ትንበያ ፣ ሦስተኛው - ሁለተኛው ፣ እና የመሳሰሉት እሴቶች ፣ እና ረድፎቹ ከነባር ምልከታዎች ጋር ይጣጣማሉ።

የውጤቱ ውጤት ማጠቃለያ.lm() ተግባር እና ግምገማ

አሁን በ R ውስጥ የመስመር መመለሻ ሞዴል የመገንባት ምሳሌን እንመልከት፡-
> ቤተ-መጽሐፍት (ሩቅ) > lm1<-lm(Species~Area+Elevation+Nearest+Scruz+Adjacent, data=gala) >ማጠቃለያ(lm1) ይደውሉ፡ lm(ፎርሙላ = ዝርያዎች ~ አካባቢ + ከፍታ + ቅርብ + ስክሩዝ + አጠገብ፣ ዳታ = ጋላ) ቀሪዎች፡- ደቂቃ 1Q ሚዲያን 3Q ከፍተኛ -111.679 -34.898 -7.862 33.460 182.584 ቅምጦች፡ ግምታዊ ስህተት t ዋጋ Pr (>|t|) (መጠላለፍ) 7.068221 19.154198 0.369 0.715351 አካባቢ -0.023938 0.022422 -1.068 0.296318 ከፍታ 0.319456.5e 0.3194565e 0.009144 1.054136 0.009 0.993151 Scruz -0.240524 0.215402 -1.117 0.275208 አጎራባች -0.074805 0.017700 -4.226 0.000297 *** --- ሲኒፍ. ኮዶች: 0 '***' 0.001 ''**' 0.01 ''*' 0.05'.' 0.1 '' 1 ቀሪ መደበኛ ስህተት: 60.98 በ 24 ዲግሪ ነጻነት ላይ ብዙ R-squared: 0.7658, የተስተካከለ R-ካሬ: 0.7171 F- ስታትስቲክስ፡ 15.7 በ 5 እና 24 DF፣ p-እሴት፡ 6.838e-07
የጠረጴዛ ጋላ ስለ 30 የጋላፓጎስ ደሴቶች አንዳንድ መረጃዎችን ይዟል። አንድን ሞዴል እንመለከታለን ዝርያዎች - በደሴቲቱ ላይ ያሉ የተለያዩ የእፅዋት ዝርያዎች ብዛት በበርካታ ሌሎች ተለዋዋጮች ላይ በቀጥታ ይወሰናል.

የማጠቃለያ.lm() ተግባር ውጤትን እንመልከት።
በመጀመሪያ ሞዴሉ እንዴት እንደተገነባ የሚያስታውስ መስመር ይመጣል.
ከዚያም ስለ ቀሪዎች ስርጭት መረጃ ይመጣል: ዝቅተኛ, የመጀመሪያ ሩብ, መካከለኛ, ሶስተኛ ሩብ, ከፍተኛ. በዚህ ጊዜ የተረፈውን አንዳንድ መጠን ለመመልከት ብቻ ሳይሆን ለመደበኛነትም ለምሳሌ በሻፒሮ-ዊልክ ፈተና መሞከር ጠቃሚ ይሆናል.
ቀጥሎ - በጣም አስደሳች - ስለ ቅንጅቶች መረጃ። እዚህ ትንሽ ንድፈ ሃሳብ ያስፈልጋል.
በመጀመሪያ የሚከተለውን ውጤት እንጽፋለን-

ከተሸፈነው ሲግማ ስኩዌር ጋር ለእውነተኛው ሲግማ ካሬ ያለ አድልዎ ግምት ነው። እዚህ በትንሹ የካሬዎች ዘዴ የተገኘውን ግምቶች እንደ ቅንጅት ከወሰድን የቁጥር ትክክለኛ ቬክተር ነው ፣ እና ኤፒሲሎን ከክዳን ጋር የቀረው ንጥረ ነገር ቬክተር ነው። ያም ማለት፣ ስህተቶቹ በመደበኛነት ይሰራጫሉ ተብሎ በሚታሰብ፣ የፍጥነት መለኪያ (vector of coefficients) እንዲሁ በመደበኛነት በእውነተኛው እሴት ዙሪያ ይሰራጫል፣ እና ልዩነቱ ከአድልዎ ውጪ ሊገመት ይችላል። ይህ ማለት የቁጥሮች እኩልነት ወደ ዜሮ ያለውን መላምት መሞከር ይችላሉ, እና ስለዚህ የትንበያዎችን አስፈላጊነት ያረጋግጡ, ማለትም የ Xi ዋጋ በእውነቱ የተገነባውን ሞዴል ጥራት በእጅጉ ይጎዳል እንደሆነ.
ይህንን መላምት ለመፈተሽ፣ ትክክለኛው የ Coefficient bi ዋጋ 0 ከሆነ የተማሪ ስርጭት ያለው የሚከተለውን ስታቲስቲክስ እንፈልጋለን።

የት
የቅንጅት ግምት መደበኛ ስህተት ነው፣ እና t(k-n-1) የተማሪ ስርጭት ከ k-n-1 ዲግሪዎች ጋር ነው።

አሁን የማጠቃለያ.lm()ን ውጤት መተንተን ለመቀጠል ዝግጁ ነዎት።
ስለዚህ ፣ በትንሽ ካሬዎች ዘዴ ፣ በመደበኛ ስህተቶቻቸው ፣ በቲ-ስታቲስቲክስ እሴቶች እና ለእሱ p-እሴቶች የተገኙት የቁጥሮች ግምቶች የሚከተሉት ናቸው። በተለምዶ p-እሴቱ ከአንዳንድ በትክክል ትንሽ አስቀድሞ ከተመረጡት ጣራዎች ለምሳሌ 0.05 ወይም 0.01 ጋር ይነጻጸራል። እና የ p-ስታቲስቲክስ እሴቱ ከመነሻው ያነሰ ሆኖ ከተገኘ መላምቱ ውድቅ ነው, ነገር ግን የበለጠ ከሆነ, በሚያሳዝን ሁኔታ, ምንም ተጨባጭ ነገር ሊባል አይችልም. በዚህ ጉዳይ ላይ፣ የተማሪው ስርጭት 0 ያህል የተመጣጠነ ስለሆነ፣ p-እሴቱ ከ1-F(|t|)+F(-|t|) ጋር እኩል ይሆናል፣ F የተማሪ ስርጭት ተግባር እንደሆነ ላስታውስዎ። በ k-n-1 የነፃነት ዲግሪ . እንዲሁም፣ R በረዳትነት የፒ-እሴቱ ከኮከቦች ጋር በበቂ ሁኔታ ትንሽ የሆነባቸውን ጉልህ ውህዶች ያሳያል። ያም ማለት፣ እነዚያ በጣም ዝቅተኛ የመሆን እድል ያላቸው ውህዶች በሲግኒፍ መስመር ውስጥ ከ 0 ጋር እኩል ናቸው። ኮዶች የኮከቦችን ዲኮዲንግ ይይዛሉ-ሶስቱ ካሉ ፣ ከዚያ p-እሴቱ ከ 0 እስከ 0.001 ፣ ሁለት ካሉ ፣ ከዚያ ከ 0.001 እስከ 0.01 ፣ ወዘተ. ምንም አዶዎች ከሌሉ, የ p-እሴቱ ከ 0.1 ይበልጣል.

በእኛ ምሳሌ፣ ከፍታ እና አጠገብ ያሉት ትንበያዎች በዝርያ ዋጋ ላይ ተጽዕኖ እንደሚያሳድሩ በታላቅ እምነት መናገር እንችላለን፣ ነገር ግን ስለ ሌሎች ትንበያዎች ምንም ማለት አይቻልም። በተለምዶ እንደዚህ ባሉ ጉዳዮች ላይ ትንበያዎች አንድ በአንድ ይወገዳሉ እና ሌሎች የአምሳያው አመላካቾች እንዴት እንደሚለወጡ ይመልከቱ ፣ ለምሳሌ BIC ወይም Adjusted R-squared ፣ ይህም የበለጠ ይብራራል።

ቀሪው መደበኛ የስህተት እሴቱ በቀላሉ ከሲግማ ግምት ጋር ይዛመዳል፣ እና የነፃነት ደረጃዎች እንደ k-n-1 ይሰላሉ።

እና አሁን በመጀመሪያ መመልከት ያለብዎት በጣም አስፈላጊ ስታቲስቲክስ: R-squared እና የተስተካከለ R-squared:

በእያንዳንዱ ምልከታ ዪ የY እውነተኛ እሴቶች ባሉበት ፣ ዪ ከካፕ ጋር በአምሳያው የተተነበዩት እሴቶች ናቸው ፣ Y ከባር ጋር ከሁሉም የ Yi እውነተኛ እሴቶች አማካይ ነው።

በ R-squared ስታቲስቲክስ እንጀምር, ወይም አንዳንድ ጊዜ እንደሚጠራው, የመወሰን Coefficient. የአምሳያው ሁኔታዊ ልዩነት ከትክክለኛው የ Y እሴቶች ልዩነት ምን ያህል እንደሚለይ ያሳያል።ይህ ኮፊሸንት ወደ 1 የሚጠጋ ከሆነ የአምሳያው ሁኔታዊ ልዩነት በጣም ትንሽ ነው እና ሞዴሉ መረጃውን በደንብ ሊገልጽ የሚችልበት ዕድል ሰፊ ነው። . የ R-squared Coefficient በጣም ትንሽ ከሆነ, ለምሳሌ, ከ 0.5 ያነሰ, ከዚያም, በከፍተኛ እምነት, ሞዴሉ የእውነተኛውን ሁኔታ አያንጸባርቅም.

ሆኖም ግን, የ R-squared ስታቲስቲክስ አንድ ከባድ ችግር አለው: የተገመቱት ቁጥር እየጨመረ ሲሄድ, ይህ ስታቲስቲክስ ብቻ ሊጨምር ይችላል. ስለዚህ, ምንም እንኳን ሁሉም አዳዲስ ትንበያዎች በጥገኛ ተለዋዋጭ ላይ ምንም ተጽእኖ ባይኖራቸውም, ብዙ ትንበያዎች ያሉት ሞዴል ትንሽ ከሆነው ሞዴል የተሻለ ይመስላል. እዚህ የኦካም ምላጭን መርህ ማስታወስ ይችላሉ. እሱን ተከትሎ ፣ ከተቻለ ፣ ቀላል እና የበለጠ ለመረዳት ስለሚቻል በአምሳያው ውስጥ አላስፈላጊ ትንበያዎችን ማስወገድ ጠቃሚ ነው። ለእነዚህ ዓላማዎች, የተስተካከለው R-squared ስታቲስቲክስ ተፈጠረ. እሱ የተለመደውን R-squared ይወክላል ፣ ግን ለብዙ ቁጥር ትንበያዎች ከቅጣት ጋር። ዋናው ሀሳብ: አዳዲስ ገለልተኛ ተለዋዋጮች ለአምሳያው ጥራት ትልቅ አስተዋፅኦ ካደረጉ, የዚህ ስታቲስቲክስ ዋጋ ይጨምራል, ካልሆነ ግን, በተቃራኒው, ይቀንሳል.

ለምሳሌ፣ ልክ እንደበፊቱ አንድ አይነት ሞዴል አስቡበት፣ አሁን ግን ከአምስት ትንበያዎች ይልቅ፣ ሁለቱን እንተወዋለን፡-
> lm2<-lm(Species~Elevation+Adjacent, data=gala) >ማጠቃለያ(LM2) ጥሪ፡ lm(ፎርሙላ = ዝርያዎች ~ ከፍታ + አጠገብ፣ ዳታ = ጋላ) ቀሪዎች፡- ደቂቃ 1Q ሚዲያን 3Q ከፍተኛ -103.41 -34.33 -11.43 22.57 203.65 Coefficients: ግምት Std. ስህተት ቲ ዋጋ PR (> | ቲ |) (መጠላለፍ) 1.43287 15.02469 0.095 0.924727 ከፍታ 0.27657 0.03176 8.707 2.53E -09 *** AdJACent -0.040414 ----- 1.040449 IGN ከሆነ. ኮዶች: 0 '***' 0.001 ''**' 0.01 ''*' 0.05'.' 0.1 '' 1 ቀሪ መደበኛ ስህተት: 60.86 በ 27 ነጻነት ዲግሪ ብዙ R-squared: 0.7376, የተስተካከለ R-ካሬ: 0.7181 F- ስታቲስቲክስ፡ 37.94 በ2 እና 27 ዲኤፍ፣ p-እሴት፡ 1.434e-08
እንደሚመለከቱት, የ R-squared ስታቲስቲክስ ዋጋ ቀንሷል, ነገር ግን የተስተካከለው R-squared ዋጋ በትንሹ ጨምሯል.

አሁን ሁሉም የትንበያዎቹ ቅንጅቶች ከዜሮ ጋር እኩል ናቸው የሚለውን መላምት እንፈትሽ። ያም ማለት የ Y ዋጋ በአጠቃላይ በ Xi linearly ላይ የተመሰረተ ስለመሆኑ መላምት ነው። ይህንን ለማድረግ, የሚከተለውን ስታቲስቲክስ መጠቀም ይችላሉ, ይህም ሁሉም ውህዶች ከዜሮ ጋር እኩል ናቸው የሚለው መላምት እውነት ከሆነ,


  1. የተገነባውን ሞዴል ጥራት ይገምግሙ. የአምሳያው ጥራት ከአንድ-ደረጃ ሞዴል ጋር ሲነጻጸር ተሻሽሏል? የመለጠጥ ቅንጅቶችን፣ - እና -coefficientsን በመጠቀም ጉልህ የሆኑ ነገሮች በውጤቱ ላይ የሚያሳድሩትን ተጽዕኖ ይገምግሙ።
ከዚህ ችግር አንቀጽ 1.4 ጋር በሚመሳሰል መልኩ የተመረጠውን ባለብዙ ሞዴል (6) ጥራት ለመገምገም, የመወሰን መለኪያን እንጠቀማለን. አር- ካሬ፣ አማካኝ አንጻራዊ የመጠምዘዝ ስህተት እና ኤፍ- የአሳ ማጥመጃ መስፈርት.

መወሰኛ Coefficient አር-squared ከ "Regression" ውጤቶች (ሰንጠረዥ "Regression ስታቲስቲክስ" ለ ሞዴል ​​(6)) ይወሰዳል.

በውጤቱም, በአፓርትመንት ዋጋ ላይ ያለው ልዩነት (ለውጥ). ዋይበዚህ ስሌት መሠረት 76.77% በክልሉ ከተማ ልዩነት ተብራርቷል X 1 , በአፓርታማ ውስጥ ያሉት ክፍሎች ብዛት X 2 እና የመኖሪያ ቦታ X 4 .

ዋናውን ውሂብ እንጠቀማለን ዋይ እኔእና በ Regression መሳሪያ የተገኙ ቀሪዎች (ሠንጠረዥ "የቀሪው ውጤት" ለ ሞዴል ​​(6)). አንጻራዊ ስህተቶቹን እናሰላለን እና አማካዩን ዋጋ እናገኝ
.

የቀረውን ማውጣት


ምልከታ

የተገመተው Y

የተረፈ

Rel. ስህተት

1

45,95089273

-7,95089273

20,92340192

2

86,10296493

-23,90296493

38,42920407

3

94,84442678

30,15557322

24,12445858

4

84,17648426

-23,07648426

37,76838667

5

40,2537216

26,7462784

39,91981851

6

68,70572376

24,29427624

26,12287768

7

143,7464899

-25,7464899

21,81905923

8

106,0907598

25,90924022

19,62821228

9

135,357993

-42,85799303

46,33296544

10

114,4792566

-9,47925665

9,027863476

11

41,48765602

0,512343975

1,219866607

12

103,2329236

21,76707636

17,41366109

13

130,3567798

39,64322022

23,3195413

14

35,41901876

2,580981242

6,7920559

15

155,4129693

-24,91296925

19,0903979

16

84,32108188

0,678918123

0,798727204

17

98,0552279

-0,055227902

0,056355002

18

144,2104618

-16,21046182

12,66442329

19

122,8677535

-37,86775351

44,55029825

20

100,0221225

59,97787748

37,48617343

21

53,27196558

6,728034423

11,21339071

22

35,06605378

5,933946225

14,47303957

23

114,4792566

-24,47925665

27,19917406

24

113,1343153

-30,13431529

36,30640396

25

40,43190991

4,568090093

10,15131132

26

39,34427892

-0,344278918

0,882766457

27

144,4794501

-57,57945009

66,25943623

28

56,4827667

-16,4827667

41,20691675

29

95,38240332

-15,38240332

19,22800415

30

228,6988826

-1,698882564

0,748406416

31

222,8067278

12,19327221

5,188626473

32

38,81483144

1,185168555

2,962921389

33

48,36325811

18,63674189

27,81603267

34

126,6080021

-3,608002113

2,933335051

35

84,85052935

15,14947065

15,14947065

36

116,7991162

-11,79911625

11,23725357

37

84,17648426

-13,87648426

19,73895342

38

113,9412801

-31,94128011

38,95278062

39

215,494184

64,50581599

23,03779142

40

141,7795953

58,22040472

29,11020236

አማካኝ

101,2375

22,51770962

አንጻራዊ ስህተቶችን አምድ በመጠቀም አማካዩን ዋጋ እናገኛለን =22.51% (AVERAGE ተግባርን በመጠቀም)።

ንጽጽሩ እንደሚያሳየው 22.51%>7% ነው። በዚህ ምክንያት የአምሳያው ትክክለኛነት አጥጋቢ አይደለም.

በመጠቀም ኤፍ - የአሳ ማጥመጃ መስፈርት የአምሳያው አጠቃላይ ጠቀሜታ እንፈትሽ። ይህንን ለማድረግ የ "Regression" መሣሪያን (ሠንጠረዥ "የልዩነት ትንተና" ሞዴል (6)) በመጠቀም ከተገኘው ውጤት እንጽፋለን. ኤፍ= 39,6702.

FRIST የሚለውን ተግባር በመጠቀም ዋጋውን እናገኛለን ኤፍ cr =3.252 ለትርጉም ደረጃ α = 5%፣ እና የነፃነት ደረጃዎች ቁጥሮች 1 = 2 , 2 = 37 .

ኤፍ> ኤፍ cr, ስለዚህ, የሞዴል (6) እኩልነት ወሳኝ ነው, አጠቃቀሙ ጠቃሚ ነው, ጥገኛ ተለዋዋጭ ዋይበአምሳያው (6) ውስጥ በተካተቱት ተለዋዋጭ ተለዋዋጮች በደንብ ይገለጻል X 1 , X 2. እና X 4 .

በተጨማሪ መጠቀም - የተማሪ ፈተና የአምሳያው ግለሰባዊ ቅንጅቶችን አስፈላጊነት እንፈትሽ።

- ለሪግሬሽን እኩልታዎች ስታቲስቲክስ በ "Regression" መሳሪያ ውጤቶች ውስጥ ተሰጥቷል. ለተመረጠው ሞዴል (6) የሚከተሉት እሴቶች ተገኝተዋል።


ዕድሎች

መደበኛ ስህተት

ቲ-ስታቲስቲክስ

ፒ-እሴት

የታችኛው 95%

ከፍተኛ 95%

የታችኛው 95.0%

ከፍተኛ 95.0%

Y-መገናኛ

-5,643572321

12,07285417

-0,46745966

0,642988

-30,1285

18,84131

-30,1285

18,84131

X4

2,591405557

0,461440597

5,61590284

2.27ኢ-06

1,655561

3,52725

1,655561

3,52725

X1

6,85963077

9,185748512

0,74676884

0,460053

-11,7699

25,48919

-11,7699

25,48919

X2

-1,985156991

7,795346067

-0,25465925

0,800435

-17,7949

13,82454

-17,7949

13,82454

ወሳኝ እሴት crለትርጉም ደረጃ ተገኝቷል α=5%እና የነፃነት ደረጃዎች ብዛት =40–2–1=37 . cr =2.026 (STUDAR ተግባር)።

ለነፃ ዕድሎች α =–5.643 ስታቲስቲክስ ተገልጿል
, crስለዚህ, የነፃው ቅንጅት ወሳኝ አይደለም እና ከአምሳያው ሊገለል ይችላል.

ለ regression Coefficient β 1 =6.859 ስታቲስቲክስ ተገልጿል
, β 1 አስፈላጊ አይደለም, እሱ እና የክልል የከተማው ሁኔታ ከአምሳያው ሊወገድ ይችላል.

ለ regression Coefficient β 2 =-1,985 ስታቲስቲክስ ተገልጿል
, cr, ስለዚህ, የ regression Coefficient β 2 አስፈላጊ አይደለም, እሱ እና በአፓርትማው ውስጥ ያሉት የክፍሎች ብዛት ምክንያት ከአምሳያው ሊገለሉ ይችላሉ.

ለ regression Coefficient β 4 =2.591 ስታቲስቲክስ ተገልጿል
, > t cr፣ ስለዚህ፣ የሪግሬሽን ኮፊሸን β 4 አስፈላጊ ነው ፣ እሱ እና የአፓርታማው የመኖሪያ አካባቢ ሁኔታ በአምሳያው ውስጥ ሊቆይ ይችላል።

ስለ ሞዴል ​​ኮፊፊሴፍቶች አስፈላጊነት መደምደሚያዎች በአስፈላጊ ደረጃ ላይ ተደርገዋል α=5%. የ P-value ዓምድን በመመልከት, የነጻውን ቅንጅት እናስተውላለን α በ 0.64 = 64% ደረጃ ላይ ጉልህ ሆኖ ሊቆጠር ይችላል; የተሃድሶ ቅንጅት β 1 - በ 0.46 = 46% ደረጃ; የተሃድሶ ቅንጅት β 2 - በ 0.8 = 80% ደረጃ; እና የመመለሻ ቅንጅት β 4 - በ 2.27E-06 = 2.26691790951854E-06 = 0.0000002%.

አዲስ ፋክተር ተለዋዋጮች ወደ እኩልታው ሲታከሉ የመወሰን ቅንጅት በራስ-ሰር ይጨምራል አር 2 እና የአምሳያው ጥራት ሁልጊዜ ባይሻሻልም አማካኝ የአቀራረብ ስህተት ይቀንሳል. ስለዚህ, የሞዴሉን (3) እና የተመረጠውን ባለብዙ ሞዴል (6) ጥራትን ለማነፃፀር, የተለመዱ የመወሰን መለኪያዎችን እንጠቀማለን.

ስለዚህ "የክልል ከተማ" ወደ ሪግሬሽን እኩልታ ሲጨመሩ X 1 እና ምክንያቱ "በአፓርታማ ውስጥ ያሉት ክፍሎች ብዛት" X 2 የአምሳያው ጥራት ተበላሽቷል, ይህም ምክንያቶችን ለማስወገድ እንደሚደግፍ ይናገራል X 1 እና X 2 ከአምሳያው.

ተጨማሪ ስሌቶችን እናከናውን.

አማካይ የመለጠጥ ቅንጅቶች በመስመራዊ ሞዴል ሁኔታ ውስጥ በቀመርዎች ይወሰናሉ
.

አማካይ ተግባርን በመጠቀም ኤስ ዋይ, በፋክቱ ውስጥ ብቻ በመጨመር X 4 በአንድ መደበኛ ልዩነት - በ 0.914 ይጨምራል ኤስ ዋይ

የዴልታ አሃዞች በቀመርዎቹ ይወሰናሉ።
.

በ Excel ውስጥ ያለውን የ"Data Analysis" ጥቅል "Correlation" መሣሪያን በመጠቀም ጥንድ ቁርኝቶችን እንፈልግ።


ዋይ

X1

X2

X4

ዋይ

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

የመወሰን ጥምርታ ቀደም ብሎ ተወስኗል እና ከ 0.7677 ጋር እኩል ነው.

የዴልታ አሃዞችን እናሰላለን፡-

;

ከ Δ 1 ጀምሮ 1 እና X 2 በተሳሳተ መንገድ ተመርጠዋል እና ከአምሳያው ውስጥ መወገድ አለባቸው. ይህ ማለት በውጤቱ መስመራዊ የሶስት-ደረጃ ሞዴል ስሌት መሰረት በውጤቱ ምክንያት ለውጥ ዋይ(የአፓርታማ ዋጋዎች) 104% በፋክተሩ ተፅእኖ ተብራርቷል X 4 (የአፓርታማው የመኖሪያ ቦታ) ፣ በ 4% በምክንያት ተጽዕኖ X 2 (የክፍሎች ብዛት) ፣ በ 0.0859% በፋክቱ ተጽዕኖ X 1 (የክልሉ ከተማ)።