Uwiano wa mistari mingi. Vigezo viwili vya kujitegemea

Ujenzi wa urejeshaji wa mstari, tathmini ya vigezo vyake na umuhimu wao unaweza kufanywa kwa kasi zaidi wakati wa kutumia mfuko wa uchambuzi wa Excel (Regression). Wacha tuzingatie tafsiri ya matokeo yaliyopatikana katika kesi ya jumla ( k vigezo vya maelezo) kulingana na mfano 3.6.

Katika meza takwimu za kurudi nyuma maadili yafuatayo yanatolewa:

Nyingi R - mgawo wa uunganisho mwingi;

R- mraba- mgawo wa uamuzi R 2 ;

Imesawazishwa R - mraba- kurekebishwa R 2 kurekebishwa kwa idadi ya digrii za uhuru;

Hitilafu ya kawaida- kosa la kawaida la urejeshaji S;

Uchunguzi - idadi ya uchunguzi n.

Katika meza Uchambuzi wa tofauti wanapewa:

1. Safu df - idadi ya digrii za uhuru sawa na

kwa kamba Kurudi nyuma df = k;

kwa kamba Saliodf = nk – 1;

kwa kamba Jumladf = n– 1.

2. Safu SS - jumla ya mikengeuko ya mraba sawa na

kwa kamba Kurudi nyuma ;

kwa kamba Salio ;

kwa kamba Jumla .

3. Safu MS tofauti zilizoamuliwa na fomula MS = SS/df:

kwa kamba Kurudi nyuma- utawanyiko wa sababu;

kwa kamba Salio- tofauti za mabaki.

4. Safu F - thamani iliyohesabiwa F-kigezo kinachokokotolewa kwa kutumia fomula

F = MS(kurudi nyuma)/ MS(iliyobaki).

5. Safu Umuhimu F - thamani ya kiwango cha umuhimu inayolingana na mahesabu F-takwimu .

Umuhimu F= FDIST( F- takwimu, df(kurudi nyuma), df(iliyobaki)).

Ikiwa umuhimu F < стандартного уровня значимости, то R 2 ni muhimu kitakwimu.

Odd Hitilafu ya kawaida T-takwimu P-thamani Chini 95% 95% ya juu
Y 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

Jedwali hili linaonyesha:

1. Odd- maadili ya mgawo a, b.

2. Hitilafu ya kawaida- makosa ya kawaida ya coefficients regression S a, S b.



3. t- takwimu- maadili yaliyohesabiwa t - Vigezo vilivyohesabiwa na formula:

t-takwimu = Coefficients/Hitilafu ya Kawaida.

4.R-thamani (umuhimu t) ni thamani ya kiwango cha umuhimu inayolingana na iliyokokotwa t- takwimu.

R-thamani = MSOMI(t-takwimu, df(iliyobaki)).

Kama R-maana< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. Chini 95% na Juu 95%- vikomo vya chini na vya juu vya vipindi vya kujiamini vya 95% kwa mgawo wa mlingano wa urejeshaji wa mstari wa kinadharia.

KUONDOLEWA KWA MENGINEYO
Uchunguzi Alitabiri y Mabaki e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

Katika meza KUONDOLEWA KWA MENGINEYO imeonyeshwa:

katika safu Uchunguzi- nambari ya uchunguzi;

katika safu Ilitabiriwa y - maadili yaliyohesabiwa ya kutofautisha tegemezi;

katika safu Mabaki e - tofauti kati ya maadili yaliyozingatiwa na yaliyohesabiwa ya kutofautisha tegemezi.

Mfano 3.6. Kuna data (vitengo vya kawaida) juu ya gharama za chakula y na mapato ya kila mtu x kwa vikundi tisa vya familia:

x
y

Kwa kutumia matokeo ya kifurushi cha uchanganuzi cha Excel (Regression), tutachambua utegemezi wa gharama za chakula kwa mapato ya kila mtu.

Matokeo ya uchambuzi wa rejista kawaida huandikwa katika fomu:

ambapo makosa ya kawaida ya hesabu za urejeshaji zinaonyeshwa kwenye mabano.

Migawo ya urejeshaji A = 65,92 na b= 0.107. Mwelekeo wa mawasiliano kati ya y Na x huamua ishara ya mgawo wa kurejesha b= 0.107, i.e. uunganisho ni wa moja kwa moja na mzuri. Mgawo b= 0.107 inaonyesha kuwa na ongezeko la mapato ya kila mtu kwa 1 ya kawaida. vitengo gharama za chakula huongezeka kwa vitengo vya kawaida vya 0.107. vitengo

Hebu tutathmini umuhimu wa coefficients ya mfano unaosababisha. Umuhimu wa coefficients ( a, b) inaangaliwa na t- mtihani:

Thamani ya P ( a) = 0,00080 < 0,01 < 0,05

Thamani ya P ( b) = 0,00016 < 0,01 < 0,05,

kwa hivyo, coefficients ( a, b) ni muhimu katika kiwango cha 1%, na hata zaidi katika kiwango cha umuhimu cha 5%. Kwa hivyo, coefficients regression ni muhimu na mfano ni wa kutosha kwa data asili.

Matokeo ya makadirio ya urejeshaji yanaendana sio tu na maadili yaliyopatikana ya mgawo wa rejista, lakini pia na seti fulani yao (muda wa kujiamini). Kwa uwezekano wa 95%, vipindi vya kutegemewa kwa vigawo ni (38.16 - 93.68) kwa a na (0.0728 - 0.142) kwa b.

Ubora wa mfano unatathminiwa na mgawo wa uamuzi R 2 .

Ukubwa R 2 = 0.884 inamaanisha kuwa kipengele cha mapato kwa kila mtu kinaweza kueleza 88.4% ya tofauti (kutawanya) katika gharama za chakula.

Umuhimu R 2 inaangaliwa na F- mtihani: umuhimu F = 0,00016 < 0,01 < 0,05, следовательно, R 2 ni muhimu katika kiwango cha 1%, na hata zaidi katika kiwango cha umuhimu cha 5%.

Katika kesi ya urejeshaji wa mstari wa pande mbili, mgawo wa uunganisho unaweza kufafanuliwa kama . Thamani iliyopatikana ya mgawo wa uwiano inaonyesha kuwa uhusiano kati ya gharama za chakula na mapato ya kila mtu uko karibu sana.

Uchambuzi wa urejeshi ni njia ya utafiti wa takwimu ambayo hukuruhusu kuonyesha utegemezi wa kigezo fulani kwenye kigezo kimoja au zaidi cha kujitegemea. Katika enzi ya kabla ya kompyuta, matumizi yake yalikuwa magumu sana, haswa linapokuja suala la idadi kubwa ya data. Leo, baada ya kujifunza jinsi ya kujenga regression katika Excel, unaweza kutatua matatizo magumu ya takwimu katika dakika chache tu. Ifuatayo ni mifano maalum kutoka kwa uwanja wa uchumi.

Aina za Kurudi nyuma

Wazo hili lenyewe lilianzishwa katika hisabati mnamo 1886. Kurudi nyuma hufanyika:

  • mstari;
  • kimfano;
  • kutuliza;
  • kielelezo;
  • hyperbolic;
  • maandamano;
  • logarithmic.

Mfano 1

Wacha tuzingatie shida ya kuamua utegemezi wa idadi ya washiriki wa timu ambao waliacha kwa wastani wa mshahara katika biashara 6 za viwandani.

Kazi. Katika biashara sita, wastani wa mshahara wa kila mwezi na idadi ya wafanyikazi walioacha kazi kwa hiari ilichambuliwa. Katika fomu ya jedwali tunayo:

Idadi ya watu walioacha

Mshahara

30,000 rubles

35,000 rubles

40,000 rubles

rubles 45,000

50,000 rubles

55,000 rubles

60,000 rubles

Kwa kazi ya kuamua utegemezi wa idadi ya wafanyikazi wanaoacha kazi kwa wastani wa mshahara katika biashara 6, muundo wa regression una fomu ya equation Y = a 0 + a 1 x 1 +...+a k x k, ambapo x i ni kuathiri vigeu, a i ni hesabu za rejista, na k ni idadi ya mambo.

Kwa shida hii, Y ni kiashiria cha kuacha wafanyikazi, na sababu ya ushawishi ni mshahara, ambayo tunaashiria kwa X.

Kwa kutumia uwezo wa kichakataji lahajedwali la Excel

Uchambuzi wa urejeshaji katika Excel lazima utanguliwe kwa kutumia vitendaji vilivyojumuishwa kwenye data iliyopo ya jedwali. Hata hivyo, kwa madhumuni haya ni bora kutumia nyongeza ya "Uchambuzi Pack" muhimu sana. Ili kuiwasha unahitaji:

  • kutoka kwenye kichupo cha "Faili" nenda kwenye sehemu ya "Chaguo";
  • katika dirisha linalofungua, chagua mstari wa "Ongeza";
  • bonyeza kitufe cha "Nenda" kilicho hapa chini, upande wa kulia wa mstari wa "Usimamizi";
  • angalia kisanduku karibu na jina "Kifurushi cha uchambuzi" na uthibitishe vitendo vyako kwa kubofya "Ok".

Ikiwa kila kitu kimefanywa kwa usahihi, kifungo kinachohitajika kitaonekana upande wa kulia wa kichupo cha "Data", kilicho juu ya karatasi ya Excel.

katika Excel

Kwa kuwa sasa tuna zana zote muhimu za mtandaoni za kufanya hesabu za uchumi, tunaweza kuanza kutatua tatizo letu. Kwa hii; kwa hili:

  • Bonyeza kitufe cha "Uchambuzi wa Takwimu";
  • katika dirisha linalofungua, bofya kitufe cha "Regression";
  • kwenye kichupo kinachoonekana, ingiza anuwai ya maadili ya Y (idadi ya wafanyikazi walioacha kazi) na kwa X (mishahara yao);
  • Tunathibitisha vitendo vyetu kwa kushinikiza kitufe cha "Ok".

Kwa hivyo, programu itajaza lahajedwali mpya kiotomatiki na data ya uchanganuzi wa rejista. Kumbuka! Excel hukuruhusu kuweka mwenyewe eneo unalopendelea kwa madhumuni haya. Kwa mfano, hii inaweza kuwa karatasi sawa ambapo thamani za Y na X ziko, au hata kitabu kipya cha kazi iliyoundwa mahsusi kuhifadhi data kama hiyo.

Uchambuzi wa matokeo ya urejeshaji wa R-mraba

Katika Excel, data iliyopatikana wakati wa usindikaji wa data katika mfano unaozingatiwa ina fomu:

Kwanza kabisa, unapaswa kuzingatia thamani ya R-mraba. Inawakilisha mgawo wa uamuzi. Katika mfano huu, R-mraba = 0.755 (75.5%), yaani, vigezo vilivyohesabiwa vya mfano vinaelezea uhusiano kati ya vigezo vinavyozingatiwa na 75.5%. Thamani ya juu ya mgawo wa uamuzi, inafaa zaidi mfano uliochaguliwa kwa kazi maalum. Inachukuliwa kuelezea kwa usahihi hali halisi wakati thamani ya R-mraba iko juu ya 0.8. Ikiwa R-mraba<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Uchambuzi wa Odds

Nambari 64.1428 inaonyesha thamani ya Y itakuwa nini ikiwa vijiti vyote vya xi katika mfano tunaozingatia vitawekwa upya hadi sifuri. Kwa maneno mengine, inaweza kusema kuwa thamani ya parameter iliyochambuliwa pia huathiriwa na mambo mengine ambayo hayajaelezewa katika mfano maalum.

Mgawo unaofuata -0.16285, ulio katika kiini B18, unaonyesha uzito wa ushawishi wa kutofautiana kwa X kwenye Y. Hii ina maana kwamba wastani wa mshahara wa kila mwezi wa wafanyakazi ndani ya mfano unaozingatiwa huathiri idadi ya waachaji na uzito wa -0.16285, i.e. kiwango cha ushawishi wake ni kidogo kabisa. Ishara "-" inaonyesha kwamba mgawo ni hasi. Hii ni dhahiri, kwa kuwa kila mtu anajua kuwa mshahara wa juu katika biashara, watu wachache huonyesha hamu ya kusitisha mkataba wa ajira au kuacha.

Rejea nyingi

Neno hili linarejelea mlingano wa uhusiano na vigeu kadhaa huru vya fomu:

y=f(x 1 +x 2 +…x m) + ε, ambapo y ni sifa tokeo (kigeu tegemezi), na x 1, x 2,…x m ni sifa za kipengele (vigezo vinavyojitegemea).

Makadirio ya Parameta

Kwa regression nyingi (MR), inafanywa kwa kutumia njia ya angalau mraba (OLS). Kwa milinganyo ya mstari wa fomu Y = a + b 1 x 1 +…+b m x m + ε tunaunda mfumo wa milinganyo ya kawaida (tazama hapa chini)

Ili kuelewa kanuni ya njia, fikiria kesi ya sababu mbili. Kisha tuna hali iliyoelezwa na formula

Kutoka hapa tunapata:

ambapo σ ni tofauti ya kipengele sambamba kilichoonyeshwa kwenye faharisi.

OLS inatumika kwa mlinganyo wa MR kwa mizani iliyosanifiwa. Katika kesi hii, tunapata equation:

ambayo t y, t x 1, ... t xm ni vigezo vya kawaida, ambavyo maadili ya wastani ni sawa na 0; β i ni hesabu sanifu za urekebishaji, na mkengeuko wa kawaida ni 1.

Tafadhali kumbuka kuwa β i zote katika kesi hii zimeainishwa kama za kawaida na za kati, kwa hivyo ulinganisho wao na kila mmoja unachukuliwa kuwa sawa na unakubalika. Kwa kuongeza, ni desturi ya kuchunguza vipengele kwa kutupa zile zilizo na thamani za chini kabisa za βi.

Tatizo la kutumia Mlinganyo wa Regression wa Linear

Tuseme tuna jedwali la mabadiliko ya bei ya bidhaa mahususi N katika kipindi cha miezi 8 iliyopita. Ni muhimu kufanya uamuzi juu ya ushauri wa ununuzi wa kundi lake kwa bei ya rubles 1850 / t.

nambari ya mwezi

jina la mwezi

bei ya bidhaa N

Rubles 1750 kwa tani

Rubles 1755 kwa tani

Rubles 1767 kwa tani

Rubles 1760 kwa tani

Rubles 1770 kwa tani

Rubles 1790 kwa tani

Rubles 1810 kwa tani

Rubles 1840 kwa tani

Ili kutatua tatizo hili katika processor ya lahajedwali ya Excel, unahitaji kutumia chombo cha "Uchambuzi wa Data", tayari kinachojulikana kutoka kwa mfano uliowasilishwa hapo juu. Ifuatayo, chagua sehemu ya "Regression" na uweke vigezo. Ni lazima ikumbukwe kwamba katika sehemu ya "Muda wa Kuingiza Y" anuwai ya maadili lazima iingizwe kwa tofauti tegemezi (katika kesi hii, bei za bidhaa katika miezi maalum ya mwaka), na katika "Muda wa Kuingiza X" - kwa kutofautiana kwa kujitegemea (nambari ya mwezi). Thibitisha kitendo kwa kubofya "Sawa". Kwenye laha mpya (ikiwa imeonyeshwa hivyo) tunapata data ya urekebishaji.

Kwa kuzitumia, tunaunda equation ya mstari wa fomu y=ax+b, ambapo vigezo a na b ni coefficients ya mstari na jina la nambari ya mwezi na coefficients na mistari "Y-intersection" kutoka kwa karatasi na. matokeo ya uchambuzi wa urejeshaji. Kwa hivyo, equation ya regression ya mstari (LR) ya kazi ya 3 imeandikwa kama:

Bei ya bidhaa N = 11.714 * nambari ya mwezi + 1727.54.

au katika nukuu za aljebra

y = 11.714 x + 1727.54

Uchambuzi wa matokeo

Ili kuamua kama mlinganyo wa urejeshaji wa mstari unaotokana unatosha, viwiko vya uunganisho vingi (MCC) na uamuzi vinatumiwa, pamoja na jaribio la Fisher na jaribio la t la Mwanafunzi. Katika lahajedwali la Excel na matokeo ya urekebishaji, huitwa nyingi R, R-mraba, F-takwimu na t-takwimu, kwa mtiririko huo.

KMC R inafanya uwezekano wa kutathmini ukaribu wa uhusiano wa uwezekano kati ya vigeu huru na tegemezi. Thamani yake ya juu inaonyesha uhusiano wenye nguvu kati ya vigezo "Nambari ya mwezi" na "Bei ya bidhaa N katika rubles kwa tani 1". Walakini, asili ya uhusiano huu bado haijulikani.

Mraba wa mgawo wa uamuzi R2 (RI) ni tabia ya nambari ya uwiano wa jumla ya kutawanyika na inaonyesha kusambaza ambayo sehemu ya data ya majaribio, i.e. maadili ya tofauti tegemezi inalingana na usawa wa rejista ya mstari. Katika tatizo linalozingatiwa, thamani hii ni sawa na 84.8%, yaani, data ya takwimu inaelezwa kwa kiwango cha juu cha usahihi na SD inayosababisha.

Takwimu za F, pia huitwa mtihani wa Fisher, hutumiwa kutathmini umuhimu wa uhusiano wa mstari, kukanusha au kuthibitisha dhana ya kuwepo kwake.

(Jaribio la Mwanafunzi) husaidia kutathmini umuhimu wa mgawo na neno lisilojulikana au lisilolipishwa la uhusiano wa mstari. Ikiwa thamani ya t-test > tcr, basi dhana kuhusu kutokuwa na umuhimu wa neno la bure la equation ya mstari imekataliwa.

Katika tatizo linalozingatiwa kwa neno la bure, kwa kutumia zana za Excel, ilipatikana kuwa t = 169.20903, na p = 2.89E-12, yaani, tuna uwezekano wa sifuri kwamba hypothesis sahihi kuhusu kutokuwa na maana ya neno la bure itakataliwa. . Kwa mgawo wa kisichojulikana t=5.79405, na p=0.001158. Kwa maneno mengine, uwezekano kwamba hypothesis sahihi juu ya kutokuwa na maana ya mgawo kwa haijulikani itakataliwa ni 0.12%.

Kwa hivyo, inaweza kubishaniwa kuwa equation ya rejista ya mstari inayotokana inatosha.

Tatizo la uwezekano wa ununuzi wa block ya hisa

Rejea nyingi katika Excel hufanywa kwa kutumia zana sawa ya Uchambuzi wa Data. Hebu fikiria tatizo maalum la maombi.

Wasimamizi wa kampuni ya NNN lazima waamue kuhusu ushauri wa kununua hisa 20% katika MMM JSC. Gharama ya kifurushi (SP) ni dola milioni 70 za Kimarekani. Wataalamu wa NNN wamekusanya data kuhusu miamala kama hiyo. Iliamuliwa kutathmini thamani ya kizuizi cha hisa kulingana na vigezo kama hivyo, vilivyoonyeshwa kwa mamilioni ya dola za Kimarekani, kama:

  • akaunti zinazolipwa (VK);
  • kiasi cha mauzo ya kila mwaka (VO);
  • akaunti zinazopokelewa (VD);
  • gharama ya mali zisizohamishika (COF).

Kwa kuongezea, kigezo cha malimbikizo ya mishahara ya biashara (V3 P) katika maelfu ya dola za Kimarekani hutumiwa.

Suluhisho kwa kutumia kichakataji lahajedwali la Excel

Kwanza kabisa, unahitaji kuunda meza ya data ya chanzo. Inaonekana kama hii:

  • piga dirisha la "Uchambuzi wa Data";
  • chagua sehemu ya "Regression";
  • Katika kisanduku cha "Ingiza muda Y", ingiza anuwai ya anuwai ya anuwai tegemezi kutoka kwa safu G;
  • Bofya kwenye aikoni iliyo na mshale mwekundu upande wa kulia wa dirisha la "Ingiza muda X" na uangazie anuwai ya thamani zote kutoka safu wima B, C, D, F kwenye laha.

Weka alama kwenye kipengee cha "Karatasi Mpya" na ubofye "Sawa".

Pata uchanganuzi wa rejista kwa shida fulani.

Utafiti wa matokeo na hitimisho

"Tunakusanya" mlinganyo wa kurejesha hali kutoka kwa data iliyozungushwa iliyowasilishwa hapo juu kwenye lahajedwali ya Excel:

SP = 0.103 * SOF + 0.541 * VO - 0.031 * VK +0.405 * VD +0.691 * VZP - 265.844.

Katika fomu inayojulikana zaidi ya hisabati, inaweza kuandikwa kama:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

Data ya MMM JSC imewasilishwa kwenye jedwali:

Tukiziweka katika mlinganyo wa kurudi nyuma, tunapata kiasi cha dola za Marekani milioni 64.72. Hii ina maana kwamba hisa za MMM JSC hazifai kununuliwa, kwani thamani yake ya dola za Marekani milioni 70 imepanda sana.

Kama unavyoona, matumizi ya lahajedwali ya Excel na mlinganyo wa kurudi nyuma ulifanya iwezekane kufanya uamuzi sahihi kuhusu uwezekano wa shughuli mahususi.

Sasa unajua regression ni nini. Mifano ya Excel iliyojadiliwa hapo juu itakusaidia kutatua matatizo ya vitendo katika uwanja wa uchumi.

KATIKA takwimu za kurudi nyuma mgawo mwingi wa uunganisho umeonyeshwa (Wingi R) na uamuzi (R-mraba) kati ya Y na safu ya sifa za sababu (ambayo inaambatana na maadili yaliyopatikana hapo awali katika uchanganuzi wa uunganisho)

Sehemu ya kati ya meza (Uchambuzi wa Tofauti) inahitajika ili kupima umuhimu wa mlinganyo wa kurejesha hali.

Chini ya meza - halisi

makadirio ya mwisho bi ya hesabu za urejeshi wa jumla bi, kupima umuhimu wao na makadirio ya muda.

Ukadiriaji wa vekta ya mgawo b (safu Odd):

Kisha makadirio ya equation ya regression ina fomu:

Inahitajika kuangalia umuhimu wa mlinganyo wa urejeleaji na mgawo wa urejeshaji unaosababishwa.

Wacha tuangalie umuhimu wa equation ya rejista katika kiwango cha b=0.05, i.e. dhana H0: в1=в2=в3=…=вk=0. Ili kufanya hivyo, thamani inayozingatiwa ya takwimu ya F imehesabiwa:

Excel inaonyesha hii katika matokeo uchambuzi wa tofauti:

QR=527.4296; Qost=1109.8673 =>

Katika safu F thamani imeonyeshwa Finayoonekana.

Kutoka kwa jedwali la F-usambazaji au kutumia kitendakazi cha takwimu kilichojengewa ndani FGUNDUA kwa kiwango cha umuhimu b=0.05 na idadi ya digrii za uhuru wa nambari n1=k=4 na denominata n2=n-k-1=45 tunapata thamani muhimu ya takwimu za F sawa na

Fcr = 2.578739184

Kwa kuwa thamani inayozingatiwa ya takwimu ya F inazidi thamani yake muhimu 8.1957 > 2.7587, nadharia tete kuhusu usawa wa vekta ya coefficients imekataliwa na uwezekano wa hitilafu wa 0.05. Kwa hivyo, angalau kipengele kimoja cha vekta b=(b1,b2,b3,b4)T ni tofauti sana na sifuri.

Wacha tuangalie umuhimu wa mgawo wa mtu binafsi wa equation ya rejista, i.e. hypothesis .

Kujaribu umuhimu wa mgawo wa urejeshaji unafanywa kwa misingi ya takwimu za T kwa kiwango cha umuhimu.

Thamani zilizozingatiwa za takwimu za T zinaonyeshwa kwenye jedwali la matokeo kwenye safu wima t-takwimu.

Coefficients (bi)

t-takwimu (tob)

Makutano ya Y

Kigezo cha X5

Kigezo cha X7

Kigezo cha X10

Kigezo cha X15

Ni lazima zilinganishwe na thamani muhimu tcr inayopatikana kwa kiwango cha umuhimu b=0.05 na idadi ya digrii za uhuru n=n – k - 1.

Ili kufanya hivyo, tunatumia kazi ya takwimu ya Excel iliyojengwa STUDISPOBR, kwa kuingia kwenye menyu iliyopendekezwa uwezekano b = 0.05 na idadi ya digrii za uhuru n = n–k-1 = 50-4-1 = 45. (Unaweza kupata maadili ya tcr kutoka kwa jedwali la takwimu za hesabu.

Tunapata tcr = 2.014103359.

Kwa thamani inayoonekana ya t-takwimu ni ndogo kuliko muhimu katika thamani kamili 2.0141>|-0.0872|, 2.0141>|0.2630|, 2.0141>|0.7300|, 2.0141>|-1.6629 |.

Kwa hivyo, dhana kwamba coefficients hizi ni sawa na sifuri haijakataliwa na uwezekano wa makosa ya 0.05, i.e. coefficients sambamba ni duni.

Kwa thamani inayozingatiwa ya t-takwimu ni kubwa kuliko modulo ya thamani muhimu |3.7658|>2.0141, kwa hivyo, dhana H0 imekataliwa, i.e. - muhimu

Umuhimu wa mgawo wa urekebishaji pia huangaliwa na safu wima zifuatazo za jedwali linalosababisha:

Safu uk-maana inaonyesha umuhimu wa vigezo vya mfano kwenye kiwango cha mpaka cha 5%, i.e. ikiwa p≤0.05, basi mgawo unaolingana unachukuliwa kuwa muhimu, ikiwa p>0.05, basi hauna maana.

Na safu za mwisho - chini 95% Na juu 95% Na chini 98% Na juu 98% - haya ni makadirio ya muda ya vigawo vya urejeshaji vilivyo na viwango maalum vya kuegemea kwa r = 0.95 (zinazotolewa kila wakati) na r = 0.98 (zinazotolewa wakati uaminifu wa ziada unaolingana umewekwa).

Ikiwa mipaka ya chini na ya juu ina ishara sawa (sifuri haijajumuishwa katika muda wa kujiamini), basi mgawo unaolingana wa urekebishaji unachukuliwa kuwa muhimu, vinginevyo unachukuliwa kuwa hauna maana.

Kama inavyoonekana kwenye jedwali, kwa mgawo b3 p-thamani p=0.0005<0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям этот коэффициент является значимым.

Kulingana na algorithm ya uchanganuzi wa urejeshaji wa hatua kwa hatua na kutengwa kwa regressors zisizo na maana, katika hatua inayofuata ni muhimu kuwatenga kutoka kwa kuzingatia kigezo ambacho kina mgawo usio na maana wa urejeshaji.

Katika kesi ambapo hesabu kadhaa zisizo na maana zinatambuliwa wakati wa tathmini ya urejeshaji, ya kwanza kutengwa kutoka kwa mlinganyo wa rejista ni rejeshi ambayo t-takwimu () ni ndogo katika thamani kamili. Kulingana na kanuni hii, katika hatua inayofuata ni muhimu kuwatenga kutofautisha X5, ambayo ina mgawo usio na maana wa rejista b2.

HATUA YA II YA UCHAMBUZI WA REgression.

Muundo huo unajumuisha sifa za kipengele X7, X10, X15, na haijumuishi X5.

HITIMISHO LA MATOKEO

Takwimu za kurudi nyuma

Wingi R

R-mraba

R-mraba ya kawaida

Hitilafu ya kawaida

Uchunguzi

Uchambuzi wa tofauti

(idadi ya digrii za uhuru n)

(jumla ya mikengeuko ya mraba Q)

(wastani wa mraba MS=SS/n)

(Fobs = MSR/MSost)

Umuhimu F

Kurudi nyuma

Odd

Hitilafu ya kawaida

takwimu za t

Thamani ya P

95% ya juu (bimax)

Chini 98% (bimin)

Makutano ya Y

Kigezo cha X7

Kigezo cha X10

Kigezo cha X15

Leo, kila mtu ambaye anavutiwa kidogo na uchimbaji wa data labda amesikia juu ya urejeshaji rahisi wa mstari. Tayari imeandikwa juu ya Habre, na Andrew Ng pia alizungumza juu yake kwa undani katika kozi yake maarufu ya kujifunza mashine. Urejeshaji wa mstari ni mojawapo ya njia za msingi na rahisi zaidi za kujifunza kwa mashine, lakini mbinu za kutathmini ubora wa muundo uliojengwa hazijatajwa sana. Katika nakala hii, nitajaribu kusahihisha upungufu huu wa kukasirisha kwa kutumia mfano wa kuchanganua matokeo ya kazi ya summary.lm() katika lugha ya R Wakati huo huo, nitajaribu kutoa fomula zinazohitajika, kwa hivyo mahesabu yote inaweza kuratibiwa kwa urahisi katika lugha nyingine yoyote. Makala haya yanalenga wale ambao wamesikia kwamba urejeshaji wa mstari unaweza kujengwa, lakini hawajakumbana na taratibu za takwimu za kutathmini ubora wake.

Muundo wa urejeshaji wa mstari

Kwa hivyo, wacha kuwe na anuwai kadhaa huru za nasibu X1, X2, ..., Xn (watabiri) na thamani Y inayowategemea (inadhaniwa kuwa mabadiliko yote muhimu ya watabiri tayari yamefanywa). Kwa kuongezea, tunadhani kuwa uhusiano huo ni wa mstari na makosa kawaida husambazwa, ambayo ni

Ambapo mimi ni n x n kitengo mraba tumbo.

Kwa hivyo, tuna data inayojumuisha uchunguzi wa k wa kiasi cha Y na Xi na tunataka kukadiria coefficients. Mbinu ya kawaida ya kutafuta makadirio ya mgawo ni mbinu ya angalau miraba. Na suluhisho la uchambuzi ambalo linaweza kupatikana kwa kutumia njia hii linaonekana kama hii:

Wapi b na kifuniko - makadirio ya vector ya coefficients, y ni vekta ya maadili ya kutofautisha tegemezi, na X ni matrix ya saizi k x n+1 (n ni idadi ya watabiri, k ni idadi ya uchunguzi), ambayo safu ya kwanza ina moja, ya pili. - maadili ya mtabiri wa kwanza, wa tatu - wa pili, na kadhalika, na safu zinazoendana na uchunguzi uliopo.

Kitendaji cha summary.lm() na tathmini ya matokeo yanayotokana

Sasa hebu tuangalie mfano wa kujenga modeli ya rejista ya mstari katika R:
> maktaba(mbali) > lm1<-lm(Species~Area+Elevation+Nearest+Scruz+Adjacent, data=gala) >summary(lm1) Piga simu: lm(formula = Spishi ~ Eneo + Mwinuko + Karibu + Scruz + Karibu, data = gala) Mabaki: Min 1Q Median 3Q Max -111.679 -34.898 -7.862 33.460 182.584 Coefficients: Makadirio ya Mizani. Hitilafu ya t thamani Pr(>|t|) (Intercept) 7.068221 19.154198 0.369 0.715351 Eneo -0.023938 0.022422 -1.068 0.296318 Mwinuko 0.304198 0.33056 Karibu 0.009144 1.054136 0.009 0.993151 Scruz -0.240524 0.215402 -1.117 0.275208 Karibu -0.074805 0.017700 -4.226 0.000297 *** --- Signif. misimbo: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Hitilafu ya kiwango cha mabaki: 60.98 kwenye digrii 24 za uhuru Nyingi za R-mraba: 0.7658, Iliyorekebishwa ya R-mraba: 0.7171 takwimu: 15.7 kwenye 5 na 24 DF, thamani ya p: 6.838e-07
Jedwali la gala lina data kuhusu Visiwa 30 vya Galapagos. Tutazingatia mfano ambapo Spishi - idadi ya spishi tofauti za mimea kwenye kisiwa hutegemea kulingana na anuwai zingine kadhaa.

Hebu tuangalie matokeo ya kazi ya summary.lm().
Kwanza inakuja mstari unaokumbusha jinsi mfano huo ulijengwa.
Halafu inakuja habari juu ya usambazaji wa mabaki: kiwango cha chini, quartile ya kwanza, wastani, quartile ya tatu, kiwango cha juu. Katika hatua hii itakuwa muhimu sio tu kuangalia quantiles ya mabaki, lakini pia kupima kwa hali ya kawaida, kwa mfano na mtihani wa Shapiro-Wilk.
Ifuatayo - ya kuvutia zaidi - habari kuhusu coefficients. Nadharia kidogo inahitajika hapa.
Kwanza tunaandika matokeo yafuatayo:

na sigma iliyofungwa kwa umbo la mraba ikiwa ni makadirio yasiyo na upendeleo kwa sigma halisi yenye mraba. Hapa b ni vekta halisi ya mgawo, na epsilon iliyo na mfuniko ni vekta ya mabaki, ikiwa tutachukua makadirio yaliyopatikana kwa njia ya angalau miraba kama coefficients. Hiyo ni, chini ya dhana kwamba makosa husambazwa kawaida, vekta ya coefficients pia itasambazwa kwa kawaida karibu na thamani halisi, na tofauti yake inaweza kukadiriwa bila upendeleo. Hii inamaanisha kuwa unaweza kujaribu nadharia ya usawa wa coefficients hadi sifuri, na kwa hivyo angalia umuhimu wa vitabiri, ambayo ni, ikiwa thamani ya Xi inaathiri sana ubora wa muundo uliojengwa.
Ili kujaribu nadharia hii, tunahitaji takwimu zifuatazo, ambazo zina usambazaji wa Mwanafunzi ikiwa thamani halisi ya mgawo bi ni 0:

Wapi
ni hitilafu ya kawaida ya makadirio ya mgawo, na t(k-n-1) ni usambazaji wa Wanafunzi wenye digrii za k-n-1 za uhuru.

Sasa uko tayari kuendelea kuchanganua matokeo ya summary.lm().
Kwa hivyo, kinachofuata ni makadirio ya coefficients iliyopatikana kwa njia ya angalau mraba, makosa yao ya kawaida, maadili ya t-takwimu na maadili ya p. Kwa kawaida thamani ya p inalinganishwa na kizingiti kidogo kilichochaguliwa mapema, kama vile 0.05 au 0.01. Na ikiwa thamani ya p-takwimu inageuka kuwa chini ya kizingiti, basi hypothesis inakataliwa, lakini ikiwa ni zaidi, kwa bahati mbaya, hakuna kitu halisi kinachoweza kusema. Acha nikukumbushe kwamba katika kesi hii, kwa kuwa usambazaji wa Mwanafunzi ni linganifu takriban 0, thamani ya p itakuwa sawa na 1-F(|t|)+F(-|t|), ambapo F ni chaguo za kukokotoa za usambazaji wa Mwanafunzi. na digrii za k-n-1 za uhuru . Pia, R inaashiria coefficients muhimu ambayo thamani ya p ni ndogo vya kutosha na nyota. Hiyo ni, hizo coefficients ambazo kwa uwezekano mdogo sana ni sawa na 0. Katika mstari wa Signif. codes ina decoding ya asterisks: ikiwa kuna tatu kati yao, basi p-thamani ni kutoka 0 hadi 0.001, ikiwa kuna mbili, basi ni kutoka 0.001 hadi 0.01, na kadhalika. Ikiwa hakuna icons, basi thamani ya p ni kubwa kuliko 0.1.

Katika mfano wetu, tunaweza kusema kwa ujasiri mkubwa kwamba watabiri Mwinuko na Karibu wana uwezekano mkubwa wa kushawishi thamani ya Spishi, lakini hakuna kitu dhahiri kinachoweza kusemwa juu ya watabiri wengine. Kwa kawaida, katika hali kama hizi, watabiri huondolewa moja kwa wakati na kuangalia jinsi viashiria vingine vya mfano vinavyobadilika, kwa mfano BIC au Adjusted R-squared, ambayo itajadiliwa zaidi.

Thamani ya makosa ya kiwango cha Mabaki inalingana kwa urahisi na makadirio ya sigma yenye kofia, na digrii za uhuru huhesabiwa kama k-n-1.

Na sasa takwimu muhimu zaidi ambazo unapaswa kuangalia kwanza: R-mraba na Iliyorekebishwa ya R-mraba:

ambapo Yi ni maadili halisi ya Y katika kila uchunguzi, Yi yenye kofia ni maadili yaliyotabiriwa na mfano, Y yenye upau ni wastani juu ya maadili yote halisi ya Yi.

Wacha tuanze na takwimu ya R-mraba, au kama inavyoitwa wakati mwingine, mgawo wa uamuzi. Inaonyesha ni kiasi gani tofauti ya masharti ya mfano inatofautiana na tofauti ya maadili halisi ya Y Ikiwa mgawo huu ni karibu na 1, basi tofauti ya masharti ya mfano ni ndogo sana na kuna uwezekano mkubwa kwamba mfano unaelezea data vizuri. . Ikiwa mgawo wa R-mraba ni mdogo sana, kwa mfano, chini ya 0.5, basi, kwa kiwango cha juu cha kujiamini, mfano hauonyeshi hali halisi ya mambo.

Hata hivyo, takwimu ya R-mraba ina dosari moja kubwa: idadi ya vitabiri inavyoongezeka, takwimu hii inaweza tu kuongezeka. Kwa hivyo, inaweza kuonekana kuwa mfano ulio na watabiri zaidi ni bora kuliko mfano ulio na wachache, hata ikiwa watabiri wote wapya hawana athari kwenye utofauti unaotegemea. Hapa unaweza kukumbuka kanuni ya wembe wa Occam. Kuifuata, ikiwa inawezekana, ni thamani ya kuondokana na utabiri usiohitajika katika mfano, kwa kuwa inakuwa rahisi na inayoeleweka zaidi. Kwa madhumuni haya, takwimu iliyorekebishwa ya R-mraba ilivumbuliwa. Inawakilisha R-mraba ya kawaida, lakini kwa adhabu kwa idadi kubwa ya watabiri. Wazo kuu: ikiwa vigezo vipya vya kujitegemea vinatoa mchango mkubwa kwa ubora wa mfano, thamani ya takwimu hii huongezeka ikiwa sio, basi, kinyume chake, inapungua.

Kwa mfano, fikiria mfano sawa na hapo awali, lakini sasa badala ya watabiri watano, wacha tuache mbili:
> lm2<-lm(Species~Elevation+Adjacent, data=gala) >summary(lm2) Simu: lm(formula = Spishi ~ Mwinuko + Karibu, data = gala) Mabaki: Min 1Q Median 3Q Max -103.41 -34.33 -11.43 22.57 203.65 Coefficients: Kadiria Std. Hitilafu T Thamani PR (> | T |) (Kukatiza) 1.43287 15.02469 0.095 0.924727 Mwinuko 0.27657 0.03176 8.707 2.53E -09 *** Karibu --0.02469 0.095 0.924727 Mwinuko 0.27657 0.03176 8.707 2.53E -09 *** Karibu --0.04001 IGN ikiwa. misimbo: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Hitilafu ya kiwango cha mabaki: 60.86 kwenye digrii 27 za uhuru Nyingi za R-mraba: 0.7376, Iliyorekebishwa R-mraba: 0.7181 takwimu: 37.94 kwenye 2 na 27 DF, thamani ya p: 1.434e-08
Kama unavyoona, thamani ya takwimu ya R-mraba imepungua, lakini thamani ya R-mraba iliyorekebishwa imeongezeka kidogo.

Sasa hebu tuangalie dhana kwamba coefficients zote za watabiri ni sawa na sifuri. Hiyo ni, nadharia juu ya ikiwa thamani ya Y kwa ujumla inategemea maadili ya Xi kwa mstari. Ili kufanya hivyo, unaweza kutumia takwimu zifuatazo, ambazo, ikiwa dhana kwamba coefficients zote ni sawa na sifuri ni kweli, ina


  1. Tathmini ubora wa muundo uliojengwa. Je, ubora wa modeli umeboreshwa ikilinganishwa na mtindo wa kipengele kimoja? Tathmini ushawishi wa mambo muhimu juu ya matokeo kwa kutumia coefficients elasticity, - na -coefficients.
Ili kutathmini ubora wa miundo mingi iliyochaguliwa (6), sawa na aya ya 1.4 ya tatizo hili, tunatumia mgawo wa uamuzi. R- mraba, wastani wa makosa ya kukadiria jamaa na F-Kigezo cha wavuvi.

Mgawo wa uamuzi R-squared itachukuliwa kutoka kwa matokeo ya "Regression" (meza "Takwimu za Regression" kwa mfano (6)).

Kwa hiyo, tofauti (mabadiliko) kwa bei ya ghorofa Y Kulingana na equation hii, 76.77% inaelezewa na tofauti ya jiji la mkoa X 1 , idadi ya vyumba katika ghorofa X 2 na nafasi ya kuishi X 4 .

Tunatumia data asili Y i na mabaki yaliyopatikana na zana ya Regression (Jedwali "Pato la salio" kwa mfano (6)). Hebu tuhesabu makosa ya jamaa na kupata thamani ya wastani
.

KUONDOLEWA KWA MENGINEYO


Uchunguzi

Alitabiri Y

Mabaki

Rel. kosa

1

45,95089273

-7,95089273

20,92340192

2

86,10296493

-23,90296493

38,42920407

3

94,84442678

30,15557322

24,12445858

4

84,17648426

-23,07648426

37,76838667

5

40,2537216

26,7462784

39,91981851

6

68,70572376

24,29427624

26,12287768

7

143,7464899

-25,7464899

21,81905923

8

106,0907598

25,90924022

19,62821228

9

135,357993

-42,85799303

46,33296544

10

114,4792566

-9,47925665

9,027863476

11

41,48765602

0,512343975

1,219866607

12

103,2329236

21,76707636

17,41366109

13

130,3567798

39,64322022

23,3195413

14

35,41901876

2,580981242

6,7920559

15

155,4129693

-24,91296925

19,0903979

16

84,32108188

0,678918123

0,798727204

17

98,0552279

-0,055227902

0,056355002

18

144,2104618

-16,21046182

12,66442329

19

122,8677535

-37,86775351

44,55029825

20

100,0221225

59,97787748

37,48617343

21

53,27196558

6,728034423

11,21339071

22

35,06605378

5,933946225

14,47303957

23

114,4792566

-24,47925665

27,19917406

24

113,1343153

-30,13431529

36,30640396

25

40,43190991

4,568090093

10,15131132

26

39,34427892

-0,344278918

0,882766457

27

144,4794501

-57,57945009

66,25943623

28

56,4827667

-16,4827667

41,20691675

29

95,38240332

-15,38240332

19,22800415

30

228,6988826

-1,698882564

0,748406416

31

222,8067278

12,19327221

5,188626473

32

38,81483144

1,185168555

2,962921389

33

48,36325811

18,63674189

27,81603267

34

126,6080021

-3,608002113

2,933335051

35

84,85052935

15,14947065

15,14947065

36

116,7991162

-11,79911625

11,23725357

37

84,17648426

-13,87648426

19,73895342

38

113,9412801

-31,94128011

38,95278062

39

215,494184

64,50581599

23,03779142

40

141,7795953

58,22040472

29,11020236

Wastani

101,2375

22,51770962

Kutumia safu wima ya makosa ya jamaa tunapata thamani ya wastani =22.51% (kwa kutumia kipengele cha AVERAGE).

Ulinganisho unaonyesha kuwa 22.51%> 7%. Kwa hivyo, usahihi wa mfano huo hauridhishi.

Kwa kutumia F - Kigezo cha mvuvi Wacha tuangalie umuhimu wa mfano kwa ujumla. Ili kufanya hivyo, tutaandika kutoka kwa matokeo ya kutumia zana ya "Regression" (meza "uchambuzi wa tofauti" kwa mfano (6)) F= 39,6702.

Kwa kutumia chaguo za kukokotoa FRIST tunapata thamani F cr =3.252 kwa kiwango cha umuhimu α = 5%, na idadi ya digrii za uhuru k 1 = 2 , k 2 = 37 .

F> F cr, kwa hivyo, equation ya mfano (6) ni muhimu, matumizi yake yanapendekezwa, tofauti tegemezi. Y imeelezewa vizuri na vigezo vya sababu vilivyojumuishwa kwenye mfano (6) X 1 , X 2. Na X 4 .

Kwa kuongeza kutumia t - Mtihani wa mwanafunzi Wacha tuangalie umuhimu wa mgawo wa mtu binafsi wa mfano.

t-Takwimu za mgawo wa mlinganyo wa urejeshi hutolewa katika matokeo ya zana ya "Regression". Thamani zifuatazo zilipatikana kwa mfano uliochaguliwa (6):


Odd

Hitilafu ya kawaida

T-takwimu

Thamani ya P

Chini 95%

95% ya juu

Chini 95.0%

Juu 95.0%

Makutano ya Y

-5,643572321

12,07285417

-0,46745966

0,642988

-30,1285

18,84131

-30,1285

18,84131

X4

2,591405557

0,461440597

5,61590284

2.27E-06

1,655561

3,52725

1,655561

3,52725

X1

6,85963077

9,185748512

0,74676884

0,460053

-11,7699

25,48919

-11,7699

25,48919

X2

-1,985156991

7,795346067

-0,25465925

0,800435

-17,7949

13,82454

-17,7949

13,82454

Thamani muhimu t cr kupatikana kwa kiwango cha umuhimu α=5% na idadi ya digrii za uhuru k=40–2–1=37 . t cr =2.026 (kazi ya STUDAR).

Kwa odds za bure α =–5.643 takwimu zilizofafanuliwa
, t cr Kwa hiyo, mgawo wa bure sio muhimu na unaweza kutengwa na mfano.

Kwa mgawo wa urejeshaji β 1 =6.859 takwimu zilizofafanuliwa
, β 1 sio muhimu, na sababu ya jiji la kikanda inaweza kuondolewa kutoka kwa mfano.

Kwa mgawo wa urejeshaji β 2 =-1,985 takwimu zilizofafanuliwa
, t cr, kwa hivyo, mgawo wa urejeshaji β 2 sio muhimu, na sababu ya idadi ya vyumba katika ghorofa inaweza kutengwa na mfano.

Kwa mgawo wa urejeshaji β 4 =2.591 takwimu zilizofafanuliwa
, > t cr, kwa hivyo, mgawo wa urejeshaji β 4 ni muhimu, na sababu ya eneo la kuishi la ghorofa inaweza kuhifadhiwa katika mfano.

Hitimisho kuhusu umuhimu wa coefficients ya mfano hufanywa kwa kiwango cha umuhimu α=5%. Kuangalia safu ya P-thamani, tunaona kwamba mgawo wa bure α inaweza kuchukuliwa kuwa muhimu katika kiwango cha 0.64 = 64%; mgawo wa kurudi nyuma β 1 - kwa kiwango cha 0.46 = 46%; mgawo wa kurudi nyuma β 2 - kwa kiwango cha 0.8 = 80%; na mgawo wa urejeshaji β 4 - kwa kiwango cha 2.27E-06= 2.26691790951854E-06 = 0.0000002%.

Vigezo vipya vya kipengele vinapoongezwa kwenye mlinganyo, mgawo wa uamuzi huongezeka kiotomatiki R 2 na kosa la wastani la kukadiria hupungua, ingawa ubora wa modeli hauboreshi kila wakati. Kwa hiyo, ili kulinganisha ubora wa mfano (3) na mfano uliochaguliwa nyingi (6), tunatumia coefficients ya kawaida ya uamuzi.

Kwa hivyo, wakati wa kuongeza sababu ya "mji wa mkoa" kwa usawa wa regression X 1 na sababu "idadi ya vyumba katika ghorofa" X 2 ubora wa mtindo umeshuka, ambayo inazungumza kwa ajili ya kuondoa mambo X 1 na X 2 kutoka kwa mfano.

Wacha tufanye mahesabu zaidi.

Wastani wa mgawo wa elasticity katika kesi ya mfano linear ni kuamua na kanuni
.

Kwa kutumia kitendakazi WASTANI tunapata: S Y, pamoja na ongezeko la sababu tu X 4 kwa kupotoka moja ya kawaida - huongezeka kwa 0.914 S Y

Mgawo wa Delta huamuliwa na fomula
.

Wacha tupate mgawo wa uunganisho wa jozi kwa kutumia zana ya "Uhusiano" ya kifurushi cha "Uchambuzi wa Data" katika Excel.


Y

X1

X2

X4

Y

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

Mgawo wa uamuzi ulibainishwa mapema na ni sawa na 0.7677.

Wacha tuhesabu mgawo wa delta:

;

Tangu Δ1 1 Na X 2 kuchaguliwa vibaya na wanahitaji kuondolewa kutoka kwa mfano. Hii inamaanisha kuwa kulingana na equation ya mfano wa sababu tatu, mabadiliko katika sababu inayosababisha. Y(bei za ghorofa) ni 104% iliyoelezewa na ushawishi wa sababu X 4 (eneo la kuishi la ghorofa), na 4% iliyoathiriwa na sababu X 2 (idadi ya vyumba), kwa 0.0859% kusukumwa na sababu X 1 (mji wa mkoa).