Uchambuzi wa uunganisho na urekebishaji katika Excel: maagizo ya utekelezaji. Uchanganuzi wa urejeshi ni mbinu ya kitakwimu ya kusoma utegemezi wa vigeuzo bila mpangilio

Uchambuzi wa kurudi nyuma

Kurudi nyuma (mstari) uchambuzi- njia ya takwimu ya kusoma ushawishi wa vigezo moja au zaidi vya kujitegemea kwenye kigezo tegemezi. Vigezo vinavyojitegemea huitwa vinginevyo virejeshi au vitabiri, na vigeu tegemezi vinaitwa vigezo vya kigezo. Istilahi tegemezi Na kujitegemea anuwai zinaonyesha tu utegemezi wa kihesabu wa anuwai ( tazama uwiano wa Uongo), badala ya mahusiano ya sababu-na-athari.

Malengo ya Uchambuzi wa Kurudi nyuma

  1. Uamuzi wa kiwango cha uamuzi wa tofauti ya kigezo (tegemezi) na watabiri (vigezo vinavyojitegemea)
  2. Kutabiri thamani ya kigezo tegemezi kwa kutumia viwezo huru
  3. Kuamua mchango wa vigeu vya kujitegemea vya kibinafsi kwa tofauti ya kutofautiana tegemezi

Uchambuzi wa urejeshaji hauwezi kutumiwa kuamua ikiwa kuna uhusiano kati ya vigeu, kwani uwepo wa uhusiano kama huo ni sharti la kutumia uchanganuzi.

Ufafanuzi wa Kihisabati wa Kurudi nyuma

Uhusiano madhubuti wa regression unaweza kufafanuliwa kama ifuatavyo. Let , iwe vigeu vya nasibu vilivyo na usambazaji wa uwezekano wa pamoja. Ikiwa kwa kila seti ya maadili matarajio ya hisabati ya masharti yanafafanuliwa

(mlinganyo wa regression katika fomu ya jumla),

basi kazi inaitwa kurudi nyuma maadili ya Y kwa maadili, na grafu yake ni mstari wa kurudi nyuma kwa, au mlinganyo wa kurudi nyuma.

Utegemezi unaonyeshwa katika mabadiliko katika maadili ya wastani ya Y na mabadiliko katika . Ingawa, kwa kila seti maalum ya maadili, thamani inabaki kuwa kigezo cha nasibu na mtawanyiko fulani.

Ili kufafanua swali la jinsi uchambuzi wa urekebishaji unakadiria mabadiliko ya Y wakati wa kubadilisha, thamani ya wastani ya mtawanyiko wa Y kwa seti tofauti za maadili hutumiwa (kwa kweli, tunazungumza juu ya kipimo cha utawanyiko wa kutofautisha tegemezi. karibu na mstari wa rejista).

Njia ya angalau miraba (hesabu ya coefficients)

Kwa mazoezi, mstari wa rejista mara nyingi hutafutwa katika mfumo wa kazi ya mstari (regression ya mstari), ambayo inakadiria vyema curve inayotaka. Hii inafanywa kwa kutumia njia ya miraba ndogo zaidi, wakati jumla ya mikengeuko ya mraba ya zile zinazotazamwa kutoka kwa makadirio yao inapunguzwa (maana ya makadirio kwa kutumia mstari ulionyooka ambao unakusudia kuwakilisha uhusiano unaotaka wa rejista):

(M - ukubwa wa sampuli). Mbinu hii inatokana na ukweli unaojulikana kuwa kiasi kinachoonekana katika usemi ulio hapo juu huchukua thamani ya chini kabisa kwa kesi wakati .

Ili kutatua tatizo la uchanganuzi wa urejeshi kwa kutumia njia ya miraba kidogo, dhana huletwa kazi za mabaki:

Kiwango cha chini cha hali ya kazi ya mabaki:

Mfumo unaotokana ni mfumo wa milinganyo ya mstari na isiyojulikana

Ikiwa tunawakilisha masharti ya bure kwenye upande wa kushoto wa milinganyo kama matrix

na coefficients kwa haijulikani upande wa kulia ni tumbo

basi tunapata equation ya matrix: , ambayo hutatuliwa kwa urahisi na njia ya Gauss. Matrix inayotokana itakuwa matrix iliyo na coefficients ya equation ya regression:

Ili kupata makadirio bora, ni muhimu kutimiza masharti ya OLS (masharti ya Gauss–Markov). Katika fasihi ya Kiingereza, makadirio kama haya yanaitwa BLUE (Wakadiriaji Bora wa Mistari Isiyo na Upendeleo).

Ufafanuzi wa Vigezo vya Urejeshaji

Vigezo ni coefficients ya uwiano wa sehemu; inafasiriwa kama sehemu ya tofauti ya Y iliyoelezewa kwa kurekebisha ushawishi wa watabiri waliobaki, ambayo ni, hupima mchango wa mtu binafsi kwa maelezo ya Y. Katika kesi ya watabiri waliounganishwa, shida ya kutokuwa na uhakika katika makadirio hutokea, ambayo hutegemea mpangilio ambao watabiri wamejumuishwa kwenye modeli. Katika hali kama hizi, inahitajika kutumia uunganisho na njia za uchambuzi wa urekebishaji wa hatua kwa hatua.

Wakati wa kuzungumza juu ya mifano isiyo ya mstari ya uchanganuzi wa rejista, ni muhimu kuzingatia ikiwa tunazungumza juu ya kutokuwa na usawa katika anuwai huru (kutoka kwa maoni rasmi, kupunguzwa kwa urahisi kwa urejeshaji wa mstari), au juu ya kutokuwa na usawa katika vigezo vinavyokadiriwa (kusababisha hali mbaya. ugumu wa hesabu). Katika kesi ya kutokuwa na usawa wa aina ya kwanza, kutoka kwa mtazamo mkubwa, ni muhimu kuonyesha kuonekana kwa mfano wa masharti ya fomu, kuonyesha uwepo wa mwingiliano kati ya vipengele, nk (angalia Multicollinearity).

Angalia pia

Viungo

  • www.kgafk.ru - Hotuba juu ya mada "Uchambuzi wa urekebishaji"
  • www.basegroup.ru - mbinu za kuchagua vigezo katika mifano ya regression

Fasihi

  • Norman Draper, Harry Smith Uchambuzi wa urejeshaji uliotumika. Rejeshi Nyingi = Uchanganuzi wa Urejeshaji Uliotumika. - Toleo la 3. - M.: "Dialectics", 2007. - P. 912. - ISBN 0-471-17082-8
  • Mbinu thabiti za kukadiria miundo ya takwimu: Monograph. - K.: PP "Sansparel", 2005. - P. 504. - ISBN 966-96574-0-7, UDC: 519.237.5:515.126.2, BBK 22.172+22.152
  • Radchenko Stanislav Grigorievich, Mbinu ya uchambuzi wa regression: Monograph. - K .: "Korniychuk", 2011. - P. 376. - ISBN 978-966-7599-72-0

Wikimedia Foundation. 2010.

Wakati wa masomo yao, wanafunzi mara nyingi hukutana na aina mbalimbali za milinganyo. Mmoja wao - equation ya rejista - inajadiliwa katika nakala hii. Aina hii ya equation hutumiwa mahsusi kuelezea sifa za uhusiano kati ya vigezo vya hisabati. Aina hii ya usawa hutumiwa katika takwimu na uchumi.

Ufafanuzi wa kurudi nyuma

Katika hisabati, regression inamaanisha kiasi fulani ambacho kinaelezea utegemezi wa thamani ya wastani ya seti ya data juu ya maadili ya kiasi kingine. Mlinganyo wa urejeshaji unaonyesha, kama utendaji wa sifa fulani, thamani ya wastani ya sifa nyingine. Kitendakazi cha urejeleaji kina umbo la mlinganyo rahisi y = x, ambapo y hufanya kama kigezo tegemezi, na x kama kigezo huru (kipengele-sababu). Kwa kweli, regression inaonyeshwa kama y = f (x).

Ni aina gani za uhusiano kati ya vigezo?

Kwa ujumla, kuna aina mbili zinazopingana za mahusiano: uwiano na regression.

Ya kwanza ina sifa ya usawa wa vigezo vya masharti. Katika kesi hii, haijulikani kwa uhakika ni tofauti gani inategemea nyingine.

Ikiwa hakuna usawa kati ya vigezo na masharti yanasema ni tofauti gani inayoelezea na ambayo inategemea, basi tunaweza kuzungumza juu ya kuwepo kwa uhusiano wa aina ya pili. Ili kuunda usawa wa rejista ya mstari, itakuwa muhimu kujua ni aina gani ya uhusiano unaozingatiwa.

Aina za kurudi nyuma

Leo, kuna aina 7 tofauti za urekebishaji: hyperbolic, linear, nyingi, zisizo za mstari, jozi, kinyume, logarithmically linear.

Hyperbolic, linear na logarithmic

Mlinganyo wa urejeshaji wa mstari hutumika katika takwimu kueleza kwa uwazi vigezo vya mlinganyo. Inaonekana y = c+t*x+E. Mlinganyo wa hyperbolic una umbo la hyperbola ya kawaida y = c + m / x + E. Mlingano wa mstari wa logarithm huonyesha uhusiano kwa kutumia kazi ya logarithmic: Katika y = Katika c + m * Katika x + Katika E.

Nyingi na zisizo za mstari

Aina mbili ngumu zaidi za urekebishaji ni nyingi na zisizo za mstari. Mlinganyo wa urejeshi mwingi unaonyeshwa na chaguo za kukokotoa y = f(x 1, x 2 ... x c) + E. Katika hali hii, y hufanya kama kigezo tegemezi, na x hufanya kama kigezo cha maelezo. Tofauti ya E ni stochastic inajumuisha ushawishi wa mambo mengine katika equation. Mlinganyo wa urejeshaji usio na mstari una utata kidogo. Kwa upande mmoja, kuhusiana na viashiria vilivyozingatiwa, sio mstari, lakini kwa upande mwingine, katika jukumu la kutathmini viashiria, ni mstari.

Aina kinyume na zilizooanishwa za rejeshi

Kinyume ni aina ya chaguo za kukokotoa ambazo zinahitaji kubadilishwa kuwa fomu ya mstari. Katika programu nyingi za jadi za maombi, ina fomu ya kazi y = 1/c + m*x+E. Mlinganyo wa kurejesha hali ya jozi unaonyesha uhusiano kati ya data kama chaguo za kukokotoa y = f (x) + E. Kama tu katika milinganyo mingine, y inategemea x, na E ni kigezo cha stochastic.

Dhana ya uwiano

Hiki ni kiashiria kinachoonyesha kuwepo kwa uhusiano kati ya matukio au michakato miwili. Nguvu ya uhusiano inaonyeshwa kama mgawo wa uunganisho. Thamani yake hubadilika-badilika ndani ya muda [-1;+1]. Kiashiria hasi kinaonyesha uwepo wa maoni, kiashiria chanya kinaonyesha maoni ya moja kwa moja. Ikiwa mgawo unachukua thamani sawa na 0, basi hakuna uhusiano. Thamani ya karibu ni 1, uhusiano wenye nguvu kati ya vigezo ni karibu na 0, ni dhaifu zaidi.

Mbinu

Njia za parametric za uunganisho zinaweza kutathmini nguvu ya uhusiano. Zinatumika kwa msingi wa makadirio ya usambazaji kusoma vigezo vinavyotii sheria ya usambazaji wa kawaida.

Vigezo vya mlingano wa urejeshi wa mstari ni muhimu ili kutambua aina ya utegemezi, kazi ya mlinganyo wa urejeshi na kutathmini viashiria vya fomula ya uhusiano iliyochaguliwa. Sehemu ya uunganisho inatumika kama njia ya utambulisho wa muunganisho. Ili kufanya hivyo, data zote zilizopo lazima zionyeshwa kwa picha. Data zote zinazojulikana lazima ziwekwe katika mfumo wa kuratibu wa pande mbili za mstatili. Hivi ndivyo uwanja wa uunganisho unavyoundwa. Thamani za sababu ya kuelezea zimewekwa alama kwenye mhimili wa abscissa, wakati maadili ya sababu tegemezi yamewekwa alama kwenye mhimili wa kuratibu. Ikiwa kuna uhusiano wa kazi kati ya vigezo, vimewekwa kwa namna ya mstari.

Ikiwa mgawo wa uunganisho wa data kama hiyo ni chini ya 30%, tunaweza kusema juu ya kutokuwepo kabisa kwa muunganisho. Ikiwa ni kati ya 30% na 70%, basi hii inaonyesha kuwepo kwa uhusiano wa kati wa karibu. Kiashiria cha 100% ni ushahidi wa uunganisho wa kazi.

Mlinganyo usio na mstari wa rejista, kama tu mstari, lazima uongezwe na faharasa ya uunganisho (R).

Uwiano kwa Marudio Mengi

Mgawo wa uamuzi ni kiashiria cha mraba wa uwiano nyingi. Anazungumza juu ya uhusiano wa karibu wa seti iliyowasilishwa ya viashiria na tabia inayosomwa. Inaweza pia kuzungumza juu ya asili ya ushawishi wa vigezo kwenye matokeo. Mlinganyo wa urejeshaji nyingi unakadiriwa kwa kutumia kiashirio hiki.

Ili kuhesabu kiashiria cha uwiano nyingi, ni muhimu kuhesabu index yake.

Njia ya angalau mraba

Njia hii ni njia ya kukadiria sababu za urekebishaji. Kiini chake ni kupunguza jumla ya mikengeuko ya mraba inayopatikana kutokana na utegemezi wa kipengele kwenye chaguo za kukokotoa.

Mlinganyo wa urejeshaji wa mstari wa pande mbili unaweza kukadiriwa kwa kutumia njia kama hiyo. Aina hii ya milinganyo hutumika wakati uhusiano wa mstari uliooanishwa unapogunduliwa kati ya viashirio.

Vigezo vya Equation

Kila kigezo cha kitendakazi cha urejeshaji cha mstari kina maana maalum. Mlinganyo wa urejeshaji wa mstari uliooanishwa una vigezo viwili: c na m Kigezo cha m kinaonyesha mabadiliko ya wastani katika kiashiria cha mwisho cha chaguo la kukokotoa y, mradi kigezo cha x kinapungua (huongezeka) kwa kitengo kimoja cha kawaida. Ikiwa variable x ni sifuri, basi kazi ni sawa na parameter c. Ikiwa mabadiliko ya x sio sifuri, basi sababu c haina maana ya kiuchumi. Ushawishi pekee kwenye utendaji ni ishara mbele ya kipengele c. Ikiwa kuna minus, basi tunaweza kusema kwamba mabadiliko katika matokeo ni polepole ikilinganishwa na sababu. Ikiwa kuna plus, basi hii inaonyesha mabadiliko ya kasi katika matokeo.

Kila kigezo kinachobadilisha thamani ya mlinganyo wa rejista kinaweza kuonyeshwa kupitia mlinganyo. Kwa mfano, sababu c ina fomu c = y - mx.

Data ya makundi

Kuna hali ya kazi ambayo habari zote zimewekwa na sifa x, lakini kwa kikundi fulani maadili ya wastani ya kiashiria tegemezi yanaonyeshwa. Katika kesi hii, maadili ya wastani yanaonyesha jinsi kiashiria kulingana na x kinabadilika. Kwa hivyo, habari iliyojumuishwa husaidia kupata usawa wa rejista. Inatumika kama uchambuzi wa uhusiano. Hata hivyo, njia hii ina vikwazo vyake. Kwa bahati mbaya, viashiria vya wastani mara nyingi vinakabiliwa na mabadiliko ya nje. Mabadiliko haya hayaakisi muundo wa uhusiano huo; Wastani huonyesha mifumo ya uhusiano mbaya zaidi kuliko mlinganyo wa rejista ya mstari. Walakini, zinaweza kutumika kama msingi wa kupata equation. Kwa kuzidisha idadi ya watu binafsi kwa wastani unaolingana, mtu anaweza kupata jumla y ndani ya kikundi. Ifuatayo, unahitaji kuongeza viwango vyote vilivyopokelewa na kupata kiashiria cha mwisho y. Ni ngumu zaidi kufanya mahesabu kwa kutumia kiashirio cha xy. Ikiwa vipindi ni vidogo, tunaweza kuchukua kiashiria cha x kwa vitengo vyote (ndani ya kikundi) kuwa sawa. Unapaswa kuizidisha kwa jumla ya y ili kujua jumla ya bidhaa za x na y. Ifuatayo, viwango vyote vinaongezwa pamoja na jumla ya xy hupatikana.

Mlinganyo wa urejeshaji wa jozi nyingi: kutathmini umuhimu wa uhusiano

Kama ilivyojadiliwa hapo awali, urejeshaji nyingi una utendaji wa fomu y = f (x 1,x 2,…,x m)+E. Mara nyingi, equation kama hiyo hutumiwa kutatua shida ya usambazaji na mahitaji ya bidhaa, mapato ya riba kwenye hisa zilizonunuliwa tena, na kusoma sababu na aina ya kazi ya gharama ya uzalishaji. Pia hutumiwa kikamilifu katika aina mbalimbali za tafiti na mahesabu ya uchumi mkuu, lakini katika kiwango cha uchumi mdogo equation hii hutumiwa kidogo mara kwa mara.

Kazi kuu ya urekebishaji mwingi ni kuunda mfano wa data iliyo na idadi kubwa ya habari ili kuamua zaidi ni ushawishi gani kila moja ya sababu ina kibinafsi na kwa jumla yao juu ya kiashiria kinachohitaji kuigwa na coefficients yake. Mlinganyo wa urejeshaji unaweza kuchukua aina mbalimbali za maadili. Katika kesi hii, kutathmini uhusiano, aina mbili za kazi hutumiwa kawaida: mstari na usio na mstari.

Kazi ya mstari inaonyeshwa kwa namna ya uhusiano ufuatao: y = a 0 + a 1 x 1 + a 2 x 2 + ... + a m x m. Katika kesi hii, a2, m inachukuliwa kuwa mgawo wa urejeshaji "safi". Inahitajika kuashiria mabadiliko ya wastani katika paramu y na mabadiliko (kupungua au kuongezeka) katika kila parameta inayolingana x na kitengo kimoja, na hali ya maadili thabiti ya viashiria vingine.

Milinganyo isiyo ya mstari ina, kwa mfano, umbo la utendaji kazi wa nguvu y=ax 1 b1 x 2 b2 ...x m bm. Katika kesi hii, viashiria b 1, b 2 ..... b m huitwa coefficients elasticity, zinaonyesha jinsi matokeo yatabadilika (kwa kiasi gani%) na ongezeko (kupungua) katika kiashiria sambamba x na 1% na. na kiashiria thabiti cha mambo mengine.

Ni mambo gani yanahitajika kuzingatiwa wakati wa kuunda regression nyingi

Ili kujenga kwa usahihi regression nyingi, ni muhimu kujua ni mambo gani yanapaswa kulipwa kipaumbele maalum.

Ni muhimu kuwa na uelewa fulani wa asili ya mahusiano kati ya mambo ya kiuchumi na kile kinachoigwa. Mambo ambayo yatahitaji kujumuishwa lazima yakidhi vigezo vifuatavyo:

  • Lazima iwe chini ya kipimo cha kiasi. Ili kutumia kipengele kinachoelezea ubora wa kitu, kwa hali yoyote inapaswa kupewa fomu ya kiasi.
  • Haipaswi kuwa na muunganisho wa mambo, au uhusiano wa kiutendaji. Vitendo kama hivyo mara nyingi husababisha matokeo yasiyoweza kubadilika - mfumo wa hesabu za kawaida huwa bila masharti, na hii inajumuisha kutoaminika kwake na makadirio yasiyo wazi.
  • Katika kesi ya kiashiria kikubwa cha uunganisho, hakuna njia ya kujua ushawishi wa pekee wa mambo juu ya matokeo ya mwisho ya kiashiria, kwa hiyo, coefficients kuwa haijulikani.

Mbinu za ujenzi

Kuna idadi kubwa ya mbinu na mbinu zinazoelezea jinsi unaweza kuchagua vipengele vya equation. Hata hivyo, njia hizi zote zinategemea uteuzi wa coefficients kwa kutumia kiashiria cha uwiano. Miongoni mwao ni:

  • Mbinu ya kuondoa.
  • Njia ya kubadili.
  • Uchambuzi wa urejeshaji wa hatua kwa hatua.

Njia ya kwanza inahusisha kuchuja coefficients zote kutoka kwa seti ya jumla. Njia ya pili inahusisha kuanzisha mambo mengi ya ziada. Kweli, ya tatu ni uondoaji wa mambo ambayo hapo awali yalitumiwa kwa equation. Kila moja ya njia hizi ina haki ya kuwepo. Wana faida na hasara zao, lakini wote wanaweza kutatua suala la kuondoa viashiria visivyohitajika kwa njia yao wenyewe. Kama sheria, matokeo yaliyopatikana kwa kila njia ya mtu binafsi ni karibu sana.

Mbinu za uchambuzi wa anuwai

Njia kama hizo za kuamua sababu zinatokana na kuzingatia mchanganyiko wa sifa zinazohusiana. Hizi ni pamoja na uchanganuzi wa kibaguzi, utambuzi wa umbo, uchanganuzi wa sehemu kuu, na uchanganuzi wa nguzo. Kwa kuongeza, pia kuna uchambuzi wa sababu, lakini ilionekana kutokana na maendeleo ya njia ya sehemu. Zote zinatumika katika hali fulani, kulingana na hali na mambo fulani.

Dhana ya kurudi nyuma. Utegemezi kati ya vigezo x Na y inaweza kuelezewa kwa njia tofauti. Hasa, aina yoyote ya uunganisho inaweza kuonyeshwa kwa equation ya jumla, wapi y kutibiwa kama kigezo tegemezi, au kazi kutoka kwa mwingine - kutofautiana kwa kujitegemea x, inayoitwa hoja. Mawasiliano kati ya hoja na fomula inaweza kubainishwa na jedwali, fomula, grafu, n.k. Kubadilisha kitendakazi kulingana na mabadiliko katika hoja moja au zaidi huitwa kurudi nyuma. Njia zote zinazotumiwa kuelezea uwiano zinajumuisha maudhui uchambuzi wa kurudi nyuma.

Ili kueleza rejeshi, milinganyo ya uunganisho, au milinganyo ya urejeshi, mfululizo wa regression wa majaribio na kinadharia, grafu zao, zinazoitwa mistari ya urejeshi, pamoja na mgawo wa urejeshi wa mstari na usio wa mstari hutumiwa.

Viashiria vya urekebishaji vinaonyesha uhusiano wa uunganisho kwa pande mbili, kwa kuzingatia mabadiliko katika maadili ya wastani ya tabia. Y wakati wa kubadilisha maadili x i ishara X, na, kinyume chake, onyesha mabadiliko katika maadili ya wastani ya tabia X kulingana na maadili yaliyobadilika y i ishara Y. Isipokuwa ni mfululizo wa saa, au mfululizo wa saa, unaoonyesha mabadiliko ya sifa baada ya muda. Urejeshaji wa safu kama hizi ni za upande mmoja.

Kuna aina nyingi tofauti na aina za uunganisho. Kazi inakuja kwa kutambua aina ya unganisho katika kila kesi maalum na kuielezea kwa usawa unaofaa wa uunganisho, ambayo inaruhusu sisi kutarajia mabadiliko iwezekanavyo katika tabia moja. Y kulingana na mabadiliko yanayojulikana katika mwingine X, inayohusiana na ya kwanza kimahusiano.

12.1 Urejeshaji wa mstari

Mlinganyo wa kurudi nyuma. Matokeo ya uchunguzi uliofanywa kwenye kitu fulani cha kibaolojia kulingana na sifa zinazohusiana x Na y, inaweza kuwakilishwa na pointi kwenye ndege kwa kujenga mfumo wa kuratibu za mstatili. Matokeo yake ni aina ya mchoro wa kutawanya ambayo inaruhusu mtu kuhukumu fomu na ukaribu wa uhusiano kati ya sifa tofauti. Mara nyingi uhusiano huu unaonekana kama mstari ulionyooka au unaweza kukadiriwa na mstari ulionyooka.

Uhusiano wa mstari kati ya vigezo x Na y inaelezewa na mlinganyo wa jumla, wapi a, b, c, d,... - vigezo vya equation vinavyoamua uhusiano kati ya hoja x 1 , x 2 , x 3 ,…, x m na kazi.

Kwa mazoezi, sio hoja zote zinazowezekana zinazingatiwa, lakini ni hoja kadhaa tu;

Katika mlinganyo wa urejeleaji wa mstari (1) a ni neno huru, na kigezo b huamua mteremko wa mstari wa regression kuhusiana na axes za kuratibu za mstatili. Katika jiometri ya uchambuzi parameter hii inaitwa mteremko, na katika bayometriki - mgawo wa kurudi nyuma. Uwakilishi wa kuona wa parameta hii na nafasi ya mistari ya rejista Y Na X Na X Na Y katika mfumo wa kuratibu wa mstatili unatoa Mchoro 1.

Mchele. Mistari 1 ya urejeshaji ya Y kwa X na X na Y kwenye mfumo

kuratibu za mstatili

Mistari ya urekebishaji, kama inavyoonyeshwa kwenye Mchoro wa 1, inapita kwa hatua O (,), inayolingana na maadili ya wastani ya hesabu ya sifa zinazohusiana na kila mmoja. Y Na X. Wakati wa kuunda grafu za rejista, maadili ya tofauti ya X hupangwa kando ya mhimili wa abscissa, na maadili ya kutofautisha tegemezi, au kazi Y, yamepangwa kando ya mhimili wa kuratibu AB kupita kwa uhakika O (, ) inalingana na uhusiano kamili (wa kazi) kati ya vigezo Y Na X, wakati mgawo wa uunganisho. Nguvu ya uhusiano kati ya Y Na X, kadiri mistari ya urejeleaji inavyokaribia AB, na, kinyume chake, jinsi muunganisho unavyopungua kati ya idadi hizi, ndivyo mistari ya urejeleaji inavyokuwa mbali zaidi kutoka kwa AB. Ikiwa hakuna uhusiano kati ya sifa, mistari ya regression iko kwenye pembe za kulia kwa kila mmoja na .

Kwa kuwa viashirio vya urejeshi vinaelezea uhusiano wa uunganisho baina ya pande mbili, mlinganyo wa rejista (1) unapaswa kuandikwa kama ifuatavyo:

Fomula ya kwanza huamua maadili ya wastani wakati tabia inabadilika X kwa kila kitengo cha kipimo, kwa pili - maadili ya wastani wakati wa kubadilisha na kitengo kimoja cha kipimo cha sifa Y.

Mgawo wa kurudi nyuma. Mgawo wa urejeshaji unaonyesha ni kiasi gani kwa wastani thamani ya sifa moja y mabadiliko wakati kipimo cha mwingine, uhusiano na, mabadiliko na moja Y ishara X. Kiashiria hiki kinatambuliwa na formula

Hapa kuna maadili s kuzidishwa na saizi ya vipindi vya darasa λ , ikiwa zilipatikana kutoka kwa safu tofauti au jedwali za uunganisho.

Mgawo wa urejeshaji unaweza kuhesabiwa bila kukokotoa mikengeuko ya kawaida s y Na s x kulingana na formula

Ikiwa mgawo wa uunganisho haujulikani, mgawo wa urekebishaji huamuliwa kama ifuatavyo:

Uhusiano kati ya rejeshi na migawo ya uunganisho. Kulinganisha fomula (11.1) (mada 11) na (12.5), tunaona: nambari yao ina thamani sawa, ambayo inaonyesha uhusiano kati ya viashiria hivi. Uhusiano huu unaonyeshwa na usawa

Kwa hivyo, mgawo wa uwiano ni sawa na maana ya kijiometri ya coefficients b yx Na b xy. Fomula (6) inaruhusu, kwanza, kulingana na maadili yanayojulikana ya coefficients ya rejista b yx Na b xy amua mgawo wa urejeshaji R xy, na pili, angalia usahihi wa hesabu ya kiashiria hiki cha uwiano R xy kati ya sifa tofauti X Na Y.

Kama vile mgawo wa uunganisho, mgawo wa urejeshaji unaashiria tu uhusiano wa mstari na unaambatana na ishara ya kuongeza kwa uhusiano chanya na ishara ya minus ya uhusiano hasi.

Uamuzi wa vigezo vya urejeshaji wa mstari. Inajulikana kuwa jumla ya mikengeuko ya mraba ni lahaja x i kutoka kwa wastani ni thamani ndogo zaidi, yaani, nadharia hii inaunda msingi wa mbinu ya angalau miraba. Kuhusu urejeshaji wa mstari [tazama formula (1)] hitaji la nadharia hii linatimizwa na mfumo fulani wa milinganyo uitwao kawaida:

Suluhisho la pamoja la equations hizi kwa heshima na vigezo a Na b inaongoza kwa matokeo yafuatayo:

;

;

, kutoka wapi na.

Kuzingatia asili ya njia mbili ya uhusiano kati ya vigezo Y Na X, fomula ya kuamua parameta A inapaswa kuonyeshwa kama hii:

Na. (7)

Kigezo b, au mgawo wa urejeshaji, hubainishwa na fomula zifuatazo:

Ujenzi wa mfululizo wa rejeshi wa majaribio. Ikiwa kuna idadi kubwa ya uchunguzi, uchanganuzi wa urejeshaji huanza na ujenzi wa safu za urejeleaji wa majaribio. Mfululizo wa urejeshaji wa nguvu huundwa kwa kuhesabu maadili ya tabia moja tofauti X maadili ya wastani ya mwingine, yanayohusiana na X ishara Y. Kwa maneno mengine, ujenzi wa safu za urekebishaji wa nguvu huja chini kupata wastani wa kikundi kutoka kwa maadili yanayolingana ya sifa Y na X.

Mfululizo wa urekebishaji wa nguvu ni safu mbili za nambari ambazo zinaweza kuwakilishwa na vidokezo kwenye ndege, na kisha, kwa kuunganisha alama hizi na sehemu za mstari wa moja kwa moja, mstari wa kumbukumbu wa nguvu unaweza kupatikana. Mfululizo wa regression wa nguvu, haswa grafu zao, zinazoitwa mistari ya kurudi nyuma, toa wazo wazi la umbo na ukaribu wa uhusiano kati ya sifa tofauti.

Mpangilio wa mfululizo wa urejeleaji wa majaribio. Grafu za safu za urekebishaji wa nguvu zinageuka, kama sheria, sio laini, lakini mistari iliyovunjika. Hii inafafanuliwa na ukweli kwamba, pamoja na sababu kuu zinazoamua muundo wa jumla katika utofauti wa sifa zinazohusiana, ukubwa wao huathiriwa na ushawishi wa sababu nyingi za sekondari ambazo husababisha kushuka kwa kasi kwa pointi za nodal za regression. Ili kutambua mwelekeo kuu (mwenendo) wa tofauti ya conjugate ya sifa zinazohusiana, ni muhimu kuchukua nafasi ya mistari iliyovunjika na mistari laini, inayoendesha vizuri. Mchakato wa kubadilisha mistari iliyovunjika na laini inaitwa alignment ya mfululizo wa majaribio Na mistari ya kurudi nyuma.

Mbinu ya upangaji wa picha. Hii ndiyo njia rahisi zaidi ambayo hauhitaji kazi ya computational. Kiini chake kinapungua kwa zifuatazo. Msururu wa urejeleaji wa majaribio unaonyeshwa kama grafu katika mfumo wa kuratibu wa mstatili. Kisha sehemu za kati za urejeshaji zimeainishwa kwa macho, ambayo mstari thabiti hutolewa kwa kutumia mtawala au muundo. Ubaya wa njia hii ni dhahiri: hauzuii ushawishi wa mali ya mtu binafsi ya mtafiti juu ya matokeo ya upatanishi wa mistari ya kumbukumbu ya nguvu. Kwa hivyo, katika hali ambapo usahihi wa juu unahitajika wakati wa kubadilisha mistari iliyovunjika ya rejista na laini, njia zingine za kulinganisha safu za majaribio hutumiwa.

Njia ya wastani ya kusonga. Kiini cha njia hii kinakuja kwa hesabu ya mfuatano wa wastani wa hesabu kutoka kwa maneno mawili au matatu yaliyo karibu ya mfululizo wa majaribio. Njia hii ni rahisi sana katika hali ambapo safu ya majaribio inawakilishwa na idadi kubwa ya maneno, ili upotezaji wa wawili wao - uliokithiri, ambao hauepukiki na njia hii ya upatanishi, hautaathiri dhahiri muundo wake.

Njia ya angalau mraba. Njia hii ilipendekezwa mwanzoni mwa karne ya 19 na A.M. Legendre na, bila yeye, K. Gauss. Inakuruhusu kupangilia mfululizo wa majaribio kwa usahihi zaidi. Njia hii, kama inavyoonyeshwa hapo juu, inatokana na dhana kwamba jumla ya mikengeuko ya mraba ni chaguo. x i kutoka kwa wastani wao kuna thamani ya chini, i.e. Kwa hivyo jina la njia, ambayo hutumiwa sio tu katika ikolojia, bali pia katika teknolojia. Njia ya miraba ndogo zaidi ni ya kimalengo na ya ulimwengu wote;

Sharti la njia ya miraba ndogo zaidi ni kwamba nukta za kinadharia za mstari wa urekebishaji lazima zipatikane kwa njia ambayo jumla ya mikengeuko ya mraba kutoka kwa nukta hizi kwa uchunguzi wa kimajaribio. y i ilikuwa ndogo, i.e.

Kwa kuhesabu kiwango cha chini cha usemi huu kwa mujibu wa kanuni za uchambuzi wa hisabati na kuibadilisha kwa njia fulani, mtu anaweza kupata mfumo wa kinachojulikana. milinganyo ya kawaida, ambayo maadili yasiyojulikana ni vigezo vinavyohitajika vya equation ya regression, na coefficients inayojulikana imedhamiriwa na maadili ya sifa za sifa, kwa kawaida jumla ya maadili yao na bidhaa zao za msalaba.

Urejeshaji wa safu nyingi. Uhusiano kati ya vigezo kadhaa kawaida huonyeshwa na equation nyingi za regression, ambayo inaweza kuwa mstari Na isiyo ya mstari. Katika umbo lake rahisi zaidi, urejeleaji mwingi unaonyeshwa kama mlinganyo na viambishi viwili huru ( x, z):

Wapi a- muda wa bure wa equation; b Na c- vigezo vya equation. Ili kupata vigezo vya equation (10) (kwa kutumia njia ndogo ya mraba), mfumo ufuatao wa hesabu za kawaida hutumiwa:

Mfululizo wa nguvu. Mpangilio wa safu. Mabadiliko ya sifa kwa wakati huunda kinachojulikana mfululizo wa wakati au mfululizo wa mienendo. Kipengele cha tabia ya mfululizo kama huu ni kwamba tofauti huru ya X hapa daima ni sababu ya wakati, na kutofautisha tegemezi Y ni kipengele kinachobadilika. Kulingana na mfululizo wa regression, uhusiano kati ya vigezo X na Y ni wa upande mmoja, kwani sababu ya wakati haitegemei kutofautiana kwa sifa. Licha ya vipengele hivi, mfululizo wa mienendo unaweza kulinganishwa na mfululizo wa regression na kuchakatwa kwa kutumia mbinu sawa.

Kama safu ya urekebishaji, safu za nguvu za nguvu huathiriwa sio tu na zile kuu, lakini pia na sababu nyingi za sekondari (nasibu) ambazo huficha mwelekeo kuu wa utofauti wa sifa, ambao kwa lugha ya takwimu huitwa. mwenendo.

Uchambuzi wa mfululizo wa saa huanza kwa kutambua umbo la mtindo. Ili kufanya hivyo, mfululizo wa saa unaonyeshwa kama grafu ya mstari katika mfumo wa kuratibu wa mstatili. Katika kesi hii, alama za wakati (miaka, miezi na vitengo vingine vya wakati) zimepangwa kando ya mhimili wa abscissa, na maadili ya kutofautisha Y yanapangwa pamoja na mhimili wa kuratibu ikiwa kuna uhusiano wa mstari kati ya vijiti X na Y (mwelekeo wa mstari), njia ya miraba ndogo ndiyo inayofaa zaidi kulandanisha safu ya saa ni mlinganyo wa rejista katika mfumo wa kupotoka kwa masharti ya safu tegemezi ya kutofautisha Y kutoka kwa maana ya hesabu ya safu huru. kutofautiana X:

Hapa kuna parameta ya rejista ya mstari.

Tabia za nambari za mfululizo wa mienendo. Sifa kuu za jumla za nambari za mfululizo wa mienendo ni pamoja na maana ya kijiometri na maana ya hesabu karibu nayo. Zinaonyesha kiwango cha wastani ambacho thamani ya kigezo tegemezi hubadilika kwa vipindi fulani vya muda:

Tathmini ya kutofautiana kwa wanachama wa mfululizo wa mienendo ni kupotoka kwa kawaida. Wakati wa kuchagua milinganyo ya urejeshi ili kuelezea mfululizo wa saa, umbo la mwelekeo huzingatiwa, ambalo linaweza kuwa la mstari (au kupunguzwa hadi mstari) na lisilo la mstari. Usahihi wa uchaguzi wa equation ya rejista kawaida huhukumiwa kwa kufanana kwa maadili yaliyozingatiwa na mahesabu ya kutofautisha tegemezi. Suluhisho sahihi zaidi kwa tatizo hili ni uchanganuzi wa urejeleaji wa njia ya utofauti (mada ya 12, aya ya 4).

Uwiano wa mfululizo wa wakati. Mara nyingi ni muhimu kulinganisha mienendo ya mfululizo wa wakati unaohusiana na kila mmoja kwa hali fulani za jumla, kwa mfano, ili kujua uhusiano kati ya uzalishaji wa kilimo na ukuaji wa idadi ya mifugo kwa muda fulani. Katika hali kama hizi, tabia ya uhusiano kati ya vigezo X na Y ni mgawo wa uwiano R xy (mbele ya mwelekeo wa mstari).

Inajulikana kuwa mwelekeo wa mfululizo wa saa, kama sheria, hufichwa na kushuka kwa thamani kwa mfululizo wa kigezo tegemezi cha Y. Hili hutokeza tatizo la aina mbili: kupima utegemezi kati ya mfululizo unaolinganishwa, bila kujumuisha mwelekeo, na kupima utegemezi kati ya wanachama jirani wa mfululizo sawa, bila kujumuisha mtindo. Katika kesi ya kwanza, kiashiria cha ukaribu wa uhusiano kati ya mfululizo wa wakati uliolinganishwa ni mgawo wa uwiano(ikiwa uhusiano ni wa mstari), katika pili - mgawo wa uunganisho otomatiki. Viashirio hivi vina maana tofauti, ingawa vinakokotolewa kwa kutumia fomula sawa (tazama mada 11).

Ni rahisi kuona kwamba thamani ya mgawo wa uunganisho otomatiki huathiriwa na utofauti wa washiriki wa safu tegemezi: kadri washiriki wa mfululizo wanavyopotoka kutoka kwa mwelekeo, ndivyo mgawo wa uunganisho otomatiki unavyoongezeka, na kinyume chake.

Uchanganuzi wa urejeleaji ni njia ya kuanzisha usemi wa uchanganuzi wa utegemezi wa kistochastiki kati ya sifa zinazosomwa. Mlinganyo wa urejeshaji unaonyesha jinsi wastani unavyobadilika katika wakati wa kubadilisha yoyote ya x i , na ina fomu:

Wapi y - kutofautisha tegemezi (daima ni sawa);

X i - vigezo vya kujitegemea (sababu) (kunaweza kuwa na kadhaa yao).

Ikiwa kuna tofauti moja tu ya kujitegemea, huu ni uchambuzi rahisi wa rejista. Ikiwa kuna kadhaa yao ( P 2), basi uchambuzi huo unaitwa multifactorial.

Uchambuzi wa urekebishaji hutatua shida kuu mbili:

    kujenga usawa wa regression, i.e. kutafuta aina ya uhusiano kati ya kiashiria cha matokeo na mambo ya kujitegemea x 1 , x 2 , …, x n .

    tathmini ya umuhimu wa equation inayosababisha, i.e. kuamua ni kiasi gani sifa za kipengele zilizochaguliwa zinaelezea utofauti wa sifa u.

Uchambuzi wa urejeshi hutumiwa hasa kwa kupanga, na pia kwa kuunda mfumo wa udhibiti.

Tofauti na uchanganuzi wa uunganisho, ambao hujibu tu swali la ikiwa kuna uhusiano kati ya sifa zilizochanganuliwa, uchanganuzi wa urekebishaji pia hutoa usemi wake rasmi. Kwa kuongeza, ikiwa uchambuzi wa uwiano unasoma uhusiano wowote kati ya mambo, basi uchambuzi wa urejeshaji unasoma utegemezi wa upande mmoja, i.e. uhusiano unaoonyesha jinsi mabadiliko katika sifa za kipengele huathiri sifa ya ufanisi.

Uchambuzi wa urejeshi ni mojawapo ya mbinu zilizotengenezwa zaidi za takwimu za hisabati. Kwa kusema kweli, ili kutekeleza uchambuzi wa rejista ni muhimu kutimiza idadi ya mahitaji maalum (haswa, x l ,x 2 ,...,x n ;y lazima iwe huru, kawaida kusambazwa vigeu vya nasibu vyenye tofauti za mara kwa mara). Katika maisha halisi, kufuata kali kwa mahitaji ya urekebishaji na uchambuzi wa uunganisho ni nadra sana, lakini njia hizi zote mbili ni za kawaida sana katika utafiti wa kiuchumi. Utegemezi katika uchumi hauwezi kuwa wa moja kwa moja tu, bali pia wa kinyume na usio wa kawaida. Mfano wa rejista unaweza kujengwa mbele ya utegemezi wowote, hata hivyo, katika uchanganuzi wa aina nyingi tu mifano ya mstari wa fomu hutumiwa:

Equation ya urekebishaji imeundwa, kama sheria, kwa kutumia njia ya mraba kidogo, kiini chake ni kupunguza jumla ya kupotoka kwa mraba wa maadili halisi ya tabia inayotokana na maadili yake yaliyohesabiwa, i.e.:

Wapi T - idadi ya uchunguzi;

j =a+b 1 x 1 j + b 2 x 2 j + ... + b n X n j - thamani iliyohesabiwa ya kipengele cha matokeo.

Inashauriwa kuamua coefficients regression kutumia paket za uchambuzi kwa kompyuta binafsi au calculator maalum ya fedha. Katika hali rahisi zaidi, migawo ya urejeleaji ya mlinganyo wa urejeshaji wa mstari wa sababu moja wa fomu. y = a + bx inaweza kupatikana kwa kutumia formula:

Uchambuzi wa nguzo

Uchanganuzi wa nguzo ni mojawapo ya mbinu za uchanganuzi wa pande nyingi zinazokusudiwa kupanga (kukusanya) idadi ya watu ambao vipengele vyake vina sifa nyingi. Thamani za kila kipengele hutumika kama viwianishi vya kila kitengo cha watu wanaochunguzwa katika nafasi ya vipengele vingi. Kila uchunguzi, unaoonyeshwa na maadili ya viashiria kadhaa, unaweza kuwakilishwa kama hatua katika nafasi ya viashiria hivi, maadili ambayo yanazingatiwa kama kuratibu katika nafasi ya multidimensional. Umbali kati ya pointi R Na q Na k kuratibu hufafanuliwa kama:

Kigezo kuu cha kuunganisha ni kwamba tofauti kati ya makundi inapaswa kuwa muhimu zaidi kuliko kati ya uchunguzi uliowekwa kwa nguzo moja, i.e. katika nafasi ya pande nyingi ukosefu wa usawa ufuatao lazima uzingatiwe:

Wapi r 1, 2 - umbali kati ya nguzo 1 na 2.

Kama vile taratibu za uchanganuzi wa urejeshi, utaratibu wa kuunganisha ni wa nguvu kazi kubwa, inashauriwa kuifanya kwenye kompyuta.

Katika uundaji wa takwimu, uchanganuzi wa urejeleaji ni utafiti unaotumiwa kutathmini uhusiano kati ya vigeu. Mbinu hii ya hisabati inajumuisha mbinu nyingine nyingi za kuigwa na kuchanganua vigeu vingi ambapo mkazo ni uhusiano kati ya kigezo tegemezi na kimoja au zaidi huru. Hasa zaidi, uchanganuzi wa urejeshi hutusaidia kuelewa jinsi thamani ya kawaida ya kigezo tegemezi hubadilika ikiwa mojawapo ya vigeu vinavyojitegemea hubadilika huku vigeu vingine huru vikibaki kuwa sawa.

Katika visa vyote, makadirio lengwa ni kazi ya vigeu huru na inaitwa kazi ya kurejesha kumbukumbu. Katika uchanganuzi wa urejeshi, pia ni ya kupendeza kuashiria mabadiliko katika kigezo tegemezi kama kazi ya urekebishaji, ambayo inaweza kuelezewa kwa kutumia usambazaji wa uwezekano.

Matatizo ya Uchambuzi wa Kurudi nyuma

Njia hii ya utafiti wa takwimu hutumiwa sana kwa utabiri, ambapo matumizi yake yana faida kubwa, lakini wakati mwingine inaweza kusababisha udanganyifu au mahusiano ya uwongo, kwa hiyo inashauriwa kuitumia kwa uangalifu katika suala hilo, kwa kuwa, kwa mfano, uwiano haimaanishi. kusababisha.

Idadi kubwa ya mbinu zimetengenezwa kwa uchanganuzi wa urejeleaji, kama vile urejeleaji wa miraba ya mstari na ya kawaida, ambayo ni parametric. Kiini chao ni kwamba kazi ya urekebishaji inafafanuliwa kwa suala la idadi ya kikomo ya vigezo visivyojulikana ambavyo vinakadiriwa kutoka kwa data. Urejeshaji usio na kipimo huruhusu utendakazi wake kuwa ndani ya seti mahususi ya vitendakazi, ambayo inaweza kuwa isiyo na kipimo.

Kama mbinu ya utafiti wa takwimu, uchanganuzi wa urejeleaji katika mazoezi unategemea aina ya mchakato wa kutengeneza data na jinsi inavyohusiana na mbinu ya urejeleaji. Kwa kuwa aina ya kweli ya mchakato wa kutengeneza data kwa kawaida ni nambari isiyojulikana, uchanganuzi wa urejeleaji wa data mara nyingi hutegemea kwa kiasi fulani mawazo kuhusu mchakato huo. Mawazo haya wakati mwingine yanaweza kujaribiwa ikiwa kuna data ya kutosha inayopatikana. Miundo ya urejeshaji mara nyingi ni muhimu hata wakati mawazo yamekiukwa kwa kiasi, ingawa yanaweza yasifanye kazi kwa ufanisi wa kilele.

Kwa maana finyu zaidi, urejeleaji unaweza kurejelea haswa makadirio ya vigeu vya majibu endelevu, kinyume na vijitibu tofauti vinavyotumika katika uainishaji. Kesi inayobadilika ya pato inayoendelea pia inaitwa urejeleaji wa kipimo ili kuitofautisha na matatizo yanayohusiana.

Hadithi

Njia ya mwanzo ya urejeshaji nyuma ni njia inayojulikana ya angalau mraba. Ilichapishwa na Legendre mwaka wa 1805 na Gauss mwaka wa 1809. Legendre na Gauss walitumia mbinu kwa tatizo la kuamua kutoka kwa uchunguzi wa angani mizunguko ya miili inayozunguka Jua (hasa comets, lakini baadaye pia sayari ndogo ndogo). Gauss alichapisha uendelezaji zaidi wa nadharia ya angalau mraba mnamo 1821, ikijumuisha toleo la nadharia ya Gauss-Markov.

Neno "regression" lilianzishwa na Francis Galton katika karne ya 19 kuelezea jambo la kibiolojia. Wazo lilikuwa kwamba urefu wa wazao kutoka kwa mababu zao huelekea kurudi chini kuelekea wastani wa kawaida. Kwa Galton, regression ilikuwa na maana hii ya kibiolojia tu, lakini baadaye kazi yake iliendelea na Udney Yoley na Karl Pearson na kuletwa katika muktadha wa jumla zaidi wa takwimu. Katika kazi ya Yule na Pearson, usambazaji wa pamoja wa majibu na vigezo vya maelezo huchukuliwa kuwa Gaussian. Dhana hii ilikataliwa na Fischer katika karatasi za 1922 na 1925. Fisher alipendekeza kuwa usambazaji wa masharti wa tofauti ya majibu ni Gaussian, lakini usambazaji wa pamoja hauhitaji kuwa. Katika suala hili, pendekezo la Fischer liko karibu na uundaji wa Gauss wa 1821. Kabla ya 1970, wakati mwingine ilichukua hadi saa 24 kupata matokeo ya uchanganuzi wa rejista.

Mbinu za uchambuzi wa urejeshi zinaendelea kuwa eneo la utafiti amilifu. Katika miongo ya hivi karibuni, mbinu mpya zimetengenezwa kwa urejeshaji thabiti; rejeshi zinazohusisha majibu yanayohusiana; njia za urejeshaji zinazoshughulikia aina tofauti za data zinazokosekana; regression isiyo ya kawaida; Njia za urejeshaji wa Bayesian; rejeshi ambapo vigezo vya utabiri hupimwa kwa makosa; regression na watabiri zaidi kuliko uchunguzi, na uelekezaji wa sababu-na-athari na rejista.

Mifano ya urejeshaji

Mitindo ya uchanganuzi wa urekebishaji ni pamoja na anuwai zifuatazo:

  • Vigezo visivyojulikana, beta iliyochaguliwa, ambayo inaweza kuwa scalar au vector.
  • Vigezo Huru, X.
  • Vigezo Tegemezi, Y.

Nyanja tofauti za sayansi ambapo uchanganuzi wa urejeleaji hutumiwa hutumia istilahi tofauti badala ya vigeu tegemezi na vinavyojitegemea, lakini katika hali zote modeli ya urejeleaji inahusisha Y na utendaji wa X na β.

Ukadiriaji kawaida huandikwa kama E(Y | X) = F(X, β). Ili kufanya uchanganuzi wa urejeshaji, aina ya chaguo za kukokotoa f lazima ibainishwe. Chini ya kawaida, inategemea ujuzi kuhusu uhusiano kati ya Y na X, ambayo haitegemei data. Ikiwa ujuzi huo haupatikani, basi fomu ya kubadilika au rahisi F inachaguliwa.

Tofauti tegemezi Y

Wacha sasa tufikirie kuwa vekta ya vigezo visivyojulikana $ \ beta $ ina urefu $ \ k $. Ili kufanya uchanganuzi wa urejeshaji, mtumiaji lazima atoe maelezo kuhusu kigezo tegemezi cha Y:

  • Ikiwa vidokezo vya data vya fomu (Y, X) vinazingatiwa, ambapo N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • Ikiwa hasa N = K huzingatiwa na kazi F ni ya mstari, basi equation Y = F (X, β) inaweza kutatuliwa hasa badala ya takriban. Hii ni sawa na kusuluhisha seti ya milinganyo ya N na N-isiyojulikana (vipengee β) ambayo ina suluhu la kipekee mradi tu X inajitegemea kimstari. Ikiwa F sio ya mstari, kunaweza kuwa hakuna suluhisho, au suluhisho nyingi zinaweza kuwepo.
  • Hali ya kawaida ni pale N > pointi za data zinazingatiwa. Katika hali hii, kuna maelezo ya kutosha katika data ya kukadiria thamani ya kipekee ya $ \ beta $ ambayo inafaa zaidi data, na muundo wa urekebishaji ambapo programu kwa data inaweza kutazamwa kama mfumo uliobainishwa kupita kiasi katika $ \ beta $.

Katika kesi ya mwisho, uchambuzi wa rejista hutoa zana za:

  • Kupata suluhisho kwa vigezo visivyojulikana $ \ beta $, ambayo, kwa mfano, itapunguza umbali kati ya thamani iliyopimwa na iliyotabiriwa ya $ Y $.
  • Chini ya mawazo fulani ya takwimu, uchanganuzi wa urekebishaji hutumia maelezo ya ziada ili kutoa maelezo ya takwimu kuhusu vigezo visivyojulikana β na thamani zilizotabiriwa za utofauti tegemezi wa Y.

Nambari inayohitajika ya vipimo vya kujitegemea

Fikiria mfano wa urejeshaji ambao una vigezo vitatu visivyojulikana: β 0 , β 1 na β 2 . Tuseme mjaribio hufanya vipimo 10 kwa thamani sawa ya vekta ya kutofautiana ya X. Katika kesi hii, uchambuzi wa urejeshaji hautoi seti ya kipekee ya maadili. Bora unayoweza kufanya ni kukadiria mkengeuko wa wastani na wa kawaida wa kigezo tegemezi cha Y. Vile vile, kwa kupima thamani mbili tofauti za X, unaweza kupata data ya kutosha ya kusawazisha na mbili zisizojulikana, lakini sio kwa tatu au zaidi zisizojulikana.

Ikiwa vipimo vya mjaribio vilifanywa kwa viwango vitatu tofauti vya vekta inayojitegemea ya X, basi uchanganuzi wa urekebishaji utatoa seti ya kipekee ya makadirio kwa vigezo vitatu visivyojulikana katika $ \ beta $.

Katika kesi ya urejeshaji wa mstari wa jumla, taarifa iliyo hapo juu ni sawa na hitaji la kuwa matrix X T X haiwezi kugeuzwa.

Mawazo ya Kitakwimu

Wakati idadi ya vipimo N ni kubwa kuliko idadi ya vigezo visivyojulikana k na makosa ya kipimo ε i , basi, kama sheria, maelezo ya ziada yaliyomo katika vipimo basi husambazwa na kutumika kwa utabiri wa takwimu kuhusu vigezo visivyojulikana. Habari hii ya ziada inaitwa kiwango cha regression cha uhuru.

Mawazo ya Msingi

Mawazo ya kawaida ya uchanganuzi wa rejista ni pamoja na:

  • Sampuli ni kiwakilishi cha utabiri wa makisio.
  • Neno la makosa ni kigezo cha nasibu chenye maana ya sifuri, ambayo ni ya masharti kwa vigeu vya maelezo.
  • Vigezo vya kujitegemea vinapimwa bila makosa.
  • Kama vigeu vinavyojitegemea (watabiri), vinajitegemea kwa mstari, yaani, haiwezekani kueleza kitabiri chochote kama mchanganyiko wa mstari wa wengine.
  • Makosa hayajaunganishwa, ambayo ni, matrix ya udadisi wa makosa ya diagonals na kila kipengele kisicho sifuri ni tofauti ya makosa.
  • Tofauti ya makosa ni ya mara kwa mara katika uchunguzi (homoscedasticity). Ikiwa sivyo, basi mraba mdogo au njia zingine zinaweza kutumika.

Masharti haya ya kutosha kwa makadirio ya angalau miraba yana sifa zinazohitajika hasa, mawazo haya yanamaanisha kuwa makadirio ya vigezo yatakuwa yenye lengo, thabiti, na yenye ufanisi, hasa yakizingatiwa katika darasa la wakadiriaji wa mstari. Ni muhimu kutambua kwamba ushahidi mara chache hukidhi masharti. Hiyo ni, njia hutumiwa hata kama dhana sio sahihi. Tofauti kutoka kwa mawazo wakati mwingine inaweza kutumika kama kipimo cha jinsi mfano ni muhimu. Mengi ya mawazo haya yanaweza kulegezwa kwa njia za hali ya juu zaidi. Ripoti za uchanganuzi wa takwimu kwa kawaida hujumuisha uchanganuzi wa majaribio kwenye sampuli ya data na mbinu kwa ajili ya manufaa ya modeli.

Zaidi ya hayo, vigezo katika baadhi ya matukio hurejelea thamani zilizopimwa katika maeneo ya uhakika. Huenda kukawa na mitindo ya anga na uunganisho otomatiki wa anga katika vigeu vinavyokiuka mawazo ya takwimu. Urejeshaji wa uzani wa kijiografia ndio njia pekee inayoshughulika na data kama hiyo.

Kipengele cha urejeshaji wa mstari ni kwamba kigezo tegemezi, ambacho ni Yi, ni mchanganyiko wa mstari wa vigezo. Kwa mfano, urejeshaji rahisi wa mstari hutumia kigezo kimoja huru, x i , na vigezo viwili, β 0 na β 1, kuiga n-alama.

Katika urejeshaji wa safu nyingi, kuna anuwai nyingi huru au kazi zake.

Sampuli nasibu inapochukuliwa kutoka kwa idadi ya watu, vigezo vyake huruhusu mtu kupata sampuli ya modeli ya urejeleaji wa mstari.

Katika kipengele hiki, maarufu zaidi ni njia ya angalau mraba. Inatumika kupata makadirio ya vigezo ambayo hupunguza jumla ya mabaki ya mraba. Aina hii ya upunguzaji (ambayo ni kawaida ya urejeshaji wa mstari) wa chaguo za kukokotoa hupelekea seti ya milinganyo ya kawaida na seti ya milinganyo ya mstari yenye vigezo, ambayo hutatuliwa ili kupata makadirio ya vigezo.

Chini ya dhana zaidi kwamba makosa ya idadi ya watu kwa ujumla huenezwa, mtafiti anaweza kutumia makadirio haya ya makosa ya kawaida kuunda vipindi vya kujiamini na kufanya majaribio ya nadharia kuhusu vigezo vyake.

Uchanganuzi wa urejeshaji usio na mstari

Mfano ambapo fomula ya kukokotoa si ya mstari kuhusiana na vigezo inaonyesha kuwa jumla ya miraba inapaswa kupunguzwa kwa kutumia utaratibu wa kurudia. Hii inaleta matatizo mengi ambayo yanafafanua tofauti kati ya njia za mraba zenye mstari na zisizo za mstari. Kwa hivyo, matokeo ya uchanganuzi wa rejista wakati wa kutumia njia isiyo ya mstari wakati mwingine haitabiriki.

Uhesabuji wa nguvu na saizi ya sampuli

Kwa ujumla hakuna mbinu thabiti kuhusu idadi ya uchunguzi dhidi ya idadi ya vigezo huru katika modeli. Sheria ya kwanza ilipendekezwa na Dobra na Hardin na inaonekana kama N = t^n, ambapo N ni saizi ya sampuli, n ni idadi ya vigeu vinavyojitegemea, na t ni idadi ya uchunguzi unaohitajika kufikia usahihi unaotaka ikiwa mfano ungekuwa. tofauti moja tu ya kujitegemea. Kwa mfano, mtafiti huunda modeli ya urejeshi wa mstari kwa kutumia seti ya data ambayo ina wagonjwa 1000 (N). Ikiwa mtafiti ataamua kuwa uchunguzi tano unahitajika ili kufafanua kwa usahihi mstari (m), basi idadi ya juu ya vigezo huru ambavyo modeli inaweza kuunga mkono ni 4.

Mbinu nyingine

Ingawa vigezo vya modeli za urejeshi kawaida hukadiriwa kwa kutumia njia ya miraba ndogo zaidi, kuna njia zingine ambazo hutumiwa mara chache sana. Kwa mfano, hizi ni njia zifuatazo:

  • Njia za Bayesian (kwa mfano, rejeshi la mstari wa Bayesian).
  • Asilimia ya kurudi nyuma, inayotumika kwa hali ambapo kupunguza makosa ya asilimia inachukuliwa kuwa inafaa zaidi.
  • Mkengeuko mdogo kabisa, ambao ni thabiti zaidi mbele ya wauzaji wa nje unaosababisha urejeshaji wa quantile.
  • Urejeshaji usio na kipimo, ambao unahitaji idadi kubwa ya uchunguzi na mahesabu.
  • Kipimo cha kujifunza kwa umbali ambacho hufunzwa kupata kipimo cha maana cha umbali katika nafasi fulani ya kuingiza data.

Programu

Vifurushi vyote vikuu vya programu za takwimu hufanya uchanganuzi wa urejeleaji wa miraba. Urejeshaji rahisi wa mstari na uchanganuzi wa urejeshaji nyingi unaweza kutumika katika baadhi ya programu za lahajedwali na pia baadhi ya vikokotoo. Ingawa vifurushi vingi vya programu za takwimu vinaweza kufanya aina mbalimbali za urejeshaji usio na kipimo na thabiti, mbinu hizi hazina viwango; vifurushi tofauti vya programu hutumia njia tofauti. Programu maalum ya urejeleaji imeundwa kwa matumizi katika maeneo kama vile uchanganuzi wa mitihani na uchunguzi wa neva.