Njia ya Bayesian katika uchunguzi wa kiufundi. Mbinu za utambuzi wa takwimu

Hadi sasa, idadi kubwa ya mbinu zimeandaliwa, matumizi ambayo inafanya uwezekano wa kutambua aina ya hali ya kiufundi ya kitu kilichotambuliwa. Karatasi hii inajadili tu baadhi yao, ambayo hutumiwa sana katika mazoezi ya uchunguzi.

Mbinu ya Bayes

Mbinu ya uchunguzi kulingana na matumizi ya fomula ya Bayes inarejelea mbinu za utambuzi wa takwimu.

Uwezekano wa tukio A, ambayo inaweza kutokea tu wakati moja ya matukio yasiyolingana 2 hutokea? 1? KATIKA 2 ,..., katika p, sawa na jumla ya bidhaa za uwezekano wa kila moja ya matukio haya kwa uwezekano unaolingana wa tukio. A:

Fomula hii inaitwa formula ya jumla ya uwezekano. Mfuatano wa nadharia ya kuzidisha na fomula jumla ya uwezekano ni nadharia inayoitwa nadharia dhahania. Wacha tufikirie kuwa tukio hilo A inaweza kutokea tu wakati moja ya matukio yasiyolingana yanatokea KATIKA, SAA 2, ..., katika p, lakini kwa kuwa haijulikani mapema ni nani kati yao atatokea, zinaitwa hypotheses. Uwezekano wa kutokea kwa tukio A hubainishwa kwa kutumia fomula ya jumla ya uwezekano (1.5), na uwezekano wa masharti. R A (B/) kulingana na formula

Kubadilisha thamani R(L), tunapata

Fomula (1.6) inaitwa formula ya Bayes. Huruhusu uwezekano wa dhahania kukadiria upya baada ya matokeo ya jaribio ambalo tukio lilitokea kujulikana. A.

Kutambua ukubwa wa uwezekano wa masharti wa kutokea kwa sifa ni muhimu katika kutumia fomula ya Bayes kutambua hali. Mbinu ya Bayesian inatumika sana katika sayansi ya udhibiti, utambuzi wa mawimbi na nadharia ya utambuzi wa muundo, na uchunguzi wa kimatibabu na kiufundi.

Hebu fikiria kiini cha njia kuhusiana na kazi ya uchunguzi. Upande wa hisabati wa suala hilo umewasilishwa kwa undani katika kazi Ts3]. Wakati wa operesheni, kitu chochote kinaweza kuwa katika moja ya majimbo iwezekanavyo TVj, ...,Nj(katika hali rahisi - "kawaida", "kukataa"), ambayo hypotheses (utambuzi) Z) j,..., Z) imepewa; . Wakati wa uendeshaji wa kituo, vigezo (ishara) vinafuatiliwa Kwa, ..., kj. Uwezekano wa uwepo wa pamoja wa hali Z)- na sifa katika kitu kj kuamua

Wapi Р(Dj)- uwezekano wa utambuzi DJ, imedhamiriwa na data ya takwimu:

Wapi P- idadi ya vitu vilivyochunguzwa;

Nj- idadi ya majimbo;

P(kj/Dj) kj kwa vitu vyenye hali Dj. Ikiwa kati ya P vitu vyenye utambuzi DJ, ilionyesha ishara kj, Hiyo

P (cr- uwezekano wa kutokea kwa ishara kj katika vitu vyote, bila kujali hali (utambuzi) wa kitu. Acha kutoka kwa jumla ya nambari P ishara ya vitu kj ilipatikana ndani rij vitu, basi

P(Dj/kj) - uwezekano wa utambuzi Z); baada ya kujulikana kuwa kitu husika kina sifa Kwa-.

Fomula ya jumla ya Bayes inatumika kwa kesi wakati uchunguzi unafanywa kulingana na seti ya sifa KWA, ikiwa ni pamoja na ishara (ku, k p). Kila moja ya ishara kj Ina rij safu (, Kwa d,

kj2 , ..., kj s, ..., k jm). Kama matokeo ya uchunguzi, inajulikana

utekelezaji wa sifa k.-k. na mchanganyiko mzima wa ishara KWA. Katika-

deke maana yake ni maana maalum ya kipengele. Fomula ya Bayes ya seti ya vipengele ina fomu

Wapi P (Dj/A*) - uwezekano wa utambuzi D baada ya matokeo ya uchunguzi kulingana na seti ya ishara kujulikana KWA;

P(Dj)- uwezekano wa awali wa utambuzi Dj.

Inachukuliwa kuwa mfumo ni katika moja tu ya majimbo yaliyoonyeshwa, i.e.

Kuamua uwezekano wa utambuzi kwa kutumia njia ya Bayes, matrix ya utambuzi huundwa kulingana na nyenzo za awali za takwimu (Jedwali 1.1). Idadi ya mistari inalingana na idadi ya utambuzi unaowezekana. Idadi ya safu wima huhesabiwa kama jumla ya bidhaa za idadi ya vipengele na nambari inayolingana ya tarakimu pamoja na moja kwa uwezekano wa awali wa utambuzi. Jedwali hili lina uwezekano wa kategoria za wahusika kwa utambuzi tofauti. Ikitambuliwa

ki ni nambari mbili (ishara rahisi "ndio - hapana"), basi kwenye meza inatosha kuonyesha uwezekano wa kutokea kwa ishara. R(k-/Dj). Uwezekano wa kukosa kipengele I. Rahisi zaidi

tumia fomu ya sare, kwa kudhani, kwa mfano, kwa ishara ya tarakimu mbili. Inapaswa kufafanuliwa kuwa , Wapi nij- idadi ya tarakimu za sifa kj. Jumla ya uwezekano wa utekelezaji wote unaowezekana wa kipengele ni sawa na moja. Utawala wa uamuzi ni sheria kulingana na ambayo uamuzi juu ya utambuzi hufanywa. Katika njia ya Bayes, kitu kilicho na tata ya vipengele ft inarejelea utambuzi wenye uwezekano wa juu zaidi (wa nyuma). ft e Dj, Kama P(Dj/lt) >

> P(Dj/ft) (J - 1, 2, ..., n i *j). Sheria hii kawaida huboreshwa kwa kuanzisha thamani ya kizingiti kwa uwezekano wa utambuzi P(Dj/ft) >

> Pj, Wapi Pj- kiwango cha utambuzi kilichochaguliwa mapema kwa utambuzi Dj. Katika kesi hii, uwezekano wa utambuzi wa karibu wa kushindana sio juu kuliko 1 - Pj. Kawaida inakubaliwa P (> 0.9. Kwa kuzingatia hilo PiD/t?) uamuzi juu ya uchunguzi haujafanywa na maelezo ya ziada yanahitajika.

Jedwali 1.1

Matrix ya utambuzi katika njia ya Bayes

Ishara kj

R(k 12 /

R(k 22 /

R(k uk /

Mfano. Locomotive ya dizeli iko chini ya uangalizi. Katika kesi hii, ishara mbili zinazingatiwa: Kwa- ongezeko la matumizi ya mafuta ya dizeli kwa saa katika nafasi ya kawaida ya mtawala wa dereva kwa zaidi ya 10% ya thamani iliyokadiriwa; kwa 2- kupunguzwa kwa nguvu ya jenereta ya dizeli iliyowekwa kwenye nafasi ya kawaida ya mtawala wa dereva kwa zaidi ya 15% ya thamani iliyopimwa. Wacha tufikirie kuwa kuonekana kwa ishara hizi kunahusishwa ama na kuongezeka kwa kuvaa kwa sehemu za kikundi cha silinda-pistoni (utambuzi /)]), au kwa kutofanya kazi vizuri kwa vifaa vya mafuta (utambuzi). D 2). Ikiwa injini ya dizeli iko katika hali nzuri (utambuzi D 3) ishara Kwa sio kuzingatiwa, lakini ishara kwa 2 kuzingatiwa katika 7% ya kesi. Kwa mujibu wa takwimu za takwimu, imeanzishwa kuwa 60% ya injini zilizogunduliwa na Z) 3 zinarekebishwa kabla ya matengenezo yaliyopangwa. D 2- 30%, na utambuzi Z)j - 10%. Pia ilibainika kuwa ishara Kwa j katika jimbo Z)| hutokea kwa 10%, na katika hali D 2 - katika 40% ya kesi; ishara kwa 2 chini ya jimbo Z)| hutokea kwa 15%, na katika hali D 2- katika 20% ya kesi. Tunatoa habari ya awali kwa namna ya meza. 1.2.

Jedwali 1.2

Uwezekano wa hali na udhihirisho wa dalili

R(k 2 / A)

Wacha tuhesabu uwezekano wa majimbo kwa chaguzi anuwai za kutekeleza huduma zinazodhibitiwa:

1. Ishara Kwa Na kwa 2 kupatikana, basi:

2. Ishara Kwa kutambuliwa, ishara kwa 2 kutokuwepo.

Kutokuwepo kwa ishara k i inamaanisha uwepo wa ishara Kwa.(tukio kinyume), na P(k./D.)-- P(k./D.).

3. Ishara Kwa 2 imegunduliwa, ishara Kwa haipo:

4. Ishara /:| Na kwa 2 kukosa:

Uchambuzi wa matokeo yaliyopatikana ya hesabu huturuhusu kupata hitimisho zifuatazo:

  • 1. Kuwepo kwa ishara mbili k na k 2 s uwezekano 0.942 unaonyesha hali hiyo DJ
  • 2. Kuwepo kwa ishara Kwa na uwezekano wa 0.919 inaonyesha hali hiyo D 2(ubovu wa vifaa vya mafuta).
  • 3. Kuwepo kwa ishara kwa 2 na uwezekano wa 0.394 inaonyesha hali hiyo D 2(malfunction ya vifaa vya mafuta) na kwa uwezekano wa 0.459 kuhusu hali Z) 3 (hali sahihi). Kwa uwiano huo wa uwezekano, kufanya maamuzi ni vigumu, hivyo mitihani ya ziada inahitajika.
  • 4. Kutokuwepo kwa ishara zote mbili na uwezekano wa 0.717 inaonyesha hali nzuri (Z) 3).
Hivi sasa, njia za Bayesian zimeenea sana na zinatumika kikamilifu katika nyanja mbali mbali za maarifa. Walakini, kwa bahati mbaya, sio watu wengi wana wazo la ni nini na kwa nini inahitajika. Moja ya sababu ni ukosefu wa kiasi kikubwa cha fasihi katika Kirusi. Kwa hivyo, hapa nitajaribu kuwasilisha kanuni zao kwa urahisi kadiri niwezavyo, kuanzia zile za msingi (naomba msamaha ikiwa hii inaonekana rahisi sana kwa wengine).

Katika siku zijazo, ningependa kuendelea na uchambuzi wa Bayesian yenyewe na kuzungumza juu ya usindikaji wa data halisi na, kwa maoni yangu, mbadala bora kwa lugha ya R (kidogo imeandikwa juu yake) - Python na moduli ya pymc. . Binafsi, naona Python inaeleweka zaidi na yenye mantiki kuliko R iliyo na vifurushi na BUGS, na Python inatoa mengi zaidi. O uhuru mkubwa na unyumbufu (ingawa Python ina ugumu wake, zinaweza kushinda, na hazipatikani mara nyingi katika uchambuzi rahisi).

Historia kidogo

Kama maelezo mafupi ya kihistoria, nitasema kwamba fomula ya Bayes ilichapishwa tayari mnamo 1763, miaka 2 baada ya kifo cha mwandishi wake, Thomas Bayes. Walakini, njia za kuitumia zilienea sana hadi mwisho wa karne ya ishirini. Hii inafafanuliwa na ukweli kwamba mahesabu yanahitaji gharama fulani za computational, na ikawa inawezekana tu kwa maendeleo ya teknolojia ya habari.

Kuhusu uwezekano na nadharia ya Bayes

Fomula ya Bayes na kila kitu kinachofuata kinahitaji uelewa wa uwezekano. Unaweza kusoma zaidi juu ya uwezekano kwenye Wikipedia.
Katika mazoezi, uwezekano wa tukio kutokea ni mzunguko wa kutokea kwa tukio hili, yaani, uwiano wa idadi ya uchunguzi wa tukio kwa jumla ya idadi ya uchunguzi kwa idadi kubwa (kinadharia isiyo na mwisho) ya uchunguzi.
Fikiria jaribio lifuatalo: tunaita nambari yoyote kutoka kwa sehemu na kuona kwamba nambari hii iko kati, kwa mfano, 0.1 na 0.4. Kama unavyoweza kudhani, uwezekano wa tukio hili utakuwa sawa na uwiano wa urefu wa sehemu hadi urefu wa jumla wa sehemu (kwa maneno mengine, uwiano wa "idadi" ya maadili yanayowezekana kwa usawa. jumla ya "idadi" ya maadili), ambayo ni (0.4 - 0.1) / (1 - 0) = 0.3, ambayo ni, uwezekano wa kuingia kwenye sehemu ni 30%.

Sasa hebu tuangalie mraba wa x.

Wacha tuseme tunapaswa kutaja jozi za nambari (x, y), ambayo kila moja ni kubwa kuliko sifuri na chini ya moja. Uwezekano kwamba x (nambari ya kwanza) itakuwa ndani ya sehemu (iliyoonyeshwa kwenye takwimu ya kwanza kama eneo la bluu, kwa sasa nambari ya pili y sio muhimu kwetu) ni sawa na uwiano wa eneo la eneo la bluu kwa eneo la mraba mzima, ambayo ni (0.4 - 0.1 ) * (1 - 0) / (1 * 1) = 0.3, ambayo ni 30%. Kwa hivyo, tunaweza kuandika kwamba uwezekano kwamba x ni ya sehemu hiyo ni p(0.1<= x <= 0.4) = 0.3 или для краткости p(X) = 0.3.
Ikiwa sasa tunaangalia y, basi vivyo hivyo, uwezekano kwamba y iko ndani ya sehemu ni sawa na uwiano wa eneo la eneo la kijani na eneo la mraba mzima p (0.5).<= y <= 0.7) = 0.2, или для краткости p(Y) = 0.2.
Sasa hebu tuone kile tunaweza kujifunza kuhusu maadili ya x na y.
Ikiwa tunataka kujua ni uwezekano gani kwamba x na y ni wakati huo huo katika sehemu zinazolingana, basi tunahitaji kuhesabu uwiano wa eneo la giza (makutano ya maeneo ya kijani na bluu) kwa eneo lote. mraba: p (X, Y) = (0.4 - 0.1 ) * (0.7 - 0.5) / (1 * 1) = 0.06.

Sasa wacha tuseme tunataka kujua ni uwezekano gani kwamba y iko kwenye muda ikiwa x tayari iko kwenye muda. Hiyo ni, kwa kweli, tuna kichungi na tunapotaja jozi (x, y), tunatupa mara moja jozi hizo ambazo hazikidhi hali ya x kuwa katika muda fulani, na kisha kutoka kwa jozi zilizochujwa tunahesabu hizo kwa ambayo y inakidhi hali yetu na kuzingatia uwezekano kama uwiano wa idadi ya jozi ambayo y iko katika sehemu iliyotajwa hapo juu kwa jumla ya idadi ya jozi zilizochujwa (yaani, ambayo x iko katika sehemu). Tunaweza kuandika uwezekano huu kama p(Y|X). Kwa wazi, uwezekano huu ni sawa na uwiano wa eneo la eneo la giza (makutano ya mikoa ya kijani na bluu) kwa eneo la eneo la bluu. Eneo la eneo la giza ni (0.4 - 0.1) * (0.7 - 0.5) = 0.06, na eneo la bluu ni (0.4 - 0.1) * (1 - 0) = 0.3, basi uwiano wao ni 0.06 / 0.3 = 0.2. Kwa maneno mengine, uwezekano wa kupata y kwenye sehemu kutokana na kwamba x tayari ni ya sehemu hiyo ni p(Y|X) = 0.2.
Ikumbukwe kwamba kwa kuzingatia yote hapo juu na maelezo yote hapo juu, tunaweza kuandika maneno yafuatayo
p(Y|X) = p(X, Y) / p(X)

Wacha tuzalishe tena kwa ufupi mantiki yote ya hapo awali kuhusiana na p(X|Y): tunataja jozi (x, y) na kuchuja zile ambazo y iko kati ya 0.5 na 0.7, basi uwezekano kwamba x iko katika muda mradi tu y ni ya sehemu ni sawa na uwiano wa eneo la giza na eneo la kijani kibichi:
p(X|Y) = p(X, Y) / p(Y)

Katika fomula mbili hapo juu, tunaona kwamba neno p(X, Y) ni sawa, na tunaweza kuliondoa:

Tunaweza kuandika upya usawa wa mwisho kama

Hii ni nadharia ya Bayes.
Inafurahisha pia kutambua kwamba p(Y) ni p(X,Y) kwa thamani zote za X. Hiyo ni, ikiwa tutachukua eneo lenye giza na kulinyoosha ili kufunika maadili yote ya X, basi. itafuata haswa eneo la kijani kibichi, ambayo inamaanisha itakuwa sawa na p(Y). Katika lugha ya hisabati hii itamaanisha yafuatayo:
Kisha tunaweza kuandika tena formula ya Bayes kama ifuatavyo:

Utumiaji wa Nadharia ya Bayes

Hebu tuangalie mfano ufuatao. Chukua sarafu na uigeuze mara 3. Kwa uwezekano sawa tunaweza kupata matokeo yafuatayo (O - vichwa, P - mikia): OOO, OOR, ORO, ORR, ROO, ROR, RPO, RRR.

Tunaweza kuhesabu ni vichwa vingapi vilikuja katika kila kisa na ni mara ngapi kulikuwa na mabadiliko ya vichwa-mkia, vichwa vya mikia:

Tunaweza kuzingatia idadi ya vichwa na idadi ya mabadiliko kama vigezo viwili vya nasibu. Kisha meza ya uwezekano itaonekana kama hii:

Sasa tunaweza kuona formula ya Bayes ikifanya kazi.
Lakini kwanza, hebu tuchore mlinganisho na mraba ambao tuliangalia hapo awali.
Unaweza kutambua kwamba p(1O) ni jumla ya safu wima ya tatu ("eneo la samawati" la mraba) na ni sawa na jumla ya thamani zote za kisanduku kwenye safu wima hii: p(1O) = 2/8 + 1/8 = 3/8
p(1С) ni jumla ya safu ya tatu ("eneo la kijani" la mraba) na, vivyo hivyo, ni sawa na jumla ya maadili yote ya seli katika safu hii p(1С) = 2/8 + 2/ 8 = 4/8
Uwezekano kwamba tulipata kichwa kimoja na mabadiliko moja ni sawa na makutano ya maeneo haya (yaani, thamani katika seli ya makutano ya safu ya tatu na safu ya tatu) p (1C, 1O) = 2/8.
Halafu, kufuata fomula zilizoelezewa hapo juu, tunaweza kuhesabu uwezekano wa kupata mabadiliko moja ikiwa tutapata kichwa kimoja katika kurusha tatu:
p(1C|1O) = p(1C, 1O) / p(1O) = (2/8) / (3/8) = 2/3
au uwezekano wa kupata kichwa kimoja ikiwa tutapata mabadiliko moja:
p(1O|1C) = p(1C, 1O) / p(1C) = (2/8) / (4/8) = 1/2
Ikiwa tutahesabu uwezekano wa kupata badiliko moja ikiwa kuna kichwa kimoja p(1O|1C) kupitia fomula ya Bayes, tunapata:
p(1O|1C) = p(1C|1O) * p(1O) / p(1C) = (2/3) * (3/8) / (4/8) = 1/2
Ambayo ndio tuliyopata hapo juu.

Lakini mfano ulio juu una umuhimu gani wa kivitendo?
Ukweli ni kwamba tunapochambua data halisi, kwa kawaida tunavutiwa na kigezo fulani cha data hii (kwa mfano, wastani, tofauti, n.k.). Kisha tunaweza kuchora mlinganisho ufuatao na jedwali hapo juu la uwezekano: safu ziwe data yetu ya majaribio (wacha tuwaonyeshe data), na safu wima ziwe maadili yanayowezekana ya paramu ya data hii ambayo inatuvutia (wacha tuiashiria. ) Kisha tunavutiwa na uwezekano wa kupata thamani fulani ya parameter kulingana na data zilizopo.
Tunaweza kutumia formula ya Bayes na kuandika yafuatayo:

Na kukumbuka formula na kiunga, tunaweza kuandika yafuatayo:

Hiyo ni, kwa kweli, kama matokeo ya uchambuzi wetu, tuna uwezekano kama kazi ya parameta. Sasa tunaweza, kwa mfano, kuongeza kazi hii na kupata thamani inayowezekana zaidi ya parameta, kuhesabu utawanyiko na thamani ya wastani ya parameta, kuhesabu mipaka ya sehemu ambayo parameta tunayopendezwa nayo iko na uwezekano wa 95. %, na kadhalika.

Uwezekano huo unaitwa uwezekano wa nyuma. Na ili kuihesabu tunahitaji kuwa nayo
- uwezekano wa kazi na - uwezekano wa awali.
Kazi ya uwezekano imedhamiriwa na mfano wetu. Hiyo ni, tunaunda mfano wa kukusanya data ambayo inategemea parameter ya maslahi kwetu. Kwa mfano, tunataka kujumuisha data kwa kutumia mstari wa moja kwa moja y = a * x + b (kwa hivyo tunadhania kwamba data yote ina uhusiano wa kimstari na kelele ya Gaussian iliyowekwa juu yake na tofauti inayojulikana). Kisha a na b ni vigezo vyetu, na tunataka kujua thamani zao zinazowezekana zaidi, na uwezekano wa kazi ni Gaussian na maana iliyotolewa na equation ya mstari na tofauti fulani.
Uwezekano wa hapo awali unajumuisha maelezo tunayojua kabla ya kufanya uchanganuzi. Kwa mfano, tunajua kwa hakika kwamba mstari lazima uwe na mteremko chanya, au kwamba thamani katika ukatizaji wa x lazima iwe chanya - yote haya na zaidi tunaweza kujumuisha katika uchanganuzi wetu.
Kama unaweza kuona, dhehebu la sehemu ni muhimu (au katika hali ambapo vigezo vinaweza kuchukua tu maadili fulani tofauti, jumla) ya nambari juu ya maadili yote yanayowezekana ya paramu. Katika mazoezi, hii ina maana kwamba denominator ni mara kwa mara na hutumikia kuhalalisha uwezekano wa nyuma (hiyo ni, ili kiungo cha uwezekano wa nyuma ni sawa na moja).

Kwa hili ningependa kumaliza chapisho langu (inaendelea

NJIA YA UCHAMBUZI WA KUFUATA

NJIA YA BAYES

Muhtasari wa hotuba

Uchambuzi na ukaguzi wa kazi za nyumbani

Wakati wa kuandaa.

Maendeleo ya hotuba.

Hotuba ya 9

Somo. NJIA ZA UTAMBUZI WA TAKWIMU

Lengo. Toa dhana ya utambuzi wa mawimbi ya kidijitali.

1. Kielimu. Eleza mchakato wa utambuzi wa ishara za dijiti.

2. Kimaendeleo. Kuza fikra za kimantiki na mtazamo wa kisayansi wa asili.

3. Kielimu. Kuza shauku katika mafanikio ya kisayansi na uvumbuzi katika sekta ya mawasiliano ya simu.

Miunganisho ya taaluma mbalimbali:

· Kusaidia: sayansi ya kompyuta, hisabati, teknolojia ya kompyuta na MP, mifumo ya programu.

· Zinazotolewa: Internship

Msaada wa mbinu na vifaa:

1. Maendeleo ya mbinu kwa somo.

2. Mtaala.

3. Mtaala

4. Mpango wa kazi.

5. Muhtasari wa usalama.

Vifaa vya kufundishia kiufundi: kompyuta binafsi.

Kutoa kazi:

· Vitabu vya kazi

3. Jibu maswali:

1. Kuna tofauti gani kati ya ishara za dijiti na ishara za analogi?

2. Ni madarasa gani ya michoro hutumiwa wakati wa kufanya vipimo?

3. Toa maelezo mafupi ya kila darasa.

4. Ni nini kinachotumiwa kuunda mchoro wa jicho?

5. Eleza kiini cha mchoro wa jicho.

· Misingi ya mbinu

  • Fomula ya jumla ya Bayes.

· Matrix ya uchunguzi.

Utawala wa maamuzi

· Misingi ya mbinu.

· Utaratibu wa jumla wa njia.

· Uunganisho wa mipaka ya uamuzi na uwezekano wa makosa ya aina ya kwanza na ya pili.

Faida kuu ya njia za utambuzi wa takwimu ni uwezo wa kuzingatia wakati huo huo ishara za asili tofauti za mwili, kwani zinaonyeshwa na idadi isiyo na kipimo - uwezekano wa kutokea kwao chini ya majimbo tofauti ya mfumo..

Miongoni mwa njia za utambuzi wa kiufundi ni njia kulingana na formula ya jumla ya Bayes ( Nadharia ya Bayes (au fomula ya Bayes) ni moja wapo ya nadharia kuu za nadharia ya uwezekano, ambayo hukuruhusu kuamua uwezekano kwamba tukio (dhahania) limetokea mbele ya ushahidi usio wa moja kwa moja tu (data), ambayo inaweza kuwa sio sahihi. ), ina nafasi maalum kutokana na unyenyekevu na ufanisi wake.

Njia ya Bayes ina hasara:kiasi kikubwa cha maelezo ya awali, "ukandamizaji" wa uchunguzi wa nadra, nk. Hata hivyo, katika hali ambapo kiasi cha data ya takwimu inaruhusu matumizi ya njia ya Bayes, inashauriwa kuitumia kama mojawapo ya njia za kuaminika na za ufanisi.

Misingi ya mbinu. Njia hiyo inategemea formula rahisi ya Bayes. Ikiwa kuna utambuzi D i na ishara rahisi ki , kutokea kwa utambuzi huu, basi uwezekano wa tukio la pamoja la matukio (uwepo wa hali ya Di na ishara ki kwenye kitu. )



Kutoka kwa usawa huu hufuata formula ya Bayes

(3.2)

Ni muhimu sana kuamua maana halisi ya idadi yote iliyojumuishwa katika fomula hii.

P(Di) - uwezekano wa awali wa nadharia D

P(ki/Di) - uwezekano wa dhana ki juu ya kutokea kwa tukio D (uwezekano wa nyuma - uwezekano wa tukio la nasibu, mradi tu data ya nyuma, i.e. iliyopatikana baada ya jaribio, inajulikana.)

P(ki) - jumla ya uwezekano wa kutokea kwa tukio ki

P(Di/ki) - uwezekano wa kutokea kwa tukio Di ikiwa hypothesis ki ni kweli

P (D) - uwezekano wa utambuzi D, imedhamiriwa na data ya takwimu (uwezekano wa awali wa utambuzi). Kwa hivyo, ikiwa imechunguzwa hapo awali N vitu na W,-vitu vilikuwa na hali D, basi

P(D i) = N i /N.(3.3)

P (kj/Di) - uwezekano wa kutokea kwa kipengele k j; kwa vitu vilivyo na jimbo la Di. Ikiwa kati ya Ni, vitu vilivyogunduliwa na Di, N ij ishara ilionekana k j Hiyo

(3.4)

P (kj) - uwezekano wa kutokea kwa ishara kj katika vitu vyote, bila kujali hali (utambuzi) wa kitu. Acha kutoka kwa jumla ya nambari N ishara ya vitu Kwa) ilipatikana ndani Nj vitu, basi

(3.5)

Katika usawa (3.2) R ( Di/kj)- uwezekano wa utambuzi D baada ya kujulikana kuwa kitu kinachohusika kina sifa kj (uwezekano wa nyuma wa utambuzi ).

Utangulizi

Njia ya Bayes inahusu mbinu za utambuzi wa takwimu, faida kuu ambayo ni uwezo wa kuzingatia wakati huo huo vipengele vya asili tofauti za kimwili. Hii ni kwa sababu ya ukweli kwamba ishara zote zina sifa ya idadi isiyo na kipimo - uwezekano wa kutokea kwao chini ya majimbo tofauti ya mfumo.

Njia ya Bayesian, kwa sababu ya unyenyekevu na ufanisi wake, inachukua nafasi maalum kati ya njia za utambuzi wa kiufundi, ingawa pia ina shida, kwa mfano, idadi kubwa ya habari ya awali, "kukandamiza" utambuzi wa nadra, nk. Walakini, katika hali ambapo kiasi cha taarifa ya takwimu inaruhusu njia ya Bayesian kutumika, inashauriwa kutumia kama mojawapo ya njia za kuaminika na za ufanisi.

Misingi ya Njia ya Bayes

Njia hiyo inategemea formula ya Bayes (formula ya uwezekano wa hypotheses).

Ikiwa kuna utambuzi D i na ishara rahisi k j , kutokea kwa utambuzi huu, basi uwezekano wa tukio la pamoja la matukio ( uwepo wa hali katika kitu D i na ishara k j), imedhamiriwa na formula:

P (D i k j ) = P (D i ) P (k j /D i ) = P (k j P (D i / k j ). (1.1.)

Kutoka kwa usawa huu ifuatavyo formula ya Bayes:

P (D i / k j ) = P (D i ) P (k i /D i )/P(k j ) (1.2.)

Ni muhimu sana kuamua maana halisi ya idadi yote iliyojumuishwa katika fomula hii.

P(D i) --uwezekano wa utambuzi D i, iliyoamuliwa kutoka kwa data ya takwimu ( uwezekano wa awali wa utambuzi) Kwa hivyo, ikiwa imechunguzwa hapo awali N vitu na N i vitu vilikuwa na hali D i, Hiyo

P(D i) = N i /N. (1.3.)

P (k j /D i k j kwa vitu vyenye hali D i .

Ikiwa kati ya N i vitu vyenye utambuzi D i,y N ij ishara ilionekana k j , basi uwezekano wa uunganisho wa Bayes

P(k j /D i) = N ij /N i . (1.4.)

P(k j) --uwezekano wa kutokea kwa ishara k j katika vitu vyote, bila kujali hali (utambuzi) wa kitu. Acha kutoka kwa jumla ya nambari N ishara ya vitu k j ilipatikana ndani N j vitu, basi

P(k j ) = N j /N. (1.5.)

Kuanzisha utambuzi, hesabu maalum P(kj) haihitajiki. Kama itakavyokuwa wazi kutoka kwa kile kinachofuata, maana P(D i) Na P (k j /D i), inayojulikana kwa majimbo yote yanayowezekana, kuamua thamani P(k j ).

Katika usawa P (D i /k j) - uwezekano wa utambuzi D i baada ya kujulikana kuwa kitu husika kina sifa k j (uwezekano wa nyuma wa utambuzi).

Tuma kazi yako nzuri katika msingi wa maarifa ni rahisi. Tumia fomu iliyo hapa chini

Wanafunzi, wanafunzi waliohitimu, wanasayansi wachanga wanaotumia msingi wa maarifa katika masomo na kazi zao watakushukuru sana.

Iliyotumwa kwenye http://www.allbest.ru/

Utangulizi

Njia ya Bayes inahusu mbinu za utambuzi wa takwimu, faida kuu ambayo ni uwezo wa kuzingatia wakati huo huo vipengele vya asili tofauti za kimwili. Hii ni kwa sababu ya ukweli kwamba ishara zote zina sifa ya idadi isiyo na kipimo - uwezekano wa kutokea kwao chini ya majimbo tofauti ya mfumo.

Njia ya Bayesian, kwa sababu ya unyenyekevu na ufanisi wake, inachukua nafasi maalum kati ya njia za utambuzi wa kiufundi, ingawa pia ina shida, kwa mfano, idadi kubwa ya habari ya awali, "kukandamiza" utambuzi wa nadra, nk. Walakini, katika hali ambapo kiasi cha taarifa ya takwimu inaruhusu njia ya Bayesian kutumika, inashauriwa kutumia kama mojawapo ya njia za kuaminika na za ufanisi.

1. Misingi ya njia ya Bayes

Njia hiyo inategemea formula ya Bayes (formula ya uwezekano wa hypotheses).

Ikiwa kuna utambuzi D i na ishara rahisi k j , kutokea kwa utambuzi huu, basi uwezekano wa tukio la pamoja la matukio ( uwepo wa hali katika kitu D i na ishara k j), imedhamiriwa na formula:

P (D ik j) = P (D i) P (k j/D i) = P (k jP (D i/ k j). (1.1.)

Kutoka kwa usawa huu ifuatavyo formula ya Bayes:

P (D i/ k j) = P (D i) P (k i/D i)/P(k j ) (1.2.)

Ni muhimu sana kuamua maana halisi ya idadi yote iliyojumuishwa katika fomula hii.

P(D i) --uwezekano wa utambuzi D i, iliyoamuliwa kutoka kwa data ya takwimu ( uwezekano wa awali wa utambuzi) Kwa hivyo, ikiwa imechunguzwa hapo awali N vitu na N i vitu vilikuwa na hali D i, Hiyo

P(D i) = N i/N. (1.3.)

P (k j/D i k j kwa vitu vyenye hali D i.

Ikiwa kati ya N i vitu vyenye utambuzi D i,y N ij ishara ilionekana k j , basi uwezekano wa uunganisho wa Bayes

P(k j/D i) = N ij/N i. (1.4.)

P(k j) --uwezekano wa kutokea kwa ishara k j katika vitu vyote, bila kujali hali (utambuzi) wa kitu. Acha kutoka kwa jumla ya nambari N ishara ya vitu k j ilipatikana ndani N j vitu, basi

P(k j ) = N j/N. (1.5.)

Kuanzisha utambuzi, hesabu maalum P(kj ) haihitajiki. Kama itakuwa wazi kutoka kwa yafuatayo , maadili P(D i) Na P (k j / D i), inayojulikana kwa majimbo yote yanayowezekana, tambua thamani P(k j ).

Katika usawa P (D i/k j) - uwezekano wa utambuzi D i baada ya kujulikana kuwa kitu husika kina sifa k j (imani ya nyumaTutambuzi).

2 . Fomula ya jumla ya Bayes

Njia hii inatumika kwa kesi wakati uchunguzi unafanywa kulingana na seti ya ishara KWA , ikiwa ni pamoja na ishara k 1 , k 2 , ..., k v . Kila moja ya ishara k j Ina m j vyeo ( k j l, k j 2 , ..., k js, ...,). Kama matokeo ya uchunguzi, utekelezaji wa tabia hujulikana

k j * = k js (1.5.)

na mchanganyiko mzima wa ishara K*. Kielezo *, kama hapo awali, inamaanisha maana maalum (ufahamu) wa sifa. Fomula ya Bayes ya seti ya vipengele ina fomu

P(D i/ KWA * )= P(D i)P(KWA */D i)/P(KWA * )(i = 1, 2, ..., n), (1.6.)

Wapi P (D i/ KWA * ) --uwezekano wa utambuzi D i baada ya matokeo ya uchunguzi kwenye seti ya ishara kujulikana KWA , P (D i) --uwezekano wa awali wa utambuzi D i (kulingana na takwimu za awali).

Mfumo (1.6.) unatumika kwa yoyote kati ya n hali zinazowezekana (utambuzi) wa mfumo. Inachukuliwa kuwa mfumo uko katika moja tu ya majimbo yaliyoonyeshwa na kwa hivyo

Katika matatizo ya vitendo, uwezekano wa kuwepo kwa majimbo kadhaa A1, ....., Ar mara nyingi huruhusiwa, na baadhi yao yanaweza kutokea pamoja na kila mmoja.

P(KWA */ D i) = P(k 1 */ D i)P (k 2 */ k 1 * D i)...P (k v */ k l* ...k* v- 1 D i), (1.8.)

Wapi k j * = k js --kitengo cha sifa iliyofunuliwa kama matokeo ya uchunguzi. Kwa ishara huru za utambuzi

P (KWA */ D i) = P (k 1 */ D i) P (k 2 */ D i)... P (k v * / D i). (1.9.)

Katika matatizo mengi ya vitendo, hasa kwa idadi kubwa ya vipengele, inawezekana kukubali hali ya uhuru wa vipengele hata mbele ya uwiano mkubwa kati yao.

Uwezekano wa kuonekana kwa tata ya isharaKWA *

P(KWA *)= P(D s)P(KWA */D s) . (1.10.)

Fomula ya jumla ya Bayes inaweza kuandikwa kama ifuatavyo :

P(D i/ K * ) (1.11.)

Wapi P (KWA */ D i)inaamuliwa kwa usawa (1.8.) au (1.9.). Kutoka kwa uhusiano (1.11.) inafuata

P(D i/ KWA *)=l , (1.12.)

ambayo, bila shaka, inapaswa kuwa hivyo, kwa kuwa moja ya uchunguzi ni lazima kutambua, na utambuzi wa uchunguzi mbili kwa wakati mmoja hauwezekani. Ikumbukwe kwamba denominator ya formula ya Bayes kwa utambuzi woteOwito ni ule ule. Hii inakuwezesha kuamua kwanza uwezekano wa kutokea kwa pamoja e nia i utambuzi na utekelezaji huu wa seti ya vipengele

P(D iKWA *) = P(D i)P(KWA */D i) (1.13.)

na kisha uwezekano wa nyuma wa utambuzi

P (D i/KWA *) = P(D iKWA *)/P(D sKWA *). (1.14.)

Kumbuka kwamba wakati mwingine ni vyema kutumia logarithm ya awali ya formula (1.11.), kwani kujieleza (1.9.) ina bidhaa za kiasi kidogo.

Ikiwa utekelezaji wa seti fulani ya vipengele KWA * ni kuamua kwa utambuzi D uk, basi ugumu huu haufanyiki katika utambuzi mwingine:

Kisha, kwa sababu ya usawa (1.11.)

Kwa hivyo, mantiki ya kuamua ya utambuzi ni kesi maalum ya mantiki ya uwezekano. Fomula ya Bayes pia inaweza kutumika katika kesi wakati baadhi ya vipengele vina usambazaji tofauti, na sehemu nyingine ina usambazaji unaoendelea. Kwa usambazaji unaoendelea, wiani wa usambazaji hutumiwa. Hata hivyo, katika mpango wa hesabu, tofauti maalum katika sifa ni ndogo ikiwa ufafanuzi wa curve inayoendelea unafanywa kwa kutumia seti ya maadili tofauti.

3 . Matrix ya utambuzi

Kuamua uwezekano wa uchunguzi kwa kutumia njia ya Bayes, ni muhimu kuunda tumbo la uchunguzi (Jedwali 1.1), ambalo linaundwa kwa misingi ya nyenzo za awali za takwimu. Jedwali hili lina uwezekano wa kategoria za wahusika kwa utambuzi tofauti.

Jedwali 1.1

Matrix ya utambuzi katika njia ya Bayes

Utambuzi D i

Ishara k j

k 1

k 2

P(k 11 /D i)

P(k 12 /D i)

P(k 21 /D i)

P(k 22 /D i)

P(k 23 /D i)

P(k 24 /D i)

P(k 31 /D i)

P(k 32 /D i)

D 1

D 2

Ikiwa ishara ni nambari mbili (ishara rahisi "ndio - hapana"), basi kwenye meza inatosha kuonyesha uwezekano wa kuonekana kwa ishara. P(k i/D i). Uwezekano wa kukosa kipengele R ( /D,-) = 1 - P(k i/D i).

Walakini, ni rahisi zaidi kutumia fomu ya sare, ikizingatiwa, kwa mfano, kwa ishara ya nambari mbili R (k j/D i) = R (k i 1 /D i); R ( /D) = P(k i 2 /D i).

Kumbuka kwamba P(k js/Di) = 1, wapi T, -- idadi ya tarakimu za sifa k j. Jumla ya uwezekano wa utekelezaji wote unaowezekana wa kipengele ni sawa na moja.

Matrix ya uchunguzi inajumuisha uwezekano wa kipaumbele wa utambuzi. Mchakato wa kujifunza katika njia ya Bayes ni pamoja na kuunda matrix ya utambuzi. Ni muhimu kutoa uwezekano wa kufafanua meza wakati wa mchakato wa uchunguzi. Ili kufanya hivyo, sio tu maadili yanapaswa kuhifadhiwa kwenye kumbukumbu ya kompyuta P(k js/Di), lakini pia idadi ifuatayo: N -- jumla ya idadi ya vitu vilivyotumika kukusanya matrix ya uchunguzi; N i D i; N ij -- idadi ya vitu vilivyo na utambuzi D i, kuchunguzwa kwa kuzingatia k j. Ikiwa kitu kipya kilicho na utambuzi kinakuja D m, basi uwezekano wa awali wa priori wa uchunguzi hurekebishwa.

Ifuatayo, masahihisho yanaletwa kwa uwezekano wa vipengele. Acha kitu kipya na utambuzi D m kutokwa kugunduliwa r ishara k j. Kisha, kwa uchunguzi zaidi, maadili mapya ya vipindi vya uwezekano wa kipengele hukubaliwa k j juu ya utambuzi D m:

Uwezekano wa masharti ya ishara kwa uchunguzi mwingine hauhitaji marekebisho.

Hitimisho

Katika njia ya Bayes, kitu kilicho na tata ya vipengele KWA * inarejelea utambuzi wenye uwezekano wa juu zaidi (wa nyuma).

K* D i, Kama P (D i/ K *) > P (D j/ K *) (j = 1, 2,..., n; mimi? j). (1.17.)

Alama , inayotumiwa katika uchanganuzi wa kazi, ina maana ya mali ya seti. Masharti (1.17.) inaonyesha kuwa kitu kilicho na utekelezaji fulani wa changamano cha sifa KWA * au, kwa kifupi, utekelezaji KWA * ni ya utambuzi (hali) D i. Sheria (1.17.) kwa kawaida hufafanuliwa kwa kuanzisha thamani ya kizingiti kwa uwezekano wa utambuzi:

P (D i/ K *) ? P i, (1.18.)

Wapi P i. -- iliyochaguliwa mapema kiwango cha utambuzi kwa utambuzi D i. Katika kesi hii, uwezekano wa utambuzi wa karibu wa kushindana sio juu kuliko 1 - P i. Kawaida inakubaliwa P i? 0.9. Kwa kuzingatia hilo

P (D i/ K *)

i (1.19.)

uamuzi juu ya uchunguzi haujafanywa (kukataa kutambua) na maelezo ya ziada yanahitajika.

Mchakato wa kufanya maamuzi katika njia ya Bayes wakati wa kuhesabu kwenye kompyuta hutokea haraka sana. Kwa mfano, kufanya uchunguzi kwa hali 24 na ishara 80 za tarakimu nyingi huchukua dakika chache tu kwenye kompyuta na kasi ya shughuli 10 - 20,000 kwa pili.

Kama inavyoonyeshwa, njia ya Bayes ina shida kadhaa, kwa mfano, makosa katika kutambua utambuzi nadra. Katika mahesabu ya vitendo, inashauriwa kufanya utambuzi kwa kesi ya utambuzi unaowezekana, kuweka.

P (D i) = l/n (1.20.)

Kisha utambuzi utakuwa na thamani kubwa zaidi ya uwezekano wa nyuma D i, kwa ajili yake R (K* /D i) upeo:

K* D i, Kama P(K* /D i) > P (K* /D j) (j = 1, 2,..., n; mimi? j). (1.21.)

Kwa maneno mengine, utambuzi hufanywa D i ikiwa seti hii ya dalili ni ya kawaida zaidi wakati wa uchunguzi D i kuliko na utambuzi mwingine. Sheria hii ya uamuzi inalingana njia ya uwezekano mkubwa. Inafuata kutoka kwa uliopita kwamba njia hii ni kesi maalum ya njia ya Bayes na uwezekano sawa wa awali wa uchunguzi. Katika njia ya uwezekano mkubwa, uchunguzi wa "kawaida" na "nadra" una haki sawa.

Orodha ya vyanzo vilivyotumika

1. Gorelik, A. L. Mbinu za utambuzi [Nakala]: kitabu cha kiada. mwongozo wa vyuo vikuu / A. L. Gorelik, V. A. Skripkin. - M.: Juu zaidi. shule, 2004. - 261 p.

2. Sapozhnikov, V.V. Misingi ya uchunguzi wa kiufundi [Nakala]: kitabu cha maandishi. posho / V.V. Sapozhnikov, Vl. V. Sapozhnikov. - M.: Njia, 2004. - 318 p.

3. Serdakov, A. S. Udhibiti wa moja kwa moja na uchunguzi wa kiufundi [Nakala] / A. S. Serdakov. - Kyiv: Teknolojia, 1971. - 244 p.

4. Stetsyuk. A. E. "Misingi ya uchunguzi wa kiufundi. Nadharia ya kutambuliwa": kitabu cha maandishi. posho / A. E. Stetsyuk, Ya. Yu. Bobrovnikov. - Khabarovsk: Nyumba ya kuchapisha DVGUPS, 2012. - 69 p.

Iliyotumwa kwenye Allbest.ru

Nyaraka zinazofanana

    Utafiti wa algoriti za kawaida zaidi za kutatua matatizo ya asili ya uwezekano. Kufahamiana na vipengele vya combinatorics, nadharia ya urn, formula ya Bayes, mbinu za kupata tofauti, tofauti za random zinazoendelea. Kuzingatia misingi ya aljebra ya tukio.

    mwongozo wa mafunzo, umeongezwa 05/06/2010

    Uamuzi na tathmini ya uwezekano wa tukio fulani kutokea. Mbinu ya kutatua tatizo kwa kutumia nadharia ya kuongeza na kuzidisha, fomula ya jumla ya uwezekano, au Bayes. Utumiaji wa mpango wa Bernoulli katika kutatua shida. Uhesabuji wa kupotoka kwa mraba.

    kazi ya vitendo, imeongezwa 08/23/2015

    Ufafanuzi wa takwimu, axiomatic na classical wa uwezekano. Tofauti tofauti za nasibu. Punguza nadharia za Laplace na Poisson. Chaguo za kukokotoa za usambazaji wa uwezekano wa anuwai anuwai za nasibu. Fomula ya Bayes. Makadirio ya pointi ya tofauti.

    karatasi ya kudanganya, imeongezwa 05/04/2015

    Uhesabuji wa uwezekano wa kutorejeshwa kwa mkopo na taasisi ya kisheria na mtu binafsi kwa kutumia fomula ya Bayes. Uhesabuji wa tofauti za sampuli, mbinu yake, hatua kuu. Kuamua uwezekano wa mpira mweupe kuanguka kati ya mitatu iliyochukuliwa bila mpangilio, kuhalalisha matokeo.

    mtihani, umeongezwa 02/11/2014

    Utumiaji wa kanuni na sheria za nadharia ya uwezekano katika kutatua shida. Fomula ya Bayes, inayokuruhusu kubainisha uwezekano wa tukio, mradi tu tukio lingine ambalo kitakwimu linategemeana limetokea. Nadharia ya kikomo cha kati.

    kazi ya kozi, imeongezwa 11/04/2015

    Jaribio na matokeo ya nasibu. Utulivu wa takwimu. Dhana ya uwezekano. Algebra ya matukio. Kanuni ya uwili kwa matukio. Uwezekano wa masharti. Fomula za kuongeza na kuzidisha uwezekano. Fomula ya Bayes. Nafasi ya matukio ya msingi.

    muhtasari, imeongezwa 12/03/2007

    Kuamua uwezekano wa kupata angalau pointi 4 kwenye kete wakati wa kuikunja mara moja. Kuamua uwezekano wa kutoa sehemu (ikiwa sehemu iliyochukuliwa kwa nasibu na mkusanyaji iligeuka kuwa ya ubora bora) na mmea wa kwanza kwa kutumia formula ya Bayes.

    mtihani, umeongezwa 05/29/2012

    Viashiria vya kuegemea kama viashiria vya kuegemea kwa vitu visivyoweza kurekebishwa. Ufafanuzi wa classical na kijiometri wa uwezekano. Mara kwa mara ya tukio nasibu na "ufafanuzi wa takwimu" wa uwezekano. Nadharia za kuongeza na kuzidisha uwezekano.

    kazi ya kozi, imeongezwa 11/18/2011

    Tofauti tofauti tofauti na usambazaji wao. Jumla ya fomula ya uwezekano na fomula ya Bayes. Tabia za jumla za matarajio ya hisabati. Tofauti ya tofauti ya nasibu. Chaguo za kukokotoa za ugawaji wa kibadilishaji nasibu. Ufafanuzi wa classical wa uwezekano.

    mtihani, umeongezwa 12/13/2010

    Mifano ya hisabati ya matukio au michakato. Muunganisho wa njia rahisi ya kurudia. Kadirio la makosa ya nyuma. Njia ya mzunguko wa mifumo ya mstari. Udhibiti wa usahihi na ufumbuzi wa takriban ndani ya mfumo wa njia ya moja kwa moja. Njia ya kupumzika na njia ya Gauss.