Kaedah Bayesian dalam diagnostik teknikal. Kaedah pengiktirafan statistik

Sehingga kini, sebilangan besar kaedah telah dibangunkan, penggunaannya memungkinkan untuk mengenali jenis keadaan teknikal objek yang didiagnosis. Kertas ini hanya membincangkan sebahagian daripada mereka, yang paling banyak digunakan dalam amalan diagnostik.

kaedah Bayes

Kaedah diagnostik berdasarkan aplikasi formula Bayes merujuk kepada kaedah pengecaman statistik.

Kebarangkalian kejadian A, yang manakah boleh berlaku hanya apabila salah satu peristiwa tidak serasi 2 berlaku? 1? DALAM 2 ,..., Dalam p, sama dengan jumlah hasil darab kebarangkalian bagi setiap peristiwa ini dengan kebarangkalian kejadian yang sepadan A:

Formula ini dipanggil jumlah formula kebarangkalian. Akibat dari teorem pendaraban dan jumlah formula kebarangkalian ialah teori hipotesis yang dipanggil. Mari kita andaikan bahawa peristiwa itu A boleh berlaku hanya apabila salah satu peristiwa yang tidak serasi berlaku DALAM, PADA 2 , ..., Dalam p, tetapi kerana tidak diketahui terlebih dahulu yang mana antara mereka akan berlaku, ia dipanggil hipotesis. Kebarangkalian berlakunya peristiwa A ditentukan menggunakan jumlah formula kebarangkalian (1.5), dan kebarangkalian bersyarat R A (V/) mengikut formula

Menggantikan nilai R(L), kita mendapatkan

Formula (1.6) dipanggil formula Bayes. Ia membenarkan kebarangkalian hipotesis untuk dianggarkan semula selepas keputusan percubaan di mana peristiwa itu berlaku diketahui. A.

Mengenal pasti magnitud kebarangkalian bersyarat kejadian sifat adalah kunci untuk menggunakan formula Bayes untuk mendiagnosis keadaan. Pendekatan Bayesian digunakan secara meluas dalam sains kawalan, pengesanan isyarat dan teori pengecaman corak, dan diagnostik perubatan dan teknikal.

Mari kita pertimbangkan intipati kaedah berkaitan dengan tugas diagnostik. Bahagian matematik isu dibentangkan secara terperinci dalam kerja Ts3]. Semasa operasi, sebarang objek boleh berada dalam salah satu keadaan yang mungkin TVj, ...,Nj(dalam kes paling mudah - "norma", "penolakan"), yang mana hipotesis (diagnosa) Z)j,...,Z) diberikan; . Semasa operasi kemudahan, parameter (tanda) dipantau kepada, ..., kj. Kebarangkalian kehadiran bersama keadaan Z)- dan atribut dalam objek kj ditentukan

di mana Р(Dj)- kebarangkalian diagnosis DJ, ditentukan oleh data statistik:

di mana P- bilangan objek yang ditinjau;

Nj- bilangan negeri;

P(kj/Dj) kj untuk objek dengan keadaan Dj. Jika antara P objek dengan diagnosis DJ, menunjukkan tanda kj, Itu

P(cr- kebarangkalian berlakunya sesuatu tanda kj dalam semua objek, tanpa mengira keadaan (diagnosis) objek. Biarkan daripada jumlah bilangan P tanda objek kj ditemui di rij objek, kemudian

P(Dj/kj) - kebarangkalian diagnosis Z); setelah diketahui bahawa objek yang dimaksudkan mempunyai ciri Kepada-.

Formula Bayes umum digunakan untuk kes apabila tinjauan dijalankan mengikut set ciri KEPADA, termasuk tanda-tanda (ku, k p). Setiap tanda kj Ia ada rrij pangkat (, Kepada d,

kj2 , ..., kj s, ..., k jm). Hasil daripada peperiksaan, ia diketahui

pelaksanaan ciri k.-k. dan keseluruhan kompleks tanda KEPADA. dalam-

deke bermaksud maksud khusus sesuatu ciri. Formula Bayes untuk set ciri mempunyai bentuk

di mana P(Dj/A*) - kebarangkalian diagnosis? D selepas keputusan pemeriksaan berdasarkan set tanda diketahui KEPADA;

P(Dj)- kebarangkalian awal diagnosis Dj.

Diandaikan bahawa sistem hanya berada dalam satu daripada keadaan yang ditunjukkan, i.e.

Untuk menentukan kebarangkalian diagnosis menggunakan kaedah Bayes, matriks diagnostik dibentuk berdasarkan bahan statistik awal (Jadual 1.1). Bilangan baris sepadan dengan bilangan diagnosis yang mungkin. Bilangan lajur dikira sebagai hasil tambah bilangan ciri dan bilangan digit yang sepadan ditambah satu untuk kebarangkalian diagnosis terdahulu. Jadual ini mengandungi kebarangkalian kategori watak untuk pelbagai diagnosis. Jika diiktiraf

ki adalah dua digit (tanda mudah "ya - tidak"), maka dalam jadual itu sudah cukup untuk menunjukkan kebarangkalian berlakunya tanda R(k-/Dj). Kebarangkalian ciri hilang I. Lebih selesa

gunakan borang seragam, dengan mengandaikan, sebagai contoh, untuk tanda dua digit. Perlu dijelaskan bahawa , Di mana nij- bilangan digit atribut kj. Jumlah kebarangkalian semua kemungkinan pelaksanaan atribut adalah sama dengan satu. Peraturan keputusan adalah peraturan mengikut mana keputusan mengenai diagnosis dibuat. Dalam kaedah Bayes, objek dengan ciri yang kompleks kaki merujuk kepada diagnosis dengan kebarangkalian tertinggi (posterior). ft e Dj, Jika P(Dj/lt) >

> P(Dj/kaki) (J - 1, 2, ..., n i * j). Peraturan ini biasanya diperhalusi dengan memperkenalkan nilai ambang untuk kebarangkalian diagnosis P(Dj/ft) >

>Pj, di mana Pj- tahap pengecaman yang telah dipilih untuk diagnosis Dj. Dalam kes ini, kebarangkalian diagnosis bersaing terdekat tidak lebih tinggi daripada 1 - Pj. Biasanya diterima P ( > 0.9. Memandangkan itu PiD/t?) keputusan mengenai diagnosis tidak dibuat dan maklumat tambahan diperlukan.

Jadual 1.1

Matriks diagnostik dalam kaedah Bayes

Tanda kj

R(k 12 /

R(k 22 /

R(k p /

Contoh. Sebuah lokomotif diesel sedang dalam pengawasan. Dalam kes ini, dua tanda diperiksa: Kepada- peningkatan penggunaan bahan api diesel setiap jam pada kedudukan nominal pengawal pemandu sebanyak lebih daripada 10% daripada nilai undian, kepada 2- pengurangan kuasa penjana diesel yang ditetapkan pada kedudukan nominal pengawal pemandu dengan lebih daripada 15% daripada nilai undian. Mari kita anggap bahawa penampilan tanda-tanda ini dikaitkan sama ada dengan peningkatan haus bahagian kumpulan omboh silinder (diagnosis /)]), atau dengan kerosakan peralatan bahan api (diagnosis D 2). Jika enjin diesel dalam keadaan baik (diagnosis D 3) tanda Kepada tidak diperhatikan, tetapi tanda kepada 2 diperhatikan dalam 7% kes. Menurut data statistik, telah ditetapkan bahawa 60% enjin yang didiagnosis dengan Z) 3 diubah suai sebelum pembaikan yang dijadualkan. D 2- 30%, dengan diagnosis Z)j - 10%. Ia juga didapati bahawa tanda Kepada j di negeri Z)| berlaku dalam 10%, dan dalam keadaan D 2 - dalam 40% kes; tanda kepada 2 di bawah negeri Z)| berlaku dalam 15%, dan dalam keadaan D 2- dalam 20% kes. Kami membentangkan maklumat awal dalam bentuk jadual. 1.2.

Jadual 1.2

Kebarangkalian keadaan dan manifestasi gejala

R(k 2 / A)

Mari kita hitung kebarangkalian keadaan untuk pelbagai pilihan pelaksanaan ciri terkawal:

1. Tanda-tanda Kepada Dan kepada 2 didapati, maka:

2. Tanda Kepada dikesan, tanda kepada 2 tidak hadir.

Ketiadaan tanda k i bermaksud kehadiran tanda Kepada.(peristiwa yang bertentangan), dan P(k./D.)-- P(k./D.).

3. Tanda tangan Kepada 2 dikesan, tanda Kepada tidak hadir:

4. Tanda /:| Dan kepada 2 hilang:

Analisis hasil pengiraan yang diperoleh membolehkan kami membuat kesimpulan berikut:

  • 1. Kehadiran dua tanda k dan k 2 s kebarangkalian 0.942 menunjukkan keadaan DJ
  • 2. Kehadiran tanda Kepada dengan kebarangkalian 0.919 menunjukkan keadaan D 2(kerosakan peralatan bahan api).
  • 3. Kehadiran tanda kepada 2 dengan kebarangkalian 0.394 menunjukkan keadaan D 2(kerosakan peralatan bahan api) dan dengan kebarangkalian 0.459 tentang keadaan Z) 3 (keadaan yang betul). Dengan nisbah kebarangkalian sedemikian, membuat keputusan adalah sukar, jadi peperiksaan tambahan diperlukan.
  • 4. Ketiadaan kedua-dua tanda dengan kebarangkalian 0.717 menunjukkan keadaan yang baik (Z) 3).
Pada masa ini, kaedah Bayesian telah menjadi agak meluas dan digunakan secara aktif dalam pelbagai bidang ilmu. Walau bagaimanapun, malangnya, tidak ramai orang mempunyai idea tentang apa itu dan mengapa ia diperlukan. Salah satu sebabnya ialah kekurangan sejumlah besar kesusasteraan dalam bahasa Rusia. Oleh itu, di sini saya akan cuba membentangkan prinsip mereka semudah mungkin, bermula dari yang paling asas (saya minta maaf jika ini nampak terlalu mudah bagi sesetengah pihak).

Pada masa akan datang, saya ingin beralih kepada analisis Bayesian sendiri dan bercakap tentang pemprosesan data sebenar dan tentang, pada pendapat saya, alternatif yang sangat baik untuk bahasa R (sedikit telah ditulis mengenainya) - Python dengan pymc modul. Secara peribadi, saya mendapati Python lebih jelas dan lebih logik daripada R dengan pakej dan BUGS, dan Python memberikan lebih banyak lagi O kebebasan dan fleksibiliti yang lebih besar (walaupun Python mempunyai kesukarannya sendiri, ia boleh diatasi, dan ia tidak sering ditemui dalam analisis mudah).

Sedikit sejarah

Sebagai nota sejarah ringkas, saya akan mengatakan bahawa formula Bayes telah diterbitkan pada tahun 1763, 2 tahun selepas kematian pengarangnya, Thomas Bayes. Walau bagaimanapun, kaedah menggunakannya menjadi benar-benar meluas hanya menjelang akhir abad kedua puluh. Ini dijelaskan oleh fakta bahawa pengiraan memerlukan kos pengiraan tertentu, dan ia menjadi mungkin hanya dengan perkembangan teknologi maklumat.

Mengenai kebarangkalian dan teorem Bayes

Formula Bayes dan segala-galanya yang berikut memerlukan pemahaman tentang kebarangkalian. Anda boleh membaca lebih lanjut tentang kebarangkalian di Wikipedia.
Dalam amalan, kebarangkalian sesuatu peristiwa berlaku ialah kekerapan kejadian peristiwa ini, iaitu nisbah bilangan cerapan peristiwa itu kepada jumlah bilangan cerapan untuk jumlah bilangan cerapan yang besar (tidak terhingga secara teori).
Pertimbangkan percubaan berikut: kami memanggil sebarang nombor daripada segmen dan melihat bahawa nombor ini berada di antara, sebagai contoh, 0.1 dan 0.4. Seperti yang anda fikirkan, kebarangkalian peristiwa ini akan sama dengan nisbah panjang segmen kepada jumlah panjang segmen (dengan kata lain, nisbah "bilangan" kemungkinan nilai yang sama kemungkinan kepada jumlah "bilangan" nilai), iaitu (0.4 - 0.1) / (1 - 0) = 0.3 , iaitu, kebarangkalian untuk masuk ke segmen ialah 30%.

Sekarang mari kita lihat kuasa dua x.

Katakan kita perlu menamakan pasangan nombor (x, y), yang setiap satunya lebih besar daripada sifar dan kurang daripada satu. Kebarangkalian bahawa x (nombor pertama) akan berada dalam segmen (ditunjukkan dalam rajah pertama sebagai kawasan biru, pada masa ini nombor kedua y tidak penting untuk kita) adalah sama dengan nisbah luas kawasan itu. kawasan biru ke kawasan seluruh persegi, iaitu (0.4 - 0.1 ) * (1 - 0) / (1 * 1) = 0.3, iaitu 30%. Oleh itu kita boleh menulis bahawa kebarangkalian bahawa x tergolong dalam segmen itu ialah p(0.1<= x <= 0.4) = 0.3 или для краткости p(X) = 0.3.
Jika kita sekarang melihat y, maka begitu juga, kebarangkalian bahawa y berada di dalam segmen adalah sama dengan nisbah luas kawasan hijau dengan luas keseluruhan persegi p(0.5<= y <= 0.7) = 0.2, или для краткости p(Y) = 0.2.
Sekarang mari kita lihat apa yang boleh kita pelajari tentang nilai kedua-dua x dan y.
Jika kita ingin mengetahui apakah kebarangkalian bahawa x dan y berada secara serentak dalam segmen yang diberikan sepadan, maka kita perlu mengira nisbah kawasan gelap (persimpangan kawasan hijau dan biru) dengan luas keseluruhan segi empat sama: p(X, Y) = (0.4 - 0.1 ) * (0.7 - 0.5) / (1 * 1) = 0.06.

Sekarang katakan kita ingin tahu apakah kebarangkalian bahawa y berada dalam selang jika x sudah berada dalam selang. Iaitu, sebenarnya, kita mempunyai penapis dan apabila kita menamakan pasangan (x, y), kita segera membuang pasangan yang tidak memenuhi syarat x berada dalam selang tertentu, dan kemudian daripada pasangan yang ditapis kita mengira pasangan itu untuk yang y memenuhi keadaan kami dan menganggap kebarangkalian sebagai nisbah bilangan pasangan yang mana y terletak pada segmen yang disebut di atas kepada jumlah bilangan pasangan yang ditapis (iaitu, yang mana x terletak pada segmen itu). Kita boleh menulis kebarangkalian ini sebagai p(Y|X). Jelas sekali, kebarangkalian ini adalah sama dengan nisbah kawasan kawasan gelap (persimpangan kawasan hijau dan biru) dengan kawasan kawasan biru. Luas kawasan gelap ialah (0.4 - 0.1) * (0.7 - 0.5) = 0.06, dan kawasan biru ialah (0.4 - 0.1) * (1 - 0) = 0.3, maka nisbahnya ialah 0.06 / 0.3 = 0.2. Dengan kata lain, kebarangkalian mencari y pada segmen memandangkan x sudah tergolong dalam segmen itu ialah p(Y|X) = 0.2.
Perlu diingatkan bahawa dengan mengambil kira semua notasi di atas dan semua notasi di atas, kita boleh menulis ungkapan berikut
p(Y|X) = p(X, Y) / p(X)

Mari kita hasilkan semula secara ringkas semua logik sebelumnya sekarang berhubung dengan p(X|Y): kita namakan pasangan (x, y) dan tapis pasangan yang mana y terletak di antara 0.5 dan 0.7, maka kebarangkalian bahawa x berada dalam selang dengan syarat bahawa y tergolong dalam segmen adalah sama dengan nisbah kawasan kawasan gelap kepada kawasan hijau:
p(X|Y) = p(X, Y) / p(Y)

Dalam dua formula di atas, kita melihat bahawa istilah p(X, Y) adalah sama, dan kita boleh menghapuskannya:

Kita boleh menulis semula persamaan terakhir sebagai

Ini adalah teorem Bayes.
Menarik juga untuk diperhatikan bahawa p(Y) sebenarnya adalah p(X,Y) untuk semua nilai X. Iaitu, jika kita mengambil kawasan gelap dan meregangkannya supaya ia meliputi semua nilai X, ia betul-betul mengikut kawasan hijau , yang bermaksud ia akan sama dengan p(Y). Dalam bahasa matematik ini bermakna yang berikut:
Kemudian kita boleh menulis semula formula Bayes seperti berikut:

Penggunaan Teorem Bayes

Mari kita lihat contoh berikut. Ambil syiling dan balikkan 3 kali. Dengan kebarangkalian yang sama kita boleh mendapatkan keputusan berikut (O - kepala, P - ekor): OOO, OOR, ORO, ORR, ROO, ROR, RPO, RRR.

Kita boleh mengira berapa banyak kepala yang muncul dalam setiap kes dan berapa kali terdapat perubahan kepala-ekor, ekor-kepala:

Kita boleh menganggap bilangan kepala dan bilangan perubahan sebagai dua pembolehubah rawak. Kemudian jadual kebarangkalian akan kelihatan seperti ini:

Sekarang kita boleh melihat formula Bayes dalam tindakan.
Tetapi pertama, mari kita lukiskan analogi dengan segi empat sama yang kita lihat tadi.
Anda boleh perhatikan bahawa p(1O) ialah jumlah lajur ketiga ("kawasan biru" segi empat sama) dan sama dengan jumlah semua nilai sel dalam lajur ini: p(1O) = 2/8 + 1/8 = 3/8
p(1С) ialah jumlah baris ketiga ("kawasan hijau" segi empat sama) dan, begitu juga, adalah sama dengan jumlah semua nilai sel dalam baris ini p(1С) = 2/8 + 2/ 8 = 4/8
Kebarangkalian bahawa kita mendapat satu kepala dan satu perubahan adalah sama dengan persilangan kawasan ini (iaitu, nilai dalam sel persilangan lajur ketiga dan baris ketiga) p(1C, 1O) = 2/8
Kemudian, mengikut formula yang diterangkan di atas, kita boleh mengira kebarangkalian mendapat satu perubahan jika kita mendapat satu kepala dalam tiga lontaran:
p(1C|1O) = p(1C, 1O) / p(1O) = (2/8) / (3/8) = 2/3
atau kebarangkalian mendapat satu kepala jika kita mendapat satu perubahan:
p(1O|1C) = p(1C, 1O) / p(1C) = (2/8) / (4/8) = 1/2
Jika kita mengira kebarangkalian mendapat satu perubahan jika terdapat satu kepala p(1O|1C) melalui formula Bayes, kita dapat:
p(1O|1C) = p(1C|1O) * p(1O) / p(1C) = (2/3) * (3/8) / (4/8) = 1/2
Itu yang kami dapat di atas.

Tetapi apakah kepentingan praktikal contoh di atas?
Hakikatnya ialah apabila kami menganalisis data sebenar, kami biasanya berminat dengan beberapa parameter data ini (contohnya, min, varians, dll.). Kemudian kita boleh melukis analogi berikut dengan jadual kebarangkalian di atas: biarkan baris menjadi data eksperimen kami (mari kita nyatakan mereka Data), dan lajur ialah nilai kemungkinan parameter data ini yang menarik minat kita (mari kita nyatakan ia ). Kemudian kami berminat dengan kebarangkalian untuk mendapatkan nilai parameter tertentu berdasarkan data yang ada.
Kita boleh menggunakan formula Bayes dan menulis yang berikut:

Dan mengingati formula dengan integral, kita boleh menulis yang berikut:

Iaitu, sebenarnya, sebagai hasil analisis kami, kami mempunyai kebarangkalian sebagai fungsi parameter. Sekarang kita boleh, sebagai contoh, memaksimumkan fungsi ini dan mencari nilai parameter yang paling berkemungkinan, mengira serakan dan nilai purata parameter, mengira sempadan segmen di mana parameter yang kita minati terletak dengan kebarangkalian 95 %, dan lain-lain.

Kebarangkalian itu dipanggil kebarangkalian posterior. Dan untuk mengiranya kita perlu ada
- fungsi kemungkinan dan - kebarangkalian terdahulu.
Fungsi kemungkinan ditentukan oleh model kami. Iaitu, kami mencipta model pengumpulan data yang bergantung pada parameter yang diminati oleh kami. Sebagai contoh, kami ingin menginterpolasi data menggunakan garis lurus y = a * x + b (oleh itu kami menganggap bahawa semua data mempunyai hubungan linear dengan hingar Gaussian yang ditindih padanya dengan varians yang diketahui). Kemudian a dan b ialah parameter kami, dan kami ingin mengetahui nilai kemungkinan besarnya, dan fungsi kemungkinan ialah Gaussian dengan min yang diberikan oleh persamaan garis dan varians yang diberikan.
Kebarangkalian terdahulu termasuk maklumat yang kita ketahui sebelum melakukan analisis. Sebagai contoh, kita tahu dengan pasti bahawa garis mesti mempunyai cerun positif, atau nilai pada pintasan-x mestilah positif - semua ini dan banyak lagi yang boleh kita masukkan ke dalam analisis kita.
Seperti yang anda lihat, penyebut pecahan ialah kamiran (atau dalam kes di mana parameter hanya boleh mengambil nilai diskret tertentu, jumlah) pengangka ke atas semua nilai parameter yang mungkin. Dalam amalan, ini bermakna penyebut adalah pemalar dan berfungsi untuk menormalkan kebarangkalian posterior (iaitu, kamiran kebarangkalian posterior adalah sama dengan satu).

Dengan ini saya ingin menamatkan catatan saya (bersambung

KAEDAH ANALISIS BERURUTAN

KAEDAH BAYES

Rangka kuliah

Analisis dan penyemakan kerja rumah

mengatur masa.

Kemajuan kuliah.

Kuliah 9

Subjek. KAEDAH PENGIKTIRAFAN STATISTIK

Sasaran. Berikan konsep pengecaman isyarat digital.

1. Pendidikan. Terangkan proses pengecaman isyarat digital.

2. Perkembangan. Membangunkan pemikiran logik dan pandangan alam semula jadi - saintifik.

3. Pendidikan. Memupuk minat dalam pencapaian saintifik dan penemuan dalam industri telekomunikasi.

Hubungan antara disiplin:

· Menyokong: sains komputer, matematik, teknologi komputer dan MP, sistem pengaturcaraan.

· Disediakan: Internship

Sokongan metodologi dan peralatan:

1. Pembangunan metodologi untuk pelajaran.

2. Kurikulum.

3. Kurikulum

4. Program kerja.

5. Taklimat keselamatan.

Bahan bantu mengajar teknikal: komputer peribadi.

Menyediakan pekerjaan:

· Buku kerja

3. Jawab soalan:

1. Apakah perbezaan antara isyarat digital dan isyarat analog?

2. Apakah kelas rajah yang digunakan semasa membuat pengukuran?

3. Berikan penerangan ringkas tentang setiap kelas.

4. Apakah yang digunakan untuk membina gambar rajah mata?

5. Terangkan intipati gambarajah mata.

· Asas kaedah

  • Formula umum Bayes.

· Matriks diagnostik.

Peraturan yang tegas

· Asas kaedah.

· Prosedur am kaedah.

· Sambungan sempadan keputusan dengan kebarangkalian kesilapan jenis pertama dan kedua.

Kelebihan utama kaedah pengiktirafan statistik ialah keupayaan untuk secara serentak mengambil kira tanda-tanda sifat fizikal yang berbeza, kerana ia dicirikan oleh kuantiti tanpa dimensi - kebarangkalian kejadiannya di bawah keadaan sistem yang berbeza..

Antara kaedah diagnostik teknikal ialah kaedah berdasarkan formula umum Bayes ( Teorem Bayes (atau formula Bayes) ialah salah satu teorem utama teori kebarangkalian, yang membolehkan anda menentukan kebarangkalian sesuatu peristiwa (hipotesis) telah berlaku dengan kehadiran hanya bukti tidak langsung (data), yang mungkin tidak tepat. ), memegang tempat yang istimewa kerana kesederhanaan dan kecekapannya.

Kaedah Bayes mempunyai kelemahan:sejumlah besar maklumat awal, "penindasan" diagnosis yang jarang berlaku, dll. Walau bagaimanapun, dalam kes di mana jumlah data statistik membenarkan penggunaan kaedah Bayes, adalah dinasihatkan untuk menggunakannya sebagai salah satu kaedah yang paling boleh dipercayai dan berkesan.

Asas kaedah. Kaedah ini berdasarkan formula Bayes yang mudah. Sekiranya terdapat diagnosis D i dan tanda mudah ki , berlaku dengan diagnosis ini, maka kebarangkalian kejadian bersama kejadian (kehadiran keadaan Di dalam objek dan tanda ki )



Daripada persamaan ini mengikut formula Bayes

(3.2)

Adalah sangat penting untuk menentukan makna yang tepat bagi semua kuantiti yang termasuk dalam formula ini.

P(Di) - kebarangkalian terdahulu bagi hipotesis D

P(ki/Di) - kebarangkalian hipotesis ki apabila berlakunya peristiwa D (kebarangkalian posterior - kebarangkalian kejadian rawak, dengan syarat data posterior diketahui, iaitu diperoleh selepas eksperimen.)

P(ki) - jumlah kebarangkalian kejadian ki

P(Di/ki) - kebarangkalian berlakunya peristiwa Di jika hipotesis ki adalah benar

P(D) - kebarangkalian diagnosis D, ditentukan oleh data statistik (kebarangkalian diagnosis terdahulu). Jadi, jika diteliti sebelum ini N objek dan W,-objek mempunyai keadaan D, kemudian

P(D i) = N i /N.(3.3)

P (kj/Di) - kebarangkalian berlakunya ciri k j; untuk objek dengan keadaan Di. Jika antara Ni, objek yang didiagnosis dengan Di, N ij satu tanda muncul k j Itu

(3.4)

P (kj) - kebarangkalian berlakunya sesuatu tanda kj dalam semua objek, tanpa mengira keadaan (diagnosis) objek. Biarkan daripada jumlah bilangan N tanda objek kepada ) ditemui di Nj objek, kemudian

(3.5)

Dalam kesamarataan (3.2) R ( Di/kj)- kebarangkalian diagnosis D selepas diketahui bahawa objek berkenaan mempunyai ciri kj (kebarangkalian diagnosis posterior ).

pengenalan

Kaedah Bayes merujuk kepada kaedah pengiktirafan statistik, kelebihan utamanya ialah keupayaan untuk mengambil kira ciri-ciri sifat fizikal yang berbeza secara serentak. Ini disebabkan oleh fakta bahawa semua tanda dicirikan oleh kuantiti tanpa dimensi - kebarangkalian kejadiannya di bawah keadaan sistem yang berbeza.

Kaedah Bayes, kerana kesederhanaan dan kecekapannya, menduduki tempat yang istimewa di kalangan kaedah diagnostik teknikal, walaupun ia juga mempunyai kelemahan, contohnya, sejumlah besar maklumat awal, "penindasan" diagnosis yang jarang berlaku, dll. Walau bagaimanapun, dalam kes di mana jumlah maklumat statistik membolehkan penggunaan kaedah Bayes, adalah dinasihatkan digunakan sebagai salah satu kaedah yang paling boleh dipercayai dan berkesan.

Asas Kaedah Bayes

Kaedah ini berdasarkan formula Bayes (formula untuk kebarangkalian hipotesis).

Sekiranya terdapat diagnosis D i dan tanda mudah k j , berlaku dengan diagnosis ini, maka kebarangkalian kejadian bersama kejadian (kehadiran keadaan dalam objek D i dan tandatangan k j), ditentukan oleh formula:

P(D i k j ) = P(D i ) P (k j /D i ) = P (k j ) P (D i / k j ). (1.1.)

Daripada kesamarataan ini mengikut formula Bayes:

P(D i / k j ) = P(D i ) P(k i /D i )/P(k j ) (1.2.)

Adalah sangat penting untuk menentukan makna yang tepat bagi semua kuantiti yang termasuk dalam formula ini.

P(D i) --kebarangkalian diagnosis D i, ditentukan daripada data statistik ( kebarangkalian diagnosis terdahulu). Jadi, jika diteliti sebelum ini N objek dan N i objek mempunyai keadaan D i, Itu

P(D i) = N i /N. (1.3.)

P (k j /D i k j untuk objek dengan keadaan D i .

Jika antara N i objek dengan diagnosis D i, y N ij satu tanda muncul k j , maka kebarangkalian korelasi Bayes

P(k j /D i) = N ij /N i . (1.4.)

P(k j) --kebarangkalian berlakunya sesuatu tanda k j dalam semua objek, tanpa mengira keadaan (diagnosis) objek. Biarkan daripada jumlah bilangan N tanda objek k j ditemui di N j objek, kemudian

P(k j ) = N j /N. (1.5.)

Untuk menubuhkan diagnosis, pengiraan khas P(kj) tidak dikehendaki. Seperti yang akan jelas dari apa yang berikut, maksudnya P(D i)Dan P (k j /D i), dikenali untuk semua keadaan yang mungkin, tentukan nilainya P(k j ).

Dalam kesamarataan P (D i /k j)--kebarangkalian diagnosis D i setelah diketahui bahawa objek yang dimaksudkan mempunyai ciri k j (kebarangkalian diagnosis belakang).

Hantar kerja baik anda di pangkalan pengetahuan adalah mudah. Gunakan borang di bawah

Pelajar, pelajar siswazah, saintis muda yang menggunakan asas pengetahuan dalam pengajian dan kerja mereka akan sangat berterima kasih kepada anda.

Disiarkan pada http://www.allbest.ru/

pengenalan

Kaedah Bayes merujuk kepada kaedah pengiktirafan statistik, kelebihan utamanya ialah keupayaan untuk mengambil kira ciri-ciri sifat fizikal yang berbeza secara serentak. Ini disebabkan oleh fakta bahawa semua tanda dicirikan oleh kuantiti tanpa dimensi - kebarangkalian kejadiannya di bawah keadaan sistem yang berbeza.

Kaedah Bayes, kerana kesederhanaan dan kecekapannya, menduduki tempat yang istimewa di kalangan kaedah diagnostik teknikal, walaupun ia juga mempunyai kelemahan, contohnya, sejumlah besar maklumat awal, "penindasan" diagnosis yang jarang berlaku, dll. Walau bagaimanapun, dalam kes di mana jumlah maklumat statistik membolehkan penggunaan kaedah Bayes, adalah dinasihatkan digunakan sebagai salah satu kaedah yang paling boleh dipercayai dan berkesan.

1. Asas Kaedah Bayes

Kaedah ini berdasarkan formula Bayes (formula untuk kebarangkalian hipotesis).

Sekiranya terdapat diagnosis D i dan tanda mudah k j , berlaku dengan diagnosis ini, maka kebarangkalian kejadian bersama kejadian (kehadiran keadaan dalam objek D i dan tandatangan k j), ditentukan oleh formula:

P(D ik j) = P(D i) P (k j/D i) = P (k j) P (D i/ k j). (1.1.)

Daripada kesamarataan ini mengikut formula Bayes:

P(D i/ k j) = P(D i) P(k i/D i)/P(k j ) (1.2.)

Adalah sangat penting untuk menentukan makna yang tepat bagi semua kuantiti yang termasuk dalam formula ini.

P(D i) --kebarangkalian diagnosis D i, ditentukan daripada data statistik ( kebarangkalian diagnosis terdahulu). Jadi, jika diteliti sebelum ini N objek dan N i objek mempunyai keadaan D i, Itu

P(D i) = N i/N. (1.3.)

P (k j/D i k j untuk objek dengan keadaan D i.

Jika antara N i objek dengan diagnosis D i, y N ij satu tanda muncul k j , maka kebarangkalian korelasi Bayes

P(k j/D i) = N ij/N i. (1.4.)

P(k j) --kebarangkalian berlakunya sesuatu tanda k j dalam semua objek, tanpa mengira keadaan (diagnosis) objek. Biarkan daripada jumlah bilangan N tanda objek k j ditemui di N j objek, kemudian

P(k j ) = N j/N. (1.5.)

Untuk menubuhkan diagnosis, pengiraan khas P(kj ) tidak dikehendaki. Seperti yang akan jelas daripada apa yang berikut , nilai P(D i)Dan P (k j / D i), diketahui untuk semua keadaan yang mungkin, tentukan nilainya P(k j ).

Dalam kesamarataan P (D i/k j)--kebarangkalian diagnosis D i setelah diketahui bahawa objek yang dimaksudkan mempunyai ciri k j (kepercayaan posteriorTdiagnosis).

2 . Formula umum Bayes

Formula ini terpakai kepada kes apabila peperiksaan dijalankan mengikut satu set tanda KEPADA , termasuk tanda-tanda k 1 , k 2 , ..., k v . Setiap tanda k j Ia ada m j pangkat ( k j l, k j 2 , ..., k js, ...,). Hasil daripada peperiksaan, pelaksanaan ciri tersebut diketahui

k j * = k js (1.5.)

dan keseluruhan kompleks tanda K*. Indeks *, seperti sebelumnya, bermaksud makna khusus (realisasi) sifat. Formula Bayes untuk set ciri mempunyai bentuk

P(D i/ KEPADA * )= P(D i)P(KEPADA */D i)/P(KEPADA * )(i = 1, 2, ..., n), (1.6.)

di mana P (D i/ KEPADA * ) --kebarangkalian diagnosis D i selepas keputusan peperiksaan pada satu set tanda diketahui KEPADA , P (D i) --kebarangkalian awal diagnosis D i (mengikut perangkaan sebelum ini).

Formula (1.6.) terpakai kepada mana-mana n kemungkinan keadaan (diagnosa) sistem. Diandaikan bahawa sistem hanya berada dalam satu daripada keadaan yang ditunjukkan dan oleh itu

Dalam masalah praktikal, kemungkinan kewujudan beberapa keadaan A1, ....., Ar sering dibenarkan, dan sebahagian daripadanya boleh berlaku dalam kombinasi antara satu sama lain.

P(KEPADA */ D i) = P(k 1 */ D i)P (k 2 */ k 1 * D i)...P (k v */ k l* ...k* v- 1 D i), (1.8.)

di mana k j * = k js --kategori atribut yang didedahkan hasil daripada peperiksaan. Untuk tanda bebas diagnostik

P (KEPADA */ D i) = P (k 1 */ D i) P (k 2 */ D i)... P (k v * / D i). (1.9.)

Dalam kebanyakan masalah praktikal, terutamanya dengan sejumlah besar ciri, adalah mungkin untuk menerima syarat kebebasan ciri walaupun dengan adanya korelasi yang ketara di antara mereka.

Kebarangkalian kemunculan kompleks tandaKEPADA *

P(KEPADA *)= P(D s)P(KEPADA */D s) . (1.10.)

Formula umum Bayes boleh ditulis seperti berikut :

P(D i/ K * ) (1.11.)

di mana P (KEPADA */ D i)ditentukan oleh kesaksamaan (1.8.) atau (1.9.). Daripada hubungan (1.11.) ia berikut

P(D i/ KEPADA *)=l , (1.12.)

yang, sudah tentu, harus berlaku, kerana salah satu diagnosis semestinya direalisasikan, dan merealisasikan dua diagnosis pada masa yang sama adalah mustahil. Sila ambil perhatian bahawa penyebut formula Bayes untuk semua diagnostikOpanggilan adalah sama. Ini membolehkan anda menentukan terlebih dahulu kebarangkalian berlaku bersama e nia i diagnosis ke dan pelaksanaan satu set ciri ini

P(D iKEPADA *) = P(D i)P(KEPADA */D i) (1.13.)

dan kemudian kebarangkalian diagnosis belakang

P (D i/KEPADA *) = P(D iKEPADA *)/P(D sKEPADA *). (1.14.)

Ambil perhatian bahawa kadangkala adalah dinasihatkan untuk menggunakan logaritma awal formula (1.11.), kerana ungkapan (1.9.) mengandungi produk dalam kuantiti yang kecil.

Jika pelaksanaan set ciri tertentu KEPADA * ialah menentukan untuk diagnosis D hlm, maka kompleks ini tidak berlaku dalam diagnosis lain:

Kemudian, berdasarkan persamaan (1.11.)

Oleh itu, logik deterministik diagnosis adalah kes khas logik probabilistik. Formula Bayes juga boleh digunakan dalam kes apabila sesetengah ciri mempunyai taburan diskret, dan bahagian lain mempunyai taburan berterusan. Untuk pengedaran berterusan, ketumpatan pengedaran digunakan. Walau bagaimanapun, dalam pelan pengiraan, perbezaan ciri yang ditentukan adalah tidak ketara jika takrifan lengkung berterusan dijalankan menggunakan set nilai diskret.

3 . Matriks diagnostik

Untuk menentukan kebarangkalian diagnosis menggunakan kaedah Bayes, adalah perlu untuk mencipta matriks diagnostik (Jadual 1.1), yang dibentuk berdasarkan bahan statistik awal. Jadual ini mengandungi kebarangkalian kategori watak untuk pelbagai diagnosis.

Jadual 1.1

Matriks diagnostik dalam kaedah Bayes

Diagnosis D i

Tanda k j

k 1

k 2

P(k 11 /D i)

P(k 12 /D i)

P(k 21 /D i)

P(k 22 /D i)

P(k 23 /D i)

P(k 24 /D i)

P(k 31 /D i)

P(k 32 /D i)

D 1

D 2

Jika tanda-tanda adalah dua digit (tanda mudah "ya - tidak"), maka dalam jadual itu sudah cukup untuk menunjukkan kebarangkalian tanda itu muncul P(k i/D i). Kebarangkalian ciri hilang R ( /D,-) = 1 - P(k i/D i).

Walau bagaimanapun, adalah lebih mudah untuk menggunakan bentuk seragam, dengan mengandaikan, sebagai contoh, untuk tanda dua digit R (k j/D i) = R (k i 1 /D i); R ( /D,) = P(k i 2 /D i).

Perhatikan bahawa P(k js/Di) = 1, di mana T, -- bilangan digit atribut k j. Jumlah kebarangkalian semua kemungkinan pelaksanaan atribut adalah sama dengan satu.

Matriks diagnostik termasuk kebarangkalian priori diagnosis. Proses pembelajaran dalam kaedah Bayes terdiri daripada membentuk matriks diagnostik. Adalah penting untuk menyediakan kemungkinan untuk menjelaskan jadual semasa proses diagnostik. Untuk melakukan ini, bukan sahaja nilai harus disimpan dalam memori komputer P(k js/Di), tetapi juga kuantiti berikut: N -- jumlah bilangan objek yang digunakan untuk menyusun matriks diagnostik; N i D i; N ij -- bilangan objek dengan diagnosis D i, diperiksa berdasarkan k j. Jika objek baru dengan diagnosis tiba D m, maka kebarangkalian a priori sebelumnya bagi diagnosis diselaraskan.

Seterusnya, pembetulan diperkenalkan kepada kebarangkalian ciri. Biarkan objek baru dengan diagnosis D m pelepasan dikesan r tanda k j. Kemudian, untuk diagnostik lanjut, nilai baharu selang kebarangkalian ciri tersebut diterima k j selepas diagnosis D m:

Kebarangkalian bersyarat tanda untuk diagnosis lain tidak memerlukan pelarasan.

Kesimpulan

Dalam kaedah Bayes, objek dengan ciri yang kompleks KEPADA * merujuk kepada diagnosis dengan kebarangkalian tertinggi (posterior).

K* D i, Jika P(D i/ K *) > P(D j/ K *) (j = 1, 2,..., n; saya? j). (1.17.)

Simbol , digunakan dalam analisis fungsian, bermakna kepunyaan set. Keadaan (1.17.) menunjukkan bahawa objek yang mempunyai pelaksanaan tertentu ciri kompleks KEPADA * atau secara ringkasnya, pelaksanaan KEPADA * tergolong dalam diagnosis (keadaan) D i. Peraturan (1.17.) biasanya dijelaskan dengan memperkenalkan nilai ambang untuk kebarangkalian diagnosis:

P(D i/ K *) ? P i, (1.18.)

di mana P i. -- pra-pilihan tahap pengiktirafan untuk diagnosis D i. Dalam kes ini, kebarangkalian diagnosis bersaing terdekat tidak lebih tinggi daripada 1 - P i. Biasanya diterima P i? 0.9. Memandangkan itu

P(D i/ K *)

i (1.19.)

keputusan mengenai diagnosis tidak dibuat (enggan mengenali) dan maklumat tambahan diperlukan.

Proses membuat keputusan dalam kaedah Bayes apabila mengira pada komputer berlaku agak cepat. Sebagai contoh, membuat diagnosis untuk 24 keadaan dengan 80 tanda berbilang digit hanya mengambil masa beberapa minit pada komputer dengan kelajuan 10 - 20 ribu operasi sesaat.

Seperti yang ditunjukkan, kaedah Bayes mempunyai beberapa kelemahan, contohnya, kesilapan dalam mengenali diagnosis yang jarang berlaku. Dalam pengiraan praktikal, adalah dinasihatkan untuk menjalankan diagnostik untuk kes diagnosis yang sama kemungkinan, meletakkan

P(D i) = l/n (1.20.)

Kemudian diagnosis akan mempunyai nilai kebarangkalian posterior terbesar D i, untuk yang mana R (K* /D i) maksimum:

K* D i, Jika P(K* /D i) > P(K* /D j) (j = 1, 2,..., n; saya? j). (1.21.)

Dalam erti kata lain, diagnosis dibuat D i jika set simptom ini lebih biasa semasa diagnosis D i berbanding dengan diagnosis lain. Peraturan keputusan ini sepadan kaedah kemungkinan maksimum. Ia berikutan daripada sebelumnya bahawa kaedah ini adalah kes khas kaedah Bayes dengan kebarangkalian diagnosis terdahulu yang sama. Dalam kaedah kemungkinan maksimum, diagnosis "biasa" dan "jarang" mempunyai hak yang sama.

Senarai sumber yang digunakan

1. Gorelik, A. L. Kaedah pengecaman [Teks]: buku teks. manual untuk universiti / A. L. Gorelik, V. A. Skripkin. - M.: Lebih tinggi. sekolah, 2004. - 261 p.

2. Sapozhnikov, V.V. Asas diagnostik teknikal [Teks]: buku teks. elaun / V.V. Sapozhnikov, Vl. V. Sapozhnikov. - M.: Laluan, 2004. - 318 p.

3. Serdakov, A. S. Kawalan automatik dan diagnostik teknikal [Teks] / A. S. Serdakov. - Kyiv: Teknologi, 1971. - 244 hlm.

4. Stetsyuk. A. E. “Asas diagnostik teknikal. Teori pengiktirafan": buku teks. elaun / A. E. Stetsyuk, Ya Bobrovnikov. - Khabarovsk: Rumah penerbitan DVGUPS, 2012. - 69 p.

Disiarkan di Allbest.ru

Dokumen yang serupa

    Kajian algoritma yang paling tipikal untuk menyelesaikan masalah yang bersifat probabilistik. Membiasakan dengan unsur-unsur kombinatorik, teori urn, formula Bayes, kaedah mencari diskret, pembolehubah rawak berterusan. Pertimbangan asas algebra peristiwa.

    manual latihan, ditambah 05/06/2010

    Penentuan dan penilaian kebarangkalian kejadian tertentu berlaku. Satu teknik untuk menyelesaikan masalah menggunakan teorem penambahan dan pendaraban, jumlah formula kebarangkalian, atau Bayes. Aplikasi skema Bernoulli dalam menyelesaikan masalah. Pengiraan sisihan kuasa dua.

    kerja amali, tambah 23/08/2015

    Takrifan statistik, aksiomatik dan klasik bagi kebarangkalian. Pembolehubah rawak diskret. Hadkan teorem Laplace dan Poisson. Fungsi taburan kebarangkalian untuk pembolehubah rawak multivariate. Formula Bayes. Anggaran titik varians.

    helaian tipu, ditambah 05/04/2015

    Pengiraan kebarangkalian tidak membayar balik pinjaman oleh entiti sah dan individu menggunakan formula Bayes. Pengiraan varians sampel, metodologinya, peringkat utama. Menentukan kebarangkalian bola putih terjatuh daripada tiga yang diambil secara rawak, mewajarkan keputusannya.

    ujian, ditambah 02/11/2014

    Aplikasi formula dan hukum teori kebarangkalian dalam menyelesaikan masalah. Formula Bayes, yang membolehkan anda menentukan kebarangkalian sesuatu peristiwa, dengan syarat peristiwa lain yang saling bergantung secara statistik telah berlaku. Teorem had pusat.

    kerja kursus, ditambah 11/04/2015

    Satu eksperimen dengan hasil rawak. Kestabilan statistik. Konsep kebarangkalian. Algebra peristiwa. Prinsip dualitas untuk acara. Kebarangkalian bersyarat. Formula untuk penambahan dan pendaraban kebarangkalian. Formula Bayes. Ruang acara asas.

    abstrak, ditambah 12/03/2007

    Menentukan kebarangkalian mendapat sekurang-kurangnya 4 mata pada sebiji dadu apabila melemparkannya sekali. Menentukan kebarangkalian menghasilkan bahagian (jika bahagian yang diambil secara rawak oleh pemasang ternyata berkualiti tinggi) oleh tumbuhan pertama menggunakan formula Bayes.

    ujian, ditambah 05/29/2012

    Penunjuk kebolehpercayaan sebagai penunjuk kebolehpercayaan objek yang tidak boleh dibaiki. Takrifan kebarangkalian klasik dan geometri. Kekerapan kejadian rawak dan "definisi statistik" kebarangkalian. Teorem penambahan dan pendaraban kebarangkalian.

    kerja kursus, ditambah 18/11/2011

    Pembolehubah rawak diskret dan taburannya. Jumlah formula kebarangkalian dan formula Bayes. Sifat am jangkaan matematik. Varians pembolehubah rawak. Fungsi taburan pembolehubah rawak. Takrif klasik kebarangkalian.

    ujian, ditambah 12/13/2010

    Model matematik fenomena atau proses. Penumpuan kaedah lelaran mudah. Anggaran ralat posterior. Kaedah putaran sistem linear. Kawalan ketepatan dan penyelesaian anggaran dalam rangka kerja kaedah langsung. Kaedah relaksasi dan kaedah Gauss.