Teknik teşhiste Bayes yöntemi. İstatistiksel tanıma yöntemleri

Bugüne kadar, kullanımı teşhis edilen nesnenin teknik durumunun tipini tanımayı mümkün kılan çok sayıda yöntem geliştirilmiştir. Bu makale, tanısal uygulamada en yaygın olarak kullanılanlardan yalnızca bazılarını tartışmaktadır.

Bayes yöntemi

Bayes formülünün uygulanmasına dayanan teşhis yöntemi, istatistiksel tanıma yöntemlerini ifade eder.

Olayın olasılığı A, hangisi yalnızca uyumsuz olaylardan 2 biri meydana geldiğinde meydana gelebilir? 1? İÇİNDE 2 ,..., p'de, bu olayların her birinin olasılıklarının, olayın karşılık gelen olasılığı ile çarpımının toplamına eşittir A:

Bu formül denir toplam olasılık formülü.Çarpma teoreminin ve toplam olasılık formülünün doğal sonucu, hipotez teorisi olarak adlandırılan teoridir. hadi diyelim ki olay A yalnızca uyumsuz olaylardan biri meydana geldiğinde meydana gelebilir İÇİNDE, 2'DE , ..., p'de, ancak hangisinin gerçekleşeceği önceden bilinmediğinden bunlara hipotez adı verilmektedir. Bir A olayının meydana gelme olasılığı, toplam olasılık formülü (1.5) ve koşullu olasılık kullanılarak belirlenir. RA (B/) formüle göre

Değerin değiştirilmesi R(L), aldık

Formül (1.6)'ya Bayes formülü denir. Olayın meydana geldiği denemenin sonuçları bilindikten sonra hipotezlerin olasılıklarının yeniden tahmin edilmesine olanak sağlar. A.

Bir özelliğin ortaya çıkmasının koşullu olasılıklarının büyüklüğünü belirlemek, bir durumu teşhis etmek için Bayes formülünü kullanmanın anahtarıdır. Bayes yaklaşımı kontrol biliminde, sinyal tespitinde ve örüntü tanıma teorisinde ve tıbbi ve teknik teşhislerde yaygın olarak kullanılmaktadır.

Teşhis göreviyle ilgili olarak yöntemin özünü ele alalım. Konunun matematiksel tarafı Ts3] çalışmasında ayrıntılı olarak sunulmaktadır. Operasyon sırasında herhangi bir nesne olası TVj durumlarından birinde olabilir, ...,Nj(en basit durumda - “norm”, “ret”), buna hipotezlerin (teşhislerin) Z)j,...,Z) atandığı; . Tesisin işletimi sırasında parametreler (işaretler) izlenir İle, ..., kj. Z) durumunun ve bir nesnedeki niteliğin ortak varlığı olasılığı kj azimli

Nerede R(Dj)- teşhis olasılığı DJ, istatistiksel verilerle belirlenir:

Nerede P- incelenen nesnelerin sayısı;

Nj- durum sayısı;

P(kj/Dj) kj durumu olan nesneler için Dj. Eğer arasında P teşhisi olan nesneler DJ, bir işaret gösterdi kj, O

P(cr- bir işaretin ortaya çıkma olasılığı kj nesnenin durumuna (teşhisine) bakılmaksızın tüm nesnelerde. Toplam sayıdan izin ver P nesneler işareti kj bulundu rij daha sonra nesneler

P(Dj/kj) - teşhis olasılığı Z); Söz konusu nesnenin aşağıdaki özelliklere sahip olduğu öğrenildikten sonra İle-.

Genelleştirilmiş Bayes formülü, anketin bir dizi özelliğe göre gerçekleştirildiği duruma uygulanır. İLE, işaretler dahil (ku, k p).İşaretlerin her biri kj Var rrij sıralar (, İle D,

kj2 , ..., kj s, ..., kjm). Yapılan inceleme sonucunda belli oldu

özelliğin uygulanması k.-k. ve tüm işaretler kompleksi İLE. İçinde-

deke bir özelliğin özel anlamı anlamına gelir. Bir dizi özellik için Bayes formülü şu şekildedir:

Nerede P(Dj/A*) - Bir dizi işarete dayalı muayene sonuçlarının belli olmasından sonra teşhis olasılığı? İLE;

P(Dj)- ön tanı olasılığı Dj.

Sistemin belirtilen durumlardan yalnızca birinde olduğu varsayılmaktadır;

Bayes yöntemini kullanarak teşhis olasılığını belirlemek için, ön istatistiksel materyale dayanarak bir teşhis matrisi oluşturulur (Tablo 1.1). Satır sayısı olası teşhislerin sayısına karşılık gelir. Sütun sayısı, özellik sayısı ile karşılık gelen basamak sayısının çarpımının toplamı ve teşhislerin önceki olasılıklarının bir toplamı olarak hesaplanır. Bu tablo, çeşitli teşhisler için karakter kategorilerinin olasılıklarını içerir. Tanınırsa

ki iki basamaklıdır (basit işaretler “evet - hayır”), o zaman tabloda işaretin ortaya çıkma olasılığını belirtmek yeterlidir R(k-/Dj). Eksik özelliğin olasılığı I. Daha uygun

örneğin iki basamaklı bir işaret için tek tip bir form kullanın. Şunu açıklığa kavuşturmak gerekir , Nerede nij- nitelik basamaklarının sayısı kj. Bir özelliğin tüm olası uygulamalarının olasılıklarının toplamı bire eşittir. Karar kuralı, tanıya ilişkin kararın kendisine göre verildiği kuraldır. Bayes yönteminde karmaşık özelliklere sahip bir nesne ft En yüksek (arka) olasılığa sahip tanıyı ifade eder ft ve Dj, Eğer P(Dj/lt) >

> P(Dj/ft) (J - 1, 2, ..., n ben * j). Bu kural genellikle teşhis olasılığı için bir eşik değeri getirilerek iyileştirilir P(Dj/ft) >

>Pj, Nerede Pj- Teşhis için önceden seçilmiş tanıma seviyesi Dj. Bu durumda, en yakın rakip teşhisin olasılığı 1'den yüksek değildir - Pj. Genellikle kabul edilir P ( > 0.9. Verilen PiD/t?) tanıya ilişkin bir karar verilmemektedir ve ek bilgi gerekmektedir.

Tablo 1.1

Bayes yönteminde teşhis matrisi

İmza kj

R(k 12 /

R(k 22 /

R(k p /

Örnek. Dizel bir lokomotif gözetim altında. Bu durumda iki işaret kontrol edilir: İle- sürücü kumandasının nominal konumunda saatlik dizel yakıt tüketiminde nominal değerin %10'undan fazla artış, 2'ye- sürücü kumandasının nominal konumunda ayarlanan dizel jeneratörün gücünde, nominal değerin %15'inden fazla azalma. Bu işaretlerin ortaya çıkmasının, silindir-piston grubunun parçalarının artan aşınması (teşhis /)] veya yakıt ekipmanındaki bir arıza (teşhis) ile ilişkili olduğunu varsayalım. 2). Dizel motor iyi durumdaysa (teşhis D 3) işaret İle gözlemlenmedi ama bir işaret 2'ye Vakaların %7'sinde görülür. İstatistiksel verilere göre Z) 3 tanısı konan motorların %60'ının planlı onarımlardan önce değiştirildiği tespit edilmiştir. 2- %30, Z)j tanısıyla - %10. Ayrıca işaretin olduğu da tespit edildi. İle j Z durumunda)| %10 oranında meydana gelir ve bu durumda D 2 - vakaların %40'ında; imza 2'ye Z durumu altında)| %15 oranında görülür ve bu durumda 2- vakaların %20'sinde. İlk bilgileri tablo şeklinde sunuyoruz. 1.2.

Tablo 1.2

Koşulların olasılıkları ve semptomların belirtileri

R(k2 / A)

Kontrollü özelliklerin çeşitli uygulama seçenekleri için durumların olasılıklarını hesaplayalım:

1. İşaretler İle Ve 2'ye bulundu, sonra:

2. İmzala İle tespit edildi, işaret 2'ye mevcut olmayan.

İşaretin olmaması ben bir işaretin varlığı anlamına gelir İle.(ters olay) ve P(k./D.)-- P(k./D.).

3. İmzala İle 2 tespit edildi, işaret İle mevcut olmayan:

4. İşaretler /:| Ve 2'ye eksik:

Hesaplama sonuçlarının analizi aşağıdaki sonuçları çıkarmamızı sağlar:

  • 1. İki burcun varlığı k ve k 2 s olasılık 0,942 durumu gösterir DJ
  • 2. Bir işaretin varlığı İle 0,919 olasılıkla durumu belirtir 2(yakıt ekipmanı arızası).
  • 3. Bir işaretin varlığı 2'ye 0,394 olasılıkla durumu belirtir 2(yakıt ekipmanı arızası) ve Z durumu 3 (uygun durum) hakkında 0,459 olasılıkla. Böyle bir olasılık oranıyla karar vermek zor olduğundan ek incelemeler yapılması gerekir.
  • 4. 0,717 olasılıkla her iki işaretin de olmaması iyi bir duruma işaret eder (Z) 3).
Günümüzde Bayes yöntemleri oldukça yaygınlaşmış ve çeşitli bilgi alanlarında aktif olarak kullanılmaktadır. Ancak ne yazık ki pek çok kişinin ne olduğu ve neden gerekli olduğu konusunda fikri yok. Bunun nedenlerinden biri de Rusça edebiyatın çok fazla olmamasıdır. Bu nedenle burada onların ilkelerini olabildiğince basit bir şekilde, en temelden başlayarak sunmaya çalışacağım (bu bazılarına çok basit görünüyorsa özür dilerim).

Gelecekte Bayesian analizine geçmek ve gerçek verilerin işlenmesi hakkında konuşmak ve bana göre R diline mükemmel bir alternatif (bunun hakkında çok az şey yazıldı) - pymc ile Python hakkında konuşmak istiyorum. modül. Kişisel olarak Python'u paketler ve HATALAR içeren R'den çok daha anlaşılır ve mantıklı buluyorum ve Python çok daha fazlasını veriyor Ö daha fazla özgürlük ve esneklik (Python'un zorlukları olmasına rağmen bunların üstesinden gelinebilir ve basit analizlerde sıklıkla karşılaşılmaz).

Biraz tarih

Kısa bir tarihsel not olarak Bayes formülünün 1763 yılında, yazarı Thomas Bayes'in ölümünden 2 yıl sonra yayınlandığını söyleyeceğim. Ancak bunu kullanan yöntemler ancak yirminci yüzyılın sonlarına doğru gerçek anlamda yaygınlaştı. Bu, hesaplamaların belirli hesaplama maliyetleri gerektirmesi ve bunların ancak bilgi teknolojisinin gelişmesiyle mümkün hale gelmesiyle açıklanmaktadır.

Olasılık ve Bayes teoremi hakkında

Bayes'in formülü ve takip eden her şey olasılığın anlaşılmasını gerektirir. Olasılık hakkında daha fazla bilgiyi Vikipedi'de okuyabilirsiniz.
Uygulamada, bir olayın meydana gelme olasılığı, bu olayın meydana gelme sıklığıdır, yani büyük (teorik olarak sonsuz) toplam gözlem sayısı için olaya ilişkin gözlem sayısının toplam gözlem sayısına oranıdır.
Şu deneyi düşünün: Segmentten herhangi bir sayıyı çağırıyoruz ve bu sayının örneğin 0,1 ile 0,4 arasında olduğunu görüyoruz. Tahmin edebileceğiniz gibi, bu olayın olasılığı, parçanın uzunluğunun parçanın toplam uzunluğuna oranına (başka bir deyişle, olası eşit olası değerlerin "sayısının" toplam uzunluğuna oranına) eşit olacaktır. toplam değer “sayı”), yani (0,4 - 0,1) / (1 - 0) = 0,3 , yani segmente girme olasılığı% 30'dur.

Şimdi x'in karesine bakalım.

Diyelim ki her biri sıfırdan büyük ve birden küçük olan (x, y) sayı çiftlerini adlandırmamız gerekiyor. X'in (birinci sayı) doğru parçasının içinde olma olasılığı (ilk şekilde mavi alan olarak gösterilmiştir, şu anda ikinci sayı y bizim için önemli değildir) doğru parçasının alanının oranına eşittir. mavi alanın tüm karenin alanına oranı, yani (0,4 - 0,1 ) * (1 - 0) / (1 * 1) = 0,3, yani %30. Böylece x'in parçaya ait olma olasılığının p(0,1) olduğunu yazabiliriz.<= x <= 0.4) = 0.3 или для краткости p(X) = 0.3.
Şimdi y'ye bakarsak, benzer şekilde, y'nin parçanın içinde olma olasılığı, yeşil alanın alanının tüm karenin alanına oranına eşittir p(0,5)<= y <= 0.7) = 0.2, или для краткости p(Y) = 0.2.
Şimdi hem x hem de y değerleri hakkında neler öğrenebileceğimize bakalım.
X ve y'nin aynı anda ilgili bölümlerde olma olasılığının ne olduğunu bilmek istiyorsak, o zaman karanlık alanın (yeşil ve mavi alanların kesişimi) tüm alana oranını hesaplamamız gerekir. kare: p(X, Y) = (0,4 - 0,1 ) * (0,7 - 0,5) / (1 * 1) = 0,06.

Şimdi diyelim ki, eğer x zaten aralıktaysa, y'nin aralıkta olma olasılığının ne olduğunu bilmek istiyoruz. Yani aslında bir filtremiz var ve (x, y) çiftlerini adlandırdığımızda, x'in belirli bir aralıkta olması koşulunu sağlamayan çiftleri hemen atarız ve filtrelenmiş çiftlerden bunları sayarız. bu y bizim koşulumuzu karşılıyor ve olasılığı, y'nin yukarıda belirtilen bölümde yer aldığı çiftlerin sayısının, filtrelenen çiftlerin (yani x'in bölümde yer aldığı) toplam sayısına oranı olarak değerlendiriyoruz. Bu olasılığı p(Y|X) olarak yazabiliriz. Açıkçası, bu olasılık karanlık bölgenin alanının (yeşil ve mavi bölgelerin kesişimi) mavi bölgenin alanına oranına eşittir. Karanlık alanın alanı (0,4 - 0,1) * (0,7 - 0,5) = 0,06 ve mavinin alanı (0,4 - 0,1) * (1 - 0) = 0,3 ise bunların oranı şöyle olur: 0,06 / 0,3 = 0,2. Başka bir deyişle, x'in zaten parçaya ait olduğu dikkate alındığında, parça üzerinde y'yi bulma olasılığı p(Y|X) = 0,2'dir.
Yukarıdakilerin tümünü ve yukarıdaki tüm notasyonları dikkate alarak aşağıdaki ifadeyi yazabileceğimize dikkat çekilebilir.
p(Y|X) = p(X, Y) / p(X)

Şimdi p(X|Y) ile ilgili olarak önceki mantığı kısaca yeniden oluşturalım: (x, y) çiftlerini adlandırıyoruz ve y'nin 0,5 ile 0,7 arasında olduğu çiftleri filtreliyoruz, ardından x'in aralıkta olma olasılığı şu koşulla sağlanır: Segmente ait olan y, karanlık alanın alanının yeşil alana oranına eşittir:
p(X|Y) = p(X, Y) / p(Y)

Yukarıdaki iki formülde p(X, Y) teriminin aynı olduğunu görüyoruz ve onu ortadan kaldırabiliriz:

Son eşitliği şu şekilde yeniden yazabiliriz:

Bu Bayes'in teoremi.
X'in tüm değerleri için p(Y)'nin aslında p(X,Y) olduğunu belirtmek de ilginçtir. Yani, karanlık alanı alıp X'in tüm değerlerini kapsayacak şekilde genişletirsek, yeşil alanı tam olarak takip edecek, yani p(Y)'ye eşit olacaktır. Matematik dilinde bu şu anlama gelir:
O zaman Bayes'in formülünü şu şekilde yeniden yazabiliriz:

Bayes Teoreminin Uygulanması

Aşağıdaki örneğe bakalım. Bir bozuk para alın ve 3 kez çevirin. Eşit olasılıkla aşağıdaki sonuçları elde edebiliriz (O - yazı, P - yazı): OOO, OOR, ORO, ORR, ROO, ROR, RPO, RRR.

Her durumda kaç tura geldiğini ve kaç kez tura-yazı, yazı-tura değişimi olduğunu sayabiliriz:

Kafa sayısını ve değişiklik sayısını iki rastgele değişken olarak düşünebiliriz. O zaman olasılık tablosu şöyle görünecektir:

Artık Bayes'in formülünü çalışırken görebiliriz.
Ama önce daha önce baktığımız kareye bir benzetme yapalım.
p(1O)'nun üçüncü sütunun (karenin "mavi alanı") toplamı olduğunu ve bu sütundaki tüm hücre değerlerinin toplamına eşit olduğunu fark edebilirsiniz: p(1O) = 2/8 + 1/8 = 3/8
p(1С) üçüncü satırın toplamıdır (karenin “yeşil alanı”) ve benzer şekilde bu satırdaki tüm hücre değerlerinin toplamına eşittir p(1С) = 2/8 + 2/ 8 = 4/8
Bir tura ve bir değişiklik alma olasılığımız bu alanların kesişimine eşittir (yani üçüncü sütun ile üçüncü satırın kesişimindeki hücredeki değer) p(1C, 1O) = 2/8
Daha sonra yukarıda açıklanan formülleri takip ederek, üç atışta bir tura gelirse tek değişiklik alma olasılığını hesaplayabiliriz:
p(1C|1O) = p(1C, 1O) / p(1O) = (2/8) / (3/8) = 2/3
veya bir değişiklik yaparsak bir tura gelme olasılığı:
p(1O|1C) = p(1C, 1O) / p(1C) = (2/8) / (4/8) = 1/2
Bayes formülü ile bir yazı p(1O|1C) olması durumunda bir değişiklik alma olasılığını hesaplarsak şunu elde ederiz:
p(1O|1C) = p(1C|1O) * p(1O) / p(1C) = (2/3) * (3/8) / (4/8) = 1/2
Yukarıda elde ettiğimiz şey buydu.

Peki yukarıdaki örneğin pratikte ne gibi önemi var?
Gerçek şu ki, gerçek verileri analiz ettiğimizde genellikle bu verilerin bazı parametreleriyle (örneğin ortalama, varyans vb.) ilgileniriz. O zaman yukarıdaki olasılık tablosuyla aşağıdaki benzetmeyi yapabiliriz: satırlar bizim deneysel verilerimiz olsun (bunları Veri olarak gösterelim) ve sütunlar bu verinin bizi ilgilendiren parametresinin olası değerleri olsun (bunu gösterelim) ). Daha sonra mevcut verilere dayanarak belirli bir parametre değeri elde etme olasılığıyla ilgileniyoruz.
Bayes formülünü uygulayıp aşağıdakileri yazabiliriz:

İntegralli formülü hatırlayarak şunu yazabiliriz:

Yani aslında yaptığımız analiz sonucunda parametrenin fonksiyonu olarak bir olasılığımız var. Şimdi, örneğin, bu fonksiyonu maksimuma çıkarabilir ve parametrenin en olası değerini bulabilir, parametrenin dağılımını ve ortalama değerini hesaplayabilir, ilgilendiğimiz parametrenin 95 olasılıkla içinde bulunduğu segmentin sınırlarını hesaplayabiliriz. %, vesaire.

Olasılığa arka olasılık denir. Ve bunu hesaplamak için sahip olmamız gerekiyor
- olabilirlik fonksiyonu ve - önsel olasılık.
Olabilirlik fonksiyonu modelimiz tarafından belirlenir. Yani ilgilendiğimiz parametreye bağlı olarak bir veri toplama modeli oluşturuyoruz. Örneğin, y = a * x + b düz çizgisini kullanarak verileri enterpolasyon yapmak istiyoruz (böylece tüm verilerin, bilinen bir varyansla üzerine bindirilen Gauss gürültüsüyle doğrusal bir ilişkiye sahip olduğunu varsayıyoruz). O halde a ve b bizim parametrelerimizdir ve bunların en olası değerlerini bilmek istiyoruz ve olabilirlik fonksiyonu, doğrunun denklemi ve belirli bir varyans tarafından verilen bir ortalamaya sahip bir Gaussian'dır.
Önsel olasılık, analizi gerçekleştirmeden önce bildiğimiz bilgileri içerir. Örneğin, bir doğrunun pozitif bir eğime sahip olması gerektiğini veya x-kesme noktasındaki değerin pozitif olması gerektiğini kesin olarak biliyoruz; tüm bunları ve daha fazlasını analizimize dahil edebiliriz.
Gördüğünüz gibi, bir kesirin paydası, parametrenin tüm olası değerleri üzerinden payın integralidir (veya parametrelerin yalnızca belirli ayrık değerleri alabildiği durumda, toplam). Pratikte bu, paydanın bir sabit olduğu ve sonsal olasılığı normalleştirmeye hizmet ettiği anlamına gelir (yani, son olasılığın integrali bire eşit olacak şekilde).

Yazımı bununla bitirmek istiyorum (devam)

SIRALI ANALİZ YÖNTEMİ

BAYES YÖNTEMİ

Ders taslağı

Ödevlerin analizi ve kontrolü

Zamanı organize etmek.

Dersin ilerleyişi.

Ders 9

Ders. İSTATİSTİKSEL TANIMA YÖNTEMLERİ

Hedef. Dijital sinyal tanıma kavramını verin.

1. Eğitici. Dijital sinyal tanıma sürecini açıklar.

2. Gelişimsel. Mantıksal düşünmeyi ve doğal, bilimsel bir dünya görüşünü geliştirin.

3. eğitici. Telekomünikasyon endüstrisindeki bilimsel başarılara ve keşiflere ilgiyi artırmak.

Disiplinlerarası bağlantılar:

· Destekleyici: bilgisayar bilimi, matematik, bilgisayar teknolojisi ve MP, programlama sistemleri.

· Sağlanan: Staj

Metodolojik destek ve ekipman:

1. Ders için metodolojik gelişim.

2. Müfredat.

3. Müfredat

4. Çalışma programı.

5. Güvenlik brifingi.

Teknik öğretim yardımcıları: kişisel bilgisayar.

İş sağlamak:

· Çalışma kitapları

3. Soruları cevaplayın:

1. Dijital sinyaller ile analog sinyaller arasındaki fark nedir?

2. Ölçüm yaparken hangi sınıf diyagramlar kullanılıyor?

3. Her sınıfın kısa bir tanımını yapın.

4. Göz şeması oluşturmak için ne kullanılır?

5. Göz diyagramının özünü açıklayınız.

· Yöntemin temelleri

  • Genelleştirilmiş Bayes formülü.

· Teşhis matrisi.

Belirleyici kural

· Yöntemin temelleri.

· Yöntemin genel prosedürü.

· Karar sınırlarının birinci ve ikinci türdeki hata olasılıklarıyla bağlantısı.

İstatistiksel tanıma yöntemlerinin temel avantajı, boyutsuz niceliklerle karakterize edildikleri için farklı fiziksel nitelikteki işaretleri aynı anda hesaba katma yeteneğidir - sistemin farklı durumları altında ortaya çıkma olasılıkları.

Teknik teşhis yöntemleri arasında genelleştirilmiş Bayes formülüne dayalı bir yöntem ( Bayes teoremi (veya Bayes formülü), olasılık teorisinin ana teoremlerinden biridir; bu, bir olayın (hipotezin) yalnızca hatalı olabilecek dolaylı kanıtların (verilerin) varlığında meydana gelme olasılığını belirlemenizi sağlar. ), sadeliği ve verimliliği nedeniyle özel bir yere sahiptir.

Bayes yönteminin dezavantajları vardır:büyük miktarda ön bilgi, nadir teşhislerin “bastırılması” vb. Ancak istatistiksel veri hacminin Bayes yönteminin kullanılmasına izin verdiği durumlarda, en güvenilir ve etkili yöntemlerden biri olarak kullanılması tavsiye edilir.

Yöntemin temelleri. Yöntem basit bir Bayes formülüne dayanmaktadır. Bir tanı varsa D ben ve basit bir ki işareti , bu teşhisle ortaya çıkan olayların ortak ortaya çıkma olasılığı (nesnede Di durumunun varlığı ve ki işareti) )



Bu eşitlikten Bayes'in formülü çıkar

(3.2)

Bu formülde yer alan tüm büyüklüklerin tam anlamını belirlemek çok önemlidir.

P(Di) - D hipotezinin önceki olasılığı

P(ki/Di) - D olayının meydana gelmesi üzerine ki hipotezinin olasılığı (sonraki olasılık - arka verilerin bilinmesi koşuluyla, yani deneyden sonra elde edilmesi koşuluyla rastgele bir olayın olasılığı.)

P(ki) - ki olayının toplam gerçekleşme olasılığı

P(Di/ki) - ki hipotezi doğruysa Di olayının meydana gelme olasılığı

P(D) - tanı olasılığı D istatistiksel verilerle belirlenir (önceden teşhis olasılığı). Yani daha önce incelenirse N nesneler ve W,-nesneler D durumuna sahipti, o zaman

P(Di) = Ni/N.(3.3)

P (kj/Di) - k j özelliğinin ortaya çıkma olasılığı; Di durumuna sahip nesneler için. Ni arasında Di tanısı konan nesneler varsa, N ij bir işaret belirdi kj O

(3.4)

P (kj) - bir işaretin ortaya çıkma olasılığı kj nesnenin durumuna (teşhisine) bakılmaksızın tüm nesnelerde. Toplam sayıdan izin ver N nesneler işareti İle ) bulundu Nj daha sonra nesneler

(3.5)

Eşitlikte (3.2) R ( Di/kj)- Söz konusu nesnenin aşağıdaki özelliklere sahip olduğu öğrenildikten sonra D teşhisinin olasılığı kj (arka tanı olasılığı ).

giriiş

Bayes yöntemi, temel avantajı farklı fiziksel yapıdaki özellikleri aynı anda hesaba katma yeteneği olan istatistiksel tanıma yöntemlerini ifade eder. Bunun nedeni, tüm işaretlerin boyutsuz niceliklerle karakterize edilmesidir - bunların sistemin farklı durumları altında ortaya çıkma olasılıkları.

Bayes yöntemi, basitliği ve etkinliği nedeniyle teknik teşhis yöntemleri arasında özel bir yere sahiptir, ancak aynı zamanda büyük miktarda ön bilgi, nadir teşhislerin "bastırılması" vb. gibi dezavantajları da vardır. İstatistiksel bilgi miktarı Bayes yönteminin kullanılmasına izin verdiğinden, en güvenilir ve etkili yöntemlerden biri olarak kullanılması tavsiye edilir.

Bayes Yöntemi Temelleri

Yöntem Bayes formülüne (hipotezlerin olasılığı formülü) dayanmaktadır.

Bir tanı varsa D Ben ve basit bir işaret k J , bu teşhisle ortaya çıkan olayların ortaklaşa ortaya çıkma olasılığı (nesnede durumun varlığı) D Ben ve imzala k J), aşağıdaki formülle belirlenir:

P(D) Ben k J ) = P(D) Ben ) P (k J /D Ben ) = P (k J ) P (D) Ben / k J ). (1.1.)

Bu eşitlikten Bayes formülü çıkar:

P(D) Ben / k J ) = P(D) Ben ) P(k Ben /D Ben )/P(k J ) (1.2.)

Bu formülde yer alan tüm büyüklüklerin tam anlamını belirlemek çok önemlidir.

P(D Ben) --tanı olasılığı D Ben, istatistiksel verilerden belirlenir ( önceden teşhis olasılığı). Yani daha önce incelenirse N nesneler ve N Ben nesnelerin bir koşulu vardı D Ben, O

P(D Ben) = N Ben /N. (1.3.)

P (k J /D Ben k J durumu olan nesneler için D Ben .

Eğer arasında N Ben teşhisi olan nesneler D Ben, sen N ben bir işaret belirdi k J , ardından Bayes korelasyon olasılıksal

P(k J /D Ben) = N ben /N Ben . (1.4.)

P(k J) --bir işaretin ortaya çıkma olasılığı k J nesnenin durumu (teşhis) ne olursa olsun tüm nesnelerde. Toplam sayıdan izin ver N nesneler işareti k J bulundu N J daha sonra nesneler

P(k J ) = N J /N. (1.5.)

Tanı koymak için özel bir hesaplama P(kj) gerekli değil. Aşağıdakilerden de anlaşılacağı üzere, anlam P(D Ben)Ve P (k J /D Ben), tüm olası durumlar için bilinen değeri belirleyin P(k J ).

Eşitlik içinde P (D Ben /k J) - tanı olasılığı D Ben Söz konusu nesnenin aşağıdaki özelliklere sahip olduğu öğrenildikten sonra k J (tanının arka olasılığı).

İyi çalışmanızı bilgi tabanına göndermek basittir. Aşağıdaki formu kullanın

Bilgi tabanını çalışmalarında ve çalışmalarında kullanan öğrenciler, lisansüstü öğrenciler, genç bilim insanları size çok minnettar olacaklardır.

Yayınlanan http://www.allbest.ru/

giriiş

Bayes yöntemi, temel avantajı farklı fiziksel yapıdaki özellikleri aynı anda hesaba katma yeteneği olan istatistiksel tanıma yöntemlerini ifade eder. Bunun nedeni, tüm işaretlerin boyutsuz niceliklerle karakterize edilmesidir - bunların sistemin farklı durumları altında ortaya çıkma olasılıkları.

Bayes yöntemi, basitliği ve etkinliği nedeniyle teknik teşhis yöntemleri arasında özel bir yere sahiptir, ancak aynı zamanda büyük miktarda ön bilgi, nadir teşhislerin "bastırılması" vb. gibi dezavantajları da vardır. İstatistiksel bilgi miktarı Bayes yönteminin kullanılmasına izin verdiğinden, en güvenilir ve etkili yöntemlerden biri olarak kullanılması tavsiye edilir.

1. Bayes yönteminin temelleri

Yöntem Bayes formülüne (hipotezlerin olasılığı formülü) dayanmaktadır.

Bir tanı varsa D Ben ve basit bir işaret k J , bu teşhisle ortaya çıkan olayların ortaklaşa ortaya çıkma olasılığı (nesnede durumun varlığı) D Ben ve imzala k J), aşağıdaki formülle belirlenir:

P(D) Benk J) = P(D) Ben) P (k J/D Ben) = P (k J) P (D) Ben/ k J). (1.1.)

Bu eşitlikten Bayes formülü çıkar:

P(D) Ben/ k J) = P(D) Ben) P(k Ben/D Ben)/P(k J ) (1.2.)

Bu formülde yer alan tüm büyüklüklerin tam anlamını belirlemek çok önemlidir.

P(D Ben) --tanı olasılığı D Ben, istatistiksel verilerden belirlenir ( önceden teşhis olasılığı). Yani daha önce incelenirse N nesneler ve N Ben nesnelerin bir koşulu vardı D Ben, O

P(D Ben) = N Ben/N. (1.3.)

P (k J/D Ben k J durumu olan nesneler için D Ben.

Eğer arasında N Ben teşhisi olan nesneler D Ben, sen N ben bir işaret belirdi k J , ardından Bayes korelasyon olasılıksal

P(k J/D Ben) = N ben/N Ben. (1.4.)

P(k J) --bir işaretin ortaya çıkma olasılığı k J nesnenin durumu (teşhis) ne olursa olsun tüm nesnelerde. Toplam sayıdan izin ver N nesneler işareti k J bulundu N J daha sonra nesneler

P(k J ) = N J/N. (1.5.)

Tanı koymak için özel bir hesaplama P(kj ) gerekli değil. Aşağıdakilerden açıkça anlaşılacağı üzere , değerler P(D Ben)Ve P (k J / D Ben), tüm olası durumlar için biliniyorsa değeri belirleyin P(k J ).

Eşitlik içinde P (D Ben/k J) - tanı olasılığı D Ben Söz konusu nesnenin aşağıdaki özelliklere sahip olduğu öğrenildikten sonra k J (a posteriori inançTTeşhis).

2 . Genelleştirilmiş Bayes formülü

Bu formül, incelemenin bir dizi işarete göre yapıldığı durum için geçerlidir. İLE , işaretler dahil k 1 , k 2 , ..., k v . İşaretlerin her biri k J Var M J sıralar ( k J ben, k J 2 , ..., k js, ...,). İnceleme sonucunda özelliğin uygulanması belli olur

k J * = k js (1.5.)

ve tüm işaretler kompleksi k*. Dizin *, daha önce olduğu gibi, niteliğin özel anlamı (gerçekleşmesi) anlamına gelir. Bir dizi özellik için Bayes formülü şu şekildedir:

P(D Ben/ İLE * )= P(D Ben)P(İLE */D Ben)/P(İLE * )(Ben = 1, 2, ..., N), (1.6.)

Nerede P (D Ben/ İLE * ) --tanı olasılığı D Ben Bir dizi işaret üzerinde yapılan incelemenin sonuçları belli olduktan sonra İLE , P (D Ben) --ön tanı olasılığı D Ben (önceki istatistiklere göre).

Formül (1.6.) aşağıdakilerden herhangi biri için geçerlidir N sistemin olası durumları (teşhisler). Sistemin belirtilen durumlardan yalnızca birinde olduğu varsayılır ve bu nedenle

Pratik problemlerde, birkaç A1, ....., Ar durumunun var olma olasılığına sıklıkla izin verilir ve bunlardan bazıları birbirleriyle kombinasyon halinde ortaya çıkabilir.

P(İLE */ D Ben) = P(k 1 */ D Ben)P (k 2 */ k 1 * D Ben)...P (k v */ k ben* ...k* v- 1 D Ben), (1.8.)

Nerede k J * = k js --İnceleme sonucunda ortaya çıkan özelliğin kategorisi. Tanısal açıdan bağımsız işaretler için

P (İLE */ D Ben) = P (k 1 */ D Ben) P (k 2 */ D Ben)... P (k v * / D Ben). (1.9.)

Özellikle çok sayıda özelliğe sahip pratik problemlerin çoğunda, aralarında önemli korelasyonlar olsa bile özelliklerin bağımsızlığı koşulunu kabul etmek mümkündür.

Bir işaret kompleksinin ortaya çıkma olasılığıİLE *

P(İLE *)= P(D S)P(İLE */D S) . (1.10.)

Genelleştirilmiş Bayes formülü şu şekilde yazılabilir: :

P(D Ben/ k * ) (1.11.)

Nerede P (İLE */ D Ben)eşitlik (1.8.) veya (1.9.) ile belirlenir. (1.11.) ilişkisinden şu sonuç çıkar:

P(D Ben/ İLE *)=l , (1.12.)

Elbette ki böyle olması gerekir, çünkü tanılardan birinin mutlaka gerçekleşmesi gerekir, iki tanının aynı anda gerçekleşmesi ise imkansızdır. bu not alınmalı tüm teşhisler için Bayes formülünün paydasıÖçağrı aynı. Bu, ilk önce belirlemenizi sağlar birlikte meydana gelme olasılığı e nia Ben teşhis ve bir dizi özelliğin bu uygulaması

P(D BenİLE *) = P(D Ben)P(İLE */D Ben) (1.13.)

ve daha sonra tanının arka olasılığı

P (D Ben/İLE *) = P(D BenİLE *)/P(D SİLE *). (1.14.)

İfade (1.9.) küçük miktarlarda ürünler içerdiğinden bazen formül (1.11.)'in ön logaritmasının kullanılması tavsiye edilir.

Belirli bir dizi özelliğin uygulanması durumunda İLE * dır-dir belirleme teşhis için D P, o zaman bu kompleks diğer teşhislerde oluşmaz:

Daha sonra eşitlik sayesinde (1.11.)

Dolayısıyla deterministik teşhis mantığı, olasılıksal mantığın özel bir durumudur. Bayes formülü, bazı özelliklerin ayrık bir dağılıma sahip olduğu ve diğer kısmının sürekli bir dağılıma sahip olduğu durumda da kullanılabilir. Sürekli dağıtım için dağıtım yoğunlukları kullanılır. Bununla birlikte, sürekli bir eğrinin tanımı bir dizi ayrı değer kullanılarak gerçekleştirilirse, hesaplama planında özelliklerde belirtilen fark önemsizdir.

3 . Teşhis matrisi

Bayes yöntemini kullanarak teşhis olasılığını belirlemek için, ön istatistiksel materyale dayanarak oluşturulan bir teşhis matrisi (Tablo 1.1) oluşturmak gerekir. Bu tablo, çeşitli teşhisler için karakter kategorilerinin olasılıklarını içerir.

Tablo 1.1

Bayes yönteminde teşhis matrisi

Teşhis D Ben

k j işareti

k 1

k 2

P(k 11 /D Ben)

P(k 12 /D Ben)

P(k 21 /D Ben)

P(k 22 /D Ben)

P(k 23 /D Ben)

P(k 24 /D Ben)

P(k 31 /D Ben)

P(k 32 /D Ben)

D 1

D 2

İşaretler iki basamaklıysa (basit işaretler “evet - hayır”), o zaman tabloda işaretin görünme olasılığını belirtmek yeterlidir. P(k Ben/D Ben). Eksik özelliğin olasılığı R ( /D,-) = 1 - P(k Ben/D Ben).

Bununla birlikte, örneğin iki basamaklı bir işaret için tek tip bir form kullanmak daha uygundur. R (k J/D Ben) = R (k Ben 1 /D Ben); R ( /D,) = P(k Ben 2 /D Ben).

Dikkat P(k js/Di) = 1, burada T, -- nitelik basamaklarının sayısı k J. Bir özelliğin tüm olası uygulamalarının olasılıklarının toplamı bire eşittir.

Teşhis matrisi, teşhislerin önsel olasılıklarını içerir. Bayes yöntemindeki öğrenme süreci bir teşhis matrisinin oluşturulmasından oluşur. Teşhis sürecinde tabloyu netleştirme olasılığını sağlamak önemlidir. Bunun için sadece değerlerin bilgisayar belleğinde saklanması gerekmez. P(k js/Di), aynı zamanda aşağıdaki miktarlar: N -- teşhis matrisini derlemek için kullanılan nesnelerin toplam sayısı; N Ben D Ben; N ben -- tanısı konulan nesnelerin sayısı D Ben, dayalı olarak incelendi k J. Teşhisli yeni bir nesne gelirse D M, daha sonra teşhislerin önceki a priori olasılıkları ayarlanır.

Daha sonra özelliklerin olasılıklarına düzeltmeler eklenir. Teşhisli yeni nesneye izin verin D M deşarj algılandı R imza k J. Daha sonra daha ileri teşhis için özelliğin olasılık aralıklarının yeni değerleri kabul edilir. k J teşhis üzerine D M:

Diğer tanılara ilişkin işaretlerin koşullu olasılıkları ayarlama gerektirmez.

Çözüm

Bayes yönteminde karmaşık özelliklere sahip bir nesne İLE * En yüksek (arka) olasılığa sahip tanıyı ifade eder

K* D Ben, Eğer P(D) Ben/ k *) > P(D) J/ k *) (J = 1, 2,..., N; Ben? J). (1.17.)

Sembol Fonksiyonel analizde kullanılan , bir kümeye ait olmak anlamına gelir. Koşul (1.17.), bir özellikler kompleksinin belirli bir uygulamasına sahip olan bir nesnenin olduğunu gösterir. İLE * veya kısacası uygulama İLE * tanıya (duruma) aittir D Ben. Kural (1.17.) genellikle teşhis olasılığı için bir eşik değeri getirilerek açıklığa kavuşturulur:

P(D) Ben/ k *) ? P Ben, (1.18.)

Nerede P Ben. -- önceden seçilmiş tanınma düzeyi teşhis için D Ben. Bu durumda, en yakın rakip teşhisin olasılığı 1'den yüksek değildir - P Ben. Genellikle kabul edilir P Ben? 0.9. Verilen

P(D) Ben/ k *)

Ben (1.19.)

tanıya ilişkin bir karar verilmemiştir (tanımanın reddedilmesi) ve ek bilgi gerekmektedir.

Bayes yönteminde bilgisayarda hesaplama yaparken karar verme süreci oldukça hızlı gerçekleşir. Örneğin saniyede 10 - 20 bin işlem hızına sahip bir bilgisayarda 80 adet çok basamaklı işaret ile 24 duruma yönelik teşhis koymak yalnızca birkaç dakika sürmektedir.

Belirtildiği gibi Bayes yönteminin bazı dezavantajları vardır; örneğin nadir teşhislerin tanınmasındaki hatalar. Pratik hesaplamalarda, eşit derecede muhtemel teşhisler için teşhis yapılması tavsiye edilir.

P(D) Ben) = l/n (1.20.)

O zaman teşhis en büyük sonsal olasılık değerine sahip olacaktır. D Ben, hangisi için R (K* /D Ben) maksimum:

K* D Ben, Eğer P(K* /D Ben) > P(K* /D J) (J = 1, 2,..., N; Ben? J). (1.21.)

Başka bir deyişle tanı konulur. D Ben Tanı sırasında bu semptom dizisi daha yaygınsa D Ben diğer teşhislerden daha iyidir. Bu karar kuralına karşılık gelir maksimum olabilirlik yöntemi Öncekilerden bu yöntemin, aynı ön teşhis olasılıklarına sahip Bayes yönteminin özel bir durumu olduğu sonucu çıkmaktadır. Maksimum olasılık yönteminde “yaygın” ve “nadir” tanılar eşit haklara sahiptir.

Kullanılan kaynakların listesi

1. Görelik, A. L. Tanıma yöntemleri [Metin]: ders kitabı. üniversiteler için el kitabı / A. L. Gorelik, V. A. Skripkin. - M.: Daha yüksek. okul, 2004. - 261 s.

2. Sapozhnikov, V.V. Teknik teşhisin temelleri [Metin]: ders kitabı. ödenek / V.V. V. Sapozhnikov. - M .: Rota, 2004. - 318 s.

3. Serdakov, A. S. Otomatik kontrol ve teknik teşhis [Metin] / A. S. Serdakov. - Kiev: Teknoloji, 1971. - 244 s.

4. Stetsyuk. A. E. “Teknik teşhisin temelleri. Tanıma Teorisi": ders kitabı. ödenek / A. E. Stetsyuk, Ya. - Habarovsk: DVGUPS yayınevi, 2012. - 69 s.

Allbest.ru'da yayınlandı

Benzer belgeler

    Olasılıksal nitelikteki problemleri çözmek için en tipik algoritmaların incelenmesi. Kombinatorik elemanlarına aşinalık, urn teorisi, Bayes formülü, ayrık, sürekli rastgele değişkenleri bulma yöntemleri. Olay cebirinin temellerinin ele alınması.

    eğitim kılavuzu, 05/06/2010 eklendi

    Belirli bir olayın meydana gelme olasılığının belirlenmesi ve değerlendirilmesi. Toplama ve çarpma teoremini, toplam olasılık formülünü veya Bayes'i kullanarak bir problemi çözmeye yönelik bir teknik. Bernoulli şemasının problem çözümünde uygulanması. Kare sapmanın hesaplanması.

    pratik çalışma, 23.08.2015 eklendi

    Olasılığın istatistiksel, aksiyomatik ve klasik tanımı. Ayrık rastgele değişkenler. Laplace ve Poisson'un limit teoremleri. Çok değişkenli rastgele değişkenler için olasılık dağılım fonksiyonu. Bayes'in formülü. Varyansın nokta tahmini.

    Hile sayfası, 05/04/2015 eklendi

    Bayes formülünü kullanarak bir tüzel kişilik ve bir birey tarafından bir kredinin geri ödenmeme olasılığının hesaplanması. Örneklem varyansının hesaplanması, metodolojisi, ana aşamaları. Rastgele alınan üç topun içinden beyaz bir topun düşme olasılığının belirlenmesi ve sonucun gerekçelendirilmesi.

    test, eklendi: 02/11/2014

    Olasılık teorisi formüllerinin ve yasalarının problem çözümünde uygulanması. Bayes formülü, istatistiksel olarak birbirine bağlı başka bir olayın meydana gelmesi koşuluyla, bir olayın olasılığını belirlemenize olanak tanır. Merkezi Limit Teoremi.

    kurs çalışması, eklendi 11/04/2015

    Rastgele sonuçlu bir deney. İstatistiksel kararlılık. Olasılık kavramı. Olayların cebiri. Olaylar için dualite ilkesi. Koşullu olasılıklar. Olasılıkların toplanması ve çarpımı için formüller. Bayes'in formülü. Temel olayların alanı.

    özet, 12/03/2007 eklendi

    Bir zar bir kez atıldığında en az 4 puan alma olasılığının belirlenmesi. Bayes formülünü kullanarak bir parçanın (montajcı tarafından rastgele alınan parçanın mükemmel kalitede çıkması durumunda) ilk fabrika tarafından üretilme olasılığının belirlenmesi.

    test, 29.05.2012 eklendi

    Onarılamaz nesnelerin güvenilirliğinin göstergeleri olarak güvenilirlik göstergeleri. Olasılığın klasik ve geometrik tanımı. Rastgele bir olayın sıklığı ve olasılığın "istatistiksel tanımı". Olasılık toplama ve çarpma teoremleri.

    kurs çalışması, eklendi 11/18/2011

    Ayrık rastgele değişkenler ve dağılımları. Toplam olasılık formülü ve Bayes formülü. Matematiksel beklentinin genel özellikleri. Rastgele bir değişkenin varyansı. Rasgele bir değişkenin dağılım fonksiyonu. Olasılığın klasik tanımı.

    test, 12/13/2010 eklendi

    Olayların veya süreçlerin matematiksel modelleri. Basit yineleme yönteminin yakınsaması. Bir posteriori hata tahmini. Doğrusal sistemlerin dönme yöntemi. Doğrudan yöntem çerçevesinde doğruluk ve yaklaşık çözümün kontrolü. Gevşeme yöntemi ve Gauss yöntemi.