Phương pháp Bayesian trong chẩn đoán kỹ thuật. Phương pháp nhận dạng thống kê

Cho đến nay, một số lượng lớn các phương pháp đã được phát triển, việc sử dụng chúng giúp nhận biết loại tình trạng kỹ thuật của đối tượng được chẩn đoán. Bài viết này chỉ thảo luận về một số trong số chúng, được sử dụng rộng rãi nhất trong thực hành chẩn đoán.

Phương pháp Bayes

Phương pháp chẩn đoán dựa trên việc áp dụng công thức Bayes đề cập đến các phương pháp nhận dạng thống kê.

Xác suất của sự kiện MỘT,điều này chỉ có thể xảy ra khi một trong những sự kiện không tương thích 2 xảy ra? 1? TRONG 2 ,..., Trong p, bằng tổng tích các xác suất của từng sự kiện này với xác suất tương ứng của sự kiện đó MỘT:

Công thức này được gọi là công thức tổng xác suất. Hệ quả tất yếu của định lý nhân và công thức xác suất tổng là cái gọi là lý thuyết giả thuyết. Hãy giả sử rằng sự kiện MỘT chỉ có thể xảy ra khi một trong những sự kiện không tương thích xảy ra TRONG, B 2, ..., Trong p, nhưng vì không biết trước điều nào trong số chúng sẽ xảy ra nên chúng được gọi là giả thuyết. Xác suất xảy ra sự kiện A được xác định bằng công thức tổng xác suất (1.5) và xác suất có điều kiện RA (B/) theo công thức

Thay thế giá trị R(L), chúng tôi nhận được

Công thức (1.6) được gọi là công thức Bayes. Nó cho phép xác suất của các giả thuyết được đánh giá lại sau khi biết kết quả của thử nghiệm trong đó sự kiện xảy ra. MỘT.

Xác định mức độ xác suất có điều kiện của sự xuất hiện của một đặc điểm là chìa khóa để sử dụng công thức Bayes để chẩn đoán một tình trạng. Phương pháp Bayes được sử dụng rộng rãi trong khoa học điều khiển, phát hiện tín hiệu và lý thuyết nhận dạng mẫu cũng như chẩn đoán y tế và kỹ thuật.

Chúng ta hãy xem xét bản chất của phương pháp liên quan đến nhiệm vụ chẩn đoán. Mặt toán học của vấn đề được trình bày chi tiết trong tác phẩm Ts3]. Trong quá trình hoạt động, bất kỳ đối tượng nào cũng có thể ở một trong các trạng thái có thể là TVj, ...,Nj(trong trường hợp đơn giản nhất - “chuẩn mực”, “từ chối”), được gán các giả thuyết (chẩn đoán) Z)j,...,Z); . Trong quá trình vận hành cơ sở, các thông số (dấu hiệu) được theo dõi ĐẾN, ..., kj. Xác suất xuất hiện chung của trạng thái Z)- và thuộc tính trong một đối tượng kj xác định

Ở đâu Р(Dj)- xác suất chẩn đoán DJ,được xác định bằng số liệu thống kê:

Ở đâu N- số lượng đối tượng được khảo sát;

Nj- số lượng trạng thái;

P(kj/Dj) kjđối với các đối tượng có trạng thái Dj. Nếu trong số Nđối tượng có chẩn đoán DJ, cho thấy một dấu hiệu kj, Cái đó

P(cr- xác suất xuất hiện của một dấu hiệu kj trong tất cả các đối tượng, bất kể tình trạng (chẩn đoán) của đối tượng. Hãy từ tổng số N ký hiệu đồ vật kjđã được tìm thấy ở rij các đồ vật thì

P(Dj/kj) - xác suất chẩn đoán Z); sau khi đã biết rằng đối tượng được đề cập có đặc điểm ĐẾN-.

Công thức Bayes tổng quát áp dụng cho trường hợp khảo sát được thực hiện theo tập hợp các đặc điểm ĐẾN, bao gồm cả dấu hiệu (ku, k p). Mỗi dấu hiệu kjrrij cấp bậc (, ĐẾN d,

kj2 , ..., kj s, ..., k jm). Theo kết quả của cuộc kiểm tra, nó được biết đến

thực hiện đặc tính k.-k. và toàn bộ các dấu hiệu phức tạp ĐẾN. TRONG-

deke có nghĩa là ý nghĩa cụ thể của một tính năng. Công thức Bayes cho tập đặc trưng có dạng

Ở đâu P(Dj/A*) - xác suất chẩn đoán? D sau khi biết được kết quả kiểm tra dựa trên một tập hợp các dấu hiệu ĐẾN;

P(Dj)- xác suất chẩn đoán sơ bộ Dj.

Giả định rằng hệ thống chỉ ở một trong các trạng thái được chỉ định, tức là

Để xác định xác suất chẩn đoán bằng phương pháp Bayes, ma trận chẩn đoán được hình thành dựa trên tài liệu thống kê sơ bộ (Bảng 1.1). Số lượng dòng tương ứng với số lượng chẩn đoán có thể. Số cột được tính bằng tổng các tích của số đặc điểm và số chữ số tương ứng cộng với một cho xác suất chẩn đoán trước đó. Bảng này chứa xác suất của các loại ký tự cho các chẩn đoán khác nhau. Nếu được công nhận

ki là hai chữ số (ký hiệu đơn giản “có - không”) thì trong bảng chỉ đủ để chỉ ra xác suất xuất hiện của ký hiệu đó R(k-/Dj). Xác suất thiếu tính năng I. Thuận tiện hơn

sử dụng một dạng thống nhất, ví dụ, giả sử đối với dấu hiệu có hai chữ số. Cần làm rõ rằng , Ở đâu nij- số chữ số thuộc tính kj. Tổng xác suất của tất cả các triển khai có thể có của một tính năng bằng một. Quy tắc quyết định là quy tắc mà theo đó quyết định về chẩn đoán được đưa ra. Trong phương pháp Bayes, một đối tượng có nhiều đặc điểm phức tạp ftđề cập đến chẩn đoán có xác suất (sau) cao nhất ft e Dj, Nếu như P(Dj/lt) >

> P(Dj/ft) (J - 1, 2, ..., n i*j). Quy tắc này thường được cải tiến bằng cách đưa ra giá trị ngưỡng cho xác suất chẩn đoán P(Dj/ft) >

>Pj,Ở đâu Pj- mức độ nhận dạng được chọn trước để chẩn đoán Dj. Trong trường hợp này, xác suất chẩn đoán cạnh tranh gần nhất không cao hơn 1 - Pj. Thường được chấp nhận P ( > 0,9. Cho rằng PiD/t?) quyết định về chẩn đoán không được đưa ra và cần có thêm thông tin.

Bảng 1.1

Ma trận chẩn đoán theo phương pháp Bayes

Dấu hiệu kj

R(k 12 /

R(k 22 /

R(k p /

Ví dụ. Một đầu máy diesel đang được giám sát. Trong trường hợp này, hai dấu hiệu được kiểm tra: ĐẾN- tăng mức tiêu thụ nhiên liệu diesel hàng giờ ở vị trí danh nghĩa của bộ điều khiển người lái hơn 10% giá trị định mức, đến 2- giảm công suất của máy phát điện diesel đặt ở vị trí danh định của bộ điều khiển người lái hơn 15% giá trị định mức. Giả sử rằng sự xuất hiện của các dấu hiệu này có liên quan đến sự mài mòn ngày càng tăng của các bộ phận của nhóm xi lanh-piston (chẩn đoán /)]) hoặc do trục trặc của thiết bị nhiên liệu (chẩn đoán Đ2). Nếu động cơ diesel ở tình trạng tốt (chẩn đoán D 3) ký tên ĐẾN không được quan sát, nhưng là một dấu hiệu đến 2 quan sát thấy trong 7% trường hợp. Theo dữ liệu thống kê, người ta xác định rằng 60% động cơ được chẩn đoán mắc bệnh Z) 3 đã được sửa đổi trước khi sửa chữa theo lịch trình. D 2- 30%, với chẩn đoán Z)j - 10%. Người ta cũng nhận thấy rằng dấu hiệu ĐẾN j ở trạng thái Z)| xảy ra ở 10% và trong điều kiện D 2 - trong 40% trường hợp; dấu hiệu đến 2ở trạng thái Z)| xảy ra ở 15% và trong điều kiện D 2- trong 20% ​​trường hợp. Chúng tôi trình bày thông tin ban đầu dưới dạng bảng. 1.2.

Bảng 1.2

Xác suất của tình trạng và biểu hiện của triệu chứng

R(k 2 / MỘT)

Hãy tính xác suất của các trạng thái cho các tùy chọn khác nhau để triển khai các tính năng được kiểm soát:

1. Dấu hiệu ĐẾNđến 2 tìm thấy thì:

2. Ký tên ĐẾNđược phát hiện, ký đến 2 vắng mặt.

Sự vắng mặt của dấu hiệu tôi có nghĩa là sự hiện diện của một dấu hiệu ĐẾN.(sự kiện ngược lại) và P(k./D.)-- P(k./D.).

3. Ký tên ĐẾN 2 phát hiện, ký ĐẾN vắng mặt:

4. Dấu hiệu /:| Và đến 2 mất tích:

Phân tích kết quả tính toán thu được cho phép chúng tôi rút ra các kết luận sau:

  • 1. Sự hiện diện của hai dấu hiệu k và k 2 s xác suất 0,942 chỉ ra điều kiện DJ
  • 2. Sự hiện diện của một dấu hiệu ĐẾN với xác suất 0,919 cho biết điều kiện D 2(sự cố thiết bị nhiên liệu).
  • 3. Sự hiện diện của một dấu hiệu đến 2 với xác suất 0,394 cho biết điều kiện D 2(trục trặc thiết bị nhiên liệu) và với xác suất 0,459 ở trạng thái Z) 3 (điều kiện thích hợp). Với tỷ lệ xác suất như vậy việc ra quyết định rất khó khăn nên cần phải kiểm tra bổ sung.
  • 4. Sự vắng mặt của cả hai dấu hiệu với xác suất 0,717 cho thấy tình trạng tốt (Z) 3).
Hiện nay, các phương pháp Bayesian đã trở nên khá phổ biến và được sử dụng tích cực trong nhiều lĩnh vực kiến ​​thức. Tuy nhiên, thật không may, không nhiều người biết nó là gì và tại sao lại cần thiết. Một trong những lý do là thiếu một lượng lớn tài liệu bằng tiếng Nga. Vì vậy, ở đây tôi sẽ cố gắng trình bày các nguyên tắc của họ một cách đơn giản nhất có thể, bắt đầu từ những điều cơ bản nhất (tôi xin lỗi nếu điều này có vẻ quá đơn giản đối với một số người).

Trong tương lai, tôi muốn chuyển sang phân tích Bayesian và nói về việc xử lý dữ liệu thực và theo ý kiến ​​​​của tôi, một sự thay thế tuyệt vời cho ngôn ngữ R (một chút đã được viết về nó) - Python với pymc mô-đun. Cá nhân tôi thấy Python rõ ràng và logic hơn nhiều so với R với các gói và LỖI, đồng thời Python cung cấp nhiều hơn thế tự do và linh hoạt hơn (mặc dù Python có những khó khăn riêng nhưng chúng có thể vượt qua và chúng không thường gặp trong phân tích đơn giản).

Một chút lịch sử

Như một ghi chú lịch sử ngắn gọn, tôi sẽ nói rằng công thức Bayes đã được xuất bản vào năm 1763, 2 năm sau cái chết của tác giả nó, Thomas Bayes. Tuy nhiên, các phương pháp sử dụng nó chỉ thực sự phổ biến vào cuối thế kỷ XX. Điều này được giải thích là do việc tính toán đòi hỏi một số chi phí tính toán nhất định và chúng chỉ trở nên khả thi khi có sự phát triển của công nghệ thông tin.

Về xác suất và định lý Bayes

Công thức Bayes và mọi thứ tiếp theo đòi hỏi sự hiểu biết về xác suất. Bạn có thể đọc thêm về xác suất trên Wikipedia.
Trong thực tế, xác suất xảy ra một sự kiện là tần suất xuất hiện của sự kiện này, nghĩa là tỷ lệ giữa số lượng quan sát của sự kiện trên tổng số quan sát đối với tổng số quan sát lớn (về mặt lý thuyết là vô hạn).
Hãy xem xét thí nghiệm sau: chúng ta gọi bất kỳ số nào từ phân đoạn và thấy rằng số này nằm trong khoảng, ví dụ: 0,1 và 0,4. Như bạn có thể đoán, xác suất của sự kiện này sẽ bằng tỷ lệ độ dài của đoạn đó với tổng chiều dài của đoạn đó (nói cách khác là tỷ lệ của “số” các giá trị có thể xảy ra bằng nhau so với tổng “số” giá trị), tức là (0,4 - 0,1) / (1 - 0) = 0,3 , tức là xác suất lọt vào phân khúc là 30%.

Bây giờ chúng ta xét bình phương của x.

Giả sử chúng ta phải đặt tên cho các cặp số (x, y), mỗi số lớn hơn 0 và nhỏ hơn một. Xác suất để x (số thứ nhất) nằm trong đoạn thẳng (thể hiện trong hình thứ nhất là vùng màu xanh, hiện tại số thứ hai y không quan trọng đối với chúng ta) bằng tỉ số diện tích của vùng màu xanh lam so với diện tích của toàn bộ hình vuông, tức là (0,4 - 0,1 ) * (1 - 0) / (1 * 1) = 0,3, tức là 30%. Do đó chúng ta có thể viết rằng xác suất để x thuộc phân khúc là p(0,1<= x <= 0.4) = 0.3 или для краткости p(X) = 0.3.
Nếu bây giờ chúng ta nhìn vào y, thì tương tự, xác suất để y nằm trong đoạn thẳng bằng tỉ số diện tích của phần màu xanh lá cây với diện tích của toàn bộ hình vuông p(0,5<= y <= 0.7) = 0.2, или для краткости p(Y) = 0.2.
Bây giờ hãy xem chúng ta có thể tìm hiểu những gì về giá trị của cả x và y.
Nếu muốn biết xác suất để x và y đồng thời nằm trong các đoạn thẳng tương ứng cho trước là bao nhiêu thì chúng ta cần tính tỉ số giữa vùng tối (giao điểm của vùng xanh lục và xanh lam) với diện tích của toàn bộ phần đó. hình vuông: p(X, Y) = (0,4 - 0,1 ) * (0,7 - 0,5) / (1 * 1) = 0,06.

Bây giờ giả sử chúng ta muốn biết xác suất để y nằm trong khoảng là bao nhiêu nếu x đã nằm trong khoảng đó. Trên thực tế, tức là chúng ta có một bộ lọc và khi đặt tên cho các cặp (x, y), chúng ta sẽ loại bỏ ngay những cặp không thỏa mãn điều kiện x nằm trong một khoảng nhất định, sau đó từ các cặp đã lọc, chúng ta đếm những cặp đó cho mà y thỏa mãn điều kiện của chúng ta và coi xác suất là tỷ lệ giữa số cặp mà y nằm trong phân đoạn nêu trên trên tổng số cặp được lọc (nghĩa là x nằm trong phân đoạn). Chúng ta có thể viết xác suất này là p(Y|X). Rõ ràng, xác suất này bằng tỷ lệ diện tích của vùng tối (giao điểm của vùng xanh lục và xanh lam) với diện tích của vùng màu xanh lam. Diện tích của vùng tối là (0,4 - 0,1) * (0,7 - 0,5) = 0,06 và diện tích của vùng màu xanh là (0,4 - 0,1) * (1 - 0) = 0,3, khi đó tỷ lệ của chúng là 0,06 / 0,3 = 0,2. Nói cách khác, xác suất tìm thấy y trên phân khúc cho rằng x đã thuộc phân khúc đó là p(Y|X) = 0,2.
Có thể lưu ý rằng có tính đến tất cả các ký hiệu trên và tất cả các ký hiệu trên, chúng ta có thể viết biểu thức sau
p(Y|X) = p(X, Y) / p(X)

Bây giờ chúng ta hãy tái tạo ngắn gọn tất cả logic trước đó liên quan đến p(X|Y): chúng ta đặt tên cho các cặp (x, y) và lọc những cặp mà y nằm trong khoảng từ 0,5 đến 0,7, khi đó xác suất x nằm trong khoảng với điều kiện là y thuộc đoạn bằng tỉ số giữa diện tích vùng tối và diện tích phần xanh:
p(X|Y) = p(X, Y) / p(Y)

Trong hai công thức trên, chúng ta thấy số hạng p(X, Y) giống nhau và chúng ta có thể loại bỏ nó:

Chúng ta có thể viết lại đẳng thức cuối cùng là

Đây là định lý Bayes.
Cũng rất thú vị khi lưu ý rằng p(Y) thực sự là p(X,Y) với tất cả các giá trị của X. Nghĩa là, nếu chúng ta lấy vùng tối và kéo dài nó sao cho nó bao phủ tất cả các giá trị của X, nó sẽ đi theo vùng màu xanh lá cây một cách chính xác, có nghĩa là nó sẽ bằng p(Y). Trong ngôn ngữ toán học, điều này có nghĩa như sau:
Khi đó chúng ta có thể viết lại công thức Bayes như sau:

Ứng dụng định lý Bayes

Hãy xem ví dụ sau. Lấy một đồng xu và lật nó 3 lần. Với xác suất bằng nhau chúng ta có thể nhận được các kết quả sau (O - ngửa, P - đuôi): OOO, OOR, ORO, ORR, ROO, ROR, RPO, RRR.

Chúng ta có thể đếm được có bao nhiêu mặt ngửa xuất hiện trong mỗi trường hợp và bao nhiêu lần có sự thay đổi đầu-sấp, sấp-ngửa:

Chúng ta có thể coi số lần ngửa và số lần thay đổi là hai biến ngẫu nhiên. Khi đó bảng xác suất sẽ như sau:

Bây giờ chúng ta có thể thấy công thức Bayes đang hoạt động.
Nhưng trước tiên, hãy vẽ một sự tương tự với hình vuông mà chúng ta đã xem xét trước đó.
Bạn có thể nhận thấy rằng p(1O) là tổng của cột thứ ba (“diện tích màu xanh” của hình vuông) và bằng tổng của tất cả các giá trị ô trong cột này: p(1O) = 2/8 + 1/8 = 3/8
p(1С) là tổng của hàng thứ ba (“diện tích xanh” của hình vuông) và tương tự, bằng tổng của tất cả các giá trị ô trong hàng này p(1С) = 2/8 + 2/ 8 = 4/8
Xác suất để chúng ta có một đầu và một lần thay đổi bằng giao điểm của các khu vực này (nghĩa là giá trị trong ô giao điểm của cột thứ ba và hàng thứ ba) p(1C, 1O) = 2/8
Sau đó, theo các công thức được mô tả ở trên, chúng ta có thể tính xác suất nhận được một thay đổi nếu chúng ta có được một quả đầu trong ba lần ném:
p(1C|1O) = p(1C, 1O) / p(1O) = (2/8) / (3/8) = 2/3
hoặc xác suất có được một mặt ngửa nếu chúng ta có một sự thay đổi:
p(1O|1C) = p(1C, 1O) / p(1C) = (2/8) / (4/8) = 1/2
Nếu chúng ta tính xác suất nhận được một thay đổi nếu có một đầu p(1O|1C) thông qua công thức Bayes, chúng ta sẽ nhận được:
p(1O|1C) = p(1C|1O) * p(1O) / p(1C) = (2/3) * (3/8) / (4/8) = 1/2
Đó là những gì chúng tôi đã nhận được ở trên.

Nhưng ví dụ trên có ý nghĩa thực tế gì?
Thực tế là khi phân tích dữ liệu thực, chúng ta thường quan tâm đến một số tham số của dữ liệu này (ví dụ: giá trị trung bình, phương sai, v.v.). Sau đó, chúng ta có thể rút ra sự tương tự sau với bảng xác suất ở trên: đặt các hàng là dữ liệu thử nghiệm của chúng ta (hãy biểu thị chúng là Dữ liệu) và các cột là các giá trị có thể có của tham số của dữ liệu này mà chúng ta quan tâm (hãy biểu thị nó ). Sau đó, chúng tôi quan tâm đến xác suất thu được một giá trị tham số nhất định dựa trên dữ liệu có sẵn.
Chúng ta có thể áp dụng công thức Bayes và viết như sau:

Và nhớ lại công thức có tích phân, chúng ta có thể viết như sau:

Trên thực tế, đó là kết quả của phân tích của chúng tôi, chúng tôi có xác suất là một hàm của tham số. Ví dụ, bây giờ chúng ta có thể tối đa hóa hàm này và tìm giá trị có thể xảy ra nhất của tham số, tính toán độ phân tán và giá trị trung bình của tham số, tính ranh giới của đoạn mà tham số chúng ta quan tâm nằm trong xác suất là 95 %, vân vân.

Xác suất được gọi là xác suất sau. Và để tính được nó chúng ta cần phải có
- hàm khả năng và - xác suất trước.
Hàm khả năng được xác định bởi mô hình của chúng tôi. Nghĩa là, chúng tôi tạo ra một mô hình thu thập dữ liệu phụ thuộc vào tham số mà chúng tôi quan tâm. Ví dụ: chúng tôi muốn nội suy dữ liệu bằng cách sử dụng đường thẳng y = a * x + b (do đó chúng tôi giả định rằng tất cả dữ liệu có mối quan hệ tuyến tính với nhiễu Gaussian được đặt trên đó với một phương sai đã biết). Khi đó a và b là các tham số của chúng ta và chúng ta muốn biết các giá trị có khả năng xảy ra nhất của chúng và hàm khả năng là một Gaussian với giá trị trung bình được cho bởi phương trình của đường thẳng và một phương sai nhất định.
Xác suất trước bao gồm thông tin mà chúng tôi biết trước khi thực hiện phân tích. Ví dụ: chúng tôi biết chắc chắn rằng một đường phải có độ dốc dương hoặc giá trị tại điểm chặn x phải dương - tất cả những điều này và hơn thế nữa chúng tôi có thể kết hợp vào phân tích của mình.
Như bạn có thể thấy, mẫu số của một phân số là tích phân (hoặc trong trường hợp các tham số chỉ có thể lấy một số giá trị rời rạc nhất định là tổng) của tử số trên tất cả các giá trị có thể có của tham số. Trong thực tế, điều này có nghĩa là mẫu số là một hằng số và dùng để chuẩn hóa xác suất hậu nghiệm (nghĩa là sao cho tích phân của xác suất hậu nghiệm bằng 1).

Đến đây tôi xin kết thúc bài viết của mình (tiếp theo)

PHƯƠNG PHÁP PHÂN TÍCH TRÌNH TỰ

PHƯƠNG PHÁP BAYES

Đề cương bài giảng

Phân tích và kiểm tra bài tập về nhà

Thời điểm tổ chức

Tiến độ của bài giảng.

Bài giảng 9

Chủ thể. PHƯƠNG PHÁP NHẬN DẠNG THỐNG KÊ

Mục tiêu. Đưa ra khái niệm nhận dạng tín hiệu số.

1. Giáo dục. Giải thích quá trình nhận dạng tín hiệu số.

2. Phát triển. Phát triển tư duy logic và thế giới quan tự nhiên - khoa học.

3. giáo dục. Nuôi dưỡng sự quan tâm đến những thành tựu và khám phá khoa học trong ngành viễn thông.

Kết nối liên ngành:

· Hỗ trợ: khoa học máy tính, toán học, công nghệ máy tính và MP, hệ thống lập trình.

· Cung cấp: Thực tập

Hỗ trợ về phương pháp và thiết bị:

1. Phát triển phương pháp của bài học.

2. Chương trình giảng dạy.

3. Chương trình giảng dạy

4. Chương trình làm việc.

5. Tóm tắt an toàn.

Đồ dùng dạy học kỹ thuật: máy tính cá nhân.

Cung cấp việc làm:

· Sách bài tập

3. Trả lời các câu hỏi:

1. Sự khác biệt giữa tín hiệu số và tín hiệu analog là gì?

2. Những loại sơ đồ nào được sử dụng khi thực hiện phép đo?

3. Hãy mô tả ngắn gọn về mỗi lớp.

4. Dùng gì để vẽ sơ đồ mắt?

5. Giải thích bản chất của sơ đồ mắt.

· Cơ sở của phương pháp

  • Công thức Bayes tổng quát.

· Ma trận chẩn đoán.

Quy tắc quyết định

· Cơ sở của phương pháp.

· Quy trình chung của phương pháp.

· Kết nối ranh giới quyết định với xác suất xảy ra lỗi loại thứ nhất và loại thứ hai.

Ưu điểm chính của phương pháp nhận dạng thống kê là khả năng tính đến đồng thời các dấu hiệu có bản chất vật lý khác nhau, vì chúng được đặc trưng bởi các đại lượng không thứ nguyên - xác suất xuất hiện của chúng trong các trạng thái khác nhau của hệ thống..

Trong số các phương pháp chẩn đoán kỹ thuật có một phương pháp dựa trên công thức Bayes tổng quát ( Định lý Bayes (hay công thức Bayes) là một trong những định lý chính của lý thuyết xác suất, cho phép bạn xác định xác suất mà một sự kiện (giả thuyết) đã xảy ra khi chỉ có bằng chứng gián tiếp (dữ liệu), có thể không chính xác ), giữ một vị trí đặc biệt do tính đơn giản và hiệu quả của nó.

Phương pháp Bayes có nhược điểm:một lượng lớn thông tin sơ bộ, “loại bỏ” các chẩn đoán hiếm gặp, v.v. Tuy nhiên, trong trường hợp khối lượng dữ liệu thống kê cho phép sử dụng phương pháp Bayes, thì nên sử dụng nó như một trong những phương pháp đáng tin cậy và hiệu quả nhất.

Cơ bản của phương pháp. Phương pháp này dựa trên công thức Bayes đơn giản. Nếu có chẩn đoán tôi và một dấu hiệu đơn giản ki , xảy ra với chẩn đoán này, thì xác suất xảy ra chung của các sự kiện (sự hiện diện của trạng thái Di trong đối tượng và ký hiệu ki )



Từ đẳng thức này tuân theo công thức Bayes

(3.2)

Điều rất quan trọng là xác định ý nghĩa chính xác của tất cả các đại lượng có trong công thức này.

P(Di) - xác suất trước của giả thuyết D

P(ki/Di) - xác suất của giả thuyết ki khi xảy ra sự kiện D (xác suất hậu nghiệm - xác suất của một sự kiện ngẫu nhiên, với điều kiện là dữ liệu hậu nghiệm đã biết, tức là thu được sau thí nghiệm.)

P(ki) - tổng xác suất xảy ra sự kiện ki

P(Di/ki) - xác suất xảy ra sự kiện Di nếu giả thuyết ki là đúng

P(D) - xác suất chẩn đoán D, được xác định bằng số liệu thống kê (xác suất chẩn đoán trước). Vì vậy, nếu kiểm tra trước Nđối tượng và W,-đối tượng có trạng thái D thì

P(D i) = N i /N.(3.3)

P (kj/Di) - xác suất xuất hiện đặc điểm k j; đối với các đối tượng có trạng thái Di. Nếu trong số Ni, đối tượng được chẩn đoán mắc Di, N ij một dấu hiệu xuất hiện k j Cái đó

(3.4)

P(kj) - xác suất xuất hiện của dấu hiệu kj trong tất cả các đối tượng, bất kể tình trạng (chẩn đoán) của đối tượng. Hãy từ tổng số N ký hiệu đồ vật ĐẾN )đã được tìm thấy ở Nj các đồ vật thì

(3.5)

Trong sự bình đẳng (3.2) R ( Di/kj)- xác suất chẩn đoán D sau khi biết rằng đối tượng được đề cập có đặc điểm kj (xác suất chẩn đoán sau ).

Giới thiệu

Phương pháp Bayes đề cập đến các phương pháp nhận dạng thống kê, ưu điểm chính của nó là khả năng tính đến đồng thời các đặc điểm có tính chất vật lý khác nhau. Điều này là do thực tế là tất cả các dấu hiệu được đặc trưng bởi các đại lượng không thứ nguyên - xác suất xuất hiện của chúng trong các trạng thái khác nhau của hệ thống.

Phương pháp Bayes, do tính đơn giản và hiệu quả của nó, chiếm một vị trí đặc biệt trong các phương pháp chẩn đoán kỹ thuật, mặc dù nó cũng có những nhược điểm, chẳng hạn như một lượng lớn thông tin sơ bộ, “ngăn chặn” các chẩn đoán hiếm gặp, v.v. khối lượng thông tin thống kê cho phép sử dụng phương pháp Bayes, nên sử dụng nó như một trong những phương pháp đáng tin cậy và hiệu quả nhất.

Khái niệm cơ bản về phương pháp Bayes

Phương pháp này dựa trên công thức Bayes (công thức tính xác suất của các giả thuyết).

Nếu có chẩn đoán D Tôi và một dấu hiệu đơn giản k j , xảy ra với chẩn đoán này, thì xác suất xảy ra chung của các sự kiện (sự hiện diện của điều kiện trong đối tượng D Tôi và ký tên k j), được xác định theo công thức:

P(D Tôi k j ) = P(D Tôi ) P (k j /D Tôi ) = P (k j ) P (D Tôi / k j ). (1.1.)

Từ đẳng thức này tuân theo công thức Bayes:

P(D Tôi / k j ) = P(D Tôi ) P(k Tôi /D Tôi )/P(k j ) (1.2.)

Điều rất quan trọng là xác định ý nghĩa chính xác của tất cả các đại lượng có trong công thức này.

P(D Tôi) --xác suất chẩn đoán D Tôi, được xác định từ số liệu thống kê ( xác suất chẩn đoán trước). Vì vậy, nếu kiểm tra trước Nđồ vật và N Tôiđối tượng có một điều kiện D Tôi, Cái đó

P(D Tôi) = N Tôi /N. (1.3.)

P (k j /D Tôi k j đối với các đối tượng có trạng thái D Tôi .

Nếu trong số N Tôiđối tượng có chẩn đoán D Tôi, y N ij một dấu hiệu xuất hiện k j , thì xác suất tương quan Bayes

P(k j /D Tôi) = N ij /N Tôi . (1.4.)

P(k j) -- xác suất xuất hiện dấu hiệu k j trong tất cả các đối tượng, bất kể trạng thái (chẩn đoán) của đối tượng. Hãy từ tổng số N ký hiệu đồ vật k jđã được tìm thấy ở N j các đồ vật thì

P(k j ) = N j /N. (1.5.)

Để thiết lập chẩn đoán, tính toán đặc biệt P(kj) không cần thiết. Như sẽ được làm rõ từ phần tiếp theo, ý nghĩa P(D Tôi)Và P (k j /D Tôi), đã biết với tất cả các trạng thái có thể, hãy xác định giá trị P(k j ).

Bình đẳng P (D Tôi /k j) - xác suất chẩn đoán D Tôi sau khi đã biết rằng đối tượng được đề cập có đặc điểm k j (xác suất chẩn đoán sau).

Gửi tác phẩm tốt của bạn tới cơ sở kiến ​​thức thật dễ dàng. Sử dụng mẫu dưới đây

Các sinh viên, nghiên cứu sinh, các nhà khoa học trẻ sử dụng nền tảng kiến ​​thức trong học tập và công việc sẽ rất biết ơn các bạn.

Đăng trên http://www.allbest.ru/

Giới thiệu

Phương pháp Bayes đề cập đến các phương pháp nhận dạng thống kê, ưu điểm chính của nó là khả năng tính đến đồng thời các đặc điểm có tính chất vật lý khác nhau. Điều này là do thực tế là tất cả các dấu hiệu được đặc trưng bởi các đại lượng không thứ nguyên - xác suất xuất hiện của chúng trong các trạng thái khác nhau của hệ thống.

Phương pháp Bayes, do tính đơn giản và hiệu quả của nó, chiếm một vị trí đặc biệt trong các phương pháp chẩn đoán kỹ thuật, mặc dù nó cũng có những nhược điểm, chẳng hạn như một lượng lớn thông tin sơ bộ, “ngăn chặn” các chẩn đoán hiếm gặp, v.v. khối lượng thông tin thống kê cho phép sử dụng phương pháp Bayes, nên sử dụng nó như một trong những phương pháp đáng tin cậy và hiệu quả nhất.

1. Cơ bản về phương pháp Bayes

Phương pháp này dựa trên công thức Bayes (công thức tính xác suất của các giả thuyết).

Nếu có chẩn đoán D Tôi và một dấu hiệu đơn giản k j , xảy ra với chẩn đoán này, thì xác suất xảy ra chung của các sự kiện (sự hiện diện của điều kiện trong đối tượng D Tôi và ký tên k j), được xác định theo công thức:

P(D Tôik j) = P(D Tôi) P (k j/D Tôi) = P (k j) P (D Tôi/ k j). (1.1.)

Từ đẳng thức này tuân theo công thức Bayes:

P(D Tôi/ k j) = P(D Tôi) P(k Tôi/D Tôi)/P(k j ) (1.2.)

Điều rất quan trọng là xác định ý nghĩa chính xác của tất cả các đại lượng có trong công thức này.

P(D Tôi) --xác suất chẩn đoán D Tôi, được xác định từ số liệu thống kê ( xác suất chẩn đoán trước). Vì vậy, nếu kiểm tra trước Nđồ vật và N Tôiđối tượng có một điều kiện D Tôi, Cái đó

P(D Tôi) = N Tôi/N. (1.3.)

P (k j/D Tôi k j đối với các đối tượng có trạng thái D Tôi.

Nếu trong số N Tôi đối tượng có chẩn đoán D Tôi, y N ij một dấu hiệu xuất hiện k j , thì xác suất tương quan Bayes

P(k j/D Tôi) = N ij/N Tôi. (1.4.)

P(k j) -- xác suất xuất hiện dấu hiệu k j trong tất cả các đối tượng, bất kể trạng thái (chẩn đoán) của đối tượng. Hãy từ tổng số N ký hiệu đồ vật k j đã được tìm thấy ở N j các đồ vật thì

P(k j ) = N j/N. (1.5.)

Để thiết lập chẩn đoán, tính toán đặc biệt P(kj ) không cần thiết. Như sẽ rõ ràng từ những gì sau đây , giá trị P(D Tôi)Và P (k j / D Tôi), đã biết với tất cả các trạng thái có thể, hãy xác định giá trị P(k j ).

Bình đẳng P (D Tôi/k j) - xác suất chẩn đoán D Tôi sau khi đã biết rằng đối tượng được đề cập có đặc điểm k j (một niềm tin hậu thếTchẩn đoán).

2 . Công thức Bayes tổng quát

Công thức này áp dụng cho trường hợp việc kiểm tra được thực hiện theo bộ dấu hiệu ĐẾN , bao gồm cả dấu hiệu k 1 , k 2 , ..., k v . Mỗi dấu hiệu k j tôi j xếp hạng ( k j tôi, k j 2 , ..., k js, ...,). Theo kết quả của việc kiểm tra, việc thực hiện đặc tính sẽ được biết đến

k j * = k js (1.5.)

và toàn bộ các dấu hiệu phức tạp K*. chỉ mục *, như trước đây, có nghĩa là ý nghĩa cụ thể (sự hiện thực hóa) của thuộc tính. Công thức Bayes cho tập đặc trưng có dạng

P(D Tôi/ ĐẾN * )= P(D Tôi)P(ĐẾN */D Tôi)/P(ĐẾN * )(Tôi = 1, 2, ..., N), (1.6.)

Ở đâu P (D Tôi/ ĐẾN * ) --xác suất chẩn đoán D Tôi sau khi kết quả kiểm tra một bộ dấu hiệu được biết ĐẾN , P (D Tôi) --xác suất chẩn đoán sơ bộ D Tôi (theo thống kê trước đó).

Công thức (1.6.) áp dụng cho bất kỳ N các trạng thái có thể (chẩn đoán) của hệ thống. Giả định rằng hệ thống chỉ ở một trong các trạng thái được chỉ định và do đó

Trong các bài toán thực tế, khả năng tồn tại của một số trạng thái A1,....., Ar thường được cho phép và một số trong chúng có thể xảy ra kết hợp với nhau.

P(ĐẾN */ D Tôi) = P(k 1 */ D Tôi)P (k 2 */ k 1 * D Tôi)...P (k v */ k tôi* ...k* v- 1 D Tôi), (1.8.)

Ở đâu k j * = k js --loại thuộc tính được tiết lộ nhờ kết quả kiểm tra. Đối với các dấu hiệu độc lập về mặt chẩn đoán

P (ĐẾN */ D Tôi) = P (k 1 */ D Tôi) P (k 2 */ D Tôi)... P (k v * / D Tôi). (1.9.)

Trong hầu hết các bài toán thực tế, đặc biệt với số lượng lớn các đặc tính, có thể chấp nhận điều kiện độc lập của các đặc tính ngay cả khi có sự tương quan đáng kể giữa chúng.

Xác suất xuất hiện của một phức hợp dấu hiệuĐẾN *

P(ĐẾN *)= P(D S)P(ĐẾN */D S) . (1.10.)

Công thức Bayes tổng quát có thể được viết như sau :

P(D Tôi/ K * ) (1.11.)

Ở đâu P (ĐẾN */ D Tôi) được xác định bởi đẳng thức (1.8.) hoặc (1.9.). Từ quan hệ (1.11.) suy ra

P(D Tôi/ ĐẾN *)=l , (1.12.)

Tất nhiên, điều này phải xảy ra vì một trong các chẩn đoán nhất thiết phải được thực hiện và việc thực hiện hai chẩn đoán cùng một lúc là không thể. Cần lưu ý rằng mẫu số của công thức Bayes cho tất cả các chẩn đoáncuộc gọi là như nhau.Điều này trước tiên cho phép bạn xác định xác suất xảy ra đồng thời e Nia Tôi chẩn đoán và việc triển khai một bộ tính năng này

P(D TôiĐẾN *) = P(D Tôi)P(ĐẾN */D Tôi) (1.13.)

và sau đó xác suất chẩn đoán sau

P (D Tôi/ĐẾN *) = P(D TôiĐẾN *)/P(D SĐẾN *). (1.14.)

Lưu ý rằng đôi khi nên sử dụng logarit sơ bộ của công thức (1.11.), vì biểu thức (1.9.) chứa các tích có số lượng nhỏ.

Nếu việc thực hiện một tập hợp các tính năng nhất định ĐẾN * xác định để chẩn đoán D P, thì phức hợp này không xảy ra trong các chẩn đoán khác:

Khi đó, do đẳng thức (1.11.)

Vì vậy, logic xác định của chẩn đoán là một trường hợp đặc biệt của logic xác suất. Công thức Bayes cũng có thể được sử dụng trong trường hợp một số đặc trưng có phân bố rời rạc và phần còn lại có phân bố liên tục. Để phân phối liên tục, mật độ phân phối được sử dụng. Tuy nhiên, trong kế hoạch tính toán, sự khác biệt quy định về các đặc tính là không đáng kể nếu việc xác định đường cong liên tục được thực hiện bằng cách sử dụng một tập hợp các giá trị rời rạc.

3 . Ma trận chẩn đoán

Để xác định xác suất chẩn đoán bằng phương pháp Bayes, cần tạo ma trận chẩn đoán (Bảng 1.1), được hình thành trên cơ sở tài liệu thống kê sơ bộ. Bảng này chứa xác suất của các loại ký tự cho các chẩn đoán khác nhau.

Bảng 1.1

Ma trận chẩn đoán theo phương pháp Bayes

Chẩn đoán D Tôi

Ký kj

k 1

k 2

P(k 11 /D Tôi)

P(k 12 /D Tôi)

P(k 21 /D Tôi)

P(k 22 /D Tôi)

P(k 23 /D Tôi)

P(k 24 /D Tôi)

P(k 31 /D Tôi)

P(k 32 /D Tôi)

D 1

D 2

Nếu các dấu hiệu có hai chữ số (các dấu hiệu đơn giản “có - không”) thì trong bảng chỉ cần chỉ ra xác suất xuất hiện của dấu hiệu đó là đủ P(k Tôi/D Tôi). Xác suất thiếu tính năng R ( /D,-) = 1 - P(k Tôi/D Tôi).

Tuy nhiên, sẽ thuận tiện hơn khi sử dụng dạng thống nhất, ví dụ, giả sử đối với ký hiệu có hai chữ số R (k j/D Tôi) = R (k Tôi 1 /D Tôi); R ( /D,) = P(k Tôi 2 /D Tôi).

Lưu ý rằng P(k js/Di) = 1, trong đó T, -- số chữ số thuộc tính k j. Tổng xác suất của tất cả các triển khai có thể có của một tính năng bằng một.

Ma trận chẩn đoán bao gồm xác suất chẩn đoán tiên nghiệm. Quá trình học theo phương pháp Bayes bao gồm việc hình thành một ma trận chẩn đoán. Điều quan trọng là cung cấp khả năng làm rõ bảng trong quá trình chẩn đoán. Để làm điều này, không chỉ các giá trị phải được lưu trữ trong bộ nhớ máy tính P(k js/Di), nhưng cũng có số lượng sau: N -- tổng số đối tượng được sử dụng để biên soạn ma trận chẩn đoán; N Tôi D Tôi; N ij - số lượng đối tượng được chẩn đoán D Tôi, được kiểm tra dựa trên k j. Nếu một đối tượng mới có chẩn đoán xuất hiện D tôi, thì xác suất chẩn đoán trước đó sẽ được điều chỉnh.

Tiếp theo, các hiệu chỉnh được đưa ra đối với xác suất của các đặc trưng. Hãy để đối tượng mới với chẩn đoán D tôi phát hiện phóng điện r dấu hiệu k j. Sau đó, để chẩn đoán thêm, các giá trị mới của khoảng xác suất của tính năng được chấp nhận k j khi chẩn đoán D tôi:

Xác suất có điều kiện của các dấu hiệu cho các chẩn đoán khác không cần điều chỉnh.

Phần kết luận

Trong phương pháp Bayes, một đối tượng có nhiều đặc điểm phức tạp ĐẾN * đề cập đến chẩn đoán có xác suất (sau) cao nhất

K* D Tôi, Nếu như P(D Tôi/ K *) > P(D j/ K *) (j = 1, 2,..., N; Tôi? j). (1.17.)

Biểu tượng , được sử dụng trong phân tích chức năng, có nghĩa là thuộc về một tập hợp. Điều kiện (1.17.) chỉ ra rằng một đối tượng có cách triển khai nhất định của một tập hợp các đặc điểm ĐẾN * hay nói tóm lại là thực hiện ĐẾN * thuộc về chẩn đoán (điều kiện) D Tôi. Quy tắc (1.17.) thường được làm rõ bằng cách đưa ra giá trị ngưỡng cho xác suất chẩn đoán:

P(D Tôi/ K *) ? P Tôi, (1.18.)

Ở đâu P Tôi. -- đã chọn trước mức độ công nhậnđể chẩn đoán D Tôi. Trong trường hợp này, xác suất chẩn đoán cạnh tranh gần nhất không cao hơn 1 - P Tôi. Thường được chấp nhận P Tôi? 0,9. Cho rằng

P(D Tôi/ K *)

Tôi (1.19.)

quyết định chẩn đoán không được đưa ra (từ chối công nhận) và cần có thêm thông tin.

Quá trình ra quyết định theo phương pháp Bayes khi tính toán trên máy tính diễn ra khá nhanh chóng. Ví dụ, việc chẩn đoán 24 tình trạng với 80 dấu hiệu có nhiều chữ số chỉ mất vài phút trên máy tính với tốc độ 10 - 20 nghìn thao tác mỗi giây.

Như đã chỉ ra, phương pháp Bayes có một số nhược điểm, chẳng hạn như sai sót trong việc nhận biết các chẩn đoán hiếm gặp. Trong tính toán thực tế, nên tiến hành chẩn đoán cho trường hợp các chẩn đoán có khả năng xảy ra như nhau, đặt

P(D Tôi) = l/n (1.20.)

Khi đó chẩn đoán sẽ có giá trị xác suất hậu nghiệm lớn nhất D Tôi, mà R (K* /D Tôi) tối đa:

K* D Tôi, Nếu như P(K* /D Tôi) > P(K* /D j) (j = 1, 2,..., N; Tôi? j). (1.21.)

Nói cách khác, chẩn đoán được thực hiện D Tôi nếu tập hợp triệu chứng này phổ biến hơn trong quá trình chẩn đoán D Tôi hơn so với các chẩn đoán khác. Quy tắc quyết định này tương ứng phương pháp khả năng tối đa Từ phần trước, phương pháp này là trường hợp đặc biệt của phương pháp Bayes với cùng xác suất chẩn đoán tiên nghiệm. Trong phương pháp khả năng tối đa, các chẩn đoán “phổ biến” và “hiếm” đều có quyền ngang nhau.

Danh sách các nguồn được sử dụng

1. Gorelik, A. L. Phương pháp nhận dạng [Văn bản]: sách giáo khoa. cẩm nang cho các trường đại học / A. L. Gorelik, V. A. Skripkin. - M.: Cao hơn. trường học, 2004. - 261 tr.

2. Sapozhnikov, V.V. Nguyên tắc cơ bản của chẩn đoán kỹ thuật [Văn bản]: sách giáo khoa. trợ cấp / V.V. V. Sapozhnikov. - M.: Lộ trình, 2004. - 318 tr.

3. Serdkov, A. S. Điều khiển tự động và chẩn đoán kỹ thuật [Văn bản] / A. S. Serdkov. - Kiev: Công nghệ, 1971. - 244 tr.

4. Stetsyuk. A. E. “Cơ bản của chẩn đoán kỹ thuật. Lý thuyết công nhận": sách giáo khoa. trợ cấp / A. E. Stetsyuk, Ya. - Khabarovsk: Nhà xuất bản DVGUPS, 2012. - 69 tr.

Đăng trên Allbest.ru

Tài liệu tương tự

    Nghiên cứu các thuật toán điển hình nhất để giải các bài toán có tính chất xác suất. Làm quen với các phần tử của tổ hợp, lý thuyết bình, công thức Bayes, phương pháp tìm biến ngẫu nhiên rời rạc, liên tục. Xem xét các vấn đề cơ bản của đại số sự kiện.

    sổ tay đào tạo, bổ sung 06/05/2010

    Xác định và đánh giá xác suất xảy ra một sự kiện nhất định. Một kỹ thuật giải quyết vấn đề bằng cách sử dụng định lý cộng và nhân, công thức xác suất tổng hoặc Bayes. Ứng dụng sơ đồ Bernoulli vào giải các bài toán. Tính toán độ lệch bình phương.

    công việc thực tế, bổ sung 23/08/2015

    Định nghĩa thống kê, tiên đề và cổ điển về xác suất. Các biến ngẫu nhiên rời rạc. Định lý giới hạn của Laplace và Poisson. Hàm phân phối xác suất cho các biến ngẫu nhiên nhiều biến. Công thức Bayes. Ước tính điểm của phương sai.

    bảng cheat, được thêm vào ngày 04/05/2015

    Tính toán xác suất không trả được khoản vay của một pháp nhân và một cá nhân bằng công thức Bayes. Tính toán phương sai mẫu, phương pháp, các giai đoạn chính. Xác định xác suất để một trong ba bi trắng được lấy ngẫu nhiên, chứng minh kết quả.

    kiểm tra, thêm vào 11/02/2014

    Vận dụng các công thức, định luật của lý thuyết xác suất để giải các bài toán. Công thức Bayes, cho phép bạn xác định xác suất của một sự kiện, với điều kiện là một sự kiện khác phụ thuộc lẫn nhau về mặt thống kê với nó đã xảy ra. Định lý giới hạn trung tâm.

    bài tập khóa học, được thêm vào ngày 04/11/2015

    Một thí nghiệm có kết quả ngẫu nhiên. Tính ổn định thống kê Khái niệm xác suất. Đại số của các sự kiện. Nguyên tắc nhị nguyên cho các sự kiện. Xác suất có điều kiện. Công thức cộng và nhân xác suất. Công thức Bayes. Không gian của các sự kiện cơ bản.

    tóm tắt, thêm vào ngày 03/12/2007

    Xác định xác suất để một viên xúc xắc được ít nhất 4 điểm khi tung một lần. Xác định xác suất sản xuất một bộ phận (nếu bộ phận được nhà lắp ráp lấy ngẫu nhiên có chất lượng xuất sắc) bởi nhà máy đầu tiên sử dụng công thức Bayes.

    kiểm tra, thêm vào ngày 29/05/2012

    Các chỉ số độ tin cậy là chỉ số về độ tin cậy của các đối tượng không thể sửa chữa được. Định nghĩa cổ điển và hình học của xác suất. Tần suất của một sự kiện ngẫu nhiên và "định nghĩa thống kê" về xác suất. Các định lý cộng và nhân xác suất.

    bài tập khóa học, được thêm vào ngày 18/11/2011

    Các biến ngẫu nhiên rời rạc và phân phối của chúng. Công thức xác suất tổng và công thức Bayes. Các tính chất chung của kỳ vọng toán học. Phương sai của một biến ngẫu nhiên. Hàm phân phối của một biến ngẫu nhiên. Định nghĩa cổ điển về xác suất.

    kiểm tra, thêm vào 13/12/2010

    Mô hình toán học của hiện tượng hoặc quá trình. Sự hội tụ của phương pháp lặp đơn giản. Một ước tính lỗi hậu nghiệm. Phương pháp quay của hệ thống tuyến tính. Kiểm soát độ chính xác và giải pháp gần đúng trong khuôn khổ phương pháp trực tiếp. Phương pháp thư giãn và phương pháp Gauss.