| RA QUYẾT ĐỊNH BAYES |
|
RA QUYẾT ĐỊNH BAYES Nguyễn Như Phong Kỹ thuật Hệ thống Công nghiệp Đại học Bách Khoa, ĐHQG TPHCM
Trong nhiều trường hợp ra quyết định, vấn đề nảy sinh là có nên thu thập thông tin về trạng thái hệ thống trước khi ra quyết định. Giả sử thông tin mới về trạng thái S được thu thập qua r thực nghiệm và được biễu thị bởi véc tơ dữ kiện thông tin X = xk, kNr. Phương pháp Bayes dùng thông tin này để cập nhật xác suất xuất hiện trạng thái P ở trên. Với trạng thái si, xác suất thông tin xk xác nhận trạng thái si là p(xksi), xác suất có điều kiện này là xác suất xuất hiện thông tin xk ở trạng thái si. Từ xác suất thông tin có điều kiện p(xksi) ta cập nhật xác suất trạng thái với thông tin mới theo công thức Bayes:
Trong đó p(xk) là xác suất biên của thông tin xk được xác định theo công thức sau:
Xác suất xuất hiện trạng thái có điều kiện p(sixk) là xác suất sau khi có thêm thông tin nên được gọi là hậu xác suất để phân biệt với tiền xác suất p(si) là xác suất trước khi có thêm thông tin. Tiện ích kỳ vọng với thông tin xk:
Tiện ích kỳ vọng cực đại với thông tin xk:
Tiện ích kỳ vọng cực đại với thông tin X:
Một khái niệm của quá trình ra quyết định là giá trị thông tin V(X). Trong trường hợp này, có sự bất định trong thông tin mới X mà ta gọi là thông tin không hoàn chỉnh. Giá trị thông tin không hoàn chỉnh này có thể được tính như sau:
Một khái niệm khác của quá trình ra quyết định là thông tin hoàn chỉnh Xp là thông tin có thể giúp tiên đoán chính xác trạng thái tương lai. Với thông tin hoàn chỉnh hậu xác suất trạng thái chỉ có thể là 0 hay 1:
Với thông tin hoàn chỉnh Xp, tiện ích kỳ vọng cực đại:
Giá trị thông tin hoàn chỉnh: V(xp) = E(u*xp) – E(u*) Ví dụ: Một công ty khai thác dầu khí ở một vùng. Có hai trạng thái là có dầu (s1) và không có dầu (s2). Từ các thông tin khoang thăm dò trước đâu xác suất trạng thái tính được: p(s1) = p(s2) = 0,5 Công ty có hai quyết định khoan (a1) và không khoan (a2). Ma trận tiện ích như sau: uij a1 a2 s1 4 -1 s2 -2 2 Tiện ích kỳ vọng khi chọn phương án a1 là: E(a1) = 0,5 * 4 + 0,5 * (–2) = 1 Tiện ích kỳ vọng khi chọn phương án a2 là: E(a2) = 0,5*(–1) + 0,5*2 = 0,5 Vậy phương án chọn lựa là a1 và tiện tích kỳ vọng cực đại là E(u*) = E(a1) = 1. Công ty lấy và phân tích 8 mẫu thử ở vùng định khoan. Xác suất có điều kiện về thông tin không hoàn chỉnh như ở bảng sau: x1 x2 x3 x4 x5 x6 x7 x8
0 0,05 0,1 0,1 0,2 0,1 0,1 0,5 0,05 0,1 0,1 0,2 0,1 0,1 0,05 0 1 1 Với thông tin hoàn chỉnh, các xác suất có điều kiện này thay đổi như ở bảng sau:
x1 x2 x3 x4 x5 x6 x7 x8
0 0 0 0 0,2 0,5 0,2 0,1 0,1 0,2 0,5 0,2 0 0 0 0 1 1 Với từng thông tin xk các xác suất thông tin p(xk), các xác suất trạng thái có điều kiện p(sixk), các kỳ vọng tiện ích có điều kiện cực đại E(u*xk), cùng các phương án chọn lựa được tính toán với kết quả như ở bảng sau: x1 x2 x3 x4 x5 x6 x7 x8 p(xk) 0,25 0,75 0,25 0,15 0,15 0,25 0,75 0,25 p(s1xk) 0 1/3 1/5 1/3 2/3 4/5 2/3 1 p(s2xk) 1 2/3 4/5 2/3 1/3 1/5 1/3 0 E(u*xk) 2 1 1,4 1 2 2,8 2 4 ajxk a2 a2 a2 a2 a1 a1 a1 a1 Tương tự với trường hợp thông tin hoàn chỉnh kết quả tính toán như ở bảng sau: x1 x2 x3 x4 x5 x6 x7 x8 p(xk) 0,05 0,1 0,25 0,1 0,1 0,25 0,1 0,05 p(s1xk) 0 0 0 0 1 1 1 1 p(s2xk) 1 1 1 1 0 0 0 0 E(u*xk) 2 2 2 2 4 4 4 4 ajxk a2 a2 a2 a2 a1 a1 a1 a1 Kỳ vọng tiện ích với thông tin không hoàn chỉnh: E(u*x)=0,25*2+0,75*1+0,25*1,4+0,15*1+0,15*2+0,25*2,8+0,75*2+0,25*4 =1,875. Giá trị thông tin không hoàn chỉnh: V(x) = E(u*x) – E(u*) = 1,875 – 1 = 0, 875. Kỳ vọng tiện ích với thông tin hoàn chỉnh: E(u*xp) = (0,05 + 0,1 + 0,25 + 0,1)*2 + (0,1 + 0,25 + 0,1 + 0,05)*4 = 3. Giá trị thông tin hoàn chỉnh: V(xp) = E(u*xp) – E(u*) = 3 – 1 = 2.
TLTK Nguyễn Như Phong. Vận trù ngẫu nhiên. NXBĐHQG. 2003, 2010, 2015 |