Tìm hiểu về PGM (Probabilistic Graphical Model) framework

Tram Ho

Để giải các bài toán về AI, ngoài cách biến đổi các bài toán về các bài toán con phù hợp với các giải thuật đã được thiết kế, chúng ta còn một phương pháp khác để xử lý chúng. Đó chính là thay vì biến đổi bài toán ban đầu, ta sẽ đi thiết kế một mô hình dành riêng cho bài toán đó. Chẳng hạn với bài toán đưa ra chẩn đoán về dinh dưỡng cho trẻ, ta có thể đơn giản thiết lập một số lượng feature cụ thể để biến bài toán chẩn đoán thành một bài toán phân nhãn. Nhưng bên cạnh đó ta cũng có thể tạo ra mô hình riêng cho để chẩn đoán không chỉ trẻ đủ, thiếu hay thừa dinh dưỡng mà còn có thể đưa ra lý do vì sao trẻ thiếu/thừa dinh dưỡng. Có một framework có thể giúp chúng ta làm được điều đó – PGM (Probabilistic Graphical Model). Trong framework này có 2 nhóm phổ biến hay được ứng dụng đó chính là Bayesian Network và Markov Network. Trong bài viết này chúng ta sẽ cùng tìm hiểu cách biểu diễn của 2 nhóm này.

1. Bayesian Networks (BNs):

  • Linh hồn của cách biểu diễn của nhóm này chính là việc sử dụng đồ thị có hướng và không lặp (không tồn tại một chu trình khép kín trong đồ thị có hướng này) – ta ký hiệu là G. Trong đố mỗi node của G là một biến ngẫu nhiên đại diện cho các thông tin hay feature chứa trong bài toán và các edge (cạnh) có hướng thể hiện sự ảnh hưởng giữa các node. Chẳng hạn khả năng trẻ thiếu sắt phụ thuộc vào lượng thức ăn mà trẻ ăn hàng ngày có nhiều thịt bò/lợn hay không. Hay nói một cách khác đồ thị này chính là cách cấu trúc dữ liệu giúp biểu diễn Joint Distribution (xác suất hợp) của mô hình.

  • G là một BN với các biến ngẫu nhiên X1, … , Xn. Trong đó mỗi biến ngẫu nhiên Xi trong đồ thị G tương ứng với một node trong G được gán tương ứng với một factor. Trong trường hợp của BN factor tại môi node là Conditional Probability Distribution (CPD – phân phối xác suất có điều kiện) hay còn gọi là local probabilistic model. CPD của Xi là phân phối xác suất của biến Xi khi biến các giá trị các biến ngẫu nhiên là node cha của chúng (Xi có thể có nhiều hơn một cha – node thân hay node lá, hoặc không có node cha – node gốc). Mỗi CPD có thể được biểu diễn bằng các bảng, cấu trúc dạng cây (tree structure) hay noisy-OR, noisy-MAX

Trong hình trên bên trái là mô tả cho đồ thị tương ứng với nội dung bài toán còn bên phải CPD tương ứng của từng node. Bài toán về dự đoán 2 căn bệnh Pneumonia (viêm phổi) và Tuberculosis (bệnh lao). Bệnh Pneumonia có thể khiến bệnh nhân bị Lung Infiltrates (biểu hiện phổi bị tổn thương) và Lung Infiltrates có thể quan sát được thông qua phim chụp XRay. Bệnh Tuberculosis có thể sinh ra Sputum Smear (đờm). Trong ví dụ này các bạn có thể thấy các thông tin quan sát được là XRay và Sputum Smear nhưng dù chỉ có 1 trong 2 thông tin này ta vẫn có những kết luận về việc mắc bệnh lao hay viêm phổi.

2. Markov Networks:

Nhóm phổ biến thứ 2 được gọi là Markov Networks hay Markov Random Field. Nhóm này thay vì sử dụng đồ thị có hướng như nhóm trên thì lại sử dụng đồ thị vô hướng. Chính vì vậy chúng rất hữu ích trong việc mô hình hóa nhiều bài toán khi mà các hiện tượng (được mô tả bằng các biến ngẫu nhiên) không thể biết rõ hướng tác động lẫn nhau của chúng (không thể sử dụng đồ thị có hướng) Ký hiệu đồ thị biểu diễn Markov Network là H, cũng giống như BN mỗi node là một biến ngẫu nhiên và các edge đại diện cho một “loại xác suất nào đó” thể hiện sự tương tác giữa 2 node nối bởi cạnh này. Không giống như BN “loại xác suất nào đó” ở đây không tương ứng với probability (xác suất) hay conditional probability (xác suất điều kiện). Vì vậy trong trường hợp của Markov Network ta chỉ nói mỗi node được đại diện bởi 1 factor.

Trong hình trên, bên trái là bài toán và bên phải là Markov Network với các factor tương ứng với từng node, từng edge. Bài toán ở đây là quan sát tình trạng bệnh lao trên 4 bệnh nhân trong đó các bệnh nhân có liên lạc với nhau như trong hình (bệnh nhân 1 với bệnh nhân 2, bệnh nhân 2 với bệnh nhân 4, bệnh nhân 4 với bệnh nhân 3, bệnh nhân 3 với bệnh nhân 1).

Tài liệu tham khảo và dịch từ https://www.sciencedirect.com/topics/computer-science/bayesian-networks

Chia sẻ bài viết ngay

Nguồn bài viết : Viblo