Skip navigation

1.4. Công thức Bayes

1.4.1. Công thức xác suất đầy đủ

Định nghĩa 1.10. Nhóm các sự kiện $A_1, A_2,\cdots, A_n\, (n\geq 2)$ của một phép thử được gọi là một nhóm đầy đủ nếu

(i) $A_i\cap A_j=\emptyset$, $\forall i\neq j$ (xung khắc từng đôi),

(ii) $A_1\cup A_2\cup\cdots\cup A_n=\mathbf{\Omega}$.

Theo định nghĩa này ở phép thử đang xét chỉ có thể xuất hiện một sự kiện trong số $n$ sự kiện $A_1,\cdots, A_n$ (và phải có một sự kiện). Đặc biệt với mọi sự kiện $A$ thì hệ $\{A, \overline{A}\}$ là đầy đủ.

Ví dụ 1.23. Một tiểu đoàn có 3 đại đội cùng trồng một loại bí xanh. Chọn ngẫu nhiên một quả bí xanh và gọi $A_1, A_2, A_3$ lần lượt là sự kiện quả bí xanh được chọn do đại đội 1, đại đội 2 và đại đội 3 trồng. Khi đó hệ $\{A_1, A_2, A_3\}$ là đầy đủ.

Nếu như ta chưa biết xác suất $P(A)$ của một sự kiện $A$ nào đó, nhưng biết các xát suất $P(A_i)$ của một hệ đầy đủ $\{A_1,A_2,\cdots, A_n\}$ của không gian mẫu $\mathbf{\Omega},$ và biết các xác suất có điều kiện $P(A|A_i)$, thì ta có thể dùng công thức sau, gọi là công thức xác suất đầy đủ, để tính xác suất của sự kiện $A$ $$\label{dd} P(A)=\sum\limits_{i=1}^nP(A\cap A_i)=\sum\limits_{i=1}^n P(A_i).P(A|A_i). \tag{1.12}$$

Khi $A$ xảy ra thì có một và chỉ một biến cố $A_i$ cùng xảy ra với $A$. Trường hợp riêng của \eqref{dd} là khi ta có hai sự kiện $A, B$, có thể sử dụng hệ đầy đủ $\{B,\overline{B}\}$ của $\mathbf{\Omega}$ để tính xác suất của $A$: $$\label{dd1} P(A)=P(A\cap B)+P(A\cap \overline{B})=P(B).P(A|B)+P(\overline{B}).P(A|\overline{B}).$$

Chú ý: Vận dụng công thức xác suất đầy đủ để giải một bài toán, vấn đề quan trọng là phải chỉ ra được nhóm sự kiện đầy đủ và xung khắc từng đôi. Trong thực tế việc này thường gặp ở 2 hình thức sau:

(i) Công việc tiến hành trải qua 2 phép thử. Thực hiện phép thử thứ nhất ta có một trong $n$ khả năng xảy ra là các sự kiện: $A_1,A_2,\cdots,A_n$. Sau khi thực hiện phép thử thứ nhất ta thực hiện phép thử thứ hai. Trong phép thử thứ hai ta quan tâm đến sự kiện $A$. Khi đó sự kiện $A$ sẽ được tính theo công thức xác suất đầy đủ với hệ đầy đủ $\{A_1,A_2,\cdots,A_n\}$.

(ii) Một tập hợp chứa $n$ nhóm phần tử. Mỗi nhóm phần tử có một tỉ lệ phần tử có tính chất $\mathbf P$ nào đó. Lấy ngẫu nhiên từ tập hợp ra 1 phần tử. Gọi $A$ là sự kiện chọn được phần tử thuộc nhóm thứ $i$. Khi đó xác suất của sự kiện chọn được phần tử có tính chất $\mathbf{P}$ trong phép thử sẽ được tính theo công thức xác suất đầy đủ với hệ đầy đủ $\{A_1,A_2,\cdots,A_n\}$.

Ví dụ 1.24. Xét một lô giày chiến sĩ được sản xuất bởi 3 nhà máy với tỉ lệ lần lượt là 20%, 30% và 50%. Xác suất giày hỏng của các nhà máy lần lượt là 0,001; 0,005 và 0,006. Lấy ngẫu nhiên một chiếc giày từ lô hàng. Tìm xác suất để chiếc giày lấy ra bị hỏng.

1.4.2. Công thức Bayes

Công thức Bayes, mang tên của linh mục và nhà toán học người Anh Thomas Bayes (1702-1761), là công thức ngược, cho phép tính xác suất có điều kiện $P(B|A)$ khi biết xác suất có điều kiện $P(A|B)$ và một số thông tin khác. Dạng đơn giản nhất của công thức này là: Nếu $A, B$ là hai sự kiện bất kì với xác suất khác 0 thì từ (1.7) và (1.8), ta có: $$\label{Bay} P(B|A)=\dfrac{P(A|B).P(B)}{P(A)}. \tag{1.13}$$

Kết hợp \eqref{Bay} với công thức xác suất đầy đủ \eqref{dd} cho $P(A)$, ta được:

Định lý 1.1. Giả sử $\{A_1,A_2,\cdots,A_n\}$ là hệ đầy đủ và $A$ là một sự kiện bất kì có thể xảy ra trong phép thử. Khi đó ta có công thức Bayes: $$\label{Bay1} P(A_k|A)=\dfrac{P(A_k).P(A|A_k)}{P(A)}=\dfrac{P(A_k).P(A|A_k)}{\sum_{i=1}^n P(A_i).P(A|A_i)} \tag{1.14}$$ với mọi $k=1,2,\cdots,n$.

Ví dụ 1.25. Mạng Bayes được sử dụng trên các trang Web của các nhà sản xuất công nghệ cao nhằm giúp khách hàng nhanh chóng chẩn đoán các vấn đề với sản phẩm. Chẳng hạn, một doanh nghiệp sản xuất máy in thu được các kết quả từ cơ sở phân tích dữ liệu khảo sát của khách hàng. Trong đó, các lỗi xuất hiện ở máy in được chia làm ba nhóm: phần cứng, phần mềm và các loại khác (chẳng hạn như trình kết nối) với xác suất tương ứng là 0,1; 0,6 và 0,3. Xác suất lỗi do phần cứng gây ra là 0,9; do phần mềm là 0,2 và do các vấn đề khác là 0,5. Nếu khách hàng truy cập trang web của nhà sản xuất để chẩn đoán lỗi máy in, nguyên nhân nào có khả năng cao nhất?

Ví dụ 1.26. Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15. Do có nhiễu trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B còn 1/8 tín hiệu B bị méo và thu được như tín hiệu A.

a) Tìm xác suất để máy thu được tín hiệu A.

b) Giả sử máy đã thu được tín hiệu A. Hỏi xác suất thu được đúng tín hiệu phát đi?

Nhận xét: Công thức Bayes cho phép đánh giá lại xác suất xảy ra các sự kiện $A_k$, sau khi đã có thêm thông tin về sự kiện $A$. Cần phải nhấn mạnh rằng nếu muốn dùng các công thức \eqref{dd} hoặc \eqref{Bay1}, nhất thiết phải có hệ đầy đủ. Ngoài ra nếu \eqref{dd} cho ta xác suất không có điều kiện, thì \eqref{Bay1} cho phép tính xác suất có điều kiện, trong đó sự kiện $A_k$ cần tính xác suất phải là một thành viên của hệ đầy đủ đang xét. Từ đó thấy rằng việc dùng công thức Bayes để tính xác suất có điều kiện đã gợi ý cho ta cách chọn hệ đầy đủ sao cho sự kiện quan tâm phải là thành viên. Trong trường hợp không có (hoặc rất khó xác định) hệ đầy đủ, ta nên dùng công thức \eqref{Bay}, khi đó việc tính $P(A)$ sẽ khó hơn là dùng công thức \eqref{dd}.

Ví dụ 1.27. Một mạch điện gồm 2 bộ phận mắc nối tiếp, với xác suất làm việc tốt trong một khoảng thời gian nào đó của mỗi bộ phận là 0,95 và 0,98. Ở một thời điểm trong khoảng thời gian trên, người ta thấy mạch điện ngừng làm việc (do bộ phận nào đó hỏng), tìm xác suất để chỉ bộ phận thứ hai hỏng.

1.4.3. Công thức Bernoulli

Trong thực tế nhiều khi ta gặp những phép thử gồm một dãy liên tiếp các phép thử như nhau được lặp đi lặp lại $n$ lần và để ý đến sự xuất hiện của một sự kiện $A$ nào đó trong $n$ lần thử này. Chẳng hạn bắn 10 viên đạn độc lập vào một mục tiêu, mỗi lần bắn 1 viên được xem như tiến hành một phép thử, 10 lần bắn độc lập là 10 phép thử độc lập.

Định nghĩa 1.11. Tiến hành một dãy $n$ phép thử mà phép thử sau độc lập với các phép thử trước đó. Trong mỗi phép thử chỉ có 2 kết quả: hoặc xảy ra sự kiện $A$ hoặc không xảy ra, xác suất xảy ra sự kiện $A$ ở mỗi phép thử là như nhau và bằng $p\, (p\neq 0, p\neq 1)$. Dãy $n$ phép thử độc lập này còn được gọi là một lược đồ Bernoulli.

Trong một lược đồ Bernoulli sự kiện $A$ có thể xuất hiện từ 0 đến $n$ lần. Gọi $B$ là sự kiện “$A$ xuất hiện đúng $k$ lần”, ta thấy $B$ có thể xảy ra theo nhiều phương án khác nhau, miễn sao trong dãy các kết quả của $n$ phép thử sự kiện $A$ có mặt đúng $k$ lần. Rõ ràng, mỗi kết quả thỏa mãn sự kiện $B$ tương ứng với việc chọn ra $k$ phép thử ($A$ xuất hiện) từ $n$ phép thử đã cho, hay có tất cả $C_n^k$ phương án như vậy. Do trong dãy $n$ phép thử độc lập, sự kiện $A$ xuất hiện đúng $k$ lần, $\overline{A}$ xuất hiện $n-k$ lần, nên xác suất để xảy ra một phương án sẽ bằng $p^k(1-p)^{n-k}$. Từ đó ta có công thức Bernoulli $$\label{Ber} P(B)=P_n(k;p)=C^k_n.p^k.(1-p)^{n-k},\quad k=0,1,\cdots, n. \tag{1.15}$$

Ví dụ 1.28. Một máy thông tin có 5 chi tiết đối với độ tin cậy (xác suất làm việc tốt trong một khoảng thời gian nào đó) của mỗi chi tiết là 0,9. Tìm xác suất để trong khoảng thời gian ấy có đúng 2 chi tiết làm việc tốt.

Ví dụ 1.29. Một học viên có xác suất bắn trúng mục tiêu là 0,8. Có ý kiến cho rằng học viên đó cứ 10 lần bắn thì chắc chắn có 8 lần trúng mục tiêu, điều đó có đúng không?

Định lý 1.2. Thực hiện một dãy $n$ phép thử Bernoulli với xác suất thành công trong mỗi lần thử là $p$. Ta có các kết quả sau

(i) $P_n(k;p)=\dfrac{(n-k+1)p}{kp}\cdot P_n(k-1;p)$.

(ii) $P_{\max}=P_n(m;p)$ với $(n+1)p-1\leq m\leq (n+1)p$, $m\in\mathbb Z_+$ được gọi là giá trị có khả năng xảy ra lớn nhất.

Ví dụ 1.30. Một chiến sĩ bắn ngẫu nhiên, độc lập 20 viên đạn vào một mục tiêu với xác suất bắn trúng đích của mỗi viên đạn là 0,4. Tìm số viên đạn trúng đích với khả năng cao nhất.

Tra cứu kiến thức môn học close