(ii) $A_1\cup A_2\cup\cdots\cup A_n=\mathbf{\Omega}$.
Theo định nghĩa này ở phép thử đang xét chỉ có thể xuất hiện một sự kiện trong số $n$ sự kiện $A_1,\cdots, A_n$ (và phải có một sự kiện). Đặc biệt với mọi sự kiện $A$ thì hệ $\{A, \overline{A}\}$ là đầy đủ.
Ví dụ 1.23. Một tiểu đoàn có 3 đại đội cùng trồng một loại bí xanh. Chọn ngẫu nhiên một quả bí xanh và gọi $A_1, A_2, A_3$ lần lượt là sự kiện quả bí xanh được chọn do đại đội 1, đại đội 2 và đại đội 3 trồng. Khi đó hệ $\{A_1, A_2, A_3\}$ là đầy đủ.
Nếu như ta chưa biết xác suất $P(A)$ của một sự kiện $A$ nào đó, nhưng biết các xát suất $P(A_i)$ của một hệ đầy đủ $\{A_1,A_2,\cdots, A_n\}$ của không gian mẫu $\mathbf{\Omega},$ và biết các xác suất có điều kiện $P(A|A_i)$, thì ta có thể dùng công thức sau, gọi là công thức xác suất đầy đủ, để tính xác suất của sự kiện $A$ $$\label{dd} P(A)=\sum\limits_{i=1}^nP(A\cap A_i)=\sum\limits_{i=1}^n P(A_i).P(A|A_i). \tag{1.12}$$
Khi $A$ xảy ra thì có một và chỉ một biến cố $A_i$ cùng xảy ra với $A$. Trường hợp riêng của \eqref{dd} là khi ta có hai sự kiện $A, B$, có thể sử dụng hệ đầy đủ $\{B,\overline{B}\}$ của $\mathbf{\Omega}$ để tính xác suất của $A$: $$\label{dd1} P(A)=P(A\cap B)+P(A\cap \overline{B})=P(B).P(A|B)+P(\overline{B}).P(A|\overline{B}).$$
Chú ý: Vận dụng công thức xác suất đầy đủ để giải một bài toán, vấn đề quan trọng là phải chỉ ra được nhóm sự kiện đầy đủ và xung khắc từng đôi. Trong thực tế việc này thường gặp ở 2 hình thức sau:
(i) Công việc tiến hành trải qua 2 phép thử. Thực hiện phép thử thứ nhất ta có một trong $n$ khả năng xảy ra là các sự kiện: $A_1,A_2,\cdots,A_n$. Sau khi thực hiện phép thử thứ nhất ta thực hiện phép thử thứ hai. Trong phép thử thứ hai ta quan tâm đến sự kiện $A$. Khi đó sự kiện $A$ sẽ được tính theo công thức xác suất đầy đủ với hệ đầy đủ $\{A_1,A_2,\cdots,A_n\}$.
(ii) Một tập hợp chứa $n$ nhóm phần tử. Mỗi nhóm phần tử có một tỉ lệ phần tử có tính chất $\mathbf P$ nào đó. Lấy ngẫu nhiên từ tập hợp ra 1 phần tử. Gọi $A$ là sự kiện chọn được phần tử thuộc nhóm thứ $i$. Khi đó xác suất của sự kiện chọn được phần tử có tính chất $\mathbf{P}$ trong phép thử sẽ được tính theo công thức xác suất đầy đủ với hệ đầy đủ $\{A_1,A_2,\cdots,A_n\}$.
Ví dụ 1.24. Xét một lô giày chiến sĩ được sản xuất bởi 3 nhà máy với tỉ lệ lần lượt là 20%, 30% và 50%. Xác suất giày hỏng của các nhà máy lần lượt là 0,001; 0,005 và 0,006. Lấy ngẫu nhiên một chiếc giày từ lô hàng. Tìm xác suất để chiếc giày lấy ra bị hỏng.
Gọi $A$ là sự kiện “lấy được giày hỏng”,
$A_i$ là sự kiện “lấy được giày của nhà máy $i$” ($i=1,2,3$).
Ta có $\{A_1,A_2,A_3\}$ là hệ đầy đủ. Theo công thức \eqref{dd}, ta có \begin{align*}P(A)&=P(A_1).P(A|A_1)+P(A_2).P(A|A_2)+P(A_3).P(A|A_3)\\&=0,2.0,001+0,3.0,005+0,5.0,006=0,0065.\end{align*}
1.4.2. Công thức Bayes
Công thức Bayes, mang tên của linh mục và nhà toán học người Anh Thomas Bayes (1702-1761), là công thức ngược, cho phép tính xác suất có điều kiện $P(B|A)$ khi biết xác suất có điều kiện $P(A|B)$ và một số thông tin khác. Dạng đơn giản nhất của công thức này là: Nếu $A, B$ là hai sự kiện bất kì với xác suất khác 0 thì từ (1.7) và (1.8), ta có: $$\label{Bay} P(B|A)=\dfrac{P(A|B).P(B)}{P(A)}. \tag{1.13}$$
Kết hợp \eqref{Bay} với công thức xác suất đầy đủ \eqref{dd} cho $P(A)$, ta được:
Định lý 1.1. Giả sử $\{A_1,A_2,\cdots,A_n\}$ là hệ đầy đủ và $A$ là một sự kiện bất kì có thể xảy ra trong phép thử. Khi đó ta có công thức Bayes: $$\label{Bay1} P(A_k|A)=\dfrac{P(A_k).P(A|A_k)}{P(A)}=\dfrac{P(A_k).P(A|A_k)}{\sum_{i=1}^n P(A_i).P(A|A_i)} \tag{1.14}$$ với mọi $k=1,2,\cdots,n$.
Ví dụ 1.25. Mạng Bayes được sử dụng trên các trang Web của các nhà sản xuất công nghệ cao nhằm giúp khách hàng nhanh chóng chẩn đoán các vấn đề với sản phẩm. Chẳng hạn, một doanh nghiệp sản xuất máy in thu được các kết quả từ cơ sở phân tích dữ liệu khảo sát của khách hàng. Trong đó, các lỗi xuất hiện ở máy in được chia làm ba nhóm: phần cứng, phần mềm và các loại khác (chẳng hạn như trình kết nối) với xác suất tương ứng là 0,1; 0,6 và 0,3. Xác suất lỗi do phần cứng gây ra là 0,9; do phần mềm là 0,2 và do các vấn đề khác là 0,5. Nếu khách hàng truy cập trang web của nhà sản xuất để chẩn đoán lỗi máy in, nguyên nhân nào có khả năng cao nhất?
Gọi $A$ là sự kiện “máy in bị lỗi”, $B$ là sự kiện “lỗi thuộc phần cứng”, $C$ là sự kiện “lỗi thuộc phần mềm” và $D$ là sự kiện “lỗi thuộc các vấn đề khác”.
Ta có $\{B,C,D\}$ là hệ đầy đủ. Áp dụng \eqref{Bay1} ta có:
Xác suất để lỗi của máy in thuộc nhóm phần cứng là \begin{align*} P(B|A)&=\dfrac{P(B).P(A|B)}{P(B).P(A|B)+P(C).P(A|C)+P(D).P(A|D)}\\ &=\dfrac{0,1.0,9}{0,1.0,9+0,6.0,2+0,3.0,5}=\dfrac{1}{4}. \end{align*}
Vậy lỗi máy có nguyên nhân từ nhóm các loại khác có khả năng cao nhất.
Ví dụ 1.26. Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng 0,85 và 0,15. Do có nhiễu trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B còn 1/8 tín hiệu B bị méo và thu được như tín hiệu A.
a) Tìm xác suất để máy thu được tín hiệu A.
b) Giả sử máy đã thu được tín hiệu A. Hỏi xác suất thu được đúng tín hiệu phát đi?
Gọi $A$ là sự kiện “phát tín hiệu A”, $B$ là sự kiện “phát tín hiệu B” thì $\{A, B\}$ là hệ đầy đủ. Gọi $T_A$ là sự kiện “thu được tín hiệu A”, $T_B$ là sự kiện “thu được tín hiệu B”. Theo đề bài ta có: $$ P(A)=0,85;\quad P(B)=0,15;\quad P(T_B|A)=1/7;\quad P(T_A|B)=1/8. $$
a) Áp dụng công thức xác suất đầy đủ, máy thu được tín hiệu A với xác suất $$ P(T_A)=P(A).P(T_A|A)+P(B).P(T_A|B)=0,85.\dfrac{6}{7}+0,15.\dfrac{1}{8}\approx 0,7473. $$
b) Áp dụng công thức Bayes ta có: $$ P(A|T_A)=\dfrac{P(A).P(T_A|A)}{P(T_A)}=\dfrac{0,85.\dfrac{6}{7}}{0,7473}\approx 0,975. $$
Nhận xét: Công thức Bayes cho phép đánh giá lại xác suất xảy ra các sự kiện $A_k$, sau khi đã có thêm thông tin về sự kiện $A$. Cần phải nhấn mạnh rằng nếu muốn dùng các công thức \eqref{dd} hoặc \eqref{Bay1}, nhất thiết phải có hệ đầy đủ. Ngoài ra nếu \eqref{dd} cho ta xác suất không có điều kiện, thì \eqref{Bay1} cho phép tính xác suất có điều kiện, trong đó sự kiện $A_k$ cần tính xác suất phải là một thành viên của hệ đầy đủ đang xét. Từ đó thấy rằng việc dùng công thức Bayes để tính xác suất có điều kiện đã gợi ý cho ta cách chọn hệ đầy đủ sao cho sự kiện quan tâm phải là thành viên. Trong trường hợp không có (hoặc rất khó xác định) hệ đầy đủ, ta nên dùng công thức \eqref{Bay}, khi đó việc tính $P(A)$ sẽ khó hơn là dùng công thức \eqref{dd}.
Ví dụ 1.27. Một mạch điện gồm 2 bộ phận mắc nối tiếp, với xác suất làm việc tốt trong một khoảng thời gian nào đó của mỗi bộ phận là 0,95 và 0,98. Ở một thời điểm trong khoảng thời gian trên, người ta thấy mạch điện ngừng làm việc (do bộ phận nào đó hỏng), tìm xác suất để chỉ bộ phận thứ hai hỏng.
Do 2 bộ phận mắc nối tiếp nên chỉ 1 bộ phận hỏng là mạch ngừng làm việc.
Gọi $A_i$ là sự kiện “bộ phận thứ $i$ tốt” $(i=1,2)$, khi đó có 4 khả năng khác nhau:
- $B_0$ là sự kiện “cả 2 bộ phận đều tốt”;
- $B_1$ là sự kiện “bộ phận I tốt, bộ phận II hỏng”;
- $B_2$ là sự kiện “bộ phận I hỏng, bộ phận II tốt”;
- $B_3$ là sự kiện “cả 2 bộ phận đều hỏng”.
Ta có hệ $\{B_0,B_1,B_2,B_3\}$ là hệ đầy đủ. Do tính độc lập của các thiết bị nên \begin{align*} &P(B_0)=P(A_1\cap A_2)=P(A_1).P(A_2)=0,95.0,98=0,931,\\ &P(B_1)=P(A_1\cap \overline{A_2})=P(A_1).P(\overline{A_2})=0,95.0,02=0,019,\\ &P(B_2)=P(\overline{A_1}\cap A_2)=P(\overline{A_1}).P(A_2)=0,05.0,98=0,049,\\ &P(B_3)=P(\overline{A_1}\cap \overline{A_2})=P(\overline{A_1}).P(\overline{A_2})=0,05.0,02=0,001. \end{align*}
Gọi $A$ là sự kiện “mạch không làm việc” thì $$ P(A|B_0)=0,\quad P(A|B_1)=P(A|B_2)=P(A|B_3)=1. $$
Áp dụng công thức \eqref{Bay1} ta có xác suất cần tìm là: $$ P(B_1|A)=\dfrac{P(B_1).P(A|B_1)}{\sum_{i=0}^3P(B_i).P(A|B_i)}=\dfrac{0,019}{0,019+0,049+0,001}=\dfrac{19}{69}. $$
Ta có thể dùng \eqref{Bay} để tính $P(B_1|A)$. Ta có $$ A=(A_1\cap \overline{A_2})\cup (\overline{A_1}\cap A_2)\cup (\overline{A_1}\cap\overline{A_2}). $$
Do tính xung khắc và độc lập của các sự kiện tương ứng nên $$ P(A)=P(A_1).P(\overline{A_2})+P(\overline{A_1}).P(A_2)+P(\overline{A_1}).P(\overline{A_2})=0,069. $$
Mặt khác $B_1\cap A=A_1\cap\overline{A_2}$ nên $P(B_1\cap A)=0,019$, từ đó ta suy ra kết quả cần tìm mà không cần đến hệ đầy đủ. Tuy nhiên mọi khó khăn rơi vào việc tính $P(A)$.
1.4.3. Công thức Bernoulli
Trong thực tế nhiều khi ta gặp những phép thử gồm một dãy liên tiếp các phép thử như nhau được lặp đi lặp lại $n$ lần và để ý đến sự xuất hiện của một sự kiện $A$ nào đó trong $n$ lần thử này. Chẳng hạn bắn 10 viên đạn độc lập vào một mục tiêu, mỗi lần bắn 1 viên được xem như tiến hành một phép thử, 10 lần bắn độc lập là 10 phép thử độc lập.
Định nghĩa 1.11. Tiến hành một dãy $n$ phép thử mà phép thử sau độc lập với các phép thử trước đó. Trong mỗi phép thử chỉ có 2 kết quả: hoặc xảy ra sự kiện $A$ hoặc không xảy ra, xác suất xảy ra sự kiện $A$ ở mỗi phép thử là như nhau và bằng $p\, (p\neq 0, p\neq 1)$. Dãy $n$ phép thử độc lập này còn được gọi là một lược đồ Bernoulli.
Trong một lược đồ Bernoulli sự kiện $A$ có thể xuất hiện từ 0 đến $n$ lần. Gọi $B$ là sự kiện “$A$ xuất hiện đúng $k$ lần”, ta thấy $B$ có thể xảy ra theo nhiều phương án khác nhau, miễn sao trong dãy các kết quả của $n$ phép thử sự kiện $A$ có mặt đúng $k$ lần. Rõ ràng, mỗi kết quả thỏa mãn sự kiện $B$ tương ứng với việc chọn ra $k$ phép thử ($A$ xuất hiện) từ $n$ phép thử đã cho, hay có tất cả $C_n^k$ phương án như vậy. Do trong dãy $n$ phép thử độc lập, sự kiện $A$ xuất hiện đúng $k$ lần, $\overline{A}$ xuất hiện $n-k$ lần, nên xác suất để xảy ra một phương án sẽ bằng $p^k(1-p)^{n-k}$. Từ đó ta có công thức Bernoulli $$\label{Ber} P(B)=P_n(k;p)=C^k_n.p^k.(1-p)^{n-k},\quad k=0,1,\cdots, n. \tag{1.15}$$
Ví dụ 1.28. Một máy thông tin có 5 chi tiết đối với độ tin cậy (xác suất làm việc tốt trong một khoảng thời gian nào đó) của mỗi chi tiết là 0,9. Tìm xác suất để trong khoảng thời gian ấy có đúng 2 chi tiết làm việc tốt.
Rõ ràng ta có lược đồ Bernoulli với $n=5$; $p=0,9$ và $k=2$, áp dụng \eqref{Ber} ta có xác suất cần tìm là $$ P_{5}(2;0,9)=C^2_{5}.(0,9)^2.(0,1)^3=81.10^{-4}.$$
Ví dụ 1.29. Một học viên có xác suất bắn trúng mục tiêu là 0,8. Có ý kiến cho rằng học viên đó cứ 10 lần bắn thì chắc chắn có 8 lần trúng mục tiêu, điều đó có đúng không?
Ý kiến trên là sai. Ở đây có thể coi việc thực hiện 10 lần bắn là dãy 10 phép thử, trong đó $A$ là sự kiện bắn trúng mục tiêu có $P(A)=0,8$. Từ đó xác suất để trong 10 lần bắn có đúng 8 lần trúng mục tiêu là $$ P_{10}(8;0,8)=C^8_{10}.(0,8)^8.(0,2)^2\approx 0,3108. $$
Định lý 1.2. Thực hiện một dãy $n$ phép thử Bernoulli với xác suất thành công trong mỗi lần thử là $p$. Ta có các kết quả sau
(ii) $P_{\max}=P_n(m;p)$ với $(n+1)p-1\leq m\leq (n+1)p$, $m\in\mathbb Z_+$ được gọi là giá trị có khả năng xảy ra lớn nhất.
Ví dụ 1.30. Một chiến sĩ bắn ngẫu nhiên, độc lập 20 viên đạn vào một mục tiêu với xác suất bắn trúng đích của mỗi viên đạn là 0,4. Tìm số viên đạn trúng đích với khả năng cao nhất.
Xem việc bắn độc lập 20 viên đạn vào một mục tiêu như là tiến hành 20 phép thử Bernoulli với xác suất trúng đích của mỗi viên đạn (sự kiện $A$) là không đổi $p=0,4$. Ta có $n=20$ và $(n+1)p-1=7,4$ nên $m=8$.
Vậy khả năng lớn nhất là có 8 viên đạn trúng đích.