Skip navigation

1.2. Sự kiện ngẫu nhiên và xác suất

1.2.1. Sự kiện (biến cố) ngẫu nhiên

Trong lí thuyết xác suất, sự kiện được hiểu như là một sự việc, một hiện tượng nào đó của cuộc sống tự nhiên và xã hội.

Phép thử ngẫu nhiên (hay còn gọi là phép thử) là một hành động hay thí nghiệm mà ta không đoán trước được kết quả của nó, tuy nhiên có thể xác định được tập hợp tất cả các kết quả có thể có của phép thử đó.

Ví dụ 1.10. Gieo một con xúc xắc đồng chất trên một mặt phẳng (phép thử). Phép thử này có 6 kết quả là: xuất hiện mặt 1 chấm, mặt 2 chấm, ..., mặt 6 chấm. Mỗi kết quả này cùng với các kết quả phức tạp hơn như: xuất hiện mặt có số chấm là số nguyên tố, mặt có số chấm chẵn, mặt có số chấm là bội của 2, đều có thể coi là các sự kiện.

Như vậy kết quả của một phép thử là một trường hợp riêng của sự kiện. Sự kiện được gọi là tất yếu, nếu nó chắc chắn xảy ra, và được gọi là bất khả, nếu nó không thể xảy ra khi thực hiện phép thử. Còn nếu sự kiện có thể hoặc không xảy ra sẽ được gọi là sự kiện ngẫu nhiên.

Để mô tả một phép thử, người ta xác định một tập hợp các kết quả của nó. Tập hợp tất cả các kết quả của một phép thử tạo thành không gian các sự kiện sơ cấp (hay không gian mẫu), kí hiệu là $\mathbf{\Omega}$. Chẳng hạn, trong Ví dụ 1.10, nếu kí hiệu $A_i$ là sự kiện xuất hiện mặt $i$ chấm ($i=\overline{1,6}$) thì $\mathbf{\Omega}=\{A_1,A_2,A_3,A_4,A_5,A_6\}$.

Một câu hỏi tự nhiên là: “Do đâu có sự kiện ngẫu nhiên? Và chúng ta có thể nhận biết được nó không?” Thực ra mỗi sự kiện đều xảy ra theo một quy luật nào đó, song do điều kiện thiếu thông tin và phương tiện cần thiết (kinh phí, trang thiết bị và thời gian) nên ta không có khả năng nhận định đầy đủ về sự kiện đó. Vấn đề càng trở nên khó khăn hơn khi chỉ cần có một sự thay đổi bất ngờ dù rất nhỏ của điều kiện tiến hành phép thử sẽ làm thay đổi kết quả của phép thử đó. Cho nên bài toán xác định bản chất xác suất của một sự kiện bất kì trong một phép thử tùy ý là không thể giải được.

1.2.2. Xác suất của một sự kiện

Xác suất của một sự kiện (hay biến cố, tình huống giả định) là khả năng xảy ra sự kiện đó, được đánh giá dưới dạng một số thực nằm giữa 0 và 1. Khi một sự kiện không thể xảy ra thì xác suất của nó bằng 0; ngược lại, một sự kiện chắc chắn đã hoặc sẽ xảy ra thì xác suất của nó bằng 1. Chẳng hạn, đứng tại Hà Nội ném một hòn đá, sự kiện “đá rơi xuống địa giới Việt Nam” có xác suất bằng 1, trong khi sự kiện “đá rơi xuống Thái Bình Dương” có xác suất bằng 0. Khi một sự kiện có thể xảy ra hoặc có thể không xảy ra, và ta không biết chắc chắn nó có xảy ra hay không, thì ta có thể coi xác suất của nó lớn hơn 0 và nhỏ hơn 1. Sự kiện nào càng dễ xảy ra hơn thì có xác suất càng lớn (càng gần 1), và ngược lại nếu càng khó xảy ra thì xác suất càng nhỏ (càng gần 0). Ví dụ khi bắn một viên đạn vào bia, ta không đoán trước được viên đạn trúng bia hay không trúng bia. Nếu như cứ 100 lần bắn có 75 lần trúng bia, thì ta sẽ coi xác suất bắn trúng bia là 75%. Con số 75% ở đây chính là tần suất hay tỉ lệ bắn trúng của các lần bắn, nó bằng số lần bắn trúng bia chia cho tổng số lần bắn. Không những chỉ các sự kiện trong tương lai, mà cả các sự kiện trong quá khứ, mà chúng ta thiếu thông tin để có thể biết chắc là chúng đã thực sự xảy ra hay không, thì chúng ta vẫn có thể gán cho các sự kiện đó một xác suất nào đó, ứng với độ tin tưởng của chúng ta về việc sự kiện đó đã thực sự xảy ra hay không. Ví dụ như: sự tuyệt chủng của loài khủng long có phải do một thiên thạch cỡ lớn rơi xuống Trái Đất? Đấy là một giả thuyết, mà theo các nhà khoa học thì có nhiều khả năng xảy ra, nhưng không chắc chắn.

1.2.3. Định nghĩa xác suất và các tính chất

a) Định nghĩa cổ điển

Trong mục này, ta sẽ làm việc với các phép thử có kết quả đồng khả năng. Xét ví dụ sau.

Ví dụ 1.11. Trong một hộp có $n$ viên bi giống nhau về kích cỡ và chỉ khác nhau về màu sắc, trong đó có $m$ bi trắng và $n-m$ bi đỏ. Lấy ra một viên bi (phép thử). Do số viên bi là $n$ nên tổng số các kết quả khác nhau sẽ là $n$, và vì tính giống nhau của chúng nên mỗi viên bi có cùng khả năng được rút. Gọi $A$ là sự kiện “rút được bi trắng” thì trong số $n$ kết quả đồng khả năng có $m$ kết quả thuận lợi cho $A$ (nghĩa là biến cố $A$ xảy ra khi và chỉ khi một trong các kết quả này xảy ra). Vì vậy trực giác cho thấy nên lấy $m/n$ làm xác suất của việc xuất hiện sự kiện $A$.

Định nghĩa 1.5. Giả sử một phép thử với $n$ kết quả đồng khả năng, trong đó có $m$ kết quả thuận lợi cho sự kiện $A$. Khi đó xác suất của sự kiện $A$, kí hiệu là $P(A)$, được cho bởi $$\label{dn1} P(A)=\dfrac{m}{n}=\dfrac{\text{số kết quả thuận lợi đối với }A}{\text{số kết quả đồng khả năng}}. \tag{1.1}$$

Cách tính xác suất theo \eqref{dn1} có ưu điểm là tương đối đơn giản, tuy nhiên phạm vi áp dụng rất hạn chế chỉ cho các phép thử gồm hữu hạn kết quả đồng khả năng.

Ví dụ 1.12. Trong hộp đựng 20 viên đạn gồm 14 viên màu đỏ và 6 viên màu trắng. Lấy ngẫu nhiên (không hoàn lại) 5 viên đạn từ trong hộp. Tính xác suất để trong 5 viên đạn lấy ra có 3 viên đỏ. Biết rằng các viên đạn giống nhau. 

Ví dụ 1.13. Kết quả bài thi cuối kì môn Toán cho trong bảng dưới đây

Lớp Điểm Tổng bài thi
6 7 8 9 10
ĐH-A 5 14 6 2 1 28 bài
ĐH-B 6 15 1 3 2 27 bài

Rút ngẫu nhiên từ mỗi lớp một bài thi. Tìm xác suất để hai bài rút ra:

a) Đều đạt điểm 10.

b) Có đúng một bài đạt điểm 10.

c) Có ít nhất một bài đạt điểm 10.

b) Tính chất của xác suất

Tính chất 1. Nếu $A$ là một sự kiện thì xác suất của $A$ thỏa mãn $$\label{tc1} 0\leq P(A)\leq 1. \tag{1.2}$$

Tính chất 2. Nếu $A$ là một sự kiện và kí hiệu $\overline{A}$ là sự kiện phủ định của $A$ thì $$\label{tc2} P(A)+P(\overline{A})=1. \tag{1.3}$$

Ý nghĩa triết học của Tính chất 2 tương đối hiển nhiên vì trong hai sự kiện $A$ và $\overline{A}$ có một và chỉ một sự kiện xảy ra. Nếu $A$ càng có nhiều khả năng xảy ra thì $\overline{A}$ càng có ít khả năng xảy ra, và ngược lại.

Ví dụ 1.14. Một học viên kiểm tra bắn súng AK. Nếu xác suất bắn trúng là 70% thì xác suất bắn trượt là 30% (=100% - 70%), chứ không thể là 20%.

Tính chất 3. Với hai sự kiện $A$ và $B$ ta sẽ kí hiệu sự kiện “cả $A$ và $B$ đều xảy ra” bằng $A\cap B$ và sự kiện “ít nhất một trong hai sự kiện $A$ hoặc $B$ xảy ra” bằng $A\cup B$. Khi đó nếu hai sự kiện $A$ và $B$ không thể cùng xảy ra, thì xác suất của sự kiện “xảy ra $A$ hoặc $B$” bằng tổng các xác suất của $A$ và của $B$, tức là $$\label{tc3} \text{Nếu }P(A\cap B)=0 \text{ thì }P(A\cup B)=P(A)+P(B). \tag{1.4}$$

Ví dụ 1.15. Điểm thi của một học viên có thể là 8 điểm, có thể là 9 điểm, hoặc có thể là điểm khác, nhưng không thể vừa được 8 điểm vừa được 9 điểm. Bởi vậy $P\big((8\text{đ})\cup (9\text{đ})\big)=P(8\text{đ})+P(9\text{đ})$.

Tính chất 4. Nếu $A$ và $B$ là hai sự kiện bất kì thì $$\label{tc4} P(A\cup B)=P(A)+P(B)-P(A\cap B). \tag{1.5}$$

Ví dụ 1.16. Hai đội TCU-1 và TCU-2 của trường đại học Thông tin liên lạc tham gia cuộc thi Robocon toàn quốc. Khả năng lọt qua vòng loại để vào vòng chung kết của từng đội tương ứng là 90% và 70% (mỗi bảng chỉ chọn một đội vào vòng chung kết và hai đội TCU-1, TCU-2 không cùng trong một bảng đấu loại). Tính khả năng xảy ra các tình huống sau:

a) Cả hai đội lọt vào vòng chung kết.

b) Có ít nhất một đội lọt vào vòng chung kết.

c) Chỉ có đội TCU-1 lọt vào vòng chung kết.

c) Định nghĩa theo phương pháp thống kê

Điều kiện đồng khả năng của các kết quả của một phép thử không phải lúc nào cũng được đảm bảo. Có nhiều hiện tượng xảy ra không theo các yêu cầu của định nghĩa cổ điển, chẳng hạn khi tính xác suất một đứa trẻ sắp ra đời là con trai, hạt đậu tương không nảy mầm, ngày mai trời mưa...

Có một cách khác để xác định xác suất của một sự kiện. Giả sử ta tiến hành $n$ phép thử với cùng một hệ điều kiện thấy có $n_A$ lần xuất hiện sự kiện $A$. Số $n_A$ được gọi là tần số xuất hiện sự kiện $A$ và tỉ số 

$$ f_n(A)=\dfrac{n_A}{n}$$  gọi là tần suất xuất hiện sự kiện  $A.$

Ta nhận thấy rằng khi $n$ thay đổi, $n_A$ thay đổi vì thế $f_n(A)$ cũng thay đổi. Ngay cả khi tiến hành dãy $n$ phép thử khác với cùng một điều kiện thì tần số và tần suất của $n$ lần thử này cũng có thể khác tần số và tần suất của $n$ lần thử trước. Tuy nhiên, trên cơ sở quan sát lâu dài các phép thử khác nhau người ta nhận thấy tần suất xuất hiện một sự kiện có tính ổn định, thay đổi rất ít trong các loạt phép thử khác nhau và dao động xung quanh một hằng số xác định. Sự khác biệt đó càng ít khi số phép thử tăng nhiều lên. Đặc tính ổn định của tần suất khi số phép thử tăng lên khá lớn cho phép ta định nghĩa xác suất của sự kiện là trị số ổn định đó của tần suất xuất hiện sự kiện. Nhưng do hằng số đó chưa biết, nên người ta lấy ngay tần suất khi số phép thử đủ lớn làm xác suất của sự kiện. Cách hiểu như vậy được gọi là định nghĩa thống kê của xác suất. Cơ sở toán học cho việc dùng thống kê để tính xác suất là luật số lớn và các định lí giới hạn, mà chúng ta sẽ tìm hiểu ở Chương 2 trong giáo trình này. Có nhiều ví dụ minh họa tính ổn định của tần suất khi số phép thử khá lớn. Ta có thể tham khảo một ví dụ kinh điển về xác định tần số và tần suất việc xuất hiện mặt sấp (mặt không có chữ) của một đồng tiền do Buffon và Pearson thực hiện

Ta nhận thấy rằng khi số lần tung đồng tiền $n$ tăng lên, tần suất xuất hiện mặt sấp ổn định dần về giá trị 0,5 được lấy làm xác suất xuất hiện mặt sấp khi tung một đồng tiền cân đối và đồng chất.

Người làm thí nghiệm Số lần tung một đồng tiền Tần số mặt sấp Tần suất mặt sấp
Buffon 4040 2040 0,505
Pearson 12000 6010 0,501
Pearson 24000 12012 0,5005

Một ví dụ khác: Có một vài số liệu sau đây về tai nạn ô tô và máy bay. Trong những năm 1989-1999, trên toàn thế giới, trung bình mỗi năm có khoảng 18 triệu chuyến bay, 24 tai nạn máy bay chết người, và 750 người chết trong tai nạn máy bay. Cũng trong khoảng thời gian đó, ở nước Pháp, trung bình mỗi năm có khoảng 8000 người chết vì tai nạn ô tô, trên tổng số 60 triệu dân. Từ các số liệu này, chúng ta có thể tính xác suất để một người ở Pháp bị chết vì tai nạn ô tô trong một năm là 8000/60 000 000 = 0,0133%. Xác suất để đi một chuyến bay gặp tai nạn chết người là 24/18 000 000 = 0,000133%, chỉ bằng 1/100 xác suất bị chết vì tai nạn ô tô trong 1 năm ở Pháp. Nếu một người một năm bay 20 chuyến, thì xác suất bị chết vì tai nạn máy bay trong năm bằng khoảng $20 \times 0,000133\%= 0,00266$%, tức là chỉ bằng 1/5 xác suất bị chết vì tai nạn ô tô trong năm ở Pháp.

Định nghĩa xác suất theo thống kê khắc phục được hạn chế của định nghĩa cổ điển, nó hoàn toàn dựa trên các thí nghiệm quan sát thực tế để tìm xác suất của sự kiện. Tuy nhiên định nghĩa thống kê về xác suất cũng chỉ áp dụng cho các phép thử mà có thể lặp lại được nhiều lần một cách độc lập trong những điều kiện giống hệt nhau. Ngoài ra để xác định một cách tương đối chính xác giá trị của xác suất thì cần tiến hành một số $n$ đủ lớn lần các phép thử, mà việc này đôi khi không thể làm được vì hạn chế về thời gian và kinh phí.

Ngày nay với sự trợ giúp của công nghệ thông tin, người ta có thể mô phỏng các phép thử ngẫu nhiên mà không cần thực hiện các phép thử trong thực tế. Điều này cho phép tính xác suất theo phương pháp thống kê thuận tiện hơn.

d) Định nghĩa theo hình học

Với những phép thử đồng khả năng mà số kết quả sau một phép thử là vô hạn thì việc sử dụng định nghĩa xác suất cổ điển để tính xác suất của một sự kiện là không thực hiện được. Để khắc phục hạn chế này người ta đưa ra định nghĩa xác suất bằng hình học.

Giả sử tập hợp (vô hạn) các kết quả đồng khả năng của một phép thử có thể biểu thị bởi miền hình học $\Omega$ (chẳng hạn đoạn thẳng, miền cong hoặc khối không gian). Số đo độ dài, diện tích, thể tích tương ứng được gọi là độ đo của miền $\Omega$ và kí hiệu là $m(\Omega)$.

Định nghĩa 1.6. Xét một phép thử với vô hạn kết quả đồng khả năng, giả sử có thể thiết lập sự tương ứng một - một mỗi thuận lợi cho sự kiện $A$ với một điểm thuộc miền $A\subset\Omega$ có độ đo là $m(A)$. Khi đó xác suất sự kiện $A$ là $$ P(A)=\dfrac{m(A)}{m(\Omega)}. $$

Ví dụ 1.17. Một đường cáp quang nối Hà Nội với thành phố Hồ Chí Minh dài 1800 km gặp sự cố kĩ thuật làm tắc nghẽn thông tin liên lạc. Sự cố kĩ thuật có thể xảy ra ở bất cứ một vị trí nào của đường cáp quang với cùng một khả năng. Tính xác suất để sự cố kĩ thuật xảy ra cách Hà Nội không quá 200km.

Ta có miền $\Omega$ là đường cáp quang nối Hà Nội và thành phố Hồ Chí Minh có $m(\Omega)=1800$. Miền $A$ tương ứng với sự kiện cần tính xác suất là đoạn cáp quang từ Hà Nội tới vị trí cách Hà Nội 200 km nên $m(A)=200$. Vậy xác suất là $1/9$.

Ví dụ 1.18. Hai người bạn hẹn gặp nhau tại một địa điểm xác định trong khoảng từ 7h đến 8h. Mỗi người đến (và chắc chắn đến) điểm hẹn một cách độc lập, nếu không gặp người kia thì đợi 30 phút hoặc đến 8 giờ thì không đợi nữa. Tìm xác suất để hai người gặp nhau.

1.2.4. Nguyên lí xác suất lớn, xác suất nhỏ

Trong ứng dụng của lí thuyết xác suất, ta thường gặp vấn đề sau: Giả sử bằng cách nào đó, thông qua những quan sát của quá khứ, chúng ta biết được rằng xác suất của sự kiện $A$ trong một phép thử là $P(A)=p\in [0,1]$. Ta có thể nói gì về việc xảy ra của sự kiện $A$ trong 1 lần thử đơn lẻ tiếp theo?

Một sự kiện các xác suất rất nhỏ, thậm chí gần bằng 0 vẫn có thể xảy ra khi thực hiện phép thử. Qua thực nghiệm và quan sát thực tế, người ta thấy rằng các sự kiện có xác suất nhỏ sẽ không xảy ra khi ta chỉ thực hiện một phép thử hay một vài phép thử. Từ đó ta thừa nhận nguyên lí sau đây.

Nguyên lí xác suất nhỏ: “Nếu một sự kiện có xác suất rất nhỏ thì thực tế có thể cho rằng sự kiện đó sẽ không xảy ra trong một (một vài) phép thử ở tương lai”.

Một sự kiện có thể coi là có xác suất nhỏ tuỳ thuộc vào bài toán cụ thể. Chẳng hạn mỗi chiếc máy bay đều có một xác suất rất nhỏ bị xảy ra tai nạn (như ví dụ trên là 0,000133%). Nhưng trên thực tế ta vẫn không từ chối đi máy bay vì tin rằng trong chuyến bay ta đi sự kiện máy bay rơi không xảy ra.

Hiển nhiên việc quy định một mức xác suất thế nào được gọi là nhỏ sẽ phụ thuộc vào từng bài toán cụ thể. Chẳng hạn nếu xác suất để máy bay rơi là 0,01% thì xác suất đó chưa thể được coi là nhỏ. Song nếu xác suất một chuyến tàu khởi hành chậm là 0,01% thì có thể coi rằng xác suất này là nhỏ.

Mức xác suất nhỏ này được gọi là mức ý nghĩa. Nếu $\alpha$ là mức ý nghĩa thì số $\beta=1-\alpha$ gọi là độ tin cậy. Khi dựa trên nguyên lí xác suất nhỏ ta nói rằng: “Sự kiện $A$ có xác suất nhỏ (tức là $P(A)\leq\alpha$) sẽ không xảy ra trên thực tế với độ tin cậy là $\beta$”. Tính đúng đắn của kết luận sẽ xảy ra trong $100.\beta\%$ trường hợp.

Tương tự như vậy ta có thể đưa ra Nguyên lí xác suất lớn: “Nếu sự kiện $A$ có xác suất lớn (gần bằng 1) thì trên thực tế có thể hiểu sự kiện đó sẽ xảy ra trong một (hoặc một vài) phép thử tiếp theo”.

Tra cứu kiến thức môn học close