Skip navigation

2.1. Biến ngẫu nhiên và phân phối xác suất

2.1.1. Khái niệm biến ngẫu nhiên

a) Khái niệm

“Biến” là cái có thể thay đổi. “Ngẫu nhiên” nghĩa là ta chưa xác định được. Một biến có thể là ngẫu nhiên với người này, nhưng không ngẫu nhiên với người khác, tùy theo lượng thông tin nhận được. Ví dụ, số tuổi của ông A là một số xác định, không ngẫu nhiên đối với ông A, nhưng nó là một số không xác định, ngẫu nhiên với ông B nào đó.

Khái niệm biến số (đại lượng biến thiên) đã rất thông dụng trong toán giải tích. Chính vì thế ta tìm cách đưa vào khái niệm biến số ngẫu nhiên như là một đại lượng phụ thuộc vào kết cục của một phép thử ngẫu nhiên.

Ví dụ 2.1. Khi nghiên cứu BNN “nhiệt độ” của một phản ứng hóa học trong một khoảng thời gian nào đó, ta thấy nhiệt độ đó nhận giá trị trong một khoảng $[t;T]$, trong đó $t$ và $T$ tương ứng là các nhiệt độ thấp nhất và cao nhất của phản ứng trong khoảng thời gian trên.

Về mặt hình thức, có thể định nghĩa BNN như là một hàm số có giá trị thực xác định trên không gian các sự kiện sơ cấp (sao cho nghịch ảnh của một khoảng số là một sự kiện), tức là $$ X:\mathbf{\Omega}\to \mathbb R, $$trong đó $\mathbf{\Omega}$ là không gian các sự kiện sơ cấp. Để phân biệt sau này ta kí hiệu $X, Y$,... là các BNN, còn $x,y$,... là giá trị của các BNN đó. Như vậy, $X$ mang tính ngẫu nhiên, còn $x$ là giá trị cụ thể quan sát được khi phép thử đã tiến hành. Trong giáo trình này, ta chỉ xét những BNN thỏa mãn điều kiện $X(\omega)<+\infty$, với mọi $\omega\in\mathbf{\Omega}$.

Tương tự như với các số và các hàm số, ta có thể làm nhiều phép toán khác nhau với các BNN: cộng, trừ, nhân, chia, lấy giới hạn, tích phân, hàm hợp... Qua các phép toán như vậy, chúng ta có thể suy ra các BNN mới từ các BNN cho trước.

Ví dụ 2.2. Một học sinh thi vào đại học phải thi 3 môn. Điểm của mỗi môn có thể coi là BNN. Tổng điểm cũng là một BNN, và là tổng của 3 BNN trước.

Ví dụ 2.3. Tốc độ $V$ của một xe ô tô đang chạy trên đường có thể coi là một BNN. Nếu xe đang chạy mà phải phanh gấp lại vì phía trước có nguy hiểm, thì từ thời điểm người lái xe đạp phanh cho đến thời điểm xe dừng lại, xe phải chạy thêm được một quãng đường có độ dài $D$ nữa. $D$ cũng có thể coi là một BNN. Nó không phải là tỷ lệ thuận với $V$, mà là tỷ lệ thuận với $V^2$. Tức là BNN $D$ có thể được sinh ra từ BNN $V$ theo công thức: $D = k.V^2$. Hệ số $k$ ở đây phụ thuộc vào điều kiện của đường và điều kiện của xe; nó có thể coi là xác định nếu ta biết các điều kiện này, còn nếu không thì có thể coi là một BNN khác. Ví dụ, trong điều kiện bình thường, thì $k=0,08 s^2/m$, một xe đang chạy với tốc độ 36km/h (10m/s) thì từ lúc bóp phanh đến lúc dừng hẳn sẽ chạy thêm $0,08\times 10^2=8$ mét, nhưng nếu xe đang chạy với tốc độ 72km/h ($2\times 36$km/h) thì từ lúc đạp phanh đến lúc dừng hẳn sẽ chạy thêm những $8\times 2^2=32$ mét.

b) Phân loại

BNN được gọi là rời rạc, nếu tập giá trị của nó là một tập hữu hạn hoặc vô hạn đếm được các phần tử. Ví dụ: số điểm thi của một học sinh, số cuộc điện thoại gọi đến một tổng đài trong một đơn vị thời gian, số viên đạn trúng đích khi bắn liên tiếp $n$ viên đạn độc lập vào một mục tiêu,...

BNN được gọi là liên tục, nếu tập giá trị của nó lấp kín một khoảng trên trục số (số phần tử của tập giá trị là vô hạn không đếm được). Ví dụ: độ cao của một cây tại thời gian $t$ nào đó, nhiệt độ không khí ở mỗi thời điểm nào đó, độ dài của chi tiết máy, tuổi thọ của một loại thiết bị điện tử đang hoạt động,...

Như vậy miền giá trị của một BNN rời rạc sẽ là một dãy số $x_1, x_2,\cdots, x_n,\cdots$ có thể hữu hạn hoặc vô hạn. Miền giá trị của một BNN liên tục sẽ là một đoạn $[a,b]\subset \mathbb R$ hoặc là chính $\mathbb R = (-\infty, +\infty)$.

2.1.2. Phân phối xác suất của biến ngẫu nhiên

a) Bảng phân phối xác suất và hàm xác suất

Đối với BNN rời rạc, mỗi giá trị của nó được gắn với một xác suất đặc trưng cho khả năng BNN nhận giá trị đó $p_i=P(X=x_i)$. Bảng phân phối xác suất của $X$ có dạng sau

$X=x$ $x_1$ $x_2$ ... $x_n$ ...
$p(x)$ $p_1$ $p_2$ ... $p_n$ ...

trong đó $\{x_1,x_2,\cdots, x_n,\cdots\}$ là tập các giá trị của $X$ (đã sắp xếp theo thứ tự tăng), $p_n=p(x_n)=P(X=x_n)$.

Ví dụ 2.4. Một xạ thủ chỉ có 3 viên đạn. Anh ta được yêu cầu bắn từng phát cho đến khi trúng mục tiêu thì dừng bắn, biết rằng xác suất trúng của mỗi lần bắn là 0,6. Hãy lập bảng phân phối xác suất của số đạn cần bắn.

Hàm số $p(x)=P(X=x)$ với $x$ thuộc tập giá trị của $X$, thường được gọi là hàm xác suất của $X$ và có 2 tính chất cơ bản gồm:

 (i) $p(x)\geq 0, \forall x$.

(ii) $\sum\limits_{x}p(x)=1$.

Ví dụ 2.5. Một xạ thủ bắn 3 phát, xác suất bắn trúng mục tiêu của mỗi phát là 0,6. Hãy lập bảng phân phối xác suất của số đạn trúng mục tiêu.

b) Hàm phân phối xác suất

Bảng phân phối xác suất có một hạn chế cơ bản là chưa đủ tổng quát để đặc trưng cho một BNN tùy ý, nhất là trường hợp BNN liên tục. Vì vậy người ta đưa ra khái niệm sau.

Định nghĩa 2.1. Hàm phân phối xác suất của BNN $X$, kí hiệu là $F(x)$, được xác định như sau $$\label{2.1} F(x)=P(X<x),\quad x\in\mathbb R. \tag{2.1}$$

Từ định nghĩa trên, $F(x)$ phản ánh độ tập trung xác suất ở bên trái của số thực $x$. Trong trường hợp BNN rời rạc, \eqref{2.1} cho ta một hàm còn được gọi là hàm phân phối tích lũy (hay xác suất tích lũy), tức là

$$\label{2.2} F(x)=P(X=x_1)+\cdots+P(X=x_{i-1}),\text{ với }x_{i-1}< x\leq x_i. \tag{2.2}$$

Ví dụ 2.6. Giả sử BNN $X$ có bảng phân phối xác suất như sau

$X$ 1 2 3
$p(x)$ 0,5 0,2 0,3

Từ bảng phân phối trên và \eqref{2.2}, ta có hàm phân phối $$ F(x)=\begin{cases} 0&\text{ nếu }x\leq 1,\\ 0,5&\text{ nếu }1<x\leq 2,\\ 0,7&\text{ nếu }2<x\leq 3,\\ 1&\text{ nếu }x>3. \end{cases} $$

Để ý là số giá trị của $X$ bằng số điểm gián đoạn loại 1 của $F(x)$ (đồ thị dạng bậc thang).

Hàm phân phối xác suất có vai trò quan trọng khi nghiên cứu các BNN liên tục. Nếu ta biết được hàm phân phối xác suất thì ta sẽ xác định hoàn toàn BNN. Tuy nhiên trong thực tế, việc tìm được $F(x)$ là rất khó, nếu không nói là hầu như không thể làm được.

Một số tính chất của hàm phân phối $F(x)$:

(i) $0\leq F(x)\leq 1$;

(ii) $F(x)$ là một hàm không giảm, tức là nếu $x_1<x_2$ thì $F(x_1)\leq F(x_2)$;

(iii) $P(a\leq X\leq b)=F(b)-F(a)$;

(iv) $\lim\limits_{x\to-\infty}F(x)=0$ và $\lim\limits_{x\to+\infty}F(x)=1$.

Ví dụ 2.7. Cho hàm phân phối xác suất của một BNN liên tục $X$ có dạng: $$ F(x)=\begin{cases} 0,&x\leq 2,\\ k(x-2)^2,&2<x\leq 4,\\ 1,&x>4. \end{cases} $$Xác định hằng số $k$ và tính $P(2\leq X<3)$.

c) Hàm mật độ xác suất

Hàm phân phối xác suất $F(x)$ không cho biết rõ phân phối xác suất ở lân cận một điểm nào đó trên trục số. Vì vậy đối với các BNN liên tục, có $F(x)$ khả vi, người ta đưa ra khái niệm sau đây.

Định nghĩa 2.2. Hàm mật độ xác suất của BNN liên tục $X$, kí hiệu là $f(x)$, có hàm phân phối $F(x)$ khả vi (trừ ở một số hữu hạn điểm gián đoạn bị chặn), được xác định bằng $$\label{2.3} f(x)=F'(x). \tag{2.3}$$

Từ định nghĩa trên ta thấy nếu $X$ là BNN rời rạc thì hàm phân phối xác suất của $X$ là hàm gián đoạn nên $F(x)$ không khả vi tại những điểm gián đoạn. Vì vậy BNN rời rạc không có hàm mật độ xác suất.

Ngoài ra, từ \eqref{2.3} ta có $$F(x)=\int_{-\infty}^x f(x)dx\quad \text{và}\quad P(a\leq X< b)=\int_a^b f(x)dx.$$

Về mặt hình học, xác suất để BNN $X$ nhận giá trị trong $(a,b)$ (hoặc $[a,b]$) là diện tích phần mặt phẳng chắn bởi đường cong $p(x)$, trục $Ox$ và các đường thẳng tương ứng

Xác suất $P(a\leq X<b)$

Giả sử $X$ là BNN liên lục, khi đó $F(x)$ liên tục. Ta có $$ P(X=a)=\lim\limits_{b\to a^+}P(a\leq X<b)=\lim\limits_{b\to a^+}[F(b)-F(a)]=0. $$

Như vậy, từ $P(X=a)=0$, ta thấy rằng: Nếu $X$ là BNN liên tục thì $$ P(a\leq X\leq b)=P(a< X< b)=P(a< X\leq b)=P(a\leq X< b). $$

Hàm mật độ xác suất của một BNN liên tục có hai tính chất cơ bản giống như hàm xác suất là:

(i) $f(x)\geq 0, \forall x$.

(ii) $\int\limits_{-\infty}^{+\infty}f(x)=1$.

Từ tính chất $(ii)$, ta thấy diện tích của hình giới hạn bởi hàm mật độ xác suất và trục Ox bằng 1. Người ta cũng chứng minh được rằng nếu một hàm thực không âm $f(x)$ thỏa mãn $\int\limits_{-\infty}^{+\infty}f(x)dx=1$ thì nó cũng là hàm mật độ xác suất của một BNN $X$ nào đó.

Ví dụ 2.8. Cho $f(x)=\begin{cases} 0,&\text{ nếu }x\notin [0,\pi],\\ k\sin x,&\text{ nếu }x\in [0,\pi]. \end{cases}$

a) Tìm $k$ để $f(x)$ là hàm mật độ xác suất.

b) Tìm hàm phân phối xác suất tương ứng.

c) Tính xác suất để $X$ nhận giá trị trong khoảng $\left(\dfrac{\pi}{2},\dfrac{3\pi}{2}\right)$.

Tra cứu kiến thức môn học close