Khi biết bảng phân phối xác suất đối với BNN rời rạc hay biết hàm mật độ xác suất đối với BNN liên tục thì ta hoàn toàn xác định được quy luật xác suất của BNN. Tuy nhiên, trong thực tế, để giải quyết một vấn đề nào đó nhiều khi không cần thông tin một trong các loại hàm nêu trên mà chỉ cần biết một số giá trị đặc trưng tương ứng với BNN đang xét. Các giá trị đặc trưng này được chia thành hai nhóm: một nhóm đặc trưng cho vị trí và một nhóm đặc trưng cho mức phân tán của BNN.
2.2. Các tham số đặc trưng của biến ngẫu nhiên
2.2.1. Kì vọng của biến ngẫu nhiên
a) Định nghĩa
- Nếu $X$ là BNN rời rạc có hàm xác suất $p(x_i)=p_i,\,i=1,2,\cdots,n$ thì $$ E(X)=\sum\limits_{i=1}^nx_ip_i; $$
- Nếu $X$ là BNN rời rạc nhận vô hạn đếm được các giá trị $x_i$ với hàm xác suất tương ứng $p(x_i)=p_i$ và nếu $\sum\limits_{i=1}^\infty |x_i|p_i$ hội tụ thì $ E(X)=\sum\limits_{i=1}^\infty x_ip_i$;
- Nếu $X$ là BNN liên tục có hàm mật độ xác suất $f(x),\,x\in\mathbb R$ và $\int\limits_{-\infty}^{+\infty}|x|f(x)dx$ hội tụ thì $ E(X)=\int\limits_{-\infty}^{+\infty}xf(x)dx$.
Nhận xét:
(i) Các BNN rời rạc nhận một số hữu hạn các giá trị luôn có kì vọng.
(ii) Các BNN rời rạc nhận một số vô hạn đếm được hoặc không đếm được các giá trị có thể không có giá trị kì vọng.
(iii) Kì vọng của BNN $X$ là giá trị đặc trưng cho vị trí (trung tâm) của BNN, tức là các giá trị cụ thể của $X$ sẽ tập trung quanh kì vọng.
Ví dụ 2.9. Hàm mật độ xác suất của BNN $X$ là $f(x)=\dfrac{1}{\pi(1+x^2)}$. Tính $E(X)$?
Vì $X$ là BNN liên tục nên kì vọng của $X$ là $$\int_{-\infty}^{+\infty}|x|f(x)dx=\int_{-\infty}^{+\infty}\dfrac{x}{\pi(1+x^2)}dx.$$Rõ ràng tích phân trên phân kì nên $X$ không có kì vọng.
Ví dụ 2.10. Giả sử một cái bình đựng 10 quả cầu giống nhau nhưng khác nhau về trọng lượng: 5 quả nặng 1 kg, 2 quả nặng 2 kg, 3 quả nặng 3 kg. Lấy ngẫu nhiên từ bình ra 1 quả cầu và gọi $X$ là trọng lượng của quả cầu đó. Tính $E(X)$ và so sánh $E(X)$ với trọng lượng trung bình của 1 quả cầu trong hộp.
$X$ là trọng lượng của quả cầu được lấy ra. Khi đó ta có bảng phân phối xác suất của $X$:
$X$ | 1 | 2 | 3 |
$p(x)$ | 5/10 | 2/10 | 3/10 |
Kì vọng $E(X)=\sum\limits_{i=1}^3x_ip_i=1.\dfrac{5}{10}+2.\dfrac{2}{10}+3.\dfrac{3}{10}=\dfrac{18}{10}=1,8.$
Gọi $M$ là trọng lượng trung bình của các quả cầu trong bình, ta có $$ M=\dfrac{5.1+2.2+3.3}{10}=\dfrac{18}{10}=1,8. $$
Vậy $E(X)=M$.
Tính chất:
(i) $E(C)=C$ với $C$ là hằng số;
(ii) $E(C.X)=C.E(X)$;
(iii) $E(X+Y)=E(X)+E(Y)$;
(iv) Nếu $X,Y$ độc lập thì $E(X.Y)=E(X).E(Y)$;
(v) Nếu $Y=\varphi(X)$ thì $E(Y)=\sum\limits_i\varphi(x_i)p(x_i)$ hoặc $E(Y)=\int\limits_{-\infty}^{+\infty}\varphi(x)f(x)dx$, trong đó $p(x)$ và $f(x)$ là các hàm xác suất và mật độ xác suất tương ứng.
b) Ý nghĩa của kì vọng
Tiến hành $n$ phép thử. Giả sử $X$ là BNN nhận các giá trị có thể $x_1,x_2,\cdots,x_N$ với số lần xuất hiện tương ứng $k_1,k_2,\cdots,k_N$. Giá trị trung bình (trung bình cộng) của BNN $X$ trong $n$ phép thử là $$ \overline{X}=\dfrac{x_1k_1+x_2k_2+\cdots+x_Nk_N}{n}=\dfrac{k_1}{n}x_1+\cdots+\dfrac{k_N}{n}x_N=\sum\limits_{i=1}^Nx_if_i $$ với $f_i=\dfrac{k_i}{n}$ là tần suất để $X$ nhận giá trị $x_i$.
Sử dụng định nghĩa xác suất theo lối thống kê ta có $\lim\limits_{n\to\infty} f_i=p_i$. Vì vậy với $n$ đủ lớn ta có $$ \overline{X}=\sum\limits_{i=1}^Nx_ip_i=E(X). $$
Như vậy, kì vọng chính là tổng có trọng số của tất cả các giá trị của $X$, hay còn là trị trung bình (trung bình có trọng số) của BNN (phân biệt với trung bình cộng của các giá trị). Trong thực tế, nếu quan sát các giá trị của $X$ nhiều lần và lấy trung bình cộng (trung bình số học), thì khi số quan sát càng lớn, số trung bình đó càng gần tới kì vọng $E(X)$, vì vậy kì vọng còn được gọi là trung bình số học của biến $X$ mà không sợ nhầm lẫn.
Ví dụ 2.11. Một người dùng 10 000 đồng để mua 1 con số nằm trong dãy số từ 00 đến 99. Người mua sẽ thắng 700 000 đồng nếu số mua trùng với 2 số cuối của giải đặc biệt do Nhà nước phát hành trong ngày hôm đó. Hãy tìm số tiền thắng trung bình của một lần chơi như vậy.
Gọi $X$ là số tiền thắng của một lần chơi, rõ ràng $X$ nhận các giá trị 0 và 700 000 với các tần suất (và coi luôn là xác suất) tương ứng là 99/100 và 1/100. Từ đó số tiền thắng trung bình trong mỗi lần chơi chính là kì vọng $$ E(X)=0.0,99+700\text{ }000.0,01=7\text{ }000 \text{ đồng}. $$
Mặc dù $E(X)>0$, nhưng anh ta đã bỏ ra 10 000 đồng để mua 1 con số. Như vậy trong thực tế mỗi lần chơi anh ta mất trung bình 3 000 đồng.
Ví dụ 2.12. Một gia đình chi tiêu trong một tháng ở 2 mức: 10 triệu hoặc 8 triệu đồng, trong đó có 11 tháng ở mức 10 triệu, chỉ có 1 tháng ở mức 8 triệu. Hỏi trung bình mỗi tháng gia đình này tiêu hết bao nhiêu tiền?
Như vậy có 2 mức chi tiêu nên trung bình số học (trung bình cộng) sẽ là $(10+8)/2=9$ triệu đồng. Nhưng trung bình có trọng số (kì vọng) sẽ là $10.\dfrac{11}{12}+8.\dfrac{1}{12}\approx 9,83$ triệu đồng. Rõ ràng kì vọng phản ánh chính xác hơn, hợp lí hơn trung bình số học.
c) Giá trị kì vọng hình học
Giá trị kì vọng ứng với trung bình cộng, còn giá trị kì vọng hình học ứng với trung bình nhân. Một ví dụ đơn giản sau đây cho thấy sự quan trọng của trung bình nhân trong thực tế.
Ví dụ 2.13. Giả sử giá nhà dao động trong 4 năm như sau. Năm đầu tiên giảm 15%, năm thứ hai tăng 35%, năm thứ ba giảm 20%, năm thứ tư tăng 20%. Hỏi xem trong 4 năm đó giá nhà tăng lên (giảm đi) trung bình mỗi năm bao nhiêu %?
Nếu ta lấy trung bình cộng thì được $(-15\% + 35\% - 20\% + 20\%)/4=5\%$ một năm. Nhưng con số đó có phản ánh chính xác sự đi lên của giá nhà trong 4 năm?
Nếu gọi giá lúc đầu là $X$, thì sau năm đầu giá là $(1-15\%)X$, sau năm thứ hai giá là $(1+35\%)(1-15\%)X$, sau năm thứ ba giá là $(1-20\%)(1+35\%)(1-15\%)X$, sau 4 năm giá là $(1+20\%)(1-20\%)(1+35\%)(1-15\%)X = 1,1016.X$. Tức là sau 4 năm giá nhà chỉ tăng lên 10,16%, chứ không phải 20%. Để có cái nhìn chính xác về độ tăng trưởng trung bình hàng năm trong giai đoạn 4 năm, cần tính như sau $$ \big[(1+0,2)(1-0,2)(1+0,35)(1-0,15)\big]^{1/4}-1\approx 0,02449, $$ tức là giá nhà tăng 2,449% một năm.
Trung bình nhân có thể được định nghĩa qua trung bình cộng $$\label{2.4} \Big(\prod\limits_i x_i\Big)^{1/n}=\exp\left(\dfrac{1}{n}\sum\limits_i\ln x_i\right). \tag{2.4}$$
Mặt khác hàm $f(x)=\ln x$ là hàm lõm trên nửa đường thẳng dương (đạo hàm bậc hai của nó bằng $-1/x^2$ là một hàm âm), do đó $$ \dfrac{1}{n}\sum\limits_i\ln x_i\leq \ln\left(\dfrac{1}{n}\sum\limits_i x_i\right). $$
Lấy $\exp$ hai vế của bất đẳng trên ta được $$\label{2.5} \Big(\prod\limits_i x_i\Big)^{1/n}\leq \dfrac{1}{n}\sum\limits_i x_i, \tag{2.5}$$ dấu “=” xảy ra khi và chỉ khi tất cả các số $x_i$ bằng nhau.
Từ \eqref{2.4} gợi ý cho ta định nghĩa giá trị kì vọng hình học của $X$ sau đây.
Từ \eqref{2.5}, ta được $G(X)\leq E(X)$. Dấu “=” xảy ra khi $X$ là hằng số.
Ví dụ 2.14. Giả sử có một cơ hội đầu tư trong đó khả năng thắng/thua là 50-50, sau 1 tháng sẽ biết kết quả. Nếu thắng thì lãi 100%, nếu thua thì lỗ 50% số tiền bỏ ra. Hỏi đối với người đầu tư thì có nên đầu tư vào những cơ hội như vậy không? Theo bạn nên đầu tư với nhiều nhất bao nhiêu % vốn đầu tư (để đạt kì vọng lợi nhuận cao nhất, giả sử là không có các cơ hội đầu tư khác)?
Trước hết, ta có thể tính giá trị kì vọng lợi nhuận của đầu tư theo cơ hội trên với 1 đơn vị vốn bỏ ra. Gọi $L$ là biến “lợi nhuận”, ta có 2 khả năng: hoặc $L=1$ hoặc $L=-1/2$, mỗi khả năng có xác suất 50%. Như vậy kì vọng lợi nhuận trên 1 đơn vị vốn bỏ ra là: $$E(L) = 0,5.1+0,5.(-1/2) = 0,25.$$ Kì vọng lợi nhuận ở đây là dương (bằng 25% vốn bỏ ra trong một tháng), nên đây là cơ hội nên đầu tư, trừ khi có những cơ hội khác tốt hơn.
Câu hỏi thứ hai là nhà đầu tư nên đầu tư vào đó nhiều nhất là bao nhiêu phần trăm vốn đầu tư? Nếu giả sử đầu tư toàn bộ 100% vốn. Khi đó có 2 khả năng, hoặc là tổng số vốn tăng lên gấp đôi, hoặc là giảm đi còn 1 nửa, với xác suất của mỗi khả năng là 50%. Nhưng nếu một nhà đầu tư mà làm như vậy 2 lần liên tiếp, 1 lần thắng và 1 lần thua, thì sau hai lần số vốn lại về như cũ, không tăng trưởng được gì. Muốn đảm bảo cho vốn tăng trưởng “về lâu về dài”, cái cần tính đến không phải là kì vọng của vốn sau mỗi lần đầu tư, mà là giá trị kì vọng hình học. Nếu giả sử chỉ có 1 cơ hội đầu tư duy nhất như trên, thì giá trị kì vọng hình học của vốn có được sau khi đầu tư $Y$ tiền vào đó trên tổng số $X$ tiền sẽ là $\sqrt{(X-Y/2)(X+Y)}$. Để tối đa hóa giá trị kì vọng hình học tức là tìm $Y$ sao cho $\sqrt{(X-Y/2)(X+Y)}$ đạt cực đại, ta cần chọn $Y=X/2$ (với $X$ cho trước), và khi đó giá trị kì vọng hình học của vốn sau khi đầu tư là $\sqrt{(X-X/4)(X+X/2)}=1,061.X$. Như vậy, kì vọng lợi nhuận của một cơ hội đầu tư như trên, tính trên toàn bộ vốn của nhà đầu tư, chỉ có không quá 6,1% chứ không phải 25%.
2.2.2. Phương sai và độ lệch chuẩn
a) Định nghĩa
Xét BNN $X$ có kì vọng $E(X)$.
$$\label{2.6}D(X)=E\Big[\big(X-E(X)\big)^2\Big].\tag{2.6}$$
Sử dụng tính chất của kì vọng, ta có thể biến đổi công thức \eqref{2.6} thành
$$D(X)=E(X^2)-[E(X)]^2.$$
Trong tính toán, phụ thuộc vào $X$ là rời rạc (với hàm xác suất $p(x)$) hay liên tục (với hàm mật độ $f(x)$), ta có hai công thức tính phương sai:
\begin{align*} D(X)&=\sum\limits_{\forall i}[x_i-E(X)]^2p_i=\sum\limits_{\forall i}x_i^2p_i-\left(\sum\limits_{\forall i}x_ip_i\right)^2,\\ D(X)&=\int_{-\infty}^{+\infty}[x-E(X)]^2f(x)dx=\int_{-\infty}^{+\infty}x^2f(x)dx-\left(\int_{-\infty}^{+\infty}xf(x)dx\right)^2. \end{align*}
Ví dụ 2.15. Theo thống kê, việc một người Mỹ 25 tuổi sẽ sống thêm trên một năm có xác suất là 99,2%, còn xác suất để người đó chết trong vòng một năm tới là 0,8%. Một công ty bảo hiểm đề nghị người đó tham gia chương trình bảo hiểm sinh mạng cho 1 năm với số tiền chi trả 1 000 USD, còn tiền đóng là 10 USD. Tính phương sai của lợi nhuận mà công ty bảo hiểm nhận được.
Gọi $X$ là lợi nhuận của công ty bảo hiểm trong 1 năm. Khi đó $X$ nhận 2 giá trị là 10 USD (nếu khách hàng không chết) và $-990$ USD (nếu khách hàng qua đời) với xác suất tương ứng là 0,008 và 0,992. Như vậy kì vọng (lợi nhuận của công ty trên 1 khách hàng trong 1 năm) là $$ E(X)=(-990).0,008+10.0,992=2. $$
Ta có $E(X^2)=(-990)^2.0,008+10^2.0,992=7940$ và phương sai $$ D(X)=E(X^2)-[E(X)]^2=7940-4=7936.$$
Để ý rằng phương sai $D(X)$ luôn là một số không âm (xem công thức \eqref{2.6}). Từ định nghĩa ta cũng thấy rằng về mặt vật lí $D(X)$ không cùng thứ nguyên (cùng đơn vị đo) đối với $X$, vì vậy ta đưa vào khái niệm sau đây.
Phương sai còn được kí hiệu là $\sigma^2(X)$ hoặc $\sigma^2$ (nếu đã biết rõ là phương sai của BNN $X$ nào đó). Độ lệch chuẩn được dùng thường xuyên hơn phương sai do có cùng đơn vị đo với chính BNN $X$.
Tính chất:
(i) $D(C)=0$ với $C$ là hằng số,
(ii) $D(CX)=C^2D(X)$, $\sigma(CX)=|C|\sigma(X)$,
(iii) Nếu $X,Y$ độc lập và $D(X), D(Y)$ hữu hạn thì $D(X\pm Y)=D(X)+D(Y)$ và $$\sigma(X\pm Y)=\sqrt{D(X)+D(Y)}\leq \sigma(X)+\sigma(Y).$$
b) Ý nghĩa và ứng dụng thực tế của phương sai
Phương sai chính là độ lệch bình phương trung bình quanh giá trị kì vọng $E(X)$. Vậy phương sai đặc trưng cho độ phân tán của BNN quanh trị trung bình của BNN đó. Cũng theo ý nghĩa đó, phương sai càng lớn thì độ bất định của biến tương ứng càng lớn. Trong công nghiệp, phương sai biểu thị độ chính xác của sản xuất; trong kỹ thuật, phương sai đặc trưng cho mức độ phân tán của các chi tiết gia công hay sai số của thiết bị; trong quản lí và kinh doanh thì nó đặc trưng cho mức độ rủi ro của các quyết định; trong chăn nuôi, phương sai biểu thị độ đồng đều của các con gia súc; trong trồng trọt, nó biểu thị mức độ ổn định của năng suất...
Ví dụ 2.16. Trong Ví dụ 2.15, đầu tư của công ty bảo hiểm cho những người 25 tuổi là có lãi nhưng rủi ro là rất lớn với $\sigma(X)=\sqrt{7936}\approx 89,08$.
Phương sai của trung bình cộng $n$ biến ngẫu nhiên độc lập cùng phân phối sẽ bé hơn $n$ lần phương sai của các biến thành phần, tức là nếu $D(X_i)=\sigma^2, \forall i=\overline{1,n}$ thì $$ D(\overline{X})=D\left(\dfrac{X_1+X_2+\cdots+X_n}{n}\right)=\dfrac{1}{n^2}\sum\limits_{i=1}^nD(X_i)=\dfrac{\sigma^2}{n}. $$
Đây chính là lí do khi đo đạc các đại lượng vật lí, người ta thường đo nhiều lần rồi lấy trung bình cộng các kết quả. Khi đó sai số của kết quả đo đạc sẽ rất nhỏ.
2.2.3. Một số tham số đặc trưng khác
Từ định nghĩa hàm phân phối, để tìm trung vị, ta chỉ cần giải $F(x)=1/2$. Trong nhiều trường hợp ứng dụng, trung vị là đặc trưng vị trí rất tốt, nhiều khi tốt hơn cả kì vọng, nhất là khi trong số liệu có những sai sót thái quá.
Nhận xét: Nếu $\alpha=0,5$ thì $X_{0,5}$ chính là trung vị của BNN $X$.
Từ định nghĩa hàm phân phối, ta có $F(X_\alpha)=\alpha$. Thông thường người ta hay xét các phân vị 25%, 50% (trung vị), 75%, 95%,...
Ví dụ 2.17. Giả sử BNN $X$ có hàm mật độ $$f(x)=\begin{cases} 0,&\text{ nếu }x\leq 0,\\ \dfrac{x}{2}\exp\left(-\dfrac{x^2}{4}\right),&\text{ nếu }x> 0. \end{cases}$$Xác định $\mathrm{Mod}X$ và trung vị.
$\mathrm{Mod}X$ sẽ là nghiệm của phương trình $$f'(x)=\dfrac{1}{2}\exp\left(-\dfrac{x^2}{4}\right)-\dfrac{x^2}{4}\exp\left(-\dfrac{x^2}{4}\right)=0.$$
Từ đó $\mathrm{Mod}X$ là nghiệm của $1-\dfrac{x^2}{2}=0$. Nhưng do $x>0$ nên $\mathrm{Mod}X=\sqrt{2}$.
Trung vị là nghiệm của phương trình $$ \int_0^{\mathrm{Med}X}\dfrac{x}{2}\exp\left(-\dfrac{x^2}{4}\right)dx=0,5\quad\text{hay}\quad 1-\exp\left(-\dfrac{(\mathrm{Med}X)^2}{4}\right)=0,5. $$
Từ đây suy ra $\mathrm{Med}X=1,665$.
2.2.4. Bất đẳng thức Markov và bất đẳng thức Chebyschev
Những bất đẳng thức tương đối đơn giản sau đây của Markov và Chebyschev sẽ có ích trong việc đánh giá phân phối xác suất của các BNN.
Bất đẳng thức Markov và Chebyschev xác định giới hạn xác suất khi biết kì vọng và phương sai của BNN khi chưa biết phân phối xác suất.
Ví dụ 2.18. Giả sử số phế phẩm của một nhà máy làm ra trong một tuần là BNN $X$ với kì vọng $E(X)=50$.
a) Có thể nói gì về xác suất sản phẩm hỏng tuần này vượt quá 75.
b) Nếu phương sai của phế phẩm trong tuần này là $\sigma^2=25$ thì có thể nói gì về xác suất phế phẩm tuần này sẽ ở giữa 40 và 60.
a) Theo bất đẳng thức Markov thì $P(X>75)\leq \dfrac{E(X)}{75}=\dfrac{50}{75}=\dfrac{2}{3}$.
b) Theo bất đẳng thức Chebyschev $$P(|X-50|<10)\geq 1-\dfrac{25}{10^2}=\dfrac{3}{4}.$$
Do đó $ P(40<X<60)=\dfrac{3}{4}$.
Ta có kết quả quan trọng sau.
Luật số lớn Chebyschev chứng tỏ rằng khi $n$ đủ lớn thì trung bình cộng của các BNN sẽ có giá trị lệch rất ít so với trung bình cộng của các kì vọng. Một hệ quả quan trọng của Định lí 2.3 là nếu đưa thêm các giả thiết các $X_i, \forall i$ có cùng kì vọng (tức là $E(X_i)=\mu,\forall i$) thì \eqref{2.7} sẽ trở thành $$ \lim\limits_{n\to\infty}P\left(\left|\dfrac{1}{n}\sum\limits_{i=1}^nX_i-\mu\right|<\varepsilon\right)=1,\qquad \forall\varepsilon>0. $$
Như vậy, mặc dù từng BNN độc lập có thể nhận giá trị khác nhiều so với kì vọng của chúng, song trung bình số học của một số lớn các BNN lại nhận giá trị gần bằng kì vọng của chúng với xác suất rất lớn. Sự kiện này cho phép ta ước lượng kì vọng bằng trung bình cộng các kết quả đo đạc độc lập của BNN có kì vọng đó. Chẳng hạn, gieo một con xúc xắc cân đối. Giả sử $X$ là số nốt xuất hiện ở mặt trên con xúc xắc. Ta có $E(X)=3,5$. Một nhà thống kê đã gieo một con xúc xắc cân đối 1 triệu lần (nhờ sự trợ giúp của máy vi tính) và ghi lại số nốt xuất hiện ở mặt trên con xúc xắc. Số trung bình của 1 triệu lần gieo được tìm thấy là $$ \dfrac{x_1+\cdots+x_{10^6}}{10^6}\approx 3,500876. $$
Luật số lớn Chebyschev có ứng dụng rộng rãi trong nhiều lĩnh vực, chẳng hạn nó chính là cơ sở cho phương pháp đo lường trong vật lí. Để xác định giá trị của một đại lượng vật lí nào đó người ta thường tiến hành đo $n$ lần độc lập và lấy trung bình số học của các kết quả đo làm giá trị thực của đại lượng cần đo. Thật vậy, giả sử xem kết quả của $n$ lần đo là các BNN $X_1,\cdots,X_n$. Ta thấy rằng các BNN này độc lập, có cùng kì vọng bằng chính giá trị thực của đại lượng vật lí (giả sử không có sai số hệ thống), các phương sai của chúng đều bị chặn trên bởi bình phương của độ chính xác của thiết bị đo. Do đó theo Định lí 2.3 ta có thể cho rằng trung bình số học của các kết quả đo sẽ sai lệch rất ít so với giá trị thực của đại lượng vật lí với xác suất gần như bằng một.