Tóm tắt nội dung

Tập tổng thể là tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hay định lượng nào đó. Việc chọn ra từ tổng thể một tập con gọi là phép lấy mẫu.

Mẫu ngẫu nhiên: Nếu trong phép lấy mẫu đó mỗi cá thể của tổng thể được chọn một cách độc lập và có xác suất được chọn như nhau thì ta được một mẫu ngẫu nhiên.

Bảng phân phối tần số, tần suất và phân phối thực nghiệm: một mẫu ngẫu nhiên kích thước n của X nhận giá trị xi với tần số xuất hiện ni (i=1,k), i=1kni=n, fi=nin gọi là tần suất của xi. Khi đó ta có thể mô tả mẫu ngẫu nhiên trên qua bảng phân phối tần số và tần suất thực nghiệm của X

(a) Tần số

X x1 xk
Tần số n1 nk

(b) Tần suất

X x1 xk
Tần suất f1 fk

Hàm phân phối thực nghiệm Fn(x)=xi<xfi.

Thống kê: Hàm g(X1,,Xn) với (X1,,Xn) là một mẫu ngẫu nhiên được gọi là một hàm mẫu hay một thống kê.

Trung bình mẫu: X=1ni=1nXihoặcX=1ni=1kXini.

Tần suất mẫu: Xét BNN tổng thể XB(1;p). Lấy mẫu ngẫu nhiên kích n có cùng phân phối với X. Tần số xuất hiện dấu hiệu A của mẫu là r=i=1nXi, tần suất mẫu f=rn=X.

Phương sai mẫu: 

- Phương sai mẫu: S^2=1ni=1n(XiX)2,hoặcS^2=1ni=1kXi2ni(X)2.

- Phương sai mẫu có hiệu chỉnh: S2=1n1i=1n(XiX)2hoặcS2=1n1i=1k(XiX)2ni.

- Phương sai mẫu khi biết kì vọng μ của tổng thể: S2=1ni=1n(Xiμ)2hoặcS2=1ni=1k(Xiμ)2ni.

Ước lượng không chệch: Thống kê θ^ được gọi là ước lượng không chệch của tham số θ của tổng thể nếu E(θ^)=θ.

Ước lượng hiệu quả: Ước lượng không chệch có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng một mẫu ngẫu nhiên gọi là ước lượng hiệu quả.

Ước lượng vững: Thống kê θ^ được gọi là một ước lượng vững của tham số θ nếu với mọi ε>0 cho trước ta có limnP(|θ^θ|<ε)=1.

Khoảng tin cậy: Giả sử θ^1θ^2 là hai thống kê có từ mẫu ngẫu nhiên (X1,X2,,Xn), θ là một trong các đặc số của BNN X của tổng thể. Khi đó θ^1,θ^2 được gọi là khoảng tin cậy của θ với độ tin cậy β nếu P(θ^1θθ^2)=β.

Khoảng tin cậy cho kì vọng của biến ngẫu nhiên phân phối theo quy luật chuẩn: 

- Trường hợp phương sai tổng thể σ2 đã biết: (XUα/2σn;X+Uα/2σn).

- Trường hợp phương sai tổng thể σ2 chưa biết và n30: (XUα/2Sn;X+Uα/2Sn).

- Trường hợp phương sai tổng thể σ2 chưa biết và n<30: (Xtα/2(n1)Sn;X+tα/2(n1)Sn).

Khoảng tin cậy cho tỉ lệ: Với điều kiện {nf>5,n(1f)>5, ta có khoảng tin cậy: (fUα/2f(1f)n;f+Uα/2f(1f)n).

Khoảng tin cậy cho phương sai của biến ngẫu nhiên phân phối theo quy luật chuẩn: 

- Trường hợp kì vọng tổng thể μ đã biết: (nS2χα/22(n);nS2χ1α/22(n)).

- Trường hợp kì vọng tổng thể μ chưa biết: ((n1)S2χα/22(n1);<(n1)S2χ1α/22(n1)).

Thủ tục kiểm định giả thuyết thống kê: 

(i) Phát biểu giả thuyết H0 và đối thuyết H1.

(ii) Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n.

(iii) Chọn tiêu chuẩn kiểm định T và xác định quy luật phân phối xác suất của T với điều kiện giả thuyết H0 đúng.

(iv) Dựa vào luật phân phối xác suất của T, tìm miền bác bỏ Rα sao cho P(TRα|H0)=α.

(v) Dựa vào mẫu cụ thể kích thước n, tính các thông số của mẫu cần thiết, thay thế vào thống kê T tính được giá trị T0 và gọi là giá trị quan sát thực tế hay giá trị thực nghiệm của thống kê T tương ứng với mẫu.

(vi) So sánh giá trị quan sát T0 của tiêu chuẩn kiểm định T với miền bác bỏ Rα và kết luận.

Kiểm định về kì vọng của tổng thể có phân phối chuẩn: 

- Trường hợp phương sai tổng thể σ2 đã biết: tiêu chuẩn kiểm định T=Xμ0σn, giả thuyết H0:μ=μ0

H1:μμ0, miền bác bỏ Rα={|T|>Uα/2},

H1:μ>μ0, miền bác bỏ Rα={T>Uα},

H1:μ<μ0, miền bác bỏ Rα={T<Uα}.

- Trường hợp phương sai tổng thể σ2 chưa biết và n30: tiêu chuẩn kiểm định T=Xμ0Sn, giả thuyết H0:μ=μ0

H1:μμ0, miền bác bỏ Rα={|T|>Uα/2},

H1:μ>μ0, miền bác bỏ Rα={T>Uα},

H1:μ<μ0, miền bác bỏ Rα={T<Uα}.

- Trường hợp phương sai tổng thể σ2 chưa biết và n<30: tiêu chuẩn kiểm định T=XμSn, giả thuyết H0:μ=μ0

H1:μμ0, miền bác bỏ Rα={|T|>tα/2(n1)},

H1:μ>μ0, miền bác bỏ Rα={T>tα(n1)},

H1:μ<μ0, miền bác bỏ Rα={T<tα(n1)}.

Kiểm định về tỉ lệ của tổng thể có phân phối Bernoulli: tiêu chuẩn kiểm định T=fpp(1p)n, giả thuyết H0:p=p0

H1:pp0, miền bác bỏ Rα={|T|>Uα/2},

H1:p>p0, miền bác bỏ Rα={T>Uα},

H1:p<p0, miền bác bỏ Rα={T<Uα}.

Kiểm định về phương sai của biến ngẫu nhiên có phân phối chuẩn: tiêu chuẩn kiểm định T=(n1)S2σ2, giả thuyết H0:σ2=σ02

H1:σ2σ02, miền bác bỏ Rα=(;χ1α/22(n1))(χα/22(n1);+),

H1:σ2>σ02, miền bác bỏ Rα=(χα2(n1);+),

H1:σ2<σ02, miền bác bỏ Rα=(;χ1α2(n1)).

So sánh hai kì vọng của hai tổng thể có phân phối chuẩn: 

- Trường hợp hai phương sai σX2σY2 đã biết: tiêu chuẩn kiểm định T=(XY)(μXμY)σX2n1+σY2n2, giả thuyết H0:μX=μY

H1:μXμY, miền bác bỏ Rα={|T|>Uα/2},

H1:μX>μY, miền bác bỏ Rα={T>Uα},

H1:μX<μY, miền bác bỏ Rα={T<Uα}.

- Trường hợp hai phương sai σX2σY2 chưa biết và n30: tiêu chuẩn kiểm định T=(XY)(μXμY)SX2n1+SY2n2, giả thuyết H0:μX=μY

H1:μXμY, miền bác bỏ Rα={|T|>Uα/2},

H1:μX>μY, miền bác bỏ Rα={T>Uα},

H1:μX<μY, miền bác bỏ Rα={T<Uα}.

- Trường hợp hai phương sai σX2σY2 chưa biết và σX2=σY2: tiêu chuẩn kiểm định T=(XY)(μXμY)(n11)SX2+(n11)SY2n1+n22.1n1+1n2T(n1+n22), giả thuyết H0:μ=μ0

H1:μXμY, miền bác bỏ Rα={|T|>tα/2(n1+n22)},

H1:μX>μY, miền bác bỏ Rα={T>tα(n1+n22)},

H1:μX<μY, miền bác bỏ Rα={T<tα(n1+n22)}.

- Trường hợp hai phương sai σX2σY2 chưa biết và σX2σY2: tiêu chuẩn kiểm định T=(XY)(μXμY)SX2n1+SY2n2T(k), trong đó k=[(n11)(n21)(n21)C2+(n11)(1C)2]C=SX2/n1SX2/n1+SY2/n2, giả thuyết H0:μ=μ0

H1:μXμY, miền bác bỏ Rα={|T|>tα/2(k)},

H1:μX>μY, miền bác bỏ Rα={T>tα(k)},

H1:μX<μY, miền bác bỏ Rα={T<tα(k)}.

So sánh hai tỉ lệ của hai tổng thể có phân phối Bernoulli: tiêu chuẩn kiểm định T=(fXfY)(pXpY)f(1f)(1n1+1n2), trong đó f=n1fX+n2fYn1+n2, giả thuyết H0:pX=pY.

H1:pXpY, miền bác bỏ Rα={|T|>Uα/2},

H1:pX>pY, miền bác bỏ Rα={T>Uα},

H1:pX<pY, miền bác bỏ Rα={T<Uα}.