Bài giảng Lý thuyết xác suất và thống kê - Chương 7: Kiểm định giả thuyết thống kê

pdf 21 trang ngocly 1200
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê - Chương 7: Kiểm định giả thuyết thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_chuong_7_kiem_dinh.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê - Chương 7: Kiểm định giả thuyết thống kê

  1. Chương 7: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
  2. I. Khái niệm chung : Giả thuyết thống kê là một mệnh đề về tham số, về luật phân phối hay về tính chất của biến ngẫu nhiên. Ví dụ : • Giả thuyết về tham số μ = EX : ⎧H00:μ = μ ⎧H :μ = μ a) ⎨ 00 H : μ > μ b) ⎨ ⎩ 10 ⎩H10: μ < μ ⎧H00:μ = μ c) ⎨ ⎩H10: μ ≠ μ
  3. Trong đó, H0 gọi là giả thuyết không, H1 gọi là đối thuyết và μ0 là số đã biết. Đối thuyết trong a) và b) gọi là đối thuyết một phía. Đối thuyết trong c) gọi là đối thuyết hai phía. • Giả thuyết về luật phân phối : H0 : “ X có luật phân phối với hàm phân phối F(x)” (H1 : “ X không có luật phân phối với hàm phân phối F(x)”, không cần phát biểu) • Giả thuyết về tính chất : H0 : “ X và Y là độc lập ” (H1 : “X và Y không độc lập”, không cần phát biểu)
  4. Cách kiểm định giả thuyết : Gọi M là không gian mẫu quan sát X từ tổng thể M. • Chia M thành hai miền M0 và M1 sao cho : ∪ M0 M1 = M M0 ∩ M1 = ∅ • Lấy mẫu ( x1 , , xn ), 1) Nếu (x1, , xn) ∈ M0 thì chấp nhận H0 (Bác bỏ H1). 2) Nếu (x1, , xn) ∈ M1 thì chấp nhận H1 (Bác bỏ H0). Gọn hơn : 1) Nếu (x1, , xn ) ∈ M1 thì chấp nhận H1 (Bác bỏ H0). 2) Nếu (x1 , , xn ) ∉ M1 thì chấp nhận H0 (Bác bỏ H1).
  5. Sai lầm khi kiểm định : • Sai lầm loại 1 : Bác bỏ H0 khi thực tế H0 đúng. Xác suất xảy ra sai lầm loại 1 : α = P[(X1 , , Xn )∈ M1 / H0 đúng ] • Sai lầm loại 2 : Chấp nhận H0 khi thực tế H0 sai. Xác suất xảy ra sai lầm loại 2 : β = P[(X1 , , Xn )∈ M0 / H1 đúng ] Một cách chia M thành M0 và M1 gọi là một qui tắc ( tiêu chuẩn) kiểm định. M1 được gọi là miền bác bỏ H0. Người ta xây dựng qui tắc sao cho đạt được α đủ nhỏ cho trước và với β có thể chấp nhận được.
  6. α được gọi là mức ý nghĩa của kiểm định, thường cho trước là 1% hoặc 5%. II. Kiểm định giả thuyết về so sánh kỳ vọng với một số cho trước : Đặt μ = EX và σ2 = DX. Các giả thuyết : H0 : μ = μ0 a) H1 : μ > μ0 ; b) H1 : μ < μ0 ; c) H1 : μ ≠ μ0 1) Khi n ≥ 30, σ2 đã biết. Xét thống kê X − μ ZN= 0 ~(0,1) σ khi H0 đúng. n
  7. Miền bác bỏ H0 ứng với các đối thuyết : a) M1 = { ( x1 , , xn ) : Z > z1− α } b) M1 = { ( x1 , , xn ) : Z z1− α/2 } } Trong đó, zα là phân vị mức α của Φ(x). 2) Khi n ≥ 30, σ2 không biết. Xét thống kê X − μ ZN= ~(0,1) S khi H0 đúng. n Miền bác bỏ H0 như ở phần 1).
  8. 3) Khi n 1 − α } n−1 M1 = { ( x1 , , xn ) : T t α } } 1 1 n 1− 2
  9. III. Kiểm định giả thuyết về so sánh hai kỳ vọng : Quan sát X trên hai mẫu lấy từ hai tổng thể A và B. Trên tổng thể A : 2 X có kỳ vọng μ1 và phương sai σ 1 , mẫu cỡ n1, kỳ 2 vọng mẫu, phương sai mẫu có điều chỉnh S 1 . Trên tổng thể B : 2 X có kỳ vọng μ2 và phương sai σ 2 , mẫu cỡ n2, kỳ 2 vọng mẫu, phương sai mẫu có điều chỉnh S 2 .
  10. Xét các giả thuyết : H0 : μ1 = μ2 a) H1 : μ1 > μ2 ; b) H1 : μ1 < μ2 ; c) H1 : μ1 ≠ μ2 σ 2 σ 2 1. Khi n1 ≥ 30, n2 ≥ 30 và1 và 2 đã biết Xét thống kê XX− ZN= 12~(0,1) σσ22 12+ nn12
  11. Miền bác bỏ H0 ứng với các đối thuyết như ở (1). Khi các phương sai mẫu chưa biết ta thay bằng phương sai mẫu. 2 2 2 2. Khi n1 < 30, n2 < 30 vàσ1 = σ 2 = σ Xét thống kê XX12− Tt= ~(n12+−n 2) 2 ⎛⎞11 S ⎜⎟+ ⎝⎠nn12 Trong đó (1)(1)nSnS−−−22 S 2 = 1122 nn12+−2 Miền bác bỏ H0 ứng với các đối thuyết như ở (2).
  12. IV. Kiểm định giả thuyết về so sánh tỷ lệ với số cho trước : Giả sử tham số p là tỷ lệ các phần tử loại L trên tổng thể M. m Gọi m là số phần tử loại L trên mẫu vàf = là tần n suất các phần tử loại L trên mẫu. Xét mẫu cỡ lớn : nf ≥ 10 , n(1-f) ≥ 10, các giả thuyết: H0 : p = p0 a) H1 : p > p0 ; b) H1 : p < p0 ; c) H1 : p ≠ p0 và thống kê fp− 0 ZN= ~(0,1), khi H0 đúng pp00(1− ) n
  13. Miền bác bỏ H0 như ở phần 1) kiểm định giả thuyết về kỳ vọng. V. Kiểm định giả thuyết về so sánh hai tỷ lệ: Xét mẫu cỡ lớn : n1 ≥ 30, n2 ≥ 30. Quan sát tỷ lệ các phần tử lọai L trên hai mẫu lấy từ hai tổng thể A và B. Trên tổng thể A : tỷ lệ phần tử loại L là p1,mẫu cỡ n1, tần suất f1. Trên tổng thể B : tỷ lệ phần tử loại L là p2, mẫu cỡ n2, tần suất f2.
  14. Xét các giả thuyết : H0 : p1 = p2 a) H1 : p1 > p2 ; b) H1 : p1 < p2 ; c) H1 : p1 ≠ p2 Xét thống kê ff− ZN= 12 ~(0,1) ⎛⎞11 pqˆˆ⎜⎟+ ⎝⎠nn12 Trong đó, nf+ nf pˆ = 11 2 2 và qpˆˆ= 1− nn12+
  15. Miền bác bỏ H0 ứng với các đối thuyết như ở (1). VI. Kiểm định giả thuyết về so sánh hai phương sai : Quan sát X trên hai mẫu lấy từ hai tổng thể A và B. Trên tổng thể A : 2 mẫu cỡ , phương sai mẫu có điều X ~N(μ1,σ 1 ), n1 2 chỉnh S 1 . Trên tổng thể B : 2 mẫu cỡ phương sai mẫu có điều X ~N(μ2, σ 2 ), n2, 2 chỉnh S 2 .
  16. Xét các giả thuyết : 22 H0 : σ12= σ 22 22 a) H1 : σ12> σ ; b) H1 : σ12≠ σ và thống kê 2 S1 FFnn=−−2 ~ (12 1, 1) S2 có luật phân phối Fisher với bậc tự do n1-1 và n2-1. 22 Chú ý rằng ta đánh chỉ số sao cho SS 12 > . Miền bác bỏ H0 ứng với các đối thuyết : nn12−−1, 1 M1 = { ( x1 , , xn ) : F > t1−α } nn12−1,− 1 M1 = { ( x1 , , xn ) : ⎢F ⎢ > t1/2−α } nn12−1,− 1 Trong đó, t1−α là phân vị mức (1-a) của luật Fisher với bậc tự do n1-1 và n2-1.
  17. VII. Kiểm định giả thuyết về luật phân phối : H0 : “ X có luật phân phối với hàm phân phối F(x)” Lập bảng : Lớp L1 . . . Lk Tổng Tần số Tần số TN N1 . . . Nk n Tần số LT N’1 . . . N’k n Trong đó, Ni là các tần số thực nghiệm của lớp Li, hay số phần tử của mẫu rơi vào Li . N’i là các tần số lý thuyết của lớp Li, hay số phần tử của mẫu rơi vào Li khi H0 đúng.
  18. N’i = npi pi = P( X∈ Li / H0 đúng ) Nếu Li = (ai , ai+1 ] thì pi = P( ai χ 1 − α } kr− −1 Trong đó, χ 1 − α là phân vị mức 1-α của luật chi bình phương với k-r-1 bậc tự do.
  19. VIII. Kiểm định giả thuyết về tính độc lập : Ta có bảng số liệu hai chiều về hai thuộc tính X và Y : Giả thuyết H0 : “ Thuộc tính X và Y là độc lập” Thuộc tính X có n mức độ A1, , An. Thuộc tính Y có m mức độ B1, , Bm. Ta quan sát N cá thể. Và lập bảng sau đây. Thuộc tính B1 . . . Bm Tổng số N ( N’ ) A1 N11 ( N’11 ) . . . 1m 1m NA1 . . . . . . . . . . . . N ( N’ ) N ( N’ ) An n1 n1 . . . nm nm NAn Tổng số NB1 . . . NBm N
  20. Trong đó, Nij là tần số thực nghiệm, hay số quan sát có thuộc tính Ai và Bj . N’ij là tần số lý thuyết, hay số phần tử của mẫu có thuộc tính Ai và Bj khi H0 đúng. NN. N ' = A iBj ij n Thống kê nm()NN− '2 Qh= ij ij ~[(1)(1)]χ 2 −−c ∑∑ ' ij==11 Nij có phân phối chi bình phương với (h-1)(c-1) bậc tự do. Trong đó, h là số hàng, c là số cột.
  21. Miền bác bỏ H0 : (1)(1)hc− − M1 = { ( x1 , , xn ) : Q > χ1−α } (1)(1)hc− − Trong đó, χ1−α là phân vị mức 1-α của luật chi bình phương với (h-1)(c-1) bậc tự do.