Bài giảng Lý thuyết xác suất và thống kê - Chương 8: Kiểm định giả thiết thống kê

pptx 27 trang ngocly 3160
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê - Chương 8: Kiểm định giả thiết thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptxbai_giang_ly_thuyet_xac_suat_va_thong_ke_chuong_8_kiem_dinh.pptx

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê - Chương 8: Kiểm định giả thiết thống kê

  1. Chương 8 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
  2. I. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Giả thiết thống kê: Giả thiết thống kê là những giả thiết nói về các tham số, phân phối xác suất hoặc tính độc lập của các ĐLNN. Kiểm định giả thiết thống kê: Việc tìm ra kết luận bác bỏ hay chấp nhận 1 giả thiết đgl kiểm định giả thiết thống kê. Giả thiết cần kiểm định đgl giả thiết không và được ký hiệu là H0. Mệnh đề đối lập với H0 đgl giả thiết đối (đối thiết) và được ký hiệu là H1.
  3. I. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Phương pháp kiểm định giả thiết thống kê: ❖Xuất phát từ yêu cầu của bài toán thực tế, ta nêu ra giả thiết H0 và giả thiết đối của nó. ❖Chọn mẫu ngẫu nhiên (X1, X2, , Xn). ❖Chọn hàm Z = (X1, X2, , Xn, ) sao cho: nếu H0 đúng thì ta sẽ xác định được quy luật PPXS của Z. ĐLNN Z đgl tiêu chuẩn kiểm định. ❖Khi đó với 1 số dương bé tùy ý, ta tìm được 1 miền W sao cho: P(Z W ) = (tức là biến cố (Z W ) có xác suất rất nhỏ).
  4. I. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Phương pháp kiểm định giả thiết thống kê: Miền W đgl miền bác bỏ giả thiết H0. Phần bù của W đgl miền chấp nhận giả thiết H0. đgl mức ý nghĩa của kiểm định. ❖Thực hiện 1 phép thử, ta thu được mẫu cụ thể (x1, x2, , xn). Từ mẫu này ta tính được giá trị cụ thể của Z (ký hiệu z, gọi là giá trị thực nghiệm): z = (x1,x2, ,xn,0). ❖Quy tắc quyết định: ▪ Nếu z W thì ta bác bỏ giả thiết H0. ▪ Nếu z W thì ta chấp nhận giả thiết H0.
  5. I. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Lưu ý: • Do ta chỉ dựa vào mẫu để ra quyết định nên khi nói “chấp nhận H0” thì điều đó không có nghĩa là giả thiết H0 đúng mà chỉ có nghĩa là với số liệu của mẫu ta chưa có đủ cơ sở để bác bỏ H0. • Xét cặp giả thiết: H0:  = 0 H1:  0 Kiểm định đgl kiểm định hai phía (vì miền bác bỏ nằm ở 2 phía của miền chấp nhận, tương ứng với 2 trường hợp  0).
  6. I. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Lưu ý: • Kiểm định phía trái: H0:  = 0 H1:  0 Hai loại kiểm định này được gọi chung là kiểm định một phía. Đúng Đúng Sai H0 Sai lầm Đúng Sai Sai
  7. I. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Sai lầm loại I và sai lầm loại II: ❖Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ một giả thiết trong khi thực tế giả thiết đó đúng. Xét xác suất mắc phải sai lầm loại I đối với H0: đó là xác suất để Z thuộc miền bác bỏ W khi H0 đúng (P(Z W )) xác suất mắc phải sai lầm loại I chính là mức ý nghĩa . ❖Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận một giả thiết trong khi thực tế giả thiết đó sai.
  8. I. KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Sai lầm loại I và sai lầm loại II: Xét xác suất mắc phải sai lầm loại II đối với H0: đó là xác suất để Z không thuộc miền bác bỏ W khi H0 sai Đặt xác suất này là . Khi đó (1 - ) đgl lực của kiểm định. Nhận xét:      Người ta thường ấn định mức ý nghĩa khá nhỏ, khi đó chọn tiêu chuẩn kiểm định Z và miền bác bỏ tương ứng sao cho  nhỏ đến mức có thể được.
  9. II. KIỂM ĐỊNH GIẢ THIẾT VỀ TỶ LỆ TỔNG THỂ Kiểm định hai phía: Xét cặp giả thiết: H0: p = p0 H1: p p0 Tiêu chuẩn kiểm định được chọn là: F - p Z = ~ N(0,1) pq n 0.45 0.4 0.35 Nếu giả thiết H0 đúng 0.3 thì: 0.25 0.2 F - p0 Z = ~ N(0,1) /2 0.15 /2 0.1 pq00 0.05 0 -3 -2 -1 0 1 2 3 n -z /2 z /2
  10. II. KIỂM ĐỊNH GIẢ THIẾT VỀ TỶ LỆ TỔNG THỂ Kiểm định hai phía: Với mức ý nghĩa , vì Z ~ N(0,1) nên ta tìm được 1 số z /2 sao cho: F - p0 P(- zα/2 z α/2 ) = 1 - α pq00 0.45 n 0.4 0.35 Ta chọn miền bác 0.3 0.25 bỏ là: 0.2 /2 0.15 /2 (- ; - z /2)(z /2; + ) 0.1 0.05 0 -3 -2 -1 0 1 2 3 -z /2 z /2
  11. II. KIỂM ĐỊNH GIẢ THIẾT VỀ TỶ LỆ TỔNG THỂ Kiểm định hai phía: Từ đó ta có quy tắc quyết định: 0.45 f - p0 0.4 • B1: Tính: z = 0.35 0.3 pq00 0.25 0.2 n /2 0.15 /2 0.1 • B2: Từ mức ý nghĩa 0.05 0 -3 -2 -1 0 1 2 3 Tìm z /2. -z /2 z /2 • B3: Nếu z (- ; - z /2)(z /2; + ) Bác bỏ H0. Ngược lại thì chấp nhận H0.
  12. II. KIỂM ĐỊNH GIẢ THIẾT VỀ TỶ LỆ TỔNG THỂ Kiểm định phía phải: Xét cặp giả thiết: H0: p = p0 H1: p > p0 Làm tương tự, ta có quy tắc quyết định: 0.45 f - p0 • B1: Tính: z = 0.4 0.35 pq00 0.3 0.25 n 0.2 0.15 0.1 • B2: Từ mức ý nghĩa 0.05 0 Tìm z . -3 -2 -1 0 1 2 3 z • B3: Nếu z (z ; + ) Bác bỏ H0. Ngược lại thì chấp nhận H0. quy tắc kiểm định phía trái?
  13. III. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ Kiểm định hai phía: Xét cặp giả thiết: H0:  = 0 ❖n ≥ 30,  đã biết : H1:  0 Tiêu chuẩn kiểm định được chọn là: X - μ Z = ~ N(0,1) σ 0.45 0.4 n 0.35 Nếu giả thiết H đúng 0.3 0 0.25 thì: 0.2 X - μ0 /2 0.15 /2 Z = ~ N(0,1) 0.1 σ 0.05 0 -3 -2 -1 0 1 2 3 n -z /2 z /2
  14. III. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ Kiểm định hai phía: ❖n ≥ 30,  đã biết : Từ đó ta có quy tắc quyết định: 0.45 x - μ0 0.4 • B1: Tính: z = 0.35 σ 0.3 0.25 0.2 n /2 0.15 /2 0.1 • B2: Từ mức ý nghĩa 0.05 0 Tìm z /2. -3 -2-z /2-1 0 1 z /22 3 • B3: Nếu z (- ; - z /2)(z /2; + ) Bác bỏ H0. Ngược lại thì chấp nhận H0.
  15. III. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ Kiểm định hai phía: ❖n ≥ 30,  chưa biết : Tiêu chuẩn kiểm định được chọn là: X - μ Z = ~ T(n - 1) N(0,1) S 0.45 n 0.4 0.35 Nếu giả thiết H0 đúng 0.3 0.25 thì: X - μ 0.2 0 /2 0.15 /2 Z = ~ N(0,1) 0.1 S 0.05 0 -3 -2 -1 0 1 2 3 n -z /2 z /2
  16. III. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ Kiểm định hai phía: ❖n ≥ 30,  chưa biết : Từ đó ta có quy tắc quyết định: 0.45 x - μ0 0.4 • B1: Tính: z = 0.35 s 0.3 0.25 0.2 n /2 0.15 /2 0.1 • B2: Từ mức ý nghĩa 0.05 0 Tìm z /2. -3 -2-z /2-1 0 1 z /22 3 • B3: Nếu z (- ; - z /2)(z /2; + ) Bác bỏ H0. Ngược lại thì chấp nhận H0.
  17. III. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ Kiểm định hai phía: ❖n < 30,  đã biết và ĐLNN gốc X có phân phối chuẩn: Làm tương tự, ta có quy tắc quyết định: 0.45 x - μ0 0.4 • B1: Tính: z = 0.35 σ 0.3 0.25 0.2 n /2 0.15 /2 0.1 • B2: Từ mức ý nghĩa 0.05 0 Tìm z /2. -3 -2-z /2-1 0 1 z /22 3 • B3: Nếu z (- ; - z /2)(z /2; + ) Bác bỏ H0. Ngược lại thì chấp nhận H0.
  18. III. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ Kiểm định hai phía: ❖n < 30,  chưa biết và ĐLNN gốc X có phân phối chuẩn: Tiêu chuẩn kiểm định được chọn là: X - μ 0.45 Z = ~ T(n - 1) 0.4 S 0.35 0.3 n 0.25 Nếu giả thiết H0 đúng 0.2 thì: X - μ 0.15 Z = 0 ~ T(n - 1) /2 0.1 /2 S 0.05 0 -3 -2-t -1 0 1 t 2 3 n /2 /2
  19. III. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ Kiểm định hai phía: ❖n < 30,  chưa biết và ĐLNN gốc X có phân phối chuẩn: 0.45 0.4 Ta có quy tắc quyết định: 0.35 0.3 x - μ0 • B1: Tính: z = 0.25 s 0.2 0.15 n /2 0.1 /2 • B2: Từ mức ý nghĩa 0.05 0 -3 -2 -1 0 1 2 3 Tìm t /2. -t /2 t /2 • B3: Nếu z (- ; - t /2)(t /2; + ) Bác bỏ H0. Ngược lại thì chấp nhận H0.
  20. IV. KIỂM ĐỊNH GIẢ THIẾT VỀ QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA ĐẠI LƯỢNG NGẪU NHIÊN ❖Giả sử ĐLNN X có hàm phân phối xác suất F(x) chưa biết. * ❖Ta cần kiểm định giả thiết: H0: F(x) = F (x) với F*(x) là 1 hàm phân phối xác suất cụ thể nào đó. ❖Thực hiện n phép thử độc lập. Khi đó: ▪ Tần số lý thuyết của biến cố (X = xi) sẽ là nPi (với Pi = P(xi X xi + 1) hoặc Pi = P(X=xi) (i = 1, 2, , k)). ▪ Tần số thực tế của biến cố (X = xi) là ni.
  21. IV. KIỂM ĐỊNH GIẢ THIẾT VỀ QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA ĐẠI LƯỢNG NGẪU NHIÊN k 2 2 (n - nP ) Chọn tiêu chuẩn kiểm định: χ =  ii i = 1 nPi Với n khá lớn thì 2 ~ 2(k – r – 1), với r là số tham số chưa biết tương ứng với PPXS của X nếu H0 đúng (các tham số này phải được ước lượng bằng phương pháp hợp lý cực đại). Với mức ý nghĩa , miền bác bỏ giả thiết H0 2 là: W = ( ; + ).
  22. IV. KIỂM ĐỊNH GIẢ THIẾT VỀ QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA ĐẠI LƯỢNG NGẪU NHIÊN Từ đó ta có quy tắc quyết định: k 2 2 (n - nP ) • B1: Tính: χ =  ii i = 1 nPi 2 • B2: Từ mức ý nghĩa Tìm  (k – r – 1). 2 2 • B3: Nếu  ( (k – r – 1); + ) Bác bỏ H0. Ngược lại thì chấp nhận H0.
  23. V. KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP ❖Giả sử quan sát đồng thời 2 dấu hiệu A và B trên cùng 1 phần tử. Dấu hiệu A có các dấu hiệu thành phần là A1, A2, , Ah. Dấu hiệu B có các dấu hiệu thành phần là B1, B2, , Bk. ❖Ta cần kiểm định giả thiết: H0: A và B độc lập; H1: A và B không độc lập. ❖Lấy mẫu kích thước n và trình bày kết quả quan sát dưới dạng bảng:
  24. V. KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP B A B1 B2 Bk Tổng A1 n11 n12 n1k n1 A2 n21 n22 n2k n2 Ah nh1 nh2 nhk nh Tổng m1 m2 mk n Gọi Ci là biến cố chọn được phần tử mang dấu hiệu Ai; Dj là biến cố chọn được phần tử mang dấu hiệu Bj; Nếu H0 đúng, tức là A và B độc lập thì các dấu hiệu Ai, Bj cũng độc lập Ci, Dj cũng độc lập.
  25. V. KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP B A B1 B2 Bk Tổng A1 n11 n12 n1k n1 A2 n21 n22 n2k n2 Ah nh1 nh2 nhk nh Tổng m1 m2 mk n nmn P(C D ) = ij ; P(C ) = i ; P(D ) = j i jn i n j n nmn C , D độc lập =iji . j i j n n n
  26. V. KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP Từ đó ta có quy tắc quyết định: • B1: Tính: 2 nmn ij - i . j k h k h 2 2 n n n nij χ = = n. - 1 n m  n .m j = 1 i = 1i . j j = 1 i = 1 ij nn • B2: Từ mức ý nghĩa 2 Tìm  [(h – 1)(k – 1)]. 2 2 • B3: Nếu  ( [(h – 1)(k – 1)]; + ) Bác bỏ H0. Ngược lại thì chấp nhận H0.
  27. Tổng kết chương 8 • Kiểm định tỷ lệ tổng thể, trung bình tổng thể (hai phía, phía trái, phía phải)? • Kiểm định quy luật PPXS? • Kiểm định tính độc lập?