Bài giảng Thống kê kinh tế - Nguyễn Văn Vũ An

pdf 69 trang ngocly 1280
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê kinh tế - Nguyễn Văn Vũ An", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_kinh_te_nguyen_van_vu_an.pdf

Nội dung text: Bài giảng Thống kê kinh tế - Nguyễn Văn Vũ An

  1. THỐNG KÊ KINH TẾ Nguyễn Văn Vũ An Bộ môn Tài chính – Ngân hàng (TVU)
  2. TÀI LIỆU THAM KHẢO 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 2
  3. TÀI LIỆU THAM KHẢO 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 3
  4. CHƯƠNG 1. GIỚI THIỆU MÔN HỌC 1. KHÁI NIỆM . Thống kê là một nhánh của toán học liên quan đến việc thu thập, phân tích, diễn giải hay giải thích và trình bày các dữ liệu . Thống kê mô tả và thống kê suy diễn tạo thành thống kê trong ứng dụng 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 4
  5. 2. TỔNG QUAN VỀ THỐNG KÊ . Thống kê mô tả: Là pháp sử dụng để tóm tắt hoặc mô tả một tập hợp dữ liệu . Thống kê suy diễn: Là phương pháp mô hình hóa trên các dữ liệu quan sát để giải thích được những biến thiên “dường như” có tính ngẫu nhiên và tính không chắc chắn của các quan sát 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 5
  6. 3. MỘT SỐ KHÁI NIỆM TRONG THỐNG KÊ . Tổng thể thống kê là tập hợp các đơn vị thuộc hiện tượng nghiên cứu, cần quan sát, thu thập và phân tích mặt lượng của chúng theo một hoặc một số tiêu thức nào đó . Mẫu là tổng thể bao gồm một số đơn vị được chọn ra từ tổng thể chung theo một phương pháp lấy mẫu nào đó 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 6
  7. 3. MỘT SỐ KHÁI NIỆM TRONG THỐNG KÊ . Quan sát là cơ sở thu thập số liệu và thông tin cần nghiên cứu . Dữ liệu định tính phản ánh tính chất, sự hơn kém của đối tượng của các đối tượng nghiên cứu, là các dữ liệu ban đầu không được thể hiện dưới dạng số . Dữ liệu định lượng phản ánh mức độ hay mức độ hơn kém, là các dữ liệu có thể cân, đong, đo, đếm được 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 7
  8. 4. QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ Xác định vấn đề nghiên cứu, mục tiêu, nội dung, đối tượng nghiên cứu Xây dựng hệ thống các khái niệm, Các chỉ tiêu thống kê Thu thập dữ liệu thống kê Xử lý số liệu: • Kiểm tra, chỉnh lý, sắp xếp số liệu • Phân tích thống kê sơ bộ • Phân tích thống kê thích hợp Phân tích và giải thích kết quả Báo cáo và truyền đạt kết quả nghiên cứu 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 8
  9. 5. CÁC LOẠI THANG ĐO . Thang đo định danh . Thang đo thứ bậc . Thang đo khoảng . Thang đo tỷ lệ 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 9
  10. CHƯƠNG 2. THU THẬP DỮ LIỆU . Vấn đề đầu tiên của công việc thu thập dữ liệu là xác định rõ những dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này . Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu . Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn, đó chính là những dữ liệu đã qua tổng hợp, xử lý 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 10
  11. CHƯƠNG 2. THU THẬP DỮ LIỆU . Các phương pháp thu thập dữ liệu sơ cấp o Thực nghiệm o Khảo sát qua điện thoại o Thư hỏi o Quan sát trực tiếp o Phỏng vấn cá nhân 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 11
  12. CHƯƠNG 2. THU THẬP DỮ LIỆU . Các kỹ thuật chọn mẫu o Kỹ thuật lấy mẫu xác suất • Lấy mẫu ngẫu nhiên đơn giản • Lấy mẫu hệ thống • Lấy mẫu cả khối/ cụm và lấy mẫu nhiều giai đoạn • Lấy mẫu phân tầng o Kỹ thuật lấy mẫu phi xác suất • Lấy mẫu thuận tiện • Lấy mẫu định mức • Lấy mẫu phán đoán 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 12
  13. CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ 1. BẢNG TẦN SỐ Trị số của biến (Xi) Tần số (fi) Tần suất (%) X1 f1 f1/n X2 f2 f2/n Xk fk fk/n Tổng fi = n 100 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 13
  14. CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ 1. BẢNG TẦN SỐ Công việc của chủ hộ Tần số (người) Tần suất (%) Có hoạt động kinh tế 658 63,45 Không hoạt động kinh tế 47 4,53 Không có việc làm 332 32,02 Tổng 1.037 100 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 14
  15. CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ 1. BẢNG TẦN SỐ Tần suất Độ tuổi (tuổi) Tần số (người) Tần suất (%) tích lũy (%) 15 - 20 146 12,9 12,9 21 - 30 410 36,3 49,2 31 - 40 293 26,0 75,2 41 - 50 187 16,6 91,8 51 - 60 93 8,2 100 Tổng 1.129 100 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 15
  16. CHƯƠNG 3. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ 1. BẢNG TẦN SỐ 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 16
  17. 2. TÓM LƯỢC VÀ TRÌNH BÀY DỮ LIỆU BẰNG ĐỒ THỊ 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 17
  18. 2. TÓM LƯỢC VÀ TRÌNH BÀY DỮ LIỆU BẰNG ĐỒ THỊ 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 18
  19. CHƯƠNG 4. TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ x . Trung bình mẫu (Mean): x  i n  fi xi . Trung bình có trọng số: XW  fi . Trung vị - Me (Median): Là giá trị đứng giữa của tập dữ liệu đã được sắp xếp theo thứ tự tăng dần . Mode (Mo): Giá trị gặp nhiều nhất trong tập dữ liệu 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 19
  20. CHƯƠNG 4. TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ n . Trung bình nhân (Geometric mean): x x1x2 xn . Khảo sát hình dạng của các đa giác tần số tương ứng với các kiểu phân phối Lệch trái Cân đối Lệch phải Mean < Me < Mo Mean = Me = Mo Mo < Me < Mean 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 20
  21. CHƯƠNG 4. TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ . Phương sai: Trung bình của các biến thiên bình phương giữa từng quan sát trong tập dữ liệu so với trung bình của nó x x 2 x x 2 f s2  i Hoặc s2  i i n 1  fi 1 . Độ lệch chuẩn: Lấy căn bậc hai của phương sai 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 21
  22. CHƯƠNG 4. TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ Tuổi 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 22
  23. CHƯƠNG 4. TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ X . Trung bình tổng thể:   i N 2 2  X i  . Phương sai tổng thể: N . Chuẩn hóa dữ liệu: Biến đổi chúng thành dữ liệu ở 1 thang đo chuẩn x  o Chuẩn hóa z cho dữ liệu tổng thể: z x x  o Chuẩn hóa z cho dữ liệu mẫu: z s 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 23
  24. CHƯƠNG 5. XÁC SUẤT, BIẾN NGẪU NHIÊN VÀ LUẬT PHÂN PHỐI 1. XÁC SUẤT CĂN BẢN . Phép thử . Biến cố: Kết cục của phép thử o Biến cố chắc chắn (Ω) o Biến cố không thể có (Ø) o Biến cố ngẫu nhiên (A, B, C, ) . Xác suất của một biến cố 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 24
  25. 1. XÁC SUẤT CĂN BẢN . Biến cố tổng C = A ∪ B hay C = A + B là biến cố xảy ra khi và chỉ khi A hoặc B xảy ra . Biến cố tích C = A ∩ B hay C = A*B là biến cố xảy ra khi và chỉ khi A và B cùng xảy ra . Biến cố xung khắc . Biến cố độc lập
  26. 1. XÁC SUẤT CĂN BẢN . P(A) = m/n . Tính chất: o 0 ≤ P(A) ≤ 1 o P(Ω) = 1 o P(Ø) = 0
  27. 2. BIẾN NGẪU NHIÊN . Biến ngẫu nhiên là những biến mà giá trị của nó được xác định 1 cách ngẫu nhiên o Biến ngẫu nhiên rời rạc o Biến ngẫu nhiên liên tục
  28. 3. CÁC PHÂN PHỐI LÝ THUYẾT QUAN TRỌNG . Phân phối nhị thức (Binominal distribution) . Phân phối Poisson (Poisson distribution) . Phân phối bình thường (Normal distribution) . Phân phối bình thường chuẩn hóa (Standard normal distribution) . Dùng phân phối bình thường tính xấp xỉ một số phân phối rời rạc . Phân phối đều (Uniform distribution) . Phân phối mũ (Exponential distribution)
  29. CHƯƠNG 6. PHÂN PHỐI CỦA CÁC THAM SỐ MẪU 1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU . Trung bình mẫu là ước lượng không chệch của trung bình tổng thể vì giá trị trung bình tính được từ tất cả các trị trung bình mẫu của mẫu cỡ n có thể lấy được từ tổng thể cỡ N sẽ đúng trị trung bình của tổng thể . Ví dụ: Tuổi có cỡ N = 4 như sau {18, 20, 22, 24} Ta có μ = (18 + 20 + 22 + 24)/4 = 21
  30. 1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU Các mẫu 18 20 22 24 Nếu tất cả các cỡ mẫu có 2 người được chọn theo 18 18; 18 18; 20 18; 22 18; 24 kiểu hoàn lại từ tổng thể 20 20; 18 20; 20 20; 22 20; 24 thì có 16 mẫu theo nguyên tắc Nn 22 22; 18 22; 20 22; 22 22; 24 24 24; 18 24; 20 24; 22 24; 24 (18 19 20 24) 336  21  x 16 16
  31. 1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU . Sai số chuẩn của trung bình mẫu 2 X  (18 21)2 (24 21)2   i 5 2,236 N 4  2,236  1,58 x n 2 Như vậy: Khi cỡ mẫu tăng thì sai số chuẩn của trung bình giảm xuống Khi n/N > 0,05   N n  FPC x n n N 1 Với FPC (Finite population correction) là yếu tố hiệu chỉnh tổng thể hữu hạn
  32. 1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU . Chọn mẫu từ một tổng thể có phân phối bình thường  x X     x X x n Z  X o Ví dụ: Xem ví dụ P. 176 (Thống kê ứng dụng)
  33. 1. PHÂN PHỐI CỦA TRUNG BÌNH MẪU . Chọn mẫu từ một tổng thể không có phân phối bình thường o Lý thuyết giới hạn trung tâm (Central limit theorem) • Tổng thể có phân phối bình thường thì trung bình mẫu cũng là phân phối bình thường dù cỡ mẫu là bao nhiêu • n ≥ 30, phân phối mẫu xấp xỉ phân phối bình thường • Hình dáng của phân phối tổng thể khá đối xứng thì phân phối mẫu xấp xỉ phân phối bình thường nếu cỡ mẫu n ≥ 15 o Ví dụ: P.179 (Thống kê ứng dụng) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 33
  34. 2. PHÂN PHỐI CỦA TỶ LỆ MẪU X . Tỷ lệ mẫu: Ps n o X: Số quan sát có thuộc tính quan tâm p p p(1 p) Z s P p  P p(1 p) s s n n o Ví dụ: P. 182 (Thống kê ứng dụng) Khi n/N > 0,05 p(1 p) p(1 p) N n  FPC x n n N 1 o Ví dụ: P. 183 (Thống kê ứng dụng)
  35. CHƯƠNG 7. ƯỚC LƯỢNG CÁC THAM SỐ TỔNG THỂ 1. ƯỚC LƯỢNG TRUNG BÌNH TỔNG THỂ . Vấn đề đặt ra là ước lượng các đặc trưng của tổng thể (chưa biết) từ các đặc trưng của mẫu dữ liệu thu thập được . Ước lượng điểm là phương pháp dùng một tham số thống kê mẫu đơn lẻ để ước lượng về giá trị thật của tham số tổng thể . Ước lượng khoảng là phương pháp dựa vào dữ liệu của mẫu, với một độ tin cậy cho trước, xác định khoảng giá trị mà đặc trưng của tổng thể có thể rơi vào nguyenvanvuan@gmail.com 35 6/11/2015 10:23 AM
  36. 1. ƯỚC LƯỢNG TRUNG BÌNH TỔNG THỂ . Ước lượng khoảng trung bình tổng thể khi đã biết phương sai tổng thể: o Ví dụ: P. 189 (Thống kê ứng dụng) . Ước lượng khoảng trung bình tổng thể khi không biết phương sai tổng thể: o Nếu n ≥ 30: o Nếu n < 30: o Ví dụ: P. 193 (Thống kê ứng dụng) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 36
  37. web . nguyenvanvuantvu.yolasite.com 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 37
  38. 2. ƯỚC LƯỢNG TỈ LỆ TỔNG THỂ p (1 p ) p (1 p ) p z s s p p z s s s / 2 n s / 2 n Ví dụ: P. 195 (Thống kê ứng dụng) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 38
  39. 3. XÁC ĐỊNH CỠ MẪU CHO BÀI TOÁN ƯỚC LƯỢNG 2 z  . Đối với trung bình tổng thể: n / 2 e o Ví dụ: P. 196 (Thống kê ứng dụng) z 2 p(1 p) . Đối với tỷ lệ tổng thể: n / 2 e2 o Ví dụ: P. 197 (Thống kê ứng dụng) nN . Trong tình huống tổng thể hữu hạn: n' n (N 1) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 39
  40. 4. ƯỚC LƯỢNG TRÊN HAI MẪU . Ước lượng khác biệt hai trung bình tổng thể trong trường hợp mẫu độc lập o Trường hợp biết phương sai tổng thể: 2 2 1  2 (x1 x2 ) z / 2 n1 n2 • Ví dụ: P. 199 (Thống kê ứng dụng) o Trường hợp chưa biết phương sai tổng thể, mẫu lớn: 2 2 s1 s2 (x1 x2 ) z / 2 n1 n2 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 40
  41. 4. ƯỚC LƯỢNG TRÊN HAI MẪU o Trường hợp chưa biết phương sai tổng thể, mẫu nhỏ: Độ lệch chuẩn mẫu gộp: 2 2 (n1 1)s1 (n2 1)s2 s p n1 n2 2 1 1 (x x ) t s 1 2 / 2;df p với df = n1+ n2 -2 n1 n2 Trong tình huống mẫu nhỏ, phương sai tổng thể không 2 2 2 bằng nhau thì: s1 s2 n1 n2 df 2 2 s 2 s 2 1 2 n n 1 2 6/11/2015 10:23 AM 41 n1 1 n2 1
  42. 4. ƯỚC LƯỢNG TRÊN HAI MẪU . Ước lượng khác biệt hai trung bình tổng thể trong trường hợp mẫu cặp o B1: Tính từng cặp chênh lệch d = x – x i 1i 2i d o B2: Tính trung bình các chênh lệch trên mẫu d  n o B3: Tính độ lệch chuẩn của chênh lệch: 2 d d s  i d n 1 sd o B4: Xây dựng khoảng ước lượng: d t / 2;n 1 n o Ví dụ: P. 204 (Thống kê ứng dụng) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 42
  43. 4. ƯỚC LƯỢNG TRÊN HAI MẪU . Ước lượng tỷ lệ hai mẫu ps1(1 ps1) ps2 (1 ps2 ) ps1 ps2 z / 2 n1 n2 o Ví dụ: P. 206 (Thống kê ứng dụng) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 43
  44. CHƯƠNG 8. KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ TỔNG THỂ 1. CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH . Đặt giả thuyết về tham số tổng thể o Giả thuyết H0 thường mô tả hiện tượng lúc bình thường, mô tả tình trạng nguyên thủy, hoặc tình trạng không chịu tác động gì của hiện tượng; Giả thuyết H0 luân có dấu bằng (P.209) o Giả thuyết H1 mô tả tình trạng ngược lại với H0 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 44
  45. 1. CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH . Xác suất sai lầm loại I là xác suất để chúng ta bác bỏ H0 trong khi nó thật sự đúng . Xác suất sai lầm loại II là xác suất để chúng ta không bác bỏ H0 trong khi nó sai . Mức ý nghĩa α của kiểm định (Significance level) . Giá trị tới hạn (Critical value) là biên giới chia đôi hai vùng chấp nhập và bác bỏ H0 . Kiểm định một bên và kiểm định hai bên (P.213) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 45
  46. 2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU . Kiểm định giả thuyết về trung bình tổng thể o Khi biết độ lệch chuẩn B1: Nhận định tình hình của tham số tổng thể B2: Đặt giả thuyết B3: Xác định α x  B4: Tính giá trị kiểm định ztt  / n B5: Bác bỏ H0 nếu kiểm định hai bên thì ztt > zα/2 hoặc ztt zα B6: Kết luận (P.217) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 46
  47. 2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU . Kiểm định giả thuyết về trung bình tổng thể o Khi không biết độ lệch chuẩn B1- B3: Giống TH biết độ lệch chuẩn B4: Tính giá trị kiểm định x  n ≥ 30 thì z tt s / n x  t n zα/2 hoặc ztt tα/2;n-1 hoặc ttt zα(ttt > tα;n-1) B6: Kết luận (P218 – 219) 47
  48. 2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU . Tiếp cận p-value (P.221) o P-value ≥ α thì chấp nhận H0 o P-value < α thì bác bỏ H0 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 48
  49. 2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU . Kiểm định giả thuyết về tỷ lệ tổng thể: p p z s 0 tt p(1 p) / n Vì chúng ta giả định p = p0 nên dùng p0 thay thế cho p như một cách tính sắp xỉ Quyết định chấp nhận hay bác bỏ H0 (P. 223) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 49
  50. 2. KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU . Kiểm định giả thuyết về phương sai tổng thể: (P.226) 2 2 (n 1)s tt 2  0 Bác bỏ H0 trong trường hợp: 2 2 2 2 Kiểm định hai bên: tt n 1;1 / 2 Hoặc tt n 1; / 2 2 2 Kiểm định bên phải: tt n 1; 2 2 Kiểm định bên trái: tt n 1;1 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 50
  51. 3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU . Kiểm định giả thuyết cho khác biệt của hai trung bình tổng thể, biết phương sai của hai tổng thể, hai mẫu độc lập x1 x2 (1 2 ) ztt  2  2 1 2 n1 n2 . Kiểm định giả thuyết cho khác biệt của hai trung bình tổng thể, không biết phương sai của hai tổng thể, hai mẫu độc lập cỡ mẫu lớn x1 x2 (1 2 ) ztt s 2 s2 (P.230) 1 2 n1 n2 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 51
  52. 3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU . Kiểm định giả thuyết cho khác biệt của hai trung bình tổng thể, không biết phương sai của hai tổng thể, hai mẫu độc lập cỡ mẫu nhỏ (P.232) x1 x2 (1 2 ) ttt (n 1)s2 (n 1)s2 1 1 1 1 2 2 (n1 1) (n2 1) n1 n2 Quy tắc bác bỏ H0: t t t t tt n1 n2 2; / 2 Kiểm định hai bên: tt n1 n2 2; / 2 Hoặc t t Kiểm định bên phải: tt n1 n2 2; t t Kiểm định bên trái: tt n1 n2 2; 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 52
  53. 3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU . Kiểm định giả thuyết cho khác biệt của hai trung bình tổng thể, hai mẫu không độc lập (Mẫu phối hợp từng cặp) o B1: Tính từng cặp chênh lệch di = x1i – x2i d o B2: Tính trung bình các chênh lệch trên mẫu d  n o B3: Tính độ lệch chuẩn của chênh lệch: 2 d d s  i d n 1 d d ttt o B4: Tính toán giá trị kiểm định: sd o Ví dụ: P. 236 (Thống kê ứng dụng) n 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 53
  54. 3. KIỂM ĐỊNH GIẢ THUYẾT HAI MẪU . Kiểm định giả thuyết khác biệt giữa hai tỷ lệ tổng thể ( p p ) ( p p ) z 1s 2s 1 2 o Phương pháp dùng phân phối z: tt 1 1 ps (1 ps )( ) n1 n2 n1 ps1 n2 ps2 X1 X 2 Với ps n1 n2 n1 n2 (P.242) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 54
  55. CHƯƠNG 9. PHÂN TÍCH PHƯƠNG SAI 1. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ . B1: Tính các trung bình mẫu của các nhóm TOÅNG THEÅ 1 2 . . . k x11 x21 . . . Xk1 x12 x22 . . . xk1 . . . . . . . . . . . . x1n1 x2n2 . . . xknk 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 55
  56. 1. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ . B1: Tính các trung bình mẫu của các nhóm o Tính trung bình mẫu ni  xij j 1 xi ni o Trung bình chung của k mẫu k  ni xi i 1 x k  ni i 1 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 56
  57. 1. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ . B2: Tính tổng các chênh lệch bình phương o Tổng các chênh lệch bình phương trong nội bộ nhóm (SSW) n1 n2 2 SS (x x )2 SS1 (x1 j x1) 2  2 j 2  j 1 j 1 Tương tự ta có SSW = SS1 + SS2+ + SSk n k i 2 Hay SSW =   (xij xi ) i 1 j 1 o Tổng chênh lệch bình phương giữa các nhóm (SSG) k 2 SSG ni (xi x) i 1 o Tổng các chênh lệch bình phương toàn bộ (SST) k ni 2 SST (xij x) Hay: SST = SSW + SSG i 1 j 1 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 57
  58. 1. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ . B3: Tính các phương sai (Trung bình chênh lệch của các chênh lệch bình phương) o Tính phương sai trong nội bộ nhóm (MSW) SSW MSW n k o Tính phương sai giữa các nhóm (MSG) SSG MSG k 1 MSG F . B4: Kiểm định giả thuyết: MSW Nếu F > F(k-1;n-k);α thì bác bỏ H0 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 58
  59. 1. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ (P.257) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 59
  60. 2. PHÂN TÍCH SÂU ANOVA . Khi H0 bị bác bỏ thì cần phân tích sâu hơn để xác định nhóm nào khác với nhóm nào (Turkey) . Nếu có k nhóm thì số lượng cặp cần so sánh là: k ! k(k 1) C2 k 2!(k 2)! 2 . VD: k= 3 thì số cặp cần so sánh là 3 . Các giả thuyết cần kiểm định 1. H0: µ1 = µ2 2. µ2 = µ3 3. µ1 = µ3 H1: µ1 ≠ µ2 µ2 ≠ µ3 µ1 ≠ µ3 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 60
  61. 2. PHÂN TÍCH SÂU ANOVA MSW . Giá trị tới hạn Turkey: T q , k, n k ni . Bác bỏ H0 khi độ lệch tuyệt đối giữa các cặp trung bình mẫu lớm hơn hay bằng T giới hạn (P.266) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 61
  62. 2. PHÂN TÍCH SÂU ANOVA 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 62
  63. CHƯƠNG 10. KIỂM ĐỊNH PHI THAM SỐ 1. KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON VỀ TRUNG VỊ CỦA MỘT TỔNG THỂ B1: Thu thập thông tin mẫu B2: Tính toán chênh lệch di giữa các giá trị quan sát được và giá trị trung vị B3: Lấy giá trị tuyệt đối của chênh lệch B4: Xếp hạng tuyệt đối của chênh lệch B5: Với các giá trị di dương thì vào cột R+, ngược lại thì đặt vào cột R- B6: Tính giá trị thống kê W: Hai bên: W = min[Σ(cột R+); Σ(cột R-)] Bên phải W=Σ(cột R+) Bên trái W=Σ(cột R-) B7: Bác bỏ H0 khi W ≤ Wα (Ta chỉ xét cận trái) (P.286) 63
  64. 1. KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON VỀ TRUNG VỊ CỦA MỘT TỔNG THỂ . Khi cỡ mẫu lớn (n > 20): n(n 1) W z 4 n(n 1)(2n 1) 24 Quy tắc bác bỏ H0: (P.287) Hai bên: z < -zα/2 Một bên: z < -zα 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 64
  65. 2. KIỂM ĐỊNH TỔNG HẠNG WILCOXON CHO TRUNG BÌNH HAI MẪU ĐỘC LẬP . Trường hợp n1 và n2 không bằng nhau chúng ta quy ước n1 là cỡ mẫu nhỏ và n2 là cỡ mẫu lớn và giá trị tổng hạng Wilcoxon T1 được tính là tổng tất cả các hạng trong mẫu 1 o H0: M1 = M2 o Bác bỏ H0: • Hai bên: T1 ≥ giới hạn trên hoặc T1 ≤ giới hạn dưới • Bên phải: T1 ≥ giới hạn trên • Bên trái: T1 ≤ giới hạn dưới (P.289) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 65
  66. 3. KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON CHO MẪU PHỐI HỢP TỪNG CẶP . Tính khác biệt Di cho từng cặp quan sát . Xác định các giá trị tuyệt đối Di . Xác định cỡ mẫu thực tế . Tách riêng các hạng – và + theo dấu của Di gốc . Tính tổng hạng riêng cho các chênh lệch dương, đó chính là trị thống kê kiểm định W=ΣRi(+) o H0: MD = 0 o Bác bỏ H0: • Hai bên: W ≥ giới hạn trên hoặc W ≤ giới hạn dưới • Bên phải: W ≥ giới hạn trên • Bên trái: W ≤ giới hạn dưới (P.292) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 66
  67. 4. KIỂM ĐỊNH KRUSKAL WALLIS 12 R2 W  i 3(n 1) n(n 1) ni 2 W k 1, (P.293) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 67
  68. 5. KIỂM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH ĐỘC LẬP . Eij = [(Tổng hàng i) x (Tổng cột j)]/ Cỡ mẫu (P.297) O E 2  2  ij ij Eij 2 2 tt (r 1)(c 1); 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 68
  69. 6. KIỂM ĐỊNH CHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP 2 2 (Oi Ei ) tt  Ei 2 2 tt k 1; (P.299) 6/11/2015 10:23 AM nguyenvanvuan@gmail.com 69