Giáo trình Thống kê cơ bản - Chương 15: Kiểm định chi bình phương

doc 8 trang ngocly 30
Bạn đang xem tài liệu "Giáo trình Thống kê cơ bản - Chương 15: Kiểm định chi bình phương", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • docgiao_trinh_thong_ke_co_ban_chuong_15_kiem_dinh_chi_binh_phuo.doc

Nội dung text: Giáo trình Thống kê cơ bản - Chương 15: Kiểm định chi bình phương

  1. KIỂM ÐỊNH CHI BÌNH PHƯƠNG Mục tiêu Sau khi nghiên cứu chủ đề, học viên cĩ khả năng: - Xây dựng được bảng dự trù n m để mơ tả mối liên quan giữa hai biến số định tính 2 - Sử dụng kiểm định  cho bảng dự trù n m về sự liên quan giữa hai biến số định tính - Trình bày các giả định về tính hợp lệ cho kiểm định 2 2 - Sử dụng kiểm định  McNemar để kiểm định sự liên quan giữa hai biến số định tính trong thiết kế bắt cặp. 1. Giới thiệu Trình bày số liệu của các biến định tính được mơ tả ở chương Thống kê, biến số và phân phối. Khi cĩ hai biến định tính, số liệu được sắp xếp trong bảng dự trù (contigency table). Các phạm trù cho một biến số tạo thành hàng và các phạm trù cho biến số khác tạo thành cột. Cá nhân được đưa vào một ơ thích hợp của bảng dự trù tùy theo giá trị của hai biến số. Bảng dự trù cũng được dùng cho các biến số định lượng rời rạ hay biến số định lượng liên tục khi các giá trị được phân nhĩm. Kiểm định chi bình phương (2 ) được dùng để kiểm định xem cĩ sự liên hệ giữa các biến số hàng và biến số cột hay khơng hay nĩi cách khác, sự phân phối của các cá nhân trong các phạm trù của một biến số cĩ phụ thuộc vào sự phân phối trong các phạm trù của biến kia hay khơng. Khi bảng chỉ cĩ hai hàng và hai cột điều này cĩ nghĩa là so sánh phân phối của biến số nhị giá (được biểu thị bằng tỉ lệ) ở hai nhĩm hay cịn gọi là so sánh hai tỉ lệ. 2. Bảng 2 x 2 (so sánh hai tỉ lệ) Chúng ta sử dụng lại thí dụ đã nêu trong chương Nguyên tắc kiểm định - so sánh hai tỉ lệ. Trong một thử nghiệm lâm sàng để điều trị ung thư vú đã di căn, bệnh nhânh được phân nhĩm ngẫu nhiên để được điều trị với L-Pam hay CMF (một phối hợp gồm 3 loại thuốc). Ðáp ứng khối u được định nghĩa là sự teo nhỏ trên một nửa của diện tích khối u trong thời gian tối thiểu là 2 tuần. Số liệu như sau: Bảng 11. Ðáp ứng khối u của 184 bệnh nhân ung thư vú với điều trị bằng CMF và L-PAM Ðiều trị CMF L-Pam Tổng số Ðáp ứng của Cĩ 49 18 67 khối u (52,7%) (19,8%) (36,4%) Khơng 44 73 117 Tổng số bệnh 93 91 184 nhân Với số liệu trên, chúng ta cĩ thể sử dụng kiểm định ý nghĩa để xem bằng chứng để kết luận CMF tốt hơn L-Pam mạnh đến mức độ nào. Bước đầu tiên trong việc lí giải số liệu bảng dự trù là tính tốn tỉ lệ hay phần trăm thích hợp. Do đĩ tỉ lệ đáp ứng là 52,7% trong nhĩm điều trị CMF, 19,8% trong nhĩm placebo
  2. và 36,4% tồn bộ. Sau đĩ chúng ta cần quyết định như vậy cĩ đủ chứng cứ để xem CMF cĩ hiệu quả hơn L-Pam hay sự khác biệt là chỉ là do tình cờ. Ðiều này được tiến hành bằng kiểm định chi bình phương (chi square test) nhằm so sánh số quan sát trong một trong bốn phạm trù trong bảng dự trù với vọng trị nếu khơng cĩ sự khác biệt về hiệu quả giữa CMF và L-Pam. Tổng số 67/184 bệnh nhân đáp ứng và nếu CMF và L-Pam cĩ hiệu quả bằng nhau, tỉ lệ đáp ứng trong hai nhĩm cũng bằng giá trị trên và chúng ta sẽ cĩ 93 * 67/184 =33,9 người trong nhĩm CMF và 91 * 67/184 = 33,1 người trong nhĩm L-Pam đáp ứng với điều trị. Tương tư như vậy sẽ cĩ 93 * 117/184 = 59,1 người và 91 * 117/184 = 57,9 người khơng đáp ứng. Những vọng trị này đươc trình bày trong bảng 13.1(b). Chúng cũng tạo tổng số hàng và tổng số cột tương tự như trị số quan sát. Giá trị chi bình phương cĩ được bằng cách tính (quan sát - vọng trị) 2/vọng trị cho mỗi ơ trong bảng dự trù và cộng chúng lại. (O E) 2  2  , d. f . 1 độ tự do với bảng 2 x 2 E Giá trị này được gọi là giá trị  2 của Pearson. Nếu hiệu số giữa số quan sát được và vọng trị càng lớn, giá trị 2 càng lớn và ít cĩ thể sự khác biệt này là do tình cờ. Ðiểm phần trăm của phân phối  2 được trình bày trong bảng A5. Giá trị này phụ thuộc vào độ tự do và trong bảng 2 2 độ tự do bằng 1. Trong thí dụ này (49 33,9) 2 (18 33,1) 2 (44 59,1) 2 (73 57,9) 2  2 33,9 33,1 59,1 57,9 6,73 6,89 3,86 3,94 21,4 21,4 lớn hơn 10,83, điểm 0,001 của phân phối  2 một độ tự do. Do đĩ xác suất của sự khác biệt quan sát được về tỉ lệ đáp ứng do tình cờ nhỏ hơn 0,001 (0,1%), nếu khơng cĩ sự khác biệt về hiệu quả giữa CMF và L-Pam. Do đĩ cĩ thể kết luận rằng CMF cĩ hiệu quả tốt hơn. Bảng 13.1 Kết quả thử nghiệm CMF và L-Pam trên bệnh nhân ung thư vú. (a) Số quan sát Ðiều trị CMF L-Pam Tổng số Cĩ 49 18 67 (52,7%) (19,8%) (36,4%) Khơng 44 73 117 Tổng số bệnh 93 91 184 nhân (a) Vọng trị Ðiều trị CMF L-Pam Tổng số Cĩ 33,9 33,1 67 Khơng 59,1 57,9 117 Tổng số bệnh 93 91 184
  3. nhân Cơng thức 2 của Mantel-Haenzen 2 2 Khi trường hợp chỉ cĩ một bảng 2 x 2 giá trị của  MH sẽ hơi nhỏ hơn  của Pearson tuỳ theo cỡ mẫu; N 1  2  2 MH N Cơng thức 2 của Yates để hiệu chỉnh tính liên tục Giống như kiểm định bình thường, kiểm định chi bình phương đối với bảng 2 2 cĩ thể được cải tiến nhờ hiệu chỉnh tính liên tục, thường được gọi là hiệu chỉnh tính liên tục của Yates (Yates' continuity correction). Cơng thức như sau (| O E | 1  2  2 , d. f . 1 E cho giá trị 2 nhỏ hơn, |O - E| cĩ nghĩa là giá trị tuyệt đối của O-E hay nĩi cách khác, giá trị của O-E bỏ qua dấu của nĩ. Trong thí dụ này giá trị của 2 là (49 33,9 0,5) 2 (33,1 18 0,5) 2 (59,1 44 0,5) 2 (73 57,9 0,5) 2  2 33,9 33,1 59,1 57,9 6,29 6,44 3,61 3,68 20,0 So sánh với kiểm định bình thường Kiểm định bình thường để so sánh hai tỉ lệ và kiểm định chi bình phương cho bảng dự trù 2 2 thực chất là tương đương với nhau và  2 = z2. Ðiều này đúng với cả khi cĩ hay khơng cĩ hiệu chỉnh tính liên tục, với điều kiện là nĩ cùng hiệu chỉnh hoặc khơng cùng hiệu chỉnh. Từ thí dụ trong Bảng 11, z2 với (khơng hiệu chỉnh tính liên tục) = 4,632= 21,4 giống hệt như giá trị  2 = 21,4 đã được tính ở trên. Kiểm định bình thường cĩ ưu điểm là dễ tính khoảng tin cậy hơn cho hiệu số hơn và vì vậy thường được sử dụng để so sánh hiệu quả điều trị của thử nghiệm lâm sàng hay để ước lượng nguy cơ quy trách. Kiểm định 2 dễ áp dụng hơn và cĩ thể ứng dụng để tính khoảng tin cậy của nguy cơ tương đối (RR) nên thường được sử dụng trong các nghiên cứu dịch tễ quan sát. Ngồi ra kiểm định 2 cĩ thể mở rộng để so sánh nhiều tỉ lệ và dùng cho bảng dự trù lớn hơn và Lưu ý rằng điểm phần trăm trong Bảng A5 cho kiểm định chi bình phương một độ tự do tương ứng với điểm phần trăm hai đuơi trong bảng A2 của phân phối bình thường. (Khái niệm kiểm định một đuơi hay hai đuơi khơng dùng đối với kiểm định chi bình phương cĩ độ tự do lớn hơn bởi vì chúng bao gồm việc so sánh nhiều tỉ lệ (multiple comparison).) Tính hợp lệ (validity) Nên luơn luơn sử dụng hiệu chỉnh tính liên tục mặc dù chúng cĩ tác động nhiều nhất khi vọng trị nhỏ. Khi chúng rất nhỏ kiểm định chi bình phương (và kiểm định bình thường) khơng phải là xấp xỉ tốt, ngay cả khi cĩ hiệu chỉnh tính liên tục và khi đĩ nên dùng kiểm định chính xác (exact test) cho bảng 2 2. Cochran (1954) đề nghị sử dụng kiểm định chính xác khi tổng số của bảng nhỏ hơn 20 hay khi nĩ ở giữa 20 và 40 và số nhỏ nhất trong bốn giá trị vọng trị nhỏ hơn 5. Do đĩ kiểm định chi bình phương hợp lệ khi tổng số
  4. phải lớn hơn 40 bất kể các giá trị vọng trị hay khi tổng vọng trị ở giữa 20 và 40 với điều kiện tất cả các giá trị vọng trị phải lớn hơn hoặc bằng 5. Bảng 12. Kí hiệu tổng quát cho bảng dự trù 2 2 Ðiều trị CMF L-Pam Tổng số Cĩ a1 a0 m1 Khơng b1 b0 m0 Tổng số bệnh n1 n0 N nhân Cơng thức tính nhanh Nếu các số trong bảng dự trù được kí hiệu bằng các kí tự như trong bảng 13.2 thì cơng thức để tính chi bình phương nhanh hơn cho bảng 2 2 như sau: N (a b a b ) 2 184 (49 73 44 18) 2  2 1 0 0 1 21,4 n1n0 m1m0 67 117 93 91 Nếu khơng cĩ sai số làm trịn, kết quả cĩ được từ cơng thức tính nhanh hồn tồn đồng nhất với cơng thức tính 2 kinh điển. Cơng thức tính nhanh cho 2 của Mantel Haenszel là: (N 1) (a b a b ) 2 (N 1) (a N n m ) 2  2 1 0 0 1 1 1 1 n1n0 m1m0 n1n0 m1m0 Cơng thức tính nhanh cho 2 của Yates để hiệu chỉnh tính liên tục là: N (| a b a b | N / 2) 2 184 (| 49 73 44 18 | 92) 2  2 1 0 0 1 20,0 n1n0 m1m0 67 117 93 9 Kết quả này tương tự như như giá trị đã tính ở trên, nếu khơng xét đến sai số làm trịn. 3. Bảng lớn Kiểm định chi bình phương cĩ thể được áp dụng cho bảng lớn hơn, nĩi chung là bảng r x c, trong đĩ r kí hiệu số hàng trong bảng và c là số cột. (O E)2  2  , d.f . (r 1) (c 1) E Và khơng cĩ hiệu chỉnh tính liên tục hay kiểm định chính xác cho bảng dự trù ngoại trừ bảng 2 2. Cochran (1954) đã đề nghị rằng xấp xỉ của kiểm định chi bình phương sẽ hợp lệ nếu cĩ ít hơn 20% số các giá trị vọng trị dưới 5 và khơng cĩ giá trị vọng trị nào nhỏ hơn một. Cĩ thể vượt qua hạn chế này bằng cách kết hợp các hàng (hay các cột) cĩ giá trị vọng trị thấp. Khơng cĩ cơng thức tính nhanh cho bảng r x c (trường hợp đặc biệt 2 x c hay r x 2 sẽ được xét ở phần sau). Phải tính vọng trị cho mỗi ơ. Sử dụng các lí luận y như trong trường hợp bảng 2 2. Qui tắc chung để tính vọng trị là: Tổng của cột Tổng của hàng E Tổng số chung
  5. Cần lưu ý rằng kiểm định chi bình phương chỉ hợp lệ nếu được áp dụng cho số thực tế trong các phạm trù khác nhau. Khơng bao giờ được áp dụng nĩ cho bảng chỉ cĩ tỉ lệ hay phần trăm mà thơi. Bảng 13. So sánh các nguồn nước chính được sử dụng bởi gia đình trong 3 làng ở Tây phi NGUỒN LÀNG A LÀNG B LÀNG C TỔNG SỐ NƯỚC Sơng 20(40,0%) 32(53,3%) 18(45,0%) 70(46,7%) Ao hồ 18(36,0%) 20(33,3%) 12(30,0%) 70(33,3%) Suối 12(24,0%) 8(13,3%) 10(25,0%) 30(20,0%) Tổng số 50(100,0%) 60(100,0%) 40(100,0%) 150(100,0%) Bảng 14. So sánh các nguồn nước chính được sử dụng bởi gia đình trong 3 làng ở Tây phi (vọng trị) NGUỒN LÀNG A LÀNG B LÀNG C TỔNG NƯỚC SỐ Sơng 23,3 28,0 18,7 70 Ao hồ 16,7 20,0 13,3 50 Suối 10,0 12,0 8,0 30 Tổng số 50 60 40 150 Thí dụ Bảng 13 trình bày kết quả của cuộc điều tra so sánh nguồn nước chính trong 3 xã ở Tây châu Phi. Trong bảng trình bày số và phần trăm các gia đình dùng, nước sơng, nước ao, hay suối. Thí dụ trong làng A, 40% sử dụng nước sơng chủ yếu, 36% nước ao hồ, 24,0% sử dụng giếng. Việc tính tốn các phần trăm là cần thiết trong việc lí giải số liệu của bảng dự trù. Nĩi chung, 70 trong 150 hộ dùng nước giếng. Nếu khơng cĩ sự khác biệt giữa các làng, người ta cĩ thể cho rằng tỉ lệ dùng nước sơng là giống nhau trong mỗi làng. Do đĩ vọng trị của số hộ dùng nước sống là 70 50/150 = 23,3 70 60/150= 28,0 70 40/150 = 18,7 Vọng trị cĩ thể được tính bằng cách áp dụng quy tắc chung. Thí dụ vọng trị của hộ dùng nước sống trong làng B là: tổng của hàng (sông) tổng của cột (B) 70 60 28,0 tổng số chung 150 Vọng trị của tồn bộ bảng được trình bày trong Bảng 14.
  6. (O E)2  2  E ( 20-23,3)2 / 23,3 ( 32-28,0 )2 / 28,0 (18-18,7 )2 /18,7 (18-16,7 )2 /16,7 ( 20-20,0 )2 / 20,0 (12-12,3)2 /13,3 (12-10,0 )2 /10,0 (8-12,0 )2 /12,0 (10-8,0 )2 /8,0 3,53 df (r 1) (c 1) 2 2 4 Bởi vì 3,53 nhỏ hơn 5,39 (điểm 25% của 2 4 độ tự do), cĩ thể kết luận rằng khơng cĩ sự khác biệt ý nghĩa giữa các làng về phần trăm số hộ dùng các nguồn nước khá nhau (P>0,25) 4. Cơng thức ngắn gọn cho bảng 2 x c Kiểm định chi bình phương được áp dụng cho bảng 2 x c, đĩ là bảng chỉ cĩ 2 hàng trình bày sự khác biệt giữa c tỉ lệ thể hiện bởi c cột trong bảng. Cơng thức cơ đọng hơn trong trường hợp này N 2[(r 2 / n) R2 / N]  2 , d. f . c 1 R(N R) Bảng 15. Tỉ lệ hiện nhiễm Schistosoma mansoni theo nghề nghiệp Nghề nghiệp S. Manosi Ngư dân Nơng dân Buơn bán thợ thủ cơng tổng số Dương tính 22(62,9%) 21 (48,8%) 17 (29,3%) 15 (51,7%) 75 (45,5%) Âm tính 13 22 41 14 90 Tổng số 35 43 58 29 165 Trong đĩ n thể hiện tổng số cho cột và r là giá trị của ơ trên trong cột đĩ. r 2/n được tính cho mỗi cột trong bảng và tổng của chúng là ( r2/n). N là tổng số tồn bộ và R là tổng số cả hàng trên. (đối với bảng cĩ 2 cột chứ khơng phải hai hàng, từ 'cột' và 'hàng' sẽ đổi chỗ cho nhau trong phần trình bày trên.) Thí dụ Bảng 15 trình bày kết quả cuộc điều tra ở một vùng nơng thơn ở Trung Phi để so sánh tỉ lệ hiện nhiễm Schistosoma mansoni trong các nghề nghiệp khác nhau. Áp dụng cơng thức ngắn gọn cho 2:  (r 2 /n) 22 2 /35 212 / 43 17 2 /58 15 2 / 29 13,83 10,26 4,98 7,76 36,83 R 2 / N 75 2 /165 34,09 1652( 36,83-34,09 )  2 11,05 d. f . 3 75 90 Ðiều này cĩ ý nghĩa ở mức 2,5%, gợi ý rằng cĩ thể cĩ sự liên hệ giữa nguy cơ nhiễm bệnh và nghề nghiệp. Suất mắc tồn bộ của S. mansoni cao ở người ngư dân, thấp ở người buơn bán so với nơng dân và thợ thủ cơng.
  7. 5. Bài tập Ðể xem việc ăn thịt cĩ liên quan hay độc lập đến viêm ruột hoại tử hay khơng, một nhà khoa học đã tiến hành một nghiên cứu bệnh chứng thu được số liệu như sau: Table 10. Sự liên hệ giữa ăn thịt trong thời gian gần đầu và viêm ruột hoại tử ở Papua New Guinea (OR=11,6) Ăn thịt trong thời Khơng ăn thịt trong Tổng số gian gần đây thời gian gần đây Nhĩm bệnh 50 11 61 Nhĩm chứng 16 41 57 Tổng số 66 52 118 Ta thấy người ăn thịt cĩ nguy cơ bị viêm ruột hoại tử tăng gấp 11 lần so với người khơng ăn thit. Tuy nhiên để đảm bảo rằng sự gia tăng nguy cơ này khơng phải do sai số ngẫu nhiên ta tiến hành tính giá trị 2 và tính mức ý nghĩa của nĩ. Bài giải: 1. Giả thuyết Ho: ăn thịt khơng cĩ liên quan đến viêm ruột hoại tử hay Nguy cơ viêm ruột hoại tử ở nhĩm ăn thịt bằng nguy cơ viêm ruột hoại tử ở nhĩm khơng ăn thịt 2. Chọn kiểm định 2 với 1 độ tự do, giá trị tới hạn là 3,84 với mức ý nghĩa 5% 3. Giá trị 2 được tính như sau: Vì giá trị 2 = 34,72 lớn hơn giá trị tới hạn 3,84 tương ứng với mức ý nghĩa 0,05 nên chúng ta cĩ thể bác bỏ giả thuyết Ho. Tuy niên do để lượng hố sức mạnh của sự liên hệ, người ta tính giá trị p (p-value) . Tra bảng  2, ta tìm được p tương ứng với giá trị 34,72 <0,001. Vì vậy ta cĩ thể báo cáo: bác bỏ giả thuyết Ho với p<0,0001. 2. Một cuộc điều tra việc sử dụng mùng được tiến hành trong một mẫu ngẫu nhiên gồm các đứa trẻ dưới 7 tuổi ở khu vực Tây Nguyên. Ðiều tra ghi nhận dân tộc của đứa trẻ và đứa trẻ thường ngủ mùng cĩ tẩm permethrin, mùng khơng tẩm permethrin hay khơng ngủ mùng, với kết quả như sau: Nhĩm dân tộc Khơng mùng Mùng khơng tẩm Mùng tẩm permethrin Êđê 3 88 165 Mơ nơng 43 73 76 Stiêng 29 16 26 a. Mục tiêu của nghiên cứu là xem xét sự liên hệ giữa dân tộc và việc sử dụng ùng. Ðể khảo sát các số liệu này, bước đầu tiên cần thực hiện là gì? b. Các biến số nào là biến số đáp ứng, biến số nào là biến số giải thích? Nên sử dụng phần trăm theo hàng hay phần trăm theo cột? Tính các số phần trăm này. Các số phần trăm cho thấy điều gì?
  8. c. Bạn cĩ nghĩ rằng sự khác biệt về sử dụng mùng trong các dân tộc khác nhau này là do cơ hội hay khơng? Dùng phương pháp thống kê nào để đánh giá điều này? d. Tiến hành kiểm định ý nghĩa để xem cĩ bằng chứng về mối liên hệ hay khơng. Giá trị p là bao nhiêu? e. Hãy kiểm tra tính giá trị của kiểm định 2 mà bạn đã thực hiện. f. Chúng ta cĩ thể kết luận được điều gì? g. Chúng ta cĩ thể nĩi thêm gì về sự các biệt giữa các nhĩm dân tộc? Sự khác biệt đĩ ở đâu?