Giáo trình Thống kê cơ bản - Chương 8: Nguyên tắc kiểm định - So sánh hai tỉ lệ
Bạn đang xem tài liệu "Giáo trình Thống kê cơ bản - Chương 8: Nguyên tắc kiểm định - So sánh hai tỉ lệ", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
giao_trinh_thong_ke_co_ban_chuong_8_nguyen_tac_kiem_dinh_so.doc
Nội dung text: Giáo trình Thống kê cơ bản - Chương 8: Nguyên tắc kiểm định - So sánh hai tỉ lệ
- NGUYÊN TẮC KIỂM ÐỊNH - SO SÁNH HAI TỈ LỆ Mục tiêu: Sau khi nghiên chủ đề, học viên cĩ khả năng: - Nêu được nguyên tắc của việc kiểm định ý nghĩa - Đánh giá một giả thuyết khơng (Ho) cĩ đạt yêu cầu hay khơng - Trình bày và ứng dụng cơng thức z để so sánh 2 tỉ lệ ở 2 mẫu - Trình bày và ứng dụng được cơng thức của khoảng tin cậy của hiệu số 2 tỉ lệ - Trình bày được sự liên hệ giữa kiểm định ý nghĩa và khoảng tin cậy - Phân biệt được 2 loại sai lầm: sai lầm loại I và sai lầm loại II 1. Thí dụ: Trong một thử nghiệm lâm sàng để điều trị ung thư vú đã di căn, bệnh nhânh được phân nhĩm ngẫu nhiên để được điều trị với L-Pam hay CMF (một phối hợp gồm 3 loại thuốc). Ðáp ứng khối u được định nghĩa là sự teo nhỏ trên một nửa của diện tích khối u trong thời gian tối thiểu là 2 tuần. Số liệu được trình bày trong bảng sau: Ðiều trị CMF L-Pam Tổng số Ðáp ứng của Cĩ 49 18 67 khối u (52,7%) (19,8%) (36,4%) Khơng 44 73 117 Tổng số bệnh 93 91 184 nhân Với số liệu trên, chúng ta cĩ thể sử dụng kiểm định ý nghĩa để xem bằng chứng để kết luận CMF tốt hơn L-Pam mạnh đến mức độ nào. 2. Nguyên tắc của kiểm định ý nghĩa Nguyên lí của phương pháp phản chứng là nều chúng ta cĩ thể suy luận nếu {A B khơng xảy ra} thì {B xảy ra A khơng xảy ra} Kí hiệu B là phủ định của mệnh đề B, A là phủ định của mệnh đề A, ta cĩ thể viết nếu {A B} thì {B A } Ðây là suy luận chúng ta rất thường xuyên ứng dụng trong chẩn đốn y khoa (dù rằng chúng ta ứng dụng nĩ một cách cĩ ý thức hay vơ thức).Thí dụ: một bệnh nhân nhập viện vì bị đau bụng dữ dội. Giả sử chúng ta nghi ngờ bệnh nhân bị tắc ruột và chúng ta khai thác bệnh sử của bệnh nhân. Bệnh nhân cho biết bệnh nhân cĩ trung tiện bình thường và chúng ta loại bỏ căn nguyên tắc ruột. Cĩ thể chúng ta khơng nhận thức được quá trình suy luận nhưng nĩ đã diễn ra như sau: Nếu bệnh nhân bị tắc ruột thì bệnh nhân sẽ khơng đi trung tiện. Do bệnh nhân trung tiện bình thường nên bệnh nhân khơng bị tắc ruột. Nguyên tắc của kiểm định ý nghĩa tương tự như nguyên tắc của phương pháp phản chứng. Ðĩ là: Nếu {Ho T hiếm xảy ra} thì { T xảy ra Ho hiếm xảy ra }
- Kí hiệu theo cơng thức xác suất của biến cố T là P(T), ta viết: Nếu {Ho P(T) nhỏ } thì { T xảy ra P(Ho) nhỏ } Phân tích từng bước của quá trình kiểm định ý nghĩa chúng ta cĩ các bước: 1. Xây dựng giả thuyết Ho 2. Chọn lựa kiểm định thích hợp - Việc tìm chuỗi suy luận từ Ho P(T) 3. Tính giá trị thống kê T của số liệu thu thập được 4. Tính xác suất của thống kê T - kí hiệu là P(T) và được gọi là giá trị p 5. Và nếu P(T) đủ nhỏ chúng ta kết luận P(Ho) nhỏ và chúng ta bác bỏ giả thuyết Ho 2.1. Giả thuyết khơng Trong thống kê, giả thuyết khơng (null hypothesis) là một mệnh đề âm tính cho rằng khơng cĩ sự liên hệ thống kê nào và như ở trên đã trình bày, khẳng định giả thuyết khơng là buớc đầu tiên của bất cứ một kiểm định ý nghĩa thống kê nào. Trong trường hợp so sánh 2 tỉ lệ trước tiên chúng ta sẽ chọn lập trường âm tính: giả định rằng khơng cĩ sự khác biệt về tỉ lệ giữa hai dân số đích mà đã được đại diện bởi hai dân số nghiên cứu (mẫu). Trong thí dụ điều trị ung thư vú, chúng ta xem giả thuyết khơng là hai điều trị này cĩ hiệu quả tương đương. Nĩi khác đi các bệnh nhân ung thư vú sẽ cĩ tỉ lệ đáp ứng với điều trị bằng nhau đối với CMF và L-Pam. Ho: 1= 2 Hay Hp: tỉ lệ đáp ứng với CMF = tỉ lệ đáp ứng với L-Pam Chúng ta cũng cĩ phát biểu giả thuyết khơng như sau: đối với một bệnh nhân bất kì, xác suất đáp ứng điều trị với CMF và L-Pam là bằng nhau. 2.2. Chọn kiểm định ý nghĩa để so sánh hai tỉ lệ phần trăm Sau khi xác định giả thuyết khơng chúng ta cần xác định chuỗi suy luận từ Ho P(B) bằng cách đặt ra câu hỏi: - Nếu giả thuyết khơng là đúng, cơ hội (xác suất) xảy ra sự khác biệt về tỉ lệ tương tự hay lớn hơn sự khác biệt đã quan sát được là bao nhiêu? Cụ thể trong trường hợp thí dụ về ung thư vú, chúng ta đặt ra câu hỏi, nếu thuốc CMF và L-Pam cĩ hiệu quả điều trị cùng bằng 36%, xác suất xảy ra sự khác biệt tương tự hoặc khác biệt nhiều hơn số liệu đã quan sát (đĩ là đáp ứng với CMF là 52,7% và với L-Pam là 19,8%) là bao nhiêu? Như vậy, giả thuyết khơng cho rằng số bệnh nhân điều trị thuốc L-Pam được xem là một mẫu gồm 19 bệnh nhân và bệnh nhân điều trị thuốc CMF là một mẫu gồm 93 bệnh nhân cả hai đều cĩ tỉ lệ đáp ứng là 36,4%. Trong trường hợp này lí thuyết thống kê cho rằng: - Hiệu số của tỉ lệ đáp ứng ở hai mẫu p1-p2 sẽ cĩ phân phối xấp xỉ bình thường - Hiệu số của tỉ lệ đáp ứng ở hai mẫu p1-p2 sẽ dao động chung quanh giá trị 0 - Sai số chuẩn của hiệu số hai tỉ lệ là 1 1 1 1 S.E. (1- )( ) 0,364 0,636 ( ) 0,071 7,1% n1 n 2 93 91
- 2.3. Tính chỉ số thống kê đo lường hiệu số quan sát được Sự khác biệt (hiệu số) quan sát được đo lường theo sai số chuẩn được gọi là thống kê z: hiệu số tỉ lệ quan sát 52,7 19,8 32,9 Z 4,63 sai số chuẩn của hiệu số 7,1 7,1 2.4. Tính xác suất của chỉ số thống kê Z Ðối với phân phối bình thường, ta cĩ xác định xác suất cĩ được thống kê Z lớn hơn hoặc bằng một giá trị Z0 nhất định bằng cách sử dụng một phần mềm thống kê (thí dụ như Epi-Info; Excel hay Stata), hoặc tham khảo bảng phân phối chuẩn. Hoặc chúng ta cĩ thể sử dụng trực tiếp các thơng tin sau: P(|Z| 0,674) =0,5 P(|Z| 1,282) =0,2 P(|Z| 1,645) =0,1 P(|Z| 1,960) =0,05 P(|Z| 2,576) =0,01 P(|Z| 3,291)=0,001 Ðiểm cần nhắc lại là nếu Z càng lớn thì xác suất P càng nhỏ. Trong thí dụ trên với Z=4,63 thì ta cĩ P<0,001. Nĩi cách khác, nếu điều trị CMF và L- Pam thực sự cĩ hiệu quả như nhau thì xác suất cĩ được sự khác biệt lớn như chúng ta đã quan sát là nhỏ hơn 1/1000. 2.5. Kết luận Vì vậy chúng ta kết luận bác bỏ giả thuyết Ho với mức ý nghĩa 0,001. Hay nĩi rằng sự khác biệt cĩ ý nghĩa thống kê ở mức 0,001. Do đĩ cĩ bằng chứng mạnh mẽ cho rằng các bệnh nhân nhân nhĩm CMF thực sự cĩ đáp ứng tốt hơn so với bệnh nhân nhĩm L-Pam 3. Phương pháp tắt để tính z Ðiều trị CMF L-Pam Tổng số Ðáp ứng của Cĩ 49 a1 18 a0 67 khối u Khơng 44 b1 73 b0 117 Tổng số bệnh 93 91 184 nhân Ngồi cách tính z bằng tỉ số giữa hiệu số 2 tỉ lệ và sai số chuẩn của hiệu số 2 tỉ lệ, chúng ta cĩ thể tính z theo cơng thức sau (kí hiệu 4 tần suất của 4 ơ trong bảng 2 x 2 lần lượt là a, b, c, d): (a b a b ) 2 N (49 73 44 18) 2 184 Z 1 0 0 1 4,64 (a1 b1 )(a0 b0 )(a1 a0 )(b1 b0 ) 67 117 93 91 Ðây là phương pháp tắt để tính z và cĩ ưu điểm là cĩ thể tính nhanh hơn và ít nhầm lẫn hơn. Khuyết điểm của phương pháp này là khơng thể hiện được bản chất của phương pháp kiểm định z. Cả hai phương pháp đều cho kết quả đồng nhất nhau nếu khơng cĩ sai số do việc làm trịn số.
- 4. Biện luận giá trị của p Giá trị p lớn hơn 0,1 được xem là đủ lớn để xem rằng khơng cĩ đủ bằng chứng để bác bỏ giả thuyết Ho. Theo thơng lệ, người ta cho rằng p 0,05. Ngược lại nếu khoảng tin cậy khơng chứa giá trị 0 thì giá trị p sẽ <0,05
- Bài tập 1. Những nghiên cứu trước đây cho thấy rằng thuốc chẹn kênh calci tác dụng nhanh làm gia tăng bệnh tật và tử vong ở các bệnh nhân bị suy tim mãn tính. Một nghiên cứu được tiến hành để xem xét hiệu quả của Amlodipine trên những bệnh nhân bị suy tim mạn tính. Trong nghiên cứu này 1153 bệnh nhân bị suy tim mãn tính và phân số tống máu nhỏ hơn 30% được điều trị mù đơi hoặc là với amolodipine (571) hay placebo (582 bệnh nhân) cùng với điều trị sẵn cĩ. Các bệnh nhân được phân tầng tuỳ theo cĩ hay khơng bị thiếu máu cơ tim. Biến số kết quả chính (primary outcome) của nghiên cứu là tử vong do bất cứ nguyên nhân nào hay nhập viện do các biến cố tim mạch. a. Giả sử anh chị là người thiết kế nghiên cứu cho thử nghiệm lâm sàng này, anh chị cho rằng điều trị bằng amlodipine sẽ cĩ tác động tốt ở biến số nào (tử vong do bất kì nguyên nhân nào - nhập viện do biến cố tim mạch - hay xảy ra một trong 2 biến cĩ trên)? Anh chi cho rằng amlodipine sẽ cĩ kết quả tốt ở phân tầng nào (ở nhĩm thiếu máu cơ tim hay ở nhĩm khơng thiếu máu cơ tim? Sau một thời gian theo dõi (từ 6 đến 33 tháng với trung vị là 13,8 tháng), kết quả được ghi nhận như sau: Tất cả bệnh nhân Nhĩm thiếu máu cơ tim Nhĩm khơng thiếu máu Biến số kết Placebo amlodipine Placebo amlodipine Placebo amlodipine quả (n=582) (n=571) (n=370) (n=362) (n=212) (n=209) Chết 192 160 126 123 66 37 Phù phổi 15 35 13 21 2 14 Thiếu tưới 11 10 8 8 3 2 máu nặng 10 7 9 4 1 3 Nhồi máu cơ 18 10 12 8 6 2 tim Nhịp nhanh thất hay rung thất Tổng cộng 246 222 168 164 78 58 Sử dụng test ý nghĩa phù hợp để đánh giá: b. Cĩ phải điều trị bằng amlodipine giảm nguy cơ tử vong ở các bệnh nhân bị suy tim mãn hay khơng? b. Cĩ phải điều trị bằng amlodipine giảm nguy cơ nhập viện vì các biến cố tim mạch ở các bệnh nhân bị suy tim mãn hay khơng? b. Cĩ phải điều trị bằng amlodipine giảm nguy cơ xảy ra biến cố kết quả chính (tử vong hay nhập viện vì các biến cố tim mạch) ở các bệnh nhân bị suy tim mãn hay khơng? c. Cĩ phải điều trị bằng amlodipine giảm nguy cơ tử vong ở các bệnh nhân bị suy tim mãn và cĩ thiếu máu cơ tim hay khơng?
- d. Cĩ phải điều trị bằng amlodipine giảm nguy cơ tử vong ở các bệnh nhân bị suy tim mãn và khơng bị thiếu máu cơ tim hay khơng? e. Chúng ta cĩ thể kết luận gì về hiệu quả của amlodipine từ nghiên cứu này?



