Giáo trình Thống kê cơ bản - Chương 9: Nguyên lí kiểm định
Bạn đang xem tài liệu "Giáo trình Thống kê cơ bản - Chương 9: Nguyên lí kiểm định", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
giao_trinh_thong_ke_co_ban_chuong_9_nguyen_li_kiem_dinh.doc
Nội dung text: Giáo trình Thống kê cơ bản - Chương 9: Nguyên lí kiểm định
- NGUYÊN LÍ KIỂM ĐỊNH Mục tiêu: Sau khi nghiên chủ đề, học viên cĩ khả năng: - Trình bày được sự liên hệ giữa kiểm định ý nghĩa và khoảng tin cậy - Phân biệt được 2 loại sai lầm: sai lầm loại I và sai lầm loại II 1. Chọn lựa kiểm định phù hợp Như vậy nguyên lí của kiểm định ý nghĩa (hay kiểm định giả thuyết là như nhau). Các kiểm định chỉ khác nhau việc lựa chọn thống kê xuất phát từ giả thuyết H 0. Việc lựa chọn này phụ thuộc vào biến số của vấn đề quan tâm và thiết kế của nghiên cứu. Bảng 10. Chọn lựa kiểm định phù hợp Loại thiết kế nghiên cứu Hai nhĩm Ba (hay Trước và Nhiều điều Liên hệ điều trị gồm nhiêù) sau một trị trên cùng giữa hai các cá nhân nhĩm điều điều trị các đối biến số Thang đo của biến số khác nhau trị gồm các (hoặc 2 tượng cá nhân điều trị) ở khác nhau trên cùng các đối tượng Ðịnh lượng (mẫu rút từ t-test khơng Phân tích t-test bắt Phân tích Hồi quy một dân số cĩ phân phối bắt cặp phương sai cặp phương sai tuyến tính bình thường và phương đo lường và tương sai hai nhĩm đồng nhất lập lại quan pearson Ðịnh tính - Danh định 2 bảng 2 x 2 bảng 3 x test Cochrance Hệ số của n n McNemar Q bảng n x m (phi, OR, RR) Ðịnh tính -Thứ tự Kiểm định Kruskal- Kiểm định Friedman hệ số tương (hay biến định lượng tổng sắp Wallis sắp hạng cĩ quan khơng bình thường) hạng dấu Spearman Mann- Wilcoxon Whitney 2. Kiểm định ý nghĩa; Kiểm định giả thuyết Ý tưởng về kiểm định ý nghĩa (significance testing) được khởi xướng bởi R A Fisher. Giả sử chúng ta muốn đánh giá xem một loại thuốc mới cĩ cải thiện tỉ lệ sống cịn 1 năm sau khi bị nhồi máu cơ tim hay khơng. Chúng ta tiến hành một nghiên cứu các bệnh nhân đượcđiều trị với một loại thuốc mới và một nhĩm tương đương được điều trị với giả dược và phát hiện rằng tử vong trong nhĩm điều trị với thuốc mới chỉ bằng một nửa so với nhĩm điều trị bằng placebo. Đây là một kết quả hứa hẹn nhưng cĩ khi chỉ là một kết quả
- do cơ may? Chúng ta hãy xem xét câu hỏi này bằng cách tính giá trị p. Giá trị p chính là xác suất cĩ ít nhất sự khác biệt 2 lần về tỉ lệ tử vong nếu như thuốc thực sự khơng cĩ tác động gì lên tỉ lệ sống cịn. Fisher thấy rằng giá trị p là một chỉ số đo lường sức mạnh của chứng cớ chống lại giả thuyết Ho (trong thí dụ này, giả thuyết là thuốc khơng tác động gì lên tỉ lệ sống cịn). Ơng ta cổ vũ sử dụng P < 0.05 (5% ý nghĩa) làm mức tiêu chuẩn để kết luận rằng cĩ bằng cớ chống lại giả thuyết được kiểm đinh, mặc dù khơng cĩ một quy tắc tuyệt đối “Nếu p nằm giữa 0,1 và 0,9 chắc chắn khơng cĩ lí do gì để nghi ngờ giả thuyết được kiểm đinh. Nếu nĩ dưới 0,02 nĩ chỉ ra một cách mạnh mẽ rằng giả thuyết khơng thể giải thích được cho sự kiện thực tế. Chúng ta sẽ khơng thường xuyên bị lạc lối nếu chúng ta chọn một ngưỡng quy ước ở 0,05” Điều quan trọng, Fisher cho rằng việc lí giải giá trị p thuộc về nhà nghiên cứu. Thí dụ giá trị p khoảng 0,05 dẫn tới khơng thể tin hay bác bỏ giả thuyết khơng mà dẫn tới quyết định một thực nghiệm khác. Nếu A B {P( B ) thấp P(A) thấp } { Ho Tkê S } {P( Tkê S ) < ngư ỡng bác bỏ Ho} Khơng thích cách lí giải chủ quan của Fisher, Neyman và Pearson đề xuất cách tiếp cận được gọi là “kiểm định giả thuyết” (hypothesis tests) và thay thế cho quan điểm chủ quan về sức mạnh của giá trị p làm chứng cớ chống lại giả thuyết khơng bằng cách tiếp cận khách quan dựa vào cây quyết định. Neyman và Pearson cho rằng cĩ hai loại sai lầm cĩ thể
- phạm phải trong khi lí giải kết quả của thực nghiệm. Cách tiếp cận của Fisher tập trung vào sai lầm loại một: xác suất bác bỏ giả thuyết khơng nếu giả thuyết khơng thực ra là đúng. Neyman và Pearson cũng quan tâm đến sai lầm loại II: xác suất chấp nhận giả thuyết khơng (và khơng chịu dùng điều trị mới) trong khi giả thuyết thực sự là sai. Bằng cách sắp đặt các nguy cơ sai lầm loại I và loại II, số các sai lầm mắc phải trong khi lí giải kết quả sẽ được hạn chế. Điều này khơng phải là xa lạ với ai đã từng tính cỡ mẫu cho các nghiên cứu cĩ kiểm định giả thuyết. Để sử dụng cách tiếp cận Neyman-Pearson chúng ta phải chỉ rõ đối thuyết (alternative hypothesis). Nĩi cách khác đối thuyết khơng thể chỉ được phát biểu đơn giản: “thuốc mới làm giảm nguy cơ tử vong” mà phải chỉ rõ nguy cơ tử vong giảm bao nhiêu: “thuốc mới làm giảm nguy cơ tử vong 60%” Nhà nghiên cứu cĩ quyền tự do chọn quy tắc quyết định bằng cách phát biểu cụ thể đối thuyết, nguy cơ sai lầm loại I, và nguy cơ sai lầm loại II, nhưng điều này phải được thực hiện trước khi nghiên cứu. Do đĩ trong cách tiếp cận của Neyman-Pearson chúng ta xây dựng một nguyên tắc ra quyết định để giúp lí giải kết quả nghiên cứu từ trước khi tiến hành nghiên cứu và việc phân tích chỉ đơn giản là bác bỏ hay chấp nhận giả thuyết khơng và, ngược lại với cách tiếp cận chủ quan của Fisher, khơng cố gắng lí giải giá trị p trong từng một nghiên cứu cụ thể. Phát biển H0 ; Ha Tính số thống kê (z; t; chi2; F) Thực hiện nghiên Xác suất sai Xác suất sai Không nhỏ Không nhỏ cứu với cỡ mẫu lầm loại 1 lầm loại 2 tra bảng tính p lớn hơn Nhỏ Nhỏ Chấp nhận giả Bác bỏ giả thuyết thuyết Điều đáng tiếc các nhà nghiên cứu lại khơng tìm hiểu rõ ràng ý tưởng và sử dụng phần thơ sơ nhất của cách tiếp cận này cho rằng giả thuyết khơng sẽ được bác bỏ nếu p< 0,05 (với nguy cơ sai lầm loại 1 là 5%). Điều này dẫn đến cảm nhận sai lầm là cách tiếp cận của Neyman-Pearson tương tự như cách tiếp cận của Fisher. 3. Sai lầm loại một và sai lầm loại hai Sai lầm loại một: bác bỏ giả thuyết Ho trong khi giả thuyết Ho là đúng. Sai lầm loại hai: Khơng bác bỏ giả thuyết Ho trong khi giả thuyết Ho sai. Trong nghiên cứu thống kê người ta khơng bao giờ cĩ thể chắc chắn. Do vậy, khi nhà nghiên cứu đi đến kết luận bác bỏ giả thuyết Ho, người nghiên cứu cĩ thể bị sai lầm (sai lầm loại một - với một xác suất nào đĩ). Khi nhà nghiên cứu khơng bác bỏ giả thuyết H 0,
- nhà nghiên cứu cũng cĩ thể bị sai lầm (sai lầm loại hai - cũng với một xác suất nào đĩ). Một điều nên nhớ là bằng kiểm định thống kê người ta cĩ thể xác định được xác suất sai lầm loại một nhưng khơng thể tính được xác suất sai lầm loại hai. Ðơi khi người ta cịn sử dụng khái niệm năng lực (power) của kiểm định thống kê. Năng lực của kiểm định thống kê = 1 - xác suất sai lầm loại 2. Khái niệm năng lực của thống kê hay được dùng trong tính cỡ mẫu. Hình 5. Biểu đồ minh hoạ mối liên quan giữa sai lầm loại 1, sai lầm loai 2, cỡ mẫu và khoảng cách giữa Ho - Ha. Đường phân phối màu đậm bên trái thể hiện giả thuyết Ho, đường màu nhạt bên phải thể hiện giả thuyết Ha. Vùng diện tích màu đậm là xác suất sai lầm loại 1 và vùng diện tích màu nhạt thể hiện xác suất sai lầm loại 2. Chúng ta cĩ thể nhận xét với cùng cỡ mẫu, nguy cơ sai lầm loại 2 càng tăng nếu Ha càng gần Ho. Cần phải tăng cỡ mẫu để phân biệt được Ha và Ho (giảm nguy cơ sai lầm loại 2) khi Ha gần Ho 4. So sánh các tiếp cận cổ điển (chủ nghĩa tần suất) và Bayes trong suy luận thống kê Giả sử chúng ta muốn đánh giá một loại thuốc mới cĩ cải thiện tỉ lệ sống cịn một năm sau khi bị nhồi máu cơ tim bằng một thử nghiệm lâm sàng cĩ nhĩm chứng placebo. Chúng ta sẽ thực hiện điều này bằng cách ước lượng tỉ số nguy cơ – nguy cơ tử vong trong bệnh nhân được điều trị với thuốc mới chia cho nguy cơ tử vong ở nhĩm đối chứng. Nếu tỉ số nguy cơ là 0,5, thuốc mới giảm nguy cơ tử vong 50%, nếu tỉ số nguy cơ là 1 thì thuốc mới khơng cĩ tác dụng. Thống kê tần suất chủ nghĩa
- - Cho rằng chân lí đã cĩ sẵn. Chúng ta sử dụng số liệu để suy luận từ giá trị của tỉ số nguy cơ ở dân số cĩ thực (nhưng chưa biết) - Khoảng tin cậy 95% cho chúng ta khoảng giá trị hợp lí của tỉ số nguy cơ dân số; Chúng ta thực hiện nghiên cứu 100 lần thì 95% những khoảng tin cậy tính được sẽ chứa giá trị của dân số - Giá trị p là xác suất cĩ được tỉ số nguy cơ tương tự hay nhỏ hơn tỉ số nguy cơ chúng ta đã phát hiện nếu giả thuyết Ho là đúng. Thống kê Bayes - Người theo chủ nghĩa Bayes cĩ cách tiếp cận chủ quan. Chúng ta bắt đầu với quan điểm chúng ta về tỉ số nguy cơ và thể hiện nĩ theo phân phối xác suất Chúng ta sẽ dùng số liệu để điều chỉnh ý kiến đĩ (chúng tá sẽ rút ra phân phối xác suất của tỉ số nguy cơ dựa trên số liệu và phân phối cĩ sẵn) - Khoảng tin tưởng 95% (95% credible interval) là khoảng cĩ 95% cơ may cĩ chứa tỉ số nguy cơ dân số. - Phân phối hậu nghiệm cĩ thể được dùng để rút ra các khẳng định xác suất về tỉ số nguy cơ – thí dụ, xác suất thuốc làm tăng nguy cơ tử vong - Cĩ sự tương tự giữa thống kê Bayes và việc sử dụng test trong chẩn đốn bệnh, trong đĩ power của kiểm định tương tự như độ nhạy, giá trị p tương tự như (1- độ chuyên) và tương tự như tỉ số độ khả dĩ dương. Khi đĩ nếu kết quả là bác bỏ Ho, số chênh hậu nghiệm của mệnh đề bằng số chênh tiền nghiệm x Nếu chúng ta khơng cĩ ý kiến tiền nghiệm (chúng ta xem các khoảng giá trị đều cĩ khả năng ngang nhau) thì kết quả của các tiếp cận cổ điển tương tự như cách tiếp cận của Bayes. - Khoảng tin cậy 95% tương tự như khoảng tin tưởng 95% (95% credible interval) - Giá trị p (một bên) tương tự như xác suất hậu nghiệm của mệnh đề thuốc làm tăng nguy cơ tử vong (giả sử rằng chúng ta cĩ được kết quả là thuốc cĩ tác dụng bảo vệ) Dù vậy hai cách tiếp cận này sẽ cho kết quả khác nhau ý kiến tiền nghiệm của chúng ta về mệnh đề khơng phải là mơ hồ



