Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 7: Các kiểm nghiệm giả thiết về các phần - Nguyễn Duy Long

pdf 22 trang ngocly 3150
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 7: Các kiểm nghiệm giả thiết về các phần - Nguyễn Duy Long", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_hoc_ung_dung_trong_quan_ly_xay_dung_chuon.pdf

Nội dung text: Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 7: Các kiểm nghiệm giả thiết về các phần - Nguyễn Duy Long

  1. 9/8/2010 Phần07 Nguyễn Duy Long, TiếnSỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1  Các kiểmnghiệmgiả thiếtvề các phần  Phần thêm về kiểm nghiệm ©2010, Nguyễn Duy Long, Tiến Sỹ 2 1
  2. 9/8/2010 Testing Hypotheses about Proportions ©2010, Nguyễn Duy Long, Tiến Sỹ 3  Trong thống kê học, mộtgiả thiết đề nghị mộtmô hình cho thế giới.  Rồi xem về dữ liệu 1. Nếudữ liệunhấtquánvới mô hình, ta không có lý do để không tin giả thiết. ◦ Dữ liệunhấtquánvớimôhìnhthêmphầnhỗitrợ (lend support) giả thiết, nhưng không chứng minh (prove) nó. Hay 2. Nếudữ liệu không nhấtquánvới mô hình, ta cần chọnxemdữ liệucó không nhấtquán đủ để khôngtin vàomôhình. ◦ Nếu chúng không đủ nhấtquán, cóthể từ chối(reject) mô hình. ©2010, Nguyễn Duy Long, Tiến Sỹ 4 2
  3. 9/8/2010  Nghĩ về logic trong xét xử: ◦ Để chứng minh ai đócótội, ta bắt đầubằng giả định họ vô tội. ◦ Ta giữ lạigiả thiết đó đếnkhicácchứng cứ làm nó không thể vượtngoàimộtnghingờ hợplý. ◦ Khi và chỉ khi đó, ta từ chốigiả thiếtvôtộivàtuyênbố người đócótội.  Logic dùng trong các xét xử được dùng giống trong các kiểmnghiệmgiả thiếttrongthống kê học: ◦ Bắt đầu bằng giả định giả thiết là đúng. ◦ Xem dữ liệucónhấtquánvớigiả thiết. ◦ Nếunhư vậy, tấtcả những gì ta có thể làm là giữ lạigiả thiếtmàtađãbắt đầu. Nếu không như vậy, thì như hội thẩm đoàn, ta tự hỏi chúng không thể nằmngoàimộtnghi ngờ hợp lý không. ©2010, Nguyễn Duy Long, Tiến Sỹ 5  Công ty xây dựng sảnxuất ống bê tông ly tâm và muốnngănchặnvếtnứt. ◦ Qui trình sản xuất hiện thời cho thấy chỉ 80% ống bê tông là không có vếtnứt. ◦ Kỹ thuậtmới đượckiểmnghiệmvới 400 ống bê tông đúc thử có 17% bị nứt. ◦ Công ty tranh luậnvề việcchuyểnqui trìnhmớinày, nhưng sẽ mấtthờigianvàtiềnbạc.  Công ty này muốnbiếthọ có thể kếtluậnmột cách hợp lý rằng qui trình mới cải thiện vấn đề nứt. ©2010, Nguyễn Duy Long, Tiến Sỹ 6 3
  4. 9/8/2010  Đặctínhthống kê là ta có thể định lượng mức độ nghi ngờ của chúng ta. ◦ Có thể dùng mô hình được đề nghị bởigiả thiết để tính xác suấtmàbiếncố ta chứng kiếncóthể xảyra.  Xác suất đó đượcgọilàgiátrị p (p-value). ◦ Giá trị p càng nhỏ, biếncố càng ít xảyra, chogiả thiết đúng. ©2010, Nguyễn Duy Long, Tiến Sỹ 7  Giả thiếtrỗng (null hypothesis), viếttắtH0, mô tả thông số mô hình quầnthể đang quan tâm và đề nghị một giá trị cho thông số đó. ◦ Ví dụ, H0: p = 0.20, như trong ví dụ sự nứtcủa ống bê tông  Ta muốnso sánhdữ liệucủa chúng ta vớigiátrị mà ta kỳ vọng vớiH0 là đúng. ◦ Có thể làm điềunàybằng cách tìm ra bao nhiêu độ lệch chuẩntừ giá trị đề nghị.  Sẽ hỏicơ hộicókếtquả đónếugiả thiếtrỗng là đúng. ©2010, Nguyễn Duy Long, Tiến Sỹ 8 4
  5. 9/8/2010  Kiểmnghiệmgiả thiếtgiống vớixétxửởtòa án.  Giả thiếtrỗng là bị can vô tội.  Rồitrìnhbàychứng cứ -dữ liệu đượcthuthập.  Rồi đánh giá chứng cứ: “Các dữ liệunàykhả dĩ xảy ra một cách hợplývàtìnhcờ nếugiả thiếtrỗng đúng?”  Cuối cùng, ta phảiquyết định “không khả dĩ ra sao về vấn đề không khả dĩ (How unlikely is “unlikely”?) ◦ Một số người đặt những tiêu chuẩn cứng – 1 của 20 (0.05) hay 1 của 100 (0.01). ◦ Nhưng nếubạnphảiraquyết định, bạnphảiphánxéttrong tình huống cụ thể là xác suất đủ nhỏ để có “nghi ngờ hợp lý” (“reasonable doubt”) ©2010, Nguyễn Duy Long, Tiến Sỹ 9  Khi dữ liệunhấtquánvớimôhìnhtừ giả thiếtrỗng, giá trị p cao và ta không thể bác bỏ giả thiếtrỗng. ◦ Ta phải giữ giả thiết rỗng. ◦ Nếu ta không thể chứng minh nó; ta không chấpnhậngiả thiếtrỗng ◦ thay vào đó, ta “thấtbạitrongviệcbácbỏ giả thiếtrỗng” (“fail to reject the null hypothesis”) khi dữ liệunhấtquán vớimôhìnhgiả thiếtrỗng và phù hợpvớinhững gì ta có thể kỳ vọng từ sự biến đổitronglấymẫu(natural sampling variability).  Nếugiá trị p là đủ nhỏ, ta sẽ “bác bỏ giả thiếtrỗng” (“reject the null hypothesis”) vì những gì ta quan sát thấylàrất không thể mô hình rỗng đúng. ©2010, Nguyễn Duy Long, Tiến Sỹ 10 5
  6. 9/8/2010  Nếuchứng cứ là không đủ mạnh để bác bỏ giả định vô tội, bồithẩm đoàn sẽ tuyên “vô tội” (“not guilty”)  Trong thống kê học, ta thấtbạitrongviệcbácbỏ giả thiếtrỗng. ◦ Không bao giờ tuyên bố giả thiếtrỗng là đúng. ◦ Thỉnh thoảng ta nói giả thiếtrỗng vẫn đượcgiữ.  Trong xét xử, trách nhiệmchứng minh thuộcvề bên khởitố.  Trong kiểm nghiệm giả thiết, trách nhiệm chứng minh thuộcvề các xác nhận không thường. ◦ Giả thiếtrỗng là bình thường, giả thiếtthaythế (alternative hypothesis) là không bình thường. ©2010, Nguyễn Duy Long, Tiến Sỹ 11  Bốnphầncơ bảncủamộtkiểmnghiệmgiả thiết: 1. Các giả thiết(Hypotheses) 2. Mô hình (Model) 3. Sự tính toán (Mechanics) 4. Kếtluận(Conclusion)  Xem chi tiếttiếpsauđây ©2010, Nguyễn Duy Long, Tiến Sỹ 12 6
  7. 9/8/2010 1. Các giả thiết ◦ Giả thiếtrỗng: để thựchiệnmộtkiểmnghiệm giả thiết, trước tiênphải chuyểncâu hỏi ta quan tâm thành mộtphátbiểuvề các tham số của mô hình.  Tổng quát, ta có H0: tham số (parameter) = giá trị đượcgiả thiết (hypothesized value). ◦ Giả thiếtthay thế: giả thiếtthay thế, HA, chứa các giá trị củathamsố mà ta chấpnhậnnếuta bác bỏ giả thiếtrỗng. ©2010, Nguyễn Duy Long, Tiến Sỹ 13 2. Mô hình  Để bắt đầumộtkiểmnghiệm giả thiết, chỉ ra mô hình mà bạnsẽ dùng để kiểmnghiệmgiả thiết rỗng và thông số quan tâm.  Tấtcả các mô hình đềucần các giả định, phát biểu các giả định và kiểm tra các điềukiệntương ứng.  Bạncóthể kết thúc vớimộtphátbiểunhư sau: ◦ “Vì các điềukiện đãthỏa, tôi có thể mô hình phân phối mẫucủaphầnvớimộtmôhìnhchuẩn.” ◦ Có thể có trường hợpbạnsẽ nói “Vì các điềukiện không thỏa, tôi không thể tiếptụcvớisự kiểmnghiệm.” ©2010, Nguyễn Duy Long, Tiến Sỹ 14 7
  8. 9/8/2010  Các điềukiệncầnthiếtchokiểmnghiệmz mộtphần (one-proportion z-test) giống vớikhoảng z mộtphần (one proportion z-interval). Ta kiểmnghiệmgiả thiết H0: p = p0 pˆ p0 tính trị số thống kê kiểmnghiệm, z: z SD pˆ p00q Điểmquantrọng nhưng dễ sai: để với SD pˆ n tính SD dùng giá trị po  Khi các điềukiệnthỏavàgiả thiếtrỗng là đúng, trị số thông kê nghiểmnghiệm này theo mô hình chuẩntắc, vì thế ta có thể dùng mô hình này để có giá trị p. Bảng z, có z để tìm giá trị p ©2010, Nguyễn Duy Long, Tiến Sỹ 15 3. Tính toán  Tính trị số thông kê kiểmnghiệmtừ dữ liệu.  Các kiểmnghiệm khác nhau có các công thức khác nhau và trị số thống kê kiểmnghiệmkhác nhau.  Sau tính toán, ta có giá trị p. ◦ Giá trị p là xác suấtmàgiátrị thống kê đượcquansátcó thể xảyranếumôhìnhrỗng đúng. Nói cách khác, giá trị p là xác suấtcóđiềukiện: xác suấtmàcáckếtquả quan sát có thể xảyranếugiả thiết rỗng là đúng. ◦ Nếup đủ nhỏ, ta bác bỏ giả thiếtrỗng. ©2010, Nguyễn Duy Long, Tiến Sỹ 16 8
  9. 9/8/2010 4. Kếtluận ◦ Kếtluậnvề mộtkiểmnghiệmgiả thiếtluônlà mộtphátbiểuvề giả thiếtrỗng. ◦ Kếtluậnphải luôn phát biểuhoặcbácbỏ hoặc giữ (thấtbạitrongviệcbácbỏ giả thiếtrỗng). ◦ Kếtluận nên phát biểu trong ngữ cảnh củanó. ©2010, Nguyễn Duy Long, Tiến Sỹ 17 1. Tùy thuộcvàotakiểmnghiệmgìvàquantâmtìm kiếmgì, cóbagiả thiếtthaythế khả dĩ: 1. HA: thông số giá trị đượcgiả thiết ©2010, Nguyễn Duy Long, Tiến Sỹ 18 9
  10. 9/8/2010  HA: thông số ≠ giá trị đượcgọilàthaythế 2 phương (two-sided alternative) vì ta quan tâm sự chệch cả hai bên củagiátrị giả thiếtrỗng.  Cho thay thế hai phương, giá trị p là xác suấtlệch theo hai hướng từ giá trị giả thiếtrỗng. ©2010, Nguyễn Duy Long, Tiến Sỹ 19  Hai giả thiếtthaythế khác đượcgọilàthaythế một phương (one-sided alternatives).  Thay thế một phương tập trung các độ lệch từ giá trị giả thiếtrỗng chỉ theo mộthướng.  Giá trị p cho thay thế mộtphương là xác suấtlệch chỉ mộthướng củasự thay thế từ giá trị giả thiết rỗng. ©2010, Nguyễn Duy Long, Tiến Sỹ 20 10
  11. 9/8/2010  Đâu là giả thiếtrỗng và giả thiếtthaythế dùng trong các tình huống sau? 1. Sảnxuất ống bê tông lytâmtrongví dụ trên 2. Bạnmuốnbiếtnếu dùng mộtloạithảodược trong hai tháng có thể giảmcân. 3. Bạnlàmộtchủ tiệmspa, bạnmuốnbiếtnếuquảng cáo trên báo củabạnhiệuquả (đolường bằng số khách hàng hằng tuần) 4. Ban nghĩ rằng tiêu thụ nhiên liệucủaxecẩucủabạncó thể khác vớitiêuthụ đưaracủanhàsảnxuất. ©2010, Nguyễn Duy Long, Tiến Sỹ 21  Giá trị p nhỏ ra sao để bạncóthể bác bỏ giả thiết rỗng?  Tiêu chí quyết định phụ thuộctìnhhuống.  Yếutố nữa để chọngiátrị p là tầmquantrọng của vấn đề cầnkiểmnghiệm.  Đừng chỉ tuyên bố giả thiếtrỗng là bị bác hay không bị bác. ◦ Báo cáo giá trị p để thể hiện“sứcmạnh” củachứng cứ đối vớigiả thiết. ©2010, Nguyễn Duy Long, Tiến Sỹ 22 11
  12. 9/8/2010  Trở lạivídụ: Vớiqui trìnhhiệntại có 80% ống bê tông không bị nứt. Kỹ thuậtmới đượcthử nghiệm sản xuất 400 ống có kết quả 17% bị nứt.  Công ty bê tông muốnbiếtkỹ thuậtmớigiảmtỷ lệ nứt không. 1. Phát biểugiả thiết. (Ho) 2. Chỉ ra mô hình và kiểmtracácđiềukiệncầnthiết để sử dụng nó. 3. Nếucóthể tiếptụctừ bước 2, tính trị số thông kê kiểm nghiệm và giá trị p 4. Kếtluận ©2010, Nguyễn Duy Long, Tiến Sỹ 23  Giá trị p là 0.0668. Chỉ 6.7% khả năng kếtquả từ qui trình thử nghiệmlàdo sự biến đổitự nhiên (natural variation) . Ta có thể bác bỏ giả thiết rỗng?  Trong thựctế, ta chỉ ra giá trị “trần” (cut-off) cho giá trị p trước khi phân tích. ◦ Nếutachọn5%, tasẽ giữ lạigiả thiếtrỗng. ©2010, Nguyễn Duy Long, Tiến Sỹ 24 12
  13. 9/8/2010  Tạimột vùng xa chỉ khoảng 30% giếng được đào là tìm đủ nước ở độ sâu 30 mét hay nhỏ hơn. Một người đàn ông địa phương cho rằng có thể tìm nướcbằng cách “dò mạch nước” – dùng gậy để chỉ giếng nên đào ở đâu. Bạnkiểm tra 80 khách hàng của anh ta và thấyrằng 27 khách hàng có giếng 30 mét hay nhỏ hơn. Bạnkếtluậngìvề “thủ pháp” của anh ta? Biếtrằng giá trị p khoảng 5% để có chứng cứ xác đáng. ©2010, Nguyễn Duy Long, Tiến Sỹ 25 More about tests ©2010, Nguyễn Duy Long, Tiến Sỹ 26 13
  14. 9/8/2010  Khi giá trị p nhỏ, cho ta biếtdữ liệulàhiếmvớigiả thiếtrỗng đãcho.  Hiếm như thế nào là “hiếm”?Ta? Ta có thể xác định sự kiệnhiếmmột cách tùy tiệnbằng cách đặtmột ngưỡng cho giá trị p củata. ◦ Nếup dưới điểm đó, ta bác bỏ H0. Ta gọikếtquả là đáng kể về mặt thông kê (statistically significant) hay ta có thể nói là kiểmnghiệmlàđáng kểởmức đó(“significant at that level”). ◦ Ngưỡng này là mứcalpha, còngọilàmức đáng kể (significance level), viếttắt . ◦ Các mức alpha là 0.10, 0.05, và 0.01.  Bạnnóigìnếugiátrị p là không thấphơn ? ◦ Bạn không chấpnhậngiả thiếtrỗng. Bạnchỉ giữ lại hay thất bạitrongbácbỏ nó. ©2010, Nguyễn Duy Long, Tiến Sỹ 27  Ý bạn là gì khi nói kiểmnghiệmlàđáng kể về thống kê (statistically significant)? ◦ Ý ta là trị số thống kê kiểm nghiệm, z, có giá trị p tương ứng thấphơnmứcalpha màbạnchọn.  Đừng nghĩ rằng đáng kể về thống kê thì tự động có tầmquantrọng hay ảnh hưởng thựctiễn. ◦ Ta có mộtsự thay đổinhỏ (nhỏ hơn1%) đáng kể về thống kê, nếukíchthướcmẫu đủ lớn.  Mặt khác, nếumẫu không đủ lớn, thậmchícósự khác nhau lớn về tài chính hay khoa học cũng có thể không đáng kể về thống kê. ©2010, Nguyễn Duy Long, Tiến Sỹ 28 14
  15. 9/8/2010  Ở phần 06, khi tạomứctin chắc, ta lấygiátrị tới hạn(critical value, z*) tương ứng vớimứctin chắc đã chọn.  Ta cũng dùng các giá trị tớihạntrongkiểmnghiệm giả thiết. ◦ z* phụ thuộcvào và kiểmnghiệm1 hay 2 phương.  Một khi tính trị thống kê kiểmnghiệm, z, thay vì dùng bảng Z để tìm giá trị p, chỉ kiểmtranótrực tiếpvới các giá trị tớihạn. Ví dụ, vớikiểmnghiệm mộtphương, đuôi trên (upper tail): ◦ z > z*, thì bác bỏ H0. ◦ z< z*, thấtbạitrongviệcbácbỏ H0. ◦ Vẫnhữuíchkhitìmgiátrị p, để định lượng kết quả không khả dĩ ra sao, nếugiả thiếtrỗng đúng. ©2010, Nguyễn Duy Long, Tiến Sỹ 29  Mộtsố giá trị tớihạnthường gặptừ mô hình chuẩn ◦ Với đuôi dưới (lower tail), z* âm 1-phương 2-phương 0.05 1.645 1.96 0.01 2.28 2.575 0.001 3.09 3.29 ©2010, Nguyễn Duy Long, Tiến Sỹ 30 15
  16. 9/8/2010  Khi giả thiếtthaythế là  Khi giả thiếtthaythế là mộtphương, giá trị tới hai phương, giá trị giới hạn đặttấtcả chỉ hạnchia đôi cho hihai mộtbên: đuôi: Giá trị tớihạn Giá trị tớihạn Giá trị tớihạn ©2010, Nguyễn Duy Long, Tiến Sỹ Slide 21- 31  Ví dụ này chỉ sự tương ứng giữatrị số thống kê kiểmnghiệm(z), giá trị tớihạn z* , giá trị p và mức alpha, .  Ta đãngheĐHBK có 60% nam sinh viên nhưng muốnkiểmtraxemphầntrămnàyđãthayđổi. Ta chấpnhậnmức đáng kể = 4% như vượtngoài nghi ngờ hợplý.  Ta thựchiệnlấymẫungẫu nhiên 250 sinh viên ĐHBK và thấyrằng 140 là nam. Giả định rằng các điều kiện thỏa. 1. Các giả thiếtlàgì? 2. Giá trị tớihạnz*, vớimứcalpha đãcho? 3. Tính z, trị số thống kê kiểmnghiệm 4. Ta giữ hay bác bỏ H0? 5. Giá trị p? ©2010, Nguyễn Duy Long, Tiến Sỹ 32 16
  17. 9/8/2010  Tóm tắttínhtoán: ◦ Ta cầnkiểmnghiệm2 phương với = 4% z= -1.29, Giá trị = 9.9% =2% =2% Giá trị tớihạn Giá trị tớihạn z*=- 2.05 z*= 2.05  Vì z > z* hay -1.29 > -2.05, ta giữ H0 hay mộtcáchtương đương,  Giá trị p = .0985 > .02 = α/2, ta giữ H0 ©2010, Nguyễn Duy Long, Tiến Sỹ 33  Khoảng tin chắcvàkiểmnghiệmgiả thiết đượcxây dựng với các phép tính giống nhau. ◦ Giống các giả định và điều kiện. ◦ Cả hai dùng giá trị tớihạn, z*.  Có thể xấpxỉ mộtkiểmnghiệmgiả thiếtbằng cách xem xét khoảng tin chắc. (sự xấpxỉ sẽ tốthơnkhi p p0 vàˆ tiếngần nhau) ◦ Chỉ hỏigiátrị giả thiếtrỗng có nhấtquánvớikhoảng tin chắcchothôngsố vớimứctin chắctương ứng. ©2010, Nguyễn Duy Long, Tiến Sỹ 34 17
  18. 9/8/2010  Vì khoảng tin chắclàhaiphương, chúng tương ứng vớikiểmnghiệmhaiphương. ◦ Tổng quát, khoảng tin chắc với mức tin chắc C% tương ứng vớikiểmnghiệmhaiphương vớimức là 100 – C%.  Mốiliệnhệ giữakhoảng tin chắcvàkiểmnghiệm giả thiếtmộtphương phứctạphơn. ◦ Khoảng tin chắcvớimứctin chắcC% tương ứng vớikiểm nghiệmgiả thiếtmộtphương vớimức là ½(100 – C)%. ©2010, Nguyễn Duy Long, Tiến Sỹ 35  Thậmchívới nhiềuchứng cứ, ta vẫncóthể có kết luậnsai.  Khi thựchiệnkiểmnghiệmgiả thiết, ta có thể sai theo hai cách: 1.Giả thiếtrỗng đúng, nhưng ta sai lầmbácbỏ nó – sai sót loại1 (Type I error). 2.Giả thiếtrỗng sai, nhưng ta thấtbạitrongbácbỏ nó – sai sót loại II (Type II error).  Bốntìnhhuống trong kiểmnghiệmgiả thiết ©2010, Nguyễn Duy Long, Tiến Sỹ 36 18
  19. 9/8/2010  Bốntìnhhuống trong kiểmnghiệmgiả thiết: Sự Thật H0 Đúng H0 Sai Quyết Bác H0 Sai Sót LoạiI OK Định của (α) Tôi Giữ H0 OK Sai Sót Loại II (β)  Trở lạivớisự tương đồng trong xét xử, nếuthấtbạitrong luậntộingườithậtsự có tộilàsaisótloạiI, sự tương đồng củasaisótloại II là gì? ©2010, Nguyễn Duy Long, Tiến Sỹ 37  Sai sót loạiI xảyrathường xuyên ra sao? ◦ Vì sai sót loạiI làbácgiả thiếtrỗng thật, xác suấttạosai sót loại I là mức . ◦ Với là 5%, ta có 5% cơ hộitạosaisótloạiI ©2010, Nguyễn Duy Long, Tiến Sỹ 38 19
  20. 9/8/2010  Khi H0 sai nhưng ta thấtbạitrongbácbỏ nó, ta tạo ra sai sót loại II. ◦ Khả năng củakiểmnghiệmnhậnragiả thiếtsaigọilàsức mạnh (power) của kiểm nghiệm – xác suất bác bỏ đúng giả thiếtrỗng sai. ◦ Gán  cho xác suấtcủasaisótnày. Sứcmạnh củakiểm nghiệmlà1–. ◦ Đánh giá  khó hơnvìtakhôngbiếtgiátrị củathôngsố. ◦ Không có giá trị duy nhấtcho. Thựctế, có mộttậpcác, mỗigiátrị cho mỗigiátrị thông số sai. ©2010, Nguyễn Duy Long, Tiến Sỹ 39  Một cách để tập trung sự chú ý củatavàomột  cụ thể là nghĩ về kích thước ảnh hưởng (effect size).  Ta có thể giảm  cho tấtcả các giá trị thông số thay thế bằng cách tăng . ◦ Có thể giảm  nhưng tăng cơ hộicủasaisótloạiI. ◦ “Sứccăng” giữ sai sót loại I và II là tấtyếu.  Các duy nhất để giảmcả hai loạisaisótlàthuthập nhiềudữ liệuhơn. ©2010, Nguyễn Duy Long, Tiến Sỹ 40 20
  21. 9/8/2010  Kích thước ảnh hưởng càng lớn, càng dễ thấynó.  Có kích thướcmẫulớnhơngiảmxácsuấtcủasaisótloại II, và tăng sứcmạnh củakiểmnghiệm.  Càng chấp nhận sai sót loại I, càng ít cơ hội có sai sót loại II. Giả sử giả thiết rỗng đúng Giả sử giả thiết rỗng không đúng ấ ạ Th tb i Bác H0 trong bác H0 ©2010, Nguyễn Duy Long, Tiến Sỹ 41  Ta có thể giảmcả hai loạisaisótbằng cách tạohaiđường cong hẹphơn. Bằng cách nào? Giả sử giả thiết rỗng đúng Giả sử giả thiết rỗng không đúng Thấtbại Bác H0 trong bác H0 ©2010, Nguyễn Duy Long, Tiến Sỹ 42 21
  22. 9/8/2010  Đừng diểngiảigiátrị p như là xác suấtmàH0 là thật. ◦ Giá trị p là về dữ liệu, không phảigiả thiết. ◦ Là xác suất của dữ liệu với H0 là thật, không phải ngược lại.  Đừng tin quá mạnh vào các mứcalpha tùytiện. ◦ Cho biếtgiátrị p để người đọccóthể có quyết đinh cho họ.  Đừng nhầmlẫngiữasự đáng kể về mặtthựctiễnvà về mặtthống kê. ◦ Chỉ vì giả thiếtlàđáng kể về mặtthống kê không có nghĩalà đáng kể trong thựctiễn.  Đừng quên rằng dù tất cả nỗ lực của bạn, bạn có thể có kếtluậnsai. ©2010, Nguyễn Duy Long, Tiến Sỹ 43 ©2010, Nguyễn Duy Long, Tiến Sỹ 44 22