Giáo trình Thống kê cơ bản - Chương 11: So sánh hai trung bình - Kiểm định T không bắt cặp

doc 9 trang ngocly 30
Bạn đang xem tài liệu "Giáo trình Thống kê cơ bản - Chương 11: So sánh hai trung bình - Kiểm định T không bắt cặp", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • docgiao_trinh_thong_ke_co_ban_so_sanh_hai_trung_binh_kiem_dinh.doc

Nội dung text: Giáo trình Thống kê cơ bản - Chương 11: So sánh hai trung bình - Kiểm định T không bắt cặp

  1. SO SÁNH HAI TRUNG BÌNH - KIỂM ÐỊNH T KHƠNG BẮT CẶP Mục tiêu Sau khi nghiên cứu chủ đề, học viên cĩ khả năng 1. Tính khoảng tin cậy của hiệu số hai trung bình 2. Kiểm định giả thuyết hai trung bình là bằng nhau theo phép kiểm t và phép kiểm z 3. Trình bày được các giả định của 2 phép kiểm t và phép kiểm z. 1. Giới thiệu Trong phần trước chúng ta đã nghiên cứu phương pháp suy luận thống kê về trung bình của một biến số định lượng trong một dân số, dựa trên số liệu từ một mẫu ngẫu nhiên hoặc trung bình của hiệu số trước sau của một biến số của cùng dân số. Trên thực tế, chúng ta thường phải thực hiện việc so sánh trung bình của hai dân số sử dụng mẫu khơng bắt cặp. Ðĩ là hai mẫu chúng ta chọn từ hai dân số khác nhau và khơng cĩ sự liên hệ gì giữa các quan sát, chẳng hạn quan sát thứ nhất của mẫu một khơng cĩ liên hệ gì với quan sát thứ nhất của mẫu hai. Trong phần này chúng ta sẽ nghiên cứu hai phương pháp 1. Tính khoảng tin cậy của hiệu số hai trung bình và 2. Kiểm định giả thuyết hai trung bình là bằng nhau ứng dụng cho hai mẫu khơng bắt cặp. 2. Kí hiệu Chúng ta kí hiệu trung bình và độ lệch chuẩn của biến số x trong dân số thứ nhất là 1 và 1 và trong dân số thứ hai là  2 và 2. Hiển nhiên là với hai dân số xác định, các trung bình 1, 2 và các độ lệch chuẩn dân số 1 và 2 là khơng đổi. Nếu chúng ta nghiên cứu n1 đối tượng được chọn ngẫu nhiên trong dân số 1 và n2 đối tượng được chọn ngẫu nhiên trong dân số 2, chúng ta sẽ tính được trung bình x 1 và độ lệch chuẩn s1 của mẫu 1 và trung bình x2 và độ lệch chuẩn s2 của mẫu 2. Dân số 1 Mẫu 1 Dân số 2 Mẫu 2 Trung bình 1 x1 2 x2 Ðộ lệch chuẩn 1 s1 2 s2 3. Thí dụ Ðể đánh giá sự liên hệ giữa tình trạng dinh dưỡng ở tuổi thiếu nhi và khả năng hoạt động thể lực ở tuổi trưởng thành, một nghiên cứu được tiến hành ở 2 làng_. Ở một làng, tất cả các bà mẹ mang thai hay cho con bú và tất cả trẻ em dưới 7 tuổi được bổ sung thực phẩm giàu năng lượng và giàu protein (Atole: 163 KCal + 6,4 g protein/180 mL) và ở làng khác các bà mẹ và trẻ em chỉ được bổ sung thực phẩm nghèo năng lượng và khơng cĩ protein (Fresco: 59 KCal + 0 g protein/180 mL). Can thiệp dinh dưỡng được chấm dứt vào năm 1977. Vào năm 1988, các nhà nghiên cứu trở lại làng và tiến hành đo đạc tốc độ tiêu thụ oxy cực đại (VO 2max) trên các nam thanh niên từ 14 đến 18 tuổi (đây là các đối tượng được bổ sung dinh dưỡng trong lúc mang thai và ít nhất trong 3 năm đầu cuộc đời). Kết quả như sau
  2. Nhĩm can thiệp n VO2max (L/phút) Trung bình mẫu Ðộ lệch chuẩn Atole 44 2,62 0,54 Fresco 42 2,24 0,54 Từ số liệu này chúng ta cĩ thể kết luận gì về tốc độ tiêu thụ oxy cực đại ở hai nhĩm can thiệp dinh dưỡng. 4. Phân phối mẫu của hiệu số hai trung bình Giả sử chúng ta cĩ một dân số P1 gồm nhiều đối tượng được bổ sung dinh dưỡng với Atole và một dân số P2 gồm nhiều đối tượng được bổ sung dinh dưỡng với Fresco. Giả sử chúng ta tiến hành nhiều lần việc rút ra cỡ mẫu gồm 44 nam thanh niên từ dân số P1 và 42 nam thanh niên từ dân số P2 và chúng ta tính hiệu số trung bình (x 1 -x2). Phân phối của các hiệu số trung bình (x 1 -x2) cĩ các đặc tính sau thay đổi tuỳ theo giả định của chúng ta: a. Phương sai của 2 dân số bằng nhau 1. Giá trị x1 -x2 sẽ thay đổi từ mẫu này sang mẫu khác (x 1, s1,x2, s2 cũng thay đổi từ mẫu này sang mẫu khác) 2. Giá trị x 1 -x2 sẽ phân phối đối xứng chung quanh giá trị ( 1 -  2) là hiệu số trung bình thực của dân số P1 và P2: 3. Các giá trị gần (1 - 2) sẽ phổ biến hơn các giá trị xa với (1 - 2) 4. Sai số chuẩn của (x1 -x2) sẽ được tính theo cơng thức: 1 1 SE  ( ) n1 n2 Viết theo ngơn ngữ tốn học hình thức 2 2 X1~N(1, ) và X2~N(2, ) => (X1 -X2)~(1 -2 , ) b. Phương sai của 2 dân số khác nhau 1. Giá trị x1 -x2 sẽ thay đổi từ mẫu này sang mẫu khác (x 1, s1,x2, s2 cũng thay đổi từ mẫu này sang mẫu khác) 2. Giá trị x 1 -x2 sẽ phân phối đối xứng chung quanh giá trị ( 1 -  2) là hiệu số trung bình thực của dân số P1 và P2: 3. Các giá trị gần (1 - 2) sẽ phổ biến hơn các giá trị xa với (1 - 2) 4. Sai số chuẩn của (x1 -x2) sẽ được tính theo cơng thức:  2  2 SE ( 1 2 ) n1 n2 Viết theo ngơn ngữ tốn học hình thức 2 2 X1~N(1,1 ) và X2~N(2,2 ) => (X1 -X2)~(1 -2 , )
  3. Cơng thức này cĩ thể chứng minh sử dụng định lí: phương sai của tổng (hay hiệu) của 2 biến số độc lập sẽ bằng tổng của hai phương sai của 2 biến số đĩ. Phương sai của (x1 -x2) = Phương sai của (x1 ) + Phương sai của (x2) = 6. Kiểm định giả thuyết để so sánh hai trung bình Chúng ta cĩ thể muốn kiểm định giả thuyết là hai trung bình dân số,  1 và 2, bằng nhau hay nĩi khác đi ( 1 -  2)=0. Nếu giả thuyết Ho đúng thì hiệu số trung bình mẫu sẽ cĩ phân phối bình thường, tập trung tại giá trị 0 và cĩ sai số chuẩn thay đổi tuỳ theo giả định a. Phương sai của 2 dân số bằng nhau 1 1 SE  ( ) n1 n2 Khi đĩ, Giá trị Z của hiệu số trung bình mẫu sẽ : (x x ) (x x ) Z 1 2 1 2 SE 1 1  ( ) n1 n2 Tuy nhiên trên thực tiễn do chúng ta khơng thể xác định  một cách chính xác, chúng ta (n 1)s 2 (n 1)s 2 s 1 1 2 2 phải sử dụng (n1 1) (n2 1) để thay thế cho . Khi đĩ chúng ta sẽ cĩ giá trị t (x x ) (x x ) t 1 2 1 2 SE 1 1 s ( ) n n 1 2 với n1+n2-2 độ tự do (1) b . Phương sai của 2 dân số khác nhau  2  2 SE ( 1 2 ) n1 n2 Khi đĩ, Giá trị Z của hiệu số trung bình mẫu sẽ : (x x ) (x x ) Z 1 2 1 2 SE  2  2 ( 1 2 ) n1 n2 Cũng tương tự như lập luận ở trên, trên thực tiễn do chúng ta khơng biết được chính xác 1 và 2, nên chúng ta phải sử dụng s 1 thay thế cho  1 và s2 thay thế cho  2 và chúng ta cĩ giá trị t: (x x ) (x x ) t 1 2 1 2 SE s 2 s 2 ( 1 2 ) n1 n2 (2)
  4. 2 2 2  s1 s2 n1 n2 d. f .  s 4 s 4 1 2 n 2 (n 1) n 2 (n 1) với 1 1 2 2  (3) Việc cơng thức tính độ tự do khi sử dụng giả định 2 phương sai khác nhau tương đối khĩ nhớ nên độ tự do của phân phối t khi phương sai khơng bằng nhau thường chỉ tính tốn các phần mềm thống. Khi phân tích thống kê với máy tính cầm tay, người ta thường giả định nếu cỡ mẫu của 2 nhĩm đều trên 20 thì độ tự do của t sẽ trên 30 (xem bảng 1). Khi đĩ cĩ thể khơng cần tra bảng t mà chỉ cần tra bảng phân phối chuẩn. Do đĩ, đơi khi cơng thức kiểm định t cho 2 trung bình khi phương sai khơng bằng nhau với cỡ mẫu lớn cịn được gọi là cơng thức kiểm định z Bảng 3. Độ tự do của t khi phương sai khơng bằng nhau tương ứng với phương sai nhĩm và cỡ mẫu của 2 nhĩm khác nhau Độ lệch chuẩn nhĩm 1: s1 1 1 1 2 2 2 Cỡ mẫu nhĩm 1: n1 10 20 20 10 20 20 Độ lệch chuẩn nhĩm 2: s2 1 1 1 1 1 1 Cỡ mẫu nhĩm 2: n2 10 10 20 10 10 20 Độ tự do 18 18 38 13 28 28 Tĩm lại, chúng ta cĩ 2 cơng thức để kiểm định 2 trung bình: cơng thức (1) và cơng thức (2). Cả hai cơng thức này đều chỉ sử dụng được khi biến số cần so sánh cĩ phân phối bình thường. Tuy nhiên cơng thức (1) sử dụng khi cĩ thể giả định là 2 phương sai bằng nhau và cơng thức (2) chỉ đơn giản để sử dụng khi cỡ mẫu của 2 nhĩm đều lớn. Trong trường hợp nếu 2 phương sai khơng bằng nhau, chúng ta sử dụng cơng thức (2) và tính tốn cụ thể độ tự do theo cơng thức (3). 7. Thí dụ về tính tốn kiểm định so sánh 2 trung bình 1. Trong thí dụ so sánh tốc độ sử dụng oxy cực đại ở hai nhĩm thanh niên, giả thuyết Ho được đưa ra là Ho: trung bình tốc độ sử dụng oxy cực đại ở nhĩm Atole bằng trung bình tốc độ sử dụng oxy cực đại ở nhĩm Fresco A = F Bởi vì cả hai giả định (a) phương sai bằng nhau và (b) cỡ mẫu 2 nhĩm đều lớn đều đúng, chúng ta cĩ thể chọn sử dụng một trong 2 phương pháp kiểm định ở trên: 2a. Kiểm định sử dụng giả định phương sai bằng nhau 3a. Tính giá trị thống kê (n 1)s 2 (n 1)s 2 43 0,542 41 0,542 s 1 1 2 2 0,54 (n1 1) (n2 1) (44 1) (42 1)
  5. (x x ) 2,62 2,24 0,38 t 1 2 0,326 1 1 1 1 0,1165 s ( ) 0,54 n1 n2 44 42 với 84 độ tự do 4a. Vì độ tự do khá lớn nên chúng ta cĩ thể tra bảng phân phối chuẩn z thay cho bảng t. Ta cĩ P(|Z| 3,26)=0,0012 Nếu chúng ta khơng thể tính trực tiếp p, tra bảng chúng ta cĩ thể biết rằng p 0,001 5a. Khi đĩ chúng ta cĩ thể bác bỏ Ho với p=0,0011, hay nĩi khác đi số liệu cho phép kết luận can thiệp dinh dưỡng bằng Atole ở tuổi nhà trẻ làm tăng tốc độ sử dụng oxy tối đa ở tuổi trưởng thành (p=0,0011). 2b. Kiểm định sử dụng giả định phương sai khơng bằng nhau 3b. Tính giá trị thống kê (x x ) (x x ) (2,62 2,24) 0,38 t 1 2 1 2 ) 3,26 SE  2  2 0,01357 0,1165 ( 1 2 ) n1 n2 bởi vì cỡ mẫu của 2 nhĩm đều lớn chúng ta cĩ thể cho rằng độ tự do của t cũng khá lớn và cĩ thể tra bảng phân phối chuẩn z thay cho bảng t. Nếu muốn chặt chẽ chúng ta cĩ thể sử dụng cong thức đã trình bày ở trên để tính độ tự do của phân phối t bằng 83,8. 4b. Tính giá trị p: P(|Z| 3,26)=0,0012 5b. Kết luận: Chúng ta cĩ thể bác bỏ Ho với p=0,0011, hay nĩi khác đi số liệu cho phép kết luận can thiệp dinh dưỡng bằng Atole ở tuổi nhà trẻ làm tăng tốc độ sử dụng oxy tối đa ở tuổi trưởng thành (p=0,0012). 7. Ðiều kiện sử dụng test Z Test Z như trình bày ở trên địi hỏi 2 giả định: 1. Phân phối mẫu của trung bình mẫu và phân phối mẫu của hiệu số trung bình mẫu cĩ phân phối xấp xỉ bình thường. 2. Ðộ lệch chuẩn thực sự (độ lệch chuẩn dân số)  1 và  2 cĩ thể được ước lượng một cách chính xác bằng độ lệch chuẩn mẫu s1 và s2. Chính xác ra, giả định thứ nhất chỉ đúng nếu giá trị của số liệu trong dân số cĩ phân phối bình thường. Tuy nhiên theo định lí giới hạn trung tâm, với cỡ mẫu lớn thì phân phối của trung bình mẫu sẽ tiệm cận phân phối bình thường ngay cả khi giá trị của số liệu trong dân số khơng cĩ phân phối bình thường. Về giả định thứ hai, s1 và s2. cũng ước lượng khá chính xác  1 và 2 nếu cỡ mẫu lớn. Vì vậy, phương pháp z nĩi chung đáng tin cậy khi cỡ mẫu đủ lớn (cỡ mẫu của mỗi nhĩm từ 20 trở lên) và hình dạng của tổ chức đồ khơng quá khơng bình thường. Ngồi ra nếu phân
  6. tích trên tổ chức đồ chúng ta thấy phân phối bị lệch dương, chúng ta cần phải dùng biến đổi log để phân phối trở lại gần giống phân phối bình thường. 8. Phương pháp với mẫu nhỏ Nếu một trong haimẫu nhỏ, cả hai giả định nêu ở trên sẽ bị vi phạm và khi đĩ sử dụng xấp xỉ bình thường là khơng đáng tin cậy. Tuy nhiên nếu chúng ta phân tích tổ chức đồ cho thấy các giá trị là tương đối đối xứng và khơng quá khác biệt với phân phối bình thường, chúng ta cĩ thể sử dụng phương pháp biến cải từ phép kiểm định z nêu ở trên. Ðĩ là sử dụng phân phối t và trong đĩ chấp nhận sai số thêm vào khi sử dụng độ lệch chuẩn mẫu s1 và s2 thay vì độ lệch chuẩn thực 1 và 2. Tuy nhiên phương pháp này địi hỏi thêm một giả định là hai độ lệch chuẩn thực 1 và 2 là bằng nhau và bằng với giá trị chung . Vì vậy phương pháp này địi hỏi hai độ lệch chuẩn khơng quá khác nhau (tỉ số của chúng khơng lớn hơn 2). Cơng thức của kiểm định t cũng tương tự như kiểm định z nhưng chỉ khác ở cơng thức của sai số chuẩn: 1 1 SE s ( ) n1 n2 (n 1)s 2 (n 1)s 2 với s 1 1 2 2 (n1 1) (n2 1) Trong cơng thức trên s là ước lượng của độ lệch chuẩn chung  và được gọi là độ lệch chuẩn gộp (pooled standard deviation) và trung bình của hai độ lệch chuẩn s1 và s2 với hệ số là mẫu số trong cơng thức tính độ lệch chuẩn. Ðể kiểm định ý nghĩa thống kê người ta tính giá trị t (x x ) (x x ) t 1 2 1 2 SE 1 1 s ( ) n1 n2 (n 1)s 2 (n 1)s 2 với s 1 1 2 2 (n1 1) (n2 1) rồi tính P(|t|>to) bằng cách sử dụng các phần mềm máy tính hay tra bảng phân phối student với (n1+n2-2) độ tự do. Trong trường hợp này người ta gọi đây là test t khơng bắt cặp. Ðể tính khoảng tin cậy của hiệu số (1 - 2) bằng thống kê t ta sử dụng cơng thức: 1 1 (x1 x2 ) t s ( ) n1 n2 giá trị t ở đây cũng được tra từ bảng phân phối student. 9. So sánh kiểm định z và kiểm định t Kiểm định z và kiểm định t hồn tồn tương đương trong thống kê các biến số định lượng. Như vậy chúng ta cĩ thể sử dụng thống kê z hay t trong ước lượng khoảng tin cậy của trung bình, của hiệu số 2 trung bình, kiểm định ý nghĩa trong so sánh 2 trung bình ở
  7. thiết kế cĩ bắt cặp và khơng bắt cặp. Chúng chỉ khác nhau về điều kiện áp dụng. Ðiều kiện áp dụng của thống kê z là cỡ mẫu đủ lớn (để trung bình mẫu cĩ phân phối bình thường và độ lệch chuẩn mẫu gần bằng độ lệch chuẩn dân số). Ðiều kiện áp dụng thống kê t là phân phối của các giá trị phải xấp xỉ bình thường (trong trường hợp so sánh 2 mẫu nĩ cần thêm điều kiện là hai độ lệch chuẩn của 2 mẫu khơng quá khác nhau). Khi chúng ta khơng thể áp dụng thống kê z hay thống kê t, thí dụ như khi cỡ mẫu nhỏ và phân phối khơng bình thường hoặc hai phương sai khơng đồng nhất ta cần phải sử dụng các phép kiểm phi tham số. 5. Khoảng tin cậy của hiệu số hai trung bình Sử dụng lập luận chúng ta đã trình bày cho việc tính các khoảng tin cậy của trung bình và tỉ lệ đơn, chúng ta sẽ cĩ các cơng thức khoảng tin cậy 95% của hiệu số ( 1 - 2) tuỳ theo các giả định: a. Giả định phương sai 2 nhĩm bằng nhau Ðể tính khoảng tin cậy của hiệu số (1 - 2) bằng thống kê t ta sử dụng cơng thức: 1 1 (x x ) t s ( ) 1 2 c n n 1 2 với tc là giá trị tới hạn của phân phối t ở n1+n2- 2 độ tự do (n 1)s 2 (n 1)s 2 s 1 1 2 2 với (n1 1) (n2 1) b. Giả định phương sai 2 nhĩm khơng bằng nhau Khoảng tin cậy của hiệu số ( 1 - 2) khi phương sai của 2 nhĩm khơng bằng nhau được tính theo cơng thức: s 2 s 2 (x x ) t ( 1 2 ) 1 2 c n n 1 2 với tc là giá trị tới hạn của phân phối t với độ tự do 2 2 2  s1 s2 n1 n2 d. f .  s 4 s 4 1 2 n 2 (n 1) n 2 (n 1) 1 1 2 2  Khi cỡ mẫu đủ lớn chúng ta khơng cần phải tính độ tự do (bởi vì độ tự do cũng khá lớn) mà chỉ cần áp dụng giá trị tới hạn của z thay cho giá trị tới hạn của t. Áp dụng trong nghiên cứu về can thiệp dinh dưỡng lên khả năng hoạt động thể lực, khoảng tin cậy 95% của VO2max là: 2 2 2 2 s1 s2 0,54 0,54 (x1 x2 ) 1,96 ( ) (2,62 2,24) 1,96 ( ) n1 n2 44 42 0,542 0,542 0,38 1,96 ( ) 0,38 0,23 0,15 đến 0,61L / min 44 42
  8. Khoảng tin cậy 95% trên cĩ ý nghĩa: Xác suất hiệu số của trung bình tốc độ oxy tối đa các nam thanh niên can thiệp dinh dưỡng bằng Atole và nhĩm can thiệp bằng Fresco nằm trong khoảng 0,38 đến 0,61 lít/phút là 95%. Bài tập 1. Mẫu gồm 143 trẻ gái và 127 trẻ trai tuổi từ 1-4 tuổi được chọn từ ngẫu nhiên từ một dân số nơng thơn. Mức Hemoglobin (Hb) tính bằng g/dL của mỗi đứa trẻ được đo lường và cho kết quả sau: Giới tính n Hemoglobin (g/dL) Trung bình mẫu Ðộ lệch chuẩn Nam 143 11,35 1,41 Nữ 127 11,01 1,32 a. Hiệu số quan sát của trung bình nồng độ Hb ở trẻ em nam và trẻ em nữ? Nếu khơng làm kiểm định thống kê, chúng ta cĩ cho rằng cĩ sự khác biệt về nồng độ Hb theo giới tính trong dân số này khơng? b. Ước lượng sai số chuẩn của hiệu số của hai trung bình mẫu. Nĩ cĩ ý nghĩa gì? Vẽ phác phân phối mẫu hiệu số của trung bình. c. Sử dụng sai số chuẩn tính được để tính khoảng tin cậy 95% cho hiệu số thực sự giữa trẻ em nam và trẻ em nữ. Chúng ta cĩ thể kết luận gì từ điều này? d. nếu chúng ta muốn cĩ sức mạnh của bằng chứng cho sự khác biệt giữa hai giới, chúng ta sẽ làm gì? e. Tiến hành kiểm định ý nghĩa và tính giá trị p. Giả thuyết khơng là gì? Giá trị p được lí giải như thế nào? f. Tính khoảng tin cậy 95% của Hb trung bình ở trẻ nam và trẻ nữ. Hai khoảng tin cậy này cĩ trùng nhau khơng? Thảo luận. g. Chúng ta cĩ cần kiểm định t trong phân tích này hay khơng? 2. Trong một thử nghiệm cộng đồng sử dụng Ivermectin để điều trị nhiễm onchocercam, dân làng từ 5 tuổi trở lên được dùng Ivermectin hay viên placebo. Trước khi điều trị, thể tích hồng cầu đặc (packed cell volume - PCV) được đo và bằng nhau giữa hai nhĩm. Sáu tháng sau khi điều trị, thể tích hồng cầu đặc được đo và số liệu của đàn ơng từ 25-29 tuổi được trình bày trong bảng sau: Ivermectin (n=16) 39 - 35 - 38 - 42 - 37 - 52 - 40 - 45 - 39 - 31 - 34 - 45 - 44 - 42 - 40 - 43 Placebo (n=14) 40 - 41 - 35 - 36 - 32 - 38 - 38 - 44 - 43 - 46 - 33 - 35 - 31 - 33 a. Tính trung bình và độ lệch chuẩn của PCV ở 2 nhĩm. Hiệu số quan sát giữa trung bình PCV ở hai nhĩm. Nếu khơng làm kiểm định thống kê, chúng ta cĩ cho rằng cĩ sự khác biệt về PCV ở hai nhĩm can thiệp và placebo hay khơng? b. Kiểm định ý nghĩa nào cần thiết để đánh giá hiệu số giữa hai trung bình?
  9. c. Ðiều kiện để kiểm định này cĩ giá trị là gì? Ðiều kiện đĩ cĩ thoả trong trường hợp này hay khơng? d. Kiểm định thống kê và tính giá trị p. Lí giải giá trị p. e. Tính khoảng tin cậy 95% của hiệu số PCV trung bình giữa nhĩm ivermectin và nhĩm placebo. f. Từ số liệu này chúng ta cĩ thể rút ra kết luận gì? 3. Người ta đếm số lượng cung quăng trong một 100 ml nước của một hồ nước trong bảy ngày liên tiếp ở tháng mười và trong 10 ngày liên tiếp ở tháng mười một. Kết quả được trình bày ở bảng sau: Tháng mười 25 41 10 22 7 36 14 Tháng mười 7 3 9 5 2 2 3 13 5 10 một a. Tính trung bình và độ lệch chuẩn của số lượng lăng quăng bắt trong mỗi tháng b. Kiểm định t cĩ thích hợp để so sánh sự khác biệt giữa hai tháng hay khơng? c. Lấy logarithm của số lượng cung quăng, lúc đĩ kiểm định t cĩ thích hợp khơng? nếu cĩ tiến hành kiểm định và lí giải kết quả. d. tính khoảng tin cậy của hiệu số trung bình (vẫn sử dụng thang đo log) e. Lấy antilog của hiệu số quan sát của trung bình của log, lí giải ý nghĩa của số đĩ. Lấy antilog của k 4. Một bệnh viện so sánh nằm viện trung bình của hai nhĩm bệnh nhân: nhĩm 1 bao gồm các bệnh nhân được các bác sĩ (chưa được đạo tạo sau đại học) điều trị và một nhĩm 2 được các bác sĩ đã cĩ bằng sau đại học điều trị. Kết quả như sau: n1 = 1820; x1 = 12,6; s1= 1 n2 = 1250; x2 = 12,3; s2= 3 Kiểm định nào được sử dụng để so sánh thời gian nằm viện trung bình của hai nhĩm bệnh nhân. Kiểm định thống kê và tính giá trị của p. Lí giải giá trị của p Từ số liệu này chúng ta cĩ thể rút ra kết luận gì?