Bài tập Xác suất thống kê (Phần 2) - Lê Thị Thiên Hương
Bạn đang xem 20 trang mẫu của tài liệu "Bài tập Xác suất thống kê (Phần 2) - Lê Thị Thiên Hương", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_tap_xac_suat_thong_ke_phan_2_le_thi_thien_huong.pdf
Nội dung text: Bài tập Xác suất thống kê (Phần 2) - Lê Thị Thiên Hương
- CHƯƠNG VII KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ A. TÓM TẮT LÍ THUYẾT 1. Khái niệm Giả thiết thống kê là giả thiết nói về đặc trưng, quy luật phân phối, tính độc lập của các đại lượng ngẫu nhiên. Dùng các thống kê từ mẫu để khẳng định hay bác bỏ một giả thiết thống kê được gọi là kiểm định giả thiết thống kê. Khi kiểm định một giả thiết H, có thể xảy ra một trong hai loại sai lầm : - Loại một : bác bỏ H trong lúc H đúng ; - Loại hai : chấp nhận H trong lúc H sai. Ta gọi xác suất xảy ra sai lầm loại một trong kiểm định là mức ý nghĩa của kiểm định, kí hiệu là . Phương pháp kiểm định là cho trước mức ý nghĩa (thường 10%). Nếu xác suất H đúng không bé hơn 1 - thì ta chấp nhận H, nếu xác suất đó bé hơn 1 - thì ta bác bỏ H. 2. Kiểm định tỉ lệ a) Kiểm định giả thiết về tỉ lệ của tổng thể . Bài toán. Giả sử tổng thể có tỉ lệ p chưa biết. Ta cần kiểm định giả thiết H : “p = po” với mức ý nghĩa . . Phương pháp - Từ mẫu định tính kích thước n 30, ta tính được tỉ lệ mẫu f. 1 - Tra bảng hàm số Laplace để tìm số Z sao cho (Z ) = . 2 f po - Tính thống kê Zo = n . po (1 po ) - So sánh Zo với Z : . Nếu Zo Z thì chấp nhận H ; . Nếu Zo > Z thì bác bỏ H. b) Kiểm định so sánh hai tỉ lệ . Bài toán Giả sử tỉ lệ của hai tổng thể lần lượt là p1, p2 chưa biết. Cần kiểm định giả thiết H : “p1 = p2” với mức ý nghĩa . . Phương pháp - Từ hai mẫu tương ứng kích thước n1, n2 30, ta tính được các tỉ lệ mẫu f1, f2. 1 - Tra bảng hàm số Laplace để tìm Z sao cho (Z ) = . 2 f1 f 2 - Tính thống kê Zo = , 1 1 po (1 po ) n1 n 2 n1f1 n 2f 2 trong đó po = . n1 n 2 - So sánh Zo với Z : 72
- . Nếu Zo Z thì chấp nhận H ; . Nếu Zo > Z thì bác bỏ H. 3. Kiểm định kì vọng a) Kiểm định giả thiết về kì vọng của tổng thể . Bài toán Giả sử tổng thể có giá trị trung bình (kì vọng) là chưa biết. Cần kiểm định giả thiết H : “= o” với mức ý nghĩa . . Phương pháp Từ mẫu định lượng kích thước n ta tính được X , S. (1) Trường hợp n 30 - Tra bảng hàm số Laplace tìm Z sao cho 1 (Z ) = . 2 X μ o - Tính thống kê Zo = n . S - So sánh Zo với Z : . Nếu Zo Z thì chấp nhận H ; . Nếu Zo > Z thì bác bỏ H. (2) Trường hợp n tùy ý, tổng thể có phân phối chuẩn, đã biết phương sai 2 Ta tiến hành kiểm định như trường hợp (1) với X μ o Zo = n . (3) Trường hợp n T thì bác bỏ H. b) Kiểm định so sánh hai kì vọng . Bài toán Giả sử giá trị trung bình của hai tổng thể lần lượt là 1, 2. Cần kiểm định giả thiết H : “1= 2” với mức ý nghĩa . . Phương pháp 2 2 - Từ hai mẫu tương ứng kích thước n1, n2 30, ta tính được X1, S1 ; X 2 , S2 . 1 - Tra bảng ta tìm được số Z sao cho ( Z ) = . 2 X1 X 2 - Tính thống kê Zo = . S2 S2 1 2 n1 n 2 - So sánh Zo với Z : . Nếu Zo Z thì chấp nhận H ; 73
- . Nếu Zo > Z thì bác bỏ H. 4. Kiểm định phương sai . Bài toán Giả sử tổng thể có phân phối chuẩn với phương sai 2 chưa biết. Cần kiểm định giả 2 2 thiết H : “ = σ o ” với mức ý nghĩa . . Phương pháp - Từ mẫu định lượng kích thước n, ta tính được phương sai mẫu hiệu chỉnh S2. - Tra bảng phân phối “khi bình phương” dòng n – 1, cột 1 - và cột , ta tìm được 2 2 2 2 hai số tương ứng là 1 , 2 . 2 2 (n 1)S - Tính thống kê 0 2 . o 2 2 2 - So sánh 0 với 1 , 2 2 2 2 . Nếu 1 0 2 thì chấp nhận H ; 2 2 2 2 . Nếu 0 2 thì bác bỏ H. B. CÁC BÀI GIẢI MẪU 1. Kiểm định giả thiết về tỉ lệ của tổng thể Bài 1. Theo báo cáo, tỉ lệ hàng phế phẩm trong kho là 10%. Kiểm tra ngẫu nhiên 100 sản phẩm thấy có 8 phế phẩm. Hỏi báo cáo trên có đáng tin ở mức ý nghĩa 5% không? Giải Gọi p là tỉ lệ phế phẩm trong kho hàng, p chưa biết. Ta giả thiết p = 10%, đúng như báo cáo, (ở đây tỉ lệ giả thiết po = 10%). Ta kiểm tra giả thiết H : “p = po” với = 5%. 8 Ta có kích thước mẫu n = 100, tỉ lệ mẫu f = 0,08. 10 Tra bảng hàm số Laplace ta thấy 1 0,05 (1,96) = = 0,475 nên Z = 1,96. 2 Tính thống kê, ta được 0,08 - 0,10 Zo = 100 = 0,6667. 0,10(1 0,10) Vì Zo < Z nên ta chấp nhận H, nghĩa là báo cáo đáng tin cậy. Bài 2. Trước đây tỉ lệ phế phẩm của một nhà máy là 5%. Năm nay người ta áp dụng một biện pháp kĩ thuật mới để sản xuất. Sau một thời gian, kiểm tra 800 sản phẩm thì thấy có 24 phế phẩm. Với mức ý nghĩa 1%, hãy đánh giá hiệu quả của biện pháp kĩ thuật đó. Giải Tỉ lệ phế phẩm của nhà máy (xem là tổng thể) trước đây, tức là trước khi áp dụng biện pháp kĩ thuật mới, là 5%. Còn tỉ lệ phế phẩm sau khi áp dụng biện pháp kĩ thuật là p chưa biết. Ta giả thiết H : “p = 5%”, giống như trước đây. Rõ ràng, nếu giả thiết đúng thì biện pháp kĩ thuật không tác dụng đến tỉ lệ phế phẩm của nhà máy. Còn nếu giả thiết sai thì biện pháp kĩ thuật đã làm thay đổi tỉ lệ phế phẩm đó. Ta tiến hành kiểm tra giả thiết trên với = 1%. 74
- Từ mẫu ta có 24 n = 800, f = = 0,03. 800 Tra bảng hàm số Laplace, ta tìm được Z = 2,58. Tính thống kê, ta được 0,03 - 0,05 Zo = 800 = 2,6. 0,05(1 0,05) Vì Zo > Z nên giả thiết p = 5% là sai. Do đó tỉ lệ phế phẩm của nhà máy hiện nay không phải là 5% như trước kia. Mặt khác, vì tỉ lệ mẫu f = 3% 30, X = 235g, S = 36. Vì = 0,01 nên Z = 2,58. Ta có 75
- 2,35 - 250 Zo = 81 = 3,75. 36 Suy ra Zo > Z nên giả thiết bị bác bỏ. Mặt khác, vì khối lượng trung bình của mẫu X = 235g bé hơn khối lượng quy định nên việc đóng gói tự động chưa đạt yêu cầu về khối lượng các gói bánh. Bài 5. Một cửa hàng nhận thấy lâu nay trung bình mỗi khách hàng mua 15 ngàn đồng. Tuần này cửa hàng chọn ngẫu nhiên 16 khách hàng thì thấy trung bình mỗi người mua 14 ngàn đồng và độ lệch mẫu hiệu chỉnh là 2 ngàn đồng. Cho biết sức mua của khách hàng có phân phối chuẩn. Với mức ý nghĩa 5%, xét xem sức mua của khách hàng có giảm sút không ? Giải Gọi là sức mua trung bình hiện nay, o = 15 ngàn đồng là sức mua trung bình trước kia. Ta giả thiết H : “ = o”. Nếu giả thiết đúng thì sức mua của khách hàng không thay đổi, nếu giả thiết sai thì sức mua đã thay đổi. Ta kiểm định giả thiết đó. Vì kích thước mẫu n = 16 30 ; X 1 = 1,68, S1 = 36 ; X 2 = 1,64, S2 = 25. Suy ra 1,68 - 1,64 Zo = = 0,0531. 36 25 100 120 Vì Zo < Z nên ta chấp nhận giả thiết. Vậy không thể kết luận thể lực của học sinh nội thành tốt hơn. 5. Kiểm định phương sai 76
- Bài 7. Đo đường kính của 25 viên bi từ một lô hàng, ta tính được S = 0,3 mm. Với mức ý nghĩa 0,01, hãy kiểm định giả thiết cho rằng phương sai của đường kính các viên bi trong lô hàng trên là 0,06 mm2, biết đường kính đó tuân theo quy luật phân phối chuẩn. Giải Gọi 2 là phương sai của đường kính các viên bi trong lô hàng thì 2 chưa biết. Ta kiểm định giả thiết H : 2 = 0,06 mm2 với = 0,01. Theo đề bài ta có n = 25, S2 = 0,09. Tra bảng phân phối “khi bình phương” dòng 24 cột 0,995 và cột 0,005, ta được 2 2 1 = 12,4 ; 2 = 39,4. Tìm thống kê 24.0,09 2 = = 36. 0 0,06 2 2 2 Vì 1 < 0 < 2 nên ta chấp nhận giả thiết. C. BÀI TẬP 1. Theo quy định, một lô hàng được xem là đạt tiêu chuẩn nếu tỉ lệ phế phẩm của lô hàng không quá 5%. Tiến hành kiểm tra 100 sản phẩm của lô hàng thì thấy có 8 phế phẩm. Với mức ý nghĩa 5%, hãy cho kết luận về lô hàng đó. 2. Tỉ lệ người mắc bệnh tai mũi họng ở một thành phố là 6%. Trong lần kiểm tra sức khoẻ ngẫu nhiên 300 người thì thấy có 24 người mắc bệnh tai mũi họng. Với = 0,01 có thể cho rằng tỉ lệ người mắc bệnh đó có xu hướng tăng lên không ? 3. Khi điều trị bằng thuốc A, tỉ lệ bệnh nhân khỏi bệnh là 80%. Đổi sang thuốc B để điều trị cho 110 người thì thấy có 920 người khỏi bệnh. Với mức ý nghĩa = 0,02 có thể cho rằng thuốc B hiệu quả hơn thuốc A hay không ? 4. Một máy sản xuất tự động có tỉ lệ sản phẩm không đạt tiêu chuẩn là 20%. Sau khi áp dụng phương pháp sản xuất mới, người ta lấy 40 thùng hàng, mỗi thùng có 10 sản phẩm để kiểm tra. Kết quả cho trong bảng sau. Số sản phẩm 1 2 3 4 5 6 7 8 9 10 không đạt tiêu chuẩn Số thùng hàng 2 0 4 6 8 10 4 5 1 0 Với mức ý nghĩa = 0,05, hãy đánh giá hiệu quả của phương pháp sản xuất mới này. 5. Theo dõi số tai nạn lao động của hai xí nghiệp trong một thời gian ta có số liệu sau. Xí nghiệp thứ nhất : 20 tai nạn/400 công nhân. Xí nghiệp thứ hai : 28 tai nạn/500 công nhân. Hỏi có sự khác nhau đáng kể về chất lượng công tác phòng hộ lao động ở hai xí nghiệp đó với = 2% ? 6. Theo phương pháp nuôi thứ nhất ta có 12 con gà bị bệnh trong đàn gà 200 con. Theo phương pháp nuôi thứ hai có 5 con bị bệnh trong đàn gà 100 con. Với = 5%, có thể kết luận rằng tỉ lệ gà bị bệnh khi nuôi theo phương pháp thứ hai thấp hơn không ? 7. Khối lượng của một loại sản phẩm do một nhà máy sản xuất là đại lượng ngẫu nhiên có phân phối chuẩn với khối lượng trung bình quy định là 500 gam. Nghi ngờ khối 77
- lượng của loại sản phẩm này có xu hướng giảm sút, người ta đã cân thử một số sản phẩm và thu được kết quả ghi ở bảng sau. Khối lượng (g) 480 485 490 495 500 510 Số sản phẩm 2 3 8 5 3 4 Với = 3%, hãy kết luận về điều nghi ngờ đó. 8. Kết quả đo chiều cao của 24 trẻ em 2 tuổi được ghi trong bảng sau (đơn vị tính : cm). 84,4 89,9 89,0 87,0 78,5 84,1 86,3 80,6 80,0 81,3 86,8 83,4 89,8 85,4 80,6 85,0 82,5 80,7 84,3 85,4 85,0 85,5 81,6 81,9 Chiều cao chuẩn của trẻ em 2 tuổi là 86,5 cm. Hỏi với = 0,01 có sự khác biệt đáng kể của chiều cao nhóm trẻ so với chuẩn không ? 9. Độ bền của một loại dây thép sản xuất theo công nghệ cũ là 150. Sau khi cải tiến kĩ thuật người ta lấy 100 sợi dây thép để thử thì thấy độ bền trung bình là 185 và S = 25. Với = 0,03 hãy kết luận hiệu quả của việc cải tiến kĩ thuật. 10. Năng suất lúa trung bình ở vụ trước là 4,5 tấn/ha. Vụ lúa năm nay người ta áp dụng biện pháp kĩ thuật mới cho toàn bộ diện tích trồng lúa trong vùng. Theo dõi 100 ha ta có bảng năng suất lúa sau đây. Năng suất Diện tích Năng suất Diện tích (tạ/ha) (ha) 30 – 35 7 50 – 55 20 35 – 40 12 55 – 60 8 40 – 45 18 60 – 65 5 45 – 50 27 65 – 70 3 Với = 0,01 hãy kết luận về biện pháp kĩ thuật mới. 11. Để nghiên cứu nhu cầu một loại hàng, người ta khảo sát nhu cầu của mặt hàng này ở một số hộ gia đình. Kết quả cho ở bảng sau. Nhu cầu Số hộ gia đình Nhu cầu Số hộ gia đình (kg/tháng) < 1 10 4 – 5 78 1 – 2 35 5 – 6 31 2 – 3 86 6 – 7 18 3 – 4 132 7 – 8 10 Giả sử khu vực đó có 4000 hộ gia đình. Nếu cho rằng nhu cầu trung bình về mặt hàng này của toàn khu vực là 168 tấn trong một năm thì có chấp nhận được không với mức ý nghĩa 1% ? 12. Kiểm tra các sản phẩm do hai phân xưởng sản xuất, ta có các số liệu sau đây. 78
- Phân xưởng Số sản phẩm Khối lượng Phương sai mẫu Số phế phẩm được kiểm tra trung bình (kg) hiệu chỉnh 1 900 50,2 0,16 18 2 800 50,1 0,20 16 a) Với mức ý nghĩa 0,05 có thể coi khối lượng trung bình của các sản phẩm do hai phân xưởng sản xuất là như nhau được không ? b) Với mức ý nghĩa 0,01 có thể coi tỉ lệ phế phẩm của hai phân xưởng cũng như nhau hay không ? 13. Kiểm tra 100 sản phẩm do máy thứ nhất sản xuất ta thấy khối lượng trung bình là 251 gam, phương sai mẫu hiệu chỉnh là 9 (g2). Kiểm tra 100 sản phẩm do máy thứ hai sản xuất ta được kết quả tương ứng là 249g, 16 g2. Với mức ý nghĩa 0,02 có thể kết luận khối lượng trung bình của sản phẩm do hai máy sản xuất là khác nhau hay không ? 14. Nếu máy móc hoạt động bình thường thì khối lượng của một loại sản phẩm là đại lượng ngẫu nhiên có phân phối chuẩn với phương sai 2 = 25. Nghi ngờ máy hoạt động không bình thường, người ta cân thử 20 sản phẩm và tính được S2 = 27,5. Với mức ý nghĩa 0,03 hãy kết luận về điều nghi ngờ đó. 15. Cho biết đường kính của một loại chi tiết là đại lượng ngẫu nhiên có phân phối chuẩn với phương sai 2 = 0,04 mm2. Đo đường kính của 15 chi tiết ta được độ lệch mẫu hiệu chỉnh là 0,22 mm2. Với mức ý nghĩa 0,05 hãy kiểm định giả thiết cho rằng độ phân tán của đường kính là quá khác biệt so với quy định. CHƯƠNG VIII 79
- TƯƠNG QUAN VÀ HỒI QUY A. TÓM TẮT LÍ THUYẾT 1. Tương quan giữa các đại lượng ngẫu nhiên Giả sử hai đại lượng ngẫu nhiên X và Y là hai dấu hiệu trên cùng một tổng thể. Để đo mức độ tương quan giữa X và Y người ta xét số E(XY) E(X)E(Y) RXY = , (X)(Y) được gọi là hệ số tương quan giữa X và Y. Với mọi đại lượng ngẫu nhiên, ta có -1 RXY 1. Trường hợp RXY = 0 ta nói X và Y không tương quan với nhau. Trường hợp RXY = 1 ta nói X và Y có tương quan tuyến tính. Đặt f(x) = E(Y/X = x) là kì vọng của Y khi X nhận giá trị x, ta được hàm f(x) xác định trên tập hợp các giá trị của X và gọi nó là hàm hồi quy của Y theo X. Hàm hồi quy f(x) cho ta biết trung bình của Y theo các giá trị của X. Tương tự, ta có hàm hồi quy của X theo Y là g(y) = E(X/Y = y). 2. Bảng tương quan mẫu Cho một mẫu kích thước n. Quan sát đồng thời X và Y ta được bảng sau đây, được gọi là bảng tương quan mẫu Y y1 y2 yh ni X x1 n11 n12 n1h n1 x2 n21 n22 n2h n2 xk nk1 nk2 nkh nk mj m1 m2 mh = n Trong bảng này xi(i = 1, k ) là các giá trị của X, yj(j = 1, h ) là các giá trị của Y, ni(i = 1,k ) là số lần X nhận giá trị xi, mj(j = 1, h ) là số lần Y nhận giá trị yj, mij(i = 1,k , j = 1,h ) là số lần đồng thời X nhận giá trị xi, Y nhận giá trị yj. Ta có k h h k n i m j n ij n ; n ij = ni , n ij = mj. i 1 j 1 i, j j 1 i 1 Các đặc trưng của mẫu là k k 1 2 1 2 2 2 2 X x i n i , X x i n i , SX X (X) ; n i 1 n i 1 80
- h h 1 2 1 2 2 2 2 Y yi m j , Y y j m j , SY Y (Y) ; n j 1 n j 1 1 k h XY x i y jn ij . n i 1 j 1 3. Hệ số tương quan mẫu Ta gọi XY X.Y r = XY SX .SY là hệ số tương quan mẫu giữa X và Y. Như vậy, hệ số tương quan mẫu là một ước lượng của hệ số tương quan RXY. Ta cũng có -1 rXY 1. 4. Đường hồi quy mẫu Đặt 1 h Y x Y X n y i ( / xi ) ij j ni j 1 là kì vọng của Y khi X = xi. Khi biểu diễn các điểm (xi, Y xi ) lên mặt phẳng tọa độ và nối các điểm liên tiếp (xi, Y xi ) với (xi + 1, Y xi 1 ) bằng một đoạn thẳng (i = 1,k ), ta được một đường gấp khúc, được gọi là đường hồi quy mẫu Y theo X. Đường hồi quy này sẽ xấp xỉ với đường hồi quy f(x) = E(Y/X = x). Tương tự, ta có đường hồi quy mẫu X theo Y. 5. Đường hồi quy tuyến tính mẫu Đường hồi quy tuyến tính mẫu Y theo X là đường thẳng có phương trình y = ax + b “gần” với đường hồi quy mẫu Y theo X nhất, theo nghĩa k 2 ni (Y xi (axi b)) i 1 đạt giá trị nhỏ nhất. Phương trình hồi quy tuyến tính mẫu Y theo X là y = ax + b, trong đó XY X.Y a = , b = Y aX . 2 S X Phương trình này còn được viết ở dạng “đối xứng” y Y x X r . XY SY SX Đổi vai trò của X và Y ta có công thức tìm đường hồi quy tuyến tính mẫu X theo Y. Trường hợp X và Y có tương quan “xấp xỉ” tuyến tính thì đường hồi quy tuyến tính cho ta cơ sở để dự báo. 81
- B. CÁC BÀI GIẢI MẪU 1. Tính các đặc trưng mẫu Bài 1. Cho lượng nước mưa ở hai địa phương quan sát tại 10 thời điểm khác nhau, ta được bảng số liệu sau đây xi 87 47 74 86 38 15 41 8 79 75 yj 86 56 84 72 47 17 43 19 88 78 Hãy tính các đặc trưng mẫu. Giải Ta có kích thước mẫu n = 10. . Đối với đại lượng ngẫu nhiên X, ta tính được 1 87 47 75 X x 55 ; n i 10 1 872 472 752 X 2 x 2 3793 ; n i 10 2 2 2 2 SX X (X) = 3793 – 55 = 768 ; SX 768 = 27,7128. . Đối với đại lượng ngẫu nhiên Y, ta tính được 1 86 56 78 Y y 59 ; n j 10 1 862 562 782 Y 2 y2 4130,8 ; n j 10 2 2 2 2 SY Y (Y) = 4130,8 – 59 = 649,8 ; SY 649,8 = 25,4912. . Đối với tích XY, ta có 1 87.86 47.56 75.78 XY x y 3928. n i i 10 Bài 2. Cho bảng số liệu sau đây. Hãy tính các đặc trưng mẫu của bộ số liệu đó. Y 10 15 20 25 30 35 X 1 4 7 2 10 15 3 26 35 3 4 10 8 18 6 5 2 5 6 1 Giải Ta lập một bảng mới để tính toán các tổng cần thiết cho việc tính các đặc trưng mẫu. 82
- 2 yj 10 15 20 25 30 35 ni xini x i n i xi 1 4 7 11 11 11 40 105 2 10 15 25 50 100 300 600 3 26 35 3 64 192 576 1560 2625 270 4 10 8 18 6 42 168 672 800 800 2160 840 5 2 5 6 1 14 70 350 200 625 900 175 mj 4 17 53 48 27 7 156 491 1709 yjmj 40 255 1060 1200 810 245 3610 2 y j m j 400 3825 21200 30000 24300 8575 88300 12000 Trong bảng trên - Các ô bôi đen ở góc cuối bên phải ghi các tổng cần thiết cho việc tính các đặc trưng mẫu. - Mỗi ô ở bảng ban đầu gồm hai số : . Số trên là nij ; . Số dưới là tích xiyjnij (tổng của tất cả các tích này được ghi ở ô bôi đen thuộc dòng cuối, cột cuối). Ta tính các đặc trưng mẫu. 1 491 X x n 3,1474 ; n i i 156 1 1709 X 2 x 2n 10,9551 ; n i i 156 2 SX = 1,0660 ; SX = 1,0325. 1 3610 Y y m 23,1410 ; n j j 156 1 88300 Y 2 y2m 566,0256 ; n j j 156 2 SY = 30,5198 ; SY = 5,5245. 1 12000 XY x y n 76,9321. n i j ij 156 2. Tính hệ số tương quan mẫu Bài 3. Tính hệ số tương quan mẫu của bộ số liệu cho ở Bài 2. Giải XY X.Y 76,9231 3,1474.23,1410 Ta có : rXY = = 0,7169. 1,0325.5,5245 SX .SY 83
- 3. Tìm phường trình hồi quy tuyến tính mẫu Bài 4. Đo chiều cao X và khối lượng Y của 5 học sinh, ta được kết quả cho ở bảng sau. X(m) 1,45 1,60 1,50 1,65 1,55 Y(kg) 50 55 45 65 60 a) Tìm phương trình hồi quy tuyến tính mẫu Y theo X. b) Dự đoán khối lượng trung bình của những học sinh có chiều cao 1,52m. c) Sai số dự đoán của Y khi X = 1,45m là bao nhiêu ? Giải a) Trước hết, ta tính các đặc trưng mẫu. 1,45 1,60 1,55 X 1,55 ; 5 1,452 1,602 1,552 X 2 2,4075 ; 5 2 2 SX 2,4075 1,55 0,005 ; 50 55 60 Y 55 ; 5 1,45.50 1,60.55 1,55.60 XY 85,65. 5 Suy ra các hệ số của phương trình cần tìm là XY X.Y 85,65 1,55.55 a = ; 80 2 0,005 SX b = Y aX 55 80.1,55 69 . Vậy, phương trình hồi quy tuyến tính mẫu Y theo X có dạng y = 80x – 69. b) Trong phương trình trên x có đơn vị là m, y có đơn vị là kg. Để dự đoán khối lượng trung bình của những học sinh có chiều cao 1,52m, ta thay x = 1,52 vào phương trình và tìm được y = 80.1,52 – 69 = 52,6 (kg). c) Tương tự, thay x = 1,45m vào phương trình, ta dự đoán được khối lượng trung bình là y = 80.1,45 – 69 = 47 (kg). Trên mẫu, học sinh cao 1,45m lại có khối lượng 50 kg (xem cột 1 của mẫu). Vậy sai số khi dự đoán là : 50 – 47 = 3 (kg). Bài 5. Để nghiên cứu sự phát triển của một loại cây trồng, người ta tiến hành đo chiều cao Y(m) và đường kính X(cm) của một số cây. Kết quả được ghi ở bảng sau đây. 84
- Y 3 4 5 6 7 8 X 21 2 5 23 3 11 25 8 15 10 27 4 17 3 29 7 12 a) Tìm hệ số tương quan mẫu và phương trình hồi quy tuyến tính mẫu Y theo X và X theo Y. b) Nếu Y được tính theo đơn vị là cm thì các hàm số ở câu a) sẽ thay đổi thế nào ? Từ kết quả câu a), hãy suy ra các phương trình hồi quy tương ứng khi đơn vị của Y là cm. Giải a) Trước hết ta tính các đặc trưng mẫu. Ta có thể lập bảng dưới dạng sau y j 3 4 5 6 7 8 ni xi 21 2 5 7 23 3 11 14 25 8 15 10 33 27 4 17 3 24 29 7 12 19 m j 2 8 23 32 20 12 n = 97 Khi đó 21.7 23.14 25.33 27.24 29.19 X 25,7010 ; 97 212.7 232.14 252.33 272.24 292.19 X 2 665,9072 ; 97 2 SX 5,3658 ; Sx 2,3164. 3.2 4.8 5.23 6.32 7.20 8.12 Y 5,9897 ; 97 32.2 42.8 52.23 62.32 72.20 82.12 Y 2 37,3299 ; 97 2 SY = 1,4534 ; SY = 1,2056. 21.3.2 21.4.5 23.4.3 23.5.11 29.7.7 29.8.12 XY 156,2165 97 . Tính hệ số tương quan mẫu XY X.Y r = = 0,8147. XY SX .SY . Tìm phương trình hồi quy tuyến tính mẫu Y theo X. 85
- Cách thứ nhất. XY X.Y a = = 0,4240 ; 2 SX b = Y aX = - 4,9075. Do đó y = ax + b = 0,4240x – 4,9075. Cách thứ hai. Áp dụng công thức “đối xứng” ta được y Y x X r , XY Sy SX hay y 5,9897 x 25,7010 0,8147 . 1,2056 2,3164 Rút gọn ta được phương trình y = 0,4240x – 4,9075. . Tìm phương trình hồi quy tuyến tính mẫu X theo Y. Cách thứ nhất. Đổi vai trò của X và Y ta được XY X.Y a = = 1,5654 ; 2 SY b = X aY = 16,3247. Do đó ta có phương trình x = ay + b = 1,5654y + 16,3247. Cách thứ hai. Áp dụng công thức “đối xứng” ta có x X y Y r XY , SX SY hay x 25,7010 y 5,9897 0,8147 . 2,3164 1,2056 Rút gọn ta được x = 1,5653y + 16,3251. b) Nếu y được tính theo đơn vị là cm thì vế trái của phương trình y = 0,4240x – 4,9075 sẽ tăng lên 100 lần. Suy ra vế phải cũng phải tăng 100 lần. Do đơn vị của x không thay đổi nên hệ số a và b phải tăng 100 lần. Vậy phương trình mới có dạng y = 42,40x – 490,75. . Xét phương trình x = 1,5653y + 16,3251. 86
- Nếu y tăng 100 lần và x giữ nguyên thì hệ số của y phải giảm 100 lần. Vậy, phương trình mới có dạng x = 0,015653y + 16,3251. 4. Bài tập tổng hợp Bài 6. Để nghiên cứu sự phát triển của một loại cây trồng, người ta tiến hành đo đường kính X(cm) và chiều cao Y(m) của một số cây. Kết quả được ghi trong bảng sau đây. Y 2 3 4 5 6 7 X 20 3 5 22 2 10 24 8 12 15 5 26 4 16 7 28 8 5 a) Những cây cao 6m trở lên được gọi là cây loại một. Hãy ước lượng tỉ lệ cây loại một với độ tin cậy 89%. b) Hãy ước lượng đường kính trung bình của những cây loại một với độ tin cậy 98%, cho biết đường kính có phân phối chuẩn. c) Tìm phương trình hồi quy tuyến tính mẫu của chiều cao đối với đường kính cây. d) Giả sử trước đó chiều cao trung bình của loại cây này ở cùng độ tuổi là 5,1m. Số liệu trên được lấy ở những cây đã được áp dụng một biện pháp chăm bón mới. Với mức ý nghĩa 5%, hãy nhận xét về tác dụng của việc chăm bón đó. Giải a) Đây là bài toán ước lượng tỉ lệ tổng thể. Ta xem tổng thể là loại cây trồng đang được nghiên cứu. Gọi p là tỉ lệ cây loại một của tổng thể. Ta cần ước lượng p với độ tin cậy = 80%. Ta có kích thước mẫu định tính n = 3 + 5 + 2 + 10 + + 8 + 5 = 100. Số cây loại một trong mẫu k = 5 + 7 + 8 + 5 = 25. Do đó tỉ lệ mẫu là k 25 f = = 0,25. n 100 Tra bảng hàm số Laplace, ta thấy 0,89 (1,6) = = 0,445 nên Z = 1,6. 2 Độ chính xác f (1 f ) 0,25.0,75 = Z 1,6 = 0,0693. n 100 Vậy, tỉ lệ cây loại một của tổng thể là p = f = 0,25 0,0693 ; hay 18,07% p 31,93%. b) Đây là bài toán ước lượng kì vọng của tổng thể. 87
- Ta xem tổng thể là cây loại một. Gọi là đường kính trung bình của tổng thể. Ta cần ước lượng với độ tin cậy = 98%. Mẫu định lượng có kích thước n = 5 + 7 + 8 + 5 = 25. Ta có 24.5 26.7 28(8 5) X 26,64 ; 25 242.5 262.7 282 (8 5) X 2 712,16 ; 25 2 2 SX = 2,4704 ; S = 2,5733 ; S = 1,6042. Vì n = 25 30 nên tra bảng hàm số Laplace ta tìm được Z = Z0,05 = 1,96. 88
- Tính thống kê Y o 4,65 - 5,1 Zo = n 100 3,8. S 1,1924 Suy ra Zo > Z nên H bị bác bỏ, tức là chế độ chăm bón mới đã làm thay đổi chiều cao của cây. Mặt khác, chiều cao trung bình của mẫu hiện nay là Y = 4,54m nhỏ hơn chiều cao trung bình của tổng thể trước kia. Vậy chế độ chăm bón mới đã làm giảm chiều cao trung bình của cây. C. BÀI TẬP 1. Theo kết quả thử nghiệm độ bền của các loại dây điện có đường kính khác nhau, người ta có bảng số liệu sau đây. Đường kính (X) 0,6 2 2,2 2,45 2,6 Lực tối đa (Y) 500 560 690 760 850 a) Hãy xác định hệ số tương quan mẫu giữa X và Y. b) Tìm phương trình hồi quy tuyến tính mẫu Y theo X. 2. Điểm kiểm tra hai môn Toán và Lí của một nhóm sinh viên được cho trong bảng sau Điểm Toán (X) 7 6 7 10 4 5 7 8 8 9 Điểm Lý (Y) 8 7 7 9 5 3 8 9 6 7 a) Hãy ước lượng hệ số tương quan giữa khả năng học Toán và khả năng học Lí của sinh viên. b) Tìm phương trình hồi quy tuyến tính mẫu Y theo X và X theo Y. 3. Bảng dưới đây cho ta kết quả thu hoạch Y (tấn/ha) theo lượng phân bón X (tạ/ha) trên 100 ha ruộng. 1 2 3 4 5 a) Tìm hệ số tương quan 14 10 8 mẫu. 15 12 7 b) Tìm phương trình hồi quy 16 28 6 tuyến tính mẫu Y theo X. 17 8 9 18 12 4. Nghiên cứu mối liên hệ giữa X (ngàn đồng) là số tiền đầu tư cho việc phòng bệnh tính trên đầu người và Y (%) là tỉ lệ người mắc bệnh ở 50 địa phương, ta thu được bảng số liệu sau đây. Y 2,0 2,5 3,0 3,5 4,0 X 100 - - - 2 3 200 - - 3 6 2 300 - 4 6 3 - 400 1 6 4 1 - 500 6 3 - - - 89
- a) Tính hệ số tương quan mẫu. b) Tìm phương trình hồi quy tuyến tính mẫu Y theo X. 5. Đo chiều cao Y (m) và đường kính X (cm) của một loại cây, ta được kết quả cho trong bảng sau đây. Y 6 8 10 12 14 a) Xác định hệ số tương quan mẫu. X b) Tìm các phương trình hồi quy 30 2 17 9 3 tuyến tính mẫu. 35 10 17 9 c) Hãy ước lượng tỉ lệ cây cao trên 40 3 24 16 13 10m với độ tin cậy 95%. 45 6 24 12 50 2 11 22 6. Quan sát X và Y ta có bảng sau. Giả sử X và Y phụ thuộc tương quan Y 4 8 12 16 tuyến tính. X a) Tìm phương trình tương quan tuyến tính Y theo X. 1 – 5 16 7 5 –10 18 21 30 3 b) Ước lượng trung bình của Y khi X = 4 với độ tin cậy 95%. 10 –15 4 5 17 7. Cho X (%) và Y (g) là hai chỉ tiêu của một loại sản phẩm. Điều tra ở một số sản phẩm ta được kết quả sau. X 2 4 8 10 a) Tìm phương trình hồi quy tuyến tính Y mẫu X theo Y. 21,2 18 4 b) Giả sử trước khi điều tra, giá trị trung 22,5 5 30 9 bình của chỉ tiêu Y là 21,5kg. 23,7 7 16 15 6 Số liệu trên được lấy sau một cải tiến kỹ 30 1 thuật. Cho nhận xét về ảnh hưởng của việc cải tiến đó đối với chỉ tiêu Y của sản phẩm với mức ý nghĩa 0,05. c) Hãy dự đoán chỉ tiêu Y của sản phẩm với điều kiện X = 7%. d) Để ước lượng trung bình của chỉ tiêu X với độ tin cậy 90% thì đảm bảo độ chính xác là bao nhiêu ? 8. Khảo sát về thu nhập và tỉ lệ thu nhập chi cho giáo dục ở 400 hộ gia đình, ta thu được bảng các số liệu sau. 90
- X 10 20 30 40 50 Trong bảng này : Y . X là tỉ lệ thu nhập chi cho 550 – 650 10 40 20 giáo dục (đơn vị tính :%), 650 – 750 40 60 20 . Y là thu nhập bình quân mỗi 750 – 850 20 80 40 người/tháng (đơn vị tính : ngàn 850 – 950 30 30 10 đồng). a) Ước lượng tỉ lệ thu nhập chi cho giáo dục trung bình của một gia đình với độ tin cậy 95%. b) Những gia đình có thu nhập bình quân một người trên 850 ngàn đồng/tháng là hộ có thu nhập khá cao. Nếu nói rằng : tỉ lệ hộ có thu nhập khá cao trong toàn vùng là 17,5% thì có chấp nhận được không với mức ý nghĩa = 5% ? c) Để ước lượng tỉ lệ thu nhập chi cho giáo dục với độ chính xác = 0,8% (với số liệu của bảng trên) thì đảm bảo độ tin cậy là bao nhiêu ? d) Giả thiết X, Y có sự phụ thuộc tương quan tuyến tính. Tìm phương trình hồi quy tuyến tính mẫu X theo Y. 9. Đo độ bền và tỉ lệ cácbon một số mẫu thép của một nhà máy luyện thép, ta có bảng sau đây. X 3 – 5 5 – 9 9 – 15 15 – 20 Y 80 – 100 5 3 100 –120 8 17 20 120 – 140 2 7 15 11 140 – 160 8 10 5 160 – 200 7 3 trong đó : . X là tỉ lệ cácbon (đơn vị tính : %) , . Y là độ bền của thép (đơn vị tính : kg/cm2). a) Hãy ước lượng độ bền trung bình của thép do nhà máy sản xuất với độ tin cậy 99%. b) Theo báo cáo của nhà máy thì với tỉ lệ cácbon trong khoảng 15 – 20% thì thép có độ bền trung bình là 150 kg/cm2. Với mức ý nghĩa 5%, hãy cho kết luận về báo cáo đó. (Giả thiết Y có phân phối chuẩn). c) Tìm các phương trình hồi quy tuyến tính mẫu. 10. Quan sát một mẫu, ta có bảng thống kê lượng phân bón X (kg/ha) và năng suất lúa Y(tấn/ha) sau đây. 91
- X 120 140 160 180 200 Y 2,0 – 2,4 2 2,4 – 2,8 5 3 2,8 – 3,2 14 8 4 3,2 – 3,6 15 17 3,6 – 4,0 10 6 7 4,0 – 4,4 12 a) Lập phương trình hồi quy tuyến tính mẫu Y theo X. b) Hãy ước lượng năng suất lúa trung bình của vùng đó với độ tin cậy 95%. c) Hãy ước lượng năng suất lúa trung bình của những thửa ruộng đã dùng lượng phân bón 180kg/ha với độ tin cậy 99%. d) Để ước lượng năng suất lúa trung bình của cả vùng với độ tin cậy 99% và độ chính xác 0,05 tấn thì cần điều tra bao nhiêu ha ruộng nữa ? 92
- MỘT SỐ ĐỀ THI THAM KHẢO Thời gian làm bài : 90 phút ĐỀ SỐ 1 Câu I.(3 điểm) Phần thi trắc nghiệm của mỗi thí sinh có 3 câu hỏi, mỗi câu hỏi có 4 cách trả lời, trong đó chỉ có 1 cách trả lời đúng. Một thí sinh không thuộc câu nào chọn ngẫu nhiên 1 trong 4 câu trả lời của mỗi câu hỏi. Gọi X là số câu thí sinh đó trả lời đúng. a) Lập bảng phân phối xác suất của X, tính kì vọng và phương sai của X. b) Tính P(X 2). Câu II.(3 điểm) Có 2 hộp, mỗi hộp đựng 5 viên bi cùng cỡ, trong đó bao gồm 3 bi đỏ và 2 bi xanh. Lấy ngẫu nhiên từ hộp thứ nhất ra 2 bi bỏ vào hộp thứ hai, sau đó lại lấy ngẫu nhiên từ hộp thứ hai ra 2 bi. a) Tính xác suất để 2 bi lấy từ hộp thứ hai đều là bi đỏ. b) Bỏ 2 bi vừa lấy được từ hộp thứ hai vào hộp thứ nhất. Tính xác suất để sau khi bỏ 2 bi lấy từ hộp thứ hai vào hộp thứ nhất thì số bi đỏ ở hộp thứ nhất nhiều hơn số bi đỏ còn lại trong hộp thứ hai. Câu III. (4 điểm) Để nghiên cứu sự phát triển của một loại cây ở một lâm trường, người ta đo đường kính X(cm) và chiều cao Y(m) của một số cây cùng độ tuổi và có được bảng số liệu sau. a) Tìm phương trình hồi X 3 4 5 6 7 quy tuyến tính mẫu Y theo Y X. 20 5 b) Ước lượng đường kính 22 19 25 10 trung bình của loại cây 24 5 17 8 này với độ tin cậy 95%. 26 7 4 93
- ĐỀ SỐ 2 (Ngày thi 06/01/2004) Câu I (Xác suất – 6 điểm) Có hai cái hộp đựng sản phẩm. Hộp thứ nhất có 10 sản phẩm gồm 8 sản phẩm tốt và 2 phế phẩm ; Hộp thứ hai có 10 sản phẩm gồm 7 sản phẩm tốt và 3 phế phẩm ; 1) Từ hộp thứ nhất lấy ngẫu nhiên ra 3 sản phẩm, từ hộp thứ hai lấy ngẫu nhiên ra 2 sản phẩm. Sau đó bỏ 5 sản phẩm đã lấy vào hộp thứ ba đang rỗng. Tính xác suất để trong 5 sản phẩm đã bỏ vào hộp thứ ba có a) đúng một phế phẩm ; b) ít nhất một phế phẩm. 2) Một xạ thủ được phép bắn không quá 4 viên đạn và bắn từng viên cho đến khi trúng mục tiêu thì ngừng bắn. Xác suất bắn trúng mục tiêu ở mỗi lần bắn của xạ thủ đó đều là 0,7. Gọi X là số viên đạn mà xạ thủ đó đã bắn. a) Hãy lập bảng phân phối xác suất và hàm phân phối xác suất của X. b) Tính kì vọng, phương sai và độ lệch chuẩn của X. Câu II (Thống kê – 4 điểm) Để ước lượng số cá trong hồ ở một trại nuôi cá, người ta đánh bắt 400 con cá ngẫu nhiên đủ các loại, đánh dấu rồi thả lại xuống hồ. Một thời gian sau đánh bắt lại ngẫu nhiên một số con cá. Cân và ghi khối lượng X(kg) của từng con cá, số con cá bị đánh dấu (mi) và số con cá không bị đánh dấu (ni) có khối lượng X(kg), ta được bảng số liệu dưới đây. X 0,8 0,9 1,0 1,1 1,2 1,4 (mi) 4 7 5 2 1 1 (nj) 20 36 40 32 30 22 1) Hãy ước lượng khối lượng trung bình của mỗi con cá trong hồ với độ tin cậy 95%. 2) Ước lượng toàn thể số cá có trong hồ và ước lượng doanh thu tối thiểu khi bán hết số cá trong hồ với độ tin cậy 95%, biết rằng mỗi kg cá trị giá 15000 đồng. * Cho biết (1,96) = 0,475 ( là hàm Laplace) hoặc F(1,96) = 0,975 (F là hàm phân phối chuẩn). 94
- ĐỀ SỐ 3 (Ngày thi 15/01/2004) Câu I (Xác suất – 6 điểm) Có 3 thùng hàng. Thùng thứ nhất có 10 sản phẩm gồm : 8 sản phẩm tốt và 2 phế phẩm ; Thùng thứ hai có 10 sản phẩm gồm : 7 sản phẩm tốt và 3 phế phẩm ; Thùng thứ ba có 10 sản phẩm gồm : 6 sản phẩm tốt và 4 phế phẩm. 1) Từ mỗi thùng lấy ra ngẫu nhiên 1 sản phẩm. Gọi X là số phế phẩm trong 3 sản phẩm đã lấy. a) Lập bảng phân phối xác suất của X ; b) Tìm hàm phân phối xác suất của X ; c) Tính kì vọng và phương sai của X ; d) Tính xác suất để X 2. 2) Gieo đồng thời 2 đồng xu hai mặt sấp – ngửa cân đối đồng chất. Nếu được cả hai mặt sấp thì chọn thùng thứ nhất ; nếu được cả hai mặt ngửa thì chọn thùng thứ hai ; các trường hợp còn lại chọn thùng thứ ba. Từ thùng đã chọn lấy ra ngẫu nhiên 3 sản phẩm. a) Tính xác suất để trong 3 sản phẩm đã lấy có ít nhất một sản phẩm tốt. b) Biết rằng cả 3 sản phẩm đã lấy đều là phế phẩm, tính xác suất để 3 phế phẩm đó được lấy ra từ thùng thứ ba. Câu II (Thống kê – 4 điểm) Nghiên cứu mối quan hệ giữa điểm tuyển sinh X và điểm môn Toán cao cấp Y của sinh viên trường ĐH KTCN, chọn ngẫu nhiên một nhóm sinh viên của trường ta ghi được bảng số liệu sau X 10 12 13 15 1) Tính hệ số tương quan tuyến tính mẫu và Y lập phương trình hồi quy tuyến tính mẫu Y 4 8 5 4 - theo X. 5 5 10 3 - 2) Ước lượng điểm trung bình môn Toán cao 6 - 16 8 6 cấp của sinh viên toàn trường với độ tin cậy 7 - 11 16 8 95%. * Cho biết (1,96) = 0,475 ( là hàm Laplace) hoặc F(1,96) = 0,975 (F là hàm phân phối chuẩn). 95
- ĐỀ SỐ 4 (Ngày thi 23/06/2004) Câu I (3 điểm) Một hội chợ có 3 gian hàng tặng quà khuyến mãi. Để vào các gian hàng đó phải tung 1 súc sắc. Nếu xuất hiện mặt chẵn thì được vào gian hàng thứ nhất, mặt chia hết cho 5 thì vào gian thứ hai, các trường hợp còn lại vào gian thứ ba. Cho biết tỉ lệ khách hàng được quà khuyến mãi khi vào 3 gian hàng đó lần lượt là 20%, 40%, 30%. Giả sử bạn đi dự hội chợ. Tính xác suất để bạn tặng được quà khuyến mãi. Nếu bạn không được tặng quà thì xác suất bạn đã vào gian thứ ba là bao nhiêu ? Câu II (3 điểm) Một xạ thủ bắn 2 viên đạn vào 1 tấm bia gồm 2 vòng tròn. Bắn trúng vòng thứ nhất được 10 điểm, trúng vòng thứ hai được 6 điểm. Còn bắn trượt thì bị điểm 0. Gọi X là điểm trung bình của xạ thủ đó sau 2 lần bắn độc lập, mỗi lần 1 viên đạn. Hãy lập bảng phân phối xác suất, hàm phân phối xác suất và tính kì vọng, phương sai của X. Cho biết xác suất bắn trúng vòng thứ nhất là 0,5 ; vòng thứ hai là 0,3 ; còn xác suất bắn trượt là 0,2. Câu III (4 điểm) Cho X(kg) và Y(m) là hai đại lượng có mối quan hệ tuyến tính với bảng giá trị sau đây. X 20 25 30 35 Y 10 16 10 12 15 21 30 12 15 14 15 17 1) Hãy tìm hệ số tương quan và lập phương trình hồi quy X theo Y. Nếu Y đo bằng cm thì phương trình này thay đổi như thế nào (không tính lại mẫu). 2) Giả sử số liệu trên được đo sau khi thực hiện một công nghệ sản xuất mới, còn trước đó tỷ lệ X 30kg là 40%. Hãy đánh giá hiệu quả của công nghệ đó với mức ý nghĩa 5%. 96
- ĐỀ SỐ 5 (Ngày thi 07/08/2004) Câu I (3 điểm) Một hộp đựng 15 quả bóng bàn, trong đó có 9 quả chưa sử dụng lần nào. Lần đầu người ta lấy ngẫu nhiên 3 quả để thi đấu, sau đó trả lại vào hộp. Lần thứ hai lấy ngẫu nhiên 3 quả. Tìm xác suất để cả 3 quả lấy ra lần sau đều chưa sử dụng lần nào. Câu II (3 điểm) Trong một lô hàng có 20 sản phẩm, trong đó có 4 sản phẩm xấu, 16 sản phẩm tốt. Lấy ngẫu nhiên cùng lúc 10 sản phẩm để kiểm tra. a) Tìm xác suất lấy được toàn sản phẩm tốt. b) Gọi X là số sản phẩm tốt lấy được trong 10 sản phẩm đó. Hãy lập bảng phân phối xác suất, hàm phân phối xác suất và tính kì vọng, phương sai, độ lệch của X. Câu III (4 điểm) Kiểm tra các gói đường loại 1kg trong một siêu thị, ta có kết quả sau Khối lượng (kg) 0,95 0,96 0,97 0,99 1,00 1,01 1,03 Số gói 19 30 32 8 2 3 6 a) Với mức ý nghĩa = 0,05 có thể kết luận việc đóng gói đảm bảo yêu cầu hay không? b) Hãy ước lượng tỉ lệ số gói đường có khối lượng dưới mức qui định với độ tin cậy 95,44%. Cho biết giá trị của hàm số Laplace (1,96) = 0,475 ; (2,00) = 0,4772. 97
- ĐỀ SỐ 6 (Ngày thi 16/03/2005) Câu I (Xác suất – 6 điểm) Có 3 kiện hàng. Kiện thứ nhất có 10 sản phẩm gồm : 6 sản phẩm tốt và 4 phế phẩm ; Kiện thứ hai có 10 sản phẩm gồm : 7 sản phẩm tốt và 3 phế phẩm ; Kiện thứ ba có 7 sản phẩm gồm : 4 sản phẩm tốt và 3 phế phẩm. 1) Cùng một lúc tung hai đồng xu hai mặt sấp – ngửa cân đối đồng chất trên một mặt phẳng nằm ngang. Nếu cả hai mặt đều sấp thì từ kiện thứ nhất lấy ngẫu nhiên 1 sản phẩm, từ kiện thứ hai lấy ngẫu nhiên 2 sản phẩm. Nếu trái lại thì từ kiện thứ nhất lấy ngẫu nhiên 2 sản phảm, từ kiện thứ hai lấy ngẫu nhiên 1 sản phẩm. Gọi T là số sản phẩm tốt trong 3 sản phẩm đã lấy ra. a) Lập bảng phân phối xác suất của T ; c) Tính kỳ vọng của T ; b) Tìm hàm phân phối xác suất của T ; d) Tính phương sai của T. 2) Bỏ ba sản phẩm vừa lấy vào kiện thứ ba. Sau đó từ kiện thứ ba lấy ngẫu nhiên ra 3 sản phẩm. a) Tính xác suất để cả 3 sản phẩm đã lấy sau cùng đều tốt ; b) Biết rằng không phải cả 3 sản phẩm lấy ra sau cùng đều tốt, tính xác suất để cả 3 sản phẩm đã lấy ra từ hai kiện đầu đều là phế phẩm. Câu II (Thống kê – 4 điểm) Nghiên cứu mối quan hệ giữa vốn đầu tư X(triệu đồùng) và lãi ròng Y(triệu đồng) hàng tháng ở một công ty kinh doanh, ghi chép trong một số tháng ngẫu nhiên ta được bảng số liệu dưới đây. X 50 100 150 200 Y 1) Tìm hệ số tương quan tuyến tính mẫu và lập phương 20 10 5 2 - trình hồi quy tuyến tính mẫu Y theo X; 2) Ước lượng lãi ròng trung bình mỗi tháng của công ty 40 5 10 3 - đó với độ tin cậy 95%. 3) Có báo cáo cho rằng tỷ lệ tháng có lãi ròng cao 60 - 15 10 5 trên 65 triệu của công ty đó là 70%. Hãy kiểm định báo cáo đó với mức ý nghĩa 1%. 80 - 5 10 20 Cho biết (1,96) = 0,475 ; (2,58) = 0,495 ( là hàm tích phân Laplace). 98
- ĐÁP ÁN VÀ THANG ĐIỂM ĐỀ SỐ 1 Câu I (3 điểm) a) (2,5 điểm) * Trước hết ta tìm bảng phân phối xác suất của X (1,5 đ). Ta có X là đại lượng ngẫu nhiên rời rạc nhận các giá trị 0, 1, 2, 3. Ta tính P(X = k), k = 0,3. Xem phép thử là trả lời 1 câu hỏi, ta có dãy 3 phép thử Bernoulli. Gọi Đ là biến cố 1 sinh viên trả lời đúng câu hỏi đó thì P(Đ) = p = . 4 Áp dụng công thức Bernoulli ta được 0 3 1 0 1 1 27 P(X = 0) = P3(0 ; ) = C3 1 ; 4 4 4 64 1 2 1 1 1 3 27 P(X = 1) = P3(1 ; ) = C3 ; 4 4 4 64 2 1 1 2 1 3 9 P(X = 2) = P3(2 ; ) = C3 ; 4 4 4 64 3 0 1 3 1 3 1 P(X = 3) = P3(3 ; ) = C3 ; 4 4 4 64 Vậy bảng phân phối xác suất của X là X 0 1 2 3 P 27 27 9 1 64 64 64 64 * Tính kì vọng (0,5 đ) 27 27 9 1 48 E(X) = 0. + 1. + 2. + 3. = = 0,75. 64 64 64 64 64 * Tính phương sai (0,5 đ) 27 27 9 1 72 E(X2) = 02. + 12. + 22. + 32. = = 1,125. 64 64 64 64 64 D(X) = E(X2) – E2(X) = 0,5625. b) (0,5 điểm) Tính 9 1 10 P(X 2) = P(X = 2) + P(X = 3) = + = . 64 64 64 99
- Câu II (3 điểm) a) (1,5 điểm) Gọi Đ là biến cố lấy được 2 bi đỏ từ hộp thứ hai (sau khi có thêm bi của hộp thứ nhất). Rõ ràng Đ phụ thuộc số lượng bi đỏ được bỏ thêm vào hộp thứ hai. Do đó, ta gọi Đk là biến cố hộp thứ hai có thêm k bi đỏ của hộp thứ nhất, k = 0,2 . Khi đó, ba biến cố Đo, Đ1, Đ2 là một nhóm đầy đủ nên P(Đ) = P(Đo)P(Đ/Đo) + + P(Đ2)P(Đ/Đ2). Ta tính các xác suất ở vế phải bằng định nghĩa. Dễ thấy C2 C1 C1 C2 P(Đ ) = 2 , P(Đ ) = 2 3 , P(Đ ) = 3 ; 0 2 1 2 2 2 C5 C5 C5 C2 C2 C2 P(Đ/Đ ) = 3 , P(Đ/Đ ) = 4 , P(Đ/Đ ) = 5 . 0 2 1 2 2 2 C7 C7 C7 Vậy 1 3 6 6 3 10 69 23 P(Đ) = . . . . 10 21 10 21 10 21 210 70 b) (1,5 điểm) Gọi A là biến cố cần tìm xác suất, Bi là biến cố hộp thứ nhất có i bi đỏ sau 2 lần chuyển bi. Ta phân tích mối quan hệ giữa A với Bi. Theo đề bài, 2 bi vừa lấy ở hộp thứ hai (ta không biết chúng có màu gì) lại được bỏ vào hộp thứ nhất. Tuy nhiên, sau 2 lần chuyển bi thì số lượng bi ở mỗi hộp và tổng số bi đỏ ở cả hai hộp không thay đổi. (Mỗi hộp vẫn có 5 bi và tổng số bi đỏ vẫn là 6). Do đó, muốn A xảy ra, tức là số bi đỏ ở hộp thứ nhất phải nhiều hơn số bi đỏ còn lại ở hộp thứ hai thì B4 hoặc B5 phải xảy ra. Ta có phép toán A = B4 + B5, mà hai biến cố này xung khắc nên P(A) = P(B4) + P(B5). * Ta đi tìm P(B4), P(B5). Áp dụng công thức xác suất đầy đủ, ta có P(B4) = P(Đ0)P(B4/Đ0) + + P(Đ2)P(B4/Đ2). - Để tìm P(B4/Đ0) cần lưu ý rằng : Khi Đ0 xảy ra thì hộp thứ nhất còn lại 3 bi đỏ (hộp thứ hai có 3 bi đỏ, 4 bi xanh), nên muốn B4 xảy ra thì phải lấy thêm 1 bi đỏ và 1 bi xanh từ hộp thứ hai. Suy ra C1 C1 12 P(B /Đ ) = 3 4 . 4 0 2 C7 21 - Nếu Đ1 xảy ra thì hộp thứ nhất còn lại 2 bi đỏ, 1 bi xanh (hộp thứ hai có 4 bi đỏ, 1 bi xanh) nên cần có thêm 2 bi đỏ của hộp thứ hai. Suy ra C2 6 P(B /Đ ) = 4 . 4 1 2 C7 21 100
- Dễ thấy P(B4/Đ2) = P( ) = 0. Vậy 1 12 6 6 3 48 P(B4) = . . .0 . 10 21 10 21 10 210 . Tương tự, P(B5) = P(Đo)P(B5/Đo) + + P(Đ2)P(B5/Đ2) 1 C2 6 3 3 = . 3 .0 .0 . 2 10 C7 10 10 210 Vậy 48 3 17 P(A) = . 210 70 Câu III (4 điểm) a) (2 điểm) Từ mẫu ta tính được : X 22,94 ; 2 2 X 528,52 ; SX = 2,2764 ; Y 4,99 ; XY 115,34. Do đó a = 0,3819 ; b = - 3,7708. Vậy phương trình hồi quy tuyến tính mẫu Y theo X có dạng y = 0,3819x – 0,37708. b) (2 điểm) Đây là bài toán ước lượng giá trị trung bình của tổng thể. Xem tổng thể là toàn bộ loại cây đó ở lâm trường. Gọi đường kính trung bình của tổng thể là . Ta cần ước lượng với = 95%. Ta tính thêm phương sai mẫu hiệu chỉnh của mẫu định lượng (theo X). Ta có 100 S2 = 2,2764 nên S2 = .2,2764 = 2,2993 và S = 1,5164. X 99 Tra bảng ta được Z = 1,96 ; độ chính xác : 1,5164 = 1,96. = 0,2972. 10 Vậy = 22,94 0,2972 (cm). ĐỀ SỐ 2 Câu I (6 điểm) 1) (3 điểm) a) (1,5 điểm) Gọi A là biến cố cần tìm xác suất. 101
- Gọi Tk là biến cố lấy được k phế phẩm (và 3 – k sản phẩm tốt) từ hộp thứ nhất, k=0,3 . Gọi Ti’ là biến cố lấy được i phế phẩm ( và 2 – i sản phẩm tốt) từ hộp thứ hai, i = 0,2 . Ta có phép toán A = T1To’ + ToT1’ , trong đó các biến cố tham gia vào tích thì độc lập, các biến cố tham vào tổng thì xung khắc. Do đó P(A) = P(T1)P(To’) + P(To)P(T1’). Bằng định nghĩa ta tính được các xác suất ở vế phải. Vậy C1 C2 C2 C3 C1 C1 2352 294 P(A) = 2 8 . 7 8 . 3 7 . 3 2 3 2 C10 C10 C10 C10 5400 675 b) (1,5 điểm) Gọi B là biến cố có ít nhất 1 phế phẩm trong hộp thứ ba. Ta có B là biến cố trong hộp thứ ba không có phế phẩm nào, tức là toàn sản phẩm tốt. Khi đó C3 C2 1176 147 P( B ) = 8 . 7 . 3 2 C10 C10 5400 675 Suy ra 147 528 P(B) = 1 - . 675 675 2) (3 điểm) a) (2 điểm). Ta có X là đại lượng ngẫu nhiên rời rạc, X nhận các giá trị 1, 2, 3, 4. Để tính P(X = k), k = 1,4, ta gọi Vi là biến cố viên đạn thứ i bắn trúng mục tiêu, i=1,4. . Rõ ràng, muốn X = 1 thì V1 phải xảy ra. Do đó P(X = 1) = P(V1) = 0,7. . Biến cố X = 2 xảy ra khi viên đạn thứ nhất bắn trượt, còn viên thứ hai bắn trúng, tức là tích V1 V2 xảy ra. Do đó P(X = 2) = P(V1 V2) = 0,3.0,7 = 0,21. . Tương tự, P(X = 3) = P(V1 V2 V3) = 0,3.0,3.0,7 = 0,063. . Khi cả ba viên đầu đều bắn trượt thì bắn tiếp viên đạn cuối cùng (viên thứ tư có thể trúng hay trượt), khi ấy X = 4. Do vậy 3 P(X = 4) = P(V1 V2 V3 ) = 0,3 = 0,027. Từ đó ta có bảng phân phối xác suất là X 1 2 3 4 P 0,7 0,21 0,063 0,027 Vậy, hàm phân phối xác suất là 102
- 0 , nếu x - , 1 0,7 , nếu x 1, 2 F(x) = 0,91 , nếu x 2, 3 0,973 , nếu x 3, 4 1 , nếu x (4, ) b) (1 điểm) E(X) = 1,417 ; E(X2) = 2,539 D(X) = 0,53111 ; (X) = 0,72877 Câu II (4 điểm) 1) (2 điểm) Đây là bài toán ước lượng giá trị trung bình của tổng thể. Ta xem tổng thể là toàn bộ số cá trong hồ. Gọi khối lượng trung bình của tổng thể là , ta ước lượng với = 0,95. xi ni Từ đề bài ta có bảng số liệu sau với xi là giá trị của mẫu, ni là số phần 0,8 24 tử của mẫu (bị đánh dấu hoặc không bị đánh dấu) cùng có khối lượng 0,9 43 xi. 1,0 45 Từ đó ta tính được các đặc trưng của mẫu định lượng này là 1,1 34 n = 200, X = 1,0485 (Kg), X 2 = 1,13025 ; S = 0,1762. 1,2 31 Suy ra độ chính xác = 0,0244. 1,4 23 Vậy = 1,0485 0,0244 (Kg) hay 1,0241 1,0729. b) (2 điểm) . Để ước lượng số cá có trong hồ, tức là tổng số phần tử của tổng thể, ta cần biết tỉ lệ số cá bị đánh dấu của tổng thể. Gọi tỉ lệ này là p, số phần tử của tổng thể là N, số phần tử bị đánh dấu của tổng thể là M. Từ mẫu định tính ta tìm được n = 200 ; k = 4 + 7 + 5 + 2 + 1 + 1 = 20 ; f = 0,1. Suy ra = 0,0416. Do đó, p = 0,1 0,0416. Hay 0,0584 p 0,1416. Mặt khác, M M p = nên N = với M = 400. N p Vậy 2825 N 6849. 103
- . Để tìm doanh thu tối thiểu khi bán hết cá, ta phải tính khối lượng cá tối thiểu của tổng thể, từ đó suy ra số tiền tối thiểu khi bán hết cá trong hồ là : 15000 . 1,0241 . 2825 = 43 396 237,5 (đồng) ĐỀ SỐ 3 Câu I (6 điểm) 1) (3 điểm) a) (1,5 điểm) Ta có X là đại lượng ngẫu nhiên rời rạc, X nhận các giá trị : 0, 1, 2, 3. Ta tính P(X = k), k = 0,3. Gọi Ti là biến cố lấy được một phế phẩm từ thùng hàng thứ i (i = 1,3), ta có các biến cố T1, T2, T3 độc lập với nhau. Do đó P(X = 0) = P(T1 T2 T3 ) = 0,8 . 0,7 . 0,6 = 0,336 ; P(X = 1) = P(T1 T2 T3 + T1 T2 T3 + T1 T2 T3) = = 0,2 . 0,7 . 0,6 + 0,8 . 0,3 . 0,6 + 0,8 . 0,7 . 0,4 = 0,452 ; P(X = 2) = P(T1T2 T3 + T1 T2 T3 + T1 T2T3 = 0,2 . 0,3 . 0,6 + 0,2 . 0,7 . 0,4 + 0,8 . 0,3 . 0,4 = 0,188 ; Vậy X có bảng phân phối xác suất sau đây X 0 1 2 3 P 0,336 0,452 0,188 0,024 b) (0,5 điểm) 0 ,nếu x - , 0 0,336 ,nếu x 0, 1 F(x) = 0,788 ,nếu x 1, 2 0,976 ,nếu x 2, 3 1 ,nếu x (3, ) c) (0,5 điểm) E(X) = 0,9 ; E(X2) = 1,42 ; D(X) = 0,61. d) (0,5 điểm) P(X 2) = P(X = 0) + P(X =1) + P(X =2) = 0,976. 2) (3 điểm) a) (1,5 điểm). Gọi A là biến cố cần tìm xác suất, thì A phụ thuộc vào việc thùng nào đã được chọn trước đó. Do đó ta gọi thêm Hk là biến cố chọn được thùng hàng thứ k (k = 1,3. Khi đó H1, H2, H3 là một nhóm đầy đủ các biến cố nên P( A ) = P(H1)P( A /H1) + + P(H3)P( A /H3), trong đó A là biến cố từ hộp đã chọn lấy ra được 3 phế phẩm. Từ phép thử tung 2 đồng xu, bằng định nghĩa, ta tính được 1 1 1 P(H1) = , P(H2) = , P(H3) = . 4 4 2 Rõ ràng P( A /H1) = P() = 0 ; C3 1 P( A /H ) = 3 = ; 2 3 C10 120 C3 4 P( A /H ) = 4 = ; 3 3 C10 120 104
- 1 1 1 2 4 3 Vậy P( A ) = .0 + . + . = , 4 4 120 4 120 160 Suy ra 3 157 P(A) = 1 – P(A ) = 1 - = . 160 160 b) (1,5 điểm) Theo đề bài, biến cố A đã xảy ra, ta cần tìm P(H3/ A ). Theo công thức Bayes 2 4 . P(H3 )P(A / H3 ) 4 120 8 P(H3/ A ) = . P(A) 9 9 480 Câu II (4 điểm) 1) (2 điểm) Từ mẫu ở đề bài ta tính được n = 100 , X = 12,47 ; SX = 1,3671 ; Y = 5,83 ; SY = 1,0868 ; XY = 73,49. Do đó 73,49 12,47.5,83 RXY = = 0,5316. 1,3671.1,0868 Suy ra phương trình hồi quy tuyến tính mẫu Y theo X là Y = 0,4226x + 0,5601. 2) (2 điểm) Đây là bài toán ước lượng giá trị trung bình của tổng thể. Ta xem tổng thể là toàn bộ sinh viên Trường ĐHKTCN, gọi là điểm trung bình môn Toán cao cấp của tổng thể. Ta ước lượng với = 0,95. Ta cần tính lại phương sai và độ lệch mẫu hiệu chỉnh của mẫu định lượng theo Y. Ta có 100 S2 = 1,1811 ; S2 = .1,1811 = 1,1930 ; S = 1,0922. Y 99 Do đó 1,0922 = 1,96. = 0,2141. 10 Vậy = 5,83 0,2141. ĐỀ SỐ 4 Câu I (3 điểm) . Gọi Q là biến cố bạn được quà khuyến mãi. Rõ ràng Q phụ thuộc việc trước đó bạn đã vào gian hàng nào. Do đó, ta gọi biến cố vào gian hàng thứ k là Gk, k = 1,3. Khi ấy ta có các biến cố G1, G2, G3 là một nhóm đầy đủ nên P(Q) = P(G1)P(Q/G1) + + P(G3)P(Q/G3). 105
- Đề bài đã cho ta P(Q/Gk), k = 1,3. Còn xác suất P(Gk) được tính bằng định nghĩa. Ta có 3 1 2 P(G1) = ; P(G2) = ; P(G3) = . 6 6 6 Vậy 3 1 2 4 P(Q) = .0,2 + .0,4 + .0,3 = . 6 6 6 15 . Theo đề bài, biến cố Q đã xảy ra, ta cần tìm P(G3/ Q ). Áp dụng công thức Bayes, ta được 2 (1 0,3) P(G3 )P(Q / G3 ) 6 7 P(G3/ Q ) = . 4 22 P(Q) 1 15 Câu II (3 điểm) Ta có hai cách giải sau đây. Cách thứ nhất Gọi Vk là biến cố viên đạn thứ nhất trúng vòng tròn thứ k, k = 0,2 . (Ở đây ta xem vòng tròn thứ 0 là việc bắn trượt). Tương tự Vk’ là các biến cố tương ứng của viên đạn thứ hai. Dễ thấy các biến cố Vk, Vk’ độc lập với nhau nên với X = 0, 3, 5, 6, 8, 10, ta có 2 P(X = 0) = P(VoVo’) = 0,2 = 0,04 ; P(X = 3) = P(VoV2’ + V2Vo’) = 2.0,3.0,2 = 0,12 ; P(X = 5) = P(VoV1’ + V1Vo’) = 2.0,5.0,2 = 0,2 ; 2 P(X = 6) = P(V2V2’) = 0,3 = 0,09 ; P(X = 8) = P(V1V2’ + V2V1’) = 2.0,5.0,3 = 0,3 ; 2 P(X =10) = P(V1V1’) = 0,5 = 0,25. Vậy X có bảng phân phối xác suất là X 0 3 5 6 8 10 P 0,04 0,12 0,2 0,09 0,3 0,25 Cách thứ hai Gọi Ti là điểm của xạ thủ sau khi bắn viên đạn thứ i (i = 1,2 ). Ta có T1, T2 đều là các T T đại lượng ngẫu nhiên rời rạc, nhận các giá trị 0, 6, 10. Và X = 1 2 . Ta có bảng các giá 2 trị của X và các xác suất tương ứng sau đây. 106
- 1 X = (T1 + T2) P(X) 2 T1 P1 0 6 10 0,2 0,3 0,5 T2 P2 0 0 3 5 0,2 0,04 0,06 0,10 6 3 6 8 0,3 0,06 0,09 0,15 10 5 8 10 0,5 0,10 0,15 0,25 Suy ra P(X = 0) = 0,04 ; P(X = 3) = 0,12 ; P(X = 5) = 0,20 ; P(X = 6) = 0,09 ; P(X = 8) = 0,30 ; P(X = 10) = 0,25. * Từ bảng phân phối xác suất ta có hàm phân phối xác suất của X là 0 , nếu x - , 0 0,04 , nếu x 0, 3 0,16 , nếu x 3, 5 F(x) = 0,36 , nếu x 5, 6 0,45 , nếu x 6, 8 0,75 , nếu x 8, 10 1 , nếu x (10, ) * E(X) = 6,8 ; E(X2) = 53,52 ; D(X) = 7,28. Câu III (4 điểm) a) (2 điểm) Từ mẫu ta tính được n = 150 ; X = 27,4 ; SX = 5,1225 ; Y = 12,5733 ; SY = 1,7679 ; XY = 349,1. Từ đó RXY = 0,5070 và phương trình X theo Y có dạng x 27,4 y 12,5733 0,5070 5,1225 1,7679 Vậy x = 1,4690y + 8,9294. 107
- Trong phương trình này x đo bằng kg, y đo bằng m. Nếu y đo bằng cm thì vế phải giảm 100 lần nên vế trái phải giảm 100 lần. Khi đó phương trình trở thành x = 1,4690y + 8,9294 100 hay x = 146,90y + 892,94. b) (2 điểm) Đây là bài toán được đưa về bài toán kiểm định. Gọi p là tỉ lệ X 30 kg sau khi áp dụng công nghệ sản xuất mới. Ta giả thiết H : “p = 40%”, như trước khi áp dụng công nghệ đó. Nếu chấp nhận giả thiết thì việc áp dụng công nghệ đó không có tác dụng, nếu bác bỏ thì tỉ lệ X 30 kg đã thay đổi. Ta tiến hành kiểm định với = 0,05. Từ mẫu định tính (theo X) ta tính được N = 150 ; k = 30 + 12 + 15 + 17 = 74 ; f = 0,4933. 0,4933 0,4 150 Zo = = 2,3325 > Z . 0,4.0,6 Do đó ta bác bỏ H. Vì tỉ lệ mẫu f > po = 0,4 nên công nghệ sản xuất mới đã làm tăng tỉ lệ X 30 kg. ĐỀ SỐ 5 Câu I (3 điểm) Gọi C là biến cố cả 3 quả bóng bàn lấy ra ở lần thứ hai đều chưa sử dụng lần nào. Gọi Si là biến cố trong 3 quả bóng lấy ra ở lần thứ nhất có i quả đã sử dụng i = 0,3. Ta có So, S1, S2, S3 là một nhóm đầy đủ nên 3 P(C) = P(Si )P(C/ Si ) . i 0 . Các xác suất P(Si) được tính bằng định nghĩa. Chẳng hạn, xem phép thử thứ nhất là lấy 3 quả bóng từ 15 quả ; biến cố So xảy ra khi ta lấy được 3 quả từ 9 quả chưa sử dụng ; biến cố S1 xảy ra khi lấy 1 quả từ 6 quả đã sử dụng và 2 quả từ 9 quả chưa sử dụng ; v.v Khi đó C3 C1 C2 P(S ) = 9 ; P(S ) = 6 9 , 0 3 1 3 C15 C15 C2C1 C3 P(S ) = 6 9 ; P(S ) = 6 . 2 3 4 3 C15 C15 . Ta tính P(C/Si), i = 0,3 . - Khi So đã xảy ra, ta có 3 quả “chưa sử dụng” biến thành “đã sử dụng” nên chỉ còn lại 6 quả chưa sử dụng lần nào mà thôi. Suy ra C3 P(C/S ) = 6 . o 3 C15 108
- - Khi S1 đã xảy ra còn lại 7 quả chưa sử dụng nên C3 P(C/S ) = 7 . 1 3 C15 Tương tự, C3 C3 P(C/S ) = 8 ; P(C/S ) = 9 . 2 3 3 3 C15 C15 Vậy 3696 P(C) = . 41405 Câu II (3 điểm) a) (1 điểm) Gọi S là biến cố lấy được 10 sản phẩm tốt. Theo định nghĩa C10 14 P(S) = 16 = . 10 C20 323 b) (2 điểm). Ta có X là đại lượng ngẫu nhiên rời rạc, nhận các giá trị : 6 (ứng với số sản phẩm xấu tối đa là 4), 7, 8, 9, 10. Ta tính P(X = k), k = 6,10 . Tương tự câu a), theo định nghĩa, ta tính được C6 C4 14 C7 C3 80 P(X = 6) = 16 4 ; P(X = 7) = 16 4 ; 10 10 C20 323 C20 323 C8 C2 135 C9 C1 80 P(X = 8) = 16 4 ; P(X = 9) = 16 4 ; 10 10 C20 323 C20 323 C10 14 P(X = 10) = 16 . 10 C20 323 Vậy bảng phân phối xác suất của X là X 6 7 8 9 10 14 80 135 80 14 P 323 323 323 323 323 * Hàm phân phối xác suất 0 , nếu x - , 6 14/ 323 , nếu x 6, 7 94/ 323 , nếu x 7, 8 F(x) = 223/ 323 , nếu x 8, 9 309 / 323 , nếu x 9, 10 1 , nếu x (10, ) * E(X) = 8 ; E(X2) = 64,8418 ; 109
- 16 4 D(X) = 0,8418 = ; (X) = 0,9175. 19 19 Câu III (4 điểm) a) (2 điểm) Đây là bài toán kiểm định. Ta xem tổng thể là toàn bộ số gói đường có trong siêu thị. Gọi là khối lượng trung bình của tổng thể. Ta giả thiết H : “ = 1 kg”, đúng như quy định đã ghi trên bao bì. Nếu giả thiết được chấp nhận thì việc đóng gói đảm bảo yêu cầu và ngược lại. Ta tiến hành kiểm định với = 0,05. Mẫu định lượng ở đề bài cho ta các số liệu n = 100, X = 0,9702 (kg), S = 0,0206. Do đó 0,9702 1 100 Zo = = 14,466 > Z . 0,0206 Suy ra H bị bác bỏ. Vì X < o = 1 kg nên máy đóng gói không đảm bảo quy định về khối lượng các gói đường. b) Đây là bài toán ước lượng tỉ lệ tổng thể. Gọi tỉ lệ các gói đường có khối lượng dưới mức quy định của tổng thể là p. Ta cần ước lượng p với = 0,9544. Từ mẫu định tính ta có n = 100, k = 19 + 30 + 32 + 8 = 89 Do đó f = 0,89 ; độ chính xác = 0,0626 Vậy p = 0,89 0,0626, hay 82,74% p 95,26%. ĐỀ SỐ 6 Câu I (6 điểm) 1) (3 điểm) a) (1,5 điểm) Ta có T là đại lượng ngẫu nhiên rời rạc, T nhận các giá trị 0, 1, 2, 3. Ta tính P(T = k), k = 0,3. Gọi S là biến cố xuất hiện hai mặt sấp khi gieo 2 đồng xu. Ta có 1 3 P(S) = ; P( S) = . 4 4 Rõ ràng, các biến cố “T = k” đều phụ thuộc nhóm đầy đủ S, S . Do đó P(T = k) = P(S)P(T = k/S) + P(S )P(T = k/S) Ta tính các xác suất P(T = k/S) và P(T = k/S), k = 0,3. - Khi S xảy ra, để T = 0 xảy ra thì phải lấy 1 phế phẩm từ kiện thứ nhất và 2 phế phẩm từ kiện thứ hai. Do đó C1 C2 12 P(T = 0/S) = 4 . 3 = ; 1 2 C10 C10 450 110
- Tương tự, C2 C1 18 P(T = 0/ ) = 4 . 3 = . S 2 1 C10 C10 450 - Đối với các biến cố còn lại, ta cũng tính tương tự và được kết quả C1 C1 .C1 C1 C2 102 P(T = 1/S) = 4 . 7 3 + 6 . 3 ; 1 2 1 2 C10 C10 C10 C10 450 C1 C1 C1 C2 C1 114 P(T = 1/S ) = 6 4 . 3 + 4 . 7 = ; 2 1 2 1 C10 C10 C10 C10 450 C1 C2 C1 C1 C1 210 P(T = 2/S) = 4 . 7 + 6 . 7 3 = ; 1 2 1 2 C10 C10 C10 C10 450 C2 C1 C1 C1 C1 213 P(T = 2/S ) = 6 . 3 + 6 4 . 7 = ; 2 1 2 1 C10 C10 C10 C10 450 C1 C2 126 P(T = 3/S) = 6 . 7 ; 1 2 C10 C10 450 C2 C1 105 P(T = 3/S ) = 6 . 7 . 2 1 C10 C10 450 Vậy 22 148 283 147 P(T = 0) = ; P(T = 1) = ; P(T = 2) = ; P(T = 3) = . 600 600 600 600 Suy ra bảng phân phối xác suất của T là T 0 1 2 3 22 148 283 147 P 600 600 600 600 b) (0,5 điểm) Hàm phân phối xác suất 0 , nếu t - , 0 22 / 600 , nếu t 0, 1 F(t) = 170 / 600 , nếu t 1, 2 453/ 600 , nếu t 2, 3 1 , nếu t (3, ) 1155 2603 c) (0,5 điểm) E(T) = ; E(T2) = 600 600 d) (0,5 điểm) D(X) = 0,6327. 2) (3 điểm) a) (1,5 điểm) Gọi B là biến cố cả 3 sản phẩm lấy ra sau cùng đều là sản phẩm tốt. Vì T k,k 0,3 là nhóm đầy đủ nên 3 P(B) = P(T k)P(B/ T k). k 0 111
- Ta tính P(B/T = k) bằng định nghĩa. Chẳng hạn, khi T = 0 thì kiện thứ ba có 4 sản phẩm tốt và 6 phế phẩm. Do đó phép thử là lấy 3 sản phẩm từ 10 sản phẩm và B xảy ra khi ta lấy 3 sản phẩm tốt từ 4 sản phẩm tốt. Như vậy 3 C4 P(B/T = 0) = 3 . C10 Tương tự, 3 3 C5 C6 P(B/T=1) = 3 , P(B/T=2) = 3 , C10 C10 3 C7 P(B/T=3) = 3 , C10 12373 Vậy P(B) = . 7200 b) (1,5 điểm) Theo đề bài, biến cố B đã xảy ra, ta cần tính P(T = 0/ B). Áp dụng công thức Bayes, ta được 22 4 (1 ) P(T 0)P(B/ T 0) 2552 P(T = 0/ B) = 600 120 . 12373 59627 P(B) 1 7200 Câu II (4 điểm) 1) (2 điểm) Từ mẫu ta tính được n = 100 ; X = 130 ; SX = 50,9902 ; Y = 56,6 ; SY = 21,7357 ; XY = 8140. Từ đó ta có RXY = 0,7056 và phương trình có dạng y = 0,3008x + 17,496. 2) (1 điểm) Đây là bài toán ước lượng giá trị trung bình của tổng thể với n = 100 > 30 và = 0,95. Do đó ta cần tính độ lệch mẫu hiệu chỉnh theo Y. Sử dụng mẫu ở câu 1) ta có 100 S2 = 472,44 ; S2 = .472,44 = 477,2121 ; S = 21,8452. Y 99 Suy ra 21,8452 = 1,96 = 4,2817. 10 Vậy, công ty đó có lãi ròng trung bình hàng tháng là = Y = 56,6 4,2817 (triệu đồng) 3) (1 điểm) Đây là bài toán kiểm định. Gọi p là tỉ lệ tháng có lãi ròng cao trên 65 triệu của công ty (ta xem công ty là tổng thể). Ta có giả thiết H : “p = 70%”. Ta cần kiểm định giả thiết này với = 0,01. Từ mẫu định tính ta có 112
- n = 100, k = 5 + 10 + 20 = 35. Do đó f = 0,35 0,35 0,70 Zo = .10 = 7,6 > Z = 2,58. 0,7.0,3 Suy ra H bị bác bỏ. Vậy, báo cáo đó không chấp nhận được. 113
- CÁC BẢNG SỐ a ke a Bảng 1 : GIÁ TRỊ CỦA HÀM P (a) k k! a 0.1 0.2 0.3 0.4 0.5 0.6 k 0 0.904837 0.818731 0.740818 0,670320 0,606531 0,548812 1 0.090481 0.163746 0.222245 0.268128 0,303265 0,329287 2 0.001521 0.016375 0.033337 0,053626 0,075817 0,098786 3 0.000151 0.001091 0.033334 0,007150 0,012636 0,019757 4 0.000004 0.000055 0.000250 0,000715 0,001580 0,002964 5 0.000002 0.000015 0,000057 0,000158 0,000356 6 0.000001 0,000004 0,000013 0,000035 7 0.000001 0,000003 a 0,7 0,8 0,9 1,0 2,0 3,0 k 0 0,496585 0,449329 0,406570 0,367877 0,135335 0,049787 1 0,347610 0,359463 0,365913 0,367879 0,270671 0,149361 2 0,121663 0,113785 0,164661 0,483940 0,270671 0,224042 3 0,028388 0,038343 0,049398 0,0611313 0,180447 0,224042 4 0,004968 0,007669 0,011115 0,015328 0,090224 0,168031 5 0,000695 0,001227 0,002001 0,003066 0,036089 0,100819 6 0,000081 0,000164 0,000300 0,000511 0,012030 0,050409 7 0,000008 0,000019 0,000039 0,000073 0,003137 0,021604 8 0,000002 0,000004 0,000009 0,000859 0,008101 9 0,000001 0,000191 0,002701 10 0,000038 0,000810 11 0,000007 0,000221 12 0,000001 0,000055 13 0,000013 14 0,000003 15 0,000001 114
- a 4,0 5,0 6,0 7,0 8,0 9,0 k 0 0,018316 0,006738 0,002479 0,000912 0,000335 0,000123 1 0,073263 0,033690 0,014873 0,006383 0,002684 0,001111 2 0,146525 0,084224 0,044618 0,022341 0,010735 0,004998 3 0,195367 0,140374 0,089235 0,052129 0,028626 0,014994 4 0,195367 0,175467 0,133853 0,091226 0,057252 0,033737 5 0,156293 0,175467 0,160623 0,127717 0,091604 0,060727 6 0,104194 0,146223 0,160623 0,149003 0,122138 0,091090 7 0,059540 0,104445 0,137677 0,149003 0,139587 0,117116 8 0,029770 0,065278 0,103258 0,130377 0,139587 0,131756 9 0,013231 0,036266 0,068838 0,101405 0,124077 0,131756 10 0,005292 0,018133 0,041303 0.070983 0,099262 0,118580 11 0,001925 0,008242 0,022529 0,045171 0,072190 0,097020 12 0,000642 0,003434 0,011262 0,026350 0,048127 0,072765 13 0,000197 0,001321 0,005199 0,014188 0,029616 0,050376 14 0,000056 0,000472 0,002228 0,007094 0,016924 0,032384 15 0,000015 0,000157 0,000891 0,003311 0,009026 0,019431 16 0,000004 0,000049 0,000334 0,001448 0,004513 0,010930 17 0,000001 0,000014 0,000118 0,000596 0,002124 0,005786 18 0,000004 0,000039 0,000232 0,000944 0,002893 19 0,000001 0,000012 0,000085 0,000397 0,001370 20 0,000004 0,000030 0,000159 0,000617 21 0,000001 0,000010 0,000061 0,000264 22 0,000003 0,000022 0,000108 23 0,000001 0,000008 0,000042 24 0,000003 0,000016 25 0,000001 0,000006 26 0,000002 27 0,000001 115
- x2 1 Bảng 2 : GIÁ TRỊ HÀM GAUSSE f (x) e 2 2π x 0 1 2 3 4 5 6 7 8 9 0,0 0,3989 3989 3989 3986 3986 3984 3982 3980 3977 3973 0,1 3970 3965 3961 3956 3951 3945 3939 3932 3925 3918 0,2 3910 3902 3894 3885 3876 3867 3857 3847 3836 3825 0,3 3814 3802 3790 3778 3765 3752 3739 3726 3712 3697 0,4 3683 3668 9653 3637 3621 3605 3589 3572 3555 3538 0,5 3521 3503 3485 3467 3448 3929 3410 3391 3372 3352 0,6 3332 3312 3292 3271 3251 3230 3209 3187 3166 3144 0,7 3123 3101 3079 3056 3034 3011 2989 2966 2943 2920 0,8 2897 2874 2850 2827 2803 2780 2756 2732 2709 2685 0,9 2661 2637 2613 2589 2565 2541 1516 2492 2468 2444 1,0 0,2420 2396 2371 2347 2323 2299 2275 2251 2227 2203 1,1 2179 2155 2131 2107 2083 2059 2036 2012 1989 1965 1,2 1942 1919 1895 1872 1849 1826 1804 1781 1758 1736 1,3 1714 1691 1669 1647 1626 1604 1582 1561 1539 1518 1,4 1497 1476 1456 1435 1415 1394 1374 1354 1334 1315 1,5 1295 1276 1257 1238 1219 1200 1182 1163 1145 1127 1,6 1109 1092 1074 1057 1040 1023 1006 0989 0973 0957 1,7 0940 0925 0909 0893 0878 0863 0848 0833 0818 0804 1,8 0790 0775 0761 0748 0734 0721 0707 0694 0681 0669 1,9 0656 0644 0632 0620 0608 0596 0584 0573 0562 0551 2,0 0,0540 0529 0519 0508 0498 0488 0478 0468 0459 0449 2,1 0440 0431 0422 0413 0404 0396 0388 0379 0371 0363 2,2 0355 0347 0339 0332 0325 0317 0310 0303 0297 0290 2,3 0283 0277 0270 0264 0258 0252 0246 0241 0235 0229 2,4 0224 0219 0213 0208 0203 0198 0194 0189 0184 0180 2,5 0175 0171 0167 0163 0158 0154 0151 0147 0143 0139 2,6 0136 0132 0129 0126 0122 0119 0116 0113 0110 0107 2,7 0104 0101 0099 0096 0093 0091 0088 0086 0084 0081 2,8 0079 0077 0075 0073 0071 0069 0067 0065 0063 0061 2,9 0060 0058 0056 0055 0053 0051 0050 0048 0047 0046 3,0 0,0044 0043 0042 0040 0039 0038 0037 0036 0035 0034 3,1 0033 0031 0031 0030 0029 0028 0027 0026 0025 0025 3,2 0024 0023 0022 0022 0021 0020 0020 0019 0018 0018 3,3 0017 0017 0016 0016 0015 0015 0014 0014 0013 0013 3,4 0012 0012 0012 0011 0011 0010 0010 0010 0009 0009 3,5 0009 0008 0008 0008 0008 0007 0007 0007 0007 0006 3,6 0006 0006 0006 0006 0006 0005 0005 0005 0005 0004 3,7 0004 0004 0004 0004 0004 0004 0003 0003 0003 0003 3,8 0003 0003 0003 0003 0003 0002 0002 0002 0002 0002 3,9 0002 0002 0002 0002 0002 0002 0002 0002 0001 0001 x 0 1 2 3 4 5 6 7 8 9 116
- t2 1 x 2 Bảng 3 : HÀM LAPLACE Φ(x) e dt 2π 0 x 0 1 2 3 4 5 6 7 8 9 0,0 0,00000 00399 00798 01197 01595 01994 02392 02790 03188 03586 0.1 03983 04380 04776 05172 05567 05962 06356 06749 07142 07535 0.2 07926 08317 08706 09095 09483 09871 10257 10642 11026 11409 0.3 11791 12172 12556 12930 13307 13683 14058 14431 14803 15173 0.4 15542 15910 16276 16640 17003 17364 17724 18082 18439 18793 0.5 19146 19497 19847 20194 20194 20884 21226 21566 21904 22240 0.6 22575 22907 23237 23565 23891 24215 24537 24857 25175 25490 0.7 25804 26115 26424 26730 27035 27337 27637 27935 28230 28524 0.8 28814 29103 29389 29673 29955 30234 30511 30785 31057 31327 0.9 31594 31859 32121 32881 32639 32894 33147 33398 33646 33891 1,0 34143 34375 34614 34850 35083 35314 35543 35769 35993 36214 1.1 36433 36650 36864 37076 37286 37493 37698 37900 38100 38298 1,2 38493 38686 38877 39065 39251 39435 39617 39796 39973 40147 1.3 40320 40490 40658 40824 40988 41149 41309 41466 41621 41774 1,4 41924 42073 42220 42364 42507 42647 42786 42922 43056 43189 1.5 43319 43448 43574 43699 43822 43943 44062 44179 44295 44408 1.6 44520 44630 44738 44815 44950 45053 45154 45254 45352 45449 1.7 45543 45637 45728 45818 45907 45994 46080 46164 46246 46327 1.8 46407 46485 46562 46638 46712 46784 46856 46926 46995 47062 1.9 47128 47193 47257 47320 47381 47441 47500 47558 47615 47670 2,0 47725 47778 47831 47882 47932 47982 48030 48077 48124 48169 2.1 48214 48257 48300 48341 48382 48422 48461 48500 48537 48574 2.2 48610 48645 48679 48713 48745 48778 48809 48840 48870 48899 2.3 48928 48956 48983 49010 49036 49061 49086 49111 49134 49158 2.4 49180 49202 49224 49245 49266 49285 49305 49324 49343 49361 2.5 49379 49396 49413 49430 49446 49261 49477 49492 49506 49520 2.6 49534 49547 49560 49573 49585 49598 49609 49621 49632 49643 2.7 49653 49664 49674 49683 49693 49702 49711 49720 49728 49763 2.8 49744 49752 49760 49767 49774 49781 49788 49795 49801 49807 2.9 49813 49819 49825 49831 49836 49841 49846 49851 49856 49861 3,0 0,49865 3,1 48903 3,2 49931 3,3 49952 3,4 49966 3.5 49977 3,6 49984 3,7 49989 3,8 49993 3,9 49995 4,0 499968 4.5 499997 4999999 5,0 7 117
- Bảng 4 : PHÂN PHỐI KHI BÌNH PHƯƠNG 2, P(X > 2 (n, )) VỚI X 2 (n) n 0,995 0,99 0,975 0,95 0,05 0,025 0,01 0,005 1 0,0000393 0,000157 0,000982 0,00393 3,841 5,024 6,635 7,879 2 0,0100 0,0201 0,0506 0,103 5,991 7,378 9,210 10,597 3 0,0717 0,115 0,216 0,352 7,815 9,348 11,345 12,838 4 0,207 0,297 0,484 0,711 9,488 11,143 13,277 14,860 5 0,412 0,554 0,831 1,145 11,071 12,833 15,086 16,749 6 0,676 0,872 1,237 1,635 12,592 14,449 16,812 18,548 7 0,989 1,239 1,690 2,167 14.067 16,013 18,475 20,278 8 1,344 1,646 2,180 2,733 15,507 17,535 20,090 21,955 9 1,735 2,088 2,700 3,325 16,919 19,023 21,666 13,590 10 2,156 2,558 3,247 3,940 18,307 20,483 23,209 25,188 11 2,603 3,053 3,816 4,575 19,675 21,920 24,725 26,758 12 3,074 3,571 4,404 5,226 21,026 23,337 26,217 28,299 13 3,565 4,107 5,009 5,892 22,362 24,736 27,688 29,820 14 4,075 4,660 5,629 6,571 23,685 26,119 29,142 31,320 15 4,601 5,229 6,262 7,261 24,996 27,489 30,578 32,801 16 5,142 5,812 6,908 7,962 26,296 28,845 32,000 34,268 17 5,697 6,408 7,564 8,672 27,587 30,191 33,409 35,717 18 6,265 7,015 8,231 9,390 28,869 31,526 34,805 37,156 19 6,844 7,633 8,907 10,117 30,144 32,853 36,191 38,581 20 7,434 8,260 9,591 10,851 31,410 34,170 37,566 39,997 21 8,034 8,897 10,283 11,591 32,671 35,479 38,932 41,400 22 8,643 9,542 10,982 12,338 33,926 36,781 40,289 42,796 23 9,260 10,196 11,689 13,091 35,172 38,075 41,638 44,184 24 9,886 10,856 12,401 13,848 36,415 39,364 42,980 45,559 25 10,520 11,524 13,120 14,611 37,652 40,646 44,314 46,930 26 11,160 12,198 13,844 15,379 38,885 41,924 45,643 48,290 27 11,808 12,878 14,573 16,151 40,113 43,195 46,963 49,647 28 12,461 13,565 15,308 16,928 41,337 44,461 48,278 50,994 29 13,121 14,256 16,047 17,708 42,557 45,722 49,588 52,338 30 13,787 14,953 16,791 18,493 43,773 46,979 50,892 53,673 118
- Bảng 5 : PHÂN PHỐI STUDENT t : P( X > t(n, )) = VỚI X t(n) n 0,20 0,10 0,05 0,02 0,01 0,001 1 3,078 6,314 12,706 31,820 63,526 363,6 2 1,886 2,920 4,303 6,965 9,925 31,600 3 1,638 2,353 3,182 4,541 5,841 12,922 4 1,533 2,132 2,776 3,747 4,604 8,610 5 1,476 2,015 2,571 3,365 4,032 6,869 6 1,440 1,943 2,447 3,143 3,707 5,959 7 1,415 1,895 2,365 2,998 3,499 5,408 8 1,397 1,860 2,306 2,896 3,355 5,041 9 1,383 1,833 2,262 2,821 3,250 4,781 10 1,372 1,812 2,228 2,764 3,169 4,587 11 1,363 1,796 2,201 2,718 3,106 4,437 12 1,356 1,782 2,179 2,681 3,055 4,318 13 1,350 1,771 2,160 2,650 3,012 4,221 14 1,345 1,761 2,145 2,624 2,977 4,140 15 1,341 1,753 2,131 2,602 2,947 4,073 16 1,337 1,746 2,120 2,583 2,921 4,015 17 1,333 1,740 2,110 2,567 2,898 3,965 18 1,330 1,734 2,101 2,552 2,878 3,922 19 1,328 1,729 2,093 2,539 2,861 3,883 20 1,325 1,725 2,086 2,528 2,845 3,850 21 1,323 1,721 2,080 2,518 2,831 3,819 22 1,321 1,717 2,074 2,508 2,819 3,792 23 1,319 1,714 2,069 2,500 2,807 3,767 24 1,318 1,711 2,064 2,492 2,797 3,745 25 1,316 1,708 2,060 2,485 2,787 3,725 26 1,315 1,706 2,056 2,479 2,779 3,707 27 1,314 1,703 2,052 2,473 2,771 3,690 28 1,313 1,701 2,048 2,467 2,763 3,674 29 1,311 1,699 2,045 2,462 2,756 3,659 + 1,282 1,645 1,960 2,326 2,576 3,291 119
- TÀI LIỆU THAM KHẢO 1. Đậu Thế Cấp, Lê Thiên Hương. Lý thuyết xác suất và Thống kê toán học. Trường Đại học kĩ thuật công nghệ (Lưu hành nội bộ), 1998. 2. Đinh Văn Gắng. Bài tập xác suất và thống kê. NXB Giáo dục, 2000. 3. Đặng Hấn. Bài tập xác suất thống kê. Trường Đại học kinh tế TP.Hồ Chí Minh (Lưu hành nội bộ), 1994. 4. Hoàng Ngọc Nhậm. Bài tập xác suất thống kê. NXB Thống kê, 1996. 5. Đặng Hùng Thắng. Bài tập xác suất. NXB Giáo dục, 1998. 6. Tống Đình Quỳ. Hướng dẫn giải bài tập Xác suất Thống kê. NXB Giáo dục, 1998. 120