Bài giảng Xác suất thống kê - Phan Trọng Tiến

pdf 59 trang ngocly 2040
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Phan Trọng Tiến", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_phan_trong_tien.pdf

Nội dung text: Bài giảng Xác suất thống kê - Phan Trọng Tiến

  1. BÀI GIẢNG XÁC SUẤT THỐNG KÊ
  2. Mục lục — 1 — Mục lục 1 Chương 1 Giải tích tổ hợp 2 1.1 Hoán vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Chỉnh hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4 Công thức nhị thức Newton . . . . . . . . . . . . . . . . . . . . . . . 3 1.5 Tích đề các . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Bài tập chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Chương 2 Biến cố và xác suất của biến cố 6 2.1 Phép thử ngẫu nhiên và không gian mẫu . . . . . . . . . . . . . . . . 6 2.2 Quan hệ giữa các biến cố và các phép toán . . . . . . . . . . . . . . 7 2.3 Xác suất của các biến cố . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.4 Các Công thức tính xác suất . . . . . . . . . . . . . . . . . . . . . . . 11 2.5 Công thức Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.6 Công thức xác suất đầy đủ . . . . . . . . . . . . . . . . . . . . . . . . 14 2.7 Công thức Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Bài tập chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Chương 3 Đại lượng ngẫu nhiên và quy luật phân phối xác suất 21 3.1 Định nghĩa và phân loại các đại lượng ngẫu nhiên . . . . . . . . . . . 21 3.2 Qui luật phân phối xác suất của ĐLNN . . . . . . . . . . . . . . . . . 21 3.3 Các tham số đặc trưng của đại lượng ngẫu nhiên . . . . . . . . . . . 24 3.4 Một số qui luật phân phối xác suất thông dụng . . . . . . . . . . . . 28 Bài tập chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 Chương 4 Đại cương về thống kê toán 34 4.1 Tổng thể và mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . 34 4.2 Các đặc trưng tương ứng của tổng thể và mẫu . . . . . . . . . . . . . 35 4.3 Ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 4.4 Ước lượng khoảng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4.5 Kiểm định giả thiết thống kê . . . . . . . . . . . . . . . . . . . . . . . 45 Bài tập chương 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Tài liệu tham khảo 58 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  3. Chương 1 — 2 — GIẢI TÍCH TỔ HỢP 1.1 HOÁN VỊ Cho tập hợp M gồm n(n ≥ 1) phần tử. + Mỗi cách sắp xếp của n phần tử của M theo một thứ tự nhất định gọi là một hoán vị của n phần tử đã cho. + Kí hiệu số các hoán vị khác nhau của n phần tử là Pn + Pn = n! Ví dụ 1.1.1. Có bao nhiêu cách khác nhau để sắp xếp 4 em học sinh vào 4 ghế ngồi. Giải: Có P4 = 4! = 24 cách. 1.2 Chỉnh hợp 1.2.1 Chỉnh hợp không lặp Cho tập M gồm n(n ≥ 1) phần tử và k là một số nguyên dương + Mỗi cách sắp xếp k phần tử của tập hợp M theo một tứ tự nhất định được gọi là một chỉnh hợp không lặp chập k của n phần tử đã cho. + Ký hiệu số các chỉnh hợp không lặp chập k khác nhau của n phần tử đã cho k là An. + Hai chỉnh hợp không lặp chập k khác nhau khi chúng có một phần tử khác nhau hoặc chúng có thứ tự khác nhau. n! Ak = = n(n − 1) (n − k + 1) n (n − k)! Ví dụ 1.2.1. Có bao nhiêu số khác nhau gồm 3 chữ số được thiết lập từ {1, 2, 3, 4, 5}. Giải: Một số có 3 chữ số được lập từ {1, 2, 3, 4, 5} tương ứng với một chỉnh hợp không lặp chập 3 của 5 số 1, 2, 3, 4, 5. Vậy các số khác nhau gồm 3 chữ sỗ được thiết lập từ 1, 2, 3, 4, 5 bằng: 5! 5.4.3.2.1 A3 = = = 60 5 (5 − 3)! 2.1 1.2.2 Chỉnh hợp lặp + Gọi chỉnh hợp lặp chập k của n phần tử của tập M là một tập hợp có thứ tự gồm k phần tử lấy từ tập M, mà mỗi phần tử của nó có thể có mặt tới k lần. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  4. + Số các chỉnh hợp lặp chập k của n phần tử là nk. — 3 — Ví dụ 1.2.2. Lập tất cả các chỉnh hợp lặp chập 3 của 2 phần tử {1, 2}. Giải: {1, 1, 1}; {1, 1, 2}; {1, 2, 1}; {1, 2, 2}; {2, 1, 1}; {2, 1, 2}; {2, 2, 1}; {2, 2, 2}. Nghĩa là có 23 = 8 chỉnh hợp lặp chập 3 khác nhau của 2 phần tử. Ví dụ 1.2.3. Có bao nhiêu cách trao 15 phần thưởng cho 5 người dự thi. Giải: Mỗi cách phân 15 sản phẩm cho 5 người là một chỉnh hợp chập 15 của 5. Vậy số cách để phân ngẫu nhiên 15 phần thưởng cho 5 người là: 515. 1.3 Tổ hợp Cho tập M gồm n phần tử. + Một tổ hợp (không kể thứ tự) gồm k phần tử (k ≤ n) của tập M được gọi là một tổ hợp chập k của n phần tử đã cho. + Hai tổ hợp chập k của n phần tử đã cho được gọi là khác nhau nếu chúng có một phần tử khác nhau. k + Số các tổ hợp chập k khác nhau của n phần tử đã cho được kí hiệu là: Cn. n! Ck = n k!(n − k)! + Chú ý: 0! = 1. Ví dụ 1.3.1. Có bao nhiêu cách để chọn 3 cuốn sách trong số 10 cuốn. Giải: mỗi cách chọn 3 cuốn sách trong số 10 cuốn là một tổ hợp chập 3 của 10. Vậy số cách chọn là: 10! 10.9.8 C3 = = = 120 10 3!(10 − 3)! 3.2.1 Ví dụ 1.3.2. Có bao nhiêu cách để chọn ra 5 người trong lớp có 45 người để đi lao 45! động. Giải: C5 = 45 5!(45 − 5)! 1.4 Công thức nhị thức Newton n n X k k n−k (a + b) = Cna b k=0 1.5 Tích đề các + Tích đề các của các tập hợp A1, , Ak được định nghĩa và kí hiệu bởi A1 × A2 × × Ak = {(a1, , ak)|ai ∈ Ai} Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  5. — 4 — + Nếu Ai có ni phần tử thì tích đề các A1, , Ak có n1 nk phần tử. Ví dụ 1.5.1. Có 5 con đường để đi từ A đến B và 6 con đường để đi từ B đến C. Hỏi có bao nhiêu cách để đi từ A đến C mà qua B. Giải: Mỗi cách lựa chọn là một phần tử của tích đề các của các tập hợp tương ứng có 5 và 6 phần tử. Vậy số cách lựa chọn là: 5.6 = 30. BÀI TẬP CHƯƠNG 1 1.1. Một lớp có 50 học sinh, cần bầu ra 5 chức vụ là: lớp trưởng, lớp phó học tập, lớp phó văn thể, bí thư chi đoàn, phó bí thư chi đoàn. Hỏi có bao nhiêu cách lựa chọn nếu a) Mỗi người có thê kiêm nhiệm tối đa 5 nhiệm vụ. b) Mỗi người có thể kiêm nhiệm tối đa 3 nhiệm vụ. c) Mỗi người có thể kiêm nhiệm tối đa 2 nhiệm vụ. d) Mỗi người có thể kiêm nhiệm tối đa 1 nhiệm vụ. 1.2. Có 14 cuốn sách sắp đặt trên một giá sách. Hỏi có bao nhiêu cách sắp xếp nếu: a) Giá chỉ có một ngăn đủ cho 14 cuốn. b) Giá có hai ngăn, mỗi ngăn đủ chổ cho 14 cuốn. c) Giá có hai ngăn, mỗi ngăn đủ chổ cho 7 cuốn. d) Giá chỉ có một ngăn đủ chổ cho 10 cuốn (4 cuốn không được để trên giá). e) Giá chỉ có hai ngăn, mỗi ngăn đủ chỏ cho 5 cuốn sách (có 4 cuốn sẽ không được bỏ lên giá). 1.3. Có k chậu hoa và m cái đôn để đặt chậu hoa. Hỏi có bao nhiêu cách để đặt chậu hoa lên đôn (mỗi đôn chỉ đặt được một chậu hoa) nếu: a) k = 6, m = 3. b) k = 3, m = 6. c) k = m = 9. 1.4. Một học sinh phi thi 4 môn trong 10 ngày (mỗi ngày thi một môn). Có bao nhiêu cách để lập chương trình thi? 1.5. Trong lô 100 sản phẩm có 80 sản phẩm tốt và 20 sản phẩm xấu. Hỏi a) Có bao nhiêu cách lấy ra 10 sản phẩm. b) Có bao nhiêu khả năng lấy ra 10 sản phẩm trong đó có 7 sản phẩm tốt và 3 sản phẩm xấu. 1.6. Phân ngẫu nhiên 18 hành khách lên 5 toa tàu. a) Có bao nhiêu cách phân ngẫu nhiên 18 hành khách lên 5 toa tàu. b) Có bao nhiêu cách phân ngẫu nhiên 18 hành khách lên 5 toa tàu mà toa thứ nhất có đúng 5 người. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  6. c) Có bao nhiêu cách phân ngẫu nhiên 18 hành khách lên 5 toa tàu mà mỗi— 5 toa — không quá 4 người. 1.7. Trong sàn nhảy có 10 nam và 8 nữ. Hỏi có bao nhiêu cách chọn ra 2 đôi nam nữ để nhảy. 1.8. Tỉnh A có 5 đội bóng nam và 3 đội bóng nữ, tỉnh B có 6 đội bóng nam và 2 đội bóng nữ. Dự định diễn ra một trận đấu giữa hai đội bóng nam và một trận đấu của hai đội bóng nữa giữa hai tỉnh. Hỏi có bao nhiêu phương án khác nhau về lựa chọn các đội thi đấu. 1.9. Có bao nhiêu cách để chia 16 đội bóng đá thành 4 bng, mỗi bng chỉ có 4 đội. 1.10. Giải ngoại hạng Anh có tất cả 20 đội tham dự. Trong một mùa giả tất cả các đội đều gặp nhau 2 trận (trận lượt đi và trận lượt về). Hỏi trong một mùa Giải có bao nhiêu trận đấu diễn ra. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  7. Chương 2 — 6 — BIẾN CỐ VÀ XÁC SUẤT CỦA BIẾN CỐ 2.1 PHÉP THỬ NGẪU NHIÊN VÀ KHÔNG GIAN MẪU Trong thực tế ta thường gặp rất nhiều hành động mà các kết quả của nó không thể dự báo trước được, chẳng hạn như làm một thí nghiệm hay quan sát một hiện tượng nào đó. Ta gọi chúng là các phép thử ngẫu nhiên, ký hiệu là T . Các kết quả của T là ngẫu nhiên, không thể xác định trước. Tuy nhiên ta có thể liệt kê ra tấc cả các kết quả có thể của phép thử T . + Không gian mẫu: Tập hợp tất cả các kết quả có thể xảy ra của phép thử T , ký hiệu là Ω. Biến cố ngẫu nhiên: Mỗi tập con A ⊂ Ω được gọi là một biến cố. + Biến cố sơ cấp: Mỗi phần tử ω ∈ Ω được gọi là biến cố sơ cấp. + Biến cố không thể là biến cố không bao giờ xảy ra khi phép thử được thực hiện, ký hiệu ∅. + Biến cố chắc chắn là biến cố luôn luôn xảy ra khi phép thử được thực hiện, ký hiệu là Ω. Ví dụ 2.1.1. Quan sát tình hình hoạt động của một dây chuyền máy móc là làm một phép thử. Việc dây chuyền máy móc hoạt động tốt hay hỏng hóc là hai biến cố. Ví dụ 2.1.2. Gieo một con xúc sắc và quan sát số nốt trên mặt xuất hiện của con xúc sắc là một làm một phép thử. Ta không biết trước được mặt nào của con xúc sắc xuất hiện. Không gian mẫu của T là Ω = {1, 2, 3, 4, 5, 6}. + {1} , {2} , {3} , {4} , {5} , {6} là những biến cố sơ cấp. + A = {1, 3, 5} là biến cố mặt lẻ + B = {2, 4, 6} là biến cố mặt chẵn. + C = {1, 2, 3, 4, 5, 6} là biến cố chắc chắn, tức là C = Ω. + D = {7} là biến cố không thể có, tức là C = ∅. Ví dụ 2.1.3. Kiểm tra 3 sản phẩm. Biến cố "không có quá 3 sản phẩm tốt có trong 3 sản phẩm kiểm tra" là biến cố chắc chắn. Biến cố "có 4 phế phẩm có trong 3 sản phẩm kiểm tra" là biến cố không thể. Biến cố "có 2 sản phẩm tốt trong 3 sản phẩm kiểm tra" là biến cố ngẫu nhiên. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  8. 2.2 Quan hệ giữa các biến cố và các phép toán — 7 — Để giải các bài toán xác suất, ta thường diễn tả biến cố phức tạp theo các biến cố đơn giản hơn. + Tương đương: Biến cố A và B được gọi là hai biến cố tương đương, ký hiệu A = B nếu biến cố A xảy ra thì B cũng xảy ra và ngược lại. Ví dụ 2.2.1. Tung một con xúc xắc, biến cố "xúc xắc ra mặt lẻ" và biến cố "xúc xắc ra một trong ba mặt: 1, 3, 5" là hai biến cố tương đương. + Xung khắc: Hai biến cố A và B được gọi là xung khắc nếu chúng không thể cùng xảy ra trong một phép thử. Ví dụ 2.2.2. Khi kiểm tra 5 sản phẩm, biến cố "có 1 phế phẩm" và biến cố "có 2 phế phẩm" là hai biến cố xung khắc nhau. Các biến cố A1,A2,,An được gọi là xung khắc từng đôi nếu 2 biến cố bất kỳ trong số n biến cố này đều xung khắc với nhau. + Biến cố đối lập: Biến cố được gọi là biến cố đối của biến cố A nếu nó xảy ra khi và chỉ khi A không xảy ra, ký hiệu là A¯ . Ta có A¯ = Ω\A. Ví dụ 2.2.3. Kiểm tra một sản phẩm, biến cố "sản phẩm kiểm tra là sản phẩm tốt" và biến cố "sản phẩm kiểm tra là sản phẩm xấu" là hai biến cố đối lập nhau. Nhận xét: + Đặc biệt, trong trường hợp A là biến cố chắc chắn thì biến cố đối lập với A là biến không thể. + So sánh với điều kiện xung khắc ta thấy: Hai biến cố đối lập thì xung khắc nhưng hai biến cố cung khắc chưa chắc đã đối lập. 2.2.1 Các phép toán của biến cố a. Phép hợp (tổng) + Hợp của hai biến cố A và B là biến cố xảy ra khi và chỉ khi có ít nhất một trong hai biến cố A hoặc B xảy ra, ký hiệu là A ∪ B hoặc A + B. Tổng quát, biến cố A được gọi là tổng của n biến cố A1,A2, , An nếu A xảy ra khi và chỉ khi có ít nhất một trong n biến cố đó xảy ra. Ký hiệu A = A1 ∪A2 ∪ ∪An n P hoặc A = Ai. i=1 Ví dụ 2.2.4. Xét phép thử quan sát hai xạ thủ cùng bắn vào một bia (mỗi xạ thủ bắn một viên đạn). Gọi A là biến cố "xạ thủ thứ nhất bắn trúng bia", Gọi B là biến cố "xạ thủ thứ hai bắn trúng bia", và Gọi C là biến cố "bia trúng đạn". Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  9. Rõ ràng C = A ∪ B — 8 — b. Phép giao (tích) + Tích của hai biến cố A và B là biến cố xảy ra nếu cả A và B đều xảy ra, ký hiệu là AB hoặc A ∩ B. Tổng quát, biến cố A được gọi là tích của n biến cố A1,A2, , An nếu A xảy ra nếu tất cả các biến cố A1,A2, , An đều xảy ra. Ký hiệu A = A1A2 An. Ví dụ 2.2.5. Xét phép thử quan sát hai xạ thủ cùng bắn vào một bia (mỗi xạ thủ bắn một viên đạn). Gọi D là biến cố "xạ thủ thứ hai bắn trật". Gọi E là biến cố "xạ thủ thứ hai bắn trật" và gọi F là biến cố "bia không trúng đạn". Rõ ràng F = D ∩ E. c. Nhóm đầy đủ các biến cố Hệ n các biến cố A1,A2, , An là một hệ đầy đủ và xung khắc từng đôi nếu các biến cố xung khắc từng đôi và tổng của chúng là biến cố chắc chắn. Ví dụ 2.2.6. Kiểm tra 3 sản phẩm, gọi tương ứng là các biến cố có "0, 1, 2, 3 sản phẩm tốt trong 3 sản phẩm kiểm tra". Các biến cố là một hệ đầy đủ và xung khắc từng đôi. d. Phép hiệu + Hiệu của biến cố B với biến cố A là biến cố "B xảy ra nhưng A không xảy ra", ký hiệu là B\A. Đặc biệt, ta có A¯ = Ω\A . Nhận xét. Khi giải nhiều bài toán xác suất, ta thường biểu diển các biến cố phức hợp thành tổng và tích các biến cố đơn giản hơn. Ví dụ 2.2.7. Một nhà máy sản xuất 3 sản phẩm. Gọi Ai, i = 1, 2, 3 là biến cố "sản ¯ phẩm thứ i là sản phẩm tốt". Khi đó Ai, i = 1, 2, 3 là biến cố "sản phẩm thứ i là phế phẩm". Nếu gọi A là biến cố "có 1 sản phẩm tốt trong 3 sản phẩm do nhà máy sản ¯ ¯ ¯ ¯ ¯ ¯ xuất" thì A = A1.A2.A3 ∪ A1A2A3 ∪ A1A2A3. Nếu gọi B là biến cố "có 2 sản phẩm tốt trong 3 sản phẩm do nhà máy sản ¯ ¯ ¯ xuất" thì B = A1.A2.A3 ∪ A1A2A3 ∪ A1A2A3. Nếu gọi C là biến cố "có 3 sản phẩm tốt trong 3 sản phẩm do nhà máy sản xuất" thì C = A1.A2.A3. 2.3 Xác suất của các biến cố 2.3.1 Khái niệm về xác suất Giả sử là biến cố của phép thử nào đó. Mặc dù khi tiến hành phép thử ta không thể nói trước biến cố A xảy ra hay không nhưng ta thừa nhận rằng: có một số đo Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  10. khả năng xảy ra của biến cố A, ký hiệu p(A). Khi đó p (A) = 1 nếu là biến cố— chắc 9 — chắn và p(A) = 0 nếu A là biến cố không thể. Vậy xác suất của một biến cố là một số biểu thị khả năng xảy ra của biến cố đó khi thực hiện phép thử. a. Định nghĩa cổ điển về xác suất Phần này chúng ta xây dựng mô hình xác suất cho những phép thử "đối xứng" như tung đồng xu hay gieo xúc sắc hoặc chọn ngẫu nhiên k phần tử từ tập hợp có hữu hạn phần tử. Định nghĩa 2.3.1. Xác suất của biến cố A là tỉ số giữa số trường hợp thuận lợi cho A và số trường hợp đồng khả năng có thể xảy ra khi thực hiện phép thử, hay m p (A) = trong đó, m: là số trường hợp thuận lợi cho n: là số trường hợp đồng n khả năng có thể xảy ra khi thực hiện phép thử. b. Tính chất Nếu A là biến cố ngẫu nhiên thì 0 < P (A) < 1: Nếu A là biến cố chắc chắn thì P (Ω) = 1: Nếu A là biến cố không thể thì P (∅) = 0: Như vậy nếu A là biến cố bất kỳ thì 0 6 P (A) 6 1. c. phương pháp tính xác suất + phương pháp tính xác suất bằng định nghĩa cổ điển + phương pháp suy luận trực tiếp + phương pháp sử dụng sơ đồ + phương pháp sử dụng các khái niệm Giải tích tổ hợp Ví dụ 2.3.2. Gieo đồng thời 3 con xúc sắc được chế tạo cân đối, đồng chất. Tính xác suất để tổng số nốt xuất hiện của 3 con là 9. Giải. Mỗi kết quả của phép thử là một bộ ba (a, b, c), trong đó a, b, c là các số nguyên dương từ 1 đến 6. Vậy số trường hợp đồng khả năng là n = 63 = 216. Các bộ ba có tổng bông 9 là: (1, 2, 6) và 5 hoán vị của nó; (1, 3, 5) và 5 hoán vị của nó (1, 4, 4) và 2 hoán vị của nó; (2, 2, 5) và 2 hoán vị của nó (2, 3, 4) và 5 hoán vị của nó; (3, 3, 3). Suy ra số 25 trường hợp thuận lợi là m = 6 + 6 + 3 + 6 + 3 + 1 = 25. Vậy p(A) = . 216 Ví dụ 2.3.3. Trước cổng trường có 3 quán cơm bình dân chất lượng ngang nhau. Ba sinh viên Hồng, Hà, Hoa độc lập với nhau chọn một quán để ăn trưa. Tính xác suất để: a) 3 sinh viên cùng vào một quán; b) 2 sinh viên cùng vào một quán, còn người kia thì vào quán khác. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  11. Giải: Ta đánh số ba quán cơm là 1, 2, 3. Gọi a, b, c là quán cơm mà Hồng,— 10 Hà, — Hoa chọn. Như vậy số trường hợp đồng khả năng là n = 33 = 27. Gọi A là biến cố 3 sinh viên cùng vào một quán. Số trường hợp thuận lợi của A là (1, 1, 1); (2, 2, 2) và (3, 3, 3). 3 1 Vậy p(A) = = . 27 9 Gọi B là biến cố 2 sinh viên cùng vào một quán, còn sinh viên kia thì vào quán khác. (1, 1, 2) và 2 hoán vị của nó; (1, 1, 3) và 2 hoán vị của nó; (2, 2, 1) và 2 hoán vị của nó; (2, 2, 3) và 2 hoán vị của nó; (3, 3, 1) và 2 hoán vị của nó; (3, 3, 2) và 2 hoán vị của nó; 18 2 Số trường hợp thuận lợi của B là 6.3=18. Vậy p(B) = = . 27 3 Ví dụ 2.3.4. Một túi đựng 10 quả cầu, trong đó có 6 quả màu xanh và 4 quả màu vàng. Lấy ngẫu nhiên (không hoàn lại) từ túi ra 3 quả cầu. a) Tính xác suất để có 2 quả cầu xanh trong 3 quả cầu lấy ra từ túi. b) Tính xác suất để trong 3 quả cầu lấy ra có ít nhất 1 quả cầu xanh. Giải. a) Gọi A là biến cố có 2 quả cầu màu xanh trong 3 quả cầu lấy ra từ túi. Số trường hợp đồng khả năng có thể xảy ra là một nhóm gồm 3 quả cầu (không 3 phân biệt thứ tự) được chọn từ 10 quả cầu. Vậy n = C10 = 120. Số trường hợp thuận lợi cho A là số nhóm gồm 3 quả cầu, trong đó có 2 quả 60 xanh. nên m = C2.C1 = 60. Vậy p (A) = = 0.5. 6 4 120 b) Gọi B là biến cố có ít nhất một quả cầu xanh trong 3 quả cầu lấy ra từ túi. Gọi Bi là biến cố có i quả cầu xanh trong 3 quả cầu lấy ra từ túi (0 6 i 6 3). Ta có Bi là họ xung khắc nên B = B1 ∪ B2 ∪ B3. Suy ra 1 2 2 1 3 C6 .C4 C6 .C4 C6 36 + 60 + 20 p (B) = p (B1) + p (B2) + p (B3) = 3 + 3 + 3 = . C10 C10 C10 120 d. Ưu điểm và hạn chế của định nghĩa cổ điển Ưu điểm: Tìm xác suất của biến cố ta không cần thực hiện phép thử (phép thử chỉ thực hiện một cách giả định). Nhược điểm: Chỉ áp dụng để tính xác suất khi phép thử có tính "đối xứng" và đòi hỏi phép thử phải xác định số trường hợp thuận lợi và số trường hợp đồng khả năng và đó là những số hữu hạn nhưng trong thực tế đa số các phép thử không thỏa mãn các yêu cầu đó. e. Định nghĩa xác suất theo thống kê. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  12. Tần số - Tần suất — 11 — Xét A là biến cố của một thí nghiệm ngẫu nhiên. Ta lặp lại thí nghiệm này n lần. Khi đó: số lần xuất hiện biến cố A trong n phép thử được gọi là tần số của A, µ (A) ký hiệu là µ (A) và tỉ số f(A) = n được gọi là tần suất của biến cố A trong n n n phép thử. Ví dụ 2.3.5. Khi kiểm tra ngẫu nhiên 60 sản phẩm ở một lô hàng, người ta phát hiện ra 3 phế phẩm. Gọi A là biến cố "sản phẩm kiểm tra là phế phẩm" thì tần 3 suất xuất hiện biến cố A là f(A) = = 5%. 60 Ví dụ 2.3.6. Để nghiên cứu khả năng xuất hiện mặt sấp khi tung đồng xu, người ta tiến hành tung đồng xu nhiều lần và thu được kết quả sau: Người làm thí nghiệm Số lần tung Số lần được mặt sấp Tần suất Buyffon 4040 2048 0.5069 Pearson 1200 6019 0.5016 Pearson 24000 12012 0.5005 Từ thí nghiệm trên ta thấy khi phép thử tăng lên, tần suất xuất hiện mặt sấp tiến dần đến 0.5 (xác suất xuất hiện mặt sấp khi tung đồng xu là 0.5). Vậy tần suất dần đến xác suất khi số phép thử tăng lên. Định nghĩa. Tần suất xuất hiện biến cố sẽ hội tụ về xác suất xuất hiện biến cố khi số phép thử tăng lên vô hạn. Trong thực tế với số phép thử đủ lớn ta có p (A) ≈ f (A). 2.4 Các Công thức tính xác suất 2.4.1 Công thức cộng xác suất Định lý 2.4.1. Nếu A và B là hai biến cố xung khắc thì: P (A ∪ B) = P (A) + P (B) Tổng quát, nếu A1,A2, , An là n biến cố xung khắc từng đôi thì p (A1 ∪ A2 ∪ ∪ An) = p (A1) + p (A2) + + p (An) Hệ quả 2.4.2. Nếu A1,A2, , An là n biến cố đầy đủ và xung khắc từng đôi thì: n X P (Ai) = 1. i=1 Hệ quả 2.4.3. Nếu A và A¯ là hai biến cố đối lập với nhau thì: p (A) = 1 − p A¯. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  13. Ví dụ 2.4.4. Một hộp có 10 sản phẩm (trong đó có 2 phế phẩm). Lấy ngẫu— nhiên 12 — (không hoàn lại) từ hộp ra 6 sản phẩm. Tính xác suất để có không quá 1 phế phẩm trong 6 sản phẩm lấy ra. Giải: Gọi A là biến cố "không có phế phẩm nào trong 6 sản phẩm lấy ra" và gọi B là biến cố "có 1 phế phẩm trong 6 sản phẩm lấy ra". Gọi C là biến cố "có không quá 1 phế phẩm trong 6 sản phẩm lấy ra". Suy ra C = A ∪ B. Do A, B là hai biến cố xung khắc (vì nó không thể đồng thời xảy ra trong phép thử lấy ngẫu nhiên 6 sản phẩm từ hộp). Vậy 6 1 5 C8 C2 C8 14 + 56 2 p (C) = p (A ∪ B) = p (A) + p (B) = 6 + 6 = = ≈ 0.66. C10 C10 105 3 Định lý 2.4.5. Nếu A và B là hai biến cố bất kỳ thì: p (A ∪ B) = p (A) + p (B) − p (AB) . Ta có thể mở rộng định lý trên cho trường hợp 3 biến cố: p (A ∪ B ∪ C) = p (A) + p (B) + p (C) − p (A.B) − p (AC) − p (BC) + p (ABC) . Ví dụ 2.4.6. Theo kho sát của tổ chức y tế WHO, trong một vùng dân cư tỉ lệ người mắc bệnh tim là 9%, bệnh huyết áp là 12% và mắc cả hai bệnh là 7%. Chọn ngẫu nhiên một người trong vùng đó. Tính xác suất để người đó không mắc cả bệnh tim và huyết áp. Giải. Gọi A là biến cố "người đó mắc bệnh tim" và gọi B là biến cố "người đó mắc bệnh huyết áp". Ta có p (A) = 0.09, p (B) = 0.12, (AB) = 0.07. Gọi N là biến cố "người đó không mắc c bệnh tim và bệnh huyết áp". Suy ra N¯ = A ∪ B Nên p N¯ = p (A ∪ B) = p (A) + p (B) − p (AB) = 0.09 + 0.12 + 0.07 = 0.14 Vậy p (N) = 1 − p N¯ = 1 − 0.14 = 0.86. 2.4.2 Công thức nhân xác suất 2.4.2.1 Xác suất có điều kiện Định nghĩa. Xác suất của biến cố A được tính với điều kiện biến cố B đã xãy ra được gọi là xác suất có điều kiện của A, ký hiệu P (A/B) . Ví dụ 2.4.7. Một túi đựng 5 quả cầu, (trong đó có 2 quả màu trắng). Lấy ngẫu nhiên (không hoàn lại) lần lượt từ túi ra 2 quả cầu. Tính xác suất để lần thứ hai được quả cầu trắng biết rông lần thứ nhất lấy được quả cầu trắng. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  14. Giải. Gọi A là biến cố "lần thứ hai lấy được quả cầu trắng" và gọi B là biến— 13 cố — "lần thứ hai nhất lấy được quả cầu trắng". Ta cần tìm (A/B) . Ta thấy lần thứ nhất đã lấy được quả cầu trắng (B đã xãy ra) nên trong túi 1 còn 4 quả cầu, trong đó có 1 quả trắng. Vậy p(A/B) = = 0.25 4 P (AB) Công thức tính: P (A/B) = P (B) Nếu A, B là hai biến cố bất kỳ, ta có: p(AB) = p(B).P (A/B) = p(A).p(B/A) Tổng quát ta có: p(A1A2 An) = p(A1).P (A2/A1)p(A3/A1A2) p(An/A1A2 An−1). 2.4.2.2 Biến cố độc lập + Hai biến cố A và B được gọi là độc lập với nhau nếu p(A/B) = p(A) (tức là biến cố B xảy ra hay không cũng không ảnh hưởng đến khả năng xảy ra của biến cố A). Dựa vào định nghĩa của xác suất có điều kiện, từ điều trên ta có: p(AB) = p(A).p(B). Nhận xét: A và B độc lập ⇔ A¯ và B độc lập ⇔ A và B¯ độc lập ⇔ A¯ và B¯ độc lập. Nếu p(C) = 0 hoặc p(C) = 1 thì C độc lập với mọi biến cố. Định nghĩa. Nếu các biến cố A1,A2, , An độc lập với nhau thì p(A1 An) = p(A1) p(An). Ví dụ 2.4.8. Một phân xưởng có 3 máy. Xác suất các máy bị hỏng trong ngày tương ứng là 0.1; 0.2 và 0.15. Tính các xác suất sau đây: a). Có một máy bị hỏng trong ngày. b). Có ít nhất một máy bị hỏng trong ngày. Giải. Gọi A1,A2,A3 tương ứng là các biến cố máy thứ nhất, thứ hai, thứ ba bị hỏng trong ngày. a). Gọi A là biến cố có một máy bị hỏng trong ngày. Khi đó ta có ¯ ¯ ¯ ¯ ¯ ¯ A = A1A2A3 ∪ A1A2A3 ∪ A1A2A3 Vì các biến cố tích xung khắc từng đôi và độc lập toàn phần nên ¯ ¯ ¯ ¯ ¯ ¯  p (A) = p A1A2A3 ∪ A1A2A3 ∪ A1A2A3 ¯  ¯  ¯  ¯  ¯  ¯  = p (A1) p A2 p A3 + p A1 p (A2) p A3 + p A1 p A2 p (A3) = 0, 1.0, 8.0, 85 + 0, 9.0, 2.0, 85 + 0, 9.0, 8.0, 15 = 0, 329 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  15. b). Gọi B là biến cố "có ít nhất một máy bị hỏng trong ngày" nên B¯ là biến— cố 14 "cả — ¯ ¯ ¯ ¯ ba máy đều tốt" hay p(B) = A1A2A3. Suy ra ¯ ¯  ¯  ¯  P (B) = 1 − P B = 1 − P A1 P A2 P A3 = 1 − 0, 9.0, 8.0, 85 = 0, 388. 2.5 Công thức Bernoulli Trong nhiều bài toán thực tế, ta thường gặp cùng một phép thử được lặp đi lặp lại nhiều lần. Trong mỗi phép thử có thể xảy ra hay không xảy ra biến cố A nào đó và ta quan tâm đến tổng số lần xảy ra biến cố A trong dãy phép thử đó. Định nghĩa. Các phép thử được gọi là độc lập với nhau nếu xác suất để xảy ra một biến cố nào đó trong từng phép thử sẽ không phụ thuộc vào việc biến cố đó có xảy ra ở phép thử khác hay không. Ví dụ 2.5.1. Tung nhiều lần một đồng xu, lấy ngẫu nhiên (có hoàn lại) n sản phẩm từ một lô hàng là các phép thử độc lập. Bài toán. Giả sử tiến hành n phép thử độc lập. Trong mỗi phép thử chỉ có thể xảy ra hai trường hợp: hoặc biến cố A xảy ra, hoặc biến cố A không xảy ra. Xác suất để biến cố A xảy ra trong mỗi phép thử đều bằng p và xác suất A không xảy ra là q = 1 − p. Ta gọi n phép thử này được gọi là dãy phép thử Bernoulli. Khi đó xác suất để trong n phép thử độc lập nói trên biến cố A xảy ra đúng k lần là: k k n−k B(k, n, p) = Cnp q ; k = 0, 1, , n Ví dụ 2.5.2. Một cầu thủ bóng rỗ có khả năng ném lọt rỗ với xác suất p = 0, 95. Tìm xác suất để trong 10 lần ném có đúng 8 lần lọt rỗ. Giải. Rõ ràng đây là dãy phép thử Bernoulli với xác suất ném lọt rỗ là p = 0, 95. 8 8 2 Do đó xác suất cần tìm là B(8; 0, 95; 10) = C10.(0, 95) .(0, 05) ' 0, 0746 . 2.6 Công thức xác suất đầy đủ Giả sử B là biến cố bất kỳ có thể xảy ra đồng thời với một trong các biến cố A1,A2, , An-hệ biến cố xung khắc từng đôi và đầy đủ. Khi đó, xác suất của B là: n X p(B) = p(Ai).p(B/Ai). i=1 Các xác suất p (A1) , p (A2) , , p (An) được gọi là xác suất của giả thiết hay còn gọi là xác suất tiên nghiệm. Ví dụ 2.6.1. Một cơ sở sản xuất mũ gồm có 3 tổ cùng sản xuất mũ (độc lập nhau) với tỉ lệ sản phẩm trong tổng số sản phẩm lần lượt là 20%, 30% và 50%, trong đó Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  16. tỉ lệ phế phẩm tương ứng là 5%, 2% và 1%. Tất cả sản phẩm làm ra đều được— 15 xếp — chung vào một kho. Hỏi tỉ lệ phế phẩm của kho là bao nhiêu? Giải. Lấy ngẫu nhiên một mũ từ trong kho ra kiểm tra. Gọi B là biến cố gặp mũ phế phẩm và Ai là biến cố mũ lấy ra do tổ i sản xuất (1 ≤ i ≤ 3), ta có p(B) = p(A1).p(B/A1) + p(A2).P (B/A2) + p(A3).P (B/A3) 20 5 30 2 50 1 = × + × + × = 0, 021 100 100 100 100 100 100 2.7 Công thức Bayes Giả sử B là biến cố bất kỳ có thể xảy ra đồng thời với một trong các biến cố A1,A2, , An -hệ biến cố xung khắc từng đôi và đầy đủ. Giả thiết rằng B đã xảy ra khi đó, với i = 1, , n ta có: p(Ai).p(B/Ai) p(Ai/B) = n P p(Ai).p(B/Ai) i=1 Nhận xét: Các xác suất p(Ai/B) được xác định sau khi đã biết kết quả của phép thử B đã xảy ra nên gọi là các xác suất hậu nghiệm. Như vậy công thức Bayes cho phép ta xác định các xác suất tiên nghiệm khi biết thông tin B đã xảy ra khi thực hiện phép thử. Ví dụ 2.7.1. Hai máy tiện cùng sản xuất ra một loại trục xe đạp như nhau. Các trục xe được đóng chung vào một kiện. Năng suất của máy tiện thứ hai gấp đôi năng suất của máy tiện thứ nhất. Máy tiện thứ nhất sản xuất trung bình được 64% trục loại tốt, còn máy tiện thứ hai được 80% trục loại tốt. Lấy ngẫu nhiên từ kiện một trục ra kiểm tra thì được trục loại tốt. Tìm xác suất để trục đó do máy tiện thứ nhất sản xuất. Giải. Gọi B là biến cố trục đó là trục loại tốt và A1,A2 tương ứng là các biến cố 1 2 trục đó do máy thứ nhất và máy thứ hai sản xuất ra. Ta có p(A ) = ; P (A ) = ; 1 3 2 3 và p(B/A1) = 0, 64; p(B/A2) = 0, 8 Theo công thức xác suất đầy đủ thì p(B) = p(A1).p(B/A1) + p(A2).p(B/A2) 1 2 = 0, 64 × + 0, 8 × ' 0, 7467. 3 3 1 p(A ).p(B/A ) 0, 64 × Vậy p(A /B) = 1 1 ' 3 ' 0, 2857 . 1 p(B) 0, 7467 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  17. — 16 — BÀI TẬP CHƯƠNG 2 2.1. Ba xạ thủ, mỗi người bắn một phát. Gọi Ai là biến cố người thứ i bắn trúng. Hãy biểu diển qua các biến cố sau: a. A: chỉ có người thứ nhất bắn trúng. b. B: người thứ nhất bắn trúng còn người thứ hai bắn trật. c. C : có ít nhất một người bắn trúng. d. D : cả 3 người đều bắn trúng. e. E : có ít nhất hai người bắn trúng. f. F : chỉ có hai người bắn trúng. g. G : không có ai bắn trúng h. H : không có hơn 2 người bắn trúng. i. I : người thứ nhất bắn trúng, hoặc người thứ hai và người thứ ba cùng bắn trúng. j. K : người thứ nhất bắn trúng hay người thứ hai bắn trúng. 2.2. Gieo đồng thời hai con xúc xắc được chế tạo cân đối, đồng chất. Tìm xác suất để: a. Tổng số nốt là 7. b. Tổng số nốt là 8. 2.3. Một công ty cần tuyển hai nhân viên. Có 6 người nộp đơn ( trong đó có 4 nữ và 2 nam ). Giả sử khả năng trúng tuyển của 6 người là như nhau. Tính xác suất để: a. cả 2 người trúng tuyển đều là nam. b. cả 2 người trúng tuyển đều là nữ. c. có ít nhất một nữ trúng tuyển. 2.4. Trong 30 đề thi, trong đó có 10 đề khó, 20 đề trung bình. Tìm xác suất để: a. Một học sinh bốc 1 đề, gặp đề trung bình. b. Một học sinh bốc 2 đề, gặp ít nhất một đề trung bình. 2.5. Lớp X có 60 sinh viên, trong đó có 20 nam và 40 nữ. Chọn ngẫu nhiên một nhóm gồm 8 sinh viên để đi chiến dịch sinh viên tình nguyện. Tính xác suất để: a. Có 4 nam trong số 8 sinh viên được chọn? b. Có nhiều nhất 3 sinh viên nam trong 8 sinh viên được chọn? c. Có ít nhất 1 sinh viên nam trong 8 sinh viên được chọn? d. Không có sinh viên nam trong 8 sinh viên được chọn? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  18. 2.6. Trên giá sách có 50 cuốn sách, trong đó có 3 cuốn sách của cùng một— tác 17 gi. — Tìm xác suất để không có hai cuốn nào trong 3 cuốn đứng cạnh nhau. 2.7. Tại thành phố Đồng Hới biết rằng biển số xe gắn máy có 4 chử số. Chọn ngẫu nhiên một biển số xe. Tính xác suất để chọn được biển số xe: a. Có 4 chữ số khác nhau. b. Có 2 chữ số giống nhau. c. Có 3 chữ số giống nhau. d. Có 4 chữ số giống nhau. 2.8. Một dãy ghế trong hội trường rạp chiếu phim có 20 chổ ngồi, xếp 20 người vào ngồi một cách ngẫu nhiên, trong đó có Lan và Điệp. Tính xác suất để: a. Lan được ngồi ở hai đầu dãy ghế. b. Lan và Điệp được ngồi gần nhau. 2.9. Trường X có số sinh viên học học tốt Toán và Anh văn của lớp A và B (biết mỗi lớp có 45 sinh viên) được cho như sau: Học tốt  lớp A B Toán 25 25 Anh văn 30 30 Toán và Anh văn 20 10 Có đoàn kiểm định chất lượng đến thanh tra. Theo bạn, giáo viên nên mời đoàn vào lớp nào để khả năng gặp được một sinh viên học tốt ít nhất một môn là cao nhất? 2.10. Ba xạ thủ A, B, C độc lập với nhau cùng nổ súng vào một mục tiêu. Xác suất bắn trúng của xạ thủ tương ứng là 0,4; 0,5 và 0,6. Tính xác suất để: a. Chỉ có duy nhất một xạ thủ bắn trúng. b. ít nhất một xạ thủ bắn trúng. 2.11. Có hai túi đựng các quả cầu. Túi thứ nhất đựng 3 quả trắng, 7 quả đỏ và 15 quả xanh. Túi thứ hai đựng 10 quả trắng, 6 quả đỏ và 9 quả xanh. Từ mỗi túi chọn ngẫu nhiên một quả cầu. Tính xác suất để 2 quả cầu được chọn đều có cùng màu. 2.12. Một công ty có 60 nhân viên, trong đó có 20 nam và 40 nữ. Tỷ lệ nhân viên nữ có thể nói tiếng Anh lưu loát là 15% và tỷ lệ này đối với nam là 20% a. Gặp ngẫu nhiên một nhân viên của công ty. Tìm xác suất để gặp được nhân viên nói tiếng Anh lưu loát? b. Gặp ngẫu nhiên hai nhân viên của công ty. Tìm xác suất để có ít nhất một người nói tiếng Anh lưu loát trong số 2 người gặp? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  19. 2.13. Ba sinh viên An, Hùng, Oanh cùng làm bài thi môn Giải tích. Xác suất— 18 làm — được bài của từng người lần lượt là 0, 7; 0, 6 và 0, 5. Tìm xác suất để: a. Có hai sinh viên làm được bài thi? b. Nếu có hai sinh viên làm được bài thi, tìm xác suất để An không làm được bài? 2.14. Trong hồ có 10 con cá carnh (trong đó có 3 cá có đuôi màu đỏ và 7 cá có đuôi màu xanh). Bắt ngẫu nhiên từ hồ ra một con cá. Nếu bắt ra cá có đuôi màu đỏ thì bỏ vào hồ một con cá có đuôi màu xanh. Nếu bắt ra cá có đuôi màu xanh thì bỏ vào một cá có đuôi màu đỏ. Sau đó từ hồ bắt tiếp ra một con cá. a. Tính xác suất để cá được bắt lần sau có đuôi màu đỏ? b. Nếu hai con cá được bắt ra (lần 1 và lần 2) có đuôi cùng màu. Tính xác suất để hai con cá này có đuôi cùng màu xanh? 2.15. Trong một kỳ thi tốt nghiệp, mỗi sinh viên phi thi hai môn cơ sở và chuyên nghành. Giả sử xác suất bạn thi đạt môn c sở là 80%. Nếu thi đạt yêu cầu môn c sở thì xác suất thi đạt môn chuyên nghành là 60%. Nếu không đạt yêu cầu môn c sở thì hy vọng thi đạt môn chuyên nghành là 30%. Tìm xác suất để: a. Thi đạt cả hai môn cơ sở và chuyên ngành? b. Thi đạt môn chuyên nghành? c. Thi đạt ít nhất một môn? 2.16. Chị Lan có một chùm chìa khóa gồm 9 chiếc bề ngoài rất giống nhau nhưng trong đó chỉ có 2 chiếc mở được cửa tủ. Chị Lan thử ngẫu nhiên từng chìa (chìa nào không đúng thì bỏ ra). Tìm xác suất để chị Lan mở được cửa ở lần thử thứ 3. 2.17. Hai anh em Hùng và An chi trò chi như sau: Mỗi người lần lượt rút một viên bi từ một hộp đựng 2 bi đỏ và 4 bi xanh. Bi được rút ra không trả lại vào hộp. Người nào lấy được bi đỏ trước thì thắng cuộc. Tính xác suất thắng cuộc của người rút trước. 2.18. Có 3 sinh viên nhưng chỉ có 2 vé đi xem phim. Họ làm 3 lá thăm, trong đó có 2 thăm có đánh dấu. Mỗi người lần lượt rút một thăm. Nếu ai rút được thăm có đánh dấu thì được vé đi xem phim. Hãy chứng minh sự công bông của cách làm này. 2.19. Trong một nhà máy có ba phân xưởng I, II, III tương ứng làm ra 25%, 35% và 40% tổng sản phẩm của nhà máy. Giả sử xác suất làm ra phế phẩm của phân xưởng I là 0,01, của phân xưởng II là 0,02 và phân xưng III là 0,025. Chọn ngẫu nhiên một sản phẩm của nhà máy. Tính xác suất để đó là phế phẩm? 2.20. Một phân xưởng có 3 máy. Xác suất để mỗi máy sản xuất ra sản phẩm đạt tiêu chuẩn kỹ thuật lần lượt là 0,9 ; 0,8 và 0,7. Trong một giờ mỗi máy sản suất Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  20. được 5 sản phẩm. Tìm xác suất để trong một giờ c 3 máy sản xuất được ít nhất— 19 14 — sản phẩm đạt tiêu chuẩn kỷ thuật? 2.21. Có hai hộp sản phẩm, biết rằng: Hộp thứ 1: có 7 chính phẩm và 3 phế phẩm. Hộp thứ 2 : có 5 chính phẩm và 3 phế phẩm. Lấy ngẫu nhiên một sản phẩm ở hộp thứ 1 bỏ vào hộp thứ 2 rồi sau đó từ hộp thứ 2 lấy ngẫu nhiên ra một sản phẩm thì được chính phẩm. Tính xác suất để sản phẩm lấy ra từ hộp từ hộp thứ 2 là sản phẩm của hộp thứ nhất bỏ vào? 2.22. Có hai kiện hàng: Kiện thứ nhất: có 5 sản phẩm loại A, 1 sản phẩm loại B. Kiện thứ hai : có 2 sản phẩm loại A, 4 sản phẩm loại B. Từ mỗi kiện hàng chọn ngẫu nhiên ra 1 sản phẩm đem giao cho khách hàng. Sau đó các sản phẩm còn lại được dồn vào kiện thứ ba (trống). a. Chọn ngẫu nhiên một sản phẩm từ kiện hàng thứ ba. Tính xác suất để lấy được là sản phẩm loại B? b. Nếu ta chọn ngẫu nhiên 2 sản phẩm từ kiện ba. Tính xác suất để có ít nhất một sản phẩm loại B từ 2 sản phẩm đã chọn. 2.23. Có ba hộp đựng các quả cầu: Hộp thứ 1 có 10 quả cầu màu đỏ. Hộp thứ 2 có 5 quả cầu màu đỏ và 5 quả cầu màu xanh. Hộp thứ 3 có 10 quả cầu màu xanh. Chọn ngẫu nhiên một hộp rồi từ hộp đó lấy ngẫu nhiên (không hoàn lại) ra 2 quả cầu thì được quả cầu màu xanh. Sau đó cũng từ hộp này lấy ngẫu nhiên ra một quả cầu. Tính xác suất để lấy được quả cầu màu xanh? 2.24. Một hộp có 10 sản phẩm (hoàn toàn không biết chất lượng của các sản phẩm trong hộp này). Mọi giả thiết về số sản phẩm tốt có trong hộp được xem là đồng khả năng. Lấy ngẫu nhiên(không hoàn lại) từ hộp ra 3 sản phẩm để kiểm tra thì thấy có cả 3 sản phẩm tốt. Theo bạn, có bao nhiêu sản phẩm tốt có trong 7 sản phẩm còn lại trong hộp? vì sao? 2.25. Một nhà máy có 3 phân xưởng cùng sản xuất một loại sản phẩm. Phân xưởng 1 sản xuất 25%; phân xưởng 2 sản xuất 25% và phân xưởng 3 sản xuất 50% sản phẩm của toàn nhà máy. Tỷ lệ phế phẩm của các phân xưởng 1, 2 và 3 lần lượt là: 1%, 5% và 10%. Lấy ngẫu nhiên một sản phẩm từ lô hàng do nhà máy sản xuất. a. Tìm xác suất để lấy được phế phẩm? nêu ý nghĩa thực tế của xác suất này? b. Nếu lấy được một chính phẩm, theo bạn sản phẩm đó do phân xưởng nào sản xuất? tại sao? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  21. 2.26. Có 3 lô hàng, mỗi lô gồm 10.000 sản phẩm. Tỷ lệ sản phẩm loại I của từng— 20 —lô tương ứng là: 70%, 80% và 90%. Lấy từ mỗi lô ra 10 sản phẩm để kiểm tra (không hoàn lại). Nếu trong 10 sản phẩm lấy ra kiểm tra có từ 8 sản phẩm loại I trở lên thì mua lô hàng đó. a. Tìm xác suất để lô hàng có tỷ lệ sản phẩm loại I là 70% được mua? b. Tìm xác suất để có ít nhất một lô hàng được mua? c. Nếu chỉ có một lô hàng được mua. Tìm xác suất để đó là lô hàng có tỷ lệ sản phẩm loại I là 70%? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  22. Chương 3 — 21 — ĐẠI LƯỢNG NGẪU NHIÊN VÀ QUY LUẬT PHÂN PHỐI XÁC SUẤT 3.1 ĐỊNH NGHĨA VÀ PHÂN LOẠI CÁC ĐẠI LƯỢNG NGẪU NHIÊN 3.1.1 Định nghĩa Một đại lượng mà giá trị của nó là ngẫu nhiên, không dự đoán trước được gọi là một đại lượng ngẫu nhiên (ĐLNN), ký hiệu là X, Y, Z. Khi thực hiện một phép thử, bằng một quy tắc (hay một hàm) ta có thể gán các giá trị bông số cho những kết quả của một phép thử. Các giá trị này được coi là giá trị của đại lượng ngẫu nhiên, ký hiệu là x1, x2, , xn, Ví dụ 3.1.1. Kiểm tra 3 sản phẩm. Gọi X là số phế phẩm trong 3 sản phẩm kiểm tra. X là ĐLNN vì khi kiểm tra 3 sản phẩm X sẽ nhận một và chỉ một trong số các giá trị: 0, 1, 2, 3. 3.1.2 Phân loại đại lượng ngẫu nhiên Một ĐLNN được gọi là rời rạc nếu tập giá trị mà nó có thể nhận là tập hữu hạn hoặc vô hạn đếm được. Đối với ĐLNN rời rạc ta có thể liệt kê được các giá trị của nó. Ví dụ 3.1.2. Gieo một con xúc sắc. Gọi X là số nốt xuất hiện trên con xúc sắc, X là ĐLNN rời rạc. Ta có tập các giá trị có thể có của X là X (Ω) = {1, 2, 3, 4, 5, 6}. Một ĐLNN được gọi là liên tục nếu tập giá trị mà nó có thể nhận được có thể lấp kín cả một khoảng trên trục số. Đối với ĐLNN liên tục, không thể liệt kê được các giá trị của nó. Ví dụ 3.1.3. Chiều cao của học sinh trong một lớp học, khối lượng của một loại hoa quả là những ĐLNN liên tục. 3.2 Qui luật phân phối xác suất của ĐLNN Để xác định một đại lượng ngẫu nhiên ta phải biết đại lượng ngẫu nhiên ấy có thể nhận giá trị nào và nó nhận giá trị ấy với xác suất tương ứng bao nhiêu. Một hệ thức cho phép biểu diển mối quan hệ giữa các giá trị có thể nhận của ĐLNN với các xác suất tương ứng gọi là qui luật phân phối xác suất của ĐLNN. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  23. Để thiết lập quy luật phân phối xác suất của ĐLNN, ta có thể dùng: bảng— phân 22 — phối xác suất hay hàm phân phối xác suất hoặc hàm mật độ xác suất. 3.2.1 Bảng phân phối xác suất Bảng phân phối xác suất dùng để thiết lập qui luật phân phối xác suất của ĐLNN rời rạc X. Giả sử ĐLNN X có thể nhận một trong các giá trị: x1, x2, , xn với xác suất tương ứng là: p1, p2, pn. Hay là pi = p (X = xi) , i = 1 n. Khi đó bảng phân phối xác suất của X có dạng: X x1 x2 xn p p1 p1 pn n P Ta luôn có pi = 1. i=1 Ví dụ 3.2.1. Một xạ thủ được phép bắn 3 viên đạn vào mục tiêu với xác suất trúng mục tiêu là 0,6. Anh ta bắn cho tới khi hết đạn hoặc trúng mục tiêu thì thôi. Gọi X là số viên đạn bắn ra. Lập bảng phân phối xác suất của X. Giải. Tập giá trị có thể của X là X = 1, 2, 3. Khi đó, các biến cố (X = 1), (X = 2), (X = 3) lập thành một nhóm biến cố đầy đủ. Gọi Ai là biến cố bắn trúng mục tiêu ở lượt đạn thứ i (1 6 i 6 3). Ta có ¯ ¯ p(X = 1) = p(A1A2) = p(A1).P (A2) = 0, 4 × 0, 6 = 0, 24 ¯ ¯ p(X = 2) = p(A1.A2) = p(A1).P (A2) = 0, 4 × 0, 6 = 0, 24 P (X = 3) = 1 − p(X = 1) − p(X = 2) = 1 − 0, 6 − 0, 24 = 0, 16 Vậy bảng phân phối xác suất của X là: X 1 2 3 p 0,6 0,24 0,16 Ví dụ 3.2.2. Trong hộp có 10 sản phẩm (trong đó có 6) chính phẩm. Lấy ngẫu nhiên không hoàn lại từ hộp ra 2 sản phẩm. Lập bảng phân phối xác suất của số chính phẩm được lấy ra. Giải. Gọi X là số chính phẩm được lấy ra từ hộp thì X là ĐLNN rời rạc có tập giá trị có thể có là X (Ω) = {0, 1, 2} . 2 1 1 C4 2 C6 C4 8 Ta có p1 = p (X = 0) = 2 = ; p2 = P (X = 1) = 2 = ; p3 = C10 15 C10 15 2 C6 5 P (X = 2) = 2 = C10 15 Vậy bảng phân phối xác suất của X: X 0 1 2 p 2/15 8/15 5/15 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  24. 3.2.2 Hàm phân phối xác suất — 23 — Hàm phân phối xác suất dùng để thiết lập qui luật phân phối xác suất của cả ĐLNN rời rạc và liên tục. 3.2.2.1 Định nghĩa. Hàm phân phối của ĐLNN X được định nghĩa bởi biểu thức: F (x) = p(X 2 Ví dụ 3.2.4. Cho hàm phân phối của biến số ngẫu nhiên X là   0 khi x 6 a  x−a F (x) = b−a khi a b a+b với 0 < a < b. Tính P ( 2 < X < a + b). Giải. Ta có a + b a + b 1 1 p( < X < a + b) = F (a + b) − F ( ) = 1 − = . 2 2 2 2 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  25. 3.2.3 Hàm mật độ xác suất — 24 — 3.2.3.1 Định nghĩa Hàm mật độ xác suất của đại lượng ngẫu nhiên liên tục X được định nghĩa như sau: f (x) := F 0 (x) 3.2.3.2 Tính chất. Giar sử biến số ngẫu nhiên X có hàm mật độ f và hàm phân phối F , ta có các tính chất sau: i) f (x) > 0, +∞ ii) R f(x)dx = 1, −∞ b R iii) Nếu F liên tục trên R thì P (a 6 X 6 b) = f(x)dx, a 3.2.3.3 ý nghĩa của hàm mật độ. Từ định nghĩa hàm mật độ, ta có hệ thức xấp xĩ: p(x 6 X 6 x+∆x) ≈ f (x) .∆x Tức là xác suất để X nhận giá trị thuộc một lân cận (x, x + ∆x) gần như tỷ lệ với giá trị của hàm mật độ f (x) tại điểm x. Vậy, với cùng độ dài ∆x, tại điểm x nào mà giá trị của hàm f(x) lớn hơn thì lân cận của điểm ấy sẽ tập trung một xác suất lớn hơn nên f(x) có tên là hàm mật độ xác suất. 3.3 Các tham số đặc trưng của đại lượng ngẫu nhiên Khi ta xác định được qui luật phân phối xác suất của đại lượng ngẫu nhiên thì ta nắm được toàn bộ thông tin về đại lượng ngẫu nhiên đó. Tuy nhiên trong thực tế cũng rất khó và không cần thiết để nắm toàn bộ thông tin này mà chúng ta cần quan tâm đến những thông tin quan trọng nhất phn ánh đầy đủ các đặc trưng cơ bản của đại lượng ngẫu nhiên mà ta đang nghiên cứu. 3.3.1 Kỳ vọng toán 3.3.1.1 Định nghĩa. Cho X là đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị x1, x2, , xn với các xác suất tương ứng là p1, p2, , pn. Khi đó kỳ vọng toán của ĐLNN X được định n P nghĩa là: E(X) = xipi i=1 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  26. Nếu X là đại lượng ngẫu nhiên liên tục với hàm mật độ xác suất f(—x) 25thì: — +∞ E(X) = R xf(x)dx −∞ 3.3.1.2 Tính chất. 1. E(C) = C, 2. E(CX) = C.E(X) 3. E(X1 + X2 + ··· + Xn) = E(X1) + E(X2) + ··· + E(Xn) 4. Nếu X1,X2, , Xn là ĐLNN độc lập thì E(X1.X2 Xn) = E(X1).E(X2) E(Xn) . Chú ý. Hai ĐLNN được gọi là độc lập với nhau nếu quy luật phân phối xác suất của ĐLNN này không phụ thuộc vào ĐLNN kia nhận giá trị bông bao nhiêu. 3.3.1.3 ý nghĩa của kỳ vọng. Để tìm hiểu bản chất của kỳ vọng, ta xét các ví dụ sau: Ví dụ 3.3.1. Nghiên cứu về thu nhập của 500 công nhân nghành may, ta có số liệu như sau: Thu nhập(tr.đ/năm) 7 8 9 10 11 12 14 Số công nhân 50 70 150 120 55 30 25 Gọi X là thu nhập của công nhân ngành may, từ số liệu trên ta có bảng phân phối xác suất: X 7 8 9 10 11 12 14 p 0.1 0.14 0.3 0.24 0.11 0.26 0.05 Vậy ta có E (X) = 7.0, 1 + 8.0, 14 + 9.0, 3 + 10.0, 24 + 11.0, 11 + 12.0, 06 + 14.0, 05 = 9, 55 = (7.50 + 8.70 + 9.150 + 10.120 + 11.55 + 12.30 + 14.25)/500 Kết luận: Thu nhập trung bình của một công nhân nghành may là 9,55 triệu đ/năm. Vậy kỳ toán của ĐLNN chính là giá trị trung bình của ĐLNN đó. Ví dụ 3.3.2. Một đợt xổ số người ta phát hành 10000 vé với giá vé là 1000 đồng/1vé. Trong đó chỉ có một vé trúng thưởng với trị giá là 50000 đồng. Một người nào đó mua mỗi lần 2 vé (lấy ngẫu nhiên). Tính số tiền trung bình người đó kiếm được trong mỗi lần xổ số. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  27. Giải. Gọi X là số tiền người đó kiếm được trong mỗi lần xổ số. — 26 — Ta có tập giá trị của X là −2000, 48000. 0 1 0 9999 2 Suy ra p(X = −2000) ' C2 .( 10000 ) .( 10000 ) ' 0, 9998 và p(X = 48000) ' 1 − 0, 9998 = 0, 0002 Vậy bảng phân phối của X: X −2000 48000 p 0,9998 0,0002 Suy ra E(X) = (−2000) × 0, 9998 + 48000 × 0, 0002 = −1990. Vậy số tiền trung bình người mất đi 1990 đồng trong mỗi đợt sổ xố. 3.3.2 phương sai Trong thực tế, nhiều khi nếu chỉ xác định kỳ vọng toán của ĐLNN thì chưa đủ. Để xác định một ĐLNN ta còn phi xác định mức độ phân tán các giá trị của ĐLNN xung quanh giá trị trung bình của nó. 3.3.2.1 Định nghĩa. phương sai của ĐLNN ngẫu nhiên X, ký hiệu D(X) (hay V ar(X) ), được xác định bởi: n o D(X) = E [X − EX]2 Trong thực tế, người ta thường tính bông công thức: D(X) = E(X2) − [E(X)]2 n P 2 Nếu X là ĐLNN rời rạc thì: D(X) = [xi − E (X)] pi i=1 +∞ Nếu X là ĐLNN liên tục thì: D(X) = R [x − E (X)]2 f(x)dx −∞ 3.3.2.2 Tính chất. i. D(C) = 0 ii. D(CX) = C2.E(X) iii. Nếu X, Y là các ĐLNN độc lập thì D(X + Y ) = D(X) + D(Y ) iv. Nếu X, Y là các ĐLNN độc lập thì D(X − Y ) = D(X) + D(Y ) v. D(C + X) = D(X), C là hằng số. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  28. 3.3.2.3 ý nghĩa của phương sai. — 27 — Từ định nghĩa ta thấy phương sai là kỳ vọng toán của bình phương các sai lệch hay phương sai là sai lệch bình phương trung bình. Nó phản ánh mức độ phân tán các giá trị của ĐLNN xung quanh giá trị trung bình. Đại lượng nào có nhiều giá trị sai lệch lớn so với giá trị trung bình thì phương sai sẽ lớn và ngược lại. Nhận xét: Ta thấy phương sai không cùng đơn vị đo với kỳ vọng cũng như X. Do đó, người ta đưa ra một đại lượng khác là σ(X) = pD(X), được gọi là độ lệch chuẩn của biến số ngẫu nhiên X. Ta thấy cả σ(X) và D(X) đều đánh giá được mức độ phân tán hay mức độ tập trung của các giá trị của X xung quanh giá trị trung bình của nó. 3.3.3 Giá trị tin chắc nhất Định nghĩa. Giá trị tin chắc nhất của ĐLNN rời rạc X, ký hiệu là Mod(X) là giá trị của X ứng với xác suất lớn nhất trong bng phân phối xác suất. Nếu X là ĐLNN liên tục có hàm mật độ xác suất f (x) thì Mod(X) là giá trị của X mà tại đó hàm mật độ đạt giá trị cực đại. Nhận xét. Từ định nghĩa Mod(X) ta thấy Mod(X) chính là giá trị có khả năng xảy ra nhiều nhất trong các giá trị mà ĐLNN X có thể nhận. Ví dụ 3.3.3. ĐLNN X có qui luật phân phối xác suất như sau: X 7 8 9 10 11 12 14 p 0.1 0.14 0.3 0.24 0.11 0.26 0.05 Ta thấy P (X = 9) = 0, 3 là lớn nhất vì vậy Mod(X) = 9. 3.3.4 Một số tham số đặc trưng khác 3.3.4.1 Mômen h ki Định nghĩa. Mômen cấp k được định nghĩa là: αk = E (X) . n ko Định nghĩa. Mô men trung cấp k được định nghĩa là: ηk = E [X − E (X)] . n 2o Nhận xét: α1 = E [(X)]; η2 = E [X − E (X)] = D (X) và 2 2 2 η2=E X − [E (X)] = α2 − (α1) 3 η3=α3 − 3α1.α2 + 2 (α1) 2 4 η4=α4 − 4α1.α3 + 6 (α1) α2 − 3 (α1) Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  29. 3.3.4.2 Hệ số bất đối xứng: — 28 — µ S = 3 σ3 3.3.4.3 Hệ số nhọn: µ K = 4 − 3 σ4 Nếu K càng lớn thì đồ thị của hàm mật độ của ĐLNN đó càng nhọn. 3.4 Một số qui luật phân phối xác suất thông dụng 3.4.1 Qui luật nhị thức Giả sử tiến hành n phép thử độc lập, gọi A là biến cố nào đó mà ta cần quan tâm. Khi đó A có thể xảy ra hoặc không xảy ra. Giả sử P (A) = p, gọi X là số lần biến cố A xảy ra trong n phép thử. Khi đó X là ĐLNN rời rạc với miền giá trị là X (Ω) = {0, 1, 2, ··· , n}. Theo công thức Bernoulli ta có: k k n−k Pk = P {X = k} = Cnp (1 − p) (3.4.1) Định nghĩa. ĐLNN X có phân bố nhị thức với tham số n, p, ký hiệu X ∼ B(n, p) nếu X là ĐLNN rời rạc nhận một trong các giá trị: 0, 1, , n và các xác suất tương ứng được tính theo công thức (3.4.1). Nhận xét. Trong nhiều trưng hợp ta cần tính xác suất để ĐLNN X phân phối theo qui luật chuẩn nhận giá trị trong khoảng (k, k + h), ta có công thức sau: P (k 6 X 6 k + h) := Pk + Pk+1 + ··· + Pk+h Định lý 3.4.1. Nếu X ∼ B(n, p) thì i. E (X) = np ii. D (X) = npq Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  30. — 29 — iii. np − q 6 Mod (X) 6 np + p Ví dụ 3.4.2. Trong thành phố Đồng Hới có 65% gia đình có máy giặt. Chọn ngẫu nhiên 12 gia đình và gọi X là số gia đình có máy giặt. a) Tính xác suất để có đúng 5 gia đình có máy giặt. b) Tính xác suất để có ít nhất 2 gia đình có máy giặt. Giải. Nếu coi việc điều tra máy giặt trên là một phép thử thì ta có 12 phép thử độc lập. trong mỗi phép thử chỉ có hai khả năng xảy ra: hoặc có máy giặt hoặc không. Xác suất có máy giặt là p = 0.65. Ta có X ∼ B(12, 0.65). Vậy: 5 5 7 a) P {X = 5} = C12 (0.65) (0.35) = 0, 0591. 12 1 11 b) p {X > 2} = 1−P {X = 0}−p {X = 1} = 1−(0.35) −C12 (0.65) (0.35) = 0.999. Ví dụ 3.4.3. Một nhà máy sản xuất được 200 sản phẩm trong một ngày. Xác suất để sản xuất ra phế phẩm là 0.05. Tìm số phế phẩm trung bình và số phế phẩm tin chắc nhất của máy đó trong một ngày. Giải. Gọi X là số phế phẩm của nhà máy trong một ngày thì X ∼ B(200, 0.05). Suy ra E (X) = np = 200 × 0.05 = 10. Số phế phẩm tin chắc nhất của máy là np − q 6 Mod (X) 6 np + p hay 9.05 6 Mod (X) 6 10.05. Suy ra Mod(X) = 10. 3.4.2 Qui luật Poisson Gi sử tiến hành n phép thử độc lập, gọi A là biến cố nào đó mà ta cần quan tâm. Khi đó A có thể xảy ra hoặc không xảy ra. Giả sử P (A) = p, gọi X là số lần biến cố A xảy ra trong n phép thử. Trường hợp n lớn p nhỏ (p < 0.1) và tích np = λ không đổi. Ta có: λk p = p {X = k} = Ckpkqn−k ≈ e−λ (3.4.2) k n k! Định nghĩa. ĐLNN X có phân bố Poisson với tham số λ, ký hiệu X ∼ ℘(λ) nếu X là ĐLNN rời rạc nhận một trong các giá trị: 0, 1, ., n và các xác suất tương ứng tính theo công thức (3.4.2). Định lý 3.4.4. Nếu thì i. E (X) = λ ii. D (X) = λ iii. λ − 1 6 Mod (X) 6 λ Ví dụ 3.4.5. Một xe ti vận chuyển 4000 chai Cocacola. Xác suất một chai Cocacola bị vỡ khi vận chuyển là 0,001. a). Tìm xác suất để có không quá 3 chai bị vỡ khi vận chuyển. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  31. b). Tìm số chai cocacola bị vỡ trung bình và số chai bị vỡ tin chắc nhất khi— 30 vận — chuyển? Giải. Gọi X là số chai cocacola bị vỡ khi vận chuyển 4000 chai. Khi đó X là ĐLNN và X ∼ B(4000, 0.001). Do n = 4000 khá lớn, p = 0, 001 quá nhỏ và λ = np = 4000 × 0, 001 = 4 nên ta coi X ∼ ℘(4). a) Xác suất để có không quá 3 chai bị vỡ khi vận chuyển là: P (0 6 X 6 3) = P0 + P1 + P2 + P3. 40 −4 41 −4 42 −4 Ta có P0 = P (X = 0) = 0! e , P1 = 1! e , P2 = P (X = 2) = 2! e , P3 = 43 −4 P (X = 3) = 3! e . Vậy  32 p (0 X 3) = 1 + 4 + 8 + e−4 ≈ 6 6 3 b). Số cocacola bị vỡ trung bình là hay có trung bình 4 chai cocacola bị vỡ khi vận chuyển 4000 chai. Số chai bị vỡ tin chắc nhất khi vận chuyển 4000 chai là Suy ra E (X) = λ = 4. Vậy số chai cocacola có khả năng bị vỡ nhiều nhất là 3 hoặc 4 chai khi vận chuyển 4000 chai. 3.4.3 Qui luật siêu bội Từ một tập hợp gồm N phần tử, (trong đó có M phần tử có tính chất A nào đó). Lấy ngẫu nhiên không hoàn lại ra n phần tử. Gọi X là số phần tử có tính chất A có trong n phần tử lấy ra thì X là ĐLNN rời rạc có thể nhận các giá trị: 0, 1, 2, , n với xác suất tương ứng là: k n−k CM .CN−M Pk = P {X = k} = n (3.4.3) CN Trong đó, max {0,M + n − N} 6 k 6 min {n, M} Định nghĩa. ĐLNN X có siêu bội với tham số N, M, n, ký hiệu X ∼ H (N, M, n) nếu X là ĐLNN rời rạc nhận một trong các giá trị: 0, 1, ., n và các xác suất tương ứng tính theo công thức (3.4.3). Định lý 3.4.6. Nếu X ∼ H (N, M, n) thì M 1. E (X) = np, p = N N−n 2. D (X) = npq N−1 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  32. Nhận xét. Khi n bé so với N thì ta có thể chứng minh công thức xấp xĩ— sau: 31 — k n−k CM .CN−M k k n−k n ≈ Cnp q CN Ví dụ 3.4.7. Chọn ngẫu nhiên 7 lá bài từ một bộ bài có 52 lá. Tính xác suất để có 3 lá rô. Giải. Gọi X là số lá rô trong 7 lá bài được chọn ra, thì X là ĐLNN rời rạc có thể nhận các giá trị 0, 1, 2, 3, 4, 5, 6, 7. Do trong bộ bài 52 con có 13 lá rô nên X ∼ H (52, 13, 7). Vậy 3 4 C13.C39 P3 = P {X = 3} = 7 C52 Ví dụ 3.4.8. Một công ty nhập về một lô hàng có 1000 sản phẩm, trong đó có 800 sản phẩm loại A và 200 sản phẩm loaị B. Lấy ngẫu nhiên (không hoàn lại) từ lô hàng 10 sản phẩm để kiểm tra. Tìm xác suất để có ít nhất 8 sản phẩm loại A trong 10 sản phẩm lấy ra kiểm tra? Giải. Gọi X là số sản phẩm loại A có trong 10 sản phẩm lấy ra để kiểm tra, vì lấy không hoàn lại nên X là ĐLNN có X ∼ H (1000, 800, 10). Vì n = 10 khá bé so với N = 1000 nên ta có thể xấp xĩ X ∼ B (10 ; 0, 8). Ta có p (X > 8) = P (X = 8) + P (X = 9) + P (X = 10) 8 8 2 9 9 10 10 = C10 (0, 8) (0, 2) + C10 (0, 8) (0, 2) + C10 (0, 8) = 0, 30199 + 0, 268435 + 0, 107374 = 0, 6778. BÀI TẬP CHƯƠNG 3 3.1. Một hợp tác xã nông nghiệp có hai ô tô vận ti hoạt động. Xác suất bị hỏng trong ngày làm việc của các ô tô tương ứng là 0,1 và 0,2. Gọi X là số ô tô bị hỏng trong thời gian làm việc. a. Lập bảng phân phối xác suất của X. b. Thiết lập hàm phân phối xác suất và vẽ đồ thị của nó. 3.2. Một dây chuyền gồm 3 bộ phận hoạt động độc lập với nhau. Xác suất trong thời gian 1 tuần các bộ phận bị hỏng tương ứng là 0,4; 0,2 và 0,3. Gọi X là số bộ phận bị hỏng trong thời gian 1 tuần làm việc. a. Lập bảng phân phối xác suất của X. b. Thiết lập hàm phân phối xác suất và vẽ đồ thị của nó. c. Tính xác suất trong thời gian 1 tuần có không quá 2 bộ phận bị hỏng. d. Tính giá trị tin chắc nhất của X. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  33. 3.3. Có hai lô sản phẩm: — 32 — Lô 1: Có 8 chính phẩm và 2 phế phẩm. Lô 2: Có 7 chính phẩm và 3 phế phẩm. Từ lô thứ nhất lấy ngẫu nhiên 2 sản phẩm bỏ sang lô thứ hai, sau đó từ lô thứ hai lấy ra 2 sản phẩm. a. Tìm qui luật phân phối xác suất của số chính phẩm được lấy ra. b. Xây dựng hàm phân phối xác suất của số chính phẩm được lấy ra và vẽ đồ thị. 3.4. Có hai kiện hàng. Kiện thứ nhất: Có 4 sản phẩm loại A và 8 sản phẩm loại B. Kiện thứ hai : Có 3 sản phẩm loại A và 5 sản phẩm loại B Lấy ngẫu nhiên 2 sản phẩm từ kiện thứ nhất bỏ vào kiện thứ hai, sau đó từ kiện thứ hai lấy không hoàn lại ra 3 sản phẩm. Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra từ kiện thứ hai. a. Lập bảng phân phối xác suất của X. b. Tính E (X); var (X) . 3.5. Có hai kiện hàng, mỗi kiện có 5 sản phẩm. Kiện thứ nhất: Có 2 sản phẩm loại A. Kiện thứ hai: Có 3 sản phẩm loại A. Lấy ngẫu nhiên 1 sản phẩm từ kiện thứ nhất bỏ vào kiện thứ hai, sau đó từ kiện thứ hai lấy ngẫu nhiên 2 sản phẩm bỏ vào kiện 1 thứ nhất. Lập bảng phân phối xác suất của số sản phẩm loại A trong kiện thứ nhất? 3.6. Có hai hộp đựng bi: Hộp thứ nhất: có 2 bi xanh và 4 bi vàng. Hộp thứ hai: có 4 bi xanh Rút ngẫu nhiên 2 bi từ hộp thứ nhất bỏ sang hộp thứ hai, sau đó từ hộp thứ hai lấy ngẫu nhiên 3 bi bỏ vào hộp thứ nhất. Gọi lần lược là số bi xanh có ở hộp thứ nhất, thứ hai sau khi thực hiện phép thử. Tìm qui luật phân phối xác suất của X1,X2. 3.7. Có 3 kiện hàng. Kiện thứ nhất: Có 8 sản phẩm loại A và 2 sản phẩm loại B. Kiện thứ hai: Có 5 sản phẩm loại A và 5 sản phẩm loại B. Kiện thứ ba: Có 3 sản phẩm loại A và 7 sản phẩm loại B. a. Chọn ngẫu nhiên một kiện rồi từ kiện đã chọn lấy ngẫu nhiên không hoàn lại ra 2 sản phẩm thì được 2 sản phẩm loại A. Lấy tiếp từ kiện đã chọn ra 2 sản phẩm. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  34. Tìm qui luật phân phối xác suất của số sản phẩm loại A có trong 2 sản phẩm— 33 lấy — ra lần sau? b. Chọn ngẫu nhiên 2 kiện rồi từ 2 kiện đã chọn lấy ngẫu nhiên không hoàn lại mỗi kiện 1 sản phẩm.Tìm qui luật phân phối xác suất của số sản phẩm loại A có trong 2 sản phẩm lấy ra? 3.8. Có 3 kiện hàng, mỗi kiện chứa 10 sản phẩm. Số sản phẩm loại B trong mỗi kiện tương ứng là 1,2,3. a. Lấy ngẫu nhiên từ mỗi kiện ra một sản phẩm. Tìm qui luật phân phối xác suất của số sản phẩm loại A có trong 3 sản phẩm lấy ra? b. Chọn ngẫu nhiên một kiện rồi từ kiện đã chọn lấy ngẫu nhiên không hoàn lại 3 sản phẩm. Tìm qui luật phân phối xác suất của số sản phẩm loại B có trong 3 sản phẩm lấy ra? 3.9. Lãi suất thu được trong một năm (tính theo %) khi đầu tư vào công ty A, công ty B tương ứng là các ĐLNN X và Y (X và Y độc lập). Cho biết qui luật phân phối xác suất của X và Y như sau: X 4 6 8 10 12 p 0.05 0.1 0.3 0.4 0.15 Y -4 2 8 10 12 16 p 0.1 0.2 0.2 0.25 0.15 0.1 a. Đầu tư vào công ty nào có lãi suất kỳ vọng cao hơn? b. Đầu tư vào công ty nào có mức độ rủi ro ít hơn? Vì sao? c. Nếu muốn đầu tư vào cả hai công ty thì nên đầu tư theo tỷ lệ như thế nào để cho: (1) Thu được lãi suất kỳ vọng cao nhất (2) Mức độ rủi ro về lãi suất ít nhất. 3.10. Số tiền lời trong năm tới (tính theo đơn vị: triệu đồng) thu được khi đầu tư 100 triệu đồng vào hai ngành A và B tùy thuộc vào tình hình kinh tế trong nước và cho ở bảng sau: Số tiền lời Tình hình kinh tế Kém phát triển ổn định Phát triển Ngành A 10 40 80 Ngành B -30 70 110 a. Số tiền lời kỳ vọng ngành nào là cao hơn? b. Mức độ rủi ro ngành nào là ít hơn? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  35. Chương 4 — 34 — ĐẠI CƯƠNG VỀ THỐNG KÊ TOÁN 4.1 TỔNG THỂ VÀ MẪU NGẪU NHIÊN 4.1.1 Tổng thể Tập hợp các phần tử mà ta cần kho sát về một hay một số dấu hiệu nào đó gọi là một tổng thể. Giả sử ta nghiên cứu về dấu hiệu X∗ nào đó của các phần tử trong tổng thể. Dấu hiệu X∗ này thường được cụ thể hóa thành các giá trị thay đổi từ phần tử này qua phần tử khác. Chúng lập nên một đại lượng ngẫu nhiên X nào đó. Khi đó có thể coi việc nghiên cứu dấu hiệu X* trên các phần tử của tổng thể là xét ĐLNN X trên tổng thể. 4.1.2 phương pháp mẫu. Gi sử cần nghiên cứu ĐLNN X trên một tổng thể gồm N phần tử. Người ta thường sẽ chọn ngẫu nhiên có hoàn lại n phần tử. Ta gọi đó là một mẫu kích thước n (nói chung n là nhỏ so với N). Lần lượt đo giá trị X trên các phần tử cụ thể của mẫu, nghiên cứu kết quả và bông các phương pháp khoa học, rút ra kết luận về ĐLNN X trên tổng thể đó. Ghi chú: Khi N quá lớn so với n, người ta có thể chọn ngẫu nhiên n phần tử không hoàn lại. Từ đây ta qui ước chỉ xét các tổng thể có số phần tử N rất lớn. 4.1.3 Mẫu ngẫu nhiên kích thước n Giả sử ĐLNN X (xét trên một tổng thể) có qui luật phân phối cụ thể nào đó. Ta dự định sẽ chọn ngẫu nhiên n phần tử. Giá trị X (chưa biết trước) trên phần tử thứ 1 là ĐLNN X1 có cùng qui luật phân phối với X. Giá trị X (chưa biết trước) trên phần tử thứ n là ĐLNN Xn có cùng qui luật phân phối với X. Ta gọi bộ thứ tự gồm n ĐLNN X1,X2, , Xn có cùng phân phối với ĐLNN X là một mẫu ngẫu nhiên kích thước n của ĐLNN X. Ký hiệu WX = (X1,X2,,Xn). Lấy ngẫu nhiên n phần tử cụ thể trong tổng thể và đo giá trị X trên cụ thể các phần tử thứ 1, thứ 2, thứ n này, ta được một mẫu cụ thể là (x1, x2, , xn). Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  36. — 35 — 4.2 CÁC ĐẶC TRƯNG TƯƠNG ỨNG CỦA TỔNG THỂ VÀ MẪU X ĐLNN trên tổng thể Mẫu (X1,X2, , Xn) Mẫu cụ thể (x1, x2, , xn) +Trung bình tổng thể +Trung bình mẫu +Trung bình mẫu cụ thể X1+ +Xn x1+ +xn E(X) ≡ M(X) = µ X = n x = n +phương sai tổng thể Phương sai mẫu (hiệu +Phương sai mẫu cụ thể chỉnh) n 2 n 2 2 1 P   2 1 P 2 D(X) = σ S = n−1 Xi − X S = n−1 (xi − x) i=1 i=1  n   n  1 P 2 2 1 P 2 2 = n−1 Xi − nX = n−1 xi − nx i=1 i=1 +Độ lệch tổng thể +Độ√ lệch mẫu +Độ√ lệch mẫu cụ thể σ = pD(X) S = S2 s = s2 +Tỉ lệ tổng thể +Tỉ lệ mẫu +Tỉ lệ mẫu cụ thể M X + + X x + + x m P (A) = A = p = E(X) F = 1 n f = 1 n = A N n n n n MA là số phần tử có tính chất A trong tổng thể; mA: số phần tử có tính chất A trong mẫu cụ thể; ở đây X: ĐLNN với X = 1 nếu phần tử có tính chất A, X = 0 nếu phần tử không có tính chất A(•). +Có thể nói x, s2, s, f ở trên lần lượt là giá trị của trung bình mẫu, phương sai mẫu, độ lệch mẫu, tỉ lệ mẫu ứng với mẫu cụ thể (kích thước n). +Có thể hiểu: tỉ lệ mẫu Fn là tỉ lệ phần tử có tính chất A trong mẫu sẽ lấy ngẫu nhiên n phần tử. Giá trị tỉ lệ mẫu f là tỉ lệ phần tử có tính chất A trong mẫu cụ thể n phần tử. Tính chất. Trung bình mẫu, phương sai mẫu, độ lệch mẫu, tỉ lệ mẫu là các ĐLNN và     i) E X = E(X) = µ; D X = D(X)/n = 2/n ii) E(S2) = D(X) = σ2; iii) Cho X là ĐLNN xác định bởi (•). Ta có E(Fn) = E(X) = p và D(Fn) = D(X)/n = p(1 − p)/n. Chứng minh. i)   E X = E([X1 + + Xn]/n) = (E(X1) + + E(Xn))/n = (E(X) + + E(X))/n = E(X)   2 2 D X = (D(X1) + + D(Xn))/n = (D(X) + + D(X))/n = D(X)/n. ii) Xem [1,2,3]. iii) Dễ chứng minh E(X) = p và D(X) = p(1 − p). Tiếp theo, từ i) suy ra iii). Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  37. Ví dụ 4.2.1. Điều tra năng suất lúa trong 1 vùng lớn. Kiểm tra 100ha trồng— 36 lúa — được chọn ngẫu nhiên, người ta thu được số liệu: Năng suất (tạ/ha) 41 44 45 46 48 52 54 Diện tích tưng ứng 10 20 30 15 10 10 5 Tính giá trị trung bình mẫu và phương sai mẫu, độ lệch mẫu của mẫu cụ thể trên. Ta lập bảng: 2 xi ni nixi nixi 41 10 410 16810 44 20 880 38720 45 30 1350 60750 46 15 690 31740 48 10 480 23040 52 10 520 27040 54 5 270 14580 Σ n = 100 4600 212680 4600 Giá trị trung bình mẫu x = = 46 (tạ/ha) 100 Giá trị phương sai mẫu s2 = 1 [212680 − 100.462] = 10, 91. √ 99 Giá trị độ lệch mẫu s = 10, 91 ≈ 3, 3 (tạ/ha) Ghi chú. Khi tính x và s2, nếu số liệu của mẫu cho theo khoảng thì ta thay khoảng đó bằng giá trị trung tâm của khoảng (tức là trung bình cộng của 2 đầu khoảng). Ví dụ 4.2.2. Để tìm hiểu số lượng mủ cao su cho mỗi ngày của mỗi cây trên một vùng (trong năm đầu khai thác), người ta kiểm tra ngẫu nhiên 100 cây cao su và có số liệu Lượng mủ (g) 200-210 210-220 220-230 230-240 240-250 250-260 260-270 Số cây 2 8 14 30 25 12 9 Tìm trung bình, phương sai và độ lệch mẫu cụ thể trên. Ta có bảng Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  38. 2 — 37 — xi ni nixi nixi 205 2 410 84050 215 8 1720 369800 225 14 3150 708750 235 30 7050 165675 245 25 6125 150062 255 12 3060 780300 265 9 2385 632025 Σ n = 100 23900 5732300 Từ bảng ta suy ra 23900 Giá trị trung bình mẫu x = = 239(g) 100 Giá trị phương sai mẫu 1 s2 = (5732300 − 100 × 2392) = 204, 0404 99 Giá trị độ lệch mẫu s = p204, 0404 ≈ 14, 28(g) 4.3 ƯỚC LƯỢNG ĐIỂM Giả sử ĐLNN X của tổng thể có một đặc trưng số θ chưa biết và cần ước lượng. Ta có thể ước lượng θ bông một con số nào đó xấp xỉ θ. Cách ước lượng như vậy gọi là ước lượng điểm. 4.3.1 phương pháp hàm ước lượng điểm. Giả sử ĐLNN X của tổng thể có tham số θ cần phải ước lượng điểm. Từ ĐLNN X ta lập mẫu ngẫu nhiên kích thước n là (X1, , Xn). Lập hàm ước _ lượng θ = f(X1, , Xn) là hàm theo các ĐLNN X1, , Xn. Chọn mẫu cụ thể (x1, , xn). Giá trị hàm ước lượng là f(x1, , xn) và đây là ước lượng điểm của θ. Trong thực tế, + Để ước lượng trung bình tổng thể E(X)(M(X)) ta dùng hàm ước lượng là trung bình mẫu X. + Để ước lượng tỉ lệ tổng thể p = p(A) ta dùng hàm ước lượng là tỉ lệ mẫu Fn. + Để ước lượng phương sai tổng thể D(X) ta dùng hàm ước lượng là phương sai mẫu S2. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  39. — 38 — Chọn mẫu cụ thể (x1, , xn). Rồi tính giá trị hàm ước lượng. Đó là ước lượng điểm cần tìm. 4.3.2 Ước lượng không chệch. _ Hàm ước lượng θ = f(X1, , Xn) gọi là ước lượng không chệch của tham số θ _ nếu giá trị trung bình E(θ) = θ. _ ý nghĩa. Nếu θ = f(X1, , Xn) là ước lượng không chệch của tham số θ thì sai _ số trung bình của ước lượng là E(θ − θ) = θ − θ = 0. Các hàm ước lượng sử dụng trong thực tế đã nói ở trên đều là ước lượng không chệch.   2 2 Do E X = E(X); E(S ) = D(X); E(Fn) = p ( từ tính chất của X, S và Fn). Ghi chú. Người ta chứng minh được với mẫu cụ thể có kích thước n đủ lớn, + Trung bình mẫu cụ thể x xấp xỉ trung bình tổng thể E(X). + Tỉ lệ mẫu cụ thể f xấp xỉ tỉ lệ tổng thể p = p(A). + phương sai mẫu cụ thể s2 xấp xỉ phương sai tổng thể D(X). Ví dụ 4.3.1. Xét lại ví dụ 4.2.1 ở trên. a)Hãy ước lượng năng suất trung bình của lúa trong vùng. b)Hãy ước lượng độ thiếu đồng đều của năng suất lúa trong vùng. Từ kết quả ví dụ 4.2.1, ta có năng suất lúa trong vùng ước chừng là x = 46 (tạ/ha). Độ thiếu đồng đều năng suất lúa trong vùng ước chừng s ≈ 3, 3(tạ/ha) (hoặc s2 = 10, 91). 4.4 ƯỚC LƯỢNG KHOẢNG Giả sử ĐLNN X của tổng thể có đặc trưng số θ chưa biết và cần ước lượng. Ta chọn một khoảng (θ1, θ2) sao cho nó chứa θ với xác suất cao ( tức là p(θ1 0 đủ bé). Cách ước lượng như vậy gọi là ước lượng khoảng. Ghi chú. Khoảng (θ1, θ2) gọi là khoảng tin cậy và 1 − α gọi là độ tin cậy của ước lượng trên. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  40. 4.4.1 Ước lượng trung bình tổng thể. — 39 — Giả sử ĐLNN X có trung bình tổng thể E(X) = µ chưa biết. Cần ước lượng khoảng tin cậy của µ với độ tin cậy 1 − α, với α > 0 đủ bé. Lập mẫu ngẫu nhiên (X1, , Xn). n > 30 ( hoặc n zα) = α P (|Z| > zα) = α P (|T | > tα) = α +tính độ chính xác +tính độ chính xác +tính độ chính xác √σ √s √s ε = zα . n ε = zα . n ε = tα . n +Khoảng tin cậy của µ là +Khoảng tin cậy của µ là +Khoảng tin cậy của µ là (x − ε, x + ε)với độ tin (x − ε, x + ε)với độ tin (x − ε, x + ε)với độ tin cậy 1 − α cậy 1 − α cậy 1 − α Lập luận(*) √ P (|Z| > z) = α ⇔ P (|Z| ≤ z ) = 1 − α ⇔ P (X − z .σ/ n µ X + √ α α 6 6 zα.σ/ n) = 1 − α. Ví dụ 4.4.1. Điều tra năng suất lúa trên 100 ha lúa được chọn ngẫu nhiên của một vùng lớn, người ta tính được trung bình mẫu cụ thể x = 46 tạ/ha và độ lệch mẫu cụ thể s = 3, 3 tạ. Hãy ước lượng năng suất lúa trung bình cả vùng với độ tin cậy 95%. Gọi X (tạ/ha) là năng suất lúa trên các ha lúa của vùng lớn đó. E(X) = µ (tạ/ha) là năng suất lúa trung bình toàn vùng. Cần ước lượng µ với độ tin cậy 1 − α = 0, 95. TH này n = 100 > 30 và σ2 chưa biết. Ta làm như sau + α = 0, 05. Tìm zα sao: P (|Z| > zα) = α ⇒ zα = 1, 96. s 3, 3 ε = zα .√ = 1, 96.√ = 0, 6468 ≈ 0, 65 n 100 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  41. — 40 — +Khoảng tin cậy của µ là (x − ε, x + ε) = (460, 65; 46 + 0, 65). Năng suất lúa trung bình cả vùng ước chừng 45,35 đến 46,65 (tạ/ha) với độ tin cậy 95%. Ví dụ 4.4.2. Lấy ngẫu nhiên 15 bao thuốc bột do một công ty dược sản xuất ra. Ta tính được trung bình mẫu cụ thể 39,8 g và phương sai mẫu cụ thể là 0,144. Giả thiết trọng lượng các bao thuốc bột là ĐLNN có phân phối chuẩn. Hãy ước lượng trọng lượng trung bình của các bao thuốc do công ty sản xuất với độ tin cậy 95%. Gọi X (g) là trọng lượng mỗi bao thuốc do công ty sản xuất. E(X) = µ(g) là trọng lượng trung bình của mỗi bao. Cần ước lượng µ với độ tin cậy 95%. TH này n = 15 tα) = 1 − α , ta có tα = 2, 145. √ s 0, 144 ε = tα .√ = 2, 145. √ = 0, 21 n 15 +Khoảng tin cậy (x − ε, x + ε) = (39, 80, 21; 39, 8 + 0, 21). Vậy trọng lượng trung bình của các bao thuốc khoảng 39,59 đến 40,01g với độ tin cậy 95%. 4.4.2 Ước lượng tỉ lệ tổng thể. Giả sử tỉ lệ các phần tử có tính chất A trong một tổng thể là p = P (A) mà ta chưa biết. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  42. Cần ước lượng khoảng tin cậy của tỉ lệ p với độ tin cậy 1 − α, với α > 0—đủ 41 bé. — Xét ĐLNN X trên tổng thể xác định như sau X = 1 nếu phần tử kiểm tra có tính chất A, X = 0 nếu phần tử kiểm tra không có tính chất A. Lập mẫu ngẫu nhiên kích thước n đủ lớn (X1, , Xn). Fn − p Xét ĐLNN Z = √ , với Fn là tỉ lệ mẫu. pp(1 − p)/ n Người ta chứng minh được Z ∼ N(0, 1). Lập luận tương tự trên và để ý với n đủ lớn, ta có f ≈ p,ta suy ra cách tìm khoảng tin cậy: +Tìm tần suất f xuất hiện tính chất A trong mẫu cụ thể. +Tra bảng phân phối chuẩn tắc tìm trị zα sao cho P (|Z| > zα) = α. +Tính độ chính xác pf(1 − f) ε = z . √ α n +Khoảng tin cậy của tỉ lệ p là (f − ε, f + ε) với độ tin cậy 1 − α. Ví dụ 4.4.3. Nghiên cứu nhu cầu tiêu dùng một mặt hàng ở một thành phố, người ta điều tra trên 1000 người được chọn ngẫu nhiên của thành phố và thấy có 600 người có nhu cầu. Hãy ước lượng tỉ lệ người có nhu cầu về mặt hàng đó trong toàn thành phố với độ tin cậy 95%. Gọi tỉ lệ người có nhu cầu về mặt hàng này là p. Ta cần ước lượng p với độ tin cậy 1 − α = 0, 95. +Tỉ lệ người có nhu cầu này trong mẫu cụ thể là f = 600/1000 = 0, 6. +Tìm zα sao P (|Z| > zα) = α = 0, 05 ⇒ zα = 1, 96. Và √ pf(1 − f) 0, 6.0, 4 ε = zα. √ = 1, 96. √ = 0, 03 n 1000 +Khoảng tin cậy của p là (0, 6 − 0, 03; 0, 6 + 0, 03) = (0, 57; 0, 63). Vậy tỉ lệ người trong thành phố có nhu cầu về mặt hàng là 57% đến 63% với độ tin cậy là 95%. 4.4.3 Ước lượng phương sai tổng thể. Giả sử ĐLNN X có phân phối chuẩn và chưa biết phương sai σ2 của nó. Hãy ước lượng khong tin cậy của phương sai σ2 với độ tin cậy 1 − α với α đủ bé. Từ X ta lập mẫu ngẫu nhiên kích thước n là (X1, , Xn). Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  43. TH1. Biết trung bình tổng thể TH2. Không biết trung bình— tổng 42 — E(X) = µ. thể E(X). n (n − 1)S2 P (X − µ)2 Xét ĐLNN χ2 = . Người ta i σ2 Xét ĐLNN χ2 = i=1 . Người ta σ2 c/m nó có phân phối "Khi bình c/m nó có phân phối χ2 với n bậc tự do phương" với n − 1 bậc tự do. Qui tắc tìm khoảng tin cậy sau Qui tắc tìm khoảng tin cậy sau 2 2 2 2 +Tìm các số χα/2 và χ1 - α/2 trong bảng +Tìm các số χα/2 và χ1 - α/2 trong bảng phân phối χ2 với n bậc tự do. phân phối χ2 với n − 1 bậc tự do. n P 2 2 +Tính trị số u = (xi − µ) +Tính trị số u = (n − 1)s i=1 +Khoảng tin cậy của phương sai σ2 là +Khoảng tin cậy của phương sai σ2 là     u u u u 2 ; 2 2 ; 2 χα/2 χ1−α/2 χα/2 χ1−α/2 Ví dụ 4.4.4. Lượng hao phí nguyên liệu cho một đơn vị sản phẩm là ĐLNN X có phân phối chuẩn với giá trị trung bình là 20 (g). Quan sát ngẫu nhiên 25 sản phẩm, ta có số liệu cho ở bảng Trọng lượng nguyên liệu hao phí (g) 19.5 20 20.5 Số sản phẩm 5 18 2 Với độ tin cậy 90%, hãy ước lượng phương sai D(X) = σ2. Đây là bài toán ước lượng phương sai biết giá trị trung bình µ = 20. + 1 + α = 0, 9 ⇒ α = 0, 1, α/2 = 0, 05 và 1 − α/2 = 0, 95 2 2 2 Tra bảng χ với bậc tự do n = 25, ta có χα/2 = 37, 65 và χ1−α/2 = 14, 61. 2 Ta có u = Σni.(xi − µ) = 1, 75. + Khoảng tin cậy của phương sai σ2 là ! u u  1, 75 1, 75  2 ; 2 = ; = (0, 0465; 0, 12). χα/2 χ1−α/2 37, 65 14, 61 Vậy phương sai của X là khoảng 0,0465 đến 0,12 với độ tin cậy 90%. Ví dụ 4.4.5. Xét lại ví dụ 4.4.4 với chút thay đổi là không cho biết giá trị trung bình µ. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  44. Đây là bài toán ước lượng phương sai khi không biết giá tri trung bình E—(X 43) —. + 1 − α = 0, 9 ⇒ α = 0, 1, α/2 = 0, 05 và 1 − α/2 = 0, 95 Tra bảng χ2 với bậc 2 2 tự do n − 1 = 24, ta có χα/2 = 36, 42 và χ1−α/2 = 13, 85. 2 1 2 Ta có x = 498, 5/25 = 19, 94 s = 24 (9941, 75 − 25 × 19, 94 ) = 0, 0692. u u = (n − 1)s2 = 240, 0692 = 1, 66   u u  1,66 1,66  +Khoảng tin cậy 2 ; 2 = ; = (0, 046; 0, 12) Vậy phương sai χα/2 χ1−α/2 36,42 13,85 của X khoảng 0,046 đến 0,12 với độ tin cậy 90%. 4.4.4 Xác định kích thước mẫu. Giả sử đã biết khoảng tin cậy có độ chính xác ε và độ tin cậy 1 − α. Cần xác định kích thước mẫu n1 tối thiểu là bao nhiêu. Xác định kích thước mẫu khi ước lượng trung bình tổng thể. Với α ta xác định zα sao cho P (|Z| > zα) = α. √σ 2 √s 2 Ta có ε = zα . n . (TH biết σ ) hoặc ε = zα . n (TH không biết σ ). 2 2 2 2 (zα) .σ 2 (zα) .s 2 Suy ra n = ε2 (TH biết σ ) hoặc n = ε2 (TH không biết σ ). Chọn kích thước mẫu là số tự nhiên n1 > n này. Ví dụ 4.4.6. Giả sử cần ước lượng năng suất lúa trung bình cho một vùng lớn. Sau khi điều tra 100ha lúa chọn ngẫu nhiên trong vùng người ta có ước lượng năng suất trung bình của vùng ước chừng 45,35 đến 46,65 (tạ/ha) với độ tin cậy 95% và có độ lệch mẫu cụ thể s = 3, 3 tạ. Tìm số ha lúa phải điều tra thêm để khong tin cậy (45,35 ; 46,65) như trên có độ tin cậy 99%. Với α = 0, 01, tìm zα sao: P (|Z| > zα) = α. Chọn zα = 2, 576. √s 2 Ta có ε = (46, 6545, 35)/2 = 0, 65. Biết ε = zα . n (TH không biết σ ) 2 2 2 2 (zα) .s 2,576 ×3,3 n = ε2 = 0,652 = 171, 04 ⇒ Số ha cần điều tra ít nhất là n1 = 172. Số ha lúa phải điều tra thêm n1 − 100 = 72 (ha). Xác định kích thước mẫu khi ước lượng tỉ lệ tổng thể. √ f(1−f) √ Với α ta xác định zα sao cho P (|Z| > zα) = α. Ta có ε = zα. n . (z )2.f(1 − f) Suy ra n = α ε2 Chọn kích thước mẫu là số tự nhiên n1 > n này. Ví dụ 4.4.7. Nghiên cứu nhu cầu tiêu dùng một mặt hàng ở một thành phố, người ta điều tra trên 1000 người của thành phố và biết tỉ lệ người trong thành phố có nhu cầu về mặt hàng này là 57% đến 63% với độ tin cậy là 95%. Người ta muốn tăng độ tin cậy lên 99% thì số người phải điều tra thêm là bao nhiêu? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  45. √ 2 — 44 — f(1−f) (zα) .f(1 − f) Ta có ε = z . √ Suy ra n = . Với α = 0, 01. Tìm z sao: α n ε2 α P (|Z| > zα) = α, ta có zα = 2, 576. Ta có f = (0, 63 + 0, 57)/2 = 0, 6 và ε = (0, 630, 57)/2 = 0, 03. suy ra n = (2, 57620, 60, 4)/0, 032 = 1769, 54 ⇒ Số người phi điều tra ít nhất n1 = 1770. Số người phải điều tra thêm 1770 − 1000 = 770 người. 4.4.5 Xác định độ tin cậy. Giả sử đã biết khong tin cậy có độ chính xác ε và biết kích thước mẫu n. Cần xác định độ tin cậy 1 − α là bao nhiêu. Xác định độ tin cậy khi ước lượng trung bình tổng thể. Để đơn giản ta chỉ xét trường hợp kích thước mẫu n > 30. σ s Ta có ε = z .√ (TH biết σ2) hoặc ε = z .√ (TH không biết σ2). α n α n √ ε. n 2 2 Suy ra zα = σ (TH biết σ ) hoặc (TH không biết σ ). Từ giá trị zα, ta có P (|Z| > z) = α ⇒ độ tin cậy 1 − α. Ví dụ 4.4.8. Để ước lượng trọng lượng trung bình sản phẩm của nhà máy, người ta điều tra 121 sản phẩm, được phương sai mẫu cụ thể s2 = 15,3 và trung bình mẫu cụ thể là 98 Kg. Ước lượng với độ chính xác là 1Kg thì độ tin cậy là bao nhiêu. √ s 2 ε. n Ta có ε = zα .√ (TH không biết σ ). Suy ra zα = . ε = 1; n = 121 và √ n s s = 15, 3 = 3, 9115 ⇒; z = (1.11)/3, 9115 = 2, 8122. Từ P (|Z| > z) = α có α ≈ 0, 0049 ⇒ 1 − α = 0, 9951. Vậy ước lượng trọng lượng trung bình sản phẩm khong 97 đến 99 Kg thì độ tin cậy là 99,51% Xác định độ tin cậy khi ước lượng tỉ lệ tổng thể. Xét trường hợp kích thước n đủ lớn. p √ f(1 − f) ε. n Ta có ε = zα. √ . Suy ra zα = √ n f(1−f) Từ giá trị zα , ta có P (|Z| > zα) = α ⇒ độ tin cậy 1 − α. Ví dụ 4.4.9. Nghiên cứu nhu cầu tiêu dùng 1 mặt hàng ở một thành phố, người ta điều tra trên 1000 người được chọn ngẫu nhiên và được tỉ lệ mẫu f = 60%. Ước lượng tỉ lệ người (trong thành phố) có nhu cầu về mặt hàng đó khoảng 55% đến 65% thì độ tin cậy bao nhiêu? Ta có f = 0, 6; ε = 0, 05; n = 1000. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  46. √ f(1−f) — 45 — √ Biết ε = zα. n . Suy ra √ √ ε. n 0, 05 × 1000 zα = = √ ≈ 3, 2275. pf(1 − f) 0, 6 × 0, 4 Ta có P (|Z| > zα) = α0, 0013 ⇒ 1 − α = 0, 9987. Vậy ước lượng tỉ lệ người có nhu cầu khoảng 55% đến 65% thì độ tin cậy là 99,87%. 0 Chú ý. TH: tra bảng P (Z > zα) = α. 0 Thay zα = zα/2 vào toàn bộ các công thức có sử dung zα ở trên. 0 0 Để ý P (|Z| > zα) = P (|Z| > zα/2) = 2P (z > zα/2) = α. 4.5 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 4.5.1 Khái niệm a. Giả thiết thống kê. + Giả thiết thống kê là các giả thiết về các tham số hoặc qui luật phân phối xác suất hoặc tính độc lập của các ĐLNN. + Việc tìm ra kết luận là chấp nhận hoặc bác bỏ một gi thiết gọi là kiểm định giả thiết thống kê. + Giả thiết cần kiểm định gọi là giả thiết không, ký hiệu là H0 (hoặc H). Mệnh đề đối lập với H0 được gọi là giả thiết đối và ký hiệu là H1 (hoặc H). Chẳng hạn: H0 : θ = θ0,H1 : θ 6= θ0. Kiểm định với giả thiết đối dạng này gọi là kiểm định giả thiết hai phía. Còn nếu kiểm định với giả thiết đối H1 : θ > θ0 (hoặc H1 : θ Chọn được miền Wα sao cho P (Z ∈ Wα) = α, với α > 0 rất bé (biến cố Z ∈ Wα là rất khó xảy ra). Với mẫu cụ thể, ta tính giá trị cụ thể của Z là z. +Nếu Z ∈ Wα thì ta bác bỏ giả thiết H0, thừa nhận H1. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  47. — 46 — +Nếu Z/∈ Wα thì ta tạm chấp nhận gi thiết H0. Miền Wα gọi là miền bác bỏ gi thiết H0. Trị α gọi là mức ý nghĩa của kiểm định. Thường chọn α ∈ [1%; 5%]. c. Sai lầm loại 1 và sai lầm loại 2. + Sai lầm loại 1 là sai lầm mắc phải khi ta bác bỏ H0 nhưng trong thực tế H0 là đúng. Xác suất mắc sai lầm loại 1 là P (Z ∈ Wα) = α (chính là mức ý nghĩa α). +Sai lầm loại 2 là sai lầm mắc phải khi ta chấp nhận H0 nhưng trong thực tế H0 là sai. Khi kiểm định giả thiết thống kê, ta phải hạn chế khả năng mắc phải hai loại sai lầm trên. Thường ta làm như sau: ấn định trước mức ý nghĩa α (cũng chính là xác suất mắc sai lầm loại 1). Tìm miền bác bỏ Wα sao cho xác suất mắc sai lầm loại 2 là nhỏ nhất. Các miền bác bỏ Wα mà ta sử dụng trong các kiểm định sẽ nói ở sau đều thỏa yêu cầu này. 4.5.2 Kiểm định giả thiết về trung bình tổng thể Xét ĐLNN X trên một tổng thể. Giả sử trung bình tổng thể là E(X) = µ và ta chưa biết µ. + Ta cần kiểm định giả thiết H0 : µ = m0 và giả thiết đối H1 : µ 6= m0 với mức ý nghĩa α. Lập mẫu ngẫu nhiên (X1, , Xn). Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  48. n > 30 ( hoặc n T có Gs H0 đúng=> Gs H0 đúng=> phân phối Student với Z ∈ N(0, 1). Z ∈ N(0, 1). bậc tự do n − 1. Với α đủ nhỏ, chọn được Với α đủ nhỏ, chọn được Với α đủ nhỏ, chọn được zα sao cho zα sao cho tα sao cho P (|Z| > zα) = α ( Biến cố P (|Z| > zα) = α ( Biến cố P (|T | > tα) = α (Biến cố (|Z| > zα) là biến cố rất (|Z| > zα) là biến cố rất (|T | > tα) là biến cố rất khó xãy ra). khó xãy ra) khó xãy ra). => Miền bác bỏ là => Miền bác bỏ là => Miền bác bỏ là W = Z : |Z| > zα với zα ở W = Z : |Z| > zα với zα ở W = Z : |T | > tα với tα trên. trên. trên. n > 30 ( hoặc n zα) = α P (|Z| > zα) = α tα sao P (|T | > tα) = α. +|z| > zα => bác bỏ giả +|z| > zα => bác bỏ giả + |t| > tα => bác bỏ giả thiết H0; |z| ≤ zα => thiết H0; |z| ≤ zα => thiết H0. |t| ≤ t => tạm tạm chấp nhận H0. tạm chấp nhận Ho. chấp nhận Ho. Ta cần kiểm định giả thiết H0 : µ = m0 và giả thiết đối H1 : µ > m0 với mức ý nghĩa α Qui tắc quyết định Qui tắc quyết định Qui tắc quyết định +Tính z như trên. +Tính z như trên. +Tính t như trên. 0 0 0 +Tìm giá trị tới hạn zα +Tìm giá trị tới hạn zα +Tìm giá trị tới hạn tα 0 0 0 sao cho P (Z > zα) = α sao cho P (Z > zα) = α sao cho P (T > tα) = α 0 0 0 + z > zα =>bác bỏ H0 + z > zα =>bác bỏ H0 +t > tα =>bác bỏ H0 0 0 0 z ≤ zα =>Tạm chấp z ≤ zα =>Tạm chấp t ≤ tα =>tạm chấp nhận nhận H0 nhận H0 H0 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  49. — 48 — Ta cần kiểm định giả thiết H0 : µ = m0 và gi thiết đối H1 : µ bác bỏ H0 + z bác bỏ H0 +t bác bỏ H0 0 0 0 z ≥ −zα =>Tạm chấp z ≥ −zα =>Tạm chấp t ≥ −tα =>tạm chấp nhận H0 nhận H0 nhận H0 Chú ý. + Khi tìm zα để P (|Z| > zα) = α (hoặc tìm tα để P (|T | > tα) = α). 0 0 Nếu tra bằng bảng P (Z > zα) = α thì thay zα = zα/2. 0 0 Nếu tra bảng P (T > zα) = α thì thay tα = tα/2. 0 0 0 0 + Khi tìm zα để P (Z > zα) = α (hoặc tìm tα để P (T > tα) = α). 0 Nếu tra bảng P (|Z| > zα) = α thì thay zα = z2α. 0 Nếu tra bảng P (|T | > tα) = α thì thay tα = t2α. 0 0 0 0 Tóm lại: Có thể thay zα = zα/2; zα = z2α; còn thay tα = tα/2 và tα = t2α. Ví dụ 4.5.1. Trọng lượng các bao hàng do một máy đóng bao sản xuất là ĐLNN phân phối theo qui luật chuẩn với trọng lượng trung bình qui định là 50 Kg. Người ta cân thử 25 bao hàng và tính được x = 49, 74 Kg và s = 0, 5 Kg. Với mức ý nghĩa 1% hãy kết luận tình hình làm việc của máy đóng bao đó: đóng các bao hàng đúng trọng lượng trung bình qui định không? Giải. Gọi µ là trọng lượng trung bình thực tế của máy đóng bao sản xuất. 2 Đặt giả thiết H0 : µ = 50 và H1 : µ 6= 50. Do σ chưa biết, ta kiểm định theo qui tắc sau: x − 50 (49, 74 − 50) Tính t = √ = .5 = −2, 6. s/ 25 0, 5 α = 0, 01. Tra bảng Student 24 bậc tự do với P (|T | > tα) = 0, 01, ta có tα = 2, 797. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  50. — 49 — Ta có |t| Tạm chấp nhận H0. KL: Với mức ý nghĩa 1%, tạm coi máy đã đóng các bao hàng có trọng lương trung bình thực tế đúng qui định. Ví dụ 4.5.2. Cũng ví dụ như trên nhưng với yêu cầu muốn kiểm tra xem các bao hàng do máy đóng có trọng lượng trung bình có nhỏ hơn qui định không. (Do đã có nghi ngờ). Giải. Gọi µ là trọng lượng trung bình thực tế của máy đóng bao sản xuất. 2 Đặt giả thiết H0 : µ = 50 và H1 : µ tα) = α = 0, 01, ta có 0 tα = t2α = 2, 492. 49, 74 − 50 √ Tính t = . 25 = −2, 6. 0, 5 0 Ta có t = −2, 6 Bác bỏ H0. KL: Với mức ý nghĩa α = 1%, các bao hàng do máy đóng có trọng lượng trung bình thực tế nhỏ hơn qui định. 4.5.3 Kiểm định giả thiết về tỉ lệ Giả sử tỉ lệ các phần tử có tính chất A của tổng thể là p và ta chưa biết p. Cần kiểm định giả thiết H0 : p = p0 với mức ý nghĩa α . Xét ĐLNN X trên tổng thể. X được xác định như sau: X = 1 nếu phần tử có tính chất A và X = 0 nếu phần tử không có tính chất A. Lập mẫu ngẫu nhiên (X1, , Xn) với kích thước n > 30. Fn − p0 Xét Z = p √ . p0(1 − p0)/ n Gs H0 là đúng. Người ta chứng minh Z ∼ N(0, 1). Tương tự kiểm định giá trị trung bình đưa đến. Chọn mẫu cụ thể kích thước n lớn (n > 30). Qui tắc quyết định H0 : p = p0; H1 : p 6= p0 H0 : p = p0; H1 : p > p0 H0 : p = p0; H1 : p zα) = α P (Z > zα) = α P (Z zα=> bác bỏ H0. +z > zα=> bác bỏ H0. +z bác bỏ H0. 0 0 0 |z| ≤ zα =>Tạm chấp + z ≤ zα =>Tạm chấp z ≥ −zα =>Tạm chấp nhận H0 nhận H0 nhận H0 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  51. Ví dụ 4.5.3. Tỉ lệ phế phẩm của một dây chuyền sản xuất là 5%. Sau khi— 50 tiến — hành một cải tiến kỹ thuật người ta kiểm tra ngẫu nhiên 3000 sản phẩm thì thấy có 120 phế phẩm. Với mức ý nghĩa 0,01 hãy kết luận việc cải tiến kỹ thuật có làm giảm tỉ lệ phế phẩm không? Giải. Gọi p là tỉ lệ phế phẩm mới của dây chuyền sau cải tiến. Kiểm tra giả thiết H0 : p = 0, 05,H1 : p zα = z2α = 2, 326. 0 Ta có z bác bỏ H0. Kết luận: với mức ý nghĩa α = 1%, cải tiến kỹ thuật có làm giảm tỉ lệ phế phẩm. 4.5.4 Kiểm định giả thiết bằng nhau của hai trung bình Cho hai ĐLNN X và Y độc lập, có cùng phân phối chuẩn với E(X) và E(Y ) đều chưa biết. Cần kiểm định giả thiết H0 : E(X) = E(Y ) với mức ý nghĩa α. Từ X lập mẫu ngẫu nhiên WX kích thước n1, Từ Y lập mẫu ngẫu nhiên WY kích thước n2. X − Y Xét thống kê Z = q . D(X) + D(Y ) n1 n2 Giả sử H0 là đúng. Người ta chứng minh được Z ∼ N(0, 1). Lập luận tương tự trên suy ra: Qui tắc quyết định: +Lấy mẫu cụ thể kích thước n1 (đối với X) và mẫu kích thước n2 (đối với Y). x − y x − y +Tính z = (hoặc z = nếu D(X),D(Y ) chưa biết, q D(X) D(Y ) q s2 s2 + X + Y n1 n2 n1 n2 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  52. — 51 — n1, n2 > 30 đủ lớn). H0 : E(X) = E(Y ); H1 : H0 : E(X) = E(Y ); H1 : H0 : E(X) = E(Y ); H1 : E(X) 6= E(Y ) E(X) > E(Y ) E(X) zα) = α. P (|Z| > zα) = α. P (|Z| zα => bác bỏ H0. +z > zα => bác bỏ H0 +z bác bỏ H0 0 0 |z| ≤ z=> tạm chấp nhận z ≤ zα =>tạm chấp nhận z ≥ −zα =>tạm chấp H0. H0. nhận H0. Ví dụ 4.5.4. Trong lượng một loại sản phẩm do hai nhà máy sản xuất ra là ĐLNN có phân phối chuẩn và có cùng độ lệch tiêu chuẩn là σ = 1Kg. Cân thử 25 sản phẩm của nhà máy thứ nhất ta có x = 50Kg và cân thử 20 sản phẩm của nhà máy thứ hai ta có y = 50, 6Kg. Với mức ý nghĩa α = 0, 05, hãy kết luận xem trọng lượng trung bình của sản phẩm do hai nhà máy sản xuất ra có như nhau không. Giải. Gọi các trọng lượng sản phẩm do nhà máy thứ nhất và thứ hai sản xuất là X và Y (kg). X và Y là các ĐLNN có phân phối chuẩn và D(X) = D(Y ) = 1. Kiểm định giả thiết H0 : E(X) = E(Y ); H1 : E(X) 6= E(Y ). α = 0, 05. Tìm zα sao : P (|Z| > zα) = α. Ta có zα = 1, 96. x − y 50 − 50, 6 Tính z = q = q = −2. D(X) + D(Y ) 1 + 1 n1 n2 25 20 Ta có |z| > zα = 1, 96=> bác bỏ H0. KL: Với mức ý nghĩa α = 0, 05, không thể xem trọng lượng trung bình của sản phẩm hai nhà máy là như nhau được. Ghi chú. TH: D(X) = D(Y ) nhưng chưa biết giá trị cụ thể của chúng. Người ta chứng minh được: Nếu H0 đúng (E(X) = E(Y ) ) thì với 2 2 2 (n1 − 1)SX + (n2 − 1)SY S∗ = n1 + n2 − 2 Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  53. — 52 — có phân phối Student (n1 + n2 − 2) bậc tự do. Dựa vào kết quả trên hãy suy ra qui tắc quyết định khi n1 hay n2 p2 H0 : p1 = p2; H1 : p1 zα) = α. P (|Z| > zα) = α. P (|Z| zα => bác bỏ H0. +z > zα => bác bỏ H0 +z bác bỏ H0 0 0 |z| ≤ z=> tạm chấp nhận z ≤ zα =>tạm chấp nhận z ≥ −zα =>tạm chấp H0. H0. nhận H0. Ví dụ 4.5.5. Kiểm tra các sản phẩm chọn ngẫu nhiên do hai nhà máy cùng sản xuất. Ta có bảng sau Nhà máy số sản phẩm được kiểm tra số phế phẩm A 1000 20 B 900 30 Với mức ý nghĩa α = 0, 05, có thể coi tỉ lệ phế phẩm 2 nhà máy là như nhau không? Giải. Gọi p1 và p2 là các tỉ lệ phế phẩm của nhà máy thứ nhất và thứ hai. Xét giả thiết H0 : p1 = p2 và H1 : p1 6= p2. α = 0, 05. Tìm zα sao: P (|Z| > zα) = α => zα = 1, 96. +Tính tỉ lệ phế phẩm nhà máy thứ nhất f1 = 0, 02 và của nhà máy thứ hai là f2 = 0, 0333. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  54. p∗ = (20 + 30)/(1000 + 900) = 1/38 và 1 − p∗ = 37/38. — 53 — +Tính f1 − f2 0, 02 − 0, 033 z = r = q = −1, 81  1 1  1 37 1 1  p ∗ (1 − p∗). + 38 . 38 1000 + 900 n1 n2 + |z| Tạm chấp nhận H0. KL: Với mức ý nghĩa 5%, tạm có thể coi tỉ lệ phế phẩm của hai nhà máy như nhau. BÀI TẬP CHƯƠNG 4 4.1. Đo chiều cao và đường kính của một loại cây có cùng độ tuổi. Ta được kết quả cho ở bảng sau: Chiều cao (cm) 104 99 105 103 102 106 Đường kính (cm) 11 13 15 14 12 12 Tính trung bình và phương sai mẫu của chiều cao và đường kính. 4.2. Quan sát về thời gian cần thiết để sản xuất một chi tiết máy, ta thu được các số liệu cho ở bảng sau: Khoảng thời gian (phút) Số quan sát Khoảng thời gian (phút) Số quan sát 20-25 2 40-45 14 25-30 14 45-50 8 30-35 26 50-55 4 35-40 32 Tính trung bình mẫu và phương sai mẫu? 4.3. Tiến hành quan sát về hai chỉ tiêu X và Y, ta thu được các số liệu cho ở bảng sau: X 0.25 0.37 0.44 0.55 0.60 0.62 0.68 0.70 Y 2.57 2.31 2.12 1.92 1.75 1.71 1.60 1.51 X 0.73 0.75 0.92 0.84 0.87 0.88 0.90 0.95 1 Y 1.50 1.41 1.33 1.31 1.25 1.20 1.19 1.15 1 2 2 Tính: x; y; xy; sX ; sY . 4.4. Điều tra năng suất của 100 hecta lúa ở một vùng, người ta thu được kết quả cho ở bảng sau: Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  55. Năng suất (tạ/ha) Diện tích (ha) Năng suất (tạ/ha) Diện tích (ha)— 54 — 30-35 7 50-55 20 35-40 12 55-60 8 40-45 18 60-65 5 45-50 27 65-70 3 Tính trung bình mẫu và phương sai mẫu? 4.5. Để nghiên cứu nhu cầu của một loại hàng hóa ở một khu vực, người ta tiến hành kho sát 800 gia đình. Kết quả cho ở bảng dưới đây: Nhu cầu (kg/tháng) Số gia đình (ni) Nhu cầu (kg/tháng) Số gia đình (ni) 30-35 25 55-60 142 35-40 48 60-65 94 40-45 83 65-70 50 45-50 159 70-75 10 50-55 189 Tính trung bình mẫu và độ lệch chuẩn mẫu? 4.6. Thống kê số hàng hóa bán được mỗi ngày và số ngày bán được lượng hàng tương ứng, ta có bảng số liệu sau: Lượng hàng bán số ngày (ni) Lượng hàng bán số ngày (ni) trong ngày (kg) trong ngày (kg) 100-200 5 400-450 70 200-250 12 450-500 35 250-300 56 500-550 30 300-350 107 550-700 10 350-400 75 Tính trung bình mẫu và cho biết ý nghĩa thực tế của nó? 4.7. Kho sát về thu nhập và tỉ lệ thu nhập chi cho giáo dục ở 400 hộ gia đình, ta thu được số liệu cho ở bảng sau: Y X 10 20 30 40 50 150-250 10 40 20 250-350 40 60 20 350-450 20 80 40 450-550 30 30 10 Trong đó: X là tỉ lệ thu nhập chi cho giáo dục (tính theo %), Y là thu nhập bình quân của một người trong gia đình (đơn vị tính là ngàn đồng/tháng). Tính trung bình mẫu và phương sai mẫu của X và Y? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  56. 4.8. Kho sát một mẫu gồm 12 người cho thấy số lần họ xem phim trong 1 năm— 55 như — sau: 14, 16, 17, 24, 20, 32, 18, 29, 31, 15, 35. Tìm khoảng tin cậy 95% cho số lần trung bình mà một người tới rạp chiếu bóng trong 1 năm, biết số lần xem phim của một người là đại lượng có phân phối chuẩn. 4.9. Để định mức thời gian gia công một chi tiết máy người ta theo dõi ngẫu nhiên thời gian gia công 25 chi tiết và thu được bảng số liệu sau đây: Thời gian (phút) 14 16 18 20 24 Số chi tiết 2 6 11 4 2 Với mức tin cậy 0.95, hãy ước lượng thời gian gia công trung bình tối đa với loại chi tiết trên. Cho biết thời gian gia công chi tiết đó tuân theo quy luật chuẩn. 4.10. Năng suất ngô của một vùng A được báo cáo lên qua 25 điểm thu hoạch là: Năng suất (tạ/ha) 7 9 11 13 17 Số điểm thu hoạch 2 7 12 3 1 Với mức tin cậy là 0.95, hãy tính năng suất trung bình ngô tối thiểu của vùng này. Cho biết năng suất ngô tuân theo quy luật chuẩn. 4.11. Chọn ngẫu nhiên 36 công nhân của một xí nghiệp thì thấy lưng trung bình là 380.000 đ/1 tháng. Giả sử lương công nhân tuân theo quy luật chuẩn, với độ lệch chuẩn σ = 14 ngàn đồng. Với độ tin cậy 95%, hãy ước lượng mức lưng trung bình của công nhân trong toàn xí nghiệp trên. 4.12. Điều tra năng suất lúa trên diện tích 100 hécta trồng lúa của một vùng, ta thu được bảng số liệu sau: Năng suất (tạ/ha) (xi) 41 44 45 46 48 52 54 Số ha có năng suất tương ứng (ni) 10 20 30 15 10 10 5 1) Lập bảng tính trung bình mẫu x và phương sai mẫu s2 ứng với số liệu trên. 2) Ước lượng năng suất lúa trung bình của vùng đó với độ tin cậy 95%? 3) Ước lượng năng suất lúa trung bình tối đa và tối thiểu của vùng đó với độ tin cậy 90%? 4) Những thửa ruộng có năng suất từ 48 tạ/ha trở lên là những thửa có năng suất cao. a) Hãy ước lượng năng suất lúa trung bình của những thửa có năng suất cao trong vùng đó với độ tin cậy 99%. b) Hãy ước lượng tỷ lệ diện tích có năng suất cao trong vùng đó với độ tin cậy 95%. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  57. 4.13. Một trại chăn nuôi A xuất chuồng 200 con lợn, trọng lượng hơi tính— bằng 56 — (Kg), ta có bảng số liệu sau: Trọng lượng (xi) 45-55 55-65 65-75 75-85 85-95 95-105 Số lợn (ni) 10 30 45 80 30 5 a) Lập bảng tính trung bình mẫu và phương sai mẫu ứng với bộ số liệu trên. b) Ước lượng trọng lượng lợn (hơi) trung bình của trại chăn nuôi A với độ tin cậy 95%. c) Nếu chủ trại chăn nuôi A thông báo trọng lượng (hơi) trung bình của trại chăn nuôi là trên 80 kg thì có chấp nhận được không với mức ý nghĩa 10%. d) Lợn có trọng lượng từ 85 kg trở lên được gọi là lợn chóng lớn, hãy ước lượng tỷ lệ lợn chóng lớn của trại chăn nuôi trên với mức ý nghĩa 99%. 4.14. Trọng lượng một loại chi tiết là một biến số ngẫu nhiên quy theo quy luật chuẩn với độ lệch tiêu chuẩn là 1.2 kg. Phải chọn ít nhất bao nhiêu chi tiết để điều tra, nếu muốn độ chính xác của ước lượng không vượt quá 0.3 và mức tin cậy của ước lượng là 0.95. 4.15. Chiều dài của một loại sản phẩm A do một máy tự động sản xuất là một biến số ngẫu nhiên quy theo quy luật chuẩn với độ lệch tiêu chuẩn là 3cm. Phải chọn ít nhất bao nhiêu chi tiết để đo, nếu muốn độ dài khoảng tin cậy không vượt quá 0,6 và mức tin cậy của ước lượng là 0,99. 4.16. Để điều tra số cá trong một hồ, người ta đánh bắt 1000 con cá, đánh dấu rồi th xuống hồ. Lần sau bắt lại 200 con thì được 40 con đánh dấu. Với độ tin cậy 95% hãy: a) Ước lượng tỷ lệ cá được đánh dấu trong hồ. b) Ước lượng số cá trong hồ. 4.17. Gieo 400 hạt giống thì có 20 hạt giống không ny mầm. Tỷ lệ hạt giống không ny mầm tối đa là bao nhiêu? Yêu cầu kết luận với mức tin cậy 0.95. 4.18. Cơ quan cảnh sát giao thông kiểm tra hệ thống phanh của 40 chiếc xe tải trên đường quốc lộ. Họ phát hiện ra 14 chiếc có phanh chưa đảm bo an toàn. Tìm khoảng tin cậy 98% cho tỉ lệ xe tải có phanh chưa an toàn. 4.19. Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri thì được biết 960 người trong số đó bỏ phiếu cho ứng cử viên A. Với mức tin cậy 0.99, ứng cử viên A chiếm được tối thiểu bao nhiêu phần trăm số phiếu. 4.20. Tỷ lệ nảy mầm của một loại hạt giống trong mẫu là 90%. Cần ước lượng tỷ lệ nảy mầm của loại hạt giống đó với mức tin cậy 0.95. Với độ dài khoảng tin cậy đối xứng không vượt quá 0.02, thì phải gieo bao nhiêu hạt? Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  58. 4.21. Để xác định tỷ lệ người mắc chứng bướu cổ do thiếu hụt iode ở một khu— 57 vực — dân cư nào đó, cần khám bao nhiêu người? Nếu muốn cho khong ước lượng có độ chính xác không vượt quá 0.04 với mức tin cậy 0.95. 4.22. Giả sử điểm trung bình môn toán của 100 thí sinh thi vào ĐHNT là 5, với độ lệch chuẩn mẫu hiệu chỉnh là 2.5. a)Ước lượng điểm trung bình môn toán của toàn thể sinh viên với độ tin cậy 95%. b)Với độ chính xác là 0.25 điểm, hãy xác định độ tin cậy. 4.23. Tuổi thọ của một loại bóng đèn được biết theo quy luật chuẩn với độ lệch chuẩn 100 giờ. a) Chọn ngẫu nhiên 100 bóng để thử nghiệm, thấy mỗi bóng tuổi thọ trung bình là 1000 giờ. Hãy ước lượng tuổi thọ trung bình của bóng đèn xí nghiệp A sản xuất với độ tin cậy 95%. b) Với độ chính xác 15 giờ, hãy xác định độ tin cậy. c) Với độ chính xác 25 giờ và độ tin cậy 95% thì cần thử nghiệm bao nhiêu bóng. 4.24. Để ước lượng tỷ lệ sản phẩm xấu của một kho đồ hộp, người ta kiểm tra ngẫu nhiên 100 hộp thấy có 11 hộp xấu. a) Ước lượng tỷ lệ sản phẩm xấu của kho đồ hộp với độ tin cậy 94%. b) Với sai số cho phép (độ chính xác) 3%, hãy xác định độ tin cậy. 4.25. Điều tra năng suất lúa ở 1 một vùng trong vụ hè thu năm 2007, người ta thu được bảng số liệu sau: Năng suất (tấn/ha) 3-4 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7 7-8 Diện tích (ha) 5 10 26 30 28 12 6 4 a) Những thửa ruộng có năng suất trên 6 tấn/ha là những thửa ruộng có năng suất cao. Ước lượng diện tích lúa có năng suất cao vùng này với độ tin cậy 95%. Biết diện tích lúa gieo trồng ở vùng này là 8000 ha. (HD: Tính khoảng (p1; p2) sau đó nhân với 8000 ha). a) Điều tra sơ bộ vụ hè thu năm 2006 thì thấy năng suất lúa ở vùng này là 5 tấn/ha và phương sai mẫu hiệu chỉnh là 0,49. Vụ hè thu năm 2007 người ta áp dụng 1 biện pháp kỹ thuật mới. Hãy xét về tác dụng của biện pháp kỹ thuật mới này với mức ý nghĩa 5%. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến
  59. — 58 — Tài liệu tham khảo [1] Nguyễn Văn Hộ, Xác suất thống kê, NXB Giáo Dục, 2006. [2] Phạm Văn Kiều, Giáo trình xác suất và thống kê, NXB Giáo Dục, 2007. [3] Đào Hữu Hồ, Xác suất thống kê, NXB Đại Học Quốc Gia, 2001 [4] Lê Văn Tiến, Lý thuyết xác suất và thống kê toán học, NXB Nông Nghiệp, 1999. [5] Nguyễn Đình Hiền, Giáo trình xác suất thống kê, NXB Đại học Sư phạm, 2003. Bài giảng xác suất thống kê Th.s Phan Trọng Tiến