Bài giảng Lý thuyết xác suất và thống kê - Lê Bá Long

pdf 200 trang ngocly 5690
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê - Lê Bá Long", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_le_ba_long.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê - Lê Bá Long

  1. HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG PGS.TS. Lê Bá Long Bài giảng LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ (Dành cho sinh viên hệ đại học chuyên ngành Kinh tế) Hà Nội, 2013
  2. LỜI NÓI ĐẦU Các hiện tượng diễn ra trong tự nhiên, xã hội hoặc có tính chất tất định (có tính quy luật, có thể biết trước kết quả) hoặc có tính chất ngẫu nhiên (không biết trước kết quả). Mặc dù không thể nói trước một hiện tượng ngẫu nhiên xảy ra hay không xảy ra khi thực hiện một phép thử, tuy nhiên nếu tiến hành quan sát khá nhiều lần một hiện tượng ngẫu nhiên trong các phép thử như nhau, ta có thể rút ra được những kết luận khoa học về hiện tượng này. Lý thuyết xác suất nghiên cứu khả năng xuất hiện của các hiện tượng ngẫu nhiên và ứng dụng chúng vào thực tế. Lý thuyết xác suất cũng là cơ sở để nghiên cứu Thống kê – môn học nghiên cứu các phương pháp thu thập thông tin, chọn mẫu, xử lý thông tin, nhằm rút ra các kết luận hoặc đưa ra quyết định cần thiết. Ngày nay, với sự hỗ trợ tích cực của máy tính điện tử và công nghệ thông tin, lý thuyết xác suất thống kê ngày càng được ứng dụng rộng rãi và hiệu quả trong mọi lĩnh vực khoa học tự nhiên và xã hội. Chính vì vậy lý thuyết xác suất thống kê được giảng dạy cho hầu hết các nhóm ngành ở đại học. Tập bài giảng lý thuyết xác suất và thống kê toán được biên soạn lại theo chương trình qui định của Học viện Công nghệ Bưu Chính Viễn Thông dành cho hệ đại học chuyên ngành kinh tế với hình thức đào tạo theo tín chỉ. Nội dung của cuốn sách bám sát các giáo trình của các trường đại học khối kinh tế và theo kinh nghiệm giảng dạy nhiều năm của tác giả. Chính vì thế, giáo trình này cũng có thể dùng làm tài liệu học tập, tài liệu tham khảo cho sinh viên của các trường đại học và cao đẳng khối kinh tế. Nội dung của tập bài giảng có 6 chương tương ứng với 3 tín chỉ: Chương 1: Biến cố ngẫu nhiên và xác suất. Chương 2: Biến ngẫu nhiên. Chương 3: Biến ngẫu nhiên hai chiều. Chương 4: Cơ sở lý thuyết mẫu. Chương 5: Ước lượng các tham số của biến ngẫu nhiên. Chương 6: Kiểm định giả thiết thống kê. Ba chương đầu thuộc về lý thuyết xác suất, ba chương còn lại là những vấn đề cơ bản của lý thuyết thống kê. Điều kiện tiên quyết của môn học này là hai môn Toán cao cấp 1 và Toán cao cấp 2 trong chương trình toán đại cương khối kinh tế. Mặc dù tác giả rất có ý thức trình bày một cách tương đối đầy đủ và chặt chẽ. Tuy nhiên, vì sự hạn chế của chương trình toán dành cho khối kinh tế nên nhiều kết quả và định lý chỉ được phát biểu, minh họa và không có đủ kiến thức cơ sở để chứng minh chi tiết. Giáo trình được viết cho đối tượng là sinh viên các trường đại học khối kinh tế, vì vậy tác giả cung cấp nhiều ví dụ minh họa tương ứng với từng phần lý thuyết và có nhiều ví dụ ứng dụng vào bài toán kinh tế. Ngoài ra tác giả cũng có ý thức trình bày thích hợp đối với người tự học. Trước khi nghiên cứu các nội dung chi tiết, người học nên xem phần giới thiệu của mỗi chương, để thấy được mục đích, ý nghĩa, yêu cầu chính của chương đó. Trong mỗi chương, mỗi nội dung, người học có thể tự đọc và hiểu được cặn kẽ thông qua cách diễn đạt và chỉ dẫn rõ ràng. Đặc biệt
  3. học viên nên chú ý đến các nhận xét, bình luận, để hiểu sâu sắc hơn hoặc mở rộng tổng quát hơn các kết quả và hướng ứng dụng vào thực tế. Các ví dụ là để minh hoạ trực tiếp khái niệm, định lý hoặc các thuật toán, vì vậy sẽ giúp người học dễ tiếp thu bài hơn. Sau mỗi chương đều có các câu hỏi luyện tập và các bài tập tự luận. Có khoảng từ 20 đến 30 bài tập cho mỗi chương, tương ứng với 3 -5 câu hỏi cho mỗi tiết lý thuyết. Hệ thống câu hỏi này bao trùm toàn bộ nội dung vừa được học. Có những câu hỏi kiểm tra trực tiếp các kiến thức vừa được học, nhưng cũng có những câu đòi hỏi học viên phải vận dụng một cách tổng hợp và sáng tạo các kiến thức đã học để giải quyết. Vì vậy, việc giải các bài tập này giúp học viên nắm chắc hơn lý thuyết và tự kiểm tra được mức độ tiếp thu lý thuyết của mình. Có đáp án và hướng dẫn giải các bài tập ở cuối cuốn sách. Tuy nhiên tác giả khuyên học viên nên cố gắng tự mình giải các bài tập này và chỉ đối chiếu hoặc tham khảo kết quả khi thực sự cần thiết. Tuy tác giả đã rất cố gắng, song do thời gian bị hạn hẹp, nên các thiếu sót còn tồn tại trong tập bài giảng là điều khó tránh khỏi. Tác giả rất mong nhận được sự đóng góp ý kiến của bạn bè, đồng nghiệp, các học viên xa gần. Xin chân thành cám ơn. Tác giả xin bày tỏ lời cám ơn tới PGS.TS Phạm Ngọc Anh, TS. Vũ Gia Tê, Ths. Lê Bá Cầu, TS. Nguyễn Thị Nga đã đọc bản thảo và cho những ý kiến phản biện quý giá. Cuối cùng, tác giả xin bày tỏ sự cám ơn đối với Ban Giám đốc Học viện Công nghệ Bưu Chính Viễn Thông, bạn bè đồng nghiệp đã khuyến khích, động viên, tạo nhiều điều kiện thuận lợi để chúng tôi hoàn thành tập tài liệu này. Hà Nội, 2013 TÁC GIẢ
  4. MỤC LỤC LỜI NÓI ĐẦU 13 MỤC LỤC 15 CHƯƠNG 1: BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT 11 1.1 PHÉP THỬ VÀ BIẾN CỐ 12 1.1.1 Phép thử (Experiment) 12 1.1.2 Biến cố (Event) 12 1.2 ĐỊNH NGHĨA XÁC SUẤT 13 1.2.1 Định nghĩa cổ điển về xác suất 13 1.2.2 Định nghĩa thống kê về xác suất 19 1.3 QUAN HỆ CỦA CÁC BIẾN CỐ 20 1.3.1 Quan hệ biến cố đối 20 1.3.2 Tổng của các biến cố 20 1.3.3 Tích của các biến cố 20 1.3.4 Biến cố xung khắc 20 1.3.5 Hệ đầy đủ các biến cố 21 1.3.6 Tính độc lập của các biến cố 21 1.4 CÁC ĐỊNH LÝ VÀ TÍNH CHẤT XÁC SUẤT 22 1.4.1 Xác suất chắc chắn và xác suất không thể 22 1.4.2 Qui tắc cộng xác suất 22 1.4.3 Quy tắc xác suất của biến cố đối 24 1.4.4 Xác suất có điều kiện 25 1.4.5 Quy tắc nhân xác suất 27 1.4.6 Công thức xác suất đầy đủ 30 1.4.7 Công thức Bayes 31 1.5 DÃY PHÉP THỬ BERNOULLI 34 1.6 NGUYÊN LÝ XÁC SUẤT LỚN, XÁC SUẤT NHỎ 37 CÂU HỎI ÔN TẬP VÀ BÀI TẬP CHƯƠNG 1 37 CHƯƠNG 2: BIẾN NGẪU NHIÊN 42 2.1 ĐỊNH NGHĨA VÀ PHÂN LOẠI BIẾN NGẪU NHIÊN 43 2.1.1 Khái niệm biến ngẫu nhiên 43 2.1.2 Phân loại 44 2.2 PHÂN BỐ XÁC SUẤT CỦA BIẾN NGẪU NHIÊN 45 2.2.1 Hàm phân bố xác suất 45 2.2.2 Hàm khối lượng xác suất và bảng phân bố xác suất của biến ngẫu nhiên rời rạc 46 2.2.3 Hàm mật độ phân bố xác suất của biến ngẫu nhiên liên tục 50 2.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 52 2.3.1 Kỳ vọng 52 2.3.2 Phương sai 56 2.3.3 Phân vị, Trung vị 59 2.3.4 Mốt 60
  5. 2.3.5 Mô men, hệ số bất đối xứng, hệ số nhọn 61 2.4 MỘT SỐ QUY LUẬT PHÂN BỐ XÁC SUẤT RỜI RẠC THƯỜNG GẶP 62 2.4.1 Phân bố Bernoulli 62 2.4.2 Phân bố nhị thức 63 2.4.3 Phân bố Poisson 65 2.5 MỘT SỐ QUY LUẬT PHÂN BỐ XÁC SUẤT LIÊN TỤC THƯỜNG GẶP 67 2.5.1 Phân bố đều 67 2.5.2 Phân bố chuẩn 69 2.5.3 Tính gần đúng phân bố nhị thức 73 2.5.4 Phân bố “Khi bình phương” 75 2.5.5 Phân bố Student 76 CÂU HỎI ÔN TẬP VÀ BÀI TẬP CHƯƠNG 2 77 CHƯƠNG 3: VÉC TƠ NGẪU NHIÊN 81 3.1 KHÁI NIỆM VÉC TƠ NGẪU NHIÊN 81 3.1.1 Khái niệm và phân loại véc tơ ngẫu nhiên 81 3.1.2 Hàm phân bố xác suất đồng thời và hàm phân bố xác suất biên 82 3.2 HÀM KHỐI LƯỢNG XÁC SUẤT VÀ BẢNG PHÂN BỐ XÁC SUẤT 83 3.2.1 Hàm khối lượng xác suất đồng thời và bảng phân bố xác suất đồng thời 83 3.2.2 Bảng phân bố xác suất biên 84 3.2.3 Quy luật phân bố xác suất có điều kiện 87 3.2.4 Tính độc lập của các biến ngẫu nhiên 90 3.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN RỜI RẠC HAI CHIỀU 90 3.3.1 Kỳ vọng và phương sai của các biến ngẫu nhiên thành phần 90 3.3.2 Hiệp phương sai 91 3.3.3 Hệ số tương quan 91 3.3.4 Kỳ vọng có điều kiện, hàm hồi quy 94 3.4 LUẬT SỐ LỚN VÀ ĐỊNH LÝ GIỚI HẠN TRUNG TÂM 96 3.4.1 Bất đẳng thức Markov và bất đẳng thức Trêbưsép 96 3.4.2 Hội tụ theo xác suất 97 3.4.3 Luật số lớn Trêbưsép 97 3.4.4 Luật số lớn Bernoulli 99 3.4.5 Định lý giới hạn trung tâm 99 CÂU HỎI ÔN TẬP VÀ BÀI TẬP CHƯƠNG 3 100 CHƯƠNG 4: CƠ SỞ LÝ THUYẾT MẪU 105 4.1 SỰ CẦN THIẾT PHẢI LẤY MẪU 105 4.2 MẪU NGẪU NHIÊN 106 4.2.1 Khái niệm mẫu ngẫu nhiên 106 4.2.2 Một vài phương pháp chọn mẫu ngẫu nhiên 107 4.2.3 Mô hình hóa mẫu ngẫu nhiên 107 4.2.4 Biểu diễn giá trị cụ thể của mẫu ngẫu nhiên theo bảng và theo biểu đồ 108 4.3 THỐNG KÊ VÀ CÁC ĐẶC TRƯNG CỦA MẪU NGẪU NHIÊN 113 4.3.1 Định nghĩa thống kê 113
  6. 4.3.2 Trung bình mẫu 114 4.3.3 Phương sai mẫu, Độ lệch chuẩn mẫu 114 4.3.4 Tần suất mẫu 115 4.3.5 Cách tính giá trị cụ thể của trung bình mẫu x và phương sai mẫu s2 116 4.4 MẪU NGẪU NHIÊN HAI CHIỀU 117 4.4.1 Khái niệm mẫu ngẫu nhiên hai chiều 117 4.4.2 Biểu diễn giá trị cụ thể của mẫu ngẫu nhiên hai chiều 118 4.4.3 Một số thống kê đặc trưng của mẫu ngẫu nhiên hai chiều 118 4.5 PHÂN BỐ XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ ĐẶC TRƯNG MẪU 119 4.5.1 Trường hợp biến ngẫu nhiên gốc có phân bố chuẩn 119 4.5.2 Trường hợp biến ngẫu nhiên gốc hai chiều cùng có phân bố chuẩn 122 4.5.3 Trường hợp biến ngẫu nhiên gốc có phân bố Bernoulli 123 4.5.4 Trường hợp biến ngẫu nhiên gốc hai chiều cùng có phân bố Bernoulli 124 CÂU HỎI ÔN TẬP VÀ BÀI TẬP CHƯƠNG 4 125 CHƯƠNG 5: ƯỚC LƯỢNG CÁC THAM SỐ CỦA BIẾN NGẪU NHIÊN 127 5.1. PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM 127 5.1.1 Ước lượng không chệch (unbiased estimator) 127 5.1.2 Ước lượng hiệu quả (efficient estimator) 128 5.1.3 Ước lượng vững (consistent estimator) 129 5.2 PHƯƠNG PHÁP ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY 129 5.2.1 Khái niệm khoảng tin cậy 130 5.2.2 Khoảng tin cậy của kỳ vọng của biến ngẫu nhiên có phân bố chuẩn 130 5.2.3 Khoảng tin cậy cho tham số p của biến ngẫu nhiên gốc có phân bố Bernoulli 134 5.2.4 Ước lượng phương sai của biến ngẫu nhiên có phân bố chuẩn 135 CÂU HỎI ÔN TẬP VÀ BÀI TẬP CHƯƠNG 5 139 CHƯƠNG 6: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 143 6.1 KHÁI NIỆM CHUNG VỀ GIẢ THIẾT THỐNG KÊ 143 6.1.1 Giả thiết thống kê 143 6.1.2 Tiêu chuẩn kiểm định giả thiết thống kê 144 6.1.3 Miền bác bỏ giả thiết 144 6.1.4 Giá trị quan sát của tiêu chuẩn kiểm định 145 6.1.5 Quy tắc kiểm định giả thiết thống kê 145 6.1.6 Sai lầm loại một và sai lầm loại hai 145 6.1.7 Thủ tục kiểm định giả thiết thống kê 146 6.2 KIỂM ĐỊNH THAM SỐ 146 6.2.1 Kiểm định giả thiết về kỳ vọng của biến ngẫu nhiên có phân bố chuẩn 146 6.2.2 Kiểm định giả thiết về phương sai của biến ngẫu nhiên có phân bố chuẩn 153 6.2.3 Kiểm định giả thiết về tần suất p của tổng thể 155 6.2.4 Kiểm định giả thiết về hai kỳ vọng của hai biến ngẫu nhiên có phân bố chuẩn 156 6.2.5 Kiểm định giả thiết về sự bằng nhau của hai tần suất tương ứng với hai tổng thể 162 CÂU HỎI ÔN TẬP VÀ BÀI TẬP CHƯƠNG 6 164
  7. HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN BÀI TẬP 167 HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN CHƯƠNG 1 167 HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN CHƯƠNG 2 171 HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN CHƯƠNG 3 177 HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN CHƯƠNG 4 180 HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN CHƯƠNG 5 181 HƯỚNG DẪN GIẢI VÀ ĐÁP ÁN CHƯƠNG 6 184 PHỤ LỤC I: GIÁ TRỊ HÀM MẬT ĐỘ 188 PHỤ LỤC II: GIÁ TRỊ HÀM PHÂN BỐ CHUẨN TẮC 189 PHỤ LỤC III: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ STUDENT 190 PHỤ LỤC IV: GIÁ TRỊ TỚI HẠN CỦA PHÂN BỐ “KHI BÌNH PHƯƠNG” 191 PHỤ LỤC V: GIÁ TRỊ HÀM KHỐI LƯỢNG XÁC SUẤT POISSON 192 PHỤ LỤC VI: GIÁ TRỊ HÀM PHÂN BỐ POISSON 194 BẢNG CHỈ DẪN THUẬT NGỮ 196 TÀI LIỆU THAM KHẢO 198
  8. Chương 1: Biến cố ngẫu nhiên và xác xuất CHƯƠNG 1: BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT Các hiện tượng trong tự nhiên hay xã hội xảy ra một cách ngẫu nhiên (không biết trước kết quả) hoặc tất định (biết trước kết quả sẽ xảy ra). Chẳng hạn một vật nặng được thả từ trên cao chắc chắn sẽ rơi xuống đất, trong điều kiện bình thường nước sôi ở 1000 C Đó là những hiện tượng diễn ra có tính quy luật, tất định. Trái lại khi tung đồng xu ta không biết mặt sấp hay mặt ngửa sẽ xuất hiện. Ta không thể biết trước có bao nhiêu cuộc gọi đến tổng đài, có bao nhiêu khách hàng đến điểm phục vụ trong khoảng thời gian nào đó. Ta không thể xác định trước chỉ số chứng khoán trên thị trường chứng khoán ở một thời điểm khớp lệnh trong tương lai Đó là những hiện tượng ngẫu nhiên. Tuy nhiên, nếu tiến hành quan sát khá nhiều lần một hiện tượng ngẫu nhiên trong những hoàn cảnh như nhau, thì trong nhiều trường hợp ta có thể rút ra những kết luận có tính quy luật về những hiện tượng này. Lý thuyết xác suất nghiên cứu các qui luật của các hiện tượng ngẫu nhiên. Việc nắm bắt các quy luật này sẽ cho phép dự báo các hiện tượng ngẫu nhiên đó sẽ xảy ra như thế nào. Chính vì vậy các phương pháp của lý thuyết xác suất được ứng dụng rộng rãi trong việc giải quyết các bài toán thuộc nhiều lĩnh vực khác nhau của khoa học tự nhiên, kỹ thuật và kinh tế-xã hội. Chương này trình bày một cách có hệ thống các khái niệm cơ bản và các kết quả chính về lý thuyết xác suất: - Các khái niệm phép thử, biến cố. - Quan hệ giữa các biến cố. - Các định nghĩa về xác suất: định nghĩa xác suất theo cổ điển, theo thống kê. - Các tính chất của xác suất: công thức cộng và công thức nhân xác suất, xác suất của biến cố đối. - Xác suất có điều kiện, công thức nhân trong trường hợp không độc lập. Công thức xác suất đầy đủ và định lý Bayes. Khi đã nắm vững các kiến thức về đại số tập hợp (một trường hợp cụ thể của đại số Boole) như hợp, giao tập hợp, tập con, phần bù của một tập con học viên sẽ dễ dàng trong việc tiếp thu, biểu diễn hoặc mô tả các biến cố. Để tính xác suất các biến cố theo phương pháp cổ điển đòi hỏi phải tính số các trường hợp thuận lợi đối với biến cố và số các trường hợp đồng khả năng có thể. Vì vậy học viên cần nắm vững các phương pháp đếm - giải tích tổ hợp (đã được học ở lớp 12 và trong chương 1 của môn đại số). Tuy nhiên để thuận lợi cho người học chúng tôi sẽ nhắc lại các kết quả chính về phương pháp đếm trong mục 1.2.2. Một trong những khó khăn của bài toán xác suất là xác định được biến cố và sử dụng đúng các công thức thích hợp. Bằng cách tham khảo các ví dụ và giải nhiều bài tập sẽ rèn luyện tốt kỹ năng này. 11
  9. Chương 1: Biến cố ngẫu nhiên và xác xuất 1.1 PHÉP THỬ VÀ BIẾN CỐ 1.1.1 Phép thử Trong thực tế ta thường gặp nhiều thí nghiệm, quan sát mà các kết quả của nó không thể dự báo trước được. Ta gọi chúng là các phép thử ngẫu nhiên. Phép thử ngẫu nhiên thường được ký hiệu bởi chữ C . Tuy không biết kết quả sẽ xảy ra như thế nào, nhưng trong nhiều trường hợp ta có thể liệt kê được hoặc biểu diễn tất cả các kết quả của phép thử C . Ví dụ 1.1: . Phép thử tung đồng xu có hai khả năng xảy ra là mặt sấp, ký hiệu S, hoặc mặt ngửa, ký hiệu N. Ta gọi S, N là các biến cố sơ cấp. Tập các biến cố sơ cấp được gọi là không gian mẫu. Vậy không gian mẫu của phép thử là  S, N. . Với phép thử gieo xúc xắc 6 mặt, có thể xem các biến cố sơ cấp là số các chấm trên mỗi mặt xuất hiện. Vậy không gian mẫu  1,2,3,4,5,6. . Phép thử tung đồng thời 2 đồng xu có không gian mẫu là:  (S,S),(S, N),(N,S),(N, N). Chú ý rằng bản chất của các biến cố sơ cấp không có vai trò đặc biệt gì trong lý thuyết xác suất. Chẳng hạn có thể mã hóa và xem không gian mẫu của phép thử tung đồng tiền là  0, 1, trong đó 0 là biến cố sơ cấp chỉ mặt sấp xuất hiện và 1 để chỉ mặt ngửa xuất hiện. 1.1.2 Biến cố Với phép thử C ta có thể xét các biến cố (còn gọi là sự kiện) mà việc xảy ra hay không xảy ra hoàn toàn được xác định bởi kết quả của C . Các biến cố ngẫu nhiên được ký hiệu bằng các chữ in hoa A, B, C, Mỗi kết quả  (biến cố sơ cấp) của phép thử C được gọi là kết quả thuận lợi cho biến cố A nếu A xảy ra khi kết quả của phép thử C là  . Ví dụ 1.2: Nếu gọi A là biến cố “số chấm xuất hiện là chẵn” trong phép thử gieo xúc xắc ở ví dụ 1.1 thì A có các kết quả thuận lợi là các mặt có 2, 4, 6 chấm, vì biến cố A xuất hiện khi kết quả của phép thử là mặt 2 chấm, 4 chấm hoặc 6 chấm. Mặt 1 chấm, 3 chấm, 5 chấm không phải là kết quả thuận lợi đối với A . Tung hai đồng xu, biến cố xuất hiện một mặt sấp một mặt ngửa (xin âm dương) có các kết quả thuận lợi là (,)SN và (,)NS . Như vậy có thể xem mỗi biến cố A là một tập con của không gian mẫu  có các phần tử là các kết quả thuận lợi đối với A . Cần chú ý rằng mỗi biến cố chỉ có thể xảy ra khi một phép thử được thực hiện, nghĩa là gắn với không gian mẫu nào đó. Có hai biến cố đặc biệt sau: Biến cố chắc chắn: là biến cố luôn luôn xảy ra khi thực hiện phép thử. Không gian mẫu  là một biến cố chắc chắn. 12
  10. Chương 1: Biến cố ngẫu nhiên và xác xuất Biến cố không thể: là biến cố nhất định không xảy ra khi thực hiện phép thử. Biến cố không thể được ký hiệu . Tung một con xúc xắc, biến cố xuất hiện mặt có số chấm nhỏ hơn hay bằng 6 là biến chắc chắn, biến cố xuất hiện mặt có 7 chấm là biến cố không thể. 1.2 ĐỊNH NGHĨA XÁC SUẤT Một biến cố ngẫu nhiên xảy ra hay không trong kết quả của một phép thử là điều không thể biết hoặc đoán trước được. Tuy nhiên bằng những cách khác nhau ta có thể định lượng khả năng xuất hiện của biến cố, đó là xác suất xuất hiện của biến cố. Xác suất của một biến cố là một con số đặc trưng khả năng khách quan xuất hiện biến cố đó khi thực hiện phép thử. Xác suất của biến cố A ký hiệu PA(). Trường hợp biến cố chỉ gồm một biến cố sơ cấp a ta ký hiệu P() a thay cho P() a . Trường hợp các kết quả của phép thử xuất hiện đồng khả năng thì xác suất của một biến cố có thể được xác định bởi tỉ số của số trường hợp thuận lợi đối với biến cố và số trường hợp có thể. Với cách tiếp cận này ta có định nghĩa xác suất theo phương pháp cổ điển. Trường hợp các kết quả của phép thử không đồng khả năng xuất hiện nhưng có thể thực hiện phép thử lặp lại nhiều lần độc lập, khi đó tần suất xác định khả năng xuất hiện của biến cố. Vì vậy ta có thể tính xác suất của biến cố thông qua tần suất xuất hiện của biến cố đó. Với cách tiếp cận này ta có định nghĩa xác suất theo thống kê. 1.2.1 Định nghĩa cổ điển về xác suất 1.2.1.1 Định nghĩa và ví dụ Giả sử phép thử C thoả mãn hai điều kiện sau: (i) Không gian mẫu có một số hữu hạn phần tử. (ii) Các kết quả xảy ra đồng khả năng. Khi đó xác suất của biến cố A được xác định và ký hiệu sè tr­êng hîp thuËn lîi đèi víi A P(A) (1.1) sè tr­êng hîp cã thÓ Nếu xem biến cố A như là tập con của không gian mẫu  thì sè phÇn tö cña A A P(A) (1.2) sè phÇn tö cña   Ví dụ 1.3: Biến cố A xuất hiện mặt chẵn trong phép thử gieo con xúc xắc ở ví dụ 1.1 có 3 3 1 trường hợp thuận lợi ( A 3) và 6 trường hợp có thể (  6 ). Vậy P(A) . 6 2 Biến cố xuất hiện một mặt sấp và một mặt ngửa khi gieo đồng thời hai đồng xu có 2 kết 1 quả thuận lợi và 4 kết quả đồng khả năng có thể, vậy có xác suất xuất hiện của biến cố đó là . 2 13
  11. Chương 1: Biến cố ngẫu nhiên và xác xuất Để tính xác suất cổ điển ta sử dụng phương pháp đếm của giải tích tổ hợp. 1.2.1.2 Các qui tắc đếm A. Qui tắc cộng Nếu có m1 cách chọn loại đối tượng x1, m2 cách chọn loại đối tượng x2 , , mn cách chọn loại đối tượng xn . Các cách chọn đối tượng xi không trùng với cách chọn x j nếu i j thì có m1 m2  mn cách chọn một trong các đối tượng đã cho. Chẳng hạn để biết số SV có mặt của một lớp đông ta có thể lấy tổng số SV có mặt của các tổ do tổ trưởng cung cấp. B. Qui tắc nhân Giả sử công việc H gồm nhiều công đoạn liên tiếp HHH1, 2 , , k . Có n1 cách thực hiện công đoạn H1, ứng với mỗi công đoạn H1 có n2 cách thực hiện công đoạn H2 Vậy có tất cả n1 n 2   nk cách thực hiện công việc H . Ví dụ 1.4: Một nhân viên có 4 chiếc áo sơ mi và 3 quần dài đồng phục, thì anh ta có 4.3 12 cách chọn áo sơ mi và quần đồng phục. Ví dụ 1.5: Tung một con xúc xắc (6 mặt) hai lần. Tìm xác suất để trong đó có 1 lần ra 6 chấm. Giải: Theo quy tắc nhân ta có số các trường hợp có thể khi tung con xúc xắc 2 lần là 6.6 = 36. Gọi A là biến cố “ trong 2 lần tung con xúc xắc có 1 lần được mặt 6”. Nếu lần thứ nhất ra mặt 6 thì lần thứ hai chỉ có thể ra các mặt từ 1 đến 5, do đó có 5 trường hợp. Tương tự cũng có 5 trường hợp chỉ xuất hiện mặt 6 ở lần tung thứ hai. Áp dụng quy tắc cộng ta suy ra biến cố “chỉ có một lần ra mặt 6 khi 2 tung xúc xắc” có 10 trường hợp thuận lợi. Vậy 10 xác suất cần tìm là . 36 Ví dụ 1.6: a. Có bao nhiêu số có 4 chữ số. b. Có bao nhiêu số có 4 chữ số khác nhau. c. Có bao nhiêu số có 4 chữ số khác nhau và chữ số cuối là 0. Giải: a. Có 9 cách chọn chữ số đầu tiên (vì chữ số đầu tiên khác 0) và các chữ số còn lại có 10 cách chọn cho từng chữ số. Vậy có 9.10.10.10=9000 số cần tìm. b. Có 9 cách chọn chữ số đầu tiên (vì chữ số đầu tiên khác 0), 9 cách chọn chữ số thứ hai, 8 cách chọn chữ số thứ ba và 7 cách chọn chữ số thứ tư. Vậy có 9.9.8.7=4536 số cần tìm. c. Vì chữ số thứ tư là số 0 và các chữ số này khác nhau do đó có 9 cách chọn chữ số đầu tiên, 8 cách chọn chữ số thứ hai, 7 cách chọn chữ số thứ ba. Vậy có 9.8.7=504 số cần tìm. C. Hoán vị Mỗi cách đổi chỗ của n phần tử hoặc mỗi cách sắp xếp n phần tử vào n vị trí trong một hàng được gọi là phép hoán vị n phần tử. Sử dụng quy tắc nhân ta có thể tính được: Có n! hoán vị n phần tử. Quy ước 0! = 1. 14
  12. Chương 1: Biến cố ngẫu nhiên và xác xuất Ví dụ 1.7: a. Có bao nhiêu cách bố trí 5 nam SV và 4 nữ SV theo một hàng. b. Có bao nhiêu cách bố trí 5 nam SV và 4 nữ SV theo một hàng, sao cho các nữ SV ở vị trí số chẵn. Giải: a. Số cách bố trí 9 SV (gồm 5 nam SV và 4 nữ SV) theo một hàng là 9!= 362880. b. Có 5! cách bố trí nam SV, ứng với mỗi cách bố trí nam SV có 4! cách bố trí nữ SV vào vị trí chẵn tương ứng. Vậy có 5!4!=2880 cách bố trí theo yêu cầu. Ví dụ 1.8: (Hoán vị vòng tròn) Có n người ( n 3 ), trong đó có hai người là anh em. a. Có bao nhiêu cách sắp xếp n người ngồi xung quanh một bàn tròn. b. Có bao nhiêu cách sắp xếp n người ngồi xung quanh một bàn tròn, trong đó có hai người là anh em ngồi cạnh nhau. c. Có bao nhiêu cách sắp xếp n người ngồi xung quanh một bàn tròn, trong đó có hai người là anh em không ngồi cạnh nhau. Giải: a. Có 1 người ngồi ở vị trí bất kỳ, vì vậy n 1 người còn lại có (n 1)! cách chọn vị trí ngồi. Vậy có (n 1)! cách sắp xếp n người ngồi xung quanh một bàn tròn. b. Người anh ngồi ở một vị trí tùy ý, người em ngồi vào 1 trong 2 chỗ cạnh người anh (có 2 cách) và n 2 người còn lại còn lại ngồi tùy ý vào n 2 chỗ còn lại (có (n 2)! cách). Vậy số các cách sắp xếp theo yêu cầu là 2.(n 2)!. c. Sử dụng kết quả phần a. và b. ta suy ra số cách sắp xếp n người ngồi xung quanh một bàn tròn, trong đó có hai người là anh em không ngồi cạnh nhau là (n 1)!2.( n 2)! ( n 2)!( n 1) 2. Ví dụ 1.9: Xếp ngẫu nhiên 6 cuốn sách toán và 4 sách lý vào 1 giá sách. Tính xác suất 3 cuốn sách toán đứng cạnh nhau. Giải: Số trường hợp có thể là số cách sắp xếp 10 cuốn sách vào giá sách đó là 10!. Ta xem 3 cuốn sách toán đứng cạnh nhau như là một cuốn sách lớn. Như vậy ta cần sắp xếp 8 cuốn sách vào giá sách (có 8! cách), ngoài ra 3 cuốn sách toán đứng cạnh nhau có 3! cách sắp xếp. Do đó số các trường hợp thuận lợi là 8!3!. Vậy xác suất 3 cuốn sách toán 8!3! 1 đứng cạnh nhau là P . 10! 15 D. Chỉnh hợp Chọn lần lượt k (1 k n ) phần tử không hoàn lại trong tập n phần tử ta được một chỉnh hợp chập k của n phần tử. Sử dụng quy tắc nhân ta có thể tính được số các chỉnh hợp chập k của n phần tử là n! Ak n( n 1) ( n k 1) (1.3) n (n k )! 4 Ví dụ 1.10: Có A10 10.9.8.7 5040 cách bố trí 10 người ngồi vào 4 chỗ. 15
  13. Chương 1: Biến cố ngẫu nhiên và xác xuất Ví dụ 1.11: Một người gọi điện thoại quên mất hai số cuối của số điện thoại và chỉ nhớ được rằng chúng khác nhau. Tìm xác suất để quay ngẫu nhiên một lần được đúng số cần gọi. Giải: Gọi A là biến cố “quay ngẫu nhiên một lần được đúng số cần gọi”. Số các trường hợp có thể là số các cặp hai chữ số khác nhau từ 10 chữ số từ 0 đến 9. Nó bằng số các chỉnh hợp 2 chập 2 của 10 phần tử. Vậy số các trường hợp có thể là A10 10  9 90 . 1 Số các trường hợp thuận lợi của A là 1. Vậy PA() . 90 Cũng có thể tính trực tiếp số trường hợp có thể của biến cố A như sau: Có 10 khả năng cho con số ở hàng chục và với mỗi con số hàng chục có 9 khả năng cho con số ở hàng đơn vị khác với hàng chục. Áp dụng quy tắc nhân ta được số các trường hợp có thể là 10 9 90. E. Tổ hợp Chọn đồng thời k phần tử của tập n phần tử ta được một tổ hợp chập k của n phần tử. Cũng có thể xem một tổ hợp chập k của n phần tử là một tập con k phần tử của tập n phần tử. Hai chỉnh hợp chập k của n phần tử là khác nhau nếu: . có ít nhất 1 phần tử của chỉnh hợp này không có trong chỉnh hợp kia. . các phần tử đều như nhau nhưng thứ tự khác nhau. Do đó với mỗi tổ hợp chập k có k! chỉnh hợp tương ứng. Mặt khác hai chỉnh hợp khác nhau ứng với hai tổ hợp khác nhau là khác nhau. k Vậy số các tổ hợp chập k của n phần tử là Cn thỏa mãn: Ak n! k! Ck A k C k n (1.4) n n n k! k !( n k )! Một vài trường hợp cụ thể n( n 1) n( n 1)( n 2) C0 1; C1 n ; C2 ; C3 ; CCk n k . (1.5) n n n 2 n 6 n n Ví dụ 1.12: Một công ty cần tuyển 2 nhân viên. Có 6 người nộp đơn trong đó có 4 nữ và 2 nam. Giả sử khả năng trúng tuyển của cả 6 người là như nhau. Tính xác suất biến cố: a. Hai người trúng tuyển là nam b. Hai người trúng tuyển là nữ c. Có ít nhất 1nữ trúng tuyển. 6 5 Giải: Số trường hợp có thể là số tổ hợp chập 2 của 6 phần tử, vậy  C2 15 . 6 2 1 a. Chỉ có 1 trường hợp cả 2 nam đều trúng tuyển do đó xác suất tương ứng là P . 15 16
  14. Chương 1: Biến cố ngẫu nhiên và xác xuất 4 3 6 b. Có C2 6 cách chọn 2 trong 4 nữ, vậy xác suất tương ứng P . 4 2 15 c. Trong 15 trường hợp có thể chỉ có 1 trường hợp cả 2 nam được chọn, vậy có 14 trường 14 hợp ít nhất 1 nữ được chọn. Do đo xác suất tương ứng P . 15 Ta cũng có thể tính số trường hợp thuận lợi của biến cố “có ít nhất 1 nữ được chọn” như sau. Vì chỉ chọn 2 ứng viên nên biến cố có ít nhất 1 nữ trúng tuyển được chia thành 2 loại: Có 2 nữ được chọn: Có 6 cách Có 1 nữ và 1 nam được chọn: Có 4  2 cách chọn Sử dụng quy tắc cộng ta được 14 trường hợp ít nhất 1 nữ được chọn. Ví dụ 1.13: Một hộp có 8 bi màu đỏ, 3 bi trắng và 9 bi màu xanh. Lấy ngẫu nhiên 3 bi từ hộp. Tính xác suất trong các trường hợp sau: a. 3 bi lấy được cùng màu đỏ b. 2 đỏ và 1 trắng c. Ít nhất 1 trắng d. Mỗi màu 1 bi e. Nếu lấy lần lượt không hoàn lại 3 bi, tính xác suất lấy được mỗi màu 1 bi. 3 C8 14 Giải: a. P 3 0,0491 C20 285 2 1 CC8 3 7 b. P 3 0,0737 C20 95 CCCCC1 2 2 1 3 23 C3 34 23 c. 3 17 3 17 3 hoặc 17 P 3 P 1 3 1 0,4035 C20 57 C20 57 57 1 1 1 CCC8 3 9 18 d. P 3 0,1895. C20 95 8.3.9 3 e. P 0,0316 . 20.19.18 95 Nhận xét 1.1: Hoán vị, chỉnh hợp, tổ hợp có thể liên hệ với nhau như sau: . Có thể xem mỗi hoán vị n phần tử là một cách sắp xếp n phần tử này thành một hàng. . Mỗi chỉnh hợp chập k của n phần tử là một cách sắp xếp k phần tử từ n phần tử này thành một hàng. 17
  15. Chương 1: Biến cố ngẫu nhiên và xác xuất . Khi sắp xếp các phần tử thành một hàng ta ngầm hiểu từ trái sang phải, vì vậy trường hợp hoán vị vòng quanh cần chọn một phần tử làm điểm xuất phát do đó có (n 1)! cách hoàn vị vòng quanh của n phần tử. . Có thể xem mỗi tổ hợp chập k của n vật là một cách sắp xếp n vật thành một hàng, trong đó có k vật loại 1 giống nhau và n k vật loại 2 còn lại cũng giống nhau. Có n! cách sắp xếp n vật thành một hàng. Vì các vật cùng loại giống nhau không phân biệt được, do đó nếu số cách sắp xếp các vật thỏa mãn yêu cầu trên là N thì ứng với mỗi một cách sắp xếp trong N cách ở trên có k! hoán vị vật loại 1, (n k )! hoán vị vật loại 2 được đếm trong tổng số n! cách. n! Vậy k!( n k )! N n ! N . k!( n k )! Ta có thể mở rộng kết quả này như sau. Công thức tổ hợp mở rộng Số cách sắp xếp n n1 n 2  nk vật theo một hàng: trong đó có n1 vật loại 1 giống nhau, n2 vật loại 2 giống nhau, , nk vật loại k giống nhau là n! (1.6) n1! n 2 ! nk ! Công thức này có thể giải thích như sau: Có n! cách sắp xếp n n1 n 2  nk vật khác nhau theo một hàng. Vì các vật cùng loại giống nhau không phân biệt được, do đó nếu số cách sắp xếp các vật thỏa mãn yêu cầu trên là N thì ứng với mỗi một cách sắp xếp trong N cách ở trên có n1! hoán vị vật loại 1, n2 ! hoán vị vật loại 2, , nk ! hoán vị vật loại k được đếm trong tổng số n! cách. Vì n! vậy n1! n 2 ! nk ! N n ! N n1! n 2 ! nk ! Ví dụ 1.14: Cần sắp xếp 4 cuốn sách toán, 6 sách lý và 2 sách hóa khác nhau trên cùng một giá sách. Có bao nhiêu cách sắp xếp trong mỗi trường hợp sau: a. Các cuốn sách cùng môn học phải đứng cạnh nhau. b. Chỉ cần các sách toán đứng cạnh nhau. c. Nếu các cuốn sách trong mỗi môn học giống nhau thì có bao nhiêu cách sắp xếp. Giải: a. Có 4! cách sắp xếp các cuốn sách toán, 6! cách sắp xếp các cuốn sách lý, 2! cách sắp xếp các cuốn sách hóa và 3! cách sắp xếp 3 nhóm toán, lý, hóa. Vậy số cách sắp xếp theo yêu cầu là 4!6!2!3!=207.360. b. Ta ghép 4 sách toán thành 1 cuốn sách to. Như vậy có 9 cuốn sách cần sắp xếp, do đó có 9! cách sắp xếp. Trong mỗi trường hợp này các cuốn sách toán luôn đứng bên nhau, nhưng có 4! cách sắp xếp 4 cuốn sách toán. 18
  16. Chương 1: Biến cố ngẫu nhiên và xác xuất Vậy số cách sắp xếp theo yêu cầu là 9!4!=8.709.120. c. Vì các cuốn sách cùng loại không phân biệt do đó có thể áp dụng công thức (1.6) và số 12! cách sắp xếp là 13.860 . 4!6!2! 1.2.2 Định nghĩa thống kê về xác suất Định nghĩa xác suất theo cổ điển trực quan, dễ hiểu. Tuy nhiên khi phép thử có không gian mẫu vô hạn hoặc các kết quả không đồng khả năng thì cách tính xác suất cổ điển không áp dụng được. Trong trường hợp này người ta sử dụng phương pháp thông kê như sau. Giả sử phép thử C có thể được thực hiện lặp lại nhiều lần độc lập trong những điều kiện giống hệt nhau. Nếu trong n lần thực hiện phép thử C biến cố A xuất hiện kn (A) lần (gọi là tần số xuất hiện) thì tỉ số: k (A) f (A) n n n được gọi là tần suất xuất hiện của biến cố A trong n phép thử. Người ta chứng minh được (định lý luật số lớn Bernoulli) khi n tăng lên vô hạn thì fn (A) tiến đến một giới hạn xác định. Ta định nghĩa giới hạn này là xác suất của biến cố A , ký hiệu P(A). P(A) lim f n (A) (1.7) n Trên thực tế các tần suất fn (A) xấp xỉ nhau khi n đủ lớn và P(A) được chọn bằng giá trị xấp xỉ này. Ví dụ 1.15: Một công ty bảo hiểm muốn xác định xác suất để một thanh niên 25 tuổi sẽ bị chết trong năm tới, người ta theo dõi 100.000 thanh niên và thấy rằng có 798 người bị chết 798 trong vòng 1 năm sau đó. Vậy xác suất cần tìm xấp xỉ bằng 0,008 . 100.000 Ví dụ 1.16: Thống kê cho thấy tần suất sinh con trai xấp xỉ 0,513. Vậy xác suất để bé trai ra đời lớn hơn bé gái. Nhận xét 1.2: Định nghĩa xác suất theo thống kê khắc phục được hạn chế của định nghĩa cổ điển, phương pháp này hoàn toàn dựa trên các thí nghiệm hoặc quan sát thực tế để tìm xác suất của biến cố. Tuy nhiên định nghĩa thống kê về xác suất cũng chỉ áp dụng cho các phép thử mà có thể lặp lại được nhiều lần một cách độc lập trong những điều kiện giống hệt nhau. Ngoài ra để xác định một cách tương đối chính xác giá trị của xác suất thì cần tiến hành một số lần n đủ lớn các phép thử, mà việc này đôi khi không thể làm được vì hạn chế về thời gian và kinh phí. Ngày nay với sự trợ giúp của công nghệ thông tin, người ta có thể mô phỏng các phép thử ngẫu nhiên mà không cần thực hiện các phép thử trong thực tế. Điều này cho phép tính xác suất theo phương pháp thống kê thuận tiện hơn. 19
  17. Chương 1: Biến cố ngẫu nhiên và xác xuất 1.3 QUAN HỆ CỦA CÁC BIẾN CỐ Một cách tương ứng với các phép toán của tập hợp, trong lý thuyết xác suất người ta xét các quan hệ sau đây của các biến cố trong cùng một phép thử. 1.3.1 Quan hệ biến cố đối Với mỗi biến cố A , luôn luôn có biến cố gọi là biến cố đối của A , ký hiệu A và được xác định như sau: Biến cố A xảy ra khi và chỉ khi biến cố đối A không xảy ra. Ví dụ 1.17: Bắn một phát đạn vào bia. Gọi A là biến cố “bắn trúng bia”. Biến cố đối của A là A “bắn trượt bia”. 1.3.2 Tổng của các biến cố Tổng của hai biến cố A,B là biến cố được ký hiệu A  B . Biến cố tổng A  B xảy ra khi và chỉ khi có ít nhất A hoặc B xảy ra. n Tổng của một dãy các biến cố A1, A2, , An là biến cố AAA1 2   n hoặc  Ai . i 1 Biến cố tổng xảy ra khi có ít nhất một trong các biến cố Ai xảy ra, với i 1, , n . Ví dụ 1.18: Một mạng điện gồm hai bóng đèn mắc nối tiếp. Gọi A1 là biến cố “bóng đèn thứ nhất bị cháy”, A2 là biến cố “bóng đèn thứ hai bị cháy”. Gọi A là biến cố “mạng mất điện”. Ta thấy rằng mạng bị mất điện khi ít nhất một trong hai bóng bị cháy. Vậy AAA 1  2 . 1.3.3 Tích của các biến cố Tích của hai biến cố A,B là biến cố được ký hiệu AB . Biến cố tích AB xảy ra khi cả hai biến cố A , B đồng thời cùng xảy ra. n Tích của một dãy các biến cố A1, A2, , An là biến cố AAA1 2   n hoặc Ai . i 1 Biến cố tích xảy ra khi tất cả các biến cố Ai đồng thời cùng xảy ra, với mọi i 1, , n . Ví dụ 1.19: Một mạng điện gồm hai bóng đèn mắc song song. Gọi A1 là biến cố “bóng đèn thứ nhất bị cháy”, A2 là biến cố “bóng đèn thứ hai bị cháy”. Gọi A là biến cố “mạng mất điện”. Ta thấy rằng mạng mắc song song bị mất điện khi cả hai bóng bị cháy. Vậy AAA 1  2 . 1.3.4 Biến cố xung khắc Hai biến cố A,B gọi là xung khắc nếu hai biến cố này không thể đồng thời cùng xảy ra. Nói cách khác biến cố tích AB là biến cố không thể, nghĩa là AB  . Đôi khi người ta còn ký hiệu tổng của hai biến cố xung khắc A và B là AB . 20
  18. Chương 1: Biến cố ngẫu nhiên và xác xuất Ví dụ 1.20: Một bình có 3 loại cầu: cầu mầu trắng, mầu đỏ và mầu xanh. Lấy ngẫu nhiên 1 cầu từ bình. Gọi At , Ađ , Ax lần lượt là biến cố quả cầu rút được là cầu trắng, đỏ, xanh. Các biến cố này xung khắc từng đôi một, vì mỗi quả cầu chỉ có 1 mầu. 1.3.5 Hệ đầy đủ các biến cố Dãy các biến cố AAA1, 2 , , n được gọi là một hệ đầy đủ các biến cố nếu thỏa mãn hai điều kiện sau: (i) Xung khắc từng đôi một, nghĩa là AAi j  với mọi i j; i 1, , n ; j 1, , n (ii) Tổng của chúng là biến cố chắc chắc, nghĩa là AAA1 2  n  . Đặc biệt với mọi biến cố A , hệ hai biến cố AA,  là hệ đầy đủ. Ví dụ 1.21: Một nhà máy có ba phân xưởng sản xuất ra cùng một loại sản phẩm. Giả sử rằng mỗi sản phẩm của nhà máy chỉ do một trong ba phân xưởng này sản xuất. Chọn ngẫu nhiên một sản phẩm, gọi A1, A2 , A3 lần lượt là biến cố sản phẩm được chọn do phân xưởng thứ nhất, thứ hai, thứ ba sản xuất. Khi đó hệ ba biến cố AAA1,, 2 3 là hệ đầy đủ. Hệ ba biến cố AAAt ,,đ x  trong ví dụ 1.20 cũng là đầy đủ. 1.3.6 Tính độc lập của các biến cố Hai biến cố A và B được gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra biến cố này không ảnh hưởng tới việc xảy ra hay không xảy ra biến cố kia. Trường hợp tổng quát: hệ các biến cố A1, A2 , , An được gọi là độc lập nếu việc xảy ra hay không xảy ra của một nhóm bất kỳ k biến cố, trong đó 1 k n, không làm ảnh hưởng tới việc xảy ra hay không xảy ra của một nhóm nào đó các biến cố còn lại. Ví dụ 1.22: Ba xạ thủ A, B, C mỗi người bắn một viên đạn vào mục tiêu. Gọi A, B,C lần lượt là biến cố A, B, C bắn trúng mục tiêu. a. Hãy mô tả các biến cố: ABCABCABC ,,     . b. Biểu diễn các biến cố sau theo A,B,C : - D : Có ít nhất 2 xạ thủ bắn trúng. - E : Có nhiều nhất 1 xạ thủ bắn trúng. - F : Chỉ có xạ thủ C bắn trúng. - G : Chỉ có 1 xạ thủ bắn trúng. c. Các biến cố A, B,C có xung khắc không, có độc lập không ? Giải: a. ABC  : là biến cố cả 3 đều bắn trúng. ABC  : là biến cố cả 3 đều bắn trượt. A B C : là biến cố có ít nhất 1 người bắn trúng. 21
  19. Chương 1: Biến cố ngẫu nhiên và xác xuất b. Biến cố có ít nhất hai xạ thủ bắn trúng: DABBCCA ()()()      . Vì chỉ có 3 xạ thủ bắn vào bia nên biến cố “có nhiều nhất một xạ thủ bắn trúng” cũng là biến cố “có ít nhất hai xạ thủ bắn trượt”, vậy: EABBCCA ()()()      . Biến cố chỉ có C bắn trúng: FABC   . Biến cố chỉ có một xạ thủ bắn trúng: GABCABCABC ()()()         . c. Ba biến cố A, B,C độc lập nhưng không xung khắc. Nhận xét 1.3: . Từ ví dụ trên cho thấy tính chất xung khắc hoặc độc lập của các biến cố được suy từ ý nghĩa của phép thử. . Nếu A, B độc lập thì các cặp biến cố: A, B ; A, B ; A, B cũng độc lập. . Một số tài liệu ký hiệu tổng, tích của hai biến cố AB, là AB và AB . Mỗi cách ký hiệu có những thuận lợi riêng. Nhưng ký hiệu theo cách này rất khó biểu diễn các tính chất dạng đại số Boole của các biến cố, chẳng hạn tính chất phân phối của tổng đối với tích và tích đối với tổng của các biến cố được xét trong chú ý sau. . Chú ý rằng các biến cố với phép toán tổng, tích và lấy biến cố đối tạo thành đại số Boole, do đó các phép toán được định nghĩa ở trên có các tính chất như các phép toán hợp, giao, lấy phần bù đối với các tập con của không gian mẫu. Chẳng hạn phép toán tổng, phép toán tích các biến cố có tính giao hoán, kết hợp, tổng phân bố đối với tích, tích phân bố đối với tổng, thỏa mãn luật De Morgan ABCABAC()()()     ; ABCABAC()()()     ; ABAB  ; ABAB  1.4 CÁC ĐỊNH LÝ VÀ TÍNH CHẤT XÁC SUẤT 1.4.1 Xác suất chắc chắn và xác suất không thể Các định nghĩa trên của xác suất thỏa mãn các tính chất sau: 1. Với mọi biến cố A : 0 P(A) 1. (1.8) 2. Xác suất của biến cố không thể bằng 0, xác suất của biến cố chắc chắn bằng 1. PP( ) 0, (  ) 1 (1.9) 1.4.2 Qui tắc cộng xác suất 1.4.2.1 Trường hợp xung khắc Nếu A, B là hai biến cố xung khắc thì 22
  20. Chương 1: Biến cố ngẫu nhiên và xác xuất P(A B) P(A) P(B) . (1.10) Tổng quát hơn, nếu A1, A2, , An là dãy các biến cố xung khắc từng đôi một thì n n PAPA  i  () i . (1.11) i 1 i 1 Từ công thức (1.9) và (1.11) ta có hệ quả: Nếu A1, A2, , An là một hệ đầy đủ thì n P(Ai ) 1 (1.12) i 1 1.4.2.2 Trường hợp không xung khắc . Nếu A,B là hai biến cố bất kỳ thì PABPAPBPAB()()()()  (1.13) . Nếu A, B,C là ba biến cố bất kỳ thì PABCPAPBPCPABPBCPCAPABC()()()()()()()()     (1.14) . Nếu A1, A2, , An là dãy n biến cố bất kỳ n n n 1 PAPAPAAPAAAPAAA  i () i  ( i  j )  ( i  j k )(1)( 1  2 ) n i 1 i 1 1 i j n 1 i j k n (1.15) Ví dụ 1.23: Một lô hàng có 25% sản phẩm loại I, 55% sản phẩm loại II và 20% sản phẩm loại III. Sản phẩm được cho là đạt chất lượng nếu thuộc loại I hoặc loại II. Chọn ngẫu nhiên 1 sản phẩm tìm xác suất để sản phẩm này đạt tiêu chuẩn chất lượng. Giải: Gọi A1, A2 , A3 lần lượt là biến cố sản phẩm được chọn thuộc loại I, II, III. Ba biến cố này xung khắc từng đôi một. P(A1) 0,25, P(A2 ) 0,55, P(A3 ) 0,20. Gọi A là biến cố sản phẩm được chọn đạt tiêu chuẩn chất lượng, ta có A A1  A2 . Vậy xác suất tìm được sản phẩm đạt tiêu chuẩn chất lượng là: P(A) P(A1) P(A2) 0,25 0,55 0,8 . Ví dụ 1.24: Sơ đồ cây Nhiều phép thử có tính chất nối tiếp lập thành dãy, chẳng hạn phép thử tung liên tiếp đồng xu ba lần, quan sát chỉ số chứng khoán trong năm ngày liên tiếp, hoặc tám ký số liên tiếp nhận được của một bộ nhận thông tin Trong trường hợp này ta có thể biểu diễn không gian mẫu và các biến cố tương ứng dưới dạng sơ đồ cây. Từ sơ đồ cây (hình 1.1) ta có 1 PAPB()() 2 23
  21. Chương 1: Biến cố ngẫu nhiên và xác xuất 1 AB ,  , do đó PAB() . Áp dụng quy tắc cộng ta được 3 4 4 1 1 1 3 PABPAPBPAB()()()()  . 2 2 4 4 Ta cũng có thể tính trực tiếp bằng cách xác định AB 1,,,,,  2  3  4  7  8. Vậy cũng có 6 3 PAB() . 8 4 Gieo liên tiếp một đồng xu 3 lần, ta có thể biểu diễn không gian mẫu như sau. Gieo lần 1 Gieo lần 2 Gieo lần 3 Biến cố sơ cấp S 1 S  N 2 S S 3 N  N 4 Gốc S 5 S  N 6 N S  7 N N 8 Hình 1.1: Sơ đồ cây của phép thử gieo đồng xu liên tiếp 3 lần Ví dụ 1.25: Xét hai biến cố A, B trong cùng một phép thử có xác suất PA( ) 0,7, PB( ) 0,6. a. Hai biến cố A, B có xung khắc không? b. Giả sử AB là biến cố chắc chắn, tìm PAB() . Giải : a. Theo công thức 1.8 và 1.13 ta có 1  PABPAPBPABPABPAB ( ) () ()    ( )0,70,6 ( ) ( )0,3 Vậy hai biến cố AB, không xung khắc. b. Trường hợp AB là biến cố chắc chắn thì PABPAPBPAB( ) () () (  )0,3 . 1.4.3 Quy tắc xác suất của biến cố đối Áp dụng công thức (1.12) cho hệ đầy đủ A, A  ta được quy tắc tính xác suất biến cố đối: Với mọi biến cố A P( A) 1 P( A) và cũng có PAPA( ) 1 ( ) . (1.16) Ví dụ 1.26: Gieo con xúc xắc hai lần, tính xác suất ít nhất một lần xuất hiện mặt 6 chấm. 24
  22. Chương 1: Biến cố ngẫu nhiên và xác xuất Giải : Gọi A là biến cố có ít nhất một xuất hiện mặt 6 chấm, khi đó biến cố đối A không có lần nào xuất hiện mặt 6 chấm 52 5 2 11 PAPA( ) ( ) 1 . 62 6 2 36 Ví dụ 1.27: Trong phòng có n người ( n 365 ; một năm có 365 ngày). a. Tính xác suất có ít nhất hai người có cùng ngày sinh? b. Tính xác suất này khi n 10 . Giải : a. Gọi A là biến cố có ít nhất hai người trong phòng có cùng ngày sinh. Biến cố đối A là biến cố mọi người không trùng ngày sinh. Mọi người đều đồng khả năng được sinh ra vào một ngày bất kỳ trong năm do đó số các trường hợp có thể là 365n . Số trường hợp thuận lợi đối với biến cố đối A là số chỉnh hợp chập n của 365. Vậy An (365)(364) (365 n 1) PA() 365 , PAPA( ) 1 ( ) . 365n 365 n A10 b. Khi n 10 thì PA( ) 365 0,883, PA( ) 1 0,883 0,117 . 36510 Ví dụ 1.28: Giả sử phép thử C có không gian mẫu  a,,, b c d với xác suất P( a ) 0,2 , P( b ) 0,3, P( c ) 0,4 , P( d ) 0,1. Xét hai biến cố A a, b và B b,, c d . Tính xác suất của các biến cố PA(); PB(); PA() ; PAB() và PAB() . Giải: P() A P () a P () b 0,2 0,3 0,5 ; P() B P () b P () c P () d 0,3 0,4 0,1 0,8 P() A P () c P () d 0,4 0,1 0,5 hoặc PAPA() 1 () 10,5 0,5 AB  do đó PABP( ) (  ) 1 A B b do đó P( A B ) P ( b ) 0,3 . 1.4.4 Xác suất có điều kiện Xác suất của biến cố B được tính trong điều kiện biết rằng biến cố A đã xảy ra được gọi là xác suất của B với điều kiện A . Ký hiệu PBA( | ) . Tính chất 1.1:  Nếu P(A) 0 thì: PAB() PBA( | ) . (1.17) PA()  Khi cố định A với P(A) 0 thì xác suất có điều kiện PBA( | ) có tất cả các tính chất của xác suất thông thường (công thức (1.8)-(1.16)) đối với biến cố B . 25
  23. Chương 1: Biến cố ngẫu nhiên và xác xuất Chẳng hạn: PBAPBAPBBAPBAPBAPBBA( | ) 1 , 1  2 1 2 1  2 (1.18) Nhận xét 1.4: Ta có thể tính xác suất có điều kiện PBA( | ) bằng cách áp dụng công thức (1.17) hoặc tính trực tiếp. Ví dụ 1.29: Gieo đồng thời hai con xúc xắc cân đối (6 mặt). Tính xác suất để tổng số chấm xuất hiện trên hai con xúc xắc 10 biết rằng ít nhất một con đã ra mặt có 5 chấm. Giải: Gọi A là biến cố " ít nhất một con ra 5 chấm", bằng cách tính sử dụng xác suất biến cố đối tương tự ví dụ 1.27 ta có 52 11 PA( ) 1 . 62 36 Gọi B là biến cố "tổng số chấm trên hai con 10 " Biến cố AB có 3 kết quả thuận lợi là (5,6), (6,5), (5,5). Vậy 3 3 11 3 PABPBA() . 36 36 36 11 Ta cũng có thể tính trực tiếp như sau. Có 11 trường hợp ít nhất một con xúc xắc xuất hiện mặt 5 chấm: (5,1);(5,2);(5,3);(5,4);(5,5) ; (5,6) ;(1,5);(2,5);(3,5);(4,5); (6,5) trong đó có 3 trường hợp tổng số chấm 10 . 3 Vậy PBA( | ) 11 Ví dụ 1.30: Xét phép thử gieo đồng xu liên tiếp 3 lần ở ví dụ 1.24 Gọi A là biến cố lần thứ nhất ra mặt sấp. B là biến cố lần thứ hai ra mặt ngửa. C là biến cố số lần mặt sấp xuất hiện nhiều hơn hoặc bằng số lần mặt ngửa 1 1 1 1 1 PA() ; PAB() PBA( | ) . 2 4 4 2 2 3 3 1 3 AC ,,    PAC()  PCA( | ) . 1 2 3 8 8 2 4 Ví dụ 1.31: Có hai phân xưởng của nhà máy sản xuất cùng một loại sản phẩm. Phân xưởng I sản xuất được 1000 sản phẩm trong đó có 100 phế phẩm. Phân xưởng II sản xuất được 2000 sản phẩm trong đó có 150 phế phẩm. Lấy ngẫu nhiên một sản phẩm để kiểm tra và đó là phế phẩm. Tính xác suất phế phẩm này do phân xưởng thứ I sản xuất. Giải: Gọi B là biến cố sản phẩm được chọn để kiểm tra là phế phẩm. Gọi A là biến cố sản phẩm được chọn để kiểm tra do phân xưởng I sản xuất. Ta cần tính xác suất có điều kiện PAB( | ) . 100 1 Biến cố AB có 100 kết quả thuận lợi đồng khả năng do đó PAB() . 3000 30 26
  24. Chương 1: Biến cố ngẫu nhiên và xác xuất 250 1 Trong 3000 sản phẩm sản xuất ra có 250 phế phẩm, do đó PB() . 3000 12 Áp dụng công thức (1.17) ta được 1/ 30 PAB( | ) 2 / 5 0, 4 . 1/12 Ta có thể tính trực tiếp xác suất PAB( | ) như sau: Có 250 trường hợp đồng khả năng có thể lấy được phế phẩm của nhà máy nhưng chỉ có 100 kết quả thuận lợi đối với biến cố phế phẩm do phân xưởng I sản xuất. Vậy xác suất để lấy được phế phẩm do phân xưởng thứ I sản xuất trong số các phế phẩm là 100 2 PAB( | ) 0,4 . 250 5 1.4.5 Quy tắc nhân xác suất 1.4.5.1 Trường hợp độc lập . Nếu A, B là hai biến cố độc lập thì xác suất của biến cố B không phụ thuộc vào A có xảy ra hay không (xem mục 1.5.7), nghĩa là PBAPB( | ) ( ). Theo (1.17) ta có PABPAPB()()() . (1.19) . Nếu A1, A2 , , An  là các biến cố độc lập thì PAAAPAPAPA 1 2  n 1 2 n (1.20) Thông thường tính độc lập của các biến cố được suy ra từ ý nghĩa thực tế. Chẳng hạn nếu A là biến cố xạ thủ thứ nhất bắn trúng mục tiêu và B là biến cố xạ thủ thứ hai bắn trúng mục tiêu (xem ví dụ 1.14) thì A,B là hai biến cố độc lập. 1.4.5.2 Trường hợp không độc lập . Với hai biến cố A,B bất kỳ, áp dụng công thức (1.17) ta có PABPAPBA( ) ( ) ( | ) (1.21) . Với n biến cố bất kỳ AAA1, 2 , , n : PAAAPAPAAPAAAPAAAA 12  n 121312  n 12    n 1 (1.22) Để chứng minh công thức (1.22) ta chỉ cần áp dụng lần lượt công thức (1.17) vào vế phải của công thức (1.22) và giản ước cuối cùng được vế trái. Ví dụ 1.32: Túi I chứa 3 bi trắng, 7 bi đỏ, 15 bi xanh. Túi II chứa 10 bi trắng, 6 bi đỏ, 9 bi xanh. Từ mỗi túi lấy ngẫu nhiên 1 bi. Tìm xác suất để 2 bi được rút từ 2 túi là cùng màu. Giải: Gọi At , Ađ , Ax lần lượt là biến cố bi được rút từ túi I là trắng, đỏ, xanh. Bt , Bđ , Bx lần lượt là biến cố bi được rút từ túi II là trắng, đỏ, xanh. Các biến cố At , Ađ , Ax xung khắc, Bt , Bđ , Bx xung khắc; 27
  25. Chương 1: Biến cố ngẫu nhiên và xác xuất Các biến cố At , Ađ , Ax độc lập với các biến cố Bt , Bđ , Bx . Biến cố 2 bi được rút cùng mầu là ABABABt t  đ  đ  x  x Vậy xác suất cần tìm: PABABABPABPABPAB t  t đ đ x x t t đ  đ x  x (theo công thức 1.11) PAPBPAPBPAPB t t đ đ x x (theo công thức 1.19) 310 7 6 159 207    0,331. 25 25 25 25 25 25 625 Ví dụ 1.33: Hai máy bay ném bom 1 mục tiêu. Mỗi máy bay ném 1 quả với xác suất trúng mục tiêu tương ứng là 0,7 , 0,8 và độc lập với nhau. Tìm xác suất để mục tiêu bị trúng bom. Giải: Gọi AA1, 2 lần lượt tương ứng là biến cố “máy bay thứ nhất và máy bay thứ hai ném trúng mục tiêu”. A là biến cố “mục tiêu bị đánh trúng”. Rõ ràng AAA 1  2 và AA1, 2 độc lập. Do đó PAPAAPAPAPAA()   1 2 1 2 1 2 PAPAPAPA 0,7 0,8 0,7.0,8 0,96 . 1 2 1 2 Ví dụ 1.34: Một hộp đựng 100 sản phẩm trong đó có 20 phế phẩm. Lấy ngẫu nhiên lần lượt và không hoàn lại 2 sản phẩm ở trong hộp. a. Tính xác suất sản phẩm lấy được lần đầu là phế phẩm. b. Tính xác suất sản phẩm lấy được lần thứ hai là phế phẩm biết rằng sản phẩm lấy lần đầu cũng là phế phẩm. c. Tính xác suất cả hai sản phẩm lấy được đều là phế phẩm. Giải: a. Gọi A1 là biến cố sản phẩm lấy được lần đầu là phế phẩm, ta có 20 PA( ) 0,2 . 1 100 b. Gọi A2 là biến cố sản phẩm lấy được lần thứ hai là phế phẩm. Vậy xác suất sản phẩm lấy được lần thứ hai là phế phẩm biết rằng sản phẩm lấy lần đầu cũng là phế phẩm: 19 PAA( | ) 0,192 . 2 1 99 20 19 c. PAAPAPAA( ) ()(|)  0,0384 . 1 2 1 2 1 100 99 Ví dụ 1.35: Rút lần lượt ngẫu nhiên không hoàn lại 3 quân bài từ cỗ bài tú lơ khơ. Tính xác suất trong các trường hợp sau: a. Cả 3 quân bài rút được không phải là quân bích. 28
  26. Chương 1: Biến cố ngẫu nhiên và xác xuất b. Lần thứ nhất rút được không phải quân bích và lần thứ hai rút được quân bích. c. Hai lần đầu rút được không phải quân bích và lần thứ ba rút được quân bích. Giải: : Gọi AAA1,, 2 3 lần lượt tương ứng là biến cố lần thứ nhất, lần thứ hai và lần thứ ba rút được quân bài không phải là bích. a. Biến cố cả 3 quân bài rút được không phải là quân bích là AAA1 2  3 . Vậy xác suất cần tìm là PAAAPAPAAPAAA(1 2  3 ) ( 1 ) ( 2 | 1 ) ( 3 | 1  2 ) . 39 38 37 PA() , PAA( | ) , PAAA( | ) . 1 52 2 1 51 3 1 2 50 39 38 37 PAAA()    . 1 2 3 52 51 50 b. Xác suất lần thứ nhất rút được không phải quân bích và lần thứ hai rút được quân bích là 39 13 PAAPAPAA |  . 1 2 1 2 1 52 51 c. Xác suất hai lần đầu rút được không phải quân bích và lần thứ ba rút được quân bích là 39 38 13 PAAAPAPAAPAAA  | |    . 1 2 3 1 2 1 3 1 2 52 51 50 Tương tự ví dụ 1.12 và ví dụ 1.24 ta có thể biểu diễn các biến cố và xác suất tương ứng của phép thử rút liên tiếp 3 quân bài dưới dạng sơ đồ cây Không phải quân bích 37/50 Quân bích Không phải quân bích 13/50 38/51 Quân bích Không phải quân bích 13/51 39/52 Quân bích 13/52 Hình 1.2: Sơ đồ cây rút liên tiếp 3 quân bài Ví dụ 1.36: Một thủ kho có một chùm chìa khóa gồm 9 chiếc, bề ngoài chúng giống hệt nhau nhưng trong đó chỉ có đúng 2 chiếc mở được kho. Anh ta thử ngẫu nhiên từng chìa (chìa nào không trúng thì bỏ ra). Tính xác suất để đến lần thử thứ ba mới mở được kho. Giải: Ký hiệu Ai là biến cố “thử đúng chìa ở lần thứ i ”; i 1, ,8. Ký hiệu B là biến cố “đến lần thử thứ ba mới mở được kho”. 29
  27. Chương 1: Biến cố ngẫu nhiên và xác xuất Ta có BAAA 1  2  3 . Các biến cố này không độc lập, áp dụng công thức 1.18 ta có PAAAPAPAAPAAA 1 2  3 1 2 1 3 1  2 . Từ giả thiết ta có thể tính được 7 6 2 PA , PAA , PAAA 1 9 2 1 8 3 1 2 7 Do đó 7 6 2 1 PAAA    . 1 2 3 9 8 7 6 1.4.6 Công thức xác suất đầy đủ Định lý 1.3: Giả sử AAA1, 2 , , n là một hệ đầy đủ các biến cố, khi đó với mọi biến cố B (trong cùng phép thử) ta có n n PBPABPAPBA()()() i   i i (1.23) i 1 i 1 Ví dụ 1.37: Một túi đựng 4 bi trắng và 6 bi đen. Người thứ nhất lấy ngẫu nhiên từ túi 3 bi (không hoàn lại), người thứ hai lấy tiếp 2 bi. Tính xác suất để người thứ hai lấy được 1 bi trắng. Giải: Gọi lần lượt A0 , A1 , A2 , A3 là biến cố người thứ nhất lấy được 0, 1, 2, 3 bi trắng. Gọi B là biến cố người thứ hai lấy được 1 bi trắng. 3 1 2 2 1 3 C6 1 CC4 6 1 CC4 6 3 C4 1 Ta có: PA()0 3 , PA()1 3 , PA()2 3 , PA()3 3 . C10 6 C10 2 C10 10 C10 30 Ta có bảng tổng hợp của các kết quả sau khi người thứ nhất chọn ngẫu nhiên 3 bi: Biến cố Ak xảy ra A0 A1 A2 A3 Số bi màu trắng người thứ nhất lấy được 0 1 2 3 Số bi màu trắng còn lại sau khi người thứ nhất lấy 4 3 2 1 Số bi màu đen còn lại sau khi người thứ nhất lấy 3 4 5 6 Từ đó ta tính được các xác suất có điều kiện 1 1 1 1 1 1 1 1 CC4 3 12 CC3 4 12 CC2 5 10 CC1 6 6 PBA()0 2 , PBA()1 2 , PBA()2 2 , PBA()3 2 . C7 21 C7 21 C7 21 C7 21 112 112 310 1 6 56 Vậy PB()     . 6 21 2 21 10 21 30 21 105 Ví dụ 1.38: Một người tham gia thi đấu cờ vua với một nhóm các đấu thủ chia làm ba loại: loại I chiếm 1/ 2 số đấu thủ, loại II chiếm 1/ 4 số đấu thủ và loại III chiếm 1/ 4 số đấu thủ còn 30
  28. Chương 1: Biến cố ngẫu nhiên và xác xuất lại. Xác suất anh ta thắng đấu thủ loại I là 0,3, thắng đấu thủ loại II là 0,4 và thắng đấu thủ loại III là 0,5. Anh ta thi đấu ngẫu nhiên với một trong các đấu thủ loại I, loại II hoặc loại III. Tính xác suất anh ta thắng cuộc. Giải: Gọi A1 , A2 , A3 lần lượt là biến cố anh ta thi đấu với một trong các đấu thủ thuộc loại I, loại II, hoặc loại III. Ta có PA(1 ) 0,5, PA(2 ) 0,25 , PA(3 ) 0, 25. Gọi B là biến cố anh ta đánh thắng, theo giả thiết ta có PBA( |1 ) 0,3; PBA( |2 ) 0, 4 ; PBA( |3 ) 0,5 . Áp dụng công thức xác suất đầy đủ (1.23) ta được PBPAPBAPAPBAPAPBA()()()() 1 1 2 2 3 3 0,5  0,3 0,25  0,4 0,25  0,5 0,375 . Ví dụ 1.39: Gieo xúc xắc. Nếu mặt 1 chấm hoặc 2 chấm xuất hiện ta gieo tiếp lần nửa và ngừng nếu ngược lại. Tính xác suất để tổng số chấm xuất hiện ít nhất là 5. Giải: Gọi Ak là biến cố lần gieo thứ nhất xuất hiện k chấm, ta có 1 PA() với mọi k 1,2,3,4,5,6 . k 6 Gọi B là biến cố tổng số chấm xuất hiện ít nhất là 5. Giả sử biến cố A1 xảy ra, khi đó tổng số chấm ít nhất là 5 khi kết quả của lần gieo thứ hai là 4 chấm, 5 chấm hoặc 6 chấm. Tương tự, nếu biến cố A2 xảy ra, khi đó tổng số chấm ít nhất là 5 khi kết quả của lần gieo thứ hai là 3, 4, 5 hoặc 6 chấm. Vậy 3 4 PBA( | ) , PBA( | ) 1 6 2 6 Nếu biến cố A3 , A4 , A5 hoặc A6 xảy ra thì dừng lại không gieo tiếp lần thứ hai, do đó PBAPBA( |3 ) ( | 4 ) 0, PBAPBA( |5 ) ( | 6 ) 1. Áp dụng công thức xác suất đầy đủ ta được 1 3 1 4 1 1 1 1 19 PB( )       0 0 1 1 . 6 6 6 6 6 6 6 6 36 1.4.7 Công thức Bayes Từ công thức (1.21) ta có PAPBAPABPBPAB()(|)k k ( k  ) ()(|) k . Dựa vào đẳng thức này ta được kết quả sau. Định lý 1.4: Giả sử AAA1, 2 , , n là một hệ đầy đủ các biến cố, khi đó với mọi biến cố B (trong cùng phép thử) sao cho P(B) 0 ta có công thức Bayes: 31
  29. Chương 1: Biến cố ngẫu nhiên và xác xuất PAPBAPAPBA()()k k k k P Ak B ; k 1,2, , n (1.24) PB() n  PAPBA()i i i 1 Ví dụ 1.40: Một nhà máy có ba phân xưởng I, II, III cùng sản xuất ra một loại sản phẩm. Phân xưởng I, II, III sản xuất tương ứng 36%, 34%, 30% sản lượng của nhà máy, với tỷ lệ phế phẩm tương ứng là 0,12; 0,1; 0,08. a. Tìm tỷ lệ phế phẩm chung của nhà máy. b. Lấy ngẫu nhiên một sản phẩm kiểm tra và đó là phế phẩm. Tính xác suất để phế phẩm đó là do phân xưởng I sản xuất. Giải: Lấy ngẫu nhiên một sản phẩm của nhà máy để kiểm tra. Gọi B là biến cố “sản phẩm kiểm tra là phế phẩm”. Gọi A1 , A2 , A3 lần lượt là biến cố sản phẩm lấy ra kiểm tra do phân xưởng I, II, III sản xuất. Theo giả thiết thì hệ 3 biến cố AAA1,, 2 3 đầy đủ (xem thêm ví dụ 1.14) và có các xác suất. PAPAPA 1 0,36; 2 0,34; 3 0,30. PBAPBAPBA 1 0,12; 2 0,10; 3 0,08. a. Xác suất của biến cố B cũng là tỉ lệ phế phẩm chung của nhà máy. Áp dụng công thức xác suất đầy đủ (1.23) ta có PBPAPBAPAPBAPAPBA 1 1 2 2 3 3 0,1012 b. Áp dụng công thức Bayes ta được PAPBA 1 1 0,36 0,12 PAB 1 0,427. PB 0,1012 Ví dụ 1.41: Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm có đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là p . Thiết bị có khả năng phát hiện đúng sản phẩm là phế phẩm với xác suất và phát hiện đúng sản phẩm đạt chất lượng với xác suất . Kiểm tra ngẫu nhiên một sản phẩm, tìm xác suất sao cho sản phẩm này: a. Được kết luận là phế phẩm. b. Được kết luận là đạt chất lượng thì lại là phế phẩm. c. Được kết luận là đúng với thực chất của nó. Giải: Gọi A là biến cố được kết luận là phế phẩm. Gọi H là biến cố “sản phẩm được chọn là phế phẩm”. Theo giả thiết ta có: P(),, H p P A H P A H  . 32
  30. Chương 1: Biến cố ngẫu nhiên và xác xuất a. Áp dụng công thức đầy đủ của biến cố A với hệ đầy đủ HH,  ta có: PA( ) PHPAH ( ) PHPAH p (1 p )(1  ) . b. Biến cố sản phẩm kiểm tra được kết luận đạt chất lượng nhưng là phế phẩm là biến cố H với điều kiện A . Áp dụng công thức Bayes ta được PHAPHPAH  ( ) | p(1 ) PHA | . PAPA p(1 ) (1 p )  c. Biến cố kết luận là đúng với thực chất của nó là AH A H , có xác suất PAH  PAH  PHPAH( ) PHPAH p (1 p )  . Ta có thể biểu diễn kết quả dưới dạng cây biểu đồ như sau PAH( | ) 1  Kết luận là phế phẩm Chính phẩm P( H ) 1 p PAH( | )  P() H p PAH( | ) Phế phẩm Kết luận đúng với thực chất PAH( | ) 1 Hình 1.3: Sơ đồ cây xác suất đầy đủ Ví dụ 1.42: Giả sử hai biến cố A , B có xác suất PA( ) 2/ 5 , PB( ) 1/3 và P( AB ) 1/ 6 . Hãy tính a. PAB( | ) b. PAB() c. PAB() d. PBA( | ) . PAB( ) 1/ 6 1 Giải: a. PAB( | ) PB( ) 1/ 3 2 2 1 1 17 b. PABPAPBPAB()()()()  . 5 3 6 30 PBA( ) 1/ 6 5 2 5 7 c. PBAPABPAPBA(|) ()()(|).1  . PA()2/512 51230 33
  31. Chương 1: Biến cố ngẫu nhiên và xác xuất 2 7 . 1 PAB( ) 7 / 30 7 PBPAB( ) ( | )3 20 13 d. PAB( | ) PBA( | ) . PB() 2 /3 20 PA() 3 18 5 Ví dụ 1.43: Trước khi đưa sản phẩm ra thị trường người ta đã phỏng vấn ngẫu nhiên 200 khách hàng về sản phẩm đó và thấy có 34 người trả lời “sẽ mua”, 97 người trả lời “có thể sẽ mua” và 69 người trả lời “không mua”. Kinh nghiệm cho thấy tỷ lệ khách hàng thực sự sẽ mua sản phẩm tương ứng với những cách trả lời trên tương ứng là 70%, 30% và 1%. a. Hãy đánh giá thị trường tiềm năng của sản phẩm đó. b. Trong số khách hàng thực sự mua sản phẩm thì có bao nhiêu phần trăm trả lời “sẽ mua”. Giải: Gọi B là biến cố “người được phỏng vấn sẽ mua sản phẩm”. Gọi A1 , A2 , A3 lần lượt là 3 biến cố tương ứng với 3 cách trả lời của khách hàng được phỏng vấn: A1 - người đó trả lời “sẽ mua” A2 - người đó trả lời “có thể mua” A3 - người đó trả lời “không mua” 34 97 69 AAA,,  là một hệ đầy đủ các biến cố với xác suất tương ứng , , . 1 2 3 200 200 200 Các xác suất điều kiện PBA 1 0,7; PBA 2 0,3; PBA 3 0,01. a. Theo công thức xác suất đầy đủ 34 97 69 PB()  0,7  0,3  0,010,268 200 200 200 Vậy thị trường tiềm năng của sản phẩm đó là 26,8%. b. Theo công thức Bayes PAPBA()1 1 0,17 0,7 PAB 0, 444 44, 4% . 1 PB( ) 0,268 Nhận xét 1.5: Trong thực tế các xác suất PAPAPA(1 ), ( 2 ), , (n ) đã biết và được gọi là các xác suất tiền nghiệm. Sau khi quan sát biết được biến cố B xảy ra, các xác suất của Ak được tính trên thông tin này (xác suất có điều kiện P Ak B ) được gọi là xác suất hậu nghiệm. Vì vậy công thức Bayes còn được gọi là công thức xác suất hậu nghiệm. 1.5 DÃY PHÉP THỬ BERNOULLI Một phép thử có thể lặp lại độc lập và trong mỗi phép thử ta xét sự xuất hiện của biến cố A không đổi với P(A) p, (0 p 1) được gọi là phép thử Bernoulli. 34
  32. Chương 1: Biến cố ngẫu nhiên và xác xuất p là xác suất thành công trong mỗi lần thử. Một dãy lặp lại cùng một phép thử Bernoulli được gọi là dãy phép thử Bernoulli. Kí hiệu Hk là biến cố “ A xuất hiện ra đúng k lần trong n phép thử”. Đặt Pn (k ; p) P(H k ) . Định lý 1.4: Xác suất của biến cố “ A xuất hiện ra đúng k lần trong n phép thử” là: k k n k Pn (k ; p) Cn p (1 p) ; k 0,1, ,n . (1.25) k Chứng minh: Hk là tổng của Cn các biến cố xung khắc từng đôi nhận được bằng cách hoán vị các chữ A và A trong biến cố tích sau (xem nhận xét 1.1): AAAA       k lÇn n k lÇn Từ tính chất độc lập suy ra xác suất của mỗi biến cố dạng này bằng P( A  A  A   A ) pk (1 p ) n k   . k lÇn n k lÇn k k n k Vậy Pn (k ; p) Cn p (1 p) . Khi p và n không đổi thì xác suất Pn (;) k p phụ thuộc k và đạt giá trị lớn nhất thỏa mãn điều kiện sau. Định lý 1.5: Thực hiện một dãy n phép thử Bernoulli với xác suất thành công trong mỗi lần thử là p . Ta có các kết quả sau: (n k 1) p (i). P (k ; p) P (k 1; p) (1.26) n kq n (ii). Khi k tăng từ 0 đến n thì Pn (k ; p) mới đầu tăng sau đó giảm và đạt giá trị lớn nhất tại k m thoả mãn: (n 1)p 1 m (n 1) p (1.27) Như vậy, Pmax Pn (;) m p . Khi (n 1) p không nguyên thì m (n 1) p (là phần nguyên của (n 1) p ). . Khi (n 1) p nguyên thì m (n 1)p 1 hoặc m (n 1)p Pmax Pn (m 1; p) Pn (m; p) (1.28) n! p k q n k P (k ; p) k!(n k)! (n k 1) p Chứng minh: n , từ đó có (1.26). P (k 1; p) n! kq n p k 1q n k 1 (k 1)!(n k 1)! P (k ; p) (k 1)(1 p) (1.26) n . Do đó Pn (k 1; p) (n k) p 35
  33. Chương 1: Biến cố ngẫu nhiên và xác xuất P(;) k p (k 1)(1 p ) n 1 1(1)(1)k k p np kp k 1(1) n p . Pn ( k 1; p ) ( n k ) p Vậy: Pn (k ; p) Pn (k 1; p) khi k (n 1) p 1 Pn (k ; p) Pn (m ; p) , k ( n 1) p 1. và Pn (k ; p) Pn (k 1; p) khi k (n 1) p Pn (k ; p) Pn (m; p) , k ( n 1) p, trong đó m là số tự nhiên thỏa mãn (n 1)p 1 m (n 1) p . P( m 1; p ) (n 1)(1 p ) p ( n 1)(1 p ) p Khi m (n 1)p thì n 1 Pmpn (;) nnp (1)1 pn 1(1) npp Pn (m 1; p) Pn (m; p) . Định nghĩa 1.3: m xác định bởi công thức (1.27) hoặc (1.28) được gọi là số lần xuất hiện có khả năng nhất hay giá trị có khả năng xảy ra lớn nhất. Ví dụ 1.44: Bắn 7 viên đạn vào bia. Xác suất trúng đích của mỗi viên là 0,6 . Tìm xác suất trong các trường hợp sau: a. Có đúng 3 viên trúng bia. b. Có ít nhất 6 viên trúng bia. c. Có ít nhất 1 viên trúng bia. d. Tìm số viên đạn trúng bia có khả năng lớn nhất và tính xác suất tương ứng. Giải: Có thể xem bắn mỗi viên đạn vào bia là thực hiện một phép thử Bernoulli mà xác suất thành công của phép thử là xác suất bắn trúng bia, theo giả thiết là 0,6. Bắn 7 viên là thực hiện 7 lần phép thử. Vậy: a. Xác suất để có đúng 3 viên trúng bia là 3 3 4 PC7(3;0,6) 7 0,6 0,4 0,1935 . b. Xác suất để có ít nhất 6 viên trúng bia là 66 7 7 PPCC7(6;0,6) 7 (7;0,6) 7 0,6 0,4 7 0,6 0,1586 . c. Xác suất để có ít nhất 1 viên trúng bia là 00 7 7 1 PC7 (0;0,6) 1 7 0,6 0,4 1 (0,4) 0,998. d. (n 1) p (7 1)(0,6) 4,8. Vậy số viên đạn có khả năng trúng bia nhất là 4. 4 4 3 PC7(4;0,6) 7 0,6 0,4 0,2903. Ví dụ 1.45: Tín hiệu thông tin được phát đi 3 lần độc lập nhau. Xác suất thu được mỗi lần là 0.4. a. Tìm xác suất để nguồn thu nhận được thông tin đúng 2 lần. b. Tìm xác suất để nguồn thu nhận được thông tin đó. c. Nếu muốn xác suất thu được tin 0,9 thì phải phát đi ít nhất bao nhiêu lần. Giải: Có thể xem mỗi lần phát tin là một phép thử Bernoulli mà sự thành công của phép thử là nguồn thu nhận được tin, theo giả thiết xác suất thành công của mỗi lần thử là 0,4. Vậy: 36
  34. Chương 1: Biến cố ngẫu nhiên và xác xuất a. Xác suất để nguồn thu nhận được thông tin đúng 2 lần là 2 2 PC3(2;0,4) 3 0,4 0,6 0,288 . b. Xác suất để nguồn thu nhận được thông tin là 3 PP 1 3 (0;0,4) 1 0,6 0,784 . c. Xác suất để nguồn thu nhận được thông tin khi phát n lần là P 1 0,6 n . Vậy nếu muốn xác suất thu được tin 0,9 thì phải phát đi ít nhất n lần sao cho: n n lg 0,1 1 10,6 0,9 0,6 0,1 n 4,504 . Chọn n 5. lg0,6 1 0,778 1.6 NGUYÊN LÝ XÁC SUẤT LỚN, XÁC SUẤT NHỎ Biến cố không thể (biến cố ) có xác suất bằng 0. Một biến cố có xác suất gần bằng 0 vẫn có thể xảy ra khi thức hiện một số lớn các phép thử. Tuy nhiên qua thực nghiệm và quan sát thực tế, người ta thấy rằng các biến cố có xác suất nhỏ sẽ không xảy ra khi ta chỉ thực hiện một phép thử hay một vài phép thử. Từ đó ta thừa nhận nguyên lý sau đây, gọi là “Nguyên lý xác suất nhỏ”: Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng trong một phép thử biến cố đó sẽ không xảy ra. Khi tung đồng xu vẫn có khả năng đồng xu không xảy ra mặt sấp hoặc mặt ngửa mà ở trạng thái thẳng đứng. Tuy nhiên khả năng này rất khó xảy ra, vì vậy trong thực tế ta luôn giả thiết chỉ có hai khả năng là mặt sấp hoặc mặt ngửa xuất hiện. Chẳng hạn mỗi chiếc máy bay đều có một xác suất rất nhỏ bị xảy ra tai nạn. Nhưng trên thực tế ta vẫn không từ chối đi máy bay vì tin tưởng rằng trong chuyến bay ta đi sự kiện máy bay rơi không xảy ra. Hiển nhiên việc quy định một mức xác suất thế nào được gọi là nhỏ sẽ phụ thuộc vào từng bài toán cụ thể. Chẳng hạn nếu xác suất để máy bay rơi là 0,01 thì xác suất đó chưa thể được coi là nhỏ. Song nếu xác suất một chuyến tàu khởi hành chậm là 0,01 thì có thể coi rằng xác suất này là nhỏ. Mức xác suất nhỏ này được gọi là mức ý nghĩa. Nếu là mức ý nghĩa thì số  1 gọi là độ tin cậy. Khi dựa trên nguyên lý xác suất nhỏ ta khẳng định rằng: “Biến cố A có xác suất nhỏ (tức là PA() ) sẽ không xảy ra trên thực tế” thì độ tin cậy của kết luận trên là  . Tính đúng đắn của kết luận chỉ xảy ra trong 100  % trường hợp. Tương tự như vậy ta có thể đưa ra “Nguyên lý xác suất lớn”: “Nếu biến cố A có xác suất gần bằng 1 thì trên thực tế có thể cho rằng biến cố đó sẽ xảy ra trong một phép thử”. Cũng như trên, việc quy định một mức xác suất thế nào được gọi là lớn sẽ tùy thuộc vào từng bài toán cụ thể. CÂU HỎI ÔN TẬP VÀ BÀI TẬP CHƯƠNG 1 1.1 Ta có thể có hai không gian mẫu  các biến cố sơ cấp cho cùng một phép thử C ? Đúng Sai . 37
  35. Chương 1: Biến cố ngẫu nhiên và xác xuất 1.2 Các biến cố A và A B luôn xung khắc. Đúng Sai . 1.3 Hai biến cố A và B là xung khắc thì P(A B) P(A) P(B). Đúng Sai . 1.4 Có thể xét tổng của 2 biến cố ứng với 2 phép thử khác nhau. Đúng Sai . 1.5 Hai biến cố xung khắc là hai biến cố độc lập. Đúng Sai . 1.6 Các biến cố đối của hai biến cố độc lập cũng là độc lập. Đúng Sai . 1.7 Xác suất của tổng hai biến cố độc lập bằng tổng xác suất của hai biến cố này. Đúng Sai . 1.8 Xác suất của tích 2 biến cố xung khắc bằng tích xác suất của 2 biến cố này. Đúng Sai . 1.9 Hệ 2 biến cố AA,  là hệ đầy đủ. Đúng Sai . 1.10 Cho  a,b,c,d trong đó các biến cố sơ cấp là đồng khả năng. Biến cố A a,b và B a,c là phụ thuộc vì chúng cùng xảy ra khi biến cố sơ cấp a xảy ra. Đúng Sai . 1.11 Trong thành phố có 5 hòm thư đều có đường liên lạc với nhau. Người bưu tá đi đưa thư theo một trình tự nào đó. Hỏi có bao nhiêu cách đi? 1.12 Trong một hòm đựng 10 chi tiết đạt tiêu chuẩn và 5 chi tiết là phế phẩm. Lấy đồng thời 3 chi tiết. Tính xác suất: a. Cả 3 chi tiết lấy ra thuộc loại đạt tiêu chuẩn. b. Trong số 3 chi tiết lấy ra có 2 chi tiết đạt tiêu chuẩn. 1.13 Một hộp có 10 bi màu đỏ, 30 trắng, 20 xanh và 15 vàng. Lấy ngẫu nhiên từ hộp 1 bi, tính xác suất bi lấy được trong các trường hợp sau: a. màu vàng hoặc đỏ b. không phải màu và không phải màu xanh c. màu trắng d. màu đỏ hoặc trắng hoặc xanh 1.14 Một hộp có 2 bi màu đỏ và 3 bi màu xanh. Lấy ngẫu nhiên từ hộp 2 bi, tính xác suất 2 bi lấy được trong các trường hợp sau: a. cả hai cùng màu xanh b. cả hai cùng màu đỏ c. 1 bi màu đỏ và 1 bi màu xanh 1.15 Thang máy của một tòa nhà 7 tầng xuất phát từ tầng một với 3 khách. Tìm xác suất để: a. Tất cả cùng ra ở tầng bốn. 38
  36. Chương 1: Biến cố ngẫu nhiên và xác xuất b. Tất cả cùng ra ở một tầng c. Mỗi người ra một tầng khác nhau. 1.16 Một người gọi điện thoại cho bạn nhưng lại quên mất 3 chữ số cuối và chỉ nhớ rằng chúng khác nhau. Tìm xác suất để người đó quay số một lần được đúng số điện thoại của bạn. 1.17 Ta kiểm tra theo thứ tự một lô hàng có 10 sản phẩm. Mỗi sản phẩm thuộc một trong hai loại: Tốt hoặc Xấu. Ký hiệu Ak ( k 1, ,10) là biến cố chỉ sản phẩm kiểm tra thứ k thuộc loại tốt. Biểu diễn các biến cố sau theo Ak : a. Cả 10 sản phẩm đều tốt. b. Có ít nhất một sản phẩm tốt. c. Có 6 sản phẩm kiểm tra đầu là tốt, các sản phẩm còn lại là xấu. d. Có 6 sản phẩm kiểm tra đầu là tốt. 1.18 Hai người cùng bắn vào một mục tiêu. Khả năng bắn trúng của từng người là 0,8 và 0,9. Tìm xác suất: a. Chỉ có một người bắn trúng mục tiêu. b. Có người bắn trúng mục tiêu. c. Cả hai người bắn trượt. 1.19 Cơ cấu chất lượng sản phẩm của nhà máy như sau: 40% là sản phẩm loại I, 50% là sản phẩm loại II, còn lại là phế phẩm. Lấy ngẫu nhiên một sản phẩm của nhà máy. Tính xác suất sản phẩm lấy ra không phải là phế phẩm. 1.20 Tín hiệu thông tin được phát đi 3 lần độc lập nhau. Xác suất thu được tin của mỗi lần phát là 0,4. Tính xác suất để thu được thông tin đó. 1.21 Có 1000 vé số trong đó có 20 vé trúng thưởng. Một người mua 30 vé, tìm xác suất để người đó trúng 5 vé. 1.22 Rút ngẫu nhiên 5 quân bài từ cỗ bài tú lơ khơ. Tính xác suất trong các trường hợp sau: a. Có 4 quân Át b. 4 quân Át và 1quân K c. 3 quân 10 và 2 quân J d. 10, J, Q, K và Át e. Đồng chất f. 10, J, Q, K, Át và đồng chất g. Có ít nhất 1 quân Át. 1.23 Tính xác suất rút lần lượt được 3 quân Át từ cỗ bài tú lơ khơ trong hai trường hợp sau: a. Rút có hoàn lại b. Rút không hoàn lại. 39
  37. Chương 1: Biến cố ngẫu nhiên và xác xuất 1.24 Một cỗ máy sản xuất 12.000 sản phẩm trong một ngày với tỉ lệ phế phẩm trung bình 3%. Chọn ngẫu nhiên 600 sản phẩm để kiểm tra, tính xác suất có 12 phế phẩm trong 600 sản phẩm này. 1.25 Để được nhập kho, sản phẩm của nhà máy phải qua 3 vòng kiểm tra chất lượng độc lập nhau. Xác suất phát hiện ra phế phẩm ở các vòng lần lượt theo thứ tự là 0,8; 0,9 và 0,99. Tính xác suất phế phẩm được nhập kho. 1.26 Một thủ kho có một chùm chìa khóa gồm 9 chiếc trông giống hệt nhau trong đó chỉ có một chiếc mở được kho. Anh ta thử ngẫu nhiên từng chìa khóa một, chiếc nào thử không đúng thì loại ra. Tính xác suất anh ta mở được cửa ở lần thử thứ 4. 1.27 Một lô hàng có 9 sản phẩm. Mỗi lần kiểm tra chất lượng lấy ngẫu nhiên 3 sản phẩm. Sau khi kiểm tra xong trả lại vào lô hàng. Tính xác suất để sau 3 lần kiểm tra lô hàng, tất cả các sản phẩm đều được kiểm tra. 1.28 Hai biến cố A , B có xác suất PA( ) 0,3, PAB( ) 0,65. Giả sử A , B độc lập nhưng không xung khắc. Tính PB(). 1.29 Giả sử hai biến cố A , B có xác suất PA( ) 1/ 2, PB( ) 1/3 và PAB( ) 1/ 4 . Hãy tính a. PAB( | ) b. PBA( | ) c. PAB() d. PAB() e. PAB() f. PBA( | ) g. PAB( | ) h. PAB() . 1.30 Chọn ngẫu nhiên lần lượt không hoàn lại 2 số từ các số 0,1, ,9. Tính xác suất số thứ hai chọn được là số 4. 1.31 Một lô hàng có 4 sản phẩm loại I và 5 sản phẩm loại II. Mỗi người lấy ngẫu nhiên 1 sản phẩm và không hoàn lại. Biết rằng người thứ hai lấy được sản phẩm loại I, tính xác suất người thứ nhất cũng lấy được sản phẩm loại I. 1.32 Một nhà máy có ba phân xưởng I, II, III cùng sản xuất ra một loại sản phẩm. Phân xưởng I, II, III sản xuất tương ứng 36%, 34%, 30% sản lượng của nhà máy, với tỷ lệ phế phẩm tương ứng là 0,12; 0,1; 0,08. a. Tìm tỷ lệ phế phẩm chung của nhà máy. b. Lấy ngẫu nhiên một sản phẩm kiểm tra và được sản phẩm là phế phẩm. Tính xác suất để phế phẩm đó là do phân xưởng I, II, III sản xuất. 1.33 Có bốn nhóm xạ thủ tập bắn. Nhóm thứ nhất có 5 người, nhóm thứ hai có 7 người, nhóm thứ ba có 4 người và nhóm thứ tư có 2 người. Xác suất bắn trúng đích của mỗi người trong nhóm thứ nhất, nhóm thứ hai, nhóm thứ ba và nhóm thứ tư theo thứ tự là 0,8; 0,7; 0,6 và 0,5. Chọn ngẫu nhiên một xạ thủ và biết rằng xạ thủ này bắn trượt. Hãy xác định xem xạ thủ này có khả năng ở trong nhóm nào nhất. 1.34 Bắn hai lần độc lập với nhau mỗi lần một viên đạn vào cùng một bia. Xác suất trúng đích của viên đạn thứ nhất là 0,7 và của viên đạn thứ hai là 0,4. Tìm xác suất để chỉ có một viên đạn trúng bia (biến cố A). Sau khi bắn, quan trắc viên báo có một vết đạn ở bia. Tìm xác suất để vết đạn đó là vết đạn của viên đạn thứ nhất. 40
  38. Chương 1: Biến cố ngẫu nhiên và xác xuất 1.35 Một trạm chỉ phát hai tín hiệu A và B với xác suất tương ứng 0.85 và 0.15 . Do có nhiễu trên đường truyền nên 1 7 tín hiệu A bị méo và thu được như tín hiệu B còn 1 8 tín hiệu B bị méo và thu được như A. a. Tìm xác suất thu được tín hiệu A. b. Giả sử đã thu được tín hiệu A. Tìm xác suất thu được đúng tín hiệu lúc phát. 1.36 Lô hàng có 3 sản phẩm loại I và 2 sản phẩm loại II, lô hàng thứ hai có 2 sản phẩm loại I và 5 sản phẩm loại II. Lấy ngẫu nhiên một sản phẩm từ một trong hai lô hàng này và đó là sản phẩm loại I. Tính xác suất sản phẩm loại I nhận được là từ lô hàng thứ nhất. 1.37 Một nhà máy sản xuất một chi tiết của điện thoại di động có tỷ lệ sản phẩm đạt tiêu chuẩn chất lượng là 85%. Trước khi xuất xưởng người ta dùng một thiết bị kiểm tra để kết luận sản phẩm có đạt yêu cầu chất lượng hay không. Thiết bị có khả năng phát hiện đúng sản phẩm đạt tiêu chuẩn với xác suất là 0,9 và phát hiện đúng sản phẩm không đạt tiêu chuẩn với xác suất là 0,95. Tìm xác suất để 1 sản phẩm được chọn ngẫu nhiên sau khi kiểm tra: a. Được kết luận là đạt tiêu chuẩn. b. Được kết luận là đạt tiêu chuẩn thì lại không đạt tiêu chuẩn. c. Được kết luận đúng với thực chất của nó. 41
  39. Chương 2: Biến ngẫu nhiên CHƯƠNG 2: BIẾN NGẪU NHIÊN Trong chương này ta khảo sát các biến cố của đại lượng nhận các giá trị nào đó, khi các giá trị này thay đổi ta được biến ngẫu nhiên. Khái niệm biến ngẫu nhiên (còn được gọi là đại lượng ngẫu nhiên) và các đặc trưng của chúng là những khái niệm rất quan trọng của lý thuyết xác suất. Đối với biến ngẫu nhiên ta chỉ quan tâm đến vấn đề biến ngẫu nhiên này nhận một giá trị nào đó hoặc nhận giá trị trong một khoảng với xác suất bao nhiêu. Các biến ngẫu nhiên trong các phép thử khác nhau có thể có các phân bố xác suất như nhau, nghĩa là cùng quy luật phân bố xác suất. Phân bố xác suất của biến ngẫu nhiên X có thể được khảo sát thông qua hàm phân bố xác suất FX () x P X x . Khi ta biết qui luật phân bố xác suất của một biến ngẫu nhiên thì ta có thể tính các xác suất liên quan đến biến ngẫu nhiên này. Trường hợp biến ngẫu nhiên chỉ nhận các giá trị rời rạc thì hàm phân bố xác suất hoàn toàn được xác định bởi hàm khối lượng xác suất hoặc bảng phân bố xác suất, đó là bảng ghi các giá trị mà biến ngẫu nhiên nhận với xác suất khác không tương ứng. Đối với biến ngẫu nhiên nhận giá trị liên tục thì hàm phân bố xác suất có thể được xác định bởi hàm mật độ xác suất. Một số quy luật phân bố xác suất quan trọng sau: - Phân bố Bernoulli. Phân bố này thường gặp trong các bài toán xét sự xuất hiện của biến cố A nào đó trong phép thử mà xác suất xuất hiện là p . Trong thống kê ta sử dụng biến ngẫu nhiên này để biểu diễn dấu hiệu nghiên cứu có tính định tính trong đó tham số p là tần suất của tổng thể, ví dụ tỉ lệ cử tri bỏ phiếu cho ứng cử viên A nào đó, tỉ lệ phế phẩm của một lô sản phẩm, tỉ lệ nẩy mầm của lô hạt giống . - Phân bố nhị thức Phân bố này thường gặp trong dãy phép thử Bernoulli, là tổng của các biến ngẫu nhiên độc lập có phân bố Bernoulli. - Phân bố Poisson Phân bố này thường gặp trong bài toán về quá trình đếm sự xuất hiện biến cố A nào đó trong một khoảng thời gian xác định. Chẳng hạn: số cuộc gọi đến một tổng đài, số khách hàng đến 1 điểm phục vụ, số tai nạn (xe cộ), số các sự cố xảy ra ở một địa điểm trong một khoảng thời gian xác định nào đó. - Phân bố đều Phân bố đều trong một khoảng là phân bố xác suất của biến ngẫu nhiên liên tục và đồng khả năng lấy giá trị trong khoảng đó. Phân bố đều có ứng dụng rộng trong thống kê toán. Nó có ý nghĩa to lớn trong các bài toán sử dụng phương pháp phi tham số. - Phân bố chuẩn Phân bố chuẩn thường được gặp trong các bài toán về sai số khi đo đạc các đại lượng 42
  40. Chương 2: Biến ngẫu nhiên trong vật lý, thiên văn Trong thực tế, nhiều biến ngẫu nhiên tuân theo phân bố chuẩn hoặc tiệm cận chuẩn (định lý giới hạn trung tâm) chẳng hạn: trọng lượng, chiều cao của một nhóm người nào đó, điểm thi của thí sinh, năng suất cây trồng, mức lãi suất của một công ty, nhu cầu tiêu thụ của một mặt hàng nào đó - Phân bố “khi bình phương” Phân bố “khi bình phương” được ứng dụng để kiểm định các giả thiết về xác suất của hệ đầy đủ. - Phân bố Student Trong thống kê phân bố chuẩn và phân bố Student được ứng dụng để giải quyết các bài toán về giá trị trung bình. Ngoài phương pháp sử dụng hàm phân bố để xác định biến ngẫu nhiên, trong nhiều trường hợp bài toán chỉ cần đòi hỏi khảo sát những đặc trưng cơ bản của biến ngẫu nhiên. Các đặc trưng của biến ngẫu nhiên được chia thành hai loại sau:  Các đặc trưng cho vị trí trung tâm, giá trị trung bình của biến ngẫu nhiên như: Kỳ vọng, Trung vị, Mốt.  Các đặc trưng cho độ phân tán của biến ngẫu nhiên như: Phương sai, Độ lệch chuẩn, Hệ số biến thiên, Hệ số bất đối xứng và Hệ số nhọn. Trong các bài toán thực tế kỳ vọng được sử dụng dưới dạng lợi nhuận kỳ vọng còn phương sai để tính mức độ rủi ro của quyết định. Trong kỹ thuật độ lệch chuẩn biểu diễn sai số của phép đo. Để học tốt chương này học viên phải nắm vững định nghĩa xác suất, biến cố và các tính chất của chúng đã được học ở chương 1. Các đặc trưng của biến ngẫu nhiên được xác định thông qua tính tổng của các số hạng nào đó (trường hợp biến ngẫu nhiên rời rạc) hoặc tính tích phân xác định (trường hợp biến ngẫu nhiên liên tục). Vì vậy học viên cần ôn tập về tổng của chuỗi và tích phân xác định. 2.1 ĐỊNH NGHĨA VÀ PHÂN LOẠI BIẾN NGẪU NHIÊN Gieo một con xúc xắc 6 mặt. Ký hiệu A1, A2 , A3 , A4 , A5 , A6 lần lượt là biến cố “mặt 1 chấm xuất hiện”, “mặt 2 chấm xuất hiện”, , “mặt 6 chấm xuất hiện”. Thay vì xét các biến cố như trên, ta xét đại lượng X là số chấm xuất hiện khi gieo con xúc xắc. Khi đó X có thể nhận các giá trị 1, 2, 3, 4, 5, 6 một cách ngẫu nhiên. X nhận giá trị k là biến cố Ak , nghĩa là X k Ak , với k 1,2, ,6 . Ta gọi X là một biến ngẫu nhiên có miền giá trị RX 1,2, ,6 . Một cách tổng quát ta có khái niệm biến ngẫu nhiên như sau. 2.1.1 Định nghĩa biến ngẫu nhiên Định nghĩa 2.1: Biến ngẫu nhiên X là đại lượng nhận các giá trị nào đó phụ thuộc vào các 43
  41. Chương 2: Biến ngẫu nhiên yếu tố ngẫu nhiên. Đăc biệt với mọi giá trị thực x  : “ X nhận giá trị nhỏ hơn bằng x ”, ký hiệu X x , là một biến cố ngẫu nhiên. Đối với biến ngẫu nhiên người ta chủ yếu quan tâm xem nó nhận một giá trị nào đó hoặc nhận giá trị trong một khoảng với một xác suất bao nhiêu. Tập hợp tất cả các giá trị của X được gọi là miền giá trị của X , ký hiệu RX . Ví dụ 2.1: Các đại lượng sau là biến ngẫu nhiên Tuổi thọ của một thiết bị đang hoạt động. Số khách hàng vào một điểm phục vụ trong khoảng thời gian nào đó. Số cuộc gọi đến một tổng đài trong khoảng thời gian nào đó. Sai số khi đo lường một đại lượng vật lý Định nghĩa 2.2: Hai biến ngẫu nhiên X , Y là độc lập nếu X nhận các giá trị nào đó không phụ thuộc Y và ngược lại. Nói cách khác với mọi số thực x, y hai biến cố X x , Y y độc lập. 2.1.2 Phân loại Để dễ dàng hơn trong việc nghiên cứu người ta chia các biến ngẫu nhiên thành hai loại:  Biến ngẫu nhiên rời rạc Biến ngẫu nhiên X là biến ngẫu nhiên rời rạc nếu nó chỉ nhận một số hữu hạn hoặc vô hạn đếm được các giá trị. Nghĩa là các giá trị của miền giá trị RX có thể liệt kê thành một dãy dạng x1, x2,  Biến ngẫu nhiên liên tục Biến ngẫu nhiên X là biến ngẫu nhiên liên tục nếu các giá trị của nó có thể lấp đầy một hoặc một số các khoảng hữu hạn hoặc vô hạn (như vậy miền giá trị RX là một khoảng hoặc hợp của một số khoảng hữu hạn hoặc vô hạn) và xác suất X nhận giá trị tại từng điểm đều bằng 0 (nghĩa là P X a 0 với mọi a). Ví dụ 2.2: Gọi X là số chấm xuất hiện khi gieo một con xúc xắc 6 mặt thì X là biến ngẫu nhiên rời rạc nhận các giá trị 1,2,3,4,5,6 . Gọi Y là tuổi thọ của một thiết bị đang hoạt động thì Y là biến ngẫu nhiên liên tục nhận giá trị trong một khoảng. Gọi Z là số khách hàng vào một điểm phục vụ trong khoảng thời gian nào đó, Z là biến ngẫu nhiên rời rạc nhận các giá trị 0,1,2, Số cuộc gọi đến một tổng đài trong khoảng thời gian nào đó là biến ngẫu nhiên rời rạc nhận các giá trị 0,1,2, Sai số khi đo lường một đại lượng vật lý Y nào đó là biến ngẫu nhiên liên tục nhận giá trị trong một khoảng. 44
  42. Chương 2: Biến ngẫu nhiên 2.2 PHÂN BỐ XÁC SUẤT CỦA BIẾN NGẪU NHIÊN Các biến ngẫu nhiên được xét trong các phép thử khác nhau (tương ứng với các không gian xác suất khác nhau) nhưng các quy luật phân bố xác suất của chúng có thể như nhau. Chẳng hạn xác suất bắn trúng bia của một xạ thủ là 0,8. Xạ thủ này bắn 10 viên, gọi X là số viên bắn trúng bia thì xác suất để xạ thủ bắn trúng k viên là k k10 k P X k C10(0,8) (0,2) , 0 k 10 (xem dãy phép thử Bernoulli 1.5). Tương tự, giả sử tỷ lệ chính phẩm của lô hàng là 0,8. Chọn 10 sản phẩm kiểm tra, gọi Y là số chính phẩm phát hiện được thì xác suất chọn được k chính phẩm là k k10 k P Y k C10(0,8) (0,2) , 0 k 10. Vậy P X k P Y k , với mọi k 0,1, ,10. Nói cách khác quy luật phân bố xác suất của X và Y như nhau, mặc dù X và Y là hai biến ngẫu nhiên được xét trong hai phép thử khác nhau. Quy luật phân bố xác suất được nghiên cứu thông qua hàm phân bố xác suất định nghĩa như sau. 2.2.1 Hàm phân bố xác suất Định nghĩa 2.3: Hàm phân bố xác suất (cumulative distribution function, viết tắt CDF) của biến ngẫu nhiên X là hàm số FX () x xác định với mọi x  bởi công thức: FX (); x P X x x (2.1) trong đó X x là ký hiệu biến cố “biến ngẫu nhiên X nhận giá trị nhỏ hơn hay bằng x ”. Hàm phân bố có các tính chất sau: a. 0 FX ( x ) 1 với mọi x  , (2.2) b. FX () x là hàm không giảm, liên tục bên phải. FXX()() a F a với FXX( a ) lim F ( x ) (2.3) x a, x a Nếu X là biến ngẫu nhiên liên tục thì FX () x là hàm liên tục. c. FXXXX( ) lim F ()0; x F ( ) lim F ()1 x , (2.4) x x d. P a X b FXX()() b F a . (2.5) e. P X a 1 FX ( a ) ; P X a FX () a với FXX( a ) lim F ( x ) (2.6) x a, x a Nhận xét 2.1: Một số tài liệu coi GX (); x P X x x là hàm phân bố của biến ngẫu nhiên X . Mỗi cách định nghĩa có thuận lợi riêng, tuy nhiên trong giáo trình này ta sử dụng hàm phân bố FX () x của biến ngẫu nhiên X theo công thức (2.1). Có một số khác biệt giữa hai định nghĩa này. Chẳng hạn tính chất liên tục phải của FX () x được thay bằng liên tục trái của GX () x , công thức (2.5) sẽ là P a X b GXX()() b G a 45
  43. Chương 2: Biến ngẫu nhiên 2.2.2 Hàm khối lượng xác suất và bảng phân bố xác suất của biến ngẫu nhiên rời rạc Biến ngẫu nhiên rời rạc có miền giá trị là một tập hữu hạn hoặc vô hạn đếm được. Phân bố xác suất của biến ngẫu nhiên chỉ tập trung tại các giá trị thuộc miền giá trị, ta gọi là hàm khối lượng xác suất của biến ngẫu nhiên và được định nghĩa như sau. Giả sử biến ngẫu nhiên rời rạc X có miền giá trị RX x1, x 2 ,  . Đặt pX () x P X x (2.7) Hàm pX () x được gọi là hàm khối lượng xác suất (probability mass function, viết tắt PMF) của biến ngẫu nhiên rời rạc X . Tính chất của hàm khối lượng xác suất pX () x : . pX( x k ) 0 với mọi xk R X (2.8) .  pX( x k ) 1 (2.9) xk R X . pX ( x ) 0 với mọi x RX (2.10) Hàm phân bố của X được xác định từ hàm khối lượng xác suất theo công thức: FX()() x P X x  p X x k (2.11) xk x; x k R X Nếu biến ngẫu nhiên rời rạc X nhận vô hạn các giá trị x1, x2, thì hàm phân bố xác suất có dạng: 0 nÕu x x1 FX () x (2.12) pX( x1 )  p X ( x k 1 ) nÕu x k 1 x x k ,  k 1 Nếu X chỉ nhận một số hữu hạn các giá trị x1, x 2 , , xn thì các biến cố X x1, X x 2 , , X xn (2.13) lập thành hệ đầy đủ các biến cố và hàm phân bố xác suất có dạng: 0 nÕu x x1 FX()()() x p X x1  p X x k 1 nÕu x k 1 x x k (2.14) 1 nÕu x xn Để trực quan hơn chúng ta biểu diễn hàm khối lượng xác suất của biến ngẫu nhiên rời rạc thông qua bảng phân bố xác suất. Đó là bảng có hai hàng, hàng trên ghi các giá trị của miền giá trị RX theo thứ tự tăng dần, hàng dưới là giá trị của hàm khối lượng xác suất tương ứng. Bảng phân bố xác suất của X có dạng sau: X x1 x2  p() x p() x P X 1 X 2  Ví dụ 2.3: Xét phép thử tung đồng thời 2 đồng xu (ví dụ 1.1). Không gian mẫu của phép thử là 46
  44. Chương 2: Biến ngẫu nhiên  (,SSSNNSNN ),(, ),( , ),( , ) gồm 4 kết quả đồng khả năng. Gọi X là số mặt sấp xuất hiện, khi đó X là một biến ngẫu nhiên rời rạc. Hàm khối lượng xác suất 0 nÕu x 0,1,2 pX ( x ) 1/ 4 nÕu x 0 hoÆc x 2 1/ 2 nÕu x 1 Bảng phân bố xác suất X 0 1 2 P 1/ 4 2 / 4 1/ 4 Hàm phân bố xác suất 0 nÕu x 0 1/ 4 nÕu 0 x 1 FX () x 3/ 4 nÕu 1 x 2 1 nÕu x 2 Đồ thị của hàm khối lượng xác suất và hàm phân bố F() x X pX () x 1 3/ 4 1/ 2 1/ 4 1/ 4 0 1 2 x 0 1 2 x ()a ()b Hình 2.1 Ví dụ 2.4: Chọn ngẫu nhiên 3 bi từ một túi có 6 bi đen, 4 bi trắng. Gọi X là số bi trắng trong 3 bi vừa chọn thì X là một biến ngẫu nhiên rời rạc. Tìm bảng phân bố xác suất và hàm phân bố xác suất. C3 5 CC2 1 15 Giải: PX 0 6 , PX 1 6 4 ,  3  3 C10 30 C10 30 CC1 2 9 C3 1 PX 2 6 4 , PX 3 4 .  3  3 C10 30 C10 30 Hàm khối lượng xác suất 47
  45. Chương 2: Biến ngẫu nhiên 5 15 9 1 p (0) , p (1) , p (2) , p (3) ; X 30 X 30 X 30 X 30 pX ( x ) 0 với mọi x khác 0,1,2,3. Bảng phân bố xác suất X 0 1 2 3 P 5/ 30 15/30 9 / 30 1/ 30 Hàm phân bố xác suất 0 nÕu x 0 5/ 30 nÕu 0 x 1 FX ( x ) 20 /30 nÕu 1 x 2 29 /30 nÕu 2 x 3 1 nÕu x 3 Đồ thị y 30/30 29/30 20/30 5 / 30 O 1 2 3 x Hình 2.2 Ví dụ 2.5: Mô hình giá trị tài sản nhị phân (Binomial Asset Pricing Model) Mô hình giá trị tài sản nhị phân là một công cụ hữu ích để hiểu được lý thuyết giá cả chứng khoán và lý thuyết xác suất. Chúng ta xét mô hình với thời gian rời rạc và ở mỗi bước chuyển, giá cổ phiếu thay đổi theo một trong hai giá trị có thể. Giả sử khởi điểm ta có giá trị S0 và hai hằng số dương d và u thỏa mãn 0 d u Khi đó trong chu kỳ tiếp giá cổ phiếu sẽ là dS0 hoặc uS0 . Thông thường chúng ta chọn d và u thỏa mãn 0 d 1 u . Như vậy giá cổ phiếu thay đổi từ S0 thành dS0 biểu thị 48
  46. Chương 2: Biến ngẫu nhiên sự vận động đi xuống và chuyển từ S0 thành uS0 biểu thị sự vận động đi lên. 1 Chẳng hạn xét trường hợp cụ thể d . u Trong thực tế sự vận động đi lên hoặc đi xuống không thể biết trước được và ta coi đó là hiện tượng ngẫu nhiên. Để mô phỏng mô hình này ta gieo đồng xu, nếu mặt sấp xuất hiện (biến cố S ) ta được giá cổ phiếu vận động đi lên và nếu mặt ngửa xuất hiện (biến cố N ) thì giá cổ phiếu giảm xuống. Ta ký hiệu giá cổ phiếu tại thời điểm 1 là S1. Vậy S1() S uS 0 và S1() N dS 0 . Tương tự, ta ký hiệu giá cổ phiếu tại thời điểm 2 là S2 : 2 S2()() SS uS 1 S u S 0 , S2()() SN dS 1 S duS 0 , 2 S2()() NS uS 1 N udS 0 , S2()() NN dS 1 N d S 0 , Gieo lần 1 Gieo lần 2 S2 ( SS ) 16 SS1( ) 8 S2 ( SN ) 4 S0 4 S2 ( NS ) 4 SN1( ) 2 S2 ( NN ) 1 Hình 2.3: Cây nhị phân của giá cổ phiếu với S0 4, u 1/ d 2 Tiếp tục ký hiệu giá cổ phiếu tại thời điểm 3 là S3 : 3 2 S3()() SSS uS 2 SS u S 0 , S3()() SSN dS 2 SS du S 0 , 2 2 S3()() SNS uS 2 SN u dS 0 , S3()() SNN dS 2 SN d uS 0 , 2 2 S3()() NSS uS 2 NS u dS 0 , S3()() NSN dS 2 NS d uS 0 , 2 3 S3()() NNS uS 2 NN ud S 0 , S3()() NNN dS 2 NN d S 0. Như vậy S1, S2 , S3 , là các biến ngẫu nhiên. Với trường hợp S0 4 , u 1/ d 2 ta có các bảng phân bố xác suất của S1, S2 , S3 49
  47. Chương 2: Biến ngẫu nhiên S1 2 8 S2 1 4 16 S3 1/2 2 8 32 P 1/2 1/2 P 1/4 2/4 1/4 P 1/8 3/8 3/8 1/8 2.2.3 Hàm mật độ phân bố xác suất của biến ngẫu nhiên liên tục Công thức (2.11) cho thấy hàm phân bố xác suất của biến ngẫu nhiên rời rạc có thể được xác định qua hàm khối lượng xác suất. Tuy nhiên xác suất của biến ngẫu nhiên liên tục lấy giá trị tại từng điểm bằng 0. Vì vậy đối với biến ngẫu nhiên liên tục ta không thể xét hàm khối lượng xác suất mà được thay bằng hàm mật độ xác suất. Dấu tổng của công thức 2.12 xác định hàm phân bố từ hàm khối lượng xác suất được chuyển thành dấu tích phân của hàm mật độ xác suất trong định nghĩa sau. Định nghĩa 2.4: Giả sử X là một biến ngẫu nhiên liên tục có hàm phân bố xác suất FX () x , nếu tồn tại hàm fX () x sao cho x , với mọi (2.15) FXX()() x f t dt x  thì fX () x được gọi là hàm mật độ xác suất của biến ngẫu nhiên X (probability density function, viết tắt PDF). Như vậy giá trị của hàm FX () x bằng diện tích hình phẳng giới hạn bởi đồ thị hàm mật độ xác suất fX () x , trục hoành và đường thẳng song song với trục tung có hoàng độ là x . Hàm phân bố FX () x là một nguyên hàm của hàm mật độ fX () x . fX () x FX () x x x Hình 2.4 Tính chất của hàm mật độ xác suất fX () x d 1. F()() x f x tại các điểm x mà f() x liên tục. (2.16) dx XX X 2. fX ( x ) 0 với mọi x  , (2.17) 3. , (2.18) fX ( x ) dx 1 b 4. . (2.19) PaXb  PaXb  PaXb  PaXb  fxdxX () a 50
  48. Chương 2: Biến ngẫu nhiên Nhận xét 2.2: Công thức 2.15 chỉ ra rằng hàm phân bố FX () x là một nguyên hàm của hàm mật độ fX () x , vì vậy khi biết hàm mật độ ta có thể tìm hàm phân bố bằng cách tính tích phân. Ngược lại công thức 2.16 cho phép tìm hàm mật độ xác suất từ hàm phân bố xác suất bằng cách lấy đạo hàm của hàm phân bố xác suất. Các ví dụ sau minh họa điều này. Ví dụ 2.6: Hàm phân bố xác suất của biến ngẫu nhiên liên tục X có dạng 0víi x 0 2 FX ( x ) kxvíi 0 x 1 1víi x 1 a. Xác định hệ số k ; b. Tìm hàm mật độ xác suất fX () x . Giải: a. Vì biến ngẫu nhiên X liên tục do đó hàm phân bố xác suất FX () x cũng liên tục. Xét tính liên tục của FX () x tại x 1 2 limFX ( x ) lim kx k x 1 x 1 k 1. FX (1) 1 b. Theo công thức (2.16) của hàm mật độ xác suất ta có 0víi x 0 d fXX( x ) F() x 2 xvíi 0 x 1 dx 0víi x 1 Ví dụ 2.7: Biến ngẫu nhiên liên tục X với hàm mật độ xác suất có dạng 0víi x 1 f() x k X víi x 1 2 x Hãy xác định: a. Hệ số k ; b. Hàm phân bố xác suất FX () x ; c. Tính xác suất PX 2 3 ; d. Thực hiện 4 lần phép thử độc lập biến ngẫu nhiên X , tính xác suất biến ngẫu nhiên X không lấy giá trị trong khoảng (2; 3) . k k a Giải: a. Theo tính chất (2.18) ta có 1 fX ( x ) dx dx lim k , từ đó k 1. 2 a x 1 x 1 b. Từ công thức (2.15) ta có x 0víi x 1 F()() x f t dt 1 XX 1 víi x 1 x 51
  49. Chương 2: Biến ngẫu nhiên c. Từ công thức (2.19) và (2.5) ta có 1 1 1 1 1 PXFF 2 3 XX (3) (2) 1 1 . 3 2 2 3 6 d. Theo kết quả c. ta suy ra xác suất để X không lấy giá trị trong khoảng (2;3) trong một 1 5 phép thử bằng 1 . 6 6 Vậy xác suất để trong 4 phép thử độc lập biến ngẫu nhiên X đều không lấy giá trị trong 4 5 khoảng (2;3) bằng 0,48. 6 2.3 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN Ngoài phương pháp sử dụng hàm phân bố để xác định biến ngẫu nhiên, trong nhiều trường hợp bài toán chỉ cần đòi hỏi khảo sát những đặc trưng cơ bản của biến ngẫu nhiên như: Kỳ vọng, phương sai, độ lệch chuẩn, phân vị, trung vị 2.3.1 Kỳ vọng 2.3.1.1 Định nghĩa Với mọi biến ngẫu nhiên X ta ký hiệu E X hoặc E X hoặc E X và xác định như sau: (i) Trường hợp X rời rạc với miền giá trị RX với hàm khối lượng xác suất pX() x k E()X  xk p X x k (2.20) xk R X (ii) Trường hợp X liên tục có hàm mật độ xác suất fX () x thì (2.21) E()X xfX x dx Nếu chuỗi (2.20) hội tụ tuyệt đối (trường hợp X rời rạc) hoặc tích phân (2.21) hội tụ tuyệt đối (trường hợp X liên tục) thì ta gọi E X là kỳ vọng của biến ngẫu nhiên X (expected value), trường hợp ngược lại ta nói X không tồn tại kỳ vọng. Kỳ vọng mang ý nghĩa là giá trị trung bình (average, mean value) của biến ngẫu nhiên X . Ví dụ 2.8: Tính kỳ vọng của biến ngẫu nhiên X cho ở ví dụ 2.4. 5 15 9 1 6 Giải: EX 0  1  2  3  . 30 30 30 30 5 Ví dụ 2.9: Theo thống kê việc một thanh niên 25 tuổi sẽ sống thêm trên một năm có xác suất là 0,992, xác suất để người đó chết trong vòng một năm tới là 0,008 (xem ví dụ 1.10). Một chương trình bảo hiểm kinh doanh bảo hiểm sinh mạng trong 1 năm cho thanh niên độ tuổi 25 với số tiền chi trả 1000 đô la, tiền mua bảo hiểm là 10 đô la. Hỏi lợi nhuận trung bình của công ty bảo hiểm nhận được trên mỗi khách hàng là bao nhiêu? Giải: Rõ ràng lợi nhuận là biến ngẫu nhiên X với 2 giá trị là 10 đô la (nếu người mua bảo hiểm không chết) và 990 đô la (nếu người mua bảo hiểm chết). Bảng phân bố xác suất 52
  50. Chương 2: Biến ngẫu nhiên tương ứng: X 990 10 P 0,008 0,992 Do đó kỳ vọng E X ( 990)  0,008 100,992 2 đô la. Ta thấy lợi nhuận trung bình là một số dương vì vậy công ty bảo hiểm có thể làm ăn có lãi. Ví dụ 2.10: Kỳ vọng của các biến ngẫu nhiên S1, S2 , S3 của ví dụ 2.5 1 1 1 2 1 25 1 1 3 3 1 125 ES 2  8  5; ES 1  4  16  ; ES  2  8  32  . 1 2 2 2 4 4 4 4 3 2 8 8 8 8 16 Ví dụ 2.11: Tuổi thọ của một loại côn trùng nào đó là một biến ngẫu nhiên X (đơn vị là tháng) với hàm mật độ xác suất như sau: kx2 (4 x ) nÕu 0 x 4 fX () x 0 nÕu ng­îc l¹i Tìm hàm phân bố xác suất và tìm tuổi thọ trung bình của loài côn trùng trên. 4 4 x3 x 4 64 3 Giải: Vì x2(4 x ) dx 4 k . Vậy hàm phân bố xác suất sẽ là 3 4 3 64 0 0 0 nÕu x 0 x 3x3 4 x FXX( x ) f ( t ) dt nÕu 0 x 4 64 3 4 1 nÕu x 4 Tuổi thọ trung bình: 4 3 4 3 x5 12 E X x3 (4 x)dx x4 (tháng). 64 64 5 5 0 0 2.3.1.2 Ý nghĩa của kỳ vọng Kỳ vọng mang ý nghĩa là giá trị trung bình mà biến ngẫu nhiên nhận được. Ta minh họa điều này trong trường hợp rời rạc sau. Giả sử biến ngẫu nhiên rời rạc X nhận các giá trị x1, x2 , , xm với các tần số tương ứng r1,r2 , ,rm . Khi đó ri xi là tổng giá trị X nhận được ứng với giá trị xi . r1x1 r2 x2  rm xm là tổng tất cả các giá trị X nhận được. Vậy giá trị trung bình của X r x r x  r x 1 1 2 2 m m n 53
  51. Chương 2: Biến ngẫu nhiên trong đó r1 r2  rm n . r Ký hiệu f i là tần suất nhận giá trị x của X . i n i Khi đó giá trị trung bình của X có thể viết lại r x r x  r x 1 1 2 2 m m f x f x  f x . n 1 1 2 2 m m Tần suất fi cũng chính là xác suất trường hợp X nhận giá trị xi . Chẳng hạn một nhân viên có thu nhập trong một năm như sau Tháng 1 2 3 4 5 6 7 8 9 10 11 12 Thu nhập (triệu đồng) 5 5 5 6 6 7 7 7 6 6 8 20 Như vậy nhân viên này có 3 tháng thu nhập 5 triệu, 4 tháng thu nhập 6 triệu, 3 tháng thu nhập 7 triệu, 1 tháng thu nhập 8 triệu và cuối năm được thưởng 20 triệu. Vậy tổng thu nhập cả năm S (5triÖu)  3 (6 triÖu)  4 (7 triÖu)  3 (8 triÖu)  1 (20 triÖu)  1 Thu nhập bình quân một tháng 3 4 3 1 1 S (5triÖu)  (6 triÖu)  (7 triÖu)  (8 triÖu)  (20 triÖu)  . 12 12 12 12 12 Trường hợp biến ngẫu nhiên liên tục phép tính tổng của giá trị trung bình được thay bằng phép tính tích phân xác định. Khái niệm kỳ vọng được áp dụng rộng rãi trong nhiều lĩnh vực. Trong kinh doanh và quản lý thì kỳ vọng được ứng dụng dưới dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng. Ví dụ 2.12: Giả sử một cửa hàng sách dự định nhập một số cuốn niên giám thống kê. Nhu cầu hàng năm về loại sách này được cho trong bảng phân bố xác suất sau: Nhu c ầu j (cu ốn) 20 21 22 23 24 25 Xác suất Pj 0,30 0,25 0,18 0,14 0,10 0,03 Cửa hàng mua với giá 7 USD/cuốn bán với giá 10 USD/cuốn. Song đến cuối năm phải hạ giá bán hết với giá 4 USD/cuốn. Cửa hàng muốn xác định số lượng cần nhập sao cho lợi nhuận kỳ vọng lớn nhất. Giải: Gọi i là số lượng sách dự định nhập, j là nhu cầu. Lúc đó lợi nhuận có điều kiện tương ứng được xác định bởi: 10j 7 i 4( i j ) nÕu j i 6 j 3 i nÕu j i Eij 10i 7 i nÕu j i 3 i nÕu j i Các giá trị E ij được cho trong bảng sau: 54
  52. Chương 2: Biến ngẫu nhiên Nhu cầu j j 20 21 22 23 24 25 i 20 60 60 60 60 60 60 Lượng Hàng 21 57 63 63 63 63 63 Nhập 22 54 60 66 66 66 66 i 23 51 57 63 69 69 69 24 48 54 60 66 72 72 25 45 51 57 63 69 75 Pj 0,3 0,25 0,18 0,14 0,10 0,03 Với mỗi số lượng nhập i , lợi nhuận trung bình được tính theo công thức EEi  P j ij . j Kết quả Số lượng nhập i (cuốn) 20 21 22 23 24 25 Lợi nhuận kỳ vọng Ei 60 61,2 60,9 59,52 57,3 54,48 Như vậy nếu cửa hàng nhập 21 cuốn thì lợi nhuận trung bình sẽ cao nhất. 2.3.1.3 Tính chất kỳ vọng 1) E(C) C với mọi hằng số C. (2.22) 2) E(CX) CE(X ) với mọi hằng số C. (2.23) 3) E(XXXX1  n ) E ( 1 )  E( n ) (2.24) 4) Cho hàm số ()x , xét biến ngẫu nhiên YX () thì  ()()()xi p X x i nÕu X rêi r¹c cã hµm khèi l­îng p X x i xi R X EY (2.25) (x)f(x)dx nÕu X liªn tôc cã hµm mËt đ é f ( x ) X Đặc biệt ta có các đẳng thức sau nếu tổng hoặc tích phân sau tương ứng hội tụ: x2 p()() x nÕu X rêi r¹c cã hµm khèi l­îng p x  i X i X i xi R X 2 E X (2.26) x2 f(x)dx nÕu X liªn tôc cã hµm mËt đ é f() x X 5) Nếu X1, , X n độc lập thì E()E()E()XXXX1n 1  n . (2.27) 55
  53. Chương 2: Biến ngẫu nhiên Ví dụ 2.13: Chọn ngẫu nhiên 3 bi từ một túi có 6 bi đen, 4 bi trắng. a. Nếu chọn được 1 bi trắng sẽ được thưởng 200$. Gọi Y là số tiền nhận được. Tính kỳ vọng của Y . b. Nếu chọn được 1 bi trắng sẽ được thưởng 200$ và chọn được 1 bi đen sẽ được thưởng 300$. Gọi Z là số tiền nhận được. Tính kỳ vọng của Z . Giải: a. Gọi X là số bi trắng trong 3 bi vừa chọn (xem ví dụ 2.4) thì Y (X) 200X là một biến ngẫu nhiên rời rạc có bảng phân bố sau: YX () 0 200 400 600 5/ 30 15/30 9 / 30 1/ 30 P 5 15 9 1 EY 0. 200. 400. 600. 240 $. 30 30 30 30 Mặt khác, theo công thức (2.23) và ví dụ 2.8 ta cũng được 6 EYX 200E 200. 240 $. 5 b. Z 200X 300(3 X) 900 100X . Áp dụng công thức 2.22, 2.23, 2.24 ta được 6 EZXX E900 100 900 100E 900 100  780$ . 5 2.3.2 Phương sai 2.3.2.1 Định nghĩa Phương sai (variance) hay độ lệch (deviation) bình phương trung bình của biến ngẫu nhiên X là đại lượng đo sự phân tán bình phương trung bình của X xung quanh giá trị trung 2 bình E X . Nói cách khác phương sai của X là kỳ vọng của XX E . Phương sai của X được ký hiệu D X hoặc Var X và xác định như sau DEEXXX 2 (2.28)  X DX được gọi là độ lệch chuẩn (deviation) của X . (2.29) 2 2 Ta có XXXXXX E 2 2E E Áp dụng các công thức 2.22, 2.23, 2.24 của kỳ vọng ta có thể tính phương sai theo công thức sau: DEEXXX 2 2 (2.29) Từ công thức (2.29) ta có công thức tính phương sai tương ứng với từng trường hợp rời rạc và liên tục: (i). Nếu X rời rạc với miền giá trị RX và hàm khối lượng xác suất pX() x k thì 56
  54. Chương 2: Biến ngẫu nhiên 2 E()X2 x 2 p x ; DX E X2 (E X ) 2 x 2 p ( x ) x p ( x ) (2.30)  i X i i X i  i X i xi R X xi R X x i R X (ii). Nếu X liên tục có hàm mật độ xác suất fX () x thì 2 E()X2 x 2 f x dx ; DX E X2 (E X ) 2 xfxdx 2 ( ) xfxdx ( ) (2.31) X XX Ví dụ 2.14: Tính phương sai của biến ngẫu nhiên xét trong ví dụ 2.9. Giải: EX 2 ( 990) 2  0,008 10 2  0,992 7940 . 2 2 DXXX E E 7940 4 7936  X DX 7936 89,08 . Điều này nói lên rằng mặc dù kinh doanh bảo hiểm có lãi nhưng rủi ro khá lớn. Ví dụ 2.15: Tính phương sai của biến ngẫu nhiên xét trong ví dụ 2.11. 4 3 4 3 4x5 x6 32 Giải: E X 2 x4 (4 x)dx 64 64 5 6 5 0 0 2 2 2 32 12 16 4 DEEXXX  X . 5 5 25 5 2.3.2.2 Ý nghĩa và ứng dụng thực tế của phương sai Phương sai của biến ngẫu nhiên X là độ lệch bình phương trung bình quanh giá trị trung bình E X . Trong kỹ thuật phương sai đặc trưng cho mức độ phân tán của các chi tiết gia công hay sai số của thiết bị. Trong quản lý và kinh doanh thì phương sai đặc trưng cho mức độ rủi ro của các quyết định. Ví dụ 2.9 cho thấy đầu tư bảo hiểm cho những người 25 tuổi là có lãi, nhưng ví dụ 2.14 cho thấy rủi ro của bảo hiểm rất lớn. Ví dụ 2.16: Một nhà đầu tư đang cân nhắc giữa việc đầu tư vào hai dự án A và B trong hai lĩnh vực độc lập nhau. Khả năng thu hồi vốn sau 2 năm (tính bằng % ) của hai dự án là các biến ngẫu nhiên có bảng phân bố sau: Dự án A X A 65 67 68 69 70 71 73 P 0,04 0,12 0,16 0,28 0,24 0,08 0,08 Dự án B XB 66 68 69 70 71 P 0,12 0,28 0,32 0,20 0,08 Từ các bảng phân bố xác suất trên ta tìm được 57
  55. Chương 2: Biến ngẫu nhiên EXXAA 69,16%; D 3,0944 ; EXXBB 68,72%; D 1,8016; Như vậy nếu chọn phương án đầu tư sao cho tỷ lệ thu hồi vốn kỳ vọng cao hơn thì chọn phương án A, song nếu cần chọn phương án có độ rủi ro thu hồi vốn thấp hơn thì chọn B. 2.3.2.3 Tính chất của phương sai 1) D(aX ) a2 D( X ) với mọi hằng số a . (2.32) 2) D(aX b ) a2 D( X ) với mọi hằng số a, b . (2.33) 3) Nếu X1, , X n độc lập có các phương sai hữu hạn thì 2 2 DDD a1 X 1  an X n a 1 X 1  a n X n . (2.34) Nói riêng: Nếu X ,Y độc lập và D,DXY hữu hạn thì DDD XYXY . Ví dụ 2.17: Tung con xúc xắc n lần. Tìm kỳ vọng của tổng số chấm thu được. Giải: Gọi X i (i 1, , n) là số chấm thu được ở lần tung thứ i , gọi X là tổng số chấm thu được n n trong n lần tung. Như vậy X  Xi . Theo công thức (2.24) ta có E X E Xi . i 1 i 1 Các biến ngẫu nhiên X i đều có bảng phân bố xác suất như sau Xi 1 2 3 4 5 6 P 1/ 6 1/ 6 1/ 6 1/ 6 1/ 6 1/ 6 1 7n 7 Do đó EXi 1 2 3 4 5 6 E X  E X i n . 6 2i 1 2 2 21 2 2 2 2 2 2 91 91 7 35 EXi 1 2 3 4 5 6 D X i . 6 6 622 12 n 35 Vậy DDX  Xi n . i 1 12 Ví dụ 2.18: Cho n biến ngẫu nhiên X i (i 1, , n) độc lập trong cùng một phép thử, có các kỳ vọng bằng nhau và các phương sai bằng nhau 2 EXXX1 E 2 E n  ; DXXX1 D 2 D n  XXX  Tìm kỳ vọng và phương sai của X 1 2 n . n XXXXXX1 2  n EEE 1 2  n n Giải: EEX  . n n n 2 2 XXXXXX1 2  n DDD 1 2  n n  DDX . n n2 n 2 n 58
  56. Chương 2: Biến ngẫu nhiên 2.3.3 Phân vị, Trung vị 2.3.3.1 Phân vị Phân vị mức của biến ngẫu nhiên X , ký hiệu v , là giá trị phân chia miền giá trị RX của X thỏa mãn P X v  P X v  (2.35) Nghĩa là FXX()() v F v (2.36) Trường hợp biến ngẫu nhiên X liên tục với hàm phân bố xác suất FX () x , phân vị v là điểm phân chia miền giá trị RX của X thành 2 miền với xác suất tương ứng là và 1 . Vậy v là nghiệm duy nhất của phương trình FX () x . 1 v FX () (2.37) Phân vị mức là giá trị tới hạn mức 1 (hình 2.5). (2.38) fX () x 1 v x Hình 2.5 Phân vị mức của biến ngẫu nhiên liên tục FX () x FX () x x xi xi 1 x i xi 1 x v m v xi 1 Hình 2.6: Phân vị mức của biến ngẫu nhiên rời rạc Trường hợp biến ngẫu nhiên X rời rạc có miền giá trị RX x1, x 2 ,  và hàm khối lượng xác suất: pX () x P X x 59