Giáo trình Xác suất thống kê (Phần 1)

pdf 59 trang ngocly 1150
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Xác suất thống kê (Phần 1)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_xac_suat_thong_ke_phan_1.pdf

Nội dung text: Giáo trình Xác suất thống kê (Phần 1)

  1. MỤC LỤC Lời nói đầu3 Phần I. Xác suất4 1 Biến cố và xác suất5 1.1 Bổ túc về giải tích tổ hợp 5 1.2 Phép thử ngẫu nhiên và biến cố 8 1.3 Xác suất của biến cố 11 1.4 Xác suất có điều kiện 17 1.5 Dãy phép thử Bernoulli 22 Hướng dẫn học viên tự học Chương 1 25 Bài tập 26 2 Đại lượng ngẫu nhiên và phân phối xác suất 29 2.1 Đại lượng ngẫu nhiên 29 2.2 Các số đặc trưng của đại lượng ngẫu nhiên 33 2.3 Một số phân phối xác suất quan trọng 39 2.4 Vectơ ngẫu nhiên 48 Hướng dẫn học viên tự học Chương 2 55 Bài tập 56 Phần II. Thống kê 60 3 Lý thuyết mẫu 61 3.1 Khái niệm mẫu và phương pháp lấy mẫu 61 3.1.1 Khái niệm mẫu 62 3.1.2 Các phương pháp lấy mẫu 62 3.2 Cách biểu diễn mẫu 63 3.2.1 Bảng tần số và bảng tần suất 63 3.2.2 Đa giác tần số và tổ chức đồ 64 3.3 Các đặc trưng của mẫu 65 3.3.1 Hàm phân phối mẫu 66 3.3.2 Trung bình mẫu 66 3.3.3 Phương sai mẫu và phương sai hiệu chỉnh mẫu 67 Hướng dẫn học viên tự học Chương 3 70 Bài tập 71 1
  2. 4 Ước lượng tham số 73 4.1 Ước lượng điểm 73 4.1.1 Định nghĩa 73 4.1.2 Ước lượng điểm cho kỳ vọng, xác suất và phương sai 74 4.2 Ước lượng khoảng 76 4.2.1 Khái niệm về khoảng tin cậy 76 4.2.2 Khoảng tin cậy cho giá trị trung bình 76 4.2.3 Khoảng tin cậy cho tỉ lệ 80 4.2.4 Độ chính xác của ước lượng 81 Hướng dẫn học viên tự học Chương 4 83 Bài tập 84 5 Kiểm định giả thiết 87 5.1 Các khái niệm cơ bản 87 5.1.1 Giả thiết thống kê 87 5.1.2 Tiêu chuẩn kiểm định giả thiết thống kê 88 5.2 Kiểm định giả thiết về giá trị trung bình và về tỉ lệ 89 5.2.1 Kiểm định giả thiết về giá trị trung bình 89 5.2.2 Kiểm định giả thiết về tỉ lệ 91 5.3 So sánh các giá trị trung bình và các giá trị tỉ lệ 93 5.3.1 So sánh hai giá trị trung bình 93 5.3.2 So sánh hai tỉ lệ 95 Hướng dẫn học viên tự học Chương 5 97 Bài tập 98 6 Hồi quy và tương quan 100 6.1 Hệ số tương quan mẫu 100 6.1.1 Mở đầu 100 6.1.2 Hệ số tương quan mẫu 100 6.2 Phương trình hồi quy bình phương trung bình tuyến tính 102 6.2.1 Phương trình hồi quy 102 6.2.2 Ước lượng hệ số hồi quy tuyến tính thực nghiệm 103 Hướng dẫn học viên tự học Chương 6 105 Bài tập 106 Tài liệu tham khảo 108 Các bảng số thông dụng 109 2
  3. LỜI NÓI ĐẦU Giáo trình này được viết dựa trên đề cương chi tiết học phần xác suất thống kê dành cho sinh viên các ngành khối A nói chung và các ngành Công nghệ nói riêng. Tác giả có điều chỉnh cho phù hợp với đối tượng người học là những người tốt nghiệp Trung học phổ thông. Giáo trình gồm 6 chương chia thành 2 phần. Phần 1 gồm 2 chương, trình bày các kiến thức cơ sở của lý thuyết xác suất. Trong chương 1, chúng tôi trình bày về một số khái niệm và tính chất mở đầu của lý thuyết xác suất: phép thử, biến cố, xác suất của biến cố, xác suất có điều kiện, tính độc lập của các biến cố, dãy phép thử Bernoulli, Các khái niệm và tính chất này sẽ được dùng nhiều ở các chương sau. Chương 2 trình bày các vấn đề liên quan đến đại lượng ngẫu nhiên và vectơ ngẫu nhiên: Khái niệm đại lượng ngẫu nhiên, các loại đại lượng ngẫu nhiên, hàm phân phối, bảng phân phối và hàm mật độ xác suất, các số đặc trưng của đại lượng ngẫu nhiên, Phần 2 gồm 4 chương, trình bày về những vấn đề cơ bản của thống kê ứng dụng. Cụ thể là Chương 3 trình bày về lý thuyết mẫu; Chương 4 trình bày về lý thuyết ước lượng; Chương 5 trình bày về lý thuyết kiểm định và Chương 6 trình bày về lý thuyết tương quan và hồi quy. Trong mỗi chương của phần này, chúng tôi đều đưa ra những ứng dụng của các vấn đề nêu ra vào việc giải quyết các vấn đề của thực tế. Cuối mỗi chương đều có hệ thống câu hỏi ôn tập và phần hướng dẫn học viên tự học. Tác giả xin cảm ơn các đồng nghiệp ở bộ môn Xác suất - Thống kê và Toán ứng dụng, Khoa Toán, Trường Đại học Vinh đã quan tâm động viên tác giả hoàn thành giáo trình này. Mặc dù tác giả đã rất cố gắng nhưng chắc chắn giáo trình vẫn còn nhiều khiếm khuyết, mong được sự góp ý của bạn đọc. Tác giả 3
  4. PHẦN I. XÁC SUẤT 4
  5. CHƯƠNG 1 BIẾN CỐ VÀ XÁC SUẤT 1.1 Bổ túc về giải tích tổ hợp Trong lí thuyết xác suất, nhiều khi phải tính số phần tử của một tập hợp. Giải tích tổ hợp cho ta một phương pháp tính số phần tử đó một cách nhanh chóng và chính xác. Trong mục này chúng tôi sẽ trình bày một số vấn đề cơ bản của giải tích tổ hợp được sử dụng nhiều trong các mục sau. Trước hết, chúng ta nghiên cứu quy tắc nhân và quy tắc cộng. Có nhiều cách trình bài các quy tắc này. Dưới đây là các trình bày mà theo chúng tôi là tương đối đơn giản và dễ vận dụng. 1.1.1 Quy tắc nhân Quy tắc. Giả sử một hành động có thể được thực hiện qua k bước liên tiếp. Bước 1 có thể được thực hiện bằng n1 cách, bước 2 có thể được thực hiện bằng n2 cách, bước k có thể được thực hiện bằng nk cách. Khi đó, số cách để thực hiện hành động đó là n = n1.n2 nk. Như vậy, khi một hành động có thể chia nhỏ thành nhiều bứơc, thì số cách thực hiện hành động đó bằng tích số cách thực hiện các bước. Ví dụ. 1. Một đội văn nghệ đã chuẩn bị được 2 vở kịch, 5 bài hát, 3 điệu múa. Hội diễn chỉ cho phép đội trình diễn một vở kịch, một bài hát, một điệu múa. Hỏi đội có bao nhiêu cách chọn chương trình biểu diễn của mình, biết rằng chất lượng các vở kịch, bài hát, điệu múa là như nhau. Giải. Việc chọn chương trình biểu diễn có thể được thực hiện qua 3 bước Bước 1: Chọn 1 vở kịch trong 2 vở kịch. Có 2 cách. Bước 2: Chọn 1 bài hát trong 5 bài hát. Có 5 cách. Bước 3: Chọn 1 điệu múa trong 3 điệu múa. Có 3 cách. Từ đó, áp dụng quy tắc nhân suy ra đội văn nghệ có n = 2.3.5 = 30 cách chọn chương trình biểu diễn. 2. Với các chữ số 1, 2, 3, 4, 5, có thể lập được bao nhiêu số chẵn gồm 4 chữ số khác nhau? Giải. Mỗi số cần tìm có dạng x = a1a2a3a4 với {a1, a2, a3, a4} ⊂ {1, 2, 3, 4, 5}. Muốn xác định x, ta phải chọn a1, a2, a3, a4 (4 bước). Vì x là số chẵn, nên ta chọn a4 trước, rồi chọn a1, a2, a3. 5
  6. Bước 1: Chọn a4 . Vì x là số chẵn, nên a4 = 2 hoặc a4 = 4. Có 2 cách chọn a4. Bước 2: Chọn a1. Vì a1 6= a4, nên có 4 cách chọn a1. Bước 3: Chọn a2. Vì a2 6= a4, a2 6= a1 nên còn 3 cách chọn a2. Bước 4: Chọn a3. Vì a3 6= a4, a3 6= a1 và a3 6= a2 nên còn 2 cách chọn a3. Từ đó, áp dụng quy tắc nhân suy ra số các số cần tìm là n = 2.4.3.2 = 48. 1.1.2 Quy tắc cộng Quy tắc. Giả sử các phần tử của một tập hợp có thể được chia thành k loại khác nhau; loại 1 có n1 phần tử, loại 2 có n2 phần tử loại k có nk phần tử. Khi đó số phần tử của tập hợp đó là n = n1 + n2 + ··· + nk. Dựa vào quy tắc cộng, ta có thể chuyển bài toán về tính số phần tử của một tập hợp phức tạp về các bài toán tính số phần tử của các tập hợp đơn giản hơn. Ví dụ. Có bao nhiêu số có các chữ số khác nhau được lập thành từ 4 chữ số 1, 2, 3, 4. Giải. Tập hợp các số cần lập có thể chia làm 4 loại Loại 1: Các số có 1 chữ sô. Có n1 = 4 số: 1, 2, 3, 4. Loại 2: Các số có 2 chữ sô khác nhau. Có n2 = 4.3 = 12 số. Loại 3: Các số có 3 chữ sô khác nhau. Có n3 = 4.3.2 = 24 số. Loại 4: Các số có 4 chữ sô khác nhau. Có n4 = 4.3.2.1 = 24 số. Từ đó, áp dụng quy tắc cộng, suy ra số các số cần tìm là n = 4 + 12 + 24 + 24 = 64. 1.1.3 Hoán vị Định nghĩa. Mỗi cách sắp xếp n phần tử cho trước theo một thứ tự nhất định gọi là một hoán vị của n phần tử đó. Kí hiệu số các hoán vị của n phần tử đã cho là Pn. Định lý. Số hoán vị của n phần tử là Pn = n!. Chứng minh. Mỗi hoán vị của n phần tử là kết quả của phép chọn gồm n bước. Bước 1: Chọn phần tử đầu tiên cho hoán vị. Có n cách chọn. Bước 2: Chọn phần tử thứ hai cho hoán vị. Có (n − 1) cách chọn. Bước k: Chọn phần tử thứ k cho hoán vị. Có (n − k + 1) cách chọn. Bước n: Chọn phần tử thứ n cho hoán vị. Có (n − n + 1) = 1 cách chọn. Do đó, theo qui tắc nhân, số hoán vị của n phần tử là Pn = n(n − 1) (n − k + 1) 1 = n!. Ví dụ. Giả sử một lớp có 25 sinh viên. Khi đó, số cách sắp xếp chỗ ngồi cho 25 sinh viên đó là P25 = 25!. 1.1.4 Chỉnh hợp Định nghĩa. Mỗi bộ sắp thứ tự gồm k phần tử khác nhau, lấy từ n phần tử đã cho gọi là một chỉnh hợp chập k của n phần tử đó (0 ≤ k ≤ n). 6
  7. k Ký hiệu số các chỉnh hợp chập k của n phần tử là An. Bằng lập luận tương tự như đối với hoán vị, ta được Định lý. Số chỉnh hợp chập k của n phần tử là n! Ak = = n(n − 1)(n − k + 1). n (n − k)! Ví dụ. Có bao nhiêu số khác nhau gồm 3 chữ số được lập từ 4 chữ số 1, 2, 3, 4? Giải. Mỗi số như vậy là một chỉnh hợp chập 3 của 4 phần tử. Do đó số các số như vậy là 4! A3 = = 4! = 24. 4 (4 − 3)! 1.1.5 Chỉnh hợp lặp Định nghĩa. Một bộ sắp thứ tự gồm k phần tử (không nhất thiết khác nhau) lấy từ n phần tử đã cho gọi là một chỉnh hợp lặp chập k của n phần tử đó (k ≥ 0). Như vậy, khác với chỉnh hợp, trong mỗi chỉnh hợp lặp, không đòi hỏi các phần tử phải khác nhau. Chẳng hạn tất cả các chỉnh hợp lặp chập 2 của 3 phần tử của tập M = {1, 2, 3} là (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3). ˜k Số các chỉnh hợp lặp chập k của n phần tử được kí hiệu là An. Định lý. Số các chỉnh hợp lặp chập k của n phần tử đã cho là ˜k k An = n . Chứng minh. Mỗi chỉnh hợp lặp chập k của n phần tử là kết quả của hành động chọn gồm k bước. Mỗi bước đều có n cách thực hiện (vì không đòi hỏi các phần tử phải khác nhau). Từ đó, theo qui tắc nhân, ta có ˜k k An = n.n n = n . Trong ví dụ trên, ta có n = 3, k = 2. Vậy số các chỉnh hợp lặp chập 2 của 3 phần tử là ˜2 2 A3 = 3 = 9. Ví dụ. Có bao nhiêu cách sắp xếp ngẫu nhiên 15 hành khách lên ba toa tàu? Giải. Mỗi cách sắp xếp như vậy là một chỉnh hợp lặp chập 15 của 3 phần tử. Do đó số cách sắp xếp là ˜3 15 A15 = 3 . 1.1.6 Tổ hợp Định nghĩa. Một tập con (không kể thứ tự) gồm k phần tử lấy từ n phần tử đã cho gọi là một tổ hợp chập k của n phần tử đó (0 ≤ k ≤ n). k Ký hiệu Cn là số các tổ hợp chập k của n phần tử đã cho. Định lý. Số tổ hợp chập k của n phần tử là Ak n! Ck = n = (quy ước 0! = 1). n k! k!(n − k)! 7
  8. Chứng minh. Mỗi tổ hợp chập k của n phần tử sinh ra k! chỉnh hợp chập k khác nhau của n phần tử đó (các chỉnh hợp này chỉ khác nhau ở thứ tự sắp xếp của các phần tử). Do đó ta có k k An = k!Cn. Suy ra Ak Ck = n . n k! Định lý được chứng minh. Từ công thức nêu trong định lý trên, dễ dàng suy ra các công thức sau đây k n−k Cn = Cn , k k−1 k Cn = Cn−1 + Cn−1. Ví dụ. Có bao nhiêu cách sắp xếp ngẫu nhiên 15 hành khách lên 3 toa tàu mà toa thứ nhất có đúng 3 hành khách? 3 Giải. Ta thấy có C15 cách lấy 3 trong 15 hành khách cho vào toa I. Số cách phân ngẫu nhiên 12 người còn lại lên hai toa kia là 212. Vậy số cách phân ngẫu nhiên 15 hành khách 3 12 lên 3 toa tàu mà toa I có đúng 3 hành khách là C15 · 2 . 1.1.7 Công thức nhị thức Newton Trên tập số thực, ta đã rất quen thuộc với các hằng đẳng thức (a + b)2 = a2 + 2ab + b2. (a + b)3 = a3 + 3a2b + 3ab2 + b3. Bằng qui nạp có thể chứng minh được công thức sau đây, gọi là công thức nhị thức Newton n n k k n−k (a + b) = Σk=0Cna b (∀a, b ∈ R). n n k Đặc biệt, với a = b = 1 ta có 2 = Σk=0Cn. n n−k k Với a = 1, b = -1 ta có 0 = Σk=0(−1) Cn. Nếu thay b bởi -b thì ta có công thức n n n−k k k n−k (a − b) = Σk=0(−1) Cna b (∀a, b ∈ R). 1.2 Phép thử ngẫu nhiên và biến cố 1.2.1 Tất nhiên và ngẫu nhiên Như ta đã biết, các hiện tượng trong tự nhiên và xã hội có thể được chia làm hai loại: tất nhiên và ngẫu nhiên. Hiện tượng tất nhiên là hiện tượng chắc chắn xảy ra khi có một họ điều kiện nào đó được thực hiện. Chẳng hạn, với điều kiện áp suất bình thường của khí quyển và nhiệt độ 1000C nước chắc chắn sôi; với điều kiện cho axít clohiđric (HCl) tác dụng với natri hiđrôxit (NaOH) chắc chắn xuất hiện muối ăn và nước Hiện tượng ngẫu nhiên là hiện tượng có thể xảy ra hoặc không xảy ra khi có một họ điều kiện nào đó được được thực hiện. Chẳng hạn, khi ta gieo một đồng tiền đối 8
  9. xứng, ta không thể biết được mặt sấp hay mặt ngửa sẽ xuất hiện. Như vậy, các hiện tượng " Mặt sấp xuất hiện" và "Mặt ngửa xuất hiện" là các hiện tượng ngẫu nhiên. Kết quả của một lần kiểm tra chất lượng sản phẩm, kết quả của một lần bắn bia cũng là những hiện tượng ngẫu nhiên. Tính bất định của sự xuất hiện của các hiện tượng ngẫu nhiên làm nẩy sinh nhu cầu nghiên cứu khả năng xuất hiện của chúng. Đây chính là một trong những nguyên nhân ra đời và phát triển của lý thuyết xác suất. 1.2.2 Phép thử ngẫu nhiên và không gian biến cố sơ cấp Để nghiên cứu các hiện tượng ngẫu nhiên, người ta thường phải tiến hành các phép thử ngẫu nhiên. Phép thử ngẫu nhiên là một hành động mà kết quả của nó là ngẫu nhiên, không thể dự báo trước được. Khi thực hiện phép thử ngẫu nhiên thì các kết quả của nó không thể xác định trước được. Tuy nhiên, ta có thể xác định được tập hợp tất cả các kết quả có thể có của nó. Tập hợp đó được gọi là không gian biến cố sơ cấp và được ký hiệu bởi chữ Ω. Mỗi phần tử ω của Ω sẽ được gọi là một biến cố sơ cấp (BCSC). Ví dụ. Khi tung một đồng tiền cân đối đồng chất ta không biết trước kết quả là xuất hiện mặt sấp (S) hay mặt ngửa (N). Tuy nhiên, có thể xác định được các kết quả có thể có là S và N. Vậy hành động tung đồng tiền là một phép thử ngẫu nhiên và không gian biến cố sơ cấp của phép thử này là Ω = {S, N}. Tương tự, hành động tung một con xúc xắc cân đối đồng chất, hành động kiểm tra ngẫu nhiên chất lượng sản phẩm của một nhà máy cũng là những phép thử ngẫu nhiên. 1.2.3 Biến cố Giả sử G là một phép thử ngẫu nhiên. Một sự kiện, mà việc xảy ra hay không xảy ra của nó phụ thuộc hoàn toàn vào kết quả của G, được gọi là một biến cố của G. Một BCSC ω của G được gọi là thuận lợi cho biến cố A nếu khi kết quả của G là ω thì A xảy ra. Ví dụ. Xét phép thử: Tung một con xúc xắc cân đối, đồng chất. Gọi Mi là biến cố “xuất hiện mặt i chấm", C là biến cố “xuất hiện mặt có số chấm chẵn", L là biến cố “xuất hiện mặt có số chấm lẻ". Vậy thì Không gian các BCSC là Ω = {M1,M2,M3,M4,M5,M6}. Tập hợp các BCSC thuận lợi cho C là {M2,M4,M6}. Tập hợp các BCSC thuận lợi cho L là {M1,M3,M5}. Nhận xét rằng một biến cố được xác định hoàn toàn với tập hợp các BCSC thuận lợi cho nó. Vì lí do đó, trong lí thuyết xác suất; người ta đồng nhất một biến cố với tập con của Ω gồm các BCSC thuận lợi cho biến cố đó. Chẳng hạn, trong ví dụ trên C = {M2,M4,M6} L = {M1,M3,M5} Như vậy, có thể hiểu nôm na là, các biến cố được tạo nên từ các BCSC. Các loại biến cố Một biến cố được gọi là biến cố không thể có, nếu nó không thể xảy ra khi phép thử được thực hiện. Như vậy không có BCSC nào của Ω thuận lợi cho biến cố không thể có. Do đó, biến cố không thể có được đồng nhất với tập ∅. Một biến cố được gọi là biến cố chắc chắn, nếu nó chắc chắn xảy ra khi phép thử được thực hiện. Mọi BCSC của phép thử đều thuận lợi cho biến cố chắc chắn. Do đó, biến cố chắc chắn được đồng nhất với toàn bộ tập Ω. 9
  10. Một biến cố được gọi là biến cố ngẫu nhiên, nếu nó có thể xẩy ra hoặc không xảy ra khi phép thử được thực hiện. Biến cố ngẫu nhiên thường được ký hiệu bởi các chữ in A, B, C . . Chẳng hạn, trong ví dụ trên Biến cố "Số chấm xuất hiện > 6" là biến cố không thể có (∅ ) Biến cố “Số chấm xuất hiện 6 6" là biến cố chắc chắn (Ω) Các biến cố C = {M2,M4,M6}} và L = {M1,M3,M5} là các biến cố ngẫu nhiên. 1.2.4 Quan hệ và phép toán giữa các biến cố Quan hệ thuận lợi. Ta nói biến cố A thuận lợi cho biến cố B nếu khi A xảy ra thì B xảy ra. Rõ ràng, A thuận lợi cho B khi và chỉ khi tập hợp các BCSC thuận lợi cho A là tập con của tập hợp các BCSC thuận lợi cho B. Do đó, nếu A thuận lợi cho B thì ta kí hiệu A ⊂ B Quan hệ bằng nhau. Hai biến cố A và B gọi là bằng nhau (hay tương đương) nếu A xảy ra khi và chỉ khi B xảy ra. Nói cách khác, A và B bằng nhau khi và chỉ khi A ⊂ B và B ⊂ A. Nếu A và B bằng nhau thì ta kí hiệu A = B. Hợp của các biến cố. Biến cố A được gọi là hợp của 2 biến cố B và C nếu A xảy ra khi và chỉ khi ít nhất một trong 2 biến cố B hoặc C xảy ra. Lúc đó ta có kí hiệu A = B ∪ C Tổng quát. Biến cố A được gọi là hợp của họ biến cố Ai(i ∈ I) nếu A xảy ra khi và chỉ khi ít nhất một trong các biến cố Ai(i ∈ I) xảy ra. Kí hiệu [ A = Ai. i∈I Giao các biến cố. Biến cố A được gọi là giao (tích) của 2 biến cố B và C nếu A xảy ra khi và chỉ khi B và C đồng thời xảy ra. Kí hiệu A = B ∩ C ( A = B.C). Tổng quát. Biến cố A được gọi là giao (tích) của họ các biến cố Ai, (i ∈ I) nếu A xảy ra khi và chỉ khi tất cả các Ai, (i ∈ I) đều xảy ra. Kí hiệu \ A = Ai (A = Πi∈I Ai). i∈I Hiệu các biến cố. Biến cố A được gọi là hiệu của biến cố B với biến cố C nếu A xảy ra khi và chỉ khi B xảy ra và C không xảy ra. Kí hiệu A = B\C. Các biến cố xung khắc. Hai biến cố A và B được gọi là xung khắc nếu chúng không thể đồng thời xảy ra. Nói cách khác, A và B được gọi là xung khắc nếu A.B = ∅. 10
  11. Biến cố đối lập. Biến cố A được gọi là biến cố đối lập của biến cố A nếu A xảy ra khi và chỉ khi A không xảy ra. Rõ ràng lúc đó ta có A = A, A = Ω\A, A = A. Họ đầy đủ các biến cố. Họ n biến cố H1,H2, , Hn được gọi là họ đầy đủ các biến cố nếu chúng thoả mãn đồng thời hai điều kiện sau 1. Chúng xung khắc với nhau đôi một. Tức là HiHj = ∅, (i 6= j) 2. Hợp của chúng là biến cố chắc chắn. Tức là H1 ∪ H2 ∪ Hn = Ω. Nói cách khác, H1,H2, , Hn là họ đầy đủ các biến cố nếu khi phép thử được thực hiện thì có một và chỉ một trong các biến cố đó xảy ra. Chẳng hạn nếu A là biến cố bất kì thì A và A lập thành một họ đầy đủ. Ví dụ. Hai người cùng bắn, mỗi người bắn một viên vào bia. Ai là biến cố “Người thứ i bắn trúng" (i = 1, 2). Vậy thì A1A2 là biến cố “cả hai người cùng bắn trúng". A1A2 ∪ A1A2 là biến cố “có đúng một người bắn trúng". A1A2 là biến cố “không ai bắn trúng". Họ đầy đủ các biến cố là: A1, A1 hoặc A1 A2, A1A2, A1A2, A1A2. Chú ý. Quan hệ và phép toán trên tập hợp các biến cố có tất cả các tính chất của quan hệ và phép toán trên các tập hợp. Chẳng hạn 1. (A ∪ B) ∪ C = A ∪ (B ∪ C), (AB)C = A(BC). 2.A(B ∪ C) = AB ∪ AC, (A ∪ B)C = AC ∪ BC. 3.AΩ = A, A ∪ Ω = Ω. 4.A ∪ ∅ = A, A∅ = ∅. S 5. (Công thức De-Morgan) i∈I Ai = Πi∈I Ai. 1.3 Xác suất của biến cố Nói chung, một biến cố có thể xảy ra hoặc không xảy ra khi phép thử được thực hiện. Do đó, nảy sinh nhu cầu đo lường khả năng xuất hiện của nó. Số biểu thị khả năng xuất hiện của biến cố A gọi là xác suất của biến cố đó và được kí hiệu là P(A). Có nhiều cách định nghĩa xác suất. Dưới đây sẽ trình bày một số định nghĩa quan trọng. 1.3.1 Định nghĩa xác suất cổ điển Định nghĩa. Giả sử không gian BCSC của phép thử có n BCSC có cùng khả năng xuất hiện; trong đó có m BCSC thuận lợi cho biến cố A. Khi đó, số m (A) = . P n được gọi là xác suất của biến cố A. Các biến cố có cùng khả năng xuất hiện được gọi là các biến cố đồng khả năng. 11
  12. Ví dụ. 1. Xét phép thử tung một con xúc xắc cân đối đồng chất. Rõ ràng 1 (C) = (L) = . P P 2 2. Một nhóm học tập có 10 học sinh trong đó có 7 học sinh yếu. Kiểm tra ngẫu nhiên 3 em. Tính xác suất để a. Cả 3 em được kiểm tra đều là học sinh yếu. b. Trong 3 em được kiểm tra có một học sinh yếu. c. Có ít nhất một học sinh yếu được kiểm tra. Giải. Gọi A, B, C là các biến cố nêu trong các câu a, b, c tương ứng. Số cách chọn 3 3 em trong 10 em là n = C10 3 a. Số cách chọn cả 3 em yếu là C7 . Do đó 3 C7 P(A) = 3 . C10 1 2 b. Số cách chọn 3 em trong đó có 1 em yếu là C7 C3 . Do đó 1 2 C7 C3 P(B) = 3 . C10 c. Chỉ có một cách chọn 3 em đều không học yếu. Do đó 3 C10 − 1 P(C) = 3 . C10 Chú ý. Trong định nghĩa xác suất cổ điển, đòi hỏi số BCSC của phép thử phải hữu hạn và các BCSC phải có cùng khả năng xuất hiện. Đòi hỏi này thường được thoả mãn trong các trò chơi may rủi, hoặc trong các phép thử mà việc chọn lựa là vô tư, ngẫu nhiên và các dụng cụ thử là cân đối, đồng chất. Nếu số BCSC là vô hạn, hoặc hữu hạn nhưng không đồng khả năng xuất hiện, thì cách tính xác suất cổ điển không còn đúng nữa. 1.3.2 Định nghĩa xác suất bằng tần suất Tần suất của một biến cố. Giả sử phép thử G có thể lặp đi lặp lại nhiều lần độc lập nhau; A là một biến cố của G. Thực hiện G n lần. Giả sử trong n lần đó, A xuất hiện kn(A) lần. Khi đó tỉ số k (A) f (A) = n n n được gọi là tần suất xuất hiện của biến cố A trong n phép thử. Có thể dễ dàng nhận thấy rằng tần suất có những tính chất sau đây 1. 0 6 fn(A) 6 1. 2. fn(Ω) = 1. 3. Nếu AB = ∅ thì fn(A ∪ B) = fn(A) + fn(B). Định nghĩa xác suất theo tần suất. Người ta nhận thấy rằng khi số phép thử tăng lên vô hạn, tần suất của fn(A) luôn dần tới một giới hạn xác định. Giới hạn đó được định nghĩa là xác suất của biến cố A và được ký hiệu là P(A). Trên thực tế P(A) được tính xấp xỉ bởi fn(A) với n đủ lớn. Chẳng hạn, khi tiến 12
  13. hành thí nghiệm tung đồng tiền nhiều lần, ta thấy tần suất xuất hiện mặt sấp (S) xấp xỉ 0,5. Do đó, ta định nghĩa P(S) = 0, 5. Định nghĩa xác suất bằng tần suất chỉ áp dụng được cho các phép thử ngẫu nhiên có thể lặp đi lặp lại nhiều lần độc lập nhau trong những điều kiện giống hệt nhau. Ngoài ra, ta chỉ có thể xác định được tương đối chính xác giá trị của xác suất khi tiến hành một số đủ nhiều các phép thử; mà điều này đôi khi không thể làm được vì hạn chế về thời gian và kinh phí. 1.3.3 Định nghĩa xác suất hình học Trong trường hợp không gian BCSC Ω của phép thử G có vô số BCSC có cùng khả năng xuất hiện và Ω có thể biểu diễn bởi một tập đo được thì ta có định nghĩa sau đây. Định nghĩa. Giả sử không gian BCSC Ω của phép thử có vô số BCSC có cùng khả năng xuất hiện và Ω được biểu diễn bởi một tập đo được HΩ. Khi đó nếu biến cố A được biểu diễn bởi một tập đo được HA thì số độ đo HA P(A) = độ đo HΩ được gọi là xác suất của biến cố A. Trong đó “tập đo được" là tập trên đường thẳng (mặt phẳng, không gian) có độ dài (diện tích, thể tích) còn “độ đo" của một tập là độ dài (diện tích, thể tích) của tập đó. Ví dụ. Hai người bạn hẹn gặp nhau trong khong thời gian từ 7 đến 8 giờ. Biết rằng khả năng họ đến điểm hẹn vào mọi thời điểm trong thời gian hẹn là như nhau. Ngoài ra; người đến trước đợi người đến sau đúng 20 phút, nếu không gặp sẽ bỏ đi. Tìm xác suất để 2 người gặp nhau. Giải. Gọi thời điểm đến điểm hẹn của người thứ nhất là x, của người thứ 2 là y (7 6 x 6 8, 7 6 y 6 8). Vậy thì có thể biểu diễn BCSC “người thứ nhất đến vào thời điểm x, người thứ 2 đến vào thời điểm y" bởi cặp số (x, y). Khi đó, không gian BCSC Ω được biểu diễn bởi hình vuông HΩ = {(x, y) : 7 6 x 6 8, 7 6 y 6 8}. Biến cố A =" 2 người gặp nhau" được biểu diễn bởi tập 1 H = {(x, y) ∈ H : |x − y| }, A Ω 6 3 1 ( 20 phút = giờ ). Vậy 3 2 d.tích HA 2 5 P(A) = = 1 − ( ) = . d.tích HΩ 3 9 1.3.4 Định nghĩa xác suất bằng phương pháp tiên đề Các định nghĩa xác suất trình bày ở trên có ưu điểm là khá trực quan và rất tiện lợi trong việc giải một số lớp bài toán ứng dụng cụ thể. Tuy nhiên, chúng đều có hạn chế là không tổng quát và cũng không thật chặt chẽ. Để khắc phục hạn chế này, năm 1933, nhà toán học Nga Kolmogorov đã xây dựng xác suất bằng một hệ tiên đề. Trước hết, chúng ta đề cập đến một số khái niệm liên quan. 13
  14. σ- đại số Giả sử Ω là một tập hợp bất kì khác rỗng. Một họ F gồm các tập con nào đó của Ω được gọi là một σ- đại số, nếu i. Ω ∈ F ii. Nếu A ∈ F thì Ω\A ∈ F ∞ iii. Nếu An ∈ F (n = 1, 2 ) thì ∪n=1An ∈ F. σ- đại số còn được gọi là σ-trường. Không gian đo và độ đo xác suất Giả sử Ω là một tuỳ ý khác rỗng, F là một σ-đại số các tập con của Ω. Khi đó, cặp (Ω, F) dược gọi là một không gian đo. Giả sử (Ω, F) gọi là một không gian đo. Một ánh xạ P : F → R được gọi là độ đo xác suất trên F nếu i. P(A) > 0 với ∀A ∈ F (tính không âm) ii. P(Ω) = 1 (tính chuẩn hoá) iii. Nếu An ∈ F (n = 1, 2, 3, ), Ai ∩ Aj = AiAj = ∅ (i 6= j) thì ∞ P∞ P(∪n=1An) = n=1 P(An) (tính cộng tính đếm được). Bây giờ, giả sử Ω là tập bất kỳ khác rỗng, F là một σ- đại số các tập con của Ω, P là độ đo xác suất trên F. Khi đó, bộ ba (Ω, F, P) được gọi là không gian xác suất. Tập Ω được gọi là không gian biến cố sơ cấp. σ- đại số F được gọi là σ- đại số các biến cố. Mỗi A ∈ F được gọi là một biến cố. Nếu A ∩ B = AB = ∅ thì A, B được gọi là các biến cố xung khắc. Biến cố Ω ∈ F gọi là biến cố chắc chắn. Biến cố ∅ ∈ F gọi là biến cố không thể có. Biến cố A = Ω\A được gọi là biến cố đối lập của biến cố A. Không gian xác suất (Ω, F, P) gọi là không gian xác suất đầy đủ nếu mọi tập con của biến cố có xác suất không đều là biến cố. Để đơn giản, từ nay về sau, khi nói đến không gian xác suất (Ω, F, P), ta luôn xem đó là không gian xác suất đầy đủ. Chú ý. Điều kiện (ii) trong định nghĩa trên đảm bảo rằng biến cố chắc chắn có xác suất bằng 1. Tuy nhiên, sau này ta sẽ gặp những biến cố có xác suất bằng 1 nhưng chưa chắc đã là biến cố chắc chắn. Những biến cố như vậy gọi là biến cố hầu chắc chắn. Ví dụ. 1. Giả sử G là một phép thử mà không gian BCSC Ω của nó gồm n BCSC có cùng khả năng xuất hiện. Gọi F là họ tất cả các tập con của Ω. Với mỗi A ∈ F đặt |A| (A) = P |Ω| Trong đó |A| là số phần tử của A. Rõ ràng P : F → R thoả mãn các tiên đề xác suất. Đây chính là định nghĩa xác suất cổ điển. Như vậy, trong mô hình cổ điển, mọi tập A ⊂ Ω đều là biến cố. 2. Giả sử G là một phép thử mà không gian các BCSC của nó có vô số BCSC có cùng khả năng xuất hiện và được biểu diễn bởi một tập đo được HΩ. Gọi F là họ tất cả các tập con đo được của HΩ. Mỗi H ∈ F đặt độ đo (H) P(H) = . độ đo (HΩ) 14
  15. Dễ thấy (Ω, F, P) lập thành một không gian xác suất. Bây giờ, giả sử A là một biến cố của phép thử. Nếu A được biểu diễn bởi tập đo được HA thì ta đặt P(A) = P(HA). Đây chính là định nghĩa xác suất hình học. 3. Giả sử Ω là một tập vô hạn đếm được Ω = (ω1, ω2, . . . , ωn, ) còn (pn) là một P∞ dãy số không âm thoả mãn điều kiện n=1 pn = 1. Gọi F là σ- đại số tất cả các tập con của Ω. Với mỗi A ∈ F đặt X P(A) = pi. ωi∈A Dễ thấy ánh xạ P : F → R xác định như trên là xác suất và (Ω, F, P) trở thành một không gian xác suất. Mô hình này được gọi là mô hình xác suất rời rạc. Như vậy, có nhiều cách định nghĩa xác suất thoả mãn tiên đề Kolmogorov. Vấn đề là ở chỗ cần định nghĩa xác suất sao cho phù hợp với thực tiễn khách quan. 1.3.5 Các tính chất của xác suất Giả sử A, B, C, . . . là những biến cố. Khi đó, xác suất của chúng có các tính chất sau 1. P(∅) = 0. Thật vậy, đặt A1 = Ω; An = ∅(∀n > 1). Khi đó, sử dụng (iii) ta được ∞ ∞ ∞ X X 1 = P(Ω) = P(∪n=1An) = P(An) = P(Ω) + P(An). n=1 n=2 Suy ra ∞ X P(An) = 0. n=2 Điều này, cùng với (i) cho ta P(∅) = P(An) = 0(∀n > 1). 2. Nếu AB = ∅ thì P(A ∪ B) = P(A) + P(B). Tính chất này là hệ quả trưc tiếp của tiên đề về tính cộng tính đếm được của độ đo xác suất và tính chất 1. 3. P(A) = 1 − P(A). Thật vậy, ta có A ∪ A = Ω,AA = ∅. Suy ra 1 = P(Ω) = P(A ∪ A) = P(A) + P(A). Nên P(A) = 1 − P(A). 4. Nếu A ⊂ B thì P(B\A) = P(B) − P(A) và do đó P(A) 6 P(B). Thật vậy B = A ∪ (B\A),A(B\A) = ∅. 15
  16. Nên P(B) = P(A) + P(B\A) > P(A). Suy ra P(B\A) = P(B) − P(A). 5. P(A ∪ B) = P(A) + P(B) − P(AB). Thật vậy, ta có A ∪ B = A ∪ (B\AB); A(B\AB) = ∅; AB ⊂ B. Suy ra P(A ∪ B) = P(A) + P(B\AB) = P(A) + P(B) − P(AB). n Pn P 6. P(∪k=1Ak) = k=1 P(Ak) − 1 k i n P(AkAi) P n−1 6 6 6 + (AkAlAm) − · · · + (−1) (A1A2 An). 16k6l6m6n P P Thật vậy, với n = 2, công thức trên chính là tính chất (5). Bằng phương pháp quy nạp toán học, sẽ chứng minh được kết quả cho trường hợp n > 2. ∞ P∞ 7. P(∪n=1An) 6 n=1 P(An). Thật vậy, đặt n−1 B1 = A1,B2 = A2\B1, ,Bn = An\ ∪k=1 Bk. Lúc đó ∞ ∞ ∞ ∞ X X P(∪n=1An) = P(∪n=1Bn) = P(Bn) 6 P(An). n=1 n=1 8. (Tính liên tục của xác suất) i. Nếu (An) là dãy đơn điệu tăng, A1 ⊂ A2 ⊂ An ⊂ , thì tồn tại ∞ lim (An) = (∪n=1An). n→∞ P P ii. Nếu (An) là dãy đơn điệu giảm, A1 ⊃ A2 ⊃ An ⊃ , thì tồn tại ∞ lim (An) = (∩n=1An). n→∞ P P Thật vậy, giả sử (An) là dãy tăng. Đặt n−1 B1 = A1,B2 = A2\B1, ,Bn = An\An−1 = An\ ∪k=1 Bk. Lúc đó n n ∞ ∞ ∪k=1Bk = ∪k=1Ak = An, ∪n=1Bn = ∪n=1An,Bi ∩ Bj = ∅. Suy ra ∞ ∞ P∞ n P(∪n=1An) = P(∪n=1Bn) = n=1 P(Bn) = limn→∞ P(∪k=1Bk) = limn→∞ P(An). Bây giờ giả sử (An) là dãy đơn điệu giảm. Vậy thì (An) là dãy đơn điệu tăng, nên theo (i) ta có ∞ ∞ ∞ lim (An) = (∪n=1An) = (∩n=1An) = 1 − (∩n=1An). n→∞ P P P P Suy ra limn→∞ P(An) = limn→∞(1 − P(An)) = 1 − limn→∞ P(An) ∞ ∞ = 1 − (1 − P(∩n=1An)) = P(∩n=1An). Đó là điều cần chứng minh. 16
  17. 1.4 Xác suất có điều kiện 1.4.1 Định nghĩa và ví dụ Trong thực tế, nhiều khi ta phải tính xác suất của một biến cố khi biết một biến cố khác đã xảy ra. Xác suất đó gọi là xác suất có điều kiện và được định nghĩa như sau. Định nghĩa 1. Giả sử A và B là các biến cố. Xác suất của B được tính với giả thiết A đã xảy ra được gọi là xác suất của B với điều kiện A và được kí hiệu là P(B/A). Xác suất của B với điều kiện A còn được gọi là xác suất có điều kiện của A đối với B. Ví dụ. Một lớp học có n học sinh, trong đó có m học sinh nữ (m 6 n). Trong m học sinh nữ đó có k em học yếu (k 6 m). Kiểm tra ngẫu nhiên một học sinh. Gọi A là biến cố “học sinh đó là nữ", B là biến cố “học sinh đó học yếu". Vậy thì rõ ràng P(B/A) là tỉ lệ học sinh nữ học yếu. Do đó k (B/A) = . P m Mặt khác, dễ dàng nhận thấy rằng m k (A) = , (B) = . P n P n Suy ra P(AB) P(B/A) = . P(A) Qua kiểm nghiệm thực tế, người ta nhận thấy công thức trên luôn luôn đúng. Điều này gợi ý cho ta đi đến định nghĩa sau Định nghĩa 2. Giả sử (Ω, F, P) là không gian xác suất. A, B ∈ F, P(A) > 0. Khi đó số P(AB) P(B/A) = (1) P(A) được gọi là xác suất của B với điều kiện A. Chú ý. 1. Nếu P(A) = 0 thì vẫn có P(B/A) nhưng không thể áp dụng công thức (1). 2. Tuỳ theo tình huống cụ thể mà có thể tính P(B/A) theo một trong hai định nghĩa trên. 1.4.2 Tính chất. 1. P(B/A) > 0. (Hiển nhiên). 2. Nếu B ⊃ A thì P(B/A) = 1. Đặc biệt P(Ω/A) = 1. Chứng minh. P(AB) P(A) B ⊃ A ⇒ AB = A ⇒ P(B/A) = = = 1. P(B) P(A) 3. Nếu (Bn) là dãy các biến cố đôi một xung khắc thì ∞ ∞ X P(∪n=1Bn/A) = P(Bn/A). n=1 17
  18. Chứng minh. Trước hết nhận xét rằng nếu (Bn) là dãy biến cố đôi một xung khắc thì (ABn) cũng là dãy biến cố đôi một xung khắc. Do đó ∞ ∞ ∞ P((∪n=1Bn)A) P(∪n=1(ABn)) P(∪n=1Bn/A) = = P(A) P(A) P∞ ∞ ∞ (ABn) X (ABn) X = n=1 P = P = (B /A). (A) (A) P n P n=1 P n=1 Từ(1)- (3) suy ra rằng, Nếu A là một biến cố, P(A) > 0 thì ánh xạ PA : F → R xác định bởi công thức PA(B) = P(B/A)(∀B ∈ F) cũng là xác suất trên F. 1.4.3 Quy tắc nhân Định lý. Giả sử A1,A2, , An (n > 2), là n biến cố bất kì sao cho P(A1A2 An−1) > 0. Khi đó P(A1A2 An) = P(A1).P(A2/A1) P(An/A1 An−1). (2) Chứng minh. Ta chứng minh quy nạp theo n. Ta có, với mọi A1,A2 ∈ F P(A1A2) P(A2/A1) = P(A1) Do đó P(A1A2) = P(A1).P(A2). Vậy (2) đúng với n = 2. Giả sử (2) đúng đến n = k ta chứng minh nó đúng đến n = k + 1. Giả sử Ai ∈ F; i = 1, 2, . . . , k, k + 1. Lúc đó P(A1A2 AkAk+1) = P[(A1A2 Ak)Ak+1] = P(A1A2 Ak).P(Ak+1/A1A2 Ak). Mặt khác, do giả thiết qui nạp P(A1A2 Ak) = P(A1).P(A2/A1) P(Ak/A1A2 Ak−1). Suy ra P(A1A2 AkAk+1) = P(A1).P(A2/A1) P(Ak+1/A1A2 Ak). Ví dụ. Một thủ kho có một chùm chìa khoá gồm 9 chiếc bề ngoài giống hệt nhau nhưng chỉ có 2 chìa mở được kho. Anh ta thử ngẫu nhiên từng chìa (chìa nào không mở được thì bỏ ra). Tìm xác suất để anh ta mở được cửa ở lần mở thứ 3? Giải. Gọi Ai là biến cố “thử đúng chìa ở lần thứ i". Ta phải tính P(A1A2A3). Áp dụng qui tắc nhân, ta có P(A1A2A3) = P(A1)P(A2/A1)P(A3/A1A2). 18
  19. Dễ thấy 7 6 2 (A ) = , (A /A ) = , (A /A A ) = . P 1 9 P 2 1 8 P 3 1 2 7 Do đó 7 6 2 1 (A A A ) = = . P 2 1 3 9 8 7 6 1.4.4 Công thức xác suất đầy đủ và công thức Bayes Định lý. Giả sử H1,H2, ,Hn là họ đầy đủ các biến cố và P(Hi) > 0,(∀i = 1, 2, . . . , n). Khi đó, với biến cố A bất kì, ta có Pn i) P(A) = i=1 P(A/Hi)P(Hi). ii) Nếu P(A) > 0 thì P(A/Hk)P(Hk) P(Hk/A) = Pn (k = 1, 2, . . . , n). i=1 P(A/Hi)P(Hi) Chứng minh. i) Ta có n n A = AΩ = A(∪i=1Hi) = ∪i=1AHi (AHi)(AHj) = A(HiHj) = A∅ = ∅ (i 6= j). Do đó n n n X X P(A) = P(A(∪i=1Hi)) = P(AHi) = P(A/Hi)P(Hi). i=1 i=1 P(AHk) P(A/Hk)P(Hk) ii) P(Hk/A) = = Pn . P(A) i=1 P(A/Hi)P(Hi) Công thức (i) gọi là công thức xác suất đầy đủ còn công thức (ii) gọi là công thức Bayes. Ví dụ. Trong một trường PTTH số học sinh các khối 10, 11, 12 tương ứng chiếm 40%, 35% và 25% tổng số học sinh của trường. Tỷ lệ học sinh yếu của khối lớp 10 là 25%, khối lớp 11 là 20% và của khối lớp 12 là 10%. Kiểm tra ngẫu nhiên một học sinh của trường a. Tính xác suất để em đó là học sinh yếu? b.Giả sử biết rằng em đó là học sinh yếu. Tính xác suất để em đó là học sinh khối 12? Giải. Kí hiệu A, H1,H2,H3 là các biến cố sau A “học sinh được kiểm tra là học sinh yếu" H1 “học sinh được kiểm tra là học sinh yếu khối 10". H2 “học sinh được kiểm tra là học sinh yếu khối 11". H3 “học sinh được kiểm tra là học sinh yếu khối 12". Khi đó H1,H2,H3 lập thành họ đầy đủ và P(H1) = 0, 4; P(H2) = 0, 35; P(H3) = 0, 25; P(A/H1) = 0, 25; P(A/H2) = 0, 2; P(A/H3) = 0, 1. Ta cần tính P(A) và P(H3/A). Áp dụng công thức xác suất đầy đủ, ta có P(A) = P(A/H1).P(H1) + P(A/H2).P(H2) + P(A/H3).P(H3) = 0, 25.0, 4 + 0, 2.0, 35 + 0, 1.0, 25 = 0, 195 = 19, 5%. 19
  20. (Đây chính là tỉ lệ học sinh yếu của trường!). Áp dụng công thức Bayes, ta có P(A/H3)P(H3) 0, 1.0, 25 P(H3/A) = = ≈ 0, 128 = 12, 8%. P(H3) 0, 195 (Điều này có nghĩa là số học sinh yếu của lớp 12 chiếm 12, 8% số học sinh yếu của trường!). 1.4.5 Tính độc lập của các biến cố Định nghĩa 1. Hai biến cố A và B được gọi là độc lập nếu P(AB) = P(A).P(B). Tính chất 1. A, B độc lập khi và chỉ khi P(A/B) = P(A) hoặc P(B/A) = P(B). Chứng minh. Giả sử A, B độc lập. Khi đó P(AB) = P(A)P(B). Mặt khác theo công thức nhân P(AB) = P(A/B).P(B) = P(B/A).P(A) Suy ra P(A/B) = P(A); P(B/A) = P(B). Ngược lại, giả sử chẳng hạn P(A/B) = P(A). Khi đó P(AB) = P(A/B)P(B) = P(A)P(B). Nhận xét. Qua chứng minh trên, ta thấy rằng hai đẳng thức P(A/B) = P(A) và P(B/A) = P(B) đều tương đương với định nghĩa độc lập và do đó tương đương với nhau. 2. Hai biến cố A và B độc lập khi và chỉ khi một trong các điều kiện sau thoả mãn i) A, B độc lập; ii ) A, B độc lập; iii) A, B độc lập. Chứng minh. Ta sẽ chứng minh trường hợp i) các trường hợp còn lại chứng minh tương tự. Giả sử A,B độc lập. Vậy thì P(AB) = P(B\AB) = P(B) − P(AB) = P(B) − P(A)P(B) = P (B)(1 − P(A)) = P(A)P(B). Do đó A, B độc lập Ngược lại nếu A, B độc lập thì P(AB) = P(B\AB) = P(B) − P(AB) = P(B) − P(A)P(B) = P(B)(1 − P(A)) = P(A)P(B). 20
  21. Do đó A, B độc lập. Ví dụ. 1. Tung đồng thời hai đồng tiền cân đối đồng chất. Gọi A là biến cố “Đồng thứ nhất sấp", B là biến cố “Đồng thứ hai ngửa". Ta sẽ chứng minh rằng A, B độc lập. Thật vậy, ta có Ω = {(S, S)(S, N)(N, S)(N, N)}, A = {(S, S)(S, N)} B = {(S, N)(N, N)} AB = {(S, N)}. Do đó 1 1 1 (AB) = = = (A). (B). P 4 2 2 P P Suy ra A, B độc lập. Rõ ràng kết quả này phù hợp với nhận thức trực quan của ta. 2. Hai người độc lập nhau cùng bắn vào một máy bay. Xác suất bắn trúng của người thứ nhất là 0,3; của người thứ hai là 0,2. Biết rằng máy bay sẽ rơi khi có ít nhất một người bắn trúng. Tìm xác suất để máy bay rơi? Giải. Gọi A là biến cố “người thứ nhất bắn trúng “ B là biến cố “người thứ hai bắn trúng “ C là biến cố “máy bay rơi". Vậy thì A, B độc lập và C = A ∪ B. Do đó P(C) = P(A ∪ B) = P(A) + P(B) − P(AB) = P(A) + P(B) − P(A)P(B) = 0, 3 + 0, 2 − 0, 2.0, 3 = 0, 44. Dưới đây sẽ trình bày khái niệm độc lập của một họ biến cố. Định nghĩa 2. Họ các biến cố (Ai)i∈I được gọi là độc lập đôi một nếu hai biến cố bất kỳ của họ đều độc lập. Họ các biến cố (Ai)i∈I được gọi là độc lập toàn cục (gọi vắn tắt là độc lập), nếu đối với mọi họ hữu hạn các biến cố Ai1 ,Ai2 , ,Ain của họ đó, ta đều có P(Ai1 Ai2 Ain ) = P (Ai1 )P(Ai2 ) P(Ain ). Một họ độc lập thì độc lập đôi một. Tuy nhiên điều ngược lại nói chung không đúng. Ví dụ sau đây của Bernstein chứng tỏ điều đó. Ví dụ. Cho một khối tứ diện đều đồng chất có ba mặt sơn ba màu trắng, xanh, vàng, còn mặt thứ tư sơn cả ba màu đó. Tung khối tứ diện đó lên mặt phẳng và chú ý đến mặt tiếp xúc với mặt phẳng. Gọi T là biến cố “xuất hiện màu trắng"; V là biến cố “xuất hiện màu vàng"; X là biến cố “xuất hiện màu xanh". Khi đó 2 1 (T ) = (X) = (V ) = = , (TV ) P P P 4 2 P 1 1 1 = (VX) = (XT ) = = . P P 4 2 2 Do đó họ các biến cố T, V, X độc lập đôi một. Tuy nhiên 1 (TVX) = 6= (T ) (V ) (X) = 1/8. P 4 P P P 21
  22. Cho nên họ trên không độc lập. Đối với dãy độc lập các biến cố, ta có tính chất quan trọng sau đây, gọi là Luật 0 − 1 Borel-Cantelli. Trong giáo trình này, ta công nhận và không trình bày chứng minh định lý. Định lý. (Luật 0 − 1 Borel-Cantelli) Giả sử (An, n ≥ 1) là dãy các biến cố. Khi đó P∞ i) Nếu n=1 P(An) < ∞ thì P(lim sup An) = 0. P∞ ii) Nếu n=1 P(An) = ∞ và (An) độc lập thì P(lim sup An) = 1. Trong đó ∞ ∞ lim sup An = ∩n=1 ∪k=n Ak. 1.5 Dãy phép thử Bernoulli 1.5.1 Định nghĩa và ví dụ Định nghĩa. Dãy n phép thử G1,G2, , Gn được gọi là dãy n phép thử Bernoulli đối với biến cố A, nếu i) Các kết quả của chúng độc lập với nhau. ii) Xác suất của biến cố A là P(A) = p như nhau đối với mỗi phép thử trong n phép thử này. Ví dụ. 1. Tung đồng tiền 10 lần và quan sát sự xuất hiện của mặt sấp. Đó là 10 phép thử Bernoulli đối với biến cố A “Xuất hiện mặt sấp". 2. Một người có 5 viên đạn, bắn từng viên một vào mục tiêu, đó là 5 phép thử Bernoulli đối với biến cố A “Viên đạn trúng mục tiêu". (Tuy nhiên nếu có 5 người, mỗi người bắn một viên vào mục tiêu thì nói chung đây không phải là 5 phép thử Bernoulli !). 1.5.2 Định lý Bernoulli. Khi thực hiện n phép thử Bernoulli. Biến cố A có thể xuất hiện 0 lần; 1 lần; ;n lần. Vậy xác suất để A xuất hiện k lần (0 6 k 6 n) là bao nhiêu? Bernoulli đã trả lời được câu hỏi đó trong định lý sau đây. Định lý.Giả sử xác suất xuất hiện biến cố A trong mỗi phép thử là P(A) = p. Khi đó xác suất để A xuất hiện k lần trong n phép thử Bernoulli là k n−k pn(k; p) = Cnpk(1 − p) (0 6 k 6 n). Chứng minh. Ký hiệu Ak là biến cố “A xuất hiện đúng k lần khi thực hiện n phép thử Bernoulli". Vậy thì Ak là hợp của các biến cố dạng (ω1, ω2, . . . , ωn), trong đó ω1 có thể là A hoặc A và A có mặt ở k vị trí, A có mặt ở (n − k) vị trí. Mỗi biến cố như vậy k được xác định hoàn toàn bởi k vị trí của A trong n vị trí. Do đó có Cn biến cố thuận lợi cho Ak. Do tính độc lập của các phép thử nên xác suất của mỗi biến cố là P(ω1)P(ω2) P(ωn) = (P(A)P(A) P(A))(P(A)P(A) P(A)) = pk(1 − p)n−k. Vậy k n−k P(Ak) = Cnpk(1 − p) . Chú ý. Trong nhiều trường hợp, ngoài việc tính xác suất để A xuất hiện k lần, ta còn phải tính xác suất để số lần xuất hiện A nằm giữa hai số k1 và k2 (0 6 k1 6 k2).Tức 22
  23. là tính xác suất của biến cố B: “Số lần xuất hiện A lớn hơn hoặc bằng k1 và nhỏ hơn hoặc bằng k2". Xác suất này thường được kí hiệu là pn(k1, k2, p). Rõ ràng B = ∪k2 A ,A A = ∅ (i 6= j). i=k1 i i j Suy ra k2 k2 X X k n−k pn(k1, k2, p) = P(B) = Ak = Cnpk(1 − p) . k=k1 k=k1 Ví dụ. Tung con xúc xắc 10 lần. Tìm xác suất để 1. Mặt 6 chấm xuất hiện 2 lần 2. Mặt 6 chấm xuất hiện không quá 2 lần Giải. 1 1 1 5 1. p = n = 10 k = 2 nên ta có p (2; ) = C2 ( )2( )8 6 10 6 10 6 8 1 1 5 2. p (0, 2; ) = P2 Ck ( )k( )10−k 10 6 k=0 10 6 6 5 1 5 1 5 = C0 ( )10 + C1 ( )( )9 + C2 ( )2( )8. 10 6 10 6 6 10 6 8 Chú ý.Khi n, k và (n − k) đều khá lớn thì việc tính pn(k; p) và pn(k1, k2; p) theo các công thức trên là rất nặng nề. Vì thế, trên thực tế, người ta thường dùng các công thức gần đúng sau đây 1 k − np p (k; p) ≈ √ ϕ( √ ), n npq npq k − np k − np p (k , k ; p) ≈ Φ( √2 ) − Φ( √1 ) n 1 2 npq npq với z z 1 −x2 Z 1 Z −t2 q = 1 − p ϕ(x) = √ e 2 , Φ(x) = ϕ(t)dt = √ e 2 dt. 2n −∞ 2n −∞ Các công thức trên được rút ra từ các định lý giới hạn. Các định lý này sẽ được nghiên cứu trong chương 3. 1.5.3 Số có khả năng nhất Định nghĩa. Số k0 thoả mãn điều kiện: pn(k0; p) = max pn(k; p) 16k6n được gọi là số có khả năng nhất. Như vậy k0 là số có khả năng nhất nếu trong các biến cố Ak “A xảy ra k lần" (k = 0, 1, 2, . . . , n) thì biến cố Ak0 “A xảy ra k0 lần" là biến cố có khả năng xảy ra nhất. Định lý. Nếu np − q nguyên thì k0 = np − q và k0 = np − q + 1. Nếu np − q không nguyên thì k0 = [p(n + 1)]. Chứng minh. Ta có k+1 k+1 n−k−1 pn(k + 1, p) Cn p q = k k n−k pn(k, p) Cnp q n! k!(n − k)! p n − k p = = . (k + 1)!(n − k − 1)! n! q k + 1 q 23
  24. Suy ra pn(k + 1; p) > pn(k; p) ⇔ (n − k)p > (k + 1)q ⇔ k < np − q pn(k + 1; p) = pn(k; p) ⇔ k = np − q pn(k + 1; p) < pn(k; p) ⇔ k < np − q Từ đây suy ra rằng Nếu np − q là số nguyên thì pn(k; p) đạt cực đại tại hai giá trị của k là k0 = np − q và k0 = np − q + 1 = np + p = (n + 1)p. Nếu np − q không nguyên thì pn(k; p) đạt cực đại tại giá trị của k0 là số nguyên nằm giữa np − q và np − q + 1. Tức là k0 = [np − q + 1] = [(n + 1)p]. Ví dụ . Trong một cuộc thi bắn quốc tế, mỗi xạ thủ bắn 60 viên vào bia. Xạ thủ Việt Nam bắn trúng tâm với xác suất 0,92. Tìm số viên trúng tâm có khả năng nhất và xác suất tương ứng? Giải. Ta có n = 60, p = 0, 92, np − q = 60.0, 92 − 0, 08 = 55, 12. Suy ra k0 = [np − q + 1] = [56, 12] = 56. 56 56 4 p60(56; 0, 92) = C60 (0, 92) (0, 08) . 24
  25. HƯỚNG DẪN HỌC VIÊN TỰ HỌC CHƯƠNG 1 Chương này trình bày những kiến thức cơ bản về tổ hợp, phép thử ngẫu nhiên và biến cố, xác suất của biến cố, xác suất có điều kiện. Để học tốt chương này yêu cầu người học phải nắm vững các kiến thức và kĩ năng sau. 1. Lý thuyết - Quy tắc cộng, quy tắc nhân, số các hoán vị, số các tổ hợp chập k của n phần tử, số các chỉnh hợp chập k của n phần tử. - Định nghĩa, khái niệm, tính chất của phép thử ngẫu nhiên và biến cố. - Các định nghĩa khác nhau về xác suất của biến cố và các tính chất cơ bản của nó. - Định nghĩa và tính chất của xác suất có điều kiện. Đặc biệt là công thức xác suất đầy đủ và công thức Bayes. - Định nghĩa, tính chất của dãy phép thử Bernoulli. 2. Bài tập - Vận dụng thành thạo các kiến thức về tổ hợp để tính xác suất của các biến cố, đặc biệt là theo định nghĩa cổ điển của xác suất. - Nắm bắt các tính chất của xác suất biến cố để chứng minh những đẳng thức, bất đẳng thức về xác suất của biến cố. - Sử dụng thành thạo công thức xác suất đầy đủ và công thức Bayes để tính xác suất của các biến cố. - Nhận diện được dãy phép thử Bernoulli và áp dụng tính xác suất của biến cố và tính số có khả năng nhất. 25
  26. BÀI TẬP 1. Gieo đồng thời hai con xúc xắc. Tìm xác suất để a) Tổng số nốt xuất hiện là 7 ; b) Tổng số nốt xuất hiện là 8 ; c) Số nốt xuất hiện hơn kém nhau 2. 2. Một khách sạn có 6 phòng đơn. Có 10 khách đến thuê phòng trong đó có 6 nam và 4 nữ. Người quản lý chọn ngẫu nhiên 6 người. Tính xác suất để trong đó a) Cả 6 người đều là nam ; b) Có 4 nam và 2 nữ ; c) Có ít nhất 2 nữ. 3. Một hòm có 9 tấm thẻ đánh số từ 1 đến 9. Chọn ngẫu nhiên ra hai tấm thẻ. Tính xác suất để tích của hai số trên hai tấm thẻ là một số chẵn. 4. Gieo n con xúc xắc. Tìm xác suất để a) Số nốt xuất hiện trên chúng là như nhau. b) Tổng số nốt xuất hiện bằng n + 1 c) Tổng số nốt xuất hiện bằng n + 2. 5. Chứng minh rằng, nếu A, B, C là các biến cố thì a) P(A4B) = P(A) + P(B) − 2P(AB), b) P(AB) + P(BC) + P(CA) > P(A) + P(B) + P(C) − 1, c) P(AB) + P(AC) − P(BC) 6 P(A), d) P(A4B) 6 P(A4C) + P(C4B), ở đây A4B = (A \ B) ∪ (B \ A). 6. Giả sử A, B là các biến cố. Chứng minh rằng a) P(A ∪ B)P(AB) 6 P(A)P(B) 1 b)| (AB) − (A) (B)| P P P 6 4 7. Giả sử A1, ,An,C là các biến cố, Chứng minh rằng P(A1 An|C) = P(A1|C)P(A2|A1C) P(An|A1 An−1C) nếu vế phải xác định. 8. Giả sử B1, ,Bn là họ đầy đủ các biến cố, C là biến cố thoả mãn điều kiện P(BiC) > 0 (i = 1, . . . n), A là biến cố bất kỳ. Chứng minh rằng n X P(A|C) = P(A|BkC)P(Bk|C). k=1 9. Giả sử A và B là các biến cố độc lập và P(A ∪ B) = 1. Chứng minh rằng hoặc A hoặc B có xác suất bằng 1. 10. Giả sử A và B là các biến cố độc lập. Chứng minh rằng nếu A ∩ B và A ∪ B độc lập thì hoặc P(A) = 0, hoặc P(B) = 0, hoặc P(A) = 1, hoặc P(B) = 1. 11. Giả sử A và B là các biến cố độc lập, P(A ∪ B) = P(A) + P(B), P(A4B) = p và P(A \ B) < p. Tính P(A), P(B), P(A \ B). 12. Các biến cố A, B và C độc lập và đều có xác suất khác 0 và khác 1. Chứng minh rằng các biến cố AB, BC và AC không độc lập đôi một, do đó không độc lập. 26
  27. 13. Giả sử A, B, C là các biến cố thoả mãn: A độc lập với BC và với B ∪ C; B độc lập với AC ; C độc lập với AB; A, B, C đều có xác suất dương. Chứng minh rằng A, B, C độc lập. 14. Giả sử ε > 0, hai biến cố A, B được gọi là hai biến cố ε-độc lập nếu |P(AB) − P(A)P(B)| 6 ε. Chứng minh rằng a) Nếu A, B là ε - độc lập, thì A, B và A, B cũng ε - độc lập. b) Nếu A là biến cố thoả mãn P(A) 6 ε hoặc P(A) > 1 − ε thì A là biến cố ε - độc lập với mọi biến cố B. c) Nếu biến cố A là biến cố ε - độc lập với chính nó thì hoặc P(A) 6 2ε hoặc P(A) > 1 − 2ε. 15. Ta có 10 hộp bi trong đó 4 hộp loại I, mỗi hộp có 3 bi trắng và 5 bi đỏ; 3 hộp loại II, mỗi hộp có 4 bi trắng, 6 bi đỏ; 3 hộp loại III, mỗi hộp 2 bi trắng, 5 bi đỏ. a) Rút hú hoạ một hộp và từ đó lấy ngẫu nhiên một bi. Tìm xác suất để được bi đỏ. b) Rút hú hoạ một hộp và từ đó lấy ngẫu nhiên một bi thì được bi trắng. Tìm xác suất viên bi đó rút ra từ hộp loại II. 16. Một nhà máy sản xuất bóng đèn có tỉ lệ bóng đèn đạt tiêu chuẩn là 90%. Trước khi xuất ra thị trường, mỗi bóng đèn đều được qua kiểm tra chất lượng. Vì sự kiểm tra không thể tuyệt đối hoàn hảo nên một bóng đèn tốt có xác suất 0, 8 được công nhận là tốt và một bóng đèn hỏng có xác suất 0, 95 bị loại bỏ. Hãy tính tỉ lệ bóng đạt tiêu chuẩn trong số bóng được công nhận là tốt. 17. Ta có 10 hộp bi trong đó 4 hộp loại I, mỗi hộp có 3 bi trắng và 5 bi đỏ; 3 hộp loại II, mỗi hộp có 4 bi trắng, 6 bi đỏ; 3 hộp loại III, mỗi hộp 2 bi trắng, 5 bi đỏ. a) Rút hú hoạ một hộp và từ đó lấy ngẫu nhiên một bi. Tìm xác suất để được bi đỏ. b) Rút hú hoạ một hộp và từ đó lấy ngẫu nhiên một bi thì được bi trắng. Tìm xác suất viên bi đó rút ra từ hộp loại II. 18. Có hai lô sản phẩm. Lô I có 10 sản phẩm loại I và 2 sản phẩm loại II. Lô 2 có 16 sản phẩm loại I và 4 sản phẩm loại II. Từ mỗi lô ta lấy ngẫu nhiên ra một sản phẩm. Sau đó trong 2 sản phẩm thu được ta lại lấy hú hoạ ra một sản phẩm. Tìm xác suất để sản phẩm lấy ra sau cùng là sản phẩm loại I. 19. Biết rằng tỷ lệ người mắc bệnh nào đó ở địa phưng là 2%. Người ta sử dụng một phản ứng mà nếu người bị bệnh thì phản ứng luôn luôn dương tính, nếu không bị bệnh thì phản ứng có thể dương tính với xác suất 0, 30. a) Tìm xác suất phản ứng dương tính. b) Tìm xác suất bị bệnh, không bị bệnh trong nhóm người có phản ứng dương tính. 20. Có 3 hộp phấn, trong đó hộp 1 chứa 20 viên tốt và 5 viên xấu, hộp 2 chứa 10 viên tốt và 5 viên xấu, hộp 3 chứa 5 viên tốt và 15 viên xấu. Ta gieo một con xúc xắc cân đối: Nếu xuất hiện mặt 1 chấm thì chọn hộp 1, nếu xuất hiện mặt 2 hoặc 3 chấm thì chọn hộp 2, nếu xuất hiện các mặt còn lại thì chọn hộp 3. Từ hộp được chọn đó lấy ngẫu nhiên ra 1 viên phấn. Tìm xác suất đó là viên phấn tốt. 21. Một lô hàng gồm a sản phẩm loại I và b sản phẩm loại II được đóng gói để gửi cho khách hàng. Nơi nhận kiểm tra thấy thất lạc một sản phẩm. Chọn ngẫu nhiên ra một sản phẩm thì thấy nó là sản phẩm loại I; tính xác suất để sản phẩm thất lạc cũng là sản phẩm loại I. 22. Theo kết quả điều tra về bệnh lao, tỷ lệ người bị lao ở vùng nọ là 0, 001. Tìm xác suất để khi khám cho 10 người: 27
  28. a) Không ai bị lao b) 5 người bị lao c) ít nhất 1 người bị lao d) Số người không bị lao có khả năng nhất. 23. Trong một cuộc thi bắn quốc tế, mỗi xạ thủ bắn 60 viên vào bia. Xạ thủ của Việt nam bắn trúng tâm với xác suất 0, 95. Tìm xác suất để a) Xạ thủ này bắn trúng tâm cả 60 viên b) Xạ thủ này bị trượt ngoài tâm 2 viên c) Xạ thủ này bị trượt ít nhất 1 viên d) Tìm số viên trúng tâm có khả năng nhất. Tinh xác suất tương ứng. 24.Trong một thành phố nào đó 65% dân cư thích xem đá bóng. Chọn ngẫu nhiên 12 người, hãy tính xác suất để trong đó có đúng 5 người thích xem đá bóng. 25. Một bài thi trắc nghiệm (multiple - choice test ) gồm 12 câu hỏi, mỗi câu hỏi có 5 câu trả lời, trong đó chỉ có một câu đúng. Giả sử mỗi câu trả lời đúng được 4 điểm và mỗi câu trả lời sai bị trừ một điểm. Một học sinh kém làm bài bằng cách chọn hú hoạ một câu trả lời cho mỗi câu hỏi. Tìm xác suất để a) Anh ta được 13 điểm b) Anh ta được điểm âm. 26. Hai đấu thủ chơi cờ ngang tài ngang sức thi đấu với nhau. Hỏi rằng khả năng nào cao hơn giữa hai khả năng: a) Thắng 2 ván trong 4 ván. b) Thắng 3 ván trong 6 ván. 28
  29. CHƯƠNG 2 ĐẠI LƯỢNG NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT 2.1 Đại lượng ngẫu nhiên 2.1.1 Đại lượng ngẫu nhiên rời rạc Định nghĩa. Một đại lượng nhận các giá trị bằng số, phụ thuộc vào kết quả của phép thử được gọi là đại lượng ngẫu nhiên. Một đại lượng ngẫu nhiên gọi là đại lượng ngẫu nhiên rời rạc nếu nó chỉ nhận một số hữu hạn hoặc đếm được giá trị. Đối với đại lượng ngẫu nhiên rời rạc, tập hợp tất cả các giá trị có thể có của nó có thể được liệt kê bằng một dãy hữu hạn hay vô hạn x1, x2, x3, . . . , xn, . Tập hợp các giá trị có thể có của đại lượng ngẫu nhiên X được kí hiệu là X(Ω). Ví dụ 1. Tung hai đồng tiền cân đôi đông chất. Gọi X là số mặt sấp xuất hiện. Khi đó X là đại lượng ngẫu nhiên rời rạc và X(Ω) = {0, 1, 2}. 2. Kiểm tra ngẫu nhiên 3 học sinh trong một nhóm gồm 4 em học khá và 5 em học trung bình. Gọi X là số em khá được khiểm tra. Khi đó X là đại lượng ngẫu nhiên rời rạc và X(Ω) = {0, 1, 2, 3}. Như vậy, mỗi đại lượng nhẫu nhiên là một đặc trưng về lượng nào đó của các biến cố. Bảng phân phối. Khi nghiên cứu về đại lượng ngẫu nhiên rời rạc X, ta cần biết tất cả các giá trị của nó cùng với các xác suất tương ứng. Các thông tin này được xác định tiện lợi trong một bảng gọi là bảng phân phối. Giả sử đại lượng ngẫu nhiên rời rạc X nhận các giá trị x1, x2, . . . , xn, với các xác suất tương ứng là P(X = xi) = pi (i = 1, 2, 3, . . . , n . . . ). Khi đó bảng có dạng X x1 x2 xn P p1 p2 pn P được gọi là bảng phân phối của X (chú ý rằng i pi = 1). Ví dụ. Tung hai đồng tiền cân đối đồng chất. Gọi X là số mặt sấp xuất hiện. Vậy thì Ω = {(S, N), (S, S), (N, S), (N, N)} X(Ω) = {0, 1, 2} 1 (X = 0) = (N, N) = ; P P 4 2 1 (X = 1) = ((S, N)(N, S)) = = ; P P 4 2 29
  30. 1 (X = 2) = (S, S) = . P P 4 Do đó, bảng phân phối của X là X 0 1 2 1 1 1 P 4 2 2 Chú ý. Trong các bài toán thực tế, các giá trị của đại lượng ngẫu nhiên thường gắn với các biến cố của phép thử. Khi đó, xác suất của các biến cố đó chính là xác suất của các giá trị tương ứng. 2.1.2 Hàm phân phối Định nghĩa. hàm phân phối của đại lượng ngẫu nhiên X hàm số F (x) = FX (x) xác định bởi công thức FX (x) = P(X 2 thì F (x) = P(X = 0) + P(X = 1) + P(X = 2) = 1 Vậy:  0 nếu x 6 0 1  nếu 0 2 Tính chất. 1. 0 6 F (x) 6 1. 30
  31. Tính chất này suy ra từ định nghĩa và tính chất tương ứng của xác suất. 2. Nếu a P(X 0 − ∞ 1 Khi đó, dễ dàng kiểm tra trực tiếp được rằng X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất là ( 0 nếu x 6∈ (0; 1) p(x) = 1 nếu x ∈ (0; 1) 2. Cho đại lượng ngẫu nhiên liên tục X có hàm mật độ  π 0 nếu x 6∈ [0; ] p(x) = π2 sin 2x nếu x ∈ [0; ]  2 Tìm hàm phân phối của X . Giải. Nếu x < 0 thì p(t) = 0 ∀t 6 x nên Z x F (x) = 0dt = 0 −∞ 31
  32. π Nếu 0 x thì 6 6 2 Z 0 Z x x − cos 2t 1 − cos 2x F (x) = 0dt + sin 2tdt = = −∞ 0 2 0 2 π Nếu x > thì 2 π π Z 0 Z Z x 2 2 − cos 2t F (x) = 0dt + sin 2tdt + 0dt = = 1 π 2 −∞ 0 2 0 Vậy  0 nếu x  2 Tính chất. Từ định nghĩa, suy ra 1. Với mọi a, b:−∞ 6 a < b 6 +∞ ta có Z b P(a < X < b) = p(x)dx. a R +∞ 2. −∞ p(x)dx = 1. 3. p(x) = F 0 (x) tại mọi điểm x mà p(x) liên tục. Chứng minh R b R a R b 1. P(a < X < b) = P(X < b) − P(X < a) = −∞ p(t)dt − −∞ p(t)dt = a p(t)dt R +∞ 2. −∞ p(x)dx = P(X < +∞) = 1 3. 0 F (x + ∆x) − F (x) P(x < X < x + ∆x) F+(x) = lim = lim ∆x→0⊕ ∆x ∆x→0⊕ ∆x R x+∆x p(t)dt = lim x = p(x) ∆x→0+ ∆x (theo định lý giá trị trung bình của tích phân). Tương tự 0 F−(x) = p(x). Suy ra F 0 (x) = p(x). 2.1.4. Các đại lượng ngẫu nhiên độc lập Định nghĩa. Hai đại lượng ngẫu nhiên X và Y gọi là độc lập nếu với mọi x, y ∈ R , ta có P(X < x, Y < y) = P(X < x)P(Y < y). Họ các đại lượng ngẫu nhiên (Xi)i∈I được gọi là độc lập đôi một nếu với mọi i, j ∈ I, i 6= j thì Xi và Xj độc lập. Từ định nghĩa suy ra rằng nếu X, Y là các đại lượng ngẫu nhiên rời rạc: X(Ω) = {x1, x2, . . . , xn, },Y (Ω) = {y1, y2, . . . , ym, }, 32
  33. thì X và Y độc lập khi và chỉ khi P(X = xi; Y = yj) = P(X = xi) · P(Y = yj) (i = 1, 2, . . . , n, . . . ; j = 1, 2, . . . , m, . . . .) Ví dụ. 1. Tung hai con xúc xắc. Gọi X là số chấm xuất hiện trên con xúc xắc thứ nhất; Y là số chấm xuất hiện trên con xúc xắc thứ 2. Khi đó X và Y độc lập. 2. Hai người độc lập nhau bắn vào một cái bia. Gọi X và Y lần lượt là số viên trúng của người thứ nhất và người thứ 2. Vậy thì X và Y cũng độc lập. 2.2 Các số đặc trưng của đại lượng ngẫu nhiên 2.2.1 Kỳ vọng Định nghĩa. Kỳ vọng của đại lượng ngẫu nhiên X là số EX xác định bởi công thức (P i xipi nếu X rời rạc và P(X = xi) = pi. EX = R +∞ −∞ xp(x)dx nếu X liên tục có hàm mật độ p(x). Ví dụ. 1. Cho X là đại lượng ngẫu nhiên rời rạc nhận n giá trị x1, x2, . . . , xn với xác suất như nhau 1 p = P (X = x ) = . i i n Khi đó x + x + ··· + x X = x p + x p + ··· + x p = 1 2 n . E 1 1 2 2 n n n 2. Cho X là đại lượng ngẫu nhiên liên tục có hàm mật độ là  0 nếu x 6∈ [a, b] p(x) = 1 (a < b.) nếu x ∈ [a, b] a − b Khi đó Z +∞ Z a Z b EX = xp(x)dx = xp(x)dx + xp(x)dx −∞ −∞ a Z +∞ Z b 2 b x x a + b + xp(x)dx = dx = = . b a b − a 2(b − a) a 2 3. Qua 2 ví dụ trên, ta có suy nghĩ rằng EX là giá trị trung bình (trung bình cộng) của đại lượng ngẫu nhiên. Song điều này không hoàn toàn chính xác. Chẳng hạn ta xét hai đại lượng ngẫu nhiên X 0 1 1 3 P 4 4 33
  34. Y 0 1 3 1 P 4 4 3 1 Khi đó X = , Y = . E 4 E 4 Ý nghĩa: Qua các ví dụ trên, ta thấy rằng kỳ vọng của đại lượng ngẫu nhiên X là giá trị trung bình theo xác suất của đại lượng ngẫu nhiên đó. Trong trường hợp X nhận các giá trị với xác suất như nhau thì kỳ vọng chính là trung bình cộng của nó. Tính chất. Kỳ vọng có các tính chất sau đây 1. Nếu X > 0 thì EX > 0. 2. Nếu X = C thì EX = C. 3. Nếu tồn tại EX thì với moi C ∈ R, ta có E(CX) = CEX. 4. Nếu tồn tại EX và EY thì E(X ± Y ) = EX ± EY. 5. Nếu X và Y là hai đại lượng ngẫu nhiên độc lập thì E(XY ) = EXEY. 6. Nếu f : R → R là hàm liên tục và Y = f(X) thì  P f(x )p nếu X rời rạc nhận các giá trị x , x ,  i i i 1 2 EY = với P(X = xi) = pi. R +∞ −∞ f(x)p(x)dx nếu X liên tục có hàm mật độ p(x). 7. (Bất đẳng thức Markov) Giả sử X là đại lượng ngẫu nhiên không âm. Khi đó nếu tồn tại EX thì với mọi ε > 0 ta có X (X ≥ ε) E . P 6 ε Chứng minh. Ta chứng minh các tính chất trên cho các đại lượng ngẫu nhiên rời rạc. 1. Hiển nhiên. 2. Vì P(X = C) = 1 nên EX = C · 1 = C. P P 3. Ta có P(CX = Cxi) = P(CX = Cxi) nên E(CX) = i Cxipi · 1 = C i xipi = CEX. 4. Giả sử X(Ω) = {x1, x2, . . . , xm ···}; Y (Ω) = {y1, y2, . . . , yn ···}. Khi đó Z = X + Y là đại lượng ngẫu nhiên nhận các giá trị Zij = xi + yj với các xác suất tương ứng pij = P(X = xi; Y = yj), (i = 1, 2, ,; j = 1, 2, , ). Do đó X X X X X X EZ = (xi + yj)pij = xi pij + yj pij. i j i j j i Mặt khác X P(X = xi) = P(X = xi,Y = y1)+P(X = xi,Y = y2)+···+P(X = xi,Y = yn)+··· = pij. j 34
  35. Tương tự X P(Y = yj) = pij. i Suy ra X X EZ == xiP(X = xi) + yjP(Y = yj) = EX + EY. i j 5. Giả sử X(Ω) = {x1, x2, . . . , xm ···}; Y (Ω) = {y1, y2, . . . , yn ···}. Khi đó Z = X.Y nhận các giá trị Zij = xiyj với các xác suất tương ứng pij = P(X = xi; Y = yj), (i = 1, 2, ; j = 1, 2, ). Do X, Y độc lập nên pij = P(X = xi; Y = yj) = P(X = xi)P(Y = yj) = piqj. Suy ra X X X X EZ = xiyjpij = xiyjpiqj i j i j X X = xipi yjqj = EXEY. i j P 6. Nếu X nhận giá trị xi thì Y = f(X) nhận giá trị f(xi) nên EY = i f(xi)pi. 7. Giả sử G là tập giá trị của X, ta đặt G1 = [c ∈ G : 0 ≤ c ε] . Khi đó X X X EX = ci P[X = ci] = ci P[X = ci] + ci P[X = ci] ci∈G ci∈G1 ci∈G2 X X > ci P[X = ci] > ε P[X = ci] = ε P[X ≥ ε]. ci∈G2 ci∈G2 Từ đó suy ra điều phải chứng minh. Ví dụ. Cho hai đại lượng ngẫu nhiên X, Y độc lập với nhau có bảng phân phối X 0 1 2 P 0, 3 0, 4 0, 3 Y −1 1 P 0, 4 0, 6 Tính EX2; E(X + Y ) và E(XY ) Giải. Ta có EX = 0.0, 3 + 1.0, 4 + 2.0, 3 = 1 EY = −1.0, 4 + 1.0, 6 = 0, 2 EX2 = 02.0, 3 + 12.0, 4 + 22.0, 3 = 1, 6 E(X + Y ) = EX + EY = 1 + 0, 2 = 1, 2 35
  36. E(X.Y ) = EX.EY = 1.0, 2 = 0, 2. Ý nghĩa: Qua các ví dụ trên, ta thấy rằng kỳ vọng của đại lượng ngẫu nhiên X là giá trị trung bình theo xác suất của đại lượng ngẫu nhiên đó. Trong trường hợp X nhận các giá trị với xác suất như nhau thì kỳ vọng chính là trung bình cộng của nó. 2.2.2 Phương sai Định nghĩa. Giả sử X là đại lượng ngẫu nhiên. Khi đó, số DX = E(X − EX)2 (nếu tồn tại) được gọi là phương sai của X. Chú ý. Từ định nghĩa trên và từ tính chất của kỳ vọng, suy ra rằng phưng sai DX của đại lượng ngẫu nhiên X có thể tồn tại hoặc không tồn tại và nếu tồn tại thì có thể được tính theo công thức ( P(x − X)2p nếu X rời rạc và (X = x ) = p . DX = i E i P i i R +∞ 2 −∞ (x − EX) p(x)dx nếu X liên tục có hàm mật độ là p(x). Ví dụ. 1. Giả sử X là đại lượng ngẫu nhiên rời rạc có bảng phân phối X 0 1 P p q Khi đó EX = 0.q + 1.p = p Suy ra DX = (0 − p)2.q + (1 − p)2 = p2q + q2p = pq. 2. Giả sử X là đại lượng ngẫu nhiên liên tục có hàm mật độ  0 nếu x 6∈ [0, 2] p(x) = 1 nếu x ∈ [0, 2]. 2 Khi đó EX = 1 Suy ra Z +∞ DX = (x − 1)2p(x)dx −∞ Z 2 2 3 2 (x − 1) (x − 1) 1 1 1 = dx = = + = . 0 2 6 0 6 6 3 Ý nghĩa: |X − EX| là độ lệch của các giá trị của đại lượng ngẫu nhiên X khỏi EX. Do đó phương sai DX = E(X − EX)2 chính là trung bình của bình phương độ lệch của X quanh EX. Phương sai cho biết mức độ phân tán của các giá trị của đại lượng ngẫu nhiên X quanh kỳ vọng của nó. Tuy nhiên, phương sai DX √có hạn chế là không cùng thứ nguyên với X. Do đó, cùng với DX, người ta còn√ dùng DX để nghiên cứu mức độ phân tán của đại lượng ngẫu nhiên X quanh EX. DX = σX gọi là độ lệch chuẩn của X. σX có cùng thứ nguyên với X. 36
  37. Tính chất. Phương sai có những tính chất cơ bản sau đây 1. DX = EX2 − (EX)2 2. DX > 0 3. DX = 0 khi và chỉ khi X = EX = hằng số h.c.c. . 4. D(CX) = C2DX 5. Nếu X, Y độc lập thì D(X ± Y ) = DX + DY Tổng quát: Nếu (Xi)i=1,n là họ đôi một độc lập thì D(X1 + ··· + Xn) = DX1 + ··· + DXn Chứng minh. 1. DX = E(X − EX)2 = E(X2 − 2X.EX + (EX)2) = EX2 − 2EX.EX + (EX)2 = EX2 − (EX)2. 2 2 2. (X − EX) > 0 ⇒ DX = E(X − EX) > 0. 3. DX = 0 ⇐⇒ E(X − EX)2 = 0 ⇐⇒ (X − EX)2 = 0 ⇐⇒ P (X = EX) = 1 ⇐⇒ X = EX h.c.c. 4. D(CX) = E(CX−ECX) = E(CX−CEX)2 = E(C2(X−EX)2) = C2E(X−EX)2 = C2DX. 5. D(X + Y ) = E(X + Y )2 − (E(X + Y ))2 = E(X2 + 2XY + Y 2) − (EX + EY )2 = (EX2 − (EX)2) + (EY 2 − (EY )2) + 2(E(XY ) − EXEY ) = DX + DY + 2(E(XY ) − EXEY ) = DX + DY (vì E(XY ) = EX.EY ( Do X và Y độc lập)). Kết hợp với tính chất 4 ta được D(X − Y ) = D(X + (−Y )) = DX + D(−Y ) = DX + DY. Bây giờ giả sử (Xi)i=1,n là họ độc lập đôi một. Vậy thì n n n n X X 2 X 2 X 2 D( Xi) = E( Xi) − (E( Xi)) = E( Xi i=1 i=1 i=1 i=1 n X X 2 X +2 XiXj) − (EXi) − 2 EXiEXj 16i<j6n i=1 16i<j6n n n X 2 2 X X = (EXi − (EXi) ) + 2 (E(XiXj) − EXiEXj) = DXi. i=1 16i<j6n i=1 (Vì Xi,Xj độc lập nên E(XiXj) − EXi.EXj = 0). 2.2.3 Mode Khái niệm mode được định nghĩa riêng rẽ cho hai trường hợp đại lượng ngẫu nhiên rời rạc và đại lượng ngẫu nhiên liên tục. Nếu X là đại lượng ngẫu nhiên rời rạc thì giá trị x0 được gọi là mode của X, nếu X có xác suất lớn nhất tại x0. Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ p(x) thì giá trị x0 được gọi là mode của X, nếu p(x) đạt giá trị lớn nhất tại x0. Nếu x0 là mode của X thì ta viết x0 = mod X. 37
  38. 2.2.4 Phân vị cấp p Số xp (0 p (F (xp + 0) = lim F (x)). x→xp Rõ ràng, nếu F (x) là hàm liên tục thì F (xp) = p. 1 Nếu p = thì xp = x 1 được gọi là trung vị hay median của X và được ký hiệu là m(X). 2 2 2.2.5 Moment, hệ số bất đối xứng và hệ số nhọn Giả sử X là đại lượng ngẫu nhiên, khi đó số k mk = EX (nếu tồn tại) được gọi là moment cấp k của X, còn số k αk = E(X − EX) (nếu tồn tại) được gọi là moment trung tâm cấp k của X (moment cấp 1 chính là kỳ vọng, còn moment trung tâm cấp 2 chính là phương sai). Số α3 S = 3 2 α2 được gọi là hệ số bất đối xứng của X. Số α4 E = 2 − 3 α2 được gọi là hệ số nhọn của X. Ví dụ. Cho đại lượng ngẫu nhiên liên tục X có hàm mật độ  0 nếu x 2. Hãy tính các moment và moment trung tâm cấp 1, 2, 3, 4. Tính hệ số bất đối xứng và hệ số nhọn. Giải. m1 = 1; m2 = 1, 1; 3 3 m = R 1 x5dx + R 2 x3(2 − x)2dx = 1, 3; 3 2 0 2 1 3 3 22 m = R 1 x6dx + R 2 x4(2 − x)2dx = 1 . 4 2 0 2 1 55 Từ đó 2 α1 = 0, α2 = m2 − m1 = 0, 1; 3 α3 = m3 − 3m1m2 + 2m1 = 1, 3 − 3(1, 1) + 2 = 0; 38
  39. 2 4 α4 = m4 − 4m1m3 + 6m1m2 − 3m1 = −0, 2; α3 S = 3 = 0 2 α2 α4 1 E = 2 − 3 = − α2 7 2.3 Một số phân phối xác suất quan trọng 2.3.1 Phân phối nhị thức Định nghĩa. Đại lượng ngẫu nhiên X được gọi là có phân phối nhị thức với các tham số n, p và được ký hiệu là X ∼ B(n, p) ( n ≥ 1 0 2) = 1 − P (X = 0) − P (X = 1) = 1 − (0, 25) − 12(0, 75)(0, 25) . Ta hãy tìm kỳ vọng, phương sai và mode của phân bố nhị thức. Định lý . Nếu X ∼ B(n, p) thì i) EX = np ii) DX = npq iii) ( [np − q + 1] nếu np − q không nguyên mod X = np − q và np − q + 1 nếu np − q nguyên Chứng minh. i) Ta có n n X X n! X = kCkpkqn−k = k pkqn−k E n k!(n − k)! k=0 k=0 n n X (n − 1)! X = n pkqn−k = np Ck−1pkqn−k (k − 1)!(n − k)! n−1 k=1 k=1 n−1 X i−1 i n−1−i n−1 = np Cn−1p q = np(p + q) = np. i=0 39
  40. ii) n 2 X 2 k k n−k EX = k Cnp q k=0 n X k2n! = pkqn−k k!(n − k)! k=1 n n X k(k − 1)n! X kn! = pkqn−k + pkqn−k k!(n − k)! k!(n − k)! k=1 k=1 = S1 + S2. Ta có n! S = Pn pkqn−k = n(n − 1)p2 1 k=2 (k − 2)!(n − k)! S2 = np (đã tính ở trên). Thành thử 2 2 2 2 2 2 2 DX = EX − (EX) = n p − np + np − n p = np(1 − p) = npq. Để chứng minh iii) ta chỉ cần nhận xét rằng mod X chính là số có khả năng nhất. Ví dụ. Tỉ lệ cử tri ủng hộ ứng cử viên A trong một cuộc bầu cử tổng thống là 60%. Người ta hỏi ý kiến 20 cử tri được chọn một cách ngẫu nhiên. Gọi X là số người bỏ phiếu cho ông A trong 20 người đó. a. Tìm giá trị trung bình, độ lệch tiêu chuẩn của X và mod X b. Tìm P(X 6 10). Giải. X có phân√ phối nhị thức B(20, 0, 6). Vậy EX = 20.(0, 6) = 12; DX = 20(0, 6)(0, 4) = 4, 8; σX = 4, 8 ≈ 2, 2; mod X = [21.0, 6] = [12, 6] = 12. P10 k k 20−k b. P(X 6 10) = k=0 C20(0, 6) (0, 4) . 2.3.2 Phân phối Poisson Định nghĩa. Ta nói rằng đại lượng ngẫu nhiên X có phân phối Poisson với tham số λ và kí hiệu là X ∼ P (λ) nếu X(Ω) = {0, 1, 2, } và λk (X = k) = e−λ P k! trong đó λ là một số dương cho trước. λi Người ta đã lập bảng để tính sẵn (X k) = Pk e−λ với các giá trị λ khác P 6 i=1 i! nhau. Ví dụ. Một gara cho thuê ô tô thấy rằng số người đến thuê ô tô vào ngày thứ bảy cuối tuần là một đại lượng ngẫu nhiên X có phân phối Poisson với tham số λ = 2. Giả sử gara có 4 chiếc ô tô. Hãy tìm xác suất để a. Không phải tất cả 4 chiếc đều được thuê b. Tất cả 4 ô tô đều được thuê. c. Gara không đáp ứng được yêu cầu. 40
  41. d. Trung bình có bao nhiêu ô tô được thuê. e. Gara cần có ít nhất bao nhiêu ôtô để xác suất không đáp ứng nhu cầu thuê bé hơn 2%. Giải. a. P(X 6 3) = 0, 857. b. P(X > 4) = 1 − P(X 6 3) = 1 − 0, 857 = 0, 143. c. P(X > 4) = 1 − P(X ≤ 4) = 1 − 0, 947 = 0, 053. d. Gọi Y là số ôtô được thuê. Khi đó P(Y = 0) = P(X = 0) = 0, 135; P(Y = 1) = P(X 6 1) − P(X = 0) = 0, 406 − 0, 135 = 0, 271; P(Y = 2) = P(X = 2) = P(X 6 2) − P(X 6 1) = 0, 677 − 0, 406 = 0, 271; P(Y = 3) = P(X = 3) = P(X 6 3) − P(X 6 2) = 0, 857 − 0, 677 = 0, 18; P(Y = 4) = P(X > 4) = 1 − P(X 6 3) = 1 − 0, 857 = 0, 143. Từ đó EY = 1, 925. e. Ta cần xác định n nhỏ nhất để P(X > n) 0, 98 Vì P(X 6 4) = 0, 947; P(X 6 5) = 0, 983 Do đó n = 5 Ta hãy tìm kỳ vọng, phương sai và mode của phân phối Poisson. Định lý. Giả sử X ∼ P (λ). Khi đó EX = λ, DX = λ, mod X = [λ]. Chứng minh. Ta có ∞ ∞ X λk X λk−1 X = ke−λ = e−λλ = e−λλeλ = λ E k! (k − 1)! k=0 k=1 ∞ ∞ ∞ X λk X k(k − 1)λk X λk X2 = k2e−λ = e−λ + e−λ k E k! k! k! k=0 k=2 k=0 ∞ X λk−2 = e−λλ2 + λ = λ2 + λ (k − 2)! k=2 Vậy DX = EX2 − (EX)2 = λ. Để tìm mod X ta xét (X = k) λ P = > 1 ⇔ λ > k P(X = k − 1) k Vậy P(X = k) lớn nhất khi k là số nguyên lớn nhất bé hơn λ. Nói cách khác mod X = [λ]. Ví dụ. Ở một tổng đài bưu điện, các cú điện thoại gọi đến xuất hiện ngẫu nhiên, độc lập với nhau và tốc độ trung bình 2 cuộc gọi trong một phút. Tìm xác suất để: a. Có đúng 5 cú điện thoại trong 2 phút b. Không có cú điện thoại nào trong khoảng thời gian 30 giây. c. Có ít nhất 1 cú điện thoại trong khoảng thời gian 10 giây. Giải. a. Số cú điện thoại xuất hiện trong khoảng thời gian 2 phút là đại lượng ngẫu nhiên X ∼ P (4). Vậy 45 (X = 5) = e−4 P 5! 41
  42. = P(X 6 5) − P(X 6 4) = 0, 785 − 0, 629 = 0, 156 b. Số cú điện thoại xuất hiện trong khoảng thời gian 30 giây là đại lượng ngẫu nhiên X ∼ P(1). Vậy −1 P(X = 0) = e = 0, 3679 c. Số cú điện thoại xuất hiện trong khoảng thời gian 10 giây là đại lượng ngẫu nhiên 1 X ∼ P ( ). Vậy 3 1 − P(X > 1) = 1 − P(X = 0) = 1 − e 3 = 0, 2835. Định lý. Nếu X ∼ P (µ), Y ∼ P (λ) và X, Y độc lập thì Z = (X + Y ) ∼ P (λ + µ). Chứng minh. Ta có k X P(Z = k) = P(X + Y = k) = P(X = i, Y = k − i) i=0 k k X X µi e−λλk−1 = (X = i) (Y = k − i) = e−µ P P i! (k − 1)! i=0 i=0 k e−(λ+µ) X e−(λ+µ)(λ + µ)k = Ci µiλk−1 = . k! k k! i=0 Ví dụ. Một cửa hàng bán đồ điện tử gồm hai mặt hàng: tivi và radio. Số tivi và radio bán trong một ngày đều có phân phối Poisson và chúng độc lập với nhau. Trung bình mỗi ngày bán được 1 tivi và 2 radio. Tìm xác suất để một ngày cửa hàng bán được ít nhất 4 chiếc (radio và tivi). Giải. Gọi X và Y tương ứng là số tivi và số radio bán được trong ngày. Ta có X ∼ P (1) và Y ∼ P (2), X và Y độc lập. Theo định lý trên thì (X + Y ) ∼ P (3) Vậy P(X + Y > 3) = 1 − P(X + Y 6 3) = 1 − 0, 647 = 0, 353. 2.3.3 Phân phối chuẩn Phân phối chuẩn tắc. Đại lượng ngẫu nhiên liên tục Z được gọi là đại lượng ngẫu nhiên có phân phối chuẩn tắc nếu hàm mật độ của nó là 1 −π2 p(x) = ϕ(x) = √ e 2 ∀x ∈ R. 2π Đồ thị hàm mật độ của Z có dạng Đồ thị của ϕ(x) Đó là một đường cong đối xứng qua trục tung, có điểm cực đại tại x = 0. Các điểm uốn của đồ thị là x = ±1. Hàm phân phối của Z, kí hiệu bởi Φ(x), là Z x Z x 2 1 − t Φ(x) = p(t)dt = √ e 2 dt. −∞ 2π −∞ 42
  43. Rất tiếc rằng Φ(x) không biểu diễn được qua các hàm sơ cấp đã biết. Người ta đã lập bảng tính sẵn các giá trị của Φ(x). Chú ý rằng nhiều khi người ta chỉ cho các giá trị của Φ(x) với x > 0. Với x a) = 1 − Φ(a), P(a 0) nếu đại lượng ngẫu nhiên Z = có phân σ phối chuẩn tắc. Khi đó ta kí hiệu X ∼ N(µ, σ2). Ta hãy tìm hàm mật độ của đại lượng ngẫu nhiên X có phân phối chuẩn. Giả sử X ∼ N(µ, σ2). Khi đó X = σZ + µ. Trong đó Z có phân phối chuẩn tắc. Ta có x − µ x − µ (X < x) = (σZ + µ < x) = (Z < ) = Φ( ). P P P σ σ Vậy 2 0 x − µ 1 1 − (x−µ) pX (x) = Φ ( ) = √ e 2σ . σ σ σ 2π Tiếp theo ta tính các tham số đặc trưng của X. Ta có EX = E(σZ + µ) = σEZ + µ = µ. 2 2 2 2 2 2 DX = E(X − µ) = EZ(σ Z ) = σ EZ = σ . Dễ thấy mode và median của X đều bằng µ. Như vậy tham số µ là kỳ vọng đồng thời cũng là mode và median của phân phối chuẩn N(µ, σ2). Tham số σ là độ lệch chuẩn của nó. Ta có thể tính được các xác suất liên quan tới X bằng cách biến đổi nó về một biến cố có liên quan tới Z rồi tra bảng, chẳng hạn α − µ α − µ (X < α) = (Z < ) = Φ( ). P P σ σ 43
  44. α − µ (X > α) = 1 − (X 2400) b. P(1700 a) = 0, 03. Giải. 2400 − 2100 a. (X > 2400) = 1 − Φ( ) = 1 − Φ(1, 5) P 200 = 1 − 0, 9332 = 0, 0668. 2200 − 2100 1700 − 2100 b. (1700 a) = 1 − Φ( ) = 0, 03 P 200 a − 2100 ⇒ Φ( ) = 0, 97. 200 Tra ngược bảng Φ(x) ta tìm được Φ(1, 881) = 0, 97. a − 2100 Vậy = 1, 881. Từ đó a = 2476, 2. 200 2. Trọng lượng của một gói đường (đóng bằng máy tự động) có phân phối chuẩn. Trong 1000 gói đường có 70 gói có trọng lượng lớn hn 1015 g. Hãy ước lượng xem có bao nhiêu gói đường có trọng lượng ít hơn 1008g, biết rằng trọng lượng trung bình của 1000 gói đường là 1012g. Giải. Theo giả thiết trọng lượng của một gói đường X có phân phối chuẩn với µ = 1012g và độ lệch chuẩn σ. Ta cần ước lượng σ. 70 Xác suất để trọng lượng gói đường lớn hơn 1015g là = 0, 07. Vậy ta có 1000 1015 − 1012 (X > 1015) = 0, 07 ⇔ 1 − Φ( ) = 0, 07. P σ Suy ra 3 Φ( ) = Φ(1, 476). σ 3 Từ đó σ = = 2, 0325. 1, 470 Vậy 1008 − 1012 (X < 1008) = Φ( ) P 2, 0325 = Φ(−1, 968) = 1 − Φ(1, 968) = 0, 0245. Do đó trong 1000 gói đường sẽ có khoảng 1000.0, 0245 = 24, 5 gói có trọng lượng ít hơn 1008g. 2.3.4 Phân phối mũ Định nghĩa. Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối mũ với tham 44
  45. số λ > 0 và kí hiệu X ∼ E(λ), nếu nó có hàm mật độ ( λe−λx nếu x 0 p(x) = > 0 nếu x 0 0 và F (x) = 0 với x 6 0. Kỳ vọng của X là Z ∞ Z ∞ −λx −λx ∞ −λx 1 EX = λ xe dx = (−xe ) 0 + e dx = . 0 0 λ (Sử dụng tích phân từng phần). 1 Phương sai của X là DX = . Thật vậy, bằng cách tích phân từng phần ta được λ2 Z ∞ Z ∞ 2 −λx 2 −λx ∞ −λx 2 x λe dx = (−x λe ) 0 + 2 xe dx = 2 . 0 0 λ 1 √ 1 Thành thử DX = và do đó độ lệch chuẩn của X là σ = DX = . λ2 x λ Ví dụ. Giả sử tuổi thọ (tính bằng năm) của một mạch điện tử trong máy tính là một đại lượng ngẫu nhiên có phân phối mũ với kỳ vọng là 6, 25. Thời gian bảo hành của mạch điện tử này là 5 năm. Hỏi có bao nhiêu phần trăm mạch điện tử bán ra phải thay thế trong thời gian bảo hành. 1 1 Giải. Ta có λ = = EX 6, 25 −5λ − 5 −0,8 P(X 6 5) = 1 − e = 1 − e 6,25 = 1 − e ≈ 1 − 0, 449 ≈ 0, 5506. Vậy có khoảng 55% số mạch điện tử bán ra phải thay thế trong thời gian bảo hành. 2.3.5 Phân phối đều Định nghĩa. Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a, b] và kí hiệu là X ∼ U[a,b], nếu hàm mật độ của nó cho bởi công thức  1  nếu x ∈ [a, b] p(x) = b − a 0 nếu x 6∈ [a, b]. 45
  46. Hàm phân phối và các số đặc trưng. Hàm phân phối F (x) của đại lượng ngẫu nhiên X có phân phối đều trên [a, b] được xác định như sau F (x) = 0 nếu x b. Đồ thị của hàm mật độ và hàm phân phối của X Đồ thị của p(x) Đồ thị của F (x) Giả sử (α, β) ⊂ [a, b]. Xác suất để X rơi vào (α, β) là Z β β − α P(α 4 thì 2 FY (x) = P(X < x) = 1. 46
  47. Với 1 6 x 6 4 thì √ √ √ x + 1 √ F (x) = (X2 4. Từ đó hàm mật độ của Y là  1  √ nếu 0 x 1  6 6 3 x p (x) = 1 Y √ nếu 1 6 x 6 4 6 x  0 nếu x 6 0 hoặc x > 4. 2.3.6 Phân phối χ2 và phân phối Student 1. Phân phối χ2 (Khi bình phương) Đại lượng ngẫu nhiên X được gọi là có phân phối χ2 (khi bình phương) với n bậc tự do, nếu hàm mật độ của nó có dạng ( 0 nếu x 0, trong đó C là hằng số dương. Vai trò của phân phối χ2 được thể hiện qua định lý sau Định lý. Nếu X1,X2, ,Xn là các đại lượng ngẫu nhiên độc lập, có phân phối chuẩn tắc N(0, 1) thì 2 2 2 X1 + X2 + ··· + Xn có phân phối χ2 với n bậc tự do. 2. Phân phối Student Đại lượng ngẫu nhiên T được gọi là có phân phối Student với n bậc tự do, nếu hàm mật độ của nó có dạng 2 x − n+1 p(x) = C1 +  2 n trong đó C là hằng số dương. Vai trò của phân phối Student được thể hiện qua định lý sau 47
  48. Định lý. Nếu X, X1,X2, ,Xn là các đại lượng ngẫu nhiên độc lập, có phân phối chuẩn tắc N(0, 1) thì X T = q 1 Pn 2 n i=1 Xi có phân phối Student với n bậc tự do. Cùng với phân phối chuẩn, phân phối χ2 và phân phối Student được sử dụng nhiều trong thống kê toán học. 2.4 Vectơ ngẫu nhiên 2.4.1 Định nghĩa và ví dụ Từ trước đến nay, ta chỉ xét các đại lượng ngẫu nhiên riêng lẻ. Trong lý thuyết và ứng dụng, nhiều khi ta cần xét đồng thời một hệ thống có thứ tự gồm nhiều đại lượng ngẫu nhiên. Hệ thống như thế được gọi là vectơ ngẫu nhiên. → Định nghĩa. Giả sử X1,X2, ,Xn là các đại lượng ngẫu nhiên. Khi đó, vectơ X = (X1,X2, ,Xn) được gọi là vectơ ngẫu nhiên n chiều. Các đại lượng ngẫu nhiên X1,X2, ,Xn được gọi là các thành phần của vectơ → ngẫu nhiên X. Trên thực tế, vectơ ngẫu nhiên n chiều dùng để nghiên cứu đồng thời n đặc trưng về lượng của các biến cố. Ví dụ. Khi điều tra chất lượng học tập của một học sinh, nếu ta quan tâm đồng thời đến điểm toán X và điểm văn Y thì ta phải đề cập tới vectơ ngẫu nhiên hai chiều (X, Y ). Nếu cần quan tâm đến điểm lý Z nữa thì phải xét vectơ ngẫu nhiên ba chiều (X, Y, Z) Để tránh các ký hiệu cồng kềnh, từ nay về sau, ta chỉ xét vectơ ngẫu nhiên hai chiều. Phân loại vectơ ngẫu nhiên. Vectơ ngẫu nhiên (X, Y ) được gọi là vectơ ngẫu nhiên rời rạc nếu cả hai đại lượng ngẫu nhiên X và Y đều là đại lượng ngẫu nhiên rời rạc. Vectơ ngẫu nhiên (X, Y ) được gọi là vectơ ngẫu nhiên liên tục nếu cả hai đại lượng ngẫu nhiên X và Y đều là đại lượng ngẫu nhiên liên tục. Vectơ ngẫu nhiên (X, Y ) được gọi là vectơ ngẫu nhiên hỗn hợp nếu một trong hai đại lượng ngẫu nhiên thành phần là đại lượng ngẫu nhiên rời rạc, còn đại lượng ngẫu nhiên kia là đại lượng ngẫu nhiên liên tục. Trong phạm vi giáo trình này, chúng ta chỉ xét hai loại vectơ ngẫu nhiên: vectơ ngẫu nhiên rời rạc và vectơ ngẫu nhiên liên tục. 2.4. 2 Bảng phân phối của vectơ ngẫu nhiên rời rạc Định nghĩa. Giả sử X và Y là hai đại lượng ngẫu nhiên rời rạc và X(Ω) = {x1, x2, . . . , xm }; Y (Ω) = {y1, y2, . . . , yn }. Ký hiệu pij = P(X = xi,Y = yj). Khi đó bảng chữ nhật sau đây được gọi là bảng phân phối của vectơ ngẫu nhiên (X, Y ) 48
  49. Tính chất P 1. i,j pij = 1. Tính chất này hiển nhiên. P P 2. P(X = xi) = j pij; P(Y = yj) = i pij. Thật vậy P(X = xi) = P(X = xi,Y = y1) + P(X = xi,Y = y2)+ X ··· + P(X = xi,Y = yn) + ··· = pij. j Tương tự X P(Y = yj) = pij. i Như vậy, nếu biết bảng phân phối của vectơ (X, Y ) thì cũng biết được bảng phân phối của các đại lượng ngẫu nhiên X và Y . Điều ngược lại nói chung không đúng. Tuy nhiên, ta có 3. Nếu các đại lượng ngẫu nhiên thành phần X và Y độc lập thì khi biết bảng phân phối của chúng, có thể suy ra được bảng phân phối của vectơ ngẫu nhiên (X, Y ). Thật vậy pij = P(X = xi,Y = yj) = P(X = xi)P(Y = yj). P P 4. E(X + Y ) = i,j(xi + yj)pij, E(XY ) = i,j(xiyj)pij. Tính chất này được suy ra ngay từ công thức tính kỳ vọng của đại lượng ngẫu nhiên rời rạc. Ví dụ. Gieo ba đồng tiền cân đối A, B và C. Giả sử X, Y là các đại lượng ngẫu nhiên được xác định như sau X: Số mặt ngửa trên các đồng tiền A và B. Y : Số mặt ngửa trên cả ba đồng tiền A, B và C. Hãy lập bảng phân phối của vectơ (X, Y ). Giải. Rõ ràng X(Ω) = {0, 1, 2},Y (Ω) = {0, 1, 2, 3} Các kết quả của phép thử và giá trị tương ứng của X và Y được cho bởi bảng sau (N: Ngửa, S: Sấp). A B C X Y N N N 2 3 N N S 2 2 N S N 1 2 N S S 1 1 S N N 1 1 S N S 1 2 S S N 0 0 S S S 0 0 Vậy 1 1 (X = 0,Y = 0) = , (X = 0,Y = 1) = , P 8 P 8 49
  50. P(X = 0,Y = 2) = 0, P(X = 0,Y = 3) = 0 2 (X = 1,Y = 0) = 0, (X = 1,Y = 1) = , P P 8 1 (X = 1,Y = 2) = , (X = 1,Y = 3) = 0 P 8 P P(X = 2,Y = 0) = 0, P(X = 2,Y = 1) = 0, 1 1 (X = 2,Y = 2) = , (X = 2,Y = 3) = . P 8 P 8 Do đó, bảng phân phối xác suất của vectơ ( X, Y ) là 2.4.3 Hàm phân phối của vectơ ngẫu nhiên Định nghĩa. Giả sử (X, Y ) là vectơ ngẫu nhiên hai chiều. Khi đó hàm hai biến F (x, y) xác định bởi đẳng thức F (x, y) = P(X F (x2, y) nếu x1 > x2; F (x, y1) > F (x, y2) nếu y1 > y2. 2. F (−∞, −∞) = limx→−∞ F (x, y) = 0; y→−∞ F (+∞, +∞) = limx→+∞ F (x, y) = 1. y→+∞ 3. F (x, +∞) = limy→+∞ F (x, y) = FX (x); F (y, +∞) = limx→+∞ F (x, y) = FY (y). Trong đó FX (x), FY (y) là các hàm phân phối của các đại lượng ngẫu nhiên X và Y (FX (x), FY (y) được gọi là hàm phân phối biên duyên của các đại lượng ngẫu nhiên X và Y tương ứng). 4. P(a 6 X > 0 nếu trái lại. Tìm hàm phân phối FX (x) của X. Giải. Ta có ( −x 1 − e nếu x > 0 FX (x) = lim F (x, y) = y→∞ 0 nếu x < 0. 50
  51. Do đó X là đại lượng ngẫu nhiên có phân phối mũ với tham số λ = 1. 2.4.4 Hàm mật độ của vectơ ngẫu nhiên liên tục Định nghĩa. Giả sử (X, Y ) là vectơ ngẫu nhiên liên tục, có hàm phân phối F (x, y). Khi đó hàm hai biến p(x, y) > 0 thoả mãn đẳng thức Z x Z y F (x, y) = p(x, y)dxdy −∞ −∞ được gọi là hàm mật độ xác suất của vectơ ngẫu nhiên (X, Y ). Hàm mật độ xác suất của vectơ ngẫu nhiên (X, Y ) còn được gọi là hàm mật độ đồng thời của các đại lượng ngẫu nhiên X và Y . Tính chất R x R y 1. −∞ −∞ p(x, y)dxdy = 1. Thật vậy Z x Z y p(x, y)dxdy = P(X < +∞, Y < +∞) = 1 −∞ −∞ R +∞ R +∞ 2. pX (x) = −∞ p(x, y)dy; pY (y) = −∞ p(x, y)dx. Thật vậy, ta có Z x Z +∞ ( p(x, y)dy)dx = P(X < x, Y < +∞) = P(X < x) −∞ −∞ Do đó, hàm số Z +∞ pX (x) = p(x, y)dy −∞ là hàm mật độ của đại lượng ngẫu nhiên X. Tương tự, hàm số Z +∞ pY (y) = p(x, y)dx −∞ là hàm mật độ của đại lượng ngẫu nhiên Y . Như vậy, nếu biết hàm mật độ xác suất của (X, Y ) thì cũng biết hàm mật độ xác suất của X và Y . Điều ngược lại không đúng, tuy nhiên ta có 3. Nếu X và Y là các đại lượng ngẫu nhiên độc lập thì p(x, y) = pX (x)pY (y). Thật vậy, ta có P(X < x, Y < y) = P(X < x)P(Y < y) Z x Z y = pX (x)dx pY (y)dy −∞ −∞ Z x Z y = pX (x)pY (y)dxdy. −∞ −∞ Suy ra p(x, y) = pX (x)pY (y) 51
  52. là hàm mật độ của (X, Y ). Đẳng thức trên cũng là điều kiện đủ để các đại lượng ngẫu nhiên X và Y độc lập (hãy tự chứng minh điều đó). Như vậy, nếu X và Y là các đại lượng ngẫu nhiên độc lập thì khi biết hàm mật độ xác suất của X và Y , ta cũng sẽ xác định được hàm mật độ xác suất của vectơ (X, Y ). R b R d 4. P(a 6 X < b, c 6 Y < d) = P(a < X < b, c < Y < d) = a c p(x, y)dxdy. Tổng quát, nếu D ⊂ R2 làm một miền đo được bất kỳ thì ZZ P((X, Y ) ∈ D) = p(x, y)dxdy. D Tính chất này suy trực tiếp từ tính chất tương ứng của hàm phân phối. R +∞ R +∞ 5. E(XY ) = −∞ −∞ xyp(x, y)dxdy, R +∞ R +∞ E(X + Y ) = −∞ −∞ (x + y)p(x, y)dxdy. Chúng ta công nhận tính chất này. Ví dụ. Cho vectơ ngẫu nhiên (X, Y ) có hàm mật độ  1 C(x2 + xy) nếu 0 < x < 1, 0 < y < 2 p(x, y) 2 0 nếu trái lại. Hãy tìm hằng số C và tính E(XY ). Giải. Ta có Z +∞ Z +∞ Z 1 Z 2 xy 7 1 = p(x, y)dxdy = C (x2 + )dxdy = C . −∞ −∞ 0 0 2 6 6 Từ đó C = . 7 Z +∞ Z +∞ Z 1 Z 2 2 xy E(XY ) = xyp(x, y)dxdy = C xy(x + )dxdy −∞ −∞ 0 0 2 Z 1 Z 2 x2y2 17 = C (x3y + )dxdy = . 0 0 2 21 2.4.5 Phân phối có điều kiện Trường hợp rời rạc Giả sử (X, Y ) là vectơ ngẫu nhiên rời rạc X(Ω) = {x1; x2; ; xm; }; Y (Ω) = {y1; y2; ; yn; }. Với mỗi xi, yj (i = 1, 2, . . . , m; j = 1, 2, . . . , n), đặt p(xi/yj) = P[(X = xi)/(Y = yj)]; p(yj/xi) = P[(Y = yj)/(X = xi)]. Khi đó, với mỗi yj cố định, bảng X x1 x2 ··· xm ··· p(xi/yj) p(x1/yj) p(x2/yj) ··· p(xm/yj) ··· 52
  53. gọi là bảng phân phối có điều kiện của đại lượng ngẫu nhiên X với điều kiện Y = yj. Bảng phân phối có điều kiện của đại lượng ngẫu nhiên X với điều kiện Y = yj cho biết phân phối xác suất của X trong điều kiện giả thiết rằng biến cố (Y = yj) đã xảy ra. Tương tự, ta có thể định nghĩa bảng phân phối có điều kiện của đại lượng ngẫu nhiên Y với điều kiện X = xi. Nếu biết bảng phân phối của vectơ ngẫu nhiên (X, Y ) thì có thể tìm được bảng phân phối có điều kiện của các đại lượng ngẫu nhiên thành phần. Bởi vì P(X = xi,Y = yj) P(X = xi,Y = yj) p(xi/yi) = ; p(yi/xi) = . P(Y = yj) P(X = xi) Ví dụ. Vectơ ngẫu nhiên (X, Y ) được cho bởi bảng phân phối Tìm bảng phân phối có điều kiện của đại lượng ngẫu nhiên X với điều kiện đại lượng ngẫu nhiên Y nhận giá trị y1. Giải. Ta có P(X = x1,Y = y1) 0, 1 1 p(x1/y1) = = = . P(Y = y1) 0, 1 + 0, 3 + 0, 2 6 Tương tự 0, 3 1 0, 2 1 p(x /y ) = = ; p(x /y ) = = . 2 1 0, 6 2 3 1 0, 6 3 Từ đó có phân phối có điều kiện của đại lượng ngẫu nhiên X với điều kiện Y = y1 X x1 x2 x3 p(xi/y1) 1/6 1/2 1/3 Trường hợp liên tục Giả sử (X, Y ) là vectơ ngẫu nhiên liên tục có hàm mật độ là p(x, y). Các đại lượng ngẫu nhiên thành phần X và Y tương ứng có hàm mật độ là pX (x) và pY (y). Khi đó các hàm số p(x, y) p(x, y) p(x/y) = và p(y/x) = pY (y) pX (x) tương ứng được gọi là hàm mật độ có điều kiện của đại lượng ngẫu nhiên X với điều kiện đại lượng ngẫu nhiên Y lấy giá trị Y = y và hàm mật độ có điều kiện của đại lượng ngẫu nhiên Y với điều kiện đại lượng ngẫu nhiên X lấy giá trị X = x. Ví dụ. Vectơ ngẫu nhiên (X, Y ) có hàm mật độ  1  nếu x2 + y2 r2 p(x, y) = πr2 6 0 nếu x2 + y2 > r2 Dễ dàng tính được  1 √  nếu |x| r2 − x2 p 2 2 6 p(x/y) = 2 r − y √ 0 nếu |x| > r2 − x2 53
  54.  1 √  nếu |y| r2 − x2 p 2 2 6 p(y/x) = 2 r − y √ 0 nếu |y| > r2 − x2. 2.4.6 Các số đặc trưng của vectơ ngẫu nhiên Vectơ kỳ vọng. Giả sử (X1,X2, ,Xn) là vectơ ngẫu nhiên n chiều. Khi đó, nếu với mọi i đều tồn tại EXi thì vectơ (EX1, EX2, . . . , EXn) được gọi là vectơ kỳ vọng của (X1,X2, ,Xn). Covarian (Moment tương quan). Giả sử (X1,X2, ,Xn) là vectơ ngẫu nhiên. Khi đó, với mỗi cặp i, j; số cov(Xi,Xj) = E[(Xi − EXi)(Xj − EXj)] = λi,j (nếu tồn tại) được gọi là Covarian (hay Moment tương quan) của Xi, Xj. Ma trận   λ1,1 λ1,2 . . . λ1,n λ2,1 λ2,2 . . . λ2,n λ = (λi,j) =     λn,1 λn,2 . . . λn,n được gọi là ma trận Covarian của (X1,X2, ,Xn). Dễ thấy, ma trận Covarian là ma trận đối xứng, xác định dương. Hệ số tương quan. Giả sử (X, Y ) là vectơ ngẫu nhiên. Khi đó số cov(X, Y ) E[(X − EX)(Y − EY )] ρ(X, Y ) = √ = p DXDY E(X − EX)2E(Y − EY )2 được gọi là hệ số tương quan của các đại lượng ngẫu nhiên X và Y . Nếu ρ(X, Y ) = 0, thì ta nói X và Y không tương quan. Hệ số tương quan có những tính chất sau đây i) D(X + Y ) = DX + DY khi và chỉ khi ρ(X, Y ) = 0. ii) −1 6 ρ(X, Y ) 6 1. iii) |ρ(X, Y )| = 1 khi và chỉ khi X và Y phụ thuộc tuyến tính, tức là tồn tại các số a, b, c sao cho aX + bY + c = 0. Chứng minh. i) Suy ra từ đẳng thức D(X + Y ) = DX + DY +√ 2cov(X, Y ). ii) Suy từ bất đẳng thức Schwarz |cov(X, Y )| 6 DXDY . iii) Trước hết ta thấy ngay rằng, nếu X, Y phụ thuộc tuyến tính, thì bằng cách tính trực tiếp ta có |ρ(X, Y )| = 1. Ngược lại, giả sử |ρ(X, Y )| = 1, chẳng hạn ρ(X, Y ) = 1, ta có X − X Y − Y D( √ E − √ E ) = 2(1 − ρ(X, Y )) = 0 DX DY Do đó X − X Y − Y √ E − √ E = c (hằng số) DX DY Từ đó suy ra điều phải chứng minh. Qua các tính chất trên, ta thấy ρ(X, Y ) biểu thị mức độ phụ thuộc tuyến tính giữa X và Y . 54
  55. HƯỚNG DẪN HỌC VIÊN TỰ HỌC CHƯƠNG 2 Chương này trình bày những kiến thức cơ bản về đại lượng ngẫu nhiên, các số đặc trưng của đại lượng ngẫu nhiên, một số phân phối xác suất quan trọng. Ngoài ra, giáo trình cũng trình bày về vectơ ngẫu nhiên và các kiến thức liên quan. Để học tốt chương này yêu cầu người học phải nắm vững các kiến thức và kĩ năng sau. 1. Lý thuyết - Định nghĩa và các tính chất cơ bản của đại lượng ngẫu nhiên rời rạc, đại lượng ngẫu nhiên liên tục. - Các số đặc trưng của đại lượng ngẫu nhiên. Đặc biệt là kì vọng và phương sai. - Một số phân phối xác suất quan trọng, như: phân phối nhị thức, phân phối Poisson, phân phối chuẩn, phân phối mũ, phân phối đều, phân phối "Khi bình phương" và phân phối Student. - Định nghĩa vectơ ngẫu nhiên. - Định nghĩa, các khái niệm liên quan, các tính chất của vectơ ngẫu nhiên rời rạc và vectơ ngẫu nhiên liên tục. 2. Bài tập - Vận dụng thành thạo các kiến thức lý thuyết để lập bảng phân phối xác suất, tính các số đặc trưng (kì vọng, phương sai, mod, ) của đại lượng ngẫu nhiên rời rạc trong một số bài toán thực tế, cũng như đối với các đại lượng ngẫu nhiên rời rạc quan trọng. - Vận dụng thành thạo các kiến thức lý thuyết để tính xác suất của biến cố, kì vọng, phương sai, mod, trung vị, của các đại lượng ngẫu nhiên liên tục khi cho biết hàm mật độ của nó. - Tính các số đặc trưng, tính xác suất của các biến cố liên quan ứng với các đại lượng ngẫu nhiên có phân phối đặc biệt, cũng như đối với các vectơ ngẫu nhiên. 55
  56. BÀI TẬP 1. Một nhóm có 10 người gồm 6 nam và 4 nữ. Chọn ngẫu nhiên ra 3 người. Gọi X là số nữ trong nhóm. Hãy tìm bảng phân phối xác suất của X và tính EX, DX, mod X. 2. Một túi chứa 10 thẻ đỏ và 6 thẻ xanh. Chọn ngẫu nhiên ra 3 tấm thẻ (không hoàn lại). Gọi X là số thẻ đỏ. Tìm bảng phân phối xác suất của X. Tính EX và DX. Giả sử rút mỗi thẻ đỏ được 5 điểm và rút mỗi thẻ xanh được 8 điểm. Gọi Y là số điểm tổng cộng trên 3 thẻ rút ra. Tìm bảng phân phối xác suất của Y . Tìm EY , DY . 3. Hai xạ thủ A và B tập bắn, mỗi người bắn 2 phát. Xác suất bắn trúng đích của A trong mỗi phát là 0, 4, còn của B là 0, 5. Gọi X là số phát trúng của A trừ đi số phát trúng của B. Tìm bảng phân phối xác suất của X và bảng phân phối xác suất của Y = |X|. 4. Giả sử X ∼ B(2, 0, 4); Y ∼ B(2, 0, 7); X và Y độc lập. Tìm bảng phân phối xác suất của X + Y . Chứng minh rằng X + Y không có phân phối nhị thức. 5. Cho X và Y là hai đại lượng ngẫu nhiên độc lập. 1 1 a) Giả sử X ∼ B(1, ), Y ∼ B(2, ). Viết bảng phân phối xác suất của X, Y . Từ đó 5 5 1 tìm bảng phân phối xác suất của X + Y . Kiểm tra rằng X + Y ∼ B(3, ). 5 1 1 b) Giả sử X ∼ B(1, ); Y ∼ B(2, ). Tìm bảng phân phối xác suất của X + Y . Chứng 2 5 minh rằng X + Y không có phân phối nhị thức. 6. Trong một thành phố nhỏ, trung bình một tuần có 2 người chết. Tính xác suất để: a) Không có người nào chết trong vòng 1 ngày. b) Có ít nhất 3 người chết trong vòng hai ngày. 7. Một trạm cho thuê xe tắc xi có 3 chiếc xe. Hàng ngày trạm phi nộp thuế 8 USD cho một chiếc xe (dù xe đó có được thuê hay không). Mỗi chiếc xe cho thuê với giá 20 USD. Giả sử số yêu cầu thuê xe của trạm trong một ngày là đại lượng ngẫu nhiên X có phân phối Poát Xông với tham số λ = 2, 8. Gọi Y là số tiền thu được trong một ngày của trạm (nếu không có ai thuê thì số tiền thu được là −24 USD). Tìm bảng phân phối xác suất của Y . Từ đó tính số tiền trung bình thu được của trạm trong một ngày. Giải bài toán trên trong trường hợp trạm có 4 chiếc xe. Trạm nên có 3 hay 4 chiếc xe. 8. Cho đại lượng ngẫu nhiên liên tục X có hàm mật độ ( cx2(1 − x) nếu x ∈ [0, 1] p(x) = 0 nếu x 6∈ [0, 1]. Tìm hằng số c; modX và P(0, 4 2). 10. Cho đại lượng ngẫu nhiên liên tục X có hàm mật độ ( kx2 nếu 0 x 3 p(x) = 6 6 0 nếu trái lại. 56
  57. 3 Tìm hằng số k; tính P {X > 2}, tìm median của X và xác định a để P {X 1) 15. Cho hàm mật độ của một đại lượng ngẫu nhiên X có dạng ( a nếu x 1 p(x) = x4 > 0 nếu x 3 P(X x) = > 1 nếu x 0 nếu x < 0 57
  58. a) Xác định hằng số a. b) Tính P(−3 < X < 2). c) Tính kỳ vọng của X. 18. Một người hàng ngày đi bộ từ nhà đến nơi làm việc với quãng đường 600m với vận tốc đều v(m/giây). Biết rằng thời gian đi bộ của người đó là một đại lượng ngẫu nhiên phân phối đều trong khoảng từ 6 phút đến 10 phút. Tìm kỳ vọng, độ lệch chuẩn và median của v. 19. Trọng lượng của một con bò là một đại lượng ngẫu nhiên phân phối chuẩn với kỳ vọng là 250 kg và độ lệch tiêu chuẩn 40 kg. Tìm xác suất để một con bò có trọng lượng: a) Nặng hơn 300 kg; b) Nhẹ hơn 175 kg; c) Trong khoảng 260 kg đến 270 kg. 20. Thời gian từ nhà đi đến trường của sinh viên Bình là một đại lượng ngẫu nhiên X có phân phối chuẩn. Biết rằng 65% số ngày Bình đến trường mất hơn 20 phút còn 8% số ngày mất hơn 30 phút. Tìm thời gian trung bình và độ lệch tiêu chuẩn của thời gian đến trường. Bình xuất phát từ nhà trước giờ vào học bao nhiêu phút để khả năng bị muộn học là bé hơn 0, 02. 21. Chiều cao của một loại cây là một đại lượng ngẫu nhiên có phân phối chuẩn. Trong một mẫu gồm 640 cây có 25 cây thấp hơn 18m và 110 cây cao hơn 24m. Tìm kỳ vọng và độ lệch tiêu chuẩn của chiều cao của cây. Ước lượng số cây có độ cao trong khoảng từ 16m đến 20m trong mẫu nói trên. 22. Cho X là đại lượng ngẫu nhiên có phân phối mũ với tham số λ = 2. Tìm kỳ vọng và độ lệch tiêu chuẩn của e−X . 23. Cho X là đại lượng ngẫu nhiên có phân phối mũ với tham số λ = 1 và Y = 2X2. Tính P(2 < Y < 18) và P(Y < 4). 24. Cho vectơ ngẫu nhiên liên tục (X, Y ) có hàm mật độ là ( Cx nếu (x, y) thoả mãn 0 < y < x < 1 p(x, y) = 0 nếu trái lại. a) Tìm C. b) Tìm các hàm mật độ của X và của Y . c) X và Y có độc lập hay không. 25. vectơ ngẫu nhiên liên tục (X, Y ) có hàm mật độ là  x2 y2 C nếu (x, y) thoả mãn + < 1 p(x, y) = 9 4 0 nếu trái lại. a) Tìm C. b) Tìm hàm mật độ của X và Y . 26. Cho vectơ ngẫu nhiên liên tục (X, Y ) có hàm mật độ C p(x, y) = (1 + x2)(1 + y2) a) Tìm C. b) Tìm hàm phân phối của (X, Y ) 58
  59. c) X và Y có độc lập không. √ d) Tìm xác suất√ để điểm (X, Y ) rơi vào hình chữ nhật với các đỉnh là A(1, 1), B( 3, 1), C(1, 0) và D( 3, 0). 27. Một điểm A rơi ngẫu nhiên vào một hình vuông D có cạnh bằng 1. Giả sử (X, Y ) là toạ độ của A. Biết rằng hàm mật độ p(x, y) của (X, Y ) là ( 1 nếu (x, y) ∈ D p(x, y) = 0 nếu (x, y) 6∈ D. Tính xác suất để khoảng cách từ A đến cạnh gần nhất nó bé hơn hay bằng 0, 3. 28. Giả sử X và Y là hai đại lượng ngẫu nhiên độc lập có các hàm phân phối tương ứng là F (x) và G(x). Tìm hàm phân phối của các đại lượng ngẫu nhiên sau đây a)max{X, Y }, b)min{X, Y }, c) max{2X, Y }, d)min{X, Y 3}. 29. Giả sử X và Y là hai đại lượng ngẫu nhiên độc lập có cùng phân phối mũ với tham số λ. Tìm hàm phân phối và hàm mật độ của các đại lượng ngẫu nhiên sau đây a) X3; b) max{X, Y 3} c) min{X, Y 3} . 30. Giả bài toán trên với giả thiết là X và Y có phân phối đều trên đoạn [0, 1]. 31. Giả sử X là đại lượng ngẫu nhiên có phân phối mũ với tham số λ. f(x) là hàm nhận giá trị dương, khả vi và tăng nghiêm ngặt. Tìm hàm mật độ của đại lượng ngẫu nhiên f(X). 32. Chứng minh rằng hàm phân phối của một đại lượng ngẫu nhiên có không quá đếm được điểm gián đoạn. 33. Chứng minh rằng nếu hàm phân phối của một đại lượng ngẫu nhiên liên tục trên toàn trục số, thì nó liên tục đều trên đó. 59