Giáo trình Xác suất (Phần 2)

pdf 61 trang ngocly 2610
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Xác suất (Phần 2)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_xac_suat_phan_2.pdf

Nội dung text: Giáo trình Xác suất (Phần 2)

  1. Chương 4 Véctơ ngẫu nhiên 4.1 Khái niệm véctơ ngẫu nhiên Từ trước đến giờ ta chỉ xét các biến ngẫu nhiên một chiều, nhưng trong thực tế để mô tả kết quả của một thí nghiệm cần đồng thời hai hoặc nhiều hơn hai biến ngẫu nhiên. Ví dụ, nghiên cứu đặc tính chiều cao và cân nặng của phụ nữ Việt Nam, nghiên cứu nhiệt độ và áp suất trong một thí nghiệm vật lý và nghiên cứu nhiệt độ ở các tháng trong năm của một vùng nào đó. Trong những trường hợp này, đồng thời hai hoặc nhiều hơn hai biến ngẫu nhiên được xét đến. Một bộ có thứ tự gồm hai hoặc nhiều hơn hai biến ngẫu nhiên được gọi là véctơ ngẫu nhiên. Một bộ có thứ tự n biến ngẫu nhiên (X1, ,Xn) gọi là một véctơ ngẫu nhiên n chiều. Trong tài liệu này véctơ ngẫu nhiên hai chiều thường được ký hiệu (X,Y ). Véctơ ngẫu nhiên n chiều là liên tục hay rời rạc nếu các biến ngẫu nhiên thành phần là liên tục hay rời rạc. Ví dụ 4.1. Một nhà máy sản xuất một loại sản phẩm, nếu kích thước của sản phẩm được đo bằng chiều dài X và chiều rộng Y thì ta có véctơ ngẫu nhiên hai chiều, còn nếu xét thêm cả chiều cao Z nữa thì ta có véctơ ngẫu nhiên ba chiều. Nếu ta chỉ quan tâm đến trọng lượng và thể tích của sản phẩm ta cũng được biến ngẫu nhiên hai chiều. 4.2 Hàm phân phối của véctơ ngẫu nhiên hai chiều Định nghĩa 4.1 (Hàm phân phối đồng thời). Hàm phân phối xác suất đồng thời của véctơ ngẫu nhiên (X,Y ) là hàm hai biến F (x, y) được định nghĩa F (x, y)= P (X<x,Y <y) với mọi <x,y < (4.1) −∞ ∞ Hàm phân phối xác suất đồng thời F (x, y) của véctơ ngẫu nhiên (X,Y ) có các tính
  2. 4.3 Véctơ ngẫu nhiên rời rạc hai chiều 58 chất cơ bản sau: Tính chất 4.2. Véctơ ngẫu nhiên (X,Y ) có hàm phân phối đồng thời F (x, y). Hàm phân phối lề của biến ngẫu nhiên X (hay hàm phân phối của biến ngẫu nhiên X) cho bởi FX (x)= P (X < x)= F (x, + ) = lim F (x, y) (4.2) y + ∞ → ∞ Tính chất 4.3. Hàm phân phối lề của biến ngẫu nhiên Y (hay hàm phân phối của biến ngẫu nhiên Y ) cho bởi FY (y)= P (Y <y)= F (+ ,y) = lim F (x, y) (4.3) x + ∞ → ∞ Tính chất 4.4. Nếu cả hai biến x, y dần đến + thì hàm F (x, y) dần đến 1 nghĩa là ∞ lim F (x, y)=1 (4.4) x + y→+∞ → ∞ Tính chất 4.5. Nếu có ít nhất một biến dần đến thì hàm phân phối đồng thời −∞ F (x, y) dần đến không, nghĩa là lim F (x, y) = lim F (x, y) = lim F (x, y)=0 (4.5) x y x →−∞ →−∞ y→−∞ →−∞ hay gọn hơn F ( ,y)= F (x, )= F ( , )=0 −∞ −∞ −∞ −∞ Tính chất 4.6. Hàm phân phối đồng thời F (x, y) là hàm không giảm theo từng biến số, ngĩa là F (x ,y) F (x ,y) khi x < x 1 ≤ 2 1 2 F (x, y ) F (x, y ) khi y <y 1 ≤ 2 1 2 4.3 Véctơ ngẫu nhiên rời rạc hai chiều 4.3.1 Phân phối đồng thời Để mô tả véctơ ngẫu nhiên (X,Y ) nhận giá trị nào đó với xác suất tương ứng là bao nhiêu thì người ta sữ dụng bảng phân phối xác suất 4.1
  3. . ét guninrirchichiều hai rạc rời nhiên ngẫu Véctơ 4.3 H HH Y HH y1 y2 yj yn Tổng dòng X HH ··· ··· x f(x ,y ) f(x ,y ) f(x ,y ) f(x ,y ) f(x , ) 1 1 1 1 2 ··· 1 j ··· 1 n 1 • x f(x ,y ) f(x ,y ) f(x ,y ) f(x ,y ) f(x , ) 2 2 1 2 2 ··· 2 j ··· 2 n 2 • . . . . . . . . . . . . ··· ··· x f(x ,y ) f(x ,y ) f(x ,y ) f(x ,y ) f(x , ) i i 1 i 2 ··· i j ··· i n i • . . . . . . . . . . . . ··· ··· x f(x ,y ) f(x ,y ) f(x ,y ) f(x ,y ) f(x , ) m m 1 m 2 ··· m j ··· m n m • Tổng cột f( ,y ) f( ,y ) f( ,y ) f( ,y ) 1 • 1 • 2 ··· • j ··· • n Bảng 4.1: Phân phối xác suất đồng thời của (X,Y ) 59
  4. 4.3 Véctơ ngẫu nhiên rời rạc hai chiều 60 Ví dụ 4.2. Biến ngẫu nhiên rời rạc X nhận các giá trị 6, 7 và 8. Biến ngẫu nhiên Y nhận các giá trị 1, 2, 3, 4. Phân phối đồng thời của véctơ ngẫu nhiên (X,Y ) cho bởi bảng 4.2 H H Y HH H 1 2 3 4 X HH 6 0,1 0 0,1 0,0 7 0,3 0,0 0,1 0,2 8 0,0 0,2 0,0 0,0 Bảng 4.2: Phân phối đồng thời của (X,Y ) Ta sẽ xác định giá trị P (X 7,Y 2) và P (X = 6). Bằng cách lấy tổng các hàm giá ≥ ≥ trị xác suất f(x, y) tương ứng với X 7 và Y 2 chúng ta tính được ≥ ≥ P (X 7,Y 2) = f(7, 2)+ f(7, 3)+ f(7, 4) ≥ ≥ +f(8, 2)+ f(8, 3)+ f(8, 4) = 0, 0+0, 1+0, 2+0, 2+0, 0+0, 0=0, 5 Cộng các giá trị xác suất của dòng đầu tiên ta có P (X =6) = f(6, 1)+ f(6, 2)+ f(6, 3)+ f(6, 4) = 0, 1+0, 0+0, 1+0, 0=0, 2 4.3.2 Phân phối lề (Véctơ ngẫu nhiên rời rạc) Nếu biết được phân phối đồng thời của véctơ ngẫu nhiên (X,Y ) ta cũng sẽ xác định được phân phối của biến ngẫu nhiên X hoặc phân phối của biến ngẫu nhiên Y . Phân phối của X hoặc Y còn được gọi là phân phối lề của X hoặc Y . Phân phối lề của biến ngẫu nhiên X n f (x )= f(x , )= f(x ,y ) X i i • i j j=1 X Bảng phân phối của biến ngẫu nhiên X
  5. 4.3 Véctơ ngẫu nhiên rời rạc hai chiều 61 X x x x 1 2 ··· m P f (x ) f (x ) f (x ) X X 1 X 3 ··· X m Phân phối lề của biến ngẫu nhiên Y m f (y )= f( ,y )= f(x ,y ) Y j • j i j i=1 X Bảng phân phối của biến ngẫu nhiên Y Y y y y 1 2 ··· n P f (y ) f (y ) f (y ) Y Y 1 Y 2 ··· Y n Ví dụ 4.3. Tung ba đồng xu cân đối I, II, III, gọi X là số mặt ngửa xuất hiện của 2 đồng xu I, II và Y là số mặt ngửa xuất hiện của cả 3 đồng tiền I, II, III. Hãy lập bảng phân phối xác suất đồng thời của véctơ ngẫu nhiên (X,Y ). Giải. Bảng 4.3 cho chúng ta kết quả của việc tung 3 đồng xu và tính các giá trị của X và Y tương ứng, trong đó N ký hiệu mặt ngửa xuất hiện còn S là mặt sấp. Ta có 8 I II III X Y N N N 2 3 N N S 2 2 N S N 1 2 N S S 1 1 S N N 1 2 S N S 1 1 S S N 0 1 S S S 0 0 Bảng 4.3: Kết quả phép thử kết quả đồng khả năng của việc tung 3 đồng xu, do đó xác suất 1 1 P (X =2,Y =3)= , P (X =2,Y =2)= , 8 8
  6. 4.4 Véctơ ngẫu nhiên liên tục hai chiều 62 H HH Y H 0 1 2 3 Tổng dòng X HH 0 1/8 1/8 0 0 2/8 1 0 2/8 2/8 0 4/8 2 0 0 1/8 1/8 2/8 Tổng cột 1/8 3/8 3/8 1/8 1 Bảng 4.4: Xác suất đồng thời Tính tương tự cho các xác suất đồng thời còn lại ta có bảng phân phối đồng thời như bảng 4.4 Bảng phân phối của biến ngẫu nhiên X X 0 1 2 PX 2/8 4/8 2/8 Bảng phân phối của biến ngẫu nhiên Y Y 0 1 2 2 PY 1/8 3/8 3/8 1/8 4.4 Véctơ ngẫu nhiên liên tục hai chiều 4.4.1 Phân phối đồng thời Định nghĩa 4.7 (Hàm mật độ đồng thời). Hàm mật độ xác suất đồng thời của véctơ ngẫu nhiên (X,Y ), ký hiệu f(x, y), là hàm hai biến thỏa các điều kiện a) f(x, y) 0 với mọi <x,y < + . ≥ −∞ ∞ + + b) ∞ ∞f(x, y)dxdy =1. −∞R −∞R c) Với mọi tập I R2 thì xác suất ⊂ P ((X,Y ) I)= f(x, y)dxdy ∈ ZZI
  7. 4.4 Véctơ ngẫu nhiên liên tục hai chiều 63 Cũng giống như trường hợp biến ngẫu nhiên một chiều, ta có quan hệ giữa hàm phân phối xác suất đồng thời F (x, y) và hàm mật độ xác suất đồng thời f(x, y). Xác định F (x, y) khi đã biết f(x, y) x y F (x, y)= f(u, v)dudv (4.6) Z Z −∞ −∞ Và khi F (x, y) khả vi theo x và y, hàm mật độ đồng thời ∂2 f(x, y)= F (x, y) (4.7) ∂x∂y Ví dụ 4.4. Giả sử véctơ ngẫu nhiên (X,Y ) có hàm mật độ đồng thời 2 (2x2y + xy2) với 0 x 3 và 1 y 2 f(x, y)= 75 ≤ ≤ ≤ ≤   0 nơi khác Ví dụ này sẽ minh họa cách tính xác suất đồng thời khi biết hàm mật độ. Giả sử ta cần tính xác suất. 5 2 3 4 5 P 1 X 2, Y = f(x, y)dxdy ≤ ≤ 3 ≤ ≤ 3   Z1 Z4 3 5 2 3 2 = 2x2y + xy2 dy dx 75   Z1 Z4  3   2   2 61 187 = x2 + x dx = 75 81 2025 Z1   Tiếp theo, chúng ta đi tìm hàm phân phối xác suất đồng thời của véctơ ngẫu nhiên (X,Y ), với mọi x [0, 3] và y [1, 2], bởi vì f(x, y)=0 khi x< 0 hay y < 1, ∈ ∈ x y F (x, y) = P (X<x,Y <y)= f(u, v)dv du   Z Z −∞ −∞ x y   2 = 2u2v + uv2 dv du 75   Z Z 0 1  1   = 2x3y2 2x3 + x2y3 x2 225 − − Chú ý: Ở trên chúng ta mới chỉ xét trường hợp x [0, 3] và y [1, 2]. ∈ ∈
  8. 4.4 Véctơ ngẫu nhiên liên tục hai chiều 64 4.4.2 Phân phối lề (Véctơ ngẫu nhiên liên tục) Véctơ ngẫu nhiên liên tục (X,Y ) có hàm phân phối xác suất đồng thời F (x, y), hàm phân phối lề của biến ngẫu nhiên X FX (x) = P (X < x)= P (X < x, <Y < + ) x + x−∞ ∞ ∞ = f(u, v)dvdu = fX (u)du (4.8) Z Z Z −∞ −∞ −∞ Trong đó + ∞ fX (u)= f(u, v)dv (4.9) Z −∞ gọi là hàm mật độ lề của biến ngẫu nhiên X. Tương tự chúng ta cũng có hàm phân phối xác suất lề của biến ngẫu nhiên Y FY (y) = P (Y <y)= P ( <X< + ,Y <y) y + −∞ y ∞ ∞ = f(u, v)dudv = fY (v)dv (4.10) Z Z Z −∞ −∞ −∞ Trong đó + ∞ fY (v)= f(u, v)du (4.11) Z −∞ Gọi là hàm mật độ xác suất lề của biến ngẫu nhiên Y . Tương tự như biến ngẫu nhiên một chiều, ta có quan hệ giữa hàm mật độ xác suất lề và hàm phân phối xác suất lề của biến ngẫu nhiên X như sau x d F (x)= f (u)du và f(x)= F (x) X X dx Z −∞ Quan hệ giữa hàm mật độ xác suất lề và hàm phân phối xác suất lề của biến ngẫu nhiên Y y d F (y)= f (v)dv và f(y)= F (y) Y Y dy Z −∞
  9. 4.5 Phân phối có điều kiện và sự độc lập 65 Ví dụ 4.5. Cho hai biến ngẫu nhiên X và Y có hàm mật độ xác suất đồng như ví dụ 4.4. Hàm mật độ lề fX (x) của biến ngẫu nhiên X tính từ hàm mật độ đồng thời f(x, y), theo công thức (4.9) + ∞ fX (x) = f(x, y)dy Z −∞ 2 2 2 = 2x2y + xy2 dy = 7x +9x2 75 225 Z 1   Tương tự như cách tìm hàm mật độ lề fX (x) của biến ngẫu nhiên X, hàm mật độ lề fY (y) của biến ngẫu nhiên Y + ∞ fY (y) = f(x, y)dx Z −∞ 3 2 3 = 2x2y + xy2 dx = 4y + y2 75 25 Z 0   Chúng ta cũng có thể tìm được các hàm mật độ lề từ hàm phân phối xác suất đồng thời f(x, y). 4.5 Phân phối có điều kiện và sự độc lập Hai khái niệm quan trọng đã được trình bày ở mục 2.5 là xác suất có điều kiện và sự độc lập của hai biến cố. Bây giờ chúng ta đi tìm hiểu phân phối có điều kiện và sự độc lập của hai biến ngẫu nhiên X và Y . Định nghĩa 4.8. Hàm phân phối xác suất có điều kiện của biến ngẫu nhiên X khi Y nhận giá trị y được định nghĩa F (x y)= P (X < x Y = y) (4.12) X | | Khi X là biến ngẫu nhiên rời rạc, hàm xác suất có điều kiện của biến ngẫu nhiên X khi biết Y = y cho bởi f (x y)= P (X = x Y = y) (4.13) X | | Sữ dụng công thức xác suất có điều kiện (2.5) chúng ta có P(X = x, Y = y) f (x y)= P (X = x Y = y)= X | | P (Y = y)
  10. 4.5 Phân phối có điều kiện và sự độc lập 66 hay f(x, y) fX (x y)= , nếu fY (y) > 0 (4.14) | fY (y) Công thức (4.14) cho chúng ta mối quan hệ giữa hàm xác suất có điều kiện f (x y) X | và hàm xác suất đồng thời f(x, y). Theo công thức (2.6), hai biến ngẫu nhiên X và Y là độc lập khi và chỉ khi f (x y)= f (x) (4.15) X | X Khi X và Y độc lập, công thức (4.14) trở thành f(x, y)= fX (x)fY (y) (4.16) Vậy hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi hàm xác suất đồng thời bằng tích các hàm xác suất lề của X và Y . Khi X là biến ngẫu nhiên liên tục, hàm mật độ có điều kiện của biến ngẫu nhiên X khi biết Y = y là đạo hàm của hàm phân phối xác suất có điều kiện của biến ngẫu nhiên X khi biết Y = y d f (x y)= F (x y) (4.17) X | dx X | Với F (x y) được định nghĩa như công thức (4.12), xác suất có điều kiện | P (x <X x y <Y y ) P (x <X x y <Y y )= 1 ≤ 2 ∩ 1 ≤ 2 (4.18) 1 ≤ 2| 1 ≤ 2 P (y <Y y ) 1 ≤ 2 f(x, y) là hàm mật độ đồng thời của véctơ ngẫu nhiên (X,Y ), y2 x2 f(x, y)dxdy y1 x1 P (x1 <X x2 y1 <Y y2) = ≤ | ≤ yR2 +R ∞f(x, y)dxdy y1 −∞ Ry2 xR2 f(x, y)dxdy y x = 1 1 (4.19) R Ry2 fY (y)dy y1 R Cho x = , x = x, y = y và y = y + ∆y, và lấy giới hạn ∆y 0, công thức 1 −∞ 2 1 2 → (4.19) sẽ trở thành x f(u,y)du FX (x y)= −∞ , với fY (y) =0 (4.20) | R fY (y) 6
  11. 4.6 Kỳ vọng có điều kiện 67 Công thức (4.17) trở thành d f(x, y) fX (x y)= FX (x y)= , với fY (y) =0 (4.21) | dx | fY (y) 6 Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi F (x y)= F (x) (4.22) X | X Lấy đạo hàm hai vế (4.22) theo x ta được f (x y)= f (x) (4.23) X | X Thay f (x y) trong công thức (4.23) vào công thức (4.21), X | f(x, y)= fX (x)fY (y) (4.24) là điều kiện cần và đủ để biến ngẫu nhiên X và Y độc lập. Lấy tích phân hai vế của (4.24) ta cũng có điều kiện tương đương F (x, y)= FX (x)FY (y) (4.25) 4.6 Kỳ vọng có điều kiện Định nghĩa 4.9 (Kỳ vọng có điều kiện). Cho véctơ ngẫu nhiên (X,Y ), kỳ vọng của biến ngẫu nhiên X với điều kiện Y = y, ký hiệu E (X Y = y) là hàm số của biến ngẫu | nhiên Y . 1. Nếu X, Y là các biến ngẫu nhiên rời rạc, hàm xác suất có điều kiện của X với Y = y là fX (x, y), kỳ vọng có điều kiện E (X Y = y)= xP (X = x Y = y)= xf (x y) (4.26) | | X | x x X X với mọi giá trị y sao cho f (y)= P (Y = y) =0 Y 6 2. Nếu X, Y là các biến ngẫu nhiên liên tục, hàm mật độ xác suất có điều kiện của X với Y = y là f (x y), kỳ vọng có điều kiện X | + ∞ E (X Y = y)= xf (x y)dx (4.27) | X | Z −∞ với mọi giá trị y sao cho f (y) =0 Y 6
  12. 4.7 Hiệp phương sai và hệ số tương quan 68 4.7 Hiệp phương sai và hệ số tương quan 4.7.1 Hiệp phương sai - Covariance Trong chương 3 chúng ta đã biết là đối với hai biến ngẫu nhiên X và Y thì ta luôn có đẳng thức E (X + Y )= E (X)+ E (Y ) còn đối với phương sai của tổng Var (X + Y ) và kỳ vọng của tích E (XY ) thì nó có tính chất như thê nào? Trong mục này chúng ta sẽ tìm hiểu vấn đề này. Trước hết chúng ta xét ví dụ Ví dụ 4.6. Cho hai biến ngẫu nhiên X và Y có hàm mật độ xác suất đồng thời f(x, y) như ví dụ 4.4. Từ ví dụ 4.5 chúng ta đã xác định được các hàm mật độ lề fX (x) và fY (y). Chúng ta dễ dàng tính được phương sai của tổng 939 Var (X + Y )= 2000 và tổng các phương sai 989 791 4747 Var (X)+ Var (Y )= + = 2500 10000 10000 điều này cho thấy Var (X + Y ) = Var (X)+ Var (Y ). 6 Ta phân tích Var (X + Y ) = E (X + Y E [X + Y ])2 − = E ([X E (X)]+[Y E (Y )])2 − − = E (X E[X])2 + E (Y E[Y ])2 − − +2E (X E [X]) (Y E [Y ]) − − = Var (X)+ Var (Y )+2E (X E [X]) (Y E [Y ]) − − do đó phương sai của X + Y bằng với phương sai của X cộng với phương sai của Y và cộng thêm 2E (X E [X]) (Y E [Y ]). Để đánh giá tác động qua lại giữa X và Y , − − trước hết chúng ta định nghĩa Định nghĩa 4.10 (Hiệp phương sai - Covariance). Cho X và Y là hai biến ngẫu nhiên, hiệp phương sai giữa X và Y , ký hiệu Cov (X,Y ) được định nghĩa Cov (X,Y )= E (X E [X]) (Y E [Y ]) (4.28) − −
  13. 4.7 Hiệp phương sai và hệ số tương quan 69 Bằng cách biến đổi công thức hiệp phương sai (4.28) chúng ta được công thức khác của hiệp phương sai Cov (X,Y )= E (XY ) E (X) E (Y ) ∗ (4.29) − Ví dụ 4.7. Cho hai biến ngẫu nhiên X và Y có hàm mật độ xác suất đồng thời như ví dụ 4.4. Chúng ta tìm được E (X) = 109/50, E (Y ) = 157/100 và E (XY ) = 171/50. Vậy chúng ta tính được hiệp phương sai 171 109 157 13 Cov (X,Y )= = 50 − 50 · 100 −5000 Hơn nữa, ví dụ này cũng cho ta biết E (XY ) = E (X) E (Y ) . 6 Nhưng theo bài tập 4.10, khi X và Y độc lập thì E (XY )= E (X) E (Y ) ta suy ra hiệp phương sai Cov(X,Y )= E (XY ) E (X) E (Y )=0 − Tính chất 4.11. Nếu hai biến ngẫu nhiên X và Y độc lập và có phương sai hữu hạn thì Cov (X,Y )=0 (4.30) và phương sai của X + Y Var (X + Y )= Var (X)+ Var (Y ) (4.31) Chú ý: Nếu hai biến ngẫu nhiên X và Y có Cov (X,Y )=0 thì ta nói X và Y không tương quan, nhưng không thể suy ra được X và Y là độc lập. Ví dụ 4.8. Giả sử biến ngẫu nhiên X chỉ nhận các giá trị -1, 0 và 1 với xác suất như nhau. Biến ngẫu nhiên Y = X2, chúng ta sẽ chỉ ra rằng C (ov)(X,Y )=0 nhưng X và Y không độc lập. Trong ví dụ này rõ ràng X và Y không độc lập bởi vì giá trị của biến ngẫu nhiên Y xác định dựa vào giá trị của biến ngẫu nhiên X. Tuy nhiên E (XY )= E X3 = E (X)=0 Bởi vì E (XY )=0 và E (X) E (Y )=0 cho nên Cov (X,Y )=0. Tính chất 4.12. Cho hai biến ngẫu nhiên X,Y và a,b,c,d là các hằng số thực Cov (aX + b,cY + d)= acCov (X,Y ) (4.32) ∗Xem bài tập 4.11
  14. 4.7 Hiệp phương sai và hệ số tương quan 70 Định lý 4.13 (Phương sai của tổng n biến ngẫu nhiên). Nếu X1, ,Xn là n biến ngẫu nhiên độc lập sao cho Var (X ) < + với mọi i =1, ,n thì i ∞ n n Var Xi = Var (Xi)+2 Cov (Xi,Xj) (4.33) i=1 ! i=1 i<j X X XX Chứng minh. Với biến ngẫu nhiên Y bất kỳ, Cov(Y,Y )= Var (Y ). Do đó n n n n n Var Xi = Cov Xi, Xj = Cov (Xi,Xj) i=1 ! i=1 j=1 ! i=1 j=1 X X X X X Chúng ta sẽ tách tổng cuối thành hai tổng: tổng của các i = j và tổng của các i = j. 6 Sau đó chúng ta dùng tính chất Cov (Xi,Xj)= Cov (Xj,Xi), ta được n n Cov Xi = Var(Xi)+ Cov (Xi,Xj) i=1 ! i=1 i=j 6 X Xn XX = Var (Xi)+2 Cov (Xi,Xj) i=1 i<j X XX 4.7.2 Hệ số tương quan Trong phần trước, chúng ta thấy hiệp phương sai giữa các biến ngẫu nhiên là “dấu hiệu” nhận biết sự ảnh hưởng lẫn nhau. Một điểm bất tiện khi dùng hiệp phương sai là bởi vì nó phụ thuộc vào đơn vị đo của biến ngẫu nhiên. Ví dụ hai biến ngẫu nhiên gồm X - chiều cao đo bằng mét và Y - cân nặng đo băng bằng kg của một người. Hiệp phương sai là Cov(X,Y ), còn nếu chiều cao đo bằng cm thì hiệp phương sai giữa 10X và Y là Cov (10X,Y ) = E (10XY ) E (10X) E (Y ) − = 10(E[XY ] E[X]E[Y ]) − = 10Cov (X,Y ) Rõ ràng hiệp phương sai tăng lên 10 lần do việc đổi đơn vị từ m sang cm. Để khác phục nhược điểm này, người ta định nghĩa một hệ số khác gọi là hệ số tương quan Định nghĩa 4.14 (Hệ số tương quan). Cho X và Y là hai biến ngẫu nhiên. Hệ số tương quan, ký hiệu ρ(X,Y ), được định nghĩa là bằng 0 nếu Var (X)=0 hoặc Var (Y )=0 và Cov (X,Y ) ρ(X,Y )= (4.34) Var(X)Var(Y ) nếu ngược lại. p
  15. 4.8 Bài tập luyện tập 71 Từ định nghĩa hệ số tương quan ta có ngay tính chất Tính chất 4.15. Cho X,Y là hai biến ngẫu nhiên thì hệ số tương quan 1 ρ(X,Y ) 1 (4.35) − ≤ ≤ Chứng minh. Bởi vì phương sai của một biến ngẫu nhiên luôn dương cho nên X Y 0 Var ≤ Var(X) Var(Y )! p X p Y = Var + Var Var(X)! Var(Y )! p X Y p +2Cov , Var(X) Var(Y )! Var(X) Var(Y ) 2Cov(X,Y ) = +p +p Var(X) Var(Y ) Var(X)Var(Y ) = 2+2ρ(X,Y ) p Chuyển vế ta được ρ(X,Y ) 1. Chứng minh tương tự bằng cách thay X bằng X ≥ − − thì ta cũng được ρ(X,Y ) 1 ≤ 4.8 Bài tập luyện tập Bài tập 4.1. Véctơ ngẫu nhiên rời rạc (X,Y ) có phân phối đồng thời cho ở bảng 4.5. Xác định phân phối lề của biến ngẫu nhiên X và Y H HH Y H 1 2 3 4 X HH 1 16/136 3/136 2/136 13/136 2 5/136 10/136 11/136 8/136 3 9/136 6/136 7/136 12/136 4 4/136 15/136 14/136 1/136 Bảng 4.5: Bài tập 4.2. Phân phối xác suất đồng thời của véctơ ngẫu nhiên rời rạc (X,Y ) cho bởi bảng 4.6
  16. 4.8 Bài tập luyện tập 72 H HH Y H 0 1 2 P (X = x) X HH -1 . . . . . . . . . 1/2 1 . . . 1/2 . . . 1/2 P (Y = y) 1/6 2/3 1/6 1 Bảng 4.6: a. Hoàn thành bảng phân phối. b. Xét tính độc lập giữa X và Y . c. Xác định E(XY ), Var(X + Y ) và Var(X Y ). − Bài tập 4.3. Phân phối lề của các biến ngẫu nhiên X và Y cho như bảng 4.7 Cho H HH Y H 1 2 3 4 5 P (X = x) X HH 1 . . . . . . . . . . . . . . . 5/14 2 . . . . . . . . . . . . . . . 4/14 3 . . . . . . . . . . . . . . . 2/14 4 . . . . . . . . . . . . . . . 2/14 5 . . . . . . . . . . . . . . . 1/14 P (Y = y) 2/14 5/14 4/14 2/14 1/14 1 Bảng 4.7: biết giá trị xác suất đồng thời P (X = x, Y = y) là 0 hoặc 1/14. Xác định phân phối đồng thời của véctơ ngẫu nhiên (X,Y ). Bài tập 4.4. Cho η là một số thực, xác suất đồng thời P (X = x, Y = y) của véctơ ngẫu nhiên rời rạc (X,Y ) cho bởi bảng 4.8 a. Xác định giá trị của η. b. Có giá trị nào để X và Y độc lập. Bài tập 4.5. Giả sử véctơ ngẫu nhiên (X,Y ) có phân phối xác suất đồng thời 2x y (2x+y) 1 e− e− + e− khi x> 0,y> 0 F (x, y)= − −   0 nơi khác 
  17. 4.8 Bài tập luyện tập 73 H HH Y H -1 0 1 X HH 4 η 1 1 η 0 − 16 4 − 1 3 1 5 8 16 8 6 η + 1 1 1 η 16 16 4 − Bảng 4.8: a. Xác định hàm phân phối xác suất lề của các biến ngẫu nhiên X và Y . b. Xác định hàm mật độ xác suất đồng thời của véctơ ngẫu nhiên (X,Y ). c. Xét tính độc lập giữa X và Y . Bài tập 4.6. Cho véctơ ngẫu nhiên liên tục (X,Y ) với hàm mật độ xác suất đồng thời 12 xy(1 + y) khi 0 x 1 và 0 y 1 f(x, y)= 5 ≤ ≤ ≤ ≤   0 nơi khác  1 1 1 2 a. Tìm xác suất P X , Y . 4 ≤ ≤ 2 3 ≤ ≤ 3   b. Xác định hàm phân phối đồng thời F (x, y) của véctơ ngẫu nhiên (X,Y ) khi x, y thuộc đoạn [0, 1]. c. Sữ dụng câu b, tìm hàm phân phối lề FX (x) của biến ngẫu nhiên X khi x thuộc đoạn [0, 1]. d. Xét tính độc lập giữa X và Y . e. Tính xác suất P (X<Y ). Bài tập 4.7. Hàm mật độ đồng thời của véctơ ngẫu nhiên (X,Y ) k(3x2 +8xy) khi 0 x 1 và 0 y 2 f(x, y)= ≤ ≤ ≤ ≤   0 nơi khác  a. Xác định k.
  18. 4.8 Bài tập luyện tập 74 b. Tính xác suất P (2X Y ). ≤ c. Tìm hàm phân phối xác suất đồng thời của véctơ ngẫu nhiên (X,Y ). d. Tìm hàm phân phối xác suất lề của X và Y . e. Tìm hàm mật độ xác suất lề của X và Y . f. Tính E(X), E(Y ) và E (X + Y ). g. Tính E(XY ) và ρ(X,Y ). h. Tính E (X2) , E (Y 2) và E ([X + Y ]2). i. Tính Var(X +Y ), Var(X), Var(Y ) và kiểm tra phát biểu Var(X +Y )) không bằng với Var(X)+ Var(Y ). Bài tập 4.8. Véctơ ngẫu nhiên (X,Y ) có hàm mật độ xác suất đồng thời k(x2 + y) khi 0 y 1 x2 f(x, y)= ≤ ≤ −   0 nơi khác  a. Xác định hằng số k. 1 b. Tính xác suất P 0 X , P (Y X + 1) và P (Y X2). ≤ ≤ 2 ≤ ≤   Bài tập 4.9. Cho hàm mật độ đồng thời của véctơ ngẫu nhiên (X,Y ) c(x + y2) khi 0 x 1 và 0 y 1 f(x, y)= ≤ ≤ ≤ ≤   0 nơi khác  a. Xác định hằng số c. 1 1 b. Tìm F (x y) và tính P X < Y = . X | 2 2   Bài tập 4.10. Cho X,Y là hai biến ngẫu nhiên độc lập, chứng minh rằng E(XY )= E(X)E(Y ) Bài tập 4.11. Chứng minh công thức tính hiệp phương sai (4.29).
  19. 4.8 Bài tập luyện tập 75 Bài tập 4.12. Cho hai biến ngẫu nhiên X và Y so cho E(X)=2, E(Y )=3, Var(X)=4 a. Tính E (X2). b. Tính E ( 2X2 + Y ). − Bài tập 4.13. Cho hai biến ngẫu nhiên X và Y có hàm mật độ đồng thời 2 (2x2y + xy2) với 0 x 3 và 1 y 2 f(x, y)= 75 ≤ ≤ ≤ ≤   0 nơi khác  a. Tìm hàm phân phối xác suất đồng thời của véctơ ngẫu nhiên (X,Y ). b. Tìm hàm phân phối xác suất lề của X và Y . c. Tìm hàm mật độ xác suất lề của X và Y . d. Kiểm tra tính độc lập giữa X và Y . e. Tính E(X), E(Y ) và E (X + Y ). f. Tính E(XY ) và ρ(X,Y ). g. Tính E (X2) , E (Y 2) và E ([X + Y ]2). h. Tính Var(X +Y ), Var(X), Var(Y ) và kiểm tra phát biểu Var(X +Y )) không bằng với Var(X)+ Var(Y ).
  20. Chương 5 Một số phân phối đặc biệt 5.1 Phân phối Bernoulli và nhị thức Định nghĩa 5.1 (Biến ngẫu nhiên Bernoulli). Thực hiện một phép thử, ta quan tâm đến biến cố A. Nếu biến cố A xảy ra (thành công) thì X nhận giá trị là 1, (X = 1), ngược lại biến ngẫu nhiên X nhận giá trị 0. Phép thử này gọi là phép thử Bernoulli. Giả sử xác suất xảy ra biến cố A là p, 0 p 1 ≤ ≤ P (A)= P (X =1)= p và P A¯ = P (X =0)=1 p = q − Khi đó biến ngẫu nhiên X được  gọi là biến ngẫu nhiên Bernoulli với tham số p, ký hiệu X B(1; p). ∼ Bảng phân phối xác suất của biến ngẫu nhiên Bernoulli có dạng X 1 0 P p q Dựa vào bảng phân phối xác suất của biến ngẫu nhiên Bernoulli ta dễ dàng tính được E (X)=1 và Var (X)= pq. Ví dụ 5.1. Sinh viên A trả lời một bài tập trắc nghiệm có bốn lựa chọn trong đó chỉ có một lựa chọn đúng, giả sử sinh viên này chọn câu trả lời một cách ngẫu nhiên.
  21. 5.1 Phân phối Bernoulli và nhị thức 77 Chúng ta đặt biến ngẫu nhiên 1 nếu sinh viên A chọn câu trả lời đúng X =   0 nếu sinh viên A chọn câu trả lời sai Thì khi đó biến ngẫu nhiên X là biến ngẫu nhiên Bernoulli, bảng phân phối xác suất của X Tiếp theo chúng ta xét một ví dụ liên quan đến dãy phép thử Bernoulli. X 1 0 P 1/4 3/4 Ví dụ 5.2. Một bài thi trắc nghiệm có 10 câu hỏi, mỗi câu hỏi có bốn lựa chọn câu trả lời. Giả sử ở mỗi câu hỏi bạn chọn câu trả lời một cách ngẫu nhiên, câu hỏi đặt ra ở đây là xác suất để bạn trả lời đúng k, (k =0, 1, , 10), câu là bao nhiêu? Ta gọi biến ngẫu nhiên 1 nếu trả lời đúng câu i X = i   0 nếu trả lời sai câu i thì Xi, (i = 1, , 10) là các biến ngẫu nhiên Bernoulli với tham số p = 1/4. Số câu bạn trả lời đúng sẽ là X = X + + X 1 ··· 10 Rõ ràng X chỉ nhận một trong các giá trị 0, 1, , 10. Trước hết chúng ta xét trường hợp X =0 (nghĩa là bạn trả lời không đúng cả 10 câu). Bởi vì việc chọn câu trả lời là ở các câu khác nhau nên các biến cố X = x , , X = x là độc lập, với x là { 1 1} { 10 10} i 0 hoặc 1. Chúng ta tìm P (X =0) = P Trả lời không đúng cả 10 câu P = (X1 =0, ,X10 = 0)  = P (X1 = 0) . . . P (X10 = 0) 3 10 = 4   Tiếp theo ta tính xác suất trả lời đúng duy nhất một câu, câu trả lời đúng này sẽ là
  22. 5.1 Phân phối Bernoulli và nhị thức 78 một trong 10 câu cho nên P (X =0) = P (X = 1) P (X = 0) P (X = 0) P (X = 0) 1 2 3 ··· 10 + P (X1 = 0) P (X2 = 1) P (X3 = 0) P (X10 = 0) . ··· . + P (X = 0) P (X = 0) P (X = 0) P (X = 1) 1 2 3 ··· 10 1 1 3 9 = 10 · 4 · 4     Chúng ta có thể suy ra được xác suất trả lời đúng k câu hỏi, (k =0, 1, , 10), là k 10 k 1 3 − P (X = k)= Ck 10 · 4 · 4     k Trong đó k là số câu trả lời đúng, 10 k là số câu trả lời sai và C10 là số trường hợp − k có thể để có k câu trả lời đúng. Cho nên C10 là số cách khác nhau để chọn k câu trả lời đúng từ 10 câu. Như đã tính ở trên ta biết biết số trường hợp để cả 10 câu đều sai 0 1 là C10 =1 và có C10 = 10 trường hợp để trả lời đúng một câu. Tổng quát hơn, ta phát biểu mô hình nhị thức như sau. Định nghĩa 5.2 (Mô hình nhị thức). Thực hiện n phép thử Bernoulli độc lập với xác suất thành công trong mỗi phép thử là p. Gọi X là số lần thành công (biến cố A xảy ra) trong n phép thử thì X = X + + X 1 ··· n với Xi, (i =1, ,n), là biến ngẫu nhiên Bernoulli. Khi đó X là biến ngẫu nhiên rời rạc với miền giá trị S = 0, ,n và xác suất { } k k n k P (X = k)= C p q − , k S (5.1) n ∈ X được gọi là có phân phối nhị thức với các tham số n, p ký hiệu X B (n; p). ∼ Ví dụ 5.3. Trong ví dụ 5.2 biến ngẫu nhiên X B(1/4;10). Giả sử để đỗ kỳ thi này ∼ thì bạn phải trả lời trúng ích nhất 6 câu. Xác suất bạn thi đỗ sẽ là P (X 6) = P (X = 6)+ + P (X =10)=0, 0197 ≥ ··· Định lý 5.3 (Các đặc trưng của biến ngẫu nhiên nhị thức). Nếu X là biến ngẫu nhiên có phân phối nhị thức B (n, p) thì i) E (X)= np. ii) Var (X)= npq.
  23. 5.1 Phân phối Bernoulli và nhị thức 79 1,0 0,3 b b 0,8 0,2 b f(k) 0,6 F (x) b 0,4 0,1 b b 0,2 b b 0,0 b b b 0,0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Hình 5.1: Hàm giá trị xác suất và hàm phân phối của biến ngẫu nhiên X B(10; 1/4) ∼ iii) np q Mod (X) np q +1, người ta còn gọi Mod (X) là số lần xuất hiện − ≤ ≤ − chắc nhất. iv) Với x, h là hai số nguyên nguyên dương thì P (x X x + h)= P (X = x)+ P (X = x +1)+ + P (X = x + h) . ≤ ≤ ··· Chứng minh. i) Bởi vì X B(n; p) cho nên ∼ X = X + + X 1 ··· n với Xi là các biến ngẫu nhiên Bernoulli, kỳ vọng E (X) = E (X )+ + E (X ) 1 ··· n = np ii) Các biến ngẫu nhiên X1, ,Xn độc lập nhau cho nên phương sai Var (X) = Var (X )+ + Var (X ) 1 ··· n = npq iii) Ta nhận thấy rằng khi k tăng từ 0 đến n, P (X = k) thoạt tiên tăng, sau đó đạt giá trị lớn nhất rồi giảm dần. Giả sử Mod(X)= k0 thì k0 phải thỏa điều kiện P (X = k 1) P (X = k ) P (X = k + 1) 0 − ≤ 0 ≤ 0 giải điều kiện trên ta được np q k np + p − ≤ 0 ≤
  24. 5.2 Phân phối siêu bội 80 Thay k = Mod(X) và p =1 q vào ta được 0 − np q Mod(X) np q +1 (5.2) − ≤ ≤ − Dĩ nhiên có thể thu được giá trị của Mod(X) bằng cách tính tất cả các giá trị P (X = k), nhưng cách làm thủ công đó tốn rất nhiều thời gian. Vì vậy để đơn giản khi muốn tìm Mod(X) chúng ta sữ dụng công thức (5.2). Ví dụ 5.4. Cho biến ngẫu nhiên X B(9;1/3), ta tìm kỳ vọng của biến ngẫu nhiên ∼ X theo công thức 1 E (X)= np =9 =3 · 3 và phương sai 1 2 Var(X)= npq =9 =2 · 3 · 3 số lần xuất hiện chắc nhất (Mod(X)) thỏa điều kiện np q Mod(X) np q +1 − ≤ ≤ − thay số vào ta được 2 1 2+ Mod(X) 3+ 3 ≤ ≤ 3 Mod của biến ngẫu nhiên X B(9;1/3) là một số nguyên dương, vậy ta tìm được ∼ Mod(X)=3. 5.2 Phân phối siêu bội Trước khi đi vào chi tiết mô hình của biến ngẫu nhiên X có phân phối siêu bội, ta xét ví dụ đơn giản như sau: Ví dụ 5.5. Trong bình có 10 viên bi trong đó có 6 viên bi trắng và 4 viên bi đen. Lấy ngẫu nhiên 3 viên bi, nếu gọi X là số viên bi trắng lẫn trong 3 bi lấy ra thì giá trị có thể của biến ngẫu nhiên X là 0, 1, 2, 3. Xác suất để lấy được 1 bi trắng là 1 2 P C6 C4 (X =1)= 3 C10 xác suất lấy được k bi trắng sẽ là k 3 k P C6 C4− (X = k)= 3 C10 trong đó k =0, 1, 2, 3.
  25. 5.2 Phân phối siêu bội 81 Tổng quát, một tập T gồm có N phần tử, trong đó có NA phần tử có tính chất A và N N phần tử không có tính chất A. Từ tập T ta lấy ngẫu nhiên n phần tử (lấy − A một lần n phần tử hoặc lấy n lần không hoàn lại mỗi lần một phần tử). Gọi X là số phần tử có tính chất A lẫn trong n phần tử chọn ra từ tập T . Khi đó X là biến ngẫu nhiên rời rạc nhận giá trị k sao cho 0 k n ≤ ≤  n (N N ) k N  − − A ≤ ≤ A Nếu ký hiệu  k = max(0, n N + N ) 1 − A k2 = min(NA, n) Miền giá trị của biến ngẫu nhiên X là tập S = k N : k k k (5.3) { ∈ 1 ≤ ≤ 2} và k n k − CNA CN NA P − (X = k)= n , k S CN ∈ Định nghĩa 5.4 (Phân phối siêu bội). Biến ngẫu nhiên X nhận giá trị nguyên dương k, (k S) với xác suất tương ứng ∈ k n k − CNA CN NA P − (X = k)= n , k S (5.4) CN ∈ thì ta gọi X có phân phối siêu bội với tham số N, N , n, ký hiệu X H(N; N ; n) A ∼ A Ví dụ 5.6. Một lớp học có 50 sinh viên trong đó có 30 sinh viên nữ. Cần chọn 10 bạn vào một đội văn nghệ, giả sữ khả năng được chọn của các sinh viên là như nhau. Gọi X là số sinh viên nữ được chọn, khi đó X H(50;30;10) và các giá trị có thể của X ∼ là (k =0, , 10). Xác suất để số sinh viên nữ được chọn không quá ba là P (X 3) = P (X =0)+ P (X = 1)+ P (X = 2)+ P (X = 3) ≤ 0 10 1 9 2 8 3 7 C30C20 C30C20 C30C20 C30C20 = 10 + 10 + 10 + 10 0.03648 C50 C50 C50 C50 ≈ Xác suất để chọn được ít nhất một sinh viên nữ P (X > 1) = 1 P (X < 1) − = 1 P (X = 0) − 0 10 C30C20 = 1 10 0.99998 − C50 ≈
  26. 5.2 Phân phối siêu bội 82 Hàm giá trị xác suất và hàm phân phối của biến ngẫu nhiên X H(50;30;10) được ∼ minh họa hình ở hình 5.2. 1,0 0,3 b 0,8 b b 0,2 f(k) 0,6 F (x) 0,4 b 0,1 b 0,2 b b b 0,0 b b b 0,0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Hình 5.2: Hàm giá trị xác suất và hàm phân phối của biến ngẫu nhiên X H(50; 30; 10) ∼ Định lý 5.5 (Các đặc trưng của phân phối siêu bội). Nếu biến ngẫu nhiên X ∼ H(N; NA; n) thì N i) Kỳ vọng E (X)= np với p = A . N N n ii) Phương sai Var (X)= npq − với q =1 p. N 1 − − Ví dụ 5.7. Có một cái hộp chứa 8 quả cầu trắng và 3 quả cầu đen. Lấy ngẫu nhiên không hoàn lại 4 quả cầu. Gọi X là số quả cầu trắng lấy được. Tính xác suất a. Lấy được ít nhất 1 quả cầu trắng. b. Lấy được 2 quả cầu trắng. c. Tính E (X) và Var (X). Giải. X là số bi trắng lẫn trong 4 bi lấy ra, X H(11;8;4). Theo (5.3), miền giá trị ∼ của X là tập S = k N :1 k 4 cho nên { ∈ ≤ ≤ } a. P (X 1)=1. ≥ 2 2 P C8 C3 14 b. (X =2)= 4 = . C11 15
  27. 5.3 Phân phối Poisson 83 c. Kỳ vọng 8 32 E (X)= np =4 = · 11 11 và phương sai N n 8 3 7 336 Var (X)= npq − =4 = N 1 · 11 · 11 · 10 605 − 5.3 Phân phối Poisson Định nghĩa 5.6 (Phân phối Poisson). Nếu biến ngẫu nhiên rời rạc X nhận giá trị nguyên dương k, (k =0, 1, 2, ) với xác suất λke λ P (X = k)= − , k =0, 1, 2, (5.5) k! Thì biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ, ký hiệu X P (λ). ∼ Ví dụ 5.8. Một nhà máy dệt có số ống sợi bị đứt trong mộ giờ tuân theo phân phối Poisson với tham số λ =4. Tìm xác suất để trong 1 giờ máy hoạt động không có quá 2 ống sợi bị đứt. Giải. Gọi X là số ống sợi bị đứt, X P (λ). Ta cần tìm xác suất ∼ P (X 2) = P (X = 0)+ P (X =1)+ P (X = 2) ≤ 4 4 4 1 e− 4 e− 16 e− 4 = · + · + · = 13e− 0! 1! 2! Hình 5.3 minh họa hàm giá trị xác suất và hàm mật độ của X P (4). ∼ Định lý 5.7 (Các đặc trưng của biến ngẫu nhiên phân phối Poisson). Nếu biến ngẫu nhiên X có phân phối Poisson với tham số λ, X P (λ) thì ∼ i) Hàm đặc trưng ϕ(t) = exp (λ(eit 1)). − ii) Kỳ vọng E (X)= λ. iii) Phương sai Var (X)= λ. Chứng minh.
  28. 5.3 Phân phối Poisson 84 1,0 0,3 0,8 0,2 b b f(k) 0,6 F (x) b b 0,4 0,1 b b b 0,2 b b b b 0,0 0,0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Hình 5.3: Hàm giá trị xác suất và hàm phân phối của biến ngẫu nhiên X P (4) ∼ i) Hàm đặc trưng của biến ngẫu nhiên phân phối Poisson là ∞ eitke λλk ϕ(t)= E eitX = − k! k=0  X k ∞ it λ (λe ) λ λeit λ(eit 1) = e− = e− e = e − k! Xk=0 ii) Xem bài tập 5.1. iii) Xem bài tập 5.1. Trong thực tế với một số giả thiết thích hợp thì các biến ngẫu nhiên là các quá trình đếm sau: 1. Số cuộc gọi đến một tổng đài. 2. Số khách hàng đến 1 điểm phục vụ. 3. Số xe cộ qua 1 ngã tư. 4. Số tai nạn (xe cộ); số các sự cố xảy ra ở một địa điểm. . . Ví dụ 5.9. Ở một tổng đài điện thoại các cuộc gọi đến một cách ngẫu nhiên, độc lập và trung bình có 10 cuộc gọi trong 1 phút. Giả sử số cuộc gọi đến tổng đài trong 1 phút có phân phối Poisson tìm xác suất để: a. Có đúng 5 cuộc gọi đến trong 1 phút. b. Có ít nhất 2 cuộc gọi trong 1 phút.
  29. 5.4 Phân phối hình học 85 Giải. Gọi X là số cuộc gọi đến tổng đài trong 1 phút thì X P (10) ∼ a. Có đúng 5 cuộc gọi đến trong 1 phút. 105e 10 P (X =5)= − 0, 0378 5! ≈ b. Không có một cuộc gọi nào trong 1 phút. P (X 2) = 1 P (X < 2) ≥ − = 1 P (X 1) − ≤ = 1 P (X = 0) P (X = 1) 0, 9995 − − ≈ Quy luật Poisson có ứng dụng rộng rãi trong nhiều lĩnh vực thực tế như kiểm tra chất lượng sản phẩm, lý thuyết quản trị dự trữ, lý thuyết sắp hàng, các hệ phục vụ đám đông. . . 5.4 Phân phối hình học Vào ngày thứ bảy, bạn muốn mời một người bạn của bạn đi dạo phố cùng bạn, giả sử thêm là xác suất người được bạn mời đồng ý đi cùng bạn là 0 < p 1 và quyết ≤ định đi hay không đi cùng bạn của mỗi người là độc lập nhau. Gọi X là số người mà bạn đã mời để để tìm được người đầu tiên đồng ý đi cùng bạn, do đó X =1 nếu người đầu tiên bạn mời đồng ý, X = 2 nghĩa là người đầu tiên được mời không đồng ý và người thứ hai đồng ý, . . . , và X = n nghĩa là n 1 người được mời đầu tiên không − đồng ý và người thứ n đồng ý. Rõ ràng xác suất người đầu tiên bạn mời đồng ý đi cùng bạn là P (X =1)= p Bởi vì quyết định đi hay không đi cùng bạn của mỗi người là độc lập nhau cho nên P (X = k) = P k 1 người đầu tiên không đồng ý, người thứ k đồng ý − k 1 = (1 p) − p −  Biến ngẫu nhiên X như thế được gọi là biến ngẫu nhiên có phân phối hình học. Định nghĩa 5.8 (Phân phối hình học). Biến ngẫu nhiên rời rạc X có phân phối hình học với tham số 0 <p 1, nếu xác suất ≤ k 1 P (X = k)=(1 p) − p, với k =1, 2, (5.6) − Chúng ta ký hiệu X G(p). ∼
  30. 5.4 Phân phối hình học 86 1,0 0,3 b 0,8 0,2 b f(k) 0,6 F (x) b 0,4 0,1 b b b 0,2 b b b b b b b b b 0,0 b b b b b 0,0 1 5 10 15 20 1 5 10 15 20 Hình 5.4: Hàm giá trị xác suất và hàm phân phối của biến ngẫu nhiên X G(1/4) ∼ Định lý 5.9 (Các đặc trưng của phân phối hình học). Biến ngẫu nhiên X G(p) ∼ peit i) Hàm đặc trưng ϕ(t)= . 1 qeit − 1 ii) Kỳ vọng E (X)= . p 1 p iii) Phương sai Var (X)= − . p2 Chứng minh. i) Ta thấy q =1 p, hàm đặc trưng − + ∞ itX itk k 1 ϕ(t) = E e = e q − p k=1  X + it ∞ k pe = peit qeit = 1 qeit 0 − X  ii) Kỳ vọng E (X)= ϕ0 (0). iii) Sữ dụng công thức tính phương sai Var (X)= E X2 (E(X))2 − 2 trong đó E (X )= ϕ00(0) 
  31. 5.5 Phân phối đều 87 5.5 Phân phối đều Định nghĩa 5.10 (Phân phối đều). Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a; b], ký hiệu X U [a; b], nếu hàm mật độ xác suất của X có ∼ dạng 1 khi x [a, b] b a ∈ f(x)=  − (5.7)  0 nơi khác  Từ định nghĩa trên ta có được hàm phân phối xác suất của X U [a; b] ∼ 0 khi x b    5.6 Phân phối chuẩn Định nghĩa 5.11 (Phân phối chuẩn). Biến ngẫu nhiên lên tục X nhận giá trị trong khoảng ( , + ) được gọi là có phân phối chuẩn tham số µ, σ nếu hàm mật độ xác −∞ ∞ suất có dạng 1 (x µ)2 f(x)= exp − 2 0, <µ< + , ký hiệu X N (µ; σ2). −∞ ∞ ∼ Chúng ta sẽ chứng tỏa hàm f(x) không âm (5.8) là hàm một độ bằng cách chỉ ra rằng + ∞ f(x)dx =1 (5.9) Z −∞ (x µ) Nếu chúng ta đặt y = − thì σ + + ∞ ∞ 1 y2 f(x)dx = exp dy √2π − 2 Z Z   −∞ −∞
  32. 5.6 Phân phối chuẩn 88 Bây giờ chúng ta đặt + ∞ y2 I = exp dx (5.10) − 2 Z   −∞ Để chứng minh (5.9) ta cần chứng minh I = √2π. Từ phương trình (5.10) ta có + + ∞ y2 ∞ z2 I2 = exp dx exp dz − 2 − 2 Z   Z   −∞ −∞ + + ∞ ∞ (y2 + z2) = exp dydz − 2 Z Z   −∞ −∞ Bây giờ chúng ta đổi biến sang tọa độ cực bằng cách đặt y = r cos θ và z = r sin θ. 2π + ∞ r2 I2 = exp rdrdθ =2π (5.11) − 2 Z0 Z0   Do đó I = √2π, vậy hàm số (5.8) là hàm mật độ xác suất . Hàm mật độ chuẩn, f(x), có dạng hình chuông đối xứng qua µ và giá trị cực đại 1/σ√2π tại x = µ. Hàm mật độ xác suất của biến ngẫu nhiên chuẩn khi cố định µ, thay đổi giá trị của σ σ =1, 2 và 3 . Chúng ta xem hình bên dưới, hàm mật độ xác suất của biến ngẫu nhiên phân phối chuẩn với σ nhỏ sẽ cao, nhọn và tập trung gần µ. Ngược lại khi  giá trị của σ lớn hơn thì hàm mật độ phân bố rộng hơn trên trục số. 0.8 σ = 1/2 0.6 0.4 σ = 1 0.2 σ = 2 4 3 2 1 O 1 2 3 4 − − − − Hình 5.5: Hàm mật độ µ = 0 và σ = 1/2, 1, 2 Phân phối chuẩn được đưa ra bởi nhà toán học Pháp Abraham de Moivre năm 1733. Nó được dùng để tính xấp xỉ biến ngẫu nhiên nhị thức khi n lớn. Kết quả này được Laplace mở rộng gọi là định lý giới hạn trung tâm.
  33. 5.6 Phân phối chuẩn 89 Định lý 5.12 (Các đặc trưng của biến ngẫu nhiên chuẩn). Nếu X là biến ngẫu nhiên có phân phối chuẩn tham số µ, σ thì σ2t2 i) Hàm đặc trưng ϕ(t) = exp iµt + 2 .   ii) E (X)= µ và Var (X)= σ2. Chứng minh. i) Theo định nghĩa hàm đặc trưng: ϕ(t) = E eitX + 1 ∞ (x µ)2 = exp (itx) exp − dx √2π − 2σ2 Z ! −∞ + eiµt ∞ y2 x µ = exp (itσy) exp dy do đặt y = − √2π − 2 σ Z   −∞ + eiµt ∞ (y2 2itσy) = exp − dy √2π − 2 Z   −∞ + eiµt ∞ (y itσ)2 t2σ2 = exp − dy √2π − 2 − 2 Z   −∞ + σ2t2 1 ∞ (y itσ)2 = exp iµt exp − dy − 2 √2π − 2   Z   −∞ σ2t2 = exp iµt − 2   ii) Theo công thức đạo hàm của hàm đặc trưng (3.12) ta có ϕ (0) E (X)= 0 = µ i và ϕ (0) E X2 = 00 = σ2 + µ2 i2 ta suy ra  Var (X)= E X2 (E (X))2 = σ2 − Vậy hai tham số µ, σ chính là kỳ vọng và phương sai của biến ngẫu nhiên X. Nhờ vào định lý sau, nến ngẫu nhiên X có phân phối chuẩn thì biến ngẫu nhiên tuyến tính của X cũng có phân phối chuẩn.
  34. 5.6 Phân phối chuẩn 90 Định lý 5.13. Nếu biến ngẫu nhiên X có phân phối chuẩn với kỳ vọng µ, phương sai σ2 và nếu Y = aX + b, (a, b là hằng số và a = 0), thì Y có phân phối chuẩn với kỳ 6 vọng aµ + b và phương sai a2σ2. Định lý 5.14. Nếu các biến ngẫu nhiên X1, ,Xn là độc lập và nếu Xi có phân phối chuẩn với kỳ vọng µ và phương sai σ2, (i =1, 2, ,n), thì tổng X + + X i i 1 ··· n có phân phối chuẩn với kỳ vọng là µ + + µ và phương sai là σ2 + + σ2. 1 ··· n 1 ··· n Hệ quả 5.15. Nếu các biến ngẫu nhiên X1, ,Xn là độc lập và Xi có phân phối 2 chuẩn với kỳ vọng µi và phương sai σi , (i =1, ,n). ai, ,an và b là các hằng số sao cho có ít nhất một a =0, thì biến ngẫu nhiên a X + + a X + b có phân phối i 6 1 1 ··· n n chuẩn với kỳ vọng a µ + + a µ và phương sai a2σ2 + + a2 σ2 . 1 1 ··· n n 1 1 ··· n n Định nghĩa 5.16 (Phân phối chuẩn hóa). Biến ngẫu nhiên X được gọi là có phân phối chuẩn hóa nếu nó có phân phối chuẩn với tham số µ = 0 và σ2 = 1, ký hiệu X N (0;1). ∼ Nếu X N (0;1) thì biến ngẫu nhiên X có hàm mật độ xác suất ∼ 1 x2 φ(x)= f(x)= exp x) do đối xứng = 1 θ(x) (5.15) − Ví dụ 5.10. Cho biến ngẫu nhiên X có phân phối chuẩn hóa. Thì khi đó P (X < 1) = θ( 1)=1 θ(1) = 1 0, 8413 = 0, 1587 − − − −
  35. 5.6 Phân phối chuẩn 91 P (X x) − x O x − Hình 5.6: Tính đối xứng của mật độ phân phối chuẩn hóa X µ Theo định lý (5.13), nếu X N (µ; σ2) thì − có phân phối chuẩn hóa hay ∼ σ X µ − N (0;1) σ ∼ Dựa vào tính chất này ta có thể tính xác suất của biến ngẫu nhiên X N (µ; σ2). ∼ X µ b µ P (X < b) = P − < − σ σ   b µ = θ − (5.16) σ   Tương tự, với a < b thì P (a X < b) = P (X < b) P (X < a) ≤ − b µ a µ = θ − θ − (5.17) σ − σ     Định nghĩa 5.17 (Phân vị chuẩn hóa). Cho biến ngẫu nhiên X N (µ; σ2), phân ∼ vị chuẩn hóa mức α, ký hiệu xα, là giá trị của biến ngẫu nhiên X thỏa mãn điều kiện P (X < xα)= α α O xα Hình 5.7: Phân vị chuẩn hóa mức α Ví dụ 5.11. Cho biến ngẫu nhiên X có phân phối chuẩn hóa, thì phân vị chuẩn hóa mức α =0, 975 chính là x0,975 =1, 96 hay P (X < 1, 96) = 0, 975. Vậy với α cho trước thì ta sẽ tính được giá trị của xα và ngược lại.
  36. 5.7 Phân phối Gamma 92 5.7 Phân phối Gamma Với α dương bất kỳ, đặt Γ(α) là hàm như sau + ∞ α 1 x Γ(α)= x − e− dx (5.18) Z0 tích phân này sẽ hội tụ với mọi α> 0, và Γ(x) được gọi là hàm Gamma. Tính chất 5.18. Nếu α> 1 thì Γ(α)=(α 1)Γ(α 1). − − Chứng minh. Chúng ta sữ dụng phương pháp tích phân từng phần cho (5.18). Nếu α 1 x α 2 x chúng ta đặt u = e − và dv = e− dx thì du =(α 1)x − dx và v = e− . Do đó − − + + ∞ ∞ + Γ(α) = udv = uv ∞ vdu |0 − Z0 Z0 + ∞ α 1 x + α 2 x = x − e− ∞ +(α 1) x − e− dx − 0 − Z 0 = 0+(α 1)Γ( α 1) − − Tính chất 5.19. Với mọi số nguyên dương n và 1 n ta có Γ(n)=(n 1)!. ≤ − Chứng minh. Theo tính chất 5.18, với bất kỳ n 2 thì ≥ Γ(n) = (n 1)Γ(n 1) − − = (n 1)(n 2) 1Γ(1) − − ··· = (n 1)!Γ(1) − Từ công thức (5.18) ta có + ∞ x Γ(1) = e− dx =1 Z0 cho nên Γ(n)=(n 1)! − Tính chất 5.20. Với mọi số nguyên dương n ta có 1 1 3 1 1 Γ n + = n n Γ (5.19) 2 − 2 − 2 ··· 2 2           1 trong đó Γ = √π. 2  
  37. 5.7 Phân phối Gamma 93 Chứng minh. Theo tính chất 5.18 thì ta có 1 1 3 1 1 Γ n + = n n Γ 2 − 2 − 2 ··· 2 2           1 Tiếp theo ta xác định giá trị của Γ 2 . Từ công thức (5.18) ta có +  ∞ 1 1/2 x Γ = x− e− dx 2   Z0 1 Ta đổi biến bằng cách đặt x = y2 thì dx = ydy và 2 + 1 ∞ 1 Γ = √2 exp y2 dy (5.20) 2 −2   Z0   Theo (5.11) thì + ∞ 1 exp y2 dy = √2π −2 Z   −∞ cho nên + ∞ 1 1 exp y2 dy = √2π (5.21) −2 2 Z0   Thay (5.21) vào (5.20) thì ta có 1 Γ = √π (5.22) 2   Định nghĩa 5.21 (Phân phối Gamma). Biến ngẫu nhiên X được gọi là có phân phối Gamma với tham số α và β α> 0 và β > 0 nếu X có hàm mật độ βα  xα 1e βx khi x> 0 Γ(α) − − f(x)=  (5.23)  0 khi x 0  ≤ ký hiệu X Gamma(α; β).  ∼ Tích phân của f(x) trên miền x> 0 bằng 1 bởi vì + ∞ α 1 βx Γ(α) x − e− dx = (5.24) βα Z0
  38. 5.7 Phân phối Gamma 94 thật vậy, bằng cách đổi biến y = βx và sữ dụng công thức (5.18) thì chúng ta sẽ được ngay công thức (5.24). Định lý 5.22 (Các đặc trưng của phân phối Gamma). Nếu biến ngẫu nhiên X có phân phối Gamma với tham số α và β, X Gamma(α, β) thì ∼ β α i) Hàm đặc trưng ϕ(t)= với mọi t < β. β t  −  α α ii) E (X)= và Var (X)= . β β2 Chứng minh. i) Hàm đặc trưng của biến ngẫu nhiên có phân phối Gamma ϕ(t) = E eitx + α ∞ β itx βx α 1 = e e− x − dx Γ(α) Z0 + α ∞ β (β it)x α 1 = e− − x − dx Γ(α) Z0 + α ∞ β 1 y α 1 = e− y − dy do đặt y =(β it)x β it Γ(α) −  −  Z0  β α = (5.25) β it  −  ii) Theo công thức đạo hàm của hàm đặc trưng (3.12) ta có ϕ (0) α E (X)= 0 = i β và ϕ00(0) α(α 1) E X2 = = − i2 β2 ta suy ra  α Var (X)= E X2 (E (X))2 = − β2  Định lý 5.23. Nếu các biến ngẫu nhiên X , ,X độc lập và X Gamma(α ; β) i n i ∼ i (i =1, ,n), thì tổng X + + X có phân phối Gamma với tham số α + + α 1 ··· n 1 ··· 2 và β .
  39. 5.8 Phân phối Chi bình phương 95 Chứng minh. Gọi ϕi(t), (i =1, ,n) là hàm đặc trưng của biến ngẫu nhiên Xi. Theo (5.25) thì β αi ϕ (t)= với t 0 thì 1 ≤ P X2 0 √2π − 2 (5.27)  0  khi x 0  ≤ 1  Theo (5.22) ta có Γ( = √π nên X2 có phân phối Gamma 1 , 1 2 1 2 2   2 2 Vì X1, ,Xn độc lập và cùng phân phối chuẩn hóa cho nên X1 , ,Xn độc lập 1 1 2 cùng phân phối Gamma 2 , 2 , theo định lý (5.23) thì biến ngẫu nhiên χ có phân phối Gamma n , 1 , vì vậy hàm mật độ của biến ngẫu nhiên χ2 là 2 2   1 (n/2) 1 x x − exp khi x> 0 n/2 n 2 2 Γ 2 − (5.28)    0  khi x 0 ≤ 
  40. 5.8 Phân phối Chi bình phương 96 0.4 n = 1 n = 3 0.2 n = 6 O 4 8 12 Hình 5.8: Hàm mật độ Chi bình phương n bậc tự đo Định lý 5.25 (Các đặc trưng của phân phối Chi bình phương). Nếu biến ngẫu nhiên χ2 χ2 thì ∼ n 1 n/2 i) Hàm đặc trưng ϕ(t)= với mọi t< 1 . 1 2t 2  −  ii) Kỳ vọng E (X)= n. iii) Phương sai Var (X)=2n. Chứng minh. Xem bài tập 5.2. Định nghĩa 5.26 (Phân vị chi bình phương). Điểm phân vị chi bình phương mức α, n bậc tự do, ký hiệu χ2 là giá trị của biến ngẫu nhiên χ2, (χ2 χ2 ) sao cho α,n ∼ n P 2 2 χ < χα,n = α  α O χα,n Hình 5.9: Phân vị Chi bình phương mức α, n bậc tự do Ta sữ dụng bảng xác suất ?? để tính xác suất hay phân vị của biến ngẫu nhiên χ2 χ2 . ∼ n Ví dụ 5.12. Cho biết biến ngẫu nhiên χ2 χ2 , tính P (χ2 < 11, 0365) và χ2 . ∼ 15 0,975;15 Tra bảng ?? ta tìm được P χ2 < 11, 0365 =0, 250 
  41. 5.9 Phân phối Student 97 và P χ2 0 như sau −∞ ∞ p 2 1 (n/2) 1 1 t f(t, w)= w − exp 1+ w (5.32) 2(n+1)/2√2πΓ n −2 n 2     
  42. 5.9 Phân phối Student 98 Từ (5.32) ta xác định hàm mật độ lề fT (t) của biến ngẫu nhiên T ∞ f(t)= f(t, w)dw Z0 và ta tìm được n+1 (n+1)/2 Γ t2 − f (t)= 2 1+ với <t< + (5.33) T √nπ Γ n n −∞ ∞ 2   Do đó, nếu T có phân phối Student  với n bậc tự do thì hàm mật độ xác suất của T là fT (t) như (5.33). Đồ thị của hàm mật độ có phân phối student được minh họa ở hình 5.10. Giống như phân phối chuẩn hóa, hàm mật độ của biến ngẫu nhiên có phân phối Hàm mật độ student với n = 11 0.4 Hàm mật độ student với n = 5 Hàm mật độ student với n = 1 0.2 4 3 2 1 O 1 2 3 4 − − − − Hình 5.10: Hàm mật độ student Student đối xứng qua trục tung. Hơn nữa, là khi n càng lớn thì hàm mật độ của T , T T , càng giống với hàm mật độ chuẩn hóa, bởi vì ∼ n χ2 = X2 + + X2 1 ··· n với Xi, (i = 1, ,n), là các biến ngẫu nhiên độc lập cùng phân phối chuẩn hóa. P Theo định lý luật số lớn 6.10, thì χ2/n 1. Cũng từ định lý 6.7, định lý Slutsky, thì −→ T = X√n F X. Vậy khi n lớn (trong thống kê thì n 30) thì phân phối của biến ngẫu √χ2 −→ ≥ nhiên T T được xấp xỉ bằng phân phối của biến ngẫu nhiên X với X N (0;1). ∼ n ∼ Hình 5.11 minh họa hàm mật độ của biến ngẫu nhiên chuẩn hóa và hàm mật độ của biến ngẫu nhiên T5. Định nghĩa 5.28 (Phân vị Student). Phân vị Student mức α với n bậc tự do, ký hiệu t là giá trị của biến ngẫu nhiên T T thỏa mãn P (T < t )= α. α,n ∼ n α,n Về mặt hình học, phân vị student được minh họa ở hình 5.12.
  43. 5.10 Phân phối Fisher 99 0.4 Hàm mật độ chuẩn N(0, 1) Hàm mật độ student với n = 5 0.2 Hàm mật độ student với n = 1 4 3 2 1 O 1 2 3 4 − − − − Hình 5.11: So sánh mật độ chuẩn hóa với T5 α O tα,n Hình 5.12: Phân vị Student mức α, n bậc tự do Ví dụ 5.13. Cho T T . Tính P (T < 1, 989) và vì t . Tra bảng ?? ∼ 12 0,975;12 P (T < 1, 989) = 0, 9066 và P (T < 2, 179) = 0, 9750 cho nên t0,975;12 =2, 179. Ta nhận xét rằng, vì hàm mật độ của biến ngẫu nhiên T đối xứng qua trục tung cho nên tα,n = t1 α,n. Ta sữ dụng bảng xác suất ?? để tính xác suất hay phân vị của − − biến ngẫu nhiên T T . ∼ n 5.10 Phân phối Fisher Định nghĩa 5.29 (phân phối Fisher). Cho X và Y là hai biến ngẫu nhiên độc lập, X có phân phối chi bình phương m bậc tự do và Y có phân phối chi bình phương n bậc tự do. Khi đó biến ngẫu nhiên X/m Z = (5.34) Y/n được gọi là có phân phối Fisher với m và n bậc tự do, ký hiệu Z F . ∼ m,n
  44. 5.10 Phân phối Fisher 100 Bây giờ ta đi tìm hàm mật độ của biến ngẫu nhiên Z F . Bởi vì X và Y độc ∼ m,n lập cho nên hàm mật độ xác suất đồng thời sẽ là g(x, y) = gX (x)gY (y), với gX (x), gY (y) lần lượt là hàm mật độ của X và Y . Hàm mật độ xác suất đồng thời 1 (m/2) 1 (n/2) 1 x+y x − y − exp khi x> 0 (m+n)/2 m n 2 g(x, y)= 2 Γ 2 Γ 2 −    0   khi x 0 ≤ Tiếp theo, chúng ta sẽ đi xác định hàm mật độ đồng thời f(z,w) của Z và W , trước hết ta đặt W = Y và Z như (5.34), chúng ta có W = Y Y = W nX tương đương m (5.35)  Z =  X = ZW  mY  n Jacobian của phép đổi biến từ X và Y sang T vàW là ∂y ∂y 1 0 J ∂w ∂z m = ∂x ∂x = m m = w z w n ∂w ∂z n n Hàm mật độ xác suất đồng thời f(z,w ) của Z và W , với mọi z > 0, w> 0 m/2 m (m/2) 1 [(m+n)/2] 1 1 m f(z,w)= c z − w − exp x +1 w (5.36) n −2 n       trong đó 1 c = (m+n)/2 m n 2 Γ 2 Γ 2 Hàm mật độ lề fZ (z) của biến ngẫu nhiên Z   + ∞ fZ (z)= f(z,w)dw Z0 Áp dụng công thức (5.24) để tính tích phân + ∞ 1 [(m+n)/2] 1 1 m Γ 2 (m + n) w − exp z +1 w dw = (m+n)/2 (5.37) −2 n 1 m z +1 Z0     2 n  Vậy hàm mật độ của biến ngẫu nhiên Z có phân phối Fisher mvà n bậc tự do là Γ 1 (m + n) mm/2nn/2 z(m/2) 1 f (z)= 2 − Z Γ m Γ n · (mx + n)(m+n)/2  2  2 với mọi x> 0 và f (z)=0 khi x 0.  Z ≤
  45. 5.11 Bài tập luyện tập 101 Định nghĩa 5.30 (Phân vị Fisher). Phân vị Fisher mức α với m và n bậc tự do, ký hiệu x là giá trị của biến ngẫu nhiên F F thỏa mãn P (F 1). b. Tính E (X), Var (X) và Mod(X). Bài tập 5.4. Trong một lô hàng có 80 sản phẩm tốt và 20 phế phẩm. Lấy ngẫu nhiên ra 10 sản phẩm ra kiểm tra (lấy có hoàn lại). Gọi X là số sản phẩm loại tốt lấy được. a. X tuân theo quy luật phân phối gì? b. Tìm kỳ vọng và phương sai của X . c. Tìm số sản phẩm tốt có khả năng lấy được lớn nhất. Bài tập 5.5. Trong một lô hàng có 80 sản phẩm tốt và 20 phế phẩm. Lấy ngẫu nhiên ra 10 sản phẩm ra kiểm tra (lấy không hoàn lại). Gọi X là số sản phẩm loại tốt lấy được. a. X tuân theo quy luật phân phối gì?
  46. 5.11 Bài tập luyện tập 102 b. Tìm kỳ vọng và phương sai của X . Bài tập 5.6. Một bài thi trắc nghiệm gồm có 10 câu hỏi, mỗi câu hỏi có 4 phương án trả lời, trong đó chỉ có một phương án đúng. Giả sử mỗi câu trả lời đúng được 4 điểm và câu trả lời sai bị trừ 2 điểm. Một sinh viên kém làm bài bằng cách chọn ngẫu nhiên một phương án cho mỗi câu hỏi. a. Tính xác suất để học sinh này được 4 điểm. b. Tính xác suất để học sinh này bị điểm âm. c. Gọi X là số câu trả lời đúng, tính E (X) và Var (X). d. Tìm số câu sinh viên này có khả năng trả lời đúng lớn nhất. Bài tập 5.7. Trong trò chơi “bầu cua” có ba con xúc sắc, mỗi con có sáu mặt hình là: bầu, cua, hưu, nai, tôm và gà. Giả sử có hai người, một người chơi và một người làm cái. Nếu mỗi ván người chơi chỉ đặt ở một ô (một trong các hình: bầu, cua, hưu, nai, tôm và gà) sau khi chơi nhiều ván thì người nào sẽ thắng trong trò chơi này. Giả sữ thêm mỗi ván người chơi đặt 1000đ thì trung bình mỗi ván người thắng sẽ thắng bao nhiêu? Bài tập 5.8. Có ba lọ giống nhau: hai lọ loại I, mỗi lọ có 3 bi trắng và 7 bi đen; một lọ loại II có 4 bi trắng và 6 bi đen. Một trò chơi được đặt ra như sau: Mỗi ván, người chơi chọn ngẫu nhiên một lọ và lấy ra hai bi từ lọ đó. Nếu lấy được đúng hai bi trắng thì người chơi thắng, ngược lại người chơi thua. a. Người A chơi trò chơi này, tính xác suất người A thắng ở mỗi ván. b. Giả sử người A chơi 10 ván, tính số ván trung bình người chơi thắng được và số ván người A thắng tin chắc nhất. c. Người A phải chơi ít nhất bao nhiêu ván để xác suất thắng ít nhất một ván không dưới 0,99. Bài tập 5.9. Trong ngày hội thi, mỗi chiến sĩ dự thi sẽ chọn một trong hai khẩu súng và vối khẩu súng được chọn bắn 100 viên đạn. Nếu có từ 65 viên đạn trở lên trúng mục tiêu thì chiến sĩ này được thưởng. Giả sử với chiến sĩ S, xác suất trúng bia bằng súng thứ nhất là 60% và bằng súng thứ hai là 58%. a. Tính xác suất S được thưởng. b. Giả sử S dự thi 10 lần, tính số lần được thưởng tin chắc nhất. c. Chiến sĩ S phải dự thi ít nhất bao nhiêu lần để xác suất có ít nhất một lần được thưởng không dưới 99%
  47. 5.11 Bài tập luyện tập 103 Bài tập 5.10. Trọng lượng của một con bò là 1 biến ngẫu nhiên có phân phối chuẩn với giá trị trung bình 250 kg và độ lệch tiêu chuẩn là 40 kg. Tìm xác suất để 1 con bò chọn ngẫu nhiên có trọng lượng a. Nặng hơn 300 kg. b. Nhẹ hơn 175 kg. c. Nằm trong khoảng từ 260 kg đến 270 kg. Bài tập 5.11. Chiều cao của nam giới khi trưởng thành ở một vùng dân cư là biến ngẫu nhiên phân bố chuẩn vớí kỳ vọng µ = 160 cm và độ lệch chuẩn σ = 6 cm. Một thanh niên bị coi là lùn nếu có chiều cao nhỏ hơn 155 cm. a. Tìm tỷ lệ thanh niên lùn ở vùng đó. b. Tìm xác suất để chọn ngẫu nhiên 4 người thì có ít nhất 1 người không bị lùn. Bài tập 5.12. Trọng lượng sản phẩm X do một máy tự động sản xuất là một biến ngẫu nhiên tuân theo quy luật chuẩn với µ = 100 gam và độ lệch chuẩn σ = 100 gam. Sản phẩm được coi là đạt tiêu chuẩn kỹ thuật nếu trọng lượng của nó đạt từ 98 đến 102 gam. a. Tìm tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật của nhà máy. b. Tìm tỷ lệ phế phẩm của nhà máy. Bài tập 5.13. Cho hai biến ngẫu nhiên độc lập: X N (3;4) và χ2 χ2. Tính ∼ ∼ 9 P X > χ2 +3 .  p 
  48. Chương 6 Luật số lớn - Định lý giới hạn Trong chương này sẽ trình bày hai khái niệm quan trọng của lý thuyết xác suất và thống kê đó là luật số lớn và định lý giới hạn trung tâm. Đối với luật số lớn, trong tài liệu này chúng tôi chỉ trình bày luật yếu số lớn. Luật yếu số lớn là một khẳng định trung bình số học của các biến ngẫu nhiên hội tụ theo xác suất. Trong xác suất và thống kê chúng ta thường muốn biết phân phối của các biến ngẫu nhiên, mà biến ngẫu nhiên này là hàm số của một số biến ngẫu nhiên khác, ví dụ biến ngẫu nhiên Y = g(X1, ,Xn). Đáng tiếc là việc tìm chính xác phân phối của biến ngẫu nhiên này rất khó ngay cả chúng ta biết được phân phối của các biến ngẫu nhiên thành phần Xi. Cũng có lúc chúng ta muốn biết phân phối của Y nhưng chúng ta chỉ biết một phần “thông tin” (kỳ vọng, phương sai) của các biến ngẫu nhiên thành phần Xi. Tuy nhiên khi n lớn chúng ta có thể xấp xỉ phân phối của Y ngay cả khi chúng ta chỉ biết một phần “thông tin” về các biến ngẫu nhiên X1, ,Xn nhờ vào định lý giới hạn trung tâm được trình bày ở mục 6.3. 6.1 Hội tụ theo xác suất và phân phối Định nghĩa 6.1 (Hội tụ theo xác suất). Cho dãy biến ngẫu nhiên Xn và biến ngẫu P{ } nhiên X. Ta nói X hội tụ theo xác suất đến X, ký hiệu X X, nếu với mọi { n} n −→ ε> 0 thì lim P ( Xn X <ε)=1 (6.1) n + → ∞ | − | P Nếu Xn X thì với n lớn chúng ta có Xn X với xác suất gần 1. Thông thường, −→ ≈ P X hội tụ theo xác suất đến biến ngẫu nhiên X là hằng số (X θ, θ là hằng số) n n −→ nghĩa là khi n lớn thì hầu như biến ngẫu nhiên Xn không có sự thay đổi. Định nghĩa 6.2 (Hội tụ theo phân phối). Cho dãy biến ngẫu nhiên X và biến { n}
  49. 6.1 Hội tụ theo xác suất và phân phối 105 ngẫu nhiên X. Ta nói X hội tụ theo phân phối đến X, ký hiệu X F X, nếu { n} n −→ lim P (Xn < x)= P (X < x)= F (x) (6.2) n + → ∞ tại mọi điểm liên tục của hàm phân phối F (x) Nếu X F X thì với n đủ lớn chúng ta có thể xấp xỉ phân phối của X bởi phân n −→ n phối của X. Vậy hội tụ theo phân phối rất tiện lợi cho việc xấp xỉ phân phối của biến ngẫu nhiên Xn. Định nghĩa 6.3 (Hội tụ hầu chắc chắn). Cho dãy biến ngẫu nhiên Xn và biến ngẫu a.s.{ } nhiên X. Ta nói X hội tụ hầu chắc chắn đến X, ký hiệu X X, nếu X X { n} n −−→ n 6→ với xác suất là không. Định lý 6.4. Cho dãy biến ngẫu nhiên X và biến ngẫu nhiên X. { n} P i) Nếu X a.s. X thì X X. n −−→ n −→ P ii) Nếu X X thì tồn tại dãy con n sao cho X a.s. X. n −→ j nj −−→ Định lý 6.5. Cho dãy biến ngẫu nhiên X , biến ngẫu nhiên X và θ là một hằng { n} số thực P i) Nếu X X thì X F X. n −→ n −→ P ii) Nếu X F θ thì X θ. n −→ n −→ Định lý 6.6 (Ánh xạ liên tục). Giả sử g(x) là hàm số liên tục trên R. P P i) Nếu X X thì g(X ) g(X). n −→ n −→ ii) Nếu X F X thì g(X ) F g(X). n −→ n −→ Định lý 6.7 (Định lý Slutsky). Giả sử X F X và Y F θ (θ là hằng số). Thì n −→ n −→ i) X + Y F X + θ. n n −→ ii) X Y F Xθ. n n −→ Định lý 6.8 (Bất đẳng thức Markov). Nếu X là biến ngẫu nhiên nhận giá trị không âm thì với mọi hằng số dương ε ta có E (X) P (X ε) (6.3) ≥ ≤ ε
  50. 6.1 Hội tụ theo xác suất và phân phối 106 Chứng minh. X là biến ngẫu nhiên có hàm mật độ f(x) thì + ε + ∞ ∞ E (X)= xf(x)dx = xf(x)dx + xf(x)dx Z0 Z0 Zε + + ∞ ∞ xf(x)dx εf(x)dx = εP (X ε) ≥ ≥ ≥ Zε Zε Nhân hai vế của bất phương trình với 1/ε thì ta đươc bất đẳng thức 6.3. Định lý 6.9 (Bất đẳng thức Chebyshev). Nếu X là biến ngẫu nhiên có kỳ vọng là µ và phương sai σ2 hữu hạn thì với mọi hằng số dương ε bé tùy ý ta có Var (X) P ( X µ ε) (6.4) | − | ≥ ≤ ε2 hay tương đương Var (X) P ( X µ (6.5) | − | ε2 Chứng minh. Ta thấy (X µ2) là biến ngẫu nhiên không âm và ε> 0. Sữ dụng bất − đẳng thức Markov với a = ε2 ta được E (X µ)2 P (X µ)2 ε2 − − ≥ ≤ ε Vì (X µ)2 ε2 khi và chỉ khi X µ ε nên − ≥ | − | ≥ Var (X) P ( X µ ε) | − | ≥ ≤ ε2 Bất đẳng thức Markov và Chebyshev cho ta phương tiện thấy được giới hạn xác suất khi kỳ vọng và phương sai của biến ngẫu nhiên có phân phối xác suất chưa biết. Ví dụ 6.1. Giả sử số phế phẩm của một nhà máy làm ra trong một tuần là một biến ngẫu nhiên với kỳ vọng là µ = 50. a. Có thể nói gì về xác suất sản phẩm hư tuần này vượt quá 75. b. Nếu phương sai của phế phẩm trong tuần này là σ2 = 25 thì có thể nói gì về xác suất sản phẩm tuần này sẽ ở giữa 40 và 60. Giải. a. Theo bất đẳng thức Markov E (X) 50 2 P (X > 75) = = ≥ 75 75 3
  51. 6.2 Luật số lớn 107 b. Theo bất đẳng thức Chebyshev σ2 25 1 P ( X 50 10) = = | − | ≥ ≤ 102 100 4 Do đó 1 3 P (40 1 = | − | − 4 4 6.2 Luật số lớn Định lý 6.10 (Luật số lớn). Gọi X1, ,Xn là các biến ngẫu nhiên độc lập và cùng phân phối xác suất với kỳ vọng µ = E (X) và phương sai σ2 = Var (X) hữu hạn. Đặt S = X + + X . Khi đó với mọi ε> 0, n 1 ··· n S P n µ ε 0 (6.6) n − ≥ →   khi n + . Tương dương với → ∞ S P n µ 0, S σ2 P n µ ε n − ≥ ≤ nε2   Cố định ε, S P n µ ε 0 n − ≥ →  
  52. 6.3 Định lý giới hạn trung tâm 108 khi n + , hay tương đương với → ∞ S P n µ 0 S P n p <ε 1 (6.8) n − →   khi n + . Giới hạn trên nói lên rằng, khi thực hiện lâp lại phép thử Bernoulli → ∞ nhiều lần chúng ta “tin chắc” rằng số lần thành công trung bình sẽ “gần” với p. 6.3 Định lý giới hạn trung tâm Một khái niệm quan trọng của lý thuyết xác suất là Định lý giới hạn trung tâm. Định lý này sẽ cho phép ta xấp xỉ phân phối của tổng n biến ngẫu nhiên độc lập với biến ngẫu nhiên có phân phối chuẩn. Trong tài liệu này chỉ phát biểu cho trường hợp tổng n biến ngẫu nhiên độc lập và cùng phân phối. Định lý 6.11 (Định lý giới hạn trung tâm). Nếu X1, ,Xn là các biến ngẫu nhiên độc lập và cùng phân phối với kỳ vọng µ và phương sai σ2 hữu hạn. Ta đặt S = X + + X n 1 ··· n S có kỳ vọng là E (S ) = nµ và phương sai Var (S ) = nσ2. Khi n thì biến n n n → ∞ ngẫu nhiên S F X, với X N nµ; nσ2 (6.9) n −→ ∼ Hay biến ngẫu nhiên  S nµ F Z = n − Z, với Z N (0;1) (6.10) n σ√n −→ ∼
  53. 6.3 Định lý giới hạn trung tâm 109 Nghĩa là khi n lớn thì với mọi x R ∈ S nµ P n − < x P (Z < x) , với Z N (0;1) (6.11) σ√n ≈ ∼   Chứng minh. Ta đặt S nµ 1 n X µ Z = n − = i − n σ√n √n σ i=1 X   và X µ Z = i − , i =1, ,n i σ Các biến ngẫu nhiên Zi, (i = 1, n), là độc lập và có cùng phân phối nên cũng có 1 t cùng hàm đặc trưng ϕ(t), ta cũng có hàm đặc trưng của √n Zi là ϕ √n . Từ tính chất 3.18 thì hàm đặc trưng của Zn là   t n ϕ (t)= ϕ n √n    cũng theo tính chất 3.19 - đạo hàm của hàm đặc trưng thì 0 ϕ (0) = i (Zi)=0 00 ϕ (0) = i2 Z2 = 1 i − Khai triển Taylor của hàm đặc trưng ϕ(t) có dạng 2 3 0 t 00 t 000 ϕ (t) = ϕ (0) + tϕ (0) + ϕ (0) + ϕ (0) + 2! 3! ··· 2 3 t t 000 = 1 + ϕ (0) + − 2 3! ··· Ta suy ra 2 3 t t t 000 ϕ =1 + ϕ (0) + √n − 2n 3!n3/2 ···   Hàm đặc trưng ϕn(t) của biến ngẫu nhiên Zn sẽ là 2 3 n t t 000 ϕ (t) = 1 + ϕ (0) + n − 2n 3!n3/2 ···   2 3 n 1 t t 000 = 1+ + ϕ (0) + n − 2 3!n1/2 ···    Mà ta có 2 3 t t 000 1 lim + ϕ (0) + = t2 n − 2 3!n1/2 ··· −2 →∞  
  54. 6.3 Định lý giới hạn trung tâm 110 do đó 1 2 lim ϕn (t) = exp t (6.12) n −2 →∞   Theo định lý 5.12 thì (6.12) chính là hàm đặc trưng của biến ngẫu nhiên có phân phối chuẩn hóa. Từ tính chất 3.17 thì biến ngẫu nhiên Zn sẽ hội tụ theo phân phối đến biến ngẫu nhiên Z N (0;1). ∼ Chú ý: Ở công thức (6.9) ta viết S F X, với X N nµ; nσ2 n −→ ∼ Nghĩa là khi n lớn phân phối của biến ngẫu nhiên S được xấp xỉ bằng phân phối . n . chuẩn N (nµ, nσ2). Để đơn giản ta viết S N (nµ; nσ2), dấu “ ” nghĩa là “xấp xỉ n ∼ ∼ phân phối”. Ví dụ 6.3. Cho X1, ,X200 là 200 biến ngẫu nhiên độc lập có phân phối Bernoulli với p = 0, 3. Biến ngẫu nhiên X B(1;0, 3) cho nên kỳ vọng E (X ) = p = 0, 3 và i ∼ i phương sai Var (X )= pq =0, 3 0, 7=0, 21. i · Ta đặt biến ngẫu nhiên S = X + +X , bởi vì dãy biến ngẫu nhiên X , ,X 200 1 ··· n 1 200 độc lập cho nên kỳ vọng E (S ) = 200 0, 3=60 200 · và phương sai Var (S ) = 200 0, 21 = 42 200 · . Theo định lý 6.11 ta có S N (60; 42) tương đương với 200 ∼ 0 S200 60 . S = − N (0;1) √42 ∼ Ta tính xấp xỉ xác suất S200 < 65 65 60 P (S < 65) θ − θ(0, 77) 200 ≈ √ ≈  42  0, 7794 ≈ Ví dụ 6.4. Các kỹ sư xây cầu mỹ thuận tin rằng trọng lượng W (đơn vị tấn) cầu có thể chịu đựng, không là hư hại cấu trúc của cầu có phân phối chuẩn với µ = 400 và độ lệch tiêu chuẩn σ = 40. Giả sử trọng lượng của xe tải qua cầu là biến ngẫu nhiên có kỳ vọng là 3 và độ lệch tiêu chuẩn 0,3. Hỏi bao nhiêu xe tải trên cầu để xác suất cầu bị hư cấu trúc lớn hơn 0, 1.
  55. 6.3 Định lý giới hạn trung tâm 111 Giải. Gọi Pn là xác suất hư hại cấu trúc cầu khi n xe đi qua là P = P (S W ) n n ≥ = P (S W 0) (6.13) n − ≥ với S = X + + X . Biến ngẫu nhiên S có kỳ vọng là 3n và phương sai là 0, 09n. n 1 ··· n n Theo định lý 6.11 thì . S N (3n;0, 09n) n ∼ Biến ngẫu nhiên S W có kỳ vọng n − E (S W )= E (S ) E (W )=3n 400 n − n − − Bởi vì W biến ngẫu nhiên độc lập với các biến ngẫu nhiên Xi, (i =1, ,n) cho nên W cũng độc lập với S . Phương sai của S W là n n − Var (Sn W )= Var (Sn)+ Var (W )=0, 09n + 1600 − . Theo hệ quả 5.15 thì biến ngẫu nhiên S W N (3n 400;0, 09n + 1600). Bài toán n − ∼ − yêu cầu tìm số xe tải, n, trên cầu để xác suất cầu hư cấu trúc lớn hơn 0, 1 đồng nghĩa với việc tìm n sao cho P = P (S W > 0) > 0, 1 n n − tương đương với P (S W < 0) 0, 9 n − ≤ suy ra 3n 400 θ − θ(1, 28) √0, 09n + 1600 ≤   Do θ(x) là hàm không giảm cho nên 3n 400 − 1, 28 √0, 09n + 1600 ≤ hay n 117. ≥ Định lý 6.12 (Định lý giới hạn cho dãy phép thử Bernoulli). Giả sử các biến ngẫu nhiên X1, ,Xn độc lập và cùng phân phối Bernoulli ∗ với tham số 0 <p< 1. Ta đặt S = X + + X , ta đã biết là S B(n; p) do đó ta có được kỳ vọng và n 1 ··· n n ∼ phương sai của Sn lần lượt là E (Sn)= np, Var (Sn)= npq. Khi n lớn thì phân phối của biến ngẫu nhiên S được xấp xỉ bằng phân phối chuẩn . n N(np, npq), ký hiệu S N(np; npq). Xác suất n ∼ a np Sn np b np P (a Sn < b) = P − − < − ≤ √npq ≤ √npq √npq   b np a np θ − θ − (6.14) ≈ √npq − √npq     ∗Xem mục 5.1
  56. 6.3 Định lý giới hạn trung tâm 112 và 1 (k np)2 P (S = k) exp − (6.15) n ≈ √2πnpq − 2npq   Với θ(x) như công thức (5.13). Nếu chúng ta đặt k np x0 = − √npq thì công thức (6.15) trở thành 1 1 1 2 P (Sn = k) exp x ≈ √npq · √ π −2 0 2   1 φ(x0) (6.16) ≈ √npq trong đó hàm φ(x0) được xác định như công thức (5.12). Với x0 cho trước, giá trị của φ được tính sẵn ở bảng (??). Ví dụ 6.5. Một xạ thủ bắn 100 phát vào một mục tiêu, các lần bắn độc lập với nhau. Xác suất bắn trúng mục tiêu của mỗi lần bắn là p = 0, 55. Tính xác suất để số viên trúng mục tiêu lớn hơn hoặc bằng 50 và nhỏ hơn 62. Giải. Gọi S là số phát trúng mục tiêu trong 100 phát bắn, ta có S B(100; 0, 55). 100 100 ∼ Kỳ vọng E (S )= np = 100 0, 55 = 55 100 · và phương sai Var (S )= npq = 100 0, 55 0, 45 = 24, 75 100 · · . Theo định lý 6.12 thì S N(55; 24, 75). Suy ra 100 ∼ 62 55 50 55 P (50 S < 62) θ − θ − ≤ 100 ≈ √24, 75 − √24, 75     θ(1, 4071) θ( 1, 0050) 0, 7705 ≈ − − ≈ Vậy xác suất để có số viên trúng mục liêu lớn hơn hoặc bằng 50 và nhỏ hơn 62 viên là 0, 7705. Ví dụ 6.6. Tung 1 đồng xu cân đối 100 lần, tính xác suất có đúng 45 lần xuất hiện mặt ngửa.
  57. 6.4 Định lý xấp xỉ Poisson 113 P (X = k) 0.08 0.06 0.04 0.02 35 45 55 65 75 k Hình 6.1: Xấp xỉ xác suất P (50 <S100 < 62) Giải. Gọi S100 là số lần xuất hiện đồng xu ngửa khi tung đồng xu 100 lần. Ta có S B(100; 0, 5). Kỳ vọng 100 ∼ E (S )= np = 100 0, 5=50 100 · và phương sai Var (S )= npq = 100 0, 5 0, 5=25 100 · · . Theo định lý 6.12 thì S N(50; 25). Và xác suất 100 ∼ 1 45 50 P (S = 45) φ − 100 ≈ 5 5   1 φ( 1) 0, 0484 ≈ 5 − ≈ φ( 1) tra bảng ??. Vậy xác suất có đúng 45 lần xuất hiện mặt ngửa là 0, 0484. − 6.4 Định lý xấp xỉ Poisson Các biến ngẫu nhiên X1, ,Xn độc lập cùng phân phối Bernoulli tham số p, 0 <p< 1, chúng ta đã biết S = X + + X có phân phối nhị thức tham số n, n 1 ··· n p, hay S B(n; p). Trong thực tế công thức nhị thức (5.1) chỉ được sữ dụng khi n n ∼ tương đối bé. Trong trường hợp n lớn và p không quá gần 0 hay 1 ta dùng công thức xấp xỉ (6.14) hay (6.15) để tính P (Sn = k) hay P (Sn <k). Trong trường hợp p quá gần 0 hay 1 thì việc dùng các công thức đó sẽ dẫn đến sai số đáng kể. Trong trường hợp n rất lớn và p rất bé thì phân phối của Sn được tính xấp xỉ nhờ lý sau:
  58. 6.4 Định lý xấp xỉ Poisson 114 P (X = k) 0.08 0.06 0.04 0.02 35 45 55 65 k Hình 6.2: Xấp xỉ xác suất P (S100 = 45) Định lý 6.13 (Xấp xỉ Poisson). Nếu biến ngẫu nhiên S B(n; p), và khi n lớn p n ∼ gần 0 thì λke λ P (S = k) − (6.17) n ≈ k! vời λ = np. Chứng minh. Theo công thức nhị thức (5.1): k k n k n(n 1) (n k 1) k n k P (S = k)= C p q − = − ··· − − p q − n n k! λ Đặt λ = np, suy ra p = . Do đó, n k n k n(n 1) (n k 1) λ λ − P (S = k) = − ··· − − 1 n k! n − n     n k λk 1 2 k 1 λ − = 1 1 1 1 − 1 k! − n − n ··· − n − n          Chuyển qua giới hạn khi n + ta được → ∞ k n k λ λ λ − λe− lim P (Sn = k)= lim 1 = n + k! n + − n k! → ∞ → ∞   Khi n lớn p gần 0 ta có công thức xấp xỉ λke λ P (S = k) − n ≈ k! Chú ý trong trường hợp các phép thử Bernoulli có p = P (A) gần 1 thì P A¯ =1 p − sẽ gần 0. Do đó để tính xác suất k lần xảy ra A khi thực hiện n phép thử, P (S = k)  n ta chuyển sang tính xác suất n k lần xảy ra A¯ trong n phép thử. −
  59. 6.5 Bài tập luyện tập 115 Ví dụ 6.7. Một nữ công nhân đứng máy xe sợi gồm 800 ống sợi, xác suất đứt sợi ở mỗi ống trong một giờ là 0,005. Tính xác suất trong vòng 1 giờ có không quá 2 ống bị đứt sợi. Giải. Gọi S là số ống sợi bị đứt trong 1 giờ. Thì X B(800; 0, 005) nên 800 ∼ P (S 2) = P (S = 0)+ P (S =1)+ P (S = 2) 800 ≤ 800 800 800 Vì n = 800 lớn và p =0, 005 nhỏ nên theo công thức (6.17) với λ = np =4 40e 4 41e 4 42e 4 P (S 2) − + − + − 0, 3114 800 ≤ ≈ 0! 1! 2! ≈ 6.5 Bài tập luyện tập Bài tập 6.1. Cho X là biến ngẫu nhiên liên tục với kỳ vọng µ = 10 và phương sai σ2 = 100/3. Dùng bất đẳng thức Chebyshev tìm cận trên của các xác suất: a. P ( X 10 2). | − | ≥ b. P ( X 10 5). | − | ≥ c. P ( X 10 9). | − | ≥ Bài tập 6.2. Cho X là biến ngẫu nhiên có phân phối chuẩn hóa. Dùng bất đẳng thức Chebyshev, tìm cận trên của các xác suất P ( X 1), P ( X 2) và P ( X 3). | | ≥ | | ≥ | | ≥ Bài tập 6.3. Cho biến ngẫu nhiên X có kỳ vọng µ =0 và phương sai σ2, biến ngẫu 6 nhiên Y được định bởi X µ Y = − µ σ2 a. Chứng minh P (Y a) a> 0. ≥ ≤ µ2a2 ∀ b. X là biến ngẫu nhiên như bài 6.1, tìm cận trên của các xác suất P (Y 0, 2), ≥ P (X 0, 5) và P (Y 2). ≥ ≥ Bài tập 6.4. Điểm thi cuối khóa môn xác suất thống kê là biến ngẫu nhiên có miền giá trị [0, 10] với kỳ vọng 7 và phương sai 1. a. Tìm cận dưới của xác suất điểm của một sinh viên bất kỳ lớn hơn 5 và nhỏ hơn 9.
  60. 6.5 Bài tập luyện tập 116 b. Nếu có 200 sinh viên dự thi, tìm cận dưới của xác suất điểm trung bình của lớp lớn hơn 5 và nhỏ hơn 9. Bài tập 6.5. Đặt S100 là số đồng xu sấp khi tung 1 đồng xu cân đối 100 lần. Dùng định lý giới hạn tính a. P (S100 < 45). b. P (45 S < 55). ≤ 100 c. P (X100 = 49). Bài tập 6.6. Cho các biến ngẫu nhiên X1, ,Xn là n biến ngẫu nhiên độc lập cùng phân phối với kỳ vọng µ, độ lệch tiêu chuẩn σ =0, 3. Dùng định lý giới hạn trung tâm để xác định n sao cho S P n < 0, 3 0, 95 n ≥   với S = X + + X . n 1 ··· n Bài tập 6.7. Một xí nghiệp sản xuất máy tính có xác suất làm ra phế phẩm là 0,02. Chọn ngẫu nhiên 50 máy để kiểm tra, tìm xác suất để: a. Có đúng 2 phế phẩm. b. Có không quá 2 phế phẩm. Bài tập 6.8. Xác suất để gặp một hạt thóc lép khi chọn giống là 0,004. Tìm xác suất để khi chọn ngẫu nhiên 1000 hạt trong vô số thóc ta gặp: a. 10 hạt lép. b. Không quá 3 hạt. Bài tập 6.9. Một con xúc xắc cân đối, đồng chất được gieo 1000 lần. Tìm xác suất để tổng số nốt xuất hiện nhỏ hơn 3540. Bài tập 6.10. Xác suất để một người bị phản ứng từ việc tiêm huyết thanh là 0,001. Tìm xác suất sao cho trong 2000 người: a. Có đúng 3 người bị phản ứng. b. Có nhiều hơn 2 người bị phản ứng. Bài tập 6.11. Đặt X1, ,X144 là các biến ngẫu nhiên độc lập và cùng phân phối 2 với kỳ vọng µ = E (Xi)=2 và phương sai σ = Var (Xi)=4. Dùng định lý giới hạn trung tâm, hãy tính xấp xỉ giá trị xác suất P (X + + X < 350). 1 ··· 144
  61. 6.5 Bài tập luyện tập 117 Bài tập 6.12. Các biến ngẫu nhiên X1, ,X625 là các biến ngẫu nhiên độc lập và cùng phân phối xác suất, có hàm mật độ xác suất cho bởi 3(1 x)2 khi 0 x 1 f(x)= − ≤ ≤   0 nơi khác Dùng định lý giới hạn trung tâm, hãy tính xấp xỉ giá trị xác suất P (X + + X < 350). 1 ··· 625