Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu

pdf 15 trang ngocly 1080
Bạn đang xem tài liệu "Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_4_ly_thuyet_mau.pdf

Nội dung text: Bài giảng Xác suất thống kê - Chương 4: Lý thuyết mẫu

  1. Chương 4 Lý thuyết mẫu  Tổng thể và mẫu Mẫu ngẫu nhiên, mẫu thực nghiệm Các đặc trưng của mẫu Đại lượng thống kê
  2. Tổng thể và mẫu . Tập hợp có phần tử là tất cả các đối tượng mà ta nghiên cứu được gọi là tổng thể. . Tổng thể còn được gọi là đám đông hay dân số. . Số phần tử của tổng thể được gọi là kích thước của tổng thể. . Khi nghiên cứu tính chất nào đó của tổng thể người ta chỉ lấy ra một số phần tử của tổng thể để nghiên cứu (?), và từ đó phỏng đoán cho tổng thể. Các phần tử lấy ra được gọi là mẫu. Kích thước mẫu là số phần tử của mẫu.
  3. Tổng thể và mẫu Mẫu đại diện tốt cho tổng thể thì mẫu thỏa hai điều kiện chính: . Mẫu phải được chọn ngẫu nhiên từ tổng thể; . Các phần tử của mẫu phải được chọn độc lập với nhau. Cách chọn mẫu: . Mẫu không hoàn lại; . Mẫu hoàn lại; Quy ước: Ta dùng mẫu có hoàn lại.
  4. Mẫu ngẫu nhiên, mẫu thực nghiệm Giả sử ta nghiên cứu dấu hiệu , là BNN trên một tổng thể nào đó. Chọn mẫu có kích thước 푛 . Gọi 푖 là giá trị quan sát của trên phần tử thứ 푖 của mẫu; . Do mẫu có hoàn lại nên các 푖 có phân phối giống như và chúng độc lập với nhau; . Bộ gồm 푛 biến ngẫu nhiên độc lập ( 1, 2, , 푛) được gọi là một mẫu ngẫu nhiên. . Khi các 푖 có giá trị cụ thể là 푖, ta gọi bộ ( 1, 2, , 푛) là một mẫu cụ thể
  5. Mẫu ngẫu nhiên, mẫu thực nghiệm Ví dụ: Một kệ chứa đĩa nhạc với giá như sau: Giá (ngàn đồng) 20 25 30 34 40 Số đĩa 35 10 25 17 13 Lấy ngẫu nhiên 1 đĩa nhạc trong kệ. Gọi là giá của đĩa này, có bảng phân phối xác suất 20 25 30 34 40 푃 0.35 0.10 0.25 0.17 0.13
  6. Mẫu ngẫu nhiên, mẫu thực nghiệm Lấy ngẫu nhiên (có hoàn lại) 4 đĩa nhạc trong kệ. Gọi 푖 là giá của đĩa thứ 푖, 푖 = 1, 2, 3, 4. Ta có . Các 푖 độc lập và có bảng PPXS giống như . . ( 1, 2, 3, 4) là mẫu ngẫu nhiên . Xem giá từng đĩa đã lấy ra, thấy: đĩa 1 giá 20 ngàn đồng, đĩa 2 giá 30 ngàn đồng, đĩa 3 giá 20 ngàn đồng, đĩa 4 giá 40 ngàn đồng. Ta có mẫu thực nghiệm 1, 2, 3, 4 = 20,30,20,40 .
  7. Các đặc trưng của tổng thể Định lượng: Xét dấu hiệu trên một tổng thể, là BNN. . Trung bình tổng thể, = 휇. . Phương sai tổng thể, = 휎2. Định tính: Tổng thể có kích thước , trong đó có phần tử có tính chất được quan tâm. Tỷ lệ tổng thể là =
  8. Các đặc trưng của mẫu (Thay chữ in hoa thành in thường ta được mẫu thực nghiệm) Trung bình mẫu: Cho mẫu ngẫu nhiên ( 1, 2, 3, 4). 1 푛 = 푖 푛 푖=1 휎2 Định lý: = 휇 và = . 푛 Phương sai mẫu: 푛 1 Chưa hiệu chỉnh: 푆 2 = ( − )2 푛 푖 푖=1 푛 1 Đã hiệu chỉnh: 푆2 = ( − )2 푛 − 1 푖 푖=1 푛 − 1 Định lý: 푆 2 = 휎2, 푆2 = 휎2 푛
  9. Các đặc trưng của mẫu (Thay chữ in hoa thành in thường ta được mẫu thực nghiệm) Độ lệch chuẩn mẫu . Chưa hiệu chỉnh, 푆 . Đã hiệu chỉnh, 푆. Tỷ lệ mẫu (tỷ lệ tổng thể là p) Gọi 푖 là số phần tử có tính chất A trong lần lấy thứ 푖. Ta có 푖~ (1, ), và số phần tử có tính chất A trong 푛 mẫu với kích thước 푛 là 푖=1 푖. 1 푛 Tỷ lệ mẫu: 퐹 = 푖 푛 푖=1 (1− ) Định lý: 퐹 = , 퐹 = 푛
  10. Các đặc trưng của mẫu Ví dụ: Điều tra năng suất lúa trên diện tích 100 ha đất trồng lúa, người ta thu được bảng số liệu Năng suất 41 44 45 46 48 52 54 (tạ/ha) Diện tích 10 20 30 15 10 10 5 (ha) 1. Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh; 2. Những thửa ruộng có năng suất từ 48 tạ/ha trở lên là những thửa ruộng có năng suất cao. Tính tỉ lệ diện tích có năng suất cao; 3. Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh của những thửa ruộng có năng suất cao.
  11. Phân phối xác suất các đặc trưng của mẫu 2 Định lý: Cho ~ (휇, 휎 ) và mẫu ( 1, 2, , 푛). Ta có 휎2 −휇 1) ~ 휇, , hay 푛~ 0,1 ; 푛 휎 −휇 2) 푛~ 푛 − 1 . 푆 푛−1 3) 푆2~휒 2(푛 − 1) 휎2
  12. Phân phối xác suất các đặc trưng của mẫu Định lý giới hạn trung tâm: Cho 1, 2, , 푛 là một dãy các BNN độc lập, có cùng phân phối với kỳ vọng 휇 và phương sai 휎2. Thế thì khi 푛 ≥ 30, 1 + 2 + ⋯ + 푛 có phân phối xấp xỉ chuẩn với kỳ vọng 푛휇 và phương sai 푛휎2. Định lý: Cho có = 휇, = 휎2 và mẫu ( 1, 2, , 푛) có 푛 ≥ 30. Ta có 휎2 −휇 1) ~ 휇, , hay 푛 ~ 0,1 ; 푛 휎 −휇 2) 푛 ~ 0,1 , với 푠 là độ lệch chuẩn mẫu 푠 hiệu chỉnh của một mẫu thực nghiệm nào đó. Ký hiệu: ~ có nghĩa là phân phối xấp xỉ.
  13. Phân phối xác suất các đặc trưng của mẫu Phân phối của tỷ lệ mẫu Nhắc lại, tỷ lệ mẫu 1 푛 퐹 = 푖 푛 푖=1 trong đó, 푖 là số phần tử có tính chất A trong lần lấy thứ 푖, 푖~ 1, . Theo định lý giới hạn trung tâm thì 푛 푖 ~ 푛 , 푛 (1 − ) 푖=1 Suy ra (1 − ) 퐹~ , 푛
  14. Phân phối xác suất các đặc trưng của mẫu Ví dụ: Chiều cao của sinh viên trong trường ĐHCN là biến ngẫu nhiên có phân phối chuẩn với kỳ vọng là 165cm, độ lệch chuẩn là 10cm. Người ta đo chiều cao của 100 sinh viên, được chọn ngẫu nhiên. 1. Xác suất để chiều cao trung bình của 100 sinh viên đó sai lệch so với chiều cao trung bình của sinh viên trong trường không quá 2cm là bao nhiêu? 2. Khả năng chiều cao trung bình của số sinh viên trên vượt quá 168cm là bao nhiêu? 3. Nếu muốn chiều cao trung bình đo được sai lệch so với chiều cao trung bình của tổng thể không vượt quá 1cm với XS là 0.99 thì ta phải chọn bao nhiêu sinh viên để đo chiều cao?
  15. Đại lượng thống kê Cho là một dấu hiệu mà ta nghiên cứu trên một tổng thể và một mẫu ngẫu nhiên ( 1, 2, , 푛). Hàm ( 1, 2, , 푛) được gọi là một đại lượng thống kê. Ví dụ: Trung bình mẫu 푛 1 = 푛 푖 푖=1 là một đại lượng thống kê. Ví dụ: Tỷ lệ mẫu 푛 1 퐹 = 푛 푖 푖=1 là một đại lượng thống kê.