Bài giảng Tin học ứng dụng - Chương II: Các hàm thống kê - Trần Trung Hiếu

pdf 17 trang ngocly 550
Bạn đang xem tài liệu "Bài giảng Tin học ứng dụng - Chương II: Các hàm thống kê - Trần Trung Hiếu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_tin_hoc_ung_dung_chuong_ii_cac_ham_thong_ke_tran_t.pdf

Nội dung text: Bài giảng Tin học ứng dụng - Chương II: Các hàm thống kê - Trần Trung Hiếu

  1. Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT Email: tthieu@hua.edu.vn Website:
  2. Chương II: Các hàm thống kê 1. Các hàm thống kê (Statistical Functions) 2. Giới thiệu một số hàm thống kê
  3. Chương II: Các hàm thống kê 1. Các hàm thống kê . Bấm nút fx trên ToolBar hoặc chọn Menu Insert/Function xuất hiện hộp thoại . Ở Function category chọn Statistical
  4. Chương II: Các hàm thống kê 2. Giới thiệu một số hàm thống kê . Average, Max, Min, Count, CountA . Var, Stdev . Correl, Covar . Finv . Tinv . Frequency . Linest
  5. Giới thiệu một số hàm thống kê 1. Average, Max, Min, Count, CountA . Average, Max, Min (đã học trong tin ĐC) . Count: Đếm số lượng các ô có giá trị kiểu số trong miền và các giá trị số trong danh sách biến » Cú pháp: COUNT(value1,value2, ) » value1, value2 có thể là địa chỉ miền, địa chỉ ô hay một giá trị bất kỳ. • Ví dụ: COUNT(1,"A",a,2, A3, A2:B3) . CountA: Đếm số lượng các ô không trống trong miền và các giá trị trong danh sách biến » Cú pháp: COUNTA(value1,value2, ) » value1, value2 có thể là địa chỉ miền, địa chỉ ô hay một giá trị bất kỳ. • Ví dụ: COUNTA(1,"A",a,2, A3, A2:B3)
  6. Giới thiệu một số hàm thống kê 2. VAR, STDEV . Trong xác suất, xét đại lượng ngẫu nhiên X » Tiến hành n phép thử được các giá trị ngẫu nhiên: x1, x2, xn căn cứ vào kết quả phép thử, dựa vào kiến thức xác suất tính toán các đại lượng từ đó đưa ra các kết luận, dự báo. » Kỳ vọng M(X): đặc trưng cho giá trị trung bình của lượng ngẫu nhiên » Phương sai mẫu D(X) hay độ lệch chuẩn σ(X) đặc trưng cho độ phân tán các giá trị của DLNN xung quanh giá trị trung bình n 2 ()xx » Công thức ước lượng để tính phương sai:  i D() X s2 1 » Độ lệch chuẩn được tính theo công thức: (n 1)  ()()XDX
  7. Giới thiệu một số hàm thống kê 2. VAR, STDEV (tiếp) . Trong Excel » Tính phương sai sử dụng hàm VAR (variance) • Cú pháp: VAR(number1,number2, ) • number1, number2 có thể là địa chỉ ô, địa chỉ miền hay một giá trị của biến ngẫu nhiên X » Tính độ lệch chuẩn sử dụng hàm STDEV (standard deviation) • Cú pháp: STDEV(number1,number2, ) • number1, number2 có thể là địa chỉ ô, địa chỉ miền hay một giá trị của biến ngẫu nhiên X
  8. Giới thiệu một số hàm thống kê 3. Correl, Covar . Trong xác suất » Khi nghiên cứu đồng thời cặp lượng ngẫu nhiên (X,Y) ngoài các đặc trưng kỳ vọng, phương sai của X, Y ta còn phải xét sự tương quan giữa chúng dùng hiệp phương sai cov(X,Y) hay hệ số tương quan ρxy để xét sự tương quan • Trong giải tích có kiểu liên hệ hàm số giữa 2 đại lượng biến thiên X vày Y (chẳng hạn giữa diện tích Y và bán kính X của đường tròn Y=πX • Khi khảo sát các đại lượng ngẫu nhiên không độc lập X, Y ta thấy chúng cũng có liên hệ với nhau nhưng kiểu liên hệ đó không phải kiểu liên hệ hàm số - Ví dụ: Giữa lượng phân bón X và sản lượng Y của một loại cây chúng có liên hệ nhưng ta không thể nói trước được giá trị của Y khi biết giá trị của X, mà sau khi làm nhiều thí nghiệm ta chỉ có thể nói với mức bón x thì trung bình sẽ thu được sản lượng y Đây gọi là kiểu liên hệ tương quan (hay liên hệ thống kê): mỗi giá trị của X có tương ứng một quy luật phân phối xác suất của Y • Nếu X, Y độc lập thì hiệp phương sai bằng 0. Nếu hiệp phương sai # 0 ta nói rằng các đại lượng ngẫu nhiên X,Y không độc lập • Giá trị tuyệt đối của hệ số tương quan <=1. Nếu trị tuyệt đối khá gần 0 thì coi như giữa X và Y không có tương quan tuyến tính, nếu khá gần 1 thì quan hệ giữa X và Y có thể coi là là tuyến tính (có thể biểu diễn Y=aX+b) » Công thức ước lượng hiệp phương sai và hệ số tương quan
  9. Giới thiệu một số hàm thống kê 3. Correl, Covar (tiếp) . Trong Excel » Tính hiệp phương sai sử dụng hàm COVAR (covariance) • Cú pháp: COVAR(dãy_số_1,dãy_số_2) • dãy_số_1,dãy_số_2 là các miền dữ liệu của các biến X, Y tương ứng • Chú ý: - dãy_số_1, dãy_số_2 phải là kiểu số - Nếu giá trị trong dãy số khác kiểu số thì giá trị này được coi như giá trị 0 thay thế - Nếu hai dãy số khác nhau về kích thước thì gặp lỗi #N/A - Nếu một trong hai dãy rỗng thì gặp lỗi #DIV/0
  10. Giới thiệu một số hàm thống kê 3. Correl, Covar (tiếp) . Trong Excel » Tính hệ số tương quan sử dụng hàm CORREL (correlation) • Cú pháp: CORREL(dãy_số_1,dãy_số_2) • dãy_số_1,dãy_số_2 là các miền dữ liệu của các biến X, Y tương ứng • Chú ý: - dãy_số_1, dãy_số_2 phải là kiểu số - Nếu giá trị trong dãy số khác kiểu số thì giá trị này được coi như giá trị 0 thay thế - Nếu hai dãy số khác nhau về kích thước thì gặp lỗi #N/A - Nếu một trong hai dãy rỗng thì gặp lỗi #DIV/0
  11. Giới thiệu một số hàm thống kê 4. Hàm FINV . Trong xác suất: » Qui luật phân phối xác suất Fisher » Trong thực hành ta thường phải tìm số Fα với k1, k2 bậc tự do sao cho P(F> Fα )=α » Fα gọi là nghịch đảo phân bố xác suất theo quy luật Fisher • Ví dụ: - Với α=0.05, k1=5, k2=10 tra trong bảng phân phối xác suất Fisher tìm được Fα =3.33 - Có nghĩa P(F> 3.33 )=0.05 với bậc tự do k1=5, k2=10
  12. Giới thiệu một số hàm thống kê 4. Hàm FINV (tiếp) . Trong Excel: » Để tìm số Fα ta sử dụng hàm FINV(α, k1, k2) • α là mức xác suất • k1, k2 là bậc tự do 1, bậc tự do 2 » Ví dụ: • Với α=0.05, k1=5, k2=10 dùng hàm FINV(0.05, 5,10) ta tính được Fα= FINV(0.05, 5,10) =3.33 • Có nghĩa P(F> 3.33 )=0.05 với bậc tự do k1=5, k2=10
  13. Giới thiệu một số hàm thống kê 5. Hàm TINV . Trong xác suất đã học qui luật phân bố xác suất Student » Trong thực hành thường phải tìm số tα với k bậc tự do sao cho: P(|t|> tα) = α » Ví dụ: α=0.05, k=10 tra bảng tìm được tα=2.228: P(|t|>2.228)=0.05 . Trong Excel để tìm tα ta sử dụng hàm TINV(α, k) » α là mức xác suất » k là bậc tự do • Ví dụ: TINV(0.05, 10)=2.228
  14. Giới thiệu một số hàm thống kê 6. Hàm FREQUENCY . Hàm tính tần suất trên dãy số dựa theo miền phân tổ đã định . Ví dụ
  15. Giới thiệu một số hàm thống kê 5. Hàm FREQUENCY (tiếp) . Cú pháp FREQUENCY(miền_số_liệu, miền_phân_tổ) » Miền phân tổ được dùng để nhóm các số liệu thành một nhóm . Cách sử dụng hàm » Hàm FREQUENCY phải được sử dụng ở dạng ‘công thức mảng’ » Cách làm: • B1: Đặt con trỏ vào ô muốn hiển thị kết quả, sử dụng hàm một cách bình thường như các hàm khác • B2: Xác định số trường hợp trả về của miền phân tổ • B3: Chọn miền chứa kết quả bao gồm các ô theo chiều dọc, ô đầu tiên là ô vừa tính toán, số ô chọn bằng số trường hợp xác định ở bước 2. Thực hiện nhấn F2, sau đó Ctr+Shift+Enter để fill kết quả
  16. Giới thiệu một số hàm thống kê 6. Hàm LINEST . Trong xác suất: » Xét một số hình ảnh về tính tương quan giữa 2 dãy số liệu có được qua khảo sát cặp biến ngẫu nhiên (X,Y) » Nếu X, Y có quan hệ tuyến tính Y=aX+b thì có thể ước lượng các hệ số a, b theo công thức
  17. Giới thiệu một số hàm thống kê 6. Hàm LINEST (tiếp) . Trong Excel: Tính hồi quy tuyến tính giữa 2 dãy số liệu và cho kết quả dạng » y=ax+b với m là hệ số hồi quy » Y=a1x1+a2x2+ +anxn+b với mi là các hệ số hồi quy . Cú pháp LINEST(tập_giá_trị_y, tập_giá_trị_x) » Hàm cần được sử dụng ở dạng ‘công thức mảng’ (khác với hàm frequency, khi chọn miền, cần chọn các ô theo chiều ngang chứ không theo chiều dọc)