Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 1: Giới thiệu về thống kê học - Nguyễn Duy Long

pdf 25 trang ngocly 3270
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 1: Giới thiệu về thống kê học - Nguyễn Duy Long", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_hoc_ung_dung_trong_quan_ly_xay_dung_chuon.pdf

Nội dung text: Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 1: Giới thiệu về thống kê học - Nguyễn Duy Long

  1. 9/7/2010 Nguyễn Duy Long, TiếnSỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1 Phần01 Nguyễn Duy Long, TiếnSỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 2 1
  2. 9/7/2010  Tư duy thống kê  Giới thiệu về thống kê học  Trình bày dữ liệu định tính ©2010, Nguyễn Duy Long, Tiến Sỹ 3 ©2010, Nguyễn Duy Long, Tiến Sỹ 4 2
  3. 9/7/2010  Thờigiancủadự án: ◦ Dự án hoàn thành khi tấtcả các công việccủanó hoàn thành ◦ Thờigianhoànthànhcáccôngviệc là không chắc chắn. ◦ Hiểuvàgiảmthiểusự không chắcchắnnàysẽ giúp quảnlýtiến độ thành công. Phầnngầm Phần khung Hoàn thiện Nguồn: Glossary oi Statistical Terms, ASQ Quality Press ©2010, Nguyễn Duy Long, Tiến Sỹ 5  Là mộttriếtlýcủaviệchọcvàhànhđộng dựa trên các nggyuyên lý cơ bảnsau: ◦ Tấtcả công việc đềuxảyratrongmộthệ thống của các qui trình kếtnối nhau ◦ Sự biến thiên (variation) tồntạitrongtấtcả các qui trình ◦ Hiểuvàgiảmthiểusự biến thiên là chìa khóa để thành công Nguồn: Glossary oi Statistical Terms, ASQ Quality Press ©2010, Nguyễn Duy Long, Tiến Sỹ 6 3
  4. 9/7/2010 Qui trình Tư duy thống kê Sự biến đổi Các dữ liệu Phương pháp thống kê Các công cụ thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 7 ©2010, Nguyễn Duy Long, Tiến Sỹ 8 4
  5. 9/7/2010  Đánh giá các kếtluậnsauđây: ◦ “Những ngườicócha mẹ có bằng đạihọcthìcókhả năng (likely) lấybằng đạihọchơnlànhững người có cha mẹ không có bằng đạihọc.” ◦ “Lượng xe máy ở Sài Thành có liên hệ vớilượng nhà và đất ởởHà Thành.” ©2010, Nguyễn Duy Long, Tiến Sỹ 9 Nguồn: ©2010, Nguyễn Duy Long, Tiến Sỹ 10 5
  6. 9/7/2010 Thống kê: Với thông tin trong tay bạn, cái gì trong thùng? Xác suất: Với thông tin trong thùng, cái gì trong tay bạn? Nguồn: MIT OCW, dựa trên Gilbert, 1976 ©2010, Nguyễn Duy Long, Tiến Sỹ 11  Thống kê học (statistics, số ít): Một cách lý luận, cùng với các công cụ và phương pppháp đi kèm, đượcthiếtkế để giúp chúng ta hiểubiết về thế giới.  Thống kê (satistics, số nhiều): các phép tính cụ thể đượcthựchiệntrêncácdữ liệu(data). ©2010, Nguyễn Duy Long, Tiến Sỹ 12 6
  7. 9/7/2010 Dữ liệu Thống kê Thông tin (Data) (Statistics) (Information) ©2010, Nguyễn Duy Long, Tiến Sỹ 13  Suy nghĩ (think)  Biểuthị (show)  Trình bày (tell) ©2010, Nguyễn Duy Long, Tiến Sỹ 14 7
  8. 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 15  Quầnthể (population): một nhóm gồmtấtcả các thành phần mà nhà thựchànhthống kê quan tâm. ◦ v.d. tấtcả các nhà thầu ở Sài Gòn  Mẫu(sample): mộttậphợp các dữ liệurútra từ quầnthể ◦ v.d. mộtmẫu 75 nhà thầu ở Sài Gòn ©2010, Nguyễn Duy Long, Tiến Sỹ 16 8
  9. 9/7/2010  Thông số (parameter): một đạilượng mô tả quầnthể ◦ v.d. doanh thu bình quân củatất các nhà thầulà 100 tỷ đồng.  Trị (tham) số thống kê (statistic): một đại lượng mô tả mẫu ◦ v.d. doanh thu bình quân củamẫu 75 nhà thầulà 120 tỷ đồng. ©2010, Nguyễn Duy Long, Tiến Sỹ 17 Quầnthể Mẫu Tậpcon Trị số thống kê Thông số Các quầnthể có các thông số; các mẫucócáctrị số thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 18 9
  10. 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 19 Phương pháp thông kê Thống kê học mô tả Thông kê học suy luận (descriptive statistics) (inferential statistics) ©2010, Nguyễn Duy Long, TiếnSỹ 20 10
  11. 9/7/2010  Thu thập số liệu ◦ v.dkhd. khảo sááhíát, quan sát, thí nghiệm  Trình bày dữ liệu ◦ v.d. biểu đồ và đồ thị  Xác định đặc điểmmc củaad dữ liệu x ◦ v.d. trung bình của mẫu= i n ©2010, Nguyễn Duy Long, Tiến Sỹ 21  Quá trình tạoramột ướclượng, dự đoán, hay qqyuyết định về quầnthể dựatrênmẫu. Quầnthể Mẫu Suy luận Trị số thống kê Thông số ©2010, Nguyễn Duy Long, Tiến Sỹ 22 11
  12. 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 23  Dữ liệu (data): là các đạilượng cùng ngữ cảnh đikèm.  Ngữ cảnh củadữ liệu: “Five W’s”: Who, What, When, Where, and Why. Có thể có cả “How.”  Dữ liệu không có ngữ cảnh đikèmthìhầu như vô nghĩa. ©2010, Nguyễn Duy Long, Tiến Sỹ 24 12
  13. 9/7/2010 Họ Tên TuổiLoạilao Lương ĐộiThi Bảohiểm động ngày Công Phan Cam 18 Phổ thông 50,000 1 Không Vũ Phu 35 Nề 90,000 1 Có Cao Giá 28 Nề 95,000 2 Không TrầnAi 45 Sắt 90,000 1 Có Lê La 30 Điện 85,000 2 Có Lâm Tặc 30 Mộc 90, 000 1 Không Ngô Khoai 32 Phổ thông 45,000 2 Có Phạm 22 Phổ thông 50,000 2 Không Thượng (Trích từ bảng lương tháng 9/2009, Dự Án “Xây Nhà Từ Nóc”) ©2010, Nguyễn Duy Long, Tiến Sỹ 25 Định tính (categorical) Biếncủadữ liệu Định lượng (quantitative) ©2010, Nguyễn Duy Long, Tiến Sỹ 26 13
  14. 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 27  Biểu đồ số ngườimắcbệnh và tử vong do cúm A/H1N1: Nguồn: Báo TuổiTrẻ, 28/09/2009 ©2010, Nguyễn Duy Long, Tiến Sỹ 28 14
  15. 9/7/2010  Ba qui tắc: 1. Vẽ/tạohìnhảnh —cóthể lộ ra những điềumà chúng ta không thấytừ dữ liệuthô. 2. Vẽ/tạohìnhảnh —những đặc điểmquantrọng của dữ liệusẽ đượcthể hiện. Chúng ta có thể thấy những điều chúng ta không mong đợi. 3. Vẽ/tạohìnhảnh —cáchtốtnhất để nói vớingười khác rằng dữ liệucủabạncóhìnhảnh trình bày đượcchọnlựakỹ. ©2010, Nguyễn Duy Long, Tiến Sỹ 29  Đếmsố lượng của các giá trị dữ liệuchomỗi loại.  Tổ chức chúng vào mộtbảng chỉ số đếm, thể hiệntổng số lượng và loại.  Ví dụ hạng vé tàu Titanic: Hạng vé Đếm Hạng nhất 325 Hạng nhì 285 Hạng ba 706 Thủythủ đoàn 885 (Nguồn: De Veaux et al., 2006) ©2010, Nguyễn Duy Long, Tiến Sỹ 30 15
  16. 9/7/2010  Bảng tầnsuấttương đốicũng tương tự, nhưng thể hiệndạng phầntrăm(thayvìsố đếm) chomỗi loại. Hạng vé % Hạnh nhất 14.77 Hạng nhì 12.95 Hạng ba 32. 08 Thủythủ đoàn 40.21 ©2010, Nguyễn Duy Long, Tiến Sỹ 31 Thủythủ đoàn Hạng ba Hạng hai Hạng nhất ©2010, Nguyễn Duy Long, Tiến Sỹ 32 16
  17. 9/7/2010  Biểu đồ thanh tầnsuấttương đốimôtả sự phân phối tương đốicủasố đếmchomỗiloại.  Thỏamãn“nguyên lý diệntíhích.” Nhất Nhì Ba Thủythủ đoàn Hạng ©2010, Nguyễn Duy Long, Tiến Sỹ Slide 3- 33  Khi quan tâm các phầntrongtổng thể, biểu đồ bánh là chọnlựahay. Hạng Nhất Hạng hai Thủythủ Hạnn ba ©2010, Nguyễn Duy Long, Tiến Sỹ 34 17
  18. 9/7/2010  Cho phép trình bày hai biến định tính cùng nhau.  Cho phép thể hiện các thành phần đượcphânphốinhư thế nào theo mỗi biến, và tùy thuộc vào giá trị của biến khác. ◦ v.d. xem xét hạng vé và sự sống sót củahànhkhách trên tàu Titanic: Hạng ấ ủ ủ ổ t Nh t Nhì Ba Th yth T ng ó ó Sống 203 118 178 212 711 ng s Chết 122 167 528 673 1490 ố S Tổng 325 285 706 885 2201 ©2010, Nguyễn Duy Long, Tiến Sỹ 35  Các cộtvàhànglề bên phảivàbêndướichoratổng số và các phân phốitầnsuất (frequency distributions) cho mỗi một biến.  Mỗiphânphốitầnsuấtgọilàphânphốilề (marginal distribution) củabiếntương ứng. ◦ Phân phốilề cho biếnsống sót (survival) củatàu Titanic: Hạng t ó ó Nhất Nhì Ba Thủy thủ Sống 203 118 178 212 ng s ố ế S Ch t 122 167 528 673 ©2010, Nguyễn Duy Long, Tiến Sỹ 36 18
  19. 9/7/2010  Mỗiphầntử củabảng cho ra số đếmcủasự kếthợpgiá trị củahaibiến. ◦ Ví dụ, phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra 673 thủythủ chết khi tàu Titanic bị chìm. Hạng Nhất Nhì Ba Thủythủ Tổng sót Sống 203 118 178 212 711 g g n Chết 122 167 528 673 1490 ố S Tổng 325 285 706 885 2201 ©2010, Nguyễn Duy Long, Tiến Sỹ 37  Phân phốicóđiềukiện(conditional distribution) cho ra phân phốicủamộtbiến chỉ cho các thành phầnthỏamãnmột điều kiệnnàođócủabiếnkhác. ◦ Phân phốicóđiềukiệncủahạng vé với điềukiện sống: Hạng Nhất Nhì Ba Thủythủ Tổng 203 118 178 212 711 ng ố S 28.6% 16.6% 25.0% 29.8% 100% ©2010, Nguyễn Duy Long, Tiến Sỹ 38 19
  20. 9/7/2010 ◦ Phân phốicóđiềukiệncủahạng vé, với điềukiện thiệtmạng: Hạng Nhất Nhì Ba Thủythủ Tổng t 122 167 528 673 1490 ế Ch 8.2% 11.2% 35.4% 45.2% 100% ©2010, Nguyễn Duy Long, Tiến Sỹ 39  Các phân phốicóđiềukiệnchothấyrằng có sự khác nhau về hạng vé và tỷ lệ sự sống sót. Sống sót Chết Nhất Nhì Ba Thủythủ ©2010, Nguyễn Duy Long, Tiến Sỹ 40 20
  21. 9/7/2010  Sự phân phốicủahạng vé vớingườisống sót và sự phân phối của hạng vé với người không sống sót là khác nhau.  Hạng vé và sự sống sót là có sự liệnhệ, nhưng chúng không độclập.  Các biến đượccoilàđộclậpkhisự phân phối củamộtbiếntrong bảng tùy thuộclàgiống nhau cho mỗiloạicủabiếncònlại. ©2010, Nguyễn Duy Long, Tiến Sỹ 41  Biểu đồ thanh phân đốt (segmented bar charts) trình bày lượng thông tin giống vớibiểu đồ bánh.  Biểu đồ thanh phân đốtgiữahạng vé và tình trạng ố Hạng s ng sót: m Nhất ă Nhì ntr ầ Ba ủ ủ Ph Th yth Sống sót Chết ©2010, Nguyễn Duy Long, Tiến Sỹ 42 21
  22. 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 43  “Cănhộ giá trung bình bán chạy”: Nguồn: Báo TuổiTrẻ, 24/10/2009 ©2010, Nguyễn Duy Long, Tiến Sỹ 44 22
  23. 9/7/2010  Trình bày thành thật—đảmbảobiểu đồ nói ra những gì đang thể hiện. ◦ Có vấn đề gì trong biểu đồ trên? ©2010, Nguyễn Duy Long, Tiến Sỹ 45  Đừng cường điệu hóa. Không kếtluậnnhững điềuchưathể kếtluận  Đừng sử dụng trị trung bình không hợplý— mà có thể dẫn đến cái gọilànghịch lý Simpson (Simpson’s Paradox). ©2010, Nguyễn Duy Long, Tiến Sỹ 46 23
  24. 9/7/2010  Hương có điểm TBTL 7.00 ở trường ĐHBK  Thủy có điểm TBTL 7.50 ở trường ĐHBK  Ai có vẻ họctốthơn trong các môn học ở ĐHBK? Hương hay Thủy?  Theo bạn thì ai có khả năng đạt điểm cao hơn trong môn họcnày? ©2010, Nguyễn Duy Long, Tiến Sỹ 47  Chấtlượng thi công công trình của hai nhà thầu A và B theo đánh giá củacácchủ đầutư (đạt/tổng số hợp đồng): Loạicôngtrình Dân dụng Công nghiệpTổng Nhà thầuA 40/60 13/15 53/75 (66.6%) (86.7%) (70.7%) Nhà thầu B 5/8 42/50 47/58 (62.5%) (84.0%) (81.0%)  Chọn nhà thầunàođể thi công chấtlượng hơn? ©2010, Nguyễn Duy Long, Tiến Sỹ 48 24
  25. 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 49 25