Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 1: Giới thiệu về thống kê học - Nguyễn Duy Long
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 1: Giới thiệu về thống kê học - Nguyễn Duy Long", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_thong_ke_hoc_ung_dung_trong_quan_ly_xay_dung_chuon.pdf
Nội dung text: Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Chương 1: Giới thiệu về thống kê học - Nguyễn Duy Long
- 9/7/2010 Nguyễn Duy Long, TiếnSỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1 Phần01 Nguyễn Duy Long, TiếnSỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 2 1
- 9/7/2010 Tư duy thống kê Giới thiệu về thống kê học Trình bày dữ liệu định tính ©2010, Nguyễn Duy Long, Tiến Sỹ 3 ©2010, Nguyễn Duy Long, Tiến Sỹ 4 2
- 9/7/2010 Thờigiancủadự án: ◦ Dự án hoàn thành khi tấtcả các công việccủanó hoàn thành ◦ Thờigianhoànthànhcáccôngviệc là không chắc chắn. ◦ Hiểuvàgiảmthiểusự không chắcchắnnàysẽ giúp quảnlýtiến độ thành công. Phầnngầm Phần khung Hoàn thiện Nguồn: Glossary oi Statistical Terms, ASQ Quality Press ©2010, Nguyễn Duy Long, Tiến Sỹ 5 Là mộttriếtlýcủaviệchọcvàhànhđộng dựa trên các nggyuyên lý cơ bảnsau: ◦ Tấtcả công việc đềuxảyratrongmộthệ thống của các qui trình kếtnối nhau ◦ Sự biến thiên (variation) tồntạitrongtấtcả các qui trình ◦ Hiểuvàgiảmthiểusự biến thiên là chìa khóa để thành công Nguồn: Glossary oi Statistical Terms, ASQ Quality Press ©2010, Nguyễn Duy Long, Tiến Sỹ 6 3
- 9/7/2010 Qui trình Tư duy thống kê Sự biến đổi Các dữ liệu Phương pháp thống kê Các công cụ thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 7 ©2010, Nguyễn Duy Long, Tiến Sỹ 8 4
- 9/7/2010 Đánh giá các kếtluậnsauđây: ◦ “Những ngườicócha mẹ có bằng đạihọcthìcókhả năng (likely) lấybằng đạihọchơnlànhững người có cha mẹ không có bằng đạihọc.” ◦ “Lượng xe máy ở Sài Thành có liên hệ vớilượng nhà và đất ởởHà Thành.” ©2010, Nguyễn Duy Long, Tiến Sỹ 9 Nguồn: ©2010, Nguyễn Duy Long, Tiến Sỹ 10 5
- 9/7/2010 Thống kê: Với thông tin trong tay bạn, cái gì trong thùng? Xác suất: Với thông tin trong thùng, cái gì trong tay bạn? Nguồn: MIT OCW, dựa trên Gilbert, 1976 ©2010, Nguyễn Duy Long, Tiến Sỹ 11 Thống kê học (statistics, số ít): Một cách lý luận, cùng với các công cụ và phương pppháp đi kèm, đượcthiếtkế để giúp chúng ta hiểubiết về thế giới. Thống kê (satistics, số nhiều): các phép tính cụ thể đượcthựchiệntrêncácdữ liệu(data). ©2010, Nguyễn Duy Long, Tiến Sỹ 12 6
- 9/7/2010 Dữ liệu Thống kê Thông tin (Data) (Statistics) (Information) ©2010, Nguyễn Duy Long, Tiến Sỹ 13 Suy nghĩ (think) Biểuthị (show) Trình bày (tell) ©2010, Nguyễn Duy Long, Tiến Sỹ 14 7
- 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 15 Quầnthể (population): một nhóm gồmtấtcả các thành phần mà nhà thựchànhthống kê quan tâm. ◦ v.d. tấtcả các nhà thầu ở Sài Gòn Mẫu(sample): mộttậphợp các dữ liệurútra từ quầnthể ◦ v.d. mộtmẫu 75 nhà thầu ở Sài Gòn ©2010, Nguyễn Duy Long, Tiến Sỹ 16 8
- 9/7/2010 Thông số (parameter): một đạilượng mô tả quầnthể ◦ v.d. doanh thu bình quân củatất các nhà thầulà 100 tỷ đồng. Trị (tham) số thống kê (statistic): một đại lượng mô tả mẫu ◦ v.d. doanh thu bình quân củamẫu 75 nhà thầulà 120 tỷ đồng. ©2010, Nguyễn Duy Long, Tiến Sỹ 17 Quầnthể Mẫu Tậpcon Trị số thống kê Thông số Các quầnthể có các thông số; các mẫucócáctrị số thống kê ©2010, Nguyễn Duy Long, Tiến Sỹ 18 9
- 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 19 Phương pháp thông kê Thống kê học mô tả Thông kê học suy luận (descriptive statistics) (inferential statistics) ©2010, Nguyễn Duy Long, TiếnSỹ 20 10
- 9/7/2010 Thu thập số liệu ◦ v.dkhd. khảo sááhíát, quan sát, thí nghiệm Trình bày dữ liệu ◦ v.d. biểu đồ và đồ thị Xác định đặc điểmmc củaad dữ liệu x ◦ v.d. trung bình của mẫu= i n ©2010, Nguyễn Duy Long, Tiến Sỹ 21 Quá trình tạoramột ướclượng, dự đoán, hay qqyuyết định về quầnthể dựatrênmẫu. Quầnthể Mẫu Suy luận Trị số thống kê Thông số ©2010, Nguyễn Duy Long, Tiến Sỹ 22 11
- 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 23 Dữ liệu (data): là các đạilượng cùng ngữ cảnh đikèm. Ngữ cảnh củadữ liệu: “Five W’s”: Who, What, When, Where, and Why. Có thể có cả “How.” Dữ liệu không có ngữ cảnh đikèmthìhầu như vô nghĩa. ©2010, Nguyễn Duy Long, Tiến Sỹ 24 12
- 9/7/2010 Họ Tên TuổiLoạilao Lương ĐộiThi Bảohiểm động ngày Công Phan Cam 18 Phổ thông 50,000 1 Không Vũ Phu 35 Nề 90,000 1 Có Cao Giá 28 Nề 95,000 2 Không TrầnAi 45 Sắt 90,000 1 Có Lê La 30 Điện 85,000 2 Có Lâm Tặc 30 Mộc 90, 000 1 Không Ngô Khoai 32 Phổ thông 45,000 2 Có Phạm 22 Phổ thông 50,000 2 Không Thượng (Trích từ bảng lương tháng 9/2009, Dự Án “Xây Nhà Từ Nóc”) ©2010, Nguyễn Duy Long, Tiến Sỹ 25 Định tính (categorical) Biếncủadữ liệu Định lượng (quantitative) ©2010, Nguyễn Duy Long, Tiến Sỹ 26 13
- 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 27 Biểu đồ số ngườimắcbệnh và tử vong do cúm A/H1N1: Nguồn: Báo TuổiTrẻ, 28/09/2009 ©2010, Nguyễn Duy Long, Tiến Sỹ 28 14
- 9/7/2010 Ba qui tắc: 1. Vẽ/tạohìnhảnh —cóthể lộ ra những điềumà chúng ta không thấytừ dữ liệuthô. 2. Vẽ/tạohìnhảnh —những đặc điểmquantrọng của dữ liệusẽ đượcthể hiện. Chúng ta có thể thấy những điều chúng ta không mong đợi. 3. Vẽ/tạohìnhảnh —cáchtốtnhất để nói vớingười khác rằng dữ liệucủabạncóhìnhảnh trình bày đượcchọnlựakỹ. ©2010, Nguyễn Duy Long, Tiến Sỹ 29 Đếmsố lượng của các giá trị dữ liệuchomỗi loại. Tổ chức chúng vào mộtbảng chỉ số đếm, thể hiệntổng số lượng và loại. Ví dụ hạng vé tàu Titanic: Hạng vé Đếm Hạng nhất 325 Hạng nhì 285 Hạng ba 706 Thủythủ đoàn 885 (Nguồn: De Veaux et al., 2006) ©2010, Nguyễn Duy Long, Tiến Sỹ 30 15
- 9/7/2010 Bảng tầnsuấttương đốicũng tương tự, nhưng thể hiệndạng phầntrăm(thayvìsố đếm) chomỗi loại. Hạng vé % Hạnh nhất 14.77 Hạng nhì 12.95 Hạng ba 32. 08 Thủythủ đoàn 40.21 ©2010, Nguyễn Duy Long, Tiến Sỹ 31 Thủythủ đoàn Hạng ba Hạng hai Hạng nhất ©2010, Nguyễn Duy Long, Tiến Sỹ 32 16
- 9/7/2010 Biểu đồ thanh tầnsuấttương đốimôtả sự phân phối tương đốicủasố đếmchomỗiloại. Thỏamãn“nguyên lý diệntíhích.” Nhất Nhì Ba Thủythủ đoàn Hạng ©2010, Nguyễn Duy Long, Tiến Sỹ Slide 3- 33 Khi quan tâm các phầntrongtổng thể, biểu đồ bánh là chọnlựahay. Hạng Nhất Hạng hai Thủythủ Hạnn ba ©2010, Nguyễn Duy Long, Tiến Sỹ 34 17
- 9/7/2010 Cho phép trình bày hai biến định tính cùng nhau. Cho phép thể hiện các thành phần đượcphânphốinhư thế nào theo mỗi biến, và tùy thuộc vào giá trị của biến khác. ◦ v.d. xem xét hạng vé và sự sống sót củahànhkhách trên tàu Titanic: Hạng ấ ủ ủ ổ t Nh t Nhì Ba Th yth T ng ó ó Sống 203 118 178 212 711 ng s Chết 122 167 528 673 1490 ố S Tổng 325 285 706 885 2201 ©2010, Nguyễn Duy Long, Tiến Sỹ 35 Các cộtvàhànglề bên phảivàbêndướichoratổng số và các phân phốitầnsuất (frequency distributions) cho mỗi một biến. Mỗiphânphốitầnsuấtgọilàphânphốilề (marginal distribution) củabiếntương ứng. ◦ Phân phốilề cho biếnsống sót (survival) củatàu Titanic: Hạng t ó ó Nhất Nhì Ba Thủy thủ Sống 203 118 178 212 ng s ố ế S Ch t 122 167 528 673 ©2010, Nguyễn Duy Long, Tiến Sỹ 36 18
- 9/7/2010 Mỗiphầntử củabảng cho ra số đếmcủasự kếthợpgiá trị củahaibiến. ◦ Ví dụ, phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra 673 thủythủ chết khi tàu Titanic bị chìm. Hạng Nhất Nhì Ba Thủythủ Tổng sót Sống 203 118 178 212 711 g g n Chết 122 167 528 673 1490 ố S Tổng 325 285 706 885 2201 ©2010, Nguyễn Duy Long, Tiến Sỹ 37 Phân phốicóđiềukiện(conditional distribution) cho ra phân phốicủamộtbiến chỉ cho các thành phầnthỏamãnmột điều kiệnnàođócủabiếnkhác. ◦ Phân phốicóđiềukiệncủahạng vé với điềukiện sống: Hạng Nhất Nhì Ba Thủythủ Tổng 203 118 178 212 711 ng ố S 28.6% 16.6% 25.0% 29.8% 100% ©2010, Nguyễn Duy Long, Tiến Sỹ 38 19
- 9/7/2010 ◦ Phân phốicóđiềukiệncủahạng vé, với điềukiện thiệtmạng: Hạng Nhất Nhì Ba Thủythủ Tổng t 122 167 528 673 1490 ế Ch 8.2% 11.2% 35.4% 45.2% 100% ©2010, Nguyễn Duy Long, Tiến Sỹ 39 Các phân phốicóđiềukiệnchothấyrằng có sự khác nhau về hạng vé và tỷ lệ sự sống sót. Sống sót Chết Nhất Nhì Ba Thủythủ ©2010, Nguyễn Duy Long, Tiến Sỹ 40 20
- 9/7/2010 Sự phân phốicủahạng vé vớingườisống sót và sự phân phối của hạng vé với người không sống sót là khác nhau. Hạng vé và sự sống sót là có sự liệnhệ, nhưng chúng không độclập. Các biến đượccoilàđộclậpkhisự phân phối củamộtbiếntrong bảng tùy thuộclàgiống nhau cho mỗiloạicủabiếncònlại. ©2010, Nguyễn Duy Long, Tiến Sỹ 41 Biểu đồ thanh phân đốt (segmented bar charts) trình bày lượng thông tin giống vớibiểu đồ bánh. Biểu đồ thanh phân đốtgiữahạng vé và tình trạng ố Hạng s ng sót: m Nhất ă Nhì ntr ầ Ba ủ ủ Ph Th yth Sống sót Chết ©2010, Nguyễn Duy Long, Tiến Sỹ 42 21
- 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 43 “Cănhộ giá trung bình bán chạy”: Nguồn: Báo TuổiTrẻ, 24/10/2009 ©2010, Nguyễn Duy Long, Tiến Sỹ 44 22
- 9/7/2010 Trình bày thành thật—đảmbảobiểu đồ nói ra những gì đang thể hiện. ◦ Có vấn đề gì trong biểu đồ trên? ©2010, Nguyễn Duy Long, Tiến Sỹ 45 Đừng cường điệu hóa. Không kếtluậnnhững điềuchưathể kếtluận Đừng sử dụng trị trung bình không hợplý— mà có thể dẫn đến cái gọilànghịch lý Simpson (Simpson’s Paradox). ©2010, Nguyễn Duy Long, Tiến Sỹ 46 23
- 9/7/2010 Hương có điểm TBTL 7.00 ở trường ĐHBK Thủy có điểm TBTL 7.50 ở trường ĐHBK Ai có vẻ họctốthơn trong các môn học ở ĐHBK? Hương hay Thủy? Theo bạn thì ai có khả năng đạt điểm cao hơn trong môn họcnày? ©2010, Nguyễn Duy Long, Tiến Sỹ 47 Chấtlượng thi công công trình của hai nhà thầu A và B theo đánh giá củacácchủ đầutư (đạt/tổng số hợp đồng): Loạicôngtrình Dân dụng Công nghiệpTổng Nhà thầuA 40/60 13/15 53/75 (66.6%) (86.7%) (70.7%) Nhà thầu B 5/8 42/50 47/58 (62.5%) (84.0%) (81.0%) Chọn nhà thầunàođể thi công chấtlượng hơn? ©2010, Nguyễn Duy Long, Tiến Sỹ 48 24
- 9/7/2010 ©2010, Nguyễn Duy Long, Tiến Sỹ 49 25