Bài giảng Thống kê trong kinh doanh thực hành Excel - Nguyễn Duy Tâm

pdf 116 trang ngocly 2620
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê trong kinh doanh thực hành Excel - Nguyễn Duy Tâm", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_trong_kinh_doanh_thuc_hanh_excel_nguyen_d.pdf

Nội dung text: Bài giảng Thống kê trong kinh doanh thực hành Excel - Nguyễn Duy Tâm

  1. NGUYỄN DUY TÂM 1 02-Oct-09 Nguyễn Duy Tâm _ IDR
  2. Con người –Tầm nhìn mới NỘI DUNG 1. Nhập dữ liệu vào excel 2. Thống kê dữ liệu dạng bảng 3. Thống kê dữ liệu dạng đồ thị 4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả 5. Ước lượng và kiểm định giả thiết 6. Phân tích phương sai ANOVA 7. Hồi quy tương quan 8. Kiểm định phi tham số 9. Lý thuyết quyết định 02-Oct-09 Nguyễn Duy Tâm _ IDR 2
  3. Nhập số liệu vào Excel Con người –Tầm nhìn mới OBS Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION 1 0 0 22 4 1 4 2 1 1 22 0.125 0 5 3 0 0 18 10 0 5 4 0 1 22 0.75 0 3 5 12 0 42 15 1 2 6 0 0 37 15 1 4 7 0 1 52 15 1 4 8 7 0 27 1.5 0 5 9 0 1 27 4 0 4 10 0 0 27 1.5 1 2 Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls OBS = Số thứ tự của người được phỏng vấn Y-PT = Số lần quan hệ tình dục ngoài hôn nhân trong năm Z1_MALE = 1 nếu là nam, 0 nếu là nữ Z2_AGE = Tuổi Z3_NOYM = Số năm kết hôn Z4_CHILD = 1 nếu có con, 0 nếu chưa có con Z8_SATISFACTION = Mức độ thỏa mãn về hôn nhân, thang Likert 1-5 Ghi chú : Biến số theo cột, quan sát ghi theo hàng 02-Oct-09 Nguyễn Duy Tâm _ IDR 3
  4. Con người –Tầm nhìn mới Tạo biểu nhập liệu (Form) Trên một trang bảng tính mới (New worksheet) Tạo dòng tiêu đề (biến số) ở dòng 1. Quét khối dòng tiêu đề, rồi vào Data/ Form 02-Oct-09 Nguyễn Duy Tâm _ IDR 4
  5. Con người –Tầm nhìn mới Tạo biểu nhập liệu (Form) Vì chúng ta không định nghĩa chính xác số dòng của bảng tính, nên Excel có hỏi như bảng giao diện ở trên. Đơn giản là chọn OK. 02-Oct-09 Nguyễn Duy Tâm _ IDR 5
  6. Con người –Tầm nhìn mới Bản ghi cho ngƣời thứ nhất Nhập cho người thứ nhất Bảng số liệu điều tra của người này như sau OBS = 1 Người thứ nhất Y-PT = 0 Chưa ngoại tình Z1_MALE = 0 Nữ Z2_AGE = 22 22 tuổi Z3_NOYM = 4 Kết hôn được 4 năm Z4_CHILD = 1 Đã có con Z8_SATISFACTION = 4 Hài lòng về cuộc hôn nhân của mình 02-Oct-09 Nguyễn Duy Tâm _ IDR 6
  7. Bản ghi cho ngƣời thứ nhất Con người –Tầm nhìn mới 02-Oct-09 Nguyễn Duy Tâm _ IDR 7
  8. Con người –Tầm nhìn mới Bản ghi cho ngƣời thứ hai Từ Form nhập liệu, click New để nhập một bản ghi (record) hay quan sát (observation) mới. Bảng số liệu điều tra của người thứ hai như sau OBS = 2 Người thứ hai Y-PT = 1 Đã ngoại tình Z1_MALE = 1 Nam Z2_AGE = 22 22 tuổi Z3_NOYM = 0.125 Kết hôn được 1.5 tháng (1.5/12) Z4_CHILD = 0 Chưa có con Z8_SATISFACTION = 5 Rất hài lòng về cuộc hôn nhân của mình 02-Oct-09 Nguyễn Duy Tâm _ IDR 8
  9. Con người –Tầm nhìn mới Bản ghi cho ngƣời thứ hai Làm tương tự cho đến người thứ 10 ở slide 3. 02-Oct-09 Nguyễn Duy Tâm _ IDR 9
  10. Con người –Tầm nhìn mới Mảng thứ tự Chọn biến Z2_AGE Sắp xếp thành mảng thứ tự từ nhỏ đến lớn Quét khối toàn bộ số liệu, kể cả dòng tên biến. Data/ Sort 02-Oct-09 Nguyễn Duy Tâm _ IDR 10
  11. Giao diện Sort Con người –Tầm nhìn mới OBS Z2_AGE 3 18 1 22 2 22 4 22 8 27 9 27 10 27 6 Kết quả37 5 42 7 52 Chọn Sort by: Z2_AGE Chọn Asending: Sắp xếp theo thứ tự tăng dần 02-Oct-09 Nguyễn Duy Tâm _ IDR 11
  12. Con người –Tầm nhìn mới 1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc tính và thuộc lượng.  Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ  Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin) Công cụ trên excel: Dùng lệnh =FREQUENCY[ (data_array, bins_array)] 02-Oct-09 Nguyễn Duy Tâm _ IDR 12
  13. Con người –Tầm nhìn mới 1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG Quy trình dùng lệnh FREQUENCY Đối với biến có ít biểu hiện  B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện  B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency Cú pháp: = FREQUENCY(data_array, bins_array)  Data_array: Dữ liệu cần lập bảng  Bins_array: các biểu hiện  Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím [ctrl+shift+enter]  Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital] 02-Oct-09 Nguyễn Duy Tâm _ IDR 13
  14. Con người –Tầm nhìn mới 1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG Quy trình dùng lệnh FREQUENCY Đối với biến có nhiều biểu hiện: B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi phân tổ. B2: Lập cột Bin chỉ gồm các số giới hạn trên của mỗi phân tổ. Ví dụ biến [trình độ học vấn]_edu B3: dùng lệnh FREQUENCY để lập bảng. . Bài tập: lập bảng tần số theo trình độ học vấn, độ tuổi và trình độ kết hôn. . Chú ý: phân tổ do sinh viên tự phân, có thể phân tổ đều hoặc không đều 02-Oct-09 Nguyễn Duy Tâm _ IDR 14
  15. Con người –Tầm nhìn mới Biểu đồ tần số-Thủ tục Data Analysis Dùng thủ tục Data Analysis trong thư viện hàm Add-Ins của Excel Kiểm tra xem có thủ tục Data Analysis trong Tools hay chưa? Tools/ Add-Ins/ Check vào Analysis ToolPak/ OK 02-Oct-09 Nguyễn Duy Tâm _ IDR 15
  16. Con người –Tầm nhìn mới Biểu đồ tần số-Thủ tục Data Analysis Tools/ Data Analysis/ Histogram 02-Oct-09 Nguyễn Duy Tâm _ IDR 16
  17. Biểu đồ tần số-Thủ tục DataCon ngườiAnalysis –Tầm nhìn mới Input Range: Quét khối số liệu, nhớ có cả tên biến Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên Labels: Khai báo có dòng đầu tiên là tên biến Chọn Output range: ô đầu tiên chứa kết quả Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart Output 02-Oct-09 Nguyễn Duy Tâm _ IDR 17
  18. Biểu đồ tần số-Thủ tục DataCon ngườiAnalysis –Tầm nhìn mới Cumulative Cumulative BIN Frequency % BIN Frequency % 20 1 10.00% 30 6 60.00% 30 6 70.00% 20 1 70.00% 40 1 80.00% 40 1 80.00% 50 1 90.00% 50 1 90.00% 60 1 100.00% 60 1 100.00% More 0 100.00% More 0 100.00% Bảng tần số, tần suất tích lũy và phân phối Pareto 02-Oct-09 Nguyễn Duy Tâm _ IDR 18
  19. Biểu đồ tần số-Thủ tục DataCon ngườiAnalysis –Tầm nhìn mới Histogram 7 120.00% 6 100.00% 5 80.00% 4 Frequency 60.00% Cumulative % Frequency 3 40.00% 2 20.00% 1 0 0.00% 30 20 40 50 60 More BIN Biểu đồ Pareto 02-Oct-09 Nguyễn Duy Tâm _ IDR 19
  20. Con người –Tầm nhìn mới 2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ Các dạng đồ thị: 1. Hình thanh : Column, Bar, 2. Hình tròn, (bánh) : Pie 3. Đường gấp khúc : Line 4. Phân tán : Scatter 02-Oct-09 Nguyễn Duy Tâm _ IDR 20
  21. Con người –Tầm nhìn mới 2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ QUY TRÌNH VẼ ĐỒ THỊ ĐỒ THỊ HÌNH TRÕN  B1: chọn vùng dữ liệu Tần số  B2: chọn biểu tượng đồ thị Rất không hài [chart wizart] hoặc lòng 1% 5% Không hài 12% insert/chart lòng 49% Bình thường  B3: Chọn các hiệu chỉnh 33% tương ứng Hài lòng Rất hài lòng Đồ thị hình tròn thường dùng tần suất (%) để hiển thị 02-Oct-09 Nguyễn Duy Tâm _ IDR 21
  22. Con người –Tầm nhìn mới 2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ ĐỒ THỊ HÌNH THANH ĐỒ THỊ HÌNH THANH [COLUMN] [BAR] Tên thuộc tính dài Tên thuộc tính ngắn 02-Oct-09 Nguyễn Duy Tâm _ IDR 22
  23. gian liệu theo qua dõi thời dùng cho trường hợp dữ Đồ thị Line:thường GẤP _ LINE KHÚC ĐỒ ĐƯỜNG THỊ 02 - Oct - 09 Nguyễn Nguyễn Duy Tâm_ IDR 100 120 140 160 180 20 40 60 80 0 Jan-95 Jan-96 Jan-97 Jan-98 Jan-99 chỉ số CPI chỉ số Jan-00 Jan-01 Jan-02 Jan-03 Jan-04 Jan-05 23
  24. Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Data/ Pivot Table 02-Oct-09 Nguyễn Duy Tâm _ IDR 24
  25. Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ được xem là tên trường(Field) 02-Oct-09 Nguyễn Duy Tâm _ IDR 25
  26. Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Nên chọn trang bảng tính mới 02-Oct-09 Nguyễn Duy Tâm _ IDR 26
  27. Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row Fields và Data Items 02-Oct-09 Nguyễn Duy Tâm _ IDR 27
  28. Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới Nhấp đúp vào A3 (ô giao giữa Row Fields và Column Fields) và chọn Count of Z8_SATISFACTION. Ưu điểm: có thể tính Tổng, tần số và nhiều lệnh khác 02-Oct-09 Nguyễn Duy Tâm _ IDR 28
  29. Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới Count of Z8_SATISFACTION Z1_MALE Grand Z8_SATISFACTION 0 1 Total 1 11 5 16 2 35 31 66 3 46 47 93 4 93 101 194 5 130 102 232 Grand Total 315 286 601 02-Oct-09 Nguyễn Duy Tâm _ IDR 29
  30. Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới Click vào A3, kéo và thả trường Z1_MALE vào Column Fields. Ưu điểm: lập bảng tần số chéo cho nhiều biến. 02-Oct-09 Nguyễn Duy Tâm _ IDR 30
  31. Pivot Table với 3 biến phân loại Con người –Tầm nhìn mới Kéo và thả Z4_Child vào Page Fields 02-Oct-09 Nguyễn Duy Tâm _ IDR 31
  32. Con người –Tầm nhìn mới Một số yêu cầu Dùng công cụ Pivot table: 1. Lập bảng tổng số con của các hộ gia đình có 1,2, ,n con cụ thể. 2. Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể. 3. Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng hôn nhân nào chiếm đa số 4. Lập bảng tần số cho biến marita (column) và biến sex (row). Vẽ biểu đồ và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số. Vẽ biểu đồ tương ứng. 5. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row). 6. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) và . 02-Oct-09 Nguyễn Duy Tâm _ IDR 32
  33. Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả CHỈ TIÊU TẬP TRUNG CHỈ TIÊU PHÂN TÁN Trung bình : average Phương sai : var =average(data) =var(data) Trung vị : Median Độ lệch chuẩn : stdev =median(data) =stdev(data) Mode : Mode =mode(data) Tứ phân vị : quartile =quartile(data,số phân vị) (1: Q1; 2:Q2; 3:Q3) 02-Oct-09 Nguyễn Duy Tâm _ IDR 33
  34. Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả MỘT SỐ LỆNH CÓ TRONG MỘT SỐ LỆNH KHÁC EXCEL 2007 Tính tổng thoả điều kiện Tính tổng thỏa điều kiện =sumif(vùng ĐK, ĐK, nâng cao. Vùng tính tổng) =sumifs(vùng tính tổng, Đếm thỏa điều kiện vùng ĐK1, ĐK1, vùng =countif(vùng ĐK,ĐK) ĐK2, ĐK2) Đếm thỏa điều kiện nâng cao. =countifs(vùng ĐK1, ĐK1,vùng ĐK2, ĐK2, ) Nguyễn Duy Tâm _ IDR 02-Oct-09 34
  35. Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả MỘT SỐ LỆNH CÓ TRONG BÀI TẬP (AFFAIR) EXCEL 2007 Trung bình thỏa điều kiện 1. Tính giá trị trung bình, trung vị, =averageif(vùng ĐK, ĐK, mode, tứ phân vị, phương sai, độ lệch chuẩn cho các biến: Vùng tính mean) Z2_age, Z4_child, Z6_edu. Nêu =averageifs(vùng tính ý nghĩa của các số trên. mean,vùng ĐK1, ĐK1, 2. Tính tổng số con của những Vùng ĐK2, ĐK2) người có độ tuổi dưới 30. hoặc của những người hài lòng về tình trạng hôn nhân. 3. Đếm những người có 1 con 02-Oct-09 Nguyễn Duy Tâm _ IDR 35
  36. Con người –Tầm nhìn mới Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả BÀI TẬP (THUC HANH BÀI TẬP (THUC HANH EXCEL) EXCEL) 1. Đếm những người làm 1. Tính tổng số anh/chị/em việc toàn thời gian trong của những người lý dị, ly mẫu khảo sát thân. 2. Đếm những người đã lập 2. Tính tổng số con của gia đình, chưa lập gia đình những người là nữ giới. 02-Oct-09 Nguyễn Duy Tâm _ IDR 36
  37. Con người –Tầm nhìn mới Tính trị thống kê bằng thủ tục Data Analysis Tools/ Data Analysis/ Descriptive Statistics Nhập số liệu và các tùy chọn vào giao diện 02-Oct-09 Nguyễn Duy Tâm _ IDR 37
  38. Con người –Tầm nhìn mới Tính trị thống kê bằng thủ tục Data Analysis Tools/ Data Analysis/ Descriptive Statistics Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTIONZ5_RELIGIOUS Z6_EDU Z7_OCCUPATION Mean 1.46 0.48 32.49 8.18 0.72 3.93 3.12 16.17 4.19 Standard Error 0.13 0.02 0.38 0.23 0.02 0.04 0.05 0.10 0.07 Median 0.00 0.00 32.00 7.00 1.00 4.00 3.00 16.00 5.00 Mode 0.00 0.00 27.00 15.00 1.00 5.00 4.00 14.00 5.00 Standard Deviation 3.30 0.50 9.29 5.57 0.45 1.10 1.17 2.40 1.82 Sample Variance 10.88 0.25 86.28 31.04 0.20 1.22 1.36 5.77 3.31 Kurtosis 4.26 -2.00 0.23 -1.57 -1.09 -0.20 -1.01 -0.30 -0.78 Skewness 2.35 0.10 0.89 0.08 -0.96 -0.84 -0.09 -0.25 -0.74 Range 12 1 39.5 14.875 1 4 4 11 6 Minimum 0 0 17.5 0.125 0 1 1 9 1 Maximum 12 1 57 15 1 5 5 20 7 Sum 875 286 19525 4914.795 430 2363 1873 9716 2521 Count 601 601 601 601 601 601 601 601 601 Kết quả sau khi đã hiệu chỉnh. Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công cụ DATA ANALYSIS cho các biến: agewed sibs childs age educ trong bài tập thực hành excel 02-Oct-09 Nguyễn Duy Tâm _ IDR 38
  39. Con người –Tầm nhìn mới HỆ SỐ TƢƠNG QUAN Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng (interval). Chú ý: Đối với thang đo định danh (norminal): những chỉ số tính toán không có ý nghĩa thống kê. Công thức lệnh: tính rxy =correl(data_X, data_Y) Ý nghĩa: Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y -1 < = rxy < 0 : X và Y nghịch biến 0< rxy <=1 : X và Y đồng biến 02-Oct-09 Nguyễn Duy Tâm _ IDR 39
  40. Dùng thủ tục Data Analysis đểCon tính người –maTầm nhìn trận mới tƣơng quan Tools/ Data Analysis/ Correlation 02-Oct-09 Nguyễn Duy Tâm _ IDR 40
  41. Dùng thủ tục Data Analysis đểCon tính người –maTầm nhìn trận mới tƣơng quan Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILDZ8_SATISFACTIONZ5_RELIGIOUSZ6_EDUZ7_OCCUPATION Y_PT 1 Z1_MALE 0.011736 1 Z2_AGE 0.095237 0.190641 1 Z3_NOYM 0.186842 0.030283 0.777546 1 Z4_CHILD 0.10401 0.069222 0.421931 0.572857 1 Z8_SATISFACTION-0.27951 -0.00752 -0.199 -0.24312 -0.19628 1 Z5_RELIGIOUS-0.1445 0.007679 0.193777 0.218261 0.129351 0.024296 1 Z6_EDU -0.00244 0.397505 0.134596 0.040003 -0.00699 0.109303 -0.04257 1 Z7_OCCUPATION0.049612 0.467923 0.166413 0.044592 -0.09273 0.017422 -0.03972 0.533605 1 Kết quả. BT thực hành excel: Tính matrận hệ số tương quan cho các biến agewed sibs childs age educ và nhận xét về mối quan hệ giữa các biến 02-Oct-09 Nguyễn Duy Tâm _ IDR 41
  42. Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn Chọn loại đồ thị là Scatter 02-Oct-09 Nguyễn Duy Tâm _ IDR 42
  43. Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn Nhập số liệu 02-Oct-09 Nguyễn Duy Tâm _ IDR 43
  44. Con người –Tầm nhìn mới Đồ thị phân tán:Hài lòng phụ thuộc vào học vấn Các tùy chọn 02-Oct-09 Nguyễn Duy Tâm _ IDR 44
  45. Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn Xuất ra trang riêng 02-Oct-09 Nguyễn Duy Tâm _ IDR 45
  46. Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Chọn loại đồ thị là Scatter 02-Oct-09 Nguyễn Duy Tâm _ IDR 46
  47. Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Nhập số liệu 02-Oct-09 Nguyễn Duy Tâm _ IDR 47
  48. Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Các tùy chọn 02-Oct-09 Nguyễn Duy Tâm _ IDR 48
  49. Đồ thị phân tán: Con người –Tầm nhìn mới Hài lòng phụ thuộc vào học vấn Xuất ra trang riêng 02-Oct-09 Nguyễn Duy Tâm _ IDR 49
  50. MÔ PHỎNG LẤY MẪU LẶP LConẠ ngườiI –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE Số thứ tự trong tổng thể: Hàm Randbetween 02-Oct-09 Nguyễn Duy Tâm _ IDR 50
  51. MÔ PHỎNG LẤY MẪU LẶP LConẠ ngườiI –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE Điền kết quả lấy mẫu: Hàm Vlookup 02-Oct-09 Nguyễn Duy Tâm _ IDR 51
  52. MÔ PHỎNG LẤY MẪU LẶP LẠConI người –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE MÔ PHỎNG BẰNG THỦ TỤC SAMPLING Tools/ Data Analysis/ Sampling 02-Oct-09 Nguyễn Duy Tâm _ IDR 52
  53. MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE STT MẪU MẪU 1 MẪU 2 MẪU 3 MẪU 4 MẪU 5 MẪU 6 MẪU 7 MẪU 8 MẪU 9 MẪU 10 1 27 37 42 32 52 27 42 22 32 32 2 22 32 27 57 32 27 32 47 42 27 3 22 22 52 32 22 42 42 27 37 37 4 42 27 22 22 37 52 27 32 22 22 5 42 47 32 27 32 27 37 27 27 27 6 32 37 22 37 27 37 27 22 42 52 7 27 37 32 42 22 37 32 27 32 32 8 27 57 27 27 37 27 27 22 22 22 9 27 42 52 22 47 32 32 27 27 27 TRUNG BÌNH 29.78 37.56 34.22 33.11 34.22 34.22 33.11 28.11 31.44 30.89 KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU LƢU Ý: KẾT QUẢ NHẬN ĐƢỢC LÀ NGẪU NHIÊN Tạo 10 mẫu theo bảng trên (dùng công cụ Sample, số quan sát mỗi mẫu là 9) 02-Oct-09 Nguyễn Duy Tâm _ IDR 53
  54. MÔ PHỎNG LẤY MẪU LẶPCon người LẠI –Tầm nhìn mới CHỌN CỠ MẪU n = 9 TỪ Z2_AGE TRUNG BÌNH CỦA TRUNG BÌNH MẪU 32.46 TRUNG BÌNH CỦA TỔNG THỂ 32.488 ĐỘ LỆCH CHUẨN CỦA TRUNG BÌNH MẪU 2.4237 ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ 9.2888 ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ/3 3.0963 TRUNG BÌNH: HÀM AVERAGE  ĐỘ LỆCH CHUẨN: HÀM STDEV   X LƢU Ý: THEO LÝ THUYẾT THÌ X VÀ n CÓ THỂ ĐẠT ĐƢỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU 02-Oct-09 Nguyễn Duy Tâm _ IDR 54
  55. ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon GIÁ người TRỊ –Tầm TRUNG nhìn mới BÌNH (BiẾT )  XZXZ  aa/ 2nn / 2 Chọn a = 0.05 =>P(1-a/2)= 0.975 Tra Za/2 = 1.96 Tính trung bình = 32.49 Ƣớc lƣợng khỏang tin cậy 95%: (31.77; 33.21) 02-Oct-09 Nguyễn Duy Tâm _ IDR 55
  56. ƢỚC LƢỢNG KHOẢNG TÌN ConCẬY người CHO –Tầm nhìn mới GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT ) SS X t  X t aa/ 2,nn 1nn / 2, 1 Chọn a = 0.05 =>P(1-a/2)= 0.975 Tra ta/2 = 1.964 Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29 Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23) 02-Oct-09 Nguyễn Duy Tâm _ IDR 56
  57. ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon GIÁ người TRỊ –Tầm TRUNG nhìn mới BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS Tools/ Data Analysis/ Descriptive Statistics Chọn Summary Statistics và Confidence Level for Mean 02-Oct-09 Nguyễn Duy Tâm _ IDR 57
  58. ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG Con người –Tầm nhìn mới BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS SS X t  X t aa/ 2,nn 1nn / 2, 1 Cận dƣới = Mean – Confidence Level (95%) Cận trên = Mean + Confidence Level (95%) 02-Oct-09 Nguyễn Duy Tâm _ IDR 58
  59. Con người –Tầm nhìn mới Bài tập ƣớc lƣợng BÀI TẬP “THUC HANH BÀI TẬP AFFAIR EXCEL 1. Ước lượng độ tuổi bình 1. Ước lượng độ tuổi bình quân (age) của những quân (age) của những người được khảo sát. người được khảo sát 2. Ước lượng độ tuổi bình quân kết hôn (agewed). 3. Ước lượng trình độ học vấn (educ) bình quân của những người được khảo sát. 02-Oct-09 Nguyễn Duy Tâm _ IDR 59
  60. Kiểm định 1 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average 02-Oct-09 Nguyễn Duy Tâm _ IDR 60
  61. Kiểm định 1 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm Giá trị Z = 11.44 nằm ở miền bác bỏ =>Có bằng chứng thống kê cho thấy số năm học trung bình của người Mỹ lớn hơn 15 năm. 02-Oct-09 Nguyễn Duy Tâm _ IDR 61
  62. Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra ứng với 2a. 02-Oct-09 Nguyễn Duy Tâm _ IDR 62
  63. Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho. Vậy số năm học trung bình của người Mỹ cao hơn 16. 02-Oct-09 Nguyễn Duy Tâm _ IDR 63
  64. Kiểm định 2 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2) 02-Oct-09 Nguyễn Duy Tâm _ IDR 64
  65. Kiểm định 2 đuôi (Biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải nhập tham số là (1-a/2) Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể bác bỏ Ho. 02-Oct-09 Nguyễn Duy Tâm _ IDR 65
  66. Kiểm định 2 đuôi (Chƣa biết s) Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Hàm TINV(a, n-1) 02-Oct-09 Nguyễn Duy Tâm _ IDR 66
  67. Con người –Tầm nhìn mới Kiểm định 2 đuôi (Chƣa biết s) Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm Z6_EDU Trung bình 16.17 9 Độ lệch chuẩn = 2.40 16 Cỡ mẫu n= 601 14 Sai số chuẩn = 0.10 17 a = 0.05 14 t a/2 = 1.964 14 18 Ho:  = 16 17 H1  <> 16 20 17 Trị thống kê t= 1.70 Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể bác bỏ Ho. 02-Oct-09 Nguyễn Duy Tâm _ IDR 67
  68. Con người –Tầm nhìn mới Bài tập kiểm định BÀI TẬP AFFAIR BTẬP THỰC HÀNH EXCEL 1. Có giả thiết cho rằng, 1. Có giả thiết cho rằng, độ tuổi (age) bình độ tuổi (age) bình quân quân của những người được khảo sát là của những người được dưới 40. Bạn hãy kiểm định giả thiết khảo sát là dưới 30. nàyα=5%. Bạn hãy kiểm định giả 2. Có giả thiết cho rằng, độ tuổi (age) bình thiết này với mức ý quân của những người được khảo sát là nghĩa α=5%. 46. Theo bạn, đúng hay sai α=3%? 2. Có giả thiết cho rằng, 3. Có giả thiết cho rằng, độ tuổi (agewed) độ tuổi (age) bình quân bình quân của những người được khảo của những người được sát là dưới 40. Bạn hãy kiểm định giả khảo sát là 33. Theo thiết này α=4%. bạn, giả thiết này đúng hay sai? (α=10%) 02-Oct-09 Nguyễn Duy Tâm _ IDR 68
  69. Kiểm định 2 đuôi (Biết và Chƣa biếtCon người)- Giá–Tầm nhìn trị mới p Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm định x: Giá trị của phát biểu Ho, Sigma: Nhập  nếu biết hoặc để trống nếu không biết. 02-Oct-09 Nguyễn Duy Tâm _ IDR 69
  70. Con người –Tầm nhìn mới Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị p Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm P_Value = 2*Min(ZTEST, 1-ZTEST) P_Value = 0.09> a = 0.05 => Không thể bác bỏ Ho. 02-Oct-09 Nguyễn Duy Tâm _ IDR 70
  71. Kiểm định sự khác biệt về trung bìnhCon người của – Tầmhai nhìn tổng mới thể-Biết độ lệch chuẩn Affair.xls trang Edu OBS MALE EDU(FEMALE) OBS MALE EDU(MALE) EDU(FEMALE) EDU(MALE) 1 0 9 1 1 9 Trung bình 15.26 17.17 2 0 9 2 1 9 Độ lệch chuẩn 2.02 2.39 3 0 9 3 1 9 Số quan sát 315 286 4 0 9 4 1 12 5 0 12 5 1 12 Ho: Không có sự khác biệt về học vấn trung bình của hai giới Kết quả khảo sát cho thấy học vấn trung bình của nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn. Kiểm định Ho bằng thủ tục . Tools | Data Analysis | z-test: Two Sample for Means 02-Oct-09 Nguyễn Duy Tâm _ IDR 71
  72. Kiểm định sự khác biệt về trungCon bình người – củaTầm nhìn hai mới tổng thể-Biết độ lệch chuẩn Tools | Data Analysis | z-test: Two Sample for Means 02-Oct-09 Nguyễn Duy Tâm _ IDR 72
  73. Kiểm định sự khác biệt về trung bìnhCon người của –Tầm hai nhìn tổng mới thể-Biết độ lệch chuẩn Kết quả kiểm định: Bác bỏ Ho 02-Oct-09 Nguyễn Duy Tâm _ IDR 73
  74. Kiểm định sự khác biệt về trung bìnhCon người của –Tầm hai nhìn tổng mới thể-Chƣa biết độ lệch chuẩn Ho: Không có sự khác biệt về học vấn trung bình của hai giới Tools | Data Analysis | t-Test: Two Sample Assuming Equal Variances 02-Oct-09 Nguyễn Duy Tâm _ IDR 74
  75. Kiểm định sự khác biệt về trung bìnhCon người của –Tầm hai nhìn tổng mới thể-Chƣa biết độ lệch chuẩn Ho: Không có sự khác biệt về học vấn trung bình của hai giới Tools | Data Analysis | t-Test: Two Sample Assuming Equal Variances Kết quả: Bác bỏ Ho 02-Oct-09 Nguyễn Duy Tâm _ IDR 75
  76. Con người –Tầm nhìn mới Bài tập kiểm định mức lƣơng trung bình theo giới tính 1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa nam và nữ là như nhau. Với số liệu của bài tập Tien luong khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả thiết trên. 2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện tại không có hiệu quả. Bằng dữ liệu bài tập hieu qua software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới và cũ. 02-Oct-09 Nguyễn Duy Tâm _ IDR 76
  77. Kiểm định F cho sự khác biệt về phƣơngCon người –Tầm sai nhìn của mới hai tổng thể Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới Tools | Data Analysis | F-Test: Two-Sample for Variances 02-Oct-09 Nguyễn Duy Tâm _ IDR 77
  78. Kiểm định F cho sự khác biệt về phƣơngCon người –Tầm sai nhìn của mới hai tổng thể Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới Kết quả: Bác bỏ Ho 02-Oct-09 Nguyễn Duy Tâm _ IDR 78
  79. Kiểm định mẫu cặp: Vợ và chồng có cảmCon người nhận –Tầm khác nhìn mới biệt về hạnh phúc không? Affair.xls/ Satisfaction Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Tools | Data Analysis | t-test: Paired Two Sample for Means 02-Oct-09 Nguyễn Duy Tâm _ IDR 79
  80. Kiểm định mẫu cặp: Vợ và chồng Concó người cảm –Tầm nhận nhìn mới khác biệt về hạnh phúc không? Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Kết quả: Chấp nhận Ho. 02-Oct-09 Nguyễn Duy Tâm _ IDR 80
  81. Con người –Tầm nhìn mới Bài tập kiểm định cặp Có giả định cho rằng, hiệu quả của một phương pháp quảng cáo được tiến hành cho nhiều công ty khác nhau hiện tại không có hiệu quả. Bằng số liệu của bài tập truoc - sau quang cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên 02-Oct-09 Nguyễn Duy Tâm _ IDR 81
  82. HÀM TTEST-Kiểm định sựCon khác người –Tầm biệt nhìn mới fx/ Statistical/ TTEST Type: 1 cho mẫu cặp, 2 cho phƣơng sai bằng nhau, 3 cho phƣơng sai khác nhau 02-Oct-09 Nguyễn Duy Tâm _ IDR 82
  83. ANOVA: Vợ và chồng có có mức độCon hài người lòng –Tầm nhìn về mới hôn nhân trung bình khác nhau không? Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau. Tools/ Data Analysis/ ANOVA-Single Factor 02-Oct-09 Nguyễn Duy Tâm _ IDR 83
  84. ANOVA: Nam và nữ có có mứcCon người độ –Tầm hài nhìn mới lòng về hôn nhân khác nhau không? Anova: Single Factor SUMMARY Groups Count Sum Average Variance WIFE 250 999 4.00 1.30 HUSBAND 250 984 3.94 1.06 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 0.45 1.00 0.45 0.38 0.54 3.86 Within Groups 586 498 1.18 Total 586 499 Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau. Kết quả: Chấp nhận Ho 02-Oct-09 Nguyễn Duy Tâm _ IDR 84
  85. ANOVA một nhân tố-Ví dụ chƣơng 8 WorksheetCon người –Tầm in nhìn mới Chapter8(V) So sánh năng suất của 3 máy Ho: Năng suất của 3 máy là như nhau 02-Oct-09 Nguyễn Duy Tâm _ IDR 85
  86. ANOVA một nhân tố-Ví dụCon chƣơng người –Tầm nhìn 8 mới Anova: Single Factor SUMMARY Groups Count Sum Average Variance Machine 1 5 124.65 24.93 1.06 Machine 2 5 113.05 22.61 0.78 Machine 3 5 102.95 20.59 0.92 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 47.16 2 23.58 25.60 0.00 3.89 Within Groups 11.05 12 0.92 Total 58.22 14 Ho: Năng suất của 3 máy là như nhau Kết quả kiểm định: Bác bỏ Ho 02-Oct-09 Nguyễn Duy Tâm _ IDR 86
  87. Con người –Tầm nhìn mới Thủ tục Tukey-Kramer Tools/ Lumenaut Statistics/ Tukey-Kramer Test Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel. 02-Oct-09 Nguyễn Duy Tâm _ IDR 87
  88. Con người –Tầm nhìn mới Thủ tục Tukey-Kramer Tools/ Lumenaut Statistics/ Tukey-Kramer Test 02-Oct-09 Nguyễn Duy Tâm _ IDR 88
  89. Thủ tục Tukey-Kramer Con người –Tầm nhìn mới Tukey-Kramer Test Critical v k Value Q MS within 9 3 3.948 0.921 MSD Values Stack Machine 1 Machine 2 Machine 3 Mean Machine 1 1.695 1.695 i Machine 2 2.320 1.695 -Mean Machine 3 4.340 2.020 j If Meani-Meanj > MSD value then pair is significantly different at the 5% level (1 Tailed) Significant pair values are in bold and underlined in above Table Tools/ Lumenaut Statistics/ Tukey-Kramer Test 02-Oct-09 Nguyễn Duy Tâm _ IDR 89
  90. Tìm hệ số chặn và độ dốc Con người –Tầm nhìn mới Hệ số chặn: fx/ Statistical/ INTERCEPT Độ dốc: fx/ Statistical/ SLOPE 02-Oct-09 Nguyễn Duy Tâm _ IDR 90
  91. Tìm hệ số chặn và độ dốc Con người –Tầm nhìn mới Hệ số chặn: fx/ Statistical/ INTERCEPT Độ dốc: fx/ Statistical/ SLOPE 02-Oct-09 Nguyễn Duy Tâm _ IDR 91
  92. Vẽ đƣờng xu hƣớng trong Chart Con người –Tầm nhìn mới Click phải/ Add Trendline/ 02-Oct-09 Nguyễn Duy Tâm _ IDR 92
  93. Vẽ đƣờng xu hƣớng trong Chart Con người –Tầm nhìn mới Type: Linear Options: Display Equation on chart 02-Oct-09 Nguyễn Duy Tâm _ IDR 93
  94. Con người –Tầm nhìn mới Vẽ đƣờng xu hƣớng trong Chart 12,000 y = 1.5x + 1636.4 10,000 R2 = 0.9 8,000 Sales 6,000 Sales Linear (Sales) 4,000 2,000 0 0 1,000 2,000 3,000 4,000 5,000 6,000 Footage Kết quả 02-Oct-09 Nguyễn Duy Tâm _ IDR 94
  95. Thủ tục REGRESSION Con người –Tầm nhìn mới Tools/ Data Analysis/ REGRESSION 02-Oct-09 Nguyễn Duy Tâm _ IDR 95
  96. Con người –Tầm nhìn mới KẾT QUẢ SUMMARY OUTPUT Regression Statistics Multiple R 0.97 R Square 0.94 Adjusted R Square 0.93 Standard Error 611.75 Observations 7 ANOVA df SS MS F Significance F Regression 1 30,380,456 30380456 81.18 0.00 Residual 5 1,871,200 374240 Total 6 32,251,656 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 1,636.41 451.50 3.62 0.02 475.81 2,797.02 Footage 1.49 0.16 9.01 0.00 1.06 1.91 02-Oct-09 Nguyễn Duy Tâm _ IDR 96
  97. Từ bảng kết xuất của Excel Con người –Tầm nhìn mới Residuals 12000 10000 8000 6000 Predicted Sales 4000 Residuals 2000 0 Predicted Sales and Residuals and Sales Predicted 0 2 4 6 8 -2000 Observations 02-Oct-09 Nguyễn Duy Tâm _ IDR 97
  98. Phần dƣ theo biến độc lập Con người –Tầm nhìn mới Footage Residual Plot 1000 800 600 400 200 0 Residuals -200 0 1,000 2,000 3,000 4,000 5,000 6,000 -400 -600 -800 Footage 02-Oct-09 Nguyễn Duy Tâm _ IDR 98
  99. Con người –Tầm nhìn mới Real and Fitted Values Footage Line Fit Plot 12,000 y = 1.4866x + 1636.4 10,000 R2 = 1 8,000 6,000 Sales Sales 4,000 Predicted Sales 2,000 Linear (Predicted 0 Sales) 0 1,000 2,000 3,000 4,000 5,000 6,000 Footage 02-Oct-09 Nguyễn Duy Tâm _ IDR 99
  100. Tools/ Data Analysis/ RegressionCon người –Tầm nhìn mới Hồi quy đơn: Oil theo Temp 02-Oct-09 Lê Tấn Luật 100
  101. Con người –Tầm nhìn mới Hồi quy đơn: Oil theo Temp SUMMARY OUTPUT Regression Statistics Multiple R 0.87 R Square 0.76 Adjusted R Square 0.74 Standard Error 66.51 Observations 15 ANOVA df SS MS F Significance F Regression 1 178624 178624 40 0.00 Residual 13 57511 4424 Total 14 236135 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 436.43823 38.63970893 11.29507 4.3E-08 352.962214 519.914246 Temp -5.4622077 0.859608768 -6.3543 2.52E-05 -7.3192795 -3.6051359 02-Oct-09 Lê Tấn Luật 101
  102. Hồi quy đơn: Oil theo Insulation Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.47 R Square 0.22 Adjusted R Square 0.16 Standard Error 119 Observations 15 ANOVA df SS MS F Significance F Regression 1 51,076 51,076 3.59 0.08 Residual 13 185,059 14,235 Total 14 236,135 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 345.38 74.69 4.62 0.00 184.02 506.74 Insulation -20.35 10.74 -1.89 0.08 -43.56 2.86 02-Oct-09 Lê Tấn Luật 102
  103. Con người –Tầm nhìn mới Hồi quy bội: Oil theo Temp và Insulation Quét Known’s X: cả Temp và Insulation SUMMARY OUTPUT Regression Statistics Multiple R 0.98 R Square 0.97 Adjusted R Square 0.96 Standard Error 26.01 Observations 15 ANOVA df SS MS F Significance F Regression 2 228015 114007 168 0.00 Residual 12 8121 677 Total 14 236135 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 562.15 21.09 26.65 0.00 516.19 608.11 Temp -5.44 0.34 -16.17 0.00 -6.17 -4.70 Insulation -20.01 2.34 -8.54 0.00 -25.12 -14.91 02-Oct-09 Lê Tấn Luật 103
  104. Biến Insulation có cải thiện môCon hình người – Tầmtừ nhìn Oil mới = f(Temp) không? Kết quả tính toán cho Fc = 73 02-Oct-09 Lê Tấn Luật 104
  105. Tra giá trị tới hạn của F: FINV Con người –Tầm nhìn mới Kết quả tính toán F* = 4.75 F =73 > F*: 4.75 Kết luận: Insulation làm tăng mức độ giải thích của mô hình. 02-Oct-09 Lê Tấn Luật 105
  106. Hồi quy bậc hai: Chuẩn bị sốCon liệungười – Tầm nhìn mới Temp2=Tem^2 Oil (Gal) Temp Temp2 275.30 40 1600 363.80 27 729 164.30 40 1600 40.80 73 5329 94.30 64 4096 230.90 34 1156 366.70 9 81 300.60 8 64 237.80 23 529 121.40 63 3969 31.40 65 4225 203.50 41 1681 441.10 21 441 323.00 38 1444 52.50 58 3364 02-Oct-09 Lê Tấn Luật 106
  107. Kết quả hồi quy Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.88 R Square 0.78 Adjusted R Square 0.74 Standard Error 65.71 Observations 15 ANOVA df SS MS F Significance F Regression 2 184,324 92,162 21 0.00 Residual 12 51,811 4,318 Total 14 236,135 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 372.33 67.60 5.51 0.00 225.04 519.62 Temp -1.26 3.75 -0.34 0.74 -9.44 6.91 Temp2 -0.05 0.05 -1.15 0.27 -0.15 0.05 02-Oct-09 Lê Tấn Luật 107
  108. Hồi quy với biến giả Con người –Tầm nhìn mới TC = Tổng chi phí sản xuất Q = Tổng sản lượng CN = 1 cho các quý đã thay đổi công nghệ, 0 cho các quý trước khi thay đổi công nghệ. TCN = 0 cho các quý đã thay đổi công nghệ, 1 cho các quý trước khi thay đổi công nghệ. 02-Oct-09 Lê Tấn Luật 108
  109. Sai lầm -> Đa cộng tuyếnCon hoàn người –Tầm hảo nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.94 R Square 0.87 Adjusted R Square 0.78 Standard Error 56.65 Observations 16 ANOVA df SS MS F Significance F Regression 3 291,681 97,227 45 0.00 Residual 13 41,727 3,210 Total 16 333,408 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 521.80 122.46 4.26 0.00 257.24 786.35 Q 0.81 0.10 8.04 0.00 0.59 1.03 CN 0.00 0.00 65,535.00 #NUM! 0.00 0.00 TCN 210.63 52.80 3.99 0.00 96.55 324.70 02-Oct-09 Lê Tấn Luật 109
  110. Hồi quy với biến giả Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.94 R Square 0.87 Adjusted R Square 0.86 Standard Error 56.65 Observations 16 ANOVA df SS MS F Significance F Regression 2 291,681 145,841 45.44 1.36E-06 Residual 13 41,727 3,210 Total 15 333,408 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 732.42 79.51 9.21 0.00 560.65 904.20 Q 0.81 0.10 8.04 0.00 0.59 1.03 CN -210.63 52.80 -3.99 0.00 -324.70 -96.55 02-Oct-09 Lê Tấn Luật 110
  111. Hồi quy với biến tƣơng tác Con người –Tầm nhìn mới SUMMARYCNQ OUTPUT = CN*Q Regression Statistics Multiple R 0.98 R Square 0.96 Adjusted R Square0.95 Standard Error 33.19 Observations 16 ANOVA df SS MS F Significance F Regression 3 320190 106730 96.90 1.11913E-08 Residual 12 13218 1102 Total 15 333408 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 401.52 80.00 5.02 0.00 227.21 575.83 Q 1.24 0.10 11.98 0.00 1.02 1.47 CN 368.96 118.05 3.13 0.01 111.75 626.17 CNQ -0.64 0.13 -5.09 0.00 -0.92 -0.37 02-Oct-09 Lê Tấn Luật 111
  112. Ý nghĩa của biến giả và biếnCon tƣơngngười –Tầm nhìn tác mới TC = 401 + 1.24*Q + 368*CN – 0.64CNQ P (0.00) (0.00) (0.01) (0.00) R2 = 0.96 Adjusted R2= 0.95 n= 16 Trước thay đổi công nghệ: CN=CNQ=0 TC = 401 + 1.24*Q Sau thay đổi công nghệ: CN=1, CNQ=Q TC = (401+368) + (1.24-0.68)*Q TC = 769 + 0.56*Q Vậy thay đổi công nghệ làm định phí tăng nhưng biến phí đơn vị giảm. 02-Oct-09 Lê Tấn Luật 112
  113. Hồi quy với biến chuyển dạngCon người log –Tầm-log nhìn mới Mô hình tuyến tính: Q=b1+b2*L+b3*K SUMMARY OUTPUT Regression Statistics Multiple R 0.99 R Square 0.99 Adjusted R Square 0.99 Standard Error 1,570.36 Observations 15 ANOVA df SS MS F Significance F Regression 2 2686989117 1.34E+09 545 1.67092E-12 Residual 12 29592539.09 2466045 Total 14 2716581656 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept -32,375.93 3,140.85 -10.31 0.00 -39,219.24 -25,532.61 L 2.62 6.43 0.41 0.69 -11.39 16.62 K 344.47 40.87 8.43 0.00 255.43 433.51 02-Oct-09 Lê Tấn Luật 113
  114. Con người –Tầm nhìn mới Chuyển dạng log-log Hàm sản xuất Cobb-Douglas a b (1) Q = A*L *K Không thể ước lượng trực tiếp hàm (1) ln(Q) = ln(A) + a*ln(L) + b*ln(K) Y = b0 + b1*X1 + b2*X2 Với b0 = ln(A); b1= a; b2=b; X1= ln(L); X2=ln(K) Chúng ta đã chuyển về dạng mô hình hồi quy tuyến tính thông thường 02-Oct-09 Lê Tấn Luật 114
  115. Chuẩn bị số liệu log-log: Hàm Conln(Number) người –Tầm nhìn mới lnQ lnL lnK 9.10 5.64 4.79 9.29 5.65 4.81 9.32 5.67 4.83 9.31 5.93 4.86 9.45 5.93 4.88 9.70 6.00 4.90 9.88 6.17 4.93 9.96 6.32 4.99 10.05 6.42 5.04 10.17 6.54 5.10 10.29 6.67 5.18 10.42 6.70 5.24 10.55 6.74 5.33 10.76 6.77 5.40 10.90 6.91 5.48 02-Oct-09 Lê Tấn Luật 115
  116. Kết quả hồi quy Con người –Tầm nhìn mới SUMMARY OUTPUT Regression Statistics Multiple R 0.99 R Square 0.98 Adjusted R Square 0.97 Standard Error 0.09 Observations 15 ANOVA df SS MS F Significance F Regression 2 4 2 267 1.13248E-10 Residual 12 0 0 Total 14 5 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept -0.38 0.78 -0.49 0.63 -2.07 1.31 lnL 0.67 0.17 3.85 0.00 0.29 1.04 lnK 1.22 0.34 3.56 0.00 0.47 1.96 02-Oct-09 Lê Tấn Luật 116