Bài giảng Thống kê kinh tế - Chương 11: Hồi quy đơn biến - Tương quan
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê kinh tế - Chương 11: Hồi quy đơn biến - Tương quan", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_thong_ke_kinh_te_chuong_11_hoi_quy_don_bien_tuong.pdf
Nội dung text: Bài giảng Thống kê kinh tế - Chương 11: Hồi quy đơn biến - Tương quan
- CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN 1 1. HỒI QUY ĐƠN BIẾN Ví dụ: Tìm hiểu mối liên hệ giữa tổng vốn đầu tư (Y – Tỉ đồng) và lãi suất ngân hàng (X - %) tại địa bàn Trà Vinh qua 10 năm liên tiếp: Xi 8.0 8.5 9.0 9.5 10.0 10.5 11.0 12.0 13.0 14.0 Yi 45.0 38.0 40.0 39.0 32.0 29.0 28.0 27.0 25.0 23.0 6/11/2015
- 1. HỒI QUY ĐƠN BIẾN 2 6/11/2015
- 1. HỒI QUY ĐƠN BIẾN 3 Phương trình: Yi = β1 + β2Xi + ui Trong đó : X, Y: Được gọi là biến. X được gọi là biến giải thích (độc lập); Y: Biến được giải thích (phụ thuộc). β1: Hệ số chặn, tham số chặn β2: Hệ số góc, tham số biến ui: Là biến ngẫu nhiên và còn gọi là yếu tố ngẫu nhiên 6/11/2015
- 2. MÔ HÌNH HỒI QUY TUYẾN TÍNH MẪU 4 Phương trình hồi quy mẫu: Yi 1 2 X i nên ta có: Yi = Y i + ei 2 2 2 ei (Yi Yi ) (Yi 1 2 X i ) Min Y X 1 2 X Y nXY i i 2 2 2 X i n(X ) 6/11/2015
- Hãy ước lượng phương trình hồi quy mẫu? 5 X Y XY X2 105,5 326 i i Ta có n =10, X 10,55 Y 32,6 8 45 360 64 10 10 X Y nXY 3317 10 10,55 32,6 8.5 38 323 72.25 i i 3,5220 2 2 2 1147,75 10 (10,55) 2 X i n(X ) 9 40 360 81 9.5 39 370.5 90.25 1 Y 2 X = 32,6 + 3,5220 x 10,55 = 69,7571 10 32 320 100 Phương trình hồi quy mẫu: 10.5 29 304.5 110.25 Y = 69,7571 – 3,5220X 11 28 308 121 i i 12 27 324 144 13 25 325 169 14 23 322 196 Σ105.5 Σ326 Σ3317 Σ1147.75 6/11/2015
- 3. HỆ SỐ XÁC ĐỊNH VÀ HỆ SỐ TƯƠNG QUAN 6 2 2 2 (Yi Y) (Yi Y ) (Yi Yi ) TSS = ESS + RSS 2 2 2 ESS 430,7457 X Y XY X2 (Yi Y) (Yi Y) R 0,8712 i i TSS 494,4 8 45 360 64 153.76 80.6602 2 8.5 38 323 72.25 29.16 52.1298 Hệ số tương quan: r = ± R 9 40 360 81 54.76 29.8018 r 0,8712 0,9334 9.5 39 370.5 90.25 40.96 13.6759 10 32 320 100 0.36 3.7524 10.5 29 304.5 110.25 12.96 0.0310 11 28 308 121 21.16 2.5119 12 27 324 144 31.36 26.0804 13 25 325 169 57.76 74.4579 14 23 322 196 92.16 147.6444 Σ105.5 Σ326 Σ3317 Σ1147.75 Σ 494.4 Σ 430.7457 6/11/2015
- 4. PHƯƠNG SAI VÀ SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG 7 2 X var( ) i 2 1 2 2 se( ) var( ) n( X i n(X ) ) 1 1 2 var( ) 2 2 2 se( 2 ) var( 2 ) X i n(X ) e2 RSS 2 i n 2 n 2 6/11/2015
- 5. KHOẢNG TIN CẬY CỦA β1, β2 8 Khoảng tin cậy của β1: 1 ± tα/2se(1) Khoảng tin cậy của β2: 2± tα/2se( 2) Ví dụ: Tiếp tục ví dụ 1, Hãy xác định khoảng tin cậy của β1, β2. 6/11/2015
- 6. KIỂM ĐỊNH SỰ PHÙ HỢP CỦA HÀM HỒI QUY 9 Chúng ta kiểm định giả thuyết: H0: 2 = 0 R 2 (n 2) 0,8712(10 2) F 54,1118 F 1 R 2 1 0,8712 6/11/2015
- 7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO 10 Dự báo điểm: Cho X0, tìm thông qua phương trình hồi quy Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu tư là bao nhiêu? 6/11/2015
- 7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO 11 Dự báo giá trị trung bình: 2 2 1 (X 0 X ) var(Y0 ) se(Y ) var(Y ) n 2 2 0 0 X i n(X ) Dự báo giá trị trung bình: ± t se( Y ) Y0 /2 0 Ví dụ: Tiếp tục ví dụ 1, khi lãi suất là 8% thì tổng vốn đầu tư trung bình là khoảng bao nhiêu ? 6/11/2015
- 7. ỨNG DỤNG PHÂN TÍCH HỒI QUY: DỰ BÁO 12 Dự báo giá trị riêng biệt: ± t se (Y Y 0 ) Y0 /2 0 2 2 1 (X 0 X ) var(Y0 Y0 ) 1 se(Y Y ) var(Y Y ) n 2 2 0 0 0 0 X i n(X ) Ví dụ : Tiếp tục ví dụ 1, khi lãi suất là 8% hãy dự báo giá trị riêng biệt của tổng vốn đầu tư. 6/11/2015
- CHƯƠNG 12. HỒI QUY ĐA BIẾN 13 1. TỔNG QUAN VỀ MÔ HÌNH HỒI QUY ĐA BIẾN Mô hình: Yi = β1 + β2X1t + β3X2t + + βkXkt + ut Trong đó : Y là biến phụ thuộc X là các biến độc lập β1: Hệ số từ do βj: Hệ số hồi quy riêng 6/11/2015
- Các giả định (điều kiện) phân tích mô hình hồi quy đa biến 14 1. Tuyến tính các tham số hồi quy 2. Các giá trị mẫu của xtj được ước lượng đúng, không có sai số 3. Kỳ vọng hoặc trung bình số học của các sai số là bằng 0 4. Các sai số u độc lập với biến giải thích 5. Các sai số u có phương sai bằng nhau 6. Các sai số u từng cặp độc lập với nhau 7. Vector sai số u theo phân phối chuẩn nhiều chiều 8. Không có biến độc lập nào là hằng số, và không tồn tại các mối liên hệ tuyến tính hoàn toàn chính xác giữa các biến độc lập 6/11/2015
- 2. PHÂN TÍCH HỒI QUY ĐA BIẾN BẰNG PHẦN MỀM SPSS 15 Để phân tích hồi quy ta cần một số bước như sau: Bước 1: Xác định vấn đề cần nghiên cứu Bước 2: Xác định được đâu là biến Y, đâu là các biến X. Bước 3: Lập bảng câu hỏi hoặc phiếu khảo sát để thu thập số liệu. Bước 4: Xử lý số liệu và nhập liệu Bước 5: Phân tích tương quan hồi quy. Bước 6: Báo cáo kết quả 6/11/2015
- Ví dụ 16 Yi = β1 + β2X1 + β3X2 + β4X3 + β5X4 + β6X5 + β7X6 + ei Với: Yi: Lợi nhuận bình quân (triệu đồng) X1: Vốn kinh doanh hiện tại (triệu đồng) X2: Tài sản cố định (triệu đồng) X3: Tuổi chủ nhiêm HTX (tuổi) X4: Chuyên môn của chủ nhiệm HTX X5: Lương của chủ nhiệm HTX (triệu đồng) X6: Quan tâm của chính quyền địa phương đối với hoạt động của HTX 6/11/2015
- Kết quả chạy phần mềm SPSS 17 Model Summaryb Adjusted R Std. Error of the Model R R Square Square Estimate 1 .898a .807 .662 102.83959 a. Predictors: (Constant), X6, X4, X5, X3, X2, X1 b. Dependent Variable: Y ANOVAb Model Sum of Squares df Mean Square F Sig. 1 Regression 352891.599 6 58815.267 5.561 .015a Residual 84607.847 8 10575.981 Total 437499.446 14 a. Predictors: (Constant), X6, X4, X5, X3, X2, X1 b. Dependent Variable: Y 6/11/2015
- Kết quả chạy phần mềm SPSS 18 Coefficientsa Standardized Unstandardized Coefficients Coefficients 95% Confidence Interval for B Model B Std. Error Beta t Sig. Lower Bound Upper Bound 1 (Constant) 172.028 262.471 .655 .531 -433.231 777.287 X1 -.224 .094 -.906 -2.389 .044 -.439 -.008 X2 .335 .113 1.120 2.956 .018 .074 .597 X3 -10.728 5.579 -.398 -1.923 .091 -23.594 2.138 X4 49.052 42.833 .290 1.145 .285 -49.721 147.824 X5 185.751 60.536 .615 3.068 .015 46.154 325.348 X6 25.364 27.582 .173 .920 .385 -38.241 88.968 a. Dependent Variable: Y 6/11/2015
- Kết quả dự báo bằng phần mềm SPSS 19 6/11/2015
- ĐA CỘNG TUYẾN 20 1. TỔNG QUAN VỀ ĐA CỘNG TUYẾN Đa cộng tuyến là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi quy. 6/11/2015
- 2. HẬU QUẢ CỦA ĐA CỘNG TUYẾN 21 Không xác định được hệ số quan hệ Độ lệch chuẩn của hệ số hồi quy ước lượng sẽ rất lớn. Điều này có nghĩa là ước lượng của chúng ta kém chính xác và khoảng tin cậy sẽ rộng hơn Khi độ lệch chuẩn của hệ số hồi quy ước lượng lớn, giá trị t-test thường nhỏ nhưng mô hình lại thường có R2 cao nên ta dễ đưa ra các quyết định sai lầm về độ tốt của mô hình hồi quy Ước lượng hệ số hồi quy sẽ dễ bị thay đổi khi ta bỏ một vài quan sát hay bỏ một biến độc lập được cho là không có giá trị. 6/11/2015
- 3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN 22 Cách 1: Một cách đơn giản để xác định đa cộng tuyến là ta tính hệ số tương quan giữa các cặp biến độc lập. Nếu ta thấy hệ số tương quan trên 0,8, ta có thể coi đó là quan hệ gần như hoàn hảo. Nếu ta thấy hệ số tương quan trên 0,5, ta có thể coi đó là quan hệ chặt chẽ 6/11/2015
- 3. CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN 23 Cách 2: Sử dụng yếu tố phóng đại phương sai (VIF): Nếu VIF > 10 thì xảy ra hiện tượng đa cộng tuyến. Coefficientsa Unstandardized Coefficients Standardized Coefficients Collinearity Statistics Model B Std. Error Beta t Sig. Tolerance VIF 1 (Constant) 3.348 .466 7.186 .000 I -.073 .037 -.086 -1.989 .070 .252 3.962 W .208 .008 1.071 24.796 .000 .252 3.962 a. Dependent Variable: C 6/11/2015
- 4. CÁCH KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN 24 Thu thập thêm dữ liệu hoặc thu thập dữ liệu chính xác hơn Tái cấu trúc mô hình bằng cách đưa thêm thông tin bổ trợ vào Xác định cặp biến độc lập nào có quan hệ gần hoàn hảo, ta có thể bỏ bớt một biến độc lập. Tính R2 đối với các hàm hồi quy: có mặt cả hai biến; không có mặt một trong hai biến. Ta loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn 6/11/2015
- PHƯƠNG SAI SAI SỐ THAY ĐỔI VÀ HẬU QUẢ 25 1. TỔNG QUAN VỀ PHƯƠNG SAI SAI SỐ THAY ĐỔI 6/11/2015
- 2. HẬU QUẢ CỦA PHƯƠNG SAI SAI SỐ THAY ĐỔI 26 Ước lượng OLS vẫn tuyến tính, chúng vẫn là ước lượng không chệch. Tuy nhiên, chúng sẽ không còn có phương sai nhỏ nhất nữa Công thức thông thường để ước lượng phương sai của ước lượng OLS, nhìn chung, sẽ chệch Theo đó, các khoảng tin cậy và kiểm định giả thuyết thông thường dựa trên phân phối t và F sẽ không còn đáng tin cậy nữa 6/11/2015
- CÁCH PHÁT HIỆN VÀ KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 27 1. CÁCH PHÁT HIỆN PHƯƠNG SAI SAI SỐ THAY ĐỔI 1.1. Xem xét đồ thị của phần sai số 6/11/2015
- 1.2. Kiểm định Park 28 2 Park cho rằng i là một hàm số nào đó của biến giải thích X. Trong trường hợp mô hình hai biến, Park đã đưa ra dạng 2 hàm số giữa i và X như sau: 2 lni = 1 + 2lnXi + vi (1) Park đã đề nghị chúng ta có thể sử dụng ei thay cho i và chạy mô hình hồi quy sau: 2 lnei = 1 + 2lnXi + vi (2) 2 ei có thể được thu thập từ mô hình hồi quy gốc. Theo đó, kiểm định Park được tiến hành theo các bước sau đây: 6/11/2015
- 1.2. Kiểm định Park 29 6/11/2015
- 1.3. Kiểm định Glejser 30 6/11/2015
- 1.4. Kiểm định tương quan hạng của Spearman 31 6/11/2015
- 1.4. Kiểm định tương quan hạng của Spearman 32 6/11/2015
- Kết quả phát hiện PSSSTĐ bằng SPSS 33 Correlations Lai suat ABSres Spearman's rho Lai suat Correlation Coefficient 1.000 -.248 Sig. (2-tailed) . .489 N 10 10 ABSres Correlation Coefficient -.248 1.000 Sig. (2-tailed) .489 . N 10 10 H0: Hệ số tương quan hạng của tổng thể bằng 0 Nhìn vào giá trị sig. của kiểm định là 0,489 > mức ý nghĩa = 5% Chấp nhận giả thuyết H0, tức là mô hình không xảy ra hiện tượng phương sai sai số thay đổi. 6/11/2015
- 1.5. Kiểm định Goldfeld – Quandt 34 6/11/2015
- 1.5. Kiểm định Goldfeld – Quandt 35 Bước 3: Sử dụng phương pháp bình phương bé nhất để ước lượng tham số của các n c hàm hồi quy đối với 2 quan sát đầu và cuối; thu thập tổng bình phương của các phần dư RSS1 và RSS2 tương ứng. Trong đó RSS1 đại diện cho RSS từ hồi quy ứng với các giá trị của Xi nhỏ hơn và RSS2 ứng với các giá trị Xi lớn hơn. Bậc tự do n c n c 2k tương ứng là - k hoặc . Trong đó, k là các tham số được ước lượng 2 2 kể cả hệ số chặn. 6/11/2015
- 1.5. Kiểm định Goldfeld – Quandt 36 RSS / df Bước 4: Tính tỷ số 2 RSS1 / df Nếu ui theo phân phối chuẩn và nếu giả định về phương sai có điều kiện không đổi được thỏa mãn thì λ tuân theo phân phối F với bậc tự do ở tử số và mẫu số là n c 2k . 2 Khi thực hành, nếu λ tính được lớn hơn giá trị tra bảng F ở mức ý nghĩa mong muốn, thì chúng ta có thể bác bỏ giả thuyết H0: phương sai có điều kiện không đổi, nghĩa là chúng ta có thể nói phương sai của sai số thay đổi. 6/11/2015
- 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 37 6/11/2015
- 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 38 2 2.2. Trường hợp chưa biết i Trường hợp 1: Phương sai sai số tỷ lệ với bình phương biến giải thích: 2 2 2 E(ui ) = Xi 2 Trong đó, hằng số i là nhân tố tỷ lệ. Chia 2 vế mô hỉnh (13) cho Xi: Yi 1 ui 1 2 1 2 vi X i X i X i X i (15). Tương tự như trường hợp đã 2 biết i trên, chúng ta có thể dễ dàng chứng minh phần dư vi này là đồng đều và chúng ta có thể áp dụng phương pháp WLS để ước lượng (15) như phần trước. 6/11/2015
- 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 39 2 2 Trường hợp 2: Phương sai sai số tỷ lệ với biến giải thích: E(ui ) = Xi. Chia 2 vế mô hỉnh (13) cho X i : Yi 1 ui 1 2 X i 1 2 X i vi (16) X i X i X i X i ui 2 2 Trong đó vi = và có thể thấy ngay rằng E(vi ) = X i 6/11/2015
- 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 40 Trường hợp 3: Phương sai của sai số tỷ lệ với bình phương của giá trị kỳ vọng 2 2 2 của Y. Điều này nghĩa là: E(ui ) = [E(Yi)] . Trong trường hợp này, chúng ta thực hiện việc biến đổi như sau: Yi 1 2 ui 1 1 X i 1 2 X i vi (17) E(Yi ) E(Yi ) E(Yi ) E(Yi ) E(Yi ) E(Yi ) ui 2 Trong đó vi = , var(vi) = E(Yi ) 6/11/2015
- 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 41 Bước 1: Ước lượng mô hình hồi quy Yi = β1 + β2Xi + ui bằng phương pháp OLS thông thường, từ đó ta thu được Yi . Sau đó, sử dụng Yi để biến đổi mô hình gốc Yi 1 X i ui về dạng như sau: 1 2 vi (18) Trong đó, vi = Y i Y i Y i Yi Bước 2: Ước lượng hồi quy (18), dù Yi không chính xác là E(Yi), nhưng chúng là ước lượng vững, nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Yi). Do vậy, phép biến đổi (18) có thể dùng được khi cỡ mẫu tương đối lớn. 6/11/2015
- 2. CÁCH KHẮC PHỤC PHƯƠNG SAI SAI SỐ THAY ĐỔI 42 Trường hợp 4: Phép biến đổi loga 2 Đôi khi thay vì dự đoán về i , chúng ta có thể định lại dạng của mô hình để làm giảm ảnh hưởng của phương sai sai số không đồng nhất. Chẳng hạn, thay vì ước lượng mô hình hồi quy gốc (13), ta có thể ước lượng mô hình hồi quy: lnYi = β1 + β2lnXi + ui (19) 6/11/2015
- HIỆN TƯỢNG TỰ TƯƠNG QUAN 43 1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN Thuật ngữ tự tương quan có thể được định nghĩa như là “quan hệ tương quan giữa các thành viên của chuỗi của các quan sát được sắp xếp theo thời gian [như trong dữ liệu chuỗi thời gian] hoặc không gian [như trong dữ liệu chéo].” 6/11/2015
- 1. TỔNG QUAN VỀ TỰ TƯƠNG QUAN 44 Hình 1: Các dạng phân phối của sai số ui hoặc (ei) 6/11/2015
- *Nguyên nhân của sự tự tương quan 45 Tính ì Hiện tượng mạng nhện Các độ trễ Xử lí số liệu Một cách xử lý khác là phép nội suy và ngoại suy số liệu Sai lệch do lập mô hình 6/11/2015
- 2. HẬU QUẢ CỦA TỰ TƯƠNG QUAN 46 Ước lượng hệ số hồi quy vẫn là ước lượng không thiên lệch, nhưng không còn là ước lượng hiệu quả nhất Công thức ta dùng để tính phương sai ở các chương trước không thể áp dụng trong trừơng hợp này. Do đó, kiểm định giả thuyết, tính khoảng tin cậy, khoảng dự báo sẽ sai. 6/11/2015
- CÁCH PHÁT HIỆN VÀ KHẮC PHỤC TỰ TƯƠNG QUAN 47 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN 6/11/2015
- 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN 48 6/11/2015
- 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN 49 6/11/2015
- 1. CÁCH PHÁT HIỆN TỰ TƯƠNG QUAN 50 Model Summaryb Adjusted R Std. Error of the Model R R Square Square Estimate Durbin-Watson 1 .927a .859 .855 11.17237 .234 Tra bảng Durbin-Watson, ở mức ý nghĩa α = 5%, dL= 1,393 và dU = 1,514. Theo kết quả chạy mô hình 0 < d = 0,234 < dL nên mô hình xảy ra hiện tượng tự tương quan dương. 6/11/2015
- 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN 51 2.1. Trường hợp đã biết cấu trúc của tự tương quan Giả sử yếu tố nhiễu ui có tự tương quan bậc 1, nghĩa là: ut = ρut-1 + et (1) Trong đó < 1 và et thoả mãn các giả định của phương pháp OLS. Giả sử (1) là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thoả đáng nếu hệ số tương quan ρ đã biết. Để làm sáng tỏ vấn đề này, ta xét mô hình hai biến: Yt = β1 + β2Xt + ut (2) Nếu (2) đúng với t thì cũng đúng với t – 1 nên: Yt-1 = β1 + β2Xt-1 + ut-1 (3) Nhân 2 vế phương trình (3) cho ρ, ta được: ρYt-1 = ρβ1 + ρβ2Xt-1 + ρut-1 (4) 6/11/2015
- 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN 52 6/11/2015
- 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN 53 6/11/2015
- 2. CÁCH KHẮC PHỤC TỰ TƯƠNG QUAN 54 Phương pháp Durbin-Watson hai bước để ước lượng ρ Để minh hoạ phương pháp này, chúng ta viết lại phương trình sai phân tổng quát dưới dạng sau: Yt = β1(1- ρ) + β2Xt - ρ β2Xt-1 + ρYt-1 + et (5) Durbin đã đề xuất thủ tục 2 bước như sau để ước lượng ρ: Bước 1: Coi (5) như một mô hình hồi quy đa biến, hồi quy Yt theo Xt, Xt-1, Yt-1 và giá trị ước lượng được của các hệ số hồi quy của Yt-1 là giá trị ước lượng của ρ. Mặc dầu là ước lượng chệch nhưng ta có ước lượng vững của ρ. * * Bước 2: Sau khi ước lượng được , hãy đổi biến Yt = Yt - Yt-1 , Xt = Xt - Xt-1 * * * * Và ước lượng hồi quy Yt = β1 + β2 Xt + et bằng phương pháp bình phương nhỏ nhất thông thường. 6/11/2015
- BIẾN GIẢ VÀ CÁCH XÁC ĐỊNH MÔ HÌNH HỒI QUY CÓ SỰ XUẤT HIỆN CỦA BIẾN GIẢ 55 1. TỔNG QUAN VỀ BIẾN GIẢ Trong nhiều tình huống, cùng với các biến định lượng còn có những biến định tính. Ví dụ khi nghiên cứu tiêu dùng của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có thể định lượng được, nhưng giới tính của chủ hộ, cấu trúc thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách của chính phủ là các biến không định lượng được. 6/11/2015
- 2. KỸ THUẬT BIẾN GIẢ 56 2.1. Hồi quy với biến giải thích là biến định tính 2.1.1. Biến định tính có hai phạm trù VD: Thu nhập có phụ thuộc giới tính ? Yi : thu nhập 1 Nếu quan sát là Nam Di = 0 Nếu quan sát là Nữ Mô hình : Yi = 1 + 2Di + ui Thu nhập trung bình của nam E(Y/Di = 1) = 1 + 2 Thu nhập trung bình của nữ E(Y/Di = 0) = 1 Nếu 2 0 thì thu nhập trung bình có phụ thuộc giới tính Biến D dùng như trên gọi là biến giả. 6/11/2015
- 2. KỸ THUẬT BIẾN GIẢ 57 Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm. Lương STT Giới D (Y: nghìn $) 1 22 Nam 1 2 19 Nữ 0 3 18 Nữ 0 4 21,7 Nam 1 5 18,5 Nữ 0 6 21 Nam 1 7 20,5 Nam 1 8 17 Nữ 0 9 17,5 Nữ 0 10 21,2 Nam 1 Kết quả ước lượng hồi quy: Yi = 18 + 3,28Di + ei 6/11/2015
- Quy tắc đặt biến giả 58 Biến giả chỉ nhận giá trị 0 và 1 Cá thể nào cũng phải có giá trị Biến giả chia tổng thể thành những thành phần riêng biệt 6/11/2015
- 2.1. Hồi quy với biến giải thích là biến định tính 59 1.1.2. Biến định tính có k phạm trù Lúc đó dùng k-1 biến giả để thay thế cho chúng. Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn? Yi: Chi phí cho văn hoá phẩm. D2i = 1: Trình độ tiểu học 0: Trình độ khác D3i = 1: Trình độ trung học 0: Trình độ khác D4i = 1: Trình độ đại học 0: Trình độ khác Mô hình có dạng: Yi = 1 + 2D2i + 3D3i + 4D4i + ui 6/11/2015
- 2.1. Hồi quy với biến giải thích là biến định tính 60 2.1.3. Mô hình có hai biến định tính Ví dụ: Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, giữa nam và nữ? 1 Nếu là nam 1 Nếu làm việc ở thành thị D2 = D3 = 0 Nếu là nữ 0 Nếu làm việc ở nông thôn E(Y/D2i, D3i) = 1 + 2D2i + 3D3i + ui Các chú ý: . Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n1, n2, . . . nk thì phải dùng k – 1 biến giả. . Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùng để so sánh với các phạm trù khác. . Các hệ số góc riêng phần được gọi là các hệ số chênh lệch. . Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như thông lệ. 6/11/2015
- 2.1. Hồi quy với biến giải thích là biến định tính 61 2.1.4. Sự tương tác giữa các biến giả Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng. Để tính đến điều đó ta thêm vào mô hình biến tương tác. Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc? Mô hình 1: Yi = 1 + 2D2i + 3D3i + 5Xi + ui Trong mô hình trên đã giả thiết giới tính và tính chất công việc không có tương tác. Mô hình 2: Yi = 1 + 2D2i + 3D3i + 4D2i*D3i + 5Xi + ui Kiểm định H0: 4 = 0 (không có tương tác) H1: 4 0 (có tương tác) Lúc đó mức độ tương tác bằng 4. 6/11/2015
- 2.2. Dùng biến giả để phân tích biến động mùa vụ 62 Xét mô hình: Yi = 1 + 2Xi + ui Nếu có sự biến động mùa vụ, chẳng hạn theo quý thì dùng 3 biến giả để đặc trưng cho chúng: D2 = 1: Quý II 0: Quý khác D3 = 1: Quý III 0: Quý khác D4 = 1: Quý II 0: Quý khác Ta có mô hình: Yi = 1 + 2D2i + 3D3i + 4D4i + 5Xi + ui Như vậy phạm trù cơ sở là quý I, nếu có ảnh hưởng theo mùa của từng quý khác nhau thì các hệ số 2, 3, 4 khác nhau có ý nghĩa thống kê. 6/11/2015