Một số phương pháp luận thống kê

pdf 105 trang ngocly 1790
Bạn đang xem 20 trang mẫu của tài liệu "Một số phương pháp luận thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfmot_so_phuong_phap_luan_thong_ke.pdf

Nội dung text: Một số phương pháp luận thống kê

  1. MỘT SỐ PHƯƠNG PHÁP LUẬN THỐNG KÊ
  2. 2.2.5. Số tương đối cường độ 58 MỤC LỤC 2.3. Số bình quân (trong thống kê) 58 2.3.1. Số bình quân số học 60 Trang 2.3.2. Số bình quân điều hoà 61 LỜI NÓI ĐẦU 9 2.3.3. Số bình quân nhân 62 2.3.4. Mốt 64 PHẦN MỘT: ĐIỀU TRA CHỌN MẪU VÀ SAI SỐ TRONG ĐIỀU TRA THỐNG KÊ 13 2.3.5. Số trung vị 66 2.4. Độ biến thiên của tiêu thức 68 1.1. Điều tra chọn mẫu 13 2.4.1. Khoảng biến thiên 68 1.1.1. Điều tra chọn mẫu, ưu điểm, hạn chế và điều kiện vận dụng 14 2.4.2. Độ lệch tuyệt đối bình quân 69 1.1.2. Một số khái niệm và định nghĩa dùng trong điều tra chọn mẫu18 2.4.3. Phương sai 71 1.1.3. Xác định cỡ mẫu, phân bổ mẫu và tính sai số chọn mẫu 26 2.4.4. Độ lệch chuẩn 72 1.2. Sai số trong điều tra thống kê 43 2.4.5. Hệ số biến thiên 74 1.2.1. Sai số trong quá trình chuẩn bị điều tra thống kê 44 2.5. Mức đồng đều của phân phối 75 1.2.2. Sai số trong quá trình tổ chức điều tra 49 2.5.1. Đường cong Lorenz 75 1.2.3. Sai số liên quan đến quá trình xử lý thông tin 52 2.5.2. Hệ số GINI 77 PHẦN HAI: BIỂU HIỆN CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KINH TẾ - XÃ HỘI 54 PHẦN BA: MỘT SỐ PHƯƠNG PHÁP THƯỜNG DÙNG TRONG PHÂN TÍCH THỐNG KÊ 80 2.1. Số tuyệt đối (trong thống kê) 54 2.2. Số tương đối (trong thống kê) 55 3.1. Phương pháp phân tổ thống kê 81 2.2.1. Số tương đối động thái 57 3.1.1. Khái niệm phân tổ thống kê và tiêu thức phân tổ 81 2.2.2. Số tương đối so sánh 57 3.1.2. Các loại phân tổ và cách thức tiến hành phân tổ 82 2.2.3. Số tương đối kế hoạch 57 3.2. Phương pháp đồ thị thống kê 85 2.2.4. Số tương đối kết cấu 58 3.2.1. Biểu đồ hình cột 86 3 4
  3. 3.2.2. Biểu đồ diện tích 87 3.6.2. Bảng cân đối "kép" 154 3.2.3. Biểu đồ tượng hình 89 PHẦN BỐN: MỘT SỐ CHỈ TIÊU CHỦ YẾU 3.2.4. Đồ thị đường gấp khúc 90 TRONG THỐNG KÊ TÀI KHOẢN QUỐC GIA 156 3.2.5. Biểu đồ hình màng nhện 92 4.1. Một số khái niệm cơ bản 156 3.3. Phương pháp phân tích dãy số biến động theo thời gian 94 4.1.1. Sản xuất 156 3.3.1. Khái niệm và đặc điểm của dãy số biến động theo thời gian 94 4.1.2. Đơn vị thường trú 157 3.3.2. Các chỉ tiêu phân tích dãy số biến động theo thời gian 95 4.1.3. Đơn vị thể chế 158 3.3.3. Một số phương pháp biểu hiện xu hướng biến động cơ bản 4.1.4. Giá cơ bản, giá sản xuất và giá sử dụng 159 của hiện tượng 101 4.1.5. Thu nhập sở hữu 162 3.4. Phương pháp phân tích tương quan 110 4.1.6. Chuyển nhượng 162 3.4.1. Liên hệ tương quan và phương pháp phân tích tương quan 110 4.1.7. Biến điểm và biến kỳ 163 3.4.2. Phân tích mối liên hệ tương quan giữa các tiêu thức biến đổi 4.1.8. Tích sản và tiêu sản 163 theo không gian 111 4.1.9. Chỉ tiêu cân đối 165 3.4.3. Phân tích mối liên hệ tương quan giữa hai chỉ tiêu biến động theo thời gian 123 4.2. Một số chỉ tiêu chủ yếu trong thống kê tài khoản quốc gia 165 3.5. Phương pháp chỉ số 130 4.2.1. Giá trị sản xuất 166 3.5.1. Một số vấn đề chung về phương pháp chỉ số 130 4.2.2. Giá trị tăng thêm 168 3.5.2. Chỉ số cá thể và chỉ số tổng hợp 133 4.2.3. Tổng sản phẩm trong nước (GDP) 169 3.5.3. Chỉ số bình quân 139 4.2.4. Tiêu dùng cuối cùng 171 3.5.4. Chỉ số liên hoàn và chỉ số định gốc 142 4.2.5. Tích lũy tài sản 171 3.5.5. Chỉ số sản phẩm so sánh được và sản phẩm không so sánh 4.2.6. Xuất, nhập khẩu hàng hóa và dịch vụ 172 được 144 4.2.7. Thu nhập của người lao động từ sản xuất 173 3.5.6. Hệ thống chỉ số 148 4.2.8. Thuế sản xuất, trợ cấp sản xuất 173 3.6. Phương pháp cân đối 152 4.2.9. Khấu hao tài sản cố định 174 3.6.1. Bảng cân đối "đơn" 153 4.2.10. Thặng dư 175 5 6
  4. 4.2.11. Tổng thu nhập quốc gia 179 5.6. Hiệu quả quá trình 209 4.2.12. Thu nhập quốc gia thuần 180 5.7. Chỉ số thành tựu công nghệ 210 4.2.13. Thu nhập quốc gia khả dụng 181 5.8. Chỉ số nghèo tổng hợp 214 4.2.14. Để dành 182 4.2.15. Thay đổi của cải thuần do thay đổi để dành và chuyển TÀI LIỆU THAM KHẢO 217 nhượng tài sản 183 4.2.16. Cho vay thuần hay đi vay thuần 184 4.2.17. Bảng tổng kết tài sản 185 4.2.18. Của cải thuần 185 4.2.19. Của cải thuần đầu kỳ 186 4.2.20. Tích sản phi tài chính cuối kỳ 186 4.2.21. Tích sản tài chính cuối kỳ 187 4.2.22. Tiêu sản cuối kỳ 187 4.2.23. Của cải thuần cuối kỳ 188 4.2.24. Thay đổi của cải thuần 188 PHẦN NĂM: MỘT SỐ CHỈ TIÊU THỐNG KÊ KINH TẾ - XÃ HỘI TỔNG HỢP 191 5.1. Hệ số ICOR 191 5.2. Chỉ số phát triển con người 193 5.3. Chỉ số phát triển giới 196 5.4. Chỉ số biến động về giới 200 5.5. Tốc độ tăng năng suất các nhân tố tổng hợp 204 7 8
  5. mẫu xảy ra trong toàn bộ quá trình điều tra thống kê, (Chuẩn bị điều tra, tổ chức thu thập thông tin, tổng hợp số liệu, ). Qua tổng kết thực LỜI NÓI ĐẦU tiễn điều tra thống kê, cuốn sách đã chỉ rõ sai số phi chọn mẫu ảnh hưởng nhiều đến chất lượng số liệu thống kê và đề xuất những hướng khắc phục nhằm giảm bớt loại sai số này. Để phục vụ cho yêu cầu nghiên cứu, đào tạo cũng như triển khai Phần hai: "Biểu hiện các mức độ của hiện tượng kinh tế - xã thực tế về công tác thống kê trong thời kỳ đổi mới, Viện Khoa học hội " đề cập một cách có hệ thống, ngắn gọn, súc tích về phương pháp Thống kê biên soạn và xuất bản cuốn sách: "Một số vấn đề phương tính, điều kiện vận dụng các chỉ tiêu phản ánh mức độ và biến động pháp luận thống kê". của tiêu thức. Bên cạnh lý thuyết chung, mỗi đại lượng đều có ví dụ Cuốn sách được biên soạn trên cơ sở kế thừa có chọn lọc những minh họa như một tài liệu hướng dẫn nghiệp vụ rõ ràng, thuận tiện vấn đề về phương pháp thống kê truyền thống đã được công bố hoặc cho việc nghiên cứu ứng dụng vào thực tế. đã từng ứng dụng triển thực tế; đồng thời được nghiên cứu cải tiến bổ Phần ba đề cập tới " Một số phương pháp thường dùng trong sung kiến thức thống kê mới trong nước và quốc tế; kết hợp chặt chẽ phân tích thống kê". Mỗi phương pháp được trình bày một cách khái giữa phương pháp thống kê với phương pháp toán học, giữa nghiên quát, tập trung vào những nội dung cơ bản nhất cũng như các hình cứu lý luận với tổng kết và ứng dụng thực tiễn; chuẩn hoá khái niệm, thức biểu hiện, phương pháp tính và điều kiện vận dụng. Phần này bổ định nghĩa, phương pháp tính các chỉ tiêu thống kê, đáp ứng yêu cầu sung một số vấn đề chưa được đề cập trong các tài liệu trước đây quản lý trong nước và phù hợp với các chuẩn mực thống kê quốc tế, hoặc có đề cập nhưng chưa đầy đủ như: Chỉ số sản phẩm so sánh phục vụ việc so sánh trong xu thế đổi mới và hội nhập. được và sản phẩm không so sánh được; phân tích tương quan dãy số Mặt khác, trong quá trình biên soạn, các tác giả có sử dụng lại theo thời gian; tự tương quan, đồ thị hình mạng nhện, vì vậy nội một số ví dụ của một số tài liệu đã tính toán để minh chứng cho nội dung các phương pháp phân tích thống kê phong phú và đa dạng hơn, dung và điều kiện áp dụng các phương pháp đã trình bày. vận dụng vào thực tế thích hợp hơn. Phần bốn giới thiệu về " Một số chỉ tiêu chủ yếu trong hệ thống Cuốn sách gồm 5 phần, mỗi phần giới thiệu từng vấn đề về tài khoản quốc gia ", phần này đề cập một số khái niệm cơ bản dùng phương pháp luận thống kê riêng biệt, nhưng chúng lại bổ sung cho trong Hệ thống tài khoản quốc gia SNA làm cơ sở để trình bày ngắn nhau tạo thành thể thống nhất các phương pháp thống kê. gọn nhưng nêu bật được nội dung, bản chất và mối liên hệ của các chỉ Phần một với tiêu đề: "Điều tra chọn mẫu và sai số trong điều tiêu chủ yếu trong hệ thống tài khoản quốc gia, phản ánh quá trình tra thống kê" giới thiệu một cách khái quát có hệ thống những vấn đề sản xuất tạo ra thu nhập, phân phối, sử dụng thu nhập cho tiêu dùng, cơ bản về lý thuyết chọn mẫu như: Khái niệm, định nghĩa, nội dung tích lũy, để dành, Bên cạnh lời văn, cuốn sách đưa ra các công thức điều tra chọn mẫu, ưu điểm, hạn chế và điều kiện vận dụng điều tra mô tả mối liên hệ của các chỉ tiêu này. chọn mẫu; cách xác định cỡ mẫu, phân bổ mẫu và phương pháp tính Phần cuối của cuốn sách trình bày nội dung phương pháp tính " sai số chọn mẫu, Trong phần này cũng đề cập tới sai số phi chọn Một số chỉ tiêu thống kê kinh tế - xã hội tổng hợp " thường gặp và 9 10
  6. đang là mối quan tâm của người dùng tin. Các chỉ tiêu này được biên soạn độc lập với nhau theo phong cách từ điển. Bên cạnh các chỉ tiêu đã giới thiệu trong cuốn: "Một số thuật ngữ thống kê thông dụng" còn bổ sung các chỉ tiêu thống kê kinh tế - xã hội khác: Tốc độ tăng năng suất các nhân tố tổng hợp, hiệu quả quá trình, Chỉ số thành tựu công nghệ và Chỉ số nghèo tổng hợp. Mỗi chỉ tiêu trình bày đều có ví dụ tính toán khá cụ thể nhằm làm rõ nội dung phương pháp tính, kiểm nghiệm khả năng tính toán và vận dụng của các chỉ tiêu đó. Với khuôn khổ có hạn, Viện Khoa học Thống kê hy vọng cuốn sách sẽ là tài liệu tham khảo bổ ích, cung cấp những kiến thức cần thiết đáp ứng một phần cho yêu cầu nghiên cứu, đào tạo và vận dụng thực tế trong công tác thống kê. Tuy nhiên, trong quá trình biên soạn và in ấn, cuốn sách không tránh khỏi những hạn chế và sai sót. Viện Khoa học Thống kê mong nhận được góp ý của đông đảo bạn đọc. Hà Nội, tháng 6 năm 2005 TẬP THỂ TÁC GIẢ 11 12
  7. mẫu ở chỗ kết quả của nó không dùng để suy rộng cho tổng thể chung. PHẦN MỘT Kết quả của điều tra chọn mẫu được dùng để mô tả đặc điểm của tổng ĐIỀU TRA CHỌN MẪU VÀ SAI SỐ thể chung. TRONG ĐIỀU TRA THỐNG KÊ Các hình thức thu thập số liệu thống kê trên đây có thể khái quát qua sơ đồ sau: Sơ đồ 1.1. Các hình thức và phương pháp thu thập số liệu 1.1. ĐIỀU TRA CHỌN MẪU thống kê Quá trình nghiên cứu thống kê gồm các giai đoạn: Thu thập số liệu, xử lý tổng hợp và phân tích, dự báo. Thu thập số liệu thống kê Trong thu thập số liệu thường áp dụng hai hình thức chủ yếu: Báo cáo thống kê định kỳ và điều tra thống kê. Báo cáo thống kê định kỳ Điều tra thống kê Báo cáo thống kê định kỳ là hình thức thu thập số liệu thống kê được tiến hành thường xuyên, định kỳ theo nội dung, phương pháp cũng như hệ thống biểu mẫu thống nhất, được quy định thành chế độ Điều tra không toàn bộ Điều tra toàn bộ báo cáo do cơ quan có thẩm quyền quyết định và áp dụng cho nhiều năm. Điều tra thống kê là hình thức thu thập số liệu được tiến hành Điều tra Điều tra Điều tra trọng điểm chuyên đề chọn mẫu theo phương án quy định cụ thể cho từng cuộc điều tra. Trong phương án điều tra quy định rõ mục đích, nội dung, đối tượng, phạm vi, phương pháp và kế hoạch tiến hành điều tra. Điều tra thống kê được Dưới đây đi sâu nghiên cứu "Điều tra chọn mẫu". áp dụng ngày càng rộng rãi trong điều kiện nền kinh tế thị trường có nhiều thành phần kinh tế. 1.1.1. Điều tra chọn mẫu, ưu điểm, hạn chế và điều kiện vận dụng Điều tra thống kê được phân thành điều tra toàn bộ và điều tra không toàn bộ. Điều tra toàn bộ nhằm tiến hành thu thập số liệu ở tất 1.1.1.1. Khái niệm điều tra chọn mẫu cả các đơn vị của tổng thể. Trong khi đó điều tra không toàn bộ chỉ Điều tra chọn mẫu (ĐTCM) là loại điều tra không toàn bộ, trong tiến hành thu thập số liệu của một bộ phận các đơn vị trong tổng thể. đó người ta chọn một cách ngẫu nhiên một số đủ lớn đơn vị đại diện Trong điều tra không toàn bộ còn chia ra điều tra trọng điểm, điều tra trong toàn bộ các đơn vị của tổng thể chung để điều tra rồi dùng kết chuyên đề và điều tra chọn mẫu. quả thu thập được tính toán, suy rộng thành các đặc điểm của toàn bộ Điều tra trọng điểm và điều tra chuyên đề khác với điều tra chọn tổng thể chung. Ví dụ, để có năng suất và sản lượng lúa của một địa 13 14
  8. bàn điều tra nào đó (huyện A chẳng hạn) người ta chỉ tiến hành thu cho phép nghiên cứu các mối quan hệ cần thiết của hiện tượng nghiên thập số liệu về năng suất và sản lượng lúa thu trên diện tích của một số cứu. hộ gia đình được chọn vào mẫu của huyện để điều tra thực tế, sau đó - Làm giảm sai số phi chọn mẫu (sai số do cân, đong, đo, đếm, dùng kết quả thu được tính toán và suy rộng cho năng suất và sản khai báo, ghi chép, v.v ). Trong thực tế công tác thống kê sai số phi lượng lúa của toàn huyện A. chọn mẫu luôn luôn tồn tại và ảnh hưởng không nhỏ đến chất lượng số ĐTCM được ứng dụng rất rộng rãi trong thống kê kinh tế - xã hội liệu thống kê, nhất là các chỉ tiêu có nội dung phức tạp, việc tiếp cận như: Điều tra năng suất, sản lượng lúa; Điều tra lao động - việc làm; để thu thập số liệu khó khăn, tốn nhiều thời gian trong quá trình phỏng Điều tra thu nhập, chi tiêu của hộ gia đình; Điều tra biến động thường vấn, ghi chép và đặc biệt hơn là đối với các chỉ tiêu điều tra không có xuyên dân số; Điều tra chất lượng sản phẩm công nghiệp. sẵn thông tin mà đòi hỏi phải hồi tưởng để nhớ lại. Đối với những loại Ngoài ra, trong tự nhiên, trong đời sống sinh hoạt của con thông tin như trên, chỉ có tiến hành điều tra mẫu mới có điều kiện người, trong y học, v.v chúng ta cũng đã gặp rất nhiều ví dụ thực tế tuyển chọn điều tra viên tốt hơn; hướng dẫn nghiệp vụ kỹ hơn, thời đã áp dụng ĐTCM; chẳng hạn: Khi đo lượng nước mưa của một khu gian dành cho một đơn vị điều tra nhiều hơn, tạo điều kiện cho các đối vực nào đó người ta chỉ chọn ra một số điểm trong khu vực và đặt tượng cung cấp thông tin trả lời chính xác hơn, tức là làm cho sai số các ống nghiệm (các mẫu) để đo lượng nước mưa qua các trận mưa phi chọn mẫu ít hơn. trong từng tháng và cả năm, sau đó dựa vào kết quả nước mưa đo - Cho phép nghiên cứu các hiện tượng kinh tế - xã hội, môi được từ mẫu là các ống nghiệm để tính toán suy rộng về lượng nước trường, không thể tiến hành theo phương pháp điều tra toàn bộ: Ví trung bình các tháng và cả năm cho cả khu vực; khi nghiên cứu ảnh dụ như nghiên cứu trữ lượng khoáng sản, thuỷ sản, hưởng của hút thuốc lá đối với sức khoẻ con người, người ta chọn ra 1.1.1.3. Hạn chế của điều tra chọn mẫu một số lượng cần thiết người hút thuốc lá để kiểm tra sức khoẻ và dùng kết quả kiểm tra từ một số người đó để kết luận về ảnh hưởng - Do ĐTCM chỉ tiến hành thu thập số liệu trên một số đơn vị, sau của hút thuốc lá tới sức khoẻ cộng đồng, v.v đó dùng kết quả để suy rộng cho toàn bộ tổng thể chung nên kết quả điều tra chọn mẫu luôn tồn tại cái gọi là "Sai số chọn mẫu" - Sai số do 1.1.1.2. Ưu điểm của điều tra chọn mẫu tính đại diện. Sai số chọn mẫu phụ thuộc vào độ đồng đều của chỉ tiêu Do chỉ tiến hành điều tra trên một bộ phận đơn vị mẫu trong tổng nghiên cứu, vào cỡ mẫu và phương pháp tổ chức chọn mẫu. Có thể thể chung nên ĐTCM có những ưu điểm cơ bản sau: làm giảm sai số chọn mẫu bằng cách tăng cỡ mẫu ở phạm vi cho phép - Tiến hành điều tra nhanh gọn, bảo đảm tính kịp thời của số liệu và lựa chọn phương pháp tổ chức chọn mẫu thích hợp nhất. thống kê. - Kết quả ĐTCM không thể tiến hành phân nhỏ theo mọi phạm vi - Tiết kiệm nhân lực và kinh phí trong quá trình điều tra. và tiêu thức nghiên cứu như điều tra toàn bộ, mà chỉ thực hiện được ở mức độ nhất định tuỳ thuộc vào cỡ mẫu, phương pháp tổ chức chọn - Cho phép thu thập được nhiều chỉ tiêu thống kê, đặc biệt đối với mẫu và độ đồng đều giữa các đơn vị theo các chỉ tiêu được điều tra. các chỉ tiêu có nội dung phức tạp, không có điều kiện điều tra ở diện rộng. Nhờ đó kết quả điều tra thu được sẽ phản ánh được nhiều mặt, 1.1.1.4. Điều kiện vận dụng của điều tra chọn mẫu 15 16
  9. Điều tra chọn mẫu thường được vận dụng trong các trường hợp kể đến chất lượng số liệu. Vì vậy cần có ĐTCM với quy mô nhỏ hơn sau: để xác định mức độ sai số này, trên cơ sở đó tiến hành đánh giá độ tin - Thay thế cho điều tra toàn bộ trong những trường hợp quy mô cậy của số liệu và nếu ở mức độ cần thiết có thể phải chỉnh lý lại số điều tra lớn, nội dung điều tra cần thu thập nhiều chỉ tiêu, thực tế ta liệu thu được từ điều tra toàn bộ. không đủ kinh phí và nhân lực để tiến hành điều tra toàn bộ, hơn nữa 1.1.2. Một số khái niệm và định nghĩa dùng trong điều tra nếu điều tra toàn bộ sẽ mất quá nhiều thời gian, không đảm bảo tính chọn mẫu kịp thời của số liệu thống kê như điều tra thu nhập, chi tiêu hộ gia đình, điều tra năng suất, sản lượng lúa, điều tra vốn đầu tư của các đơn 1.1.2.1. Tổng thể chung và tổng thể mẫu (1) vị ngoài quốc doanh ; hoặc không tiến hành được điều tra toàn bộ vì không thể xác định được tổng thể chung như điều tra đánh giá mức độ a. Các tham số của tổng thể chung ô nhiễm môi trường nước của một số sông, hồ nào đó (tổng thể chung Tổng thể chung là toàn bộ các đơn vị thuộc đối tượng điều tra của phải là toàn bộ lượng nước có trong các sông, hồ được xác định là đã một cuộc ĐTCM. bị ô nhiễm), Gọi Ui (i = 1, 2, N) là các đơn vị thuộc đối tượng điều tra với Xi - Quá trình điều tra gắn liền với việc phá huỷ sản phẩm như điều là trị số tiêu thức nghiên cứu của từng đơn vị tổng thể, thì toàn bộ các tra đánh giá chất lượng thịt hộp, cá hộp, đánh giá chất lượng đạn dược, Ui là tổng thể chung. Và khi đó sẽ có công thức tính các tham số: y tá lấy máu của bệnh nhân để xét nghiệm, v.v Các trường hợp trên - Giá trị của tổng thể chung: đây nếu điều tra toàn bộ thì sau khi điều tra toàn bộ sản phẩm sản xuất ra hoặc lượng máu có trong cơ thể của bệnh nhân sẽ bị phá huỷ hoàn N toàn. Đây là điều không bao giờ cho phép thực hiện trong thực tế. X = X1 + X2 + + XN = ∑Xi ; (1.1.1) i=1 - Để thu thập những thông tin tiên nghiệm trong những trường - Đại lượng bình quân của tổng thể chung: hợp cần thiết nhằm phục vụ cho yêu cầu của điều tra toàn bộ. Ví dụ, để thăm dò mức độ tín nhiệm của các ứng cử viên vào một chức vị X 1 N nào đó thì chỉ có thể ĐTCM ở một lượng cử tri nhất định và phải được X = = ∑ Xi ; (1.1.2) N N i=1 tiến hành trước khi bầu cử chính thức thì mới có ý nghĩa (Bỏ phiếu bầu cử chính thức chính là điều tra toàn bộ). - Phương sai của tổng thể chung: - Thu thập số liệu để kiểm tra, đánh giá và chỉnh lý số liệu của N 2 1 2 điều tra toàn bộ. Trong thực tế có những cuộc điều tra toàn bộ có quy S = ∑ ()Xi − X ; (1.1.3) N i =1 mô lớn hoặc điều tra rất phức tạp như Tổng Điều tra Dân số và Nhà ở, Tổng Điều tra Nông thôn, Nông nghiệp và Thuỷ sản, thì sai số do b. Các tham số của tổng thể mẫu khai báo, thu thập thông tin thường xuyên tồn tại và ảnh hưởng đáng (1) Ở đây chỉ đề cập trường hợp điều tra nghiên cứu chỉ tiêu bình quân làm ví dụ. 17 18
  10. Tổng thể mẫu là bộ phận của tổng thể chung gồm những đơn vị + Vì số bình quân mẫu x là ước lượng không chệch, hiệu quả và được lựa chọn để trực tiếp thu thập thông tin trong một cuộc điều tra vững của số bình quân tổng thể chung x , do đó nếu chưa biết x có chọn mẫu. thể dùng x để ước lượng. + Vì phương sai điều chỉnh mẫu s2 là ước lượng không chệch, Gọi ui (i = 1, 2, n) là các đơn vị thuộc đối tượng điều tra được hiệu quả và vững của phương sai chung S2, do đó nếu chưa biết chọn vào mẫu, với xi là trị số tiêu thức nghiên cứu từng đơn vị mẫu, phương sai S2 có thể dùng s2 để ước lượng. thì toàn bộ ui là tổng thể mẫu và n là số đơn vị tổng thể mẫu. Tổng thể mẫu có các tham số tính theo phạm vi tổng thể mẫu như sau: b. Các phương pháp ước lượng - Giá trị của tổng thể mẫu: Có 2 phương pháp sử dụng θ' để ước lượng θ: Phương pháp ước n lượng điểm và phương pháp ước lượng bằng khoảng tin cậy. x = x1 + x2 + + xn = ∑xi ; (1.1.4) - Phương pháp ước lượng điểm là dùng một tham số của mẫu để i=1 suy luận cho tham số θ chưa biết của tổng thể chung vì bản thân θ là - Đại lượng bình quân mẫu: một số xác định. 1 n x - Phương pháp ước lượng bằng khoảng tin cậy là từ một tham số x = ∑ xi = ; (1.1.5) θ' của tổng thể mẫu xây dựng một khoảng giá trị n i=1 n (θ'1, θ'2) sao cho với một xác suất cho trước, tham số θ sẽ rơi vào - Phương sai mẫu điều chỉnh (gọi tắt là phương sai mẫu): khoảng (θ'1, θ'2) đó, hay nói cách khác là khoảng (θ'1, θ'2) sẽ chứa n 2 1 2 đựng giá trị θ với một xác suất cho trước. Khoảng (θ'1, θ'2) của tham s = ∑ ()x i − x ; (1.1.6) n −1 i=1 số tổng thể mẫu được gọi là khoảng tin cậy của tham số tổng thể chung θ nếu với xác suất bằng (1 – α) cho trước thoả mãn điều kiện: 1.1.2.2. Ước lượng P (θ' < θ < θ' ) = 1 – α ; Nội dung cơ bản của phương pháp điều tra chọn mẫu là dựa vào 2 l sự hiểu biết về tham số θ' nào đó của tổng thể mẫu đã điều tra để suy (1 – α) được gọi là xác suất tin cậy của ước lượng, I = θ'2 – θ'l được luận thành tham số θ của tổng thể chung. Việc suy luận đó gọi là ước gọi là khoảng tin cậy. lượng. 1.1.2.3. Sai số chọn mẫu và phạm vi sai số chọn mẫu a. Tiêu chuẩn của ước lượng a. Sai số chọn mẫu Có ước lượng chệch và ước lượng không chệch. Tham số θ' của tổng thể mẫu được gọi là ước lượng không chệch của tham số θ của Sai số chọn mẫu (SSCM) là sự khác nhau giữa giá trị ước lượng tổng thể chung nếu M (θ') = θ (kỳ vọng toán của θ' bằng θ). Nếu ước của mẫu và giá trị của tổng thể chung. Sai số chọn mẫu còn gọi là sai lượng không thoả mãn điều kiện trên được gọi là ước lượng chệch. số do tính đại diện. Sai số này chỉ xảy ra trong điều tra chọn mẫu do Thống kê toán đã chứng minh và rút ra một số kết luận sau: chỉ điều tra một số ít đơn vị mà kết quả lại suy cho cả tổng thể. Sai số 19 20
  11. chọn mẫu có hai loại: nghiên cứu qua tính toán tỷ lệ SSCM (H) như sau: - Sai số có hệ thống: Sai số xảy ra khi áp dụng phương pháp chọn μ H = ×100 ; (1.1.9) có hệ thống, làm cho kết quả điều tra luôn bị lệch so với số thực tế về x một hướng. H càng nhỏ thì chỉ tiêu có tính đại diện càng cao và ngược lại. - Sai số ngẫu nhiên: Sai số chỉ xuất hiện trong trường hợp các đơn - Là cơ sở để xác định cỡ mẫu cho các cuộc điều tra được tiến vị của tổng thể được chọn theo nguyên tắc ngẫu nhiên, không phụ hành về sau. thuộc vào ý định của người điều tra. 1.1.2.4. Đơn vị chọn mẫu và dàn chọn mẫu b. Phạm vi sai số chọn mẫu a. Đơn vị chọn mẫu Phạm vi SSCM (ký hiệu là Δx) bằng tích của hệ số tin cậy (t) và Đơn vị chọn mẫu là các đơn vị cơ bản hoặc nhóm đơn vị cơ bản SSCM (μx) được xác định rõ ràng, tương đối đồng đều và có thể quan sát được, Δx = t.μx ; (1.1.7) thích hợp cho mục đích chọn mẫu. Ví dụ: Doanh nghiệp, hộ gia đình, Trong đó: Hệ số tin cậy (tương ứng với độ tin cậy φt,) là xác suất đơn vị diện tích gieo trồng, xã, phường, xóm, bản để giá trị thực tế của chỉ tiêu nghiên cứu ( X ) còn nằm trong khoảng Nếu chọn mẫu một cấp thì có một loại đơn vị chọn mẫu, còn nếu tin cậy ( x − t.μ đến x + t.μ ). x x chọn mẫu nhiều cấp thì sẽ có nhiều loại đơn vị chọn mẫu. Tức là lược Theo chứng minh của toán học thì t tương ứng với hàm xác suất đồ chọn mẫu theo bao nhiêu cấp thì có bấy nhiêu loại đơn vị chọn (φt) đã được Li -a-pu-nôp tính sẵn và lập thành bảng. Ý nghĩa của hàm mẫu. xác suất này được biểu hiện như sau: b. Dàn chọn mẫu P x − X ≤ Δ = φ = 1 − α [ x ] (t) Dàn chọn mẫu có thể là danh sách các đơn vị chọn mẫu với Sau đây là một vài trị số tiêu biểu: những đặc điểm nhận dạng của chúng hoặc là bản đồ chỉ ra ranh giới của các đơn vị được dùng làm căn cứ để tiến hành chọn mẫu. Khi tổ t = 1 thì φ = 0,6827; t = 2 thì φ = 0,9545; t = 3 thì φ = 0,9973 t t t chức điều tra thống kê. Như vậy, có thể ước lượng tham số của tổng thể chung bằng Trong tổng thể nghiên cứu, tùy thuộc vào lược đồ chọn mẫu mà khoảng tin cậy với công thức như sau: sẽ có các loại dàn chọn mẫu khác nhau. Nếu điều tra mẫu một cấp (giả X = x ± Δx ⇒ x − Δx ≤ X ≤ x + Δx ; (1.1.8) định điều tra các hộ trên địa bàn huyện) thì dàn chọn mẫu là danh sách các hộ gia đình của tất cả các xã trong huyện. Còn nếu điều tra mẫu c. Ý nghĩa của việc tính toán sai số chọn mẫu hai cấp, cấp I là xã và cấp II là hộ gia đình thì có hai loại dàn chọn - Sai số chọn mẫu dùng để ước lượng chỉ tiêu nghiên cứu theo mẫu: Dàn chọn mẫu cấp I là danh sách tất cả các xã trong huyện, còn khoảng tin cậy, điều này thể hiện qua công thức 1.1.8. dàn chọn mẫu cấp II là danh sách các hộ gia đình của những xã được - Sai số chọn mẫu dùng để đánh giá tính đại diện của chỉ tiêu chọn ở mẫu cấp I. 21 22
  12. 1.1.2.5. Chọn mẫu ngẫu nhiên, chọn mẫu hệ thống và chọn Có nhiều phương pháp, tổ chức chọn mẫu khác nhau. Mỗi theo phương pháp phân tích chuyên gia phương pháp có những ưu, nhược điểm riêng và được áp dụng trong những điều kiện nhất định. Tuy nhiên gọi là phương pháp này hay - Chọn mẫu ngẫu nhiên là chọn các đơn vị từ tổng thể vào mẫu phương pháp kia là đứng trên những giác độ khác nhau và cũng chỉ có hoàn toàn hú hoạ. Cách đơn giản nhất của chọn mẫu ngẫu nhiên là rút ý nghĩa tương đối. thăm hoặc sử dụng bảng số ngẫu nhiên. - Chọn mẫu hệ thống là chọn các đơn vị từ tổng thể vào mẫu theo - Xét theo cấp chọn mẫu có phương pháp tổ chức chọn mẫu một một khoảng cách cố định sau khi đã chọn ngẫu nhiên một nhóm nào cấp và tổ chức chọn mẫu hai cấp hay nhiều cấp: đó trên cơ sở các đơn vị điều tra được sắp xếp thứ tự theo một tiêu + Chọn mẫu một cấp là từ một loại danh sách của tất cả các đơn thức nhất định. vị thuộc tổng thể chung, tiến hành chọn mẫu một lần trực tiếp đến các Ví dụ: Trường đại học "X" có 2000 sinh viên (N = 2000). Cần đơn vị điều tra không qua một phân đoạn nào khác. chọn 100 sinh viên (n = 100) để điều tra mức sống của họ. Nếu chọn Chọn mẫu một cấp chỉ có một loại đơn vị chọn mẫu và một dàn hệ thống sẽ tiến hành như sau: chọn mẫu. Đối với mẫu một cấp có thể dùng cách chọn ngẫu nhiên, nhưng cũng có thể dùng cách chọn hệ thống hoặc chọn theo phương + Lập danh sách 2000 sinh viên của trường theo thứ tự nào đó, pháp chuyên gia. Tuy nhiên, trong thực tế nếu là điều tra mẫu một cấp chẳng hạn theo vần A, B, C của tên gọi. thì phổ biến là dùng cách chọn ngẫu nhiên và thường được gọi tắt là + Chia tổng số sinh viên của trường thành 100 nhóm đều nhau và "chọn mẫu ngẫu nhiên đơn giản". Chọn mẫu ngẫu nhiên đơn giản đảm sẽ có số sinh viên mỗi nhóm là 20 sinh viên: bảo số mẫu được rải trên toàn địa bàn điều tra nên SSCM sẽ nhỏ. Song (K = N: n = 2000 : 100). khó khăn là việc lập danh sách các đơn vị (dàn chọn mẫu) để tiến hành + Chọn ngẫu nhiên một sinh viên ở nhóm thứ nhất, chẳng hạn rơi chọn mẫu khá lớn, tốn nhiều thời gian và công sức. Hơn nữa khi tổ vào sinh viên có số thứ tự 15. chức điều tra phải thực hiện ở địa bàn rất rộng. + Mỗi nhóm khác còn lại sẽ chọn 1 sinh viên có số thứ tự: nhóm + Chọn mẫu nhiều cấp là tiến hành điều tra theo nhiều công đoạn, 2: (15+K), nhóm 3: (15+2K), ; nhóm 100: (15+99K). trong đó mỗi công đoạn là một cấp chọn mẫu. Có bao nhiêu cấp điều tra thì có bấy nhiêu loại đơn vị chọn mẫu cũng như có bấy nhiêu loại Kết quả chọn được 100 sinh viên như vậy được gọi là chọn hệ dàn chọn mẫu. thống. Phương pháp tổ chức chọn mẫu nhiều cấp thuận tiện cho việc lập - Chọn mẫu theo phương pháp phân tích chuyên gia là chọn mẫu dàn chọn mẫu và tổ chức điều tra: Ở cấp sau chỉ phải lập dàn chọn trên cơ sở phân tích xem xét chủ quan của người điều tra. Cách chọn mẫu cho cấp đó trong phạm vi mẫu cấp trước được chọn, phạm vi điều này thường áp dụng cho tổng thể có ít đơn vị mẫu hoặc trị số của chỉ tra được thu hẹp sau mỗi cấp điều tra. Tuy nhiên, với phương pháp tổ tiêu nghiên cứu giữa các đơn vị mẫu chênh lệch nhau nhiều. chức chọn mẫu nhiều cấp số liệu thu thập được thường có độ tin cậy thấp hơn so với chọn mẫu ngẫu nhiên đơn giản. 1.1.2.6. Các phương pháp tổ chức chọn mẫu - Nếu trước khi chọn mẫu, tiến hành phân chia tổng thể thành 23 24
  13. những tổ khác nhau theo một hay một số tiêu thức nào đó liên quan a. Xác định cỡ mẫu theo các công thức lý thuyết. Một tổng thể khi đến tiêu thức điều tra, sau đó phân bổ cỡ mẫu cho từng tổ và trong tiến hành điều tra không chia thành các tổng thể nhỏ (các tổ) thì chỉ có mỗi tổ lập một danh sách riêng và chọn đủ số mẫu phân bổ cho tổ đó. một cách xác định cỡ mẫu trên cơ sở thông tin về quy mô và phương Cách chọn như vậy gọi là chọn mẫu phân tổ. sai của tổng thể chung. Đối với một tổng thể khi điều tra có chia thành Với phương pháp chọn mẫu phân tổ, nếu việc phân tổ được tiến các tổng thể nhỏ có hai cách xác định cỡ mẫu: Cách thứ nhất xác định hành khoa học thì tổng thể mẫu sẽ có kết cấu gần tổng thể chung, do cỡ mẫu như trường hợp không phân tổ, sau đó phân bổ số mẫu chung đó SSCM sẽ giảm đi, tính chất đại diện của tổng thể mẫu được nâng cho các tổ theo nguyên tắc phân bổ mẫu. Cách thứ hai xác định cỡ cao. mẫu trên cơ sở quy mô và phương sai của từng tổ. Tuy nhiên, chọn mẫu phân tổ cũng khó khăn trong việc lập dàn Sau đây sẽ giới thiệu công thức xác định cỡ mẫu theo hai cách nói chọn mẫu như chọn mẫu ngẫu nhiên đơn giản. Hơn nữa tổ chức điều trên nhưng chỉ cho trường hợp tổ chức chọn mẫu ngẫu nhiên đơn giản tra phải tiến hành trên địa bàn rộng, thậm chí còn phức tạp hơn cả hoặc có phân tổ và được áp dụng cho nghiên cứu chỉ tiêu bình quân chọn mẫu ngẫu nhiên đơn giản. với cách chọn không lặp làm ví dụ. - Nếu điều tra chia thành nhiều cấp, các cấp tiến hành trước thì + Cách thứ nhất xác định cỡ mẫu trên cơ sở các thông tin về quy chọn từng đơn vị mẫu, nhưng ở cấp cuối cùng không chọn ra từng đơn mô và phương sai của tổng thể chung: vị, mà chọn cả nhóm các đơn vị để điều tra. Cách chọn như vậy gọi là N.t2.S2 chọn mẫu chùm (hay chọn mẫu cả khối). n = 2 2 2 ; (1.1.10) N.Δx + t .S Nếu cùng cỡ mẫu như nhau, chọn mẫu chùm so với các phương pháp tổ chức chọn mẫu nêu trên sẽ thuận tiện nhất cho việc lập dàn Trong đó: chọn mẫu và tổ chức điều tra. Tuy nhiên, độ tin cậy của số liệu thu N - Số đơn vị tổng thể chung; thập được sẽ thấp hơn; tức là có SSCM lớn nhất. n - Số đơn vị mẫu; 1.1.3. Xác định cỡ mẫu, phân bổ mẫu và tính sai số chọn mẫu t - Hệ số tin cậy; Δ - Phạm vi sai số chọn mẫu; 1.1.3.1. Xác định cỡ mẫu (số đơn vị mẫu) x S2 - Phương sai của tổng thể chung. Xác định cỡ mẫu (số đơn vị mẫu) chính là xác định số lượng đơn vị điều tra trong tổng thể mẫu để tiến hành thu thập số liệu. Yêu cầu + Cách thứ hai xác định cỡ mẫu trên cơ sở các thông tin về quy của cỡ mẩu là vừa đủ để vừa đảm bảo độ tin cậy cần thiết của số liệu mô và phương sai của các tổ t: điều tra vừa đảm bảo phù hợp với điều kiện về nhân lực và kinh phí và K 2 có thể thực hiện được, tức là có tính khả thi. ∑ wtSt n = t=1 ; (1.1.11) Dưới đây sẽ trình bày cách xác định cỡ mẫu đơn thuần theo lý Δ2 1 K x + w S2 thuyết và việc xác định cỡ mẫu trong thực tế các cuộc điều tra thống 2 ∑ t t t N t=1 kê ở Việt Nam. α 25 26
  14. Trong đó: Và do vậy, mỗi chỉ tiêu tính ra sẽ có một cỡ mẫu riêng (mặc dù yêu N - Số đơn vị tổng thể chung; cầu về độ tin cậy (φt) của các chỉ tiêu điều tra như nhau). Nói cách khác, có bao nhiêu chỉ tiêu điều tra thì phải tính bấy nhiêu cỡ mẫu, sau n - Số đơn vị mẫu; đó sẽ chọn ra cỡ mẫu lớn nhất dùng chung cho điều tra tất cả các chỉ tα - Hệ số tin cậy; tiêu. Với nhiều cỡ mẫu đòi hỏi phải tính nhiều phương sai nên công việc tính toán càng trở nên phức tạp, tốn nhiều công sức, khó thực Δx - Phạm vi sai số chọn mẫu; hiện. wt - Tỷ trọng số đơn vị của tổ t trong tổng thể chung; Vì những đặc điểm trên đây, trong thực tế điều tra chọn mẫu ở K - Số lượng tổ (t = 1, 2, K); nước ta còn ít khi áp dụng một cách trực tiếp các công thức trên để 2 St - Phương sai tổng thể chung của tổ t. xác định cỡ mẫu. Từ các công thức trên, để xác định cỡ mẫu trong quá trình chuẩn Ngành Thống kê trong những năm gần đây đã có một số cuộc bị phương án điều tra phải có được những thông tin sau: điều tra chọn mẫu mà các chuyên gia chọn mẫu đã dựa vào thông tin - N: Số đơn vị tổng thể. Chỉ tiêu này có đầy đủ ở phần lớn các của các cuộc điều tra có liên quan trước đó để xác định cỡ mẫu theo cuộc điều tra thống kê; công thức lý thuyết. Song kết quả thu được còn khiêm tốn. b. Xác định cỡ mẫu theo kinh nghiệm điều tra thực tế. Trong thực - wt: Tỷ trọng số đơn vị của tổ t trong tổng thể. Đại lượng này xác tế nhiều khi các chuyên gia thống kê thường căn cứ vào cỡ mẫu của định được trên cơ sở so sánh số đơn vị từng tổ (Nt) với số đơn vị toàn bộ tổng thể (N); các cuộc điều tra có điều kiện và quy mô tương tự đã thực hiện thành công trước đó ở trong nước hoặc trên thế giới để xác định cỡ mẫu cho - t , Δ : Hệ số tin cậy và phạm vi sai số chọn mẫu là những thông α x cuộc điều tra sau. Có nhiều cách xác định cỡ mẫu nhưng phổ biến nhất tin của chỉ tiêu điều tra và được ấn định từ trước do yêu cầu thuộc chủ vẫn dựa vào tỷ lệ mẫu chung đã được điều tra và bổ sung thêm một tỷ quan của những người quản lý và tổ chức điều tra; lệ mẫu dự phòng nào đó. 2 - St : Phương sai của từng tổ t. Số liệu để tính các phương sai Cách làm này đơn giản, nhanh chóng và dễ thực hiện, tức là có trên, cần có trước khi điều tra, song thực tế lại không có, do vậy tính khả thi cao. Tuy nhiên làm như vậy chủ yếu vẫn là theo chủ nghĩa thường phải dùng số liệu điều tra toàn bộ của các cuộc điều tra trước kinh nghiệm và gần như chưa tính đến mức độ biến động của các chỉ (nếu có). Trường hợp không có số liệu của các cuộc điều tra trước thì tiêu nghiên cứu. phải tiến hành điều tra mẫu nhỏ. Tuy nhiên, việc điều tra mẫu nhỏ c. Xác định cỡ mẫu cũng dựa theo cỡ mẫu của cuộc điều tra nào cũng khá phức tạp, mất nhiều thời gian, nhiều khi còn ảnh hưởng đến đó (có điều kiện, quy mô tương tự và đã được tiến hành thành công), tiến độ thực hiện của cuộc điều tra chính. nhưng có điều chỉnh (tăng lên hoặc giảm đi) trên cơ sở phân tích tỷ lệ Một khó khăn nữa là trong một cuộc ĐTCM thường tiến hành thu SSCM của một số chỉ tiêu chủ yếu. Quá trình này được tiến hành theo thập thông tin về nhiều chỉ tiêu. Các chỉ tiêu khác nhau sẽ có quy luật hai hướng: phân phối và độ biến thiên khác nhau, tức là có phương sai khác nhau. 27 28
  15. Trước hết liệt kê những chỉ tiêu chủ yếu cùng được tổ chức thu C0 - Kinh phí chi cho các khâu chuẩn bị, tập huấn nghiệp vụ thu thập số liệu trong cả 2 cuộc điều tra (cuộc điều tra trước đó đã hoàn thập, xử lý và các chi phí chung khác; chỉnh và cuộc điều tra lần này đang chuẩn bị); trong đó chọn ra một Z - Chi phí cần thiết cho tất cả các khâu điều tra tính cho một đơn chỉ tiêu trong cuộc điều tra lần trước có tỷ lệ SSCM lớn nhất (từ đây vị điều tra. chỉ tiêu được chọn gọi là chỉ tiêu nghiên cứu). 1.1.3.2. Phân bổ mẫu Tiếp theo, tiến hành xem xét tỷ lệ SSCM của chỉ tiêu nghiên cứu tính được của cuộc điều tra lần trước và xử lý như sau: Nếu địa bàn điều tra được chia thành các khu vực hoặc các tổ - Nếu tỷ lệ SSCM đó lớn hơn mức độ cho phép thì phải điều khác nhau và tiến hành điều tra trên tất cả các khu vực hoặc các tổ thì chỉnh cỡ mẫu của cuộc điều tra lần này tăng lên so với cuộc điều tra phải thực hiện phân bổ mẫu cho từng khu vực hoặc từng tổ đó. trước; Có nhiều cách phân bổ mẫu khác nhau, dưới đây chỉ giới thiệu - Nếu tỷ lệ SSCM đó nhỏ hơn mức độ cho phép thì có thể điều một số cách phân bổ chủ yếu. chỉnh cỡ mẫu giảm đi. a. Phân bổ mẫu tỷ lệ thuận với quy mô tổng thể Chú ý: Công thức xác định cỡ mẫu của từng tổ t (nt) như sau: + So sánh tỷ lệ SSCM là căn cứ quan trọng để điều chỉnh cỡ mẫu. Song đó không phải là căn cứ duy nhất, mà thực tế còn phải dựa vào Nt nt = n = Ntf ; (1.1.13) một số yếu tố khác như sự thay đổi về quy mô tổng thể chung, thay N đổi về số lượng chỉ tiêu điều tra, Trong đó: + Điều kiện để áp dụng cách điều chỉnh cỡ mẫu trên đây là trong t - Chỉ số thứ tự tổ (t = 1, 2 K) cuộc điều tra kỳ trước phải tính được tỷ lệ SSCM cho các chỉ tiêu chủ n - Số đơn vị mẫu chung; yếu. n - Số đơn vị mẫu của tổ t; Cách ước lượng này đơn giản và thuận tiện hơn nhiều so với cách t tính cỡ mẫu theo lý thuyết, nhưng lại có cơ sở chắc chắn hơn so với N - Số đơn vị của tổng thể; cách xác định cỡ mẫu có tính chất ước đoán thuần tuý theo kinh Nt - Số đơn vị của tổ t; nghiệm. n f - Tỷ lệ mẫu ( f = ) d. Cách xác định cỡ mẫu chủ yếu dựa vào khả năng về kinh phí. N Công thức xác định cỡ mẫu (n) trong trường hợp này như sau: Các phân bổ mẫu tỷ lệ thuận với quy mô thường được áp dụng C − C khi quy mô của các tổ tương đối đồng đều, phương sai và chi phí cho n = 0 ; (1.1.12) Z các tổ không khác nhau nhiều. Cách phân bổ này có ưu điểm: Dễ làm, không phải tính lại theo quyền số thực tế khi suy rộng kết quả là chỉ Trong đó: tiêu bình quân hoặc tỷ lệ cho tổng thể. Tuy nhiên, khi quy mô của các C - Tổng kinh phí được cấp; tổ khác nhau nhiều thì phân bổ tỷ lệ thuận với quy mô dễ làm cho các 29 30
  16. tổ có quy mô nhỏ thường không đủ số lượng mẫu để đại diện cho tổ Trong đó: đó, ngược lại các tổ có quy mô lớn lại "thừa" cỡ mẫu. Mặt khác, việc Nt - Tổng số đơn vị của tổ t; tổ chức điều tra cũng như kinh phí cần thiết cho điều tra ở các tổ có quy mô lớn sẽ rất nặng nề, còn việc tổ chức điều tra cũng như kinh phí St - Độ lệch chuẩn của tổ thứ t. cần thiết cho điều tra ở các tổ có quy mô nhỏ lại quá nhẹ nhàng. Công thức trên cho thấy quy mô mẫu của các tổ tỷ lệ thuận với quy mô và phương sai của chúng. Tổ có phương sai lớn sẽ được phân b. Phân bổ mẫu tỷ lệ với căn bậc hai của quy mô tổng thể nhiều đơn vị mẫu hơn tổ có phương sai nhỏ, tổ có quy mô lớn sẽ được Công thức tính số đơn vị mẫu (nt) của tổ t như sau: phân nhiều đơn vị hơn các tổ có quy mô nhỏ. n = n . w ; (1.1.14a) t t d. Phân bổ mẫu tối ưu Trong đó: Đây là cách phân bổ mẫu tối ưu đầy đủ hơn vì nó không những đề n - Số đơn vị của tổng thể cập tới sự khác biệt về quy mô, sự biến động của chỉ tiêu được nghiên wt - Tỷ lệ giữa căn bậc hai số đơn vị của tổ t ( Nt ) và tổng căn cứu giữa các tổ mà còn đề cập tới khả năng kinh phí của từng tổ. Công K thức phân bổ mẫu tối ưu có dạng: bậc hai số đơn vị của tất cả các tổ ( ∑ Nt ). t=1 ⎛ ⎞ ⎜ ⎟ N S / c Như vậy công thức (1.1.14a) sẽ biến đổi như sau: n = n.⎜ t t t ⎟ với t = 1, 2, K ; (1.1.16) t ⎜ K ⎟ ⎛ K ⎞ N S / c n = n.w = n⎜ N : N ⎟ ; (1.1.14b) ⎜ ∑ t t t ⎟ t t ⎜ t ∑ t ⎟ ⎝ t=1 ⎠ ⎝ t=1 ⎠ Cách phân bổ này sẽ khắc phục nhược điểm của phân bổ tỷ lệ với Trong đó: ct - Chi phí điều tra cho tổ t. quy mô tổng thể nhưng khi suy rộng phải tính lại theo quyền số thực Công thức trên cho thấy quy mô mẫu của các tổ tỷ lệ thuận với tế. quy mô và phương sai của chúng. Mặt khác tỷ lệ nghịch với căn bậc c. Phân bổ Neyman hai của chi phí có thể có để thực hiện điều tra trên phạm vi của tổ. Vì vậy, phương pháp phân bổ mẫu này thường được áp dụng khi quy mô, Phân bổ Neyman được coi là phân bổ tối ưu theo nghĩa thống kê phương sai và khả năng kinh phí của các tổ tương đối khác nhau. thuần tuý. Cỡ mẫu vừa tính theo tỷ lệ của quy mô, vừa tính đến sự khác nhau về độ biến động của chỉ tiêu nghiên cứu các tổ. e. Phân bổ mẫu có ưu tiên cho các tổ được đánh giá là quan trọng Công thức xác định cỡ mẫu (nt) cho tổ t như sau: Cách phân bổ mẫu này thường được áp dụng khi có sự khác nhau N tSt đáng kể giữa các tổ về hàm lượng thông tin cần thiết. Theo nguyên tắc n t = n. với (t = 1, 2, K) ; (1.1.15) K này, các tổ có hàm lượng thông tin thấp được phân bổ cỡ mẫu nhỏ. Tư ∑N tSt t=1 tưởng này thường ứng dụng trong điều tra các doanh nghiệp. Các doanh nghiệp thuộc tổ có quy mô lớn (có sản lượng hoặc số lượng 31 32
  17. công nhân chiếm tỷ trọng lớn trong tổng sản lượng hoặc tổng số công 8 L 10 2 18 J 8 1 nhân của các doanh nghiệp) thì phân bổ theo tỷ lệ mẫu lớn hơn. 9 V 11 1 19 H 13 1 Ngược lại các doanh nghiệp có quy mô nhỏ hơn thì phân bổ tỷ lệ mẫu nhỏ hơn. 10 M 10 1 20 S 14 2 Tóm lại, phân bổ mẫu trong thực tế cần dựa vào việc phân tích Tổng số 216 đặc điểm cụ thể của các chỉ tiêu thống kê cần thu thập ở từng tổ. Mặc khác, cũng cần xét tới điều kiện thực tế diễn ra ở từng tổ. Điều này a. Phương pháp tổ chức chọn mẫu ngẫu nhiên đơn giản đặc biệt cần lưu ý trong khi phân bổ cỡ mẫu cho điều tra nhiều cấp. * Tổ chức chọn mẫu 1.1.3.3. Cách tính sai số chọn mẫu Khi tiến hành chọn mẫu ngẫu nhiên đơn giản chỉ việc lập danh Dưới đây sẽ trình bày công thức tính SSCM tương ứng với các sách các hộ gia đình có tên chủ hộ, địa chỉ và kèm theo số thứ tự từ 1 phương pháp tổ chức chọn mẫu ngẫu nhiên đơn giản, mẫu phân tổ, đến 216 của chung 20 làng, bản kể trên. Sau đó dùng bảng số ngẫu mẫu 2 cấp và mẫu chùm nhiên hoặc rút thăm chọn ngẫu nhiên không lặp lại từ danh sách được Cách trình bày công thức tính SSCM được bắt đầu từ một ví dụ giả lập trong bảng để được số hộ cần điều tra (ở đây là chọn 20 hộ). định về danh sách các làng, bản với số hộ gia đình có vốn đầu tư cho sản * Cách tính sai số chọn mẫu xuất, kinh doanh (viết tắt là VĐT) của một địa bàn "Y" thuộc tỉnh miền núi (xem số liệu bảng 1.1). Gọi i là số thứ tự của hộ gia đình trên địa bàn điều tra. i = 1, 2, . . . . . . . N (N = 216 - Tổng số hộ của địa bàn điều tra) Bảng 1.1. Danh sách những bản, làng với số hộ có đầu tư i = 1, 2, . . . . . . . n (n = 20 - Số hộ chọn mẫu trên địa bàn) sản xuất, kinh doanh xi: Vốn đầu tư sản xuất, kinh doanh của hộ thứ i (*) (*) TT bản Tên bản Số hộ Vùng TT bản Tên bảnSố hộ Vùng Từ đó có công thức: 1 A 9 1 11 N 10 2 + VĐT bình quân một hộ: 2 I 10 2 12 E 13 1 1 n x = x ; (1.1.17) 3 D 11 3 13 P 11 3 ∑ i n i=1 4 B 11 1 14 F 11 2 + Phương sai mẫu: 5 K 12 1 15 G 12 1 n 2 1 2 6 Y 12 2 16 Q 9 3 s = ∑ ()xi − x ; (1.1.18) n −1 i=1 7 C 9 3 17 Z 10 2 + Sai số chọn mẫu: (*)Ghi chú: 1: Vùng cánh đồng; 2: Vùng khe dọc; 3: Vùng cao. 33 34
  18. s2 ⎛ n ⎞ i = 1,2,. . . . . . . nt đối với tổng thể mẫu μ = ⎜1 − ⎟ ; (1.1.19) n ⎝ N ⎠ xit - VĐT của hộ thứ i thuộc tổ t Từ đó ta có công thức tính: b. Phương pháp tổ chức chọn mẫu phân tổ + VĐT bình quân của các đơn vị thuộc tổ t: * Tổ chức chọn mẫu 1 nt Trở lại ví dụ bảng 1.1 phân các bản thành 3 vùng địa hình, tức là xt = ∑ x it ; (1.1.20) n 3 tổ (1: cánh đồng; 2: khe dọc; 3: vùng cao). Các vùng này có điều t i=1 kiện kinh tế khác nhau và do đó có mức độ đầu tư cho sản xuất, kinh + VĐT bình quân của tất cả các đơn vị điều tra: doanh của dân cư cũng khác nhau. Như vậy, việc phân chia các bản - Chọn theo tỷ lệ: theo vùng địa hình sẽ liên quan nhiều đến VĐT cho SXKD của dân 1 K cư. x = ∑ xtnt ; (1.1.21.a) n t=1 Gọi t là số thứ tự của các tổ (t = 1, 2, K = 3 - Số tổ của địa bàn - Chọn không theo tỷ lệ: điều tra); Tổ 1: t = 1 (Vùng cánh đồng); Tổ 2: t = 2 (Vùng khe dọc); 1 K x = ∑ xtNt ; (1.1.21.b) Tổ 3: t = 3 (Vùng núi cao) N t=1 Nt - Số HGĐ của tổ (vùng) t + Phương sai mẫu của các đơn vị trong tổ t: K nt N - Tổng số hộ gia đình của địa bàn điều tra (N = N ) 2 1 2 ∑ t st = ()x it − xt ; (1.1.22) t=1 ∑ n t −1 i=1 n - Số hộ chọn mẫu của tổ (vùng) t t + Sai số chọn mẫu: K n - Tổng số hộ chọn mẫu của địa bàn (n = ∑n t ) - Chọn theo tỷ lệ: t=1 2 Cỡ mẫu mỗi tổ (nt) có thể được chọn theo tỷ lệ đều nhau hoặc st ⎛ n ⎞ chọn không theo tỷ lệ đều nhau. Nếu chọn theo tỷ lệ đều nhau thì tỷ lệ μ = ⎜1 − ⎟ ; (1.1.23a) n ⎝ N ⎠ n chọn mẫu ở các tổ đều bằng f ( f = ). K N 2 ∑st n t * Cách tính sai số chọn mẫu Trong đó: s 2 = t=1 t K Gọi i là số thứ tự của HGĐ trong mỗi tổ ∑n t t=1 i = 1,2,. . . . . . . Nt đối với tổng thể chung 35 36
  19. ∗ - Chọn không theo tỷ lệ: 1 n x j = ∑ xij ; (1.1.24) n∗ 1 K s2 ⎛ n ⎞ i=1 t ⎜ t ⎟ 2 μ = ∑ ⎜1 − ⎟Nt ; (1.1.23b) + VĐT bình quân của tất cả các đơn vị điều tra: N t=1 nt ⎝ N t ⎠ ∗ 1 m 1 m n c. Phương pháp tổ chức chọn mẫu 2 cấp x = ∑ x j = ∑∑xij ; (1.1.25) m j=1 n j==1 i 1 * Tổ chức chọn mẫu + Phương sai mẫu cấp II (hộ) thuộc từng đơn vị mẫu cấp I (bản) Cũng số liệu đã cho ở bảng 1.1 tiến hành chọn mẫu 2 cấp như thứ j: sau: từ danh sách 20 làng bản chọn ngẫu nhiên không lặp lấy 4, tức là n∗ 2 1 2 20% số làng bản (chẳng hạn chọn được các bản số 1, 5, 12 và 19). Các sj = ∑()xij − xj ; (1.1.26) (n∗ − 1) bản được chọn là mẫu cấp I. Tiếp theo lập danh sách các HGĐ của 4 i=1 bản này, rồi từ các danh sách đó chọn ngẫu nhiên không lặp ra số hộ + Bình quân các phương sai mẫu cấp II: m đều nhau cho mỗi bản (5 hộ) để tiến hành điều tra. Như vậy tổng số hộ 2 1 2 được chọn là 20 (hộ là mẫu cấp II). sj = ∑s j ; (1.1.27) m j=1 * Cách tính sai số chọn mẫu + Phương sai mẫu cấp I: Gọi j là số thứ tự của đơn vị mẫu cấp I (bản) m 2 1 2 j = 1, 2, 3, , M (M = 20 - Tổng số bản của địa bàn điều tra) sb = ∑ ()x j − x ; (1.1.28) m −1 j=1 j = 1, 2, 3, , m (m = 4 - Số bản được chọn vào mẫu cấp I) + Sai số chọn mẫu: i - Số thứ tự của đơn vị cấp II (HGĐ) 2 2 ∗ n - Tổng số đơn vị mẫu cấp II (HGĐ) sb ⎛ m ⎞ sj ⎛ n ⎞ μ = ⎜1 − ⎟ + ⎜1 − ⎟ ; (1.1.29) ∗ ⎜ ∗ ⎟ n* - Số đơn vị mẫu cấp II trong mỗi đơn vị mẫu cấp I (các đơn vị m ⎝ M ⎠ m.n ⎝ N ⎠ mẫu cấp I có số đơn vị mẫu cấp II bằng nhau: n* = n : m) Trong đó: Số đơn vị cấp II thực tế có bình quân trong mỗi đơn vị cấp I (N) : N* = N : M. xij - Vốn đầu tư của HGĐ (đơn vị mẫu cấp II) thứ i thuộc bản (đơn vị mẫu cấp I) thứ j. d. Phương pháp tổ chức chọn mẫu chùm Ta có công thức tính: Trong mẫu chùm có hai loại: Mẫu chùm có kích thước bằng nhau + VĐT bình quân của các đơn vị mẫu cấp II thuộc mẫu cấp I thứ và mẫu chùm có kích thước khác nhau. Sự khác nhau về kích thước j: của mẫu chùm liên quan đến sự khác nhau về cách tổ chức chọn mẫu và công thức tính các tham số chọn mẫu. 37 38
  20. * Tổ chức chọn mẫu số dư ra bỏ lại không điều tra tiếp. Tiếp tục nghiên cứu ví dụ 1.1. Nếu xác định chùm là - Nếu ở 2 chùm có số HGĐ nhỏ hơn ( )20 thì điều tra hết 20 hộ2, 39 40
  21. m 2 1 2 đếm, cung cấp thông tin, ghi chép, đánh mã, nhập tin, ) từ đây gọi là sb = ∑ ()x j − x ; (1.1.32) m −1 j=1 "sai số điều tra". Sai số chọn mẫu (SSCM) chỉ phát sinh trong điều tra chọn mẫu - Sai số chọn mẫu khi tiến hành thu thập ở một bộ phận các đơn vị tổng thể (gọi là mẫu) rồi dùng kết quả suy rộng cho toàn bộ tổng thể chung. SSCM phụ s2 ⎛ m ⎞ μ = b ⎜1 − ⎟ ; (1.1.33) thuộc vào cỡ mẫu (mẫu càng lớn thì sai số càng nhỏ), vào độ đồng đều m M ⎝ ⎠ của chỉ tiêu nghiên cứu (độ đồng đều cao thì sai số chọn mẫu càng + Chùm có kích thước khác nhau: nhỏ) và phương pháp tổ chức điều tra chọn mẫu. Còn sai số điều tra xảy ra cả trong điều tra chọn mẫu và điều tra toàn bộ. - VĐT bình quân của các đơn vị trong mỗi chùm thứ j Trong thực tế công tác điều tra thống kê hiện nay, phương pháp 1 nj chọn mẫu được áp dụng ngày càng nhiều và có hiệu quả. Số liệu thu x j = ∑ xij ; (1.1.34) n j i=1 được từ điều tra chọn mẫu ngày càng phong phú, đa dạng và phục vụ kịp thời các yêu cầu sử dụng. Bên cạnh đó chất lượng số liệu của điều - VĐT bình quân của tất cả các đơn vị điều tra tra chọn mẫu cũng còn những hạn chế nhất định. Có một số ý kiến m hiện nay đánh giá không công bằng và thiếu khách quan về kết quả ∑ x jn j điều tra chọn mẫu, cho rằng số liệu chưa sát với thực tế vì chỉ điều tra 1 m nj x = j=1 = x ; (1.1.35) một bộ phận rồi suy rộng cho tổng thể. m ∑∑ ij n j==1 i 1 ∑n j Tất nhiên cũng phải thấy rằng đã là điều tra chọn mẫu thì không j=1 thể tránh khỏi sai số chọn mẫu nhưng mức độ sai số chọn mẫu của - Phương sai giữa các chùm: phần lớn những chỉ tiêu trong các cuộc điều tra thống kê hiện nay m thường là ở phạm vi cho phép nên chấp nhận được. Hơn nữa khi cần 2 1 2 sb = ∑ ()x j − x n j ; (1.1.36) thiết ta có thể chủ động giảm được sai số chọn mẫu bằng cách điều ⎛ n ⎞ j=1 ⎜n − ⎟ chỉnh cỡ mẫu và tổ chức chọn mẫu một cách khoa học, tuân thủ đúng ⎝ m ⎠ nguyên tắc chọn mẫu. - Sai số chọn mẫu: Như công thức 1.1.33. Điều đáng nói và cần quan tâm hơn trong điều tra thống kê chính 1.2. SAI SỐ TRONG ĐIỀU TRA THỐNG KÊ là sai số phi chọn mẫu. Loại sai số này xảy ra ở cả ba giai đoạn điều tra, liên quan đến tất cả các đối tượng tham gia điều tra thống kê và Trong điều tra thống kê có hai loại sai số: Sai số chọn mẫu (sai số ảnh hưởng đáng kể đến chất lượng số liệu thống kê. do tính đại diện của số liệu vì chỉ chọn một bộ phận các đơn vị để điều Dưới đây sẽ đi sâu nghiên cứu về sai số phi chọn mẫu - sai số tra) và sai số phi chọn mẫu (sai số thuộc về lỗi của các quy định, điều tra, xảy ra trong cả ba giai đoạn nhưng chỉ đề cập đến sai số liên hướng dẫn, giải thích tài liệu điều tra, do sai sót của việc cân đong, đo quan tới những công việc, những đối tượng thường gặp nhiều hơn. 41 42
  22. 1.2.1. Sai số trong quá trình chuẩn bị điều tra thống kê Khái niệm, định nghĩa dùng trong điều tra giúp cho hiểu rõ nội dung, bản chất cũng như phạm vi xác định thông tin của số liệu thống Trong công tác điều tra thống kê, chuẩn bị điều tra giữ một vai trò kê cần thu thập. cực kỳ quan trọng. Chất lượng của khâu chuẩn bị điều tra sẽ ảnh hưởng cả đến quá trình thu thập số liệu và cuối cùng là đến chất lượng Như ta đã biết thống kê nghiên cứu mặt lượng trong quan hệ mật của số liệu điều tra. Một cuộc điều tra được chuẩn bị kỹ lưỡng, chu thiết với mặt chất của hiện tượng kinh tế - xã hội số lớn. Chính các đáo và đầy đủ sẽ là cơ sở đầu tiên để giảm sai số điều tra nhằm nâng khái niệm, định nghĩa là phản ánh về mặt chất của hiện tượng, là cơ sở cao chất lượng của số liệu thống kê. để nhận biết, phân biệt hiện tượng này với hiện tượng khác cũng như xác định phạm vi của hiện tượng nghiên cứu. Nếu khái niệm, định a. Sai số điều tra liên quan tới việc xác định mục đích, nội dung nghĩa chuẩn xác, rõ ràng, được giải thích đầy đủ, cặn kẽ là cơ sở để và đối tượng điều tra xác định và thu thập số liệu thống kê phản ánh đúng thực tế khách Xác định mục đích điều tra là làm rõ yêu cầu của cuộc điều tra quan. Ngược lại nếu khái niệm, định nghĩa không đúng, mập mờ, phải trả lời những câu hỏi gì, đạt được những mục tiêu nào của công thiếu rõ ràng thì việc xác định, đo tính (lượng hoá) hiện tượng sẽ bị sai lệch. tác quản lý. Yêu cầu của mục đích điều tra phải rõ ràng, dứt khoát và đó chính là căn cứ để xác định nội dung cũng như đối tượng điều tra Ví dụ: Khi điều tra cán bộ khoa học công nghệ có trình độ "trên một cách đúng đắn, đầy đủ, phù hợp, không bị chệch hướng. đại học", xét về chất, trên đại học phải là những người đã tốt nghiệp và có bằng thạc sĩ, tiến sĩ và tiến sĩ khoa học. Trong thực tế có cuộc Cùng một đơn vị điều tra, nếu có mục đích điều tra khác nhau với điều tra thống kê ở nước ta chỉ đưa ra khái niệm "trên đại học" chung cách tiếp cận thu thập thông tin khác nhau thì sẽ có nội dung cũng như chung, thiếu cụ thể. Điều này làm cho những người tham gia điều tra đối tượng điều tra khác nhau. (kể cả điều tra viên lẫn đối tượng trả lời) hiểu khái niệm cán bộ khoa Xác định đúng nội dung và đối tượng điều tra, một mặt làm cho học công nghệ có trình độ trên đại học rất khác nhau. Một số ít người số liệu thu thập được sẽ đáp ứng những yêu cầu sử dụng, số liệu đảm đã hiểu đúng với nghĩa trình độ trên đại học phải gồm những người có bảo "vừa đủ". Mặt khác, xác định đúng nội dung và đối tượng điều tra bằng thạc sĩ, tiến sĩ và tiến sĩ khoa học; phần đông còn lại đã hiểu là cơ sở để thiết kế bảng hỏi một cách khoa học và có điều kiện thuận không đúng và cho là trên đại học gồm những người đã tốt nghiệp đại lợi để tiếp cận với đối tượng cung cấp thông tin, đảm bảo thông tin thu học sau đó được đi thực tập sinh sau đại học và thậm chí còn cả những được phù hợp và phản ánh đúng thực tế khách quan. người đã tốt nghiệp đại học nhưng chỉ được đi tập trung để đào tạo bồi Tóm lại việc xác định đúng mục đích, nội dung và đối tượng điều tra dưỡng thêm về nghiệp vụ một vài tháng. làm cho cuộc điều tra thực hiện đúng hướng, đúng yêu cầu là một trong Thực tế này đã làm cho số liệu điều tra được về cán bộ khoa học những điều kiện tiên quyết để đảm bảo chất lượng số liệu, giảm sai số công nghệ có trình độ "trên đại học" tăng lên hơn hai lần so với số trong điều tra thống kê. thực tế có tại thời điểm điều tra. b. Sai số liên quan tới việc xây dựng các khái niệm, định nghĩa Như vậy, những lỗi trong việc xây dựng các khái niệm, định dùng trong điều tra nghĩa và nội dung thông tin về tiêu thức, chỉ tiêu thống kê sẽ ảnh hưởng trực tiếp đến chất lượng số liệu thống kê. Đây là hiện tượng 43 44
  23. khá phổ biến trong điều tra thống kê ở nước ta hiện nay. đáp ứng và thống nhất với danh mục phục vụ cho tổng hợp chung của Để có số liệu tốt, giảm bớt sai số điều tra, một vấn đề có tính chất công tác thống kê. Nội dung bảng danh mục và cách mã hoá phải nguyên tắc đó là phải chuẩn hoá các khái niệm, định nghĩa về các tiêu được giải thích đầy đủ và hướng dẫn cụ thể. thức, chỉ tiêu của điều tra thống kê. Đồng thời phải giải thích rõ ràng, d. Sai số điều tra liên quan tới việc lựa chọn điều tra viên và đầy đủ và cụ thể hoá các khái niệm, định nghĩa cho phù hợp với từng hướng dẫn nghiệp vụ cuộc điều tra riêng biệt. Điều tra viên là người trực tiếp truyền đạt mục đích, nội dung, c. Sai số điều tra liên quan tới thiết kế bảng hỏi, xây dựng các yêu cầu điều tra đến các đối tượng cung cấp thông tin, đồng thời trực bảng danh mục và mã số dùng trong điều tra tiếp phỏng vấn, lựa chọn thông tin để ghi vào bảng hỏi (nếu là điều tra Trong điều tra thống kê, bảng hỏi là vật mang tin, là công cụ giúp trực tiếp). Vì vậy, điều tra viên có vai trò rất quan trọng trong việc điều tra viên điền thông tin hoặc đánh dấu, đánh mã vào các ô, dòng, đảm bảo chất lượng số liệu trong điều tra. cột phù hợp theo nội dung trả lời của các câu hỏi tương ứng với các Nếu điều tra viên không nắm vững mục đích của cuộc điều tra, tiêu thức ghi ở bảng hỏi dùng trong điều tra. không hiểu hết nội dung thông tin cần thu thập thì sẽ truyền đạt không Nếu các câu hỏi phức tạp, khó hiểu, khó trả lời, khó xác định đúng các yêu cầu cần thiết cho đối tượng trả lời. Ngay cả khi điều tra hoặc khó điền thông tin thì khi đó thông tin thu được sẽ kém chính viên nắm được nghiệp vụ, nhưng nếu thiếu ý thức trách nhiệm, chỉ xác, không đáp ứng yêu cầu của số liệu điều tra. phỏng vấn và ghi chép cho xong việc, hoặc cách tiếp cận với đối tượng điều tra không tốt thì cũng sẽ dẫn đến kết quả số liệu điều tra Cùng với bảng hỏi, các bảng danh mục và các mã số có vai trò thu được không theo ý muốn. quan trọng trong quá trình tổng hợp số liệu thống kê. Thông tin thu được dù đảm bảo độ tin cậy cần thiết, nhưng nếu bảng danh mục dùng Như vậy, việc lựa chọn điều tra viên không tốt cũng là nguyên cho điều tra không chuẩn xác, các mã số không rõ ràng, khó áp dụng nhân không kém phần quan trọng làm cho sai số điều tra tăng lên, ảnh dẫn tới việc đánh sai, đánh nhầm và tất nhiên như vậy số liệu tổng hợp hưởng đến chất lượng số liệu. Vì vậy, muốn giảm bớt loại sai số điều sẽ bị sai lệch. tra này, cần tuyển chọn điều tra viên có trình độ nhất định, nắm được nghiệp vụ, có kinh nghiệm thực tế về điều tra thống kê, đồng thời phải Để giảm sai số điều tra, bảng hỏi phải được thiết kế một cách có ý thức và tinh thần trách nhiệm cao. khoa học, đáp ứng đầy đủ nhu cầu thông tin theo nội dung điều tra đã được xác định, bảo đảm mối liên hệ logic và tính thống nhất giữa các Sau khi lựa chọn được điều tra viên cần tổ chức tập huấn nghiệp câu hỏi. Mặt khác, các câu hỏi phải đơn giản, dễ hiểu, dễ trả lời, dễ vụ đầy đủ và thống nhất. Trong lớp tập huấn bên cạnh giải thích biểu ghi chép, phù hợp với trình độ của điều tra viên và đặc điểm về nguồn mẫu điều tra cần cung cấp thêm những kiến thức về xã hội, phổ biến thông tin của từng loại câu hỏi. Thiết kế bảng hỏi còn phải đảm bảo những kinh nghiệm thực tế và cách tiếp cận đối tượng điều tra, cách thuận lợi cho việc áp dụng công nghệ thông tin. Các bảng danh mục ứng xử trong thực tế. Đối với các cuộc điều tra thống kê có nội dung phải có nội dung phù hợp với những thông tin cần thu thập và được phức tạp và quy mô lớn, cần tiến hành điều tra thử để kịp thời rút kinh mã hoá một cách khoa học theo yêu cầu tổng hợp của điều tra. Danh nghiệm, đảm bảo hướng dẫn nghiệp vụ gắn với điều tra thực địa. mục vừa phải phù hợp với yêu cầu của từng cuộc điều tra, vừa phải Trong điều tra chọn mẫu, khi hướng dẫn nghiệp vụ cần chỉ rõ lộ 45 46
  24. trình điều tra theo từng cấp chọn mẫu, xác định địa bàn điều tra, lập b. Sai số điều tra liên quan đến điều tra viên danh sách địa bàn và đối tượng điều tra chọn mẫu (có địa chỉ cụ thể), Như trên đã nói để nâng cao chất lượng số liệu, giảm sai số điều quy định rõ những trường hợp mất mẫu phải thay đổi như thế nào, tra, một trong những yêu cầu là phải chọn những người điều tra đủ thay đổi đến đâu để tránh tình trạng điều tra viên thay đổi mẫu tuỳ tiện tiêu chuẩn về chuyên môn và tinh thần trách nhiệm. theo ý chủ quan của họ, v.v Ngoài những yêu cầu trên, điều tra viên khi được phân công về 1.2.2. Sai số trong quá trình tổ chức điều tra địa bàn điều tra, còn đòi hỏi phải làm quen với địa bàn, tìm hiểu thực tế về phong tục, tập quán, về điều kiện đi lại, sinh hoạt của địa a. Sai số điều tra liên quan đến quan hệ giữa yêu cầu về nội phương. dung thông tin và quỹ thời gian, các điều kiện vật chất cần cho thu thập số liệu Khi điều tra, điều tra viên phải kết hợp được kiến thức chuyên môn về điều tra đã được hướng dẫn với tình hình thực tế ở địa bàn Nếu trong các cuộc điều tra thống kê phải thu thập quá nhiều chỉ điều tra, vừa phải giữ đúng nguyên tắc quy định cho điều tra, vừa phải tiêu có nội dung thông tin phức tạp, tốn nhiều thời gian để giải thích, có được những xử lý linh hoạt và hài hoà. Phần lớn những thắc mắc phỏng vấn và ghi chép; trong khi đó quỹ thời gian và kinh phí dành của đối tượng điều tra, điều tra viên phải tự mình tìm ra hướng giải cho công việc này lại không tương xứng, làm cho điều tra viên không đáp. Chỉ những trường hợp cần thiết mới ghi lại để xin ý kiến về cách đủ điều kiện để tiếp cận tìm hiểu tình hình thực tế, giải thích một cách xử lý của cấp chỉ đạo cao hơn. đầy đủ, cặn kẽ về mục đích, yêu cầu và nội dung điều tra cho người cung cấp thông tin thì có thể họ sẽ không khai báo, hoặc khai báo qua c. Sai số điều tra liên quan đến ý thức, tâm lý và khả năng hiểu loa, sai với thực tế. Đặc biệt có những loại thông tin phải hồi tưởng thì biết của người trả lời càng không đủ thời gian để nhớ lại Tất cả những điều đó làm cho số Ở đây việc trả lời câu hỏi có thể không tốt do ba nguyên nhân liệu thu thập được sai số nhiều, không phản ánh đúng thực tế khách thuộc người cung cấp thông tin như sau: quan. - Về ý thức của người trả lời: Nếu họ không có tinh thần trách Để nâng cao chất lượng số liệu thống kê, giảm sai số khi tổ chức nhiệm cao, cho là cung cấp thông tin thế nào cũng được, nói cho xong điều tra, phải cân đối giữa nhu cầu thu thập thông tin với khả năng về việc thì có thể khi điều tra, người cung cung cấp thông tin sẽ lấy lý do điều kiện kinh phí và quỹ thời gian dành cho điều tra. Không nên tổ này, lý do khác để không trả lời hoặc trả lời không hết, không đúng sự chức một cuộc điều tra đòi hỏi thu thập quá nhiều chỉ tiêu; đặc biệt thật. Không ít trường hợp người trả lời còn cố tình khai không đúng vì phải giới hạn những chỉ tiêu thu thập quá khó và tính toán phức tạp. lợi ích kinh tế và mục đích khác. Hơn nữa tuỳ thuộc vào đặc điểm và nội dung thông tin của các chỉ tiêu khác nhau, thuộc các đối tượng khác nhau để có cách tiếp cận thu thập - Về tâm lý, nhiều người cung cấp thông tin không muốn trả lời thông tin cho hợp lý. Có thể chỉ tiêu này cần thu thập từ những nội những câu hỏi liên quan đến đời tư, đến mức sống, đến sự bí mật kín dung chi tiết rồi tổng hợp chung lại, nhưng chỉ tiêu kia chỉ cần lấy số đáo của họ, của đơn vị họ. Ví dụ, khi điều tra thu thập thông tin mức liệu khái quát. Không nên cho rằng bất kỳ chỉ tiêu nào, nội dung thông thu nhập của hộ gia đình, phần lớn các chủ hộ nhất là những người có tin nào cũng phải lấy từ số liệu chi tiết mới là chính xác. thu nhập cao thường không muốn nói thật, nói hết mức thu nhập của 47 48
  25. mình. Một ví dụ khác một người phụ nữ đi nạo thai trong trường hợp tin. Việc kiểm tra này có thể phát hiện ra những trường hợp hiểu đúng giấu gia đình họ sẽ không muốn khai vì không muốn cho những người nhưng ghi chép sai như nhầm đơn vị tính: Cái ghi sai thành 1000 cái, thân trong gia đình biết đến. 1 đồng thành 1000 đồng; điền sai vị trí của thông tin Bằng kinh - Về nhận thức của người trả lời, nhiều người do nhận thức có nghiệm nghề nghiệp cũng như quan hệ logic tính toán giữa các câu hạn, không thấy rõ được mục đích, yêu cầu điều tra, không hiểu được hỏi, người kiểm tra có thể phát hiện được những loại sai sót kiểu này. nội dung câu trả lời do vậy họ không thể trả lời hoặc trả lời không Kiểm tra sơ bộ còn có thể phát hiện những trường hợp có "số liệu lạ" đúng với yêu cầu câu hỏi. (quá cao hoặc quá thấp so với mức bình quân chung). Những loại sai sót trên đây nhân viên kinh tế có thể tự sửa hoặc nếu trong những Qua đây cho thấy, để giảm bớt sai số điều tra, điều tra viên phải trường hợp cần thiết phải kiểm tra xác minh lại. Làm tốt khâu kiểm tra có cách tiếp cận hợp lý với từng loại đối tượng điều tra, ngoài kiến sơ bộ cũng là công việc góp phần quan trọng để giảm sai số điều tra. thức chuyên môn còn phải hiểu biết về xã hội, giải thích cho người Sau kiểm tra sơ bộ là công đoạn đánh mã và nhập tin. Số liệu ghi được phỏng vấn về mục đích, ý nghĩa, về nguyên tắc cung cấp và bảo đúng, ghi đầy đủ được kiểm tra kỹ lưỡng, nhưng nếu đánh mã sai, mật thông tin riêng, về trách nhiệm và quyền hạn của người cung cấp hoặc nhập tin sai thì cũng dẫn đến kết quả tổng hợp sai. thông tin, giải thích cho họ hiểu nội dung câu hỏi một cách thuận tiện nhất, gợi ý cho họ những cách trả lời để đi đến có được số liệu thật. Sai sót trong đánh mã có thể là lựa chọn mã không phù hợp với nội dung của thông tin (hoặc là do bảng mã không cụ thể, khó xác d. Sai số điều tra liên quan đến các phương tiện cân, đong, đo định, hoặc là khả năng liên hệ vận dụng mã của người đánh mã không lường tốt), đánh mã sai (mã này lẫn với mã kia) hoặc có mã đúng nhưng lộn Tất cả các khâu khác chuẩn bị tốt, nhưng nếu các loại phương tiện số (ví dụ 51 thành 15), v.v như cân, thước đo, dụng cụ đo huyết áp dùng cho các chỉ tiêu phải Để khắc phục sai sót trong khâu đánh mã, trước hết phải có bảng thực hiện kiểm tra, đo, đếm trực tiếp mà không được chuẩn bị tốt thì mã tốt, cụ thể, phù hợp với nội dung thông tin cần thu thập. Bên cạnh cũng sẽ sai sót dẫn đến sai số trong điều tra. Ví dụ, điều tra để xác những mã cụ thể cần có những mã chung để cho người đánh mã có cơ định mức độ suy dinh dưỡng của trẻ em. Nếu ta dùng loại cân không sở vận dụng cho những trường hợp thực tế xảy ra nhưng chưa có mã chuẩn thì sẽ cân không chính xác, dẫn đến số liệu tổng hợp về tỷ lệ trẻ trong danh mục mã cụ thể (gọi là các trường hợp khác). Mặt khác, em suy dinh dưỡng sẽ không đúng, hoặc là cao hơn, hoặc là thấp hơn người đánh mã phải được hướng dẫn đầy đủ về yêu cầu, nguyên tắc và thực tế. kỹ thuật đánh mã, khi thực hiện phải biết vận dụng và xử lý linh hoạt Như vậy, việc chuẩn bị tốt các phương tiện đo lường khi điều tra nhưng tuyệt đối không được tuỳ tiện, người đánh mã còn kết hợp chặt cũng là biện pháp cần thiết để giảm sai số điều tra. chẽ với các bộ phận khác trong cùng khâu tổng hợp, xử lý số liệu. Sau đánh mã là khâu nhập tin và khâu này cũng thường xuyên 1.2.3. Sai số liên quan đến quá trình xử lý thông tin xảy ra sai số. Loại sai sót này thường xảy ra trong các trường hợp sau: Sai số điều tra còn có thể xảy ra vì sai sót trong khâu đánh mã, Nhập tin đúp hoặc bỏ qua không nhập tin, nhập mã sai, ấn lộn số, nhập tin trong quá trình tổng hợp, xử lý số liệu. v.v Số liệu thu về phải được kiểm tra sơ bộ trước khi đánh mã, nhập 49 50
  26. Để khắc phục những sai sót khi nhập tin, trước hết phải lựa chọn những nhân viên nhập tin có khả năng nhập tốt, ít nhầm lẫn, có tinh PHẦN HAI thần trách nhiệm cao, tuân thủ nghiêm túc những quy trình và nguyên BIỂU HIỆN CÁC MỨC ĐỘ tắc nhập tin đã được hướng dẫn thống nhất. CỦA HIỆN TƯỢNG KINH TẾ - XÃ HỘI Trên góc độ công nghệ thông tin, phải có chương trình nhập hợp lý, khoa học, có được những lệnh cho phép tự kiểm tra để phát hiện những lỗi nhập tin. Nghiên cứu các mức độ của hiện tượng kinh tế - xã hội là yêu cầu Trong nhiều trường hợp phải phân công chéo để nhập tin hai lần quan trọng của việc tổng hợp, tính toán và phân tích thống kê nhằm rồi so sánh đối chiếu số liệu nhập để tìm ra những trường hợp không biểu hiện mặt lượng trong quan hệ mật thiết với mặt chất của hiện thống nhất thuộc về lỗi nhập tin. tượng nghiên cứu trong điều kiện thời gian và không gian cụ thể nhờ vào sự trợ giúp của các phương pháp thống kê. Đối với các cuộc điều tra thống kê thực tế hiện nay, những lỗi nhập tin ảnh hưởng đến sai số điều tra không phải là nhỏ. Tuy nhiên, Để biểu hiện các mức độ của hiện tượng trong thống kê dùng các sai số do lỗi nhập tin hoàn toàn có điều kiện để khắc phục tốt. số tuyệt đối (phản ánh quy mô), các số tương đối (phản ánh tốc độ, quan hệ tỷ lệ, cơ cấu, trình độ phổ biến), các số bình quân (phản ánh mức độ điển hình); toàn cự, phương sai, độ lệch chuẩn, hệ số biến thiên (phản ánh độ biến động của tiêu thức); đường cong Lorenz, hệ số GINI (phản ánh mức độ tập trung hay phân tán của phân phối), Dưới đây là nội dung, phương pháp tính và điều kiện vận dụng của các đại lượng đó. 2.1. SỐ TUYỆT ĐỐI (TRONG THỐNG KÊ) Số tuyệt đối là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng hoặc quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể. Số tuyệt đối trong thống kê bao gồm các con số phản ánh quy mô của tổng thể hay của từng bộ phận trong tổng thể (số doanh nghiệp, số nhân khẩu, số học sinh đi học, số lượng cán bộ khoa học, ) hoặc tổng các trị số theo một tiêu thức nào đó (tiền lương của công nhân, giá trị sản xuất công nghiệp, tổng sản phẩm trong nước (GDP), v.v ). Số tuyệt đối trong thống kê bao giờ cũng có đơn vị tính cụ thể. Đơn vị tính số tuyệt đối có thể là đơn vị hiện vật tự nhiên (cái, con, 51 52
  27. chiếc, kg, mét, v.v ), đơn vị hiện vật quy ước tức là đơn vị quy đổi Ví dụ: So với năm 2001, GDP năm 2002 của Việt Nam bằng 1, theo một tiêu chuẩn nào đó (nước mắm quy theo độ đạm; than quy 07 lần hoặc 107,0%; tỷ lệ dân số thành thị của cả nước năm 2002 là theo hàm lượng calo; xà phòng quy theo tỷ lệ chất béo; vải quy theo 25,1%, mật độ dân số của Việt Nam năm 2002 là 239 người /km2, mét độ dài tiêu chuẩn, ), đơn vị tiền tệ (đồng, nhân dân tệ, đô la Trong công tác thống kê, số tương đối được sử dụng rộng rãi để v.v ), đơn vị thời gian (giờ, ngày, tháng, năm) và đơn vị kép (tấn- phản ánh những đặc điểm về kết cấu, quan hệ tỷ lệ, trình độ phát triển, km, ngày -người, ). trình độ hoàn thành kế hoạch, trình độ phổ biến của hiện tượng kinh tế Số tuyệt đối dùng để đánh giá và phân tích thống kê, là căn cứ - xã hội được nghiên cứu trong điều kiện thời gian và không gian nhất không thể thiếu được trong việc xây dựng chiến lược phát triển kinh định. tế, tính toán các mặt cân đối, nghiên cứu các mối quan hệ kinh tế - xã Số tương đối phải được vận dụng kết hợp với số tuyệt đối. Số hội, là cơ sở để tính toán các chỉ tiêu tương đối và bình quân. tương đối thường là kết quả của việc so sánh giữa hai số tuyệt đối. Số Có hai loại số tuyệt đối: Số tuyệt đối thời kỳ và số tuyệt đối thời tương đối tính ra có thể rất khác nhau, tuỳ thuộc vào việc lựa chọn gốc điểm. so sánh. Có khi số tương đối có giá trị rất lớn nhưng ý nghĩa của nó Số tuyệt đối thời kỳ: Phản ánh quy mô, khối lượng của hiện tượng không đáng kể vì trị số tuyệt đối tương ứng của nó lại rất nhỏ. Ngược trong một thời kỳ nhất định. Ví dụ: Giá trị sản xuất công nghiệp trong lại, có số tương đối tính ra khá nhỏ nhưng lại mang ý nghĩa quan trọng 1 tháng, quý hoặc năm. Sản lượng lương thực năm 2002, năm 2003, vì trị số tuyệt đối tương ứng của nó có quy mô đáng kể. Ví dụ: 1% dân năm 2004, số Việt Nam tăng lên trong những năm 1960 đồng nghĩa với dân số Số tuyệt đối thời điểm: Phản ánh quy mô, khối lượng của hiện tăng thêm 300 nghìn người, nhưng 1% dân số tăng lên trong những tượng ở một thời điểm nhất định như: dân số của một địa phương nào năm 2000 lại đồng nghĩa với dân số tăng thêm 800 nghìn người. đó có đến 0 giờ ngày 01/04/1999; giá trị tài sản cố định có đến Căn cứ vào nội dung mà số tương đối phản ánh, có thể phân biệt: 31/12/2003; lao động làm việc của doanh nghiệp vào thời điểm số tương đối động thái, số tương đối kế hoạch, số tương đối kết cấu, 1/7/2004, số tương đối cường độ, và số tương đối không gian. 2.2. SỐ TƯƠNG ĐỐI (TRONG THỐNG KÊ) 2.2.1. Số tương đối động thái Số tương đối là chỉ tiêu biểu hiện quan hệ so sánh giữa hai chỉ Số tương đối động thái là chỉ tiêu phản ánh biến động theo thời gian về mức độ của chỉ tiêu kinh tế - xã hội. Số tương đối này tính tiêu thống kê cùng loại nhưng khác nhau về thời gian hoặc không được bằng cách so sánh hai mức độ của chỉ tiêu được nghiên cứu ở hai gian, hoặc giữa hai chỉ tiêu khác loại nhưng có quan hệ với nhau. thời gian khác nhau. Mức độ của thời kỳ được tiến hành nghiên cứu Trong hai chỉ tiêu để so sánh của số tương đối, sẽ có một số được thường gọi là mức độ của kỳ báo cáo, còn mức độ của một thời kỳ nào chọn làm gốc (chuẩn) để so sánh. đó được dùng làm cơ sở so sánh thường gọi là mức độ kỳ gốc. Ví dụ: Số tương đối có thể được biểu hiện bằng số lần, số phần trăm So với năm 2001, GDP năm 2002 của Việt Nam bằng 1, 07 lần hoặc 2 (%)hoặc phần nghìn h (‰),hay bằng các đơn vị kép h (người /km , 107,0%. người /1000 người; đồng /1000đồng, ). 53 54
  28. 2.2.2. Số tương đối so sánh Số tương đối cường độ là chỉ tiêu biểu hiện trình độ phổ biến của một hiện tượng trong các điều kiện thời gian và không gian cụ thể. Số tương đối so sánh là chỉ tiêu phản ánh quan hệ so sánh giữa hai bộ phận trong một tổng thể, hoặc giữa hai hiện tượng cùng loại Số tương đối cường độ tính được bằng cách so sánh mức độ của nhưng khác nhau về điều kiện không gian. Ví dụ: Dân số thành thị so hai chỉ tiêu khác nhau nhưng có quan hệ với nhau. Số tương đối với dân số nông thôn, dân số là nam so với dân số là nữ; giá trị tăng cường độ biểu hiện bằng đơn vị kép, do đơn vị tính ở tử số và ở mẫu thêm của doanh nghiệp ngoài quốc doanh so với giá trị tăng thêm của số hợp thành. Số tương đối cường độ được tính toán và sử dụng rất doanh nghiệp quốc doanh; năng suất lúa của tỉnh X so với năng suất phổ biến trong công tác thống kê. Các số tương đối trong số liệu lúa của tỉnh Y; số học sinh đạt kết quả học tập khá giỏi so với số học thống kê thường gặp như mật độ dân số bằng tổng số dân (người) 2 2 sinh đạt kết quả trung bình, chia cho diện tích tự nhiên (km ) với đơn vị tính là người /km ; GDP bình quân đầu người bằng tổng GDP (nghìn đồng) chia cho 2.2.3. Số tương đối kế hoạch dân số trung bình (người) với đơn vị tính là 1000đ/người; số bác sĩ Số tương đối kế hoạch là chỉ tiêu phản ánh mức cần đạt tới trong tính bình quân cho một vạn dân bằng tổng số bác sĩ chia cho tổng số kỳ kế hoạch, hoặc mức đã đạt được so với kế hoạch được giao về một dân tính bằng vạn người với đơn vị tính là người /10000 người, chỉ tiêu kinh tế - xã hội nào đó. Số tương đối kế hoạch được chia 2.3. SỐ BÌNH QUÂN (TRONG THỐNG KÊ) thành hai loại: + Số tương đối nhiệm vụ kế hoạch: Phản ánh quan hệ so sánh Số bình quân là chỉ tiêu biểu hiện mức độ điển hình của một tổng giữa mức độ đề ra trong kỳ kế hoạch với mức độ thực tế ở kỳ gốc của thể gồm nhiều đơn vị cùng loại được xác định theo một tiêu thức nào một chỉ tiêu kinh tế - xã hội. đó. Số bình quân được sử dụng phổ biến trong thống kê để nêu lên đặc điểm chung nhất, phổ biến nhất của hiện tượng kinh tế - xã hội trong + Số tương đối hoàn thành kế hoạch: Phản ánh quan hệ so sánh các điều kiện thời gian và không gian cụ thể. Ví dụ: Tiền lương bình giữa mức thực tế đã đạt được với mức kế hoạch trong kỳ về một chỉ quân một công nhân trong doanh nghiệp là mức lương phổ biến nhất, tiêu kinh tế - xã hội. đại diện cho các mức lương khác nhau của công nhân trong doanh 2.2.4. Số tương đối kết cấu nghiệp; thu nhập bình quân đầu người của một địa bàn là mức thu Số tương đối kết cấu là chỉ tiêu phản ánh tỷ trọng của mỗi bộ nhập phổ biến nhất, đại diện cho các mức thu nhập khác nhau của mọi phận chiếm trong tổng thể, tính được bằng cách đem so sánh mức độ người trong địa bàn đó. tuyệt đối của từng bộ phận với mức độ tuyệt đối của toàn bộ tổng thể. Số bình quân còn dùng để so sánh đặc điểm của những hiện Số tương đối kết cấu thường được biểu hiện bằng số phần trăm. tượng không có cùng một quy mô hay làm căn cứ để đánh giá trình độ Ví dụ: Tỷ trọng của GDP theo từng ngành trong tổng GDP của nền đồng đều của các đơn vị tổng thể. kinh tế quốc dân; tỷ trọng dân số của từng giới nam hoặc nữ trong Xét theo vai trò đóng góp khác nhau của các thành phần tham gia tổng số dân, bình quân hoá, số bình quân chung được chia thành số bình quân giản đơn và số bình quân gia quyền. 2.2.5. Số tương đối cường độ 55 56
  29. + Số bình quân giản đơn: Được tính trên cơ sở các thành phần 2500 nghìn đồng, 3000 nghìn đồng, 3000 nghìn đồng và tham gia bình quân hoá có vai trò về qui mô (tần số) đóng góp như 3500 nghìn đồng. nhau. Năng suất bình quân của 5 công nhân là: + Số bình quân gia quyền: Được tính trên cơ sở các thành phần 2000 + 2500 + 3000 + 3000 + 3500 tham gia bình quân hoá có vai trò về qui mô (tần số) đóng góp khác xs = = 2800 (nghìn đồng) 5 nhau. Để tính được số bình quân chính xác và có ý nghĩa, điều kiện chủ b. Số bình quân số học gia quyền yếu là nó phải được tính cho những đơn vị cùng chung một tính chất k (thường gọi là tổng thể đồng chất). Muốn vậy, phải dựa trên cơ sở ∑ xifi x = i=1 ; (2.3.1b) phân tổ thống kê một cách khoa học và chính xác. Đồng thời phải vận s k dụng kết hợp giữa số bình quân tổ với số bình quân chung. ∑fi i=1 Có nhiều loại số bình quân khác nhau. Trong thống kê kinh tế - Trong đó: f - Quyền số của lượng biến x (số đơn vị tổng thể có lượng xã hội thường dùng các loại sau: Số bình quân số học, số bình quân i i k điều hoà, số bình quân hình học (số bình quân nhân), mốt và trung vị. biến xi) ( ∑ fi = n ). Dưới đây là từng loại số bình quân nêu trên. i=1 Ví dụ: Một tổ học sinh có 10 học sinh, với kết quả học môn toán 2.3.1. Số bình quân số học của các em như sau: Điểm 7 có 3 em; điểm 8 có Số bình quân số học được tính bằng cách chia tổng các lượng 5 em và điểm 9 có 2 em. Vậy điểm môn toán bình quân của 10 em học biến (theo một tiêu thức nào đó) cho số đơn vị tổng thể. sinh như sau: (7 × 3) + (8 × 5) + (9 × 2) Công thức: x = = 7,9 (điểm) s 10 a. Số bình quân số học giản đơn 2.3.2. Số bình quân điều hoà n ∑ xi 1 i=1 Số bình quân tính được từ nghịch đảo của các lượng biến ( ). xs = ; (2.3.1a) x n i Công thức: Trong đó: xs - Số bình quân số học; xi (i = 1, 2, , n) - Các trị số của lượng biến; a. Số bình quân điều hoà giản đơn n n - Số đơn vị tổng thể. x = ; (2.3.2a) h n 1 Ví dụ: Một tổ có 5 công nhân, năng suất lao động của từng công ∑ nhân từ 1 đến 5 như sau: 2000 nghìn đồng, i=1 xi 57 58
  30. Trong đó: xưởng là: x - Số bình quân điều hoà; 220 + 264 + 312 796 h x = = = 12,06 (sản phẩm) h 220 264 312 66 xi (i =1,2,3, ,n) - Các lượng biến; + + 11 12 13 n - Số đơn vị tổng thể (số lượng biến). Ví dụ: Một tổ sản xuất có 5 công nhân (n = 5) cùng sản xuất một 2.3.3. Số bình quân nhân loại sản phẩm và cùng làm việc trong một thời gian như nhau. Người Số bình quân nhân tính được bằng cách khai căn bậc n của tích n công nhân thứ nhất sản xuất một sản phẩm hết 2 phút, người thứ hai lượng biến. sản xuất một sản phẩm hết Công thức: 3 phút, người thứ ba sản xuất một sản phẩm hết 4 phút, người thứ tư sản xuất 1 sản phẩm hết 5 phút và người thứ năm sản xuất một sản phẩm a. Số bình quân nhân giản đơn hết 6 phút. Thời gian hao phí bình quân ( x h ) để sản xuất một sản n phẩm của 5 công nhân bằng: n xΠ = ∏ x i ; (2.3.3a) n 5 i=1 x = = = 3,45 (phút/sản phẩm) h n 1 1 1 1 1 1 Trong đó: ∑ + + + + i=1 xi 2 3 4 5 6 xΠ - Số bình quân nhân; b. Số bình quân điều hoà gia quyền xi ( i = 1,2, , n) - Các lượng biến; k k n - Số lượng biến; ∑ Mi ∑ Mi Π - Ký hiệu của tích. x = i=1 = i=1 h k k ; (2.3.2b) Ví dụ: Tốc độ phát triển sản xuất của tỉnh "X" từ năm 1998 đến 1 Mi ∑ ∑ năm 2002 như sau: 1,775; 1,289; 1,322; 1,307; 1,222. i=1 Mi i=1 xi Tốc độ phát triển bình quân năm ( xΠ ) của tỉnh "X" từ năm 1998 Trong đó: đến 2002 là: Mi - Quyền số (Mi = xifi với i = 1, 2, ,k). x = 5 1,775.1,289.1,322.1,307.1,222 = 1, 367 hoặc 136,7% Ví dụ: Một phân xưởng sản xuất có 3 tổ công nhân. Tổ 1 sản xuất Π được 220 sản phẩm (M1) và năng suất lao động mỗi công nhân là 11 b. Số bình quân nhân gia quyền sản phẩm (x1); tổ 2 sản xuất được 264 sản phẩm (M2) với năng suất k f k lao động mỗi công nhân là 12 sản phẩm (x ) và tổ 3 sản xuất được 312 ∑ i f 2 i=1 i xΠ = ∏ xi ; (2.3.3b) sản phẩm (M3) với năng suất lao động mỗi công nhân 13 sản phẩm i=1 (x3). Vậy năng suất lao động bình quân mỗi công nhân trong phân 59 60
  31. k f − f M0 M0 −1 Trong đó: fi - Quyền số với fi = n. M = x + i ; (2.3.4a) ∑ 0 M0(min) M0 i=1 (f − f ) + (f − f ) M0 M0 −1 M0 M0 +1 k Ví dụ: Trong thời gian 10 năm ( ∑ fi = 10) tốc độ phát triển sản Trong đó: i=1 xuất của một tỉnh "X" như sau: 5 năm đầu, mỗi năm có tốc độ phát M0 - Mốt; triển là 1,1; trong 3 năm tiếp theo, mỗi năm có tốc độ phát triển là x - Giới hạn dưới của tổ có mốt; M0(min) 1,15; 2 năm cuối cùng, mỗi năm có tốc độ phát triển là 1, 25. Vậy tốc i - Trị số khoảng cách tổ có mốt; độ phát triển bình quân ( x ) của tỉnh "X" mỗi năm thời kỳ 10 năm M0 Π f - Tần số của tổ đứng trước tổ có mốt; chính là số bình quân nhân gia quyền được tính như sau: M0 −1 f - Tần số tổ có mốt; M0 x = 10 (1,1)5 .(1,15)3 .(1,25)2 = 1, 144 hoặc 114,4% Π f - Tần số của tổ đứng sau tổ có mốt. M0 +1 Số bình quân nhân được áp dụng trong trường hợp các lượng biến Ví dụ: Có tình hình về tiền lương bình quân một tháng của công có quan hệ tích số với nhau và thường được dùng để tính tốc độ phát nhân trong một doanh nghiệp như bảng 2.3.1: triển bình quân trong thực tế công tác thống kê. 2.3.4. Mốt Bảng 2.3.1: Lương của công nhân trong doanh nghiệp Mốt là biểu hiện của một tiêu thức số lượng được gặp nhiều nhất Thứ tự Mức lương Số công nhân Thứ tự Mức lương Số công nhân trong một tổng thể hay trong một dãy số phân phối. Trong dãy số tổ (1000 đ) (Người) tổ (1000 đ) (Người) lượng biến xác định, mốt là lượng biến có tần số lớn nhất. Mốt dùng A 1 2 A 1 2 để biểu hiện mức độ phổ biến của hiện tượng. Ví dụ: Trong số lượng áo sơ mi các cỡ bán ra của một cửa hàng, số lượng áo cỡ 40 bán được 1 400 - 500 20 4 700 - 800 160 nhiều nhất thì mốt chính là loại áo sơ mi cỡ 40. Một số ví dụ khác 2 500 - 600 60 5 800 - 900 60 trong địa bàn điều tra về thu nhập của các hộ gia đình, số hộ có mức 3 600 - 700 90 6 900 - 1000 10 thu nhập 3 triệu đồng một tháng là nhiều nhất, thì mức thu nhập 3 triệu đồng chính là mốt; trong một doanh nghiệp số công nhân có mức Từ số liệu bảng 2.3.1, ta thấy tổ thứ tư (i = 4) là tổ có mốt (f4 = năng suất lao động 5 triệu đồng một tháng là nhiều nhất, thì mức năng 160) và khi đó giới hạn dưới x M = 700, khoảng cách của tổ có suất lao động 5 triệu đồng chính là mốt, 0(min) mốt: i M = 800 –700 = 100, tần số của tổ đứng trước tổ có mốt Trong một dãy số lượng biến có khoảng cách tổ muốn tìm mốt, 0 f = 90 và tần số của tổ đứng sau tổ có mốt f = 60. Áp dụng trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất, sau đó M0 −1 M0 +1 tính trị số gần đúng của mốt theo công thức sau: công thức 2.3.4a tính được mốt, hay mức lương phổ biến nhất của doanh nghiệp như sau: 61 62
  32. 160 −90 của số quan sát ở vị trí chính giữa. Khi đó dãy số lượng biến được M0 = 700 +100. = 741,2 (nghìn đồng) ()()160 −90 + 160 −60 chia thành hai phần (phần trên và phần dưới số trung vị) và mỗi phần có số đơn vị tổng thể bằng nhau. Ví dụ: Tiền lương của 9 công nhân Ghi chú: Trường hợp khoảng cách tổ không bằng nhau việc xác được sắp xếp theo thứ tự mức lương tăng dần: 500, 520, 550, 570, định mốt phải căn cứ vào mật độ phân phối. 580, 600, 630, 640, 650 (nghìn đồng) thì số trung vị chính là tiền Trong một dãy số lượng biến không có khoảng cách tổ thì mốt lương của công nhân đứng ở vị trí thứ 5 (giữa của 9 người), tức là có (M0 ) là lượng biến có tần số lớn nhất. mức lương 580 nghìn đồng. Mốt biểu hiện mức độ phổ biến của hiện tượng, đồng thời bản + Nếu tổng thể có số quan sát là chẵn thì trung vị sẽ là số bình thân nó không san bằng, bù trừ chênh lệch giữa các lượng biến, cho quân giản đơn của 2 quan sát ở vị trí giữa. Ví dụ nên có thể dùng để thay thế số bình quân trong những trường hợp cần tiền lương của 12 công nhân được sắp xếp theo thứ tự mức lương tăng thiết, nhất là khi dãy số có những lượng biến quá lớn hoặc quá nhỏ. dần: 600, 610, 615, 630, 650, 655, 665, 680, 690, 695, 700, 720 (nghìn Tuy nhiên, như vậy mốt sẽ có nhược điểm là kém nhạy bén đối với sự đồng) thì số trung vị sẽ là số bình quân giản đơn của 2 người đứng ở biến thiên của mỗi tiêu thức. vị trí thứ 6 và thứ 7, tức là (655+665) : 2 = 660 (nghìn đồng). Mốt chỉ vận dụng đối với tổng thể tương đối nhiều đơn vị, không Trong một dãy số lượng biến có khoảng cách tổ, muốn tìm số nên vận dụng trong trường hợp phân phối có quá nhiều điểm tập trung trung vị trước hết cần xác định tổ có số trung vị (tổ có chứa đơn vị hoặc không có điểm chính tập trung các đơn vị. đứng ở vị trí giữa). Sau đó tính trị số gần đúng của số trung vị theo Mốt còn được dùng để khảo sát tính chất đều đặn của dãy số phân công thức: phối và chỉ tiêu đánh giá tính chất đều đặn của dãy số phân phối gọi là f hệ số đối ứng (K ), tính theo công thức: ∑ i A − S(Me−1) M = x + i 2 ; (2.3.5) x − M e Me(min) Me K = 0 ; (2.3.4b) fMe A σ Trong đó: Trong đó: M - Số trung vị; x - Số bình quân số học; e x - Giới hạn dưới của tổ có số trung vị; σ - Độ lệch tiêu chuẩn (nội dung và công thức tính độ lệch tiêu Me(min) chuẩn sẽ được giải thích sau). iMe - Trị số của khoảng cách tổ của tổ có số trung vị; 2.3.5. Số trung vị ∑fi - Tổng các tần số (Số đơn vị tổng thể) trong dãy số; Số trung vị là lượng biến của một tiêu thức nào đó đứng ở vị trí S(Me−1) - Tổng các tần số của các tổ đứng trước tổ có số trung vị; giữa trong dãy số lượng biến. fMe - Tần số của tổ có số trung vị. + Nếu tổng thể có số quan sát là lẻ thì trung vị sẽ chính là trị số Trở lại ví dụ trên (xem số liệu bảng 2.3.1) ta thấy tổ có chứa đơn 63 64
  33. vị đứng giữa là tổ 4 (i = 4) và khi đó giới hạn dưới của tổ có số trung Khoảng biến thiên (còn gọi là toàn cự) là chỉ tiêu được tính bằng vị: xMe(min) = 700, trị số khoảng cách tổ của tổ có trung vị: iMe = 800 hiệu số giữa lượng biến lớn nhất và lượng biến nhỏ nhất của một dãy số lượng biến. Khoảng biến thiên càng lớn, mức độ biến động của chỉ – 700 = 100, tổng các tần số trong dãy số ∑fi = 400, tổng các tần số tiêu càng lớn. Ngược lại, khoảng biến thiên nhỏ, mức độ biến động của các tổ đứng trước tổ có trung vị: S(Me−1) = 170, tần số của tổ có của chỉ tiêu thấp, tức là mức độ đồng đều của chỉ tiêu cao. trung vị: fMe = 160. Áp dụng công thức 2.3.5 ta tính được số trung vị: Công thức: 400 −170 R = Xmax – Xmin ; (2.4.1) M =700 + 100 2 =718,8 (nghìn đồng) e 160 Trong đó: Số trung vị có thể dùng để bổ sung hoặc thay thế cho số bình R - Toàn cự; quân số học khi không biết chính xác toàn bộ các lượng biến; chỉ cần Xmax - Lượng biến có trị số lớn nhất; đảm bảo được sự phân phối của các đơn vị theo thứ tự tăng dần của Xmin - Lượng biến có trị số nhỏ nhất. lượng biến là có thể tính được số trung vị. Ví dụ: Thu nhập của hộ gia đình như bảng 2.4.1: 2.4. ĐỘ BIẾN THIÊN CỦA TIÊU THỨC Bảng 2.4.1: Thu nhập của hộ gia đình Độ biến thiên của tiêu thức dùng để đánh giá mức độ đại diện của số bình quân đối với tổng thể được nghiên cứu. Trị số này tính ra càng Hộ 1 2 3 4 5 6 7 8 lớn, độ biến thiên của tiêu thức càng lớn do đó mức độ đại diện của số Thu nhập bình quân đối với tổng thể càng thấp và ngược lại. (1000 đồng) 6000 7000 85000 86000 9000 9100 9500 10000 Quan sát độ biến thiên tiêu thức trong dãy số lượng biến sẽ thấy nhiều đặc trưng về phân phối, kết cấu, tính đồng đều của tổng thể. Từ số liệu bảng 2.4.1 sử dụng công thức 2.4.1 ta tính được Độ biến thiên của tiêu thức được sử dụng nhiều trong nghiên cứu khoảng biến thiên: thống kê như phân tích biến thiên cũng như mối liên hệ của hiện R = 10000 – 6000 = 4000 (nghìn đồng) tượng, dự đoán thống kê, điều tra chọn mẫu, Khoảng biến thiên phản ánh khoảng cách biến động của tiêu thức Khi nghiên cứu độ biến thiên của tiêu thức, thống kê thường dùng tuy tính toán đơn giản song phụ thuộc vào lượng biến lớn nhất và nhỏ các chỉ tiêu như khoảng biến thiên, độ lệch tuyệt đối bình quân, nhất của tiêu thức, tức là không tính gì đến mức độ khác nhau của các phương sai, độ lệch tiêu chuẩn và hệ số biến thiên. Dưới đây là nội lượng biến còn lại trong dãy số. dung và phương pháp tính của các chỉ tiêu đó. 2.4.2. Độ lệch tuyệt đối bình quân 2.4.1. Khoảng biến thiên Độ lệch tuyệt đối bình quân là số bình quân số học của các độ 65 66
  34. lệch tuyệt đối giữa các lượng biến với số bình quân số học của các /người) /người) người) lượng biến đó. A 1 2 A 1 2 Công thức: 1 10 10 4 25 10 ∑ xi − x Trường hợp tính giản đơn d = ; (2.4.2a) 2 15 20 5 35 10 n 3 20 50 ∑ xi − x fi Trường hợp có quyền số d = ; (2.4.2b) Từ số liệu bảng 2.4.2 sử dụng công thức 2.3.1b và 2.4.2b ta tính ∑ fi được: Trong đó: a. Số bình quân d - Độ lệch tuyệt đối bình quân; (10.10) + (15.20) + (20.50) + (25.10) + (35.10) x (i = 1,2,3, , n nếu tính giản đơn; i = 1,2 , k nếu tính gia x = = 20 i 10 + 20 + 50 + 10 + 10 quyền) - Các trị số của lượng biến; x - Số bình quân số học; b. Độ lệch tuyệt đối bình quân fi - Quyền số của từng lượng biến xi; 10 − 2010 + 15 − 20 20 + 20 − 2050 + 25 − 2010 + 35 − 2010 d = k 10 + 20 + 50 + 10 + 10 n - Tổng số lượng biến (n = ∑fi ). i=1 400 = = 4 Chỉ tiêu này biểu hiện độ biến thiên của tiêu thức nghiên cứu một 100 cách đầy đủ hơn khoảng biến thiên. Qua đó phản ánh rõ nét hơn tính chất đồng đều của tổng thể: vì nó tính đến độ lệch của tất cả các lượng 2.4.3. Phương sai biến. Về cách tính cũng tương đối đơn giản, nhưng có đặc điểm là Phương sai là số bình quân số học của bình phương các độ lệch phải lấy giá trị tuyệt đối (giá trị dương) của chênh lệch. giữa các lượng biến với số bình quân số học của các lượng biến đó. Ví dụ: Có số liệu về năng suất lao động năm của công nhân trong Công thức: một doanh nghiệp như bảng 2.4.2: 2 (x − x) Trường hợp tính giản đơn σ2 = ∑ i ; (2.4.3a) n Bảng 2.4.2: Năng suất lao động của công nhân (x − x)2 f trong doanh nghiệp Trường hợp có quyền số σ2 = ∑ i i ; (2.4.3b) ∑ fi Số Năng suất Năng suất Số Trong đó: STT lao động năm công nhân STT lao động năm công nhân 2 (Triệu đồng (Nghìn người) (Triệu đồng (Nghìn σ - Phương sai; 67 68
  35. xi - (i=1,2, , n trường hợp giản đơn và i = 1,2, , k trường hợp có trong mối quan hệ với số trung bình. Theo định lý của Chebyshev: quyền số) - Các trị số của lượng biến; - Bất kỳ sự sắp xếp nào cũng có ít nhất 75% giá trị sẽ rơi vào x - Số bình quân số học; trong khoảng cộng trừ hai lần độ lệch chuẩn (±2σ) từ số trung bình và fi - Quyền số của từng lượng biến xi; có ít nhất 89% giá trị sẽ nằm trong khoảng cộng trừ 3 lần độ lệch chuẩn (±3σ) từ số trung bình. n - Tổng số lượng biến (n = ∑fi) Cũng từ số liệu về năng suất lao động của công nhân một doanh - Đối với phân bố chuẩn sẽ có khoảng 68% giá trị của tổng thể nghiệp trong bảng 2.4.2 ở trên áp dụng công thức 2.4.3b ta tính được chung rơi vào trong khoảng tin cậy độ lệch chuẩn (±σ)từ số trung phương sai (trường hợp có quyền số): bìnht, 95% giá trị sẽ rơi vào trong khoảng tin cậy hai lần độ lệch chuẩn (±2σ) từ số trung bình và 99% giá trị nằm trong khoảng tin cậy 2 2 2 2 2 (10−20) .10+(15−20) .20+(20−20) .50+(25−20) .10+(35−20) .10 ba lần độ lệch chuẩn (±3σ) từ số trung bình (xem hình vẽ 2.4.1). σ2 = 10 + 20 + 50 + 10 + 10 Hình 2.4.1: Đường biểu diễn phân phối chuẩn 1000 + 500 + 250 + 2250 4000 = = = 40 100 100 2.4.4. Độ lệch chuẩn Độ lệch chuẩn là căn bậc 2 của phương sai cho biết bình quân giá trị của các lượng biến cách giá trị trung bình chung là bao nhiêu đơn vị. Công thức tính: (x − x)2 x - 3σ x - 2σ x - σ x x + σ x + 2σ x + 3σ Trường hợp giản đơn σ = σ2 = ∑ i ; (2.4.4a) n 68% Trường hợp có quyền số Độ lệch chuẩn là một trong95% những chỉ tiêu thường dùng nhất để biểu hiện độ biến thiên của tiêu99% thức được nghiên cứu và đánh giá 2 (x − x) f trình độ đồng đều của tổng thể được nghiên cứu. σ = σ2 = ∑ i i ; (2.4.4b) ∑fi Độ lệch chuẩn có nhiều ứng dụng quan trọng trong các quá trình tính toán và phân tích thống kê như: Xác định số mẫu cần chọn trong Theo ví dụ về phương sai tính được ở trên: ( σ2 =40 ) thì độ lệch điều tra chọn mẫu, tính hệ số tương quan hoặc tỷ số tương quan, tính chuẩn σ = 40 = 6,32 (triệu đồng). hệ số biến thiên, v.v Độ lệch chuẩn cho phép ta xác định vị trí phân bố của dãy số Vì độ lệch chuẩn là căn bậc 2 của phương sai, nên khi nói đến vai 69 70
  36. trò của độ lệch chuẩn thì cũng chính là nói đến vai trò của phương sai. nhưng hệ số biến thiên tính theo độ lệch chuẩn thường được sử dụng Hay nói cách khác muốn có độ lệch chuẩn nhất thiết phải có phương rộng rãi hơn, tuy phần tính toán có phức tạp hơn phải sử dụng MTĐT. sai. Hệ số biến thiên tính theo độ lệch tuyệt đối bình quân có công 2.4.5. Hệ số biến thiên thức tính: d Hệ số biến thiên là chỉ tiêu tương đối phản ánh mối quan hệ so V = ; (2.4.5b) sánh giữa độ lệch chuẩn với số bình quân số học. x Công thức: Trong đó: d - Độ lệch tuyệt đối bình quân. σ V = ; (2.4.5a) x 2.5. MỨC ĐỒNG ĐỀU CỦA PHÂN PHỐI Trong đó: Để xác định mức độ biến thiên đồng đều hoặc bất bình đẳng của V - Hệ số biến thiên; phân phối có thể dùng nhiều phương pháp, nhưng trong thống kê σ - Độ lệch chuẩn; thường sử dụng đường cong Lorenz và hệ số GINI. x - Số bình quân số học. 2.5.1. Đường cong Lorenz Ví dụ: Khi độ lệch chuẩn σ = 6,32; số bình quân số học x = 20 thì 6,32 Đó là một loại đồ thị dùng để biểu diễn mức độ thiếu đồng đều sẽ có hệ số biến thiên là: V = = 0,316 hoặc 31,6%. 20 hoặc bất bình đẳng của phân phối. Ví dụ, nghiên cứu phân phối thu Hệ số biến thiên cũng dùng để đánh giá độ biến thiên của tiêu nhập của dân cư, đường cong Lorenz biểu thị quan hệ giữa tỷ lệ phần thức và tính chất đồng đều của tổng thể. Hệ số này biểu hiện bằng số trăm số dân cư và tỷ lệ phần trăm thu nhập của các nhóm dân cư đó. tương đối nên còn có thể được dùng để so sánh cả những chỉ tiêu cùng Nghiên cứu phân bố về dân số, đường cong Lorenz biểu thị quan hệ loại nhưng ở các quy mô khác nhau như so sánh độ đồng đều về thu giữa phần trăm diện tích tự nhiên của từng địa phương với phần trăm nhập bình quân của hộ gia đình ở một tỉnh miền núi (có thu nhập thấp của dân số của các địa phương đó. Khi nghiên cứu phân phối thu nhập và số hộ ít hơn) với thu nhập bình quân của hộ gia đình ở thủ đô Hà của dân cư, trên đồ thị, trục hoành biểu thị tỷ lệ phần trăm cộng dồn Nội (có mức thu nhập cao hơn và số hộ nhiều hơn), đặc biệt để so của số dân cư từ 0% đến 100% được sắp xếp theo thứ tự nhóm dân cư sánh được những chỉ tiêu của các hiện tượng khác nhau và có đơn vị có thu nhập tăng dần và trục tung biểu thị tỷ lệ phần trăm cộng dồn đo lường khác nhau như so sánh hệ số biến thiên về bậc thợ với hệ số thu nhập của các nhóm dân cư từ 0% đến 100%. biến thiên về tiền lương bình quân, hệ số biến thiên về năng suất lao Vì các nhóm dân cư được sắp xếp theo thứ tự từ nhóm có thu động bình quân, so sánh hệ số biến thiên về chỉ tiêu thu nhập của hộ nhập thấp nhất đến nhóm có thu nhập cao nhất nên tỷ lệ phần trăm gia đình với hệ số biến thiên về chi tiêu của hộ gia đình, cộng dồn số dân của các nhóm dân cư luôn luôn lớn hơn phần trăm Hệ số biến thiên còn có thể tính theo độ lệch tuyệt đối bình quân, cộng dồn thu nhập tương ứng của nhóm, do vậy đường cong Lorenz 71 72
  37. luôn nằm dưới đường nghiêng 450 và có mặt lõm hướng lên trên (xem 100 hình vẽ theo ví dụ). Đường cong Lorenz càng lõm (diện tích hình A §−êng cong Lorenz vïng 1 80 N càng lớn) thì sự bất bình đẳng càng cao và ngược lại. Nếu tất cả các §−êng cong Lorenz vïng 2 nhóm dân cư có mức thu nhập giống nhau, khi đó đường cong Lorenz 0 sẽ trùng với đường nghiêng 45 và được gọi là đường bình đẳng tuyệt o 60 45 đối. g iªn gh n Ví dụ: Có số liệu về thu nhập của các tầng lớn dân cư của 2 vùng ng A −ê nước ta trong cùng một thời kỳ như bảng 2.5.1: 40 § Bảng 2.5.1: Thu nhập của dân cư trong 2 vùng 20 B Phần trăm cộng Phần trăm dân số Phần trăm thu nhập Phần trăm dồn của thu nhập theo mức giàu, cộng dồn 0 M nghèo của dân số 0 20 40 60 80 100 Vùng 1 Vùng 2 Vùng 1 Vùng 2 20% nghèo nhất 7 6 20 7 6 Hai đường cong trên cho ta một nhận biết về sự bất bình đẳng theo thu nhập của dân cư: Vùng 1 có mức độ chênh lệch nhỏ hơn vùng 20% dưới trung 12 10 40 19 16 2 vì khoảng cách từ đường nghiêng 45o tới đường cong Lorenz 1 gần bình hơn khoảng cách tới đường cong Lorenz 2. 20% trung bình 18 17 60 37 33 Đường cong Lorenz không chỉ giúp ta so sánh sự biến động giữa các vùng mà còn giúp ta so sánh sự biến động theo thời gian. Muốn 20% khá 25 26 80 62 59 vậy, người ta vẽ các đường cong Lorenz của các năm khác nhau trong 20% giàu 38 41 100 100 100 cùng một vùng trên cùng một hệ trục toạ độ. 2.5.2. Hệ số GINI Biểu diễn mức độ chênh lệch về thu nhập của 2 vùng trên cùng một hệ toạ độ như sơ đồ 2.5.1: Hệ số GINI là số đo về sự bất bình đẳng của phân phối (thường là phân phối thu nhập của dân cư), được biểu hiện bằng tỷ lệ so sánh Sơ đồ 2.5.1: Đường cong Lorenz của hai vùng giữa phần diện tích giới hạn bởi đường nghiêng 45o và đường cong Lorenz với toàn bộ diện tích tam giác OMN. Nếu gọi A là phần diện tích giới hạn bởi đường nghiêng 45o (ON) với đường cong Lorenz và 73 74
  38. B là diện tích còn lại của tam giác OMN thì ta có hệ số GINI (G): A G = ; (2.5.1a) A + B Nếu đường cong Lorenz trùng với đường thẳng 45o (đường bình đẳng tuyệt đối) thì hệ số GINI bằng 0 (vì A = 0), xã hội có sự phân phối bình đẳng tuyệt đối. Nếu đường cong Lorenz trùng với trục hoành, hệ số GINI bằng 1 (vì B = 0), xã hội có sự phân phối bất bình đẳng tuyệt đối. Như vậy 0 ≤ G ≤ 1. Khi nghiên cứu về sự bất bình đẳng về thu nhập của dân cư, khi có số liệu về thu nhập và số người tương ứng chia theo các nhóm dân cư có mức thu nhập khác nhau, công thức tính hệ số GINI như sau: n ∑Pi ()Q + Q−1 G = 1 − i=1 ; (2.5.1b) 100000 Trong đó: Pi - Tỷ lệ số người của nhóm dân thứ i Q và QQ -1 - Tỷ lệ cộng dồn thu nhập đến nhóm dân cư thứ i và i - 1 Giả sử có số liệu về thu nhập của các nhóm dân cư một vùng trong năm như bảng 2.5.2. 75 76
  39. Bảng 2.5.2: Bảng tính hệ số GINI PHẦN BA MỘT SỐ PHƯƠNG PHÁP THƯỜNG DÙNG Thứ TNBQ Tỷ lệ số Tỷ lệ thu Tỷ lệ cộng dồn tự 1 người người của nhập của (%) TRONG PHÂN TÍCH THỐNG KÊ Q+Q-1 Pi(Q+Q-1) nhóm (1000đ từng nhóm từng nhóm Dân số Thu nhập (i) ) (Pi - %) (Qi - %) (P) (Q) Phân tích thống kê là giai đoạn cuối cùng của quá trình nghiên A 1 2 3 4 5 6 7=2.6 cứu thống kê, từ các biểu hiện về lượng nhằm nêu lên một cách tổng 1 550 20 11,46 20,00 11,46 11,46 229 hợp bản chất và tính quy luật của các hiện tượng và quá trình kinh tế - 2 650 18 13,54 38,00 25,00 36,46 656 xã hội trong các điều kiện thời gian và không gian cụ thể. Khi phân tích thống kê, người ta căn cứ vào các tài liệu báo cáo và điều tra đã 3 750 20 15,63 58,00 40,63 65,63 1.313 được tổng hợp để tính các chỉ tiêu cần thiết, so sánh và biểu hiện các 4 850 16 17,71 74,00 58,33 98,96 1.583 chỉ tiêu đó dưới dạng bảng số liệu hoặc đồ thị thống kê nhờ vào sự hỗ 5 950 15 19,79 89,00 78,13 136,46 2.047 trợ của các phương pháp chuyên môn của khoa học thống kê, rút ra những kết luận đáp ứng mục đích nghiên cứu và đề xuất các biện pháp 100,0 100,0 6 1050 11 21,88 0 0 178,13 1.959 giải quyết. Trong thống kê kinh tế - xã hội, nhiệm vụ chủ yếu của phân tích Tổng 4800 100 100 x x x 7.788 là đánh giá tình hình thực hiện các mục tiêu, chỉ ra những nguyên nhân hoàn thành hoặc không hoàn thành các mục tiêu, nêu rõ sự biến Thay số liệu vào công thức 2.5.2 ta tính được: động và xu hướng phát triển của hiện tượng nghiên cứu trong mối 7788 G = 1 − = 1 – 0,7788 = 0,2213 quan hệ với các hiện tượng có liên quan, phát hiện ra các năng lực 100000 tiềm tàng có thể khai thác trong nền kinh tế, chỉ ra những mặt cân đối Nếu như đường cong Lorenz giúp ta nhận biết bằng trực giác về lớn, những mặt thuận lợi và khó khăn, những yếu tố thúc đẩy hoặc tính chất và sự khác nhau về bất bình đẳng trong phân phối, thì hệ số kìm hãm sự phát triển kinh tế - xã hội, GINI cho phép ta xác định mức độ bất bình đẳng đó đến đâu, với con Trong phân tích thống kê, không có mẫu báo cáo phân tích nào có số cụ thể là bao nhiêu. thể áp dụng cho mọi trường hợp; mà tuỳ thuộc vào mục đích nghiên Hệ số GINI là một số không âm (0 ≤ G ≤ 1); hệ số này càng nhỏ cứu, vào điều kiện cụ thể về nội dung và đặc điểm của hiện tượng, về nguồn số liệu hiện có mà xây dựng những mô hình phân tích phù hợp thì sự bình đẳng trong phân phối càng lớn và ngược lại hệ số này càng trên cơ sở áp dụng một cách linh hoạt các phương pháp phân tích lớn thì sự bình đẳng trong phân phối càng nhỏ. thống kê. Trong đó các phương pháp thường được sử dụng là: Phương pháp phân tổ, phương pháp đồ thị, phương pháp dãy số biến động theo thời gian, phương pháp hồi quy tương quan, phương pháp chỉ số và 77 78
  40. phương pháp cân đối. hợp). 3.1. PHƯƠNG PHÁP PHÂN TỔ THỐNG KÊ a. Phân tổ theo một tiêu thức Phân tổ theo một tiêu thức là cách phân tổ đơn giản nhất và cũng 3.1.1. Khái niệm phân tổ thống kê và tiêu thức phân tổ thường được sử dụng nhất. Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó Cách tiến hành phân tổ, thường theo các bước sau: để phân chia tổng thể thống kê thành các tổ (tiểu tổ) có tính chất khác nhau. Ví dụ, phân chia nhân khẩu trong nước thành các tổ nam và nữ + Chọn tiêu thức phân tổ: (căn cứ vào giới tính), thành các tổ có độ tuổi khác nhau (căn cứ vào Chọn tiêu thức để phân tổ là vấn đề mang tính cốt lõi của phân tổ độ tuổi), v.v Một ví dụ khác: Phân chia chỉ tiêu giá trị tăng thêm của thống kê, vì phân tổ theo các tiêu thức khác nhau sẽ đáp ứng những sản xuất công nghiệp thành các tổ là kinh tế nhà nước và kinh tế ngoài mục đích nghiên cứu khác nhau, biểu hiện các khía cạnh khác nhau nhà nước (căn cứ vào hình thức sở hữu), thành các ngành công nghiệp của tập hợp thông tin. Phải căn cứ vào mục đích nghiên cứu và bản riêng biệt (căn cứ vào hoạt động sản xuất công nghiệp), v.v chất của hiện tượng để xác định tiêu thức phân tổ cho phù hợp, đồng Phân tổ thống kê là phương pháp cơ bản của tổng hợp thống kê, thời cần phải xét đến điều kiện cụ thể của hiện tượng. là một trong những phương pháp quan trọng của phân tích thống kê, + Xác định số tổ và khoảng cách tổ: đồng thời là cơ sở để vận dụng các phương pháp phân tích thống kê khác như phương pháp chỉ số, phương pháp tương quan, phương pháp Số lượng tổ phụ thuộc vào số lượng thông tin và phạm vi biến cân đối, động của tiêu thức nghiên cứu. Lượng thông tin càng nhiều, phạm vi biến động của tiêu thức càng lớn thì càng phải phân làm nhiều tổ. Tiêu thức thống kê (đặc điểm của đơn vị tổng thể để nhận thức hiện tượng nghiên cứu) được chọn làm căn cứ để phân tổ thống kê gọi - Phân tổ theo tiêu thức thuộc tính. là tiêu thức phân tổ. Tiêu thức phân tổ thống kê được chia thành 2 Ở đây sự khác nhau giữa các tổ được biểu hiện bằng sự khác nhau loại: Tiêu thức số lượng và tiêu thức thuộc tính. giữa các loại hình. Nếu các loại hình tương đối ít, ta có thể coi mỗi loại Tiêu thức số lượng là tiêu thức có thể biểu diễn được bằng con số, hình là một tổ, tức là có bao nhiêu loại hình sẽ có bấy nhiêu tổ. Trường ví dụ độ tuổi, thu nhập bình quân của hộ gia đình, trình độ văn hoá, hợp số loại hình thực tế có nhiều, nếu như coi mỗi loại hình là một tổ mức năng suất lao động, tiền lương bình quân, thì số tổ sẽ quá nhiều, không thể khái quát chung được, cũng như không nêu được đặc điểm khác nhau giữa các tổ, cho nên cần phải ghép những Tiêu thức thuộc tính là tiêu thức không thể biểu hiện được bằng loại hình giống nhau hoặc gần giống nhau vào cùng một tổ. con số, ví dụ giới tính, nghề nghiệp, dân tộc, tôn giáo, - Phân tổ theo tiêu thức số lượng. 3.1.2. Các loại phân tổ và cách thức tiến hành phân tổ Phân tổ theo tiêu thức số lượng là phân các đơn vị của tổng thể có Trong thống kê, có thể phân tổ theo một tiêu thức (gọi là phân tổ lượng biến tương ứng với trị số khác nhau của tiêu thức phân tổ vào đơn) hoặc phân tổ theo hai hay nhiều tiêu thức (gọi là phân tổ kết các tổ khác nhau. 79 80