Bài giảng Nghiên cứu marketing - Chương 7: Xử lý và phân tích dữ liệu
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nghiên cứu marketing - Chương 7: Xử lý và phân tích dữ liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_nghien_cuu_marketing_chuong_7_xu_ly_va_phan_tich_d.ppt
Nội dung text: Bài giảng Nghiên cứu marketing - Chương 7: Xử lý và phân tích dữ liệu
- Chương 7 XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU 1
- Mục tiêu chương 7 Chương này giúp học viên: • Hiểu được các khái niệm về xử lý dữ liệu • Phân biệt các phương pháp xử lý dữ liệu • Biết được quy trình xử lý dữ liệu bằng SPSS • Giải thích được ý nghĩa kết quả nghiên cứu 2
- Nội dung chương 5.1 Khái niệm về xử lý dữ liệu 5.2 Chuẩn bị dữ liệu 5.3 Mã hĩa dữ liệu 5.4 Làm sạch dữ liệu 5.5 Xử lý và phân tích dữ liệu 3
- 7.1 Khái niệm về phương pháp xử lý dữ liệu 4
- Khái niệm ▪ Xử lý dữ liệu là cơng việc diễn ra sau quá trình thu thập dữ liệu ▪ Nhiệm vụ của việc xử lý dữ liệu là chuyển các dữ liệu dưới dạng thơ thành dữ liệu tinh 5
- Quá trình chuyển hĩa dữ liệu Dữ liệu Dữ liệu thơ tinh 6
- Các phương pháp xử lý dữ liệu ▪ Phương pháp thủ cơng - Phương pháp kiểm đếm (Tallying) - Phương pháp lựa ra và đếm (Sorting and Counting) 7
- Các phương pháp xử lý dữ liệu ▪ Phương pháp xử lý bằng máy tính - Sử dụng các chuyên viên xử lý dữ liệu - Sử dụng các phần mềm xử lý dữ liệu trọn gĩi - Phát triển các phần mềm riêng 8
- Quy trình xử lý dữ liệu 1. Giá trị hĩa dữ liệu Chuẩn bị 2. Mã hĩa các câu trả lời dữ liệu 3. Nhập dữ liệu vào máy tính 4. Làm sạch dữ liệu Lưu trữ 5. Lưu trữ dữ liệu để phân tích và Phân tích 6. Phân tích dữ liệu 9
- 7.2 Chuẩn bị dữ liệu 10
- Cơng việc chuẩn bị dữ liệu ▪ Kiểm tra tính hợp lệ của dữ liệu ▪ Hiệu chỉnh dữ liệu 11
- Kiểm tra tính hợp lệ của dữ liệu ▪ Kiểm tra bảng câu hỏi đã được trả lời: tính đầy đủ của bảng câu hỏi, việc ghi chép câu trả lời ▪ Kiểm tra tính logic của các câu trả lời ▪ Xem xét những chỉ dẫn về thủ tục phỏng vấn ▪ Kiểm tra tính trung thực của các câu trả lời 12
- Hiệu chỉnh dữ liệu ▪ Liên hệ trực tiếp phỏng vấn viên để làm sáng tỏ vấn đề: các câu trả lời khơng đọc được, khơng rõ ý ▪ Gặp và phỏng vấn lại đáp viên ▪ Suy luận từ các câu trả lời khác ▪ Loại bỏ tồn bộ bản câu hỏi và tiến hành phỏng vấn lại 13
- 7.3 Mã hĩa dữ liệu 14
- Khái niệm ▪ Mã hĩa dữ liệu (coding) là quá trình chuyển đổi các trả lời thành dạng mã số để nhập và xử lý dễ dàng ▪ Được thực hiện trước hoặc sau khi phỏng vấn ▪ Các ký hiệu mã hĩa cho các biến và các trả lời được trình bày trong một sổ mã (code book) ▪ Dữ liệu mã hĩa xong được nhập vào máy dưới dạng một ma trận gọi là ma trận dữ liệu 15
- Mã hĩa dữ liệu trên bảng câu hỏi Mã hĩa câu hỏi đĩng Mã hĩa câu hỏi mở • Gán các con số cho • Nhĩm các câu trả lời cĩ các câu trả lời được cùng ý nghĩa liệt kê sẵn trên bảng • Gán các con số cho các câu hỏi nhĩm trả lời 16
- Mã hĩa dữ liệu trên bảng câu hỏi Câu hỏi một lựa chọn (SA) Câu hỏi nhiều lựa chọn(MA) • Thực hành ví dụ: - Phương pháp multiple dichotomy ✓ Bạn đánh giá mức thu nhập hiện - Phương pháp multiple category nay của bạn như thế nào? • Ví dụ: quá thấp ➢ Bạn hãy đánh dấu vào nhĩm phần mềm thấp mà bạn cĩ thể sử dụng được: trung bình Quản lý cơ sở dữ liệu cao Phần mềm soạn thảo văn bản rất cao Phần mềm bản tính khơng trả lời Phần mềm tài chính kế tốn Phần mềm truyền thơng Phần mềm khác (xin nêu rõ): 17
- Danh bạ mã hĩa hay sổ mã hĩa • Biến các trả lời thành các mã số, ký hiệu mà máy tính hiểu được • Giúp cho việc nhập liệu dễ dàng hơn • Giúp nhà nghiên cứu trong việc phân tích và diễn giải dữ liệu 18
- Nội dung trong danh bạ mã hĩa • Số thứ tự của câu hỏi. • Vấn đề của câu hỏi (thường là tĩm tắt nội dung câu hỏi). • Tên của biến số phát sinh từ câu hỏi • Nhãn của biến số (variable label) • Các giá trị mã hĩa: là các giá trị mà biến số cĩ thể nhận được để biểu diễn thơng tin được trả lời • Nhãn giá trị mã hố (Value Label) thường dùng để mơ tả ý nghĩa của các giá trị mã hĩa. 19
- STT Vấn đề Tên Mơ tả Các giá trị Mơ tả các giá trị mã câu câu hỏi biến số biến số mã hĩa hĩa hỏi 1 Vùng REGI Vùng địa lý 1 Hà Nội phỏng vấn 2 Đà Nẵng 3 TP.HCM 4 Cần Thơ 2 Cĩ sử dụng USE 1 Cĩ sữa rửa 2 Khơng mặt khơng 3 Sử dụng BRAND Nhãn hiệu 1 Pond’s nhãn hiệu đang dùng 2 Hazeline nào? 3 Biore 4 Lana 5 Nivea 6 Naco 7 Loại khác 4 Sử dụng TIME Thời điểm 1 Sáng sớm khi thức dậy sữa rửa sử dụng 2 Buổi sáng mặt vào khi 3 Buổi trưa nào? 4 Buổi chiều 20 5 Tối trước khi ngủ
- Câu hỏi Ý nghĩa câu hỏi Giá trị Mơ tả giá trị mã hĩa (biến) mã hĩa Q1 Giới tính đáp viên 1 Nam 2 Nữ Q2 Nghề nghiệp đáp viên 1 Bác sĩ 2 Giáo viên 3 Nhân viên văn phịng 4 Cơng nhân 5 Hưu trí 6 Học sinh-sinh viên 7 Khác Q22a Đánh giá về bao bì 1 Kém sản phẩm 2 Trung bình Q20b Đánh giá về chất 3 Tốt lượng sản phẩm 21
- Ma trận dữ liệu – Cột: là nơi quản lý các biến (các câu hỏi cĩ trong bảng câu hỏi) – Loại câu hỏi một trả lời: chỉ cần một cột chứa các giá trị trả lời – Loại biến nhiều trả lời: nhiều cột chứa nhiều giá trị trả lời cĩ thể cĩ – Dịng: là nơi quản lý tất cả các quan sát (bằng kích cỡ mẫu) – Ơ giao nhau giữa cột và dịng: là nơi chứa đựng giá trị trả lời của một câu hỏi trong một quan sát cụ thể. 22
- 7.4 Làm sạch dữ liệu 24
- Làm sạch dữ liệu ▪ Dữ liệu sau khi nhập xong, chưa thể đưa ngay vào xử lý ▪ Nhằm phát hiện các sai sĩt do người kiểm sốt chưa phát hiện ra hoặc do nhập liệu 25
- Các phương pháp làm sạch dữ liệu • Dùng bảng tần số • Dùng bảng kết hợp giữa hai hay ba biến • Tìm lỗi đơn giản ngay trên cửa sổ dữ liệu (Data View) 26
- Bảng mơ tả về mẫu nghiên cứu theo giới tính Frequency Percent Valid Cumulative Percent Percent Valid Nam 248 49.6 49.6 49.6 Nữ 251 50.2 50.2 99.8 11 1 .2 .2 100.0 Total 500 100.0 100.0 27
- 7.5 Xử lý và phân tích dữ liệu 28
- Phân tích dữ liệu Phân tích dữ liệu thống kê bao gồm: • Thống kê mơ tả • Thống kê suy diễn 29
- Thống kê mơ tả ( Descriptive Stactistics): • Sử dụng bảng tần số • Tính các đại lượng thống kê mơ tả • Bảng kết hợp nhiều biến • Biểu đồ 30
- Bảng tần số đơn giản • Dùng để đếm tần số về các biểu hiện của một thuộc tính • Được thực hiện với cả biến định tính và định lượng • Cần tiến hành gom biến trước khi lập bảng tần số với các biến định lượng cĩ nhiều giá trị 31
- Bảng tần số đơn giản Phần trăm có Phần trăm Tần số Tỷ lệ % ý nghĩa tích lũy Valid 1 - 3 triệu 31 31.0 31.0 31.0 3 - 5 triệu 45 45.0 45.0 76.0 5 - 7 triệu 19 19.0 19.0 95.0 >7 triệu 5 5.0 5.0 100.0 Tổng 100 100.0 100.0 32
- Bảng tần số về tuổi đáp viên Cumulative 36 8 1.6 59.6 Frequency Percent Percent 37 6 1.2 60.8 Valid 18 9 1.8 1.8 38 16 3.2 64.0 19 8 1.6 3.4 39 14 2.8 66.8 20 16 3.2 6.6 40 18 3.6 70.4 21 19 3.8 10.4 41 10 2.0 72.4 22 22 4.4 14.8 42 16 3.2 75.6 23 26 5.2 20.0 43 7 1.4 77.0 24 29 5.8 25.8 44 6 1.2 78.2 25 21 4.2 30.0 45 10 2.0 80.2 26 15 3.0 33.0 46 12 2.4 82.6 27 13 2.6 35.6 47 7 1.4 84.0 28 19 3.8 39.4 48 8 1.6 85.6 29 16 3.2 42.6 49 8 1.6 87.2 30 17 3.4 46.0 50 12 2.4 89.6 31 10 2.0 48.0 51 3 .6 90.2 32 18 3.6 51.6 52 7 1.4 91.6 33 8 1.6 53.2 33 53 4 .8 92.4 34 9 1.8 55.0 54 10 2.0 94.4 35 15 3.0 58.0
- Bảng tần số về độ tuổi đã được mã hĩa lại Cumulative Frequency Percent Valid Percent Percent Độ tuổi 18-25 150 30.0 30.0 30.0 58.0 26-35 140 28.0 28.0 80.2 36-45 111 22.2 22.2 100.0 46-60 99 19.8 19.8 Total 500 100.0 100.0 34
- Tính các đại lượng thống kê ▪ Các đại lượng đo lường độ tập trung phổ biến • Mean: Trung bình cộng • Mode: Giá trị cĩ tần số quan sát lớn nhất • Std.Deviation: Độ lệch chuẩn • Minimum: Giá trị nhỏ nhất • Maximum: Giá trị lớn nhất • SE mean: Sai số chuẩn khi ước lượng trung bình 35
- Hình dáng của phân phối 36
- Hình dáng của phân phối 37
- Hình dáng của phân phối 38
- Bảng tổng hợp nhiều biến • Yêu cầu về thơng tin địi hỏi ta phải xem xét tần số hay tần suất của các biểu hiện của một hay nhiều biến theo sự phân loại của một số biến khác ✓ Ví dụ: ta muốn biết số người trong độ tuổi từ 18 đến 25 trong mẫu quan sát là bao nhiêu nam, bao nhiêu nữ ✓ Vậy ta cĩ bảng kết hợp giữa độ tuổi và giới tính 39
- Bảng tổng hợp nhiều biến(tt) • Bảng kết hợp giữa hai biến định tính • Bảng kết hợp giữa ba biến định tính • Bảng kết hợp giữa một biến định tính với một biến định lượng • Bảng kết hợp giữa hai biến định tính và một biến định lượng 40
- Cơ cấu mẫu điều tra về độ tuổi theo từng nhĩm giới tính Giới tính Tổng Nam Nữ % theo Tần % theo % theo Tần số cột suất cột Tần số cột Độ tuổi 18-25 58 23.3% 92 36.7% 150 30.0% 26-35 71 28.5% 69 27.5% 140 28.0% 36-45 68 27.3% 43 17.1% 111 22.2% 46-60 52 20.9% 47 18.7% 99 19.8% Tổng 249 100.0% 251 100.0% 500 100.0% 41
- Cơ cấu độ tuổi theo giới tính tại hai thành phố Hà Nội TPHCM Nam Nữ Tổng Nam Nữ Tổng Tần Độ tuổi 18-25 28 40 68 30 52 82 số 26-35 33 39 72 38 30 68 36-45 30 22 52 38 21 59 46 60 27 31 58 25 16 41 Tổng 118 132 250 131 119 250 Tỷ Độ tuổi 18-25 23.7% 30.3% 27.2% 22.9% 43.7% 32.8% lệ 26-35 28.0% 29.5% 28.8% 29.0% 25.2% 27.2% 36-45 25.4% 16.7% 20.8% 29.0% 17.6% 23.6% 46 60 22.9% 23.5% 23.2% 19.1% 13.4% 16.4% Tổng 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 42
- Mơ tả dữ liệu bằng biểu đồ Hiệu quả trong việc trình bày và báo cáo kết quả, vì: ▪ Thể hiện thơng tin sinh động, trực quan và hấp dẫn ▪ Thu hút sự chú ý của người đọc ▪ Giúp người xem dễ hiểu, dễ nhớ nên cĩ tác dụng truyền đạt hiệu quả tốt 43
- Một số dạng biểu đồ thường sử dụng • Biểu đồ thanh (Bar Chart) - Thanh ngang - Thanh đứng • Biểu đồ hình trịn (Pie Chart) • Biều đồ diện tích • Biểu đồ gấp khúc 44
- Các dịp sử dụng quần Jeans(biểu đồ thanh ngang Đi chơi 96% Đi mua sắm 96% Đi ăn uống (với nhiều người) 95% Đi dạo (đi hĩng mát) 83% Đi dự tiệc 79% Đi làm việc những ngày trong tuần 50% Đi hội họp 41% Đi làm việc những ngày cuối tuần 41% Đi học 25% Đi giao dịch với khách hàng 24% 45
- Các dịp sử dụng quần Jeans(biểu đồ thanh đứng) 46
- ➢Vậy khi nào chúng ta sử dụng biểu đồ thanh ngang/thanh đứng? 47
- Quần jean và quần kaki cũng được sử dụng chủ yếu cho việc đi mua sắm, đi dạo, đi chơi, đi ăn uống hoặc đi dự tiệc; và khoảng ½ người sử dụng quần jean và quần kaki mặc chúng để đi làm Dịp sử dụng quần Quần jean Quần tây Quần Kaki (n=183) (n=117) (n=83) Đi chơi 96% Đi chơi 79% Đi chơi 92% Đi mua sắm 96% Đi mua sắm 85% Đi mua sắm 94% Đi ăn uống (với nhiều Đi ăn uống (với nhiều Đi ăn uống (với nhiều 95% 84% 88% người) người) người) Đi dạo (đi hĩng mát) 83%Đi dạo (đi hĩng mát) 76%Đi dạo (đi hĩng mát) 83% Đi dự tiệc 79% Đi dự tiệc 80% Đi dự tiệc 81% Đi làm việc những ngày Đi làm việc những ngày Đi làm việc những ngày 50% 73% 52% trong tuần trong tuần trong tuần Đi hội họp 41% Đi hội họp 45% Đi hội họp 39% Đi làm việc những ngày Đi làm việc những ngày Đi làm việc những ngày 41% 60% 48% cuối tuần (thứ Sáu/ thứ cuối tuần (thứ Sáu/ thứ cuối tuần (thứ Sáu/ thứ Đi học 25% Đi học 42% Đi học 16% Đi giao dịch với khách Đi giao dịch với khách Đi giao dịch với khách 24% 47% 31% hàng hàng hàng Đối tượng: Những người thường mua Q4b48
- Thần tượng của giới trẻ 49
- Thĩi quen mua các nhãn hiệu Quần Jean Từng mua Thường mua Thường mua nhất Nino-Max 37 28 19 PT 2000 28 18 14 B-Blue 25 16 8 Bossini 21 13 9 Giordano 5 3 1 Phương 2 2 1 Đơng Q6. Nhãn hiệu quần jean đã từng mua? Thường mua? Thường mua nhất? Đối tượng: Những người từng mua quần jean (n=219) 51
- Biểu đồ diện tích Chi tiêu cá nhân 52
- Tỷ lệ sinh viên theo học các chuyên ngành Kinh tế học 9% Thương mại 16% Marketing 25% Tài chính ngân hàng 18% Kế tốn 32% 53
- Kinh tế học Thương mại 9% 16% • Biểu đồ nào Marketing dễ quan sát 25% Tài chính ngân hàng và so sánh 18% hơn? Kế tốn 32% Kinh tế học 9% Marketing 25% Kế tốn 32% Tài chính ngân hàng 18% Thương mại 16% 54
- Đánh giá nhãn hiệu áo 2 2.5 3 3.5 4 4.5 Mean Màu sắc sản phẩm phù hợp cho thời trang thơng dụng score Chất liệu vải phù hợp với thời trang thơng dụng Dễ giặt/ ủi Cĩ chất lượng đường may cao Cĩ kiểu dệt mới lạ Cĩ độ bền sản phẩm cao Cĩ độ bền màu cao Thiết kế phù hợp với các sản phẩm thời trang đi kèm Giá cả hợp lý Cĩ kiểu dáng chững chạc Cĩ kiểu dáng hợp thời trang Nhãn hiệu nổi tiếng Nhãn hiệu uy tín Sản xuất tại Việt Nam Sản xuất tại nước ngồi Được quảng cáo trên phương tiện thơng tin đại chúng Được bán rộng rãi Cung cách phục vụ của nhân viên bán hàng niềm nở/ tận tình Được bán tại các cửa hàng thời trang thơng dụng thiết kế bắt mắt Được sản xuất bởi cơng ty quy mơ/ tầm cỡ Cĩ cửa hàng trưng bày và bán (showroom) Bossini (n=155) Thành cơng(n=75) Đối tượng: Những người nhận biết nhãn hiệu cĩ trợ giúp Q7a F-house/Phương Đơng(n=69)55 John Henry (n=37) Giordano (n=49)
- Cá tính thương hiệu Perceptual Map (Dim I : Dim II) Trẻ trung Hiện đại Năng động Gần gũi Bossini Thành Công Bình dân Chất lượng Thời thượng Cao cấp Độc đáo John Henry 0.645 variance Quồc tế Thanh lịch Giordano Nghiêm túc Lâu đời F-House Cổ điển 0.247 variance Đối tượng: Những người nhận biết nhãn hiệu cĩ trợ giúp - Nhĩm kinh doanh/giao tiếp- Q20 56
- CÂU HỎI VÀ THẢO LUẬN 1. Mã hĩa dữ liệu là gì? Vì sao phải mã hĩa dữ liệu? Mã hĩa câu hỏi đĩng và câu hỏi mở cĩ gì khác nhau? 2. Trình bày ưu điểm, nhược điểm của hai phương pháp mã hĩa 3. Mơ tả dữ liệu bằng bảng và đồ thị cĩ ưu nhược điểm gì? Khi nào nhà nghiên cứu mơ tả dữ liệu bằng biểu đồ hình trịn, hình thanh. 4. Hãy mã hĩa các câu hỏi sau đây? 57
- THỰC HÀNH MÃ HĨA CÂU HỎI a) Bạn đánh giá khả năng của bạn về việc sử dụng các phần mềm sau đây: Tốt Khá Trung bình Khơng biết sử dụng MS Word MS Excel MS Access MS Power Point Corel Draws SPSS Phần mềm khác 58
- b) Khi đi mua xe hơi ở một cửa hàng, bạn hãy sắp xếp thứ tự các yếu tố sau theo mức độ quan trọng của nĩ giảm dần từ (1 đến 6). Giá cả thích hợp Xe vừa ý Người bán quen biết trước Vị trí cửa hàng thuận lợi Dịch vụ bán hàng tốt Được bạn bè hay người thân giới thiệu 59