Bài giảng Phát hiện vai trò và dự báo bùng nổ sự kiện trên mạng xã hội - Hà Quang Thụy

ppt 32 trang ngocly 3420
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phát hiện vai trò và dự báo bùng nổ sự kiện trên mạng xã hội - Hà Quang Thụy", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_phat_hien_vai_tro_va_du_bao_bung_no_su_kien_tren_m.ppt

Nội dung text: Bài giảng Phát hiện vai trò và dự báo bùng nổ sự kiện trên mạng xã hội - Hà Quang Thụy

  1. Phát hiện vai trò và dự báo bùng nổ sự kiện trên mạng xã hội Hà Quang Thụy Phòng Thí nghiệm Công nghệ Tri thức - KTLab Trường ĐHCN, Đại học Quốc gia Hà Nội, Hà Nội, 29-9-2012 1 KTLab
  2. Nội dung - Giới thiệu chung - Khai phá dữ liệu mạng xã hội - Phát hiện vai trò và dự báo bùng nổ sự kiện trên xã hội 2 - Một mô hệ thống hình phát hiện vai trò và dự báo bùng nổ sự kiện trên xã hội - Một vài bàn luận June 9, 2021
  3. Đặt vấn đề - Dự báo bùng nổ sự kiện ▪ KTLab: Nâng cao chất lượng phát hiện sự kiện ▪ Hợp tác quốc tế ▪ NII (Nhật Bản): Event Sequence Analysis ▪ LARC (Singapore): Event Bursting ▪ Catholic University of Leuven (Katholieke Universiteit Leuven, Bỉ): Dự án hợp tác quốc tế “Improving Business Process and Complex Event Sequence Analytics using 3 Process Mining Techniques” ▪ Hợp tác trong nước: Bộ Công an - Phát hiện vai trò với bùng nổ sự kiện ▪ KTLab: Phát hiện vai trò, xếp hạng trong mạng xã hội, khai phá quan điểm cộng đồng ▪ Vai trò lớn/hạng cao, cộng đồng sự kiện / bùng nổ sự kiện June ▪ Dự báo bùng nổ sự kiện liên 9, quan tới nút có vai trò lớn 2021
  4. I. Giới thiệu chung - Khái niệm mạng xã hội ▪ John Arundel Barnes, 1954: mạng xã hội là đối tượng nghiên cứu [Barnes54]. ▪ Cấu trúc xã hội: tập các cá nhân/tổ chức + tập các quan hệ xã hội giữa các cá nhân/tổ chức [EK10]. Biểu diễn đồ thị. ▪ Phương tiện truyền thông XH (social media): phương tiện phổ biến mối quan hệ XH tới cộng đồng. Trao đổi nội dung [Lesk11] ▪ Phương tiện truyền thông XH là nền tảng để người dùng tạo và 4 trao đổi nội dung với cộng đồng [YK12] ▪ "một nhóm các ứng dụng dựa trên Internet được xây dựng trên nền tảng tư tưởng và công nghệ của Web 2.0, cho phép tạo và trao đổi nội dung do người dùng tạo ra“ [KH10] - Phân loại mạng xã hội ▪ Hai chiều đặc trưng: hiện diện xã hội/phong phú (social presence/media richness) và hiện diện xã hội/phong phú (self- presentation/self-disclosure). [Barnes54] Barnes, J. (1954). Class and Committees in a Norwegian Island Parish, Human Relations, 7, 39-58. [EK10] David Easley and Jon Kleinberg (2010). Networks, Crowds, and Markets: Reasoning June about a Highly Connected World, Cambridge University Press, 2010. 9, [KH10] Andreas M Kaplan and Michael Haenlein (2010). Users of the world, unite! The challenges and opportunities of Social Media, Business horizons (2010), 53:59-68. 2021 [YK12] Sheng Yu, Subhash Kak (2012). A Survey of Prediction Using Social Media CoRR abs/1203.1647: (2012)
  5. I. Một cách phân loại mạng xã hội 5 Twitter ? June [KH10] Andreas M Kaplan and Michael Haenlein (2010). Users of the world, unite! The challenges and opportunities of Social Media, Business horizons (2010), 53:59-68. 9, 2021
  6. I. Sự phát triển của mạng xã hội 6 June 9, [Ben12], Shea Bennet (2012). Twitter On Track For 500 Million Total Users By March, 250 Million 2021 Active Users By End Of 2012, users_b17655.
  7. I. Tác động của mạng xã hội - Tác động xã hội ▪ Góp phần tăng cường nguồn vốn xã hội (social capital) cho quốc gia [ESL07], [ZJV12] ▪ Đôi lúc cản trở phát triển xã hội - Facebook với phong trào “Mùa xuân Ả rập” ▪ Facebook góp phần quan trọng [AMCJ12], [Iskan11], [MS11]: hoạt động liên quan đến phong trào chiếm trọng số rất lớn (3 dòng cuối) 7 [AMCJ12] Ban Al-Ani, Gloria Mark, Justin Chung, Jennifer Jones (2012). The Egyptian Blogosphere: A Counter-Narrative of the Revolution, Proceedings of the ACM 2012 June conference on Computer Supported Cooperative Work: 17-26. [Iskan11] Elizabeth Iskander (2011). Connecting the National and the Virtual: Can Facebook 9, Activism Remain Relevant After Egypt’s January 25 Uprising?, International Journal of 2021 Communication 5 (2011): 1225–1237. [MS11] Racha Mourtada and Fadi Salem (2011). Civil Movements: The Impact of Facebook and Twitter, Arab Social Media Report, 1 (2): 1-30.
  8. I. Tác động xã hội của mạng xã hội - Facebook với cuộc bạo loạn tại Anh năm 2011 ▪ Liên quan giữa mức độ bạo lực với sự kiểm duyệt Facebook [AT12] ▪ Giải pháp tối ưu khuyêch tán quan điểm lành mạnh: Tham gia cởi mở cung cấp thông tin đúng và hoàn toàn không áp đặt. - Mạng xã hội với chống quyền lợi Mỹ 9/2012 ▪ Xuất phát từ video về Thánh Mohamed ▪ Đại sứ Mỹ tại Libi bị giết. Hai phía sử dụng mạng xã hội - Twitter với sự kiện thảm họa kép “Động đất – Sóng 8 thần” ở Nhật Bản 3/2011 ▪ “Phóng viên nhân dân” (Real time citizen journalist [ZJV12] ▪ Tính thời gian thực của Twitter; Mô hình xác suất dự báo và lan truyền thông tin động đất [SOM10] nhanh hơn C/quan KTTV-NB. ▪ Tư vấn sau thảm họa [CD11, DVC11] [AT12] Casilli, Antonio A. and Paola Tubaro (2012). Social media censorship in times of political unrest: A social simulation experiment on the UK riots, Bulletin of Sociological Methodology, 115 (1): 5-20. [CD11] Nigel Collier, Son Doan (2011). Syndromic Classification of Twitter Messages, eHealth 2011: 186-195 [SOM10] Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo (2010). Earthquake shakes Twitter June users: real-time event detection by social sensors, WWW 2010: 851-860. [STM11] Takeshi Sakaki, Fujio Toriumi, Yutaka Matsuo (2011). Tweet trend analysis in an 9, emergency situation, SWID '11: 3. 2021 [ZJV12] Homero Gil de Zúnĩga, Nakwon Jung, Sebastián Valenzuela (2012). Social Media Use for News and Individuals’ Social Capital, Civic Engagement and Political Participation, Journal of Computer-Mediated Communication 17 (2012) 319–336
  9. I. Tác động khoa học - Ngành xã hội học [WGG12] ▪ 5 nhóm chủ đề dựa trên Facebook: Phân tích mô tả người sử dụng, Động lực sử dụng Facebook, Trình bày danh tính, Vai trò của Facebook trong tương tác xã hội, Tính riêng tư và việc tiết lộ thông tin. ▪ Phát sinh hướng nghiên cứu mới: "Netnography" = “Inter[net]” and “eth[nography]”; "Child-led Research" - Khoa học máy tính: khai phá dữ liệu mạng xã hội 9 ▪ Là nguồn tài nguyên thông tin phong phú [LVGE12] ▪ Miền ứng dụng rộng lớn [EK10], [HSYY10], [Lesk11] ▪ Khai phá dữ liệu cấu trúc + Khai phá dữ liệu nội dung [WGG12] Robert E. Wilson, Samuel D. Gosling, and Lindsay T. Graham (2012). A Review of Facebook Research in the Social Sciences, Perspectives on Psychological Science 7(3) 203– 220. [LVGE12] Cliff Lampe, Jessica Vitak, Rebecca Gray, Nicole B. Ellison (2012). Perceptions of facebook's value as an information source, CHI 2012: 3195-3204 [EK10] David Easley and Jon Kleinberg (2010). Networks, Crowds, and Markets: Reasoning about a Highly Connected World, Cambridge University Press, 2010 [HSYY10] Jiawei Han, Yizhou Sun, Xifeng Yan, Philip S. Yu (2010). Mining Knowledge from June Databases: An Information Network Analysis Approach, ACM SIGMOD Conference Tutorial, 2010. 9, [Lesk11] Jure Leskovec (2011). Social Media Analytics, Tutorial at the ACM SIGKDD 2021 International Conference on Knowledge Discovery and Data Mining (Part 1: Information flow, Part2: Rich Interactions), 2011.
  10. II. Khai phá dữ liệu mạng xã hội - Khai phá nội dung mạng xã hội [HSYY10, Lesk11] ▪ quản lý danh tiếng (reputation management) ▪ tiếp thị phương tiện truyền thông xã hội (Social media marketing) ▪ phản ứng công dân (citizen response) ▪ phân tích hành vi con người (Human behavior analysic) ▪ phóng viên công dân thời gian thực (Real time citizen journalist) 10 ▪ - Khai phá cấu trúc mạng xã hội ▪ mẫu và tính động về cấu trúc của mạng xã hội ▪ thế giới nhỏ (small world) ▪ liên kết mạnh – yếu (strong – weak tie) ▪ phân bố luật lũy thừa (power law distribution) ▪ cấu trúc cộng đồng (community) ▪ Dự báo liên kết L. Liu và T. Zhou, 2010 [LZ10] ▪ lý thuyết cân bằng (balance theory) và lý thuyết trạng thái June (status theory) [EK10] 9, 2021 [LZ10] L. Lu and T. Zhou (2010). Link prediction in complex networks: A survey, Physica A, 390:1150–1170, 2010
  11. II. Một số tổ chức nghiên cứu KPDL mạng xã hội - Viện Tiêu chuẩn và công nghệ quốc gia Mỹ (NIST) ▪ Nhánh hội nghị TREC: Blogsphore 2010, Microblogs 2011, 2012. ▪ Blogtrack 2010 [MSOS10]: ❖ Kho ngữ liệu Blogs06 và Blogs08 ❖ Ba bài toán Tìm quan điểm (Opinion-Finding), Lọc tìm thú vị ((Blog Distillation), và Phát hiện tin nóng (Top news). ❖ 45 nhóm nghiên cứu tham gia 11 ❖ Tìm quan điểm: dựa theo phân lớp, dựa theo từ vựng ❖ Tiếp cận lọc tìm thú vị: lựa chọn tài nguyên, lựa chọn chuyên gia ❖ Phát hiện tin nóng: bỏ phiếu, xệp hạng ▪ Microblog Track 2011, 2012 ❖ NIST tạo ra 60 chủ đề, ❖ giải quyết trong thời gian thực, ❖ tìm kiếm và xếp hạng tweest ❖ 2011: công bố của 34 nhóm trên thế giới ❖ M. C. McCreadie và cộng sự, 2012 [CSMOC12] June [MSOS10] Craig Macdonald, Rodrygo L. T. Santos, Iadh Ounis, Ian Soboroff (2010). Blog track 9, research at TREC, SIGIR Forum 44(1): 58-75 (2010) [CSMOC12] Richard M. C. McCreadie, Ian Soboroff, Jimmy Lin, Craig Macdonald, Iadh Ounis, 2021 Dean McCullough (2012). On building a reusable Twitter corpus, SIGIR 2012: 1113- 1114
  12. II. Viện Tin học quốc gia Nhật Bản - Nội dung hợp tác nhóm GS Collier và KTLab ▪ Hiểu được yêu cầu người dùng khi gặp tình huống khẩn cấp ▪ Theo dõi sự biến đổi khí hậu ▪ Phân tích danh tiếng của các sản phẩm ▪ Khám phá, theo dõi chủ đề và phân tích quan điểm của người sử dụng liên quan tới thảm họa 12 - Một số nội dung cụ thể ▪ Phân lớp hội chứng từ dữ liệu Twitter [CD11]. ▪ Phân tích thông điệp Twitter về động đất [DVC11] ▪ Dự báo thay đổi phân cực chứng khoán bốn cổ phiếu Apple (AAPL), Google (GOOG), Microsoft (MSFT) và Amazon (AMZN). Seminar tiếp theo. [CD11] Nigel Collier, Son Doan (2011). Syndromic Classification of Twitter Messages, eHealth 2011: 186-195 [DVC11] Son Doan, Bao-Khanh Ho Vo, Nigel Collier (2011). An Analysis of Twitter Messages in June the 2011 Tohoku Earthquake, eHealth 2011: 58-66. 9, [TSQN12] Tien Thanh Vu, Shu Chang, Quang Thuy Ha, Nigel Collier (2012). An Experiment in Integrating Sentiment Features for Tech Stock Prediction in Twitter, Colling 2012 (being 2021 submitted).
  13. Viện Tin học quốc gia Nhật Bản 13 [TSQN12] Tien Thanh Vu, Shu Chang, Quang Thuy Ha, Nigel Collier (2012). An Experiment in June Integrating Sentiment Features for Tech Stock Prediction in Twitter, Colling 2012 (being submitted). 9, 2021
  14. II. LARC, SMU - Khái niệm phân tích cuộc sống ▪ phân tích hành vi và mạng xã hội và thực nghiệm hành vi ▪ phát hiện và thu hoạch các luật tiến hóa đối với các mạng 14 - Quá trình vòng kín 4 pha ▪ Experiment-Driven Closed-Loop Analytics ▪ Quan sát: quan sát tương tác và mối quan hệ người dùng mạng thời gian thực và thu thập các dấu vết kỹ thuật số. ▪ Phân tích và Dự báo: tiếp nhận, phân tích dấu vết kỹ thuật số phát hiện các mẫu để dự báo hành vi người dùng và xu hướng mạng. ▪ Thực nghiệm: kiểm tra cách cá nhân/nhóm phù hợp với sự thay đổi về nội dung, cung cấp dịch vụ, kinh nghiệm tương tác, giá và ưu June đãi 9, ▪ Hành động con người: người dùng tạo ra trả lời từ thực nghiệm 2021 thông qua các loại thông tin phản hồi dữ liệu cho pha Quan sát.
  15. II. LARC, SMU: Bùng nổ sự kiện - Wayne Xin Zhao và cộng sự, 2011 [ZJHS11] ▪ Topic discovery, Topical PageRank for Keyword Ranking, Probabilistic Models for Topical Keyphrase Ranking 15 - Qiming Diao và cộng sự, 2012 [DJZL12] June [DJZL12] Qiming Diao, Jing Jiang, Feida Zhu and Ee-Peng Lim (2012). Finding bursty topics from microblogs, ACL'12: 536-544, 2012 9, [ZJHS11] Wayne Xin Zhao, Jing Jiang, Jing He, Yang Song, Palakorn Achanauparp, Ee-Peng 2021 Lim and Xiaoming Li (2011) Topical keyphrase extraction from Twitter, ACL-HLT'11: 379-388, 2011
  16. II. LARC, SMU: Bùng nổ sự kiện - Wayne Xin Zhao và cộng sự, 2012 [ZSJSL12] ▪ Xung quanh cùng thời gian và cùng một chủ đề ▪ Cùng một người và cùng chủ đề 16 June 9, [ZSJSL12] Wayne Xin Zhao, Baihan Shu, Jing Jiang, Yang Song, Hongfei Yan and Xiaoming Li 2021 (2012). Identifying Event-related Bursts via Social Media Activities, EMNLP- CoNLL'12:1466-1477, 2012.
  17. III. Phát hiện vai trò - Quan hệ xã hội thực 17 ▪ Định nghĩa: tập nút và tập quan hệ ▪ Không như CSDL quản lý quan hệ xã hội: “quen biết” ▪ Cần phát hiện quan hệ xã hội trong xã hội thực ▪ Mạng thành viên câu lạc bộ Karate có hai cộng đồng: huấn luyện viên và chủ CLB ▪ Mạng email: phân cấp vai trò ▪ Quan hệ mạng thông tin công trình khoa học - Một số giải pháp ▪ Mô hình đồ thị nhân tử xác suất theo thời gian [WHJTZ10] June ▪ Xếp hạng đối tượng 9, [WHJTZ1] Chi Wang, Jiawei Han, Yuntao Jia, Jie Tang, Duo Zhang, Yintao Yu, Jingyi Guo 2021 (2010). Mining advisor-advisee relationships from research publication networks, KDD 2010: 203-212
  18. Hệ thống tìm kiếm vai trò [TS12] 18 - Mô hình chung phát hiện vai trò - Thực thể và quan hệ: ▪ 3 kiểu thực thể/nút: Người dùng, tài liệu, thẻ (tag): Một từ bắt đầu với dấu “#” ▪ 5 kiểu cung liên kết: Person-publishes, Person-receives, June Depicts, Knows, References 9, [TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012). Building a role search engine 2021 for social media. WWW (Companion Volume) 2012: 1051-1060
  19. Hệ thống tìm kiếm vai trò [TS12] - 14 đặc trưng phản ánh vai trò (M1-M14) ▪ M1: Số lượng người mà p biết ▪ M2: Số lượng người biết p “số fan hâm mộ” ▪ M3: Số lượng mối quan hệ đối ứng của p ▪ M4: Hệ số phân cụm mối quan hệ từ các độ đo ràng buộc với bạn bè của p ▪ M5: Độ sâu truyền thông trung bình của người p (chi tiết sau) ▪ M6: Độ sâu truyền thông tối đa của người p (tương tự 19 M5) ▪ M7: Số lượng tin nhắn mà p nhận được ▪ M8: Số tài liệu mô tả p ▪ M9: Thời gian trung bình các hành động ảnh hưởng được p thực hiện ▪ M10: Vị trí trung bình mà người p xuất hiện trong dòng truyền thông ▪ M11: Số lượng các ấn phẩm của p ▪ M12: Ngày p tham gia vào mạng ▪ M13: Trung bình số lượng từ trong các tài liệu của p XB ▪ M14: Chỉ số đăng ký của p: Tỷ lệ phần trăm từ mà tồn tại trong từ điển của tập tài liệu được p xuất bản June 9, [TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012). Building a role search engine 2021 for social media. WWW (Companion Volume) 2012: 1051-1060
  20. Hệ thống tìm kiếm vai trò [TS12] - Tính độ sâu TT trung bình (M5) và cực đại (M6) ▪ B1: Xác định mọi tài liệu được p xuất bản ▪ B2: Xác định được tất cả người bị ảnh hưởng từ tập tài liệu (bước 1): ▪ B nhận tài liệu của A 20 ▪ Tài liệu của B có tham khảo tài liệu của A ▪ B ghi tên vào một tài liệu nào đó của A ▪ B3: Tính khoảng cách từ p tới mỗi người từ bước 2: số lượng cung của con đường ngắn nhất giữa i và p theo mối quan hệ biết nhau ▪ B4: Độ sâu trung bình (M5)/ cực đại (M6) khoảng cách được xác định trong bước 3 June 9, [TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012). Building a role search engine 2021 for social media. WWW (Companion Volume) 2012: 1051-1060
  21. Vai trò quan trọng [TS12] - Người nổi tiếng (Celebrities) ▪ Người của công chúng như Lady Gaga, Gisele Bundchen: thu hút fan, có danh sách ? ▪ Liên kết nhiều nhưng có thể ảnh hưởng ít ▪ M2 và M8 - Người lãnh đạo (Information propagators) 21 ▪ Dư luận bắt nguồn từ người lãnh đạo tới phần còn lại ▪ Lượng thông tin qua lãnh đạo có thể không nhiều ▪ M1, M5, M6, M11, M14 - Người quảng bá (Promoters) ▪ Người quảng bá bắt đầu một tư tưởng/phát kiến mới , những người khác liên hệ với họ ▪ M9, M10 - Người nhanh nhậy (Early adopters) June ▪ Tích cực phân phối nội dung 9, ▪ M9 và M10 2021 [TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012). Building a role search engine for social media. WWW (Companion Volume) 2012: 1051-1060
  22. Xử lý dữ liệu [TS12] 22 - Phân cụm người dùng ▪ Thuật toán k-mean ▪ Hai nội dung: chuẩn hóa dữ liệu, gán vai trò cho mỗi cụm - Chiến lược chuẩn hóa ▪ Chuẩn hóa tối đa/tối thiếu về [0,1] ▪ Chuẩn hóa logarithm ▪ Chuẩn hóa hạng June - Gán vai trò 9, ▪ Xem xét phân bổ dữ liệu theo 14 đặc trưng M1-M14 2021 [TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012). Building a role search engine for social media. WWW (Companion Volume) 2012: 1051-1060
  23. Hệ thống tìm kiếm vai trò [TS12] 23 - Vai trò với các đặc trưng June 9, [TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012). Building a role search engine 2021 for social media. WWW (Companion Volume) 2012: 1051-1060
  24. Dự báo bùng nổ sự kiện - Phân hướng xu hướng Tweet ▪ [STM11], Takeshi Sakaki và cộng sự ▪ phân tích xu hướng Tweet xung quanh sự kiện thảm họa kép "động đật – sóng thần“ - Phân tích yếu tố tạo bùng nổ sự kiện ▪ [ZJHS11, ZSJSL12] và [DJZL12] 24 ▪ Phân tích các yếu tố góp phần tạo ra sự bùng nổ sự kiện ▪ Dự báo bùng nổ sự kiện. - Phân tích chủ đề ẩn ▪ Được sử dụng trong [ZJHS11, ZSJSL12] ▪ Dữ liệu miền ứng dụng lớn, thu thập được và theo phong cách riêng phù hợp với mạng xã hôi. [STM11] Takeshi Sakaki, Fujio Toriumi, Yutaka Matsuo (2011). Tweet trend analysis in an emergency situation, SWID '11: 3 [ZJHS11] Wayne Xin Zhao, Jing Jiang, Jing He, Yang Song, Palakorn Achanauparp, Ee-Peng June Lim and Xiaoming Li (2011) Topical keyphrase extraction from Twitter, ACL-HLT'11: 9, 379-388, 2011 [ZJV12] Homero Gil de Zúnĩga, Nakwon Jung, Sebastián Valenzuela (2012). Social Media Use 2021 for News and Individuals’ Social Capital, Civic Engagement and Political Participation, Journal of Computer-Mediated Communication 17 (2012) 319–336
  25. IV. Hệ thống phần mềm - Nội dung ▪ Phát hiện vai trò trong mạng xã hội, ▪ Dự báo sự bùng nổ sự kiện trong mạng xã hội theo hai tình huống ▪ Bùng nổ sự kiện toàn cục ▪ Bùng nổ sự kiện cục bộ: một bộ phận mạng xã hội, 25 một số thành viên có vai trò đặc biệt ▪ Hỗ trợ nghiệp vụ - Hai pha ▪ Học mô hình ▪ Sử dụng mô hình - Kết hợp các mạng xã hội ▪ Cho thông tin hỗ trọ phát hiện bùng nổ sự kiện từ June các mạng khác nhau 9, 2021
  26. IV. Học mô hình • Thu thập dữ liệu học từ mạng xã hội, • Tiền xử lý dữ liệu, • Xây dựng tập đặc trưng cho mô hình học, • Thực hiện thuật toán học mô hình, • Đánh giá mô hình kết quả, 26 • Tiếp nhận mô hình có chất lượng [Barnes54] Barnes June 9, 2021
  27. Sử dụng mô hình • Thu thập dữ liệu hiện thời trên mạng xã hội, • Tiền xử lý dữ liệu, trích chọn đặc trưng, • Thực hiện mô hình bài toán • Trực quan hóa kết quả mô hình để hỗ trợ người sử dụng ra quyết định tương ứng. 27 [Barnes54] Barnes June 9, 2021
  28. Thu thập dữ liệu từ Facebook - Các hình thức thu thập dữ liệu ▪ Robert E. Wilson và công sự [WGG12] ▪ Chiêu mộ người tham gia theo ngữ cảnh ngoại tuyến, ▪ Chiêu mộ người tham gia theo ngữ cảnh trực tuyến, ▪ thu thập tự động (crawling) dữ liệu. - Thu thập tự động, trực tuyến 28 ▪ Thu thập thông tin thành viên và đồ thị các mối liên kết bạn bè ❖ Đăng nhập vào tài khoản Facebook ❖ Vào địa chỉ để lấy Access token tương ứng June 9, [Barnes54] Barnes 2021
  29. Thu thập dữ liệu từ Facebook - Một số phương pháp chính ▪ Friends: Danh sách các liên kết bạn bè ▪ News feed: Thông tin cập nhập các hoạt động của bạn bè, Group, Page đã đăng ký, 29 ▪ ▪ - Thu thập từ các page ▪ Danh sách địa chỉ của page June 9, [Barnes54] Barnes 2021
  30. Thu thập dữ liệu từ Twitter 30 - Một số phương pháp chính ▪ - Một số nhận xét June 9, [Barnes54] Barnes 2021
  31. Một số bàn luận - Đề nghị một dự án ▪ Nội dung về hệ thống liên quan ▪ Thực hiện tháng 10/2012-12/2013 ▪ Một số công trình sinh viên NCKH tham gia trực tiếp hệ thống 31 ▪ Kết hợp với các dự án khác June 9, 2021
  32. TRÂN TRỌNG CÁM ƠN 32 KT-SISLAB