微博特征群体的自动发现
成员
- 于敏(2120141075)
- 张雨(2120141086)
问题描述
数据来自在线新闻网站和社交网络两种平台。
- 评论抓取:对在线新闻网站和社交网络设计不同的爬虫系统,自动获取评论及评论相关数据。
- 评论分析:数据来源于评论抓取,对评论的内容、话题的传播(如网民地域分布)和群体发现(如网络水军)等三项进行分析。
- 结果展示:利用流行的可视化工具展示评论分析的结果。
分工
- 张雨:开发不同的爬虫系统,对在线新闻网站和社交网络评论进行爬取。对评论内容进行关键词提取、参与网友地域分析、情感分析等。
- 于敏:用户自动分类,微博影响力分析、水军发现。对话题的传播进行分析,实现微博特征群体的自动发现及扩充。