社区问答网站的专家发现

题目确定时间:

成员

  • 王晶 2120151040
  • 韩学博 2120150990
  • 李凯霞 2120151003
  • 张林 2120151062

数据集

archive.org 网站下面的 Stack overflow 的公开数据

处理步骤

通过网页数据建立一个社交网络(图)并分析该网络:

1.得到所有问题的帖子和接受的答案
2.得到所有答案的帖子
3.得到所有包含某一关键词的帖子,只要id
4.选择标签为某一关键词的问题
5.识别回答被接受的用户
6.创建一个图并找到用户的排名
7.输出结果并保存

目标

通过分析社交网络中的各种指标,找出某一领域中,比如JAVA,C#,的专家

项目分工:

  • 王晶 2120151040:原始数据搜集,整理,数据预处理代码。
  • 韩学博 2120150990:数据预处理代码,数据分析代码。
  • 李凯霞 2120151003:数据预处理代码,数据分析代码。
  • 张林 2120151062:数据分析代码,数据可视化。