社区问答网站的专家发现
题目确定时间:
成员
- 王晶 2120151040
- 韩学博 2120150990
- 李凯霞 2120151003
- 张林 2120151062
数据集
archive.org 网站下面的 Stack overflow 的公开数据
处理步骤
通过网页数据建立一个社交网络(图)并分析该网络:
1.得到所有问题的帖子和接受的答案
2.得到所有答案的帖子
3.得到所有包含某一关键词的帖子,只要id
4.选择标签为某一关键词的问题
5.识别回答被接受的用户
6.创建一个图并找到用户的排名
7.输出结果并保存
目标
通过分析社交网络中的各种指标,找出某一领域中,比如JAVA,C#,的专家
项目分工:
- 王晶 2120151040:原始数据搜集,整理,数据预处理代码。
- 韩学博 2120150990:数据预处理代码,数据分析代码。
- 李凯霞 2120151003:数据预处理代码,数据分析代码。
- 张林 2120151062:数据分析代码,数据可视化。