代码片段分析与标签预测
成员
- 扶聪
- 廖心怡
数据集
csdn和github上的代码片段
处理步骤
-
使用爬虫从两个网站上抓取相应的代码片段
-
对代码片段进行处理,选出对应的标签和注释
-
对标签和注释进行分词
-
人工标注一些没有标签的代码
-
设计算法对代码进行标签预测
目标
对代码片段的特征进行分析,得到一些规律
设计出一种准确率和召回率较高的标签预测算法
项目分工
共同合作
csdn和github上的代码片段
使用爬虫从两个网站上抓取相应的代码片段
对代码片段进行处理,选出对应的标签和注释
对标签和注释进行分词
人工标注一些没有标签的代码
设计算法对代码进行标签预测
对代码片段的特征进行分析,得到一些规律
设计出一种准确率和召回率较高的标签预测算法
共同合作