代码片段分析与标签预测

成员

  • 扶聪
  • 廖心怡

数据集

csdn和github上的代码片段

处理步骤

  1. 使用爬虫从两个网站上抓取相应的代码片段

  2. 对代码片段进行处理,选出对应的标签和注释

  3. 对标签和注释进行分词

  4. 人工标注一些没有标签的代码

  5. 设计算法对代码进行标签预测

目标

对代码片段的特征进行分析,得到一些规律

设计出一种准确率和召回率较高的标签预测算法

项目分工

共同合作