话题检测与跟踪

成员

  • 乔杨(2120141035)
  • 刘建鸿(2120141026)

数据集

采集自搜狐体育(http://sports.sohu.com)的1000篇中文文章

处理思路

  1. 抓取数据
  2. 预处理
  3. 采用LDA等算法进行话题检测
  4. 结果分析,数据可视化