话题检测与跟踪 成员 乔杨(2120141035) 刘建鸿(2120141026) 数据集 采集自搜狐体育(http://sports.sohu.com)的1000篇中文文章 处理思路 抓取数据 预处理 采用LDA等算法进行话题检测 结果分析,数据可视化