社交网络事件事态挖掘

成员

  • 吴松泽
  • 徐程程
  • 刘琳

项目简介

  • (1)事件的事态有可能根据事件的时间发展产生变化
  • (2)针对一个完整事件,初步分起始、发展、高潮、拐点、衰退5个阶段
  • (3)该任务主要针对一些事件,对其进行事态划分
  • (4)拟采用基于LDA的话题漂移方法进行分析
  • (5)输出事件的5个事态位置

必要准备

  • (1)数据采集:采用爬虫工具,对一些热门事件进行数据采集
  • (2)预处理:针对不规则语料信息进行预处理及清洗,抛弃一些坏语料
  • (3)模型训练:针对大量文本信息进行事态位置训练

项目分工

  • (1)吴松泽:事态分类算法实现
  • (2)徐程程:文本数据采集
  • (3)刘琳: 文本数据预处理