微博的情感分析及群体性情绪预警

成员

  • 周新宇
  • 张玉萍

描述

训练集共一万四千条数据,测试数据是从爬萌中国上得到的数据,训练数据大约每个事件一万条。事件的定义为网络上发生的以##标记的事件。情感粗粒度为积极情感和消极情感,细粒度为喜欢、厌恶、快乐、恐惧、惊讶、愤怒、悲伤七种。

我们现在想的做法思路是使用词袋模型,然后提取特征,再构建分类器。