YouTube评论情感差异分析

成员

  • 王靖淇(3220190879)
  • 孙天艺(3220190867)
  • 孙润庚(3220190866)
  • 石根 (3220190861)

问题描述

1、问题背景及分析

近年来短视频异军突起,其移动化、社交化的特征使其很快成为最主流的内容形态之一。越来越多的内容创业者加入了短视频领域,该领域的发展也越来越成熟,并且短视频已经无意间扛起文化输出的重担。 而视频的评论表明了观看者对视频情感倾向与喜爱程度,分析短视频的评论文本可以表现视频的质量、受欢迎程度以及文化输出的力度,为改进短视频文化、提高表现力提供了一个评价尺度。 因此,本项目将以美食短视频领域的领跑者李子柒及其团队为案例,对其YouTube上的视频评论进行情感分析,对评论进行情感分类,并分析不同国家之间对视频的情感倾向差异。

2、问题描述

2.1 数据准备

本项目利用爬虫技术抓取Youtube上李子柒的视频评论,经过相关数据清洗后,整理成文本形式。

2.2 准备采用的方法或模型

基于情感词典与机器学习方法(如支持向量机、逻辑回归等)文本情感进行分析。

2.3 预期的挖掘结果

对视频评论进行情感分类,并分析不同国家之间对视频的情感倾向差异。

项目评估

分类任务,主要以准确率与F1值来进行评价。

项目分工

  • 王靖淇(3220190879)结果分析 + 文档撰写
  • 孙天艺(3220190867)模型构建 + 文档撰写
  • 孙润庚(3220190866)数据爬取 + 文档撰写
  • 石根 (3220190861) 可视化 + 文档撰写