YouTube评论情感差异分析
成员
- 王靖淇(3220190879)
- 孙天艺(3220190867)
- 孙润庚(3220190866)
- 石根 (3220190861)
问题描述
1、问题背景及分析
近年来短视频异军突起,其移动化、社交化的特征使其很快成为最主流的内容形态之一。越来越多的内容创业者加入了短视频领域,该领域的发展也越来越成熟,并且短视频已经无意间扛起文化输出的重担。 而视频的评论表明了观看者对视频情感倾向与喜爱程度,分析短视频的评论文本可以表现视频的质量、受欢迎程度以及文化输出的力度,为改进短视频文化、提高表现力提供了一个评价尺度。 因此,本项目将以美食短视频领域的领跑者李子柒及其团队为案例,对其YouTube上的视频评论进行情感分析,对评论进行情感分类,并分析不同国家之间对视频的情感倾向差异。
2、问题描述
2.1 数据准备
本项目利用爬虫技术抓取Youtube上李子柒的视频评论,经过相关数据清洗后,整理成文本形式。
2.2 准备采用的方法或模型
基于情感词典与机器学习方法(如支持向量机、逻辑回归等)文本情感进行分析。
2.3 预期的挖掘结果
对视频评论进行情感分类,并分析不同国家之间对视频的情感倾向差异。
项目评估
分类任务,主要以准确率与F1值来进行评价。
项目分工
- 王靖淇(3220190879)结果分析 + 文档撰写
- 孙天艺(3220190867)模型构建 + 文档撰写
- 孙润庚(3220190866)数据爬取 + 文档撰写
- 石根 (3220190861) 可视化 + 文档撰写