注意: 上方的内容不要删除
项目题目
结构化的情感:社交媒体转基因议题上民族主义和民粹主义的社会意涵
成员
- 胡勇 (3120180994)
- 阎覃 (3120181054)
- 兰天 (1120151828)
- 徐恒达 (1120151811)
问题描述
1、问题背景分析
转基因话题在中国一直未曾停歇,可以说是科学 传播领域的一个热点话题。关于转基因的争论由来已 久,“挺转”与“反转”已经形成泾渭分明的两大阵营。双 方的争论小到家里的大豆油问题,大到国家食品安全 战略问题,从科学到伦理操守,议题战线极为广泛。多 年的挺转与反转之争议,基本上处于谁也说服不了谁, 而最终很少相互认真参证,而是各说各话。就媒介镜像 中的“转基因”议题来看,事实上存在着两套话题体系的 博弈,其一正一反,双方在各自的领域坚守着自己的话 语权力,围绕着几个具体的问题,比如转基因技术/食 品对于身体的安全性、转基因技术/食品对于人类有什 么好处/坏处、中国是否应该尽快推广转基因的商业化、 是否应该引进从美国(孟山都等公司)进又的转基因作物等议题展开争论。
然而不为人注意的是,转基因在中国的大讨论中, 不同的话语实践中夹杂着多样化的情感生产和表达,关 于此一话题,有国际贸易框架下的支持和反对,也有食品安全的担忧,抑或民粹主义情绪下的愤怒和恐惧,不一而足。 此外,不管是政府和科学家,还是媒体从业人员和公众,在参与到这复杂议题下的讨论和行动时,从 一个理性的个体化身为充满激情的社会活动家、键盘侠,通过高昂或冷静地情感表达,在线上和线下的公共 领域中推动着事态的发展。 这种情感实践不仅推动着 转基因话题在中国的升温,并且界定了中国社会语境下转基因议题的深刻内涵。它的特点是对证据故意视而不见,对权威的不信任,以及对通常源于恐惧或焦虑的基于情感的论点的吸引力。
在中国网络民族主义、民粹主义和社交媒体崛起的双重背景下在转基因争论中,网民民族主义和民粹主义情绪的表达,受到哪些因素的影响,包括社会结构 和个体的网络行为方面,是本次工作所关注的重点。
2、问题描述
2.1 数据准备
本研究所聚焦的是社交媒体中的转基因话题, 因此 在搜集新浪微博中转基因数据的过程中,以“转基因”为关键词,获取新浪微博中与此有关的微博及其账户信息。
数据的采集是通过微博高级搜索接又并通过 scrapy 爬虫框架实现,其具体流程如下:
- 首先,以“转基因”关 键词为线索,在新浪微博中检索到所有相关的微博。
- 其次,根据被检索到的微博获取本研究所需的数据,其 括两个层面:一,微博博文层面的数据,包括检索到的 有关微博的正文、发文时间、网页链接、点赞数、转发 数和评论数; 二,微博账户层面的数据,也就是所检索 到的微博其发文账户的数据,包括账户名、账户 ID、账 户的认证信息、关注数、粉丝数、发文数、账户地理信 息、微博用户性别、用户年龄和账户的简介。
- 最后,将这些信息依次爬取并存储至 MongDB 数据库。
在采集数据的时间区间上,本研究将其设定为微博推出的时间也就是 2009 年 8 月 14 日 —2018 年 7 月 22 日,覆盖了新浪微博整个发展周期, 通过微博的检索功能,其显示共有 10692460 条与转基因有关的微博,在微博数据爬取的时候筛选了原创的标签后, 最终采集微博数为 886835 条,与转基因议题 有关的微博原创率是 8.3% 左右。
2.2 模型建立
通过深度学习的方案,构建一个情感分类的模型,采用LSTM网络提取文本特征,最后用MLP+softmax进行文本分类
2.3 预期的结果
成功构建民族主义和民粹主义的情感分类器
项目评估
由于这是一个分类任务,所以最后将采用准确率,精确率,召回率和F1值来衡量模型效果
项目分工
- 胡勇 (3120180994) 微博爬虫 + 文档撰写
- 阎覃 (3120181054) 数据分析 + 文档撰写
- 兰天 (1120151828) 模型构建 + 文档撰写
- 徐恒达 (1120151811) 模型构建 + 文档撰写