本文笔者将对微博上,“昆山反杀案”事件发展过程中,用户的情感变化进行分析和通过图标可视化,从中分析出舆论传播过程中用户情感传播特征以及寻找出情感传染的规律。

一、摘 要
随着社交平台的发展与普及,微博逐渐成为网民表达态度、发表意见以及进行深入互动的重要平台。
微博用户社会参与程度不断加深,其情绪传染与现实公共事件有关,而情绪积累与传染可能引发大规模群体事件。因此,有必要对微博情感进行分析,判断用户情感类型,分析情感传播特征继而找寻情感传染规律。
本研究对“昆山反杀案”微博进行情感分析与可视化,发现:用户评论的高频情感词,尤其是处于中心位置的情感词集合,反映网络舆情事件的主导情感基调,而高频词呈现出更加主观的态度或观点,能反映用户对整个事件的自身真实情绪与主观性评价。
用户情感与事件基调走势呈一致性,情感传染呈明显聚类现象。微博用户影响力越强其情绪传染效果越明显,在一定程度上主导着网络舆论的发展方向。
二、研究背景与问题的提出
据中国互联网报告(CNNIC)统计:截至2018年6月,我国网民规模达8.02亿,互联网普及率为57.7%;2018年上半年新增网民2968万人,较2017年末增长3.8%;在移动互联网市场,微博用户增长迅速,手机微博用户使用率达40.1%,较2017年末增长2.1个百分点,用户规模半年增长10.2%。
[1]随着社交平台的普及,微博凭借其表达的公共性、即时性、社交化和内容的简短化,已成为网民最常用于进行表达意见、情感的平台。微博内容中的情感元素也开始受到了越来越多研究者的关注。
针对微博的情感分析一般是以微博作为数据来源,挖掘和分析当中的主观信息以判断文本内容显示出的情感倾向。
目前,国内关于微博情感分析分类方法是按其粒度划分为粗粒度和细粒度情感分析两大类。粗粒度的情感分析主要是基于篇章级和句子级,而且在分析过程中仅考虑情感词,并未考虑评价对象及其属性的情感;细粒度的情感分析一般指词汇级情感分析[2],对情感进行分类是细粒度情感分析的重要方面之一。
学者们利用众多角度和方法对微博上的情感进行细粒度地分类,形成了各种“情感词库”。
- 潘明慧和牛耘基于词典的规则识别微博所表达的喜、哀、怒、惧、恶、惊六种情绪[3];
- 王志涛等在40万条新浪微博数据中对新词进行挖掘和情感识别,构建了新情感词词典,扩充了已有的情感词资源[4];
- 张珊等将目光转向其他表达情感的情感元素的词典构建上,利用微博中的表情图片并结合情感词语的方法构建了中文微博情感语料库[5];
- 无独有偶,王远文等将表情情感词典反作用于对应的微博文本,重新度量其情感词的倾向值,改进现有的情感词典[6];
- 敦欣卉等在对微博进行细粒度分类时将情感分成八个类别[7],同时还有不少学者以“喜怒哀乐”为基础对情感做了细致分类,不断提高对情感分类的科学性和丰富性。
除此之外,互联网平台的交互性和开放性,使这些情绪大规模传染成为可能。
学者们提供大量的证据说明人类倾向于模仿周围人的面部表情、语言表达、动作及行为,在这一过程中,主体的情绪体验会受到自身面部表情以及其他非语言线索影响[8]。在社交网络上,人们接触带有情感倾向内容时,会对情感产生反馈,如共鸣、强化或者分歧等。
现有的研究表明Facebook、twitter两大国外主流社交平台都存在情绪传染现象:例如Kramer等通过检查Facebook状态更新来研究大规模情绪感染现象,发现在用户发布带有情感倾向的新动态后,他们的朋友更有可能发布带有相同情绪的内容。张少群[9]等对十万多个twitter用户情绪与时间序列进行分析,验证了在twitter平台用户们的情绪既会被熟人的情绪所传染,也会被非熟人的情绪所传染[10]。
快乐、悲伤、抑郁等基本情绪传染现象也受到学者们关注,不同情绪的唤起与传染特征也有所不同。
以“快乐”这一情绪为例,当内外刺激满足个体需要时,个体就会产生积极的情绪[11]。而同性之间更容易察觉出对方的快乐,而在情绪发生传染时,女性的快乐程度比男性要低,而处在其社交网络中心的人快乐程度要比处于社交网络中心边缘的人群要高[12]。
“孤独感”是学者们关注较多的情绪之一,有分析表明:孤独情绪往往产生在集群中,朋友越少的人往往越感到孤独,而女性受到孤独情绪传染比例和程度均比男性要高[13]。
学者对比发现:抑郁、孤独和愤怒等负向情绪比愉快、兴奋等正向情绪更容易传播[14],徐翔等对今日头条帖子及评论进行分析,发现内疚、惊骇、失望、哀痛、遗憾、悲伤等负面情绪传播效果较好,而带有同情、喜爱、赞扬、安心、快乐等情感传染效果较差[15]。
尽管当下关于微博情感分析的研究不少,但大部分研究都将“情感分类模型” 和“情绪传染机制”作为研究目标,旨在提高微博当中情感词的提取效率和准确度,以及对微博情感的时序变化作出描述,在对特定的情感或情绪在公共事件中的唤起、传播机制的研究仍然存在一定的空白。
基于以上研究,我们提出:
- 微博用户情感是如何分布的?高频情感词出现的原因?情感词情感基调与事件本身的关系是什么?
- 微博用户情绪是如何传播的?是广播式传播还是病毒式传播?
- 微博用户情绪传染是否具有某种规律?情绪是否有聚类现象?相同情感是否会收到同样的情感回馈?强影响力微博用户是否具有更强的情感传染力?
三、研究思路与方法
2018年8月27日,刘海龙醉酒驾驶宝马轿车强行闯入非机动车道,与正常骑自行车的于海明险些碰擦,双方遂发生争执。刘海龙持刀砍向于海明,随后被于海明夺刀并追砍,刘海龙经抢救无效死亡。
该事件视频在微博曝光后,引起了全网民的关注与讨论,基于朴素的正义感,多数民众本能地支持于海明,也有一些法律界人士从法理角度论证于海明“杀人”行为的非正当性。
与此同时,有不少网民对刘海龙的涉黑背景却曾被昆山市授予“见义勇为奖”等表达了对政府公信力的质疑,网民复杂情绪不断扩展。9月1日,昆山警方和检察机关相继发出通报,称于海明行为属正当防卫,无需承担刑事责任,网民又形成一致“叫好” 的声音。
“昆山反杀案”发生与审理过程经历了一个完整生命周期,集合了网民“恶”、“喜”、“厌”、“好”等多种情绪,能够真实还原网民的情绪反应。
本研究以 “昆山反杀案”微博为数据基础,基于词典匹配的情感分析方法,即通过匹配情感词典,确定给定文本中积极情感词和消极情感词比例,或对不同情绪类别(如高兴、伤心、愤怒、喜悦等)进行加总,从而判定给定文本的基本情感, 并对情感类型进行判断和识别[16],进而考察情绪传播的特征与规律。
本文主要结合了以下两种研究方法来开展研究工作,具体包括:
- 网络科学方法:将微博系统中用户转发关系抽象成网络科学中的节点和连边,进而构建用户情感传染网络以及单条微博的传播级联树,这种方式的好处在于使得我们能够透过显现看本质,通过对具体实际网络的拓扑性质分析来得到情绪传播的规律。
- 情感挖掘方法与技术:本文使用Python语言中Pandas框架进行数据的分析和处理,并使用基于情感词典的方法来分析情感,以及使用Matplotlib和Pyecharts这两种绘图库对分析的结果进行可视化,并基于Anaconda软件中的Spyder进行代码的编写和调试。
闽ICP备13000641号-4