您现在的位置:   首页 >> 新闻中心 >> 数据分析

以《大秦帝国之崛起》为例,来谈大数据舆情分析和文本挖掘

发布人:www.yunke.ai 发布时间:2021-01-01 152 次浏览

本文作者将以《大秦帝国之崛起》作为分析对象,来详细阐述在大数据时代数据分析会涉及到的全网舆情分析、微博传播分析以及文本挖掘。

今年开年,因饰演白起的演员王学兵吸毒而拖延上映的《大秦帝国之崛起》(以下简称为“崛起”),终于在剧迷的千呼万唤中播出。

这部根据孙皓晖同名小说改编的电视剧是“大秦帝国”系列的第三部,首部《大秦帝国之裂变》,第二部《大秦帝国之纵横》分别于2009年、2013年播出,均获得不错的口碑,第三部《大秦帝国之崛起》因为上面的原因而补拍,直到今年年初才在央视开播。

本文将以该剧作为分析对象,来详细阐述在大数据时代数据分析会涉及到的三个“子课题”:

  • 全网的舆情分析:基于全网媒体或网民关于该剧的探讨,进行“Social Listening(社会化聆听)”,了解该剧整体口碑概况
  • 微博传播分析:基于新浪微博某条对于该剧具有重大影响力的微博的传播情况,了解该条微博的传播规律,互动粉丝的画像,以及水军的辨识
  • 文本挖掘:通过对该剧相关非结构化文本数据的分析,了解其获得观众较高认可的原因

在接下来的分析中,笔者将结合分析工具(新浪微舆情、头条媒体实验室、Python、Gephi等)、分析思路(分析角度和分析流程)、业务知识(对该剧的了解和原著小说的认知),来谈谈一个完整的数据分析case如何完成,上面所涉及的3个子课题是本文分析的重点。下图是本文的主要内容和文章结构:

1“崛起”的全网舆情分析