您现在的位置:   首页 >> 新闻中心 >> 数据分析

大数据分析:王者荣耀英雄背景下的分词报告

发布人:www.yunke.ai 发布时间:2021-01-01 152 次浏览

文章对王者荣耀英雄展开分词分析,一起来看。

中文分词在中文信息处理中是最最基础的,无论机器翻译亦或信息检索还是其他相关应用,如果涉及中文,都离不开中文分词,因此中文分词具有极高的地位。

NLP刚入门,想找个东西练练手,于是便看到了手边的农药。。。

思路

  • 使用Python爬取王者荣耀官网所有英雄的背景资料文本信息
  • 使用RMM**逆向匹配分词算法对文本进行分词处理,计算词频
  • 使用Excel出具简单的可视化报告

结果

爬取了王者荣耀官方网站-腾讯游戏71位英雄的英雄故事文本,共计59793个字符。