最近放假闲来无事,自学Python爬虫技术,而又一年即将结束,便想回顾2018这一年产品人都在关注什么?于是爬取了人人都是产品经理的网站数据,看看能不能在其中发现一些有趣的东西。Enjoy~

人人都是产品经理网站(以下简称“人人”)是互联网产品经理和运营人的学习社群,于是选择爬取人人的网站数据用来分析。笔者爬取了2018年2月到2019年1月的文章发表和阅读数据,从作者和读者两个视角进行分析。
一、分析的技术思路

前期准备主要是数据的爬取和清洗,爬取了文章标题、阅读量、评论数、收藏量、评论数和发表时间等字段。再确定分析的目的来确定问题分析的框架,**针对框架中的问题进行数据可视化和撰写分析报告。
为了避免爬虫对网站服务器造成负担,笔者已经在上述链接网页中已经上传所有爬取的数据,大家要数据的可以直接下载,避免大规模爬取。
二、分析框架
本次分析的文章时间是从2018年2月到2019年1月,从作者发表文章和读者阅读两个视角进行分析。

闽ICP备13000641号-4