本文是《如何七周成为数据分析师》的第四篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉数据可视化,大可不必再看这篇文章,或只挑选部分。
Excel的课程告一段落,今天开始第二周的内容,数据可视化阶段。
数据可视化是一个热门的概念,是分析师手中的优秀工具。好的可视化是会讲故事的,它向我们揭示了数据背后的规律。
大家对可视化的使用认知或许来源于下面这张图。虽然结构清晰,但它只针对Excel图表,不够丰富。本文会结合数据分析师的使用场景展示更多的可视化案例。

为方便演示,文中绝大多数视图为ECharts.js的范例。
了解可视化前,先知悉基础概念。
维度
数据分析中经常会提及维度。维度是观察数据的角度和对数据的描述。我们可以说地区是一种维度,这个维度包含上海北京这些城市。也可以认为销售额是一个维度,里面有各类销售数据。
维度可以用时间、数值表示,也可以用文本,文本常作为类别。数据分析的本质是各种维度的组合,我想了解和分析全国各地的销售额,就需要将地区维度和销售维度结合,如果想知道各个年份的变化,那么再加入时间维度。
说的再透彻点,Excel首行各字段就可以理解成维度。

互联网行业的PV、UV、活跃数也能算作维度。
图表的绘制依赖多个维度的组合。
维度类型和转换
维度主要是三大类的数据结构:文本、时间、数值。地区的上海、北京就是文本维度(也可以称为类别维度),销售额度就是数值维度,时间更好理解了。不同图表有维度使用限制。
数值维度可以通过其他维度加工计算得出,例如按地区维度,count出有多少是上海的,有多少是北京的。
维度可以互相转换。比如年龄原本是数值型的维度,但是可以通过对年龄的划分,将其分类为小孩、青年、老年三个年龄段,此时就转换为文本维度。具体按照分析场景使用。
接下来介绍主要的可视化图表。
闽ICP备13000641号-4