对于业务人,比如产品或运营,数据分析能力的核心不在方法和工具,而在于思维。
- 大多数人错误地理解了数据分析,把数据分析能力提升的关键放在了方法和工具;
- 对于业务人而言,数据分析的核心思路是,得到两个变量之间的「量化关系」,用以解释现象;
- 数据分析的步骤,感知问题、提出假说、选择表征、收集数据、分析验证;
- 提出假说和选择表征是很多业务人数据分析做不下去的原因。
数据分析的方法崇拜
在和团队小伙伴分享的的时候,发现一个问题:
我问,你怎么看数据分析能力?如何评价自己的数据分析能力?
大家的回答主要是这样的:
运营是基于数据驱动的,但是拿着很多数据,不能分析下去,主要是对于excel的一些陌生的公式、函数都不太会,我要专门去学一下excel
我感觉导致现在转化率低低原因是xxx,最近接触到很多用户都是这么反馈的,但还没有找到好的分析方法
产品的数据分析能力还是很重要,我想去学个R,能够去构建量化模型
……
以上,我觉得太在意数据分析方法和工具,我觉得都还没有把握住一个业务人数据分析能力的核心。
业务人考虑的最重要的问题是,业务结果到底怎么样,出现了什么问题,原因是什么,可能的解决方案是什么。
数据分析只是手段,它的误区就是,太在意方法和工具。
而最缺少的,恰恰是最重要的思维。
数据分析的本质
数据分析最重要的思维就是,不断确定业务中两组变量之间的关系,用以解释业务。
收入、转化、用户规模、用户活跃等,我们称为现象。而只有通过数据量化的现象,我们才能精准感知。所以,数据是用来描述现象的,是被量化的现象。这就是数据统计在干的事情,比如建立数据漏斗,严格意义上这就是数据统计。
而数据分析,就是寻找这些被量化的现象之间的「关系」。这个关系就是y=f(x)。找到两个变量之间的关系,多找到一种这样关系,在实践中,就多一种有效手段。
所以,在数据处理层面,有这样两个方式:
- 数据统计——利用数据体现现象,比如建立数据漏斗
- 数据分析——利用数据寻找现象关系,比如城市特征和活跃之间的关系
本文核心是围绕数据分析进行展开。
比如,做社群运营的同学,常常会想,到底什么因素在影响用户的活跃度。在实践的过程中,我们感觉到,不同的进入社群的时间点可能是活跃度比较关键的影响因素。于是,尝试通过数据定义,确定x=进群时间点与开群的时间差,y=第一月活跃率。我们将x变量按天为单位氛围不同类别,得到了以下的关系:

*x变量每类样本N>50,且基本是同一时间的社群,排除了其他因素影响
当我们得到以上图示的关系其实足以指导我们的工作了——做社群运营,尽量做到及时开群,不要让用户等待,消耗热情。
所以,数据分析最重要的思维就是,不断去寻找可能与业务结果有关的变量,确定这两个变量之间的关系。多确定了一种关系,就多了一种手段,少了一些瞎干。
要做到这些,excel的基础功能,妥妥解决。通过统计学方法回归分析出一个量化模型或论证其信效度。
因为,对于大部分业务而言,动作的精度有限,所以不需要分析的精度太高,同时,统计方法的量化模型无法用业务逻辑进行解释,只能预测,对于实操类业务意义不大。
业务中数据分析的一般方法
前面简单说了数据分析的方法工具误区和数据分析核心是要去寻找两组变量之间的关系。
那在业务中,如何进行有效的数据分析。我将数据分析归纳为以下五个步骤:
- 第一步,感知问题
- 第二步,提出假说
- 第三步,选择表征
- 第四步,收集数据
- 第五步,分析验证
闽ICP备13000641号-4