今天分享一个分析留存率的方法: Cohort Analysis ,这个方法很简单,也很实用,但是介绍这个方法的中文文章却不多。
前两天一篇叫《打造 10 亿美金产品的核心秘密:用户参与层级模型》的文章在朋友圈疯转。文章是 Pinterest 早期投资人 Sarah Tavel 总结的 用户增长 模型,主要包括三个方面:
- Growing engaged users ( 用户增长 )
- Retaining users ( 留住用户 )
- Self-perpetuating ( 自我驱动 )

图片来自PPT
对于文章中提到的这三点,我自己的理解就是做用户增长的三要素: 新增、留存、召回 。
这三要素今天不展开讲了,感兴趣的朋友可以看上面的文章,今天分享一个分析留存率的方法: Cohort Analysis ,这个方法很简单,也很实用,但是介绍这个方法的中文文章却不多。
什么是 Cohort Analysis ?
Cohort analysis is a subset of behavioral analytics that takes the data from a given dataset (e.g. an eCommerce platform, web application, or online game) and rather than looking at all users as one unit, it breaks them into related groups for analysis. These related groups, or cohorts, usually share common characteristics or experiences within a defined time-span. ( 来自 wikipedia )
解释 Cohort Analysis 之前,我们先来看一个留存曲线,如下图可见,这个产品的用户在第一个月内快速收敛,最终稳定在 10% 这个水平。

留存曲线再加上该产品的新增规模,以及单用户成本和单用户 ARPU 值,我们就能计算出这个产品的用户规模天花板,以及增长模式是不是健康。但如果我们的目标是分析该产品的留存问题,就需要用到 Cohort Analysis 了。
Cohort Analysis 可以翻译成 群体分析 或 分组分析,其实是一种通过细分来研究数据的方法。如下表就是一个从每日新增维度细分的 Cohort Analysis 表格。
- 第一列是分组的维度,下表以用户新增的日期作为细分的维度;
- 第二列是对应的新增用户数;
- 其余列为对应分组下的用户留存率;

怎么做 Cohort Analysis ?
Cohort Analysis 说来也简单,就是做好观察用户的分组;分组先分维度,再分粒度。
什么是维度?如果按用户的新增日期分组,那时间就是维度,如果按新增用户的渠道来源分组,渠道就是维度;其次是粒度,我们说的时间维度是按照月,还是按照天?这是粒度差异;新增的渠道纬度,是新增的来源产品,还是来源的具体网址,这也是粒度的差异;通过基于这两方面的分组可以将对比的差异值逐级锁定,寻找原因。
对于用户的留存分析一般有两个大的分组方向:
- 从用户的获取角度分组
- 从用户的行为角度分组
闽ICP备13000641号-4