一)公司的经营数据真的像你想的一样好吗?
A和B两家公司都是做化妆品电商的平台,他们几乎在同一时间启动公司,在各自的公司运作半年以后,作为同行他们坐到一起交流数据和经营心得。
“我们前半年一共有20000个用户注册了。”A公司说。
“我们前半年一共有30000个用户注册!”B公司说。
那么,A和B两家公司谁经营的更好呢?(注册用户数高的公司,获取新用户做的更好)
“我们的20000个注册里可是有18000个下单用户。”A公司说。
“我们的30000个注册里下单的只有15000个。”B公司说。
A好还是B好?(下单用户数高的公司,注册到下单的转化过程做的更好)
“但是这18000个前半年下过单的客户在上个月还下单的只有5000个了。”A公司说。
“我们的15000个里上个月还在下单的有10000个。”B公司说。
A好还是B好?(在最近一个月下单用户数高的,能说明留存做得好吗?)
“我们留下的这5000个都是最早几个月就获取的还在继续下单的客户。”A公司说。
“我们这10000个下单的都是上个月最新获取的客户。”B公司说。
A好还是B好?
实际情况是,A公司的新增做的不如B公司,而B公司的留存做的不如A公司。那么作为创业者或投资人,如果非要选择的话,A公司是优于B公司的。因为在一家早期公司,产品和用户留存的重要性是优于其他的,如果留存做的足够好,只要掌握了用户增长的方式方法,那么总能够厚积薄发。但如果只有增长、没有留存,那很可能永远都抓不住用户的痛点,最后什么都不剩。就好像B公司,一共18000个下过单的用户,上个月剩下10000个,但这10000个又都是上个月刚刚新增的下单用户,那么很可能发生的情况是,到了再下个月,这10000家也不见了。而A公司至少还会持续的有5000左右的下单用户。
如上图,蓝色为合理的留存变化,最终平缓的维持在一个水平,而红色为非常糟糕的需要尽快改变的情况,随着时间的延长,所有的客户都会流失。结合我们在系列一(“早知道这些我的公司就不会死”系列(一):CAC、LTV、PBP - Everything about a startup - 知乎专栏)中提到的,前一种的LTV(用户终身价值)要比后一种,不知道高到哪里去了。
当然,这里基本只考虑了用户获取和留存的情况,实际上如果真的要比较两家公司,还有更多的交易数据维度等。比如每个客户的客单价是多少,采购频次如何,交付时间多长等等(根据上面我们分析的数据,想想看,客单价高就真的一定更好吗?是否可能有某几家客单价几万,而剩下的客单价几块的情况?)。
所以数据是会骗人的,尤其是平均数据(真实世界会有用户每个月下单2.5次吗?很可能是两个分别下单1次和4次的客户而已),一个中等的平均的用户画像其实完全是用数据创造出来的虚幻的形象。要真正从数据层面掌握一家公司的情况,就要把数据不断地分组和细分,而投资人最常用的一个分析工具就叫做“Cohort Analysis”(分组分析或同期群分析)。
Cohort其实是一个组群的意思,所以Cohort Analysis就是分组分析。而在创投圈里,最常用到的一种Cohort Analysis就是按照不同时期进入的用户,分别考察其后续的行为情况(比如分别统计第一个月、第二个月、第三个月……获取的新客户在后续几个月的下单情况),所以又可以叫做同期群分析。
二)使用Cohort Analysis剖析你的数据
在中文互联网世界里,详细介绍Cohort Analysis的文章少得可怜,而这个工具又是最常用、最易用、最必用的工具,所以下面就给大家具体介绍该如何理解和使用它。
上图是一个最典型的Cohort Analysis表格。其中第一列为自然月份的排列(按照月份为维度一般是投资人会看的时间长度,建议创业公司内部都按照周为维度来监测数据),第二列为对应每个自然月的新增用户数,右侧的表格为当月新增的用户数在后续每个月的留存情况。比如1月公司新增用户80个,在当月流失2个剩余78个(流失和留存的定义每个公司都可能不同,根据不同定义,也可能第一个月的留存都是100%),在2月又流失了3个还剩下75个,以此类推。所以比如3月份的总下单用户数是261,其实是由1月新增还剩下的72个,2月新增还剩下的86个,和3月刚刚新增的103个组成的。
上图是根据第一个表格中的留存数据计算的留存率。这里可以注意到,图2把图1的表格左右倒置了一下,而且这里表格中的时间从1月、2月、3月……改为了0、1、2……第一张表格中的1月、2月等为自然月,而这里则是间隔的月份。0代表当月,1代表1个月之后,以此类推。所以根据这张表格:
1)横向比较,可以看出每月新增用户在后续各月的留存率情况。
2)纵向比较,可以看出不同月份新增用户,分别在当月、下个月、下下个月等的留存表现如何。
对应这两点一家好的公司应该看到的趋势是:
1)横向的留存数据最终会在某个月份之后停留在一个固定的留存率上,比如某个月获取的100个用户,在半年后每个月的留存率都稳定在60%,这就说明这批用户是稳定留存下来的,不然如果留存率是一直下降的(哪怕下降的速度很慢),也会在之后的某个月份归零,也就是说不管新增多少用户,最终都一个都剩不下。
2)纵向的留存数据应该是越来越好的。因为公司和创始团队应该不断的根据历史情况改进产品和体验等,所以越后加入的用户,应该能享受到越好的产品和服务,后续几个月的留存率就应该更高。
对比以上两点和表格中的数据,可以看到我们上面用来举例的这家公司做的还不足够好。
上图是根据留存数据转化的流失率的表格,和留存率唯一不同的地方是,这个数据是根据前一个月的数据分别计算的流失率。比如我们留存率的表格中,1月新用户在0个月的时候的留存率是97.5%,1个月之后的留存率是93.75%,而上图中的流失率分别是2.5%和3.75%(而不是6.25%)。这样组织数据可以让我们更好的看到具体每个月的流失率的情况,也可以知道是哪个月做的最有问题。
上面就基本说清了用户相关的Cohort Analysis该如何做,根据Cohort分析我们可以更好的知道一家公司具体的运营情况,而且是分组的有时间延展性的。你可以看到每月的新增用户数量的变化情况(是否在合理增长?),不同月份新增用户在后续每个月的留存情况(留存率是否合理?是否有某个月的数据反常?比如可能某个月的新增渠道改变,造成新增用户的质量有差异,所以后续每月的流失率都下降更快),每个月的流失率情况(是否某个月因为做了什么动作而造成历史用户的流失率大幅上升?)等等。如果只看当月的总用户情况,那么上述这些问题都会被掩盖,尤其是新增用户数量大的时候,表面看起来公司用户是在增长,但很可能全都是靠新增用户拉动的。
在42章经(ID:MyFortyTwo)公号内回复关键字“Cohort”(并给本文点赞吧 :P)可下载包括上述三张表格的Cohort Analysis的模板,只要加入不同的初始数据就可以直接得到留存率、流失率的分月结果。(Credit to Christoph Janz)
三)进阶版Cohort Analysis
Cohort Analysis用于用户分析的情况基本在上面已经说清了,但其实根据分组分析的特性,Cohort Analysis还有非常多其他的用法。
比如对于一般公司来说,当月的收入其实可以拆为:总下单用户数*每个用户的下单次数*单次的客单价。(比如当月有300个用户下单,平均每个客户下单3次,平均单次客单价100元,那么当月总收入就是90000元)这篇文章看到这里,以后每次看到“平均”两个字,你就应该警惕了。那么多客户,平均3次和100元,但实际上不同客户的情况呢?这里就也可以用Cohort Analysis来判断。比如1月获取的客户,在1月下单的次数是2次,2月下单的次数是3次,3月下单的次数是4次,那么在cohort表格中,我们就可以用下单次数来替换留存率和流失率所对应的位置。
于是就得出上方表格所示的情况。同理,客单价也是可以分别对应到不同的位置,就不再赘述了。所以,通过不同维度的Cohort Analysis,你可以看到用户随着留存时间的增加,是否与平台建立了更深的关系?每个用户是否会购买更多地次数,或每次是否会购买更多的金额?这样,最终每个月的销售额都可以被分解到非常细的维度。
而且,除了按不同时间获取的客户来分类,还可以按照不同的行为分类,比如表格的第一列可以是当月app浏览时间超过10小时的用户,也可以是参与某种优惠活动的客户等等,而右侧表格可以监测该用户群体的各种行为情况,比如参与了优惠活动的客户在后续几个月的留存是否会更高?下单金额是否会更高?等等。总之,左侧是按照某种定义区分的用户群体,右侧是这些用户可被监测的某种动作。
所以,只有真正掌握了Cohort Analysis,才能够对公司真实的运营情况有更好的了解,而为了更好地使用Cohort Analysis,从一开始的数据监测和组织结构就要做好准备。就像开尔文所说的:
“If you cannot measure it, you cannot improve it.”
你不能监测的东西,也无从改善。