新闻中心
数据分析——分析方法(汇总)(数据分析的三种方法)
数据分析中常用的分析方法

逻辑树分析法
逻辑树,又称问题树、分解树等,指的是将一个复杂问题(比如费米问题)拆解成多子个问题进行分析(即将复杂问题变的简单的过程)。

案例:芝加哥钢琴师

PEST分析法
PEST分析是指宏观环境的分析。在分析一个企业集团所处的背景的时候,通常是通过这四个因素来分析企业集团所面临的状况

多维度拆解分析法
多维度拆解分析方法指的是从不同维度去思考一个问题,将整体拆解成部分,可以看到内部的差异(讲复杂问题拆解成简单问题)


注意事项——辛普森悖论:考察问题整体和局部可能会得到不同的结论(在某些情况下对整体数据的分析和对部分数据的分析会得到完全相反的结论)
对比分析法
对比分析法也称比较分析法,是把客观事物加以比较,以达到认识事物的本质和规律并做出正确的评价。对比分析法通常是把两个相互联系的指标数据进行比较,从数量上展示和说明研究对象规模的大小,水平的高低,速度的快慢,以及各种关系是否协调。


假设检验分析法
假设检验分析方法指的是一种提出假设、然后收集证据、进而得出结论的分析方法,它可以帮助我们找到问题发生的原因

群组分析法

用户留存问题
根据业务场景不同灵活使用分组规则
分组规则一:通常按用户开始使用(如注册或购买)产品的月份进行分组

然后观察每组的留存率随时间发生的变化,比如一个月后、两个月后留存率分别是多少。对留存率高/低的用户组分析留存率高/流失的原因

比如目前是四月初,为了分析产品的留存,将前三个月的用户划分成不同的组

在该表增加几列,用于记录用户从开始注册产品到几个月后的留存率

由于制作表格时间的原因,表格右下角有空白数据

计算留存率

当群组分析表格里的数据较多时,直接分析比较困难,可以将各个组的数据绘制成图形,可视化显示留存率随时间发生的变化

所以通过群组分析方法,可以分析某个指标随时间发生的变化
案例以下几类视频平台是按月付费成为会员,用户可以在任意月份取消订购会员,取消订购会员的用户就是流失用户,为了分析用户流失原因,可以使用群组分析方法。

下图是某视频平台的新增用户数,表格按用户注册的月份进行分组,每一行是用户随着时间留存下的用户数,留存率计算如下


当前数据较多,比较困难,可以通过折线图进行观察用户留存率随时间发生的变化。由图中可知,当1、2、3月留存率开始趋于平稳时,4、5、6月的留存率还在趋于下行
由于图中折线较多,可以单独拿出1月和4月的折线进行比较。可以看出二者留存率差别较大。通过群组分析方法,我们发现留存率低的是4、5、6月份组,接下来可以继续分析这三个月留存率下降的原因。比如可能由以下几方面原因导致,公司最近上线新功能,但是这些新功能并不适合这些新用户;还有可能公司最近推广活动带来了新用户,但是公司的产品对这些新用户没有价值导致用户流失。这时候可以用到前面的假设检验分析、相关分析等方法进一步分析,找到问题发生的原因。
群组分析方法步骤:
1.找到留存率低的组(群组分析)
2.为什么留存率低(假设检验、相关分析)
分组规则二:根据用户某月使用产品的天数进行分组
首先介绍推特团队如何使用群组分析方法来发现留存率低的问题以及如何分组。推特是国外版的微博,在发展的早期阶段,团队通过数据分析发现,在新用户注册时,根据用户选择兴趣推荐30个用户最可能感兴趣的账号,这样才能使新用户成为长期活跃用户。为什么是30个账号这个数量?是群组分析方法得出的结论。当时推特面临的问题是,很多用户注册后就不再使用产品,留下的少数人成为了活跃用户。为了解决留存率低的问题,团队按每月使用产品的天数对用户分组分析
以下是推特群组分析的模拟数据
将最后一列的留存率绘制成图形然后比较各组的留存率变化。从图中可看出,当月使用推特7次是一个拐点,这时候留存率趋于稳定在90%以上,即当月使用推特7次的人中,至少有90-100%的用户会留存到下个月
那么一个月使用推特7次的用户比例如何?推特团队又将用户分成3个组,分组规则:核心用户组一个月至少访问推特7次;一般用户组一个月使用产品频率较低;冷漠用户组当月使用产品1次后就不再使用。
分组后统计每一组的用户比例。推特团队发现20%用户属于核心用户,这个比例较高。为什么核心用户留存率高?如果能找到核心用户的共同行为,就能找到用户留存原因。接着推特团队使用了相关分析。
相关分析就是找出哪些因素与分析目标有相关关系。如可以分别计算出可能因素A、B、C和分析目标的相关系数,观察这些相关系数的大小,得知哪些因素对分析目标影响大/小,公司资源有限,一个阶段只能解决一个问题,通过相关关系优先解决影响较大的因素
推特团队通过相关分析发现,关注人数和留存率高度相关。当用户关注人数在30人以上,用户就会留存下来。
通过继续深入分析,推特团队又找到一组相关关系,用户关注的30人里,有多少人回关用户和留存率高度相关。
为什么回关人数越多留存率越高?为找到背后的原因,团队使用电话采访发现如果不到1/3的人回关,那么推特就像一个新闻网站,而市面上还有很多其他新闻网站可供选择;若超过1/3的人回关,那么推特和其他社交产品没有太大区别,如微博,这时候无法体现出推特的独特之处。只有达到回关人数1/3这个比例,才能体现推特区别于其他的独特之处,即让用户及时了解社交圈发生的新鲜事。回关人数就像天平两端,不能过多或过少。
通过群组分析方法和相关分析方法,推特团队找到了留存率低的基因,最后通过分析结论对产品进行了优化,即根据新用户注册时选择的兴趣菜单向他们推荐最可能感兴趣的30个用户账号,这样才能使新用户成为长期活跃用户
金融行业案例:逾期分析买车、买房或使用信用卡时需要贷款,其流程:填写申请材料—贷款平台审核提交的贷款申请材料—若审核通过贷款平台发放贷款至银行账户—贷款到期前需要及时还款—否则贷款平台的催收人员会提醒还款,未按时还款的用户叫逾期用户
其中关键的指标为逾期率——贷款用户里,未还贷款用户的占比
贷款平台面临用户贷款不还的风险,这时可以使用群组分析方法分析放贷后用户的还款表现。
现假设某贷款产品的贷款期限为一个月,按每个月的还款日期分组,第一列是贷款到期的日期,每一行是用户贷款到期后的第几天,逾期率为当天逾期用户的占比。通过比较各组逾期率可以发现哪些组的逾期率变高,此时可以及时调整风险策略以降低逾期率。
如发现2月20及3月20的逾期率比1月20的逾期率高,这时候可以调整风险策略以降低逾期率,如优化放贷的条件,拒绝可能会逾期的用户
总结漏斗模型分析法
什么是漏斗分析方法
从业务流程起点开始到最后目标完成的每个环节都会有用户流失,因此需要一种分析方法来衡量业务流程每一步的转化效率,漏斗分析方法就是这样的分析方法
例如,在淘宝上用户从商品浏览到最后下单购买会经过的业务流程是:
一款商品浏览量是300、点击量是100、订单量是20、支付量是10
某业务环节转化率=本业务环节用户数/上一业务环节用户数
是为了衡量相邻业务环节的转化情况。例如,上表的业务流程第1环节是浏览,业务流程的第2环节是点击,那么点击量环节转化率即为:点击用户数(100)/浏览用户数(300)=33.3%
某业务环节整体转化率=某业务环节用户数/第1业务环节数量
是为了衡量从第一步到该环节为止,总体的转化情况。例如,上表的业务流程的第1环节是浏览量300,业务流程的第4环节是支付量10,那么支付环节的整体转化率即为:支付用户数(10)/浏览用户数(300)=3%
漏斗分析有什么用
漏斗分析的作用是“定位问题节点”,即找到出问题的业务环节在哪。漏斗分析常用于用户转化分析或者用户流失分析,所以漏斗分析中要关注两个指标:用户转化和用户流失
用户转化:经过各个业务环节转化下来的用户,会产生更大的价值。因为这部分用户更加忠诚,更认可业务的流程。随着转化用户的不断增加,留存用户的规模也在不断增大,产品的盈利规模也会随之增加
用户流失:流失的用户数量在每个业务环节都不同。可以分析用户流失主要在哪个业务环节,以及为什么发生流失的原因,是因为业务流程过于复杂,还是产品特性无法完全展现或是其他原因,最终的目的都是不断减少用户流失率
如何使用漏斗分析
以汽车行业为例,可以将业务流程分为3部分:售前、售中、售后
将汽车行业业务流程中的指标与漏斗分析结合, 可以得到环节转化率和转整体转化率,如下图所示
如图中所示,线索-签约的整体转化率=签约数(260)/线索(2000)=13%,也就是每进件100单,会有约13单签约。
漏斗分析的整体转化率,是从整体上评估各环节对初始环节的占比,这样就可以根据一定的比例,去预测或估算未来某批线索的大致转化或者流失情况。例如:未来一个月进件达到4000,那么根据目前这个数值(线索-签约转化率为13%),可以大致估算出,最后的签约量应该在4000*13%=520单左右
漏斗分析的环节转化率,可以评估各业务环节之间的转化情况,通过比较各环节转化率,从而寻找业务瓶颈点,也就是找到最低环节转化率对应的业务环节是哪个。 在上面案例中,环节转化率最低的业务环节为“线索-进件”(转化率为25%),如下图中红框所示
为什么 “线索-进件” 业务环节的环节转化率最低呢?
毕竟将单纯的用户(线索)发展到愿意进行信审评估(进件),是件并不容易的事,但是这个点是否就是急需解决和优化的流程呢?这就需要使用对比分析方法和行业平均值来比较。如果行业平均值为19%,那么这里的25%已经超出行业均值6个百分点了(25%-19%=6%),不应作为最急需解决的点,应着眼后续流程,即寻找后面的转化薄弱点。如果无法得知行业内平均值,可以与本公司历史转化率进行比较,找出表现最差的业务环节,对症下药,持续优化。对于不同的场景,可以灵活运用漏斗分析
下面再来看一个案例。某线上店铺本周的销量降低严重,环比降低32%,从上周的1000单掉到了680单,那么是中间哪个业务环节出了问题?如何改善这种情况?是什么样的原因造成了这样的结果,以及原因是如何产生的,这需要向前探索,去分析之前历经的业务流程。那么,用户从浏览商品到最后下单需要经历的步骤是什么,这些步骤中,哪一个是薄弱环节,影响了订单的整体转化率?
该案例的业务流程是:浏览商品-点击商品-加购物车-提交订单-支付订单。业务流程确定后,使用对比分析方法将本周和上周的数据进行比较,然后用漏斗分析方法来分析,如下图是各周的环节转化率,如下图所示:
在两周数据的对比分析中,可以发现“点击-加购”的环节转化率明显降低(从20%降为13%),这意味着用户点击商品后,却不愿意将商品加入购物车
与业务人员沟通后发现,店铺在本周更换了商品的介绍页,用户看到本期的商品介绍后,加购的意愿却降低了,导致最后订单量降低
找到原因后,就可以针对性的对商品介绍页进行调优和改善,比如与上期的介绍页结构保持一致,色彩优化等等,从而优化最薄弱的业务环节,达到提升运营效率和转化率的效果
注意事项
可以使用漏斗分析方法来分析用户转化问题,不同行业的业务流程不一样,所以漏斗分析图也不一样。如果把漏斗分析方法原封不动地带入某个行业,不去结合所在行业的业务特点,那么分析出的结果很难具有业务指导性
例如,传统的漏斗图是以AARRR模型为基础,即:获客-留存-活跃-变现-推荐,这是以用户增长为核心的漏斗图。但是对于非社区类产品,比如低频且成交周期长的购车场景而言,传统的AARRR模型无法真正表达出汽车行业的业务需求。需要将那么将漏斗分析方法和购车的业务流程结合起来,这就形成了:线索-进件-过审-签约-交车的漏斗图。所以,行业发生变化的过程中,漏斗分析方法需要从用户增长转移到汽车行业,这样的漏斗分析方法才可以产生指导作用
RFM模型
什么是RFM分析方法
把这3个指标按价值从低到高排序,并把这3个指标作为XYZ坐标轴,就可以把空间分为8部分,这样就可以把用户分为下图的8类
把这个图里对应的RFM这3个值对应的价值是高/低,对应到下面这张表里就得到了用户分类的规则
RFM分析方法有什么用
用RFM分析方法把用户分为8类,这样就可以对不同价值用户使用不同的营销决策,把公司有限的资源发挥最大的效果,这就是我们常常听到的精细化运营
比如第1类是重要价值用户,这类用户最近一次消费较近,消费频率也搞,消费金额也搞,要提供vip服务我们日常生活中接触到的会员服务就是这方面的经典案例。根据企鹅智库《2017中国会员经济数据报告》数据显示,用户对信用卡、酒店、航空公司的会员体系最满意
如何使用RFM分析方法
1. 计算R、F、M值计算R、F、M这3个指标,一般需要数据的3个字段:
用户ID或者用户名称消费时间消费金额2. 给R、F、M按价值打分注意这里是按指标的价值打分,不是按指标数值大小打分
最近一次消费时间间隔(R),上一次消费离得越近,也就是R的值越小,用户价值越高
具体实际业务中,如何定义打分的范围,要根据具体的业务来灵活定,没有统一的标准
3. 计算价值平均值分别计算出R值打分、F值打分、M值打分这3列的平均值
4. 用户分类在表格里增加3列,分别用于记录R、F、M3个值是高于平均值,还是低于平均值。
如果一行里的R值打分大于平均值,就在R值高低列里记录为“高”,否则记录为“低”。其他F值,M值也这样比较。最终得到了下面表格里的值
然后和用户分类表格里定义的规则进行比较,就可以得出用户属于哪种类别
小结1)使用原始数据计算出R、F、M值
2)给R、F、M按价值打分,比如按价值从低到高分为1-5分
3)计算价值的平均值,如果某个指标的得分比价值的平均值低,标记为低,反之标记为高
4)用户分类规则表比较,得出用户分类
再回过头看前面这个分类图,在坐标轴的中心,可以理解为某个指标价值的平均值
用户分类后的精细化运营对用户分类以后要做什么呢?那就是针对每类用户如何制定运营策略,这个具体公司业务不同,方法也不一样。这里举例说明前4类用户
1)重要价值用户,RFM三个值都很高,要提供vip服务
2)重要发展用户,消费频率低,但是其他两个值很高,就要想办法提高他的消费频率
3) 重要保持用户,最近消费距离现在时间较远,也就是F值低,但是消费频次和消费金额高。这种用户,是一段时间没来的忠实客户。应该主动和他保持联系,提高复购率
4) 重要挽留客户,最近消费时间距离现在较远、消费频率低,但消费金额高。这种用户,即将流失,要主动联系用户,调查清楚哪里出了问题,并想办法挽回。
这样通过RFM分析方法来分析用户,对用户进行精细化运营。不断将用户转化为重要价值用户。
注意事项
1. R、F、M指标定义,不同业务定义不同。要根据具体业务灵活应用
举例:RFM分析方法分析人脉,针对不同的人,制定不同的联系决策最近一次消费时间间隔(R)可以定义为最近一次见面距离现在的时间。
消费频率(F)可以定义为最近1年见面的频率。
消费金额(M)可以定义为最近1年见面 深度,比如见面是只打个招呼,还是一起吃个饭,还是畅谈人生。
按照这个定义,我们可以重点关注前3类人脉关系
1)重要价值关系:对你的生活和工作非常有价值。他几乎是你最亲密的亲戚、朋友、客户。面对这些人,你应该经常联系,彼此帮助,时不时约出来聊聊天。
2)重要发展关系:联系比较多、一起做过点事,但是聊天是有一句没一句的,这种要重点发展关系。比如把你的困惑或者小秘密和他分享,产生情感连接。
3)重要保持的关系:所谓的熟人,也就是打起电话来记得住这个人,而且也大概了解他的背景,可能很长时间都没有见的那种“朋友”。这种要主动联系,利用节假日登门拜访、共同的朋友持续保持沟通。
冯仑讲过一段话:在正常情况下,人一生交往的关系是三个数:10、30和60。其实正好对应我们刚才讲的三种人脉关系。
2. R、F、M按价值如何确定打分的规则
一般分为1-5分,也可以根据具体业务灵活来调整。
每个分数的范围是多少?这要根据具体业务来定范围的阈值,这就好比你在开车,车速控制在哪个范围内,可以根据路况灵活把握。
同样的,FRM打分的规则可以与业务部门沟通,进行头脑风暴。或者使用聚类的方法对R、F、M的值进行分类,然后给每个类别打分。
总结
杜邦分析法
杜邦分析方法是将各种财务指标综合在一起来评价公司财务管理效果。通常用于公司财务方面的分析。
杜邦分析法的历史背景
1912年,杜邦公司的销售人员 法兰克·唐纳德森·布朗(Frank Donaldson Brown)为了向公司管理层阐述公司运营效率的问题,写了一份报告。
他在报告中提出要分析“用公司自己的钱赚取的利润率”的比率。他将这个比率进行拆解,认为拆解后这个比率可以解释三个问题:
1)公司业务是否赚钱?
2)公司资产运营效率如何?
3)公司债务负担有没有风险?
“用公司自己的钱赚取的利润率”换成现代术语就是净资产收益率,它的计算公式就是上面拆解成三个指标相乘:
1)公司业务是否赚钱?(销售净利率)
2)公司资产运营效率如何?(总资产周转率)
3)公司债务负担有没有风险?(权益乘数)
净资产收益率=销售净利率 X 总资产周转率 X 权益乘数
这份报告中体现的分析方法后来被杜邦公司广泛采用,被称为“杜邦分析法”
案例应用我们通过一个案例,来看下净资产收益率公式中的三个指标。
假如你想开一个包子铺,自己出资100万,发现资金不够。又找隔壁老王借了100万。那么,这家包子铺的总资产是200万,其中投入100万(自己的钱),公司负债100万(找老王借的钱)。
1)销售净利率:公司业务是否赚钱?
销售净利润=净利润/销售额,衡量公司业务是否赚钱。你的包子铺第一个月销售额是20万,刨除各种房租、人工等成本后净利润是2万,那么销售净利润=2/20=10%。也就是每卖出100块钱的包子,你能赚10块钱。2)总资产周转率:公司资产运营效率如何?
资产周转率=销售额/总资产,衡量公司资产运营效率如何。你的包子铺总资产是200万,第一个月的销售额是20万,那么资产周转率=20/200=10%。3)权益乘数:公司债务负担有没有风险?
权益乘数=总资产/净资产,也叫做杠杆率,衡量公司负债经营的情况。你的包子铺总资产是200万,自己出资100万(净资产),那么你的包子铺的权益乘数=200/100=2。杜邦分析公式:净资产收益率=销售净利率*资产周转率*权益乘数
所以,净资产收益率=10%*10%*2=2%
如何使用杜邦分析法
在实际分析中,杜邦分析方法采用金字塔形结构,把各个指标一层层分解。例如下图是万科2018年9月份的杜邦分析
当要分析企业为什么利润下降了类似的财务问题,就可以这样这样的杜邦分析图逐个分解指标来分析