新闻中心
用户行为数据分析?(用户行为数据分析模型)
一. 项目背景及分析思路¶
(一)项目背景
近年来电商行业发展迅速,已经成为人们生活中不可或缺的一部分,与此同时电商的竞争越来越大,获客成本也在不断的攀升。在此情况下由流量思维向用户思维转变是必要的,我们需要对用户数据进行分析来为企业经营提供决策。此次项目通过相关指标对用户行为进行分析,探索用户购买的规律,挖掘可能存在的问题,并提出相关建议,实现更加精细和精准的运营,让业务获得更好的增长。
(二)分析思路
本次项目选取以下五大指标进行分析
1.常见流量类指标分析:电商平台有巨大的流量优势,对常见流量类指标分析即可发现流量的变化趋势和存在的问题。
2.常见用户类指标分析:用户是电商平台运行的关键,通过对用户购买次数等指标的分析,可知道购买次数分布和用户忠诚情况等。
3.用户购买行为分析(漏斗模型):通过用户购买行为分析,了解各行为环节转化情况,进而提供改善建议。
4.用户价值分析(RFM模型):对用户人群进行划分,进而有针对性的进行运营策略的调整。
5.用户购买商品分析:可了解商品品类和具体商品销售情况,对之后坑位调整和算法推荐提供有利帮助。二. 总结
1、通过对流量类指标进行分析发现:
1)一个月内的页面访问总数为971187,访问用户总数为8477,平均每位用户每天的浏览为4次。
2)只浏览了一次就离开了app的用户数为85位,跳失率为0.0086,基本可以忽略不计,说明淘宝有足够的吸引力让用户留在app中。
3)通过计算pv和uv的日环比,发现双十二期间PV涨幅达41%,UV涨幅达16%,均达到最大值,再和公司活动前制定的目标进行比较,是否完成预设目标。
2、通过对用户类指标进行分析发现:
用户的平均购买次数为2~3次,25%的用户购买次数超过3次,其中购买次数最大为82次。复购率为52%,一般在50%是正常的,复购率越高说明消费者对品牌的忠诚度就越高,提高复购率也是相当提升了店铺的权重。
3、通过对用户行为进行分析中发现:
1)用户使用APP有一定的时间规律,上午5点到10点,下午6点到晚上10点各类行为均有明显的上升趋势,晚上10点后开始下降,商家可以参考用户的活跃时间段,加大广告的投入增加商品曝光,对应采取一些促销活动。
2)在双12期间,活动效果明显,四种用户行为同时达到峰值,加入购物车这一用户行为的访问量高于收藏与支付的访问量。而一天中,19点到22点是用户活跃的高峰期,可重点关注运营情况。
3)用户行为通过漏斗分析,可以看出从浏览到收藏加购这一环节的转化率为5.52%,从具有购买意向到支付的转化率为20.02%(因为不知道具体的行业所以不做对比分析,一般来说高于大部分同行的转化率就算不错了)。这说明两个阶段都需要着重提升。前者可能由于产品关键词不准导致流量不精准,产品不满足消费者需求或者详情页面不够好等,后者可能性价比不高,没有优惠活动等,需要对其原因进一步挖掘分析。
4、通过对用户价值进行分析发现:
用户主要为重要挽回客户和重要发展客户,重要价值客户和重要唤回客户人数很少。根据不同用户类型来制定运营策略,实施精准营销。
5、通过对购买商品进行分析发现:
从商品品类分析来看,每类商品平均被购买了4.8次,75%商品品类只被购买了4次以内,说明存在小部分商品品类很受欢迎,其中最大的被购买量的是162次,拉高了平均值。
1)针对品类转化率比较好的,可以考虑加大广告投入增加该品类的曝光以提高销售额。
2)针对浏览量大,但转化率低的品类,需要具体分析是整个品类的商品转化率都低还是部分商品转化率低,要逐步淘汰转化率低的商品,对品类进行优化 。
从单个商品分析来看,超过75%的商品只被购买了1次,说明没有出现购买次数非常集中的商品,商品售卖主要依靠长尾商品的累积效应,可能没有爆款商品的带动。对比销量靠前和浏览量靠前的商品,可以发现推荐的机制可能存在问题,推荐的商品不是用户感兴趣的或需要的商品。三. 数据来源及数据处理
数据来源阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1; 数据集包含了2014年11月18日至2014年12月18日之间,一个月内的淘宝APP移动端用户行为数据。 由于总记录为1亿条,数量过大,为了实现数据和硬件适配的可能性,此次只分析1048575条数据。

(二)缺失值处理

(三) 异常值

(四)重复值

(五)时间格式化处理

四. 数据分析
(一) 流量类指标分析
4.1.1 页面总浏览量和总访客数量
4.1.2 不同日期维度下pv和uv的变化情况




4.1.3 不同时间维度下PV、UV的变化情况



根据折线图可知,早上5:00-10:00,18:00-21:00这两个时间段pv有较明显上升;uv从早上6:00-10:00有较明显增加,而后保持稳定数量,18点后缓慢增长,到21点后开始下降;pv、uv变化符合大众工作作息时间,侧面证明数据是真是有效的;晚上8点到10点,达到峰值,可以参考用户的活跃时间段,采取一些促销活动
(二) 用户类指标分析
4.2.1 用户购买次数

根据上述结果可知,用户的平均购买次数为2~3次,有超过一半的用户购买次数在2次以内,25%的用户购买次数超过3次,其中购买次数最大为82次
4.2.2 用户购买次数分布

根据上图可知,绝大部分用户购买次数在10次以内
4.2.3 用户的复购率

可以看出11月18号-12月18号期间用户的复购率为52%,一般来说电商复购率大于50%还算可以了,比例越大,用户忠诚度越高。
(三)用户行为指标分析

4.3.1 不同日期维度下用户行为的变化


相比这三类行为,页面访问量pv较高,前面已经单独进行了分析这里不再重复;总体看来四种行为的波动情况大体一致,每周五各项指标均为最低,加购行为数明显高于收藏和支付行为数。双十二活动当天加购和购买量均达到顶峰;收藏的增长比较小,应该是大型活动大家都早已选好了商品
4.3.2 不同时间维度下用户行为的变化


整体趋势基本一致,加购行为量高于收藏行为量。可以看到每天上午5点到10点,下午6点到晚上10点有明显的上升趋势,晚上10点后开始下降,基本符合绝大部分人的作息时间规律。 商家可以参考用户的活跃时间段,加大广告的投入增加商品曝光,对应采取一些促销活动
4.3.3 双十二当天用户行为分析
4.3.4 活动前一天用户行为分析
经过两张图的对比分析,发现在0点之前(11月11号)购买数处在很低的水平,而购物车的行为数剧增,因为双十二活动是在0点开启,所以用户在为双12零点的抢购做准备0点之后购买数达到第一个高峰;双十二当天早上八点到10点之间迎来了第二个高峰,此时部分用户已经醒了开始下单商品;而晚上八点到十点经历
4.3.5 用户行为漏斗模型分析
可以看出从浏览到加入购物车/收藏这一环节的转化低较低只有5.52%,说明从浏览到进行收藏和加入购物车的阶段是指标提升的重点环节。可能由于产品不符合消费者需求或者详情页面不够好等,需要对其原因进一步挖掘分析。
(四) 用户价值分析(RFM模型)
RFM模型解释:
R(Recency):客户最近一次交易时间的间隔。R值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。
F(Frequency):客户在最近一段时间内交易的次数。F值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。
M(Monetary):客户在最近一段时间内交易的金额。 M值越大,表示客户价值越高,反之则表示客户价值越低。4.4.1 数据计算
付费用户总人数为 4330 人4.4.2 建立模型
需要分别对F、R、M 分别计算各自的平均值,要注意三个指标数据存在极大值、极小值的情况,这对结果会产生一定的误差,所以解决方案是将其标准化,设置分段区间
,5分制,5分为最高
R-最近购买时间:最近购买时间的区间为0-30,将其分为5档,0-6,7-12,13-18,19-24,25-30分别对应评分5到1 F-最近一个月的购买频率:区间为1-82,将其分为5档,1-15,16-30,31-45,46-60,61-82分别对应评分1到5可以看出重要发展客户和重要挽留客户比例很高,有部分原因是缺失订单金额的数据,导致M评分都为高;另外应该拉长时间维度进行分析;
根据不同用户类型来制定运营策略,实施精准营销:重要价值客户:是体系中最有价值用户,需要重点关注,提供vip服务。并且活动投放时需谨慎对待,不要引起用户反感重要发展客户:用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,提高用户使用产品的频率重要保持客户:主动联系,提高复购重要挽留客户:需要找到问题(五) 购买商品分析
4.5.1 购买商品的品类分析
由上述描述统计可知,有销售的品类有2066种;每类商品平均被购买了4.8次,75%商品品类只被购买了4次以内,说明存在小部分商品品类很受欢迎,其中最大的被购买量的是162次,拉高了平均值
销量前10商品品类的售卖占比1. 以下品类转化率比较好,可以考虑加大广告投入增加该品类的曝光以提高销售额 (由于不知道具体的品类名称及其品类的平均转化率水平,所以我假定在平均数一半以内算是转化比较好)
6344品类销量排名第1,浏览量只排19名,共售出162个,平均点击41次会产生一次购买;
3424品类销量排名第4,共售出109个,平均点击36次会产生一次购买;
6977品类销量排名第7,共售出92个,平均点击19次会产生一次购买;2. 以下品类浏览量很大,但是整体的转化率低,会造成广告的浪费,总体投入产出比低;需要具体分析是整个品类的商品转化率都低还是部分商品转化率低,要逐步淘汰转化率低的商品,对品类进行优化 (由于不知道具体的品类名称及其品类的平均转化率水平,所以我假定在平均数一倍以上算是转化很差的)
品类销量排名第2,共售出140个,浏览量很大但是平均211个点击才产生一次购买;
5399品类销量排名第5,共售出99个,平均点击216次才能产生一次购买;
6513品类销量排名第11,共售出81个,平均点击277次才能产生一次购买;
5894品类销量排名第15,共售出74个,平均点击332次才能产生一次购买;
5027品类销量排名第18,共售出63个,平均点击405次才能产生一次购买;
11279品类销量排名第20,共售出62个,平均点击225次才能产生一次购买;根据以上两个结果可知,5027品类里一共有15914个不同商品(假设每个商品都有被浏览过),其中只有56个商品被购买过;
平均点击5次会产生一次购买,转化率最低的是需要点击37次才能产生一次购买,单从数据来看有被购买的商品转化率都还可以;
但是商品的销量比较少,随机因素影响比较大,无法进行准确的用户偏好判断;
总体来看这个品类里有15000多种商品在这一个月内都没有销量,应该要对商品进行合理优化
4.5.1 购买商品分析
由上述描述统计可知,超过75%的商品只被购买了1次,说明没有出现购买次数非常集中的商品,商品售卖主要依靠长尾商品的累积效应,可能没有爆款商品的带动。
根据结果可知,75%的商品只被浏览过1次(有浏览记录的),说明整体的曝光差,需要提升曝光对比销量前10的商品和浏览量靠前的商品,可以发现销量第1的商品浏览量排名在第24名,其余销量前十的产品都不在浏览量前30中。 这表明推荐的机制可能存在问题,推荐的商品不是用户感兴趣的或需要的商品;