新闻中心

数据分析-平台用户行为分析报告(用户行为分析 报表)

2023-11-28
浏览次数:
返回列表

一、背景介绍和分析目的

随着电商的竞争日益激烈,淘宝,京东作为传统电商的两大巨头占据着较大的市场规模外,同时也涌入了众多社交类电商,因此深入挖掘用户的购物行为习惯,理解用户深层次的需求,从而指导市场营销,对电商发展具有重要意义。

本文使用SQL和可视化工具对平台用户行文数据进行分析,通过数据清洗、建模分析对常见业务问题进行分析,尝试得出有价值的结论并给予有建设性的建议。

二、提出问题

1、 这个时间内的数据的基本情况是怎样的?商品的点击率和销量是多少?哪天的销量最高?在哪个时间段最活跃?

2、 各环节的转化率情况,哪个环节出现问题导致用户流失呢?流失原因是什么?

3、 一周中登录天数和转化率的关系,登录的频率需要多少转化率才高,购买力才强呢?

4、 对用户进行精细化分类,重要客户是哪些?

针对分析目的,采用多维度拆解分析方法对问题进行拆解,并在分析过程中使用假设检验法、对比分析法和RFM模型分析方法对用户使用流程及具体业务指标进行分析。

下图展示本文分析思路及分析方法:

三、理解数据

1、 数据来源

https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1

本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、收藏)。

数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,源文件数据100,150,807条

2、 字段含义

列名称说明

用户ID:字符串类型,用户ID

商品ID:字符串类型,商品ID

商品类目ID:字符串类型,商品所属类目ID

行为类型:字符串,枚举类型,包括(pv, buy, cart, fav)

时间戳:整型,行为发生的时间戳

注意到,用户行为类型共有四种,它们分别是

行为类型说明

pv:商品详情页pv,等价于点击

buy:商品购买

cart:将商品加入购物车

fav:收藏商品

四、数据清洗

通过数据库管理工具Navicat将数据集导入MySQL数据库中。

1、 选择子集

数据集全部为有效记录,由于数量巨大,故此仅随机导入了10,0000以供后续分析。

2、 缺失值处理

无缺失值

3、 删除重复值

确认无重复值

4、 一致化处理

由于时间戳包含了(年-月-日)和小时,为了方便,将该字段分成2个字段,一个日期列一个时间列。

5、 异常值处理

检查是否有错误时间戳,如负数或者0;不存在错误时间戳

检查表内date数据是否在2017-11-25至2017-12-03之间;有44条不属于这个时间范围内的数据,将这44条数据删除。

以上,数据准备完毕!

五、分析过程

1、 数据基本情况

用户行为包括点击、放进购物车、收藏以及购买,仅分析行为类型,可以看出,点击量是远远超出的。点击占总行为数的89.7%,购买占总行为的2.1%,同时发现放入购物车的行为比购买行为和收藏行为多了约1倍,可以看出,产生点击行为后的实际购买行为转化率相当低。

在日期天数上的走势为:

图中是做了四种行为按日期的走势图,由于buy,cart,fav的数量较少,所以折线图设置了第二刻度,方便看出趋势。可以看出由于12月出可能收到双12活动的影响,趋势走高,其他时间,周末和工作日并无明显差异。同时发现点击量和加入购物车行为在双12前飙升,而购买行为并无大的变化,推断可能是在为双12活动确定购买目标。

在时间上的走势:

从折线图可以看出,从上午10点左右,点击量和加入购物车的行为,持续上升,下午18点下班微微降低,然后在21点左右达到最高峰,再慢慢回落,基本上21-23点左右是点击和加入购物车行为的高峰时段。购买行为从早上上升知道10点以后曲线开始上下波动,晚上的购买行为也相对比较高,在20-23点几乎是持平的,但曲度相对点击比较平缓。

2、 用户行为情况

根据上面的数据分析,可以得到各个行为占总行为数的占比情况。

通过转化率分析来看,点击页面详情页占比将近90%,而其他行为的占比最多的是将商品放入购物车,才5.45%,而最终实现购买行为的为2.1%,用户从点击浏览到购买的转化率低。

对于这样的现象,提出两个假设:

假设1:平台推送的商品无法满足用户的需求,因此放弃了后续的加入购物车,加入收藏,购买商品的后续行为。

假设2:不同购买流程的转化率影响购买量

现在我们来分析假设1是否成立。

假设1:平台推送的商品无法满足用户需求

我们现看一下商品的类别和商品种类有多少

可以看出,商品类别有3128个,商品种类有64440个,商品种类和类别的丰富度还是比较高的。

接下来继续分析:

1. 用户想要在平台找到什么商品

2. 平台推送给用户什么商品

以此来进行对比分析,看出平台推送的商品是否满足用户需求

1用户想要在平台找到什么样的商品

点击次数排名靠前的商品类别:

把商品类别点击前10 的类别做出柱状图,可以看到4756105、3607361、4145813,进一步分析其中的商品。

通过上图可以发现4756105和3607361的商品点击量在30左右,4756105的点击量较高的商品为812879、3006793、3769601;3607361点击量较高的商品为2331370、138964、3845720。而4145813的点击量相对较小,在15左右。

2平台推送给用户什么商品

为了分析用户点击商品排名前列的商品类别和最终购买的商品的商品类别是否吻合,对最终购买的商品情况进行分析。

以上图标是购买商品top10的商品类型,点击排名前三的商品类别里,只有4145813在购买商品类别里排名前三,而4756105和3607361分别排名第7和第8,而其他购买top10的商品类别里有5种商品类别2735466、1464116、2885642、1299190、4789432在点击top10中是没有的,也就是有50%的top10的购买的商品类别在点击的top10购买的商品类别中是没有的。

对于点击量排名前三的商品类别的各前三名商品进行销量分析:

仅有2种商品存在购买行为,并且购买量仅为1个。

结论:假设1成立。

推送的商品和用户实际购买的商品在商品类型的关联度还是有的,但是具体商品的推送上没有满足用户是购买需求,导致了用户在点击后的行为转化率低。

3. 业务流程分析

本次数据集里包含的用户行为有四种:详情页点击、收藏、加入购物车和购买。因此本次报告在分析用户购买流程种主要考虑以下几种流程:

点击-购买

点击-加入购物车-购买

点击-收藏-购买

点击-收藏-加入购物车-购买

假设2:不同购买流程的转化率影响了购买量

将数据集里的数据按不同用户,不同商品维度进行分组,来获得某一用户对某一商品不同行为的数据。如果在数据中,点击行为数据大于0,购买行为大于0,并且其他两项的行为为0,则可以判断该流程为点击-购买,其他流程的判定方法于此同理。

首先创建视图,同一个用户id,商品id作为一行数据,来看这个用户的这个商品的购买行为情况,后面的四个行为分别用pv,cart,fav,buy来表示。

a点击后流失

b点击后购买

C点击后收藏

d点击,收藏后加购

e点击,收藏,加购后购买

f点击,收藏后购买

g点击,收藏后流失

h点击加购

i点击加购后购买

j点击,加购后流失

从转化率可以看出,点击后流失率很大,占比73.9%,点击收藏后,加入购物车后购买,或者收藏后直接购买的转化率相对高一些,或者点击后加入购物车后购买的转化率也相对较高,因此需要引导用户对点击商品,进行收藏或者加入购物车,提高购买的转化率。

结论:假设2成立

4. 客户价值分析

RFM模型是对用户进行细分,找出有价值的重要用户,并对不同类型的用户制定不同的策略进行有针对的营销的一种方法,进而提升购买和抓住用户的一种方法。

在本次案例中R,F,M具体定义为:

R:根据用户最近一次购买时间到2017年12月3日之间的差值,来判断用户最近一次消费时间间隔。

F:将数据集中用户在2017年11月25日到2017年12月3日这9天时间内购买的次数作为用户消费的频率。

M:由于本次数据集中未包含该字段数据,因此暂不考虑该指标。

用户分类规则表:

使用RFM对用户分类步骤:

1. 计算R,F,M值

2. 给R,F,M按价值打分

3. 计算价值的平均值,得出R,F,M价值高、低

4. 和用户分类规则表比较,得出用户分类

建立本次打分标准:

接下来:

a计算R,F值

b给R,F按价值打分

c计算价值的平均值

d得出R,F价值高低

e和用户分类规则比较,得到用户分类

结论:通过RFM对用户进行分类,可以发现四种客户类型的数量分布,可以发现这部分数据的用户主要存在于重要发展用户和重要挽留用户,因此需要对这2部分用户重点营销。

对于重要发展用户:消费频率低,但是最近消费距离现在较短,因此需要对这部分用户增加各种营销方式,来吸引他们提高消费频率。

对于重要挽留用户:最近消费时间距离现在时间较远,并且消费频率较低,有流失的风险,因此需要对这部分用户主动联系,调查清楚什么原因,并采取措施想办法挽回。

三、结论

1、 根据之前行为和时间的分析可以看出,不同时间段的各种行为发生的频率差异是很大的,高峰时间段是上午10点左右以及在21点左右,再慢慢回落,基本上21点至23点左右是点击和加入购物车行为的高峰时段,基本在用户休息放松的时间段。因此可针对不同时间段进行合理推送信息。

2、 通过对各种行为数据分析,发现平台推送的商品类别还是基本匹配的,但是对商品类别中的具体商品的推送不够合理,导致点击后,没有加入购物车、收藏以及购买行为。因此对算法部门来说,需要改善推送机制,更合理的推送用户感兴趣的商品。优先推荐点击量排名靠前的商品类别中的商品。

3、 用户在点击-收藏-购买和点击-加入购物车-购买的转化率明显大于点击-购买的转化率,因此需要相伴的引导用户收藏和加入购物车,例如进行优惠活动,对收藏和加入购物车行为进行强化,提升最终购买的转化率。

4、 通过对RFM模型进行用户细分,得到用户主要集中在重要发展用户和重要挽留用户上。因此可以主要针对这两类用户的性质进行不同的营销方式,例如重要发展用户需要增加消费频率,因此可推出优惠活动吸引这部分用户,而重要挽留用户消费频率和消费时间都比较少和远,因此需要进行主动联系,找到原因,进行有针对性的解决和挽留。

搜索