新闻中心
电商商品销售数据分析(附数据报告)
一、分析背景与目的
店铺主打母婴类商品,经过几年发展,用户规模达到29942,销量达到48096,业绩取得不错的增长。发展的同时也存在销量增速降低,复购率低,连带率低等问题。通过对店铺业务数据进行分析,发现经营问题,找到提高销量的可行措施,为接下来的运营工作提供建议。
数据源
数据集源自Baby Goods Info Data-数据集-阿里云天池,是淘宝平台母婴商品的销售数据,包括:
表1购买商品表(sample)sam_tianchi_mum_baby_trade_history.csv
表2婴儿信息表 (sample)sam_tianchi_mum_baby.csv
二、分析思路
从时间、商品、用户三个维度进行分析:
整体:销量趋势、拐点、异常,以及用户的整体活跃情况,留存情况商品:哪些品类销量高,不同品类连带率如何,不同品类销量趋势、对比用户:用户画像,年龄、性别整体销售分布、对比,年龄、性别分品类销售分布、对比三、清洗数据
涉及用户维度的分析,所以首先关联两表,在表1中添加婴儿生日、婴儿性别、婴儿年龄字段,接下来只需要对表1进行清洗
1)选择子集
根据上面的分析思路,只需要用到:用户ID,商品二级分类,商品一级分类,商品属性,购买数量,购买时间,婴儿生日,婴儿性别,婴儿年龄,将不需要的字段隐藏以便分析。
2)列重命名
原表字段都是英文,为了方便分析,改成中文
3)删除重复值
无重复数据
4)缺失值处理
商品属性字段存在缺失值,不过这次分析用不到该字段,忽略
5)一致化处理
购买时间和婴儿生日字段都是非标准日期格式,改成标准。婴儿性字段值是0和1,改成男和女
6)数据排序
按购买时间升序排序
7)异常值处理
购买数量超过100的全改成1,这次分析主要争对个人用户,考虑到存在一次买几十个商品的土豪,所以将分界线设为100。
婴儿年龄-1改为0,-2不做处理,28不做处理。存在负数是应为用户在婴儿出生前购买商品,-1表示提前一年内,可以改成0,-2表示提前2年,明显不合理,所以不做处理,分析用户相关内容时过滤。婴儿年龄28估计是用户误填了自己的年龄,同-2不做处理。
婴儿性别为2的不做处理,分析用户相关内容时过滤。
婴儿生日、婴儿性别、婴儿年龄字段的错误值(#N/A)不做处理。这是因为用户没有填写婴儿信息,只需在分析用户相关内容时过滤
清洗后的数清洗后总共有29971条数据
四、分析内容
0. 分析说明
1) 概念界定
a. 高价值品类与普通品类
高价值品类指28、5008168、50014815,它们的订单量和成交量合计都超过总体80%。普通品类指其余的38、50022520、122650008。
b. 高价值用户与普通用户
高价值用户指婴儿是0-2岁的用户,它们成交量分别都高于10%,合计占总体79.89%。普通用户指其余年龄的用户。
c. 增长率指标只计算2013-2014
由于2012年和2015年没有全年数据,所以增长率指标只计算2013-2014
2) 分析范围
本报告的分析对象是零售用户
1. 店铺销量趋势
销量与成交量和订单量有关。成交量是对商品的成交数量进行统计,订单量是对订单数量进行统计,它们是不同的概念。先从成交量角度分析。
1)成交量趋势
从图里可以看出,成交量逐年增长,2015年断崖式下跌,这是为什么呢?缩小时间粒度就可以发现是因为2015年只有1、2月数据。
从图里可以看出,每年第一季度出现波谷,第二季度和第四季度出现波峰,第四季度波峰更高,接下来探究原因。
选每年第一、第四季度数据。2013年2月成交量最低,2014年1月成交量最低。查看往年春节时间,2013年2月份春节,2014年1月份春节,因为春节前后快递停运,所以人们网购时往往避开春节,这也就是第一季度波谷的原因。
第四季度均是11月份销量最高,从图里可以看出2012-2014年都是11月11日成交量最高,所以这是因为淘宝“双十一购物节”促销活动。
从2013和2014年5、6月成交量趋势可以看出,在6月1日附近成交量达到顶峰,这是因为六一促销活动。
2)订单量趋势
订单量趋势与成交量一致
2. 各品类销量分布以及连带率
订单量最多的三个品类分别是50008168、28、500014815,合计占总体81.05%。成交量最多的品类分别是28、50008168、50014815,合计占总量81.39%。无论从订单量还是成交量, 28、50008168、50014815都是对销售贡献最高的
50008168、50022520、122650008连带率低于平均值
3. 用户月活、复购率、画像分析
活跃用户数量整体逐年增加。每一年第一季度用户数量最低,到第四季度达到顶峰。该趋势与成交量趋势一致。
整体复购率极低仅0.083%,整体连带率1.6,表现良好
0、1、2岁婴儿最多,分别占总体43.53%,20.47%,12.93%,合计占总婴儿数76.94%
男婴占52.85%,女婴占47.15%
0、1、2岁婴儿成交量最高,分别占总体43.74%,24.46%,11.70%,合计占总体79.89%
男婴成交量占总体58.10%,女婴占41.90%
4. 时间与商品双维度分析
从图里可以看到高价值品类成交量逐年增加。
28成交量2013第四季度负增长,2014第四季增长量低,“双十一活动”效果不明显。50014815在2013年二、四季度成交量增长低,“六一”和“双十一”活动效果都不明显。
高价值品类成交量增长率指标里50014815低于平均值。
从图里可以看到普通品类成交量逐年增加。
38在2013年二、四季度增长量低,峰值在第三季度;2014年二季度增长量低,峰值在第四季度。38在2013年“六一”和”双十一“活动效果不明显,2014年”六一“活动效果不明显。
500225520增长率低于普通品类平均值。
高价值品类平均增长率是49.48%,普通品类平均增长率50.44%,基本持平。
5. 用户和时间双维度分析
从图里可以看出高价值用户成交量逐年增加。
0岁婴儿2014年第四季度成交量降低,这一年”双十一“活动效果不明显。1岁婴儿2014年成交量波峰在第一季度,之后下滑很多,第四季度少量增加;这一年第一季度成交量异常,”六一“和”双十一“活动效果不明显。2岁婴儿2014年第二季度成交量下滑,这一年”六一“活动效果不明显。
由于2012年和2015年没有全年数据,所以增长率指标只计算2013-2014。高价值用户平均增长率是24.83%,2岁婴儿增长率低于平均值。
从图里可以拿出5品类增长迅速,3品类增长十分缓慢,4、6品类负增长。
3品类2013年成交量峰值在第二季度,第四季度增长量低;4商品成交量2013年峰值在第一季度,第二季度负增长,2014年第二季度增长量与第一季度持平;6商品2013-2014年第一季度无成交量
男婴和女婴成交量均逐年增加,男婴增速大于女婴。2013年六一促销对女婴成交量影响不大。
6. 用户和商品双维度分析
在各个年龄段里,均是28、5008168、50014815销量占比高
4岁以上年龄成交量不足10%,所以不做统计。38商品1岁婴儿成交量占比最高,0岁、2岁次之。其余品类均是0岁婴儿销量销量最高,1岁、2岁次之。所以38商品促销活动建议主打1岁婴儿。
男婴和女婴均是28、50008168、500014815成交量最高
50022520之外,其余所有品类均是男婴成交量高于女婴。50022520促销活动可主打女婴
五、结论
•成交量整体逐年增长,订单量、月活趋势与成交量一致。整体复购率极低,连带率表现不错。六一、双十一整体促销效果明显,局部有问题。
•品类28、50008168、50014815成交量占总体81.39%。高价值品类成交量逐年增加,普通品类中4和6负增长。28、50008168成交量增长迅速,50014815成交量增长较快,38、50022520、122650008成交量增长缓慢。 28之外的品类成交量趋势与整体一致。50008168、50022520、122650008连带率低于平均值
•0-2岁婴儿成交量占总体76.94%,男婴、女婴成交量逐年增加,男婴成交量比女婴多5.7%。4岁婴儿成交量负增长,0岁婴儿成交量增加快速,1岁婴儿成交量增加较快,其余年龄婴儿成交量增长缓慢。不同年龄与不同性别均是28、5008168、50014815成交量占比高
六、建议
•整体复购率极低,仅0.083%,建议优化用户留存方案,提高复购率。六一和双十一促销活动对成交量整体提升效果明显,用户也养成习惯,建议继续保持,持续优化。双十一促销效果整体上比六一好,促销资源可侧重双十一
•品类28、50008168、50014815对成交量贡献度最大,将它们作为主打产品进行推广。38、50022520、122650008成交量增长缓慢建议查找原因,提升成交量。50008168、50022520、122650008连带率低于平均值,建议与其它品类对比,查找原因。六一促销活动以及双十一促销活动对28商品效果不明显,建议复盘以往对28的促销活动,查找原因,优化方案以提高成交量。解决高价值品类问题之余可以解决普通品类负增长和促销效果问题。
•店铺主要用户是0到2岁的婴儿,推广时侧重他们。4岁婴成交量负增长,其余2-4岁婴儿整体成交量增长缓慢,建议优化营销方案,提高增速。0岁婴儿双十一促销效果不明显,六一促销效果不稳定,1岁婴儿六一和双十一促销效果都不明显,2013年六一促销对女婴成交量影响不大,建议复盘以往对0岁和1岁婴儿的促销活动以及2013年六一的促销活动,查找原因,优化方案以提高成交量。38商品营销活动建议主打1岁婴儿,50022520营销活动建议主打女婴。