新闻中心
淘宝订单数据分析(淘宝数据统计分析)
一、数据背景及理解数据
1、数据背景
随着增量数据的增长,我们可以根据有限的数据进行趋势和本质分析,观察在当下的运营模式下,是否有问题存在,并找到原因,给出解决问题的办法和建议。
本数据集名称《淘宝和天猫婴儿用品》,数据来自阿里巴巴天池, 淘宝和天猫上购买婴儿用品的用户
数据集-阿里云天池tianchi.aliyun.com/dataset/dataDetail?dataId=45
2、数据集的字段理解

3、数据清洗
1)选择子集
表一中,因为目前的分析不会涉及到具体商品的品名和商品属性,所以可以将这俩列隐藏。利用vlookup函数,将表一,表二连接。
2)字段重命名,由于列名表述的很清楚,可以理解,所以不需要重命名。
3)删除重复值,在表二的用户信息表中,按照用户编码这一唯一标识删除重复值,发现没有重复。
4)缺失值处理
对表中的数据进行查找缺失值,发现表中没有缺失值出现。
5)一致化处理
因为表中的出生日期和购买日期的格式不规范,需要利用分列功能将其调整。性别列将数字0和1,替换成女和男。利用datedif函数,求出用户的年龄。对于购买日期早于出生日期的,显示为“未出生”。6)数据排序
对于有顺序要求的数据,可以按某字段进行排序,本实例暂时不需要
7)对异常值进行处理
对于性别中2的值,即性别不确定的用户,对分析没有价值,删除。(在实际工作中,需要和业务部门进行核对,再次确认)年龄中,28明显不是购买人群,删除对销量列进行描述性统计分析
根据结果,可以看到,最大值和中位数差距很大,需要去向业务部门核实异常订单正确性。在这里,此笔订单对分析影响较大,删除。
最后清洗的效果如图:

二、分析目的
根据2012年到2015年的数据,分析销量的变化受哪些因素影响,找出导致销量下降的原因并给出合理的建议,以提高销量。
三、分析思路
1、提出问题
1)产品销量随时间是如何变化的?
下图是销量随时间变化的折线图:

下图是销量季度折线图:

2)产品复购率受哪些因素影响?
3)性别对销量的影响?
4)孩子年龄对销量的影响?
根据以上问题,整理出相关分析思路:

四、构建模型、分析数据
1)产品销量随时间是如何变化的?
假设:2012年和2015年的数据,是因为缺少数据而导致销量变差,而非经营问题。收集证据:

2012年只有7-12月份的数据,2015年只有1、2月份数据,可以环比看一下1、2月份数据,看一下1、2月份销量如何

2015年的1月份相比于上俩年份,销量高了很高,2月份有所下降,将2月份明晰剖出来看下:

可以看到,15年2月的数据只留存到5日,不是完整数据
结论:2015年销量下降并不是因为经营问题,而是因为数据留存到2月5日,而且从1月份完整数据对比,2015年的一月份比其他年份销量都高。
13年和2014年的1、2月份在全年来看,销量比较低,追查原因假设:由于1、2月份是春节月份,快递停运,所以会影响销量
收集证据:

2013年的春节在2月10日,14年的春节在1月30日。在春节期间,由于快递停运,影响货物邮寄,销量低至0,之后销量有回暖。而且在春节前七天,销量都有下降,后七天,销量平稳上升。
结论:假设成立,由于春节假期的快递停运影响,线上的商品销量下降。
13年和14年5月份销量都有上升,需要分析下原因假设:5月份的节日较多,举办了一些促销活动,促使销量上升。
收集证据:

从图可知:5月份销量增长波动大致有4个点,在5月12-15日,5月19-23日,5月27-29日销量都有所增长,经查,13年5月12日和14年5月11日是母亲节,520现在也是营销点,本商品是婴幼儿商品,在6月1日儿童节前的促销也是少不了的,这样就可以找到销量上涨的原因了
结论:5月份业绩增高的原因是因为有节日促销。
12、13、14年的11月份销量都有提高,分析下销量增长原因并看下具体数据构成假设:每年11月份都有双十一促销大活动,由于做营销活动,而使销量增长
收集证据:

在双十一当天的销量有猛增式的发展,并且随着年份的增加,双十一当天的销售量不断增加,说明营销活动和品牌认知度都有提高,不断向好发展。具体哪种大类商品销量更好?可以剖开看一下:

可以看到是50008168商品的销量最好,占了每年双十一业绩的近50%,我们可以进一步看一下,是购买人数多促使的销量增长还是因为有多件购买性价比高而促使的销量增长?



从2012年到2014年的交易量可以看到,大多数人都是购买1件,最大值只有4,只是交易量增加了,导致的销量增加。可能是营销活动的预热的时间更长了,品牌知名度更高了。
结论:11月份的销量大幅增长是由于双十一的促销活动促使的,并且50008166的商品卖的最好,最畅销
2)产品复购率受如何,哪些因素影响?

复购率中位数是1,说明顾客多数购买次数是1,说明回购率不高,用户粘性不太大。
具体什么原因影响回购低,这个暂时无从论证,猜测可能的原因:产品问题,包括产品质量不好,服务体验不好,后续的服务体验不好,后续营销力度弱;具体原因需要了解业务进行下一步分析。
3)性别对销量的影响

上图可知:男女购买人数基本持平,女宝的购买人数能稍微占一点优势,多了5.8%

女宝的销量比男宝多了25.16%

从上图可知:女宝宝的平均购买数量大于男宝,说明女宝宝的购买比较喜欢连带购买,导致销量比男宝多,并不是因为男宝用户少。
4)消费年龄段构成比例
从上图可知:0岁(1-12个月)的宝宝,消费力是最强的,1岁的和未出生宝宝,排名其次。 本公司产品主要的消费群体是小龄儿童。
五、结论
总结以上分析,1)春节快递停运对销量影响很大
2)销量对节日的促销活动很敏感,搞促销的销量明显高于平日销量,说明用户群体对价格敏感。但普遍购买数量是1,少数进行多件购买的行为。
3)复购率低,留存率低,用户粘性做的不太理想。
4)男女用户数基本保持持平,但女宝商品销量更高,平均购买数量更高。
5)本商品主要受众群体是未出生到2岁以下的儿童。
六、建议
1)针对一月份销量下降的情况,可以在营销上采取预付,有定金优惠方式,先赚取一部分顾客,等春节过后,可以快速回笼资金,迅速启动,而且不会轻易丢失顾客。
2)5月份是销售旺季,抓住节日热度,进行更多的促销方式,提升销量和市场占有率。同时在库存配比,要充足,不出现因缺货而导致销量上不去的情况。
3)在双十一的促销活动上,可以用销量比较好的50008168商品来和其他商品进行组合售卖,这样可以拉动其他商品的销量。在双十一之前,也可以进行预热,延长双十一活动的生命周期,最大程度的利用时间点提升销量。
4)针对女宝宝商品,可以设计出更多款式和种类,增大顾客的选择性。男宝商品,可以设置更多的满减,或以旧换新,优惠券等活动,在有旺盛需求的情况下,最大化销量。
5)本公司商品主要的客户群体是小龄儿童,所以可以做细分市场,将有限资源集中到最有优势的种类,增加商品研发投入和营销投入,对于大龄儿童的商品适当减少库存和投入。