新闻中心

数据分析入门—用Excel做数据分析(excel数据分析常用技巧包括)

2023-09-28
浏览次数:
返回列表

一、数据集认识

1.1 购买商品表

A. user_id:用户 ; B. auction_id:物品编号 ; C. cat_id:商品种类 ; D. cat1:商品属于哪个类别 ;

E. property:商品属性 ; F. buy_mount:购买数量 ; G. day:购买时间

1.2 婴儿信息表

A. user_id:用户 ; B. birthday:出生日期 ; C. gender:性别

二、从数据集中想了解哪些描述统计信息

婴儿性别比例是什么?购买商品的是男婴多还是女婴多?不同性别的婴幼儿对于不同品类的商品购买需求量的分布?年、月销售量情况?那些类别得商品销量好,可以使其变为重点热销商品?商品的复购率是多少?

三、数据清洗

3.1 通过数据集中共有字段user_id,使用函数vlookup将两个数据结合起来,并将所有列名重 命名,并隐藏不需要字段property商品属性,根据auction_id删除重复字段。

3.2 本数据中无缺失值,因此无需处理

3.3 一致化处理

将购买日期与生日使用分列功能转换为日期格式,并计算出年龄性别一致。0为男生,1为女生,2为性别不详。

3.4 异常值处理

将性别中标为2性别不详的删除。将婴儿生日按升序排列,1984年出生的不是婴儿,因此将次数据删去。

四、数据分析

女性婴儿用户比男性婴儿用户的购买力强,是主要购买力;商品50008168相比来说更加受到男性婴儿用户的喜爱,商品50008168和500014815更加受到女性婴儿用户的喜爱。通过年度分析,可以看出2013-2014年购买数量明显增加;通过月度分析,可以看出2014年12月的销售量非常高,增长很快,初步推断可能是因为2014年双十一等活动推销结果,同理,每年的11月,12月相比于其他时间销售量高。根据图中可以看出商品类别为28的商品在2013年和2014年的销量都非常高,因此可将其打造为“重点热销商品”;商品类别为38、50022520和122650008这3个商品两年多销量相比都比较低,因此可以将其下架;50008168和500014815两类商品第二年的销量均比第一年相比有大幅度增长,因此可以继续观察,逐渐打造为“热销产品”。

搜索