新闻中心

用Excel进行数据分析

2023-03-12
浏览次数:
返回列表

用Excel来进行数据分析

第一步明确问题

问题1:根据表一:购买数量与购买时间的关系

问题2:根据表一:了解哪些销售效果好,哪些不好

问题3:根据表二:了解婴儿年龄分布及销售情况

问题4:根据表二:整合表一表二,了解不同婴儿的使用频次

第二步理解数据

1)表1购买商品字段

用户ID:user_id

商品编号(item_id):auction_id

商品二级分类:cat_id,商品种类ID,表示商品属于哪个类别)

商品一级分类:cat1,商品种类ID,表示商品属于哪个类别)

(商品的一级分类和二级分类,比如上衣和衣服,汽车和玩具汽车这样的关系。虽然都是数字串id,但是根据这层关系,就可以用数据透视表来展示逻辑关系。比如商品大类下面,哪个分类更畅销)

商品属性:property(属性值可以是大小,可以是尺码、毫升等数字,还可以指品牌等,一切可以描述商品特征的都可以称为属性值)

购买数量:buy_mount

购买时间:day(可以通过excel将时间戳显示未日期格式)

2)表2婴儿信息表字段

用户ID:user_id

出生日期:birthday

性别:gender(0女性;1男性;2未知的性别)

3.数据来源

阿里巴巴天池 https://tianchi.aliyun.com/dataset/dataDetail?dataId=45

第三步数据清洗

3.1对于表一:删除了一些重复值,进行了一致化处理,并且利用分列对购买日期进行整合

3.2对于表二:将出生日期进行分列处理

第四步数据分析

对于商品与销量的处理,进过对比,用商品一级属性的数据优于商品二级属性。

并且发现了根据商品一级属性在2014年销售效果达到峰值。

利用VLOOKUP函数讲出生日期和购买日期整合到一张表格,进行数据清洗,删除不必要的函数。

最后使用round函数,算出婴儿年龄,同时对于不符合要求的年龄进行筛选,再使用数据透视表,及表格显示购买年龄情况。

发现对0-3岁婴儿的需求比较高。

搜索