新闻中心

如何分析商品订单?(订单分析英文)

2023-11-26
浏览次数:
返回列表

【题目】

有两张表,一张是订单列表,表名为“订单明细表”;一张是用户名单,表名为“注册表”。“订单明细表”中的用户ID与”注册表”中的用户ID一一对应。

问题1:查询出每天成功付费的付费人数、付费金额、付费单量

问题2:2013年6月14日注册用户的付费人数、付费金额

【问题1解题思路】

查询出每天成功付费的付费人数、付费金额、付费单量

1.题中提到查询“每天”的数据,涉及到“每个”这类问题要想到《猴子 从零学会SQL》里讲过的“分组汇总”来解决这里类问题

按“付费时间”分组,每天的付费人数用汇总函数(count对用户ID这一列统计有多少行),每天的付费金额用汇总函数(sum对付费金额这一列求和),每天的付费单量要用汇总函数(count对订单号这一列有多少行)

2.上面涉及到的列用户ID、付费金额、订单号都在“订单明细表”里

3.需要注意的是,要统计的是“人数”而不是“人次”,所以在统计“用户ID”时要做一次去重处理

4.题目中并没有明确说明“付费时间”的数据格式,根据日常处理数据的经验,需要用时间处理函数(date_format)先把时间格式统一为“年月日”,也就是date_format(付费时间,%Y-%c-%d)

1 select date_format(付费时间,%Y-%c-%d) as 付费时间, 2 count(distinct 用户ID) as 付费人数, 3 sum(付费金额) as 付费金额, 4 count(订单号) as 付费单量 5 from 订单明细表 6 group by date_format(付费时间,%Y-%c-%d);

5.注意统计的是“成功付费”的数据,那么需要用条件(where)指定“订单状态”为“成功”,把“失败”的订单排除在外,也就是在上一步的SQL中加入where子句

1 select date_format(付费时间,%Y-%c-%d) as 付费时间, 2 count(distinct 用户ID) as 付费人数, 3 sum(付费金额) as 付费金额, 4 count(订单号) as 付费单量 5 from 订单明细表 6 where 订单状态 =成功 7 group by date_format(付费时间,%Y-%c-%d);

查询结果

【本题考点】

1.如果涉及到“每个”的问题,需要想到用分组汇总或者窗口函数去解决

2.考察了SQL对数据的分组应用,本题是在分组前对数据按条件筛选,使用的是where子句。如果是要对分组结果后的数据指定条件,记得是使用having,而不是where

3.考察对SQL汇总函数的应用,常用的汇总函数有以下几个:

【问题2解题思路】

查询出2013年6月14日注册用户的付费人数、付费金额

首先我们用多维度拆解分析方法对问题拆解

1.先找出“2013年6月14日注册用户”,这个数据可以从“注册表”里查找到

2.再统计“2013年6月14日注册用户”的“付费人数”和“付费金额”总数,这个数据可以从“订单明细表”里找到

3.因为涉及到两张表,所以需要用到多表联结。这道题目要我们找到的是“注册表”中有注册的用户,同时在“订单明细表”中指定日期消费过的用户,也就是两个表中“用户ID”这一列数据有交集的数据。

所有需要查找的同时出现在两张表中的共同数据,应该使用多表联结中的“内联结”(inner join)

1 select * 2 from 订单明细表 as a 3 inner join 注册表 as b 4 where a.用户ID = b.用户ID;

因为要统计的是付费人数,付费金额,我们在上一步SQL中加入汇总函数可以得到

1 select count(distinct 用户ID) as 付费人数, 2 sum(付费金额) as 付费金额 3 from 订单明细表 as a 4 inner join 注册表 as b 5 where a.用户ID = b.用户ID;

4.找到两张表“用户ID”列共有的数据后,设置条件 where 注册表.注册时间= “2013年6月14日”。同时需要是有效订单,即订单明细表.订单状态=“成功”

5.同上一题一样,会用到时间处理函数(date_format),先把时间格式统一为“年月日”,也就是date_format(付费时间,%Y-%c-%d)

1 select count(distinct 用户ID) as 付费人数, 2 sum(付费金额) as 付费金额 3 from 订单明细表 as a 4 inner join 注册表 as b 5 where a.用户ID = b.用户ID 6 and date_format(b.注册时间,%Y-%c-%d)=2013年6月14日 7 and a.状态 = 成功;

查询结果

【本题考点】

1.考查SQL简单查询语句和逻辑运算符的使用,逻辑运算符包括:

2.考察多表查询。通过“as”语句,自定义表的名称,能够比较方便的对两张表进行关联比较。以及如何判断使用哪种联结。

我是猴子,中科院硕士/前IBM高级软件工程师/豆瓣8分《数据分析思维》作者,我和联合出品的「数据分析训练营」即将开课,3天带你掌握数据分析实用技巧,包含课程+实战带练,工作提效、升职加薪必备神器!

报名还有独家Excel自学资料领取,点击开启数据分析升职加薪密码:

前 IBM 数据分析大咖 3 天实战训练营打工人升职加薪必备立即解锁

推荐:如何从零学会SQL?

搜索