新闻中心
美国某超市销售数据分析报告(某美国著名连锁超市)
本报告以美国某超市4年的销售信息作为数据基础,运用Excel和SQL进行数据处理、分析和可视化,通过描述性分析、RFM模型分析和时间序列方法对美国某超市销售过程中可能存在的销售额和利润的增长点进行分析。主要对销售额增长率下降的可能原因进行分析,并且根据最终的分析结果得出进一步提升超市销售额的方法。
1. 数据概述与预处理
1.1数据概述
本报告数据由Kaggle提供,共有数据共有21个字段,9994条数据,分别包含ID、订单编号、下单日期、发货日期、货物所在仓、客户编号、客户姓名、客户身份、购买国家、购买城市、城市所在州、邮编、区域、货物代码、分类、子分类、产品名、单价、数量、折扣、利润。
1.2 数据预处理
本文数据的数据类型包含定性、定量、定时三种数据,无重复数据记录和缺失值,其中检验异常值时有1871条交易信息的利润是负数,说明有一部分交易是亏本的。为了能够更好的进行后续的分析,将数据中需要计算的字段的数据格式由文本型转换为数值型,并保留两位小数,同时加上一列总销售额的数据,计算方式为数量*单价-折扣。
2. 现状分析
2.1 业务背景与逻辑分析
超市销售情况由销售额和销售的利润进行分析,本文希望通过几个部分进行分析:首先分析超市的整体经营情况,通过销售额、利润和促销活动的方面进行简单分析,其次是通过拆分销售额的公式,通过商品维度和用户维度对进行经营情况的深入分析,最后由于分析可知销售数据为明显的季节性时间序列数据,因此进行销售额的时间序列分析可以预测新一年的销售额,从而可以作为超市销售的基础,本文所进行分析的超市的业务逻辑如图1所示:

本文的主要研究对象是美国某超市2015-2018的销售情况信息,希望通过分析超市四年的历史销售数据,从不同维度出发分析超市经营状况,挖掘提高销售额、销量的销售策略,查看数据时发现销售额和利润的增长率在下降,本文希望以此数据作为基础找到新的增长点,为未来提升销售额提出一些建议。
2.2超市销售情况分析
本小节首先通过描述性统计的方式进行超市目前销售情况进行分析,描述性统计[3]主要通过对变量相关的数据进行统计性的描述,包括频数、集中趋势、分布及基本的统计图形等方式来有组织的汇总数据。描述性统计方式是进行数据分析中的至关重要的一步,需要在进行数据分析前进行描述性统计分析研究。
2.2.1 整体销售情况现状描述
运用MySQL将数据按照订单编号(Order ID)分组,并统计其订单数量、订单总价和利润进行描述性统计分析,查看订单维度的整体销售情况统计。

由图2可知,数据订单共有5009单,订单平均单价为1975美元,订单平均商品数为8件,说明超市订单的商品以单价高的商品为主;此外,订单商品数的均值在中位数和第三分位数之间,订单总金额的均值大于第三分位数,说明超市购买的用户之间购买水平差距较大。

由图3可知,销售情况在9月和11、12月的订单数最多,由于本文数据为美国超市,美国新年为每年的1月1日,万圣节为11月1日,黑色星期五是11月第四个星期四,圣诞节为12月25日,因此11、12月订单数多的原因多是由于节日以及新年原因购买所需的物品。
2.2.2 增长率分析


从年度销售额及其增长率来看,超市2015年销售额为2067万,到2018年GMV达到了3088万,提升了超过1000万,因此由增长率和利润增长率来看,该超市应该处于快速成长期。从增长率来看16-17年销售额增长率超过30%,而每年利润的增长率均超过了14%,可见该超市的增长潜力非常大。
但是17-18年该超市的销售额和利润的增长率均出现了下降,且增长率降低了50%,一方面可能是因为经过一年的增长超市的增长幅度变缓是正常现象,但另一方面可能是超市经营原因导致,需要进一步改善经营措施。
2.2.3 时间维度销售情况分析


通过查看2015-2018年每一年的月度销售额和利润可以看出销售额同比上一年都是上升的,同时销售的季节性比较明显,总体看来下半年销售情况比上半年销售情况更好,下半年是旺季。
此外在上半年6月销售额比较高,7月销售额比较低,同时7月的利润也比较低,可以看出7月超市进行了促销,同时7月的促销也对于下半年销售额的提升有了一定的促进活动,吸引力一些用户。
对于旺季的月份,运营措施需要继续保持,同时可以进行一定的补货,对于淡季的月份则可以结合商品的特点举办一些促销活动来吸引用户。
2.3 用户维度
2.3.1 用户整体销售情况
年份2015201620172018汇总客单价959.56946.951006.67860.61951.74如上表所示,用户客单价均在850美元以上,说明平均下来用户的购买力还是很高的。因此后续需要通过提升用户数来进一步提升销售量和销售额,本文通过RFM模型进行用户分层从而对不同类型的用户采取不同的维系策略。
2.4.2 RFM模型原理
RFM模型作为客户关系管理领域的额一种消费行为分析模型,最早由美国数据研究所Arthur Hughes(1994)提出,RFM模型包括最近购买时间R(Recency)、购买频率F(Frequency)、购买金额M(Monetary)三个变量。
最近购买时间R是客户最近一次购买时间,通过分析时间间隔的天数,其值越小,顾客重复购买可能越大,顾客价值越高,F表示时间周期内客户购买商品的次数,购买频率越高,客户越忠诚,M表示购买总金额,购买金额和客户忠诚度也是成正比的,因此通过分析RFM评分可以得到客户的价值。
本文根据R、F、M评分是否大于均值将客户分为八个类型,如下表所示:
客户类型RscoreFscoreMscore重要价值客户111重要唤回客户011重要深耕客户101重要挽留客户001潜力客户110新客户100一般维持客户010流失客户0002.4.3 RFM结果

如图8所示获得RFM模型计算出的各类的客户数,整体来看超市的客户流失率较高,因此超市需要通过一些促销、优惠等措施挽留并进一步激活客户。
超市客户中重要的客户共有317人。其中重要价值客户有75人,约占重要客户的50%,对于这部分客户可以采取积分、VIP式服务,通过积分和服务来对待这些客户,并留意他们的购买反馈。重要深耕客户有36人,这类客户消费频率低,需要发放优惠的方式提升其消费频率。重要唤回客户有133人,这类客户占42%,这类几近流失的重要客户占比很大,需要通过短信、电话等方式唤回他们。最后是重要挽留客户,这部分共有73人,这部分将近流失的客户需要通过一些方法来挽回。
超市中一般的客户共有407人,这部分包含新客户、一般维持客户和流失客户,需要在维持重要客户的前提下,进一步的维系这些客户,可以看出超市的一般客户的数量要超过重要客户,因此需要采取促销优惠活动进一步维系这部分客户,使其转换为重要客户。
3. 时间序列分析
3.1 时间维度销售额情况

如图10所示为2015-2018销售量和销售额时间折线图,如图所示销售额和销售量处在增长的趋势,并且有明显的季节性波动,四年的季节趋势基本一致,在业务稳定上升的情况下,希望根据4年历史销售额来预测未来的销售额,从而进行未来战略调整和布局。
3.2 时间序列模型原理
时间序列预测主要是将一组观测值以时间序列进行排列,从而过程时间序列,运用数学模型将其进行进一步的延伸,预测未来一段时间的发展变化趋势,该方法是一种回归预测方法,属于定量预测。
时间序列预测法通过运营历史时间序列数据进行统计分析,从而推测出事物未来的发展趋势。在预测过程中会出现很多偶然因素,为了消除随机性对结果产生的影响,通过历史数据建立相关回归模型进行统计分析,并对数据进行适当处理,从而进行未来趋势预测。
本文的超市销售数据从2015年1月至2018年12月是明显的时间序列数据,它有两种特点:其一是由图7显示其销售额是存在季节性的周期变动,其二则是销售额是一种稳定增长趋势,因此可以采用时间序列方法来根据历史4年的历史销售额数据,预测未来一段时间的销售额。本文采用Excel的函数和数据分析工具,使用时间序列预测法,以历史数据预测未来2019年的销售额。
3.3 建模过程
如图7显示销售额的变动有明显的季节性趋势,因此本文引入季节、时间t和销售额作为变量构建多元回归模型,本文构建季度因素的时间序列模型。公式如下:

多元回归模型中,y为预测值,b0为截距、b1,b2,b3分别为第一、二和三季度的影响系数,Q1,Q2,Q3只有0和1两个取值,当三个季度的变量都为0时,则是第四个季度的预测结果。
3.4 建模结果

图10所示为销售额时间序列分析回归的结果,R方的值为86.85%,表示预测效果较好,同时P值均远小于0.05,因此预测的模型效果好,成立可用。由此获得最终的预测模型如下公式所示:
由公式预测的19年销售额预测结果为:

我们根据时间序列模型预测了未来一年的销售额,可以看到依据预测,季度一、二和三的销售额较低,为季度四的近一半,因此前三个季度需要进行大力度的推广、促销从而提升销售额,同时我们可以根据预测的销售额从而布局新一年的商品、促销活动,可以在预期销售额低的时候进行促销活动。
4. 结论与建议
4.1 销售额增长率下降原因总结
通过以上的销售情况、RFM分析和时间序列分析,可以得出超市销售额增长率下降的原因,同时也是后续进一步提升销售额的增长点:
(1)销售季节性十分明显,每年的前半年销售额和销售利润都十分低。
(2)用户的流失性明显,无论是重要用户还是一般用户的流失性都很强,可能导致销售额和利润增长率降低。
(3)用户购买水平差距较大,没有很好的根据不同的用户购买水平匹配不同类型的商品。
(4)促销活动没有针对用户类型分层进行,促销对销售额和利润的提升有限,导致增长降低。
(5)随着超市的不断发展没有进行新的促销和优惠活动,导致每年销售额和利润的增长趋势都很接近。
4.2 解决方案
超市不断的发展,经营、促销活动需要根据数据特点进行改进,本文通过4年历史数据提出如下几点解决方案:
(1)根据用户层级特点针对性维护。将通过RFM分级获得的不同用户分层进行不同的维护方式,RFM评分都很高的客户是超市的重要客户,可以进行针对性的VIP和促销活动;针对消费频率低的用户需要通过一些促销、发放优惠券的方式促进其多次消费;消费金额低的用户则可以通过商品特价方式从而促进其对于高价商品的购买;新用户和流失用户需要通过一些电话、短信等方式进一步激活和促进其进行多次消费。
(2)根据预测的销售额进行精准营销和补货。根据第3部分时间序列分析预测的销售额结果,对于销售额可能会比较低的月份举办一些优惠和促销活动,促进商品的销售,销售额比较高的月份则需要多补货,同时推出一些新商品,促进新商品的销售。
(3)利用好节日营销补充商品。美国有黑色星期五、万圣节和圣诞节,超市商品主要是办公用户、家具等,则可以根据节日特点补充一些有节日特色的商品,从而在节日期间能够进一步促进商品的销售量和销售额。
5. 局限性
数据来源于Kaggle是历史数据,数据出处没有详细说明美国超市是哪家超市,同时数据不是实时数据,因此无法真切知道该超市的真实情况以及在行业中的地位,只能根据历史数据为超市销售数据分析方法提供建议。