新闻中心

库存数据分析(库存数据如何分析)

2023-09-27
浏览次数:
返回列表

一、数据处理

1.数据导入

数据较多,导入Navicat进行处理

2.数据处理

(1)表名、列名修改

将表名、列名修改为英文,更方便查询。因不考虑锁定库存,因此删去此列;

列名分别对应城市、门店名称、skuid、商品名称、一级分类、二级分类、总库存、失败原因

(2)缺失值处理

经过查询,共有17175条数据缺失商品名称、一级分类、二级分类和在库库存,失败原因皆是sku错误。

a、其中skuid为“2032927”的商品无任何一条商品明细记录,因此判断其为skuid错误导致的查询错误;

b、“重庆保利爱尚里店”缺失所有明细记录(即553条全缺失),“星光名都店”、“卧龙西路店”等30家门店缺失548条明细记录,如此大批量的缺失推断原因为查询过程中的失误/系统的失误导致的数值缺失;

c、“华润二十四城店”缺失34条明细记录,“果糖路店”缺失9条记录等等;

缺失计数统计如下(不包括缺失1条明细的记录):

d、其余123家门店均缺失1条记录(即skuid为“2032927”的商品记录)。

(3)重复值处理

数据集共有89586条数据,而经过查询共有162家门店,每家门店553个商品,162x553=89586,因此并没有重复值;

(4)异常值

有1944条数据因skuid错误含有“a”而查询错误,因此将“a”删去。

(5)删去缺失值

再做下一步的处理前,先删去所有缺失信息的记录(17175条),即剩下

72411条记录。

(6)查询在库库存为0的记录

查询所有库存为0的记录,查询结果共有35669条。

按一级分类归类,结果如下图:

经过查询,一级分类共有16中,上图正好也是16条数据,即每类商品都有着库存为0的情况(可能是今日售完,也可能是前几日售完未补)。其中,时令蔬菜缺库情况最为严重,推测原因为时蔬为每日刚需,且为保证时蔬的新鲜,库存量都有严格的控制,因此时蔬缺库情况最为严重(可以理解为最畅销),其次是水/饮料、零食、乳品、速食等食品类商品,最后是居家生活类商品,推测原因为家居品使用周期长、库存较充足。

库存<10和库存<50的情况与库存为0的情况相差不大。

这是按商品名称进行的库存为0的计数(只取前30条数据),可见,全是食品类商品。

二、结论

1.检查有大量缺失信息的店铺数据,找到查询错误的原因,可能是查询过程中的失误/系统的失误导致的数值缺失,重新获取数据;对于skuid误加“a”的数据,将“a”删去,重新获取数据;

2.对于时令蔬菜类商品,要根据销量严格把控每日库存,晚上可采取打折处理,确保第二日菜品的新鲜度,同时要把控物流运输情况,确保每日新鲜时蔬的准时到达;对于乳品烘焙、肉类家禽、新鲜水果、豆制品、海鲜水产类保质期短且需求量较之没那么大的商品,库存量要小于时令蔬菜类商品,但也要保证在库状况,以满足顾客需求。

3.对于水/饮料、休闲零食、方便速食、粮油调味等保质期较长且需求量也较大的商品,确保每日的在库情况,以满足顾客需求。

4.对于居家生活类需求量较小的商品,控制在库数量,最大程度保证在保质期内卖出。

搜索