新闻中心
数据分析总结(财务数据分析总结与反思)
上一篇发在的文章,是一年前了,现在已经是2020年了,感觉过了好久,又感觉是昨天。下面我就分享一下这一年多来,在数据分析道路上的一些收获和感想,以及目前的计划。
首先,做数据分析,熟练掌握SQL是每个分析师的必备技能,没有之一。虽然每个数据分析师都会写SQL,但每个人水平的高下,一看代码就一目了然。但遗憾的是,就我所见,能写出好的SQL的数据分析师凤毛麟角。有的分析师认为写SQL很简单,不就select from where (group by) order by 吗?但写SQL与Java/C/Python程序员写程序如出一辙,也需要一套规范,并需要经过一定程度严谨的训练。
你的SQL有注释吗?如果另一个分析师来阅读你的代码,你的SQL易懂吗?容易修改扩展吗?每一段代码完成一个单独的功能吗?每一段代码你去校验过数据吗?(业务数据库里或多或少都会有脏数据,如何判断,如何排查?)你是如何校验数据的?看返回的数据量?取出一定量的数据用肉眼去检验?如果最后的结果与你的预期相差太大,你是如何去校验和排查的?同一段代码,如果两次运行的结果不一致,又该如何去快速检查?当你的SQL运行很长时间都没有结果返回时,你会去查问题吗?你知道如何查吗?如何优化你的SQL?你会用SQL的一些高级功能吗?比如窗口函数。写好SQL只是基础,但往往是基础的东西,被很多人忽视,而导致数据错误,分析结论误导。
上面只是做好数据分析师的基本功。你看“数据分析”四个字,其实很有意思。“数”,就是如何正确的获取到分析所要用到的原始数据;”据“,就是分析的过程中要有理有”据“;”分析“,就是”分“而”析“之,如何把一个大的问题很好的拆解成一个个小的问题,抽丝剥茧,由表及里的一层一层的分析。
我将整个数据分析过程分为需求,数据,分析,报告,落地这5个阶段。5个阶段每个都很重要,环环相扣,递进向前,阶段之间也有回溯。开篇讲的SQL只是在这个链条的”数据“这一环节。
数据分析开始于”需求“。需求通常是业务部门根据自身当前所处的业务发展的阶段,提出的一些或大或小的分析要求。关于需求可以讲的有很多,在这里,我只想强调一定要明确需求和验证需求。有时,业务同学对自己的需求也不是很明白,你需要根据自己对业务的理解和对数据本身的了解程度,和他们一起讨论,来把需求梳理清楚。有时,业务同学会提供一些背景资料,但你一定要用数据去加以验证。你要知道,是你对最终的数据和分析结果负责。
需求初步明确了,就可以开始数据获取和分析数据了。前面已经讲了SQL在这个过程中的作用。很多时候,在数据获取过程中,你会发现一些之前没有想到的可以进一步分析的点,这个时候,你需要深入的挖掘数据,将分析深入进行下去。
数据的准备和分析阶段告一段落后,就可以开始写分析报告了。分析报告就是把你的分析过程和分析成果以一种简明扼要的方式展示出来。这时候,你需要在之前的数据基础上进行提炼,抓住重点,以数据为支撑来讲述一个符合事实和逻辑的故事。
但分析不应该止步于于报告,更重要的是,我们要把从分析中得到的有价值的结论和洞察运用于业务场景中,指导业务更好的运营以提升关键的指标。这就是分析的落地。
分析过程涉及硬技能和软技能的综合运用。很多分析师用的最多的硬技能就是SQL。其实,灵活的运用Python以及机器学习可以让你做出一些有意思的项目。比如,我除了常规的一些分析工作外,还做了一些预测模型。软技能就是能够和业务同学很好的去交流讨论,能够用自己的分析去影响到他们的决策。
上面只是我做数据分析的一点体会,也正是在这一过程中,我对编程的兴趣和热爱被重新激发了。这也就有了我将要写的专栏”编程之美“。
下面把这首王安石的《元日》送给大家,祝各位新年快乐,万事如意!
元日
爆竹声中一岁除
春风送暖入屠苏
千门万户曈曈日
总把新桃换旧符