新闻中心
想要从事数据分析工作,应该做什么准备?如何切入?(学数据分析可以做什么工作)
认清并接受自己能力的边界,依此合理“使用自己”,并用工具来扩展边界。
我个人是一个BI实施公司的BA(业务分析师),所以平常会跟较多的业务人员和技术人员打交道。就我的观察而言,学会一项工具,能让你直接地开始做一些事,而工作输出的效果和价值会受限于你的分析思路。在实际工作情况下,更多的人是先理解技术和工具,再逐步地去总结出自己的“道”,即方法和经验。你去问很多的初级技术人员,他们很清楚地了解工具的特性,但不见得真的有很清晰的分析思路,所谓思路,都是在“需求”和工作压力之下,结合学习和经验,激发出的产物。
哪一些更重要?这取决于你所处的阶段。不同的人在不同的阶段会遇到不一样的瓶颈,常见的情况就是,懂了技术会慢慢发现终归要“搞定人”,而侧重于搞定人的也持续地依赖于技术对于效率的巨大提升。
如果非要分一个先后,从题主的描述来看,只是为了获得进入数据分析行业的门票,可以优先对“工具”的学习。万事开头难,当你能够使用一个分析工具处理数据,并且形成这个工具支持的输出结果,这就已经以为着你能应用这个数据,在别人具体的要求下,形成具有价值的结果。无论你是否真的有思路,至少你能顺着工具自带的逻辑,迈出第一步。这是因为技术工具本身就是他人思维的产物,比起大而全地去学习方法论,技术工具的使用和输出是明确的,能更快地让学习者试错,不断明确方向。有了明确的应用场景,就能有针对性地查漏补缺,在过程中形成属于自己的思想,去补充那些阻碍你使用的方法缺失点。
君子生非异也,善假于物也。
从这个点来看,其实无需强行地将工具和分析方法对立。因为在数据分析领域,工具中本身就蕴含着很多的分析方法,而对着一堆分析方法的概念,你是无法想象技术的应用场景的,对于形成结果本身,很难产生可量化的明确成果,这对于刚刚入门或者期待转行的人来说,过于虚无缥缈。重要的是行动起来,精进技能,并发现工作和生活中值得分析的数据和价值。
总的来说,在实际的业务分析场景下,只要不是高精尖的复杂统计问题。分析方法会让你的分析工作锦上添花,但是它更多可以通过特定问题和情境压力下的激发,通过和同事讨论还有实时学习,进而解决问题。而如果你完全不懂一个工具,在存在学习门槛的情况下,你面对的问题,可能是根本无法动手这样十分尴尬的境地。
按具体工具技能来说,当前数据分析工作涵盖的内容主要有如下几大方面:
1.BI(商业智能)软件/技术平台操作:Tableau、Power bi、帆软、Qlik、IBM等,有些公司会有内部的BI软件,比如阿里的Quike BI,功能上以数据可视化为主体,外加数据调用和清洗治理功能。(前端分析报表开发-区别于传统软件开发前端,更偏向于业务数据分析,这些软件都不难)
2.统计分析软件:Excel(一定不能忽视的技能,是理解很多业务场景的基础)、SAS、Sass等(跟BI软件有趋同和取代趋势)
3.SQL、数据库开发、ETL(日常取数,后端数据库及数据仓库搭建)
4.统计学
5.分析模型、算法(业务向分析模型OR)
6.Python或者R(数据挖掘、AI)
2015年开始,敏捷BI软件开始挤占市场并迅速取代传统BI的统治地位,进而国内还是国外都开始大肆涉足BI领域,其实敏捷BI并不是比传统BI高级,但是敏捷BI可以代表BI的重要发展方向,其最主要的一个特征就是 :个人及小型团体获取并分析数据的门槛大大降低。而也由于这个核心特征,数据分析师这个岗位自16年起被宣传得很热。但目前其涵盖的内容其实偏广,需要求职者们仔细的考量和权衡。
从岗位职责来看,数据分析师这个岗位所涵盖的工作内容可以分为以下几个方向(这是一个复合型岗位):
1.业务数据分析。在互联网企业,专业的业务型数据分析师主要是通过数据模型和专业知识,对用户和业务如何“增长”做出分析,或者对产品本身的效果,通过数据的维度进行监控,并得出建议。总得来说是一个支持沟通岗位,要求对业务十分了解,有清晰的逻辑和沟通能力,输出形成各种分析报告。对于技术的要求主要停留在Excel、敏捷BI软件的基本使用和出色的文字及PPT能力上,需要能用SQL语言进行基本的数据获取。
2.BA(商业/业务分析,注意英文单词的区别)这既是一个岗位(Business Analysis,作为岗位/角色主要是分析业务和数据需求,以支持IT运维或项目实施),也是一个国外兴起的新兴专业(Business Analytics,作为专业是偏统计和数据科学方向)。作为岗位来说:要懂技术而不需要会技术,要懂业务并且化为技术逻辑。核心职责是“需求分析”,即结合客户业务需求,归纳文档,制作报表/产品原型,形成数据字典,提供给技术实施(前端后端)人员查看。业内的话,这个岗位还会要兼顾售前(区别于销售,主要是投标、报价方面的工作)、产品经理、项目经理的部分或者全部职能。视公司情况而定(此岗位以乙方公司居多)(甲方乙方也会有区别,但核心职能不变)。作为专业来说:这是一门统计学+商科(偏经济、财会、金融)+计算机科学的复合学科。
3.技术实施人员(偏前端报表方向):一般来说,要求精通BI软件、会Excel、会用SQL进行ETL工作。乙方公司的主要职责是前端报表开发(做好前端图表计算逻辑、完善交互、美观界面、与后端ETL核对数据);甲方公司的主要职责是:结合新需求制作报表、运维(修改前端报表)、取数、同时兼顾一些沟通与汇报职能等。
4.数据挖掘和AI大数据开发,这个需要结合Python和R语言(目前主流是Python),技术向更深,需要编程基础,同时需要掌握较为复杂的技术逻辑和统计学模型。也有称其为数据科学家(data scientist)。
从发展趋势上来说,数据分析师的第一、二种是沟通型+技术型复合岗位,第四种是高级技术岗位,但第三种,目前市面上基数最大,但很容易被学会了BI前端软件的业务人员取代。眼下BI的概念正在逐步降温,随着更多的人了解BI,掌握BI工具很难支撑起一个独立岗位的工作内容。
数据分析师这个岗位,长远来看是容易被“边缘化”的一个岗位,更多的是一个角色,而很难作为一个独立的岗位存在,必然是依附于业务或者IT,而逐渐地化为IT或者业务人员的一种技能。单纯地“帮助决策、设定目标”“提供数据分析支持”这种类似于“军师”一般的存在,并非不可能,但现实角度来说,做到这样很难。当然比起很多职业,它有其特殊性和优势,但这是建立在对岗位和技能清晰的认知之上的。