新闻中心
读书笔记 谁说菜鸟不会数据分析(入门篇)(一)(菜鸟学数据分析好吗)
第一章 数据分析那些事儿
1.1数据分析是“神马”
何谓数据分析
简单来说,数据分析就是对数据进行分析。较为专业的说法,数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中提炼出来,总结出所研究对象的内在规律。
数据分析的作用
1.现状分析
简单来说就是告诉你过去发生了什么。具体体现在:
第一,告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明企业整体运营是好了还是坏了,好的程度如何,坏的程度又到哪里。
第二,告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营状况有更深入的了解。
现状分析一般通过日常通报来玩呈,如日报、周报、月报等形式。
2.原因分析
简单来说就是告诉你某一现状为什么发生。
经过第一阶段的现状分析,我们对企业的运营情况有了基本了解,但不知道运营情况具体好在哪里,差在哪里,是什么原因引起的。这时就需要开展原因分析,以进一步确定业务变动的具体原因。例如,2012年2月运营收入环比下降5%,是什么原因导致的呢?是各项业务收入都出现下降,还是个别业务收入下降引起的?是各个地区业务收入都出现下降,还是个别地区业务收入下降引起的。这就需要我们开展原因分析,进一步确定收入下降的具体原因,对运营策略做出调整与优化。
原因分析一般通过专题分析来完成,根据业务运营情况选择针对某一现状进行原因分析。
3.预测分析
简单来说就是告诉你将来会发生什么。
在了解企业运营状况后,有时还需要对企业未来发展趋势做出预测,为制定企业运营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
预测分析一般通过专题分析来完成,通常在制订企业季度、年度等计划时进行,其开展的频率没有现状分析及原因分析高。
1.2数据分析六步曲
明确分析的目的和思路
菜鸟与数据分析师的区别
菜鸟会想分析师会想这张曲线图真好看,怎么做的?数据变化的背后真相是什么?这些数据可以做什么样的分析?从哪些角度分析数据才系统?高级的分析方法在这里能用吗?用什么方法最有效?要作多少张图表?图表是否表达出有效的观点?除了为数据添加说明还需说什么?数据分析的目的达到了吗?数据分析报告要写多少页?数据分析报告有说服力吗?明确数据分析目的以及确定分析思路是确保数据分析过程有效进行的先决条件,它可以为数据的收集、处理及分析提供清晰的指引方向。
数据收集
数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供了素材和依据。
一般数据来源
1.数据库
2.公开出版物
3.互联网
4.市场调查
数据处理
主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。
数据处理是数据分析的前提,对有效数据的分析才是有意义的。
数据分析
数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
数据分析与数据处理的区别
数据处理是数据分析的基础,通过数据处理,将收集到的原始数据转换为可以分析的形式,并且保证数据的一致性和有效性。
数据分析与数据挖掘的关系
数据挖掘是一种高级的数据分析方法。数据挖掘就是从大量的数据中挖掘出有用的信息,它是根据用户的特定需求,从浩如烟海的数据中找出所需的信息,以满足用户的特定需求。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。一般来说,数据挖掘侧重解决四类数据分析问题,分类、聚类、关联和预测,重点在寻找模式与规律。数据分析与数据挖掘本质是一样的,都是从数据里面发现关于业务的知识。
数据展现
数据是通过表格和图形的方式来呈现的。
常用的数据图表包括饼图、柱形图、折线图、散点图、雷达图等。
可以对这些图表进行进一步整理加工,使之变成我们所需要的图形,如金字塔图、矩阵图、漏斗图、帕累托图等。
报告撰写
数据分析报告是对整个分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整的呈现出来,供决策者参考。所以,数据分析报告是通过对数据全方位的科学分析来评估企业运营质量,为决策者提供科学、严谨的决策依据,以降低企业运营风险,提高企业核心竞争力。
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。结构清晰、主次分明,可以使阅读者正确理解报告内容;图文并茂可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
好的分析报告一定要有建议或解决方案。作为决策者,需要的不仅仅是找出问题,更重要的是建议或解决方案,以便他们在决策时做参考作。所以,作为数据分析师,不仅仅要掌握数据分析方法,而且还要了解和熟悉业务,这样才能根据发现的业务问题,提出具有可行性的建议或者解决方案。
手托腮帮,沉思痛苦状--在思考分析思路。
手放键盘上不动,表情呆滞--在数据处理。
鼠标在飞快移动--在用数据透视表做分析。
不断交替点击鼠标左右键--在画图表。
断断续续敲击键盘,时而移动数据表--在写PPT分析报告。
1.3数据分析的三大误区
分析目的不明确,为分析而分析
数据分析不应为了分析而分析,而是应该围绕你的分析目的(了解现状、找出变动原因、预测发展等)而进行分析。
缺乏业务知识,分析结果偏离实际
数据分析师的任务不是单纯做数学题,数据分析师还必须冬营销,懂管理,更要懂策略。
一味追求高级分析方法,热衷研究模型
高级的数据分析方法不一定是最好的,能够简单有效解决问题的方法才是最好的。不论高级的分析方法还是简单的分析方法,只要能够结局业务问题,就是好方法。
1.4数据分析师的职业发展
数据分析的前景广阔
社会越发达,人们对数据的依赖剧越多。无论政府决策还是公司运营,科学研究还是媒体宣传,都需要数据支持。对数据有如此大的依赖,就必然导致对数据分析的大量需求。将数据转化为知识、结论和规律,就是数据分析的作用和价值。
数据分析师的职业要求
懂业务
熟悉行业知识、公司业务及流程。懂业务是数据敏感的体现。
懂管理
一方面是搭建数据分析框架的要求,需要用到营销、管理等理论知识来指导,另一方面的作用是针对数据分析结论提出有指导意义的分析建议,如果没有管理理论的支撑,就难以确保分析建议的有效性。
懂分析
掌握数据分析的基本原理与一些有效的数据分析方法
基本的分析方法:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。
高级的分析方法:相关分析法,回归分析法,法聚类分析法,判别分析法,主成分分析法,因子分析法、对应分析法、时间序列等。
懂工具
掌握术后据分析相关的常用工具
常用的数据分析工具有Excel、Access、SPSS、SAS。建议先用好Excel分析工具。
懂设计
指运用图表有效表达数据分析师的分析观点,使分析结果一目了然。
数据分析师的基本素质
态度严谨负责、好奇心强列、逻辑思维清晰、擅长模仿学习、勇于创新
1.5几个常用指标和术语
平均数
算术平均数,就是一组数据的算术平均值,即全部数据累加后除以数据个数。算术平均数是非常重要的基础性指标,它的特点是将总体内各单位的数据差异抽象化,代表总体的一般水平,掩盖了总体内各单位的差异。
绝对数与相对数
绝对数是反映客观现象总体在一定时间、地点条件下的总规模总水平的综合性指标,也是数据分析中常用的指标,如GDP、总人口等。此外,绝对数也可以表现为在一定时间、地点条件下数量增减变化的绝对数,比如A国人口比B国人口多1000万人等。
相对数是指由两个有联系的指标对比计算而到到的数值,用以反映客观现象之间数量联系程度的综合指标。
百分比与百分点
百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。百分比通常采用百分号(%)来表示,如8%,50%,168%等。由于百分比的分母都是100,也就是都以1%作为度量单位,因此便于比较,在数据分析中的应用非常广泛。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,一个百分点等于1%。
频数与频率
频数是指一组数据中个别数据重复出现的次数。(绝对数)
频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。(相对数)
比例与比率(相对数)
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比例是指不同类别数值的对比,它反映的是不同部分与整体之间的关系,而是一个整体中各部分之间的关系。
倍数与番数(相对数)
倍数是一个数除以另一个数所得的商。
番数是指原来数量的2的N次方倍。
同比与环比
同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。
总结
一、什么是数据分析以及数据分析的三大作用。
二、数据分析的六部曲:首先是明确分析目的和思路,然后是数据收集,第三步是将收集回来的数据进行处理,第四步是根据分析目的和思路进行数据分析,第五步是是将分析的结果通过图表的方式展现出来,最后一步是撰写数据分析报告。
三、常见的数据分析误区,明白数据分析的要求与基本素质,了解如何成为一个合格的数据分析师。
四、数据分析中常经常用到的指标和术语,除掌握基本的平均数、百分比等概念外,还需要将容易混淆的指标进行明确区分,避免在以后阐述分析结果时出现错误。
数据分析三字经
1.学习:先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新;
2.方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手;
3.分析:先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议。