新闻中心
怎样用Excel、PPT做数据分析及报告?(怎样用excel制作表格做出纸箱的简图)
数据分析步骤:

有些数据是公司从网上爬取的,爬取后交给数据分析师,这时候就要清洗数据了。
1. 明确问题

2. 理解数据





以字符串形式出现的任何数据类型都不可用于数学运算,字符串形式的出现的数字要经过处理才能用于数学运算
区分字符串类型的数字与数字类型的数字

3. 清洗数据


尽量不去删除不需要用到的数据,而是采用隐藏方式,以后要用到还可以恢复
选择子集:

恢复方式:

列名重命名:

删除重复值:


缺失值处理:
统计缺失值:鼠标左键单击不同列的编号,对比计数,查看缺失值(下图城市缺失数据2条)

由于此处缺失值少,可以通过查找定位,人工弥补缺失值


找到缺失值后直接输入缺失值,不要点击鼠标

缺失值处理还有其他3种方法:
删除缺失数据用平均值代替缺失值用统计模型计算出缺失值一致化数据处理:
适用于数据有统一的标准或者命名规则,例如:下图有的公司只有一个领域,而有的公司有多个领域
复制完以后,之前的公司所属领域就用不到了,隐藏起来,然后开始对复制后的列进行分列,点击拆分的列
进行如下操作
分列后,再给新的列命名
运用函数进行分列:
find函数的用法:
利用find函数,在某个薪水的单元格中找到字符串"k"(第一个"k")所对应的位置排序
将left函数与right函数组合使用,截取薪水字符串(可以去除数量单位"k")
find函数,在某个薪水的单元格中找到字符串"-"(第一个"-")所对应的位置排序,得出的位置排序+1表示mid的起始位置参数
利用将len函数与find函数组合使用,求出所找薪水字符串(可以去除数量单位"k")在单元格中的长度
应用上边的函数求,最低、最高薪水:
自动填充函数:
双击之后如下显示:
Excel的条件筛选功能:
再三确认不要勾选错误值
筛选之后发现:原来运用函数得出的工资,k与K大小写敏感
使用查找、替换功能,解决大小写问题:
用最高薪水=最低薪水处理掉15k以上的不明确工资
鼠标双击十字标,全部替换掉15k以上的不明确工资
字符串形式的数值转换为数字类型的数值
在最高薪水列号上右击鼠标,选择插入,可以在最高薪水列前插入一列
数据排序:
异常值处理:
鼠标点击有数据处的单元格后
清理不属于数据分析师职业的岗位
4. 数据分析 或 模型构建
新建透视表,统计不同城市的数据分析师岗位数量(占比)
在原工作表中对平均薪水做描述统计分析
再新建透视表,比较不同城市的平均薪水
工作年限不同,薪水的情况
数据可视化这部分内容在第4关日期规范化:
通过数据透视表得出每月的涨粉量(值:求和项)
按周汇总涨粉量(值:求和项)
求每个月的当日最大涨粉量涨粉量(值:求和项)
精确查找(0,假):从第一行查找开始,直到第一次找到才停止
模糊查找(非0,真):查找所有行,返回最后一次匹配到的值
利用辅助列(=姓名&学号)来查找来避免查出重复值
利用辅助列(=姓名&学号)来查找来避免查出重复值
点击十字光标实现整列运用函数
利用vlookup函数进行数据分组:
进行分组使用模糊查找(非0,真):
注意上图的范围,即要模糊查找的原因
确定查找范围要注意三种引用方式的使用:
通过按F4键,改变引用方式
5. 数据可视化
视觉排版位置顺序:越重要的数据展示的顺序越优先
以下图片来源:
1.如何看懂不同类型的图表?
2. 常见的图像有哪些?
散点图可以显示数据之间的相关性
3. 其他图形
突出数据集中的关键词用词云图
4. 如何选择图表?
选择那些用户最容易阅读的类型
简单才是最美的
艾瑞网行业报告:
5. 如何避免制作图表中的坑?
要从图片中看出,解雇人员后,工单数有何变化。
蓝色折线是每个月 新增工单数
红色折线是 处理工单数
可以看出,从7月解雇人员后,新增工单数 超过了处理工单数。
说明人力不足,的确导致团队生产力下降。
那图形中有哪些地方可以优化呢?
优化:
(1)去掉网格线 - 让数据更突出
(2)去掉数据标记;数据标记在本数据中没有用
(3)把X轴变成正的,不要斜着字体
(4)把Y轴,去掉小数点
(5)去掉不必要的图例,直接在需要描述的数据旁边,标注出来
6. 如何用Excel绘制图表
开始绘制图表:
现在生成的图表,是Excel默认格式,需要对图表进行优化。
为了让用户更能看懂这个图表,首先我们需要将数据和图表分开到两张工作表去
优化图表:
(1)隐藏图表上所有字段按钮-黄色
(2)删除标题和图例-红色(标题可以用excel表格名字来表达)
(3)删除网格
(4)去掉填充和边框
下面我们将背景设置成白色:
下面对图表配色进行优化:
根据网站给出的配色RGB,自己更改表格中的颜色
设置颜色:
设置字体:
对数据进行排序:
保存为模板,下次可以直接用
数据分析报告核心内容:
数据分析结果,研究问题的基本情况,结论,以及建议
做数据分析报告之前,要搞清楚三件事:
一、在跟谁沟通,给谁看,确保用户能懂报告的内容
二、要知道用户希望从报告中获取什么内容,呈现对用户最有用的内容
三、如何运用数据表达自己的观点(图表要能展示出我的数据结论)
数据分析报告要做的事是:目标增大共同认知
数据分析报告的结构:总—分—总
开篇内容:报告的题目,分析背景与目的,分析思路
正文内容:具体的分析的分析过程与结果
结尾内容:结论与建议
正文内容举例:
报告样板:
除了TalkingData还有很多报告网站,如:
艾瑞研究-艾瑞网:
艾媒网:
199IT互联网数据中心:
DataEye (游戏行业):
电影电视行业报告:
旅游行业报告:
下面看一下PPT制作数据分析报告中的细节问题:
用电脑看,选择横向(16:9)最合适
手机看,选择自定义幻灯片大小,模式改为 纵向。宽度:14.288, 高度:24.6 是最适合的。
在一开始,使用完全空白的ppt主题,避免使用内置主题影响灵感
选择插入选项卡的文本框写内容
呈现的内容尽量控制在三种颜色,三种形状以内
设置幻灯片母板:
设置固定的字体方法:
将Excel的图表内容弄到PPT里:
PPT简单,避免过多动画效果学会使用演讲者视图,写好备注PPT结尾页用来留给数据分析的结论与建议,不要弄成致谢,口头表述致谢
写逐字逐句关于数据分析报告的演讲稿,熟练熟背,不要对着PPT念,口头上增加PPT报告里没有的东西
PPT模板:
office官网PPT模板
图片素材 阿里巴巴矢量图标库
pixabay获取免费高清图片
补充: