新闻中心

数据分析入门-----相关专业和课程简介(1)(数据分析要学什么相关课程)

2023-05-05
浏览次数:
返回列表

开篇———杂谈

随着科技的进步,数据分析现在越来越火,现在很多在校大学生以及已经进入社会的小伙伴都会利用空闲时间学习数据分析相关技术,如入门基础的数学知识、编程知识,进阶的算法知识和项目实战等。现在互联网上有各种的在线培训班和训练营,参加这些课程基本上能覆盖到日常用到的数学知识、编程知识等,然而真正要自己去做一个项目时,会发现现在学到的知识不够透彻,有很多疑问,为了确保项目能落地执行,还是要再深入学习相关的数学知识。

本人现在就职于某科技公司,从事数据分析工作,刚好大学期间又系统地学习了数据分析的相关课程,借此从新复习与总结,也帮助一下想要入门的小伙伴们,少走弯路。

正题————专业背景分析

目前从事数据分析专业的人员较大多数的专业背景为数学专业、统计学专业、计算机专业等3类,在大学期间他们都学过的一些比较实用的数学课程,当然,因为不同的学校学生基础不同,开设的课程和使用的教材有所区别,教授的深度也有所区别。

1)、数学专业:

数学专业的本科生,如数学与应用数学信息与计算科学专业学得比较系统和深入一些,他们的必修课是《高等代数》(简称高代)、《数学分析上》(简称数分)、《数学分析下》、《解析几何》、《常微分方程》、《复变函数》、《概率论与数理统计》、《数值计算方法》、《数学模型》等课程。高代和数分是最重要的,因为考研的专业科目就是这两门,复试科目很多学校会考《常微分方程》、《概率论与数理统计》、《复变函数》等选一门或两门。

至于硕士研究生和博士研究生,所学的数学知识会更深,是在本科的基础上再上一个台阶。该部分暂时不在基础教程部分,我们先从基础的数学基础开始讲起。以下是数学专业使用到的教程,后续会对做数据分析时经常使用到的数学知识进行讲解。

高等代数 北京大学系编

数学分析 华东师范大学 编

2)、统计学:

统计学专业的学生在大学期间学过的数学主干课程为《数学分析》、《几何代数》、《数学实验》、《统计学原理》、《常微分方程》、《数理统计》、《回归分析》、《抽样调查》、《多元统计》、《数据分析及统计软件》,...等课程。

该专业培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。在我的同事中,很大一部分都是统计学专业的。

应用回归分析 中国人民大学出版社

浙大 第四版

3)、计算机专业:

计算机专业的的学生在大学期间应该都学过相关的数学知识,如《高等数学》、《线性代数》、《离散数学》、《概率论与数理统计》等课程。由于计算机专业的学生对数学的要求不及前两个专业要求那么高,只要求会使用相关的方法进行计算,不需要进行定理的证明,以及所学的数学科目没前两者那么多,所以该专业的学生的数学基础相对弱一点。

那么问题来了,以上三个专业在数据分析行业哪个专业更加吃香,更受欢迎?

这个问题的答案估计问到不同的人得到的答案估计都会不一样。既然得不到确定的答案,我们一起来分析一下各个专业的学生存在的优劣势吧!

数学专业:

优势:数学理论基础更扎实。相对于统计学专业和计算机专业,这个专业的学生大学四年都在学数学;统计学专业的学生在前两年学习的课程和数学专业的基本相同,在大三时开始体现出专业上的差异,他们学习统计学、经济学方向的课程;计算机专业从大一开始学习的数学就比前两个专业的简单一些,后面学的数学就更少了。

劣势:计算机水平不高,编程经验不足。数学专业的学生学习的计算机课程都是最基础的入门课程,学习的时间较短,加上项目实践缺乏,很容易忘记。至于我嘛,在大学时,因为参加数学建模比赛和课程需要,我们学过MATLAB、MAPLE、SPSS等软件,工作后学了python,现在python这么火,估计很多学生也学了吧。

统计学专业:

优势:数学知识+统计学知识。由于统计学已经是数学的一个分支,在这里把统计学和数学专业分开来看,所说的数学知识和统计学知识是两回事。统计学的学生在大学期间很多都数学专业的主干课程,也学过R、Eviews、SPSS、SAS、SQL等软件,这四个软件都是统计学相关的软件,有些学校要求学生都要参加问卷调查项目,然后用R、SPSS等软件进行分析。

劣势:计算机水平不高,编程经验不足。统计学专业的学生的计算机水平和数学专业差不多,大学四年时间很大一部分都花在理论知识学习中,编程经验较少。

计算机专业:

优势:扎实的编程能力。由于计算机专业的学生在大学期间学习过多门编程语言,编程经验丰富,他们的程序开发能力比数学专业和统计学专业的都强。目前较流行的大数据软件Hadoop、spark、hive、mathout等都是基于Java、C++、Scala等面向对象语言开发的,这对计算机专业的学生来说,上手的速度较其他专业容易。

劣势:数学基础不够扎实。由于专业培养方向的问题,开设的数学课程只覆盖常用到的基础课程而已,加上学习时间短,所以在数学理论和思维上不如数学专业的学生。

总而言之,不同专业背景的学生在工作能力方面各有所侧重,尺有所短,寸有所长,只要把对应的人用对在合适的位置上,就可以创造出辉煌的业绩。另外,各个专业的学生根据自己的短板进行针对性的填补,也可以成为全面发展的人才。

(PS:后面的文章开始整理数据分析时用到的《高等代数》、《数学分析》知识,为了巩固所学知识而从习题中拿出一些出来做课后练习,并在下一期时给出相应的答案。)

搜索