新闻中心
数据分析的一些软件介绍(数据分析软件都有啥)
作为统计学专业的学习者和热爱者,我总结一下近些年来我接触的软件
1、基础数据处理软件
Excel,Power Query,这两个都是微软旗下的,首先Excel是最基础的数据分析工具,没有Excel函数以及数据处理相关知识基础,用其他软件还是会有些困难,很多函数的定义都是互通的,虽然具体写法有时候不同,但是用法大同小异。Power Query是微软开发的智能数据处理工具,可以说它弥补了Excel处理数据的短板,并且微软还为它“配备”了专门的M函数,直接下载Power BI,里面就已经包含Power Query
2、数据处理与分析软件
(1)Python:Python功能很多,数据分析是其中一个,它的Pandas库,可以说是Python中的excel,用Pandas做数据分析时常搭配numpy库和matplotlib库进行使用,适用于批量处理数据和可视化
(2)R软件:R是一种开源的统计软件,是统计学在各个领域运用的较为广泛的软件,在统计学和各领域结合研究中,经常会看到R软件的身影;我之前特别喜欢R的可视化功能,现在有了BI软件以后,我感觉BI更香,BI画图效率更高,R也是免费软件
(3)matlab:matlab在进行矩阵运算时非常有优势,总体来说它更加侧重于是一款数学软件,建模运算也很强,是大学里面的比赛,比如数学建模的首选分析软件,matlab有做神经网络专门的工具包,神经网络这块个人感觉比Python好用一些
(4)SPSS和SAS:专业的统计分析软件,适用于多种统计分析方法。SPSS是我本科主修软件,SPSS实现统计建模与分析不需要编程,这一点也是它的优势,像一些因子分析,方差分析,聚类分析等等,用SPSS会相对便捷一些,我说的这个SPSS主要是SPSS系列的SPSS Statistics软件,侧重于做统计分析;现在IBM公司的SPSS系列还有一个SPSS Modeler 软件,主要做数据挖掘、机器学习建模的,侧重于做算法建模;同样它也是图形化操作界面,较其他机器学习软件(比如Python)的优势是不用编程,这点灰常友好
(5)SQL:数据分析岗位必备,SQL是结构化查询语言,基于数据库的语言。不同公司用的数据库不一样,SQL语句也不同,但是底层逻辑是相同的。比较多的是Oracle、MySQL、SQL Server,我个人习惯用MySQL,开发环境用Navicat和SQLyog多一些
(6)Eviews和Stata,专业统计软件,做时间序列灰常不错,并且操作很简便,我建立时间序列预测模型和回归模型主要使用软件
3、可视化软件
我之前做图都是用Excel,但是效率很低,工作量大,所以我开始涉猎可视化软件,我接触的主要是Tableau和Power BI这两款比较火的软件
(1)Tableau,图片色彩相当棒,毕竟他的创始人之一是皮克斯工作室创始人之一(获得过奥斯卡视觉奖那种),Tableau做数据地图超级方便,图表设计速度快,便于做Dashboard,目前很多公司都在用,不过是收费的,价格不便宜,个人版也不是免费的
(2)Power BI,微软旗下的BI软件,功能与Tableau大同小异,最小设计颗粒度为Dashboard(Tableau最小颗粒度为工作表),个人版是免费的,而且它以DAX语言作为支撑,度量值用起来可是真香,从看板建立来说,我用Power BI比较顺手,但是有一说一,PowerBI的图表色彩实在比不过Tableau