新闻中心
SAS系列01——简介(sas官方教程)
【本文用于教学】
前言:安装SAS Studio
完整安装SAS软件价格不菲,当你不在学校/公司,或者手边的电脑没有SAS时,推荐以下免费版本的SAS Studio:

这里重点介绍左边两个【持续更新亲测体验】:
第一:SAS University Edition【目前安装后SAS Studio可能无法使用,不过JupyterLab可使用,需亲测】
第二:SAS OnDemand 【推荐,网页版SAS,只是可能稳定性差点儿】
第一:SAS 大学版 (SAS University Edition)
官网有详细的安装教程(按照步骤来即可)
https://www.sas.com/zh_cn/software/university-edition/download-software.html#osx-use
安装文件(从官网下载,为免费版本):
VirtualBox-6.1.18-142142-Win.exe108.3M · 百度网盘VirtualBox-6.1.18-142142-OSX.dmg124.4M · 百度网盘unvbasicvapp__9411016__ova__en__sp0__1.ova2.5G · 百度网盘安装完成后,浏览器打开 http://localhost:10080, 就看到如下

【目前,笔者亲测,只能使用JupyterLab】


这样就得到了一个比较简陋的“计算器”,输入SAS代码,运行就出结果了。

第二:SAS 网页版 (SAS OnDemand)
按照步骤弄就可以,要注册一个账户(推荐使用学校邮箱),登陆 https://welcome.oda.sas.com/login

这样,就可以使用SAS网页版(云版)了。

正文:SAS介绍及基础
一、SAS介绍
1. SAS是专业的统计分析软件,它对表格数据进行操作和统计分析比用Matlab更方便更专业。
2. SAS,SPSS,EXCEL区别
都能用于处理数据和统计分析,高级程度:
SAS > SPSS > EXCEL
EXCEL——侧重表格(办公),只能处理一些简单的数据分析,公式丰富,一般多用于计算(统计分析结果不全面);SPSS——专业统计分析软件,界面菜单式操作,简单易学,缺点是通用性不好(处理同样的数据,也要重复点菜单);SAS——更专业统计分析软件,代码编程实现(通用性好),大多用于金融、医药等领域,用于大企业的数据分析,缺点是较难学。3. 要学好SAS,也离不开《统计学》。
二、SAS基础
SAS语言 不区分大小写; 每一条SAS语句以SAS命令关键词开始,以分号结尾; 一条语句可以写在多行(只要不拆分单词); 注释可以用 /*……*/ 或者 *......;【例】
*Read animals’ weights from file; DATA animals; INFILE ’c:\MyRawData\Zoo.dat’; INPUT Lions Tigers; PROC PRINT DATA=animals; /*Print the results*/ RUN;2. 数据集
(1)即“数据表”,一行称为一个观测值;一列称为一个变量(属性)

(2)数据类型:数值型、字符型
注:“Id”等根据需要既可当作数值型或字符型。
(3)缺失值
数值型缺失值用 . 表示;字符型缺失值用空格表示;(4)命名规则:
名称长度不能超过32个字符;名称必须以字母或下划线开始;名称仅可包括字母、数字或者下划线;名称中字母大小写均可(不区分)。注1:数据集和变量可以有描述性信息,比如数据集有创建日期、观测值数、变量数等;变量有类型、长度、格式等。
注2:数据集按一行(观测值)一行(观测值)执行。
3. SAS程序两个基本模块

注1:好的习惯是,在它们的结尾都加上RUN,指示该模块的结束,告诉SAS去执行所有之前的程序行。
注2:一个程序可以有多个数据步、过程步。
【例】学生测验成绩:编号、性别、科目1、科目2、家庭作业。
data Test; input Subject 1-2 Gender $ 4 Exam1 6-8 Exam2 10-12 HW_Grade $ 14; datalines; /* datalines, 数据行开始标志 */ 10 M 80 84 A 7 M 85 89 A 4 F 90 86 B 20 M 82 85 B 25 F 94 94 A 14 F 88 84 C ; /* 分号, 为数据行结束标志 */ run; proc print data=Test; title 学生测验成绩; run; proc means data=Test; title 学生测验成绩分析; run;程序说明:Test为数据集名称;input变量名称及其在数据列中的位置,例如1-2表示第1、2列,变量是字符型需要加上$;datalines表示数据开始,注意数据中空格数目与input中列数的对应。
运行结果:

4. SAS程序执行过程
编完SAS程序,点“提交”按钮,将执行代码,报错和执行过程出现在日志窗口,运行结果出现在结果窗口(输出结果也可以改用html格式输出)。
注:修改语法错误后,最好先清空日志窗口,然后再次提交程序。
5. SAS数据集的存取及访问
(1)SAS数据集采用二级名称,即
libref.filename
其中,libref表示路径名(逻辑库),filename表示数据文件名(数据集)。例如在路径/home/SASaccount下建立数据集data1,可以用如下代码:
libname mylib "/home/SASaccount"; data mylib.data1;程序说明:
libname 定义路径变量mylib用来存储路径"/home/SASaccount",之后就可以使用该路径变量,在其路径下创建数据集。"/home/SASaccount"为OS X系统网页版sas studio的路径,其他版本路径可能会有不同,例如windows版sas 9.4路径形式类似"d:\SASWorks"。(2)SAS数据集的存储分为临时存储和永久存储
不指定存储位置,会默认存入Work目录下,此时为临时存储(退出SAS数据将消失);其它目录下的存储都是永久存储,存储时需要指定逻辑库使用格式“libref.filename”。注:二级名称“Work.data1” 等同于一级名称“data1”。