新闻中心

sas学习笔记|sas统计分析实用宝典(2)(关于sas的计分方法下列描述正确的是)

2023-08-09
浏览次数:
返回列表

1. 描述性统计——连续性的统计

2. 列联表分析——离散型数据分析

proc freq data=test; tables sex xueli zhicheng; /*单变量列联表分析*/ run; proc freq data=test; tables sex*xueli; /*2*2的列联表分析*/ run; /*关联性检验*/ proc freq data=test; tables xueli*zhicheng/chisq measures; run; proc freq data=test; tables sex*xueli*zhicheng; /*n维列联表分析,按照第一个变量分组*/ run;

3. 统计推断

统计推断涉及两大核心问题:参数估计和假设检验。

单个样本平均数的假设检验 proc ttest data=test h0=500; run; 成对样本的均值比较多假设检验 proc ttest data=test; paired a*b; run; proc ttest data=test;/*两个样本平均数比较多假设检验*/ class a; /*指定分组变量*/ var b; /*指定t检验的分析变量*/ run;

通过analyst模块实现单个样本均值假设检验

通过insight模块实现成对样本均值比较假设检验

4. 非参数统计分析:符合正态分布的用参数统计,不符合的非参数检验

proc univariate data=test; var d; run; proc nparlway data=test wilcoxon;/**/ class type; /*分组*/ var x; /*指定变量*/ run;

还可通过analyst模块

5. 方差分析

方差分析通过F检验来比较因素的不同水平是否都对指标产生显著影响。在方差分析中,方差是衡量数据差异程度的重要变量,可以分为各因素水平的方差(组间方差)和误差的方差(组内方差)

方差分析的数据需要符合正态分布。

5.1 单因素方差分析

控制对指标的一个影响因素所进行的方差分析为单因素方差分析。需考虑这一影响因素的不同水平对指标的影响。

5.2 多因素方差分析

除考虑各因素的不同水平对指标是否有显著差异外,还需要分析各因素之间的交互影响。

5.3 多重比较

当通过方差分析判定因素是对指标具有显著影响后,因素的不同水平之间是否有显著差异,需要通过多重比较来实现。多重比较方法较多,主要有:最小显著差数法(LSD法)、q检验法、新复极差法。

5.4 ANOVA过程:用于方差分析的过程,可实现单因素和多因素的方差分析

proc anova data=test; /*单因素的方差分析*/ class treatment; /*设置因素变量*/ model x=treatment; /*设置方差分析模型*/ means treatment/t; /*多重比较设置*/ run; proc anova data=test; /*多因素的方差分析*/ class a b; /*设置因素变量*/ model x=a b a*b; /*指定方差分析的模型,分析因素a和b和ab的交互作用/ run;

5.5 GLM过程:线性模型过程,可以在回归分析、方差分析、协方差分析,多元方差分析,偏相关等常用的数据分析中使用。GLM还提供多种数据检验方法,包括随机效应检验、常用的假设检验和多变量的对比检验等。

5.6 练习

对上海市60-80岁的老年人,分60-65,65-70,70-75,75-80四个年龄层调查老人对生活的满意情况,通过满意指数来反映对生活的满足程度,满意指数范围从0-100,值越大越满意。单因素方差分析 影响因素:年龄age层(自变量) 满意情况(因变量) 将数据导入 data test; input age_level$ x@@; cards; 60-65 43 60-65 22 60-65 11 65-70 94 65-70 94 65-70 33 70-75 99 70-75 88 70-75 90 75-80 24 75-80 44 75-80 43 ; run; proc anova data=test; class age_level; model x=age_level; means age_level/t; run;

6. 相关与回归分析

6.1 相关分析:相关系数

proc corr data=test; /*相关分析*/ var a b; run; 可以通过insight和analyst模块

6.2 一元线性回归

proc reg data=test; /*进行回归分析*/ model y=x/clb cli clm z; /*定义回归模型*/ plot x*y /*绘制散点图*/ run;

6.3 多元线性回归

6.4 逐步回归

proc reg data=test; model y=x1-x10/selection=stepwise; run;

6.5 逻辑回归

搜索