数据相关性分析

新闻中心 NEWS CENTER

您当前位置：首页 > 新闻中心 > 行业资讯

数据相关性分析（两组数据相关性分析）

2023-12-24

浏览次数：次

返回列表

| 什么是相关性分析？

对两个变量或多个变量之间相关关系的分析，叫做相关性分析。

通常用来分析两组或多组数据的变化趋势是否一致。

比如身高和体重是否存在关系，天气冷和袜子的销量是否存在关系，客户满意度和客户投诉率是否存在关系等。

| 相关性分析的内容包括哪些？

变量之间是否存在关系？有还是无？

2. 存在什么样的关系？正向还是负向？

3. 关系的强度如何？大还是小？

| 什么情况下使用相关性分析？

只想分析两个变量之间是否存在相关关系，不需要区分自变量和因变量时可用相关性分析。

2. 通常在进行回归分析之前，都需要进行相关性分析。

| 如何进行相关性分析？

1. 通过计算相关性系数判断（主要是r值）

r的取值范围是[-1,1]。正向和负向关系的判断：若正相关，则r>0；若负相关，则r<0。关系强度的判断： |r|>0.95：显著性相关；

|r|≥0.8：高度相关；

0.5≤|r|<0.8：中度相关；

0.3≤|r|<0.5：低度相关；

|r|<0.3：弱相关。目前相关性系数主要有3种：Pearson、Spearman和Kendall，三种分别适用不同的场合。Pearson系数：叫皮尔逊相关系数，也叫线性相关系数，用于进行线性相关分析，是最常用的相关系数，当数据满足正态分布时会使用该系数。

Spearman系数：当数据不满足正态分布时，使用该系数。

Kendall系数：通常用于评分数据一致性水平研究（非关系研究）。

2. 通过绘制折线图或散点图判断

相关性关系的判断可以通过绘制散点图判断（SPSS和Excel均可实现绘制）。

若数据点与趋势线基本在一条线上或在这条线的附近，说明存在相关性；

若数据点在趋势线周围呈现无规律的分布状态，则说明不存在相关性。

3. 通过计算显著性系数判断（主要是P值）

看数据的相关性，还有一个指标也需要一起看，这个指标就是P值。

P值是用来进行显著性检验的，用来检验变量之间是否有差异以及差异是否显著。若P值>0.05代表数据之间不存在显著性差异；若P值<0.05，代表数据之间存在显著性的差异。

所有的检验都是需要提前做出假设的，而显著性检验则通常是先做一个无效假设（也就是零假设），所谓的无效假设通常是“数据之间不存在显著性差异”，然后通过P值来检验这个假设是否成立。

若P>0.05，则接受原无效假设，即“数据之间是不存在显著差异的”；若P<0.05，则拒绝原假设，表明“数据之间是存在显著差异的”。

| 如何计算相关性系数和显著性系数？

SPSS等统计软件计算

以SPSS为例，分析-->相关-->双变量-->选择相关系数类型，得出以下结果，下图中的相关系数即为r值，Sig即为P值。

2. Excel函数公式计算

r值计算公式：

CORREL(array1,array2)；

PEARSON(array1, array2)。

P值计算公式：

TTEST(array1,array2,tails,type)。

上一篇：数据相关性分析（两个数据相关性分析spss）

下一篇：数据相关性分析（Eviews面板数据相关性分析）

首页

关于我们

新闻中心

产品展示

留言板

咨询研究

联系我们