AnyMath 文档

科尔科夫

相关系数。

库::`工程师`

语法

函数调用

* [参数:R],[参数:P],[参数:RL],[参数:RU]=corcoef(<参数:A>>) -返回矩阵 [参数:R] 相关系数 [参数:A],矩阵的列在哪里 [参数:A] 它们是随机变量,字符串是测量值。

+ 它还返回一个p值矩阵。 [参数:P] 检验观察到的现象之间没有联系的假设(原假设)。 如果矩阵的非对角元素 [参数:P] 小于显着性级别(默认情况下 0.05),则相应的相关性在 [参数:R] 被认为是显着的。

+ 它也返回矩阵 [参数:RL][参数:RU] 包含下限和上限 95 每个系数的%置信区间。

+ 争论 [参数:P], [参数:RL][参数:RU] 只有在以下情况下才会返回 [参数:R] 它不包含复杂的元素。

* _=corrcoef([参数:A],[参数:B]) -返回两个随机变量之间的系数 [参数:A][参数:B].

* =corrcoef(,Name,Value) — 为具有一个或多个参数的任何先前语法设置附加选项 Name,Value.

争论

输入参数

# *一个* — 输入数组

+ 矩阵

Details

输入数组,指定为矩阵。

*如果 A 是一个标量,那么函数 柯尔科夫(A) 申报表 .

*如果 A 是一个向量,然后是一个函数 柯尔科夫(A) 申报表 1.

数据类型

漂浮物32, 漂浮64</无翻译> 支持复数::是

# *B* — 附加输入阵列

+ 向量资料 | 矩阵 | 多维数组

Details

指定为向量、矩阵或多维数组的附加输入数组。

* [参数:A]B 它们必须是相同的大小。

*如果 [参数:A]B -标量,那么 柯尔科夫(A,B) 申报表 1. 但是,如果 [参数:A]B 相等,则 柯尔科夫(A,B) 申报表 .

*如果 [参数:A]B -矩阵或多维数组,则 柯尔科夫(A,B) 将每个输入参数转换为其向量表示。

*如果 [参数:A]B -空数组 0×0 然后 柯尔科夫(A,B) 返回矩阵 2×2 与价值观 .

数据类型

漂浮物32, 漂浮64</无翻译> 支持复数::是

名称-值输入参数

指定格式中的可选参数对 名称,值,在哪里 姓名 -参数的名称,以及 价值 -适当的值。 名称-值参数应该放在其他参数之后,但对的顺序无关紧要。

使用逗号分隔名称和值,以及 姓名 把它放在引号里。

*例子:* R=corrcoef(A,"Alpha",0.01).

# *阿尔法* — 显着性水平

+ 0.05 (默认情况下)| 范围内的标量(0,1)

Details

显着性水平,由一个数字从 0 以前 1. 参数的值 阿尔法 以百分比确定显着性水平, 100*(1-阿尔法)%,为相关系数,其定义在边界 [参数:RL][参数:RU].

数据类型

漂浮物32, 漂浮64</无翻译>

# *行* — 使用值
"全部" (默认)| "完成" | "两两"

Details

使用值 ,设置为以下值之一:

* "全部" -启用所有值 在计算相关系数之前的输入数据中。

* "完成" -跳过包含值的所有输入数据行 ,之前计算相关系数。 此选项始终返回正半定矩阵。

* "两两" -跳过包含的所有行 ,仅成对地进行两列中的相关系数的每次计算。 此选项可以返回不是正半定的矩阵。

输出参数

# *R* — 相关系数

+ 矩阵

Details

相关系数作为矩阵返回。

*对于一个输入矩阵,矩阵 R 它有一个尺寸 [尺寸(A,2)尺寸(A,2)] 基于矩阵表示的随机变量(列)的数量 [参数:A]. 对角线元素按照惯例等于一,而非对角线元素表示成对变量的相关系数。 系数值可能因 −1 以前 1,在哪里 −1 表示直接负相关, 0 -缺乏相关性,以及 1 -直接正相关。 矩阵 R 对称。

*对于两个输入矩阵, R 它表示一个矩阵 2×2 对角线上的单位和对角线上的相关系数.

*如果任何随机变量是常量,则其与所有其他变量的相关性未定义,相应的行和列值为 .

# *P* — p值

+ 矩阵

Details

P-作为矩阵返回的值。 矩阵 P 对称且具有与 [参数:R]. 对角线上的所有元素都是单位,对角线以外的元素是每对变量的p值。 P值的范围从 0 以前 1,其中值接近 0,对应于在显着相关性 [参数:R] 和确认零假设的低概率。

# *RL*是 相关系数的下限

+ 矩阵

Details

相关系数的下界,作为矩阵返回。 矩阵 RL 对称且具有与 [参数:R]. 所有对角线元素都是单位,非对角线元素表示下边界。 95 中相应系数的置信区间的% [参数:R]. 论点 RL 如有需要,恕不退还 [参数:R] 包含复杂值。

# *RU* — 相关系数的上界

+ 矩阵

Details

相关系数的上界,作为矩阵返回。 矩阵 对称且具有与 [参数:R]. 所有对角线元素都是单位,非对角线元素表示上界。 95 中相应系数的置信区间的% [参数:R]. 论点 如有需要,恕不退还 [参数:R] 包含复杂值。

例子:

矩阵的随机列

Details

让我们计算具有两个正态分布随机列和一列通过另一列定义的矩阵的相关系数。 由于矩阵的第三列 A 是第二个的倍数,这两个变量是直接相关的,因此元素中的相关系数 (2,3)(3,2) 矩阵 R 等于 1.

import EngeeDSP.Functions: corrcoef, randn

x = randn(6,1)
y = randn(6,1)
A = [x y 2&ast;y .+ 3]
R = corrcoef(A)[1]
3×3 Matrix{Float64}:
  1.0       -0.322277  -0.322277
 -0.322277   1.0        1.0
 -0.322277   1.0        1.0

两个随机变量

Details

让我们计算两个正态分布随机向量之间的相关系数矩阵,其中每个向量包含 10 测量。

import EngeeDSP.Functions: corrcoef, randn

A = randn(10,1)
B = randn(10,1)
R = corrcoef(A,B)[1]
2×2 Matrix{Float64}:
 1.0       0.193892
 0.193892  1.0

置信区间上限和下限的p值矩阵

Details

让我们计算相关系数和正态分布随机矩阵的p值,添加的第四列等于其他三列的值之和。 自矩阵的最后一列 A 它是其他变量的线性组合,第四个变量与其他三个变量中的每一个之间存在相关性。 因此,矩阵的第四行和第四列 P 它们包含非常小的p值,这表明存在显着相关性。

import EngeeDSP.Functions: corrcoef, randn

A = randn(50,3)
A = hcat(A, sum(A, dims=2))
R,P,RU,RL=corrcoef(A)

输出矩阵 R.

print("R:")
R
R:
4×4 Matrix{Float64}:
  1.0        -0.0191831  -0.0562013  0.512678
 -0.0191831   1.0        -0.252374   0.497031
 -0.0562013  -0.252374    1.0        0.511839
  0.512678    0.497031    0.511839   1.0

输出矩阵 P p值。

print("P:")
P
P:
4×4 Matrix{Float64}:
 1.0          0.894805     0.698269     0.000140925
 0.894805     1.0          0.0770341    0.000240879
 0.698269     0.0770341    1.0          0.000145133
 0.000140925  0.000240879  0.000145133  1.0

让我们输出矩阵 RL 系数的下限和上限。

print("RL:")
RL
RL:
4×4 Matrix{Float64}:
  1.0       -0.295951  -0.329396  0.273336
 -0.295951   1.0       -0.495887  0.253795
 -0.329396  -0.495887   1.0       0.272283
  0.273336   0.253795   0.272283  1.0
print("RU:")
RU
RU:
4×4 Matrix{Float64}:
 1.0       0.260556   0.225677   0.692241
 0.260556  1.0        0.0279365  0.681144
 0.225677  0.0279365  1.0        0.691648
 0.692241  0.681144   0.691648   1.0

NaN值

Details

让我们创建一个包含值的正态分布矩阵 ,并通过排除包含的所有行来计算相关系数的矩阵 .

import EngeeDSP.Functions: corrcoef, randn

A = randn(5, 3)
A[1, 3] = NaN
A[3, 2] = NaN
A
5×3 Matrix{Float64}:
  0.194551     1.40891   NaN
  0.279785    -0.534099   -0.792337
  0.0512203  NaN          -0.952975
 -0.774466    -0.176248    0.353905
  0.786782    -0.24375     1.59703
R = corrcoef(A,"Rows","complete")[1]
3×3 Matrix{Float64}:
  1.0       -0.369186  0.340384
 -0.369186   1.0       0.748195
  0.340384   0.748195  1.0

使用选项 "全部" 要包括所有值 在计算中。

R = corrcoef(A,"Rows","all")[1]
3×3 Matrix{Float64}:
   1.0  NaN  NaN
 NaN    NaN  NaN
 NaN    NaN  NaN

使用选项 "两两" 于每列的相关系数的两两计算。 如果其中一列包含该值 这一行将被跳过。

R = corrcoef(A,"Rows","pairwise")[1]
3×3 Matrix{Float64}:
 1.0         0.00819072  0.300542
 0.00819072  1.0         0.748195
 0.300542    0.748195    1.0

此外

相关系数

Details

两个随机变量的相关系数是它们线性关系的度量。 如果每个变量都有 对于标量测量,Pearson相关系数定义为

哪里

* -平均值和标准偏差 ;

* -平均值和标准偏差 .

或者,相关系数可以使用协方差来确定。 :

两个随机变量的相关系数矩阵是每个两两组合变量的相关系数矩阵。:

因为 它们总是与自己直接相关,元素对角相等。 1 这就是 ,

文学作品

  1. Fisher R.A.,研究工作者的统计方法,第13版。 繝シ繝ォ縺ァ縺呐

  2. Kendall M.G.,The Advanced Theory Of Statistics,4th Ed。 繝シ繝ォ縺ァ縺呐

  3. Press W.H.,Teukolsky S.A.,Vetterling W.T.和Flannery B.P.,Numerical Recipes in C,2nd Ed。 繝シ繝ォ縺ァ縺呐