标准化矩阵 协方差矩阵 相关系数矩阵
在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
期望值分别为E(X) = μ 与 E(Y) = ν 的两个实数随机变量X与Y之间的协方差定义为:
COV(X,Y)=E[(X-E(X))(Y-E(Y))]=EXY-EX*EY
其中,E是期望值。它也可以表示为:
直观上来看,协方差表示的是两个变量总体误差的方差,这与只表示一个变量误差的方差不同。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。
如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果X与Y是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足EXY=EXEY。
但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。
协方差为0的两个随机变量称为是不相关的。
协方差的计算举例:
R是相关系数矩阵 cov(Xi,Xj)为协方差
因为标准化后,均值为0,标准差为1. 则有:Pij=cov(Xi,Xj)。
即:
原始矩阵的相关系数矩阵就是标准化后矩阵的协方差矩阵。因为标准差为1
对于标准化后的矩阵X,协方差矩阵(也即是相关系数矩阵)为:R = X·X ‘。因为均值为0
转载请注明:数据分析 » 标准化矩阵 协方差矩阵 相关系数矩阵