对于两个随机变量:XY
受到下面公式的启发:
D(X+Y)=D(X)+D(Y)+2E((X−EX)(Y−EY))
D(X−Y)=D(X)+D(Y)−2E((X−EX)(Y−EY))
则定义
cov(X,Y)=E{(X−E(X))(Y−E(Y))}
若该式存在,则为协方差
- 本质上是一个数
- cov(X,X)=D(X)
- 一定程度上反映了 X 与 Y 之间的线性关系强度
如果 (X,Y) 存在线性关系,则 (aX,Y) 也是线性的,那么说这两个线性关系强度应该是一样的,但是算出来的是 cov(aX,Y)=a⋅cov(X,Y) 所以不能非常准确的描述线性关系强度。考虑 标准化
尝试
cov(X∗,Y∗)=E(X∗Y∗)=D(X)D(Y)cov(X,Y)
相关系数
协方差的性质
协方差矩阵