ρXY=D(X)D(Y)cov(X,Y)=D(X)D(Y)E(XY)−EXEY
对协方差取值过于随意的缺点进行了改善
由 柯西-施瓦兹不等式 得到
ρXY∈[−1,1]
根据一开始 协方差由方差的加法减法运算引入
若 ρ=1
D(X∗−Y∗)=D(X∗)+D(Y∗)−2cov(X∗,Y∗)=0
则推出
P{X∗=Y∗}=1⟹P{Y=D(Y)D(X)(X−EX)+EY}=1
取 ρ=−1 同理
所以 Y 和 X 存在线性关系
反过来,若 P{Y=αX+β}=1 同分布的证明 概率为1 能证明 ρ=±1
所以:
∣ρXY∣=1⟺P{Y=αX+β}=1
- ρXY=1 XY 正相关
- ρXY=−1 XY 负相关
- ρXY=0 XY 不相关
若 XY 独立,则 XY 不相关,反之不成立
如在单位圆中均匀分布,XY 不相关,但是不独立。
什么时候独立和不相关能够等价?
若 X Y 服从 二维正态分布,则 XY 相互独立等价于 ρXY=0
(X,Y)∼N(μ1,σ12,μ2,σ22,ρXY)
XY 有相关系数 ρXY 分别对 XY 做线性变换得到 AB
{A=a1X+b1B=a2X+b2
则相关系数要么不变,要么相反
ρAB=∣a1a2∣a1a2ρXY
相关系数不会依赖于原点和单位的选取