跳到主要内容

逆相关_Inverse Correlation

什么是逆相关?

逆相关,也称为负相关,是指两个变量之间的一种对立关系:当一个变量的数值高时,另一个变量的值通常较低。

举个例子,设变量为A和B,当A的值很高时,B的值则较低;相反,A的值较低时,B的值则较高。在统计学术语中,逆相关通常用相关系数“r”表示,r的值介于-1和0之间,其中r = -1表示完全的逆相关。

主要结论

  • 逆相关(或负相关)是指数据集中两个变量的关系,即当一个变量高时,另一个变量低。
  • 尽管两个变量可能存在强的负相关,但这并不一定意味着一个变量的行为对另一个变量有因果影响。
  • 两个变量之间的关系可能随着时间变化,并可能存在某些时期的正相关性。

逆相关的图示

可以在图表的x轴和y轴上绘制两组数据点,以检查它们之间的相关性。这种图称为散点图,直观地体现了正相关或负相关的关系。下面的图表展示了两组数据点之间的强逆相关关系。

计算逆相关的示例

可以计算数据集中变量之间的相关性,以得出数值结果,其中最常见的方法被称为皮尔逊相关系数r。当r小于0时,表明存在逆相关。以下是计算皮尔逊r的算数示例,结果显示两变量之间存在逆相关。

假设分析师需要计算以下数据集中X和Y之间相关性的程度,其中包含七个观察值:

  • X: 55, 37, 100, 40, 23, 66, 88
  • Y: 91, 60, 70, 83, 75, 76, 30

计算相关性包含三个步骤。首先,将所有X值相加以求得SUM(X),然后将所有Y值相加以求得SUM(Y),接着将每个X值与其对应的Y值相乘并求和以得出SUM(X,Y):

SUM(X)=55+37+100+40+23+66+88=409\begin{aligned} \text{SUM}(X) &= 55 + 37 + 100 + 40 + 23 + 66 + 88 \\ &= 409 \\ \end{aligned}

SUM(Y)=91+60+70+83+75+76+30=485\begin{aligned} \text{SUM}(Y) &= 91 + 60 + 70 + 83 + 75 + 76 + 30 \\ &= 485 \\ \end{aligned}

SUM(X,Y)=(55×91)+(37×60)++(88×30)=26,926\begin{aligned} \text{SUM}(X,Y) &= (55 \times 91) + (37 \times 60) + \dotso + (88 \times 30) \\&= 26,926 \\\end{aligned}

接下来的步骤是将每个X值平方并求和以得出SUM(X²),同样对Y值进行相同操作:

SUM(X2)=(552)+(372)+(1002)++(882)=28,623\text{SUM}(X^2) = (55^2) + (37^2) + (100^2) + \dotso + (88^2) = 28,623

SUM(Y2)=(912)+(602)+(702)++(302)=35,971\text{SUM}(Y^2) = (91^2) + (60^2) + (70^2) + \dotso + (30^2) = 35,971

考虑到观察值的数量n为七,以下公式可用于计算相关系数r:

r=[n×(SUM(X,Y)(SUM(X)×(SUM(Y))][(n×SUM(X2)SUM(X)2]×[n×SUM(Y2)SUM(Y)2)]r = \frac{[n \times (\text{SUM}(X,Y) - (\text{SUM}(X) \times ( \text{SUM}(Y) ) ]} {\sqrt{[(n \times \text{SUM}(X^2) - \text{SUM}(X)^2 ] \times [n \times \text{SUM}(Y^2) - \text{SUM}(Y)^2)]}}

在本示例中,相关性为:

  • r=(7×26,926−(409×485))((7×28,623−409²)×(7×35,971−485²))
  • r=9,883÷23,414
  • r=−0.42

这两组数据的相关系数为-0.42,称为逆相关,因为这是一个负数。

逆相关告诉你什么?

逆相关表明,当一个变量高时,另一个变量往往较低。相关性分析可以揭示两个变量之间关系的有用信息,比如股票和债券市场常常向相反方向运动。

相关系数常被预测性地应用于估计诸如投资组合多元化的风险降低效果等指标。如果两种不同资产的收益呈负相关,那么它们在同一投资组合中可以相互平衡。

在金融市场中,一个著名的逆相关例子可能是美元与黄金之间的关系。当美元对主要货币贬值时,黄金的美元价格通常会上升,而当美元升值时,黄金价格则下跌。

使用逆相关的局限性

关于负相关的两个要点需要记住。首先,负相关或正相关的存在并不一定意味着存在因果关系。即使两个变量具有非常强的逆相关性,这一结果本身也不能证明两者之间存在因果关系。

其次,在处理时间序列数据时,比如大多数金融数据,两个变量之间的关系并不是静态的,可能随时间变化。这意味着在某些时期这些变量可能表现出逆相关,而在其他时期则呈现出正相关。因此,根据相关性分析的结果推导出相同的结论应用于未来数据,具有较高的风险。

参考文献

[1] Federal Reserve Bank of St. Louis. "Trade Weighted U.S. Dollar Index vs. Gold Fixing Price." Accessed Sept. 29, 2021.