跳到主要内容

相关性_Correlation

什么是相关性?

在金融和投资行业中,相关性是一种统计量,测量两种证券之间的关系程度。相关性在高级投资组合管理中被应用,计算方式为相关系数,其值必须介于-1.0与+1.0之间。

关键要点

  • 相关性是一种统计量,测量两个变量之间的关系程度。
  • 在金融领域,相关性可以衡量某只股票与基准指数(如标普500指数)的变动关系。
  • 相关性与多样化密切相关,多样化的理念是通过投资不相关的资产来减轻某些风险。
  • 相关性衡量的是关联性,但并不表明x导致y或反之,或者该关联是否由第三因素造成。
  • 使用散点图通常可以更容易地识别相关性,尤其是在变量之间存在非线性但依然强烈的相关性时。

相关性可以告诉你什么

相关性显示两个变量之间关系的强度,数值上由相关系数表示。相关系数的值范围在-1.0与1.0之间。

完美的正相关意味着相关系数恰好为1。这表明当一项证券上升或下降时,另一项证券也会同步以相同方向变动。完美的负相关意味着两个资产的变动方向相反,而零相关则表明完全没有线性关系。

举例来说,大型股共同基金通常与标准普尔500指数有高度的正相关,接近1。小型股往往与标准普尔指数呈现正相关,但其程度较低,大约为0.8。

然而,认购期权价格与其基础股票价格往往呈负相关。认购期权赋予持有者在指定时间内以预定价格出售特定数量基础证券的权利,但并无义务。

当基础股票价格下跌时,认购期权合同的盈利性提高。换句话说,随着股票价格的上涨,认购期权价格下跌,这是一种直接且强烈的负相关。

如何计算相关性

计算相关性的方法有多种。最常用的方法为皮尔逊积矩相关,本文将进一步讨论。在有限协方差矩阵的数据集中,可以使用该方法。以下是计算相关性的步骤。

重要提示: 为避免复杂的手动计算,建议使用Excel中的CORREL函数。

使用皮尔逊积矩相关法可以通过以下公式计算相关系数r:

r=n×((X,Y)((X)×(Y)))(n×(X2)(X)2)×(n×(Y2)(Y)2)其中:r=相关系数n=观察数\begin{aligned}&r = \frac { n \times ( \sum (X, Y) - ( \sum (X) \times \sum (Y) ) ) }{ \sqrt { ( n \times \sum (X ^ 2) - \sum (X) ^ 2 ) \times ( n \times \sum( Y ^ 2 ) - \sum (Y) ^ 2 ) } } \\&\textbf{其中:}\\&r=\text{相关系数}\\&n=\text{观察数}\end{aligned}

相关性的示例

投资经理、交易者和分析师发现计算相关性非常重要,因为多样化带来的风险降低效益依赖于这一统计量。财务电子表格和软件可以快速计算相关性。

举一个假设的例子,假设一位分析师需要计算以下两个数据集的相关性:

X: (41, 19, 23, 40, 55, 57, 33)

Y: (94, 60, 74, 71, 82, 76, 61)

计算相关性分为三个步骤。第一步是将所有X值相加以找到SUM(X),将所有Y值相加以找到SUM(Y),并将每个X值与其对应的Y值相乘后相加以找到SUM(X,Y):

SUM(X) = (41 + 19 + 23 + 40 + 55 + 57 + 33) = 268

SUM(Y) = (94 + 60 + 74 + 71 + 82 + 76 + 61) = 518

SUM(X,Y) = (41 x 94) + (19 x 60) + (23 x 74) + ... (33 x 61) = 20,391

下一步是将每个X值平方后相加以找到SUM(X^2)。Y值也需进行同样的处理:

SUM(X^2) = (41^2) + (19^2) + (23^2) + ... (33^2) = 11,534

SUM(Y^2) = (94^2) + (60^2) + (74^2) + ... (61^2) = 39,174

在观察数n为7的情况下,可以使用以下公式计算相关系数r:

r=n×((X,Y)((X)×(Y)))(n×(X2)(X)2)×(n×(Y2)(Y)2)其中:r=相关系数n=观察数\begin{aligned}&r = \frac { n \times ( \sum (X, Y) - ( \sum (X) \times \sum (Y) ) ) }{ \sqrt { ( n \times \sum (X ^ 2) - \sum (X) ^ 2 ) \times ( n \times \sum( Y ^ 2 ) - \sum (Y) ^ 2 ) } } \\&\textbf{其中:}\\&r=\text{相关系数}\\&n=\text{观察数}\end{aligned}

在这个例子中,相关性为:

r = (7 x 20,391 - (268 x 518) / 平方根((7 x 11,534 - 268^2) x (7 x 39,174 - 518^2)) = 3,913 / 7,248.4 = 0.54

相关性与投资组合多样化

在投资中,相关性对于多样化投资组合尤为重要。希望降低风险的投资者可以通过投资不相关资产来实现。例如,考虑一个拥有航空公司股票的投资者。如果航空行业与社交媒体行业的相关性较低,投资者可能会选择投资一家社交媒体股票,因为一个行业的负面影响可能不会影响另一个行业。

这通常是考虑跨资产类别投资时的做法。股票、债券、贵金属、房地产、加密货币、商品以及其他类型的投资之间存在不同的关系。有些可能高度相关,而有些若与其他资产不相关,则可作为对冲以实现风险多样化。

注意: 可以分散的风险称为非系统性风险。这种风险特定于某家公司、行业或资产类别。通过投资不同的资产可以降低投资组合的相关性,减少非系统性风险的暴露。

特别注意事项

相关性通常受到其他统计考虑的影响。使用统计方法分析变量时,相关性常常被引用。

在统计学中,p值用于指示发现是否具有统计显著性。可能会确定两个变量具有相关性,但可能没有足够的证据说明这一点是一个强有力的主张。高p值表明有足够的证据合理地得出结论,即总体相关系数不同于零。

可视化两个变量是否相关的最简单方法是使用散点图。散点图中的每个点代表一个样本项。散点图的x轴代表被测试的一个变量,而y轴代表另一个变量。

两个变量的相关系数常通过线性线在图上表示,如在线性关系图上表示。如果两个变量呈正相关,则可在散点图上绘制一条上升的线。如果两个变量呈负相关,则可绘制一条下降的线。数据点关系越强,数据点与该线的距离越近。

散点图在分析可能存在变化关系的复杂数据时可能更有用。例如,两个变量可能在某一程度上呈正相关,之后其关系变为负相关。这种非线性关系可能通过公式较难识别,但在散点图中更容易发现。

最后,当散点图加入密度阴影时,可以很容易地描绘出相关性。密度阴影或密度椭圆是在散点图上显示数据点最密集区域的阴影区域。如果变量有关联,密度椭圆通常会反映线性相关线的方向。否则,具有更圆形且没有明确方向的密度椭圆则表明较低的相关性。

统计中的另一个固有困难是判断两个变量之间的关系是否由这些变量造成。考虑以下陈述:

“大多数篮球运动员都很高。因此,如果你打篮球,你就会变高。”

很明显,上述陈述是错误的。那些高个子并了解这种优势的人可能会选择篮球,因为他们的自然身体特征最适合这项运动。然而,因为身高和参与篮球活动之间可能存在正相关,统计学家和数据科学家必须意识到,两个变量之间的强关系可能是由其中任何一个变量导致的。

相关性的局限性

像其他统计分析方面一样,相关性也可能被误解。小样本量可能产生不可靠的结果,即使看起来两个变量之间的相关性很强。反之,小样本量可能产生不相关的结果,而实际上这两个变量是相互关联的。

当存在异常值时,相关性往往会扭曲。相关性仅展示一个变量与另一个变量的联系,并可能没有清楚地指明单一实例或结果如何影响相关系数。

如果两个变量之间的关系是非线性的,相关性也可能被误解。识别两个变量之间的正相关或负相关要容易得多。然而,两变量之间仍可能存在更复杂的相关关系。

什么是相关性?

相关性是一个统计学术语,描述两个变量之间协调移动的程度。如果两个变量朝相同方向移动,则称这两个变量具有正相关;如果它们朝相反方向移动,则称它们具有负相关。

相关性在金融中为何重要?

相关性在金融中发挥着重要作用,因为它们用于预测未来趋势和管理投资组合内的风险。目前,各种软件程序和在线服务可以轻松计算资产之间的相关性。相关性以及其他统计概念在衍生工具和其他复杂金融工具的创建与定价中具有重要作用。

相关性的使用示例是什么?

相关性在现代金融中是一个广泛使用的概念。例如,交易者可能利用历史相关性来预测在利率或商品价格变动时一家公司的股票是会上涨还是下跌。同样,投资组合经理可能旨在通过确保投资组合内的各个资产之间的相关性适度来降低风险。

高相关性更好吗?

投资者可能对投资组合内的相关性水平有偏好。一般来说,大多数投资者会倾向于低相关性,因为这可以减轻他们在不同资产或证券因相似市场条件而受到的影响的风险。然而,寻求风险的投资者或希望将资金投入特定行业或公司的投资者可能会愿意在投资组合内接受较高的相关性,以换取更大的潜在回报。

参考文献

No references found.