跳到主要内容

偏态_Skewness

什么是偏态?

偏态是指在概率分布中观察到的不对称程度。当钟形曲线的数据显示在中位数的左右两侧不对称时,该钟形曲线就会产生偏态。分布可以是正的、右偏的,或是负的、左偏的。正态分布的偏态值为零。

关键要点

  • 偏态是指在概率分布中观察到的不对称程度。
  • 分布可以是正的、右偏的,或者负的、左偏的。正态分布的偏态值为零。
  • 偏态通常出现在股市回报或个人收入分布中。

偏态的类型

负偏态或左偏态是指分布的左侧有较长或较厚的尾部,而正偏态或右偏态则指右侧有较长或较厚的尾部。这两种偏态展示了分布的方向或权重。

下方的三种概率分布是不同程度的右偏。当数据呈正偏态时,均值会大于中位数。在左偏态分布中,均值会小于中位数。

右偏态或正偏态的分布意味着其尾部在右侧比在左侧更明显。由于该分布为正,假设其值为正,因此大多数值会落在均值的左侧。这表明最极端的值位于右侧。

负偏态或左偏态则意味着尾部在左侧比在右侧更明显。在负偏态中,大多数值位于均值的右侧。因此,最极端的值会更靠左。

重要提示: 偏态值为零意味着数据图形呈对称状,且无论分布尾部多么长或厚,数据分布都是正态的。

如何测量偏态

测量偏态的两种方法包括皮尔逊第一和第二偏态系数。皮尔逊第一偏态系数或模式偏态是通过从均值中减去众数,然后将差值除以标准差来计算。

皮尔逊第二偏态系数或中位数偏态是通过从均值中减去中位数,将差值乘以三,然后将乘积除以标准差来计算。

Sk1=XˉMosSk2=3(XMd)s其中:Sk1=皮尔逊第一偏态系数和 Sk2第二s=样本的标准差Xˉ=均值Mo=众数Md=中位数\begin{aligned}&\qquad\qquad\qquad\quad\frac{Sk_1=\frac{\bar{X}-Mo}{s}}{Sk_2=\frac{3(X-Md)}{s}}\\&\textbf{其中:}\\&Sk_1=\text{皮尔逊第一偏态系数和 } Sk_2\\&\qquad\quad\text{第二}\\&s=\text{样本的标准差}\\&\bar{X}=\text{均值}\\&Mo=\text{众数}\\&Md=\text{中位数}\end{aligned}

如果数据展现强众数,则使用皮尔逊第一偏态系数。如果数据具有弱众数或多个众数,则更适合使用皮尔逊第二偏态系数,因为它并不依赖于众数作为集中趋势的衡量标准。

提示: 偏态能告诉你异常值出现的位置,但并不告诉你异常值的数量。

偏态对投资者的启示

在判断回报分布时,投资者会关注偏态,因为它与峰度一起,考虑了数据集的极端值,而不仅仅是集中于平均值。短期和中期投资者关注极端值,因为他们不太可能持有头寸足够长的时间来确信平均值会实现。

投资者通常使用标准差来预测未来回报,但标准差假设为正态分布。由于很少有回报分布呈正态,因此偏态是更好的绩效预测依据。

偏态风险是指在具有偏态的分布中产生高偏态数据点的风险增加。许多财务模型在试图预测资产未来表现时假设为正态分布。如果数据呈偏态,该模型在其预测中总是低估偏态风险。数据偏态越严重,这种财务模型的准确性越低。

偏态在经济中何处显现?

广泛的股市通常被认为具有负偏态分布。观念是市场常常带来小幅正回报和较大负损失。然而,研究显示个别公司的股票可能倾向于左偏。[1]一个常见的偏态示例是美国家庭收入的分布。

偏态的成因是什么?

偏态反映了一个数据集,其活动在某个范围内高度集中,而在其他范围内则较为分散。想象一下在奥林匹克跳远比赛中测量的成绩。许多跳跃者可能会跳得较远,而只有少数人可能会跳得较短。这通常会造成一个右偏的分布。因此,数据点之间的关系以及它们出现的频率导致了偏态的产生。

偏态是常见现象吗?

在分析数据集时,偏态通常会出现,因为在某些情况下,偏态只是被分析数据集的一个组成部分。例如,考虑人类的平均寿命。由于大多数人倾向于在老年后去世,而年轻时去世的人相对较少。因此,在这种情况下,偏态是预期且正常的。

结论

偏态是一个统计度量,显示分布是否扭曲或不对称。如果是右偏,则被视为正偏态。在这种情况下,值会大于零。如果相反,尾部在左侧更为明显,则偏态为负,值会小于零。

参考文献

[1] Oxford Academic. "The Skewness of the Stock Market Over Long Horizons."