跳到主要内容

正态分布_Normal Distribution

什么是正态分布?

正态分布,又称高斯分布,是一种关于均值对称的概率分布,表明靠近均值的数据出现的频率高于远离均值的数据。绘制时,正态分布呈现为“钟形曲线”。

关键要点

  • 正态分布是概率钟形曲线的正式术语。
  • 在正态分布中,均值为零,标准差为1,偏度为零,峰度为3。
  • 正态分布是对称的,但并非所有的对称分布都是正态的。

正态分布的性质

正态分布是技术股票市场分析中假定的最常见分布类型。标准正态分布有两个参数:均值和标准差。在正态分布中,均值(平均数)、中位数(中点)和众数(最频繁的观测值)是相等的。这些值代表分布的高峰点,分布在均值周围对称下降,其宽度由标准差定义。

正态分布模型是中心极限定理(CLT)的关键,该定理指出,从独立且同分布的随机变量计算的均值近似呈正态分布,无论这些变量的原始分布类型如何。

正态分布是一种对称分布。当分割线产生两个镜像时,就会出现对称分布。并非所有对称分布都是正态的,因为一些数据可能呈现两个峰或一系列山丘的形态,而不仅仅是表示正态分布的钟形曲线。

观察结果

对于所有正态分布,68.2%的观测值将在均值的正负一个标准差范围内;95.4%将在正负两个标准差范围内;99.7%将在正负三个标准差范围内。

这个事实有时被称为“经验法则”,是一种描述正态分布中大多数数据出现位置的启发式方法。落在三个标准差以外的数据("3-sigma")被视为稀有事件。

偏度衡量分布的对称程度。正态分布是对称的,其偏度为零。如果数据集的分布偏度小于零,即负偏度(左偏),则左尾比右尾更长;正偏度(右偏)则意味着右尾比左尾更长。

峰度衡量分布尾部的厚度。正态分布的峰度为3.0。峰度大于3.0的分布展示的尾部数据超出正态分布的尾部(例如,离均值五个或更多标准差)。

这种超额峰度在统计学中被称为厚尾(leptokurtic),但更通俗地称为“胖尾”。金融市场中的胖尾现象描述的是所谓的尾部风险。峰度小于3.0的分布(平峰态,platykurtic)展示的尾部通常不如正态分布的尾部极端(“更瘦”)。

公式

正态分布遵循以下公式。请注意,仅需均值(μ)和标准差(σ)的值。

其中:

  • x = 正在检查的变量或数据值,f(x)是概率函数。
  • μ = 均值
  • σ = 标准差

正态分布在金融中的应用

正态分布的假设应用于资产价格和价格行为。交易者可能会绘制价格点以将近期的价格行为拟合为正态分布。在这种情况下,价格行为越远离均值,资产被高估或低估的可能性就越大。交易者可以利用标准差来建议潜在的交易。这种类型的交易通常是在非常短的时间框架内进行,因为更长的时间周期会使得选择进出点更加困难。

同样,许多统计理论试图对资产价格建模,并假设这些价格遵循正态分布。实际上,价格分布往往呈现厚尾,因此峰度通常大于三。这些资产的价格波动超过均值三个标准差的情况比假设正态分布时预期的要频繁得多。即使某个资产经历了一段时间,符合正态分布,也不能 гарантировать 过去的表现真正能反映未来。

正态分布的例子

许多自然现象似乎呈正态分布。例如,人的平均身高大约为175厘米(5尺9寸),包括男女。

如下面的图表所示,大多数人都符合这个平均水平。更高和更矮的人在总体中出现的频率逐渐降低。根据经验法则,99.7%的人会落在均值的正负三个标准差范围内,即在154厘米(5尺0寸)到196厘米(6尺5寸)之间。高于或低于这个范围的人将是稀有的(各占0.15%的总人口)。

正态分布是什么意思?

正态分布描述了围绕均值值对称的数据图,其中曲线的宽度由标准差定义。它在视觉上表现为“钟形曲线”。

为什么正态分布被称为“正态的”?

正态分布在技术上被称为高斯分布,但它在19世纪的科学出版物中被称为“正态”,并显示许多自然现象似乎“正常偏离”均值。这种“正常变异”概念由博物学家弗朗西斯·高尔顿爵士在其1889年发表的《自然遗传》中提出。

正态分布在金融中的局限性是什么?

尽管正态分布是一种统计概念,但其在金融中的应用可能有限,因为金融现象——例如预期的股票市场回报——并不完全符合正态分布。价格往往呈现对数正态分布,即右偏且具有更厚的尾部。因此,在进行预测时,过于依赖钟形曲线可能导致不可靠的结果。尽管大多数分析师意识到这一局限性,但克服这一缺陷相对困难,因为往往不清楚应选择哪种统计分布作为替代。

结论

正态分布,又称高斯分布,是一种绘制时呈现为“钟形曲线”的概率分布。正态分布描述了围绕均值值对称的数据图,其中曲线的宽度由标准差定义。