跳到主要内容

概率分布_Probability Distribution

什么是概率分布?

概率分布是一种统计函数,描述了随机变量在给定范围内所有可能取值及其发生的可能性。该范围由最小值和最大值限制。然而,可能值在概率分布上的具体位置则取决于多个因素,包括分布的均值(平均值)、标准差、偏态和峰态。

关键要点

  • 概率分布描绘了给定数据生成过程的可能结果的预期结果。
  • 概率分布有多种形状和特性。
  • 它们由均值、标准差、偏态和峰态定义。
  • 投资者使用概率分布来预测资产(如股票)在时间上的回报并对冲风险。

概率分布的运作方式

或许最常见的概率分布是正态分布,或称钟形曲线,尽管还有其他多种分布被广泛使用。某些现象的数据生成过程通常决定了其概率分布。这个过程被称为概率密度函数。

概率分布还可以用于生成累积分布函数(CDF),该函数累加了事件发生的概率。它们总是从零开始,最终达到100%。[1]

学术人员、金融分析师和基金经理可能会对特定股票的概率分布进行评估,以评估该股票未来可能带来的预期回报。

重要提示: 股票回报的历史数据可以从任何时间区间测量,且可能仅包含股票回报的一部分。这会使分析受到抽样误差的影响。通过增加样本量可以显著降低这种误差。

离散概率分布与连续概率分布

离散概率分布和连续概率分布是两种基本的概率分布类型,各自描述不同类型的随机变量。理解它们之间的差异对于正确应用统计方法和解释数据至关重要。

离散概率分布描述可能结果的集合是可计数且有限的或可计数无限的情境。这些分布在随机变量可以取特定、清晰的值时使用。

例如,10次抛硬币中出现的正面数量或一个小时内到达商店的顾客数量都是离散随机变量的例子。在这些情境中,您可以列出所有可能结果,例如零、一个、两个等等。离散概率分布的结果更可能呈现“跳跃”状态,因为结果较少。

相对而言,连续概率分布适用于随机变量可以在给定范围内取任何值的情形。这些值是不可计数的,因为在任何区间内都有无数的可能性。

例如,某一人群个体的确切身高或完成任务所需的确切时间就是连续变量。连续概率分布的分布曲线可能显得更为平滑,因为可能结果更多。

概率分布的类型

概率分布有多种分类。它们包括正态分布、卡方分布、二项分布和泊松分布。这些概率分布具有不同的用途,并代表不同的数据生成过程。[1][2]

二项分布评估在给定次数的试验中事件发生多次的概率,这个概率在每次试验中都是固定的。它可以通过记录一个篮球运动员在比赛中罚球的命中次数来生成,其中1表示进球,0表示未进。

另一个例子是使用硬币,计算该硬币在连续10次抛掷中出现正面的概率。二项分布是离散的,因为有效的结果只可能是0或1。[3]

最常用的分布是正态分布。它在金融、投资、科学和工程等领域中频繁使用。正态分布完全由其均值和标准差表征。该分布不偏斜,并且表现出峰态。

这使得分布呈对称形态,当绘制时呈现为钟形曲线。正态分布的均值(平均值)为零,标准差为一,偏态为零,峰态=3。

在正态分布中,约68%的数据将落在均值的正负一个标准差内。约95%的数据将落在均值的正负两个标准差内,99.7%的数据将落在均值的正负三个标准差内。与二项分布不同,正态分布是连续的。所有可能的值都被表示,而不仅仅是0和1之间没有其他值。[4]

注意: 概率是指事件发生的可能性,是有利结果与所有可能结果总数的比率。另一方面,赔率表示事件发生的概率与不发生的概率的比率。例如,如果赢得比赛的概率为0.25,则赔率为1:3(一次胜利对应三次失利)。

大数法则

大数法则表明,随着试验次数的增加,获得结果的平均值将趋近于预期值或真实概率。该原理保证了随着观察次数的增加,样本均值会收敛于总体均值,从而为统计推断提供了稳定性。

概率分布的有效性

判断一个概率分布是否有效需要两个步骤。第一步是分析每个概率是否大于或等于零且小于或等于一。第二步是判断所有概率之和是否等于一。如果第一步和第二步均为真,则该概率分布有效。

概率分布在金融中的应用

概率分布在金融领域主要有两种应用:

最常使用的概率分布是什么?

最常使用的概率分布包括均匀分布、二项分布、伯努利分布、正态分布、泊松分布和指数分布。[6]

概率与赔率的区别是什么?

概率测量事件发生的可能性,表示为有利结果数量与所有可能结果数量之比。赔率则表示事件发生的概率与不发生的概率之比。例如,如果赢得比赛的概率为0.25,则赔率为1:3(一次胜利对应三次失利)。

概率分布与中心极限定理

中心极限定理(CLT)是一个统计原理,表明大量独立、同分布随机变量的和的分布趋近于正态分布。

该定理的重要性在于,它使统计学家即使在总体分布未知的情况下,也能够对总体参数进行推断,只要样本量足够大。

CLT的一个关键含义是,在样本量较大时,样本均值的抽样分布将近似服从正态分布。

例如,想象你有一个班级,学生的身高各不相同,但平均身高大约为5英尺,且有一定的变化。根据CLT,平均身高样本的分布将趋向于正态(钟形)曲线。

概率分布的例子

观察投掷两个标准六面骰子时出现的结果。每个骰子投掷任一数字(1到6)的概率为1/6,但两个骰子的和形成的概率分布如图所示。7是最常见的结果(1+6、6+1、5+2、2+5、3+4、4+3)。2和12的出现概率要低得多(1+1和6+6)。

结论

概率分布描述了随机变量可能取的所有值。这在投资中应用广泛,特别是在评估股票的潜在表现以及在风险管理中帮助确定最大损失方面。

参考文献

[1] PennState, Eberly College. "STAT 500 Applied Statistics; Lesson 3: Probability Distributions."

[2] Dartmouth Department of Mathematics. "Grinstead and Snell’s Introduction to Probability." Pages 233-234.

[3] PennState, Eberly College. "STAT 500 Applied Statistics; 3.2.2 - Binomial Random Variables."

[4] University of Pennsylvania. "2.2.7 - The Empirical Rule."

[5] U.S. Securities and Exchange Commission. “Remarks Before the Peterson Institute of International Economics.”

[6] Dartmouth Department of Mathematics. "Grinstead and Snell’s Introduction to Probability."