跳到主要内容

二项分布_Binomial Distribution

什么是二项分布?

二项分布是一种统计分布,它总结了在给定参数或假设下,一个值取两个独立值的概率。

二项分布的基本假设包括:每次试验只有一个结果,每次试验的成功概率相同,并且每次试验彼此独立或互不影响。

关键要点

  • 二项分布是一种统计概率分布,总结了在给定参数或假设下,一个值取两个独立值的可能性。
  • 二项分布的基本假设是:每次试验只有一个结果,每次试验的成功概率相同,以及每次试验互斥或独立。
  • 二项分布是一种常见的离散分布,与连续分布(如正态分布)相对。

理解二项分布

首先,“二项”指的是两个术语——成功的次数和试验的次数。这两者缺一不可。

二项分布是一种常见的离散分布,用于统计学,相对而言,它只计算两个状态,通常用1(表示成功)或0(表示失败)来表示,基于一定数量的试验数据。因此,二项分布表示在n次试验中x次成功的概率,给定每次试验的成功概率为p。

二项分布总结了每次试验都具有相同成功概率时的试验次数或观察值。它决定了在指定次数的试验中观察到特定数量成功结果的概率。

注意:二项分布通常用于社会科学统计,是构建二元结果变量模型的基础,例如预测某位共和党或民主党候选人将在即将到来的选举中获胜,某人在特定时间内是否会去世等。它在金融、银行和保险等多个行业中也有广泛应用。

分析二项分布

二项分布的期望值(或均值)通过将试验次数(n)与成功概率(p)相乘来计算,即n × p。

例如,在100次掷硬币中,正面朝上的期望值为50,即(100 × 0.5)。另一个常见的例子是估计一名篮球罚球手的成功概率,其中1表示投篮命中,0表示投篮失误。

二项分布函数计算如下:

其中:

  • n表示试验次数(出现次数)
  • x表示成功的试验次数
  • p表示单次试验的成功概率
  • n C x表示n和x的组合。组合是从n个不同对象中选择x个元素的方式数量,其中顺序无关紧要且不允许替换。注意,nCx = n! / (r!(n - r)!),其中“!”表示阶乘(例如,4! = 4 × 3 × 2 × 1)。

二项分布的均值为np,方差为np(1 - p)。当p = 0.5时,分布在均值周围是对称的——例如,掷硬币时,因为正面和反面出现的概率都是50%(0.5)。当p > 0.5时,分布曲线向左倾斜;当p < 0.5时,分布曲线向右倾斜。

二项分布是多个独立且同分布的伯努利试验的总和。在伯努利试验中,实验被认为是随机的,只能有两种可能结果:成功或失败。

例如,掷硬币被视为一种伯努利试验;每次试验只能取两种值(正面或反面),每次成功的概率相同,而且一次试验的结果不会影响另一次的结果。伯努利分布是一种特例的二项分布,其中试验次数n = 1。

二项分布的示例

二项分布通过将成功的概率提升到成功次数的幂,并将失败的概率提升到成功次数和试验次数之差的幂来计算。然后,将结果乘以试验次数和成功次数的组合。

例如,假设一个赌场创建了一种新游戏,参与者可以对指定数量的掷硬币中的正面或反面数量进行下注。假设参与者想要下注10美元,预测20次掷硬币中正面出现恰好6次。参与者希望计算这一事件发生的概率,因此使用二项分布进行计算。

概率的计算为(20! / (6! × (20 - 6)!)) × (0.50)(6) × (1 - 0.50)(20 - 6)。因此,在20次掷硬币中正好出现6次正面的概率为0.0369,即3.7%。在这种情况下,期望值为10个正面,因此参与者的赌注并不好。下图显示均值为10(期望值),而出现6次正面的概率在左侧红色部分。可以看出,6次正面的概率低于7、8、9、10、11、12或13次正面的概率。

StatCrunch二项计算器

那么,这在金融中如何应用呢?举个例子:假设你是一家银行,作为放贷方,你想知道某个特定借款人违约的可能性,精确到小数点后三位。有多少借款人违约的概率会导致银行资不抵债?一旦你使用二项分布函数计算出这个数字,你就能更好地决定保险定价,以及最终借出多少钱和保留多少资金。

什么是二项分布?

二项分布是一种统计概率分布,它描述了在给定参数或假设下,一个值取两个独立值的可能性。

二项分布如何应用?

这种分布模式被用于统计学,也对金融和其他领域有影响。银行可能会利用它来估计特定借款人违约的可能性,决定放贷金额和保留资金的数量。保险行业也使用它来确定保单定价和评估风险。

为什么二项分布重要?

二项分布用于计算在一项调查或多次实验中通过或失败的结果的概率。这种类型的分布只有两个潜在结果。从更广泛的角度来看,分布是分析数据集的重要组成部分,用于估计所有潜在结果和它们出现的频率。预测和理解结果的成功或失败对业务发展至关重要。

总结

二项分布是一个重要的统计分布,描述了二元结果(例如掷硬币、是/否答案或开/关状态)。理解其特性和功能对于涉及独立取值的结果的数据分析至关重要。

它在社会科学、金融、银行、保险等多个领域都有应用。例如,它可以用来估计借款人是否会违约,期权合约是否将在价内或价外结束,或公司是否会达到或超过盈利预期。

参考文献

No references found.