跳到主要内容

拟合优度_Goodness-of-Fit

什么是拟合优度?

拟合优度是一个统计检验术语,用以判断样本数据与具有正态分布的总体分布的契合程度。简单来说,它假设一个样本是否存在偏斜,或者是否代表了实际总体中我们能够预期到的数据。

拟合优度通过比较观察值与在正态分布模型下预期值之间的差异来阐明。判断拟合优度的方法有多种,其中最常用的为卡方检验。

关键要点

  • 拟合优度是一个统计检验,旨在判断一组观察值是否与适用模型下的预期值相匹配。
  • 它可以显示您的样本数据是否符合来自正态分布总体的预期数据集。
  • 拟合优度检验有多种类型,但最常见的是卡方检验。
  • 卡方检验用于确定类别数据之间是否存在关系。
  • Kolmogorov-Smirnov检验用于判断样本是否来自特定的总体分布。

理解拟合优度

拟合优度检验是一种统计方法,用于对观察值做出推断。例如,您可以判断一个样本组是否真正代表整个总体。因此,这些检验能够确定实际值与模型中预测值之间的关系。在决策过程中,拟合优度检验使得预测未来的趋势和模式变得更加简单。

正如上述所提,有多种拟合优度检验,包括最常见的卡方检验、Kolmogorov-Smirnov检验和Shapiro-Wilk检验。这些检验通常通过计算机软件进行,但统计学家也可以使用专门针对特定检验类型的公式进行这些检验。

进行检验时,需要某个变量,并假设它是如何分布的。同时,还需要一个包含清晰明确值的数据集,例如:

  • 观察值,源自实际数据集
  • 预期值,根据假设得出
  • 数据集中的类别总数

重要提示: 拟合优度检验通常用于检验残差的正态性,或确定两个样本是否来自相同的分布。

确定显著性水平

为了正确解读拟合优度检验,统计学家需要设定一个显著性水平,例如卡方检验中的p值。p值代表获得接近观察结果极端值的结果的概率,前提是假设原假设是正确的。原假设声称变量之间不存在关系,而备择假设则假设存在关系。

相反,观察值的频率被测量并随后用于与预期值及自由度结合来计算卡方值。如果结果低于显著性水平,原假设被否定,表明变量之间存在关系。

拟合优度检验的类型

χ2=i=1k(OiEi)2/Ei\chi^2=\sum\limits^k_{i=1}(O_i-E_i)^2/E_i

卡方检验,也称为独立性卡方检验,是一种推理统计方法,基于随机样本检验关于总体的主张有效性。

仅用于分为若干类别(箱)的数据,需有足够的样本量以获得准确结果。但它并不表示关系的类型或强度。例如,无法得出关系是正向还是负向的结论。

要计算卡方拟合优度,需设定所需的显著性水平。如果您的置信水平为95%(或0.95),则显著性水平为0.05。接下来,识别要检验的类别变量,然后定义关于它们之间关系的假设陈述。[1]

注意: 变量必须是互斥的,才能符合独立性卡方检验的要求。并且拟合优度检验不应适用于连续数据。

Kolmogorov-Smirnov(K-S)检验是由俄罗斯数学家安德烈·Kolmogorov和尼古拉·Smirnov命名,是一种统计方法,用于判断样本是否来自特定的总体分布。

该检验推荐用于大样本(例如,超过2000),属于非参数检验。这意味着它无需依赖任何特定分布而有效。其目标是证明原假设,即样本来自正态分布。

与卡方检验一样,它使用原假设和备择假设,并设定显著性水平。原假设表明数据遵循总体内的特定分布,而备择假设则表明数据不遵循特定分布。显著性水平用于确定检验中的临界值。但与卡方检验不同,Kolmogorov-Smirnov检验适用于连续分布。

计算出的检验统计量常用D表示,决定是否接受或拒绝原假设。如果D大于临界值,拒绝原假设;如果D小于临界值则接受原假设。[2]

S=i=1N(2i1)N[lnF(Yi)+ln(1F(YN+1i))]S = \sum_{i = 1}^{N} \frac {( 2i - 1 )}{ N } [\ln F ( Y_i ) + \ln ( 1 - F ( Y_{N + 1 - i} ) ) ]

Anderson-Darling(A-D)检验是K-S检验的变体,但对分布的尾部给予更大权重。K-S检验对接近分布中心的差异更为敏感,而A-D检验则对尾部的变动更为敏感。[3] 在金融市场中,因为尾部风险和“厚尾”概念的普遍存在,A-D检验在金融分析中可能更具权威性。

与K-S检验类似,A-D检验也产生一个统计量,用A2表示,可以与原假设进行比较。

Shapiro-Wilk(S-W)检验用于判断样本是否遵循正态分布。此检验仅在使用具有一个连续变量的样本时检查正态性,并推荐用于样本量不超过2000的小规模样本。

Shapiro-Wilk检验使用一种称为QQ图的概率图,显示两个分位数集在y轴上由小到大排列。如果每个分位数来自同一分布,绘制的系列图形则为线性。

QQ图被用于估计方差。通过结合QQ图的方差和总体的估计方差,可以确定样本是否属于正态分布。如果两个方差的比值等于1或接近1,可以接受原假设;如果远低于1,则应该拒绝。

和上述检验一样,这个检验也使用显著性水平并形成两个假设:原假设和备择假设。原假设表明样本来自正态分布,而备择假设则表明样本不来自正态分布。[4]

其他拟合优度检验

除了上述更常见的检验之外,分析员还可以使用许多其他的拟合优度检验:

  • 贝叶斯信息准则(BIC)是一种用于从有限模型集合中选择模型的统计度量。BIC是一种拟合优度检验,用于平衡模型的复杂性与其对数据的拟合优度。
  • Cramer-von Mises标准(CVM)是一种用于评估观察数据集合与假定概率分布之间的拟合优度检验。通常用于经济学、工程或金融,它基于观察数据的累积分布函数和假定分布。
  • 赤池信息准则(AIC)是对给定数据集合的统计模型相对质量的度量,提供了模型拟合优度与其复杂性之间的权衡。它基于信息理论,测量模型在近似数据的真实潜在分布时所损失的信息量。
  • Hosmer-Lemeshow检验将二元结果的预期频率与不同组或区间中观察到的频率进行比较。这些组通常通过将结果的预测概率分为十组或箱来形成。
  • Kuiper检验与Kolmogorov-Smirnov检验相似,但对分布尾部的差异更为敏感。
  • Moran's I检验或Moran指数是用于评估数据空间自相关的统计检验。空间自相关是衡量变量观察值在空间中相似或差异程度的指标。

提示: 一条非常普遍的经验法则是要求拟合优度检验的每个组至少有五个数据点。这确保了有足够的信息输入到检验中以确定分布。

拟合优度检验的重要性

拟合优度检验在统计学中非常重要,原因有很多。首先,它们提供了一种评估统计模型与观察数据集合的契合程度的方法。进行拟合优度检验的主要重要性在于判断观察数据是否与假设的统计模型一致。由此可知,拟合优度检验在选择比其他模型更能适配数据时也可能会有帮助。

拟合优度检验还可以帮助识别可能影响模型拟合的异常值或市场异常情况。异常值可能对模型拟合产生较大的影响,因此需要将其移除或单独处理。有时,异常值在被纳入分析模型之前并不容易识别。

拟合优度检验还可以提供关于数据的变异性和模型估计参数的信息。这些信息可以用于预测和理解所建模系统的行为。根据输入到模型中的数据,可能需要针对被测试的数据集、残差计算和极端数据的p值对模型进行细化。

拟合优度检验与独立性检验的区别

拟合优度检验和独立性检验都是用于评估变量之间关系的统计检验,因此二者可能容易混淆。然而,它们各自旨在回答不同的问题。

拟合优度检验用于评估一组观察数据与特定概率分布的契合程度。另一方面,独立性检验用于评估两个变量之间的关系。其用于检验两个变量之间是否存在任何关联。独立性检验的主要目的是观察一个变量的变化与另一个变量的变化之间的关系。

独立性检验通常用于关注理解两个变量之间关系的研究问题,判断它们是相关还是独立。在许多情况下,独立性检验集中在两个特定变量(例如,吸烟是否导致肺癌)。而拟合优度检验则用于评估整个观察数据集,以判定某一特定模型的适用性。

拟合优度示例

以下是一个假设示例,展示拟合优度检验的工作原理。

假设一个小社区健身房认为最高的出勤率出现在周一、周二和周六,周三和周四为中等出勤率,而周五和周日则是最低出勤率。基于这些假设,该健身房每天雇用一定数量的员工来登记会员、清理设施、提供培训服务和教授课程。

但该健身房的财务状况不佳,老板想知道这些出勤假设和人员安排是否正确。老板决定在六周内计算每天的健身房参观人数。然后,他们可以将健身房的假设出勤人数与观察到的出勤人数进行比较,使用卡方拟合优度检验作为示例。

通过这些新的数据,他们可以确定如何更好地管理健身房并改善盈利状况。

拟合优度的含义是什么?

拟合优度是一种统计假设检验,用于查看观察数据与预期数据之间的对应程度。拟合优度检验可以帮助判断样本是否遵循正态分布,类别变量是否相关,或随机样本是否来自同一分布。

拟合优度为何重要?

拟合优度检验有助于确定观察数据是否与预期一致。决策可以基于进行的假设检验结果做出。例如,零售商希望了解哪些产品吸引年轻人。零售商对老年人和年轻人的随机样本进行调查,以确定哪种产品更受青睐。使用卡方检验,他们确定以95%的置信水平,产品A与年轻人之间存在关系。根据这些结果,可以判断该样本代表年轻成人的总体。零售市场营销人员可以利用这一点来调整他们的营销活动。

卡方检验中的拟合优度是什么?

卡方检验用于判断类别变量之间是否存在关系,以及样本是否能代表整体。它估计观察数据与预期数据的契合程度,即它们的拟合程度。

如何进行拟合优度检验?

拟合优度检验包含不同的检验方法。检验的目标将帮助确定使用哪种方法。例如,如果目标是在相对较小的样本上检验正态性,则Shapiro-Wilk检验可能适宜。如果想判断样本是否来自于总体中的特定分布,则使用Kolmogorov-Smirnov检验。每种检验都使用其独特的公式,但它们有共同点,如原假设和显著性水平。

总结

拟合优度检验用于确定样本数据与对总体的预期契合程度。通过样本数据,获取观察值并使用差异度量与计算得出的预期值进行比较。有多种拟合优度假设检验可根据您想要的结果选择。

选择合适的拟合优度检验在很大程度上取决于您想要了解的样本信息及样本的大小。例如,如果想了解类别数据的观察值是否与预期值相匹配,则可以使用卡方检验。如果想判断小样本是否遵循正态分布,Shapiro-Wilk检验可能更加有利。可用于确定拟合优度的检验有很多。

参考文献

[1] National Institute of Technology and Standards. "Chi-Square Goodness-of-Fit Test."

[2] National Institute of Standards and Technology. "Kolmogorov-Smirnov Goodness-of-Fit Test."

[3] Anderson, Theodore W. "Anderson-Darling Tests of Goodness-of-Fit." International Encyclopedia of Statistical Science, vol. 1, 2011, pp. 52-54.

[4] Shapiro, S.S., and M.B. Wilk (via UNC Gillings School of Global Publci Health). "An Analysis of Variance Test for Normality (Complete Samples)." Biometrika, vol. 53, no. 3/4, Dec. 1965, pp. 591-611.