跳到主要内容

非参数统计_Nonparametric Statistics

非参数统计是什么?

非参数统计是指一种统计方法,其中数据不被假设来自由小数量参数决定的特定模型。常见的模型包括正态分布模型和线性回归模型。

非参数统计有时使用顺序数据,这意味着数据不是依赖于数字,而是基于某种排名或顺序。例如,传达消费者偏好的调查结果,从“喜欢”到“不喜欢”的顺序,便被视为顺序数据。

非参数统计包括非参数描述性统计、统计模型、推断和统计检验。非参数模型的结构不是先验指定的,而是从数据中确定的。术语“非参数”并不意味着这些模型完全没有参数,而是说参数的数量和性质是灵活的,而不是事先固定的。直方图就是一种非参数的概率分布估计示例。

关键要点

  • 非参数统计易于使用,但不提供其他统计模型那样的精准度。
  • 这种分析类型通常最适合考虑某一事物的顺序,即使数值数据有变化,结果也可能保持不变。

理解非参数统计

在统计学中,参数统计包括如均值、标准差、皮尔逊相关、方差等参数。这种统计形式利用观察数据来估计分布的参数。

在参数统计下,数据通常假设来自具有未知参数μ(总体均值)和σ²(总体方差)的正态分布,这些参数随后通过样本均值和样本方差进行估计。

重要提示: 非参数统计不对样本大小或观察数据是否为定量数据进行假设。

非参数统计不假设数据是来自正态分布。相反,这种统计测量下分布的形状是根据数据估计的。虽然在许多情况下可以假设正态分布,但也有一些情况数据生成过程远离正态分布。

非参数统计的示例

第一个例子考虑一位金融分析师希望估计投资的风险价值(VaR)。分析师收集数百个类似投资在相似时间范围内的收益数据。分析师并不假设收益遵循正态分布,而是利用直方图非参数地估计分布。该直方图的第5百分位数则为分析师提供了VaR的非参数估计。

第二个例子考虑一位研究者希望了解平均睡眠时间是否与生病频率相关。由于许多人很少生病,偶尔其他人则比大多数人更频繁地生病,因此生病频率的分布显然是非正态的,右偏且容易出现离群值。因此,研究者决定采用像分位数回归分析这样的非参数方法,而不是使用假设生病频率正态分布的方法,如经典回归分析所做的那样。

特别考虑

由于使用的便利性,非参数统计已受到广泛认可。由于不需要参数,数据的适用范围变得更广泛。当没有均值、样本大小、标准差或其他相关参数的信息时,这种类型的统计分析可以不依赖这些信息。

由于非参数统计对样本数据的假设较少,因此其应用范围比参数统计更广泛。在更适合进行参数检验的情况下,非参数方法的效率较低。这是因为与参数统计不同,非参数统计丢失了一些在数据中可用的信息。

非参数统计包括什么?

非参数统计包括非参数描述性统计、统计模型、推断和统计检验。非参数模型的结构是从数据中确定的。

非参数统计如何工作?

非参数统计不假设样本大小、观察数据是否为定量数据或数据是否来自正态分布。相反,这种统计测量下分布的形状是根据数据估计的。

非参数统计如何应用?

由于非参数统计对样本数据的假设较少,因此比参数统计更广泛应用且易于使用。然而,在更适合进行参数检验的情况下,非参数检验的效率较低。原因在于,非参数统计丢失了一些在数据中可用的信息,与参数统计不同。

总结

非参数统计是一种统计方法,其中数据不被假设来自由小数量参数决定的特定模型,诸如正态分布模型和线性回归模型。非参数统计有时使用顺序数据,这意味着数据不是依赖于数字,而是基于某种排名或顺序。