跳到主要内容

五分位数_Quintiles

什么是五分位数?

五分位数是统计数据集中表示特定人口的20%的统计值。因此,第一个五分位数代表数据中最低的五分之一(1%至20%);第二个五分位数代表第二个五分之一(21%至40%),以此类推。

五分位数用于为特定人口创建切分点;例如,一项政府资助的社会经济研究可能会利用五分位数来确定一个家庭为了被归入社会最低五分位数所能拥有的最大财富。这个切分点可作为家庭获得旨在帮助社会底层人士的特殊政府补贴的前提条件。

关键要点

  • 五分位数代表特定人口的20%。因此,第一个五分位数表示数据中的最低五分之一,而最后一个五分位数表示数据中的最后一个五分之一。
  • 五分位数通常用于大型数据集,政治家和经济学家经常引用它们来讨论经济与社会公正的概念。
  • 根据人口规模,五分位数的替代方法包括四分位数和三分位数。

理解五分位数

五分位数是一种分位数,定义为相等大小的人口分段。统计分析中最常用的指标之一中位数,实际上就是将一个人口划分为两个分位数的结果。五分位数是将数据范围分成五个相等部分的五个值,每个部分占总范围的1/5(20%)。将一个人口分成三等份则称为三分位数,而分成四份则称为四分位数。数据集越大,就越容易划分出更大的分位数。经济学家经常使用五分位数分析非常大的数据集,例如美国的人口数据。

例如,如果我们查看过去一年内某只特定股票的每日收盘价,这些价格的前20%将代表数据的上五分位数,而底部20%将代表数据的下五分位数。在上五分位数和下五分位数之间将有三个五分位数。尽管所有股票价格的平均值通常落在第二和第四个五分位数之间,这是数据的中点,但高端或低端的异常值可能会提高或降低平均值。因此,在试图理解数据及其平均值时,考虑数据点的分布并考虑任何显著的异常值是值得的。

五分位数的常见应用

政治家们常用五分位数来阐明政策变更的必要性。例如,倡导经济公正的政治家可以将人口划分为五分位数,以说明收入最高的20%的人群控制了他认为的不公平的财富份额。相反,呼吁结束递进税制的政治家可能会使用五分位数论证收入最高的20%承担了过重的税负。

在1994年的《钟形曲线》一书中,作者利用五分位数进行研究,表明智商(IQ)与生活中的积极结果之间存在较强的相关性。

五分位数的替代方法

对于某些人口,仅用其他方法来研究数据分布比使用五分位数更为合理。对于较小的数据集,使用四分位数或三分位数可以防止数据过于稀疏。比较数据集的均值(平均值)和中位数(将数据划分为两个分位数的切分点)可以揭示数据是否均匀分布或偏向高端或低端。均值显著高于中位数则表明数据偏向高端,而较低的均值则表明相反。