跳到主要内容

中位数_Median

什么是中位数?

中位数是统计学中的一个度量指标,指的是在一个经过升序或降序排列的数字列表中的中间数字。与平均数相比,中位数对于数据集的描述性更强。中位数是介于观察数据的上半部分和下半部分之间的点,代表了数据的中心位置。中位数通常与其他描述性统计量进行比较,例如均值(平均数)、众数和标准差。

关键要点

  • 中位数是一个有序数字列表中的中间数字,对该数据集的描述性通常优于平均数。
  • 当序列中存在离群值可能影响平均数时,中位数往往被用作替代。
  • 如果数字的个数为奇数,中位数是位于中间的数字,该数字上下各有相同数量的数字。
  • 如果数字的个数为偶数,则需确定中间的两个数字,将它们相加后除以二来找到中位数。

理解中位数

统计学是数学的一个分支,涉及数据的收集与研究,使研究者能够对特定主题进行推断或判断。对定量数据的分析可用于研究人口统计学、人口、投资等多种主题。

中位数是统计研究中使用的一个有序数字列表中的中间数字。为了确定一组数字的中位值,必须首先将这些数字根据从最低到最高或从最高到最低的顺序进行排序。

  • 如果数字的个数为奇数,中位数是位于中间的数字,上下各有相同数量的数字。
  • 如果数字的个数为偶数,则需确定中间的两个数字,将它们相加后除以二来计算中位数。

中位数可以用于估算近似平均值,但不能与实际的均值混淆。

重要提示: 当序列中存在离群值可能影响平均数时,中位数常被作为均值的替代。中位数对离群值的影响通常小于均值。

中位数与均值

如上所述,不应混淆中位数与均值这两个术语。它们听起来相似,但含义却大相径庭。中位数是指一组数据中位于中间的数字。需要注意的是,这一过程是通过将数字从小到大排序,并找到位于中间的数字来实现的。

而均值则是数据集的平均值,俗称算术均值,是将一组数字之和求出的平均值。计算均值时,必须将数据组中的所有数字相加,然后除以数据点的总数。例如,如果一组数据是 3, 5, 7 和 19,那么均值计算如下:

在这种情况下,均值为 8.5。而中位数是 6。因为这一组数据的点数是偶数,将中间的两个数字相加后除以 2 得到结果:(5 + 7) ÷ 2。

注意: 中位数与四分位数紧密相关,四分位数是将观察数据划分为四个相等部分。中位数处于这四个部分的中心点,前两个四分位数在其下方,后两个在其上方。数据的其他分组方式包括五分位数(分为五个部分)和十分位数(分为十个部分)。

中位数示例

要在一个数字个数为奇数的列表中找到中位数,需找出位于中间的数字,并确保中位数两侧的数字数量相同。首先将数字按从小到大的顺序排列。

例如,在数据集 47 中,排序后的结果为 47。中位数是这个有序列表中的中间数字 47,在本例中为 13,因为在它两侧分别有三个数字。

在一组数字个数为偶数的列表中找到中位数,需要确定中间的两个数字,将它们相加后再除以二。再次将数字按从低到高的顺序排列。

例如,在数据集 47 中,排序后的结果为 47。中位数是中间两个数字的平均值 47,在本例中为 15,即 (13 + 17) ÷ 2 = 15。

如何计算中位数?

中位数是数据集中的中间值。首先,按照从小到大的顺序整理数据。要找到中间值,将观察的数量除以二。如果观察数量为奇数,则向上取整,得到位置处的值即为中位数。如果观察数量为偶数,则取该位置上方和下方值的平均值。

正态分布中的中位数位置

在正态分布或钟形曲线中,中位数、均值和众数的值相同,均处于曲线的最高点中心位置。

均值与中位数何时不同?

在偏斜的数据集中,均值和中位数通常不同。均值是通过将所有数据值相加并除以观察数来计算的。如果存在明显的离群值,或数据集中值分布不均,均值(平均数)可能无法代表数据的中间位置。

例如,在数据集 10 中,平均数为 24/8 = 3,而中位数则为 1(中间值)。

这就是为什么许多经济学家在报告一个国家的收入或财富时更偏爱使用中位数,因为它更能真实反映收入分配的情况。

总结

中位数是有序数据集中介于最低与最高之间的数字。不应将其与均值混淆,均值是通过将一组数字相加并除以数据点总数来计算的。许多专家更倾向于使用中位数而非均值,因为中位数通常能更准确地反映数据分布的情况。

参考文献

[1] National Library of Medicine. “Median.”

[2] National Cancer Institute. “Learn More About Normal Distribution.”