跳到主要内容

洛伦兹曲线_Lorenz Curve

洛伦兹曲线是什么?

洛伦兹曲线由美国经济学家马克斯·洛伦兹于1905年提出,是一种用图形方式展示收入或财富不平等的工具。该图在横轴上根据收入或财富绘制人口的百分位数,纵轴上则表示累积的收入或财富。

关键要点

  • 洛伦兹曲线是人口中收入或财富分布的图形表示。
  • 洛伦兹曲线通过累积收入或财富,展示百分位数的居民。
  • 洛伦兹曲线及其衍生统计数据广泛用于衡量人口的不平等现象。
  • 洛伦兹曲线是计算基尼系数的核心部分,基尼系数是衡量不平等程度的数学表现。
  • 由于洛伦兹曲线是基于对不完整和非连续数据的数学估算,可能无法准确反映真实的不平等情况。

理解洛伦兹曲线

在实际运用中,洛伦兹曲线通常是从一组不完整的收入或财富观察值中估算得出的数学函数。洛伦兹曲线通常伴随一条斜率为1的直线,代表收入或财富分配的完全平等;洛伦兹曲线则位于其下方,展示观察到或估算的分配情况。

虽然洛伦兹曲线多用于表示经济不平等,但它也能描述任何系统中的不平等分布。曲线离基线(由直线表示)越远,不平等等级越高。在经济学中,洛伦兹曲线表示财富或收入分配的不平等。这两者并不完全相同,因为可能存在高收入却净资产为零或负数的情况,或者低收入但净资产庞大的现象。

洛伦兹曲线通常基于税务申报等数据进行实证测量,这些数据能覆盖很大一部分人口。可以直接使用数据图作为洛伦兹曲线,或者经济学家和统计学家可能会拟合出一条表示连续函数的曲线,以填补观测数据中的任何空白。

重要提示: 洛伦兹曲线越接近平等线,不平等程度越低;越远离平等线,不平等程度越高。

洛伦兹曲线的组成部分

美国联邦储备局收集了美国家庭的净资产统计数据,并通过图形展示了财富的不平等分布。根据2019年消费者财务调查收集的最新数据,联邦储备局表示,底部50%的家庭仅拥有整体家庭财富的1.5%。

在分析洛伦兹曲线时,有几个重要组成部分需要理解:

  • x轴通常表示百分位数。在上述图中,x轴是与其他美国家庭相比的净资产排名百分位。
  • y轴通常表示累积发生的百分比。在上述图中,百分比代表家庭的净资产的累积金额。
  • 平等线由一条45度向上的斜线表示。在上述图中,它标记为虚线。
  • 洛伦兹曲线通常是向上倾斜但往往呈指数上升的曲线。在上述图中,它标记为实线。
  • 基尼系数(后文讨论)是平等线和洛伦兹曲线之间的区域。

洛伦兹曲线与基尼系数

基尼系数用于以单一数字表达不平等的程度,通常范围从0(或0%)到1(或100%)。完全平等,即每个个体拥有相同收入或财富,对应的系数为0。在洛伦兹曲线上,完全平等将是斜率为1的直线(该曲线与自身之间的面积为0,因此基尼系数为0)。

基尼系数为1意味着某个人获取了所有收入或财富。在理论上,在极端情况下基尼系数可能超过100%。例如,在处理负财富或收入时,该数字理论上可以大于1;在这种情况下,洛伦兹曲线将位于横轴之下。

基尼系数等于完美平等线下方的面积减去洛伦兹曲线下方的面积,除以完美平等线下方的面积。在上述图中,基尼系数是虚线下方而实线上方的面积。基尼系数用于衡量不平等的程度,也可以用于比较两个国家之间的不平等水平。

提示: 对于展示不平等的数据集,某些部分的分析可能较为困难。例如,上述图表具有非常长的左偏尾,这使得很难检查这一段数据中的平等变化。

洛伦兹曲线的优缺点

洛伦兹曲线提供的信息比基尼系数或洛伦兹非对称系数等总结统计数据更为详细,因为洛伦兹曲线直观展示了每个百分位数(或其他单位分解)之间的分布。它能够清楚地显示在何种收入(或财富)百分位上,观察到的分布与平等线的偏离程度以及偏差的大小。

计算基尼系数需要洛伦兹曲线的底层数据,这是衡量不平等的主要数学方法。假定收集到充足的数据,可以为任何地理区域(例如按国家、州、城市等)准备洛伦兹曲线。这对于希望利用洛伦兹曲线来更好地评估税收范围的政府尤为重要。

尽管洛伦兹曲线通常展示敏感的财务信息,但它也保持了受访个体的匿名性。此外,洛伦兹曲线可以随着时间的推移叠加在一起,展示公共政策如何改变不平等水平。

由于构建洛伦兹曲线涉及将连续函数拟合到一些不完整的数据集中,因此无法确保洛伦兹曲线上的值(除了在数据中实际观察到的值)与真实的收入分布相对应。这还因为收集足够的数据点以填补所有空白可能过于昂贵或资源需求过高。

曲线上的大多数点仅仅是基于形状的猜测,以最佳拟合观察到的数据点的曲线为依据。因此,洛伦兹曲线的形状可能对数据的质量、样本量以及对最佳拟合曲线的数学假设和判断高度敏感,这可能导致洛伦兹曲线与实际分布之间存在显著误差。

洛伦兹曲线(或基尼系数)可能也不足以清楚地展示随着时间推移的不平等变化。例如,考虑两种基尼系数计算结果完全相同的情形。尽管它们的基尼系数相同,洛伦兹曲线的斜率却可能截然不同,而底层的整体不平等水平计算结果却是相同的。

优点

  • 直观展示人口中的不平等现象,易于理解和分析
  • 有助于计算基尼系数,作为主要的不平等数学测量工具
  • 可以帮助政府进行公共政策的调整和税收范围的设定
  • 维护受访个体的匿名性
  • 可以叠加显示曲线随时间的变化

缺点

  • 样本数据可能未能准确反映整体人口,从而显示出错误的洛伦兹曲线
  • 可能需要大量数据收集以充分填补整条曲线
  • 可能需要进行估算或准备者对所绘曲线的推断
  • 由于基尼系数区域形状和大小的不同,可能会误导分析师;不同区域尽管面积相等,外观却可能不同

洛伦兹曲线实例

上面的曲线显示了一条连续的洛伦兹曲线,已根据2020年巴西的收入分配数据进行了拟合。该数据集还与代表完全平等的直线进行了比较。

在收入百分位的第55处,洛伦兹曲线的值为22.39%。这意味着洛伦兹曲线估算底部55%的人口获得了全国总收入的22.39%。如果巴西是一个完全平等的社会,底部55%将获得55%的总收入。

我们还可以看到,第99百分位对应的累积收入为89.32%。这意味着顶端1%获得了巴西收入的11.68%。

要找出大致的基尼系数,可以从完美平等线下的面积(约为0.25)中减去洛伦兹曲线下的面积(定义为0.5)。将结果除以完美平等线下的面积,得到的系数约为0.5或50%。根据世界银行的数据,2020年巴西的基尼系数为48.9。

为什么洛伦兹曲线重要?

洛伦兹曲线的重要性在于,它是展示社会经济不平等水平的最佳和最简单方式之一。随着洛伦兹曲线偏离基线,底层数据表明不平等的分布在不断加剧。

洛伦兹曲线如何测量不平等?

洛伦兹曲线是对社会中收入或财富分布的图形表示。简单来说,曲线离基线(由直线表示)越远,不平等程度越高。

谁在使用洛伦兹曲线?

政府机构对洛伦兹曲线特别感兴趣,尤其是在分析国家内的净资产和收入分布时。洛伦兹曲线能够提供公共政策的有效性反馈。它也可能指示政府在确定税收级别时如何根据收入差距或范围来设定标准。

洛伦兹曲线如何计算?

在收集到相对较大的样本数据后,便可以拟合洛伦兹曲线,以最佳方式展示该数据集的分布。由于每组信息各不相同,因此没有统一的通用曲线公式,相同数据集的非线性回归往往看起来迥然不同。

结论

通过使用洛伦兹曲线,是分析不平等分布的一种常见的方法。该曲线图形化展示了标准的平等分布应该是什么样子。随后,图表叠加显示特定数据集的实际分布。洛伦兹曲线用于计算基尼系数,以数学方式分析数据集的不平等程度,同时也能够直观检验不平等水平。

参考文献

[1] Food and Agriculture Organization of the United Nations. “Charting Income Inequality: The Lorenz Curve,” Page 9.

[2] Board of Governors of the Federal Reserve. "Wealth Inequality and the Racial Wealth Gap."

[3] U.S. Census Bureau. “Gini Index.”

[4] The World Bank, World Bank Open Data. “Gini Index (World Bank Estimate) — Brazil.”