衡量贫困与收入分配不平等的参数与非参数方法_收入分配论文

贫困与收入分配不平等测度的参数与非参数方法，本文主要内容关键词为：参数论文,不平等论文,与非论文,收入分配论文,贫困论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

引言

早期贫困与收入分配不平等的测度主要通过测度指标来完成，常用于测度贫困的指标有：Sen指数、Thon指数、Kakwani指数、FGT指数等。用于测度收入分配不平等的指标有：Gini系数、对数收入的方差、Atkinson指数、平均对数偏差、Theil指数和变化系数等。类似于随机变量分布函数的数字特征仅是体现随机变量某个方面的变化特征一样，这些指标也仅是对收入分布某个方面的描述。近年来，不少研究开始着眼于建立新的计量方法对整个收入分布函数进行估计。

对贫困与收入分配问题的讨论依赖于对收入分布的估计，常用的估计方法有两类：一类是参数估计方法，需要对累积分布函数或概率的密度函数的具体形式做出假定，进而利用数据对未知参数进行估计得到；另一类是非参数估计方法，通常利用特定的核函数来进行核密度估计得到。在参数估计方法中，大多数文献利用回归分析方法来估计未知参数，也有一些文献利用极大化熵密度的方法来估计。一些学者，如Sala-i-Martin(2002a、2002b、2006)，Minoiu等(2006、2007)研究发现：当收入分布呈现单峰形态时，参数方法可以得到较为精确的结果；然而，当收入分布呈现多峰形态时，参数方法的效果就大打折扣，这时非参数方法可以弥补其不足。

在进行贫困与收入分配问题分析时，常有两种数据类型：单元数据与分组数据，前者能够提供详尽的信息，但一般研究者难以获得连续的数据结果，不利于问题的连续分析；后者是由前者经过汇总后得到的，会有一定信息损失，但一般研究者能够从统计年鉴或统计公报中容易获得，数据具有连续性。如何利用分组数据对收入分布实施有效的估计，Sala-i-Martin(2002a、2002b、2006)，Minoiu等(2006、2007)从参数与非参数两个层面进行了初步的讨论。

显然，收入分布是对居民收入最为详尽的描述。类似于由一般的分布函数可以得到数字特征，在收入分布的基础上，也可以构造出用于测度贫困与收入分配不平等的指标。本文的创新性工作主要表现在：首先论证了收入分布与Lorenz曲线之间的等价性，其次分别在收入累积分布函数和Lorenz曲线基础上建立贫困与收入分配不平等测度方法，最后给出用于测度贫困的FGT指数与测度收入分配不平等的Gini系数的参数与非参数计算方法。

一、收入分布与Lorenz曲线

收入分布与Lorenz曲线是两种描述居民收入分配的不同方式，但两者之间具有内在的等价性，这里对其进行说明。

（一）收入分布

设X表示收入随机变量，其概率密度函数为f(x)，则其累积分布函数

表示收入不超过x发生的概率或收入不超过x的人口占总人口的比重，以收入作为横轴。以人口累积百分比作为纵轴所得到的图形。收入累积分布函数F(x)是对居民收入水平最全面与完整的刻画，其他的信息都可以由F(x)推导或衍生出来。

（二）Lorenz曲线

Lorenz曲线也是概率分布的累积分布函数的一种图形表达方式，常用来表示收入分布，即最低收入P%的居民拥有总收入L%的财富，将人口百分比放在横轴、收入百分比放在纵轴所得到的图形。由收入分布容易得到Lorenz曲线的参数方程为：

式中，为平均收入水平。在以P为横轴、L为纵轴的二维坐标系中，Lorenz曲线可以由(P，L(P))来描述。一个有效的Lorenz曲线还应满足：L(0)=0，L(1)=1，L′(0)≥0，L″(P)≥0，其中P在[0，1]中取值。

（三）两者之间联系

由式(2)可以看出，Lorenz曲线可以完全由收入累积分布函数来确定，即已知F(x)，可以唯一地确定一条Lorenz曲线L(P)。反之，若已知L(P)，则可以唯一地确定F(x)，即Lorenz曲线也可以确定收入累积分布函数。事实上，对式(2)两端关于x求一阶导数，可得：

二、贫困与收入分配不平等测度

在Sen(1976)构建了一个全新的贫困指数之后，一系列各具特色的基于公理方法的贫困指数被开发了出来，较为著名的是由Foster、Greer和Thorbecke三位学者在1984年提出的FGT指数。过去文献中最常用Gini系数测度收入分配不平等程度，并将其总是与Lorenz曲线联系在一起。这里需要指出，由收入累积分布函数F(x)或Lorenz曲线L(P)都可以建立FGT指数对贫困进行度量、Gini系数对收入分配水平等进行度量。

（一）建立在收入累积分布函数上的贫困与收入分配不平等测度

FGT指数有离散型和连续型两种，连续形式的FGT指数可以表示为：

式中，z为给定的贫困线；系数α≥0用来测算不同贫困阶层对指数值的敏感性，α取值越大时，较贫困人口的收入对指数取值影响越大。FGT指数有着较强的经济含义，当α=0时，FGT(0)为贫困发生率，反映贫困的广度；当α=1时，FGT(1)为贫困缺口率，反映贫困的深度；当α=2时，FGT(2)为贫困强度率，反映贫困的强度。由式(8)可知，连续型FGT指数就是建立在收入累积分布函数F(x)之上。

一般地，Gini系数总是与Lorenz曲线L(P)联系在一起，如式(11)所示。将式(2)代入式(11)，容易得到：

由式(9)可知，Gini系数的取值仅取决于F(x)，即Gini系数也可以建立在收入累积分布函数F(x)之上。

（二）建立在Lorenz曲线上的贫困与收入分配不平等测度

林伯强(2003)给出了由Lorenz曲线L(P)表示的FGT指数：

陈奇志等(2006)在给出Lorenz曲线严格数学定义的基础上，进一步根据图1中的面积来定义Gini系数：

图1 财富分配的Lorenz曲线

由式(10)和式(11)可知，FGT指数与Gini系数也可以建立在Lorenz曲线L(P)基础之上。事实上，还可以进一步建立贫困与收入木平等之间关系，详见林伯强(2003)的工作。

三、收入分布参数与非参数估计

对收入分布可以采用参数与非参数两种估计方案。

（一）参数估计

目前，常用于描述收入分布的参数分布主要有：Pareto分布、对数正态分布、Gamma分布、Dagum分布、广义Beta分布等，这里选用两个参数分布：对数正态分布（两个参数）与Pareto分布（两个参数）拟合收入分布。

可见，基于分组数据的核密度估计的偏依赖于未知的分位数均值概率密度函数的取值。Silverman(1986)给出的基于单元数据的核密度估计的偏为：

可见，基于单元数据的核密度估计的偏依赖于未知的真实概率密度函数的取值。

四、FGT指数与Gini系数的参数与非参数估计

在收入分布的参数与非参数估计基础上，进一步给出FGT指数与Gini系数的参数与非参数估计。

（一）参数估计

Lopez等(2006)给出由对数正态分布得到的贫困指数：

五、实证研究

（一）数据选取

本文研究市场经济体制建立以来，中国城镇居民收入分布演变、收入分配及贫困变化趋势，选取中国城镇居民家庭生活情况中的收入数据作为研究对象，数据取自《中国统计年鉴》（1995～2007，有需要相关数据者可与作者联系）。年鉴中给出的是抽样调查并经过汇总后的数据，其中包括10%的最低收入户、10%的低收入户、20%的中等偏下户、20%的中等收入户、20%的中等偏上户、10%的高收入户和10%的最高收入户。显然这是一组分组数据，其实质是按照收入由低到高进行排序并按照10%、20%、40%、60%、80%、90%分位数进行分组。由该分组数据既可以直接得到分位数均值，也可以间接得到分位数的累积人口百分比与累积收入百分比，进而可以实施对收入分布的非参数及参数估计。

（二）收入分布估计

在参数估计中，由于这里使用了分组数据，故对对数正态分布与Pareto分布的参数进行估计的式(13)和式(15)应分别修正为：

图2至图4给出了三个代表性年份（1995年、2001年、2006年）的城镇居民收入分布的参数与非参数估计结果，其中左图为分位数均位处对数正态分布与Pareto分布概率密度比较，右图为收入从1000～50000之间每隔1000取一个值得到的对数正态分布与核密度估计的概率密度比较。由图2至图4的左图可知，对数正态分布与Pareto分布对数据拟合存在较大差别，特别是在低收入部分，Pareto分布的表现差强人意。由图2至图4的左图可知，对数正态分布与核密度估计对数据拟合较为一致，只是对数正态分布比核密度估计的结果要集中一些。

图5给出了三个代表性年份的城镇居民收入分布的核密度估计，可以看出随着时间的推移：①整条概率密度曲线由左向右移动，意味着城镇居民收入水平在不断提高；②概率密度曲线的顶端在下降、尾部在拉长，意味着城镇居民收入分布越来越分散；③在2001年概率密度曲线开始由单峰向双峰变化的趋势，到了2006年双峰已经较为明显，意味着收入分配呈现两极分化，其中一部分居民年收入集中在9500元左右，另一部分居民年收入集中在36000元左右。

图2 1995年城镇居民收入分布估计

图3 2001年城镇居民收入分布估计

图4 2006年城镇居民收入分布估计

（三）贫困与收入分配不平等测度

本文选择“极端贫困线”作为国定贫困线标准，可以计算出各FGT指数（结果略），由对数正态分布与核密度估计得到的三个FGT指数都非常小，这说明国定贫困线标准偏低，难以起到有效地指导脱贫的作用。由Pareto分布估计得到的三个FGT指数出现了异常，说明利用Pareto分布拟合分组数据的收入分布有失偏颇。另外，选择1＄／天的国际贫困线标准，折合人民币约为2500元／年，可以计算出各FGT指数，发现由对数正态分布与核密度估计得到三个FGT指数的估计结果较为一致，详见图6至图8。由图6至图8可以看出，总体上说，随着时间的推移三个FGT指数都不断减小，表明中国城镇居民贫困问题有所缓解。

图5 城镇居民收入分布演进（基于核密度估计）

图6 FGT(0)估计结果

图7 FGT(1)估计结果

图8 FGT(2)估计结果

图9 历年Gini估计结果

图9给出了由对数正态分布、Pareto分布和非参数核密度估计的历年Gini系数，可见基于Pareto分布测度的结果失真了，而基于对数正态分布和Pareto分布测度的结果较为一致。图9表明，总体上看，Gini系数取值在逐年增加，这表明中国城镇居民收入分配不平等程度在恶化，特别是2004、2005、2006年三年基本上徘徊在0.4左右。

六、结束语

在对收入分布进行参数与非参数估计的基础上，建立了用于测度贫困的FGT指数与测度收入分配不平等的Gini系数，进而给出两个测度指标的参数与非参数估计方法。利用历年中国城镇居民收入的分组数据，分别利用参数与非参数方法进行估计，发现基于对数正态分布与核密度估计的效果优于基于Pareto分布的效果。由收入分布的动态演进可以看出，中国城镇居民收入在稳步提高，但同时收入分布呈现出两极分化的现象，与之对应，由三个FGT指数反映出中国城镇居民贫困问题有所缓解，由Gini系数反映出中国城镇居民收入分配不平等现象在恶化。

标签：收入分配论文; 分布函数论文; 对数正态分布论文; 核密度估计论文; 参数估计论文; 贫困问题论文; 对数论文;

衡量贫困与收入分配不平等的参数与非参数方法_收入分配论文

猜你喜欢