劳动力性别比与农民长期收入:来自中国的实证证据_性别比例论文

劳动力性别比例与农户长期收入:中国的经验证据,本文主要内容关键词为:农户论文,劳动力论文,中国论文,证据论文,性别论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、问题的提出

我国人口性别比例失调问题近年来引起广泛的关注。最近3次的人口普查数据显示,中国出生性别比从1982年的108.5上升到1990年的111.3(即男性在总人口中的比例从1982年的52.04%上升到1992年的53.40%),男性比例在1999年继续上升到55.09%(见图1),已经远远高于联合国认定的男性人口比例的正常值域标准50.49%~51.69%(United Nations,1955)。性别比例的失调可能引起严重的社会问题,包括“娶妻难”、“妇女的安全问题”、“家庭稳定性受到冲击”等(河北省妇联,2005年)。这些研究基本都是从社会学与人口学的角度考察性别比例失调的后果,一个较好的总结可以参见张翼(2005年)的研究。

其实,性别比例失调的经济后果也不容忽视。G.S.Becker(1995)出色证明了家庭内部分工而使得男女在家庭生产中的优势互补可以有效提高家庭生产的效率,因为男女在不同的家庭生产领域具有不同的比较优势。性别对收入的贡献主要体现在直接和间接两个方面:其一,直接作用,妇女在某些生产领域更加具有效率,例如,Alan de Brauw(2004)对中国农业女性化的研究发现,农村女劳动力在家庭养殖业与家庭手工业方面比男劳动力更有效率;其二,间接作用,包括妇女在家庭营养和哺育后代等方面具有男性不可比的优势(World Bank,1993)。Udry.C(1995)在对布基纳法索的研究中发现,性别偏差导致的家庭内部的资源配置不当,使得农户产出降低了10%~20%。男女性别比例失调直接的经济后果体现在家庭内生产的这种性别分工和性别比较优势的损失。尤其是在中国农村地区,以农户为生产单位的小农生产模式更加依赖于这种家庭内的资源配置分工。可以想象家庭没有妇女的一种极端情形,整个家庭的生产和生活将会是无效率的。

本文利用中国8个省份、1428个农户的面板数据集估算家庭劳动力性别比例对收入的影响,为性别比例失调的经济后果提供初步的经验研究证据。同时,考察性别比例的时序变化,为以后的预测研究做进一步准备,因此,本文还特别关注性别比例失调对农户收入长期的影响。

图1 中国1984年以来性别比例变化情况

资料来源:国家统计局.中国人口统计年鉴(2001)

二、数据与描述

(一)数据来源

本文使用一个特别设计的,包含中国8省1428个农户的面板数据集,经过数据清理,最终获得的有效样本为1354户,这个数据集的抽样范围是中国农业部的农村固定观察点。因为农业部固定观察点已有的数据包含丰富的家庭人口经济变量,但是没有包含个人信息,所以北京大学中国经济研究中心与农业部合作,对样本农户家庭成员1987—2002年期间的个人情况进行回溯调查。回溯调查获得的个人数据与农业部固定观察点已有的家庭数据进行合并,形成本文研究使用的微观面板数据集。

农业部农村固定观察点抽样范围包括中国所有省份近34000个农户,由于抽样户的变更和抽样编码的调整,这个面板数据受一定损耗。我们的调查选取了广东、浙江、湖南、河南、山西、吉林、四川和甘肃的8个省份48个村作为样本。为了保证面板数据中农户的一致性,我们采取了双重的措施:(1)农户数据特征的判断。主要利用农业部数据中农户“房屋面积”、“土地面积”、“家庭人口数”、“户主年龄”等几个变量作为依据,挑选在不同年份这些指标基本不变或者变化较小的农户进入样本。(2)基层调查员的确认。在按照上述依据挑选的基础上,由样本点基层调查员加以确认抽样范围中经过前一个步骤选出的农户在期间内没有改变。由于1992年和1994年农业部没有进行调查,并且1990年数据无法获得,因此,笔者使用的数据库实际包含13年的数据。本文主要关注性别比例对收入的影响,因此,性别比例采用男性劳动力在全部劳动力中的比例加以测量。下面,对样本性别比例分布情况与时序变化和分省指标进行描述,然后将性别比例与农户人均纯收入做相关分析,以此描述本文关注的关键变量基本概况。

(二)样本家庭性别比例分布

在样本中,男性劳动力比例平均值为0.5468(5%置信区间为0.5433~0.5504);从分布来说,有54%的样本家庭男性劳动力比例为50%,男性劳动力比例的一个非参数核密度估计*结果参见图2。

图2 样本家庭男性劳动力比例核分布密度估计(高斯核)

注:窗宽=0.0286,系采用交错确认法确定的最优窗宽

从图2可以看出,样本男劳动力比例集中趋势在50%,但是分布有一个较长的右尾,偏度为0.166。另一个峰值大约出现在男女比例2/3左右,表现出样本的男性劳动力比例具有明显的超过50%的分布特征,即:在样本中,男性劳动力比例在50%以上的家庭数量显著超过50%以下的家庭数量。

(三)样本性别比例的时序变化与分省情况

从时间上看,样本男性劳动力比例有不断增加的现象(见图3)。男性劳动力比例从1987年的0.531逐渐提高到2002年的0.566,这和前述全部人口的变化一致(见图1)。按照联合国确定的51.69%合理男性比例高限,样本人群性别比已经超出这个限度。并且随时间的推移, 性别比例差距还有不断加大的趋势。

图3 男性劳动力比例

注:总体均值为0.5468,虚线表现95%标准差

图4 分省男性劳动力比例

注:总体均值为0.5468,同时表现95%标准差

从分省的情况来看,各省样本中男性劳动力比例都在52%以上,其中,比例最高的省份是吉林,为60%,标准差也最大,这大概和吉林省样本较少的情况有关(N=605)。这说明男性比例较高在各省都是一个普遍现象,地区的差异不会改变样本性别比例的基本分布。

(四)性别比例与收入的相关分析

本文集中分析性别比例对农户收入的影响,这里使用简单相关系数和偏相关系数描述二者的基本关系,附加“男性劳动力比例”与“可比价格人均纯收入1期差分”的相关分析是为了考察性别比例和收入的变化率的关系。结果(见表1)显示,男性劳动力比例和收入水平显著负相关。

简单相关分析没有考虑农户原有的收入水平,偏相关使用“滞后1期可比价格人均纯收入”控制家庭初始收入水平以后,再分析性别比例与收入之间的相关关系更为准确。结果显示,二者偏相关系数较简单相关系数绝对值有所降低,但是依然非常显著。收入的差分与男劳动力性别比例的相关关系也大致相同。相关分析结果初步可以看出男性劳动力比例过高对农户收入和收入增长率都有不利影响。

表1 劳动力性别比例与收入及收入水平的相关系数

可比价格人均纯收入(对数) 可比价格人均收入1期差分(对数)

男性劳动力比例 简单相关系数 -0.052 -0.019

(显著水平) 0.000 0.035

偏相关系数-0.038 -0.021

男性劳动力比例 (显著水平) 0.000 0.029

[控制变量] 滞后1期可比价格人均纯收入(对数) 可比价格人均纯收入2期差分(对数)

但是相关分析的结果没有控制其他影响收入的变量,并且假定二者存在简单线性的关系,这显然不合理。下一部分使用经济计量方程对性别比例的影响加以更为严格的估计。

三、性别比例失调对农户收入的长期影响

(一)劳动力性别比例对农户长期收入影响的计量结果

本节建立简约形式的农户收入方程测算性别比例对收入的影响,基本模型如下:

Y[,it]=βX[,it]+α[,s1]S[,it]+α[,s2]S[,it][2]+α[,h]+α[,t]+e[,it] (1)

在式(1)中,下标i和t分别表示“户”和“时间(年)”;Y[,it]表示第i户在第t年的人均纯收入(对数形式),取对数形式是为了压扁方差,X[,it]表示解释变量向量;S[,it]表示男性劳动力比例,S[,it][2]表示男性劳动力比例平方项,这两个是本文关键变量;α[,h]是非观测户固定效应;α[,t]是非观测时间固定效应;e[,it]是随机误差项。笔者使用标准的固定效应面板数据方法估计式(1)。加入年固定效应是为了控制时间趋势,假设e[,it]在存在未能观察的不随时间变化的家庭特征时,只能和解释变量相关。S[,it][2]是基于这样的假设,男性劳动力比例太低和太高都会对收入产生不利的影响,因此假定男性劳动力比例对于收入的影响是一个倒U的形式及二次项系数为负,极大值应该出现于男性劳动力比例在0.5附近。

此类收入模型估计的一个主要困难在于解释变量的遗漏问题,在式(1)中,也就是α[,h]和α[,t]。α[,h]表示家庭的经营管理能力等观察不到的影响收入之变量,特别是性别比例不同的家庭,其资源配置方式的各个方面都会受到影响。α[,t]是为了控制非观测时间因素。通常的横截面估计无法克服这两个变量的遗漏问题,从而使得系数的估计是有偏的和不一致的,并且样本的增大也无法消除估计的偏误。本文有面板数据可资利用,可以得出其他解释变量一致有效的估计。其基本原理在于,如果不随时间变化,则式(1)中的其他变量可以采用差分形式而非水平形式,例如:ΔX[,i]=(X[,it]+α[,h])-(X[,it-1]+α[,h])=X[,it]-X[,it-1],这样使用差分估计就剔除了α[,h]的影响,从而得到X[,it]的一致和有效估计。因为式(1)还含有α[,t]这一观察不到的时间因素,因此本文估计使用Two-way方法是上述剔除单一非观测变量方法的自然推广。

在控制变量的选择上,我们尽量显性包含诸非时变的因素,以尽量减少e[,it]和S[,it]之间的相关。出于此目的,我们在X向量中包含3组家庭变量:第1组主要是家庭人口学特征。包括平均年龄、家庭规模、负担系数(家庭内小于等于14岁人口与大于等于65岁以上人口除以15~64岁人口的比例)等;这组变量主要控制家庭受到大病冲击的概率(平均年龄、负担系数)和治疗的偏好(教育、家庭规模)。第2组变量主要控制家庭收入能力。包括男性劳动力比例、非农收入比例、人均土地面积、生产性固定资产存量(进行了价格平减,取对数形式)。第3组变量包括控制家庭社会经济地位的哑变量。主要有:是否五保户、是否有家庭成员参军、是否有村干部、是否有家庭成员为政府雇员/企业雇员、是否有家庭成员是党员。在OLS估计中同时控制了“年份”和“省”哑变量。

为了简化分析,本文估计收入方程的一个简约形式(Reduced Form),假定解释变量都是外生或前定的。为了考察非观测因素的影响,本文对比了混合样本OLS估计和固定效应FEM的结果。为了考察方程的稳健性质,同时给出了密集算法Bootstrap的随机参数估计结果(见表2)。

表2 男性劳动力比例对收入的影响估计

OLS OLS(bootstrap) FEM(Two-Way)

解释变量Coeff.t-ratioCoeff.t-ratioCpeff. t-ratio

Constant6.853***130.1816.907***

246.1637.089***

40.584

男性劳动力比例(比例数字) 0.384***6.116 0.307***

6.225 0.108***

30.25

男性劳动力比例平方 -0.372***

-5.921 -0.305*** -8.546 -0.105*** -2.647

本户当年平均年龄0

-0.392 0 0.158 0.007***

3.359

户主受教育年限 0.009***5.091 0.009***

8.806 0.013 0.476

本户固定居民数(人)-0.033***

-9.861 -0.033*** -18.148-0.034*** -9.237

家庭负担系数-0.624***

-24.855-0.630*** -46.461-0.540*** -20.417

非农收入比重0.230***11.545 0.224***

21.149 0.318***

14.248

人均土地面积(亩) 0.042***12.944 0.040***

31.064 0.056***

14.631

生产固定资产(对数)0.029***15.972 0.029***

30.406 0.014 6.776

五保户 -0.208***

-2.186 -0.180*** -3.608 -0.147*-1.510

有家庭成员参军 0.050* 1.529 0.050***

2.785 0.051 1.485

有家庭成员为政府雇员0.367***17.456 0.347***

26.629 0.187***

7.292

有家庭成员为乡镇干部0.191***7.880 0.192***

14.416 0.220***

8.458

有家庭成员为中共党员0.014

0.935 0.018**2.178 0.083***

4.512

乡距离(公里) -0.023***

-15.775-0.023*** -28.691— —

县距离(公里) -0.007***

-17.102-0.007*** -28.171— —

地势哑变量(对照组:平原)

丘陵-0.160*** -11.857-0.162*** -20.730 — —

山区-0.250*** -18.546-0.251*** -32.900 — —

略去“省”和“年份”哑变量结果

N=12967 Adj R[2]=0.478 Adj R[2]=0.487 Adj R[2]=0.636

F=322.39*** F=337.52***F=20.07***

注:***表示1%水平上显著;**表示5%水平上显著;*表示10%水平上显著

估计结果显示,男性劳动力比例对收入的影响符合先验的假设,OLS、OLS(bootstrap)和FEM(Two-Way)估计的收入最大影响分别出现在男性劳动力比例占51.64%、50.25%和51.51%*的位置(见图5),在联合国确定的合理范围之内,并且统计上非常显著。方程总体拟合较好,其他的控制变量也具有先验的符号。固定效应模型相对OLS解释力提高了很多,并且显示在OLS中对劳动力比例的收入影响出现了低估的情况。具体来说α[,sl]OLS次项低估了真实系数,二次项则高估了真实系数,在男性劳动力均值0.5468处计算表明,OLS低估了劳动力对收入的边际影响1.57%,夸大了性别比例的负面作用。一个可能的解释就是,OLS估计忽视了农户已经按照其成员性别结构对生产经营方式和资源配置做了调整,这种调整使得在现有的人员性别结构下,资源配置得到了优化。固定效应的估计结果则反映了不同性别结构家庭都在最优方式下进行生产,其收入依然存在的净差异。

图5 男性劳动力比例对于收入的影响变化

注:OLS=0.384496Ratio-0.372261 Ratio[2];Boot=0.306782Ratio-0.305253Ratio[2];FEM=0.108213Ratio-0.105247 Ratio[2]。拐点分别为51.64%、50.25%和51.51%;Ratio表示男性劳动力比例

因为方程包含二次项,所以对系数的解释需要谨慎。从图5可以看出相对于没有男性的农户来说,男性劳动力对收入的边际贡献为正,但是边际贡献出现递减,就是在拐点以后,男性劳动力比例越大,对于收入会产生不利影响。拐点实际上是家庭性别分工对收入的最优效率。体现按照FEM的估计结果计算,在拐点以后,男性劳动力比例增加1%,对于收入的正面影响降低0.2个百分点,在样本75分位0.667的男性劳动力比例上,比最优的性别配置对于收入的影响降低2.52%。从图形上看,当家庭几乎没有女性劳动力的时候,这种性别分工的优势几乎完全丧失。

OLS(bootstrap)的估计结果和OLS差异不大,可以大致判断模型估计的结果耐抗性较强。

(二)性别比影响收入的时序变化

由于男性劳动力比例随时间不断变化,近年来有加大的趋势。考察这种影响的时序变化,可以为进一步的预测提供基础。具体的做法是在公式1的基础上,加上男性劳动力比例和时间哑变量的交互项。那么二维饱和模型高阶项系数测算的就是不同年份的净影响,实际就是一个年份的二阶边际的影响。这个政策评估办法可以参见Krueger.A.B(1993年)对于计算机技能影响的研究。在此,忽略其他变量的估计结果,仅报告交互项系数和t值(见表3)。

表3劳动力性别比例对收入影响时序变化估计结果

OLS

FEM(Two-Way)

年份 Coeff.

t-ratio Coeff.t-ratio

1988 -0.267* -1.840

-0.136** -2.403

1989 -0.366**

-2.572

-0.301***-3.131

1991 -0.200 -1.368

-0.189* -1.902

1993 -0.340**

-2.341

-0.184* -1.853

1995 -0.370**

-2.543

-0.269***-2.700

1996 -0.296**

-2.025

-0.243** -2.421

1997 -0.299**

-2.064

-0.229** -2.299

1998 -0.433*** -2.935

-0.329***-3.249

1999 -0.335**

-2.273

-0.269***-2.656

2000 -0.224 -1.540

-0.376***-3.679

2001 -0.269*-1.828

-0.400***-3.861

2002 -0.269*-1.838

-0.369***-3.583

其余变量估计结果省略

Adj R[2]=0.373 Adj R[2]=0.637

F=72.35***

F=19.91***

注:***表示1%水平上显著;**表示5%水平上显著;*表示10%水平上显著

估计的结果显示,OLS的系数普遍还是被低估,但是和FEM的趋势大体一致。固定效应模型的系数全部显著(10%水平),并且一致为负。这与前面提到的各年男性劳动力比例实际上都在拐点之上的结果有关(即都在男性收入递减的区域)。并且随着时间推移,性别比例失调对负面收入影响(相对于拐点)越来越大。下面将净影响的趋势和男性劳动力比例变化的趋势进行对比(见图6)。

图6 劳动力性别比例及其对收入影响的时序变化

从图6可以发现有趣的现象,FEM估计的男劳动力时间净影响的变化轨迹和男劳动力比例变化的时间轨迹对应非常好。即在拐点之上,男性劳动力比例越高的年份,其对收入的负面影响越高,反之亦然。在1991年和1999年男性劳动力比例距离拐点51.51%最近, 这两年对收入的负面影响也较低。而随着性别失调的加剧,2001年、2002两年的负面影响达到了峰值,分别为40%和36.9%。

由此可以预计随着出生婴儿性别比例的不断失调(韦艳等,2005年),未来劳动力性别比例失调情况的恶化会加剧这种收入的负面影响,根源在于农户将逐渐丧失家庭性别分工的比较优势。

四、结论与评述

本文通过面板数据的收入方程估计,发现在中国农村男性劳动力比例对收入的影响呈递减趋势。估算发现,对于收入而言最为有利的男性劳动力比例大约在50.25%~51.51%之间(101~105.7)。大致和联合国界定的理想性别比例吻合。超过这个界限,则对收入不利。在拐点以后,男性劳动力比例增加1%,对收入的正面影响降低0.2个百分点,在样本75分位0.667的男性劳动力比例上,相比最优的性别配置,对收入的影响降低2.52%。

本文对性别失调影响的时序变化分析还发现,随着性别比例失调问题的加剧,男性劳动力的收入递减趋势加剧。未来性别失调问题对收入的影响将会是巨大的。

由此看来,中国在1984—1999年失去的1800万女婴(马瀛通,2005年),不仅仅是一个“娶妻难”的社会问题和性别偏好的伦理问题,其对经济的影响亦不容忽视。本文的测算表明,平均而言,1987—1999年的农村性别比例失调使得农民人均纯收入降低0.67个百分点,并且这种损失随性别比例失调的加剧还有加大的趋势,这大概也是“从严控制人口”政策误导与失误的又一代价。

本文的主要缺陷在于:面板数据中存在固定效应影响的自变量与因变量之间的回馈关系(固定效应不仅影响当期的y[,it],并且影响所有的y[,it]滞后项和x的滞后项),并且这种影响无论滞后期数如何长都不能消失,从而产生严重的不一致性(Rosenzweig.M.R and Bingswanger.H,1993)问题。由于缺乏严格的外生变量作为工具变量,从而无法有效的克服固定效应造成的解释变量与因变量的回馈关系,所以难以估计性别比例影响的动态方程。从这个意义上说,本文的研究结果仅仅是一个起点。

标签:;  

劳动力性别比与农民长期收入:来自中国的实证证据_性别比例论文
下载Doc文档

猜你喜欢