教育回报率的地区差异及其对劳动力流动的影响_回报率论文

教育回报率的地区差异及其对劳动力流动的影响，本文主要内容关键词为：回报率论文,劳动力论文,其对论文,差异论文,地区论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

JEL Classification：C13，121，J31

人力资本理论认为，教育作为人力资本投资的主要形式，可以提高劳动力的生产率，进而提高其收入。而教育回报率——多接受一年教育所带来的收入增加——则不仅影响家庭和个人的教育投资决策，也影响到教育政策的制定。此外，在一个多部门(如地区)的经济中，不同部门之间的教育回报率差异要么反映了部门分割状况，要么反映了不同部门间的特征差异，对了解劳动力市场的状况和制定相关政策具有重要意义。研究表明，我国不同部门、不同群体的教育回报率存在显著差异。①本文以城镇劳动力市场中的农民工为研究对象，考察他们的教育回报率，并着重分析这一群体教育回报率的地区差异及其变化趋势。

农民工是我国劳动力市场中一个庞大而特殊的群体。我国巨大的地区和城乡收入差距使大量的劳动力从欠发达的农村地区流向发达的城市地区。尽管户籍制度不再将农民限制在土地上，但这部分劳动力通常无法获得城镇地区的本地户口，形成了庞大的“农民工”群体。2011年，我国外出农民工的数量为1.59亿。②由于教育水平低，加之歧视和信息不对称等原因，农民工的工资水平显著低于城镇本地职工。这使得研究这一群体的工资决定和教育回报尤其重要。

农民工群体是推进我国城镇化的一支重要力量。他们在决定是否迁移的同时，还需要决定迁移的目的地。在一系列影响劳动力区位选择的因素中，(预期的)工资水平是一个非常重要的因素。如果各地区的教育回报率不同，就意味着不同教育水平劳动力的相对工资水平存在差异，而这个差异会影响到劳动力迁移的模式。给定相同的平均收入，回报率高的地区会吸引更多高教育水平的劳动力；而低教育水平的劳动力则更倾向于迁往低回报率的地区。可见，教育回报率的地区差异将对我国的城镇化进程产生重要的影响。而通过考察教育回报率地区差异的变化，我们可以推断劳动力市场对地区差异反应和调整的过程。

本文使用2005年1%人口抽样调查数据以及2011年流动人口动态监测调查数据来估计农民工的教育回报率及其地区差异。其中，2005年的人口抽样调查是一份具有全国代表性的数据，利用它不仅可以描绘农民工群体教育回报率的地区差异，而且可以利用农民工的来源地等信息进行样本选择修正。利用OLS回归，我们发现农民工教育回报率存在明显的地区差异：东部地区和发达城市的教育回报率明显高于中西部地区。利用2011年的流动人口监测数据，我们发现了同样的规律。比较两个年份的结果可以看出，农民工的总体教育回报率有所降低，地区间回报率的差异也有所降低，并呈现出向均值收敛的特征。

我们还考察了地区间工资以外福利水平的差异和迁移时间差异对结果可能造成的影响。结果表明，控制上述两方面因素之后各地区的教育回报率及其差异变化不大。而为了克服选择性偏差，我们采用Dahl(2002)提出的半参数多部门样本选择模型。该模型与Heckman的两步法类似，但是通过采用非参数方法估计迁移概率和控制样本选择纠正项，它可以解决多部门的样本选择问题，而且克服了参数模型结果不稳健的弱点。利用2005年的数据进行样本选择修正的结果表明，样本选择偏差并不严重。这些练习说明了本文结果的稳健性。

最后，我们考察了地区间的人口流动与教育回报率的地区差异之间的关系。结果表明，相对于低教育水平的农民工而言，高教育水平的农民工更倾向于流动到教育回报率比较高的地区。这表明教育回报率的地区差异对我国劳动力流动的模式产生了显著影响。这也解释了为什么教育回报率的地区差异会逐渐缩小。

本文的结构安排如下：第二节简要回顾了与农民工教育回报率相关的文献；第三节介绍数据；第四节报告了OLS回归得到的教育回报率估计结果；第五节是稳健性检验，并报告了进行样本选择修正之后2005年各地区的教育回报率；最后一节总结全文。

二、文献综述

近年来，农民工群体的收入和福利状况备受关注，对其教育回报率的研究也逐渐增多。一些研究以(来自)某个地区的农民工为样本考察其教育回报率。例如，罗忠勇(2010)利用2008年珠三角地区农民工数据估计的教育回报率为4.4%；张世伟等(2009)利用2005年吉林省进城务工人员抽样调查数据和2006年吉林省农村抽样调查数据估计的农民工教育回报率为4.55%。还有一些研究使用了更大范围的样本。比如，张泓骏、施晓霞(2006)利用1999年农业部在河北、陕西、安徽、湖南、四川、浙江六个省农村地区的住户调查数据，估计得到外出打工人口的教育回报率为5.36%；戎建(2008)利用2004年复旦大学中国社会主义市场经济研究中心的来自22个省份的农村调查数据，得到迁移者的教育回报率为4.77%。对农民工教育回报率的估计还出现在一些其他研究中。比如，人们在考察城镇职工与农民工的收入差距时，Oaxaca分解的第一步是估计两类人群的工资方程，教育回报率是不可或缺的内容。多数的研究结果表明，农民工的教育回报率低于城镇职工(Meng and Zhang，2001；邢春冰，2008；Maurer-Fazio and Dinh，2004；邓曲恒，2007)。

总结上述研究，农民工在我国城镇劳动力市场中的教育回报率相对较低，不同时间和不同地区的教育回报率存在显著差异。但是，由于数据缺乏可比性，要从已有的研究中得到教育回报率的地区分布和跨期变化规律非常困难。一些研究在使用多个地区的数据时，往往只估计一个总体教育回报率——这实际上假设不同地区的教育回报率相同。

如果我们关注一个随机抽取的农民工在某个城镇劳动力市场上所面对的教育回报率，OLS回归往往给出的是有偏的结果，这是一个典型的样本选择问题。但由于农民工面临多个地区选项，问题处理并不像两个选项的样本选择问题那么简单(Heckman，1979)。③在较早的研究中，Lee(1983)假设当劳动力面临多个选择时，真正起作用的选项是他的最优也是其实际做出的选择，这使得样本选择纠正变得简单。但是Lee(1983)属于参数模型，对扰动项的实际分布比较敏感。Ahn & Powell(1993)提出一个半参数方法，通过控制个体选择概率的未知函数来纠正样本选择偏差。Dahl(2002)借鉴上述研究提出一套简单易行的修正方法，研究了美国教育回报率的州际差异。他利用非参数方法估计人们选择不同的州的概率，并通过控制少数几个概率(如选择其实际迁移的州的概率以及选择留在出生地的概率)的多项式函数来修正样本选择偏差。他发现自我选择对各州的教育回报率有显著影响。本文在进行样本选择修正时将主要借鉴Dahl(2002)的研究。

涉及到农民工的流动，以往的研究更多强调地区间平均工资水平差异的影响(如Lin et al.，2004)。而教育回报率的地区差异则反映出工资水平的地区差异将因劳动力的教育水平而不同，进而对于理解不同教育水平农民工的流动模式具有重要意义。

与已有研究相比，本文的贡献体现在如下三个方面。首先，我们的数据覆盖范围广，包含全国31个省、自治区和直辖市的300多个城市，数据(特别是2005年的人口抽样调查数据)的代表性也比较好。其次，我们放松了不同地区农民工教育回报率相等的假设，并考虑了样本选择问题。另外，我们使用了2005年和2011年两个年份的数据，既能反映农民工教育回报率的变化趋势，又具有较强的时效性。

三、数据描述

我们使用的第一套数据是2005年1%人口抽样调查数据的五分之一随机样本。该数据涵盖了全国31个省、自治区和直辖市的2585481个个人。数据中包含了农业和非农户籍人口，调查了他们的性别、年龄和教育水平等个人特征信息以及就业身份、职业、行业、工作时间和收入等与就业有关的信息。对于流动人口，还调查了他们的户口所在地、离开户口所在地的时间和迁移目的等信息。第二套数据是国家人口计生委的2011年流动人口动态监测调查数据。该调查采取分层、多阶段、与规模成比例的PPS抽样，在全国范围进行，按照随机原则在31个省(区、市)和新疆生产建设兵团抽取样本点。调查的主要内容包括流动人口基本信息、就业、居住、计划生育和生殖健康等公共服务情况以及社会参与和社会融合状况等。抽样过程中，各省样本量分4个等级，最多的为10000人，其次为6000人，再次为4000人，最少为2000人，最终全国总样本量为128000人。

在个人层面，我们保留了两个年份里户主的相关信息，包括性别、年龄、教育程度、户口性质、户口登记地情况、流动范围、离开户口所在地时间(2005)或本次来本市时间(2011)、行业、职业、就业身份、上月收入和每周工作时间等。由于本文主要关注农民工的教育回报率，我们将样本限制在有工资收入的跨县级及县级以上的地区流动、流动时间在半年及以上的农业户籍人口。按照通常的做法，我们在样本中排除了雇主、自营劳动者、退休者、学生以及家庭帮工(Coleman，1993；Mwabu and Schultz，1996)。考虑到我国的相关规定(如最低工作年龄要求和退休年龄要求)，样本年龄被限定在16岁至59岁。此外，我们根据数据中的月平均工资和每月工作小时数计算得到小时工资，利用年龄和教育年限计算得到潜在经验：年龄-教育年限-6。

在进行上述限定并删除缺失信息的样本后，2005年的最终有效样本量为30176人，其中男性22702人，女性7474人；2011年的有效样本量为38609人，其中男性22743人，女性15866人。2005年，男性和女性的平均年龄分别为31.87岁和26.28岁；2011年则分别为32.78岁和30.34岁。

表1对两个年份的样本做了更加细致的描述。从受教育水平的统计结果可以看出，具有初中以下学历的样本在两个年份里分别占79%和74%，其中，初中学历的样本在两个年份里的比例都是最高的。两个年份间，高中及以上学历的农民工相对数量显著上升，从2005年的21%上升到2011年的26%。这在一定程度上表明，上世纪90年代末以来的高等教育扩招对提高农业户籍人口的教育水平发挥了积极作用。

表1还报告了农民工的行业和职业分布，与流动人口的低教育水平相对应，两个年份的样本中从事对能力要求比较高的产业如科学研究、技术服务和地质勘查业的比例相对较低，样本主要集中在制造业和建筑业。总的来说，2011年流动人口职业和行业的分布与2005年相比更加分散。从表中我们可以看出2011年从事制造业和生产的流动人口比例明显下降，而从事服务行业和其他行业以及商业服务的流动人口比例明显增多。

四、基本模型及计量分析结果

我们采用经典的明瑟工资方程来估计教育回报率，模型的基本形式如下：

(1)

其中，lnw为小时工资收入的自然对数，schyear代表受教育年限，因为数据中只有受教育水平，我们根据中国的实际情况将教育水平换算成教育年限。④exper和expersq代表经验和经验平方。gender是虚拟变量，男性为0，女性为1。式中为待估参数，其中衡量了在其他条件不变的情况下，教育年限对工资水平的边际影响。我们首先利用这个模型对总体或不同地区的样本做回归。

表2给出了总体的和分区域的教育回报率估计结果。从中可以看出，不管是2005年还是2011年，流动人口教育回报率的地区差异都十分明显，其中东部和发达城市的教育回报率明显高于其他地区。从回归的R[2]可以看出，发达地区教育和经验对收入的解释力更强。同时，随着时间的变化，所有地区的教育回报率均有所下降。不过在表2的回归中，我们没有控制大区域内部的省份虚拟变量。因此，教育回报率的大小可能反映了地区内部不同省份间的教育和工资水平的差异。

表3给出了分省的估计结果。从1—4列可以看出，不同省份农民工的教育回报率存在巨大的差异。2005年，教育回报率最高的省份为广东，基本上达到10%，最低的省份为吉林，其教育回报率甚至为负(不显著)。总体来看，东部省份的教育回报率相对较高。到2011年，不同省份的教育回报率差异仍然十分显著，其中北京的教育回报率最高，为8.3%(标准误为0.006)；黑龙江的教育回报率为-0.2%。总体上仍然是东部地区的教育回报率高于中西部地区。

比较2005年和2011年的结果可以看出，教育回报率的地区差异有所降低。所有省份教育回报率的标准差由2005年的0.024下降到2011年的0.019。图1A则更形象地说明了教育回报率地区差异的变化模式。图中的实线为45度线，横轴和纵轴则分别代表2005年和2011年的教育回报率。可以看出，两个年份不同省份的教育回报率之间存在显著的正相关关系，大部分省份教育回报率的相对位置变化不大。而大部分省份位于45度线的下方则意味着总体教育回报率有所下降。同时，一些2005年教育回报率很低的省份的教育回报率到2011年有所上升，这说明，在总体教育回报率下降的同时，不同地区的技能价格有一个向均值回归的过程。反映到两个年份教育回报率的回归中，2005年教育回报率的系数显著为正，但小于1(为0.4588)。

最后，我们还估计了市级层面的教育回报率。但是由于很多城市的农民工样本较小，导致教育回报率的估计不准确。图1B是利用两年教育回报率均为正且剔除异常值之后的87个市的数据画出的散点图，其中横轴和纵轴分别代表2005年和2011年的教育回报率，图中的直线是45度线。图1B表现出的规律与图1A基本一致。我们可以看出教育回报率有一个趋同的趋势：2005年教育回报率比较低的城市到2011年教育回报率下降程度相对较小，甚至有一部分城市的教育回报率有所上升；而2005年教育回报率较高的市到2011年教育回报率下降幅度相对比较大。两方面的原因可能导致了教育回报率的上述变化。首先，技能价格(教育回报率)的地区差异激励高技能人口流动到回报率比较高的地方，劳动力供给结构的变化使得低回报地区的教育回报率相对上升，高回报地区的教育回报率相对降低；另一方面，也可能是地方政府教育政策的相应调整使得本地劳动力市场的供给结构发生变化，进而使农民工的教育回报率发生不同程度的变化。⑤在后面的分析中，我们将对第一个假说进行验证。不过在此之前，我们首先考察所得到的教育回报率地区差异是否稳健，以及它是否受到样本选择偏差的影响。　

五、稳健性检验和样本选择修正

如果上节中教育回报率的地区差异是对人力资本价格的真实反映，它将对不同技能水平劳动力的区域选择产生重要影响。不过，这种差异可能只是个人或工作特征的地区差异的反映，或者是劳动力自选择的结果。这种情况下，观测到的教育回报率地区差异不会为劳动力的跨区流动提供激励。本节将通过一些稳健性检验以及样本选择修正来说明这些因素对教育回报率地区差异的解释力。

(一)控制福利状况和迁移时间

首先，我们考察社会福利状况的地区差异可能对结果造成的影响。不妨想象两个城市A和B，并假设两个城市中低技能的农民工收入和福利状况相同。对于高技能的劳动力而言，A地区提供的工资高但是社会福利较差，B地区的工资低但是社会福利较好。那么在均衡的时候，我们完全可能观测到A地区的教育回报率高于B地区。为了考察这种可能性，我们在工资方程中加入了反映农民工参加社会保险状况的控制变量，包括：是否参加失业保险、是否参加养老保险和是否参加基本医疗保险(三者均为虚拟变量)。

图2A和2B分别给出了2005年和2011年控制这些变量之后的估计结果。横轴代表未加这些控制变量时的教育回报率，纵轴则代表加了不同的控制变量之后的教育回报率。图中大部分省份在控制了社会保险状况后的教育回报率都低于45度线(图中的实线)，这说明高教育水平农民工的福利状况要好于低教育水平的农民工，这使得控制福利状况后的教育回报率下降。但是，2005年各省教育回报率下降的幅度没有系统的差异；2011年高教育回报率地区的教育回报下降幅度略高于低回报地区，但这没有显著降低教育回报率的地区差异，也基本未改变不同地区在教育回报率上的排序。

接下来，我们考察劳动力流动时间差异可能带来的影响。同样考虑A和B两个城市，并假设两个城市中低技能的农民工收入和迁移时间相同。⑥如果A城市高技能劳动力的迁移时间较长(比如经济发展较早)，而同类型的劳动力只是近期才迁移到B城市，我们就可能观察到A城市的教育回报率高于B城市——因为在城市地区生活的时间越长，劳动力对城市环境越熟悉，越可能赚更高的工资。为了排除这种可能，我们在工资方程回归中控制了相关的因素。对于2005年的数据，我们控制了劳动力离开户口所在地的时间；而对于2011年的数据，我们控制了农民工来“本市”的时间。无论是2005年还是2011年，控制移民时间后的各省教育回报率都在45度线附近，表明这对各省教育回报率的估计基本没有影响。因此也不难想象，当我们同时控制社会福利和迁移时间后，估计结果与单独控制社会福利时的结果相差不大。

(二)修正样本选择偏差

以上我们使用迁移到各地区的流动人口样本通过OLS方法得到各地区的教育回报率。由于劳动力往往根据自身的比较优势选择地区，这可能导致OLS估计结果有偏。我们参考Dahl(2002)的方法，利用2005年的数据分别对省和市层面的估计进行样本选择修正。⑦下面我们通过一个简化的模型来说明样本选择偏差存在的原因，进而提出修正的办法。

我们假设农民工在选择地区时遵循效用最大化原则。如果出生在j地区的个人i迁移到地区k，则其效用为：

我们假设k地区的工资由下式决定：

(7)式中新加入的部分为样本修正函数，我们这里采用迁移概率的二项式形式。为虚拟变量，代表在k地区工作的个体i来自地区j。

为得到迁移概率，我们将所有样本按地域、年龄和教育水平分为28个特征组。其中地域有华北、东北、华东、华中、华南、西北以及西南等七个组，⑨教育水平分为初中及以下和高中及以上两组，年龄则分为30岁以下和30岁以上两组。迁移概率则定义为所有具有相同特征的人群中(在一个特征组)迁移到某个地区(k)的比例，采用这种非参的方式估计样本迁移的概率避免了多项选择模型(如mlogit模型)中的独立于无关选项(IIA)假设，也避免了在嵌套模型中进行人为分组。

表3给出了2005年样本选择修正前后各省的教育回报率，其中1、7两列是没有控制福利状况和迁移时间的结果。在对每个省份的样本进行样本修正之后，有些省份的教育回报率有所上升，如河北、海南和西藏；有些省份的教育回报率则有所下降，如安徽和重庆。然而，大多数省份在进行样本选择修正之后教育回报率的变化很小。此外，教育回报率在样本选择修正前后的变化也没有系统性的规律。5、9两列报告了控制福利状况和迁移时间后的估计结果，总体来看，样本选择修正的影响也比较小。

图3 样本修正前后各市的教育回报率(2005年)

图3利用市级层面的数据给出了样本选择修正前后的结果。该图为2005年120个(剔除了异常值)样本城市修正前后流动人口教育回报率的散点图，图中的直线为45度线。我们可以通过数据点偏离45度线的模式来考察样本修正前后教育回报率的变化。图3中的大部分城市主要分布在45度线附近，只有少数城市偏离45度线的程度较大。总体来看，不同城市间的农民工教育回报率仍然存在显著差异，而且大部分城市教育回报率大小的排序变化不大。这些结果均说明，样本选择偏差对估计结果的影响不大，不影响本文的结论。

六、教育回报率的地区差异与劳动力的流动

如果各省之间真实的教育回报率确实存在差异且个人根据比较优势选择迁移目的地，迁移概率则会随着教育回报率的差异而变化。我们假设地区间的收入差距和不同地区的吸引力差距会影响劳动力的迁移概率，具体的有以下等式：

(9)

其中，上标N代表教育水平，为教育水平为N的人当中从地区j流动到地区k的人数比例，ln(·)代表迁移概率的自然对数，代表教育水平为N的个体在第k个省份的平均收入。A代表某地一系列特征变量，本文变量的选取包括城镇登记失业率、人口密度(人每平方千米)、人均资本存量、医疗卫生机构床位数(每千人口)和气候变量(包括各地主要城市年平均气温、降水量、相对湿度)，还包括一些政府公共支出变量(即：人均财政教育费用支出、人均科学事业费、人均卫生经费支出、人均社会保障补助支出)，以及用以考察距离的位置变量(主要城市经度、纬度)，代表误差项。与以往考察收入差距对劳动力流动的影响的研究(如Lin et al.，2004)不同，等式(9)允许不同教育水平的劳动力的地区收入差距和迁移概率存在差异，它还允许不同教育水平的劳动力对城市特征及其差异拥有不同的评价。不过，我们假定不同教育水平的劳动力对收入差异反应的敏感程度相同。

我们将农民工的教育水平分为两组，高中及以上(N=HS)和初中及以下(N=MS)。对这两组人群，(9)式均成立。通过将两组人群相减可得下式：

(10)

其中，。为了估计(10)式，我们生成一个虚拟变量(教育水平为高中及以上等于1，否则等于0)，并以此来替代每个省份的工资方程中的教育年限。同样，我们可以得到样本选择修正之后的教育回报率。表4给出了利用2005年的数据估计的结果。⑩

由表4可以看出，结果中的截距项均显著为正，说明高教育水平人群比低教育水平人群的迁移概率更高。其他回归系数反映了地区收入差距和特征差异对不同教育水平相对迁移概率的影响。表4的1—2列验证了迁移概率对修正和未修正教育回报率的反应，两列结果都显示地区之间教育回报率的差异对不同教育水平人口流动概率的差异有显著影响。其中，第1列的结果表明，如果k地区的教育回报率比j地区高1%，高教育人群从j地迁移到k地的概率就比低教育人群高1.33%。第2列中的回归系数为0.74，低于第1列的结果，这大概是由于未经样本选择修正的教育回报率已经在一定程度上反映了劳动力流动的结果。表4的3—8列利用修正后的教育回报率，同时控制其他变量，如失业率、社会福利状况、气候、政府支出、距离等，其结果与未加控制变量时的结果很接近：系数变化不大而且都十分显著。总体而言，表4的结果说明不同教育水平的人口在流动的过程中会根据自身的比较优势进行区域选择。而教育回报率的地区差异和相对迁移概率间的显著关系说明我国的劳动力资源在随着外部需求的变动而进行重新配置，这是我国劳动力市场日趋灵活和不断完善的表现。近些年来的户籍制度改革可能是劳动力市场得以改善的原因之一。

农民工的教育回报率及其地区差异既影响到这一群体的收入水平，也影响到不同教育水平农民工的区域选择，对理解中国的劳动力市场和制定相关政策具有重要意义。本文利用2005年1%人口抽样调查数据和2011年流动人口动态监测调查数据，估计了不同地区农民工的教育回报率。结果表明，农民工的总体教育回报率存在下降的趋势。更为重要的是，我们发现2005年和2011年农民工的教育回报率都存在显著的地区差异，两年里各地区的教育回报率存在显著的正相关性。我们也观察到农民工的区域间流动使得教育回报率的地区差异有所下降并呈现出向均值收敛的特征。

近年来，伴随着教育扩展，我国劳动力(包括农民工)的教育水平显著提高。如何有效地利用劳动力也成为全社会关注的问题。本文的结果表明，教育回报率的地区差异已经对我国不同教育水平劳动力的区域选择产生了显著的影响。在一个可以自由流动的劳动力市场中，如果劳动力的偏好相同，区域间的流动将促使地区间的教育回报率趋同(Black et al.，2009)。由于农民工是一个流动性和同质性较强的群体，教育回报率仍存在显著的地区差异说明他们在流动过程中面临较高的成本。当然，即便不存在流动成本，如果劳动力的偏好存在差异，地区的产业结构、生活便利设施的差异和劳动力的自选择过程也会导致教育回报率的地区差异。本文的结果对于控制福利状况、迁移时间以及样本选择偏差的修正非常稳健，同时这种地区差异有随时间下降的趋势，这说明教育回报率的地区差异不大，可能是农民工在区域选择过程中的偏好异质性所导致的。因此，政府部门可以通过致力于减少劳动力流动的阻力(如取消或进一步改革现在的户籍制度)来促进劳动力的流动。

对于那些具有较高教育回报率的地方政府而言，一方面要努力吸引更多高教育水平的劳动力，另一方面也可以通过培训项目来增加现有劳动力的技能。而一旦劳动力(特别是高教育水平的劳动力)可以自由流动，一些地区的高教育回报率也可以为低教育回报地区的人力资本投资提供激励，从而提高我国的总体教育水平。对这一论断的实证检验超出了本文的范围，但是现有的很多研究都支持这一结论(Beine et al.，2008；邢春冰，2013)。(11)

①如教育回报率的性别差异(Beaudry and Lewis，2012)、所有制差异(邢春冰，2005)、城乡差异(姚先国、张海峰，2004)、行业差异(高梦滔、张颖，2007)等。

②http://www.askci.com/news/201204/27/2715551256411.shtml。

③一些研究使用了Heckman的两步法来处理样本选择问题(张泓骏、施晓霞，2006)，但这只是处理了有工作和没工作的样本间的选择问题。本文则假定农民工在迁移之前已经找好工作，重点考察他们在地区间的选择。

④本文为不同教育水平赋予教育年限的方式如下：文盲、小学、初中、高中、大专、大学和研究生的教育年限分别为0、6、9、12、15、16年和19年。

⑤由于来自不同的调查，将2005年和2011年各地区的教育回报率进行比较多少有些令人担忧。因此，我们同时利用相同来源(国家计生委)的两个年份的数据考察了地区间教育回报率趋同的特征。结果显示，尽管是两个相邻年份(2011和2012)的数据，地区间的教育回报率仍然表现出趋同的趋势。两年间，教育回报率出现下降的主要是2011年教育回报率偏高的省份，而那些上升的省份则主要是教育回报率偏低的省份。如果拿2012年的教育回报率对2011年的做回归，后者的回归系数为0.43，说明在较短的时间里，流动人口教育回报率的地区差异明显下降。尽管如此，到2012年，流动人口教育回报率的地区差异仍然十分明显。一些沿海省份的教育回报率仍然接近7%，而一些内陆省份的教育回报率则仅为3%。需要指出的是，由于数据代表性的问题，这里教育回报率均没有进行样本选择修正。

⑥我们也可以假设迁移时间对于低技能劳动力的人力资本及其收入没有影响。

⑦之所以没有对2011年样本数据进行修正分析是因为2011年的样本数据是对全国31个省份采用PPS抽样，在修正过程中计算迁移概率时，会与人口流动的真实情况存在较大偏差。

⑧我们还假设从不同地区(j)迁移到地区k的样本对应的修正项函数是相同的：λj(·)=λk(·)。

⑨华北(北京、天津、河北、山西、山东)、东北(内蒙古、辽宁、吉林、黑龙江)、华东(上海、江苏、浙江、福建)、华中(河南、湖北、湖南、安徽、江西)、华南(广东、广西、海南)、西北(陕西、甘肃、宁夏、新疆)以及西南(重庆、四川、贵州、云南、西藏、青海)。

⑩对于2011年的数据我们做了相同的工作，结果除了截距项的系数显著为正之外，修正教育回报率差异的系数基本上都不显著，虽然观察值有所增加，但是解释变量的解释能力明显下降(Adj R-squared明显很小)，我们认为主要原因在于2011年的数据由于抽样的原因不能很好地反映流动人口在地区间的流动情况——主要表现在无法准确估计。

(11)Beine et al.(2008)指出跨国移民中高教育水平劳动力迁移概率增加会激励输出国居民进行更多的人力资本投资；邢春冰(2013)将大学扩招当做一次自然实验，其结果表明，成功迁移到城市的概率增加将激励农村居民进行更多的人力资本投资。

标签：回报率论文; 概率计算论文; 修正系数论文; 特征选择论文; 城市选择论文; 流动人口论文; 投资论文;

教育回报率的地区差异及其对劳动力流动的影响_回报率论文

猜你喜欢