效率与公平：高校扩招与高等教育回报的分位数处理效应论文

经济学管理学

效率与公平：高校扩招与高等教育回报的分位数处理效应^*

刘生龙胡鞍钢

[摘要] 无数文献对教育的均值效应进行了探讨和估计，现在人们更多地关注教育的分布效应，尤其关注的是教育对低收入者的影响。分位数回归模型是当前刻画条件分布最常用的模型，经典的分位数回归模型无法解决核心变量的内生性问题。本文以1999年中国高等教育扩招作为工具变量，基于Abadie等（2002）提出的条件QTE和Frolich and Melly（2014）提出的无条件QTE方法对中国高等教育回报的条件分布进行估计，解决了分位数回归中核心变量的内生性问题。研究结果表明，中国高等教育回报显著为正，而且随着收入水平提高，高等教育回报率下降，在高等教育扩招的同时存在着提升效率的“生产率效应”和改善收入分配的“公平效应”。

[关键词] 高校扩招生产率效应公平效应高等教育回报 QTE方法

一、引言

1996年，中国高等教育毛入学率仅为8.3%。1997年9月，党的十五大报告明确提出，“稳步发展高等教育”。① 江泽民：《高举邓小平理论伟大旗帜：把建设有中国特色社会主义事业全面推向二十一世纪——在中国共产党第十五次代表大会上的报告》（1997年9月12日）。 1998年，由于爆发亚洲金融危机，中国政府做出扩大内需等重大决策，不仅增发国债，也决定将教育作为重点抓好关系国民经济发展全局的五件大事之一，从这一年起，中央一级财政支出中教育经费支出所占比例连续3年每年比上一年提高1个百分点，即1998年增加25亿元，到2000年共增加180多亿元。其中，1999年开始实行扩大高等教育招生规模。2000年10月，党的十五届五中全会《关于制定国民经济和社会发展第十个五年计划的建议》明确提出“加快发展教育事业”，还提出“扩大高中阶段教育和高等教育规模”，由此，推动高等教育发展进入快车道。

尽管当时对高校扩招的决策有许多反对意见，认为会影响高等教育的质量，但是这一决策在当时的背景和现实下具有诸多的合理之处。首先，20世纪90年代中期，中国的18—22周岁适龄青年大学入学率非常低，仅为2.4%，即使加上成人高考的也仅为4%。而同时期的韩国为51%，泰国为19%，印度为8%。② 数据来自世界银行。当时中国适龄青年大学入学率比同期人均收入水平更低的印度还要低，也即是说存在扩大大学招生规模的必要性。其次，亚洲金融危机爆发对中国经济产生一定影响，需要民众扩大内需支持经济发展。然而，中国民众不愿意进行实物消费，各种经济刺激手段对扩大内需的作用很有限。而中国人自古以来都有尊师重教的传统，家长们也愿意将更多的金钱投资在子女们的教育上。因为对这些家长们来说，教育不仅是消费，实际上也是一个投资，是对子女、家庭和国家未来的一项投资。因此，在当时的条件下扩大高等教育不仅能够刺激当时的消费，还能够为未来的人力资本进行投资，可谓一举两得。第三，高等教育扩招可以在一定程度上缓解当时下岗工人的就业压力。1998年正是中国国有企业改革带来大量下岗工人的时期，如果这部分年轻人不进入大学学习，就会直接跟下岗工人进行竞争，当时那些下岗工人将会面临更大的就业压力。最后，根据世行数据，当时中国大学师生比是1∶7，即使是发达国家，师生比也是1∶15到1∶20。也就是说师资力量也允许扩大大学生招生规模。

1999年6月，中国政府正式宣布扩招，当年中国的大学生招生数量增长了47%。同年12月，《面向21世纪教育振兴行动计划》明确提出“积极稳步扩大高等教育规模，特别要大力发展高等职业教育。”自此，拉开了高等教育扩招的序幕。图1刻画的是中国1977—2015年大学录取率和录取人数的发展状况。可以看到，虽然1998年之前由于参加高考的人数波动较大，导致大学录取率也存在一定的波动，但是大学录取人数变动并不是很大，总体来说，大学录取人数呈缓慢上升的态势。从1977年到1998年，中国的高考录取人数从27万增加到108万，年均增长率为6.8%。1999年高等教育扩招之后，大学录取人数迅速增加，大学录取率也迅速增加。2015年大学录取人数达到了700万人，1998—2015年大学录取人数年均增长率达到了13.3%。

高等教育扩招让更多的人接受了高等教育。2002年高等教育毛入学率提前达到了原定2010年实现的15.0%的目标，标志着高等教育从精英教育阶段进入大众教育阶段，到2016年，这一毛入学率已上升至42.7%，全国普通本专科在校生从1998年的341万人上升至2016年的2696万人，全国大专及以上人口从2000年的4571万人上升至2015年的1.7亿人，为中国成为世界第二大经济体提供了丰富的人力资本。不过，高校扩招也遭受了许多诟病，最主要的就是扩招之后大学教育质量下降（Wu and Zheng，2008）① Wu, B. and Zheng, Y. N.,“Expansion of Higher Education in China: Challenges and Implication”，China Policy Institute of The University of Nottingham, Brie fi ng series- Issue 36, 2008. 和大学新生面临劳动参与率下降、失业率上升和小时工资下降的问题（吴要武、赵泉，2010）。② 吴要武、赵泉：《高校扩招与大学毕业生就业》，《经济研究》2010年第9期。随着中国人口结构变化和人口老龄化加剧，“民工荒”逐渐凸显，这也使得中国农民工的初次就业工资加速上涨，与一些大学生就业困难、沦为“啃老”的境地形成鲜明对比，社会上出现“读书无用”的声音。

另一个受到较多诟病的是大学扩招后由收费教育导致的公平问题。高等教育扩招后，由于财政在高等教育方面的支出难以培养这么多的大学生，大学教育成为收费教育。高等教育收费对于富裕家庭来说更加有利，这是因为他们进入大学的门槛降低了，而且不用担心经济上的负担，但是对于广大农村家庭和贫困家庭来说，大学学费是一项严重的经济负担。这也就有可能导致富裕的家庭更多地接受高等教育，而贫穷家庭更少地接受高等教育，最终导致贫富差距进一步扩大。

本文的研究旨在对高等教育扩招决策作一事后定量评估，主要集中在两个核心问题上：一是检验大学扩招后高等教育回报率到底是多少；二是检验大学教育回报的条件分布效应，看看大学教育到底是更多地促进富人收入增加，造成贫富差距扩大的“马太效应”，还是更多地促进低收入阶层收入增加，促使贫富差距缩小的“公平效应”。

图1 1977—2015年中国大学教育发展状况

二、文献综述

自美国经济学家Mincer（1974）① Mincer, J., Schooling, Experience and Earnings ，Columbia University Press: New York, 1974.提出教育与收入决定的人力资本框架以来，教育与收入之间的关系研究一直是经济学家们感兴趣的重要话题。到现在为止，国内外有关教育经济回报的文献可谓汗牛充栋。Card（1999）② Card, D.,“Using Geographic Variation in College Proximity to Estimate the Return to School”，NBER Working Paper No.4483, 1993. 曾经对先前西方国家教育回报的文献进行了很好的评述，而张车伟（2006）③ 张车伟：《人力资本回报率变化与收入差距：马太效应及其政策含义》，《经济研究》2006年第12期。和刘生龙等（2016）④ 刘生龙、周绍杰、胡鞍钢：《义务教育法与中国城镇教育回报：基于断点回归设计》，《经济研究》2016年第2期。对中国的教育回报文献也进行了很好的梳理，这里我们首先只是针对中国教育回报的文献进行一些简要的总结。

在过去20多年的时间，里尽管许许多多文献利用中国不同人群、不同时期的数据，或者用不同的估计手段得出来的教育回报率非常不同，但是从这些文献中仍然可以总结出一些规律来。

(1)碎石制砂机械仍然采用的是传统的机械原理及工艺，导致砂石料生产企业所制的成品砂普遍存在粉料和针片状超标、砂粉分离、连续级配不达标等质量问题，影响混凝土强度和基建工程质量，不能满足国家大型项目建设的要求。经常出现公路不停的维修，楼房难以抵抗六级以上地震。

首先，中国的教育回报率在1980—2010年期间基本上呈不断上升的趋势。比如说，许多研究者计算的中国教育回报率在1980年代是很低的，每增加1年的教育回报率仅为1%—3%左右（Byron and Manaloto，1990；Knight and Song，1991）。⑤ Byron, R. P. and Manaloto, E. Q.,“Return to Education in China”，Economic Development and Cultural Change ,vol.38, no.4, 1990, pp.783-796.⑥ Knight, J. and Song, L.,“The Determinants of Urban Income Inequality in China”，Oxford Bulletin of Economics and Statistics , vol.53, no.2, 1991, pp.123-154.到1990年代中国的教育回报率达到5%—7%左右（Fleisher and Wang，2005；Appleton et al.，2005）。⑦ Fleisher, B. M. and Wang, X.,“Returns to Schooling in China Under Planning and Reform”，Journal of Comparative Economics , vol.33, no.2, 2005, pp.265-277.⑧ Appleton, S., Song, L. and Xia, Q.,“Has China Crossed the River? The Evolution of Wage Structure in Urban China During Reform and Retrenchment”，Journal of Comparative Economics , vol.106, 2005, pp.979-1014.而到了2000年以后教育回报率在7%以上（Zhang等，2005；Chen and Hamori，2009）。⑨ Zhang, J., Zhao, Y., Park, A. and Song, X.,“Economic Returns to Schooling in Urban China, 1988 to 2001”，Journal of Comparative Economics , vol.33, no.4, 2005, pp.730-752.⑩ Chen, G. and Hamori, S.,“Economic Returns to Schooling in Urban China: OLS and the Instrumental Variables Approach”，China Economic Review , vol.20, 2009, pp.143-152.中国的教育回报率上升的一个重要原因是，1980年代中国刚刚处于改革开放初期，计划经济仍然占据主导地位，人力资本的价值被严重压抑，因而使得教育的回报率不能体现教育的价值，而1992年邓小平南巡之后，随着从计划经济向社会主义市场经济转变，教育的市场价值逐渐得以释放，教育回报率自然上升。

2008年8月，易门县农业局为认真贯彻落实《国务院办公厅关于促进油料生产发展的意见》，按照玉溪市人民政府关于切实抓好2009年油菜产业的紧急通知要求和市、县领导的指示精神，充分认识抓好油菜生产的重要性、责任感和使命感，及时成立了领导小组，并从局属单位抽调五名技术人员成立油菜产业科研技术组，负责全县油菜生产的技术培训、推广和指导工作，为项目实施提供技术保障，从此开始了为期五年的油菜高产创建工作。

早前文献的第三个特点是随着计量经济手段的改进和数据可获得性的增强，一些前沿的手段，如Heckman两步法（Heckman and Li，2004）、⑫ Heckman, J. J., and Li, X.,“Selection Bias, Comparative Advantage and Heterogeneous Returns to Education: Evidence from China in 2000”，Pacif i c Economic Review , vol.9, no.3, 2004, pp.155-171.双胞胎设计（Li等，2012）、⑬ Li, H., Liu, P., Ma, N., and Zhang, J.,“Does Education Pay in Urban China? Estimating Returns to Education Using Twins”，Journal of Development Economics, vol.97, no.2, 断点回归设计（刘生龙等，2016）等方法都用在了对教育回报率的估计上。基于这些前沿的计量经济学方法和最新的数据，这些文献得出了一些非常有意义的结论，对评估和分析中国的教育政策也具有一定的借鉴意义。

很明显，方程（8）式是一个二元加权分位数回归估计，很容易看到仅仅能够从D=1的观测者中识别出，仅仅能够从D=0的观测者中识别出。因此，可以从两个一元加权分位数回归中估计得出。与条件QTE一样，在计算时首先要计算由于Z和X_i 是可观测到的，因此在计算出之后代入（9）式就可以计算出

洞庭湖及其入湖口表层沉积物的污染状况见图3，TN的单项污染指数范围分别为0.40~2.41，全湖及其入湖口的平均值为 1.05，属于轻度污染，约有21%样点TN处于中度-重度污染；TP的单项污染指数范围分别为1.09~2.23，全湖及其入湖口的平均值为1.49，100%样点的TP都处于中度-重度污染，TP的污染要比 TN严重。全湖及其入湖口的沉积物综合污染指数范围为1.00~2.23，平均值为1.42，属于轻度污染，其中约37%样点处于中度-重度污染。

由此看来，肥料利用率、有机肥替代、减施增效等政策引导，使高能耗的复合肥产业面临转型，其结果将导致复合肥进入产业调整和行业“洗牌”，使钾肥等上游原料企业经受考验。

自Koenker和Bassett （1978）提出条件分位数的统计特征和估计方法之后，由于该方法能够捕捉异质性效应而被广泛地应用于一些实证研究中。经典的分位数回归模型假定核心变量是外生的，然而现实中人们感兴趣的变量往往是内生的。鉴于此，Abadie等（2002）③ Abadie, A., Angrist, J. and Imbens, G.,“Instrumental Variables Estimates of the Effect of Subsidized Training on the Quantiles of Trainee Earnings”，Econometrica , vol.70, no.1, 2002, pp.91-117.提出了线性分位数工具变量估计，Horowitz和Lee（2007）④ Horowitz, J., and Lee, S.,“Nonparametric Instrumental Variables Estimation of a Quantile Regression Model”，Econometrica , vol.75, 2007, pp.1191-1208、Chernozhukov 等（2013）⑤ Chernozhukov,V., Fernandez-Val, I., and Melly, B.,“Inference on Counterfactual Distributions”，Econometrica ,vol.81, no.6, 2013, pp.2205-2268.又进一步提出了非参数工具变量分位数处理效应。这些分位数回归估计由于都包含了影响结果变量的其他控制变量，因此都被称为条件分位数处理效应（conditional QTE）。随着计量经济理论的进一步发展，无条件分位数处理效应（unconditional QTE）在经验研究中也得到大量的使用。Firpo（2007）⑥ Firpo, S.,“Ef fi cient Semiparametric Estimation of Quantile Treatment Effects”，Econometrica , vol.75, 2007, pp.259-276.、Imbens和Newey（2009）⑦ Imbens, G., and Newey,W.,“Identification and Estimation of Triangular Simultaneous Equations Models Without Additivity”，Econometrica , vol.77, pp.1481-1512.提出了无条件处理效应的参数估计方法。Firpo等（2007）提出了无条件处理效应的非参数估计方法。随着QTE估计方法的日益完善，近些年来，这些方法的应用研究也逐渐得到重视，尤其当被解释变量分布效应更受关注时，QTE方法有其明显的优势。

本文利用1999年高等教育扩招政策作为工具变量，检验高等教育回报的分位数处理效应。最近一些文献也对扩招之后中国的高等教育回报率进行了估计（姚先国等，2013；马汴京等，2016）。⑧ 姚先国、方昕、张海峰：《高校扩招后教育回报率和就业率的变动研究》，《中国经济问题》2013年第2期。 ⑨ 马汴京、蔡海静、姚先国：《高校扩招与大学教育回报率变动——基于CGSS数据的经验研究》，《经济理论与经济管理》2016年第不过这些文献要么利用高校扩招的影响作为工具变量估计高等教育的局部平均处理效应（马汴京等，2016），要么通过收集较长时间范围的调查数据对比高考扩招前后高等教育回报率的变化（姚先国等，2013）。前者没有估计高等教育回报率的条件分布效应，后者没有解决高等教育的内生性问题。

与当前文献相比，本文的边际贡献主要有如下几点：一是分别基于Abadie等（2002）提出的条件QTE和Frolich和Melly（2014）提出的无条件QTE方法对中国高等教育回报的条件分布进行估计，解决了分位数回归中核心变量的内生性问题，并将该估计结果与传统的OLS和2SLS估计结果进行比较；二是基于Mouri fi e和Wan（2017）① Mouri fi e, I. and Wan Y.,“Testing Local Average Treatment Effect Assumptions”，Review of Economics and Statistics ,vol.99, no.2, 2017, pp.305-313.提出的最新研究方法对本文工具变量的有效性进行了论证和检验，发现用高校扩招作为大学获得率的工具变量是有效的；三是本文的研究结果具有很强的经济学理论意义和社会现实意义。一方面，本文研究发现大学教育回报显著为正，现有大多数文献证明大学教育对收入的促进主要是通过生产率的提高实现的，这就意味着大学教育能够促进效率的提高；另一方面，本文研究还发现大学教育回报随着收入水平的提高而降低，也就是说高等教育更多地促进了低收入者收入增加，有助于促进更加公平的收入分配。

三、实证框架

绝大多数经验研究者关注均值效应，然而分布效应有时候往往是政策制定者更加关注的。被解释变量的分布往往容易发生变化，这种分布的变化仅仅依靠均值效应不能得到充分的展示。比如说，工资或者收入的上尾端（upper-tail）收入不平等很可能增加，而下尾端（lower-tail）收入不平等会下降，当前的学界和政策制定者对这种分布效应表现出越来越浓厚的兴趣。分位数处理效应（quantile treatment effects, QTE）估计是刻画分布效应重要的和强有力的工具。

为了估计大学教育对收入影响的处理效应，我们定义D_i 为一个二元变量，当个体i 获得大学教育时取值为1，反之取值为0。令Y_i 为个体i 的对数收入，和分别表示个体i 上大学或者不上大学潜在的收入。这里的Y_i 是现实中可以观察到的结果，其表达式如下：

我们将基于分位数处理效应来识别和估计Yⁱ 和Y⁰ 的分布函数。由于我们除了观测到二元变量D_i 和结果变量Y_i 之外，还可以观测到其他一些影响到结果变量的控制变量。根据自变量X_i 的作用不同，我们可以定义条件QTE（conditional QTE）和无条件QTE(unconditional QTE)。此外，由于明瑟方程中教育内生性经常被提及，我们还将解决内生性的处理选择问题。我们主要估计大学教育的条件内生QTE，作为稳健性检验，我们还将估计大学教育的无条件内生QTE。

（一）条件外生QTE

假定Y是关于X和D的线性函数，那么线性分位数回归模型形式如下：

不过需要看到的是，在农村户口和城镇户口样本中，尽管高等教育回报率在0.1、0.3、0.5和0.7分位上逐渐下降，但是在0.9分位上明显增加，甚至高于0.5分位上的教育回报。这就意味着对于农村和城镇样本内部而言，高等教育回报在收入分布上呈U型。在低收入阶段，高等教育使得低收入者的收入加速向中等收入者收敛，而在高收入阶段，高等教育使得高收入者的收入加速增加，从而进一步扩大中等收入者与高收入者之间的差距。也就是说随着大学教育的普及，低收入群体会逐渐转变成中等收入群体，但是中等收入群体却很难成为高收入群体，会不会出现“中等收入陷阱”是政策制定者要重点关注的问题。

是第分位点上不可观测的随机误差和是模型中的待估参数分位点上的条件QTE。

在条件外生QTE中X和D都被假定成是外生的，也就是线性假设和外生性假设结合起来就意味着于是我们可以根据可观测的变量（Y,X, D）的联合分布来对未知参数进行估计。这也就是Koenker and Bassett（1978）所提出的经典的分位数回归模型，即：

这里这里的是一个打钩函数（check function）。这是一个线性规划问题，通过单纯形法可以有效地估计式中的待估参数。由于分位数回归可以捕捉异质性处理效应，许多经验研究都用到了该方法（Powell，1986；Buchinsky，1994；Koenker and Xiao，2002；Angrist等，2006）。① Powell, J.,“Censored Regression Quantiles”，Journal of Econometrics , vol.32, 1986, pp.143-155.② Buchinsky, M.,“Changes in the U.S. Wage Structure 1963-1987: Application of Quantile Regression”，Econometrica ,vol.62, 1994, pp.405-458.③ Koenker, R., and Xiao, Z.,“Inference on the Quantile Regression Process”，Econometrica , vol.70, 2002, pp.1583-1612.④ Angrist, J., Chernozhukov, V., and Fern´andez-Val, I.,“Quantile Regression Under Misspecification, With an Application to the U.S. WageStructure”，Econometrica , vol.74, 2006, pp.539-563.

（二）条件内生QTE

条件外生QTE假定处理选择（treatment selection）是外生的。然而，在许多应用研究中，处理变量D是自我选择的，因此具有潜在的内生性问题。本文中，是否接受大学教育很明显具有自选择性，比如说对于那些内生能力更强的人更倾向于接受大学教育，而内生的能力同时也会影响到结果变量。由于自选择性存在，这就意味着ε⊥(D,X)这个假设条件是不成立的，在这种情况下，传统的分位数回归估计是有偏的，必须通过工具变量估计来识别真实的分位数处理效应。基于这种考虑，Abadie等（2002）和Chernozhukov与Hansen（2008）提出了线性工具变量法。Horowitz与Lee（2007）和Chernozhukov等（2013）提出了非参数工具变量分位数处理效应。Chesher（2005）⑤ Chesher, A.,“Nonparametric Identi fi cation Under Discrete Variation”，Econometrica , vol.73, 2005, pp.1525-1550.还检验了非参数条件效应的识别问题。

假定我们观测到一个二元变量Z可以用来作为工具变量，于是我们可以定义两类潜在的处理变量，即D₂ 。D₁ 只是个体受到政策影响时的处理选择，D₀ 是没有受到政策影响时的处理选择。我们感兴趣的因果效应通过潜在的结果和潜在的处理状态所描述的一种“反事实”来进行定义。潜在的结果包括Y¹ 和Y⁰ ，分别代表个体在D=1和D=0时的结果变量值。因果推断的目标是了解Y¹ 和Y⁰ 在总样本（很可能是子样本）上的分布特征。

学生在校外参与顶岗实习过程中应采用“双导师”制。即学生在企业参与顶岗实习时，既要接受校内教师的理论指导，还要接受企业导师的实践指导。企业导师应根据学生的实际情况让学生逐步参与到企业生产实践中，从而发现学生的问题并及时纠正。企业导师在实际项目中应起到引导作用，要循序渐进的加大学生实习工作的难度，从而锻炼学生工程造价的技能。实训过程中，学生潜移默化的与企业建立了感情，学生在获得技能的同时也获得了认同感和归属感。

如果工具变量的有效性条件得到满足，并且Y是关于X和D的线性函数，那么对于政策的顺从者来说，条件分位数处理效应θ^τ 可以通过如下加权分位数回归进行一致估计。

这里，是权重指数，它的计算公式为：

观察组治疗后全血高切黏度、全血低切黏度、血浆黏度、纤维蛋白原、血细胞比容较对照组明显降低,两组比较差异有统计学意义(P<0.05)。

根据观察到的我们可以先对倾向得分进行计算，然后代入到（5）式中就可以计算出再将代入到（4）式中就可以估计出θ^τ 。

（三）无条件内生QTE

到目前为止，许多应用研究都是基于条件QTE来估计分布效应，具体来说就是条件于控制变量X的效应。无条件QTE顾名思义估计的是无条件分布效应。尽管在线性假设条件下，条件和无条件的均值处理效应是一样的，但是在分位数下两者的处理效应是不一样的。举个年龄对收入影响的简单例子，无条件0.9分位指的是10%以内的高收入人群，条件于年龄的0.9分位指的是在不同年龄段中10%以内的高收入人群，它只是在不同的年龄段之中是最高10%的收入人群，并不一定是在所有人群中的高收入人群。当人们最终感兴趣的是无条件分布时，无条件QTE无疑是更合适的估计方式。对于政策制定者来说，有时候人们往往关注的是最低收入人群，而不是处于何种年龄段、何种教育水平的相对低收入人群。与条件内生QTE相比，无条件内生QTE在整个样本上加总了条件效应，因而函数形式是单维的（one-dimensional），而条件QTE的函数形式是多维的（multi-dimensional），因此其政策含义更容易传递给政策制定者。

与条件QTE中一样，我们定义Y¹ 和Y⁰ 分别代表个体在D=1和D=0时的结果变量值。无条件QTE可以通过一种直观的方式描述处理的分布影响。其表达形式如下：

这里的代表的是Y^d 的分位。与条件内生QTE一样，我们这里允许D是内生的，因果识别将通过工具变量来进行。当条件QTE工具变量的几个条件满足时，这里的无条件QTE也只能够识别出政策顺从者的处理效应，即：

这里是政策顺从者的Y^d 的分位被定义为无条件分位数处理效应，是因为影响结果变量的其他控制变量集X并没有包含在（7）式中。无条件QTE的估计并不是完全不使用X，而是在第一步回归时包含X变量，然后通过积分使得第二步回归时不再包含X。之所以仍然利用X主要有两个方面的考虑，一方面是为了使内生处理变量的因果识别假设更加合理，另一方面是为了提高估计精度。

尽管前面不论OLS估计还是2SLS估计都证实了大学教育显著的回报率，但是不论是OLS估计还是2SLS估计都只能够发现大学教育回报的均值效应，不能够反映分布效应。OLS容易低估教育回报率，2SLS估计又容易高估教育回报率，而且不论OLS估计还是2SLS估计都容易受到极端值（outliers）的影响。相对于OLS和2SLS来说，QTE的两个最大的优势在于：一是可以刻画结果变量的分布效应，二是因为通过最小化绝对偏移来进行参数估计，可以克服极端值的影响。

表2报告了大学教育对收入回报率的OLS估计，在引入了明瑟方程中最主要的几个控制变量之后，可以看到高等教育对收入的影响显著为正，这一结论不论是在所有样本还是在分成城乡户口、男女样本的情况下都是成立的。在所有样本中，大学教育总回报率为48.9%，由于大学教育年限一般为4年，因此大学教育年度回报率约为12.2%。当样本被分为农村户口和城镇户口之后，可以看到城镇户口大学教育回报率高于农村户口，前者大学教育总回报率为56.8%，后者为38.9%。当所有样本分成男女之后，女性样本的大学回报率明显高于男性样本，前者大学教育的总回报率为59.3%，后者为38.3%。

这里的计算公式为：

大型燃气联合循环电厂发电效率可以达到50%～60%，分布式热电冷联供系统总体效率可以达到70%～90%，而燃煤电厂机组发电效率仅为42%～47%。同时，燃气发电项目占地面积小，单位容量占地仅为燃煤火电厂的10%～30%。

但至目前为止，大多数文献关注的是教育回报的均值效应，而在评价一个政策的实际效果时，人们往往更关注的是政策的分布效应。这是因为对于政策实施的效果，人们往往关注的是政策对最低收入人群的影响，如果某一项政策能够更多地提高低收入人群的收入，即使它与另一项政策对收入影响的平均效应是一样的，该项政策也是更受欢迎的。传统的实证方法一般只能够估计均值效应，而分位数处理效应（quantile treatment effect, QTE）则能够估计政策的分布效应。当前人们越来越关注的是教育对收入分布的影响，这是因为教育（尤其是高等教育）的目的不仅仅在于为社会培养高素质人力资本，更在于为底层人民提供一个上升流动通道，进而促进社会公平。基于分位数回归（quantile regression）方法，张车伟（2006）和刘生龙（2008）① 刘生龙：《教育和经验对居民收入的影响》，《数量经济与技术经济研究》2008年第4期。利用不同的微观数据对教育回报的分布效应进行了估计，得出了完全相反的结论。张车伟（2006）的研究发现中国的教育回报率随着收入增加而增加，呈现教育回报率的“马太效应”，而刘生龙（2008）的研究则发现教育回报率随着收入的增加而降低，呈现教育回报率的“公平效应”。尽管张车伟（2006）和刘生龙（2008）对教育回报的分布效应进行了估计，但是由于他们所采用的是Koenker和Bassett （1978）② Koenker, R and Bassett, G.,“Regression Quantiles”，Econometrica , vol.46, 1978, pp.33-50.提出的经典分位数回归方法，该方法存在两处重要的缺陷：一是没有解决教育的内生性问题，二是假定标准误差是同方差（homoscedasticity）的，在估计教育回报的分布效应时这一假定明显不合理。为此，本文提出用新近的QTE框架来解决分位数回归模型中核心变量的内生性问题，对中国高等教育回报率的分布效应进行估计。

四、数据

本文的研究所使用的数据来自中国家庭动态跟踪调查（CFPS），该数据是北京大学社会调查中心实施的一项大规模的数据调查，研究包含CFPS2010年、2012年和2014年3轮的调查数据。CFPS样本覆盖25个省、市、自治区，代表了中国内地95%的人口，因此该数据具有很强的全国代表性。① 没有包含在样本中的大陆省份为内蒙古、海南、西藏、宁夏、青海和新疆。

本文主要检验高等教育对收入的分位数处理效应，并且以1999年大学教育扩招这样一个政策作为“自然实验”，检验高等教育对收入的因果影响。从前面的分析可以知道，1999年高等教育扩招，主要受到影响到人群是1981年以后出生的人群，为了尽量减少其他自然事件的干扰，我们选择1981年前后10年出生的人群，即1971—1990年期间出生的人群作为研究对象。这样，1971—1980年出生的人群作为本文的控制组较少地受到或者基本不会受到1999年大学教育扩招的影响，1981—1990年出生的人群作为本文的处理组更多地受到大学教育扩招的影响。由此，本文所选择的样本的年龄处于20—43岁之间。

此时，曾先生也失去了理智，他把背包扔到地上，然后向前扑倒在地上号叫。曾先生表示，当时没有考虑这种方式是否妥当，只是想控诉警方的作为，并向路人求助。

除了控制出生年龄范围，我们还对样本进行了如下选择和处理。首先，对于那些在校学生，由于不清楚他们工作之后的收入状况，因此在样本中进行了排除；其次，本文的被解释变量是对数收入，因此对收入缺失的样本进行了排除。为了保持收入在不同年份之间的可比性，按照不同年份的CPI将2012年和2014年的收入调整到2010年的可比价格。最后，一些控制变量缺失的样本我们也进行了排除。经过这样的清理之后，最终进入回归分析的样本为19213个，其中控制组样本为10027个，处理组样本为9186个。

其次是基于工具变量的两阶段最小二乘估计（2SLS）的教育回报率往往高于普通最小二乘估计（OLS）。比如说Chen and Hamori（2009）分别利用OLS和IV方法对中国城镇男性和女性居民的教育回报进行了测算，结果发现OLS测算的结果为男性8.06%，女性7.67%；而用IV估计出来的结果为男性12.61%，女性14.47%。Fang等（2012）⑪ Fang, H., Rizzo, J. A. Rozelle, S. and Zeckhauser, R. J.,“The Returns to Education in China: Evidence from the 1986 Compulsory Education Law”，NBER Working Paper No.18189, 2012. 也分别利用OLS和2SLS估计对中国的教育回报率进行了估计，OLS估计结果表明教育回报率为8.0%左右，而2SLS估计的结果则达到了20%以上。在克服了教育的内生性问题之后，2SLS估计结果往往高于OLS估计结果，说明用OLS估计的教育回报率存在一定程度的低估问题。

表1给出了相关变量的定义和描述性统计。从中可以看到，2010—2014年中国20—43岁之间获得大学教育的比重平均达到了19.4%，反映了高校扩招之后中国大学教育获得者比重迅速增加的事实。处理组大学教育获得者的比重显著高于控制组，尽管处理组人群的平均工作经验远远低于控制组人群，但是处理组人群的平均对数收入仍然显著高于控制组人群，在一定程度上反映了高等教育对收入的正向影响。从表1还可以看到，处理组和控制组人群除了性别比重上没有明显差别之外，在户口、民族和婚姻比重上都有显著不同。这就意味着仅仅比较控制组和处理组人群之间的收入差距并不一定就是大学教育对收入的因果影响，必须进行更加细致的实证检验。

表1 变量定义及描述性统计

表2 大学教育回报的OLS估计

五、实证结果及分析

（一）传统OLS估计与2SLS估计

当存在一个二元工具变量Z满足前面所述的工具变量有效性假设时， Frolich和Melly（2014）证明对于政策顺从者来说可以通过如下加权分位数回归方程进行估计：

尽管表2的OLS估计结果表明大学教育显著正向的回报率，但是很多文献都提到了教育的内生性问题。比如，教育的测量误差问题会导致其回报率容易被低估；不可观测的变量如内在的能力能够同时影响教育和收入，该变量的遗漏容易导致教育的回报率被高估；教育的符号效应也容易导致其回报率被低估。传统解决内生性的方法就是寻找合适的工具变量，通过2SLS估计来解决教育的内生性问题。

本文在这一部分采用传统的工具变量方法对中国的高等教育回报率进行参数估计。我们利用1999年高等教育扩招政策来设置工具变量Z，具体来说，本文的工具变量是一个二元变量，当个体出生在1981年以后时Z=1，反之Z=0。① 这是因为1999年高等教育扩招主要影响的是1981年之后出生的人群。表3的后面给出了第一阶段排除性F统计值估计值，可以看到都远远超过了10，因此工具变量是有效的。

表3 大学教育回报的2SLS估计

表3给出了大学教育回报的2SLS 估计，可以看到，在控制了表2中所提到的所有控制变量之后，高等教育回报率的2SLS估计普遍高于OLS估计。在所有样本下，高等教育总回报率达到了123.5%。还有与OLS估计结果不一样的地方是2SLS估计的农村高等教育回报率明显高于城镇样本，前者总回报率为189.5%，后者为70.1%。由于长期以来中国存在城乡二元经济结构问题，农村经济发展远远落后于城镇地区，农村居民的高等教育回报率远远高于城镇居民，这有着很强的政策含义，即扩大农村地区高等教育入学率可以有助于缩小城乡收入差距。

分成男女样本之后，女性样本的高等教育回报率仍然显著高于男性，前者为163.0%，后者为85.0%。由于在劳动力市场上女性是相对弱势的群体，提高女性的收入水平有助于缩小性别之间的收入差距。由于女性高等教育回报率高于男性，因此高等教育扩招对于降低性别不平等具有积极的意义。另外我们通过2010年的CFPS数据还可以看到，大学教育扩招之后，女性的大学入学率明显比男性增长得更快。具体来说，对于没有受到大学扩招影响，即出生于1976—1980年之间的人群来说，男性大学入学率为16.2%，女性为13.8%，女性在5%的显著性水平上低于男性。而对于受到大学扩招影响，即出生于1981—1986年之间的人群来说，男性大学入学率为22.9%，女性为22.3%，两者之间的差距在10%的显著性水平上都没有通过检验。这就意味着，高等教育扩招之后，尽管男女大学入学率都有所增加，但是女性明显增加得更快，使得女性在大学教育获得率上与男性的差距迅速缩小至0。

（二）条件QTE估计

原本黑暗狭小的走廊通道，在和天窗的邂逅下发生了奇妙的光影变化。通过天窗的设计，把控进入走廊的光线，每当阳光洒进天窗，就是一副光影交错的绝妙景象，如梦似幻。不同的走廊空间，可以通过不同的镂空形状形成不同的光影空间，在这样的空间里漫步，想必一定很浪漫。

表4 高等教育的条件QTE

我们主要基于Abadie等（2002）和Chernozhukov与Hansen (2005)① Chernozhukov, V., and Hansen, C.,“An IV Model of Quantile Treatment Effects”，Econometrica , vol.73, 2005,pp.245-261.所提出的条件QTE估计方法对方程（4）进行估计，估计结果见表4。对于所有样本来说，可以看到在0.1分位点上，高等教育的总回报率为96.1%；随着分位点上升，高等教育的回报率逐渐下降，在中位点上（即0.5分位点）高等教育的回报率为48.7%。在0.9分位点的上时，高等教育回报率进一步下降到39.7%。这就意味着对于低收入者而言高等教育回报率更高，随着收入水平的提高，高等教育回报率下降。最低收入者的高等教育回报率是最高收入者的2.4倍，说明高等教育对低收入者的收入增加作用更加明显，在保证低收入者与高收入者有同等入学机会的情况下，高等教育扩招有助于缩小低收入者与高收入者之间的收入差距。

表4还给出了分农村和城镇、男性和女性样本情况下高等教育回报率的分布效应。结果发现与所有样本的情况类似，即使在不同样本下，高等教育回报率都显示出随着收入的增加而下降的特点。这就意味着高等教育回报随着收入的增加而下降具有很强的稳健性，再一次证实高等教育对收入公平的正面影响。此外，根据表4还可以看到，即使在不同分位点上，农村户口居民的高等教育的回报率高于城镇户口，女性高等教育的回报率高于男性。由于在劳动力市场上，中国存在着很强的城乡二元结构和性别歧视，农村户口居民和女性都是相对弱势的群体。高等教育更多地提高了弱势群体的收入水平，很可能就是促进收入公平的重要机制之一。

这里，

而且地暖目前是全球公认的最舒适的采暖形式。冬季地面供35℃左右的温水，夏季地面采取20℃以上的冷水，进行地面调温，通过“低温采暖，高温制冷”达到节能目的。常年保证地面温度高于24℃，全年室温恒定在20℃～26℃，室内温度梯度接近理想温度梯度，室温分布均匀，全年无四季之差。

（三）无条件QTE估计

前面已经指出了无条件QTE估计的一些优点，即不会受到控制变量集X的改变而发生估计结果的变化。Frolich和Melly（2014）提出了无条件QTE的估计方法，作为与条件QTE估计值的比较，我们基于该方法对高等教育的无条件QTE也进行了估计。表5给出了高等教育回报的无条件内生QTE估计的结果。可以看到，与条件内生QTE估计结果比较类似，随着收入水平的提高，高等教育回报率明显下降。基于无条件QTE估计结果，在0.1分位点上，高等教育的回报率达到了124.0%。在0.5分位点上，高等教育的回报率下降至55.6%。在0.1分位点上，高等教育的回报率进一步下降至49.0%。当我们将样本分为城镇户口和农村户口、男性样本和女性样本之后，与条件QTE估计结果一样，农村户口的高等教育回报率在所有分位点上都高于城镇户口，女性样本高等教育回报率在所有分位点上都远远高于男性样本。这再次说明高等教育之所以有助于促进收入公平，是因为它更多地增加了农村户口和女性样本的收入，使得这些相对弱势群体的收入向与之对应的城镇户口和男性样本的收入趋同。

现阶段很多企业为降低管理成本，大多采取扁平化的管理方式，忽视了专业人力资源管理人员的重要性，造成人力资源管理岗位严重不足。同时，由于供求信息不对称等因素，导致企业在人力资源市场较难招聘到由丰富经验的人力资源从业人员。

不过需要注意的是，在城镇户口和男性样本中，虽然高等教育回报率在0.1、0.3、0.5、0.7分位上随着收入增加而下降，但是到了0.9分位后高等教育回报率明显上升，出现了高等教育回报率随着收入分布呈U型变化趋势。

（四）稳健性检验

这一部分主要针对前面的估计结果进行稳健性检验，具体来说，我们对控制变量和回归样本进行两种类型的精炼，用精炼样本进行高等教育的QTE估计，看看精炼样本下前面的估计结果会不会发生方向上的变化。精炼样本一方面将样本中教育水平为初中及以下的人群排除掉，这样做的原因是这一部分人根本没有参加高考的资格，也就是在本文中这部分样本是政策的从不接受者（never-takers），而无论是2SLS估计还是QTE估计最终的估计结果只是对政策的顺从者（compliers）有效，将never-takers从样本中排除不应该对实证结果产生实质性的影响。精炼样本另一方面将先前的样本压缩至1981年前后5年出生的人群，这样做的目的是为了保持控制组和处理组人群在年龄上更加接近，从而降低健康这样一个重要的人力资本对高等教育回报的影响。在对样本进行这样处理之后，我们发现先前的估计结果没有发生改变，说明本文的估计经得起稳健性检验。

表5 高等教育的无条件QTE

六、结论及政策含义

本文研究大学教育扩招之后高等教育对收入和收入分配的影响。前者关乎效率，即收入增长的问题，后者关乎公平的问题。效率和公平是经济社会发展中两个最重要的问题，虽然在过去30多年时间里，中国的经济发展取得了巨大的成就，但是也付出了巨大的代价，其中的一个代价就是收入差距迅速扩大，成为巨大的社会安全隐患。本文的研究同时涉及效率和公平，因此既具有经济学上的理论意义，同时也具有很强的社会现实意义。

有毒物质主要通过吸入、摄取、皮肤接触等方式进入人体，为确保制版过程中的安全，铜版画工作室通常设置详细的操作规程，要求制作者操作时严格遵守。如制版时必须穿戴手套、橡胶围裙或护目镜、防尘口罩，腐蚀时必须打开通风设备等。遵守这些规程，可以有效保护我们的健康与安全。

我们以1999年高等教育扩招这样一个自然实验作为工具变量对高等教育回报率进行估计，在估计之前我们还对工具变量的有效性进行了严格的论证，结果证实本文的工具变量是有效的。OLS和2SLS估计结果均表明高等教育回报率显著为正，OLS对高等教育回报率的估计存在一定程度的低估，2SLS对高等教育回报率的估计存在一定程度的高估。接下来，我们分别利用Abadie等（2002）提出的条件QTE方法和Frolich与Melly（2014）提出的无条件QTE估计方法对高等教育回报的条件分布进行估计。研究的结果表明在各个分位上，高等教育回报都显著为正，随着收入水平的提高，高等教育回报率下降。高等教育回报率显著为正意味着高等教育这样一个重要的人力资本投资有助于提高经济效率。此外，高等教育更多地促进低收入者收入增长，有助于促使低收入者收入向中等和高收入者收敛，因此有助于促进公平的收入分配。也就是说本文的结论证明高等教育可以同时有利于经济效率和社会公平的改进，这在一定程度上对高等教育扩招是一种肯定。

式中,p*是给定有功功率,q*是给定无功功率,pk+1是预测k+1时刻有功功率,qk+1是预测k+1时刻无功功率。第一部分旨在跟踪有功功率和无功功率,降低功率纹波,第二部分的作用是降低开关频率,λ1是开关动作函数在式(11)中的放大倍数,是一个定值。λ1越大,则开关动作函数在代价函数中的倚重越大,开关频率降低得也就更加明显,但是随着第二部分作用效果的增加,功率的跟踪效果也会逐渐下降,因此,应尽量避免开关频率下降过多。

我们还比较了条件QTE和无条件QTE估计，结果发现条件QTE估计的条件中值与OLS估计非常接近，无条件QTE估计的条件中值介于OLS和2SLS估计之间，而且无论是条件QTE还是无条件QTE，高等教育回报在收入分布上都存在显著的异质性，这是OLS和2SLS估计所无法捕捉的。此外，我们还比较了高等教育回报的城乡差异和性别差异，结果发现农村户口样本高等教育回报率高于城镇户口，女性样本高等教育回报率高于男性样本。由于农村户籍人口和女性在劳动力市场上都是相对弱势的群体，高等教育回报的公平效应很可能在于更多地提高了这些相对弱势群体的收入水平。

本文的研究具有明显的经济社会政策含义。首先国家应继续扩大农村地区大学生录取比例，为具备高中学业毕业者创造多元大学录取途径，如探索基于统一高考和高中学业水平考试成绩、参考综合素质评价的多元录取机制。同时继续加大对农村和贫困家庭大学生的资助力度，提供多样化的勤工俭学渠道，使他们不仅上得了大学，还能上得起大学。“十三五”时期我国进入高等教育普及化阶段，即到2020年高等教育毛入学率从2015年的40%提高至50%左右，① 《国家教育事业发展“十三五”规划》，2017年1月。平均每年提高两个百分点。由于农村样本的大学教育回报率高于城镇样本，让更多的农村家庭子女获得大学教育有助于提高农村家庭收入，缩小城乡收入差距。1999年高等教育扩招之后，不论城镇家庭还是农村家庭子女的大学获得率都持续上升，但是在适龄人口大学入学率上，城镇户口的入学率远远高于农村户口。根据2010年CFPS数据，我们可以比较1976—1985年之间不同出生户口的大学获得率。为了降低农村子弟因为考上大学之后户口改变所导致的偏差，我们比较12岁时户口分城镇和农村的大学获得率。通过计算发现，1976—1980年城镇和农村户口的大学获得率分别是42.3%和8.8%，城镇户口的大学获得率远远高于农村户口的大学获得率；1981—1985年城镇和农村户口大学获得率分别是56.4%和12.7%，城镇户口的大学获得率仍然远远高于农村户口的大学获得率。也就是说，大学扩招之后，尽管城镇和农村适龄人群大学教育获得率都上升了，但是在大学教育入学率上，城乡之间的差异非但没有缩小，反而有所扩大。大幅度提高农村适龄人群大学教育获得率，不仅可以提高农村地区居民的收入，还有助于缩小城乡收入差距，对当前中国政府正在实施的“精准扶贫”也具有重要的政策含义，即帮助更多的贫困家庭子女进入高等教育（包括高等职业教育），彻底告别贫困。

本文的第二个政策建议是适时将义务教育年限扩大到12年，涵盖高中教育。同时继续免除公办普通高中建档立卡的家庭经济困难学生（含非建档立卡的家庭经济困难残疾学生、农村低保家庭学生、农村特困救助供养学生）的学杂费，提供住宿费、伙食补贴费、交通补贴费等，使他们不仅能够上得了高中，还能上得起高中。农村户籍适龄人口大学教育获得率严重低于城镇地区，一个重要的原因是很多农村家庭子女在初中毕业之后就不再继续接受教育，成为大学教育的never-takers。农村子女之所以初中毕业就参加工作，一个重要原因就是家庭经济困难，而城镇地区因家庭经济问题上不起高中的比例则要少得多。将义务教育年限扩大到12年，那么几乎所有的农村家庭子女都不会因为经济困难而无法接受高中教育，这样将会有更多的农村家庭子女与城镇子女一起参加高考，农村适龄人口大学入学率自然也就会上升。将义务教育年限扩大到12年，除了能够扩大农村地区大学教育获得率之外，还能够提高农村地区平均受教育年限，从长远来看，农村地区也将会更多地从人力资本提高中获益。

总之，社会主义现代化本质上是人的现代化，而人的现代化本质上是增加对人力资本（特别是教育）的投入，提高人力资本水平（特别是高中阶段教育、高等教育），进而提高和发挥人的发展能力。教育公平是最大的公平，也是最有效率的公平。实施“有教无类”的措施，让不同的人享有接受教育的机会，特别是对农村、贫困、边远地区实行12年义务教育（解决上不了学的问题），资助家庭困难大学生帮扶力度（解决上不起学的问题），不仅有利于促进经济效率，而且也有助于促进社会公平。

〔中图分类号〕 G649.2；F124.7

〔文献标识码〕 A

〔文章编号〕 1000-7326（2019）04-0072-13

*本文系全国哲学社会科学规划办公室高端智库项目（20155010298）和清华大学自主科研计划项目“供给侧结构性改革：实证研究与公共政策”（2017THZWYY03）的阶段性成果。

作者简介刘生龙，清华大学公共管理学院副教授、清华大学国情研究院副研究员；胡鞍钢，清华大学国情研究院院长、公共管理学院教授（北京，100084）。

责任编辑：张超

标签：高校扩招论文; 生产率效应论文; 公平效应论文; 高等教育回报论文; QTE方法论文; 清华大学公共管理学院论文; 清华大学国情研究院论文;