健康人力资本与经济增长：来自中国省级数据的证据_人力资本论文

健康人力资本与经济增长：中国分省数据证据，本文主要内容关键词为：经济增长论文,中国论文,人力资本论文,证据论文,数据论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

一、引言

近几十年来，随着经济发展和社会进步，健康在世界各国的国民经济和人民生活中所占的比重、规模及其增长速度日益引人注目。2002年美国用于卫生保健方面的开支占到GDP的14％，这一数字相当于中国当年整个GDP的大小；在加拿大，这一开支也占到GDP的10％(Fuchs,2002)。虽然中国这一指标较低，但在过去几年中也在不断上升，占GDP的份额已由1980年的3.17％增至2002年的5.42％，绝对数额高达5679.65亿元。人均卫生总费用① 由过去的14.51元升至442.6元，增加了近30倍②(《2004年中国卫生统计提要》，第30页)。但随着社会经济不断发展，人口转型问题的出现以及环境污染问题的加剧，各国卫生体系和国民健康正面临着越来越多的挑战。在美国等福利国家，公共卫生事业和体制存在的问题引起政府、学术界和选民各方的关注和讨论；在发展中国家中国，突发性公共卫生事件也日趋增多，一些已经绝迹的传染病死灰复燃，环境污染和灾害不断增加，医疗卫生体制改革陷入困境，这些涉及卫生健康领域的问题造成的影响日渐凸显，成为我国政府和公众高度关注的现实问题。健康作为人力资本的重要组成部分(Grossman,1972)，它的状况及变动对一国经济增长的影响不容忽视。对健康与经济增长关系的定量研究已显得越来越重要，具有重要的经济和社会价值。

本文运用一组面板数据，试图在省级水平上考察健康与经济增长之间的经验关系。我采用两种健康度量指标，使用pooled-OLS和GLS回归方法，验证在我国健康与经济增长之间的关联。本文的经验结果表明，在我国(1)健康与经济增长之间存在显著的正向关联，这与大多数国内外相关文献相一致；(2)作为健康指数的构成因子，卫生服务与经济增长存在着正向关联。

国外大量的实证研究揭示了健康与经济增长之间的正向关系。Mayer(2001)提供了健康与经济增长存在时间跨度为30年的因果关联的有力证据，并得出健康对人均收入作用的弹性为0.8～1.5。Arora(2001)利用发达国家近200年增长的历史数据回归发现，长期经济增长的30～40％可以用健康来解释。Bhargava,Jamison,Lau and Murray(2001)则发现健康在低收入国家对经济增长有促进作用，但在发达国家其作用微乎其微。上述这些研究大都针对其本国的情形或者分析比较国家间差异，而人们可能感兴趣的是，在中国健康与经济增长之间是否呈现与上述发现类似的经验关系？对此，国内已经有少量文献，且大都使用微观数据考察健康对工资等收入的影响(张车伟，2003；魏众，2004；Liu et al.,2003)，但三位作者的分析结论与本文的发现是相互支持的。

本文的主要贡献在于：为揭示我国人口健康与经济增长之间的经验关系做了初步的尝试。不仅如此，我们还在考察该关系时，明确控制了教育和工作经验等其他主要人力资本因素的影响，而这在研究中国省级水平上该问题的文献中尚属首次。

本文以下的结构安排为：第二部分介绍并扩展含人力资本工资方程的生产函数模型；第三部分首先介绍我们采用的计量模型，然后对数据来源做具体说明，对本文所用到的主要概念和指标做出定义，并通过统计数据分别描述我国人口健康的基本特征；第四部分汇报回归分析的结果；最后一部分对全文进行总结。

二、理论模型

新古典增长理论及随后发展的增长理论都将人力资本视作经济增长的一大源泉。Mankiw,Romer and Weil(1992)较早将人力资本引入经济增长的实证分析，但采用将人力资本从索洛剩余中分离出来的间接估计方法。Bloom,Canning and Sevilla(以下简称BCS)(2001，2004)在前者基础上，把Mincer工资方程模型与总产出函数结合起来，在研究经济增长驱动因素的同时直接估计各种人力资本在其中的贡献。这样做还能够将由此得到的人力资本贡献估计与微观劳动经济学研究中的相应结果进行比较分析。

经典的总产出函数形式为柯布—道格拉斯模型，该函数隐含假定要素的边际回报率将趋于下降，由于人力资本的回报率在不同国家和地区之间相对稳定，③ 且不随国民收入和劳动力受教育年限的变化而发生系统的改变(Bils and Klenow,2000)，因而在将教育、经验和健康人力资本引入模型时，采用指数型的函数形式，④ 与物质资本和简单劳动的函数形式不同。这种含人力资本的新增长理论扩充模型的一般表达式为：

其中，分别指代教育、经验和健康人力资本。但BCS不论是在理论推导还是经验回归时，都把预期寿命作为反映健康的指标。尽管预期寿命高往往反映了健康状况好和发病率低，通常被用来作为健康的度量指标，但它主要反映的是健康在死亡(mortality)维度上的情形，其他维度的情形如发病、失能和不适(mobidity、disability和discomfort)等则未充分反映(Evans et al,1994)；另外，预期寿命反映的是一生人力资本存量的时间跨度，无法具体反映人作为劳动力这一阶段的人力资本存量的时间跨度。实际上，尽管健康与生产率和经济增长之间存在可靠的关联，但如果考虑到人口老龄化造成的健康人力资本折旧，这种用预期寿命作为健康指标的关联仍会在某个时点后失去约束力(Rico,2005)。

本文在健康的度量上，既采用BCS(2001)使用的预期寿命指标，也试图按照Rico(2005)的方法生成一个健康指数，⑤ 来克服前一种指标存在的上述问题，并对两种指标得到的结果作相互比较。这样一来，相对于BCS(2001)而言，可以更准确地衡量健康人力资本对经济增长的作用；同时，由于引入了平均受教育年限和平均工作经验年限等指标，比Rico。(2005)更好地分离出健康人力资本本身对经济增长的影响。

三、计量模型与数据说明

以前面的理论模型为基础，由公式(1)可推得其对数值形式的方程式：

同BCS(2001)相比，本文在模型设定上没有引入度量全要素生产率(TFP)国别水平的两个自变量指标——政治制度质量和疆域内热带土地面积，⑦ 但增加了健康度量的维度，使我们对健康人力资本对生产率和经济增长的效应的估计更精确些，这一点跟Rico(2005)类似；而与Rico(2005)不同的是将数据由国家层面深化至省级层面，并且将平均工作经验年限变量引入模型，比仅控制教育控制更多的非健康人力资本的作用，使我们对健康人力资本的作用估计更准确。需要注明一点，受数据量的限制以及进行增长形式回归的需要，我们未能采用固定效应和随机效应模型，并将滞后一期的资本、劳动等解释变量作为工具变量引入以克服内生性问题，但通过相同省份逐年差分，然后使用pooled-OLS和GLS回归的方法，我们可以在一定程度上揭示健康和经济增长的关联。这一点同Rico(2005)是一致的。

本文所收集的数据根据其时序特征分为三类：第一类为普查数据，主要指标包括，地区总人口数、6岁及6岁以上人口、15岁及15岁以上人口、具有各种文化程度的人口数(含半文盲、文盲人口数)以及地区分年龄人口数等。受政府在人口数据公布方面保密制度及政策的制约(Banister and Zhang,2005; Lavely,2003)，无法得到上述所有指标在第一次和第二次人口普查中的分省数据，主要收集了第三次到第五次人口普查的分省数据，⑧ 这部分数据是本文数据集的“短边”。第四次人口普查搜集了自1989年1月1日至1990年6月30日一年半的数据。因此，在各种死亡人口数据集里会出现1989和1990两种对第四次人口普查的时点标识，前者如路磊等(1994)，后者如游允中、郑晓瑛(2005)。由于标记1989年学者所测算的人口数据(婴儿死亡率和预期寿命)只有这一个时点而无其他时点的数据，而其他学者测算的数据因口径和测算方法不同而无法与之简单并接，加上学者们通常采用1990标识，这也使得这一数据测算序列更完整，所以本文也标记为1990，以便在回归中使用口径一致时点最多的数据。

第二类为年度数据，涵盖30个省、市、自治区(不包括西藏)从1977年到2002年的多项社会经济变量，包括：地区GDP(按1952年不变价计算)、从业人员、年底总人口、非农业人口、每万人床位数和每万人医生数。这部分数据源自中国统计出版社1999年版《新中国五十年统计资料汇编》一书。数据起点的选择受制于“短边”数据的可得性。按照增长经验文献的通常做法，计算各时点的实际GDP和不变价格资本及劳动等指标的对数值，然后分别做差分求得增加值，即可用于回归估计。但对含有普查数据的回归来说，这样做存在两个问题：一、由于社会或经济普查在各国一般每10年进行一次，经济增长研究又多使用宏观数据，因此样本量比较小；二、由于10年的跨度较大，因此，数据度量误差可能会比一般研究更严重些。为减弱两个问题带来的不利，本文对年度数据采取了以时点为中心向两侧各延伸两年取平均⑨ 的做法，这样做既可以减少度量误差，也能够更充分的利用数据信息。⑩ 此外，健康指数的一个因子—卷烟销量(11) 的数据取自《中国烟草年鉴》各卷(共六卷)。这部分数据缺失较为严重，基本都没有1981年的数据，为充分利用数据所带来的信息，并便于在后面构建健康指数，本文对省内数据进行平滑内推和外推，即，先对一省已有数据的对数值做OLS回归，(12) 并将1981年的预测值作为卷烟销量在当年的数据，这样做虽然比较粗糙，但也部分克服了因数据缺失而可能造成有效样本量进一步变小的问题。

第三类为引用数据，一共有三组。其一是资本数据，见本文标题说明。当然，本文还在其基础上运用相同的永续盘存法将各省区市(13) 不变价格的资本存量进一步测算至2002年。其二是环境污染系列指标，数据得自中科院地理与资源所的中国自然资源数据库，包括各地区三次人口普查时期(14) 的废气排放总量、废水排放总量、工业固体废物产生总量和二氧化硫排放量。其三是健康死亡率维度的系列指标。包括预期寿命、5岁以下儿童死亡率。前者主要得自(Banister and Zhang,2005)(15)，后者引自郑晓瑛(2005)。下表1和表2为现有已公布的各种分省预期寿命和5岁以下儿童死亡率数据的统计描述：

注：表格的每个数据栏对应的行标明预期寿命数据的来源，列为所选数据年份。栏中数字为相应来源和年份预期寿命的均值，括号内数字为标准差。*表示《中国人口死亡数据集》1975年只有男性和女性预期寿命的原始数据，表中数字为分性别预期寿命数据按人口性别比的加权平均后求得。——表示该时点无数据。

资料来源：中国卫生统计年鉴(2005)；中国人口死亡数据集；中国人口的死亡和健康；Banister and Zhang(2005)。

注：除考察指标项目不同，为5岁以下儿童死亡率外，其余同上。

资料来源：同上。

从表1我们可以看出，大部分的数据残缺不全，只有Banister and Zhang(2005)覆盖了上述5个时点。尽管如此，各数据集在自己有限的数据时点上仍体现了一定的规律。首先，平均预期寿命随时间推移而逐渐提高，如：《中国卫生统计年鉴(2005)》中的数据显示，我国人口平均预期寿命从1990年的68.1岁增至2000年的71.24岁，Banister和Zhang(2005)数据较详细地反映了我国人口平均预期寿命不断延长的演变过程。对同一年份做横向比较，发现预期寿命不论是均值还是标准差都很接近，说明选用预期寿命作为健康的指标变量是可取的。

表2是健康指数的又一个指标因子—5岁以下儿童死亡率—的统计描述。横比发现，5岁以下儿童死亡率的平均值在不同数据集间存在一定差异，这种差异趋于支持婴幼儿死亡率存在低估的判断(Banister,1987；游允中、郑晓瑛，2005)，因为死亡的不祥特性使得人们不可能倾向于夸大和多报，因而较大的出入更可能是由漏报或瞒报所致。当然从中还可以看到，除了Banister and Zhang(2005)数据显示1995年的轻微反弹外，(16) 死亡率随着经济增长和社会发展有着下降的总趋势。Banister and Zhang(2005)认为5岁以下儿童死亡率低估主要是由婴儿死亡率的低估造成的，其中1～4岁的儿童死亡率相对准确，在经验研究中，可以用它作为5岁以下儿童死亡率的近似替代指标。

下面我们对部分指标做进一步说明。首先来看平均受教育年限，它是教育人力资本存量的常用度量指标，反映一个地区教育的发展程度。常用公式为：

平均受教育年限=∑(某种文化程度人数占6岁及以上总人数的比重×对应的受教育年限)。

受教育年限的一种常见定义为：文盲=0，半文盲、扫盲班及不识字或识字很少=0.5，小学=6，初中=9，高中=12，中专=14，大专及以上=16.92，大专=15，大学=16，研究生=19.75，硕士=19，博士=22，公式中研究生受教育年限的算法为(19*3+22)/4=19.75，大专以上则为(15*3+16*6+19*3+22)/13=16.92。

其次是平均工作经验年限，即人作为劳动力的时间。工作经验的积累能够提高劳动生产率和工资等回报，它通常也被视为人力资本的一部分。为便于比较，平均工作经验年限的计算方法与BCS(2001)保持一致，具体做法详见BCS(2001)，此处不再重述。(17)

更准确地估计健康人力资本对生产率和经济增长的作用，既需要控制非健康人力资本的作用，还需要完善对健康的度量。与Rico(2005)相似，本文使用平均卷烟销量、非农人口比重、人均污染物排放量、1～4岁儿童死亡率、预期寿命、每万人床位数和每万人医生数等指标，按同等权重加总构造一个序数型的健康指数，这样做既有相关经验文献的方法原理的支持，又便于进行对比分析。上述指标的属类和引入指数的原因也不再赘述，详见Rico(2005)一文。健康指数的生成办法是：分别对上述指标在每个时点对省份进行排序，然后将同组内的指标排序值按相同权重加权平均得到生活方式、环境状况和卫生服务在特定时点的序数值，再对生活方式、环境状况和卫生服务的排序值按相同权重加权平均得到特定时点的健康指数值。注意：在排序中，平均卷烟销量、人均污染物排放量和1-4岁儿童死亡率等对健康有害的因素按从小到大排列次序，其余因素则是值越大位次越靠前。(18)

表3为上述各变量指标的统计描述，我们的数据结构是一个平衡的面板数据，(19) 由于一些变量存在数量不等的数据缺失或遗漏，各个变量的样本数并不完全一致。这里的样本数是以省份—年份为单位计算的。健康指数数据缺失较多，占到样本总数的8.04％。考察可知，数据在3个时点和社会经济不同发展水平的省份分布基本分散，不存在系统性偏误。

四、回归结果

本部分将运用pooled-OLS和GLS两类模型对健康与经济增长之间关系进行回归分析。下列两表列出了引入健康人力资本时生产函数的回归结果，分别使用的是pooled-OLS和GLS的估计方法，下面我们对这些结果进行归纳和简要的讨论。

(1)健康对经济增长有显著的促进作用。预期寿命越长，经济增长率越高。健康指数更是如此。而且这种同方向变动的关系在表4和表5的所有回归方程中均呈现出来，这与许多已有文献的研究发现是一致的。Floud et al.(1991)和Fogel(1994)等从不同方面验证都得到了类似的结果。与BCS(2001)相比，预期寿命的显著性和系数值都稍高一些，Rico(2005)对预期寿命作用的估计都不显著，且符号有正有负，(20) 本文的结果相对更稳健一些。

注：实际GDP、资本、人口、从业人员采用对数值的差分形式，其余变量为增长率形式。省际长期全要素生产率趋同，参见(Rico,2005)。括号内的数字为稳健性(robust)标准误差。双尾检验的显著水平1％、5％和10％分别由***、**和*表示。

资料来源：见上节正文中的数据说明。

(2)实物资本越雄厚的地区，经济增长越强劲，而且资本的贡献率与国家层面上的经验估计很接近，在不同模型之间相对变化也不大。这可能是因为我国实物资本相对稀缺的资源禀赋所导致的。

(3)人口多的地区，其经济增长也相对快一些，但其贡献率与国际平均水平相比偏低。这跟实际看到的现象也是一致的。与人口密度相对高的东部相比，西部的经济增长也缓慢一些。

(4)教育和工作经验等非健康人力资本对经济增长有很显著的推动作用，这与BCS(2001)和Rico(2005)的研究也是基本一致的。不同之处在于，本文的估计值更高，这可能与指标测算时因口径等问题使指标被低估，因而对经济增长率的作用强度的估计有些偏高。工作经验年限的平方项基本不显著，这与多数相关文献也是相似的。

注意到回归中未引入地理虚拟变量(如：东中西部)和年份虚拟变量。这一问题在表5中隐含得到了处理。表5使用的GLS方法通过设定，可以处理面板数据中样本单位存在异质性且横截面上可能存在关联的问题。而且该模型假定数据不存在自相关问题。在前面的数据说明中已提到，我们的增长数据基本不存在此问题(Islam,1995)。因此本文数据满足使用GLS条件，并且隐含地部分解决了虚拟变量的问题。使用从业人员作为劳动力度量指标时，除从业人员不显著外，结果基本一致。把健康指数分解为三个分指标(生活方式、环境状况和卫生服务)列入回归，发现它们是联合显著的，这既可能是由于三者间可能存在一定的关联，也可能说明这三者对于健康来说都无法偏废。

需要提到的是，由于健康能够保证持续有效率的劳动力供应且可通过生命周期的延长而增强人们受教育的积极性，从而有利于经济增长；同时，经济持续增长能够带来包括卫生在内的各项社会事业的发展，同时人们收入水平的提高也有利于增加其卫生保健方面的开支，进而促进健康，另外，污染增加等因素则会损害健康。因此，本文内生性问题是存在的。进一步的研究可以尝试寻求适当的工具变量切断增长对健康的反向因果关联。在这方面，有关文献也只是提出使用国土面积处于热带区域的比重或地理维度(离开赤道的距离)作为工具变量的思路。如果数据时点再多一些，还可以考虑使用解释变量滞后期增长率值或水平值作为健康的工具变量。此外，还可将预期寿命、儿童死亡率、受教育年限以及工作经验按性别分解后放入回归模型，考察不同指标对经济增长的影响在两性之间有否不同。由于本文样本量的限制，引入上述多项指标以后，模型存在较严重的多重共线性，因而此处不再列示其结果。

五、结论

过去20多年里，我国经济增长强劲，对于人口健康在其中的贡献有多大，长期以来却缺乏足够多的定量分析。Liu et al.(2003)对此做了可贵的尝试，但作者使用的是家庭户数据。本文使用我国省级面板数据，对在我国健康人力资本与经济增长间关系问题作了较深入的研究。我们发现，在我国健康人力资本与经济增长之间有显著的正向关联，预期寿命每延长1岁，GDP增长率相应提高1.06-1.22％；而另一度量指标健康指数对经济增长的弹性约为0.08。当前时期我国比较突出的社会问题之一是人们普遍反映的“看病难看病贵”、“有病不就医不住院”现象。这一问题得不到解决，必将影响我国人口总体的健康状况，进而在长期不利于经济增长和发展。另外，我们也发现，受教育程度和工作经验同经济增长之间呈显著的正向关系，平均受教育年限和工作经验年限每提高1年，GDP增长率分别提速1.2％和2-3％。由此可见，实现经济长期可持续增长，还需要政府进一步采取措施，加大教育投入、提高人口文化程度，完善下岗再就业制度，减少因失业问题带来的潜在损失。

注释：

①该数字系按当年价格计算。

②即使按照2003年中国统计年鉴公布的GDP指数进行平减处理，2002年人均卫生总费用仍是1980年的4倍多。

③Krueger and Lindahl(2000)给出了一个教育回报呈倒U型的证据。

④MRW(1992)对人力资本也采用指数型的表示，只不过未明确将人力资本加以分离。

⑤该指数是根据欧洲公共卫生委员会对健康的定义建立起来的，即一个人口的健康是由卫生服务、社会经济条件、生活方式和环境因素决定的。作者这样做是为了弥补预期寿命指标的不足。

⑥西方学者在计算劳动时还考虑失业率，但在本文所研究的时期内，我国特殊的经济体制使劳动力一直由计划分配参与劳动，劳动力市场化直到近10年多才加以推行，但即使如此，政府仍力图通过下岗再就业等形式维持较低的失业率(3.1％～4.6％)。本文将使用总人口和从业人员两种指标来度量劳动。

⑦国内省际之间的政治制度质量差异远小于国家间差异，疆域内热带土地面积也与国际差异比起来较不显著。Rico (2005)在差异较大的国家层面数据上这么做，本文在差异较小的国内数据基础上这么做似乎也不算有失合理了。

⑧这方面文献的样本多为三个时点，见BCS(2001，2004)和Rico(2005)。

⑨直接用时点数据回归得到的结果与其基本一致，只是非健康解释变量显著性比较低，感兴趣的读者可以来信索取。

⑩实际上，由于经济在绝大部分年份里是在增长的，因此，该做法使得某个时点后两年在平均值中分量比前两年大，相当于使数据实际年份后移，这样众多普查时点数据客观上成为前定变量值，在回归中对它们的作用的估计的内生性问题有所减弱。而且这时相邻两个时点最近数据间隔为5～6年，基本不会存在序列相关(Islam,1995)。

(11)Rico(2005)使用的是15岁以上人均酒的消费量，我国省级水平上直到1996年方有分城乡的该项数据(见《中国糖酒年鉴》，2003)。由于该指标代表健康在生活方式维度上的度量，考虑到数据可得性，本文选取了与之最接近的烟的人均销量作为替代指标。

(12)此外还尝试了以样本原数据值为基础的OLS回归，由于健康指数为排序指数(ranking data)，两种做法在后面回归时效果是一致的，本文采用了样本对数值形式的结果。

(13)仿原文，四川和重庆合并计算。文章以下部分情况同此。

(14)实际上，该数据为年度数据。由于在回归中，受普查数据的制约，该指标非普查年份的数据未进入回归，因此只引入对应时点的数据。

(15)张晓波提供了1975、1981、1990、1995和2000年的预期寿命数据，但因1975年缺乏受教育程度和工作经验数据，剩下1981、1990、1995和2000年，数据虽全，但作为增长(growth)而非水平(level)回归，1995年数据放入作差，使差分的增长率含义不明确，因为等时隔(10年)或近似等时隔时，差分即为增长率的倍数(10倍)。另外，张晓波在其文中承认1995年数据因属1％抽样调查而误差较大，且婴幼儿死亡率低估较严重，预期寿命估计也因而存在较大的偏差。所以，不将其列入回归。含1995年数据回归的结果可向作者索取。

(16)从数据描述样本量可看到95年抽样调查只有24个省份有数据，由于人口抽样调查不采取与一省总人口同比例的方法抽取，因此，这种反弹也可能是由于抽样误差引起的，尽管也不能完全排除儿童死亡率回升的可能。

(17)由于缺乏省级水平上分年龄的受教育程度的数据，在计算中存在近似和简化。但对结果无根本影响。

(18)Rico(2005)采用的是相同权重，这可能是由于生活方式、环境状况和卫生服务没有明显主次之分的缘故。

(19)三个时点为1981、1990、2000，大体等间距。

(20)这也是作者构建健康指数的一个原因。

标签：人力资本论文; 死亡率论文; 经济增长论文; 经济论文; 回归模型论文; 人口问题论文; 工作经验论文; 中国人口论文;

健康人力资本与经济增长：来自中国省级数据的证据_人力资本论文

猜你喜欢