经济增长实证研究中的内生学_面板数据论文

经济增长实证研究中的内生性,本文主要内容关键词为:经济增长论文,生性论文,实证研究论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

经济增长是经济学界一个古老而又常新的话题。早在两百多年前,亚当·斯密就曾着力阐述劳动分工和资本积累对于长期经济增长的重要性。上世纪五、六十年代,索洛—斯旺模型借助于简单的新古典生产函数,为经济增长理论提供了一个简洁的分析框架,拉姆齐—卡斯—库普曼斯模型则进一步将动态优化方法引入增长模型,推动了新古典增长模型的发展和大量实证研究文献的涌现(如增长核算等)。上世纪八、九十年代以来,D-S模型引发的“第二次垄断竞争革命”(理论)、主要经济体摆脱“滞胀”步入科网信息技术等引领的新一轮经济增长(现实)、经济数据的完善和计量手段的发展(方法)等,重新点燃了学术界对经济增长理论和实证分析的兴趣,涌现出了大量的新经济增长理论文献(如Romer,1986;Lucas,1988)和运用新的理论与方法的实证研究(如“收敛”问题、经济增长的影响因素等)。

有鉴于此,本文拟结合国外经济学界有关经济增长的实证研究文献,对经验研究和计量模型中涉及的“内生性”问题进行综述,以期为中国经济增长的实证研究提供启发和参考。在国外关于经济增长的实证研究中,早期文献的关注重点主要是“收敛”问题,尤其是“β收敛”或“条件收敛”问题。后来的大量文献则是对经济增长的各类影响因素,如政治制度、收入分配、国际贸易、金融市场、地理环境和社会习俗等进行经验分析。基于以上考虑,本文采用如下结构安排:第二部分主要结合“收敛”等问题,探讨经济增长实证研究中最常遇到的“内生性”来源,包括遗漏变量偏误、测度误差、因果联立偏误和样本选择偏误等;第三部分旨在探讨解决或克服“内生性”的建模策略和估计方法,拟结合经济增长影响因素的实证研究文献,探讨实证研究中为克服或缓解“内生性”而经常采用的工具变量法,特别是动态面板数据模型等;最后一部分是简短的评论。

二、内生性的来源

在经济增长的实证研究中,不论是“收敛”问题,还是关于经济增长影响因素的分析,多多少少都会遇到“内生性”问题。不妨以如下回归方程为例(Brock & Durlauf,2001)

(一)遗漏变量偏误

遗漏变量指的是解释变量向量中遗漏了能够对被解释变量产生影响的某些变量,这是经济增长实证分析中最常碰到的情形之一。若遗漏变量与解释变量不相关,那么不会影响估计结果的一致性,但会影响其有效性;更严重也是更常见的是:遗漏变量与解释变量相关,从而产生内生性问题,导致OLS估计的不一致性。例如,若真实的变量关系为

则方程(3)遗漏了变量w,那么遗漏变量w就进入到误差项v当中(即v=γw+u)。如果遗漏变量w与解释变量x相关,则误差项到就会与解释变量x相关,进而造成系数β的OLS估计是有偏且不一致的。

在实证研究文献中,若经济增长的某些影响因素容易被忽略或难以测量,且这些因素不随时间而变,同时又和其他影响因素相关,则可将这些因素视为固定效应,利用面板数据模型,通过一阶差分或固定效应变换解决遗漏变量偏误问题。以简单的面板数据模型为例

除了一阶差分,还可以通过引入虚拟变量,来缓解遗漏变量的影响。如Islam(1995)把初始效率视为不随时间变化的固定效应,并通过虚拟变量最小二乘法(LSDV)去除固定效应、得到一致性估计。不过,Griliches & Mairesse(1995)指出,引入虚拟变量不仅容易降低估计的效率,而且往往会引起测度误差问题。目前,在大多数经济增长实证研究文献中,对此类问题的处理方法是采用工具变量进行估计,本文将在后文中着重加以探讨。

(二)测度误差

在经济增长的实证研究中,多数探讨“条件收敛”的实证文献都涉及测度误差问题。一方面,统计口径和数据质量的差异难以避免,另一方面,不少变量难以准确测度甚至难以量化,不得不采用代理变量。因此,不论是真实变量本身,还是真实变量与代理变量之间,通常都会存在测度误差,并进入回归方程的误差项,造成内生性问题。例如,Heston & Summers(1996)指出,实证研究通常以人均GDP代替劳动者的人均GDP,从而产生测度误差;Dowrick & Quiggin(1997)分析了测度误差的根源,并对价格指数如何影响“收敛”进行了检验:在β收敛的假说下,采用发达国家的价格指数将低估收敛速度;Temple(1998)考察了初始效率和测度误差问题,指出测度误差和初始效率能够对“收敛率”产生很大的影响;等等。

假如真实的变量关系为

实证研究中有很多解决测度误差的办法。除了GMM,常见的还有高阶样本矩(Chesher & Irish,1987; Pagan & Vella,1989等)、反向回归(reverse regression,Klepper & Leamer,1984)等。此外,用矩估计(method of moments)可检验测度误差的敏感性。不过,上述方法并非处理测度误差的普遍方法,学术界对此存在不同意见。更常见的做法,是采用后文将要探讨的工具变量法,尤其是动态面板数据模型和GMM估计方法。

(三)因果联立偏误

在经济增长的实证研究中,双向因果关系造成的因果联立偏误是一种比较常见的内生性来源。如在回归方程(1)中,不少文献将向量Zi视为外生变量,但它们在解释经济增长的同时,往往也是经济增长的产物。例如,经济增长和政治稳定会联合决定均衡的产出水平,且二者会被一系列的制度安排所决定。现实情况往往是:政治不稳定会阻碍经济增长,但经济增长乏力也会激化政治不稳定。在这种情况下,回归方程中的待估计系数会包含双向因果效应,即产生因果联立偏误,造成内生性问题,并导致估计结果有偏及不一致。

解决因果联立偏误的常用方法是引入工具变量并采用广义矩估计(GMM)方法,如Xuan-Vinh Vo(2010)用GMM方法研究了资本流动和经济增长的关系,在GMM估计中用解释变量的滞后值作为工具变量来估计二者之间的双向因果关系。本文在后面将结合工具变量法讨论GMM的应用。不过,使用工具变量解决因果联立偏误问题仍然存在不少争议,如Durlauf,Johnson & Temple(2005)指出,工具变量应当是事先决定的,但事先被决定的变量并不一定是有效的工具变量。例如,Frankel & Romer(1999)在研究贸易开放度和增长之间的关系时,为克服内生性以某些地理因素(国土面积)作为贸易开放度的工具变量(国土面积事先决定且不会直接影响经济增长);但Brock & Durlauf(2001)指出,国土面积也可能同误差项相关,因为国土面积越大,则民族异质性越高,越可能出现某些影响经济增长的潜在社会问题等。

此外,在经济增长实证研究,尤其是政策评估中,还会遇到另一类涉及因果关系的问题,即评估某一项政策措施对经济增长的短期政策效应,或者说,评估一项政策究竟对增长起了多大的作用,或现实经济绩效在多大程度上是由该政策引发的。例如,Warner(1992)研究了债务危机对投资的影响,Easterly(1996)研究了稳定通胀的政策对经济增长的影响,Giavazzi & Tabellini(2005)研究了经济和政治自由化对经济增长的影响,Wacziarg & Welch(2008)研究了贸易自由化对经济增长的影响等;Pritchett(2000)对这类事件研究研究做了相关文献综述。这类涉及短期政策评估问题的实证研究,往往使用处置效应(treatment effect)分析框架,并采用双重差分方法(difference-in-difference method,DID):一方面,通过去除固定效应,可以避免不同样本中被遗漏的异质性造成的偏误和不一致;另一方面,通过去除时间效应,可以避免未被观察到的共同冲击造成的遗漏变量偏误等。限于篇幅,本文不拟做进一步讨论。

(四)样本选择偏误

如果样本的选择过程存在问题,或选择的样本不具有代表性,则很有可能造成解释变量与误差项相关,导致OLS估计的有偏且不一致。在经济增长的实证研究文献中,关于样本选择偏误问题的最著名文献,莫过于Delong(1988)对Baumol(1986)的评论:Baumol(1986)提出了“收敛俱乐部”(convergence club)概念,但Delong(1988)却认为该研究存在严重的样本选择偏误问题。具体而言,Baumol(1986)选取了Maddison(1982)总结的16个工业化国家为样本(按1979年的国民收入排序依次为:美国、英国、瑞士、瑞典、挪威、荷兰、日本、意大利、西德、法国、芬兰、丹麦、加拿大、比利时、奥地利和澳大利亚),以样本国家在1870年时的生产率和国民收入为解释变量(对数形式),以1979年和1870年的年均劳动生产率和国民收入的对数差分作为被解释变量,进行回归,发现斜率系数均为负,故认为这16个国家具有显著的收敛性。显然,Baumol(1986)采用的是事后样本,即该16国均是目前比较富裕且成功发展的国家;换言之,没有收敛的国家已经被排除在外,故存在明显的样本选择偏误问题。

Delong(1988)认为,对经济增长“收敛”假说的检验,所选取的样本不应当是事后已经成功收敛的,而应当是事前样本,即在1870年看似有潜在收敛可能的国家,而不应当以随后的经济增长为条件。基于这种考虑,Delong(1988)对样本进行了调整:排除日本,加入阿根廷、智利、东德、爱尔兰、新西兰、葡萄牙和西班牙。从当时的工业化趋势、自然资源、进出口、殖民地和投资情况等方面看,这22国均有可能成为收敛俱乐部成员。按照更新后的样本进行估计,Delong(1988)发现1870年之后的增长情况与1870年的国民收入关系不大,样本中初始收入较低的国家仍然没有收敛,只有Maddison(1982)的16国收敛了;也就是说,在排除样本选择偏误之后,收敛的证据并不明显。

样本中的异常值(outliers)问题同样值得重视。测度误差、遗漏变量和异质性等都可能造成样本的异常值,若直接忽略样本异常值问题,同样会造成内生性问题。以收敛问题为例,Temple(1998)把OECD样本按贫富程度分成四组,通过最小截平方(least trimmed squares,LTS)对异常值进行了处理,发现样本中的希腊、葡萄牙和土耳其并不具备代表性。利用处理后的数据,Temple发现了不同的收敛结果:最穷的那组国家收敛速率很快,而第二和第三穷的那两组却不明显,条件收敛有一定的“两极分化”趋势,即较穷和较富的国家条件收敛速率高且显著。

三、解决内生性问题:工具变量法

在经济增长的实证研究中,“内生性”问题几乎存在于计量分析的每一步,因此其解决方法也体现在样本选择、数据处理、变量选取和估计方法等方方面面。限于篇幅,本文拟略过样本选择和数据处理问题,而将重点置于目前最常用的工具变量法上,尤其将关注新近发展的动态面板数据模型。动态面板数据模型是将被解释变量的滞后值作为解释变量,其基本建模策略是引入被解释变量的滞后值或一阶差分滞后值作为工具变量。在基于工具变量的建模策略下,估计过程中多采用两阶段最小二乘(2SLS)和GMM等方法。本文将结合动态面板数据模型,着重探讨“差分GMM”(first-differenced generalized method of moments)和“系统GMM”(system generalized method of moments)方法。

(一)工具变量法:概括性总结

此外,对经济增长的种种影响因素进行实证研究的大量文献,也广泛地引入工具变量来解决内生性问题。例如,Romer(1990)以每一千个居民使用的广播数和人均报纸消费水平作为初始收入和识字率的工具变量,Miguel,Satyanath & Sergenti(2004)用降雨量波动作为GDP增长的工具变量,Toya,Skidmore & Robertson(2010)用自然灾害作为人力资本的工具变量;Bekaert,Harvey & Lundblad(2001)用内部人交易程度作为不完全资本市场的工具变量,Beck,Demirguc-Kunt & Levine(2005)用立法起源、资源禀赋、宗教组成和民族多样性作为企业规模的工具变量;Alesina & Ferrera(2002)用1962年城镇数量、1990年制造业就业比例和1962年政府间转移支付的收益比率作为基尼系数的工具变量;Hall & Jones(1999)用纬度、母语为欧洲语言者的比例和贸易份额作为社会基础设施的工具变量;等等。

当然,工具变量的选取往往存在较大的争议。例如,一般认为工具变量应当是事先决定的(pre-determined),保证同目前的经济增长无关,或=0,诸如地理特征等变量可以成为较好的工具变量。Hall & Jones(1999)用国家离赤道的距离作为社会基础设施的工具变量,因为纬度可能与西方的影响有关,而西方的影响越大,建立好的制度的可能性就越大。不过,Brock & Durlauf(2001)指出,有效的工具变量要求它不能是直接决定经济增长的因素(不能与误差项相关),但由于地理条件很有可能与一国的法律政治、社会经济等相关,故以地理特征作为工具变量是不合适的。

在工具变量的选取上,不少文献把解释变量的滞后值作为工具变量,如:Barro & Lee(1994)把1960年的人均GDP、滞后5年的投资占GDP比重、滞后5年的政府开支(国防和教育)占GDP比重、黑市外汇升水(对数形式)等作为工具变量;Bond,Leblebicioglu & Schiantarelli(2010)用投资、产出和通胀滞后期、贸易/GDP和政府开支/GDP作为投资的工具变量;Beaudry,Collard & Green(2005)用子时段的初始投资和平均储蓄率作为投资的工具变量。Catrinescu et al.(2009)用汇款的滞后值作为工具变量,用GMM法估计其对经济增长的影响。Fleisher,Li & Zhao(2010)认为由于FDI的内生性(与TFP相关),用本地市场化程度的滞后期作为FDI的工具变量,等等。

在近期的实证研究中,出现了大量以被解释变量的滞后值作为工具变量的实证文献,如:Xuan-Vinh Vo(2010)对资本流动和经济增长、Doytch & Uctum(2011)对不同部门FDI与当地经济增长、Hasan,Watchel & Zhou(2009)对金融深化和经济增长之间的关系进行的实证研究等。这种以被解释变量的滞后值作为工具变量的计量模型,会涉及动态面板数据、GMM估计等不同的建模策略和估计方法,有必要做进一步考察。

(二)动态面板数据模型

经济增长实证研究中还经常将被解释变量的滞后值引入方程作为解释变量。由于经济增长的持续性、有关因素对经济增长产生影响的滞后性等(如投资、教育等),以被解释变量的滞后值作为解释变量显然具有合理性,但它会引起实证研究中的内生性问题。以简单的动态面板数据模型为例

进行估计,成为经济增长实证研究中的常用估计方法。特别是在测量误差、截距项方差较高时,“差分GMM”的弱工具变量问题会更加突出,“系统GMM”可以有效缓解这一问题,因而在估计效率上更有优势。

根据方程(13)进行GMM估计,可以得到系数β的一致估计。

正是由于差分GMM的估计优势,自Caselli,Esquivel & Lefort(1996)将该方法引入经济增长实证研究后,该方法得到了大量的应用,如Forbes(2000)研究了收入不平等与经济增长的关系,发现差分GMM方法可以有效缓解测度误差和遗漏变量问题;Le(2009)在研究贸易、汇款和制度对经济增长的影响时,利用差分GMM方法来克服因果联立偏误;等等。不过,差分GMM仍存在不少局限性:尽管差分GMM能够在遗漏变量和测量误差的情况下(假定它们不随时间变化),借助于工具变量得到一致估计,但在具有较强的持续性(β较大)、时期较短(T较小)或通常仅仅是相应一阶差分变量的弱工具变量,即产生弱工具变量问题,导致估计的不一致性(通常为“下偏”)。为克服差分GMM的上述不足,Arellano & Bover(1995)、Blundell & Bond(1998)提出了“系统GMM”方法。

同差分GMM相比,系统GMM增加了额外的矩条件,不仅有助于缓解差分GMM的弱工具性和有限样本偏误等问题,而且可以提高估计的效率。不仅如此,由于计量模型中包含有水平方程,故系统GMM还可以对固定效应进行估计。Blundell & Bond(1998)进行的蒙特卡洛模拟发现,不论就一致性还是有效性而言,系统GMM明显优于差分GMM:尤其是在β较大或T较小的情况下,差分GMM存在严重的下偏。Bond,Hoeffler & Temple(2001)的研究进一步表明,差分GMM存在严重的有限样本偏误和不一致估计(下偏)。由于在存在不可观测的固定效应项的情况下,OLS会导致β系数的估计值偏高(上偏),而组内估计会导致β系数的估计值偏低(下偏),故一致估计应该介于二者之间;Bond,Hoeffler & Temple(2001)采用不同估计方法对索洛增长模型(采用在“稳态”建模的MRW模型)的估计结果表明,差分GMM的估计存在严重的下偏(比组内估计更为低估),而系统GMM的系数估计值介于OLS和组内估计之间,不仅更为合理(一致)、而且有关估计更有效率,且Sargan检验和差分Sargan检验表明,系统GMM中的工具变量(与差分GMM相同)和额外工具变量均为有效的工具变量。

正是由于系统GMM不仅能够在部分存在遗漏变量、测量误差等内生性来源情形下,仍能够得到一致估计,而且能够提高估计的效率,因此在经济增长的实证研究中得到了广泛的应用。例如,Hasan et al.(2009)对金融深化和经济增长、Aisen & Veiga(2012)对政治不稳定性和经济增长、Doytch & Uctum(2011)对不同类型的FDI和经济增长、Schularick & Steger(2010)对金融一体化和经济增长之间关系的实证研究等,均采用了系统GMM方法。当然,系统GMM同差分GMM 一样,仍然存在不少局限性:其一,二者均要求误差项不存在二阶自相关;其二,过多的工具变量,一方面造成弱工具变量问题,另一方面亦会导致最优权重矩阵估计的精确性下降,降低Hansen检验的有效性等。Roodman(2009)对差分GMM和系统GMM中工具变量过多等问题做了进一步讨论。

四、简评

内生性问题源于遗漏变量偏误、测度误差、因果联立偏误和样本选择偏误等因素,而在经济增长实证研究中,上述情况往往会同时发生。虽然工具变量法为大多数内生性问题提供了一条解决路径,但该方法本身也存在一些缺陷,而弥补这些缺陷也正是目前计量经济学研究所着力的方向。

就工具变量的选取而言,如何验证有效性和过度识别问题仍然存在缺陷和争议。从某种程度上讲,工具变量的选择大多主观性较大。如果工具变量丧失了有效性,不仅会使估计有偏,还会产生渐进不一致性。工具变量的选取可以成千上万,但不能脱离问题本身。因此工具变量的选择就应和模型结构密切相关,有必要联合考虑模型不确定性与工具变量的选择,通常可采用贝叶斯模型平均(Bayesian model averaging,BMA)和自动模型选择(automated model selection)等。

面板数据模型也存在缺陷。一方面,固定效应的识别策略很重要。Hoeffler(2002)认为,可通过两阶段混合的方法(two stage hybrid)来讨论固定效应,在第一阶段来估计固定效应,在第二阶段模型化固定效应。不过,通过处理固定效应,虽然可以缓解遗漏变量偏误,但增加了标准误,而差分去除固定效应可能还会增加测度误差。另一方面,动态面板数据模型存在参数异质性(parameter heterogeneity)问题,会导致误差项的序列相关,从而使得GMM方法对动态面板数据模型的估计是不一致的。对于目前常用的差分或系统GMM方法,它们虽然可以处理固定效应和内生性问题,同时还能避免动态面板偏误,但这两种方法存在工具变量过多的问题(David Roodman,2009)。如何界定“太多”并没有固定的标准,一般认为工具变量的个数不能多于样本个体数量。

诚如前文所言,任何实证研究都或多或少存在内生性问题。在实证研究的每一步,包括样本选择、数据处理、建模策略和估计方法等,都应审慎对待内生性问题。近几十年来,经济计量方法取得了很大的进展,出现了诸多解决内生性问题的方法,但每种方法在成功解决老问题的同时,亦会引发一些新问题。旨在解决内生性问题的建模策略和估计方法,表面上主要属于“技术性”问题,实则有着经济理论或现实经济方面的“思想性”要求。例如,计量模型的选择、解释变量和工具变量的选取等,既要考虑内生性和相应的估计方法等问题,更要结合经济理论和现实经济;再比如,工具变量是目前最常用的方法之一,但同工具变量相比,模型设定是更根本、更基础性的问题,而模型设定则离不开经济理论和现实经济。正因如此,包括内生性在内的实证研究,必须兼顾计量技术、经济理论和现实经济,不可偏废。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

经济增长实证研究中的内生学_面板数据论文
下载Doc文档

猜你喜欢