从财政水平看县级政府的财政支出责任_转移支付论文

县级政府财力与支出责任：来自财政层级的视角，本文主要内容关键词为：层级论文,财力论文,县级论文,支出论文,视角论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

JEL分类号：E62，H77，Z19 文献标识码：A 文章编号：1002-7246(2015)04-0082-17

一、引言

分权定理认为，地方政府对辖区内居民偏好的了解更加充分，因此，局部性公共物品的提供应该由地方政府负责(Musgrave，1959；Oates，1972)。从权责一致的角度看，地方政府的支出责任增加，自然需要相应的财权来匹配。然而，承载着广大居民基本公共物品供给责任的县级政府间的经济发展水平、自然禀赋存在着较大差异，这些因素决定了中央政府对财政资源的调整职责，通过均等化的转移支付平衡区域间的财力缺口(尹恒和朱虹，2009)，最终使财力与支出责任匹配。这是地方政府提供有效公共物品的前提，也是中国式财政分权的必要补充。理论界就如何理顺和调整各级政府之间的财政和支出责任等关系展开了很多定性分析(谢旭人，2009；侯一麟，2009)，逐渐形成了完善基层政府财政体制的共识。①而实践中，随着社会公众对公共服务诉求的日益强烈，政府间支出责任与财力匹配的难度也逐渐加大。

财力与支出责任相匹配是政府间关系调整中奉行的原则，关于政府间支出责任与财力匹配问题的研究也应当纳入到政府间财政关系的分析框架中。分税制把省及以下政府财政关系的调整留给了地方。显然，每一级政府都势必谋求各自利益最大化，在对上负责的政治格局下，“事权层层下压，财权层层上移”，加重了基层政府的财政困境。比如：市管县体制下，出现了“市卡县”、“市刮县”等现象(杨志勇，2009)，财权与事权难以匹配。旨在增加县级政府财力的转移支付经过市级政府进行再分配时，出现截留、挤占、挪用等问题(贾康和于长革，2010；周波，2010)。比如：市级政府截留县级政府的专项转移支付有两种手段，一种是直接不拨足额，另一种隐蔽的手段则是故意留有资金缺口，通过要求县级政府配套资金，把那部分原本应该拨付给县级政府的缺口资金，挪为己用。财力难以与支出责任匹配。“省直管县”财政改革后，随着转移支付直接到县，可能会缓解“市管县”体制带来的资金分配过程中“市卡县”等问题(刘尚希和李成威，2010)。由此可见，财政层级过多可能是阻碍支出责任与财力匹配的原因之一。

谋划财力与支出责任的匹配，可能需要从改变政府间金字塔形的财政关系调整入手，因此，从财政层级的视角对其进行定量分析，成为本文题中之意。省直管县财政改革触动了政府间的财政关系，这为我们评估财政层级对地方政府财力与支出责任匹配程度的影响提供了一个“准自然实验”。本文考察县级政府支出责任与财力在财政层级改革过程中的演变，估计了公共财政口径下的支出责任和财力，并采用标准的政策评估方法，实证检验了财政层级改革对县级支出责任、财力以及匹配度的影响。本文的特色表现在三个方面：第一，本文所用数据样本量较大，统计结果比较可信。样本覆盖了我国20个省2003-2007年的县级面板数据，全面考察了财政层级改革对县级政府支出责任、财力以及匹配度的影响。第二，衡量指标比较合理。现有研究主要从实际可支配财力角度讨论县级财政困难问题，我们认为对县级财力与支出责任匹配度的考察不应仅仅局限于财政收入方面，其与财政支出责任紧密相关。为此，我们构建了更为合理的匹配度指标，同时纠正了用实际财政收支来评价财政状况时所面临的内生性问题。第三，方法更加科学。本文运用DID-PSM方法解决政策评估中的“反事实”和控制组选择问题。

我们的研究发现，省直管县财政改革确实显著地改善了县级财政状况。财政层级减少后，县级支出责任和财力都有所增加，但财力的增加幅度远大于支出责任的增加，从而改善了财力与支出责任的匹配度，主要原因是地市级政府截留县级转移支付收入的可能性减少了，使县级政府获得的转移支付总量显著增加。改革具有一定的时间持续性。从样本细分看，无论是按照财政困境程度，还是按照改革模式划分样本，财政层级减少后，财力与支出责任的匹配度都显著提高。

本文其余部分安排如下：第二部分是数据性描述，构建财力、支出责任以及两者的匹配度等指标；第三部分讨论分析方法；第四部分报告估算结果；第五部分是稳健性检验；第六部分总结全文。

二、数据描述以及变量说明

本文的研究对象是全国范围内的县及县级市，根据改革的特点，不包括地级及以上城市的城区。本文的财政数据来源于各年《全国地市县财政统计资料》(财政部国库司编，中国财政经济出版社)，社会经济数据来源于各年《中国县(市)社会经济统计年鉴》(国家统计局农村社会经济调查司编，中国统计出版社)，人口数据来源于各年的《中华人民共和国全国分县市人口统计资料》(公安部治安管理局编，群众出版社)。为剔除行政区域变化带来的影响，我们逐一核对不同期间的行政区划变更，分为3种情况进行处理。②同时，考虑到行政体制与民族自治情况，删除4个直辖市、5个自治区以及浙江和海南共11个省的样本，删除省直辖体制的副地级县市，③删除了非民族自治区中的自治县、自治旗。

根据侯一麟(2009)的界定，2004年以后是政府职能的真正转变时期，开始承担大量诸如教育、医疗等基本公共服务和住房、就业、社会保障等“公共性”事务。因此，结合“省直管县”财政改革的时间，④以及数据的可得性，我们选取2003-2007年的县级面板数据，样本集包括行政区划稳定、具有可比性的6275个样本。

首先，我们用基础性数据估算支出责任

。通常的做法是采用财政支出来衡量政府支出责任。但该方法存在内生性，地方政府收入增加，支出自然就会增多，因此该指标很难刻画县级政府支出责任的真实景象。为消除支出伴随收入同步调整而导致的内生性，刻画地方政府支出责任的真实情况，我们根据县级财政责任估计现行制度下的县级政府理论支出责任。参照尹恒和朱虹(2009)的做法，将所有财政支出项目分为四类，包括经济支出、社会支出、行政支出以及其他支出，为避免内生性问题，我们同时采用若干地方政府不能直接控制的因素作为解释变量。⑤由于可能受到共同不可观测因素的影响，各回归方程的随机扰动项之间一般来说是相关的，所以我们采用似不相关回归模型估计得到各项理论财政支出，加总得到地区支出责任。具体为：

，k=1，2，3，4

分别表示实际人均经济支出、社会支出、行政支出、其他支出。⑥经济支出的估计方程中考虑了人均GDP、农业人口比例、人口密度、第一、二产业增加值比重、中西部虚拟变量和省份虚拟变量等因素。社会支出的估计方程中考虑了财政供养人口比例、人口密度、万人医院床位数、农业人口比例、中小学生在校人数比例等因素。行政支出的估计方程中考虑了财政供养人口比例、农业人口比例、中西部地区虚拟变量等因素。其他支出的估计方程考虑了财政供养人口比例、农业人口比例、人口密度、万人医院床位数、中小学生在校人数比例和西部地区虚拟变量。最终得到的支出责任为各项财政支出拟合值之和：⑦

其次，构建财力与支出责任匹配度指标。目前，关于财力与支出责任的匹配度尚无统一的定义，在基层政府的财政窘况下，提高财力与支出责任匹配度，潜在的含义是提高地方政府的财力水平或者减少地方政府的支出责任。基于此，我们把匹配度定义为地方政府财力解困的程度。不同于贾俊雪等(2011)用本级财政收入与财政支出的比值来衡量地方财力解困状况，⑧本文采用理论支出责任与财力(财政总收入)的比值来衡量财力与支出责任的匹配度，⑨比值越小，匹配度越高，说明地方政府履行既定支出责任时可以动用的财力越多，财政困难程度越低。

通过搜集各省下发的有关文件，我们根据改革实施的时间，构建政府财政层级改革虚拟变量。如果某县某年实行财政省直管县改革，则改革虚拟变量szgx=1，否则，szgx=0。毛捷和赵静(2012)研究发现“省直管县”财政改革既促进了县级政府的经济增长，又有利于这些地区财力的增长，而且“省直管县”财政体制对经济增长的作用主要是通过县(市)扩权而产生的“政府竞争效应”。按照此逻辑，如果试点县的财力增加是经由提高经济活力而间接产生的，则会高估财政截留的效果。为排除其他影响渠道的干扰，在此删除了实施强县扩权政策的样本。此外，本文删除了数据中所用社会经济变量的异常值或缺失值样本。我们根据Brandt and Carsten(2006)构建的一套物价水平调整指数对名义变量进行平减，其中，2005-2007年的平减指数是我们按照Brandt的物价水平调整方法根据当年的CPI外推得到。表1为本文所用变量的统计性描述。

最终得到的改革县样本有544个，占全部样本的8.7％，分布于湖北、吉林和青海等9个省份。此外，不难发现：改革县的人均粮食产量、肉类产量、油料产量、第一产业比重都明显高于非改革县；人均收入、财政困难程度低于非改革县。这些统计结果表明，现实操作中确实倾向于将粮食、油料、生猪生产大县全部纳入改革试点，而并非倾向于财力与支出责任匹配度较低的县，但其内生性还需要做进一步检验；由于试点县改革当年及其后续年份中，改革虚拟变量的设置都为1，因此，改革县支出责任与财力的比值的均值、方差都小于非改革县，改革样本的序列相关性可能会影响估计结果的显著性。

为了进一步考察核心变量的变化趋势，我们给出了全样本核密度图，如下图所示。可以看出，2003-2007年间，县级政府的实际支出、支出责任以及财力都呈现持续增加的趋势，核密度曲线持续向右偏移。在样本考察期内，匹配度呈现出先好转后恶化的趋向，表现为核密度曲线先向左后向右偏移。从图形上看，实际财政支出与财力的同步性非常明显，这在一定程度上为实际财政支出存在的内生性和估计支出责任的必要性提供了证据。

图1 县级政府实际支出的核密度图

图2 县级政府支出责任的核密度图

图3 县级政府总收入的核密度图

图4 县级政府财力与支出责任匹配度

值得一提的是，我国县级支出责任与财力比值的均值为1.2，表明我国县级政府财力处于较为“尴尬”的阶段，财力与支出责任的匹配度有待进一步提升。县级财政匹配度的标准差平均达到了0.38，表明我国县级财政状况存在着非常明显的差异。

三、文献综述和计量方法介绍

一些学者尝试对省直管县财政体制改革的政策效果进行定量评估，研究视角主要集中在财政改革的间接影响上，如经济增长、环境质量(才国伟和黄亮雄，2010；才国伟等，2011；李猛，2012)、财政自给能力(贾俊雪等，2011)。这些研究使用了GMM估计方法，通过比较试点在改革前后的变化来检验政策的效果。但是比较改革前后的差异只能说明政策与考察指标之间的相关性，很难有信心地断定政策的因果关系。可能存在一些无法观测的变量既影响样本成为改革试点单位又影响目标变量，导致改革与目标变量之间的相关性并非真实的“因果关系”。尤其是现有讨论政府层级改革的研究在缓解县级财政困难问题时，都是直接比较实际财政收入和财政支出(才国伟和黄亮雄，2010；贾俊雪等，2011)，这种做法没有考虑内生性问题而导致估计偏误。根据中国的财政行为惯例，当年额外的财政收入会转化为同年的财政支出。直接比较实际财政收支来评估财政状况很可能会低估改革的政策效应。计量经济中的双重差分模型(Difference-in-difference Approaches，DID)是政策效应评估方法之一。近年来，国内学者开始应用这一方法进行政策效应评估。例如周黎安和陈烨(2005)、左翔等(2011)、徐琰超等(2015)借鉴“自然实验”和“双重差分模型”的方法估计了农村税费改革对农民收入、地方政府公共物品供给所产生的政策影响。白重恩等(2011)借鉴此方法评估了出口退税政策调整对出口的影响。袁渊和左翔(2011)、郑新业等(2011)用此方法评估了省直管县改革对经济增长的影响。在此，我们使用基于倾向得分的双重差分方法来估计(Based on Propensity Score Matching and Difference-in-difference Approaches，DID-PSM)。该方法是一种半参数估计，较之双重差分方法严格的线性假设更具一般性。而且该方法是在样本的“共同支撑”范围内进行估计，提高了估计结果的可靠性，而双重差分模型方法仅是依靠先验的样本选择和方程形式去“外推”估计结果，当改革县与非改革县的共同支撑较少时，后者的估计显然会存在很大缺陷(黄玲文和姚洋，2007)。

需要说明的是，如果这种政策实施是随机分配给个体的，我们可以直接比较改革县与非改革县之间结果变量的平均差异来评估处理效应(Khandker et al.，2009)。但一般而言，“准自然实验”中试点的选择不是随机的，那些异质性的特征可能会成为试点选择的标准，导致我们无法识别出结果变量是否确实由改革所引起。倾向得分匹配方法有效地解决了这类问题(Heckman et al.，1998)，即利用“近似”特征的样本来解决“反事实”问题。具体而言是根据政策实施之前的选择特征，估计每一个观测值成为实验组的概率，以保证匹配在一起的实验组与控制组在政策实施前具有相同的趋势，这样有效地处理了政策评估中出现的“选择性偏差”。我们可以直接根据控制变量X寻找匹配组，然而当样本异质性较强，需要考虑的特征变量X维度较多时，找到与试验样本完全相同X的控制组是不实际的(Jalan and Ravallion，2003)。这时基于

来寻找控制组就是必要的。而且，基于一系列变量估计出的倾向得分进行匹配，估计结果会更加精确(Rosenbaum and Rubin，1983)。例如在现实操作中我们可以根据人均GDP来区分富裕县和落后县，利用第一产业占GDP的比重以及粮食、油料和肉类产量来区分农业大县等，利用这些异质性县的特征估计出倾向得分，然后据此将样本划为若干区间，为每一个试点样本在各自区间内找到最为相似的控制组样本，从而模拟出“反事实”情形，计算出处理平均效应(Average Effect of Treatment on the Treated，ATT)。

本文所用方法的具体实施主要包括以下三个步骤：首先，通过参与概率模型计算出每个观测值的倾向分值；其次，根据倾向得分为每一个试验组样本寻找一个或多个相近的匹配样本，并通过一定的方式为每个匹配样本赋予权重；第三，再利用双重差分计算每个试验组与控制组的差距，然后把这些差距加权平均即是试验组与控制组之间的总体差距。具体地，倾向得分估计方程如下：

为滞后一期变量，用来预测当期改革发生概率，

为县市的个体效应，

为时间效应，

为独立同分布的随机误差项。运用logit方法对上述模型进行估计，得到预测结果

即为样本改革的可能性或者倾向得分。

可以用两类指标描述政策效应：一类评估政策的平均效应，另一类考察政策的动态效应。(2)式定义平均效应：

选择偏差是CIA条件无法满足的主要原因。如果政策的实施是随机的，不存在政策的选择偏差，政策评估会很简单。然而大多数情况下改革试点的选择并不是随机的，次优的方法是拟随机实验，即是用观察到的、影响政策选择的变量来近似模拟随机试验。这就是PSM方法的本质。若影响试验选择的变量都得到了控制，PSM方法是有效的。如果遗漏了影响试验选择的变量，就可能出现选择偏差。选择偏差会使得估计结果与初始条件有关，即试验组与控制组在试验发生之前的差异会体现在改革效应中。Jalan and Ravallion(2003)发现如果没有很好的控制试验组与控制组初始异质性，则会产生一个有偏的估计结果。

共同支撑原则保证控制组的可行性。虽然在预测倾向得分时选择更多的控制变量可以减少选择偏差的风险，但这可能使得共同支撑原则更难满足。这是因为参与方程中包含过多的控制变量X会导致倾向得分估计值

(X)有较大方差、倾向得分估计值为1的样本更多，这使得在共同支撑中剔除样本过多而出现估计偏误。

四、估计结果

我们运用面板数据的DID-PSM方法进行分析。首先预测样本的倾向得分。为了尽量减少选择偏差，我们根据各省政府下发的改革意见找出“代表性”、“典型性”的选择“标准”，作为控制变量放入倾向得分方程。(11)根据倾向得分方程的设定原则，我们还把同时影响因变量和改革变量，以及没有受到实验影响的变量也放入到了方程中(Heckman et al.，1997；Jalan and Ravallion，2003)。为了控制所得税分享改革和其他随时间变化的宏观经济波动因素的影响，我们还在方程中加入了中西部省份和年份虚拟变量。(12)

倾向得分的估计结果见表2。虽然有些变量不显著，但是该模型有很好的预测效果。预测正确率是检测倾向得分估计方程设定效果的重要指标(Heckman et al.，1998)，其检验核心思想是为倾向得分设定一个阀值，如果一个样本倾向分值超过该值，则可以预测该样本属于试验组。通常的做法是把这个阀值设定为试验组样本量占样本总量的比例，然后使用这个比例，观察试验组和控制组的预测正确率，足够大则说明我们的倾向分值有较强的预测能力。根据惯用规则，我们得到本文的阀值是0.09，而试验组和控制组的预测正确率分别是94％和90％，这说明我们的倾向得分值有很强的预测能力。

平衡性检验(Balancing Test)用来检验倾向得分方程的设定效果。它通过检验匹配后每一个解释变量是否还存在差异来判断解释变量是否还能够提供有关试验决策的信息。如果匹配后试验组和控制组的变量间仍然存在差异(即控制变量还能够提供有关试验决策的信息)，则CIA(Conditional Independence Assumption)条件不成立，需要重新考虑倾向分值方程的设定。根据Smith and Todd(2005)的研究，通过计算配对后处理组与对照组基于各匹配变量的标准偏差进行匹配平衡性检验，计算每个待估变量的标准偏差。标准偏差越小，说明匹配效果越好。本文基于此方法的检验结果表明我们的倾向得分方程通过了平衡性检验。(13)

图5 倾向得分柱状分布图

改革县的平均倾向分值为0.26，标准差为0.12，而非改革县市的平均倾向分值为0.07，标准差为0.11。图5是改革县市与非改革县市的倾向得分柱状分布图，可以看出，两类样本的分布有一些不重合的区域，为了满足共同支撑假设，我们在下面的计算中去掉了非重合区域的改革县市。

倾向得分的平衡性检验使我们避免了源自可观测的选择性偏差，但如果存在随时间变化的不可观测因素，估计值仍然可能会有偏差。在对(2)式估计之前我们还需要验证这种情况是否存在。Sargan-Wu-Hausman为我们提供一个检验标准：参与方程残差的系数t检验值为0.8，不能拒绝该系数显著为零的原假设，表明随时间变化的选择偏差不会显著影响到估计结果。(14)

当然，我们不能因此而否定可能存在另外一种形式的内生性：如果在现实操作中成为试点的县偏离了“选择标准”，并且这些县的特征与我们待考察的因变量——财力与支出责任匹配度有系统上的相关性，比如省级政府认为财政匹配度较小的县更亟须改革，或者比较有作为的县政府会更主动地争取试点改革，在这种情况下比较试点县与非试点县市的差异并不能反映省直管县财政改革真正的效果。因此，为了验证是否有此种可能性存在，我们只选择了先于全省进行改革的试点县样本，来分析因变量匹配度是否成为试点改革的标准。具体操作为：选择2006年四个省份数据，(15)采用二元选择模型考察匹配度是否为试点选择的参考因素，控制变量与倾向得分方程中的变量相同。从回归结果看，匹配度的系数z检验值为-0.24，不能拒绝该系数显著为零的原假设，表明互为因果的选择性偏差不会影响到估计结果。

在核密度估计中，我们剔除了控制组中分布最高和最低的2％的样本(Jalan and Ravallion，2003)。(16)为提高倾向得分估计有效性，还需要尽量使改革对所有样本的“刺激”都是相同的(Ravallion，2008)。基于此，我们在后续的操作过程中，进一步细分了改革的类型。此外，改革前后发生了一些转移支付制度改革，可能会对估计产生一定的影响，比如“民族地区补助”和“三奖一补”等。我们在核密度估计中控制了这些政策的影响。(17)需要特别指出的是，有些样本可能多次放在政策实施的前后，比如：04年进行改革的县，在05至07年的改革变量都是1，序列相关性会产生较低的标准差，从而导致低估政策效果(Mullainathan et al.，2004)，为了结果的稳健性，我们在获得参数标准误时均采用了bootstrap的方法，抽样次数为200。估计结果见表3。

据表3，财政层级改革确实显著降低了支出责任与财力比，平均处理效应达到-0.091，即财政省直管县使得改革县财力与支出责任匹配度提高了10.2个百分点。省直管县财政改革较大幅度地增加了财政总收入，支出责任相对而言增幅较小，从而匹配度提高。值得注意的是支出责任和实际支出的差异。虽然改革后实际支出和支出责任都显著增加，但后者在幅度上较前者小很多。可能的解释是省直管县后，市级政府对县级政府的帮扶减少、将一些支出责任推给县级财政，从而导致县级财政的实际支出被动增加。然而县级财政实际支出的增加也有可能是由于财政总收入增加后(转移支付增加)主动调整支出的结果。支出责任小于实际支出表明主动性调整也是改革后县级财政支出增长的不可忽视原因。(18)这也是我们使用支出责任而不是实际支出评估财政匹配度的重要原因。

省直管县财政改革对县级财政收入结构变化的效应是明显的，尤其是专项转移支付与体制性补助。相对其他类型而言，这两项转移支付的分配方式体现出“原则有余，可操作性不足”的特征，分配标准和依据随意性较大。财政省直管县后，这两项转移被中间层级政府截留的可能性减少，到达县级财政的人均专项转移支付、净体制补助显著增加。税收返还显著为负，但绝对值相对较小，一种可能的解释是，市级政府凭借行政优势争夺税源而导致核定到县的税收返还减少。再结合因素法转移支付，改革县级财政得到的总转移支付显著增加。这是改革县财政总收入增加的主要原因。表3结果表明省直管县财政改革减少了地市级截留县级财政收入的可能性。需要说明的是，我们也不否认存在另外一种可能：为了突出省直管县改革的绩效，短期内省级政府可能会加大对这些地区的转移支付，或者由于试点县的谈判能力的提高，会争取到更多的转移支付。出于数据的限制，虽然我们无法分离出不同因素对财政匹配度的影响，但这不否定改革因截留减少所带来的转移支付增加的事实。可以从两个方面来佐证：其一是改革具有持续性，时间趋势明显(见表4)；其二是如果省级政府会对试点县有“偏爱”或者试点具有更大的谈判能力，那么，全部进行改革的省份改革的政策效果就会不显著。本文中湖北、吉林、安徽和江苏是全面推行改革的地区，如表5中(4)列所示，基于这些样本的回归结果依然显著为负。

表4分别考察省直管县改革当年及之后的每一年对财政匹配度的影响。“改革当年”表示县市仅在当年接受了处理，其他以此类推。除改革后第二年的虚拟变量没有通过显著性检验外，改革试点县的财力与支出责任的匹配度每一年都在提高，表明财政层级改革缓解县级财政困境的效应具有明显的持久性。需要特别说明的是，财政层级改革效应的持久性也进一步验证了使用支出责任的合理性。从构造上看，利用县级政府的结构因素估计其相对稳定的支出责任，侧重于度量较长时期平均的支出；而实际财政支出可能面临更多的波动。如果省直管县改革对县级财政状况的影响只是短期的，那么估计县级政府支出责任的必要性就不明显。

上级转移支付是影响县级政府间财力分配的重要因素，而财政层级改革的效应可能会因县级财政的初始状况差异而不同(马骁和冯俏彬，2010)，鉴于此，我们根据改革县支出责任与财力比值的中位数(1.12)对样本进行拆分。各自的改革效应见表5的(1)、(2)栏。(1)栏是初始财政困难较重县的估计结果，(2)栏为初始财政困难较轻县的估计结果。结果表明两者都显著为负，说明财政层级改革的“减负”效应具有普遍性。从时间趋势上看，财政困难较重县在改革第一年和第二年的效果虽然没有通过显著性检验，但政策方向依然没有改变。各省的省直管县财政改革具有一定的区别，根据改革方案的差异可以将其分为“补助资金管理型”、“全面管理型”和“省市共管型”三种类型，分别考察其对财政匹配度的影响。(19)表5的(3)、(4)、(5)栏分别代表了这三种类型的改革效应，整体上看，省直管县的三种改革模式都提高了县级财政匹配度，并且改革效果具有持续性。

五、稳健性检验

以下通过假想不同的政策时间、细分样本以及考虑某些重要政策改革等方式，对表3中主回归得到的结论进行稳健性分析。讨论如下：

首先，我们对主回归进行了安慰剂(Placebo Test)检验，即如果不受财政层级改革的影响，那么试点县的财政匹配度应无明显变化。我们假想2004-2007年试点样本都在2003年发生政策改革，结合2002年数据进行与主回归相似的检验过程，结果如表6的(1)列所示。(20)可以看出，假想不同的政策时间，实验组与控制组的财政匹配度没有出现显著的差异，即如果没有发生财政层级改革，这些试点县的财政匹配度不会降低。这些结果从反面佐证了我们主回归估计结果的稳健性。

其次，我们细化了样本进行分析。我国有592个国家级贫困县，中央和省级政府不仅对贫困县的转移支付力度很大，而且在税收优惠和产业政策等方面有特殊照顾。在我们的实验组样本中有235个是国家贫困县，这会对财政层级改革效果的估计造成影响。为了保证匹配后的实验组和控制组同时为贫困县或者非贫困县，我们根据是否为贫困县把样本分为两类，每一类中实验组和控制组分别进行匹配，然后逐一计算平均处理效应，最后再把计算出的两类ATT值加权平均，其权数为每一类样本占全样本的比值。(21)实证结果如表6中(2)列所示，虽然系数绝对值与主回归结果中有些差异，但平均处理效应依然显著为负。

最后，我们考虑到样本考察期间出现其他改革对本文估计的影响。自2004年1月1日起实行的出口退税负担机制改革可能会对异质县的财政匹配度产生影响。出口退税负担机制改革因为地方政府开始承担了部分出口退税责任而导致沿海城市和非沿海城市的财政匹配度受到不同影响。如果在我们的匹配过程中把有出口县和无出口县配在一起，会造成估计偏差。为此，根据数据的可得性，我们在倾向得分方程中加入了出口虚拟变量、沿海城市虚拟变量，用来提高我们在匹配过程中的精度。如表6中(3)列所示，支出责任与财力比值的系数符号与表3主回归结果一致、数值相近，且通过了显著性检验。应该是因为我们在主回归的倾向得分方程中已经考虑了人均收入水平因素，而这些因素已经包含了部分以上提到的信息。

就调整观察期而言，未发现实验组和控制组的财政匹配度出现显著差异。就细分样本而言，支出责任与财力比依然显著为负。当倾向得分的估计方程中考虑了所得税分享改革和出口退税分担机制的影响时，平均处理效应系数和显著性水平没有出现明显差异。综上所述，这些稳健性检验证明甚至强化了我们的已有结论，即财政层级改革对县级财力与支出责任的匹配度有较为显著的政策影响。

六、总结性评论

现实中的基层政府财力与支出责任匹配度较低的原因，除了支出责任界定不清被上级层层下压外，还有伴随财力增加县级政府主动扩大支出的因素，表现为实际支出远大于支出责任。本文纠正了用实际财政支出评价支出责任时所面临的内生性问题，综合考虑了公共财政制度下的地方政府各种支出责任，在此基础上构建了财力与支出责任的匹配度指标。运用2003-2007年的县级面板数据分析了财政层级对支出责任、财力以及匹配度的影响。基于倾向得分的双重差分实证结果表明：财政层级改革后县级财力与支出责任匹配度提高的主要原因是减少了地级市财政对县级转移支付的截留，使其得到的上级总转移支付显著增加，最终使改革县的财政匹配度平均提高了10.2个百分点。这种“财政解困”效应不仅具有明显的持续性，而且在财政较困难县的改革效应更明显，从而间接地缩小了县级政府间财力差距。我们还发现不同类型的改革模式具有相同的改革效果，这也表明财政层级的扁平化有利于夯实基层财力保障。本文根据中国县级数据挖掘了财政层级简化提高了县级政府财力与支出责任匹配程度的经验事实，这些增进了对现行政府间财政关系问题的了解。此外，实证结果还表明，改革县的支出责任也有一定程度的增加，说明财政层级减少只是解决了财力截留问题，在市管县的行政体制下，支出责任依然可能会被下压。因此，与财政层级改革相匹配的行政层级改革也更为重要，这是提高政府间财力与支出责任匹配程度的关键所在，也是塑造与市场经济相契合的分税分级财政体制的重要基础。

需要指出的是，虽然财政层级改革在一定程度上改善了地方财政间财力与支出责任的匹配程度，但并不一定能促使地方政府回归公共服务职能。如何提高地方财政对本地居民偏好的回应性，解决财政行为中的“越位”和“缺位”问题，是完善中国财政分权体制的关键(尹恒和杨龙见，2014)。当然，随着政府间财政关系的逐渐完善，财力和支出责任的划分问题也将进一步厘清。

感谢匿名审稿人的宝贵意见。文责自负。

注释：

①2013年11月9日《中共中央关于全面深化改革若干重大问题的决定》提出“……形成中央和地方财力与支出责任相匹配的财税体制”。2014年1月10日财政部《关于调整和完善县级基本财力保障机制的意见》中提出“……要努力实现县级政府财力和支出责任相匹配”。

②第一种情况：名称变更或者行政隶属关系变化，但县级单位行政辖区无实质变化，我们把这样的县级单位视为同一地区。第二种情况：名称无变化，但县级单位行政辖区发生实质改变，我们将这种情形视为不同地区，原编码中止，设立新编码。第三种情况：名称变化，县级单位行政辖区也发生实质改变，我们也将原编码中止，设立新的编码。

③浙江、海南县级财政一直就与省级财政直接对接，而自治区的财政体制、政府财政层级设计较为特殊，故在本文分析中将这些省份样本排除在外。副地级县市比县级单位高半级，属于省直辖体制的副地级县市包括湖北的神农架林区、潜江市、天门市、仙桃市，河南的济源市。

④较大规模的省直管县财政层级改革试点是从2004年开始的。截至2007年底，全国除去港澳台和4个直辖市、浙江、海南、五个自治区之外的20个省中有9个省进行了财政省直管县改革。

⑤受地方政府偏好的影响，实际财政支出会受到某些财政收入项目的直接影响，如果不能将这些因素的影响分离开，财政支出责任的估计是有偏的(Eichhorst，2007)。

⑥实际经济支出包括基本建设支出、农业支出、林业支出、水利和气象支出及科学支出；社会支出包括教育事业费、社会保障支出和医疗卫生支出；行政支出包括行政管理费和公检法支出。

⑦2007年的地市县财政年鉴分类科目与之前有了很大调整，但现实操作中“基数+增长”的预算方式没有改变，因此，为保证支出责任与之前年份的可比性，我们利用04、06年的拟合值计算出年均支出责任增长率，结合06年数据估算出07年的支出责任。

⑧该指标可能存在两个问题：第一，财政收入中没有包含来自上级政府的转移支付，而后者是县级政府财力的重要来源，忽略这一项会低估基层政府的财力；第二，如前所述，此指标不能解决实际财政支出随收入增多的内生性问题。

⑨财力包括税收收入和预算内非税收入，后者包括专项收入、行政事业性收费、罚没收入和其他收入；预算外收入包括政府基金收入和土地收入(马骏，2011)，其中政府性基金收入是为支持某项事业发展而征收的具有专项用途的资金，单独编列，其收入与支出一一对应，不计入一般预算收入和一般预算支出，而且土地收入在省份之间差异较大，不具有可比性，因此这里财力定义为预算内平衡性收入加上本级收入(自有税收)。

⑩Kernel匹配不会利用数据分布的先验知识，对数据分布不附加任何假定，特征最接近的样本赋予最大的权重，充分利用了多个匹配样本的优势。而其他几种匹配方法在应用上受到了限制，比如Radius匹配需要主观的限定匹配范围；通过bootstrap获得N-N匹配因果效应估计的标准差可能会产生无效的估计(Abadie，2005)，且一对一匹配遇到“坏”的配对的风险更大，而Kernel配对估计方法没有这个问题(Gilligan and Hoddinott，2004)，因此，很多研究都使用核密度匹配方法进行估计(Heckman et al.，1997；Heckman et al.，1998；Smith and Todd，2005)。

(11)湖北、安徽、吉林、江苏四省因为是全省改革，不涉及试点问题。山西、陕西、甘肃、青海、江西则选择生态保护任务重、农业大县、贫困县进行试点。

(12)所得税分享改革始于2002年，是为减缓地区间财力差距扩大，支持西部大开发。中央明确规定因所得税分享改革增加的收入主要是用于中、西部地区转移支付，因此所得税分享改革倾向于降低中、西部省份的财政匹配度。

(13)在此，我们采用Smith and Todd(2005)的平衡性检验方法，匹配后试验组与控制组基于变量

的标准偏差的计算公式为：

，该值越小则匹配效果越好，对于其判断标准，Rosenbaum and Rubin(1983)认为当匹配变量标准偏差值的绝对值大于20时可认为匹配效果不好，此时匹配效果不可靠。具体过程是同时对实验组和控制组基于各匹配变量的均值进行t检验，判断二者是否存在显著差异，并以此检验匹配效果。

(14)Sargan-Wu-Hausman检验：用财政匹配度对倾向得分、控制变量x、参与方程的残差项进行回归，鉴于相似的县，试点的分配不同，但与改革县所属省份密切相关，我们选择省份虚拟变量为识别工具。如果残差项的系数显著的不为零，则说明选择偏差会导致估计偏误(Jalan and Ravallion，2003)。

(15)山西、陕西、甘肃、青海四省存在先于全省改革的试点，恰好试点改革时间都发生在07年，因此，我们选择改革前一年的数据来检验假设，如果07年进入改革，则该县虚拟变量为1，否则，为0。

(16)有学者提出剔除共同支撑之外的样本会带来“低估”改革效果的问题，但只要共同支撑范围较大，改革效果的估计还是可信的。此外，剔除的控制组样本也可能导致估计偏差，因为这些被剔除样本整体上不同于保留下来的样本，但该问题可以通过大样本性质来减轻(Khandker et al.，2009)。

(17)2001年新增加了民族地区转移支付补助，这类补助主要是针对民族地区的，虽然我们在后续的估计中删除了少数民族地区样本，但现实中也陆续有非民族县获得该项补助(毛捷、汪德华和白重恩，2011)。在我们的全样本中，试点县获得该项补助的有10个，非试点县获得该项补助的有1067个。从2005年起，县级财政补助中新增了“缓解县乡财政困难转移支付补助”，这来源于中央建立的“三奖一补”的县乡财政困难激励约束机制。鉴于这两项转移支付补助都不是普及性的，我们在核密度估计中加入2个政策虚拟变量。

(18)实际支出的增多有两种可能，一是被市级政府压下来的被动性支出，二是主动调整的支出。在中国以收定支的财政制度下，两者都是以财政总收入增加为前提条件，不会影响到结论。理论上，改革后，设区市与省直管县在财政上属于平行关系，由过去共同追求区域利益最大化的“父子”关系转变为追求个体利益最大化的竞争者关系，市、县政府间竞争开始明显化，支出责任在省级政府划定的情况下，县级政府的被动性支出会大大减小，相反，由于财政总收入增加后(转移支付增加)主动调整支出的可能性却大大增加。经验上，实际支出高出支出责任很多也说明了后者是改革后县级财政支出增长的不可忽视原因。

(19)根据张占斌(2011)的定义，改革方案分为三种：第一，补助资金管理型：山西、江西、甘肃。主要对转移支付、专款分配，以及资金调度等涉及省对县补助资金分配的方面实行省直接管理。第二，全面管理型：湖北、安徽、吉林、江苏。即对财政体制的制定、转移支付和专款的分配、财政结算、收入报解、资金调度、债务管理等财政管理的各个方面，全部实行省对县直接管理。第三，省市共管型：陕西、青海。即省级财政在分配转移支付等补助资金时，直接核定到县，但在分配和资金调度时仍以省对市、市对县的方式办理，同时，省级财政加强对县级监管。

(20)以下的计量步骤与主回归相同，由于篇幅所限，在此只报告了最终的估计结果，以便与前文作比较。

(21)在此我们借鉴了苏振东等(2012)对不同行业的企业分别进行匹配的方法。

标签：转移支付论文; 政府支出论文; 控制变量论文; 财政制度论文; 经济论文; 财政支出论文; 财政学论文;

从财政水平看县级政府的财政支出责任_转移支付论文

猜你喜欢