最优非线性税率结构的影响因素：争论与分析的焦点_边际税率论文

最优非线性所得税率结构影响因素：论争焦点及评析，本文主要内容关键词为：所得税率论文,最优论文,因素论文,结构论文,焦点论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：F811.9 文献标识码：A 文章编号：1004-4892(2014)04-0018-08

最优所得税理论研究了在满足政府预算约束和消费者自选择约束①下，如何确定最优所得税税率结构，②从而使得社会福利最大化，其旨在分析和解决所得课税在公平与效率之间的权衡取舍问题，但并不容易清楚地表达两者相互作用的机制及影响因素。

20世纪90年代后，国内一些学者陆续对最优所得税理论进行了研究，主要集中于基本理论的概述(郭庆旺，1995；平新乔，2000)[1][2]，政策指导意义的探讨(吴俊培、胡文贤，2002；陈松青，2003；邓子基、李永刚，2010)[3][4][5]，在我国的应用(郝春虹，2006；聂佃忠、李庆梅、雎国余，2011；李宇、刘穷志，2012)[6][7][8]以及系统的评论(杨斌，2005)[9]等方面，国内已有成果相对缺乏且比较薄弱，而国外对该问题研究的历史悠久，且形成了比较系统的研究体系。Mirrlees(1971)[10]对最优非线性所得税模型的构建进行了开拓性的工作，之后，大多数研究集中于两个方面：一是放松Mirrlees模型假设，继续研究最优非线性所得税模型。另一方面是直接研究最优线性所得税模型。③发现，至少在他考虑的例子中，最优非线性所得税率结构近似线性。本文则集中于第一个问题，并集中探讨影响最优非线性所得税税率结构的主要因素。④

经典的最优非线性所得税模型假设可以描述如下：在经济中，存在消费和劳动两种商品；除了劳动者供给能力存在差异之外，消费者被看成是相同的；每个人的效用(U[i])仅依赖于他的净收入(假设没有储蓄，则净收入等于消费C)和工作时间(L)，表示为U(C，L)。另外，政府或者税务当局并不知道每个人的技能水平，也不能够监测到每个人的工作时间，但是能够观察到个人收入Z(Z=ωL)，因而政府可以执行的唯一政策是征税T(Z)。则最优非线性所得税模型可以用以下方程组表示：

其中：β为绝对效用不平等厌恶系数。在已有文献中，社会福利函数主要形式有：简单的功利主义(线性)、罗尔斯主义以及非线性功利主义。

而在文献中，许多学者使用非线性(通常为凹函数，0＜β＜∞)社会福利函数，来考虑社会计划者对效用更公平分布的社会偏好。例如，将效用的自然对数加起来，而不是将效用本身加起来，不公平问题就没有那么突出。这意味着

随着收入的上升而上升，因为

＜0，表明社会福利的边际贡献随着个人效用的增加而下降，将富人收入转移到穷人意味着效用或福利的增加。

从最优所得税文献中也可以发现，通常偏好更公平的社会福利函数对应更高的边际税率。如Mirrlees(1971)采用不同的β值得到了以下最优税率结果：19%(β=0)、21%(β=1)和50%(β→∞)。又如，Atkinson(1973a)[14]在他的数值计算中发现，在Mirrlees模型中，最大最小原则在大多数收入范围内产生了极大的不公平，并且在大多数人口范围内边际税率极大地偏离线性。

不过，也有例外的情况。如Edgeworth(1897)采用功利主义社会福利函数(β=0)，但得到最优边际税率为100%的结论；⑩Phelps(1973)[15]采用了罗尔斯(或最大最小)社会福利函数(β→∞)，发现税率是收入的减函数，大致是从100%开始下降到0。他的结论如此让人吃惊，可以称之为Phelps悖论：最公平的社会福利函数导致了最累退税率结构。所以，由于例外的存在，偏好更公平对应更累进的所得税这样一个广为接受的结论竟然被打破了。

究其原因：Tuomala(1984)[17]认为尽管β=0和β=1两种情况之间的差异很大，但是β=1和β→∞之间的差异相当小，因而没有必要趋于最大最小目标。例如，在ε=0.5，β=1，R=0.1的组合下，也产生了极大的非线性税率。Kaplow(2003)[18]则从理论上对此做出了进一步的解释，他运用收入再分配的边际社会价值这一概念，以凹性来测量相对风险厌恶可能性，详细阐述了效用函数、社会福利函数和收入再分配之间的关系，认为总体收入不平等厌恶系数(CRIIA，总体凹性)不是效用函数相对风险厌恶系数(CRRA，效用函数凹性)和社会对效用分布不平等的厌恶系数(β，社会福利函数凹性)的简单加总，而是以收入关于效用的弹性(η，边际效用关于平均效用的比率)作为后者的权重，即存在以下关系式：

CRIIA=CRRA+ηβ (6)

式(6)表明，凹社会福利函数有一个微妙的影响，在一些情况下可能并不非常重要。(11)

需要指出的是，福利主义也认为个人对他们自己的效用估计可能是不正确的，甚至在他们自己看来，非福利主义(或家长作风)社会福利函数可能是合理的。如Nozick(1974)[19]和Sen(1980b，1995)[20-21]提出的公平理论摒弃了福利主义前提。其中前者主张程序公平，认为只要个人的基本权利得到尊重，这种状况就是公平的。后者认为有必要保障人们获得使他们实现特定功能的物品。这突破了福利主义的框架，发展了非福利主义的思想，对公平问题的认识也更加深刻和全面。当然，接受非福利主义作为一个社会目标标准并不是没有争议的问题。一方面，人们实际上会做出之后会感到后悔的决策，在这种情况下个人希望政府来干预。另一方面，通常认为不应该干扰个人的独立，政府也可能在效用计算中犯类似的错误。Atkinson(1995)[22]认为政府可能追求几个目标，应以一个明智的方法将它们整合起来。Zoli(2005)[23]将贫困最小化这一非福利主义指标纳入福利主义分析框架，建立了一个包含贫困最小化和社会福利最大化的修正社会福利函数。非福利主义目标还有很多，问题的关键在于找到相应测量指标，以及如何将之纳入福利主义分析框架中的方法。

三、论争之二：技能分布形式选择

个人技能(一般假定外生给定)决定了产生收入的能力，而影响技能的要素(例如，遗产、智力、动机和运气)通常不会平均分布，因而税前收入分布往往远离平均，需要运用累进所得税进行收入再分配。Mirrlees(1971)认为税收设计的核心问题在于：税务机关缺乏个人能力的充信息，因而只能使用收入作为衡量能力的唯一指标，但他也承认可以通过一个人显见的智商、学历、谈吐风度、年龄或肤色等指标，来获得其赚取收入潜力的信息，但当然最可靠的指标是他的实际收入。(12)通常可以运用一些数学分布函数来描述工资或收入分布，如对数正态分布和帕累托分布，但各种分布形式在拟合实际分布方面并没有得到唯一的实验证据。

Mirrlees(1971)最早采用对数正态收入分布形式，得到了最优边际税率是“倒U形”的结论。之后，一些学者在此基础上进行了拓展。Phelps(1973)和Sadka(1976)[26]认为在技能分布存在一个最大值的假定下，高收入者最优边际税率为0。但是，对于最高收入分布之前的边际税率是否应该下降并不清楚；Seade(1977)[27]认为收入分布两端的边际税率都为0；米德委员会(Mead COittee，1978)给出了更全面的结论：认为高收入者应该高税率，低收入者低税率，但是在两个极端处(收入最高和收入最低的人群)税率都应该很低；Kanbur & Tuomala(1994)[28]也保留了Mirrlees模型中的对数正态假设，但是模拟了更大标准偏差(σ)的情况。认为σ增加能够改变最优所得税率的定性形式，即σ本身代表了内部不平等的测量。

而Diamond(1998)[29]以帕累托分布代替对数正态分布，且使用拟线性消费偏好，得到完全相反的“U形”税率结构。Saez(2001)[30]拓展了Diamond的高收入者最优税率上升以及在凹效用函数情况下高渐进税率的结论。他采用更一般的处理，使用弹性方法，且假设劳动供给弹性在所有生产能力水平上是固定的。他模拟了美国的数据(工资分布比较好地符合帕累托分布)，在不变的劳动供给弹性以及消费的对数效用函数假设下，发现相对较高收入水平的边际税率上升，渐进税率在50%到60%之间。此外，认为无限收入分布比有限收入分布在致力于高收入者最优税率问题上更令人感兴趣。没有最高收入者，高收入者的0税率从直觉上看不能应用，靠近高收入者的边际税率可能是正的，甚至很大。

一般来说，对数正态分布的尾部较薄，帕累托分布尾部较厚。此外，帕累托分布可以很好地拟合高收入群体，而非整个收入群体。实证结果表明帕累托分布适用于1%至3%的最高收入群体的收入分布，而对数正态分布在很大收入区间范围内拟和合理，但在两端存在极大的发散性。然而，两者都存在弹性无限增加的缺点，这与更大证据表明的上尾存在固定弹性的事实之间存在矛盾。为了避免这一点，Tuomala(2006)[31]使用两个参数的钱珀瑙恩分布(规模参数μ和形状参数θ)，也得到“U形”边际税率结构。但不需要如Diamond(1998)和Saez(2001)那样假设固定的劳动供给弹性。钱珀瑙恩分布在较大ω值上逼近帕累托分布形式，但是它也有一个内部最大值。

从式(4)也可以看到，一方面，工资分布形状通过

来影响最优边际税率。它是某个工资水平ω之上的人口的比重相对于ω工资水平人口比重，如果该比重越高，则边际税率的扭曲越小，因为对于更高收入者的边际税率类似于定额税。换句话说，如果收入分布快速变薄，高收入的边际税率应该是低的，因为我们要考虑激励效果；另一方面，对于典型的密度分布f(ω)以ω为权重对税率产生影响。在对数正态分布情况下，比率随着ω上升而下降，趋向于无限时趋向于0。在钱珀瑙恩分布情况下，这个比率相应伴随着ω上升而趋于常数1/θ。

需要指出的是，能力分布的估计是一个充满危险的任务。首先，从观察到的收入分布中获得能力分布，这项工作需要增加许多假设条件。目前我们还不清楚，这种方法在多大程度上是准确的。其次，通常替代能力的方法是工资，然而每小时工资在高收入分布那里也不是一个简单的概念，劳动收入和资本收入有可能相互交织在一起，导致工资率数据可能是不可靠的，而且工资数据一般不向公众公开，很难获得。最后，可得的工资数据也可能给不出一个清楚的答案。例如，某个工资率分布可能同时适合对数正态分布和帕累托分布两种情况。Tuomala(1990)[32]认为这一结果常常由于有限的实践相关性而大打折扣(被称为“令人惊奇和有争议的”)。严格说来，这一结果只适用于在收入分配的最顶端单个人，这意味着它可能是一个单纯的理论好奇心。而且，高收入者是否存在仍然不清楚(Mankiw et al.，2009)[33]。

四、论争焦点之三：效用函数形式选择

效用函数是个人行为可替代商品束的数学抽象，其以函数的形式给出消费者对消费组合的偏好程度，(13)而为了简化问题通常假设偏好之间是可加的。常见的偏好形式大致可以归为两类：拟线性偏好以及非线性偏好(如对数、倒数和二次函数等)。(14)拟线性偏好属于技术性偏好，利用它我们抽象掉了商品之间效用的相互依存性或者说排除了价格变化带来的收入效应的干扰。(15)

Mirrlees(1971)采用双对数效应函数，其

。在技能的对数正态分布假设下，得到了高收入者边际税率下降的结果。Tuomala(1984)采用倒数效用函数，其

。表明了比Mirrlees更小的曲率。而Tuomala(2010)[34]以二次消费效用函数替代以前模拟中的对数和倒数消费效用函数形式，其本质上采用了比以前更小的曲率，因而发现上升的边际税率结构。

Diamond(1998)认为如果消费偏好是线性的，边际税率的明确公式可能根据工资分布、劳动供给弹性和社会福利函数推导出来。在这种情况下，他发现在某些关键工资水平之上，如果劳动供给弹性固定，工资密度是单峰的以及在某些工资之上是帕累托分布，则边际税率形式是“U形”的。

而Dahan & Strawczynski(2000)[35]认为Diamond(1998)呈现的高收入者边际税率上升的结果依赖于消费效用线性假设，而且模拟结果只集中关注高收入水平，而不是整个税率结构。通过模拟，他认为是消费的效用函数假设导致了最优税率上升(Diamond)或下降的差异(Mirrlees)。如果再加上休闲的对数效用假设，则产生100%税率。而非线性效用函数使高收入者的最优税率降低，甚至在工资的帕累托分布下，边际税率也可能下降。

在线性消费效用函数情况下，因为收入变化不影响需求，所以不存在收入效应，(16)即

=1。但是，线性假设也是限制性的，因为它消除了边际消费效用的下降，而这是解释收入再分配的重要动机。而且，收入效应受到限制，最优税分析以及从中得到的结果被证明相当简单。在这种情况下，技能的分布是税率结构的关键决定因素，以及技能分布在任何拟线性情况下都具有相同的数量影响，税率结构的形状依赖于技能分布在高收入端是否有界。

如果我们假设非线性消费效用函数，高收入者的最优边际税率结构就不清楚。在式(4)中，我们可以看到，一方面，由于标准收入效应

的出现使得最优边际税率下降。消费效用凹性意味着对于富人来说收入效应更弱，这要求对高收入者更低的税率。另一方面，当

随着ω上升而上升时，它对不平等厌恶的影响推动向相反的方向移动。即消费效用的曲率修改了社会边际权重，使得政府隐含更多偏好再分配，这两个力量的交错最终决定了最优边际税率水平。在一般的例子中，由于劳动供给会随着技能的变化而变化，以及收入效应的存在，最优边际税率变得更难解释。如式(4)所示，在以下假设下渐进税率趋于一个常数：固定的劳动弹性，帕累托分布，消费的线性效用函数以及不平等厌恶的社会计划者。相反，一旦我们以凹性的消费效用函数代替线性，则渐进税率不清楚，此时

趋于0，

趋于无限。

需要指出的是，许多最优所得税文献使用一个具有代表性的消费者，且假设只存在工资能力差异，即存在单维异质性。而在现实中，个人在更多特征上存在差异，所有人具有相同的效用函数是非常不可能的。Sandmo(1993)，Judd & Su(2006)，Kaplow(2008c)，Weinzierl(2009)以及其他学者，考察了能力之外的人际间异质性因素的影响，如消费和休闲的偏好差异，相对收入水平等。他们发现额外维度的异质性往往会降低最佳再分配的程度，即边际税率会更低。

五、论争焦点之四：劳动供给弹性(17)及财政需求规模

在传统的最优所得税模拟中通常假设一个固定的弹性，这一假设导致最优税率小于100%。普遍接受的税收政策是：当劳动供给弹性上升时，最优税率应该下降。因为当市民容易受影响和愿意改变他们的工作习惯时，高税率会导致他们减少工作。如式(4)所示，

表示劳动供给在补偿和非补偿弹性中的反应，代表了标准的效率效果。在其它条件相同的情况下，边际税率随着

的上升而下降。由于劳动供给弹性因时因地差异很大，因此一国优化所得税率的确定既是一个理论问题，也是一个经验问题。

Mirrlees(1971)和Atkinson(1973a)在他们的计算中使用对数线性函数，这意味着消费和休闲之间的替代弹性为1；Stern(1976)认为科布道格拉斯效用函数中隐含的劳动供给反应程度过度(替代弹性等于1)，因而高估了上升的累进税成本。认为当使用更合理的劳动供给反应时(替代弹性等于0.4)，最优税率值(在中心例子中为54%)极大地高于Mirrlees发现的数值(通常在22-30%之间，总是低于40%)。在计算模拟的基础上，他得到以下看似合理的结论：非常高的边际税率必须基于非常低的劳动供给弹性，而不是极端的社会福利公平偏好。

不过，Tuomala(1984)采用替代弹性为0.5的CES效用函数，发现结果不同于Mirrlees和Atkinson，认为边际税率没有这么低，税率结构形式对于大多数人口来说是极大地非线性。而且这两个结果都不基于最大最小原则。虽然此时边际税率仍然随收入的上升而下降，但边际税率水平和形状相对于Mirrlees发生了很大的变化。例如，在ε=0.5，β=1，以及R=0.1时，中等和更低收入范围的边际税率更高，中值税率超过60%。

此外，财政需求(R)(18)对最优所得税率也会产生重要影响，这个领域存在相对较少的分析结果(如果有的话)。Tuomala(1984，1990)模拟结果表明：随着净政府支出的增加，边际税率对于大多数纳税人来说都增加。当财政需求下降，尤其是当它成为负数以致得到外部资源时，对穷人的最低收入要求很容易满足，因而不必用高边际税率筹集收入，也可以看到对穷人更低的税率。此外，除了提高或者降低整个税率结构，财政要求在GDP的-10%到10%范围内对边际税率形状基本没有影响。

与最优商品税不同，最优所得税从一开始就包含了公平与效率原则。税率结构中每一个变化的讨论，某种程度上都源自累进税公平与效率原则本身的权衡，但并不容易清楚表达这两个要素相互作用的路径。本文从最优边际税率结构决定公式、模拟结果及经验证据，对社会福利函数、技能分布形式、效用函数形式以及劳动供给弹性等几个方面进行的分析认为。

1.认为更平等的社会福利函数、更小的劳动供给弹性、技能的帕累托分布和效用的拟线性偏好会产生更高的边际税率，这一原来学界普遍接受的观点并不完全成立。这还要取决于其它要素的选择，当各要素交织作用在一起时，有时可能会产生令人惊讶，甚至完全相反的结果。例如，在最公平的罗尔斯(或最大最小)社会福利函数情况下，产生了最不公平的0边际税率；给定帕累托技能分布时，同时会产生下降(结合消费的对数效用函数)和上升的边际税率(结合拟线性对数效用函数)两种相反情况；在消费效用的拟线性或非线性偏好情况下，都可能导致边际税率上升等情况。

2.最优所得税问题是建立在非常严格的假设条件基础上，来求解最优解的，而这些假设常常与现实不相符的。例如，消费者是同质的、只有劳动和消费两种商品、忽略储蓄行为和政府管理成本等，使最优所得税的模拟结果往往并不能付诸于政策实践，因此该理论不具有普遍实践指导意义，各国需要根据自身的政治目的、经济发展、收入分布、文化特征以及社会机制等情况来构建最优税制。不过，正如米尔利斯惊奇地发现最优非线性所得税接近线性一样，当前比例所得税或所得税税率下降的发展趋势，可以看成是最优所得税理论的一个经验反映，即能为各国税制改革提供一定的参考。

最优所得税理论分析和应用研究将继续是经济学家们感兴趣的主题之一，该问题研究得到了极大拓展，但是并不能指望仅靠这类文献来指导实践中最优税制设计。Colombino(2009)[37]认为以往研究理所当然地认为最优所得税问题必须是一个可分析的公式，并与数值猜想或估计一致。作为第一个后果，理论模型必须采取非常限制性假设，以生成分析解。其次，理论结果可能与不同假设下产生的经验估计不一致。因而他采用其它可替代的方法，可以避免严格的理论假设，通过一个反复计算的非常灵活的微观模拟来计算得到解，这或许可以作为今后最优所得税问题研究的新方向。

①面临很高的边际税率时，技能高的人总是比技能低的人选择更少工作并享受更多闲暇。但技能高的人得到的效用至少要与技能低的人一样多，这称为自选择约束或激励相容机制。

②Hindriks et al.(2006)[11]从平均税率视角分析最优所得税问题。认为如果采用帕累托无界分布、最大最小社会福利函数以及拟线性消费效用函数(等弹性劳动供给)或者拟线性休闲效用函数，最优平均税率是上升的。

③这个转变毫无疑问很大程度是由于在更一般的例子中计算的复杂性。此外，Mirrlees(1971)发现，至少在他考虑的例子中，最优非线性所得税率结构近似线性。

④最优所得税文献主要集中于两个问题的探讨：最优边际税率的结构以及收入支持机制的设计。

⑤诸如Tuomala(1984，2006)，Diamond(1998)，Dahan & Strawczynski(2004)[12]等许多学者，都求解出了相似的表达式。

⑥e[c]可以分解为非补偿劳动供给弹性和收入效应两部分，即e[c]=e[u]-I。补偿弹性是假想弹性，这种弹性在商品价格变化后消费者的收入经过调整，因而消费者的效用水平保持不变，即排除了收入效应，使个体实际收入水平不变。非补偿弹性包括价格变化后的替代效应和收入效应。

⑦比较效用大小的标准有：基数效用论和序数效用论。基数效用论认为，效用随着消费者所消费的商品量的变化而变化，而序数效用认为效用是不可计量的，但可以根据自己的偏好顺序和效用水平的高低，对商品的主观效用按此顺序进行排列或分出等级。

⑧但是，它并不完全如此，实际上，它也表现出倾向不太平均的状况，只要这种状况从绝对值上看使境况最差的人受益最多(Stiglitz，2000)[16]。

⑨简单功利主义和最大最小原则是福利主义的特殊例子。我们也可以采用其它的效用函数形式。例如，我们可以按照效用排序时的中位选民效用来判断社会福利。

⑩效用的加总并不是平均主义的，除非我们假设边际效用递减。

(11)经过大量模拟之后，Stern(1976)[24]发现高最优税率的情况依赖于消费和休闲之间低弹性的假设，而不是高程度的不平等厌恶。

(12)Akerlof(1978)[25]将这些指标看成“标签”，虽然他的研究主要致力于缓解贫困，但最近的研究更突出标签在最优所得税体系中的广泛作用。例如，年龄标签(Kremer，2002)，性别标签(Alesina & Ichino，2007)以及高度标签(Manlkiw & Weinzierl，2010)。

(13)偏好的严格凸性意味着效用函数是严格拟凹的。

(14)科布—道格拉斯偏好等价于双对数偏好，它们之间只相当一个单调变换。

(15)Boadway et al.(2000)[36]分析了当休闲偏好为拟线性时，最优非线性所得税率的特征。

(16)这个假设可能更适合高收入水平，因为高收入者可能留下大量遗产，并且不可能根据遗产的确切水平来调节他们的收入。

(17)完全替代的商品替代弹性是无穷大，完全互补的商品的替代弹性为零。

(18)R=1-X/Z视为国民收入变化的一部分。如果X/Z=1，则R=0，即税收起纯粹再分配作用。如果X/Z＞1，表明存在诸如外国资助或国内企业利润等除税收以外的外部资源。如果X/Z＜1，则政府征税为了提供公共品。

标签：边际税率论文; 帕累托论文; 帕累托分布论文; 效用函数论文; 供给弹性论文; 基数效用论论文; 效用理论论文; 弹性福利论文; 消费者偏好论文; 非线性论文; 消费函数论文; 收入弹性论文; 企业税率论文; 线性系统论文;

最优非线性税率结构的影响因素：争论与分析的焦点_边际税率论文

猜你喜欢