地方政府绩效评价中博弈行为的成因研究&一个分析框架及其初步评述_政府绩效评估论文

地方政府绩效评估中博弈行为的致因研究——分析框架及其初步检视，本文主要内容关键词为：地方政府论文,框架论文,绩效评估论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

绩效评估中的信息失真是一个普遍存在的现象，被评估者的博弈导致了信息失真和行为扭曲，对绩效评估期望的强化问责、优化资源配置、改进内部管理等目标造成负面影响。因此，博弈行为及其对策一直是绩效评估中的重要研究主题。中国地方政府十多年的实践表明，绩效评估同样为博弈行为所困扰，弄虚作假和数据失真普遍存在，有的还比较严重。探讨博弈行为的致因及其反制之道具有重大的实践意义。

本文借鉴西方的研究成果，结合中国的现实情况，构建五因素博弈行为致因分析框架来进行调查分析并提出对策建议。第一部分为分析框架构建与调研问卷设计；第二部分是调查组织实施与信息失真总体状况的判断；第三部分讨论博弈行为致因及其相对重要性的调查结果；最后是进一步讨论和政策建议。

一、分析框架构建与调研问卷设计

国际学界对绩效评估中博弈行为的致因的研究尚未形成普遍共识，但提出了一些各具特色的分析框架和观点，这些为探讨中国政府绩效评估中博弈行为的致因具有启发意义。因此，我们先对这些成果做一简要介绍。

在宣称“首次对组织何时和为何作弊提供了系统理论解释”的论文中，Bohte和Meier以德克萨斯州476个学区考试作弊的严重程度为因变量，通过回归分析确认了导致组织作弊的四个重要因素：(1)资源投入——其他条件保持不变，生均教学投入每增加一个百分点，学校和学区作弊的可能性会降低接近一个百分点；(2)任务难度——其他保持不变，任务多样性指数每增加一个百分点，学校和学区作弊的可能性会增加0.36个百分点；(3)监督力度——外部监督力度不足的组织作弊的可能性比较高；(4)激励机制——包括奖励和惩罚。Fisher和Downes借鉴公共政策的现实评价方法，提出了一个由情境、机制、效果三要素构成的博弈致因分析框架(context-mechanism-outcome configurations-CMOC)。“效果”指组织作弊的可能性及其不诚实程度；“机制”指人的内心想法或动机，它为作弊提供了理由或借口；“情境”主要是组织制度规范和非正式文化等。他们调查确认了对作弊影响最大的四个“情境因素”，然后要求被访者对其相对重要性赋值(总分10分，分配在4个因素上)。结果是：组织非正式文化对作弊的态度得到4.5分；数据操控的严重程度(轻微作弊就可以跨越绩效门槛，还是需要严重不诚实的作弊行为)得2.6分；作弊被发现的概率1.4分；被发现后受处罚的严厉程度1.5分。研究亦表明，“机制”诸因素与作弊倾向和形式之间存在复杂的关系：“对信息失准感到反感”会导致较高的作弊倾向，但作弊多采取“轻度不诚实”的方式；“大力度奖励”不仅会导致较高的作弊概率，而且所采取的多是重新归类、捏造数据等“严重不诚实”的方式。Martin使用心理实验的方法，对大学生考试作弊的原因进行了研究。结果表明：虽然大多数主流宗教包含诚实守信的教义，但“宗教虔诚度”(religiosity)与作弊行为之间没有相关性；社会规范(social norms)对作弊行为的影响最大，“眼见”甚至“以为”周围同事在作弊，行动者作弊的概率就较高。

基于国际有关研究成果，我们构建了一个由五因素构成的博弈行为致因分析框架。各个要素及其与博弈行为之间的作用机理分述如下。第一个要素是“社会规范”。社会规范是一个众说纷纭且含义广泛的概念，但这里的社会规范有其特定的狭义内涵：“人们基于环境感知形成的态度或非正式文化，它可以冲破内在信念、价值观和道德观带来的自我约束，导致特定行为”。换言之，这里的社会规范主要指组织非正式文化对博弈行为的态度，当弄虚作假已形成气候，即使个别主体实事求是也改变不了现状的时候，组织成员就会随波逐流，心安理得地弄虚作假。从众心理和“破窗效应”等理论，实际上对社会规范和博弈行为之间的作用机理做了很好的阐释。第二个要素是“任务难度”。这是一个由任务的复杂程度、现实基础、资源和能力匹配度等构成的综合指数。它与博弈行为的关系是：政治家满足于确认问题而把解决的任务交给公务员，公民对解决这些问题往往抱有不切实际的期望，当面临严重资源约束但又要和其他组织按照同一标准竞争时，公务员就可能用作弊来追求竞争的“公平性”。第三个要素是“监督力度”，包括日常监督、信息公开、数据审计、问责等。监督力度不足的组织容易出现博弈行为，特别是从事客户服务的部门。原因在于：街头官僚直接面对客户提供服务，上级难以掌握充分信息并实施持续和有效的监督，当面临绩效压力并且被曝光的概率比较小的时候，他们就有可能弄虚作假。第四个要素是“激励机制”。不论是正面奖励还是负面惩罚，激励力度超过一定的度会导致博弈行为。杜拉斯学区向“大幅提高学生阅读水平”的教师和校长提供450-1000美元奖励，结果很快发现答案正确率和橡皮使用量出现了惊人的正相关。特别值得一提的是，如果不同绩效档次间存在较大的激励差距，博弈会出现某种形式的“门槛效应”：绩效水平与目标之间差距很小，稍做手脚就可以跨越绩效门槛进而赢得巨大收益，博弈行为发生的概率就更高。第五个要素是对“评估体系的认同度”。按照Fisher和Downes的说法，认同度涉及绩效评估的组织“嵌入度”、成员对绩效评估的态度和对评估诸技术方面的接受程度等。当绩效评估在资源配置和收入分配中发挥重要作用(嵌入度高)时，如果成员认为评估属外部强加，服务于上级控制目标而对社会公众和组织内部管理水平提升没有实质意义，或者认为指标体系缺乏多维度的合理平衡，偏离组织工作重点或导致扭曲，或者对绩效指标缺乏信任(效度不高、分类不当或时效性差等)，那么，博弈就会被视为对“不当”考评体系的“合理抵制”，博弈行为发生的概率就比较高。

上述框架对分析中国政府绩效评估中博弈行为致因具有适用性。换句话说，导致博弈行为的五大要素在中国都不同程度地存在，而且表现出自己的一些特性。以任务难度为例，中国的现实是各地在经济社会发展水平、财政实力和公共服务现有基础方面存在巨大差异；虽然近几年转移支付力度加大，但公共服务均等化依然任重道远，比如不同省份小学教育生均经费投入相差近10倍。如果上级部门用一刀切标准考核评价地方绩效并进行横向比较，博弈行为就会大行其道。再如激励机制，对地方官员而言最重要的激励是获得提拔，晋升锦标赛从GDP增长扩展到其他领域，博弈行为随之扩展。特别值得关注的是绩效评估结果的高调惩罚性使用，比如“一票否决”泛化、“末位淘汰”等做法。高压之下，部门和官员弄虚作假就不难理解。就监督力度而言，评估主体独立性不足，信息公开不足，没有绩效数据审计，弄虚作假很少受到惩罚等，无疑是博弈行为的重要致因。不过，与国外情况相比，五大因素之间的相对重要性如何，还有待大量实证研究去证实。

考虑博弈行为致因的实证研究在国内几属空白，我们选择用问卷调查进行初步探索。问卷内容包括三个部分。第一部分为个人基本信息，主要涉及性别、职业、工作相关性。第二部分为信息失真状况的基本评价，包括对信息失真普遍程度的评价，不同领域绩效信息失真程度的评价，人为弄虚作假在信息失真致因中所占的比重的判断。第三部分信息失真致因是问卷的核心部分，我们做了“一级因素”和“二级因素”的区分。一级因素完全基于上面的五因素分析框架，但根据国情特色、调查对象特点和中文习惯做了一些必要的调适，以保证被调查者能够准确理解其含义。这些下面会专门讨论。第一道题列出五个一级因素，请被调查者分别打分，以确认五个一级因素的相对重要性。在此基础上进一步列了五道题，围绕每个一级因素分别设计了3到4个二级因素请被调查者分别打分，以确认特定一级因素中不同二级因素的相对重要性。评价标尺采用李克特五级量表，要求被调查者从1到到5中选择，打分越高意味着该因素越重要。

根据国情特色和中文习惯对五因素框架做的调适涉及两个一级因素。一个是任务难度。国际相关研究中，任务难度是一个由复杂程度、现实基础、资源和能力匹配度等构成的综合指数，主要通过相关数据的横向对比来确定难度系数，进而通过回归分析确认它与博弈行为的相关性。这样，任务难度具有客观指标的属性。问卷调查完全基于主观判断，如果缺乏多地工作经历或对其他地方情况缺乏深入了解，被调查者的赋值可能完全基于自己在岗位上的感受而非与其他地方的比较。所以，我们把这一因素表述为“绩效目标过高”。以“一手高指标，一手乌纱帽”为特征的“压力型体制”大家比较熟悉或有亲身体验，这一表述易于把握和理解。另外一个调适的例子涉及社会规范，一个众说纷纭且含义广泛的概念。我们没有简单使用社会规范的概念及其学术定义，也没有使用“组织非正式文化对作弊的态度”，而是直接用“大气候下的从众行为”。这一表述有利于被调查者的准确理解，同时体现了社会规范在本文中的特定狭义内涵。问卷第三部分的考察因素及其结构见表l。从中可以看到，博弈致因分析的二级因素同样做了一些必要的选择和调适，以更好反映中国地方政府的实际情况。

表1.博弈行为致因考察因素及其结构

二、调查组织实施与信息失真状况判断

问卷调查于2014年11月至2015年3月在北京大学2012级和2013级MPA班与海南大学2012级、2013级MPA班组织实施。共发出调查问卷400份，回收300份，回收率75%。其中有效问卷257份，有效率85.67%。被调查者来自于全国各大地区，其中华南地区居多，56.0%为男性，75.1%为公务员(包括参公人员)，20.9%承担了本单位的绩效考评工作。

信息失真总体状况评价共设计了四个问题。第一个问题涉及信息失真的普遍程度：“从平时掌握的信息看，您对各地政府绩效考评中信息失真状况的总体判断”，被调查者从“非常普遍、比较普遍、少数地方存在、极个别现象”四个选项中做出选择。结果见表2。相关分析的结果表明，不同性别、职业性质和工作相关性的群体在对绩效失真状况的评价上没有显著差异，表明各个群体对信息失真问题的看法基本一致。

表2.绩效信息失真普遍程度的判断

第二个问题涉及本地信息失真状况的判断：“与各地总体状况相比，您居住地政府绩效考评中的信息失真状况”，被调查者从三个选项中选择。结果见表3。相关分析的结果表明，不同职业性质的群体对这一问题的评价存在着显著的差异(Chi-square=8.815，Kendall′s tau-c=0.093，p＜0.1)，非公务员群体对本地绩效信息失真程度严重性的判断要高于公务员群体自身的判断，而不同性别、不同工作相关性群体在本地绩效信息失真状况的判断上没有显著差异。

表3.本地绩效信息失真状况判断

第三个问题涉及不同工作领域信息的相对真实性或信息失真的相对严重程度：“就各地官方公布的数据看，您感觉下述领域中绩效信息的真实程度。”工作领域包括经济增长(GDP)、医疗卫生、生态环境、教育等六个外加公民满意度数据，选项包括“基本真实、失真存在但不影响总评价、失真问题比较突出、最不靠谱”。结果见表4。GDP增长数据、住房价格信息、教育、社会治安这四个方面被普遍认为“信息虽然失真但不影响总评价”，而医疗卫生、生态环境、公民满意度等方面则被认为存在着比较突出的信息失真问题。进一步的，通过对各项加权平均值的比较可以看出，公民满意度和生态环境数据被认为失真最严重，社会治安数据相对最可信。

表4.不同领域信息失真的相对严重程度

A：总频数256是因为一个被调查者漏填了住房价格项。

B：表中加权平均值的计算方法是：(“基本真实”频数+“失真存在但不影响总评价”频数X2+“失真问题比较突出”频数X3+“最不靠谱”频数X4)÷总频数。

第四个问题是“排除信息技术限制等客观原因，您认为人为弄虚作假在信息失真中所占得的比重”，被调查者从五个选项中选择。结果见表5。总体上人为弄虚作假被认为信息失真中占比50%左右，选择四成和六成的判断占大多数。在这一点上，不同性别和不同工作相关度的群体对此判断没有显著差异，而不同职业群体的受访者则对此问题有显著不同的看法(Chi-square=5.663，Kendall′s tau-c=0.016，p＜0.05)，非公务员群体对人为弄虚作假因素所占比重的判断明显高于公务员群体。

表5.导致信息失真诸因素中人为弄虚作假所占的比重

三、博弈行为致因调查结果与分析

博弈致因的相对重要性是问卷调查的核心。我们选择的是五个一级因素和每个一级因素中诸二级因素分别独立打分的方法。五个一级因素相对重要性的问卷调查结果见表6。从加权平均值看，大气候下的从众行为被视为导致博弈的第一因素，监督力度不足则是博弈行为的第二大致因，两者的相对重要性明显高于其他因素；绩效目标过高的相对重要性则最低。

表6.博弈致因五个一级因素的相对重要性

A：总频数256是因为一个被调查者漏填了从众行为项。

B：加权平均值计算方法是：(选择“1”频数+选择“2”频数X2+选择“3”频数X3+选择“4”频数X4+选择“5”频数X5)÷总频数。

我们对问卷数据做了方差分析，以确认个体特性(性别/职业性质/工作相关性)在各项评价上是否存在显著差异。结果发现，性别和职业性质在各项博弈因素重要性的评价上不存在显著差异，而工作相关性则对“考核体系缺乏认同”这一因素重要性的判断有显著影响(

=3.25.p＜0.1)：承担了单位绩效考核工作的群体对这一因素重要性的判断要低于未承担考核任务的群体，两者的得分均值分别为3.04和3.38。这种不一致也容易理解，因为问卷中的问题表述隐含一个因果链条：考评体系存在一些重要缺陷，这些缺陷导致认同度不足，缺乏认同导致了博弈行为。考评体系存在重要缺陷就成了选择的逻辑前提。承担本单位绩效考评工作的被调查者，当然不会认为自己的劳动成果是博弈行为的重要致因。

下面考察各一级因素内的二级因素的相对重要性。前已提及，问卷中围绕五个一级因素设了五道题，分别进行二级因素相对重要性评价，每题的问题格式基本统一：在导致XXXX(一级因素)的下列原因中，请您为其相对重要性打分(分值越高越重要)。简便起见，我们把五道题的相关结果整合成为表7。

表7.各一级因素内相关二级因素的相对重要性

注：加权方法同表6.

二级因素的相对重要性同样利用加权方法进行处理，从平均得分排序及其差距两个角度进行考察。从表7可以看出，绩效目标组三个二级因素中，“考评指标设定存在‘一刀切’的简单化倾向，没有充分考虑各地的环境和条件”平均得分3.84，明显高于“领导和上级交办的临时性任务太多，无法集中精力完成既定目标”的3.35。从众行为组三个二级因素平均得分差距不大，但“领导出于政绩动机要求或暗示弄虚作假，大家只能服从”位列第一，也许是一个值得关注的问题。另外一点也值得关注，“所在部门其他单位”弄虚作假比“其他地方”的弄虚作假更容易引起从众博弈行为。考核体系认同组中，“外部强加和控制取向”(3.65)、“考核指标体系存在问题”(3.63)两项平均得分相差很小，但与“偏离组织工作重点并导致扭曲”(3.20)之间的差距比较大。监督力度组四个二级因素在平均得分上差距不明显，值得关注的是“被曝光后责任人没有受到惩罚”得分最低即相对最不重要，而“官方权威机构对绩效数据核查审计、曝光和处置”得分最高，意味着它被视为强化监督力度的首选。激励机制组三个二级因素中最值得关注的是平均得分上的差距，“在乎组织对自己工作的评价，这会影响以后的发展”得分3.79，而“为了得到自己该得的奖金份额”仅得2.90分，是16个二级因素中得分唯一低于3的选项。

四、引申讨论与政策建议

选择信息失真“非常普遍”和“比较普遍”的两项加总占被调查者总数的84%，反映了中国地方政府绩效评估中信息失真的严重性。45.5%的被调查者认为人为弄虚作假对信息失真的“贡献率”为60%左右或者以上，意味着博弈行为被普遍视为信息失真的重要原因。相关性分析发现，非公务员群体对“本地绩效信息失真程度严重性”的判断和“人为弄虚作假因素所占比重”的判断要明显高于公务员群体，更意味着政府绩效信息在社会面临着严峻的公信力挑战。公务员群体对绩效信息的信任赤字会降低考评体系认同度从而加剧博弈风险，而社会公众对绩效信息的信任赤字则有违通过绩效评估构建人民满意的服务型政府的目标。这些发现再次证明，探讨博弈行为致因及其防范之道非常必要和迫切。

我们曾撰文对绩效评估中博弈行为防范的理论和国际经验做了系统讨论。本调查的一些发现和结论与国际研究结论有相似也有不同。中国地方政府绩效评估中博弈行为表现出哪些特点？特殊国情下博弈致因的相对重要性有何不同？我们的一些调查结论和国内的一些主流看法也有不同。下面对这些不同做进一步的讨论和解释。

第一，现有国际文献鲜有公民满意度测评中博弈行为的专门研究成果，而我们的调查中选择公民满意度“失真问题比较突出”和“最不靠谱”的达到了被调查者的72%，表明我国地方政府绩效信息中公民满意度数据的公信力最低。这是调查发现的中外之间的最大区别。理论上，公民满意度信息失真表现在两个层面：一是公民实际满意状况与报告的满意状况之间的差异；二是公共服务的“客观”质量与公民“感知”质量(满意度)之间的差异。虽然满意度主观指标的“效度”或主观客观评价之间的“契合性”一直是争论不休的问题，但国际研究的关注点一直在“客观”质量与公民“感知”质量之间的差异，信息失真和博弈行为没有进入学者的研究视野。满意度测评中的博弈行为是中国特有的现象，这一现象背后有其特殊原因。我们从中国特有的三角关系(上级官员、下级官员、普通公众之间的关系)角度对此作了阐释，但还需要进行实证验证。

鉴于“被满意”、“伪民调”等在国内成了热门词汇，一些单位组织了满意度数据公信力的调研。比如，2009年3月中国青年报社会调查中心对全国31个省、区、市13331人的调查显示，对各种民意调查结果43.8%的人表示相信，26.8%的人不太相信，29.5%的人表示不好说，要看是哪里做的调查。本调查得出的72%的数字显示，满意度数据面临的“信任赤字”要严重得多，远高于上述调研结果。这一巨大差异可能有多种原因：公民满意度只是民意调查的类型之一，公共服务需求、社会事件关注度等方面的民意调查数据可信性高一些，从而拉高了平均可信度；我们的调查针对的是地方政府报告的公民满意度，民意调查结果则包括商业调查和独立第三方调查的结论，这些数据的可信性相对高一些，同样会拉升平均可信度；我们的调查样本量小，公务员为主且年龄段集中。不论差异出于何种原因，不论哪一种数据更接近于客观真实，公民满意度数据公信力低是不争的事实。在中央推进群众路线教育，强调“把群众满意不满意作为衡量各项工作的根本标准”的大背景下，这一问题值得反思和深入研究。

第二，就博弈致因五个一级因素的相对重要性排序而言，本调查得出的结论与国际相关成果比较接近，虽然国际研究使用的因素框架有很大不同。从众行为(社会规范)位列第一，但没有像Fisher和Downes那样在相对重要性赋值中远超其他因素。监督力度不足处于第二位，也与国际相关研究成果接近。值得关注的是“绩效目标过高”(任务难度)，我们的调查结论不仅与Bohte和Meier的研究结论有着明显差异，而且不符合笔者调查前的预期。其原因可能有三点：一是Bohte和Meier的研究基于客观数据的因果分析，我们的调查只是主观判断；二是我们的预期基于“压力型体制”和“晋升锦标赛”相关研究成果形成的印象，但近几年中央淡化了GDP考核，目标过高作为博弈致因的相对重要性随之下降；三是调查对象年龄集中在25-35岁之间，可能极少数人承担正职领导职务，而目标是否过高单位正职应该最有体会。从众行为组三个二级因素中，“领导出于政绩动机要求或暗示弄虚作假，大家只能服从”位列第一，也许从一个侧面印证了领导承受着高目标的压力。

第三，博弈致因二级因素相对重要性调查的问题更多立足中国环境，因而难以和国际成果进行系统比较。但调查得出了一些有价值且值得深入研究的结论。首先是监督力度，“官方权威机构对绩效数据核查审计、曝光和处置”被视为强化监督力度的首选，这与国内外多数研究成果有所不同。发达国家已经叠床架屋设立了多种权威机构进行绩效数据核查审计，因此对官方权威机构的期待不会成为重点关注因素。国内现有文献中，强化监督力度的着力点首推“独立第三方评价”，其次是加大对违规行为的处罚力度。本调查得出的结论有所不同。究其原因，学界最为推崇的独立第三方评价已经实施了数年，信息失真现象似乎没有明显改变。在经费完全依赖被评估单位的情况下，独立第三方的“独立性”难以得到保障。即使上级政府委托的独立第三方评价，地方收买或利诱市民按照“标准答案”回答的现象屡见不鲜。一个标准答案是：“无论实际家庭人均年收入多少，农村居民必须回答8500元，城镇居民必须回答16500元；无论是否参加社会保险或保障，都必须回答参加了；无论对住房、道路、居住环境是否满意，都必须回答满意”。弄虚作假使得相关地方在民意调查中获得佳绩。标准答案获得的数据必然违背最基本的常识，居然成功逃脱了“专业”调查机构的审视和质疑！个中缘由有待考察，但学界青睐的“独立第三方评价”在被调查者眼中不那么重要，恐怕也是情有可原。至于加大处罚力度，虽然目前缺乏权威机构对绩效信息进行核查，但媒体对弄虚作假行为多有披露，当事者也没有因此受到惩处。由此引出一个基本问题：谁来实施处罚不明确，加大处罚力度就是一句空话。被调查者对权威结构的期待，看来也就顺理成章。

另外一个值得关注的是从众行为中的领导角色。Fisher和Downes把组织亚文化对作弊的态度视为博弈行为的首要影响因素，其中提到了“一些组织的态度会随领导人变动而变化”，但没有明确领导的角色是被动容忍还是主动怂恿。我们的调查发现，“领导出于政绩动机要求或暗示弄虚作假，大家只能服从”在从众行为组中被视为导致弄虚作假的第一因素。领导施加压力甚至逼迫相关部门修改统计数据时有所闻，如果上述结论被后续研究所证明，那就需要从制度规则和官僚文化特征等方面做进一步研究并提供解释。

还有一点涉及考评体系认同度，考评体系的外部强加特征得分最高，可以认为这是体系认同差的最主要根源。上文一级因素的相关性分析中，承担考评任务的人员对体系认同度差的赋值要显著低于未承担考评任务的群体。两点发现结合起来似乎表明，考评体系设计中被考评者的参与不足可能是一个问题，或者考评体系确立后与被考评者的有效沟通尚待改进。

在对调查结论与国内外现有成果的主要不同之处做了讨论和解释之后，下面基于理论研究和问卷调查结果，提出绩效评估中防范博弈行为的几点政策建议。

第一，提高监督力度。首先是考虑设立官方权威机构，对绩效数据进行核审、曝光和处置。发达国家政府赋予多种机构调查核实绩效数据的权利和职责。以英国的医疗卫生系统为例，除审计办公室负有绩效信息审核职责外，内阁办公厅的服务供给小组(Prime Minister′s Delivery Unit)、财政部、公共卫生委员会(Healthcare Commission)、公共卫生改进委员会(Commission for Health Improvement)等近20个机构都承担绩效数据的调查分析和审核职责，独立发布自己的调查报告。多元主体监督的理论基础是组织的冗余理论(redundancy theory)，核心是多重保险提高系统的可靠性，避免单一监督机构“被俘获”与被监督部门合谋导致的“审计漏洞”(audit hole)。中国绩效评估的一些数据有违基本常识，地方政府的博弈策略媒体上时有披露，但弄虚作假者都没有受到应有的惩处，官方权威机构的缺失或相关职责不明晰无疑是一个重要原因。其次是制定制度规范，加大信息公开的力度。这不仅有助于提升调查结果的公信力，而且能促进调查评估机构不断改进调研方法和技术。

第二，推进绩效评估的个性化或差异化。国际研究表明，“任务特性”与博弈行为有着直接的关系。我们的调查中“绩效目标过高”并非位列前两位的博弈致因，但“指标设定没有充分考虑各地的环境和条件”在二级因素中平均得分最高(3.84)，表明“一刀切”的简单化倾向受到高度关注。推进差异化绩效评估，就是取消用统一标准考核并进行横向比较，取消统一化的达标考评，把考评重点和目标值与地方的实际条件结合起来，针对个体设计“挑战性和可行性合理平衡”的目标体系，从而消解博弈行为的动机。实际上，有关部门和地方一直在探索差异化的绩效评估：2010年国务院《全国主体功能区规划》发布以后，国家发改委明确“十二五”期间的考核指标根据区域划分相应地分为四类。在差异化考核的基础上，淡化横向比较，不设绩效指标下限，重点考核“增值”即绩效持续改进状况。

第三，加强公民满意度测评的制度规范建设。满意度数据失真最严重是调查发现的中外之间的最大区别，需要特殊的措施予以防范。政府绩效评估已经实施了十多年，中央为推进绩效管理设立了部际联席会和相应的工作部门，但相关制度规范建设远远不能适应实践的需要，绩效评估立法成为学界关注的热点之一。我们认为，绩效管理系统立法的时机尚未成熟，但相关制度规范建设已经刻不容缓。就公民满意度测评而言，首先是调查主体资格的制度规范。政府下设民调机构的调查结论用于内部决策和政策评估没有问题，但作为公民满意度调查结果对社会公布，其公正性必然会受到质疑。要避免公信力挑战，应该在调查机构的独立性方面设立可操作的规则。其次，应制定民意调查基本技术标准方面的规范。以满意度调查的选项设置为例，不同的选项结构会导致大相径庭的调查结果，选项结构操控于是成为地方官员的博弈策略之一。我们难以理解的是，许多满意度调查是国家统计局派驻地方的调查总队实施的，为什么各地的选项结构既不统一，又不和国际接轨，甚至经常变化使之难以进行横向和纵向比较？调查总队面临压力或“被俘获”是可能的解释之一，但承担业务指导职责的国家统计局没有出台统一的标准规范，应该说难辞其咎。

第四，加强社会规范建设，创造诚实守信大环境。社会规范建设在防范博弈行为中的极端重要性已经为国内外研究所证实。基于环境感知形成的态度或非正式文化可以冲破内在信念、价值观和道德观带来的自我约束，导致弄虚作假的不当行为。这一结论并非用环境决定论为弄虚作假者开脱个人责任，而是强调环境建设的重要性。对于影响深远的“小过错”，小题大做是非常必要的，以防止“破窗效应”或“千里之堤，溃于蚁穴”。坦率地说，目前的大环境并不是很乐观，但完全可以借鉴重拳反腐的做法，划定一个时间界限，对新阶段依然不收手继续弄虚作假者严加惩处，扭转不良风气并最终形成诚实守信的大环境。

借鉴Mears和Webley提出的“意愿、能力、胆量”分析模型，我们把国际文献中博弈行为的五种防范策略归为三大类：“完善激励机制”和“提高评估体系认同度”主要解决的是作弊“意愿”问题；“优化绩效指标体系”主要解决“能力”问题，即压缩绩效指标可注水或可操纵空间，使那些“诚实的试探者”难以付诸行动；强化监督力度则针对“胆量”问题，提高作弊的曝光率和加大处罚力度，使诚实守信成为多数“理性经济人”在外部约束下唯一理性的选择。社会规范建设的归类比较复杂，应该说是四个防范策略共同作用的理想状态，即通过综合努力，造成一种不愿、不能、不敢弄虚作假的社会大气候。我们期待这一天的早日到来。

最后说明一下，本研究的局限性是显而易见的：样本量比较小，样本结构在职业、年龄、地域等方面代表性不足。不过，本文重点是中国国情下博弈致因研究框架的构建，问卷调查属于这一框架的尝试性应用或适用性检验。因此，调查中的一些发现和解释应被视为值得关注的问题、有益启示或假设，而非经验证的理论结论。我们期待框架的不断完善和问卷调查范围的扩大和不断深入，更期待基于客观数据的博弈致因量化分析，从而为探讨适合国情的博弈防范策略、建设诚实守信的大环境做出理论界的贡献。

标签：政府绩效评估论文; 绩效目标论文; 组织公民行为论文; 组织绩效论文; 群体行为论文; 工作分析论文; 工作绩效论文; 公民权利论文; 工作满意度论文; 博弈论文; 规范分析论文; 社会因素论文; 工作规范论文; 差异分析论文; 工作选择论文; 社会认同论文; 绩效奖金论文;

地方政府绩效评价中博弈行为的成因研究&一个分析框架及其初步评述_政府绩效评估论文

猜你喜欢