数据的检验与衔接,本文主要内容关键词为:数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数据的检验与衔接是统计工作中的一个重要组成部分,做好这项工作,对于提高数据的准确性和透明度,提升数据的使用价值具有重要的意义。西方国家在这方面积累了不少的经验,国际货币基金组织在其2001年出版的《季度国民核算(Quaterly National Accounts Manual)》一书中专门就此问题进行了描述,本文根据书中的有关内容,谈一下国民核算数据的检验与衔接。
数据的检验与衔接属于数据修订的范畴,数据的修订包括因统计方法和基础数据变化而进行的系统性修订和在日常工作中对数据的经常性的修订。本文研究属于后一种情况,应该是在国民核算中经常要做的工作。
数据的检验和衔接是根据数据之间业已存在的关系,运用一定的技术,对基础数据和初步核算结果所进行的检查、校验和衔接、包括发现问题、在多种基础数据及核算方法中确定最佳选择和固定统计误差等。数据的检验与衔接可以发生在核算的所有过程中,包括之前、中间和之后,是国民核算中要求最高的一项技术,也是数据生产的基本步骤。
一、数据的检验方法
检验是数据衔接和调整的基础。对数据进行检验,就是通过一些特定的技术对核算的初步结果进行检验,确定数据中是否存在问题。通常有以下几种方法。
(一)目测检验法
目测检验法是最基本的一种检验方法,是在数据使用之前对数据进行的目测检查,不做任何的补充计算、制表或者制图。这种方法虽然简单,但是也能够通过数据的表面现象,发现一些潜在的问题。如,数据的排列顺序和位数是否符合要求,数字的增长变动是否异常,等等。目测法的特点是能够很快的付诸实践,特别是没有介入原始计算的人更有可能发现数据中存在的问题。
(二)分析检验法
分析检验法是通过附加计算或制作图表来帮助检查数据中的错误,这种方法需要花费时间,但是比起目测检验法能够揭示出更多的问题。分析检验法包括以下几个方面。
1.逻辑检验。逻辑检验是在能够以数学公式或定义为基础建立起相互关系的数据中进行,主要有:(1)总计等于各个构成项目之和。如,国内生产总值=住户最终消费+政府最终消费+固定资本形成总额+库存变动+货物和服务的出口-货物和服务的进口,等等。(2)商品的平衡。即在供给和使用数据分别独立取得的情况下,检查商品的供给和使用之间的关系。商品平衡是在综合供给使用框架(或投入产出)下面,检验数据平衡关系的最有利的工具。因为,在一个经济体内,商品的供给和使用应该是平衡的,也就是说商品的生产量加上进口等于商品的使用量加出口。如果不平衡,则说明数据存在问题。在没有综合供给使用框架的情况下,某些产品的供给和使用平衡也是一个发现不同数据来源中数据错误和不衔接的有效方法,(3)年度数据等于季度数据的合计。季度数据应该与年度数据相互衔接,特别是对没有经过季节调整的数据来说。(4)特殊项目的定义。国民核算中一些特定的数量关系也是检验数据是否存在问题的有效方法。如,隐含的缩减指数=按现价计算的价值量/按不变价计算的价值量,增加值=总产出-中间消耗,等等。
2.似真性检验。似真性检验是对时间序列怎样移动的一种期望,包括对同一时间序列中不同时期的数据怎样移动的期望,以及相互之间存在某种关系的几个时间序到怎样移动的期望。与逻辑检验相反,这种方法对数据的满意程度没有确切的要求,只是对数据的变化进行评价。这种方法要求检验人员对经济发展和统计过程能很好地理解和把握。能够用来评价数据的方法有:(1)对季度指标时间序列运行轨迹的评价。通常,季度指标时间序列的运行轨迹与相应的年度指标的运行轨迹应该吻合。季度指标的似真性检验,就是看反映同一事物的季度指标是否与年度指标的运行轨迹相一致。如果两个指标的运行轨迹存在明显的趋势性增长或下降,则表明季度指标时间序列的移动存在偏差,可能季度指标的代表性存在问题。(2)计算增长变化的百分比。数据的百分比变化是检验数据质量的有效辅助方法。例如,本期数据与上年或历史同期数比较的百分比变化,能够帮助确定在哪些情况下,数据的增长或下降是不正常的,在哪些情况下,数据中一个构成项目的运行轨迹与其他构成项目的运行轨迹不同。(3)计算对增长速度的贡献。对增长达度的贡献可以揭示在总量增长背后的影响因素,而不仅仅是时间序列本身的增长。如,计算公式,这里,X是GDP构成项目的时间序列,A是GDP总量,假如自上期以来,住户消费增加了5个单位。并且上期的GDP是1000个单位,那么,住户消费的变化对GDP增长速度的贡献是0.5个百分点(5/1000=0.5)。(4)计算各种比例关系。如,劳动生产率的计算可以显示投入和产出之间的关系,并且还可以揭示出投入或者产出数据中存在的问题。最通常和简单的是计算劳动力劳动生产率,即每个工作小时或者每个雇员的不变价产出或者增加值。有时候,单独的产出、增加值和就业人数的时间序列,看不出明显的问题,但是它们的移动趋势相互之间可能存在矛盾。在这种情况下,劳动生产率的时间序列就会明显的存在不衔接的趋势,可以帮助我们发现基础数据中的问题。再如,计算具有密切关系的数据之间的比率对数据的准确性进行检验。相互之间具有某种关系的数据,它们之间的比率一般情况下比较稳定。如,消费或储蓄与收入的比率,固定资本形成总额中的建筑安装工程价值与按生产法计算的建筑业总产出之间的关系,同一产业中总产出和增加值的比例,存货占销售额的比重,等等。如果比率的变化出现不稳定的变动,则表明数据可能存在问题。(5)对推导出的数据进行检验。推导出的数据往往容易存在问题,应该受到特别的关注。如,当增加值是通过总产出推导出时,中间消耗就容易存在问题。误差和平衡项也类似,因不是直接计算得到的,经过平衡以后,某些问题往往更加明显了。(6)结合数据的修订进行检验。在对历史数据进行修订时会发现原始数据中的错误。如,数据衔接模型可以揭示出基础数据中有偏差的指标。年度基准与季度估计值的不协调也能够反映出年度或者季度数据在资料来源和方法上的问题。(7)通过图表进行检验。这种方法关注的是数据发生了大的变动而不是相互关系的细微变化。由于通过图一眼就能够看出特别不规则数据的变化,因此,利用图进行分析检验效果比较好。针对分析的不同侧重点,可以分别选用直线图或直方图。
一般地,检验最好能在数据的总量和详细层面上同时进行。因为,数据的不正常变动容易出现在总量层面上。但是,在总量层面上,绝对值比较大的数据的误差不容易被发现。另外,两个数据的误差方向相反并且相互之间能够抵销时,误差也会被隐藏起来。因此,不能忽视对详细层面数据的检验,因为一些问题仅仅出现在详细层面上、应该通过某种方法确定存在问题的构成项目,集中力量找出问题的原因。
二、数据的衔接方法
数据中的问题,与数据搜集有关的,需要通过制度方法改革来解决。比较明显的技术操作问题,应及时采取相应的措施解决。
除此之外,就是对仍然存在问题的数据进行调整和衔接了。数据的衔接在国民核算中尤为重要。因为,GDP的三种计算方法不可避免地带来数据的不一致,同时,核算所需基础资料的多而杂,也是带来数据之间不衔接的一个主要原因。为了保证核算数据的合理和准确,必须对不合理的数据进行调整利衔接。然而,如何调整和衔接,没有国际统一的标准,惟一的准则是采取的方法必须适合本国的实际。
(一)选择最佳基础数据和计算方法
在编制了供给使用表(或投入产出表)的情况下,可以通过逻辑检验法发现详细的行业或产品层次上数据之间的不衔接。在没有编制供给使用表的年份或季度,GDP的误差仅仅在数据加总时才容易发现。这时,很难确定哪个行业或构成项目是产生误差的真正原因。但是,不同形式的误差能够反映不同方面的问题,应当尽快的了解基础数据的情况,确定误差的真正原因,在多种可选择的数据中确定最有代表性的数据,对不合理数据进行替换。
在采用三种方法同时计算GDP时,由于计算方法和基础数据的不同,必然带来不同的计算结果。在基础数据经过了质量评估,核算方法经过了检验的基础上,可以根据基础数据的情况和政府管理部门的需要,确定一种方法作为主要的方法,其他的方论为辅,以保证数据的平衡和质量。我国目前是以生产法计算的GDP为准,支出法为辅。西方国家一般是以支出法数据为主,生产法为辅,但也不尽然。
季度往往只采用一种方法计算GDP,在这种情况下、即便存在问题,数据本身也无法发现和进行平衡。能够保证季度数据误差比较小的选择是,年度的数据必须要经过平衡,也就是说年度核算要在三种计算方法之间平衡,尽量减少误差。这样,在季度数据与年度数据衔接了以后,季度数据的误差便会倾向于越来越小。
(二)固定统计误差
在对基础数据和计算方法都进行了最优选择以后,还有可能存在不可消除的误差。这时,常用的消除误差的方法是将误差固定在一个范围内。这样,误差就不会影响到其他构成项目。通常,是将误差固定在比较大的构成项目,如居民消费,或者不太容易计算准确的构成项目,如存货增加。这样做以后,有误差的构成项目不再是独立计算的,而是平衡后的结果,误差项中包含的原始信息减弱甚至消失了。实际上,这种方法是隐藏误差,问题没有得到根本解决。至少,这个构成项目的名称应该改变一下,如,将存货增加改为“存货增加和误差遗漏”。
另一种消除误差的方法是通过数学方法将误差固定在某些范围内。误差的范围可以是某一组构成项目,也可以是全部。方法包括简单的或反复的比例分配。如,RAS法就是在供给使用表和其他多元衔接环境下反复进行比例分配的一种方法。在哪些范围内进行比例分配,应根据数据质量情况来决定。同样,将误差固定在某几个构成项目中带来的问题是消除了包含在原始数据中的一些信息。
公开公布核算误差也是固定统计误差的一种方法。这种方法,是同时公布两种以上方法计算的GDP。但是要确定以一种方法为主,作为计算GDP的优先选择,其他方法与优先选择方法结果之间的差额作为统计误差。这样的好处是,各个行业或构成项目的加总等于GDP总量。我国目前就是采用的这种方法。
一般情况下,如果误差很小,比例分配法是消除误差的合理方法。但是,在误差比较大,并且不知道原因的情况下,保留误差不失为一种方法,但必须给出一个限定范围,因为误差的不确定性是实际存在的。
(三)衔接
消除数据误差的过程都可以称作是衔接,这里说的衔接特指年度与季度数据的衔接。一般地,大多数国家在进行年度国民核算的同时也进行季度核算。年度核算大多是根据基础数据直接计算,而季度核算由于指标少时间性比较强,则多采用外推的方法。年度核算的资料来源是全面调查和普查,季度的基础数据一般通过抽样调查取得,与年度比较,调查的覆盖面小,指标也较少。由于季度与年度核算所依据的基础数据和核算方法不同,因此,在同一年度中,季度之和往往不等于年度。而理论上,两者应该相等。为解决这个问题,大多数国家是采用数据衔接模型,以年度数据作为基准,使季度之和与年度相等,也就是所谓的季度数据年度基准化。衔接的原理是,根据季度数据之间的比重,将季度之和与年度之间的差额分摊到各个季度中。农业的衔接方法与其他行业有所不同,由于气候的原因,有自然灾害的年份和没有自然灾害的年份之间数据波动很大,这种波动会导致季度时间序列产生“台阶”问题,产生跳跃性变动。对于这种情况,简单的差额分摊法不能奏效,比较好的办法是最小平方法。最小平方法能够在尽量保证季度与年度衔接后的曲线与原始季度时间序列曲线平行的同时,使年度与年度数据之间平滑。
经过对季度数据的年度基准化处理,不同核算期的国内生产总值能够保持一致,季度国内生产总值之和等于年度国内生产总值。