基于六五大众化的城市化人口数据修复_统计口径论文

基于六普、五普的城镇化人口统计数据修补，本文主要内容关键词为：统计数据论文,城镇化论文,人口论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

我国城镇人口的统计口径频繁变化。2000年的五普、2010年的六普均采用市镇常住人口作为统计范围，与1982年三普、1990年四普的统计口径存在很大出入，这导致根据普查结果得到的城镇人口比重数据与统计局在各普查年度之间公布的城镇人口比重数据存在很大差值，也导致根据统计局年度发布的城镇人口比重数据存在很大跳跃性。同时由于各普查年度之间人口变动抽查误差，也导致普查年度城镇化人口比重数据与上年度基于人口变动抽查的年度城镇化人口比重数据存在较大差值，因此，有必要对普查年度之间的各年度城镇人口比重数据按照同一统计口径进行修正。

一、城镇化人口比重统计数据误差

由于在我国对人口统计存在普查、1%人口抽样调查、更小样本的年度人口变动抽样调查，各期人口普查和人口抽查统计口径又常存在差异，因此，各普查年度与期间的人口变动调查年度之间城镇化人口数据必然存在统计差值。

对照三普、四普、五普、六普，以及1995年和2005年1%大样本抽样的城镇人口数据，我们可以看到基于不同口径的城镇化人口比重数据存在明显差值。考虑1990年四普的城镇人口统计口径与1982年三普的城镇人口统计口径的差异仅仅在于城镇空间范围划定，易于根据原始数据重新调整，所以国家统计局根据四普口径重新校正的1982-1989年城镇人口比重数据基本上符合四普口径的各年度实际城镇化人口比重数据。我们关注1990年后五普与四普之间、六普与五普之间各年度城镇人口比重的差值，这两段时期城镇人口统计差值产生的原因有两个方面：其一为统计口径变化，特别是自2000年五普起开始对市镇人口统计采用常住人口口径，并且尽可能剔除了市辖农村部分人口；其二为小样本抽样调查由于样本选择导致的统计误差。

1.2000年新老统计口径之间的城镇人口比重差值

2000年五普采用不同于四普的城镇人口统计口径（1991-1999年人口抽查均按该口径），因此，必然导致基于新口径的2000年城镇人口数据与基于老口径的1990-1999年城镇人口比重数据存在差值。例如根据四普统计口径实施的1991-1999年人口抽查，1999年底全国城镇人口为38892万，占全国人口比重为30.89%①,9年间城镇化年均增长速度为0.5个百分点[（30.89-26.41）/9=0.497777]，2000年继续保持0.5个百分点的平均城镇化速度，则2000年按照四普老口径统计的城镇人口比重将达到31.39%（30.89+0.5=31.39）。但2000年按照新标准统计的五普城镇人口比重数据与1999年按照四普口径公布的数据相差5.2个百分点，2000年新老两种口径的城镇化人口比重相差4.7个百分点（36.09-31.39=4.7）。

2.2010年新老统计口径之间的城镇人口比重差值

根据国家统计局发布的六普公报，2010年11月1日我国城镇人口达到66557.53万，城镇化率达到49.68%，而根据人口变更调查发布的来源于中国统计年鉴人口的数据，2009年末我国城镇人口仅为62186万，城镇化人口比重仅为46.59%，2010年（六普）与1999年（变更调查）城镇人口比重差值达3.09个百分点，很显然2010年城镇化速度不可能如此之快，按照2005-2009年间统计局发布的基于人口变动调查数据得到的0.91%的城镇化速度，假定2010年保持不变速度，按照人口变动调查数据惯性，2010年城镇人口比重为47.5%，则按照六普口径和按照人口变动调查数据惯性口径推算的2010年城镇人口比重差值达2.18个百分点。

二、已有的城镇化人口比重数据修正方法

很显然，2000年、2010年城镇人口比重存在新老两种口径的差值不能集中在一个年度内消化，必须要对以前各年度数据进行修正。如何修正城镇化人口数据，理论界有多种意见。公开发表的修正方法主要来自两方面，其一为国家统计局的调整方法[1-2]，其二为周一星等学者的修补方案[3-4]。各种修正方案结果如表1所示。

1.国家统计局城镇化人口比重调整方法

国家统计局自2002年度中国统计年鉴开始对1991-1999全国城镇人口和城镇人口比重数据发布了校正数据。1991-1999年城镇人口比重数据分别由26.37、27.63、28.14、28.62、29.04、29.37、29.92、30.40、30.89校正为26.94、27.46、27.99、28.51、29.04、30.48、31.91、33.35、34.78，但具体修正依据则没有公布。

从国家统计局发布的校正数据看，2002年度的数据校正存在几个明显硬伤。

（1）保持1995年1%大样本抽样数据不变，但1995年1%抽样调查仍然基于四普口径，而1995年我国人口城乡迁移特别是劳动人口城乡迁移政策比20世纪80年代和20世纪90年代初大大放宽，导致实际的城镇人口中已经存在大量外来农业户籍的农民工人口，因此，保持1995年1%抽样数据统计口径与实际的城镇化人口明显不符。

（2）为了保持1995年城镇人口比重数据不变，使得校正后的各年度城镇化速度以1995年为分界线出现明显台面式跳跃分布，1991-1995年间年均城镇化速度仅为0.526个百分点，而1996-2000年年均城镇化速度则高达1.436个百分点，而实际上20世纪90年代前期特别是1992-1995年间正是我国经济高速增长时期，期间城镇化速度快速增长，而20世纪90年代后期特别是1997年金融危机以后，我国城镇经济增长和城镇就业反而有所低迷，实际的城镇化速度应有所缓和。所以国家统计局的校正数据因为与实际数据相差太大，其出台后一直受到各界责难。

2.周一星等提出的城镇化人口比重数据修补方案

针对两种口径城镇化人口比重数据差值和对国家统计局校正方案的质疑，周一星等学者提出修补方案，其数据修补的核心方法是采用联合国数据预测法来进行修正，首先选择代表年份计算两个代表年份之间城乡人口增长率之差，然后假定年度之间保持S型逻辑斯蒂惯性城镇化增长速度趋势，计算各年度理论城镇人口比重数据，考虑中国各年度经济增长波动，再利用国家统计局基于原有口径计算的下一代表年前年度数据与上一代表年度数据估算基于原有口径的各年度理论数据，利用各年度变更调查数据与基于原有口径的理论数据，形成各年度修正系数。

该方案较之统计局方案存在明显改进，但也存在一些明显的不足。

（1）最后一个修正年度无法得到基于原有口径的修正系数，该年度被迫采用理论值。由于周一星文章中修正系数采用原有口径实际值与理论值的比值作为对新口径理论值的修正系数，必然导致最后一个修正年度原有口径理论值与实际值一致，无法得到该年度有效的修正系数。例如考察修正1991-1999年数据理论值的修正系数，由于基于四普的理论值只能根据1990年、1999年实际发布的数据计算得到，1999年是最后一个基于四普发布的实际数据值，按照1990年、1999年实际数据推算的基于四普理论值只能推算到1998年，无法得到1999年度的修正系数。使得周一星文章中1999年的修正值被迫保持理论值不变，导致基于实际城镇化的数据修正无法反映1999年的实际速度波动。

（2）对1990年末、2000年末城镇人口数据理论估算方法可能使用得不恰当。由于1990年普查时间为1990年7月1日，2000年普查时间为2000年11月1日，时间差度为125个月或31/3年，而周一星文章中直接约数为10.33年，由于跨度10年之久，0.0033333的年度周期差异也导致给予两次普查计算的年度城镇化速度和城镇人口比重理论值出现不小的误差，因此，精确的研究应该回避这种理论计算上的误差。

三、本研究的城镇化人口比重数据修正方法

基于现有城镇化人口数据修补方案存在缺陷，有必要提出更合理的修补方案。本文以周一星等人的修补方法为基础对我国城镇化人口数据提出再修正的修补方案。本文方案同样分为两个过程。

1.城镇化人口比重理论值估算

利用联合国方法来计算基于S型逻辑斯蒂曲线惯性趋势的各年度城镇人口理论值。该方法是根据S型逻辑斯蒂曲线关系推导的，根据已知的两个代表时期的城镇人口和乡村人口，求取城乡人口增长率差，假设城乡人口增长率差在预测期保持不变，则向外推可得预测期末的城镇人口比重，向内推可估算代表期之间各时期的城镇人口比重。具体计算方法如下。

首先，用式（1）求两个代表期间的城乡人口增长率差：

其中，URGD为城乡人口增长率差，PU（1）为上个代表期的城镇人口比重，PU（2）为下个代表期的城镇人口比重，n为两个代表期之间的时期数。

其次，用式（2）估算两代表期之间各时期的城镇人口比重：

其中，Pu（t）为t期的城镇人口比重，t为距离上个代表期的时期数。

由于实际应用中，代表期的城镇化人口比重数据并不直接以年度作为细分时间跨度，两个代表年的普查数据往往在不同月份不同日期进行，为了充分考虑两次人口普查之间的时间跨度差异，本文将按照两个代表期间的最小细分时间跨度分期，再根据各年度末上个代表期的时期差异计算各年度末的城镇人口比重理论值。例如1990年四普、2000年五普分别于1990年7月1日和2000年11月1日进行，因此，两次普查数据按照125个月度报告周期分布推算，1990年末数据为以1990年普查数据为基期的第6个报告期数据，其他各年度年末数据以此类推，2000年末数据应该为以1990年普查数据为基期的第126个报告期数据或以2000年普查数据为基期的第1个报告期数据。

2.对城镇化人口比重理论值的修正

很显然由联合国方法得到的城镇人口比重数据，实际上是在假定城镇化速度按照S型逻辑斯蒂曲线惯性变化，属于对数据的理论模拟。而实际城市化进程中，由于各年度经济发展速度的波动，城市所能提供的就业机会和居住条件也在各年度之间存在波动。因此，联合国方法得到的理论城镇化人口数据还需要结合实际经济运行进行修正。

考虑国家统计局在普查年份、1%大样本抽样调查年份之间公布各年度根据人口变动小样本抽样得到的城镇化数据，由于各年度数据均为国家统计局根据当年抽查得到，能较好反映年度之间城镇化速度波动变化，仅仅由于统计口径或抽样样本过小导致差值，因此，可以利用两个代表年度期间根据人口变动抽查发布的各年度城镇人口比重速度数据对理论值进行修订。具体修订方法也包括四个步骤。

首先，利用待修正期间根据人口变动抽查发布的各年度城镇化速度数据（城镇化速度=本年度城镇人口比重-上年度城镇人口比重），计算期间平均城镇化速度。

其次，计算各年度根据人口变动抽查发布的各年度城镇化速度与期间平均速度比值，即可以形成反映各年度城镇化速度变化的城镇化速度修正系数。

再次，利用城镇化速度修正系数乘以各年度城镇化速度理论值（城镇化速度理论值=本年度城镇人口比重理论值-上年度城镇人口比重理论值），得到修正后的城镇化速度值。

最后，以上年末理论值为基数，加上本年度修正后城镇化速度值，即可以得到各年度修正后的城镇化人口比重值。

四、城镇化人口比重数据修正

根据上述城镇化人口比重修正方案，我们基于五普、六普数据对我国相应年度城镇化人口比重数据实施了修正。

1.1991-1999年城镇化人口比重差值数据修正

关于如何处理分配2000年新老统计口径形成的城镇化人口比重数据差值，周一星等提供了两套方案[6]，第一套方案主张以1990年四普作为修正起点，另一套方案主张以1982年三普作为修正起点，并且建议采用第二套方案即以1982年作为数据修正起点。本文认为采用第一套方案较为合理，其理由有三。

（1）尽管我国改革开放始自20世纪70年代末、20世纪80年代初，但对农村人口乡城迁移限制政策的大幅度改革应在1992年邓小平南方讲话以后，所以大规模的乡城导向人口迁移也应发生在20世纪90年代以后，20世纪80年代严格的户籍管制和商品粮管制不可能为大规模乡城人口迁移提供空间。

（2）20世纪80年代我国城镇化政策强调小城镇发展，这一时期是我国小城镇包括集镇大规模发展时期，按照五普、六普城乡人口统计口径城镇人口不包括集镇人口，另外该时期我国经济发展的一个重要特征是乡镇企业大发展，“村村点火，户户冒烟”，劳动人口实现了从农业向工商业转移，但其生产生活空间仍然保留在农村，所谓“离土不离乡、进厂不进城”。所以基于城镇空间的城乡人口统计而不是基于非农就业的人口统计，不应高估该时期的城镇化速度。

（3）根据第二套方案，1982-1990年的8年间城镇化年均速度为每年提高0.89个百分点，而1990-2000年的10年间城镇化速度为每年提高0.79个百分点，很显然与1992年以后出现的快速增长的农民工浪潮不一致。

我们对1991-1999年的城镇化人口比重数据进行修订，以1990年四普和2000年五普数据作为代表期数据。四普数据中1990年7月1日城镇人口比重为26.23%和五普数据中2000年11月1城镇人口比重为36.09%，按照1990年7月1日-2000年11月1日125个月度周期计算，代入（1）式可得到URGD=0.00370070660808。再代入（2）式，得到各年度末的理论修正值。根据1991-1999年统计局发布的各年度城镇人口比重数据（基于四普口径的人口变动抽查得到），再计算各年度发布的城镇化速度和期间平均速度，计算各年度发布城镇化速度与期间平均城镇化速度之比形成各年度城镇化速度修正系数，最后通过计算城镇化速度理论值与速度修正系数的积得到修正后的城镇化速度值，修正后上年度城镇人口比重与当年城镇化速度修正值之和即得到当年城镇人口比重的修正值。

数据修订结果见表2，它基本上反映了我国20世纪90年代人口城镇化的变化趋势，因为治理整顿，1990-1991年经济调整加剧，导致了1991年城镇人口比重负增长，1992年由于年初邓小平南方讲话，再次掀起了改革开放的高潮，一系列与人口迁移特别是劳动人口迁移相关的制度被改革，如商品粮管制逐渐放松，使得1992年人口城镇化速度迎来爆发性增长，整个20世纪90年代国家对农民工基本上采取放松紧缩交替的试探政策，也使得这一期间城镇化速度波动明显。

2.2006-2009年城镇化人口比重差值数据修正

2010年城镇化人口数据差值如何分配和修正也存在两种修正方案：第一种修正方案为以2000年作为修正起始年，对2001-2009年的9年数据全部修正，第二种方案为以2005年作为修正起始年，对2006-2009的4年数据进行修正。在本研究中我们采用第二种方案，其理由如下。

（1）包括社会保障、子女就学等与户籍制度相关的纵深改革基本发生在2005年以后，2006年、2007年各地方陆续开始了以居住地为依据的户籍登记，城市社会服务也逐渐面向农民工家庭开放，非劳动人口城市化提速，在此之前，由于户籍相关制度的城乡隔离，劳动人口城市化一直快于非劳动人口城市化，此后开始有所改变。这导致基于2005年1%抽样数据为依据实施的2006-2009年度人口变动抽样调查方案可能没能有效反映2006年以后非劳动人口与劳动人口城镇化趋势变动因素，因此，2010年与2009年城镇人口比重数据误差可能主要是由2006年以后人口变动抽样调查方法不适宜而产生的。

（2）按照国家统计局发布的人口变动抽查数据，2000-2005年城镇化速度已经很高，年均速度达到1.35个百分点，而2006-2009年间的城镇化速度已经大幅下降，年均速度为0.91个百分点，如果按照变动调查数据的速度趋势对2000-2010年全部数据修订，则可能还将进一步提高2000-2005年城镇化速度，而2006-2010年城镇化速度将更大幅低于2000-2005年，不能有效反映2006年以后户籍制度纵深改革对城镇化特别是非劳动人口居住生活城镇化的促进效应。

（3）2005年的1%大样本抽查由于样本量大，对人口空间分布的抽查单位选择较为合理，并且统计口径基本没有变化，因此，选取2005年作为修订起始年是比较合理的。

我们对2006-2009年的城镇化人口比重数据进行修订，以2005年1%抽样数据和2010年六普数据作为代表期数据。2005年11月1日1%抽样调查中城镇人口比重为42.99%，2010年11月1日六普中城镇人口比重为49.68%，按照2005年11月1日～2010年11月1日120个月度周期计算，代入（1）式可得URGD=-0.004490971203。再代入（2）式，得到各年度末的理论修正值。根据2006-2009年国家统计局发布的各年度城镇人口比重数据（基于人口变动抽查得到），计算各年度发布的城镇化速度和期间平均速度，计算各年度发布城镇化速度与期间平均城镇化速度之比形成各年度城镇化速度修正系数，计算城镇化速度理论值与速度修正系数的积得到修正后的城镇化速度值，修正后上年度城镇人口比重与当年城镇化速度修正值之和即得到当年城镇人口比重的修正值。

数据修订结果见表3，2006-2010年人口城镇化继续保持21世纪初的高速增长趋势，在2003-2004年以“民工荒”为标志表明农村剩余劳动人口正在逐渐耗尽，劳动人口城镇化速度减缓导致总人口城镇化速度也有所减缓，但由于2006、2007年国家和诸多城市地方政府实施了针对外来移民人口管理的改革，如户籍、社保、教育、医疗等，促进了非劳动人口的城镇化进程，从而掀起了新一轮的人口城镇化高潮，2007年迎来了有史以来的最快城镇化速度，但由于金融危机的影响，2008年我国人口城镇化速度又有所调整。

①国家统计局.2000年中国统计年鉴[M].北京：中国统计出版社，2001：95.

标签：统计口径论文; 修正系数论文; 城镇人口论文; 城乡差异论文; 农村论文;

基于六五大众化的城市化人口数据修复_统计口径论文

猜你喜欢