出生时性别比变化监测方法的研究_性别比论文

人口出生性别比变动的监测方法研究，本文主要内容关键词为：变动论文,人口论文,性别比论文,方法论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

一、研究背景

在过去的30多年里，随着计划生育政策的全面实施和社会经济的持续发展，中国人口过快增长的趋势得到了有效控制，育龄妇女生育水平进入比较稳定的低生育水平阶段，然而，尽管中国人口再生产类型发生了根本转变，但人口素质和人口结构性问题却越来越突出，在纷繁复杂的中国人口问题中，人口出生性别比失调并持续升高就是一个非常突出的问题。

正确认识人口出生性别比持续升高问题的长期性和复杂性，不仅需要认真研究和全面总结对人口出生性别比问题认识的历史经验和教训，而且需要运用科学的方法和手段，重新审视人口出生性别比问题的根源和本质。只有实事求是地分析人口出生性别比动态变化的过程和规律，才有可能提出应对人口出生性别比持续升高问题所必需的、切实可行的对策和办法。

人口出生性别比问题的研究方法与人口出生数量、生育水平等问题的研究方法有明显不同。生育数量的规定性是非常明确的，既可以从个体水平上进行分析和规定，也可以从群体的角度进行研究和判断，而人口出生性别比却是一个相对的量，反映的是一种相对关系，是对出生男孩和女孩两个随机变量相对关系的统计综合。从人口出生性别比指标的人口统计含义来看，人口出生性别比很难在个体水平上进行描述和严格界定，它只能用分组或群体状况来描述，即估计人口出生性别比通常需要比较大的出生样本。究竟需要多大的样本量，乔晓春(2006)认为“总体规模太小的地区不适于单独计算出生性别比；要想单独计算出生性别比，且计算出的结果是有意义的，该地区某年的出生婴儿应该在3 000人以上。”这种出生规模的必要条件是以正态分布为理论基础的，因此，如果仅以正态分布为理论基础作为分析、监测人口出生性别比变动趋势主要方法的话，将面临出生婴儿规模小于3 000人(如县级及以下区域单元)不适用的问题。然而，人口出生性别比中出生男孩或女孩的概率是一个二项分布，显然用正态分布近似的判断难免会在一些样本量较小情况下发生偏离，况且总有一些区域出生人口一直小于3 000人，而正态分布是对样本量较大情况下二项分布的近似，因此，在出生规模较小情况下，如何对人口出生性别比变动情况进行监测和评估不仅是一个需要深入研究的问题，而且需要解决在实际人口出生性别比变动监测过程中微观小区域上无法判断高低，而宏观大范围内人口出生性别比很高的矛盾。对人口出生性别比的区域差异、人群差异进行分析，特别是在小样本条件下对人口出生性别比监测评估方法的探索是一项关系到如何正确判断人口出生性别比变动趋势和治理效果的基础研究。由此可见，研究人口出生性别比监测方法一方面可以对人口出生性别比变化的原因、对策和治理效果的评估提出科学依据，另一方面还可以对判断人口出生性别比变化的趋势与差异提供参考。

2010年国家统计局公布中国人口抽样变动调查结果①，认为2009年中国人口出生性别比为119.45，比2005年1％人口抽样调查的人口出生性别比(120.49)低1.04，比2008年人口抽样变动调查的人口出生性别比(120.56)低1.11。国家人口和计生委认为“各种证据表明，中国人口出生性别比攀升势头开始得到遏制，但仍然严重偏高”②。然而这个判断是否可靠？人口出生性别比是真实的下降还是统计误差？我们是否进入了对人口出生性别比判断的另一个认识的误区？对这些问题的看法将直接关系到今后对人口出生性别比问题治理方式与相关人口和计划生育政策的制定。虽然已有文献对中国人口出生性别比问题的研究很多，但对如何监测人口出生性别比变化方面的研究却很少(王广州，2006；赵开斌，2007；赵开斌、吕洪升，2008)。马瀛通等(1997)以中国1988年2‰人口抽样调查为主要数据，分析了中国人口出生性别比变化的规律和特点，认为人口出生性别比是条件随机事件，这为突破传统分析人口出生性别比的简单方法，深入探索中国人口出生性别比升高问题，深刻认识人口出生性别比的变化规律和监测人口出生性别比的动态变化过程奠定了基础。为了对人口出生性别比结构进行深入分析和数学描述，杨书章、王广州(2006)从妇女生育行为出发，构建人口出生性别比结构的状态空间，对搞清人口出生性别比的基本结构、变化规律提供帮助。但对人口出生性别比正常情况下，孩次递进生育性别比状态空间中不同孩次性别状态递进生育性别比取值范围的理论值与经验值的研究还比较欠缺。由于人口出生性别比是一个敏感的指标，需要一定的人口规模才能稳定，在整体上反映出的问题，很难从个体或小样本条件下进行分析和认定，因此，研究降低样本量要求，实现小样本条件下人口出生性别比(包括孩次递进生育性别比)的统计推断问题不仅具有重要意义，而且给人口出生性别比监测提出了更高的要求和全新的研究课题。

二、实证数据的来源

数据是研究的基础，只有高质量的数据才能确保人口出生性别比变动监测方法的有效性和可靠性。因此，在研究人口出生性别比变动监测方法的过程中，本文在考察中国人口出生性别比时所采用的数据既包括人口普查汇总数据、人口抽样变动汇总数据，也包括人口普查和人口抽样调查的原始数据。由于计算不同类型妇女的时期递进生育性别比需要有分性别的生育情况登记数据，因此，只有使用全国的人口普查和人口抽样调查等原始数据才能进行统计计算。为了解决1982年全国第三次人口普查数据对生育状况的调查没有按性别登记的问题，本文使用原始抽样数据家庭户母子匹配方法来确定孩次递进生育性别比。中国1982年抽样数据中母子匹配1980年2岁人口127 669人，占2岁人口的70.12％；母子匹配1981年1岁人口114 375人，占1岁人口的65.82％；母子匹配1982年0岁人口124 006人，占0岁人口的59.67％。本项研究在母子匹配过程中，只匹配户主或户主配偶的子女，对于第三代没有进行匹配，其他原始数据母子匹配采用相同的方法，因此，匹配率略低一些。

由于1990年以后的人口普查或人口抽样调查有生育性别和孩次信息，因此对1990、2000年人口普查和2005年1％人口抽样调查可以使用原始数据直接进行分析，而不需要进行母子匹配。另外，为了检验母子匹配和直接调查计算结果的差异，对1990年中国人口普查母子匹配数据和直接调查数据计算的相关指标进行比较，结果表明二者相应的计算结果非常接近，反映的变化趋势也完全相同，尤其是低年龄人口母子匹配的计算结果与直接调查数据的计算结果更为接近(见表1)。从表1可以看到，1990年人口普查母子匹配数据的相对误差是-2.94％，的相对误差是-10.78％。

为了总结人口出生性别比的结构特点和变化规律，不仅需要研究中国人口出生性别比的数据，同时需要研究世界人口出生性别比正常国家的数据。这样做的目的是为了进一步检验并发现人口出生性别比和孩次递进生育性别比变化的客观规律及正常变动经验值的变化范围。在研究国外人口出生性别比的正常状况和正常变动模式的过程中，本文主要采用的是美国人口普查原始数据，其中包括美国1970、1990、2000年人口普查原始抽样数据；美国1995年CPS原始数据；斯洛伐克人口抽样调查汇总数据。由于美国这几次人口普查没有完整的生育史调查或没有当年分性别生育状况的详细内容，要想研究生育状况，也需要利用原始数据家庭户关系建立母亲和孩子的关系，进一步通过母子匹配数据估计时期生育指标，具体方法与中国数据类似。

三、人口出生性别比变动的人口学监测方法

为了研究人口出生性别比变动的规律和特点，首先必须对人口出生性别比正常情况下的基本结构、变动模式和人口出生性别比最稳定的部分进行观察。然后，在此基础上分析人口出生性别比监测方法并探讨人口出生性别比正常或回归正常的标志及趋向正常的过程与特点。

(一)人口出生性别比正常情况下，不同时期人口出生性别比的基本变动模式

通过观察不同时期0岁人口性别比可以间接判断人口出生性别比变化趋势。下面以斯洛伐克人口调查0岁人口性别比为例，间接分析不同时期人口出生性别比的变化情况。从总人口规模来看，斯洛伐克1980年的人口为496.33万人，2009年1月增加到541.22万人，与中国的青海、宁夏人口大体相当。从0岁人口规模来看，斯洛伐克0岁人口由1980年的9.8万人，下降到2008年的5.4万人。根据斯洛伐克1980-2008年的人口调查数据，假定不考虑婴儿死亡率的性别差异，可以间接估计人口出生性别比，1980-2008年斯洛伐克人口出生性别比的变动情况如图1所示。从图1可以看出，1980-2008年斯洛伐克0岁人口性别比变动的范围始终在103～107之间，在58个测量数据中有29个0岁人口性别比在104.90以上，29个0岁人口性别比在104.90以下。

图1 1980-2008年斯洛伐克0岁人口性别比

注：根据http://www.infostat.sk/slovakpopin/agestr.htm数据计算。

从图1可以总结人口出生性别比正常情况下变动的基本模式具有以下特征：(1)人口出生性别比处于波动之中，不会出现超出正常值的连续上升或下降的趋势；(2)人口出生性别比稳定性表现在围绕正常值波动且变化区间很小；(3)人口出生性别比多次调查的结果非常接近。

采用与斯洛伐克类似的方法，分析中国不同时期人口出生性别比变动的大体情况。我们可以根据人口变动抽样调查、人口普查等数据来估计中国20世纪70年代以来的人口出生性别比变动情况(见图2)。从图2可以看到，与斯洛伐克类似的是，1982年以前中国的人口出生性别比变动的范围很小，1982年人口普查与1990年人口普查数据的估计结果具有高度的一致性。如果采用中国1982-1996年多次人口调查数据估计1982年人口出生性别比的话，多次调查对1982年人口出生性别比的估计值变化的区间在106.18～109.05。同样，1981年的估计值在107.07～109.69。

图2 20世纪70年代以来中国人口出生性别比估计

注：根据《中国人口统计年鉴》；1988年2‰生育节育抽样调查；1982、1990、2000年人口普查；2005年1％人口抽样调查以及其他各年度国家统计局人口变动抽样调查数据计算、整理。

为了进一步证明和比较在人口出生性别比正常及数据没有人为干预的情况下，多年重复调查推测的人口出生性别比具有高度的一致性。同样以1980-2009年斯洛伐克调查数据和美国人口普查数据为例，多年来的调查对相同时点人口出生性别比的估计值之间的误差非常小，即具有高度的一致性(见图3、图4)。相反，同样以中国20世纪70年代以来人口出生性别比的估计为例(见图2)，1982年以前人口出生性别比正常情况下，多次调查结果的差别不是很大，而对于1982年以后，中国的人口出生性别比变动的范围很大，尤其是1984年以后对相同时点人口出生性别比的估计值之间的差别很大，而且不同调查数据的估计结果很难相互吻合。以1995年为例，对1995年人口出生性别比多次调查的估计值在113.06～122.51之间。即如果人口出生性别比不正常，多次抽样调查的变化幅度一定很大，而且变动的区间也很大。

图3 1980-2009年斯洛伐克人口出生性别比估计

注：根据http://www.infostat.sk/slovakpopin/agestr.htm数据计算。

此外，虽然从表面上来看，人口出生性别比正常的国家也可能出现人口出生性别比数据申报异常，如1990年美国人口普查(见图4)，但仔细分析发现，剔除其他非白人，美国人口出生性别比正常，而且与美国其他年份的调查比较吻合。从1990年美国人口普查看到，0、5结尾的年岁表现出明显的数字偏好和调查偏差。

图4 1970年以来美国人口出生性别比估计

资料来源：Census of Population and Housing,1970,1990,2000[United States]:Public Use Microdata Sample:5-Percent Sample.www.icpsr.com 。

总之，如果以多年数据进行纵向比较或多次调查低龄人口性别比作为重复测量依据或基础判断人口出生性别比变动趋势和是否正常指标的话，正常人口出生性别比不仅变动的空间很小，重复测量数据之间的差别也很小，而且变动范围也是在正常范围之内的。

(二)人口出生性别比正常情况下，分孩次出生性别比的基本变动模式

人口出生性别比的变动与孩次有密切的关系，因此，除了可以用所有出生孩子的性别比来监测人口出生性别比的变动以外，还可以用分孩次的出生性别比指标来进行分析。

表2 1995年美国分孩次出生性别比

孩次男女合计

性别比

第一孩

10959

1042013070

105.17

第二孩8508829810807

102.53

第三孩41324045 5312

102.15

第四孩16671706 202097.71

注：1995年美国CPS调查原始数据来源于http://www.icpsr.com。

首先，以美国的数据为例，1995年第一孩出生性别比为105.17；第二孩出生性别比为102.53；第三孩出生性别比为102.15；第四孩出生性别比为97.71(见表2)。从美国的数据可以看到，出生性别比孩次之间的变动也很小，且随着孩次的升高，出生性别比有下降的趋势。此外，刘爽(2009)对其他国家数据的研究也得到类似的结论。在出生性别比正常情况下，如果仅考虑出生孩次的话，分孩次的出生性别比与不分孩次出生性别比也非常接近，其变动范围在102～107之内。同时，随着孩次的升高，出生性别比有下降的趋势。

其次，从中国1982年的数据来看，一孩出生性别比无论是哪种统计口径和哪个年度，出生性别比变动都在102～107正常值范围之内(见表3)。二孩及以上出生性别比的变动范围在108～120之间。比较市、镇、县分孩次性别比可以看到，县域出生性别比最稳定，1980年和1981年变动范围在105～115之间，1982年在107～118.05之间，这就说明中国的出生性别比正常情况下变动的范围也很小，不同调查数据的估计结果具有高度的一致性，这种状况与其他出生性别比完全正常国家出生性别比非常稳定的特征没有差异。因此，如果在出生性别比完全正常的情况下，随着孩次的升高，中国人口出生性别比从数据上反映出来的升高趋势值得怀疑。

总之，在人口出生性别比正常的情况下，分孩次出生性别比也是正常的或离经验正常值范围很近，且波动范围很小。即使中国人口出生性别比一直略高于正常值，但一孩的出生性别比与其他国家的变动规律是一致的，而二孩及以上出生性别比变动规律与出生性别比完全正常的国家是相反的。然而，即便是二孩及以上略高于正常值范围，但升高的幅度也在120以内，而且二孩及以上出生性别比之间的差异很小。因此，根据出生性别比孩次变动的正常模式和变动规律，可以推断中国人口出生性别比恢复正常的标志应该是从高孩次逐渐进入115以内，并逐渐趋近于110。

(三)人口出生性别比正常情况下，孩次性别递进状态空间的基本结构

孩次性别递进状态空间是对妇女生育孩次状态与生育性别状态的描述。人口出生性别比升高是性别偏好和产前性别选择的结果。

通过观察时期孩次递进生育性别比可以看出，1982年以前，虽然在分孩次出生性别比中二孩及以上出生性别比高于107，如果对出生性别的孩次结构从妇女生育状态和生育行为的角度细分，那么，即便是高孩次，递进生育性别比也可能是正常的(见表4)。从表4可以看到，中国在2000年以前，无论人口出生性别比是否正常，一直在102～107之间，2005年开始出现明显的不同，达到110.93。据此可以认为，即便是在人口出生性别比明显偏高情况下，只要生育水平较高或生育数量意愿没有受到明显的挤压，那么，是正常的。如果人口出生性别比是正常的，无论是，其递进生育性别比一定都是正常的。同样，从美国多次人口普查的结果也得到了相同的结论。从美国的数据来看，即便是样本量比较小的数据，如1988年以后，美国两男两女户样本量在900以下，得到的儿女双全高孩次递进生育性别比也是正常的(见表4)。

由此可见，在人口出生性别比正常或基本正常的条件下，儿女双全妇女的PSR具有非常稳定和正常的特征，因此，可以将作为人口出生性别比变动的指示性指标，并作为人口出生性别比恢复正常的信号，即人口出生性别比恢复正常的标志是都在102～107之间。据此，笔者认为，儿女双全妇女递进生育性别比不仅可以作为人口出生性别比的指示性指标，同时也可以作为生育性别偏好测量的指示性指标。

四、人口出生性别比变动的统计学监测方法

对人口出生性别比变动监测除了可以通过人口学的分队列、分孩次性别比和孩次性别状态空间等方法从人口学视角分析外，还可以用统计学方法进行监测。运用统计学方法，既可以用传统的频率学派的统计学分析方法，也可以用贝叶斯学派的统计分析技术，目标在于减少人口出生性别比统计推断的样本量。

(一)人口出生性别比变动的概率分析

从概率论的角度看，假如不考虑双胞胎和多胞胎、一次生育结果的样本空间为｛男孩，女孩｝。由于在现实中出生男孩或女孩的概率不完全是0.5，因此生男孩或女孩的概率相当于掷一枚不均匀的硬币，并将多次生育看做是离散的多重伯努利随机试验，随机试验结果的概率模型为二项分布，即男孩出生的概率为p，女孩出生的概率为1-p。在出生的n个孩子中，恰好出生x个男孩的概率为：

根据二项分布概率模型，可以计算大于特定男孩出生概率(p)条件下(如与人口出生性别比为107、110、120、130等对应的男孩概率)，所对应的出生男孩数量(x)的概率。例如，通过2000年人口普查抽样数据估计全国分地区人口出生性别比正常的可能性(见表5)。这一方法的基本思路是试图克服由于出生规模的差异和人口出生性别比不稳定造成的相对比较严重的困难。根据计算结果可以估计或预警目前各地区人口出生性别比失衡的严重程度。虽然样本量比较小，但可以对各地的情况进行监测和评估。

(二)人口出生性别比变动的贝叶斯分析

对人口出生性别比的监测是一个动态的连续过程，因此，如何使用历史数据是一个非常重要的问题。在历史数据样本量比较小的情况下对人口出生性别比的估计可以采用简单的统计方法，也可以采用贝叶斯估计的方法。比较简单的方法如将历史数据各年度的人口出生性别比统计平均、加权平均或将出生男孩、女孩分别合计然后计算人口出生性别比和检验等。然而，在这些方法中，贝叶斯估计是一个比较好的选择。贝叶斯估计方法如下。

以2000年中国人口普查数据为例，把0岁性别比看做是人口出生性别比，使用0～10岁2000年人口普查1‰抽样数据、1％抽样数据和全部人口普查数据对人口出生性别比进行估计。用1‰抽样数据对人口出生性别比进行估计，对各种估计方法与全部人口普查数据人口出生性别比进行比较得到各地区的相对误差分布如图5。从图5可以看到贝叶斯估计结果和多年人口出生性别比平均值及将多年出生男孩、女孩分别合计，然后计算出生性别比与全部人口普查数据对出生性别比的相对误差在±5％以内的达到60％左右。

从上述分析和图5的结果看，贝叶斯估计结果似乎与简单的估计方法并没有太大差别。这到底是历史数据的数据质量的原因，还是样本量的原因？为了衡量不同估计方法之间的可靠性，构造一个简单的平均误差指标：

图5 不同方法小样本人口出生性别比估计值误差分析

使用不同历史数据，比较贝叶斯估计与其他方法的差别，具体结果如表6所示。从表6可以看到，使用1‰抽样数据对人口出生性别比变动估计的相对误差中男女分别合计性别比估计结果最大，贝叶斯估计次之，而性别比平均的估计误差最小，但使用1％抽样数据对人口出生性别比变动估计的相对误差男女分别合计性别比估计结果最大，性别比平均的估计次之，而贝叶斯估计误差最小。

为了进一步证实是历史数据质量和样本量的原因，我们使用100％数据按比例生成1‰和1％抽样仿真数据，同时在生成仿真数据过程中加入随机误差。用同样的方法计算不同方法对人口出生性别比的估计误差(见表6)，从表6可以看出，无论是1‰还是1％抽样数据，贝叶斯估计的误差都最小，性别比平均次之，男女分别合计计算人口出生性别比相对误差最大。同时，随着样本量的增大，贝叶斯估计的误差明显减小。

五、总结与讨论

通过对出生性别比变动监测方法的研究，笔者认为：(1)正常的人口出生性别比是比较稳定的，其稳定性表现在分孩次与不分孩次、纯男户与纯女户、儿女双全与非儿女双全等各个方面的指标都很稳定，反之，不正常的出生性别比往往各个指标都是不稳定的。因此，在出生性别比监测过程中就是要发现这种由稳定到不稳定，由部分稳定到全部不稳定。(2)变化是多方面的，一种指标可能对某些方面敏感，对另一方面的测量可能不是非常敏感。比如，儿女双全户递进生育性别比可能没有变化，但纯女户递进生育性别比却发生明显的变化，因此，在出生性别比变动的监测过程中，不能孤立地看问题，需要全方位地分析。(3)在出生性别比正常情况下，对同一时点出生性别比的重复测量或间接估计往往是高度一致的，而且变动的范围很小，即使样本量比较小，测量与测量之间的差别也不是很大。反之，如果出生性别比不正常，对同一时点不同测量数据很难衔接或对应，测量结果的变动范围往往很大，因此，在出生性别比监测过程中重复测量有助于对问题本质和特征的把握。(4)人口统计指标体系是对出生性别比变动规律的深入研究，指标的设立和创新是对规律的总结。既要考虑指标的稳定性，又要考虑测量的灵敏性。(5)从原始数据可以分析和构造很多指标，但原始数据的可获得性毕竟有限，因此，在监测人口出生性别比变动时往往需要多渠道数据的相互校验和区间估计与趋势分析。

本文在出生性别比变动监测方法研究方面虽然做了一些尝试，但还有许多问题需要进一步研究：(1)为了充分理解出生性别比正常情况下孩次递进生育性别比的结构和变动区间，还需要更广泛的数据和科学的方法进行深入研究。(2)中国人口孩次递进生育性别比的变动模式和正常情况下的孩次性别构成是否与其他国家人口不同？是否具有特殊的规律？还是由于目前数据质量方面的问题而表现出明显的不同。(3)将新的统计学方法或构造新的统计量和人口学方法结合起来分析出生性别比问题。

总之，虽然出生性别比变动监测是一个比较复杂的问题，尤其是如何使用小样本进行比较科学的监测和评估有待进一步研究，但对出生性别比变动的监测决不能停留在以往传统的理论和方法上，需要探索新的方法和新的技术，特别是突破以往样本量的限制，才能对科学分析出生性别比问题、指导和评估综合治理效果有借鉴意义。虽然本文分别讨论了出生性别比监测的人口学和统计学方法，但二者不是孤立的，可以有机地结合起来，既可以对分孩次的出生性别比进行贝叶斯估计，也可以把孩次递进生育性别比进行统计检验。

注释：

①http://www.stats.gov.cn/tjgb/index.htm。

②http://www.finance.sina.com.cn/roll/20090116/07462631611.shtml。

标签：性别比论文; 中国人口论文; 人口普查论文; 人口问题论文; 概率计算论文; 概率抽样论文; 递进关系论文; 怀孕论文; 抽样调查论文;

出生时性别比变化监测方法的研究_性别比论文

猜你喜欢