基于贝叶斯MCMC方法的中国人口死亡率预测_贝叶斯论文

基于贝叶斯MCMC方法的我国人口死亡率预测，本文主要内容关键词为：死亡率论文,我国人口论文,方法论文,贝叶斯论文,MCMC论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

在过去的几十年中，我国和世界其他国家的人口死亡率都经历了持续性的下降，特别是在老年阶段。这种死亡率的改善超过了大多数养老基金和寿险公司的预期，给其偿付能力带来了巨大的压力，造成了一种无法用传统的风险积聚方法消除的系统性风险，即长寿风险。为了应对长寿风险，近十多年来，欧美发达国家开发了一种重要的金融创新工具——长寿衍生产品，其核心思想是让产品未来的现金流和将来实际实现的死亡率挂钩，从而让资本市场在长寿风险的配置中起积极作用。实务中，长寿衍生产品发行成功的关键是长寿风险的准确度量，即未来死亡率的准确预测。因此死亡率预测一直是近年来学者们关注的热点问题。

从1725年De Moivre模型诞生以来，人们对死亡率预测模型的研究已经有将近300年的历史。从模型的特征来看，死亡率预测模型大致可以分为静态模型、动态离散时间模型和动态连续时间模型三大类。

传统上精算师们使用的Gompertz模型和Makeham模型等都是静态的死亡率预测模型，它们往往采用一些简化的假设和人为的限定来使模型的预测结果趋于合理，完全忽略了死亡率变化的不确定性，这就使得采用传统的死亡率模型去预测人口的寿命就具有很大的局限性。近20年来，死亡率预测技术获得了长足的发展，新的动态死亡率模型不断被提出，总的来说，动态死亡率模型可以分为离散时间模型和连续时间模型。大多数离散时间死亡率模型都建立在Lee and Carter（1992）原创性工作的基础之上。之后，针对该模型统计处理上的不足，学者们从不同的视角进行了改进和拓展，如极大似然估计方法（Brouhns et al.，2002）和队列效用模型（Renshaw and Haberman，2006）等。之后，鉴于传统频率派Box-Jenkins二阶段方法在参数拟合和预测上的不连贯，学者们又尝试用贝叶斯方法在统一的框架下一次性完成参数的拟合和预测，相关文献有Cairns et al.（2011）、Müller and Mitra（2013）和Li（2014）等。

死亡率建模的连续时间模型较早的有Milevsky and Promislow（2001），作者以一个简单的均值回复扩散过程来对死力（force of mortality）建模，之后这一思想进一步拓展成更一般化的扩散过程（Dahl，2004）和跳扩散过程（Biffis，2005和Cox，Lin，and Pedersen，2010等）。此类模型能够较好地帮助我们理解死亡率随时间变化的演化过程，但数学处理上的繁琐制约了它们的实用性。

国内学者的研究主要集中在Lee-Carter及其拓展模型在中国的应用上。如李志生、刘恒甲（2010）和祝伟，陈秉正（2012）等分别应用Lee-Carter模型及其改进的模型对中国城市人口死亡率进行了预测，并探讨了预测结果的应用问题。此外，祝伟，陈秉正（2009）、韩猛，王晓军（2010）和王晓军，任文东（2012）分别考虑了中国人口死亡率数据缺失和样本量不足情况下Lee-Carter模型的改进与预测，并进一步探讨了死亡率的改善对基本养老保险的影响。国内学者的上述研究成果具有相当的深度和广度，然而，其中的不足也是明显的。

首先，当前的研究方法都诞生和发展于具有大样本和长时期人口死亡率统计数据的欧美国家。传统Lee-Cater模型时间效应估计采用的时间序列方法，理论上需要至少20年以上的连续数据才能保证预测结果的稳健性，而我国的人口死亡率统计数据相当有限，表现为多个年度数据缺失、样本量少和风险暴露数严重不足等缺陷，不仅连续年份不足20年，而且高质量的人口普查数据只有3年可查，其他仅为1%人口抽样数据和1‰变动人口抽样数据。样本量较小，存在明显的风险暴露不足问题。以2002年为例，男性样本风险暴露数不足美国的1/200，而我国的人口数却数倍于美国，较低的风险暴露数明显提高了相同年龄段人口死亡率在不同年度的不规则波动（金博轶，2012）。因此，无法直接套用国外的死亡率预测方法。其次，传统方法先进行参数估计再根据趋势外推进行预测的二阶段方法，有割裂估计过程和预测过程的弊端，在进行未来参数值的预测时，往往会直接忽略参数估计的误差，从而也导致预测过程的不确定性增加。

针对我国人口死亡率统计数据的不足和传统Lee-Carter模型参数估计方法的缺陷，本文拟采用贝叶斯方法来进行死亡率的建模和预测。与祝伟，陈秉正（2009）、韩猛，王晓军（2010）和王晓军，任文东（2012）不同的是，贝叶斯方法不仅充分利用了模型信息和样本信息，而且也融合了模型总体分布中多个未知参数的信息，可以更全面地考虑和解决传统统计方法的样本不足和样本质量问题；此外贝叶斯方法通过MCMC抽样在统一的框架下一次性估计出所有观察年份和预测年份的参数值，减少了误差的产生和累积。与金博轶（2012）的区别在于，本文依然采用经典的Lee-Carter模型，参数估计利用贝叶斯Markov Chain Monte Carlo方法，即贝叶斯MCMC方法，并利用WinBUGS软件来进行建模。使用WinBUGS可以很方便地对许多常用模型和分布进行Gibbs抽样，编程者不需要推导参数的后验密度或似然函数的精确表达式，只要设置好变量的先验分布并对所研究的模型进行一般的描述，就能顺利完成对模型的贝叶斯分析，极大地方便了贝叶斯方法的使用。

二、传统方法的不足及贝叶斯改进

（一）Lee-Carter模型

参数

和

的传统估计方法主要有奇异值分解（SVD）、加权最小二乘法（WLS）和极大似然法（MLE）等方法。

1.奇异值分解（SVD）方法。

2.加权最小二乘法

3.极大似然估计

然而似然函数中的双线性项

给模型估计带来的困难，传统上采用牛顿迭代方法求解似然方程。

在标准的Lee-Carter模型中，这种两阶段方法参数估计与预测的不连贯性比较突出。在评估预测的不确定性时，估计误差往往会被忽略，这将直接导致对实际预测误差的低估。为此，Brouhns（2002）提出用bootstrap方法来同时考虑估计和预测的误差。然而正如Kogure and Hasegawa（2007）所指出，bootstrap方法的效果并不理想。因此，Czado et al.（2005）、Pedroza（2006）和Kogure et al.（2009）等放弃频率学派的方法，转而采用贝叶斯方法，将传统Lee-Carter模型参数估计与预测相互独立的两个阶段放在一个统一的框架下，以系统性的方式来进行处理。

（二）贝叶斯模型参数先验分布的确定

这里漂移项ρ本身是一个随机过程，当实际中数据量足够大时，

会很小，可以忽略ρ的随机波动。但当我国样本量不足的情况下，以SVD和WLS等方法忽略ρ的波动性会导致对死亡率变化的估计不足，故有学者指出应将ρ的随机性包含在随机游走过程中，通过“双随机过程”来描述时间效应K的变化趋势，并改善了原有的预测效果（韩猛，王晓军，2010）。然而在贝叶斯建模思想中，每一个参数都会自动地被当作一个随机变量来处理，也就是说ρ的随机性自然的就被考虑在内，并会和其他的随机变量一起被放在一个统一的框架下进行综合处理。

在Lee and Carter（1992）中，死亡率的预测分为观察方程（1）和状态方程（6），按照Czado et al.（2005）和Kogure et al.（2009）的经验，模型未知参数的先验分布采用经典的正态-Gamma分布族，即在状态方程（7）中有：

本文综合Czado et al.（2005）、Kogure et al.（2009）和Li（2014），对先验分布中的参数，即超参数设定如下（表1）。

（三）MCMC方法与WinBUGS

Markov Chain Monte Carlo（MCMC）方法是最近发展起来的一种简单而行之有效的Bayes计算方法，其主要功能是抽样和估值。首先通过建立一个平稳分布的Markov链，用Metropolis-Hassting抽样或Gibbs抽样方法对其进行抽样，然后用蒙特卡洛方法基于这些样本做各种统计推断。而WinBUGS是英国剑桥公共卫生研究所推出的用MCMC方法进行贝叶斯推断的专用软件包。其基本原理就是通过Gibbs抽样生成马尔科夫链，Gibbs抽样收敛后，可很方便地得到参数后验分布的均数、标准差、95%置信区间和中位数等信息。使用WinBUGS对常用模型和分布进行Gibbs抽样，编程者不需要推导参数的先验密度或似然函数的精确表达式，只要设置好变量的先验分布并对所研究的模型进行一般的描述，这就极大地方便了贝叶斯方法的使用。

三、中国人口死亡率的建模与预测

（一）数据的选取与处理

由于我国1994年之前的死亡率数据缺失较多，2010年全国人口普查的分年龄死亡率数据至今未见公布，因此本文选取1994-2009年的全国男性人口死亡率历史数据，所选原始数据均来自1995年至2010年的《中国人口统计年鉴》及《中国人口与就业统计年鉴》。原始数据的主要问题和处理思路如下：

（1）数据来源不同。来自普查数据的只有2000年，1%人口抽样调查的只有1995年和2005年两年，其余年份数据均来自1‰人口变动抽样调查。

（2）数据最高年龄组不同。这16年的连续数据中，1996年数据的最高年龄是85岁以上，1995、2000和2005年数据的最高年龄是100岁以上，其余年份最高年龄均为90岁以上。对90岁以上的死亡率并没有给出具体的数值，考虑到如果按照Coale and Guo（1989）的方法进行拓展，拆分成90～94岁、95～99岁和100岁以上三组，客观上又增加了一项预测误差的来源，因此本文仍采用0～4岁、5～9岁，…，85～89岁，90+共19个年龄组。

（3）数据来源差异和样本量少是本文采用贝叶斯分析方法的主要原因，后文将对新方法的效果进行分析，以考察相对于传统方法，贝叶斯方法是否降低了数据质量对死亡率预测结果的不良影响。

（4）鉴于大部分年份给出的最高年龄数据是90+，本文将以此为基准，对最高年龄85+的1996年数据，按照Coale and Guo（1989）的方法进行拓展，而对最高年龄为100+的三年数据进行简单的算术平均合并。

（二）基于WinBUGS的参数估计与结果分析

（1）参数收敛性分析。我们知道模型的收敛性是其预测结果可靠的前提，因此首先关心的就是模型参数的收敛性问题，一般地，参数估计的MC误差小于其标准差的3%就表示已经收敛（见Ioannis Ntzoufras，2009），再结合参数的时间序列和自相关图就能做出确切的判断。对上表示例中的四个参数，MC误差项都接近其标准差的1%，且其时间序列和自相关见下页图1、表2。

对其余450个参数，经计算得到其MC误差项和标准差之比都小于2%，其时间序列和自相关图也显示明显收敛，因此模型参数的收敛性效果是相当令人满意的。

（2）预测结果的合理性。下页图2给出了2014、2019、2024和2029年预测死亡率曲线，从图2中可以明显看出死亡率的改善主要发生在65岁以后的老年阶段，随着时间的推移，每隔5年区间的老年死亡率下降较为明显，死亡率曲线呈现矩形化的趋势。

我们还把贝叶斯方法的预测结果用《中国人口与就业统计年鉴2012》及《中国人口与就业统计年鉴2013》中提供的最新的2011年和2012年的死亡率数据进行检验，预测数据采用2.5%分位点（最小）、median（中值）和97.5%分位点（最大）三组数据，从对比图可以看出，2011和2012年的实际死亡率除了个别点外都落在预测区间中，因此我们有理由相信贝叶斯模型预测的结果抓住了死亡率变化中趋势性的特征，预测结果是具有可信度的。

基于本文的数据和贝叶斯MCMC方法的估计结果，表3给出了2010年、2019年和2029年每隔10年的死亡率预测值，其中每年给出从0～4岁到90+共19个年龄组的死亡率预测值（包括2.5%分位点，中值和97.5%分位点）。下页表3数据显示，每隔10年死亡率下降趋势明显。

四、贝叶斯方法与传统方法的比较

（一）贝叶斯方法与WLS方法的比较

本文把贝叶斯方法参数估计的结果和传统Lee-Carter模型参数估计方法中常用的加权最小二乘法（WLS）的结果进行比较。首先我们考察在观察的16年数据中，以WLS方法和Bayes方法所得到的残差的时序图的差异，因为模型的残差应该服从均值为0的正态分布，时序图应该表现出相应的特征。

从图4我们可以明显看出，贝叶斯方法的残差序列是一个平稳序列，该序列始终在其均值0附近随机波动，基本对称分布于0上下，这也说明对不同观察年的数据，死亡率的拟合效果趋于一致。而加权最小二乘法所得的残差序列则没有这种随机波动的特征，而是随着出生年的变化具有较明显的趋势性。从残差序列图可以看出贝叶斯方法明显优于加权最小二乘方法。

图5是贝叶斯方法和WLS方法的时间效应参数比较。

图6绘出了以Bayes方法和WLS方法得到的时间效应参数

从2010-2029年的20年预测值，并分别给出了他们95%的置信区间。可以看出，贝叶斯方法的预测精度明显高于加权最小二乘方法。（中间红线是贝叶斯方法的估计均值，内侧的两条实线是其95%的预测区间，浅绿色线条是最小二乘估计的均值，最外侧的两条虚线是其95%的预测区间。）

（二）模型的选择标准

本文利用Cairns et al.（2009）中的贝叶斯信息准则、模型残差的正态性检验和模型参数估计的稳健性检验来对WLS和贝叶斯方法进行检验。其中贝叶斯信息准则（BIC）方法对模型r的BIC定义为：

另一个模型的选择标准是考察其残差项，这里模型的残差项定义为：

在死亡率建模中我们都假定死亡人数是独立泊松随机变量，所以如果假设成立，上式的残差将会近似地独立同分布，即应该有Z（t，x）～N（0，1）。该残差项的方差Var[Z（t，x）]如果远大于1，则表明模型具有过离散现象，而具有较低Var[Z（t，x）]值的模型拟合效果较好。

模型选择的判断结果和时间效应参数平滑性比较结果综合成表4。

从表4可以看出，贝叶斯方法相比于WLS方法具有更大的BIC值和更小的残差方差值Var[Z（t，x）]，参数

估计的平滑性也明显好于WLS方法。而在稳健性方法，贝叶斯方法和WLS方法表现均较好，但贝叶斯方法的估计结果不仅和WLS方法一样对数据年限和估计年龄段的变化稳健，而且对模型参数和超参数初值的变化也是稳健的，因此综合表4中的四个指标，贝叶斯方法明显优于WLS方法。

本文中我们改变传统Lee-Carter模型参数估计和预测的两阶段方法，利用贝叶斯MCMC方法，和WinBUGS软件编程，以先验信息和一体化的处理框架，一次性完成参数的估计和预测，解决死亡率预测中样本量不足及参数估计和预测两阶段的不连贯问题。与加权最小二乘方法（WLS）估计结果的对比可以看出，贝叶斯方法的估计结果不仅具有较好的稳健性，而且具有更好的平滑性，更大的BIC值和更小的残差方差Var[Z（t，x）]。因此我们可以认为，针对我国人口死亡率统计数据缺失、样本量少和风险暴露数严重不足等缺陷，贝叶斯预测方法较之传统方法具有明显的优越性，有利于提高我国有限人口数据下死亡率预测的精度和长寿风险度量的准确性，这对于夯实我国养老金改革的决策基础的非常重要的。此外，贝叶斯方法可以从相同或相似群体借用先验信息的功能，为我国人口数据特别贫乏地区和少数民族地区人口死亡率的预测提供了一个崭新的视角和切实可行的途径，也将是今后值得进一步探讨的研究方向。

①WinBUGS程序见附录。

标签：贝叶斯论文; 死亡率论文; mcmc论文; 参数估计论文; 预测模型论文; 贝叶斯估计论文;

基于贝叶斯MCMC方法的中国人口死亡率预测_贝叶斯论文

猜你喜欢