基于Bays视角的时变参数VAR建模--兼论“斜坡之谜”_贝叶斯论文

贝叶斯视角下时变参数VAR建模——兼论“斜率之谜”，本文主要内容关键词为：斜率论文,建模论文,之谜论文,视角论文,参数论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

自Sims（1980）提出向量自回归（VAR）模型以来，该技术得到了广泛的应用和发展。特别地，联系着短期约束、长期约束，以及新近发展的符号约束（Sign Restrictions）、异方差约束（Heteroskedasticity Restrictions）的结构向量自回归（SVAR）模型在宏观时间序列分析中发挥着越来越重要的作用，而且包含在该模型内的脉冲响应和方差分解也往往能够给出十分直观的经济含义。

尽管如此，该项建模技术仍然存在着极大的局限性。其中最令人感到缺乏真实性的是，该模型假定估计的系数是不变的，这就意味着，无论在该样本期内是否发生了经济结构的某种平滑变化，该模型对此无能为力。如果不能捕捉这种变化，那么得到的结果很可能失真。

实际上，自1978年来，中国渐进式的改革实践必然会对宏观经济数据带来某种平滑变化。毫无疑问，传统的VAR或者SVAR模型无法捕捉这种变化，那么由传统的VAR或者SVAR模型得出的结论在某种程度很可能偏离了经济实际。事实上，国内已经有部分文献在讨论一些令人诧异的经济现象。徐高（2008）提出了“斜率之谜”的概念，即在Blanchard和Quah（1989）的长期约束下，通胀率对供给冲击和需求冲击的脉冲响应的方向和经典IS-LM宏观经济理论出现了矛盾，从而使得总需求曲线斜率为正，总供给曲线斜率为负。无独有偶，高士成（2010）也发现了类似的现象。我们不排除该现象的出现可能会有其他原因，但是如果能够有机会拟合一些估计系数随机变化的VAR模型，然后再来检查“斜率之谜”，如果该现象消失了，那么经济系统的平滑变化应该得到相当程度的确认，则传统的VAR模型在此处应该存在着模型误设。

幸运的是，Cogley和Sargent（2001）、Cogley和Sargent（2005）、Primiceri（2005）在建立系数随机变化的VAR模型方面做出了巨大的贡献。考虑到允许系数随机变化时，待估系数将成倍增加，他们无一例外地均选择了带有一定先验约束的贝叶斯估计框架，在该框架下，他们建立的模型很好的捕捉了一些传统模型无法捕捉的经济现象。特别地，在该模型下，徐高（2008）提到的“斜率之谜”现象也消失了。

考虑到中国渐进式的改革实践，该类模型对于中国的宏观经济时间序列拟合应是十分贴切的。不过，由于该模型在设定和估计上均存在一定的复杂性，国内理论以及实证文献鲜有触及。本文力图清晰阐述该模型的建立过程，为提高国内实证研究水平略尽绵薄之力。

一、模型的构建

系数随时间变化（Time Varying Parameters）的VAR模型有两类，一类是假定VAR误差项的方差—协方差不随时间变化，简称TVP-VAR；一类假定误差项的方差—协方差也是时变的（Stochastic Volatility），简称TVP-VAR-SV。本节先从TVP-VAR开始，然后再扩展至TVP-VAR-SV。

1.TVP-LVAR模型

（1）TVP-VAR模型的设定。TVP-VAR模型是一个系数随时间变化的VAR模型，通过系数的变化来捕捉系统的结构变化。一般地，一个诱导型VAR可以书写如下：

因为本文使用的是贝叶斯估计框架，按照通常的做法，我们对式（1）的数据堆积形式进行一些变换，以便陈述在该框架下的估计方法。易知对每一个观测数据，有：

其中，服从独立同分布N（0，Q）。式（2）一般称为度量方程，可以看到除了误差项的分布有些许异样外，其具备经典多元回归方程的标准形式，式（3）称为状态方程，它们就是TVP-VAR的基本模型设定——一个系数随时间变化的VAR模型。

在继续往下阐述之前，此处先给出一个在贝叶斯估计理论中的经典结论，它会在后面的建模过程中多次使用。

式（4）和式（5）的结论在文后会多次使用。

（2）TVP-VAR模型的估计。式（2）和式（3）需要估计的参数包括时变的，的方差—协方差矩阵∑和的方差—协方差矩阵Q一共三个参数块。类似这样的模型，一般均通过卡尔曼滤波利用极大似然估计得到，但应该可以理解，在这样一个非线性高维空间取极值是一件非常困难的事情。这也是选择贝叶斯估计的原因之一。

贝叶斯估计的关键是要求能够得到参数块（如，∑和Q）的后验联合分布，在过去，这样的联合分布求取同样十分困难，但自从MCMC（Markov Chain Monte Carlo）算法②在贝叶斯估计中的广泛使用以来，这样的联合分布求取不再令人望而生畏。因为通过MCMC算法，可以把一些高维的问题分解成一个个低维的问题来解决。或者说，其可以将一个联合分布的估计问题利用MCMC算法的Gibbs抽样或者Metropolis-Hastings抽样将其转化成一个一个的条件分布来解决，一般而言，这些条件分布往往十分容易得到。

接下来，分别阐述先验分布如何设定，后验分布如何求取。

第一，先验分布的设定。对于其先验分布，可以借鉴Primiceri（2005），而不使用平凡先验③。首先从样本中选取一部分譬如τ个观测值，作普通的最小二乘估计，从而可以得到最初状态的一些先验信息，从而得到先验分布：

看到式（6）这种分解，可以理解这又是一个将高维分解为低维的抽样过程，根据前述对式（2）和式（3）的线性假设，易知式（6）右边的项均服从正态分布，关键是求得这些正态分布的均值和方差，我们便可以进行抽样了。

接下来，我们来求取式（6）右边各项中各正态分布的均值和方差。

再来看式（6）右边其他所有连乘项，它们均是利用后一期的信息来校正前一期的估计（即该类文献中所常称的后向递归），上述标准的卡尔曼滤子公式不再适用了。但是可以换一种思考方式，这种校正模式体现在状态方程式（3）中，可以将向量看作是在第t期时逐步增加M（1+Mp）个观测值的过程，这样的话，式（3）本身又看作了一个度量方程，于是比照标准卡尔曼滤子更新方程式（7）和式（8），的均值和方差可以写为：

至此，则可以获得所有待估参数的后验条件分布，然后就可以使用Gibbs抽样来得到联合分布，得到所有参数的估计值。

（3）TVP-VAR模型的识别。通过上述步骤，可以得到诱导VAR在各个时期的系数，及方差协方差阵∑和Q。此时可以通过对式（1）中的系数矩阵右乘一个识别矩阵C，来获得结构VAR系数矩阵，再将其变换为向量移动平均形式，从而获得脉冲响应。本文后续的实证分析中，就是通过长期约束来获得C，从而获得结构VAR系数。

2.TVP-VAR-SV模型

如果放弃式（2）中∑的时常假设，转而考虑∑的时变性，模型将更为艰深，但其脉络依然清晰。我们仍然可以从最简单的情况譬如单变量的随机波动开始，然后再将其扩展至多变量即VAR的情形。

（1）单变量的随机波动。Jacquier等（1994）为单变量随机波动提供了经典的建模方法，Kim等（1998）为使算法更为有效，做出了改进。一般地，在他们的文献中均假设：

实际上，在TVP-VAR-SV模型的假设中，都假定φ=1，是一个随机游走，这样实际上大大简化了上述模型，我们有

其中，。这样，式（12）和式（13）就形成了一个线性状态空间模型，但此时是一个对数卡方分布，是非正态的，上文中标准抽样程序仍然无法使用。对于该问题的解决，Jacquier等（1994）通过对的Metropolis-Hasting抽样替代上一节标准线性卡尔曼状态方程的后向递归程序而获得了结果，而Kim等（1998）对算法的改进就体现在这里，他们不是直接对抽样，而是稍做调整，但这使算法更为有效。具体地，Kim等（1998）考虑到混合正态分布常用来逼近一些未知的和不方便的分布，于是经过测算，他们利用了7个不同的正态分布的和来逼近的对数卡方分布，这样的话，前述的标准线性抽样又可使用。他们认为的分布可如下逼近：

（2）多变量的随机波动。多变量的随机波动并不比单变量的更为复杂，理解了单变量随机波动，理解多变量随机波动就要容易得多。

其中，表示下三角矩阵矩阵L第i行第j列元素。每一个方程都是一个标准的线性正态方程，而且他们之间互不相关，所以可以对他们单独一个一个方程抽样，抽样的分布由式（4）给出。

上述多变量随机波动抽样是由Cogley和Sargent（2005）在文中提出的。Primiceri（2005）也提出了一种多变量随机波动抽样的办法，他进一步放松假设，令L也是时变的，在本质上，他的这种放松，使对L的抽样不再是单方程的标准抽样，而是一个标准的线性状态空间模型的抽样，这种抽样的分布，我们在前面也多次提到了，限于篇幅，我们不再在此处详述该类多变随机波动的抽样，有兴趣者可以参见Primiceri（2005）。

当获得了多变量随机波动的抽样方法，再联合TVP-VAR模型的系数抽样，就可以获得TVP-VAR-SV模型所需的后验分布。

二、实证分析

在前言中，我们提到过TVP-VAR模型最大的优点就在于能够捕捉经济系统的平滑变化。而这一点，由于中国渐进式的改革进程，使得该类模型在捕捉中国宏观总量时间序列特征方面具备了天然的优势。

我们使用TVP-VAR模型④对徐高（2008）中的数据重新进行了拟合，以检查徐高（2008）在文中提出的斜率之谜现象，类似地，我们使用了与徐高（2008）一样的长期约束识别，具体识别细节可以参见Blanchard和Qauh（1989）。同时考虑到徐高（2008）的样本量过少，可能会影响到结果的稳健性，我们又针对1992年第1季度至2011年第1季度的季度数据再次进行了回归。要注意的是，因为系数是时变的，实证结果中各期的脉冲响应应该不同。

现在我们将TVP-VAR模型应用到徐高（2008）的数据集（1978-2006年的年度数据）变量依然是真实GDP对数差分及GDP平减指数变化率。

1.1978-2006年度数据拟合

该数据集只有29期观测值，而且由于差分过，实际进入模型的只有28期观测值。而前述贝叶斯估计需要首先提取一些样本进行先验分布的设定。考虑到模型的稳定性，我们选择了前面一半13期的数据来设置先验分布参数。模型仍然选择两阶滞后，具体如下：

估计时，我们进行了70000次Gibbs抽样，并舍弃前面20000次抽样数据，获得1994-2006年各期系数估计。这里，我们给出1994年、2000年和2006年对应的识别矩阵C（见表1）和脉冲响应（见下页图1）。

从图1可以看出，各期脉冲响应变化不是非常大。但无一例外，“斜率之谜”都消失了。GDP的脉冲响应都是有符号标识的实线，它们均为正值，意味着在正向需求或者供给冲击下，GDP都上升了，明显地，GDP对需求冲击的响应要更为迅速、敏感，并出现了常见的驼峰态，在第二期达到了峰值，随后回落至0。GDP对供给冲击的响应是持久的。实际上，GDP的这种脉冲响应的形状与Blanchard和Quah（1989）大体一致。价格水平对需求和供给冲击的响应也符合经典经济理论，在需求冲击下上升了，供给冲击下下降了。

2.1992年第1季度至2011年第1季度数据拟合

为保持结果的稳健性，我们将样本期扩展到1992年第1季度至2011年第1季度，再次进行了拟合。该数据集观测样本有77个，实际GDP对数和GDP平减指数都用X12进行了季节处理，经检验均为一阶单整序列，差分后进入模型，我们选择了二阶滞后，模型同式（16）。

类似地，我们选择了前面13期数据作最小二乘回归来获得应有的先验信息，然后开始后验分布估计，进行了70000次Gibbs抽样，舍弃前面20000次抽样数据，得到各期系数估计。此处，我们给出1996年第1季度、2003年第3季度和2011年第1季度对应的识别矩阵C（见表2）和脉冲响应图（见图2）。

从图2可以看出，各期响应的形态十分类似，但“斜率之谜”现象依然没有出现。物价水平对需求冲击的响应最大，其次为GDP对供给冲击的响应，GDP对需求冲击的响应没有出现太大的波动，大约10期后趋于0，物价水平对正向供给冲击的响应是负向。同时，与许多研究类似，需求冲击更多地影响了物价水平而不是GDP。

三、结论

在贝叶斯估计框架下，从先验设定到后验估计，本文详细阐述了TVP-VAR模型和TVP-VAR-SV模型的建立过程。由于我们国家的经济改革是渐进式的，经济系统中很多经济变量，特别是一些总量概念的变量，它们的结构存在平滑变化应该是不难理解的。而传统的VAR模型往往难以捕捉这种经济特征。但TVP-VAR或者TVP-VAR-SV模型则允许拟合的模型系数在时间上存在平滑转变，相对一般传统的VAR模型，时变参数VAR模型应该更加符合中国实际。特别地，我们针对徐高（2008）提出的“斜率之谜”，做出了经济系统的结构可能存在平滑变化的猜想。为验证该想法，我们利用TVP-VAR模型对徐高（2008）的数据集进行了拟合，发现“斜率之谜”消失了。同时，考虑到徐高（2008）的样本量过少可能会影响结果的稳健性，我们又使用了1992年第1季度至2011年第1季度的季度数据再次进行了拟合，“斜率之谜”现象依然没有出现。

实际上，由于传统的VAR模型无法捕捉经济系统的平滑变化，所以在拟合中国宏观总量数据方面其存在一定的缺陷。而TVP-VAR或者TVP-VAR-SV模型则恰好克服了这一缺点，在宏观时间序列研究中它显得更加适合。因此，TVP-VAR或者TVP-VAR-SV模型的引进对于提高我国宏观实证研究水平具有重大意义。

注释：

①在贝叶斯经典文献中，一般使用∑的逆的形式，这会使很多表述更为方便简洁。

②Tsay（2005）第十二章对MCMC算法提供了一个通俗而精炼的讲解。

③平凡先验在参数估计较多而样本期较短的情况下，很难得到精确的参数估计。

④此处我们未使用TVP-VAR-SV模型，在国外，使用带随机波动的TVP-VAR模型，更多的是因为美国20世纪80年代前后很多经济变量的波动性发生了明显的变化。就我国而言，经济增长和通胀率的波动并没有那么明显，而且对于我们不多的样本数据，一旦考虑∑的时变，将会多出几十个参数需要估计。

标签：贝叶斯论文; var论文; 贝叶斯估计论文; 参数估计论文; 抽样分布论文; 经济模型论文; 数据建模论文; 曲线斜率论文; 徐高论文;

基于Bays视角的时变参数VAR建模--兼论“斜坡之谜”_贝叶斯论文

猜你喜欢