预测稳健回归模型及其实证分析_实证分析论文

预测型稳健回归模型及其实证分析,本文主要内容关键词为:实证论文,稳健论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

回归分析是计量经济学中最常用的定量分析方法,也是建立经济计量模型的主要工具,它在现代经济定量分析中应用越来越广泛。众所周知,计量经济学方法有四大应用:经济结构分析、政策模拟、预测和实证分析。人们为了分析经济变量间的长期结构,作了大量研究,如2003年尼诺贝尔经济学奖获得者格兰杰(Granger)引出的协整理论,还有稳健回归理论等等,目的是研究和找到经济变量间的长期稳定的关系结构。但如果直接将这些理论方法应用在回归模型的预测应用中,结果并不十分令人满意,原因是按照传统的计量经济方法建立的模型大部分集中反映变量间的长期平均关系,而不能反映变量间的短期波动,以至于很多人对计量经济模型的预测应用产生怀疑。事实上,70年代由于流行的宏观计量模型没有预测出石油危机所导致的经济危机,就产生过对当时的计量经济学预测方法的质疑,曾经阻碍过它的普及与发展,因此,必须重视计量经济模型的预测应用问题。根据稳健回归中的M-估计的理论,我们提出了用于预测的稳健回归模型,通过实证分析,验证了它与传统的最小二乘法建立的回归模型相比,在预测方面具有更高的预测精度,并且具有稳健的性质。

一、稳健回归方法M-估计简介

在建立计量经济模型时如果误差项不服从正态分布,最小二乘法估计的结果就会严重脱离事实,估计的精度也很差。而当样本数据含有强影响点或例外点(outliers)数据时,一般OLS估计出的残差就不会是正态分布,而往往是偏尾的,其修补的措施并不应该是草率地剔除掉,因为有些强影响点数据并不是任何执行错误所致,而是固有的数据变异性的结果,简单地剔除它们,会导致重要的隐藏信息的丢失。当然,在回归分析中也不应与正常数据一样对待,它们出现的概率或频率毕竟很小,合理的做法——采用稳健回归(Robust Regression),以消除OLS对异常数据的易受影响性。

对参数估计而言,若借以计算估计量的数据分布不均匀,存在异常值干扰,但在这稍偏离原假定的概率分布(正态分布)模式下,仅使该估计量有相应的小偏差,且不致随数据误差增大而背离真实值,则称为稳健估计[3]。

适当选择目标函数ρ和权重函数ω(e),让导致残差异常的例外点或强影响点的权重变小,残差小的样本数据权重增大,从而减弱强影响点对回归分析的影响,实现稳健回归的目的。

我们可以通过比较三种常用的M-估计:普通最小二乘法、Huber估计、Bisquare估计[2]的目标函数和权重函数,观察稳健回归怎样实现削弱强影响点的影响的。

表1 三种稳健回归的比较

在Huber估计和Bisquare估计中,常数к称为阀值,κ值越小,削弱强影响点的影响范围越广,例外点的权重越小。两种稳健估计都对服从正态分布的误差影响小,对不服从正态分布的误差影响大。当κ值确定了以后,估计的残差越大,它的权重就越小,在Bisquare估计中,如果残差的绝对值大于阀值κ,则权重为0。适当的选择阀值κ,就能保证对异常值影响的处理。

例如,在Huber估计中κ=1.345,在Bisquare估计中是κ=4.685时,它们权重函数的图像分别为:

通过比较可以看出,最小二乘法对所有样本点的权重都是1;Huber估计对残差接近0的样本权重是1,残差绝对值大于阀值的样本,离阀值越远,权重越小;Bisquare估计中,在阀值以内的样本点的权重随残差绝对值离0越远,权重递减,阀值以外的样本点权重为0。

二、预测型M-估计回归模型的提出

稳健回归中的M-估计主要是削减数据中例外点或强影响点对回归估计的影响,而给不同的样本以不同的权重,权重依赖于估计残差的大小,以达到所建回归模型稳健的目的,这样做出的最终结果,更好地反映了解释变量与被解释变量间的长期平均关系。但如果所建的回归模型是进行预测应用的,这种稳健回归的结果,预测效果并不好。在预测应用中,一般都存在时效性,对变量的预测基本上都是对未来的预测,因此,近期的状况比远期的状况对未来更具影响力,那么,这一点如何在模型中反映出来呢?我们可以借鉴M-估计的方法,在构造目标函数时,引入时序函数,使近期内残差的函数在目标函数中的比重大一些,而远期的残差函数在目标函数中的比重小一些。

4.重复第2步和第3步,直到估计的参数趋于一致。

初始估计值的选取,对最终的IRLS估计结果有很大影响,如果选择不正确,就达不到稳定的结果,另外,还要满足预测型回归模型的要求,反映出时效的影响。一般初始估计值可由满足条件的经验加权最小二乘法以及实证分析的实践来定,以实现迭代结果稳定、能反映预测的时效性规律为目的。

三、实证分析

下面我们实证分析预测型稳健回归模型在实际预测中的应用,以及观察它较普通最小二乘法所具有的优良性。消费模型一直是计量经济学中的经典的实例之一,我们就以消费模型来实例分析回归预测方法,以简单的一元线性回归模型为例,这里被解释变量选择为我国城镇居民的生活消费支出,解释变量为城镇居民的可支配收入,样本数据为1985~2002年我国城镇居民可支配收入和生活消费支出的年度数据(来自各年的中国统计年鉴)。

为了便于对照比较,我们分别选1985~1994、1985~1995、1985~1996、…、1985~2002年为样本区间建立若干回归模型来预测下一年度的城镇居民生活消费支出,并将每次回归预测下一年度的实际值与预测值进行比较,其差值为残差,一种是选用普通最小二乘法,另外两种按照第二部分中预测型稳健回归的要求,分别选取一些随时间t不断增大的权重函数,做加权最小二乘法运算,并进行下一年度居民生活消费支出的预测,由于计算问题,并未进行IRLS方法的迭代,每一步回归以及其预测精度比较的计算结果见表2(表略)。

通过实证分析,我们看到,在回归分析反映变量间长期平均关系的基础上,增加考虑变量随时间变化的时序性,将短期因素也反映到模型中,有其合理性的依据,在预测应用中显示出其优越性。但在实践中如何将这一因素反映在模型中,还有很多值得探讨的问题,如随时间变化的权重选取问题等,还需要根据具体问题时序性的特点,以及实证分析的结果,加以归纳总结。另外,预测型稳健回归模型一般只适用于时间序列类型的数据,对截面数据不适合。

标签:;  ;  ;  ;  

预测稳健回归模型及其实证分析_实证分析论文
下载Doc文档

猜你喜欢