STAR和ANN模型:证券价格的非线性动态特性与可预测性研究_股票论文

STAR与ANN模型:证券价格非线性动态特征及可预测性研究,本文主要内容关键词为:模型论文,特征论文,动态论文,证券论文,价格论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

证券价格可预测性研究一直是金融学的焦点课题。有效市场理论认为,在一个风险厌恶投资者组成的竞争市场中,价格序列对不同信息集具有“鞅”特征,收益序列不可预测(Shiryaev,1999)[1]。然而,近年来金融学和计量经济学研究的进展和实证检验结论表明市场并非完全有效,金融资产价格在某种程度上是可预测的。为此,传统金融学的时变理性预期假说(Time-Varying Rational Expectations Hypothesis)和行为金融学的过度反应假说(Overreaction Hypothesis)对证券价格的可预测性给出了不同的解释。例如,Campbell和MacKinlay(1997)[2]认为,证券市场复杂结构、交易过程中的摩擦以及经营环境改变引起的时变预期可能导致价格的可预测;DeBond和Thaler(1985)[3]、Jegadeesh(1990)[4]以及Poterba和Summer(1988)[5]研究发现投资者在短期内存在反应不足,而在中长期水平上存在过度反应,这些研究将股价可预测的原因归结为投资者定价行为的非理性。为了研究股价的可预测性及其运动特征,早期金融计量经济学研究建立了一些预测股价的线性模型(Hinich and Paterson,1985;White,1988;Scheinkman and LeBaron,1989等)[6-8]。然而,实际股票价格运动往往具有突发性、急速性随机跳跃和异常波动聚类等非线性动态特征,线性模型的拟合具有很大的局限性,这激发了非线性金融时间序列模型在理论和实践上的发展。国外学者将双线性模型(Mohler,1973;Granger and Andersen,1978)[9,10],ARC族模型(Engle,1982;Bollerslev,1986)[11,12],平滑迁移模型(STAR)(Granger and Tersvirta,1993;Tersvirta等,1994)[13,14],人工神经网络模型(ANN)(Hornik等,1990;Swanson and White,1995,1997等)[15-17],小波和混沌动力学模型(Wickerhauser,1992;Edgar,1999)[18,19]等方法引入到该领域的研究之中。

在国外大量研究基础上,国内学者也对股价的可预测性进行了一定的研究:杨德权等(1999)[20]应用向量值状态空间模型的两步建模方法分析了深圳五种股票价格的动态行为,通过有关统计量和20天的样本外预测以及Henriksson与Merton提出的非参数检验方法验证和分析了预测结果的有效性;周爱民(1999)[21]建立股市自回归预测模型,检验股市主要技术指标的协整性,同时指出各种模型的阶数高低与股市有效性相对强弱之间存在着反向关系;胡杉杉等(2001)[22]对中国金融市场的数据进行了实证检验,得出我国金融市场的证券收益存在可预测成分的结论,并由此提出金融市场价格预测的理论框架;张潜、高立群(2002)[23]基于小波分析理论证明了证券价格的可预测性;宋玉臣、寇俊生(2005)[24]用自相关检验和方差比率非参数持久性测量方法,对沪深股市A、B股市场四个指数的月收益率进行实证检验,发现上证综合指数具有显著的均值回归特征;赵振全、丁志国、苏治(2005)[25]利用国际通行的“买入—持有”原则实证比较了美国市场、英国市场、日本市场和中国市场中上“动量交易策略”与“反转交易策略”有效性的差异,证明了股价在中长期上的可预测性;丁志国、苏治、杜晓字(2006)[26]利用美国、英国、日本和中国证券市场数据实证检验了时变理性预期假说,结论支持过度反应假说,证券价格具有可预测性,证券市场没有达到弱式有效;程瑜蓉、郭双冰(2003)[27]用径向基函数模型对股价进行预测,结果表明该模型能有效地进行短期预测;欧阳林群(2006)[28]建立基于人工神经网络的股价预测模型,对海信电信(股票代码:600060)收盘价和大盘指数进行了模拟,验证了股价的可预测性。但是,已有研究主要采用单一线性或非线性模型对证券价格的可预测性进行研究,没有对各模型的预测能力进行全面综合比较研究,结论缺乏稳健性。

本文与已有相关研究的主要区别及特色在于:将随机游走模型(RW模型)、AR模型、STAR模型(ESTAR和LSTAR)和ANN模型(MLP、JCP和Elman网络)同时引入到证券价格的短期和中长期可预测性研究中,并基于一步向前和多步向前预测法,采用多种统计指标和投资策略指标比较上述典型线性和非线性模型的拟合和预测能力。另外,本文还比较了基于上述模型的投资策略所获得的平均净收益。

一、模型简述与评价标准

(一)STAR模型和ANN模型

(1)STAR模型

STAR模型是一种能够捕捉股价突发性跳跃或平缓性趋势迁移的非线性模型,通过刻画股价非线性“区制(regime)转移”的动态特征,提高模型拟合效果和预测精度。两区制一阶STAR模型的结构为:

本文采用QMLE和BFGS算法估计ESTAR和LSTAR中的参数。

(2)ANN模型

ANN模型是各种非线性模式通用的逼近工具(Hornik等,1990),也是优秀的估计工具(Swanson and White,1995,1997)。本文采用MLP网络、JCP网络(Kuan and White,1994)[29],以及部分回馈Elman网络(Elman,1990)[30]对证券价格非线性动态特征及可预测性进行研究。单隐层MLP(p;q)网络的模型结构为:

(二)预测方法

为了增强结论的稳健性,本文采用一步向前预测和多步向前预测两种方法评估模型的预测能力,并且采用递归方式不断更新模型的参数估计以提高模型的预测精度。另外,线性模型和非线性模型的多步向前预测方法存在很大差别:线性模型的多步向前预测仅仅取决于模型参数和历史数据,而与扰动项分布无关;而在扰动项分布未知的情况下,非线性模型的多步向前预测的确切解析解很难获得,这可以采用数值模拟、Monte Carlo模拟和bootstrapping抽样等方法进行预测(Pemberton,1987;de Gooijer and Bruin,1998;Clements and Smith,1999;Lundbergh and Terasvirta,2002)[32-35]。本文采用Monte Carlo模拟计算STAR的多步向前预测,而神经网络的多步预测方法采用迭代预测法,即把模型得到的对下一个时刻的预测值反馈到模型输入,从而给出再下一个预测值,如此继续,直到达到所要的预测水平。需要说明的是,在做多步预测时,ANN模型训练集合中的样本和做一步预测是一样的。

(三)模型预测评价标准

1.统计标准

本文采用多种统计指标评价不同模型的预测能力:用MAE,RMSE,Theil's U-statistic指标衡量所有模型的预测精度;用正确预测收益符号的比例和DA检验(Pesaran and Timmermann,1992)[36]比较模型的盯市能力,并根据Clements and Hendry(1993)[37]方法对模型进行包容性检验。用DM检验(Diebold and Mariano,1995)[38]分析各模型的样本外预测残差是否统计显著。

2.投资策略标准

本文基于盯市策略评价模型的预测能力,把每个交易日头寸状态分为“股票满仓”和“股票空仓”两类,给定现在的头寸状态,以及由不同预测产生的“买”或“卖”的信号确定下一个交易日采取的头寸。若现在头寸是“股票满仓”,且预测值显示股票价格要下降,那么卖出股票,把所有资金投资于无风险证券;若现在头寸是“股票空仓”,且预测值显示股票市场要上涨,那么卖出无风险证券,买入股票,其它情况下当前头寸保持不变(Fernandez el at.,2003)[39]。在预测周期内,盯市策略所获得收益的计算公式如下:

二、数据选取及实证结果分析

本文选取上证180指数日收盘价作为样本。上证180的成分股是一些规模大、流动性好、行业代表性强的股票,它能全面地反映股价的走势,反映上海证券市场的概貌和运行状况,具有可操作性和投资性,能够作为投资评价尺度及金融衍生产品的基准指数。样本区间为1996年7月1日至2007年11月6日,共有2744个观测值,经过对数变换得到日收益率序列,对数收益率计算方法为:,log(·)是自然对数。数据来自Wind资讯金融终端数据库,文中数据处理和模型估计使用的软件有Matlab R2006a和Gauss7.0及其优化包。在模型估计的基础上,用一步向前预测和多步向前预测对N(N=100,200,500)个交易日进行预测,根据统计指标和投资策略指标,比较各模型的样本外预测能力。

表1 非线性模型中滞后阶数最优取值

模型

预测水平

H=100 H=200H=500

p dqpdqp dq

STAR 1 7 17 2 8

MLP 14 14

1214

14

6

JCN 15

3

12 58

7

Elman15

2

12 48

5

表1列出了STAR模型和ANN模型中滞后阶数的最优取值。需要说明的是,STAR模型估计中,设定转移变量,根据SBIC准则选择其滞后阶数p,依照样本内估计残差平方和最小原则选取d;ANN模型含一个隐层,激活函数g(·)采用双曲正切函数(Klimasauskas,1991)[42],选取使样本预测MSE最小的网络参数。

表2列出了拟合度检验及盯市能力检验的结果。依据Theil's-U统计量,RW模型的预测能力最差;依据MAE、RMSE、Signs统计量,ANN模型通常具有较小的预测误差,预测精度比AR、STAR模型高。DA检验结果表明,ANN模型“盯市”能力很强,短期和中长期对收益率符号预测的准确率基本在64%以上,JCN网络和Elman网络的“盯市”能力强于MLP网络。

表3列出了包容性检验结果。在10%的显著水平上,进行一步向前递归预测时,RW模型不包容其它模型,但其它模型都包含RW模型,即AR、STAR、ANN模型总是比RW模型好。虽然ANN模型不是在所有情况下都优于AR、STAR模型,但从总体看来,ANN模型(特别是JCN网络)具有较强预测能力。

表4列出了DM检验结果。结果表明,RW模型的预测能力与其它模型存在显著差别,其它模型都优于RW模型的预测效果;在100、200的预测水平上用一步向前预测和一步向前递归预测时,除Elman网络外,几乎全部模型的预测能力无差别。Corradi and Swanson(2002)[43]指出,由于STAR和ANN(Elman网络除外)是嵌套模型,所以检验与通常情况不一致。

图1和图2给出了LSTAR模型和ANN模型的样本内拟合和样本外预测效果。从图中可以看出:JCN网络能更好的描述指数的非线性特征。

实际投资决策中,能获得高投资收益的模型才具有真正实用价值。表5比较了基于不同模型的“盯市”投资策略与“风险调整买入并持有”投资策略的收益。结果说明,在预测水平为100时,基于Elman网络的投资策略获得的收益最高;从总体看ANN模型指导实际投资比AR,STAR模型产生更高的平均净收益,并且只有基于ANN模型的“盯市”策略所产生的收益高于“买入并持有”策略所获得的收益()。

综上,与其它模型相比,ANN模型总体上更好地刻画了上证180指数的非线性特征,具有更好的样本外预测能力,其中,JCN网络模型表现最优秀。基于ANN模型的投资策略能够获得超常收益,而RW模型对上证180指数的拟合和预测在所有模型中最差。由于ANN模型对于股价的预测完全基于历史价格信息,它在证明证券价格具有一定可预测性的同时,也表明我国证券市场没有达到弱势有效。

表2 拟合度检验及盯市能力检验

注:表中给出的是AD检验p值,“*”表示同一列中最好的结果;RM,UT,SG分别是RMSE,U-Theil,Signs的缩写;ES,LS,ML,JN,EL分别是 ESTAR,LSATR,MLP,JCN,Elman模型缩写。

图1 最后100期样本拟合结果比较

图2 100期一步向前递归预测结果比较

三、结语

本文采用线性模型和非线性模型对证券价格的非线性动态特征及可预测性进行了研究,取得了以下主要研究成果:

首先,与RW、AR模型和STAR模型相比,ANN模型拟合能力更强,预测精度更高,能更合理地刻画上证180指数的非线性动态特征。

表3 包容性检验

注:表中给出的是检验的p值;模型缩写规则与表2相同。

表4 DM检验

注:表中给出了DM检验统计量的值;统计量服从标准正态分布;模型缩写规则与表2相同。

表5 交易策略收益的比较

注:r表示基于不同模型的“盯市”策略收益;r_bha表示“风险调整买入并持有”策略收益。“*”表示同一列中最好的结果,带下划线的值为超过r_bha的“盯市”策略收益。

其次,基于ANN模型预测的“盯市”策略能获得高于“买入并持有”策略的收益,这对投资机构进行实际投资具有一定的参考价值。

最后,我国证券价格具有非线性动态特征,并且在短期和中长期水平上具有一定的可预测性,证券市场没有达到弱势有效。

值得注意的是,本文的研究更全面地融合了多种模型方法,提高了研究结论的稳健性,这是本文和已有研究结论不同的主要原因。

标签:;  ;  ;  ;  ;  ;  ;  

STAR和ANN模型:证券价格的非线性动态特性与可预测性研究_股票论文
下载Doc文档

猜你喜欢