GPD“厚尾”与POT模型中的金融风险度量_概率密度函数论文

POT模型中GPD“厚尾”性及金融风险测度,本文主要内容关键词为:金融风险论文,性及论文,模型论文,POT论文,厚尾论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

大量研究表明,金融资产回报的分布具有非正态和“厚尾”特征。极端值模型主要有分块样本极大值模型(BMM)和越槛高峰(POT)模型。它们是测度极端市场条件下市场风险的一种方法,具有超越样本数据的估计能力,可以准确地描述分布尾部的分位数。

传统极值理论在实际应用中采用的是BMM。该模型基本分析步骤是,首先对样本数据划分块,再求出每一块的最大值,然后对块最大数据进行统计分析,关于BMM的具体方法参见Coles(2001)。

POT模型基于传统极值理论,考虑超越阈值的数据,将这些数据看做极值水平,然后利用广义Pareto的概率分布来拟合这些超越数据。建模重在估计超过某阈值的超阈值所服从的分布,并在此基础上估计总体的分布并计算风险。实践表明,BMM主要用于处理具有明显季节性数据的极端值问题,往往造成大量数据的浪费,不能满足参数估计所需的样本量,增加了估计的误差。POT模型比BMM更能充分利用样本数据所包含的信息,是一种基于超过某一阈值的极端值建模的有效方法,被认为是目前极端值建模实践中最有用的模型之一。

POT模型中广义Pareto分布(CPD)由Pickands在1975年首次提出,Davison(1984),Smith(1984、1985),Van Montfort和Writer(1985)做了进一步研究,它广泛应用于极值分析、拟合保险、金融资产损失及可靠性研究领域。主要研究内容包括:

将POT模型进行广泛的应用,这也是研究最多的领域。如Zajdenweber(1996),Mcneil(1997)和Resnick(1997)用POT模型研究保险损失。在国内,利用极值理论分析极值风险,也引起了许多学者的关注,如刘国光(2005)等用POT模型研究了沪深股市股票收益率分布的尾部特征,封建强(2002)等用POT模型研究上证股指收益率的尾部特征。此外,高洪忠、柳会珍、欧阳资生、陈守东等也曾做过类似领域的研究。高松(2004)等研究POT模型在汇率风险价值中的应用。

广义Pareto分布的参数估计问题。如Dupuis(1996),桂文林(2008)等利用矩估计、概率加权矩方法和极大似然估计方法来估计极值分布,发现广义Pareto分布的形状参数ε<0时,0<y<-β/ε。因此,用实际损失数据进行参数估计时,可能会产生参数估计不合适的情况,且极大似然估计方法比矩估计和概率加权矩方法更加合适。

广义Pareto分布的阈值估计问题。如Gill(2000)等建议以样本平均超额函数图或Q-Q图等图形法来估计广义Pareto分布的阈值。Coronel-Brizio HF等(2005)利用Anderson-Darling拟合检验统计量确定广义Pareto分布的阈值。王炳兴(2008)等根据广义Pareto分布与两参数指数分布之间的相互关系,利用两参数指数分布的拟合优度检验统计量确定阈值。

关于广义Pareto分布的研究认为,当ε>0时,广义Pareto分布为普通Pareto分布,是“厚尾”分布,满足金融资产回报分布的“厚尾”特征。此外,当ε>0时,广义Pareto分布的所有大于等于1/ε的各阶矩都是无限的,即对k≥1/ε,无限(Dacorogna等,2001)。在股票和高频外汇回报中ε通常小于0.5,意味着回报有无限方差。此时,广义Pareto分布最适合金融资产时间序列“厚尾”分布建模。有关广义Pareto分布的“厚尾”性研究仅限于此。本文将对POT模型中广义Pareto分布的“厚尾”性及其应用进行深入分析,从而为风险度量及其他应用中POT模型的科学使用提供依据。

一、越槛高峰(POT)模型

其中,β>0是分布的尺度参数,而ε是重要的形状参数。当ε≤0时,0≤y≤-β/ε;当ε≥0时,y≥0,一般研究认为,此时广义帕累托分布是“厚尾”分布,它广泛应用于金融资产回报时间序列“厚尾”分布建模。这里要作具体深入分析,找到其根据。

二、广义Pareto分布的“厚尾”性分析

广义Pareto分布可由BMM模型中广义极值(GEV)分布导出,却有许多更为优良的性质,主要体现在形状参数上。它直接体现着广义Pareto分布的“厚尾”性,具体论证和实证过程如下。

1.GPD“厚尾”性与形状参数关系建立

根据(2)式得到超阈值y近似服从的广义Pareto分布的概率密度函数:

2.当ε=0时,广义Pareto分布“厚尾”性分析

当ε=0时,广义Pareto分布为指数分布。图1是它与标准正态分布概率密度函数的差值函数。可见,随着超阈值的增加,两概率密度函数值的差值接近于0。此时,广义Pareto分布介于“厚尾”与“薄尾”分布之间,为“中尾”分布,其“厚尾”性与正态分布一致。β取0.5~2.5间隔为0.5的五个值,由图1可见,随着β的不断增加,两分布的一致“厚尾”性所要求的超阈值越来越大。

图1 ε=0时广义Pareto分布和正态分布差值

3.当ε>0时,广义Pareto分布“厚尾”性分析

当ε>0时,由(3)中所有变量均为正得知,表明其概率密度函数是关于超阈值的减函数,如下页图2、图6(第64页)所示。下面分两种情况分析当β>0,ε>0时,分布的尾部随形状参数的变化而变化的具体情况。

为此种情况实证的需要,任取β=2.5,ε取0.01、0.34、0.67、1四个值,用MATLAB7.0绘得广义Pareto分布概率密度函数如图2所示。其中2β/(1-ε)依次取5.0505,7.5758,15.1515,+∞。表明随形状参数的增加,临界点相应增加,概率密度函数递减。此时具体尾部情况如下页图4,这里取y=lO,β取0.01,0.41,0.81,1.21,1.61五个值。此时,尾部变厚的速度越来越慢。与超阈值10相应的标准正态分布的尾部厚度为7.6946×,与图2和图3相比,显然为“厚尾”分布。可见,此时广义Pareto分布的尾部随形状参数的变化情况如理论上所论证。

图2 0<ε≤1,β>0时广义Pareto分布“厚尾”性

图3 0<ε<1时广义Pareto分布尾部具体特征

(2)当ε>1时,广义Pareto分布“厚尾”性分析。当ε>1时,若y<2β/(1-ε)时,y<0与超阈值为正相背,此种情况不存在。反之,y>2β/(1-ε)是一种必然情况,此时H'(z)<0,H(z)<0和H(z)>0两种情况均存在,如下例所示。

图4 ε>1,β>0,H(z)<0时的G(l)函数图

图5 ε>1,β>0,H(z)>0时的I(z)函数图

图6 ε>1,β>0时广义Pareto分布“厚尾”性

为此种情况实证的需要,任取β=1,y取3.500、3.9215、4.9215、5.9215四个值,用MATLAB 7.0绘得广义Pareto分布概率密度函数值关于形状参数关系图,如图6所示。当0<y<3.9215时,尾部厚度随形状参数的增加而变薄;当y>3.9215时,尾部厚度随形状参数的增加先增后减。此时与y对应的标准正态分布的概率密度函数值依次为,与图6所示显然为“厚尾”分布。上述结论得以验证。

4.当ε<0时,广义Pareto分布“厚尾”性分析

当ε<0,β>0时,其定义域为0≤y≤-β/ε,广义Pareto分布为“截尾”分布,如图7、图8所示。由于是“截尾”分布,当超阈值充分大时,其尾部分布概率密度函数值为零。此时相对“拖尾”分布的正态分布,必为“薄尾”分布。

若0<y<2β/(1-ε)时,得到H'(z)>0。由于z<0,于是有H(z)<H(0)=0。此时,超阈值所服从的广义

图7 -1≤ε<0,β>0时广义Pareto分布的“厚尾”性

图8 ε<-1,β>0时广义Pareto分布的“厚尾”性

Pareto分布的尾部随形状参数的增加而变薄。将上述条件和定义域合并,得到:

若y>2β/(1-ε)时,得到H'(z)<0。由于z<0,于是有H(z)>H(0)=0。此时,超阈值所服从的广义Pareto分布的尾部随形状参数增加而变厚。将上述条件和定义域合并得到:

将上述两种情况按形状参数ε分别归纳如下:

当-1≤ε<0,由(3)式和定义域知,此时超阈值所服从的广义Pareto分布的概率密度函数为减函数。若0<y<2β/(1-ε)时,超阈值所服从的广义Pareto分布的尾部随形状参数的增加而变薄。而此时若2β/(1-ε)≤y≤-β/ε时,尾部随形状参数的增加而变厚。

为实证的需要,取β=1,ε取-0.85~-0.15之间,间隔为0.15的五个值,用MATLAB7.0绘得广义Pareto分布概率密度函数如图7所示。其中(2β/(1-ε),-β/ε)依次为(1.0811,1.1765),(1.1765,1.4286),(1.2903,1.8182),(1.4286,2.5),(1.6,4)。上述结论得以验证。

当ε<-1时,由(3)式和定义域知,此时超阈值所服从的广义Pareto分布的概率密度函数为增函数。若0<y<-β/ε时,超阈值所服从的广义Pareto分布的尾部随形状参数的增加而变薄。

为实证的需要,取β=1,ε取-10~-1之间,间隔为2的五个值,用MATLAB 7.0绘得广义Pareto分布概率密度函数如图8所示。其中-β/ε依次为0.1,0.125,0.167,0.25,0.5。上述结论得以验证。

5 广义Pareto分布“厚尾”性分析

根据上述分析,超阈值所服从的广义Pareto分布概率密度函数的增减性及分布的“厚尾”性总结如表1所示。

由表1知:①当形状参数ε=0、ε>0、ε<0,对应的广义Pareto分布分别为“中尾”、“拖尾”分布,“厚尾”、“拖尾”分布和“薄尾”、“截尾”分布。②当ε<-1时,广义Pareto分布的概率密度函数为增函数,除此之外的其他情形均为减函数。③当ε>1时,广义Pareto分布为“厚尾”分布,但其尾部随形状参数的增加变化规律难以确定。④POT模型中的广义Pareto分布尾部随形状参数的变化更为具体和多样,更适合金融风险度量。综合以上分析理论后得出,当且仅当0<ε≤1,y>2β/(1-ε)时,分布为“厚尾”分布,概率密度函数递减且尾部随着形状参数的增加而变厚,变厚的速度越来越慢。股票和高频外汇回报的实践中通常满足0<ε≤0.5,此时最适合于金融资产时间序列“厚尾”分布建模。

表1 超阈值近似服从的广义Pareto分布的“厚尾”性(β>0)

三、POT模型用于金融风险度量

POT模型用于金融风险度量中阈值的选取很重要,过高不能满足估计需要的样本量,过低又不能满足分布的“厚尾”特征。选取阈值的常用方法是超阈值均值函数的线性法则。超阈值均值函数e(u)定义为C(X-u|X>u)。当超阈值服从广义Pareto分布时,超阈值均值函数为(β+ε·u)/(1-ε),是线性函数。实践中,选取不同阈值计算样本超阈值均值,得到样本超阈值均值函数(SMEF)图,记为。理论和实践表明,超阈值服从广义Pareto分布的样本超阈值均值函数图形在阈值以上的部分为正斜率的直线,以此来选取超阈值。

广义帕累托分布参数估计最常用的方法是极大似然估计,通常包括点和区间估计,前者是估计的基础,后者是为避免过高的估计线性误差所设计,用似然比检验得到。除参数的极大似然估计外,还有其他方法,如概率加权矩估计,分布函数的线性(Kearns和Pagan,1997)或非线性回归估计等。

给定一组符合渐近广义Pareto分布的超阈值样本,根据渐近广义Pareto分布的分布函数得到相应的概率密度函数和对数似然函数为:

Hosking和Wallis(1987)曾证明,当ε>-0.5时,满足极大似然估计的正则条件,此时参数的极大似然估计量服从非对称正态分布,估计量的渐近标准误差可以通过极大似然估计相应得到。

联合(1)式和(2)式并在正确估计阈值和计算样本超阈值的基础上估计超阈值渐近广义帕累托分布。于是,超过该阈值的金融资产回报尾部分布函数估计(封建强,2002;陈守东等,2007)为:

给定置信水平1-p的上分位点,即VaR的估计(封建强,2002;陈守东等,2007)为:

假如一项资产在一年内超过某个最大损失(如上式所示)的概率为P,在L年内的损失情况为L重贝努利(Bernoulli)试验。令X为上述事件第一次发生所需的年数,则它服从参数为P的几何分布,X的期望值为1/P。意味着L年内某项资产第一次超过某个最大损失平均需要1/P年。因而可用k=1/P年事件和对应的最大损失来度量某一极端事件发生的频率和资产的风险。

四、实证研究结果统计分析

作者从中国期刊网上查询到应用POT模型度量金融资产市场风险的主要参考文献,表2和表3(见下页)列举了其中6篇文献。文献中所取样本主要包括上证指数和深圳成分指数以及汇率高频数据等。由于10多年来我国股市在不断发展、制度在不断健全、市场在逐渐规范,投资者也渐趋理性,股份行为必然会表现出明显的阶段性。因而在样本选取上多数考虑到了1996年12月16日前后的股份行为的差异。文献中所取股市样本区间为1990年12月19日至2007年6月26日之间不等。上证A股指数(部分)收盘价如表3所示。其中汇率区间为1971年1月4日至2003年5月30日。

研究使用的收益率指标是日对数回报,定义为,其中为股指在t时的收盘价,即为日百分比收益率。在估计VaR时,一般对日对数收益率取负号,通过计算得到的上侧分位数取负号即为所测度的风险值。

表2 GPD“厚尾”性用于金融风险测度的实证统计的样本

表3 上证A股指数的日收盘点数(2007-06-26~2007-04-11)

注:原始数据来源于国泰安研究服务中心http://www.gtarsc.com/Login.aspx.

根据本文第三部分的理论所述,选取阈值及相应的超阈值个数如下页表4所示。ε和β参数估计可直接借助SPLUS软件得到,或者在极大似然估计中,将极大化似然函数转化为二元函数无条件极值问题,用MATLAB命令fminunc和fminsearch予以实现。在此基础上,根据公式(5)可算出不同显著性水平下的VaR值。结果如表4所示。

表2中文献及表4的实证研究结果表明:①股票和高频外汇回报的超阈值拟合广义Pareto分布,得到形状参数ε估计的最大值为0.40272,最小值为0.04370,平均为0.21843。可见,通常它们都属于0<ε≤0.5范围内,满足0<ε≤1的条件。较大的超阈值一般较多,因此由理论部分得到的0<ε≤1,y>2β/(1-ε)条件得以满足。此时最适合于金融资产时间序列“厚尾”分布建模和参数的极大似然估计。②[7]、[10]、[14]、[15]四篇文献中,上证指数对应GPD的形状参数估计分别为0.40272、0.23142、0.05849和0.04370,其平均为0.184083。在95%的置信水平下,上证指数风险度量VaR值分别为2.642%、2.211%、2.389%和3.537%,平均数为2.695%。[7]、[15]、[16]三篇文献中,深圳成分指数对应的形状参数分别为0.24402、0.28196、0.29800,平均数为0.27466。在95%的置信水平下,深圳成分指数的风险度量VaR值分别为3.762%、3.264%和3.940%,平均数为3.655%。在同一文献[7]中,上证指数的风险度量VaR值为2.642%,深圳成分指数的风险度量VaR值为3.762%。可见,深圳证券市场收益率分布尾部明显厚于上海证券市场。深圳证券市场比上海证券市场包含更高的市场风险。③我国从1996年12月开始实行涨跌停板制度(柳会珍等,2006)。从上海证券市场来看,制度执行后的[7]、[10]、[14]三篇文献的VaR平均值为2.414,制度执行前后的文献[15]的VaR值为3.537。可见,该制度执行后市场风险明显下降,该制度有效地控制了股票市场的投机现象,从而降低了投资者的收益损失风险。深圳证券市场这一特征不甚明显。

表4 GPD“厚尾”性用于金融风险测度的实证统计的参数估计

注:VaR对应95%的置信水平,其值用百分数表示。为阈值估计;为超阈值样本量;为形状参数估计;为尺度参数估计。

五、结论

通过上述研究得出的结论有:①传统研究将POT模型用于具体的金融风险度量的实践中,只是回答了在具体领域中如何应用的问题。本文为POT模型用于金融风险度量的依据进行科学论证,回答了为什么可以去用的问题。同时,通过实证研究的统计分析既证明了论证的合理性并得出我国沪深股市及汇率市场风险特征的一些新结论,因而具有更为重要的理论和实践意义。②当形状参数ε=0,ε>0和ε<0时,对应的广义Pareto分布分别为“中尾”、“拖尾”分布,“厚尾”、“拖尾”分布和“薄尾”、“截尾”分布;当ε<-1时,广义Pareto分布的概率密度函数为增函数,除此之外的其他情形均为减函数;当ε>1时,广义Pareto分布的尾部随形状参数的增加变化规律难以确定;POT模型中广义Pareto分布的尾部随形状参数的变化更为具体和多样,更适合金融风险的度量;当且仅当0<ε≤1,y>2β/(1-ε)时,分布为“厚尾”分布且尾部随着形状参数的增加而变厚,而股票回报和高频外汇回报中通常0<ε≤0.5,此时POT模型最适合于金融资产时间序列“厚尾”分布建模。③可用k=l/P年事件和对应的最大损失,即VaR来度量某一极端事件发生的频率和资产的风险。④我国金融市场大量的实证研究结果表明,股票和高频外汇回报的超阈值拟合广义Pareto分布的形状参数通常都属于0<ε≤0.5范围,与理论研究结论相一致。此时最适宜金融风险度量和参数的极大似然估计。⑤深圳证券市场收益率分布尾部明显厚于上海证券市场,深圳证券市场比上海证券市场包含更高的市场风险。可见,上海证券市场相对深圳证券市场表现更为成熟;自1996年12月,股市涨跌停板制度执行后市场风险值VaR明显下降,表明该制度执行有效地控制了股票市场的投机现象,从而降低投资者的收益损失风险。⑥在上述研究的基础上,考虑多种金融产品交易的组合,可以利用多元极值理论进行分析,目前该领域已取得一些重要成果并成为国内外研究热点,相信极值理论在多金融领域中有着更为广阔的应用前景。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

GPD“厚尾”与POT模型中的金融风险度量_概率密度函数论文
下载Doc文档

猜你喜欢