微分方程的最优控制

微分方程的最优控制

吴辉[1]2015年在《时变金融市场下动态投资组合选择理论及其应用研究》文中进行了进一步梳理金融市场中充满了各种不确定性和时变性,投资者在投资中必然面临风险。怎样有效地控制和管理风险,如何通过分散化金融投资形成最优投资组合,有效地降低投资者面临的非系统性风险,就成为了投资者必须面对的一大挑战和难题。在现实中,不同的投资可能会产生不同的风险。特别的,短期投资者与长期投资者的最优投资需求是完全不一样的。通常短期投资者只关心在一个时期内的资产(组合)收益率的均值与风险,而忽略了投资机会集在下一个时期的可能变化,短期投资者的投资行为在这种情形下被认为是短视的。传统的资产组合选择理论忽略了投资机会集的变化和金融市场资产价格的时变特征对投资决策的影响。金融市场中大量的时变经验事实特征,比如,协整效应、动量效应、随机利率、随机波动率以及宏观经济状态随机转换都表明投资机会集不是固定不变的,而是具有随机性特征。实践中,投资者的投资行为通常是动态多期的,他们不只是关心当期投资机会集对于财富的冲击,而且关心投资机会集未来的随机性对于财富的跨期冲击。由于投资机会集随时间变化,投资者除了对金融资产的短视需求外,还具有跨期对冲需求,即利用金融资产来规避随机投资机会集的跨期冲击。因此,从长期视角出发,基于金融市场的多个时变特征,对动态投资组合选择问题的研究不仅具有重大的理论价值,也具有重要的现实意义。在这种背景下,本论文研究了基于多个不同金融市场特征下动态投资组合选择的若干问题,综合运用效用函数理论、随机控制理论和随机微分博弈理论,建立严格的数理金融模型,系统的探讨了模型特征、适用条件、投资与消费行为、跨期对冲需求、配对交易和动量投资策略等规律。主要研究成果简述如下:首先,针对股票价格之间的协整效应时变特征,研究了金融市场的股票资产存在协整关系的,投资者该如何进行投资与消费。基于协整资产价格模型,以有限期消费总效用和终端时刻财富期望效用的最大化为决策目标,分别在幂效用和对数效用函数下,推导出了最优化问题价值函数的高维、非线性、非齐次的Hamilton-Jacobi-Bellman(HJB)方程。给出了最优投资、最优消费的显式的表达式。讨论了动态优化模型的四种特殊情形:投资者只关心终端时刻的财富效用最大化;投资者只关心有限期的消费总效用最大化;股票价格之间不存在协整关系以及风险厌恶系数为零。在理论分析的基础上,分析了协整效应对于投资者的福利,最优投资与最优消费的影响。结果表明,当两个风险资产的价格都被低估时,投资者通过借贷买入两个风险资产。当两个风险资产的价格都被高估时,具有较高风险厌恶程度的投资者卖空全部的风险资产。当其中一个资产的价格被高估,另一个资产的价格被低估时,发现投资者在金融市场中采取一种“多头-空头”投资模式,这为实践中配对交易策略提供了理论支持。其次,针对股票收益在短时期内具有动量效应时变特征,研究了股票收益存在动量效应的最优投资和消费问题。基于动量效应价格模型,以整个生命期的消费效用最大化为决策目标。在单位跨期替代弹性系数下,推导出了价值函数、最优投资和最优消费的精确显式表达式;在跨期替代弹性系数不为1时,通过对数线性化方法,推导出了价值函数、最优投资和最优消费的近似解析表达式。在此基础上,利用中国股票市场数据对模型的参数进行了校准,分析了动量效应对于最优投资与最优消费行为模式的影响。研究结果表明,个人偏好参数中,相对风险厌恶水平对于最优投资策略的影响远比跨期替代弹性系数重要;在动量状态变量的初始值取温和的负值时,最优投资需求都大于零,跨期对冲需求小于零,并且当风险厌恶系数大于1时,跨期对冲需求在总的投资需求占有非常重要的权重;当动量状态变量初始值为正或者温和的负值时,跨期对冲需求为负,其极大的降低了股票上的投资;而当动量状态变量初始值为深度的负值时,跨期对冲需求为正,将极大的增加在股票上的投资。个人偏好参数中,跨期替代弹性对于最优消费财富比的影响远比风险厌恶系数重要。进一步,给定风险厌恶系数,最优消费与财富之比是跨期替代弹性系数的单调减函数;给定跨期替代弹性系数,最优消费与财富之比是风险厌恶系数的减函数。再次,考虑了两个投资者面对同一投资机会集时最优交互投资组合决策问题。利用常弹性方差随机波动率模型来描述“波动率微笑”现象。以投资者终止时刻个人的财富以及与竞争对手财富的相对距离的加权平均的效用最大化为投资目标,通过随机控制理论,推导出价值函数所满足的一般hamilton-jacobi-bellman(hjb)方程。在指数效用和幂效用函数下,推导出了均衡策略的显式表达式。在此基础上,针对不同的模型参数,对指数效用函数下的均衡策略进行了分析。结果发现,均衡策略为投资期限、股票收益的波动率相关参数、弹性系数、投资者自身的风险厌恶系数以及无风险利率的单调递减函数;均衡策略为股票初始价格的增函数,并且随股票的期望收益率先增后减。最后,为了研究通货膨胀和宏观经济状态的随机转换对于投资决策的影响,建立了马尔可夫机制转换资产价格模型,利用随机微分博弈理论,考虑了两个投资者面对相关但却不同的投资机会集时最优交互投资组合决策问题。以两个投资者终止时刻财富和的效用最大化为投资目标,推导出了价值函数所满足的一般hamilton-jacobi-bellman(hjb)方程。进一步,在幂效用带通胀的模型下,推导出价值函数的feynman-kac表示和均衡策略的显式表达式。在指数效用无通胀的模型下,也推导出价值函数feynman-kac表示和均衡策略的显式表达式。在此基础上,特别的讨论了两机制状态转换模型,针对不同的模型参数,分析了机制转换对于影响。结果显示,宏观经济状态转换对于最优投资组合策略存在着显着的影响。

高强[2]2017年在《非线性期望理论及金融市场不确定性》文中指出本文主要研究了非线性期望理论及金融市场中的不确定性问题。文章共有四章,前两章主要是理论性研究,第一章深入研究了非线性期望乘积空间理论,研究了非线性期望下乘积空间的正则性问题以及非线性期望下独立增量过程的乘积空间问题,是对非线性期望理论的完善和补充。第二章研究了倒向随机微分方程最优控制问题及资产定价问题。后两章主要是应用性研究,深入研究了金融市场中的不确定性及非线性期望在金融市场中的应用。第叁章介绍了非线性期望资产定价理论,并利用非线性期望理论改进了目前国际上最通用的SPAN保证金系统,改进SPAN计算原理,得到了均值-方差不确定性下的SPAN保证金系统,可以更为快捷、准确、稳健的度量风险。并用S&P500指数期权数据进行了实证检验。第四章深入探讨了金融市场中的不确定性,说明了金融数据的分布不确定性和描述参数不确定性在金融市场中客观存在。深入研究了均值不确定性和方差不确定性在金融市场中的具体表现、估计方法,并利用均值不确定性构建了投资策略。各章节主要内容如下:(一)非线性期望下的乘积空间本章研究非线性期望下的乘积空间理论,主要针对非线性(resp.次线性)期望下乘积空间的正则性及独立增量过程的乘积空间问题进行深入探讨,完善了非线性期望乘积空间理论并弥补了之前理论中的不足。本章的结果主要出自:Gao Q,Hu M,Ji X,Liu G.Product space for two processes with indepen-dent increments under nonlinear expectations.Electronic Communications in Probability 22(2017).本章主要有以下两部分内容:1.非线性(resp.次线性)期望下乘积空间的正则性:正则性是概率论中很重要的概念,一般情况下,次线性期望空间并不满足正则性,而G期望空间满足正则性([2]),彭实戈院士在[10]中给出了乘积空间的定义,但是在定义中并未提及正则性,因此一个自然而然的问题就是,对于给定的正则次线性期望空间,其乘积空间是否依然满足正则性。为解决这个问题,首先研究两个正则次线性期望乘积空间的正则性,通过将经典的有限乘积概率空间构造推广到次线性期望情形,可以得知两个正则次线性期望空间的乘积空间仍保持正则性,并进一步推广到有限维的情形,得到如下结论:给定有限个正则次线性期望空间(Ωi,Hi,(?)_i),i = 1,2,...n,则其乘积空间()也是正则次线性期望空间。再通过反证法,可将结论推广到可列次线性期望空间。进一步研究次线性期望下完备乘积空间是否保持正则性,这种情况下问题较为复杂,本文在完备可分的距离空间下,证明了概率表示族是弱紧的及随机变量的逼近性质,最终得到了次线性期望下的完备乘积空间仍保持正则性,整体思路如下:给定正则次线性期望空间(Ωi,Hi,(?)_i),i=1,2,...,n其乘积空间记为(),记()为()的完备化空间。则可以证明()也是正则次线性期望空间,)且存在()上的一族弱紧概率族Pi使得由此可给出有限个正则次线性期望空间的完备乘积空间问题的证明。基于有限个情形的结论和随机变量的逼近性质,进一步可得如下结论:给定一列正则次线性期望空间(Ωi,Hi,(?)_i),i≥1,其中(Ωi,ρi为完备可分距离空间,Hi=Cb.Lip(Ωi)。记Ω=,则(Ω,L'(Ω),E为正则次线性期望空间,且满足Cb(Ω)(?)L'(Ω),其中(Ω,L'/(Ω),1)为(Ω,H,E)的完备化空间。2.非线性(resp.次线性)期望下独立增量过程的乘积空间接下来研究非线性(resp.次线性)期望空间中独立增量过程的乘积空间问题,即对于给定的两个d-维独立增量过程,是否存在一个非线性期望空间,及一个定义在空间上的2d-维的独立增量过程,使得其前d-维与后d-维过程分别同分布于先前给定的两个独立增量过程。这是彭院士[10]中的乘积空间方法无法解决的。本文通过离散化的方法,利用胎紧的性质,提出一种全新的构建思路,研究有限维、可列维和不可列维独立增量过程的乘积空间问题。有限维独立增量过程的乘积空间的主要定理如下:定理0.1.令(Mt)t≥0和(Nt)t≥0是两个分别定义在非线性(resp.次线性)空间(Ω1,H1,E1)和(Ω2,H2,E2)上的d-维独立增量过程,满足假设(A)。则存在定义在非线性(resp.次线性)空间(Ω,H,E)上的2d-维独立增量过程(Mt,Nt)t≥0满足:(?)进一步,如果(Mt)t≥0和(Nt)t≥0是两个平稳独立增量过程,则(Mt,Nt)t≥0也是一个平稳独立增量过程。非线性情形与次线性情形相似,因此本文只讨论次线性情形,非线性情形同理可证。进一步可知,只需要证明t∈[0,1]的情形即可。在稠密的有限点集Dn={i2-n:0≤i ≤2n上构造符合要求的次线性期望空间(Ω,Hn,En):如下定义Hn:记δn = 2-n,(?)如下定义En:Hn→R:Step 1.对于给定的φ∈Cb.Lip(R2d),满足对i≤2n,φ(Xiδn-X(i-1)δn)=φ(Miδn-M(i-1)δn,Niδn-N(i-1)δn)∈Hn定义En[φ(Xiδn-X(i-1)δn)]=E1[ψ(Miδn-M(i-1)δn)],其中ψ(x)=E2[φ(x,Niδn-N(i-1)δn)],(?)x∈Rd Step 2.对给定的φ(Xδn,X2δn-Xδn,...,X2nδn-X(2n-1)δn)∈Hn,φ∈Cb.Lip(R2n×2d),定义En[φ(Xδn,X2δn-Xδn,...,X2nδn-X(2n-1)δn)]=φ0,其中φ0=En[φ1(Xδn)].引理0.1.按上述方法定义(Ω,Hn,En),那么(1)(Ω Hn,En)构成一次线性期望空间;(2)对每个1≤i≤2n,Xiδn-X(i-1)δn独立于(Xδn,...,X(i-1)δn-X(i-2)δn);(3)(?)(?)由此可知在稠密的有限点集Dn= {i2-n:0 ≤ i≤2n}上,(Ω,Hn,En)即为满足定理0.1的次线性期望空间,故在有限点上结论成立。下面将其延拓到连续点上。易知对每个n ≥ 1,有Hn(?)Hn+1.令(?),易见(?)为H的—个子空间,使得对每一个φ∈Cb.Lip(Rm)满足:若Y1,...,ym ∈(?),则有φ(Y1,...,Ym)∈(?)。下面,我们希望定义一个次线性期望E:(?)→R。然而,在Hn上En+1[·]≠En[·],这是因为在次线性期望下独立性的顺序是不可交换的。不过,通过下面的胎紧性引理,仍可以构造E:引理0.2.对每一个固定的n ≥ 1,令Fkn,κ ≥ n,为(?)在Eκ下的分布.从而{Fkn:k≥ n}是胎紧的.用这一引理来构造次线性期望E:(?)→ R.可得如下引理:引理0.3.设P = {i2-n:n≥1,0 ≤ i ≤ 2n}.那么存在一个次线性期望E:(?)->R满足如下条件:(1)对每一列(?);(2)对每一列(?)且(?).通过以上引理,最终完成了定理0.1的证明。进一步研究无穷个独立增量过程的乘积空间问题。首先,利用相容性构造非线性(resp.次线性)期望,结合对角线法则,将结论推广到可列个独立增量过程的乘积空间中,主要定理如下:定理0.2.令(Mti)t≥0,i≥ 1是定义在非线性(resp.次线性)期望空间(Ωi,Hi,(?)_i),i≥>1上满足假设的至多可列维独立增量过程,则存在非线性(resp.次线性)期望空间(Ω,H,E)及定义在其上的可列维独立增量过程(Mt1,Mt2,...,Mti,…)t≥0满足:(?)进一步,如果(Mti)t≥0,i ≥ 1是至多可列维平稳独立增量过程,则同理可得(Mt1,Mt2…,Mii,…)t≥0也是可列维平稳独立增量过程。进一步推广到不可列个独立增量过程的乘积空间问题,注意到对角线法则方法在不可列个独立增量过程的乘积空间问题上并不适用,因此无法利用之前的方法得到想用的结论。因此我们定义上独立增量过程,并进一步给出不可列维上独立增量过程的定义:给定非线性(resp.次线性)期望空间(Ω,H,E),X,y分别是其上的m-维和n-维随机向量,称Y上独立于X,若对任给的(?)φ∈Cb.Lip(Rm×n),都有给定非线性(resp.次线性)期望空间(Ω,H,E),(Xt)t≥0为此空间上的d-维随机过程,若对(?),都有Xt+s-Xt上独立于(Xt1,...,Xtm),则称(X不)t≥0为上独立增量过程。进一步的,若对(?)t≥ 0还有(?),则称(Xt)t≥0为平稳上独立增量过程。设(Mtλ)t≥0,λ ∈I是非线性(resp.次线性)期望空间(Ω,H,E)上的一族随机过程,其中,I为不可列集。如果对(?)都有(Mtλ1,Mtλ2,…,Mtλn)t≥0..,是n-维上独立增量过程,则称(Mtλ)t≥,λ ∈ 为不可列上独立增量过程。进一步的,若对(?),n,都有(Mtλ1,Mtλ2,...,Mtλn...,)t≥0是n-维平稳上独立增量过程,则称(Mtλ)t≥0 ∈ J为不可列平稳上独立增量过程。给出不可列个独立增量过程的乘积空间的主要定理:定理0.3.令(Mtλ)t≥0,λ∈I(其中I为不可列集)是一族定义在非线性(resp.次线性)空间(Ωλ,Hλ,Eλ)上的不可列个1-维独立增量过程,满足:(C1)存在次线性期望Eλ:Hλ →R分别控制Eλ,λ ∈I;(C2)对每个t ≥ 0,Mtλ的分布在Eλ下是胎紧的;对每个 t≥ 0,λ ∈I,有(?)则存在一个非线性(resp.次线性)期望空间(Ω,H,E),及定义在其上的不可列维上独立增量过程(Mtλ,λ∈I)t≥0满足:进一步,如果(Atλ)t≥0,λ ∈I是1-维平稳独立增量过程,则(Mtλ)t≥0,λ ∈I是不可列维平稳上独立增量过程。(二)BSDE随机控制及不完备市场资产定价本章主要研究带有广义效用泛函的FBSDE随机控制最大值原理问题及不完备市场定价问题。本章的结果主要出自:1)Gao Q,Yang S.Maximum principle for forward-backward SDEs with a general cost functional.International journal of control(2016):1-7.2)Gao Q,Yang S.Pricing of contingent claims in an incomplete market with finite state stochastic processes in discrete time,Completed Manuscript,1-10.本章主要有以下两部分内容:1.带有广义效用泛函的FBSDE随机控制最大值原理彭实戈院士([53],[29])第一次介绍了由倒向随机微分方程或正倒向随机微分方程驱动的最优控制问题,并得到了很多研究者的进一步推广,如Xu[57],Lim and Zhou[24],Shi and Wu[54]等。在[29]中,彭院士首次研究了如下正倒向随机微分方程系统的随机最优控制问题:其效用泛函为:事实上,上述效用泛函中的h(·)和γ(.)可能不仅仅依赖于终端条件(t=T)和起始条件(t = 0),通常情况下,还会依赖于全局时间条件(t ∈[0,T]).也就是说,效用泛函中h(·)和γ(.)不仅由起始和终端这两个特殊时间点决定,还依赖于更一般的全局时间条件。在本文中,我们会研究带有如下依赖于全局时间条件的广义效用泛函的正倒向随机系统的随机最大值原理,其中,注意到效用泛函(0.2)是上述广义效用泛函(0.3)的一个特殊形式,也就是说,广义效用泛函(0.3)考虑到了更一般的情况,是对经典随机控制问题的十分有意义的推广,而在本文之前,带有(0.3)形式广义效用泛函的控制系统的最大值原理问题还未被认真研究。利用Frechet导数的框架,可以构建一系列需要逐步求解的伴随方程,从而推导出相应的最大值原理。最大的难点在于如何得到对应的伴随方程。本文利用Riesz表示定理与Frechet导数的框架相结合,使Frechet导数Dxh(x[0,引)和Dxγ(y[0,T])可以被相对应的有限测度μ和β描述。将测度μ和β分解为连续部分和跳跃部分,可以构建一系列的伴随方程,并通过逐步解这些伴随方程得到相对应的最大值原理。并且为了更直观的展示本文研究的带有广义效用泛函的随机控制系统与经典情况的不同,本章最后通过简单的例子进行直观的展示。本章简要过程如下:令U为R上的非空凸子集.记u = {u(·)∈M2(R)|u(t)∈U,a.e.,a.s.}。令u(·)是一个最优控制,(x(·),y(·),z(·))为对应的轨道,记= u(·)+ρu(·),0 ≤ ρ ≤ 1,u(·)+ w(·)∈ u,.因为u是凸的,因此up∈u。引入变分方程,易知变分方程存在唯一解(∈(·),η(·),ζ<(·)),记(xρ(·),yρ(·),zρ(·))为所对应的轨道,并进一步可证明其收敛性质。进而在C([0,r])中给出Frehet导数的概念,并在Frechet导数的框架下,对于h(x[0,T]和γ(y[0,T),利用Riesz表示定理,在[0,T]上分别对应存在唯一有限 Borel 测度μ和 使得(?)η[0,T]∈C([0,T])因为μ和β是[0,T]上的有限测度,至多存在可数的正测度。将其记作为了得到最大值原理,引入下列形式的伴随方程,需要注意的是,在这种情况下,需要引入一系列伴随方程:其中μ'(t)是μ(t)的导数,li+是li的右极限,定义p(l1+)= 0,其中β'(t)是β(t)的导数,si是si的左极限,定义q(s1)= 0.可证存在一组(p(·),k(·),q(·))是伴随方程的解。又因为u(·)是一个最优控制,因此,可得如下变分不等式成立:如下定义汉密尔顿方程H:R×R×R×R×[0,r]->R:H(x,y,z,u,p,k,q,t)= pb(x,u,t)+ kσ(x,u,t)+ qg(x,y,z,u,t)+ f(x,y,z,u,t)相应的可以利用汉密尔顿方程改写伴随方程:因此可以得到主要定理,定理0.4.假设条件(i)-(iii)成立,今u(·)是一个最优控制并令(x(·),y(·),z(·))是相对应的轨道,则有2.不完备市场资产组合定价当市场完备时,每一个衍生品收益都可以被市场中的一个投资组合复制,其价格可以由完备市场无套利理论得出。而在不完备的市场中的定价问题较为复杂,本文运用随机控制的方式来研究最高价与最低价,利用有限时间有限状态过程下的广义Girsanov变换对未定权益或期权定价。本文的研究是对[35]中研究的进一步扩展。任一概率测度被称为一个P-鞅测度,如果在FT上等价于P并且其折现价格过程为鞅。我们将所有的P-鞅测度记作P。需要注意的是,在完备市场中,P = {Q},其折现过程唯一,存在唯一的自融资策略,定价可以通过无套利原则得出,衍生产品价格可以被基础产品的投资组合复制。而在不完备市场中,存在多个P-鞅测度,因此并不存在唯一的自融资策略,定价也难以通过无套利推导得出,市场存在多种报价(卖方报价,买方报价),需要关注的是市场的最大价格和最小价格。在完备市场中,对于给定的未定权益U,存在y≥0和投资组合策略ω满足如下方程其中y是t = 0的无套利价格。记M(t)=θ(t)+ M(t),则在不完备市场中U存在多种价格,t = 0,U的最小价格(下价格)为infP∈PEP(Ud),U的最大价格(上价格)为 suP∈PEP(Ud).利用最优控制方法我们可以对最小最大价格进行动态研究。U在时刻t的最大可能价格为J(t)=esssupλ∈(?)EPλ[Ud|Ft],其中Pλ表示所有满足如下形式的关于P的Girsanov变换的概率测度:其中,其具有以下性质:定义过程f(t):f(t)=A(t)-j(t),则f(t)是一个增过程,可得特别的,t=T时,有U在时刻的最小可能价格为K(t)= essin fv(?)Epv)[Ud|Ft],类似最大价格的推导可知,存在一个投资组合过程φ(t)和一个右连续减过程g(t,g(0)=0满足(叁)非线性期望下的SPAN保证金本章研究非线性期望理论在保证金计算中的应用。本部分结果出自:高强,杨淑振等.基于市场复杂性的新型保证金计算工具,第四届全国金融期货与期权研究大赛获奖论文(全国一等奖),1-46,2014.首先介绍了保证金制度和国际主流的保证金计算系统,并对国际上最成熟通用的保证金管理系统SPAN进行了深入分析,介绍了 SPAN保证金的计算原理:其最核心的价格侦测风险模块基于情景模拟法,预估未来标的价格和波动率的变化,将未来市场划分为16种可能情形,分别计算16种情形中的可能损失,取其中的最大值作为最大预期损失,以此制定相应的保证金标准。此外,SPAN保证金还包括跨月价差风险、交割月风险值、商品间价差折抵、空头期权最低风险值等。分析SPAN保证金的优缺点,指出其只计算了 16种情形,无法涵盖未来市场的多种可能性,并且理论基础是Black-Scholes公式,其假设波动率是一个常数,因此不能估计波动率不确定下的风险。进一步分析了国际上其他SPAN改进系统的改进原理并利用S&P500股指期权数据对标准SPAN系统(SPAN16)和改进SPAN系统(SPAN-44和SPAN-93)进行了实证分析比较,发现改进的SPAN保证金系统划分了更多种可能情形,在一定程度上更为准确的度量了风险,但是同时也加大了计算量,并且无法解决真实市场中波动率不确定性带来的风险。接下来介绍非线性期望理论中的叁个重要分布:最大分布,G-正态分布和G-分布,以及对应的叁个重要的随机过程:G-布朗运动,有界变差G-布朗运动和广义G-布朗运动,其增量过程分别服从之前的叁种分布,例如G-布朗运动的增量过程服从G-正态分布。其与金融市场不确定性有着直接的对应关系,G-正态分布、G-布朗运动与方差不确定性(波动率不确定性)直接相关,G-正态分布随机变量可表示为(?),Λ描述了X的方差不确定性,在一维情形下,(?),其中,(?),则方差(波动率)不确定性区间为[σ2,σ2]。最大分布、有界变差G-布朗运动与均值(收益率)不确定性直接相关,最大分布随机变量可记为(?)Θ描述了Y的均值不确定性程度,在一维情形下,(?),其中,μ=E[X],μ=-E[-X],均值不确定性区间为[μ,μ]。上面的两个分布可以非平凡地组合为一个新的分布,即G-分布,其对应广义G-布朗运动,与均值-方差不确定性(收益率-波动率不确定性)直接相关。由此,可以给出如下形式的几何G-布朗运动:dXs =uXsdηs + σXsdBs,Xt = x,其中ηt,≥ 0服从最大分布,Bt,t ≥ 0服从G-正态分布,且其终端支付函数为Φ(Xr)。定义风险为u(t,Xt):=E[-Φ(XT),其中u(t,Xt)为下面偏微分方程的解探讨其计算原理,考虑有界边值问题,通过标准的离散格式离散化上述方程给出上述方程的数值解法,并可以证明牛顿迭代的收敛性及全隐格式的收敛性。利用非线性期望理论改进SPAN保证金系统,给出波动率不确定性下的SPAN保证金计算方法:假设标的物(股票或者期货)Xt满足G-期望下的几何布朗运动:其中Bt,t≥ 0服从G-正态分布,且E[σ2<B>1]=σ2,E[-σ2<B>1]=-σ2.其终端支付函数为Φ(Xr)。定义风险u(t,Xt):=E[-Φ(XT)],其中u(t,Xt)为下面偏微分方程的解其中σ2=((σ+Δσ)2,σ2=(σ2=Δσ)2。则针对SPAN对于标的价格的可能变化情形:给出9种可能的变化,其中,波动率的可能变动范围在区间[σt-Δσ,σt+Δσ]内连续取值。取9种情况的最大值作为最大预期风险,将加入波动率不确定性的SPAN保证金称为G-SPAN-9。G-SPAN-9下收取保证金为:其中Pt是t时期的期权价格。同理,可以给出均值不确定性下的SPAN保证金计算方法和均值-波动率不确定性下的SPAN保证金。由于篇幅原因,这里只给出均值-波动率不确定性下的SPAN保证金计算方法:假设股票价格满足下面的随机微分方程dXs = uXsdηs + σXsdBs,X= x,其中ηt满足最大分布,Bt满足G-正态分布,且(?)(?)其终端支付函数为Φ(Xr)。定义风险:u(t,Xt):=E[-Φ(XT)],其中u(t,Xt)为下面偏微分方程的解(?)(?)其中(?)(?)因此,同时引入均值不确定性和波动率不确定性,只需计算一种情形,即可得到全面涵盖标的价格和波动率连续变化的风险值:价格变动 波动率变动 计算比例(?)其中 Δx = PSR,Δσ = VSR。此时G-期望下收取保证金为:ρt,T(Φ(XT))=Pt+E[-Φ(XT)]其中Pt是t时期的期权价格。只需进行一次运算,即可得到涵盖更全面风险的运算结果。利用S&P500期权数据进行实证分析,可知,利用非线性期望理论改进的G-SPAN保证金不仅运算次数更少,还更全面的考虑了价格和波动率不确定导致的风险,是一种准确快捷稳健的保证金计算方式。(四)金融市场的不确定性金融市场中的不确定性主要体现有:金融数据分布的不确定性;金融数据特征描述参数的不确定性;金融数据的模型不确定性。首先验证金融数据分布的不确定性,正态分布是金融市场中最重要的分布之一,很多金融研究都以正态分布假设为基石。金融数据分析中,常假设某个时间段内的金融数据服从同一分布,比如最常见的,假设资产收益率服从正态分布,现在我们选取最能代表金融市场数据特征的沪深300股指和相对应的沪深300股指期货数据进行实证检验。经过实际分析,按一天作为窗口长度进行正态检验,服从正态性假设的天数较少,股指只有不到20%,股指期货只有不到10%。若按一周为窗口长度进行验证,则服从正态分布的周数少于1%,由此可知,正态分布假设在金融市场中存在较大问题。实际上,不仅是正态分布假设难以成立,在实际的金融市场中,很难找出一种或者几种不同的分布,来准确描述经济、金融数据的分布。不同金融数据展现出不同的数据特征,即便是同一金融数据的背后,也可能来源于不同的经济、金融、社会原理的共同作用。因此,分布不确定性在金融中客观存在。除了分布的不确定性,描述数据特征的重要参数,比如均值(一阶矩)和方差(波动率、二阶矩),也存在不确定性,收益率和波动率亦存在相应的不确定性。分析沪深300股指和沪深300股指期货日收益率的均值和方差,可知其均值方差均存在不确定性,股指期货的变动幅度相较股指的变化更为剧烈,具有更大的不确定性。均值、方差的不确定性亦客观存在,一段时间内,均值和方差在一个范围内变化,当数据量足够大时,可以认为均值、方差在一个区间内连续变动。由此可知,金融数据存在分布不确定性和特征参数的不确定性,同一时间段内,同一经济现象所产生的数据,并不来自于同一分布,而是来自于不同分布,或者说,来自于一个不确定的分布族;其特征参数,比如均值和方差,也并不是确定的数值,而是在一个区间内连续变动。对均值不确定性进行深入研究,计算均值不确定性的变动区间。针对金融市场中重要的均值回归现象,研究均值不确定性下的均值回归模型。即均值并不是确定的定值,而是在一个区间内变动。因此,真正的均值回归,并不是围绕一条均线进行回归,而是围绕均值,在一个均值不确定性区间进行回归。这个均值不确定性区间,可以看作是合理价格区间,价格在这个区间内波动时,被认为是合理的,当价格偏离上界或下界时,价格会有向合理价格区间回归的趋势。设资产价格为X,其均值为μ,均值不确定性区间为[μ,μ],在经典均值回归模型中,当X<μ或X>μ时,价格会向μ回归。然而此时只有μ一个参数,无法确定具体的回归折点。而在均值不确定性框架下,价格围绕均值μ变动,在区间[μ,μ]中震荡都被认为未偏离均值,是合理的。当X<μ或X>μ时,认为价[μ,μ]偏离了均值,会向均值回归。由此构建投资策略,选用沪深300股指期货的次月和当月合约进行跨期套利。投资策略为:价差超过μ,卖近买远,空头开仓,价差回归到μ时平仓。当价格低于μ时,买近卖远,多头开仓,价差回归均值μ时平仓。此外,每笔损失超过止损线时提前平仓,每日结束时强行平仓。用2015年1月1日-2016年12月31日数据进行实证分析,用五个指标对策略进行评价:累计收益率、年化收益率、波动率、最大回撤及夏普率。深入研究金融市场实际情况,充分考虑金融市场流动性以及政策性限仓问题、交易手续费问题、交易延迟问题、止损问题和保证金问题。在比较接近实际金融市场的参数设置下(手续费为万分之1,每笔交易限制10手,每笔止损线10%),策略的累计收益为4倍左右,最大回撤仅为4%左右,夏普率接近6,表现亦十分优异。进一步分析我国沪深300股指期货金融市场的主要发展阶段,针对不同阶段的市场情况分析策略的可行性、适用性和稳定性,可知,该策略在大多数市场阶段均有良好表现。实证回测结果明显优于常见的其他均值回归策略。综上所述,均值不确定性下的均值回归策略在理论上更为合理,在实际模拟中收益较高,回撤较低,夏普率较高,策略表现优异,且在不同市场阶段均有不错的适应性。并且为投资者提供了更多种投资策略供其选择,是一种较为合理、稳定、灵活的优秀交易策略。

张磊[3]2016年在《几类偏微分方程最优控制相关问题研究》文中研究表明本文主要研究几类偏微分方程最优控制相关问题,其内容包括状态方程的适定性、最优控制的存在性以及最优控制满足的极大值原理。全文共分六章:第一章主要阐述偏微分方程最优控制问题的来源和研究对象,并简要介绍国内外的研究现状以及本文的主要结果。第二章研究了一类非线性色散浅水波方程的分布最优控制问题。首先利用Garlekin逼近方法和能量估计,在合适的状态空间中证明了控制系统解的存在唯一性。其次引入所要讨论的最优控制问题,并且证明每一个给定的初始状态都对应着控制系统唯一的最优控制。最后借助由A.Ya. Dubovitskii和A.A. Milyutin提出的泛函分析方法成功地推导出最优控制成立的一阶必要性条件,并指出最优控制具有Bang-Bang性质。本章得到的结果推广和改进了部分已知结果。第叁章考虑了具有一个捕食者和两个被捕食者的生态模型的最优控制理论,其目的在于通过人工干预使得此生态系统中叁个物种的种群密度最大化。给定初始种群密度(均为正),借助强连续算子半群理论和抛物方程的相关理论,首先证明了控制系统存在唯一的正强解,并且指出对于给定的初始种群密度,人工干预具有最优的策略(即控制系统存在唯一的最优控制)。然后借助于对偶原理推导出最优控制的一阶必要性条件和二阶充要性条件。本章对相应的最优控制问题给出了全面的回答,其结果是新的。第四章处理了一类带有记忆项的非线性耦合波动方程的最优控制问题。首先利用经典的变分原理和紧性原理给出了最优控制变量的存在性证明。其次通过对近似最优控制变量(惩罚掉了状态限制)的极值条件在合理的意义下取极限,推导出了最优控制变量所满足的庞氏极大值原理。作为主要结果的直接应用,同时得到了由非线性Klein-Gordon方程组描述的最优控制问题的必要性条件,其结果推广和改进了文献[83]中关于Klein-Gordon方程最优控制问题的主要结果。第五章讨论了带有逐点状态限制的Boussinesq方程组的最优控制问题。首先证明了状态函数关于控制函数的连续依耐性,然后利用Ekeland变分原理和改进的针状变分技术,推导出了最优控制满足的逐点形式的庞氏极大值原理。另外,在某些强稳定性条件假设下,进一步得到了一种形式更强的庞氏极大值原理,其特点在于拉格朗日乘子可以取固定的常数。本章结果推广和改进了文献[86]中带有积分型状态限制最优控制问题的结论。第六章研究了一类广义Camassa-Holm方程的局部适定性、强解的爆破性以及解析解的存在性。首先利用Littlewood-Paley分解原理和传输方程理论证明方程在Besov空间中的局部适定性。其次证明方程在临界Besov空间中的局部适定性。借助粒子轨道方法讨论了解的爆破性,并在特殊情况下得到强解的整体存在性。最后讨论了方程解的Gevrey正则性和解析性,同时给出解存在时间的上界估计。本章结果推广和改进了部分已知的结论,其中关于解的爆破性和解析性的讨论是新的。

周刘为[4]2016年在《Lévy过程驱动的几类随机系统稳定性分析与最优控制》文中提出目前的随机微分系统的噪声一般是Gauss过程。该噪声的主要特点是其连续性。然而,随机系统除了Gauss白噪声这种连续噪声外,还可能受到Possion噪声这种不连续噪声的干扰。比如,全球金融风暴引发的股市大幅震荡,其干扰就是不连续的。随机系统的这两种噪声组合起来可用Lévy噪声来刻划。其动力学模型是具有漂移项、扩散项和Possion跳跃项的随机微分方程。另外,在实际工程中,也大量存在着由突变现象引起参数发生跳变的系统,例如机械谐振系统等。这种参数的跳变可用Markov过程来刻画。因此,Lévy噪声驱动且具Markov跳变参数的随机微分系统在实际系统中广泛存在。而针对此类系统的稳定性与最优控制研究目前尚不多见。本文针对Lévy噪声驱动的、系统参数是Markov跳变的混杂随机微分系统,比如随机神经网络系统、随机金融系统等,综合运用Lyapunov稳定性理论、随机微分方程中的It?o公式、随机不等式、M-矩阵(或线性矩阵不等式)方法、Bellman最优性原理等,分别得到随机微分系统的自适应几乎必然渐近稳定、自适应均方稳定和自适应指数稳定等稳定性准则,设计出相应的自适应同步控制器;分析与设计市场投资组合策略,并应用于欧氏期权定价问题;得出此类随机微分系统可实现最优控制的必要且充分条件,得到了此类系统非零和微分博弈的Nash均衡点的存在条件和表达形式等。本文的上述研究工作,将丰富随机微分系统稳定性与最优控制理论,可解决Lévy噪声驱动的随机系统的稳定输出、一致响应和控制效能等关键应用问题。以下具体说明本文的主要研究工作和创新点。(1)研究带有随机扰动和Markov切换参数的中立性神经网络的自适应渐近稳定性。在介绍和分析已有相关研究现状的基础上,建立具有Gauss噪声(Lévy噪声之特例)和Markov切换参数的中立型随机神经网络模型,接着分二阶和叁阶两种情形,在必要的常规假设下,利用M-矩阵和Lyapunov泛函方法得出系统自适应几乎必然渐近稳定的准则,得到自适应控制律的动态表达式,最后利用数值仿真验证系统的稳定性和控制器设计的有效性。其创新点主要是控制律的设计中巧妙地加入了一个调节项使得控制效果良好,另外用M-矩阵方法得出的稳定性准则比较简洁且便于检验。(2)考虑基于数据采样和饱和执行器的带有Lévy噪声和Markov切换参数的神经网络的均方同步问题。首先,在分析相关研究现状的基础上提出已有研究之不足,从而引出本章的研究内容及贡献。接着,建立具有Lévy噪声和Markov切换参数的主系统和从系统的动力学模型,给出必要的系统假设及要用到的基本引理。在建模时特别引入了数据采样和饱和执行器机理。接下来,利用弱无穷小算子、Dynkin公式及线性矩阵不等式方法得出系统均方同步的准则,并且得到控制器增益的显式表达式。再者,分别针对Markov参数切换缺失、Possion噪声缺失等两种特殊情形得出相应的结果。最后利用Matlab数值仿真验证本章所得结果及所用方法的有效性。其主要创新点是基于数据采样和执行饱和控制器的系统建模,并且充分考虑数据采样机理和饱和执行器机理,得到主从系统均方同步条件。(3)考虑Lévy噪声驱动下带有Markov参数切换的一主多从神经网络自适应指数同步问题。在一主多从模型中,从系统的参数待估计,且每一个从系统的状态矩阵不仅与主系统有关,还与其它从系统有关。利用系统误差设计状态反馈控制器。为提高同步的速度,设计了指数同步控制律。利用广义It?o公式、Lyapunov稳定性定理和M-矩阵方法,设计了若干自适应指数同步准则,使主系统和多从系统均方同步。同时也给出了控制器的更新律以及从系统参数的动态变化律的明晰表达式。最后用一个应用例子验证所给控制方法的有效性。其创新点主要表现在:1)提出了一主多从神经网络新模型,它以一主一从系统模型为特例;2)考虑新模型中主系统和多从系统的系统矩阵参数相互耦合,将系统的各种误差作为状态反馈量,对随机神经网络新模型设计了一种新的自适应同步控制方法。(4)考虑几何Lévy过程驱动并带有Markov转换机制的金融市场下的投资组合问题。首先提出了Lévy过程驱动并带有Markov转换机制的金融市场下的投资组合新模型,它推广了已有的Black-Scholes模型。该新模型中,债券利率、股票的回报率与波动性均随当时的金融市场状态而切换,而股票价格则由几何Lévy过程驱动。基于此新模型,利用It?o公式得到了用抛物型偏微分方程决定的投资组合策略,此偏微分方程式是现有结果的拓展,通过变量变换等方法得出了此偏微分方程的可解性。最后还给出了相关结果在解决欧式期权问题上的应用。其创新点主要表现为建立了Lévy过程驱动并带有Markov转换机制的金融市场下的投资组合新模型,以及利用It?o公式得出了投资组合策略。(5)研究带有Lévy噪声和Markov切换参数的随机微分系统的最优控制与非零和博弈问题。首先建立Lévy过程驱动的且具有Markov跳变参数的随机微分系统,给出Nash均衡点的概念。接着利用Bellman动态规划原理得出Hamiltonian-Jacobi-Bellman(HJB)方程及其逆问题的解。基于HJB方程,给出线性二次Gauss最优控制问题的解。对于线性二次Gauss微分博弈问题,利用已得出的最优控制问题的解得到非零和博弈问题的解。最后将所得结果用于股票市场博弈,得到Nash均衡点存在的条件。其创新性主要是利用Bellman动态规划原理得到了Lévy过程驱动的且具有Markov跳变参数的随机微分系统的最优控制律和非零和博弈问题的解。其结果推广了已有的关于随机微分系统的最优控制与非零和博弈问题的结论,它是微分博弈理论的重要组成部分。

吴江[5]2016年在《几类线性随机系统的预见控制》文中研究说明预见控制理论,是一种可以显着提高系统运行效率的控制理论和方法.自提出以来,预见控制在理论和应用方面的研究从未间断过.由于随机现象广泛地存在于现实世界中,因此随机系统的研究也一直是学术研究的热点.本文将预见控制理论与随机系统相结合,基于预见控制理论的思想,研究了几类线性随机系统的预见控制问题.首先,作为理论的基础,针对一类有限时间线性随机系统设计最优预见控制器.然后,将所得结论推广到无限时间情况,并讨论了闭环系统稳定性问题,设计了状态观测器.在此基础上,将设计预见控制器的方法应用到随机时滞系统,设计了最优控制器.再将随机系统预见控制理论推广到广义系统情况,解决了无脉冲连续时间广义线性随机系统的最优预见控制问题.最后,将结论推广到一类随机微分方程的情况.具体研究内容包括以下几个方面:1.提出了基于扩大误差系统方法的线性连续时间随机控制系统的最优预见控制问题并给出了控制器的设计方法.首先引入一个辅助系统对原系统进行状态平移.然后,为了克服无法像确定性系统一样对状态方程直接求导数来构造扩大误差系统的困难,引入积分器,并构造了包含积分器向量、控制向量、目标函数向量的随机扩大误差系统.通过随机扩大误差系统把所研究的随机预见控制跟踪问题转化为随机扩大误差系统的最优输出跟踪问题.通过使用随机系统动态规划方法求解随机扩大误差系统中的最优控制器,并得到原系统的最优预见控制器.最后,重新设计了性能指标函数,将所得结论推广到了无限时间情况,讨论了保证扩大误差系统稳定的充分必要条件,设计了状态观测器.2.针对线性连续时间时滞随机系统,引入了一个非奇异线性变换,从形式上将时滞随机控制系统转化为无时滞系统.再通过求解无时滞随机系统的最优控制器的方法,得到了原系统基于预见控制原理的最优控制器.针对无脉冲连续时间广义线性随机系统,引入了具有第二种形式的受限等价变换,将无脉冲连续时间广义线性随机系统转化为一个正常的线性随机系统和一个代数系统.再通过求解正常随机系统的最优预见控制器的方法,得到了原系统的最优预见控制器.3.针对一类基于随机微分方程的线性连续时间随机系统,通过设计补偿输入的办法,将系统转化为具有一般随机微分方程形式的随机系统.然后,引入一个辅助系统,对原系统进行状态平移.再引入积分器,并构造随机扩大误差系统.利用随机系统动态规划理论求解扩大误差系统中的最优调节器,并得到原系统的最优预见控制器.同时,讨论了保证随机扩大误差系统稳定的充分必要条件.文中所有结论都给出了严格的数学推导和证明,数值仿真结果表明,所涉及的预见控制器是十分有效的.

吕思宇[6]2017年在《带马尔科夫链的随机最优控制问题及其在金融中的应用》文中指出本篇论文主要研究了带马尔科夫链的随机最优控制问题,及其在金融中的应用。在理论方面,主要研究了与带马尔科夫链模型相关的最优控制理论,如随机最大值原理,动态规划原理以及它们之间的关系。然后,我们将得到的理论结果应用于金融数学问题,如股票交易问题,证券投资组合,效用最大化问题,最优投资-消费问题等。在实际中,很多现象或系统都具有状态转移或者趋势改变的性质。对于这种情形,数学上,我们一般使用马尔科夫链来刻画。例如,在股票市场中,市场可以分为牛市和熊市,市场在这两种趋势之间转换。在牛市中,股票的收益率是正的,波动率较小,而在熊市中,股票的收益率是负的,波动率也较大。此时,我们可以使用一个两状态的马尔科夫链来描述,一个状态代表牛市,一个状态代表熊市,使股票价格方程依赖于这个马尔科夫链。马尔科夫链状态的转移,代表着市场趋势的改变。从这个例子我们可以看出,马尔科夫链可以较好地模拟现实环境的随机变化,研究带马尔科夫链的随机最优控制问题是有实际意义的。相比于传统的扩散模型,带马尔科夫链模型主要具有以下两方面的优势。首先,在理论方面,模型所含有的马尔科夫链可以更加直接地描述影响系统的行为中那些不频繁变化但是对系统长期趋势有重要影响的因素和事件。例如上面的股票市场的例子,牛市与熊市的市场参数(收益率和波动率等)明显不同,传统的扩散模型就不能方便有效的反映这一现象,当引入马尔科夫链以后,就可以使得股票价格的走势和波动情况依赖于市场行情的变化。此外,在处理期权定价,证券投资组合等问题中,带马尔科夫链的模型也有广泛应用。然后,在数值计算方面,带马尔科夫链模型也具有优势。首先,当我们使用动态规划原理时,带马尔科夫链模型的随机最优控制问题具有简明的Hamilton-Jacobi-Bellman(HJB)方程,方便我们使用一些有效便捷的科学计算方法来处理。其次,在做计算处理时,带马尔科夫链模型只要求有限数据输入。仍以股票市场为例,我们只需要输入在不同状态下股票的收益率和波动率,以及马尔科夫链的转移速率矩阵。由此可见,带马尔科夫链的随机最优控制问题具有理论和计算两方面的优势。下面我们给出本文的主要内容和结构框架。在第一章中,我们研究了带马尔科夫链模型下的最优转换控制问题,及其在股票交易问题中的应用。我们首先得到了该问题的动态规划原理以及HJB方程,然后证明了问题的值函数是对应HJB方程的唯一粘性解。同时,最优转换策略也由HJB方程的障碍部分给出,决定了在何时和往何处转换是最优的。当马尔科夫链具有双时间尺度结构时,我们证明了相应的收敛性结果。最后,我们将在最优转换控制的框架下来研究股票交易问题,并利用数值计算给出了最优交易规则和最优收益。特别地,我们将利用双时间尺度马尔科夫链来模拟股票市场中的长期趋势和短期趋势,收敛性结果也被验证。在第二章中,我们研究了随机离开时间和不完备市场下的连续时间均值-方差证券投资组合选择问题。我们首先将均值-方差问题构造成为一个带终端期望限制的线性二次最优控制问题。然后,由随机线性二次控制理论,我们的均值-方差问题就会归结为两个倒向随机微分方程(BSDEs)的可解性问题。其中一个是随机Riccati方程,另一个是辅助BSDE。我们将使用BMO-鞅理论来给出一个对于上述两个BSDEs可解性的简洁有效的证明。随后,我们利用这两个倒向方程的解,给出了最优投资组合的线性反馈形式。在第叁章中,我们研究了带马尔科夫链和泊松跳的正倒向随机系统的最优控制问题。首先利用对偶方法,建立了最优控制的充分性随机最大值原理。接下来,我们研究了它与动态规划原理的关系,建立了伴随过程、一般哈密顿函数以及值函数之间的关系。最后,我们将得到的理论结果应用于一个带终端财富限制的现金流估值问题,并利用马尔科夫链的性质和一些分析技术得到了显式的最优策略。在第四章中,我们研究了带马尔科夫链的超前-延迟正倒向随机系统的最优控制问题的必要性最大值原理。我们先由凸变分方法给出了系统的变分方程,以及一些相关估计,这就使得我们可以推导出变分不等式。然后,我们给出了相应的伴随方程。根据变分不等式的形式,以及伴随方程,我们就得到了必要性最大值原理。同时,我们还证明了,在某些凸性假设下,必要性最大值原理也会变成充分性条件。最后,我们研究了一类递归效用投资-消费选择问题,并给出了显式的最优消费率。接下来,我们给出本篇论文的主要结论。1.带马尔科夫链模型下的最优转换问题及其在股票交易问题中的应用记(Ω,F,P)是一个概率空间,上面定义了一个标准的1-维的布朗运动B(t),t≥0和一个马尔科夫链α(t),t≥0。假设B(·)和α(·)是独立的。马尔科夫链取值于一个有限的状态空间M={1,...,M}。记Q=(λpq)p,q∈M是α(·)的生成元。记{Ft}t>0是由B(·)和α(·)生成的并完备化的信息族。考虑一个1-维的混合扩散(αp(·),Xp,x(·)),其初始状态是(p,x)∈M×R记N={1,...,N}是转换控制的状态集合。一个转换控制定义为一序列停时-状态对(τn,ξn)n≥1,其中τn是一列递增的停时,ξn是Fτn-可测的随机变量,取值于N,记转换控制过程为(?),其中1A是集合A的示性函数。总回报函数定义为其中ρ>0是折现因子。我们记Ai是全体初始状态为i的容许转换控制的全体。我们定义值函数为我们也记v(i,p,x)为vi,p(x)。下面的定理给出了带马尔科夫链模型下的最优转换问题的动态规划原理。定理0.1.假设(H1.1)-(H1.3),则对任意的(i,p,x)∈N×M×R和停时θ,我们有问题对应的HJB方程(或称变分不等式系统)如下下面的两个定理给出了关于方程(0.0.2)的粘性解的存在唯一性结果。定理0.2.在假设(H1.1)-(H1.3)下,由(0.0.1)定义的值函数υi,p(x)是HJB方程(0.0.2)的粘性解。定理0.3.在假设(H1.1)-(H1.3)下,记ui,p(x)(相应地,vi,p(x))是(0.0.2)的一个粘性下解(相应地,上解)且满足线性增长条件,则我们有ui,p(x)≤vi,p(x)。然后,我们假设马尔科夫链αε(·)具有双时间尺度结构,其生成元Qε=(λpqε)结构ML,其中Mk={sk1,…,skmk},k=1,…,L,M=m1+…+mL。此外,Q结构为使Qk对于Mk也是一个生成元,对任意的k=1,...,L。对应的极限变分不等式系统是定理 0.4.对任意k=1,...,L和l=1,...,mk,我们有v(i,skl)ε(x)→v(i,k)(x)。此外,v(i,k)(x)是极限变分不等式系统(0.0.3)的唯一粘性解。然后我们将理论结果应用于股票交易问题。股票价格为其中,αp(·)是一个马尔科夫链,取值于M={1,2,...,M},x和p是股票价格和马尔科夫链的初始状态。在这里,b(p),p∈M,是期望回报率,σ(p),p ∈M代表股票的波动率。记{τn}n≥1是一列递增的停时序列,代表转换控制:在τN时刻进行买卖股票。我们取n={0,1}。在这里,状态0代表不持有股票,状态1代表持有1份股票。如果i=0(初始时刻不持有股票),那么交易员在τ1时刻买入股票,然后在τ2时刻卖出,再在τ3时刻买入股票,然后在τ4时刻卖出,依此类推。另一方面,如果i1(初始时刻有1份股票),那么交易员在τ1时刻先将股票卖出,然后在τ乃时刻买入,再在T3时刻卖出,依此类推。记股票的交易策略(从状态i ∈N开始)为Ii(t)=i1[0,T,)τ1)+∑n≥1 ξn1[τn,τn+1)(t)≥0,并记Ai为交易策略的全体。目标是选择一列{τn}n≥1,最大化收益其中K是交易费。此外,定义r(i,p,x)=supIi(·)∈AiJ(i,p,x,Ii(·))。我们考虑一个新问题,具有与(0.0.4)相同的动态,不过要最大化一个新目标并定义v(i,p,x)= supIi(·)∈Ai J(i,p,x,Ii(·))。注意到新问题(0.0.6)与原始问题(0.0.5)具有相同的最优交易策略。此外,经过一个变换,我们就会看到目标泛函(0.0.6)可以写成从而,对应于现在的情形,变分不等式(0.0.2)具有下面的形式基于此,我们就可以计算值函数和最优股票交易规则。2.随机离开时间和不完备市场下的均值-方差证券投资组合问题假设T>0是一个有限时间区间的终点。(Ω,A,{Ft}t∈[0,,P)是一个完备的概率空间。记B(t)=(B(t)',W(t)')'=(B1(t),…,Bm(t),W1(t),…,Wd(t))',m≥1,d≥0是一个定义在这个概率空间上的(m+d)-维的标准布朗运动。我们进一步的假设信息族{Ft}t∈[0,T]满足FT(?)A,且是由B(t)生成的。考虑一个投资人在时间t投资自己总资产x(t)中的ui(t)于第i种证券,i = 0,1,...,m。那么,投资人的资产满足下面的SDE,其中x0是初始资产:假设投资人的离开时间τ是一个关于A可测的正的随机变量,其中A有可能比FT大。假设投资期限是T,在此之后投资人就不可以继续进行投资。因此,投资人的实际离开时间就是T∧τ。他的目标是,对于一个给定的z∈R,寻找一个终端收益满足E[x(T∧τ)=z的容许控制u(t),使得终端风险(用终端收益的方差来表示)Var[x(T∧τ)]=E[x(T∧τ)-E[x(T∧τ)]]2= E[x(T ∧τ)-z]2 最小化。利用分离方法和一些随机分析技术,我们将这个随机离开时间和不完备市场下的均值-方差问题构造成如下的一个带限制的随机线性二次控制问题。定义0.1.假设(H2.1),(H2.2),和(H2.3)成立,则随机离开时间和不完备市场下的均值-方差证券投资组合问题被构造成为一个以z∈R为参数的受约束的随机线性二次最优控制问题:注意到我们的均值-方差问题带有限制J1(u(·))=z,在解决了可行性问题以后,我们使用拉格朗日乘子法来处理这个限制。对于所有的λ ∈R,我们定义第一个目标是处理下面的这个以λ为参数的不带限制的问题:这是一个标准的随机线性二次最优控制问题,我们引入下面的两个BSDEs:和(0.0.9)就是所谓的随机Riccati方程(SRE),(0.0.10)是辅助BSDE。我们将使用BMO-鞅理论来证明上述两个方程的可解性,即以下两个定理。定理 0.5.假设(H2.1)-(H2.3)成立。则SRE(0.0.9)有解(p,Λ)∈LF∞(Ω;C(0,T;R))×LF2(0,T;Rm+d),且满足k≤p≤K,其中K>k>0。此外,∫0tΛ(s)'dB(s)是一个BMO-鞅。定理 0.6.假设(H2.1)-(H2.3)。给定一个SRE(0.0.9)的解(p,A),则BSDE(0.0.10)存在唯一解(?)。而且,对于所有的t∈[0,T],我们有0<h(t)≤1。此外,如果r(t)>0,a.e.t∈[0.T],则对所有的t ∈[0,1),有0<h(t)<1。确定了上述两个BSDEs的可解性后,就可以解出不受限问题(0.0.8)。最后,根据不受限问题的解,就能给出原始问题(0.0.7)的解。可以看出,最优的投资组合是一个线性状态反馈的形式,终端最小风险Var[x(T ∧ τ)]关于终端财富z是一个二次函数。定理0.7.假设(H2.1)-(H2.3)和条件(2.3.2)成立。则我们有(?)此外,对应于z的一个最优投资组合(具有反馈控制的形式),由下式给出u*(t)=uλ*(t)(?)(?)其中(?)(?)最优的财富过程(?)由方程(2.5.1)的解给出,对应于uλ*(t)。此外,在满足限制E[x(T∧τ)]= z的所有的财富过程x(·)中,终端财富方差Var[x(T∧τ)]的最优值是(?)(?)3.带马尔科夫链和泊松跳的正倒向系统的最大值原理及其在金融中的应用记(Ω,F,{Ft}t∈[0,T],P)是一个完备的概率空间,上面定义了一个标准的1-维的布朗运动,一个连续时间马尔科夫链,和一个泊松随机测度。马尔科夫链α(t)的状态空间是S = {α1,α2,...,αD},其中D∈N,αi∈RD,且第j个分量是δij,对于每一个i,j=1,2,…,D。对应于控制u(t)∈U(?)R的状态过程(X(t),Y(t),Z(t),Z(t,e),Z(t))∈R4×RD由下面的FBSDE给出:其中,μ∈R是一个给定的常数,b,σ,σ,σ,f是给定的具有合适维数的函数。在这里,为了方便起见,我们记Θ(t)=(X(t),Y(t),Z(t))。考虑如下的评价指标:其中l,g,h是给定的具有合适维数的函数。我们的最优控制问题是:寻找一个容许控制u*(·)∈u使得J(u*(·))= infu(·)∈u J(u(·))。记θ代表(x,y,z),记R代表所有的函数r:ε→R。定义哈密顿函数H:[0,T]×R3×(?)(?)。我们假设哈密顿函数H关于θ是可微的。在引入伴随方程(3.2.3)后,我们就可以得到下面的充分性随机最大值原理。定理0.8.记u*∈u,对应的方程(0.0.11)的解是(X*,Y*,Z*,Z*,Z*),假设伴随方为了符号方便,我们记(?)。此外,我们假设下面的条件成立条件1.对于所有的(?)。条件2.对于每一个固定的(?)存在并且是一个关于θ的凸函数。条件3.函数g(x,αi)和h(y)是凸的,对于每一个αi,i=1,2,...,D。则u*是一个最优控制,(X*,Y*,Z*,Z*,Z*)是对应的最优状态过程。接下来,我们将建立最大值原理与动态规划原理之间的关系。我们首先将代价泛函(0.0.12)简化为J(u(·))=Y(0),并记J(t,x,αi;u(·))=Y(t),其中(t,x,αi)代表初始时间和初始状态,即X(t)=x,α(t)=αi。并且,定义我们得到值函数V(t,x,αi)满足下面的HJB方程:其中,对于每一个αi,关于v∈C1,2([0,T]×R)的一般哈密顿函数G定义为(3.4.2)。则我们有下面的定理。定理 0.9.假设V(t,x,αi)∈C1,2([0,T]×R),对于每一个αi∈S。记u*是最优控制,(X*,Y*,Z*,Z*,Z*)是相应的最优状态过程。则对于所有的s∈[t,T],我们有此外,如果V(t,x,αi)∈C1,3([0,T]×R),我们定义下列过程:最后,我们应用最大值原理解决一个带马尔科夫链和泊松跳的金融市场中的带终端财富限制的现金流估值问题。由拉格朗日乘子法,我们将问题构造如下。最小化:其中,c(t)是委托人的提取回报率,作为控制的一部分。代理人的财富过程X(t)由下面的SDE给出其中,u(t)是代理人的投资策略,作为控制的另一部分。委托人的效用Y(t)由下面的倒向随机微分方程给出利用马尔科夫链的性质和鞅表示定理,我们可以显式地解出上述问题的最优策略,即下面的定理。定理0.10.带终端财富限制的现金流估值问题(3.5.3)的最优控制策略由下面给出:其中θ*由(3.5.23)给出,p(t,α(t))和q(t,α(t))分别由(3.5.17)和(3.5.18)给出。4.带马尔科夫链的正倒向超前-延迟系统的随机最大值原理记(Ω,F,P)是一个概率空间。T>0是一个有限时间区间的终点。{Bt}0≤t≤T是一个1-维布朗运动,{αt}0≤t≤T是一个有限状态马尔科夫链,状态空间记为I = {1,2,...,k}。假设B和α是相互独立的。马尔科夫链的转移速率记为λ(i,j)。假设λ(i,j)是非负的和一致有界的,并且λ(i,i)=-∑j≠iλ(i,j)。记{Ft}0≤t≤T是由{Bt,αt}0≤t≤T生成的自然信信息族,并包含F中所有的P-零测集。我们首先建立下面的带马尔科夫链的超前的BSDE的解的存在唯一性:定理0.11.在假设(H4.1)和(H4.2)下,BSDE(0.0.13)存在唯一解(Yt,Z,Vt)∈LF2(0,T+δ;R)× LF2(0,T+δ;R)× L2(P;R)。我们考虑下面的最优控制问题,控制系统由一个正倒向方程给出。其中Wtnt=(Wt(1)nt(1),...,Wt(k)nt(k)),x0(t),υ0(t)是确定性的函数。在上面,υt是一个Ft-适应的控制过程,取值于U,且U(?)R是一个非空的凸集。记u为容许控制的集合,其中容许控制是指取值于凸集U并且满足E[∫0T|υt|2dt]<∞。定义代价泛函如下:其中l,h,r是可测函数。我们的最优控制问题的目标是,在容许控制集u中,最大化泛函指标(0.0.14)。能够最大化(0.0.14)的控制ut被称为是最优控制。由变分方程(4.3.1),以及定理4.2中的估计,我们可以建立下面的变分不等式。定理0.12.假设(H4.3)-(H4.5)成立,则我们有:引入伴随方程(4.3.5)后,定义哈密顿函数H:[0,T]× I × R ×R × R × L2(Fτ;R)×R × L2(Fr;R)× L2(P;R)×U×U×R×R×R→R如下其中r,r∈[t,T]。我们可以得到下面的随机最大值原理。定理0.13.假设(H4.3)-(H4.5),记ut是一个最优控制,(Xt,Yt,Z,Wt)是对应的状态过程。(qt,pt,kt,Λt)是伴随方程(4.3.5)的唯一解。则对任意的v∈U,我们有然后,我们假设一个额外的凸性条件,来获得一个关于最优控制的充分性条件。定理0.14.假设ut∈u。记(Xt,Yt,Zt,Wt)是对应的状态过程,(qt,pt,kt,Λt)是伴随方程(4.3.5)的解。如果假设(H4.3)-(H4.6)和方程(0.0.15)对于ut成立,则ut是一个最优控制。最后,我们研究一个递归效用下的投资-消费问题。应用随机最大值原理,我们得到了显式的最优消费率。考虑一个带马尔科夫链和延迟的随机动态:其中,消费过程ct是一个Ft-适应的非负的过程,满足E[∫0T|ct|2dt]<∞。记u代表所有消费过程的集合。在我们的投资-消费问题中,假设投资人将会选取u中的一个消费过程去最大化他的效用。考虑下面的递归效用,由一个带马尔科夫链的BSDE来描述:其中U(:[0,T]× R+ × Ω →R是一个给定的满足一定条件的效用函数。我们想要找到一个消费率ct,使得利用随机最大值原理,通过最大化哈密顿函数,再结合一些BSDE的性质,我们可以得到候选的最优消费率ct可以由下式给出:容易验证假设(H4.3)-(H4.6)被满足,所以我们得到下面的结果。定理0.15.记(qt,pt,kt,Λt)是伴随方程(4.4.3)的解,假设(4.4.4)成立,则由定理0.14知,最优的消费率ct由(0.0.16)给出。

许洁[7]2017年在《时滞重随机控制系统的随机最大值原理及其应用》文中提出本文主要研究当状态方程是包含时滞的重随机微分方程时的最优控制问题.首先利用鞅表示定理和压缩映像原理给出含有时滞的重随机微分方程解的存在唯一性条件.进而在控制域为凸的假设下,利用经典的变分法给出最优控制所满足的必要条件,得到时滞重随机控制系统的最大值原理,并将此结论应用到线性二次最优控制问题中,得到最优控制的显示表达式.此外,我们对线性正倒向重随机Hamilton系统进行研究,定义相应的矩阵Riccait方程,在适当的假设条件下,给出一类线性正倒向重随机微分方程解的存在唯一性条件.由于Riccati方程是求解线性二次最优控制问题的关键,本文利用倒向随机微分方程的理论讨论了一类倒向随机Riccati方程解的存在唯一性条件.

姜彬[8]2016年在《偏微分方程最优控制中的变分迭代法应用》文中进行了进一步梳理首先使用极大值原理得到偏微分方程问题的最优性条件,然后使用变分迭代法求解Hamilton-Pontryagin方程,实现了偏微分方程最优控制问题的准确快速求解。结合两个最优控制的经典实例,对模型和算法进行了仿真实验,证明了该方法的可行性和有效性。

刘伟渭[9]2013年在《约束轮对随机非线性动力学理论研究》文中研究说明随着国内外高速铁路和高速列车的大力发展,由此带来了对车辆、轨道系统动力学各方面更为严峻的挑战和要求。确定性的观点在物理、工程技术、生物和经济领域中的应用是众所周知的,然而随着科学技术的发展,要求对实际问题的描述越来越精确。因此,随机因素的影响就不能轻易被忽视,于是对某些实际过程的分析也就有必要从通常的确定性观点转到随机的观点。对于现代轨道车辆而言,由于高速度已成为高速铁路高新技术的核心,随机因素影响更应受到重视,它对系统的运动稳定性、运行平稳性、脱轨安全性、结构服役可靠性以及列车空气动力学问题等均有重要作用。由于对轨道车辆的研究以往主要集中于确定性框架,而对随机非线性动力学的研究也主要集中于响应问题,对定性行为、可靠性等少有涉及,所以本文尝试在这方面作一些工作,内容主要包括:(1)物理模型和数学模型的建立:考虑轨道随机不平顺激励(根据作用机理主次分为随机外激和随机参激两种类型)与结构自身的频变随机参激作用等,把弹性约束轮对系统的建模从Lagrange体系转换到了Hamilton体系,用Hamilton函数的形式(即从能量的角度,把多因素的随机响应问题转化为单因素能量的分析)来对动力学行为进行研究,并建立了弹性约束轮对系统带Hamilton函数形式的Ito型随机微分方程组,运用随机平均法把该Ito型随机微分方程组表示为一维扩散过程,同时得到了支配该过程的平均Ito随机微分方程。(2)随机稳定性、分岔以及实验测定方法研究:运用拟不可积Hamilton系统相关理论和Oseledec乘性遍历定理求解了系统的最大Lyapunov指数,得到了系统的随机局部稳定性条件;通过分析一维扩散的奇异边界形态,得到了系统随机全局稳定性条件;依据系统响应的平稳概率密度和联合概率密度,得到了系统的随机Hopf分岔类型,以及D-分岔(动态分岔)和P-分岔(唯象分岔)的分岔条件,并对随机稳定性和确定性稳定性进行了比较分析;另外给出了分岔点以及脱轨安全条件的实验测定方法,并把该方法应用到了具体的实验数据分析中,实验结果和理论分析结果得到了较好吻合,验证了方法的正确性和线路应用的可行性。(3)首次穿越失效可靠性研究:在对随机稳定性和随机分岔分析的基础上,求得了弹性约束轮对系统发生首次穿越失效可靠性破坏的条件,得到了系统可靠性函数所满足的后向Kolmogorov方程,首次穿越平均时间满足的广义Pontryagin方程以及首次穿越时间条件概率密度方程,并结合初始条件和边界条件,运用相关的数值方法对其进行了分析,研究了首次穿越失效对系统形态的影响以及失效后的动力学行为。(4)随机非线性最优控制研究:依据随机动态规划方法,以系统可靠度更高和首次穿越时间更长为目标,对弹性约束轮对系统进行了随机非线性最优控制分析,并对控制效果和策略进行了详细讨论,另外还对弹性约束轮对系统随机稳定性化的非线性随机最优控制进行了研究。

徐瑞民[10]2014年在《平均场随机系统理论及其应用》文中指出本论文主要讨论两类平均场随机系统——平均场倒向重随机微分方程(mean-field BDSDEs)和平均场倒向随机发展方程(mean-field BSEEs)--的适定性问题及其在随机控制中的应用、平均场随机控制问题的均衡HJB方程和McKean-Vlasov PDE的Sobolev弱解。论文包括以下四个部分:第一部分研究单调系数下平均场倒向重随机微分方程的适定性问题,利用此方程的解给出一类随机偏微分方程的概率解释;第二部分给出一类弱系数条件下平均场倒向随机发展方程解的存在唯一性结论,并研究了在给定初边值条件下,一类平均场类型的倒向随机偏微分方程的解;第叁部分研究了叁类平均场随机控制系统:平均场倒向重随机控制系统的最大值原理、平均场倒向随机偏微分控制系统的最大值原理和平均场随机控制问题的均衡HJB方程;第四部分利用平均场倒向随机微分方程的解给出一类偏微分方程的Sobolev弱解。以下是本论文的主要内容及结构。第一章,阐述本文研究的主要问题及其背景。第二章,我们研究了单调系数下mean-field BDSDEs解的存在唯一性问题和一类随机偏微分方程的概率解释。首先给出了全局单调系数下,mean-field BDSDEs解的存在唯一性定理,在此基础上,应用函数逼近的方法,得到了局部单调系数下mean-field BDSDEs解的存在唯一性结论,并给出了一维情形下平均场倒向重随机微分方程的比较定理。利用平均场倒向重随机微分方程的解给出一类随机偏微分方程的概率表示,此表示可以看作是平均场随机偏微分方程的随机Feynman-Kac公式。第叁章,研究了比Lipschitz更弱的一般条件下,平均场倒向随机发展方程温和解的存在唯一性结论。作为基础,我们首先得到了Lipschitz条件下平均场随机发展方程解的存在唯一性。并应用上述结论研究了一类平均场倒向随机偏微分方程初边值问题的可解性问题。第四章,研究了平均场倒向重随机控制系统的最大值原理、平均场倒向随机偏微分控制系统的最大值原理和平均场随机控制问题的均衡HJB方程。首先,考虑了凸控制域下的平均场倒向重随机系统的最优控制问题,利用凸变分技术,给出了最优控制的最大值原理和验证定理;其次给出了状态初值受限制条件下由平均场倒向随机偏微分方程驱动的控制问题的最大值原理,在此控制系统中,控制域是非凸的,状态方程和效用函数中的系数依赖于状态过程、控制项、以及状态过程和控制项的分布律,我们利用Ekeland变分原理将受限制的控制问题转化为不受限制的控制问题,然后通过针状变分方法给出了最优控制存在的必要条件,并研究了一类线性二次最优控制问题;最后,由于平均场随机控制系统的值函数是时间不相容的,不满足Bellnan最优性原理。对此,我们引入均衡控制,证明了此控制系统对应的值函数满足均衡HJB方程。第五章,分析了一类平均场偏微分方程对应的Sobolev.弱解。首先,论证出McKean-Vlasov SDE的解Xst,x为一个关于初值x的二阶连续可微同胚随机流,导出了此随机流的逆对应的微分方程;然后利用此随机流的逆构造测试函数,并给出测试函数的半鞅分解定理,进而利用平均场倒向随机微分方程的解给出了McKean-Vlasov PDEs的Sobolev弱解的概率解释。下面给出本论文的主要结果。1.平均场倒向重随机微分方程和相关的随机偏微分方程在本章中,我们将研究如下类型的平均场重随机微分方程:上述方程中,{Wt,0≤t≤T}和{Bt,0≤t≤T}为某完备概率空间上的两个相互独立的标准布朗运动,dWt积分项为一标准(正向)的Ito积分,dB。积分项表示倒向Ito积分。方程(0.0.1)中系数可以解释为:对于φ=.f,g,E'[φ(s,Y's,z's,Ys,Zs)](ω)=E'[φ(s,Y's,Z's,Ys(ω),Zs(ω))]对于平均场倒向重随机微分方程,在全局单调系数条件下,有如下的解的存在唯-性定理:定理0.1.对任意给定的ζ∈L2(Ω,FT,P;Rn),如果条件似2.1)-似2.5)成立,则mean-field BDSDE(0.0.1)存在唯一解(Y,Z)∈SF2([0,T];Rn)×HF2(0,T;Rn×d).当系数条件减弱到局部单调系数下,构造系数f的一个逼近函数列{fm)m=1∞,其中对于任意给定的?n∈N,fm满足全局单调系数条件;证明对应于系数fm的平均场倒向重随机微分方程的解(Ym,Zm)为-Cauchy,其极限恰好为方程(0.0.1)的唯一解,结论具体描述为定理0.2.假设条件(A2.1),(A2.2),(A2.3)-(A2.5')成立,进一步地,假设当N→∞时,有其中θ是任意固定的常数满足0<θ<1-2a.则mean-field BDSDE(0.0.1)存在唯一解(Y,Z)∈SF2([0,T];Rn)×HF2(0,T;Rn×d).对于一维情形的平均场倒向重随机微分方程,给出相应的比较定理。定理0.3.(比较定理).考虑如下的menn-field BDSDEs:(0≤t≤T)假定mean-field BDSDEs(0.0.3)和(0.0.4)满足定理0.2的条件。令(Y1,Z1)和(Y2,Z2)分别为mean-field BDSDEs(0.0.3)和(0.0.4)的解,对于生成元f1和f2,假定(ⅰ)两个生成元之一不含有z’,(ⅱ)两个生成元之一关于y’非降。如果ζ1≤ζ2,a.s.,f1(t,y',z',y,z)≤f2(t,y',z',y,z),a.s.,则有Yt1≤Yt2,(?)所有的t∈[0,T]都成立。最后,利用平均场倒向重随机微分方程的解研究了一类新的随机偏微分方程(SPDEs)的概率表示。考虑如下的McKean-Vlasov SPDEs:对任意的(t,x)∈[0,T]×Rd,其中σ*为子的转置,定义σ:=E[σ(s,Xs0,x0,x)],L为二阶可微算子,定义为((?)u)i=(Lui)1≤i≤n,满足随机过程Xt0,x0是一类随机微分方程的解,其在t=0时刻值为x0,E表示对应于概率P的数学期望。对于McKean-Vlaov SPDE(0.0.5)和mean-field BDSDE的关系,有如下的结论定理0.4.假定条件(A2.7)和条件(A2.8)成立,令{u(t,x);0≤t≤T,x∈Rd)为Ft,TB可测随机变量,u(t,x)是方程(0.05)的解,且对任意的(t,x),u∈C0,2([0,T]×Rd;Rn)a.s此外,假定f,g∈C([0,T]×Rd×Rd×Rn×Rn×Rn×d×Rn×d)对a.s.ω∈Ω成立。则有如下结论:u(t,x)=Yt,tx,其中{(Yst,x,Zst,x);t≤s≤T)t≥0,x∈Rd为mean-fild BDSDEs(2.4,3)的唯一解,且有Yst,x=u(s,Xst,x),Zst,x=E'[σ(s,(Xs0,x0)',Xst,x)]*·▽u(s,Xst,x).(0.0.6)公式(0.0.6)可以看做是平均场类型的SPDEs的随机Feynman-Kac公式。2.Hilbert空间上的平均场倒向随机发展方程在这一部分,主要研究Hilbert空间上的平均场倒向随机发展方程其中W(s)为一圆柱Wiener过程,A表示Hilbert空间H上强连续半群etA,t≥0的生成元,系数为其中(ω',ω)∈Ω×Ω,因此系数中既包含了随机过程(Y(·),Z(·))也包含了此过程的分布(以数学期望形式)。对于上述方程,定义其温和解为定义0.1.称一对适应过程(Y,Z)为mean-field BSEE(0.0.7)的温和解,如果(Y,Z)∈SF2([0,T];H)×HF2([0,T];L2(r,H))且对所有的t∈[0,T],都有首先,在Lipschitz条件下,利用压缩映射原理,证明了方程(0.0.7)温和解的存在唯一性定理:定理0.5.对任意给定的随机变量ζ∈L1(Ω,FT,P;H),在条件(A3.1)和(A3.2)下,mean-field BSEE(0.0.7)存在唯一的温和解(Y,Z)∈SF2([0,T];H)×HF1;([0,T];L(Γ,H))。其次,在更一般的条件下,利用Picard迭代方法构造一个Cauchy序列,我们得到了mean-field BSEE(0.0.7)温和解的存在唯一性:定理0.6.假定条件(A3.2)和(A3.3)成立。则:mean-field BSEE(0.0.7)存在唯一的温和解(Y,Z)。利用前述平均场倒向随机发展方程温和解的结论,我们研究了一类平均场倒向随机偏微分方程初边值问题的可解性。3.平均场随机控制系统的最大值原理和均衡HJB方程在这一部分,主要研究平均场倒向重随机控制系统的最大值原理、平均场倒向随机偏微分控制系统的最大值原理和平均场随机控制问题的均衡HJB方程。这叁类控制系统的显着特点是状态方程和效用函数中的系数均依赖于状态过程、控制项、以及状态过程的分布律(以数学期望形式)。I.平均场倒向重随机控制系统的最大值原理首先,考虑如下的平均场倒向重随机控制系统:控制域U为Rk(k∈N+)中一非空的闭凸集,定义可行控制集为u={ut∈LF2(0,T;U)|ut(ω',ω):[0,T]×Ω×Ω→U,t∈[0,T]}.最优控制问题的目标是在可行控制集u上寻找控制u(·)使得如下的效用泛函达到最小:假设此控制问题的最优控制为u(·),(Y(·),Z(·))为对应的状态轨迹。利用凸变分技术,定义一个新的控制如下:ut0=ut+θ(vt-ut),vt∈u,0≤θ≤1.由控制域U的凸性可知uθ(·)∈u。对于ψ=f,g,h,采用记号ψ(t)(?)ψ(t,(Yt)',(Zt)',Yt,Zt,ut).引入变分方程根据变分方程解的性质,可以得到下列变分不等式的结论:引理0.1.在条件(A4.1.1)-(A4.1.3)下,对任意的v(·)∈u,下列变分不等式成立:引入伴随方程如下,其中对于ψ=f,9,h,令ψ(t)=ψ(t,Yt,Zt,Y't,Z't(ut)')。定义此控制问题的Hamilton函数为H(t,y,z,y,z,p,g,u)(?)(t,y,z,y,z,v)p+g(t,y,z,y,z,u)q+h(t,y,z,y,z,u).应用Ito公式,结合变分不等式,我们以最大值原理的形式给出了最优控制的必要条件,具体描述为:定理0.7.假定条件(A4.1.1)-(A4.1.3)成立。令u(·)为控制问题(0.0.8)-(0.09)的最优控制,(Y(·),Z(·))表示对应的状态过程。对所有的v∈u,则有E'[Hv(t,Y't,Z't;,Yt,Zt,p(t),q(t),ut)(vt-ut)]≥0,(0.0.13)a.e.,a.s.,其中(p(·),q(·))是伴随方程(0.0.12)的解。在一定的凸性的假设条件下,得到了最优控制的充分性条件——验证定理,具体结论如下:定理0.8.(验证定理)假设条件(A4.1.1)-(A4.1.4)成立。可行性控制u(·)∈u对应的状态轨迹为(Yt,Zt),伴随方程Mean-field BDSDE(0.0.12)的解表示为(p(·),q(·))。假定对于所有的t∈[0,T],有E'[H(t,Y't,Z't,Yt,Zt,p(t),q(t),ut)=minv∈UE'[H(t,Y't,Z't,Yt,Zt.p(t),q(t),vt)(0.0.14)另外,设函数H(t,y,z,y,z,p,q,v)是关于变量(f,y,z,y,z,v)的凸函数。则u是控制问题(0.0.8)-(0.0.9)的最优控制。我们利用此最大值原理,研究了一个倒向重随机线性二次最优控制问题,得到了相应的最优控制。Ⅱ.平均场倒向随机偏微分控制系统的最大值原理在本文第叁章Hilbert空间上平均场倒向随机发展方程理论的研究基础上,我们研究了在状态过程初值受限的条件下,由平均场倒向随机偏微分方程驱动的一类随机系统的最优控制问题。令O∈Rn为一有界开集,其边界(?)光滑,控制域U为一个可分的实值Hilbert空间。定义u={v(·)∈LF2(0,T;U)|vt(ω',ω):[0,T]×Ω×Ω→U关于F(?)Ft—循序可测}.u中元素称为可行性控制。对任意的v∈u,考虑状态空间H=L2((?))(范数为|·|,内积为<·,·>)上的受控的BSPDE系统:其中A为偏微分算子。效用泛函定义为此控制问题的目标是:对于给定的Φ(?)×H×H→R,在下述状态限制下在uad上选取控制项v,使得效用泛函达到最小。如果可行性控制u∈uad满足则u称为最优控制。对于固定的v∈uad,令其中m表示R上的Lebesgue测度。下述引理将给定的控制问题转换为初始状态不受限的最优控制问题。引理0.2.(S,d(·,·))为完备的距离空间,(Y,Z)为(0.0.15)对应于控制v的温和解,定义Jρ为则Jρ为S上的连续有界泛函。由上述定义知,由Ekeland变分原理可知,存在uρ(·)∈V使得(ⅰ) Jρ (uρ(·))≤ρ,(ⅱ) d(uρ(·),u(·))≤ρ,(ⅲ) Jρ(uρ(·))≤Jρ(v(≮))+ρd(uρ(·),u(·)),(?)v(·)∈S.(0.0.18)由此,对原来初值受限条件下控制问题的研究转化为研究如下的无限制条件的最优控制问题:引入伴随方程:其中对于φ=f,h,采用记号φ(t)=φ(t,x,Yt(x),Zt(x),(Tt(x))',(Zt(x))',(ut)'), φ(t)=φ(t,x,(Yt(x))',(Zt(x))',Yt(x),Zt(x),ut).在非凸控制域下,利用针状变分技术,以最大值原理的形式给出了原控制问题最优性的必要条件。定理0.9.假设条件似4.2.1)-(A4.2.3)成立。设在给定初值限制条件(0.01.17)下,BSPDE控制系统(0.0.15)-(0.0.16)的最优控制为u(·),(Y(·),z(·))为对应的状态过程。则存在户(t)SF2([0,T];K);满足(0.0.19),使得H(t,Yt',Zt',Yt,Zt,ut,P(t))≥H(t,Yt',Zt',Yt,Zt,ut,P(t)), a.e.,a.s.(?)∈uad,其中H:[0,T]×H×L(Γ,H)×H×L(Γ,H)×U×K→R为Hamiltonian函数,定义为H(t,y,z,y,z,u,p)=l1h(t,y,z,y,z,v)+pf(t,y,z,y,z,u).作为最大值原理的应用,我们研究了一类线性二次最优控制问题,并得到了最优控制的显式表达式。Ⅲ.平均场随机控制问题的均衡HJB方程对于平均场类型的最优控制问题,效用泛函J(可能)是数学期望的非线性函数,这使得控制问题是时间不相容的,因此不满足Bellman最优性原理。针对此问题,我们引入均衡控制的概念,证明了均衡值函数满足一个扩展的Hamilton-Jacobi-Bellman方程,简记为均衡HJB方程。给定的u∈u,对任意的(t,x)∈[0,T)×Rn,考虑如下的平均场类型的状态方程效用泛函定义为其中Et[·]=E[·|Ft]是条件数学期望,Q(s,t)是一个取值为正的确定性的连续可微函数且有Q(t,t)=1。根据效用函数的定义,可以推知,J(t,x;u)满足如下的递归关系式引理0.3.对任意的s∈[t,T),效用函数J满足如下的递归式。上述结论在导出均衡HJB方程时起着关键作用。首先引入均衡控制的定义:定义0.2.选取一个固定的u∈u和一个给定的ε>0。对于任意给定的初值(t,x),定义控制项,uε为如果对所有的u∈u,都有则称u为均衡控制。记对应于均衡控制ur的状态轨道为Xr。定义均衡控制的值函数为v(f,x)=J(t,x;u),称u(t,x)为均衡值函数。本小节的主要结论是均衡值函数v(·,·)满足一个扩展的HJB。具体描述如下定理0.10.假定条件(A4.3.1)-(A4.3.2)成立,如果均衡值函数u(·,·)∈C1,2([0,T]×Rn),则v(·,·)满足如下类型的HJB方程:其边界值为u(T,XT)=F(XT,E(XT))+G(XT)。函数f定义为f(t,x)=Et[XT],函数f满足下列方程其中u为均衡控制。注0.1.v(t,Xt)之所以写成Xt,而不是x,是为了区分函数b,σ和h中数学期望的形式。4.平均场偏微分方程的Sobolev弱解及其概率表示本文的第五章主要研究利用平均场正倒向随机微分方程的解给出平均场偏微分方程的Sobolev弱解的概率表示。考虑如下类型的平均场偏微分方程(McKean-Vlasov PDE):上式中Xo,xo为以下随机微分方程当初值为(t,r)=(0,r0)时的解:对于Φ∈Cc1,∞([0,T]×Rd),引入记号方程(0.0.22)的Sobolev弱解定义为定义0.3.对于终端值为E[Φ(xT0,x0,·)]的McKean-Vlasov PDE(0.0.22),称u∈H为(5.1.3)的Sobolev弱解,如果对于任意的Φ∈Cc1,∞([0,T]×Rd),u满足随机流技术在给出McKean-Vlasov PDE的Sobolev弱解中起着关键作用。由于方程(0.0.23)中平均场项的影响,随机过程(Xst,x)t≤s≤T的逆与经典的SDE的解的逆不同。命题0.1.假定条件(A5.3)成立,贝McKean-Vlasov SDE(0.0.23)定义的Ito过程(Xst,x;x∈Rd)为一个C2-微分同胚随机流。此随机流的逆Xt,s,ω(y)(此处ω是为了强调此随机过程是关于质点ω的随机过程,在不产生混淆的情况下可以省略掉)满足如下形式的带倒向Ito积分的平均场类型的随机微分方程:随机测试函数的构造依赖于随机流的逆Xt,s(y)。令J(Xt,s(y))表示Xt,s(y)的Jacobian矩阵的行列式,J(Xt,s(y))>0且有J(Xt,t(y))=1。对于Φ∈Cc+∞(Rd),定义过程φtΩ×[t,T]×Rd→R如下Φt(s,y)(?)Φ(Xt,s(y))J(Xt,s(y)).对任意的v∈L2(Rd),v与随机流Xt,s(ω)的复合函数(voXt,s(·),Φ)(?)(v,Φt(s,·)).实际上,通过积分变换,有{Φt(s,x)}t≤s是一个随机过程,不能将其直接作为一个测试函数,原因在于∫tT(u(s,·),(?)sΦ(s,·))没有意义。然而,Φt(s,x)是一个半鞅,关于φt(s,x)有如下的半鞅分解定理。引理0.4.对于任意的Φ∈Cc∞(Rd),其中(?)*是算子(?)的伴随算子。为给出McKean-Vlasov PDEs(0.0.22)的概率解释,考虑如下的平均场类型的正倒向随机微分方程下面的结论可以将McKean-Vlasov PDEs(0.0.22)的解与mean-field FBSDE的解联系起来。命题0.2.假定条件(A5.3)-(A5.4)成立。令μ∈H为McKean-Vlasov PDE(0.0.22)的Sobolev弱解,则对于s∈[t,T]和Φ∈Cc∞(Rd),其中,由半鞅分解定理可知,∫sT(u(r,·),dΦt(r,·))是良定义的。根据范数等价性定理和上述命题,证得了McKean-Vlasov PDE(0.0.22)Sobolev(?)解的存在唯一性,并给出其概率解释。定理0.11.假定条(A5.3)-(A5.4)成立。则McKean-Vlasov PDE(0.0.22)存在唯一解u∈H。进一步地,此解有如下的概率解释:u(t,x)=Ytt,x,且对所有的s∈[f,T],有Yst,x=u(s,Xst,x),Zst,x=E[σ(Xs0,x0,Xst,x)]*.▽u(s,Xst,x),其中(Xst,x,Yst,x,Zst,x)为mean-field FBSDE(0.0.25)的解。

参考文献:

[1]. 时变金融市场下动态投资组合选择理论及其应用研究[D]. 吴辉. 湖南大学. 2015

[2]. 非线性期望理论及金融市场不确定性[D]. 高强. 山东大学. 2017

[3]. 几类偏微分方程最优控制相关问题研究[D]. 张磊. 华中科技大学. 2016

[4]. Lévy过程驱动的几类随机系统稳定性分析与最优控制[D]. 周刘为. 东华大学. 2016

[5]. 几类线性随机系统的预见控制[D]. 吴江. 北京科技大学. 2016

[6]. 带马尔科夫链的随机最优控制问题及其在金融中的应用[D]. 吕思宇. 山东大学. 2017

[7]. 时滞重随机控制系统的随机最大值原理及其应用[D]. 许洁. 吉林大学. 2017

[8]. 偏微分方程最优控制中的变分迭代法应用[J]. 姜彬. 长春工业大学学报. 2016

[9]. 约束轮对随机非线性动力学理论研究[D]. 刘伟渭. 西南交通大学. 2013

[10]. 平均场随机系统理论及其应用[D]. 徐瑞民. 山东大学. 2014

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

微分方程的最优控制
下载Doc文档

猜你喜欢