基于季节ARIMA模型的GSM话务量建模和预报,本文主要内容关键词为:话务量论文,建模论文,模型论文,季节论文,ARIMA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:O212文献标识码:A
从90年代初GSM数字移动通信进入中国到现在经过了飞速的发展,从移动通信局的统计数字表明其发展速度呈指数倍增长。对话务量建模分析在网络设计、网络规划以及网络性能评价方面都起到很重要的作用。在研究网络业务时,应用时间序列ARIMA(Autoregressive Integrated Moving Average)模型可以较好的获取网络业务的特性。同时无线话务量预报也是无线网络规划、设计及管理的关键。业务量预报也已经应用到网络的不同领域,例如NSFNET的长相关预报,应用于VBR视频业务动态带宽分配的线性预测方案以及应用于宽带网中拥塞控制的预报等[1~3]。本文给出了带两个周期的乘积模型的一般表达式,同时也提出了一种用季节模型拟合实际业务流的方法,并在此基础上给出了一种基于该模型的业务量预报方法。我们用实际测得的无线业务量的预报实验证明了这种方法的可行性。
一、季节ARIMA模型
这里p,d,q,P,D,Q是为了提醒各算子的阶数不同,可称所得到的乘积季节模型为。事实上,乘积季节性ARIMA模型是疏系数ARIMA(p+P,d+D,q+Q)模型,即该模型的许多参数为零[5]。
二、建立季节模型描述实际的业务序列
我们提出如下的建立季节ARIMA模型的过程[6,7]。
步骤1、通过频谱分析得出序列的周期s;
步骤2、根据对迹的趋势分析得到d和D的一个估计,并且ADF检验确定d和D的值;
步骤3、对序列;的差分运算,得到一个新的平稳序列;
步骤4、模型识别——确定相应ARIMA模型的阶数。
对于混合模型,阶数p,q,p,Q的值通常取作0,1或2,因此对于阶数(p,q)×(P,Q)的选择范围可定为对0,1或2的不同组合,但是要求p,q,p,Q的值不能同时为零。然后通过AIC准则,从中选出较好的(p,q)×(P,Q)值作为模型的阶数;
步骤5、估计所有的参数。
用极大似然估计得到模型中所有参数的估计值;
步骤6、模型的定阶与考核通过对模型阶数的比较判别,最终确定对时间序列进行拟合最为理想的模型。
三、预报
对时间序列建模的最终目的就是利用模型和历史观测值对未来进行预报。在这一部分中将介绍使已知数据及其有关性质对未来进行预报的一般方法和预报的一般程序。
(一)用季节性ARIMA模型对时间序列的预报
(二)基于置信区间的MMSE预报
当网络设计、规划、管理和控制基于业务预报时,如果实际业务的到达率持续高于预报值,将引起大量的呼叫被阻塞,因此给出一种基于概率限的预报算法是有必要的。因为概率下限不影响呼叫,所以不象在一般预报中同时给出上限和下限,我们只需给出上限即可。
对于给定置信水平的预报的一般过程
步骤1、根据特定网络QoS(服务质量)要求,确定置信水平α;
步骤2、通过α确定出要采用的的表达式,例如取;
步骤3、根据实际数据情况及要求,确定时间间隔和h步预报参数h;
步骤4、用第二节步骤为时间序列建模;
步骤5、MMSE预报法对时间序列进行h步预报;
步骤6、通过(5)式得出预报偏差值,从而确定概率置信限。
四、可行性研究
我们用天津移动GSM的实际话务量数据用上面提出的建模和预报的算法进行建模分析。一共有330天的实际话务量数据,从2001年6月1号到2002年5月27号。对于小时话务量序列来说,每一个值代表在一小时内的话务量的积累值,同时我们可以将一天的话务量进行累加得到天话务量序列,同样天话务量序列每个值代表一天内的话务量总和。每个数据的单位为爱尔兰。我们用前300天的数据进行建模并预报后30天的值,并将预报值和真实值进行比较来评估预报算法的性能。
(一)GSM实际话务量分析
图1和图2分别是天和小时原始的话务量序列,天话务量呈现出以7天(周)为周期的周期特性,小时话务量同时具有24小时(天)和168小时(周)的周期特性。
图3是天数据的周期频谱图,横轴代表频率,纵轴代表能量,从图3我们可以得到以下结论:
(1)在频谱为0.14左右出现了尖峰,这称为主频率,由此我们可以推算出话务量呈现一定的周期性,其周期是1/0.14=7,即话务量以周为周期。这与实际情况是相符的。
(2)在频谱为0.28左右时也出现了一个尖峰,这称为二次谐波,由此我们可以得到另一个周期为1/0.28=3.5,出现二次谐波的原因是因为在七天周期内GSM网话务量的不对称性。
(3)在频谱为0.42左右时又出现一个尖峰,这称为三次谐波,由此我们可以得到另一个出现三次谐波的原因是因为周六、周日话务量明显小于平时工作日的话务量。
图4是小时数据的频谱分析图,从中我们也可以得到如下结论:
(1)从频谱图中可以看到主频率为0.0042,可以得到相应的主周期1/0.0042=24,也就是说小时话务量具有明显的天周期,同样在图中也由二次、三次谐波等。
(2)在频率0.006也有一个基本频率,对应的周期是168,也就是一周。
(二)为实际的GSM话务量建模
通过前面的频谱分析得到不同时间尺度话务量序列的周期,接着我们就可以为其建立相应的季节ARIMA模型。天数据用带一个周期的ARIMA模型,小时数据用带两个周期的ARIMA模型。
从原始话务量的曲线图中可以看到总的来说话务量呈现增长的趋势,但在春节和十一长假时,话务量急剧下降,这些点会使预报值有一定的偏移,应对原始数据进行相应的预处理。我们采用均值代替的方法对这些点进行了处理,具体是用前后几周的均值代替,同时为了保证周期性不变,用前后几周星期一的均值代替这些偏移点的星期一,同样星期二到星期日也同样。按建模步骤分别对两个不同时间尺度的话务量序列进行建模,相应的ARIMA模型为(1)天数据阶数。
(三)对GSM话务量的预报
我们已经用最小均方误差预报法对不同的序列进行了预报。同样利用这种方法在上面模型的基础上对这两种不同时间尺度的话务量序列用前300天的值对后30天进行预报。图5和图6分别显示了预报结果,在图中也给出了基于的98%的上限。
(四)预报结果和实际值的比较
我们将预报值和实际值进行了比较,分别显示在图5和图6中。通过比较我们发现预报值和实际值还是很接近的,预报值和实际值的相对误差都小于0.02,因此证明了这种预报方法的有效性。另一方面我们用周话务量进行相应的预报,结果如图7所示,从图中可以看出用带周期的ARIMA模型的预报结果要好于不带周期的ARIMA模型,带周期ARIMA模型的预报更能反映出实际话务量变化趋势。
五、结论
文中,我们主要对给实际业务序列建立乘积的季节ARIMA模型的方法进行了研究,我们给出了带两个周期乘积ARIMA模型的一般表达式,同时也给出了一种修正预报结果的方法。我们对天津移动的GSM话务量序列进行了不同的实验,我们发现预报值和实际值的相对误差都小于0.02,证明了我们采用的预报方法的可行性。我们的实验也表明季节模型可以较好的抓住网络业务的实际特性。
我们用季节模型对不同的业务进行预报,进一步说,基于季节ARIMA模型的建模和预报可以用于网络设计,规划,管理和优化等方面。