CN102891770A - 一种利用短相关模型预测长相关序列的方法 - Google Patents

一种利用短相关模型预测长相关序列的方法 Download PDF

Info

Publication number
CN102891770A
CN102891770A CN201210404009XA CN201210404009A CN102891770A CN 102891770 A CN102891770 A CN 102891770A CN 201210404009X A CN201210404009X A CN 201210404009XA CN 201210404009 A CN201210404009 A CN 201210404009A CN 102891770 A CN102891770 A CN 102891770A
Authority
CN
China
Prior art keywords
model
correlation
self
sequence
imf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210404009XA
Other languages
English (en)
Inventor
张钦宇
高波
于佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201210404009XA priority Critical patent/CN102891770A/zh
Publication of CN102891770A publication Critical patent/CN102891770A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种利用短相关模型预测长相关序列的方法,针对自相似网络流量提出了一种基于EMD的ARMA模型自相似序列预测方法,首先利用EMD方法将自相似网络流量分解为若干个IMF,由于IMF(IntrinsicModeFunctions,固有模式函数简称“IMF”)的窄带特点,证明了IMF是短相关序列,从而将长相关序列建模预测问题转化为对若干个短相关序列的建模和预测,有效地降低了模型的复杂度;其次利用ARMA模型卓越的短相关建模预测能力,对分解后的IMF序列进行了预测;最后提出了一种可以进一步提高模型预测精度的方法,有效地降低了预测结果的归一化均方误差。通过本发明申请技术方案提出的方法具有预测精度高复杂度低的优点,并且对自相似流量的预测精度高于神经网络模型的预测精度。

Description

一种利用短相关模型预测长相关序列的方法
技术领域
本发明涉及一种自相似网络流量的预测方法,尤其涉及一种利用短相关模型预测长相关序列的方法。
背景技术
网络流量的建模和预测是研究网络的性能、管理、协议及服务质量的基础,对网络的规划设计具有重要意义,因此针对网络流量的建模和预测备受人们关注。由于网络流量具有的自相似性对网络数据包缓存的占用比传统排队论分析的结果大,导致了较大的丢包率和延时,所以为了保证网络的服务质量,在研究网络流量的建模和预测过程中,需要对网络流量的自相似性质进行深入研究,找出能够刻画及预测自相似流量的模型。为此,研究人员主要做了两方面工作:一是使用传统短相关(short range dependent,短相关,简称“SRD”)模型来拟合长相关(long range dependent,长相关,简称“LRD”)性质,传统的短相关模型主要包括马尔可夫模型(Markov)以及回归模型,目前已证实短相关模型对网络流量的预测精度较差;二是探索具有长相关特性的新模型对自相似网络流量等时间序列建模及预测,主要包括分数自回归滑动平均模型(Fractional Autoregressive Integrated Moving Average,FARIMA)、分数布朗运动模型(Fractional Brownian Motion,FBM)等,但由于长相关模型的算法复杂度较大,尽管预测精度有所提高,可预测时间亦大大增加,甚至无法满足实际需要。
近年来,又提出了自相似流量建模的新思路,即将具有自相似性的流量数据转化为短相关数据,再利用短相关模型加以建模和预测,这样可以有效地减小计算复杂度。一些研究指出,利用多重分形预测模型,可将难以预测分析的长相关流量序列转化为可以用短相关线性模型预测的序列组;Patrick Flandrin及A.H.Tewfik等人分别对分形布朗运动及分形高斯噪声进行小波分析,发现小波变换的系数在同一尺度下构成的序列不具有长相关特性。此外,人工神经网络由于其优越的非线性预测能力,也被广泛的应用在流量数据的建模及预测方面。径向基函数(Radial Basis Function,RBF)神经网络是近年较为常用的网络流量预测工具,天津大学的王俊松和高志伟利用RBF神经网络对网络流量建模,并进行了预测,虽然取得了较高的精度,但是回避了网络流量通常具有自相似性的特点,未对自相似流量的预测进行研究。
发明内容
本发明解决的技术问题是:构建一种利用短相关模型预测网络自相似流量长相关序列的方法,克服现有技术算法复杂、预测能力低下的技术问题。
本发明的技术方案是:提供一种利用短相关模型预测长相关序列的方法,包括如下步骤:
分解自相似网络流量:取待分析信号x(t)的极大值点和极小值点分别用两条三次样条曲线拟合,得到x(t)的上下两条极值包络线,用m(t)表示两条包络的平均值,令h(t)=x(t)-m(t),若h(t)信号极值点的数量与过零点的数量必须相等或最多相差一个,并且在任一时间点上,h(t)信号的局部最大值与局部最小值定义的包络的均值为零,则h(t)即为第一个IMF,否则将h(t)视为x(t),重复以上步骤,至h(t)信号幅值小于预定值,停止计算,可得到若干固有模式函分量;
根据ARMA模型预测自相似网络流量:确定ARMA模型,
Figure BDA00002288437600031
其中:X(n)表示待预测的时间序列信号,φi为参数,i为1到p中任意一个数,θj为参数,j为1到q中任意一个数,ξ(n)是方差为σ2的白噪声,则{X(n)}为p阶自回归q阶滑动平均混合过程,根据ARMA模型以及序列的p个初始值,随着n值的增加,递推预测序列下一时刻的值。
本发明的进一步技术方案是:还包括将分解自相似网络流量得到的固有模式函分量进行差分处理。
本发明的进一步技术方案是:经过k次重复后,得到的信号与包络线均值之差为h1,k(t),第(k-1)次重复得到的差值为h1,k-1(t),当
Figure BDA00002288437600032
成立时,将h1,k(t)视为第一个固有模式函分量,其中:b为预定值。
本发明的进一步技术方案是:预定值b取0.1。
本发明的进一步技术方案是:确定ARMA模型包括模型参数的确定,包括模型的阶数确定,根据AIC函数:
A ( s ) = ln σ ^ 2 + 2 s N
确定模型阶数,其中:为ξ(n)方差的估计,s为模型参数的总数,是ξ(n)的方差p、q三者数量之和,p为ARMA模型自回归前的阶数,q为自回归阶数,即s=p+q+1,N为已知观测数据样本大小。
本发明的进一步技术方案是:采用逆函数法估计ARMA模型的φi和θj参数。
本发明的技术效果是:本发明针对自相似网络流量提出了一种基于ARMA(Autoregressive Moving Average,自回归滑动平均模型,简称“ARMA”)模型的EMD(empirical mode decomposition,经验模式分解,简称“EMD”)自相似序列预测方法,首先利用EMD方法将自相似网络流量分解为若干个IMF,由于IMF(Intrinsic Mode Functions,固有模式函数简称“IMF”)的窄带特点,证明了IMF是短相关序列,从而将长相关序列建模预测问题转化为对若干个短相关序列的建模和预测,有效地降低了模型的复杂度;其次利用ARMA模型卓越的短相关建模预测能力,对分解后的IMF序列进行了预测;最后提出了一种可以进一步提高模型预测精度的方法,有效地降低了预测结果的归一化均方误差。通过本发明申请技术方案提出的方法具有预测精度高复杂度低的优点,并且对自相似流量的预测精度高于神经网络模型的预测精度。
附图说明
图1为本发明的流程图。
图2为本发明的原始网络流量的累积序列数据。
图3为本发明的原始数据的累积序列方差-时间图。
图4为本发明的IMF1图示。
图5为本发明的IMF2图示。
图6为本发明的IMF3图示。
图7为本发明的IMF4图示。
图8为本发明的IMF5图示。
图9为本发明的IMF6图示。
图10为本发明的IMF7图示。
图11为本发明的IMF8图示。
图12为本发明BC-pOct89(1)的IMF1至IMF3分量自相关函数与原始数据自相关函数对比图示。
图13为本发明BC-pAug89的IMF1至IMF3分量自相关函数与原始数据自相关函数对比图示。
图14为本发明的BC-Oct89Ext的IMF1至IMF3分量自相关函数与原始数据自相关函数对比图示。
图15为本发明的BC-pOct89(2)的IMF1至IMF3分量自相关函数与原始数据自相关函数对比图示。
图16为本发明的IMF1分量经过差分和未差分的预测NMSE值。
图17为本发明的IMF1分量5次差分后的预测图示。
具体实施方式
下面结合具体实施例,对本发明技术方案进一步说明。
如图1所示,本发明的具体实施方式是:提供一种利用短相关模型预测长相关序列的方法,包括如下步骤:
步骤100:分解自相似网络流量,即:取待分析信号x(t)的极大值点和极小值点分别用两条三次样条曲线拟合,得到x(t)的上下两条极值包络线,用m(t)表示两条包络的平均值,令h(t)=x(t)-m(t),若h(t)信号极值点的数量与过零点的数量必须相等或最多相差一个,并且在任一时间点上,h(t)信号的局部最大值与局部最小值定义的包络的均值为零,则h(t)即为第一个IMF,否则将h(t)视为x(t),重复以上步骤,至h(t)信号幅值小于预定值,停止计算,可得到若干固有模式函分量。
具体实施过程如下:自相似性导致了网络流量的长相关特点,即:网络流量的自相关函数随着时间间隔的增加,呈双曲函数下降,衰减较慢。呈双曲函数下降说明网络流量的自相关函数不可积,而短相关过程的自相关函数呈指数衰减,在时间上是可积的。现有长相关模型虽然能够较好的刻画长相关性质,但是模型复杂度和算法复杂度较高。即:把长相关流量转化为短相关流量并应用短相关模型对流量数据进行建模及预测。这样不仅能够揭示长相关与短相关之间的联系,而且可以降低复杂度,有利于自相似网络流量的实时预测。
本技术方案是将流量数据经过EMD,分解为若干个短相关的IMF。经验模式分解方法在希尔伯特-黄变换(Hilbert-Huang Transform,HHT)中主要用于将原始信号分解为若干个IMF,这些IMF满足以下条件:1.信号极值点的数量与过零点的数量必须相等或最多相差一个;2.在任一时间点上,信号的局部最大值与局部最小值定义的包络的均值为零。
EMD具体步骤是:对于待分析信号x(t),首先将其所有极大值点和所有极小值点分别用两条三次样条曲线拟合,得到x(t)的上下两条极值包络线,用m(t)表示两条包络的平均值,令h(t)=x(t)-m(t),若h(t)满足IMF的条件,则h(t)即为第一个IMF,否则将h(t)视为x(t),重复以上步骤。假设经过k次重复后,得到的信号与包络线均值之差为h1,k(t),第(k-1)次重复得到的差值为h1,k-1(t),为了减少计算量,当下式成立时,可将h1,k(t)视为第一个IMF分量,即:
{ &Sigma; t = 0 T [ h 1 , k - 1 ( t ) - h 1 , k ( t ) ] 2 h 1 , k - 1 ( t ) 2 } 1 / 2 < 0.1 - - - ( 1 )
式(1)表示,经过k次迭代后的h1,k(t)与前一次迭代结果h1,k-1(t)之间的均方根差值如果小于某一预定数值,如0.1,则可将第k次迭代结果h1,k(t)视为满足条件的第一个IMF分量。这样可以避免对每次迭代后产生的结果进行繁复的、是否符合IMF分量定义的验证,减小了系统的复杂度,而且可以按照实际需要来设定阈值。阈值越小,最终得到的满足式(1)的h1,k(t)越接近真实的IMF分量。本文中,我们将此阈值,即预定值设定为0.1,如式(1)所示。
假设h1,k(t)为第一个IMF分量,将l(t)=x(t)-h1,k(t)视为x(t),重复以上步骤。当所余残量为单调函数或幅值小于预定值,停止计算,可得到若干IMF分量,记这些分量为Ci(t),最终残余量为r(t),则
x ( t ) = &Sigma; i = 1 n C i ( t ) + r ( t ) - - - ( 2 )
现在考虑自相似流量数据经过EMD后的变化。由网络流量的自相似性质可假设网络流量是平稳的。设Ci(t)的Fourier变换为Ci(ω),自相关函数为Rc(τ),根据自相关函数与功率谱密度SX(ω)的Fourier变换关系,可知:
R c ( &tau; ) = 1 2 &pi; &Integral; S X ( &omega; ) e j&omega;&tau; d&omega; - - - ( 3 )
信号的功率谱密度SX(ω)为:
S X ( &omega; ) = lim T &RightArrow; &infin; 1 T | C i ( &omega; ) | 2 - - - ( 4 )
其中T为信号在时域上的长度,为了简便,设T为有限值,即流量数据长度有限。根据IMF的定义中的第一条特点,信号被分解后的各个IMF成分是按照不同震荡模式划分的,而且是类似于传统的平稳窄带高斯过程,所以可以认为Ci(t)是带限的。将(4)代入(3),得:
R c ( &tau; ) = 1 2 &pi; &Integral; &Omega; lim T &RightArrow; &infin; 1 T | C i ( &omega; ) | 2 e j&omega;&tau; d&omega; = 1 2 &pi;T &Integral; &Omega; | C i ( &omega; ) | 2 e j&omega;&tau; d&omega; - - - ( 5 )
由于Rc(τ)为实函数,所以上式可简化为:
R c ( &tau; ) = 1 2 &pi;T &Integral; &Omega; | C i ( &omega; ) | 2 cos ( &omega;&tau; ) d&omega; - - - ( 6 )
设|Ci(ω)|2在频带Ω内的最大最小值分别为M和m,则
m 2 &pi;T &Integral; &Omega; cos ( &omega;&tau; ) d&omega; &le; R c ( &tau; ) &le; M 2 &pi;T &Integral; &Omega; cos ( &omega;&tau; ) d&omega; - - - ( 7 )
R c ( &tau; ) ~ &Integral; &Omega; cos ( &omega;&tau; ) d&omega; = 1 &tau; sin ( &omega;&tau; ) | &Omega; - - - ( 8 )
式(8)说明,Rc(τ)是可积的,从而证明了自相似网络流量经过EMD分解后得到的各个IMF分量是短相关的。
对于以上结论,通过仿真进行了验证。其中,仿真中所使用到的网络流量数据来自于贝尔通信研究所(Bellcore)于1989年测得的LAN流量数据BC-pOct89。为了避免网络流量瞬时突发影响,应选取0.1秒级时间单位上的流量数据,从中截取了45000个数据,时间跨度大约为140秒,将该段数据命名为BC-pOct89(1)。由于数据的累积不会改变其本身的长相关性质,为了减少计算量,根据下式:
X k ( m ) = 1 m [ X ( km - m + 1 ) + &CenterDot; &CenterDot; &CenterDot; + X ( km ) ] , k = 1,2,3 &CenterDot; &CenterDot; &CenterDot; - - - ( 9 )
计算了这45000个数据的累积序列,最终形成了450个数据点,用于分析,其中,X(n)表示截取的45000个序列点,
Figure BDA00002288437600083
表示最终得到的累积序列。
自相似程度用自相似参数(又称为Hurst参数)H∈(0.5,1)来表征,H越大代表网络流量的自相似程度越高。图2为流量数据,纵坐标代表单位时间间隔内到达的数据量大小(单位:bits),采用方差-时间法[14]计算其Hurst参数,如图3所示,用一条直线拟合这些数据点,根据最小二乘原理得出该直线的斜率,由此可知,此斜率与数据的Hurst参数有确定的线性关系,则该原始流量数据的Hurst参数值为0.8477。显然0.5<0.8477<1,由自相似过程特点知,该流量数据具有自相似性。
根据EMD方法,按照式(1)的条件,本文对原始数据进行分解,经过Matlab仿真计算发现将原始数据分解为8个IMF后,残余量r(t)的幅值很低,可忽略不计,并且随着IMF分解个数的增加,残余量呈递减趋势。因此8个IMF分量的分解足以满足系统预测的精度,又可以降低EMD分解的计算复杂度。原始数据分解后得到的8个IMF分量:IMF1至IMF8(见图4、图5、图6、图7、图8、图9、图10、图11)。图12给出了BC-pOct89(1)流量数据的自相关函数及IMF1-IMF3的自相关函数对比。从图12中发现,原始流量数据的自相关函数衰减较慢,在很长的时间内仍然没有衰减到0,类似于双曲函数;而经过EMD之后,各分量的自相关函数衰减速度明显快于原始流量,在时间间隔大约为0-5的范围内已经第一次衰减为0。这说明EMD对降低自相似序列的自相似性有很大作用,使得分解后的各分量呈现短相关性质而不再具有长相关性。由于IMF4-IMF8的波形逐渐接近正弦曲线(见图8至图11),随机性大大减弱,自相关函数计算误差很大。为了进一步验证本文推理的正确性,我们在网络流量数据集合中随机选取了长度各异的三组数据:BC-pOct89(2)、BC-pAug89、BC-Oct89Ext,观察了这三组具有长相关性的数据EMD之后各IMF分量的自相关函数曲线(见图13、图14、图15)。图13、图14、图15显示,BC-pOct89(2)、BC-pAug89、BC-Oct89Ext三组数据的自相关函数图像均呈慢衰减趋势,在时间间隔40个数据点之后(甚至更大)才出现第一零点;而经过EMD之后,每组数据的IMF分量的自相关函数在时间间隔0-5范围内就已经出现第一零点,与BC-pOct89(1)的情况相似。这样就验证了本文的推理证明——EMD可降低自相似序列的自相似性,使长相关转化为短相关。至此,从理论和实验两方面证实了结论:经过EMD的自相似流量不再具有自相似性。
这样,可以舍弃以往的长相关模型,采用复杂度相对较低的传统短相关模型对网络流量进行建模与预测。
步骤200:根据ARMA模型预测自相似网络流量,即:确定ARMA模型,
Figure BDA00002288437600091
其中:X(n)表示待预测的时间序列信号,φi为参数,i为1到p中任意一个数,θj为参数,j为1到q中任意一个数,ξ(n)是方差为σ2的白噪声,则{X(n)}为p阶自回归q阶滑动平均混合过程,根据ARMA模型以及序列的p个初始值,随着n值的增加,递推预测序列下一时刻的值。
具体实施过程如下:
先给出ARMA模型的定义:设{X(n),n=0,±1,±2,...}是零均值平稳过程,若对任意的n满足
Figure BDA00002288437600101
其中ξ(n)是方差为σ2的白噪声,则{X(n)}为p阶自回归q阶滑动平均混合过程,简称为ARMA(p,q)过程。
ARMA属于线性模型,建立线性模型需要根据一组观测数据来确定模型的阶数和未知参数的值。其中确定模型的阶数即确定未知参数的个数,称为模型定阶;确定模型的未知参数的值称为模型的确定。这些参数有:模型的定阶一般采用AIC准则。AIC准则是H.Akaike给出的一个ARMA模型定阶方法。定义AIC函数为:
A ( s ) = ln &sigma; ^ 2 + 2 s N - - - ( 11 )
其中
Figure BDA00002288437600104
为ξ(n)方差的估计;s为模型参数的总数,是ξ(n)的方差
Figure BDA00002288437600105
p、q三者数量之和,即s=p+q+1;N为已知观测数据样本大小。利用AIC准则来定阶是指在p、q的一定变化范围内寻求使得统计量A(s)达到最小的点
Figure BDA00002288437600106
用来作为(p,q)的估计,一般可将阶数的最大范围确定为N/3或lnN等。模型阶数确定后,可采用逆函数法估计各参数的值。下面简单介绍逆函数法对ARMA(p,q)模型的参数估计步骤。
引入后移算子B,即BX(n)=X(n-1),BkX(n)=X(n-k),则式(10)可简记为
Figure BDA00002288437600111
所谓逆函数,即把ξ(n)表示成{X(n-k),k=0,1,2,...}的线性组合,表达式如下:
&xi; ( n ) = X ( n ) - &Sigma; j = 1 &infin; I j X ( n - j ) = ( 1 - I 1 B - I 2 B 2 - &CenterDot; &CenterDot; &CenterDot; ) X ( n ) - - - ( 13 )
将式(13)带入式(12)可得关于B的恒等式:
Figure BDA00002288437600113
比较式(14)两边B的同次幂系数得:
其中θj=0,j>q;
Figure BDA00002288437600115
j>p。当j>max(p,q)时有:
Ij1Ij-1-…-θqIj-q=0           (16)
如果已知Ij的估计值,则可由式(16)求出参数(θ1,…,θq)的估计值,再由式(15)求出参数
Figure BDA00002288437600116
的估计值。
为求Ij的估计,可设
Figure BDA00002288437600117
为网络流量数据样本的自相关函数,
Figure BDA00002288437600118
为参数Ij的估计值(j=1,2,…,p),可根据式(17)计算
Figure BDA00002288437600119
的值:
I ^ 1 I ^ 2 &CenterDot; &CenterDot; &CenterDot; I ^ p = 1 &rho; ^ 1 &CenterDot; &CenterDot; &CenterDot; &rho; ^ p - 1 &rho; ^ 1 1 &CenterDot; &CenterDot; &CenterDot; &rho; ^ p - 2 &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &CenterDot; &rho; ^ p - 1 &rho; ^ p - 2 &CenterDot; &CenterDot; &CenterDot; 1 - 1 &rho; ^ 1 &rho; ^ 2 &CenterDot; &CenterDot; &CenterDot; &rho; ^ p - - - ( 17 )
计算出
Figure BDA000022884376001111
后,即可应用式(18)估计ξ(n)的方差,其中
Figure BDA000022884376001112
是网络流量数据样本的自协方差函数(j=0,1,2,...,p)。
&sigma; ^ 2 = &gamma; ^ 0 - &Sigma; j = 1 p I ^ j &gamma; ^ j - - - ( 18 )
至此,ARMA模型各参数均已确定,建模完成。
根据式(10)以及序列的p个初始值,随着n值的增加,可递推预测序列下一时刻的值。
本发明采用均方误差来评判预测结果的优劣,设均方误差MSE的值为M,即:
M = 1 n &Sigma; i = 1 n [ x ^ ( i ) - x ( i ) ] 2 - - - ( 19 )
在式(19)中,n表示流量数据的个数,
Figure BDA00002288437600123
为网络流量预测数据第i个的值,x(i)为实际网络流量数据第i个的值。随着IMF阶数的增加,亦即各分量震荡频率的降低,预测精度逐渐增大,而且MSE的衰减很快,近乎于指数衰减,其原因为:随着震荡频率的降低即IMF阶数的增加,IMF信号逐渐表现为类似正弦信号的震荡模式,IMF信号的随机性突发性逐渐减弱,这样对于信号预测的准确性有很大提高,IMF1由于震荡频率很大,所以IMF1的预测精度较差。
由于除IMF1分量之外,其余分量的预测精度较高,所以我们将IMF2至IMF8分量加在一起,作为一个整体进行预测。这样不但减少了模型个数,而且提高了效率。
对于IMF1分量预测精度较差的问题,经过研究发现,将IMF1进行差分处理后再使用ARMA模型预测,能够显著提高预测精度。ARMA模型的面向对象主要是平稳序列,而实际工程中遇到的时间序列即使是平稳的,但由于误差、干扰的存在,也表现出一定的非平稳性。数据的非平稳性将导致ARMA模型预测误差的增大。因此,为了减小IMF1的预测误差,在预测之前应加入对IMF1的预处理操作以降低其非平稳性。目前存在一些数据平稳化方法,而差分是一种常用的平稳化方法,本发明采用差分对IMF1平稳化。
设{X(n)}为一离散时间序列,则此序列的一阶差分运算结果为Y(n)=X(n+1)-X(n),二阶差分运算结果为Z(n)=Y(n+1)-Y(n)=X(n+2)-2X(n+1)+X(n),三阶以上差分依此类推。经过差分后,新序列的非平稳性得到了抑制,平稳性进一步增强。但差分处理后,所得新序列的幅值发生了改变,MSE已无法有效衡量模型的预测性能,因此,对于IMF1分量,预测性能的衡量宜选用NMSE,设NMSE的值为N,则有:
N = 1 &sigma; ^ 2 n &Sigma; i = 1 n [ x ^ ( i ) - x ( i ) ] 2 - - - ( 20 )
其中,表示预测数据的方差。NMSE是MSE归一化的结果,因此NMSE可消除序列幅值的改变对预测误差造成的影响。图15是IMF1分量未差分与分别经过1-5次差分运算之后,ARMA预测结果的NMSE值。从图中我们可以发现,差分后的预测NMSE比未经过差分的预测NMSE值小,而且随着差分阶数的增大,NMSE逐渐减小,略呈指数衰减。这说明,差分运算对增加IMF1分量的预测精度作用很大,效果明显。虽然增加差分阶数有助于提高预测精度,但是无形中也加大了算法的复杂度,增加了系统的开销。实际应用中,可以综合考虑建模预测的时间与预测精度的要求,使预测系统整体上达到最优。在此,为了说明算法的可行性,我们选择5阶差分:对IMF1分量做5次差分后,进行ARMA的建模预测,所得预测结果如图16所示,预测结果与真实值相差很小。表1是0-5阶差分后ARMA预测的NMSE值。
表1IMF1分别经过0-5阶差分后ARMA预测的NMSE值
Figure BDA00002288437600133
本发明的技术效果是:本发针对自相似网络流量提出了一种基于ARMA(Autoregressive Moving Average,自回归滑动平均模型,简称“ARMA”)模型的EMD(empirical mode decomposition,经验模式分解,简称“EMD”)自相似序列预测方法,首先利用EMD方法将自相似网络流量分解为若干个IMF,由于IMF(Intrinsic Mode Functions,固有模式函数简称“IMF”)的窄带特点,证明了IMF是短相关序列,从而将长相关序列建模预测问题转化为对若干个短相关序列的建模和预测,有效地降低了模型的复杂度;其次利用ARMA模型卓越的短相关建模预测能力,对分解后的IMF序列进行了预测;最后提出了一种可以进一步提高模型预测精度的方法,有效地降低了预测结果的归一化均方误差。通过本发明申请技术方案提出的方法具有预测精度高复杂度低的优点,并且对自相似流量的预测精度高于神经网络模型的预测精度。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (6)

1.一种利用短相关模型预测长相关序列的方法,包括如下步骤:
分解自相似网络流量:取待分析信号x(t)的极大值点和极小值点分别用两条三次样条曲线拟合,得到x(t)的上下两条极值包络线,用m(t)表示两条包络的平均值,令h(t)=x(t)-m(t),若h(t)信号极值点的数量与过零点的数量必须相等或最多相差一个,并且在任一时间点上,h(t)信号的局部最大值与局部最小值定义的包络的均值为零,则h(t)即为第一个IMF,否则将h(t)视为x(t),重复以上步骤,至h(t)信号幅值小于预定值,停止计算,可得到若干固有模式函分量;
根据ARMA模型预测自相似网络流量:确定ARMA模型,
Figure FDA00002288437500011
其中:X(n)表示待预测的时间序列信号,φi为参数,i为1到p中任意一个数,θj为参数,j为1到q中任意一个数,ξ(n)是方差为σ2的白噪声,则{X(n)}为p阶自回归q阶滑动平均混合过程,根据ARMA模型以及序列的p个初始值,随着n值的增加,递推预测序列下一时刻的值。
2.根据权利要求1所述利用短相关模型预测长相关序列的方法,其特征在于,还包括将分解自相似网络流量得到的固有模式函分量进行差分处理。
3.根据权利要求1所述利用短相关模型预测长相关序列的方法,其特征在于,经过k次重复后,得到的信号与包络线均值之差为h1,k(t),第(k-1)次重复得到的差值为h1,k-1(t),当
Figure FDA00002288437500012
成立时,将h1,k(t)视为第一个固有模式函分量,其中:b为预定值。
4.根据权利要求3所述利用短相关模型预测长相关序列的方法,其特征在于,预定值b取0.1。
5.根据权利要求1所述利用短相关模型预测长相关序列的方法,其特征在于,确定ARMA模型包括模型参数的确定,包括模型的阶数确定,根据AIC函数:
A ( s ) = ln &sigma; ^ 2 + 2 s N
确定模型阶数,其中:
Figure FDA00002288437500022
为ξ(n)方差的估计,s为模型参数的总数,是ξ(n)的方差
Figure FDA00002288437500023
p、q三者数量之和,p为ARMA模型自回归前的阶数,q为自回归阶数,即s=p+q+1,N为已知观测数据样本大小。
6.根据权利要求1所述利用短相关模型预测长相关序列的方法,其特征在于,采用逆函数法估计ARMA模型的φi和θj参数。
CN201210404009XA 2012-10-22 2012-10-22 一种利用短相关模型预测长相关序列的方法 Pending CN102891770A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210404009XA CN102891770A (zh) 2012-10-22 2012-10-22 一种利用短相关模型预测长相关序列的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210404009XA CN102891770A (zh) 2012-10-22 2012-10-22 一种利用短相关模型预测长相关序列的方法

Publications (1)

Publication Number Publication Date
CN102891770A true CN102891770A (zh) 2013-01-23

Family

ID=47535145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210404009XA Pending CN102891770A (zh) 2012-10-22 2012-10-22 一种利用短相关模型预测长相关序列的方法

Country Status (1)

Country Link
CN (1) CN102891770A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469795A (zh) * 2014-11-10 2015-03-25 上海交通大学 基于领域搜索的FARIMA模型Hurst参数估计方法
CN108111353A (zh) * 2017-12-26 2018-06-01 深圳广联赛讯有限公司 预付卡剩余流量预测方法、网络终端和存储介质
CN108964969A (zh) * 2018-05-07 2018-12-07 中国铁路总公司 混合神经网络和ar模型的高速铁路信号系统流量预测方法
CN109508788A (zh) * 2018-11-12 2019-03-22 电子科技大学 一种基于arma模型的sdn流量预测方法
CN110988817A (zh) * 2019-11-21 2020-04-10 河海大学 一种循环谱估计交叉项的抑制方法
CN112253406A (zh) * 2020-09-29 2021-01-22 中国电建集团华东勘测设计研究院有限公司 一种海上风电机组的环境荷载预测方法与振动预控制系统
CN113191003A (zh) * 2021-05-08 2021-07-30 上海核工程研究设计院有限公司 一种核电实时数据趋势拟合算法
CN113328815A (zh) * 2021-07-05 2021-08-31 重庆理工大学 一种消除映射误差的无线链路质量敏捷预测方法
CN115496627A (zh) * 2022-11-22 2022-12-20 国网天津市电力公司电力科学研究院 一种可调资源响应潜力的评估方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1545245A (zh) * 2003-11-12 2004-11-10 中国科学院计算技术研究所 数据网络流量在线预测方法
CN101651568A (zh) * 2009-07-01 2010-02-17 青岛农业大学 一种网络流量预测和异常检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1545245A (zh) * 2003-11-12 2004-11-10 中国科学院计算技术研究所 数据网络流量在线预测方法
CN101651568A (zh) * 2009-07-01 2010-02-17 青岛农业大学 一种网络流量预测和异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高波等: "基于EMD及ARMA的自相似网络流量预测", 《通信学报》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469795A (zh) * 2014-11-10 2015-03-25 上海交通大学 基于领域搜索的FARIMA模型Hurst参数估计方法
CN104469795B (zh) * 2014-11-10 2019-07-12 上海交通大学 基于领域搜索的FARIMA模型Hurst参数估计方法
CN108111353A (zh) * 2017-12-26 2018-06-01 深圳广联赛讯有限公司 预付卡剩余流量预测方法、网络终端和存储介质
CN108964969A (zh) * 2018-05-07 2018-12-07 中国铁路总公司 混合神经网络和ar模型的高速铁路信号系统流量预测方法
CN108964969B (zh) * 2018-05-07 2021-12-07 中国铁路总公司 混合神经网络和ar模型的高速铁路信号系统流量预测方法
CN109508788A (zh) * 2018-11-12 2019-03-22 电子科技大学 一种基于arma模型的sdn流量预测方法
CN110988817A (zh) * 2019-11-21 2020-04-10 河海大学 一种循环谱估计交叉项的抑制方法
CN112253406A (zh) * 2020-09-29 2021-01-22 中国电建集团华东勘测设计研究院有限公司 一种海上风电机组的环境荷载预测方法与振动预控制系统
CN113191003A (zh) * 2021-05-08 2021-07-30 上海核工程研究设计院有限公司 一种核电实时数据趋势拟合算法
CN113328815A (zh) * 2021-07-05 2021-08-31 重庆理工大学 一种消除映射误差的无线链路质量敏捷预测方法
CN115496627A (zh) * 2022-11-22 2022-12-20 国网天津市电力公司电力科学研究院 一种可调资源响应潜力的评估方法及系统

Similar Documents

Publication Publication Date Title
CN102891770A (zh) 一种利用短相关模型预测长相关序列的方法
Singh et al. Repeated wavelet transform based ARIMA model for very short-term wind speed forecasting
CN108462509B (zh) 基于时频图信息的异步跳频网台分选方法
Yang et al. Probabilistic short-term wind power forecast using componential sparse Bayesian learning
CN102546061B (zh) 基于小波变换的自适应时频空穴检测方法
CN104052701B (zh) 一种基于fpga实现的脉内调制特征实时提取与分类系统
CN101729315A (zh) 一种基于小波包分解和模糊神经网络的网络流量预测方法及装置
CN103746722A (zh) 一种跳频信号跳周期和起跳时间估计方法
CN105245503A (zh) 隐马尔可夫模型检测LDoS攻击方法
CN105160204A (zh) 一种碳排放价格组合预测方法
CN104459397A (zh) 采用自适应多分辨率广义s变换的电能质量扰动识别方法
CN112907970B (zh) 一种基于车辆排队长度变化率的可变车道转向控制方法
CN104459398A (zh) 一种采用二维形态学降噪的电能质量复合扰动识别方法
CN108507789A (zh) 基于平均随机弱正交匹配追踪的滚动轴承故障稀疏诊断方法
CN105354636A (zh) 一种基于非参数核密度估计的风功率波动性概率密度建模方法
CN102353952A (zh) 一种频域相干累加的线谱检测方法
CN106407944A (zh) 一种基于多模态回归分析的水电机组空蚀信号特征提取方法
CN104168131A (zh) 一种基于组播通信的电力调度交换网的流量生成方法
CN104573873A (zh) 一种基于模糊决策树的航站楼离港旅客流量预测方法
CN109067427A (zh) 一种基于优化型小波神经网络的跳频序列预测方法
CN101588191B (zh) 无线电信号认知方法及设备
CN105160077A (zh) 一种高压直流线路电晕电流变化趋势提取方法
CN105071388B (zh) 一种基于极大似然估计的配电网状态估计方法
CN105376105A (zh) 一种基于时间滑动窗口的互联网流量建模方法
Bekkerman et al. Heuristic approximation method for a random flow of events by an MC-flow with arbitrary number of states

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130123