CN109508788A - 一种基于arma模型的sdn流量预测方法 - Google Patents
一种基于arma模型的sdn流量预测方法 Download PDFInfo
- Publication number
- CN109508788A CN109508788A CN201811336349.7A CN201811336349A CN109508788A CN 109508788 A CN109508788 A CN 109508788A CN 201811336349 A CN201811336349 A CN 201811336349A CN 109508788 A CN109508788 A CN 109508788A
- Authority
- CN
- China
- Prior art keywords
- model
- arma
- data
- sequence
- sdn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/10—Interfaces, programming languages or software development kits, e.g. for simulating neural networks
- G06N3/105—Shells for specifying net layout
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
该发明公开了一种基于ARMA模型的SDN流量预测方法,属于无线通信网络技术领域,特别是涉及一种适用于网络的性能分析和网络规划方法。针对现有技术存在的缺点,本发明够准确预测SDN的流量变化趋势。该算法利用抽样从OpenFlow交换机中的计数器上获取仿真数据,对数据进行平稳化处理,利用平稳化后的数据训练ARMA模型,获得ARMA模型参数,包括自回归系数、滑动平均系数以及模型的阶数等。获得参数后建立ARMA预测模型,利用建立后的模型预测SDN流量变化趋势。
Description
技术领域
本发明属于无线通信网络技术领域,特别是涉及一种适用于网络的性能分析和网络规划方法。
背景技术
流量预测对于网络的性能分析和网络规划具有重要的意义。在传统的TCP/IP网络中,分布式的网络架构使得网络的灵活性和智能化不高,导致流量预测算法不能够很好的应用于工业中。软件定义网络(Software Defined Networks,SDN)作为一种新型的网络架构,具有控制平面与数据平面的解耦分离、开放的可编程接口以及逻辑集中式的控制等特征,使得SDN灵活性和智能化与传统网络相比有了较大地提高。因此,SDN的提出给流量预测算法的应用提供了一个很好的平台。而目前关于SDN的流量预测研究比较少,此外,由于SDN流量的动态变化和随机突发性,要进行准确预测是比较困难的。因此,提出准确且有效的SDN流量预测方法是非常重要的。
流量预测方法的研究是随着网络规模和网络应用的变化而不断变化的。其预测方法的发展经历了四个阶段:第一阶段,网络应用种类少,网络规模小,这一阶段主要是基于传统模型的流量预测研究。第二阶段,由于传统模型的局限性,即只具有短相关性,无法描述网络流量的长相关性。所以,提出了基于自相似模型的流量预测方法。第三阶段,网络规模的日益增大且自相似模型的参数计算过于复杂,导致自相似模型的预测性能下降,因此,提出了基于智能算法预测方法。第四阶段,随着网络规模的进一步扩大和网络应用种类的多样化,单一模型不能刻画流量的全部特性,提出了基于组合模型的流量预测方法。
上世纪70年代,由于网络应用很少,网络中传输的数据量少,研究人员利用泊松模型,马尔科夫模型等传统模型来描述网络流量。这些模型认为,若时间间隔s是足够大的,当前时刻t的流量与过去时刻(t-s)的流量是不相关的,即短期相关模型。后来,网络的自相似特性被发现后,各种基于自相似性的流量模型不断地提出。例如,分形布朗运动模型、基于重尾分布的ON/OFF模型、小波模型、FARIMA(Fractal Auto Regressive IntegratedMoving Average) 模型等都是自相似模型。紧接着,由于智能算法具有良好的非线性映射能力和快速有效的学习方法,因此在预测领域显示出巨大的优势。例如,小波分析模糊理论、人工神经网络和支持向量机方法等,已经广泛应用于生活中的各种预测领域,如通信、交通、气象、水文等。
随着SDN的兴起,研究人员将研究重点从传统网络转移到SDN。因此,基于SDN的流量预测研究也受到了研究人员的广泛关注。在传统的TCP/IP网络中,分布式的网络架构使得网络的灵活性和智能化不高,导致流量预测不能够很好的应用。在SDN中,将控制层分离出来做成控制器,实现对数据层的集中控制。因此,流量预测算法的部署和应用在SDN中得到了很好的应用。
发明内容
针对现有技术存在的缺点,本发明提出一种基于自回归滑动平均(Auto-Regressive and Moving Average Model,ARMA)模型的SDN流量预测算法,它能够准确预测SDN的流量变化趋势。该算法利用抽样从OpenFlow交换机中的计数器上获取仿真数据,对数据进行平稳化处理,利用平稳化后的数据训练ARMA模型,获得ARMA模型参数,包括自回归系数、滑动平均系数以及模型的阶数等。获得参数后建立ARMA预测模型,利用建立后的模型预测SDN流量变化趋势。
本发明技术方案为:一种基于ARMA模型的SDN流量预测方法,具体步骤如下:
步骤1:平稳性检验;
对原流量序列进行平稳性检验,如果该流量序列不满足平稳性条件,可以通过差分变换使该流量序列满足平稳性条件;
步骤2:求模型的阶数;
根据AIC准则来确定ARMA(p,q)模型的阶数p和q,p和q分别表示ARMA(p,q)的p个自回归项和q个移动平均项;
步骤3:求模型的参数;
采用逆函数法求出ARMA(p,q)模型的参数(φ1,...φp)和(θ1,...θq),φu表示ARMA(p,q)模型的自回归项系数,其中u=1,2,...,p,θv ARMA(p,q)模型的移动平均项系数,其中v=1,2,...,q,并检验参数的显著性,以及模型的合理性;并利用诊断分析,确保所得模型与所观察到的数据特征相符合;
步骤4:利用ARMA模型进行流量预测;
根据步骤3中求出的ARMA(p,q)模型的参数(θ1,...θq)和(φ1,...φp),建立具体的ARMA模型,根据所建立的ARMA模型,输入当前时刻及以前时刻的SDN网络流量数据,可获得下一时刻SDN 网络流量的预测值。
进一步的,所述步骤1平稳性检验,具体过程如下:
如果模型的原流量序列是非平稳时间序列,要对原流量序列进行平稳化处理;SDN流量是非平稳的时间序列;为了将其平稳化,利用多次差分的方法把原流量序列转化成齐次非平稳的序列;经过差分后,新序列的非平稳性得到了抑制,所得到新序列的幅度发生了变化;差分的次数被称为齐次的阶;
记▽为差分算子,则
▽xt=xt-xt-1 (1)
▽2xt=▽(xt-xt-1)=xt-2xt-1+xt-2 (2)
可以推算出
▽k=(1-B)dxt (3)
若xt是t时刻的d阶齐次非平稳序列,则经过d次差分后产生的新序列为:
yt=(1-B)dxt (4)
是一个平稳序列;
yt为由xt经过d次差分后产生的平稳序列,B为后移算子;
如果序列呈现明显的线性趋势,一阶差分就可以实现趋势平稳;序列显示曲线趋势,要增加差分的阶数提取曲线趋势的影响,通常使用二阶差分或三阶差分;差分处理使非平稳的数据序列转化成均值为0的平稳随机序列。
进一步的,所述步骤2求模型阶数,具体过程如下:
模型的定阶采用AIC准则,AIC函数定义为:
其中,是ε(t)方差的估算值,ε(t)表示ARMA(p,q)模型t时刻的估计误差;s是模型未知参数的总数,即s=p+q+1;N为已知观测数据样本大小;ARMA模型的AIC函数为:
利用AIC准则来定阶是指在p、q的一定变化范围内寻求使得统计量AIC(s)达到最小的点用来作为(p,q)的估计;模型阶数确定以后,采用逆函数法估计各参数的值;
进一步的,所述步骤3求模型的参数,具体过程如下:首先引入后移算子B;
即Bx(t)=x(t-1),Bkx(t)=x(t-k),x(t)表示t时刻的时间序列值,
即Bx(t)=x(t-1),Bkx(t)=x(t-k),x(t)表示t时刻的时间序列值,
将式子简化为:
(1-φ1B-...-φpBp)X(t)=(1-θ1B-...-θqBq)ε(t) (7)
利用逆函数,将ε(t)表示成{x(t-k),k=0,1,2,...}的线性组合,表达式为:
Ij表示自回归模型中j个时延后时刻t-j的时间序列系数,并将上式(8)代入式(7)可得B的恒等式为:
1-φ1B-…-φpBp=(1-I1B-I2B2-...)(1-θ1B-...-θqBq) (9)
根据对应项系数相等原则,可得:
其中,θj=0,j>q,φj=0,j>p,当j>max(p,q)时有:
Ij-θ1Ij-1-...-θqIj-q=0 (11)
如果已知Ij的估计值,则可由式(11)求出参数(θ1,...,θq)的估计值,再由式(10)求出参数(φ1,...,φp)的估计值;
求Ij的估计值,可设为网络流量数据样本的自相关函数,为Ij的估计值j=1,2,...,p,可根据式(11)计算的值:
计算出后,则可应用式(13)估计ε(t)的方差,其中,是j个时延后网络流量数据样本的自协方差函数;
并利用诊断分析,确保所得模型与所观察到的数据特征相符合;至此,ARMA模型各参数均已确定,建模完成。
进一步的,所述步骤4利用ARMA模型进行流量预测的具体方法为:
根据步骤3中求出的ARMA(p,q)模型的参数(θ1,...θq)和(φ1,...φp),建立具体的ARMA模型,根据所建立的ARMA模型,输入当前时刻及以前时刻的SDN网络流量数据,可获得下一时刻SDN 网络流量的预测值。
诊断分析,具体过程如下:
分析真实数据的预测值和抽样数据的预测值,并对各抽样间隔下的仿真结果进行对比分析。图3、4和5为分别为真实数据的预测值和抽样数据的预测值对比图(抽样间隔1min、5min、 10min)。从图3、4和5可以看出,抽样数据的预测值能够很好地逼近真实数据的流量变化趋势。但随着抽样间隔的粗化,它们之间的逼近程度越来越差,稳定性也变差。这表明,在一定的抽样间隔下,可以利用抽样数据的预测值来代替真实数据的预测值,即可以利用抽样数据的预测值来预测真实网络流量变化趋势,从而能够达到以较小的网络测量开销来预测流量变化趋势。
预测分析,具体过程如下:
分析真实数据与预测值,抽样数据与预测值的相对误差。图6为流量预测的相对误差。在这里,分别计算获得相对误差的平均值:当抽样间隔为1min时,真实数据与预测值相对误差的平均值为0.2454,抽样数据与预测值的相对误差的平均值为0.2577;当抽样间隔为5min 时,真实数据与预测值相对误差的平均值为0.3385,抽样数据与预测值的相对误差的平均值为0.3458;当抽样间隔为10min时,真实数据与预测值相对误差的平均值为0.5122,抽样数据与预测值的相对误差的平均值为0.5360。通过计算可知,随着抽样间隔的增大,相对误差也会随之增大,流量预测的效果也会下降。
分析结果,具体过程如下:
引入累积分布函数来更直观地描述相对误差。图7为相对误差的累积分布函数。图7表明, 1min的相对误差累积曲线在5min和10min的上面,这进一步表明抽样间隔为1min,相对误差是最小的。当相对误差为0.4时,真实数据与预测值相对误差(1min)的累积分布函数值为0.9,抽样数据与预测值相对误差(1min)的累计分布函数值为0.9,真实数据与预测值相对误差(5min)的累积分布函数值为0.7,抽样数据与预测值相对误差(5min)的累计分布函数值为0.7,真实数据与预测值相对误差(10min)的累积分布函数值为0.53,抽样数据与预测值相对误差(10min)的累积分布函数值为0.47。这说明,当相对误差为0.4时,该算法能对 90%的真实数据和抽样数据(1min)进行准确预测;当抽样误差为0.4时,该算法能对70%的真实数据和抽样数据(5min)进行准确预测;当相对误差为0.4时,该算法能对53%的真实数据(10min)进行准确预测,同时能对49%抽样数据(10min)进行准确预测。这表明,抽样间隔越小,该算法具有更高的预测精度。
本发明的有益效果:
本发明提出一种基于自回归滑动平均(Auto-Regressive and Moving AverageModel,ARMA) 模型的SDN流量预测算法。
流量预测对于网络的性能分析和网络规划具有重要的意义。在传统的TCP/IP网络中,分布式的网络架构使得网络的灵活性和智能化不高,导致流量预测算法不能够很好的应用于工业中。软件定义网络(Software Defined Networking,SDN)作为一种新型的网络架构,具有控制平面与数据平面的解耦分离、开放的可编程接口以及逻辑集中式的控制等特征,使得SDN 灵活性和智能化与传统网络相比有了较大地提高。因此,SDN的提出给流量预测算法的应用提供了一个很好的平台。
针对现有技术存在的缺点,本发明提出一种基于自回归滑动平均(Auto-Regressive and Moving Average Model,ARMA)模型的SDN流量预测算法,它能够准确预测SDN的流量变化趋势。该算法利用抽样从OpenFlow交换机中的计数器上获取仿真数据,对数据进行平稳化处理,利用平稳化后的数据训练ARMA模型,获得ARMA模型参数,包括自回归系数、滑动平均系数以及模型的阶数等。获得参数后建立ARMA预测模型,利用建立后的模型预测SDN流量变化趋势。
附图说明
图1为本发明的流量预测基本原理图;
图2为本发明基于ARMA模型的流量建模算法流程图;
图3为本发明流量预测的真实数据的预测值和抽样数据的预测值对比(1min);
图4为本发明流量预测的真实数据的预测值和抽样数据的预测值对比(5min);
图5为本发明流量预测的真实数据的预测值和抽样数据的预测值对比(10min);
图6为本发明流量预测的相对误差(1min、5min、10min);
图7为本发明流量预测的等时间间隔抽样预测误差的累积分布函数;
图8为本发明流量预测的等时间间隔抽样数据对比;
图9为本发明流量预测的等时间间隔抽样的相对误差;
图10为本发明流量预测的真实数据与抽样数据预测对比(1min);
图11为本发明流量预测的真实数据与抽样数据预测对比(5min)。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明:
步骤1所述的平稳性检验,具体过程如下:
如果模型的输入数据是非平稳时间序列,要对输入数据进行平稳化处理。SDN流量是非平稳的时间序列。为了将其平稳化,这里我们利用多次差分的方法把网络流量转化成齐次非平稳的序列。经过差分后,新序列的非平稳性得到了抑制,所得到新序列的幅度发生了变化。差分的次数被称为齐次的阶。
记▽为差分算子,则
▽xt=xt-xt-1 (1)
▽2xt=▽(xt-xt-1)=xt-2xt-1+xt-2 (2)
可以推算出
▽k=(1-B)dxt (3)
若xt是一个d阶齐次非平稳序列,则经过d次差分后产生的新序列为:
yt=(1-B)dxt (4)
是一个平稳序列。
如果序列呈现明显的线性趋势,一阶差分就可以实现趋势平稳;序列显示曲线趋势,要增加差分的阶数提取曲线趋势的影响,通常使用二阶差分或三阶差分。差分处理使非平稳的数据序列转化成均值为0的平稳随机序列。
步骤2所述的求模型阶数,具体过程如下:
模型的定阶采用AIC准则。AIC准则是H.Akaike给出的一个ARMA模型定阶方法。定义AIC 函数为:
其中,是ε(t)方差的估算值;s是模型未知参数的总数,是ε(t)的方差p、q这三者之间的数量之和,即s=p+q+1;N为已知观测数据样本大小。ARMA模型的AIC函数为:
利用AIC准则来定阶是指在p、q的一定变化范围内寻求使得统计量AIC(s)达到最小的点用来作为(p,q)的估计。模型阶数确定以后,我们采用逆函数法估计各参数的值。下面是逆函数法对ARMA(p,q)模型的参数估计步骤。
步骤3所述的求模型的参数,具体过程如下:
首先引入后移算子B,即Bx(t)=x(t-1),Bkx(t)=x(t-k),那么式子就会简化为:
(1-φ1B-...-φpBp)X(t)=(1-θ1B-...-θqBq)ε(t) (7)
接下来,利用逆函数,将ε(t)表示成{x(t-k),k=0,1,2,...}的线性组合,表达式为:
并将上式(8)代入式(7)可得B的恒等式为:
1-φ1B-...-φpBp=(1-I1B-I2B2-...)(1-θ1B-...-θqBq) (9)
根据对应项系数相等原则,可得:
其中,θj=0,j>q;φj=0,j>p。当j>max(p,q)时有:
Ij-θ1Ij-1-...-θqIj-q=0 (11)
如果已知Ij的估计值,则可由式(11)求出参数(θ1,…,θq)的估计值,再由式(10)求出参数(φ1,…,φp)的估计值。
为求Ij的估计值,可设为网络流量数据样本的自相关函数,为参数Ij的估计值(j=1,2,…,p),可根据式(11)计算的值:
计算出后,则可应用式(13)估计ε(t)的方差,其中,是网络流量数据样本的自协方差函数(j=1,2,…,p)。
至此,ARMA模型各参数均已确定,建模完成。
步骤4所述的诊断分析,具体过程如下:
分析真实数据的预测值和抽样数据的预测值,并对各抽样间隔下的仿真结果进行对比分析。图3、4和5为分别为真实数据的预测值和抽样数据的预测值对比图(抽样间隔1min、5min、 10min)。从图3、4和5可以看出,抽样数据的预测值能够很好地逼近真实数据的流量变化趋势。但随着抽样间隔的粗化,它们之间的逼近程度越来越差,稳定性也变差。这表明,在一定的抽样间隔下,可以利用抽样数据的预测值来代替真实数据的预测值,即可以利用抽样数据的预测值来预测真实网络流量变化趋势,从而能够达到以较小的网络测量开销来预测流量变化趋势。
步骤5所述的预测分析,具体过程如下:
分析真实数据与预测值,抽样数据与预测值的相对误差。图6为流量预测的相对误差。在这里,我们分别计算获得相对误差的平均值:当抽样间隔为1min时,真实数据与预测值相对误差的平均值为0.2454,抽样数据与预测值的相对误差的平均值为0.2577;当抽样间隔为5min 时,真实数据与预测值相对误差的平均值为0.3385,抽样数据与预测值的相对误差的平均值为0.3458;当抽样间隔为10min时,真实数据与预测值相对误差的平均值为0.5122,抽样数据与预测值的相对误差的平均值为0.5360。通过计算可知,随着抽样间隔的增大,相对误差也会随之增大,流量预测的效果也会下降。
步骤6所述的分析结果,具体过程如下:
引入累积分布函数来更直观地描述相对误差。图7为相对误差的累积分布函数。图7表明,1min的相对误差累积曲线在5min和10min的上面,这进一步表明抽样间隔为1min,相对误差是最小的。当相对误差为0.4时,真实数据与预测值相对误差(1min)的累积分布函数值为 0.9,抽样数据与预测值相对误差(1min)的累计分布函数值为0.9,真实数据与预测值相对误差(5min)的累积分布函数值为0.7,抽样数据与预测值相对误差(5min)的累计分布函数值为0.7,真实数据与预测值相对误差(10min)的累积分布函数值为0.53,抽样数据与预测值相对误差(10min)的累积分布函数值为0.47。这说明,当相对误差为0.4时,该算法能对 90%的真实数据和抽样数据(1min)进行准确预测;当抽样误差为0.4时,该算法能对70%的真实数据和抽样数据(5min)进行准确预测;当相对误差为0.4时,该算法能对53%的真实数据(10min)进行准确预测,同时能对49%抽样数据(10min)进行准确预测。这表明,抽样间隔越小,该算法具有更高的预测精度。
实施例
要进行流量预测,首先采集仿真所需要的流统计信息。根据对OpenFlow的介绍可知,利用控制器发送OpenFlow消息,来查询OpenFlow交换机中流表项中计数器存储的信息,可以获取流的统计信息。计数器记载着属于这条流的报文已经收到了多少个,以及其它统计数据(比如收发分组数、收发字节数和查找次数等)。
本发明研究的是对网络中一条网络流进行建模与分析,因此我们要先选择出这条流,为这条流建立新的流表项,然后进行实时的测量。这里提到的实时测量就是针对于这条流在计数器上的统计信息进行采集。基于ARMA模型的流量建模算法流程图如图1所示,具体步骤如下:
步骤1:获得仿真所需的流量数据,即1min抽样数据、1min真实数据、5min抽样数据、5min真实数据、10min抽样数据以及10min真实数据。图8分别为1min、5min和10min 的抽样数据与对应真实数据的对比。图9为不同抽样间隔下的抽样数据与真实数据的相对误差。通过计算可知,当抽样间隔为1min时,真实样本与抽样样本之间的平均相对误差为0.0483;当抽样间隔为5min时,真实样本与抽样样本之间的平均相对误差为0.0822;当抽样间隔为10min时,真实样本与抽样样本之间的平均相对误差为0.1502。因此,随着抽样间隔的增大,抽样数据与真实数据的相对误差也会增大。
步骤2:分析抽样数据和真实数据的预测结果,并对各抽样间隔下的仿真结果进行对比分析。图10为真实数据与抽样数据的预测对比图(抽样间隔1min)。图11为真实数据与抽样数据的预测对比图(抽样间隔5min)。从图10、11可以看出,真实数据和抽样数据的预测值都能够准确地预测出真实数据和抽样数据的变化趋势,预测效果也是非常好的。但是,随着抽样间隔的粗化,预测效果变得越来越差,而且预测结果会变得不稳定。这说明抽样间隔越小,ARMA更能够准确地预测网络流量变化,预测结果的稳定性也会越高。后面我们会通过相对误差和相对误差的累积分布图来定量分析各抽样间隔下该算法的预测误差,从而对比分析其预测性能。
步骤3:分析真实数据的预测值和抽样数据的预测值,并对各抽样间隔下的仿真结果进行对比分析。图3、4和5为分别为真实数据的预测值和抽样数据的预测值对比图(抽样间隔1min、5min、10min)。从图3、4和5可以看出,抽样数据的预测值能够很好地逼近真实数据的流量变化趋势。但随着抽样间隔的粗化,它们之间的逼近程度越来越差,稳定性也变差。这表明,在一定的抽样间隔下,可以利用抽样数据的预测值来代替真实数据的预测值,即可以利用抽样数据的预测值来预测真实网络流量变化趋势,从而能够达到以较小的网络测量开销来预测流量变化趋势。但抽样间隔超过一定的阈值,它们之间的逼近关系减弱,因此,抽样数据的预测值不能够预测网络流量的变化趋势。
步骤4:分析真实数据与预测值,抽样数据与预测值的相对误差。图6为流量预测的相对误差。在这里,我们分别计算获得相对误差的平均值:当抽样间隔为1min时,真实数据与预测值相对误差的平均值为0.2454,抽样数据与预测值的相对误差的平均值为 0.2577;当抽样间隔为5min时,真实数据与预测值相对误差的平均值为0.3385,抽样数据与预测值的相对误差的平均值为0.3458;当抽样间隔为10min时,真实数据与预测值相对误差的平均值为0.5122,抽样数据与预测值的相对误差的平均值为0.5360。通过计算可知,随着抽样间隔的增大,相对误差也会随之增大,流量预测的效果也会下降。
步骤5:引入累积分布函数来更直观地描述相对误差。图7为相对误差的累积分布函数。图7表明,1min的相对误差累积曲线在5min和10min的上面,这进一步表明抽样间隔为1min,相对误差是最小的。当相对误差为0.4时,真实数据与预测值相对误差(1min) 的累积分布函数值为0.9,抽样数据与预测值相对误差(1min)的累计分布函数值为0.9,真实数据与预测值相对误差(5min)的累积分布函数值为0.7,抽样数据与预测值相对误差(5min)的累计分布函数值为0.7,真实数据与预测值相对误差(10min)的累积分布函数值为0.53,抽样数据与预测值相对误差(10min)的累积分布函数值为0.47。这说明,当相对误差为0.4时,该算法能对90%的真实数据和抽样数据(1min)进行准确预测;当抽样误差为0.4时,该算法能对70%的真实数据和抽样数据(5min)进行准确预测;当相对误差为0.4时,该算法能对53%的真实数据(10min)进行准确预测,同时能对49%抽样数据(10min)进行准确预测。这表明,抽样间隔越小,该算法具有更高的预测精度。
流量预测对于网络的性能分析和网络规划具有重要的意义。SDN的提出给流量预测算法的应用提供了一个很好的平台。本发明在SDN中分别利用等间隔抽样算法从SDN获取仿真数据。然后利用仿真数据建立ARMA预测模型,并提出了基于ARMA模型的SDN流量预测算法。通过对仿真结果的分析,ARMA模型能够较为准确的预测网络流量行为趋势。抽样间隔越小,流量预测效果越好,预测精度越高,算法的稳定性也越高。
Claims (5)
1.一种基于ARMA模型的SDN流量预测方法,具体步骤如下:
步骤1:平稳性检验;
对原流量序列进行平稳性检验,如果该流量序列不满足平稳性条件,可以通过差分变换使该流量序列满足平稳性条件;
步骤2:求模型的阶数;
根据AIC准则来确定ARMA(p,q)模型的阶数p和q,p和q分别表示ARMA(p,q)的p个自回归项和q个移动平均项;
步骤3:求模型的参数;
采用逆函数法求出ARMA(p,q)模型的参数(φ1,...φp)和(θ1,...θq),φu表示ARMA(p,q)模型的自回归项系数,其中u=1,2,...,p,θvARMA(p,q)模型的移动平均项系数,其中v=1,2,...,q,并检验参数的显著性,以及模型的合理性;并利用诊断分析,确保所得模型与所观察到的数据特征相符合;
步骤4:利用ARMA模型进行流量预测;
根据步骤3中求出的ARMA(p,q)模型的参数(θ1,...θq)和(φ1,...φp),建立具体的ARMA模型,根据所建立的ARMA模型,输入当前时刻及以前时刻的SDN网络流量数据,可获得下一时刻SDN网络流量的预测值。
2.如权利要求1所述的一种基于ARMA模型的SDN流量预测方法,其特征在于所述步骤1平稳性检验,具体过程如下:
如果模型的原流量序列是非平稳时间序列,要对原流量序列进行平稳化处理;SDN流量是非平稳的时间序列;为了将其平稳化,利用多次差分的方法把原流量序列转化成齐次非平稳的序列;经过差分后,新序列的非平稳性得到了抑制,所得到新序列的幅度发生了变化;差分的次数被称为齐次的阶;
记▽为差分算子,则
▽xt=xt-xt-1 (1)
▽2xt=▽(xt-xt-1)=xt-2xt-1+xt-2 (2)
可以推算出
▽k=(1-B)dxt (3)
若xt是t时刻的d阶齐次非平稳序列,则经过d次差分后产生的新序列为:
yt=(1-B)dxt (4)
是一个平稳序列;
yt为由xt经过d次差分后产生的平稳序列,B为后移算子;
如果序列呈现明显的线性趋势,一阶差分就可以实现趋势平稳;序列显示曲线趋势,要增加差分的阶数提取曲线趋势的影响,通常使用二阶差分或三阶差分;差分处理使非平稳的数据序列转化成均值为0的平稳随机序列。
3.如权利要求1所述的一种基于ARMA模型的SDN流量预测方法,其特征在于所述所述步骤2求模型阶数,具体过程如下:
模型的定阶采用AIC准则,AIC函数定义为:
其中,是ε(t)方差的估算值,ε(t)表示ARMA(p,q)模型t时刻的估计误差;s是模型未知参数的总数,即s=p+q+1;N为已知观测数据样本大小;ARMA模型的AIC函数为:
利用AIC准则来定阶是指在p、q的一定变化范围内寻求使得统计量AIC(s)达到最小的点用来作为(p,q)的估计;模型阶数确定以后,采用逆函数法估计各参数的值。
4.如权利要求1所述的一种基于ARMA模型的SDN流量预测方法,其特征在于所述所述步骤3求模型的参数,具体过程如下:
首先引入后移算子B;
即Bx(t)=x(t-1),Bkx(t)=x(t-k),x(t)表示t时刻的时间序列值,将式子简化为:
(1-φ1B-...-φpBp)X(t)=(1-θ1B-...-θqBq)ε(t) (7)
利用逆函数,将ε(t)表示成{x(t-k),k=0,1,2,...}的线性组合,表达式为:
Ij表示自回归模型中j个时延后时刻t-j的时间序列系数,并将上式(8)代入式(7)可得B的恒等式为:
1-φ1B-...-φpBp=(1-I1B-I2B2-...)(1-θ1B-...-θqBq) (9)
根据对应项系数相等原则,可得:
其中,θj=0,j>q,φj=0,j>p,当j>max(p,q)时有:
Ij-θ1Ij-1-...-θqIj-q=0 (11)
如果已知Ij的估计值,则可由式(11)求出参数(θ1,...,θq)的估计值,再由式(10)求出参数(φ1,...,φp)的估计值;
求Ij的估计值,可设为网络流量数据样本的自相关函数,为Ij的估计值j=1,2,...,p,可根据式(11)计算的值:
计算出后,则可应用式(13)估计ε(t)的方差,其中,是j个时延后网络流量数据样本的自协方差函数;
并利用诊断分析,确保所得模型与所观察到的数据特征相符合;至此,ARMA模型各参数均已确定,建模完成。
5.如权利要求1所述的一种基于ARMA模型的SDN流量预测方法,其特征在于所述所述步骤4利用ARMA模型进行流量预测的具体方法为:
根据步骤3中求出的ARMA(p,q)模型的参数(θ1,...θq)和(φ1,...φp),建立具体的ARMA模型,根据所建立的ARMA模型,输入当前时刻及以前时刻的SDN网络流量数据,可获得下一时刻SDN网络流量的预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811336349.7A CN109508788A (zh) | 2018-11-12 | 2018-11-12 | 一种基于arma模型的sdn流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811336349.7A CN109508788A (zh) | 2018-11-12 | 2018-11-12 | 一种基于arma模型的sdn流量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109508788A true CN109508788A (zh) | 2019-03-22 |
Family
ID=65748117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811336349.7A Pending CN109508788A (zh) | 2018-11-12 | 2018-11-12 | 一种基于arma模型的sdn流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109508788A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110460622A (zh) * | 2019-09-12 | 2019-11-15 | 贵州电网有限责任公司 | 一种基于态势感知预测方法的网络异常检测方法 |
CN110505154A (zh) * | 2019-07-26 | 2019-11-26 | 北京工业大学 | 一种基于改进的迪杰斯特拉算法的交换机迁移方法 |
CN110837915A (zh) * | 2019-09-29 | 2020-02-25 | 浙江大学 | 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法 |
CN115051940A (zh) * | 2022-05-26 | 2022-09-13 | 电子科技大学 | 一种基于bloom滤波器的IPv6网络流测量方法 |
CN115442246A (zh) * | 2022-08-31 | 2022-12-06 | 武汉烽火技术服务有限公司 | 数据平面网络的流量预测方法、装置、设备及存储介质 |
CN117909935A (zh) * | 2024-01-25 | 2024-04-19 | 上海环境集团再生能源运营管理有限公司 | 一种餐厨垃圾液态高温发酵稳定化处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102891770A (zh) * | 2012-10-22 | 2013-01-23 | 哈尔滨工业大学深圳研究生院 | 一种利用短相关模型预测长相关序列的方法 |
CN106713055A (zh) * | 2017-02-27 | 2017-05-24 | 电子科技大学 | 一种虚拟cdn的节能部署方法 |
US20180077590A1 (en) * | 2016-09-12 | 2018-03-15 | Alcatel-Lucent | System and method for programmable native analytics in 5g mobile networks |
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN108600038A (zh) * | 2018-03-05 | 2018-09-28 | 华东师范大学 | 基于arima的自适应低代价sdn业务流吞吐量测量方法及系统 |
-
2018
- 2018-11-12 CN CN201811336349.7A patent/CN109508788A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102891770A (zh) * | 2012-10-22 | 2013-01-23 | 哈尔滨工业大学深圳研究生院 | 一种利用短相关模型预测长相关序列的方法 |
US20180077590A1 (en) * | 2016-09-12 | 2018-03-15 | Alcatel-Lucent | System and method for programmable native analytics in 5g mobile networks |
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN106713055A (zh) * | 2017-02-27 | 2017-05-24 | 电子科技大学 | 一种虚拟cdn的节能部署方法 |
CN108600038A (zh) * | 2018-03-05 | 2018-09-28 | 华东师范大学 | 基于arima的自适应低代价sdn业务流吞吐量测量方法及系统 |
Non-Patent Citations (3)
Title |
---|
MARIA LIBUNAO ET.AL: "Autonomic link management in wireless backhaul networks with OpenFlow and traffic prediction", 《2017 IEEE/CIC INTERNATIONAL CONFERENCE ON COMMUNICATIONS IN CHINA (ICCC)》 * |
YUQING WANG ET.AL: "A New Traffic Prediction Algorithm to Software Defined Networking", 《MOBILE NETWORKS AND APPLICATIONS》 * |
安潇潇: "ARMA相关模型及其应用", 《中国优秀硕士学位论文全文数据库 基础科技辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110505154A (zh) * | 2019-07-26 | 2019-11-26 | 北京工业大学 | 一种基于改进的迪杰斯特拉算法的交换机迁移方法 |
CN110460622A (zh) * | 2019-09-12 | 2019-11-15 | 贵州电网有限责任公司 | 一种基于态势感知预测方法的网络异常检测方法 |
CN110460622B (zh) * | 2019-09-12 | 2021-11-16 | 贵州电网有限责任公司 | 一种基于态势感知预测方法的网络异常检测方法 |
CN110837915A (zh) * | 2019-09-29 | 2020-02-25 | 浙江大学 | 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法 |
CN110837915B (zh) * | 2019-09-29 | 2022-06-17 | 浙江大学 | 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法 |
CN115051940A (zh) * | 2022-05-26 | 2022-09-13 | 电子科技大学 | 一种基于bloom滤波器的IPv6网络流测量方法 |
CN115051940B (zh) * | 2022-05-26 | 2023-05-30 | 电子科技大学 | 一种基于bloom滤波器的IPv6网络流测量方法 |
CN115442246A (zh) * | 2022-08-31 | 2022-12-06 | 武汉烽火技术服务有限公司 | 数据平面网络的流量预测方法、装置、设备及存储介质 |
CN115442246B (zh) * | 2022-08-31 | 2023-09-26 | 武汉烽火技术服务有限公司 | 数据平面网络的流量预测方法、装置、设备及存储介质 |
CN117909935A (zh) * | 2024-01-25 | 2024-04-19 | 上海环境集团再生能源运营管理有限公司 | 一种餐厨垃圾液态高温发酵稳定化处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508788A (zh) | 一种基于arma模型的sdn流量预测方法 | |
Willems | A spatial rainfall generator for small spatial scales | |
Attarzadeh et al. | Proposing a new software cost estimation model based on artificial neural networks | |
CN103840988A (zh) | 一种基于rbf神经网络的网络流量测量方法 | |
CN109325638A (zh) | 一种基于rbf神经网络的sdn流量预测方法 | |
Nunnari et al. | Forecasting monthly sales retail time series: a case study | |
CN104699894A (zh) | 基于实时学习的高斯过程回归多模型融合建模方法 | |
CN113366473A (zh) | 用于自动选择用于数据流时间序列预测的模型的方法和系统 | |
CN104468567B (zh) | 一种网络多媒体业务流识别和映射的系统及方法 | |
JP6397380B2 (ja) | 時空間変数予測装置及びプログラム | |
Prajam et al. | Applying machine learning approaches for network traffic forecasting | |
Butler et al. | The effects of variable stationarity in a financial time-series on artificial neural networks | |
Domańska et al. | A few investigations of long-range dependence in network traffic | |
Rahman et al. | Time series QoS forecasting for management of cloud services | |
CN111667694B (zh) | 一种基于改进dtw-knn的短时交通流预测方法 | |
Bektemyssova et al. | Time series forecasting by the arima method | |
Abdulhakim et al. | Prediction of flow flooding in Changhua river based on time series models | |
CN108764583A (zh) | 森林蓄积量的无偏预估方法 | |
An et al. | A study based on self-similar network traffic model | |
Owda et al. | Using artificial neural network techniques for prediction of electric energy consumption | |
Yang et al. | Predicting Internet end-to-end delay: A statistical study | |
CN112667763A (zh) | 一种基于自适应时间戳与多尺度特征提取的轨迹预测方法 | |
CN111327494A (zh) | 一种多域sdn网络流量态势评估方法及系统 | |
Kumar et al. | A simplified approach for rainfall-runoff modeling using advanced soft-computing methods | |
Borrajo et al. | Bootstrapping kernel intensity estimation for nonhomogeneous point processes depending on spatial covariates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190322 |
|
RJ01 | Rejection of invention patent application after publication |