CN103748993B - 一种基于多序列组合的主机负载预测方法 - Google Patents

一种基于多序列组合的主机负载预测方法

Info

Publication number
CN103748993B
CN103748993B CN200910121385.6A CN200910121385A CN103748993B CN 103748993 B CN103748993 B CN 103748993B CN 200910121385 A CN200910121385 A CN 200910121385A CN 103748993 B CN103748993 B CN 103748993B
Authority
CN
China
Prior art keywords
prediction
model
frequency signal
load
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910121385.6A
Other languages
English (en)
Inventor
胡昌振
姚淑萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Application granted granted Critical
Publication of CN103748993B publication Critical patent/CN103748993B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种基于多序列组合的主机负载预测方法,属于计算机应用技 术领域。本发明从非线性、非平稳信息处理角度出发,通过构造多条序列,并 利用各序列与负载相关的多种数据关系,将小波-AR-SVR-MA模型和AR模型 组合来预测主机负载,以提高主机负载预测精度。该方法适合于对重点时段或 重点时刻点的主机负载预测。

Description

一种基于多序列组合的主机负载预测方法
技术领域
本发明涉及一种基于多序列组合的主机负载预测方法,属于计算机应用技术领域。
背景技术
通常,在分布式网络环境中,负载预测分为基于网络的负载预测(网络负载预测)和基于主机的负载预测(主机负载预测)。网络负载预测的研究对象是特定网络的负载,通常将网络流量视作负载指标进行预测。主机负载预测关心的则是特定主机的负载量,早期提出的指标主要包括CPU性能指标、磁盘及内存可用空间以及进程响应时间等。随着网络技术的发展,当网络中的主机主要是提供网络服务时,该主机的网络流量成为衡量其负载的重要指标。
主机负载预测目前主要用于实现分布式/并行环境中的动态负载均衡。与传统的负载均衡算法相比,基于预测的负载均衡算法能够预先了解结点的负载变化,使平衡系统在进行任务分配时有参照量,避免因信息传递时延而造成任务在结点间来回迁移却得不到执行的情况,减少了任务再分配的发生,使负载均衡的性能得到较大提高。主机负载预测还可以应用到信息安全领域中的主机入侵检测系统,实现基于预测的主机负载异常检测,有效提高检测率。
显然,在以上应用中,主机负载预测精度的高低决定了应用效果。对于动态负载均衡来说,主机负载预测精度越高,平衡系统对工作任务在各计算机结点之间的分配准确度越高,任务因分配不均衡而引发再次分配的情况发生的可能性就越低,从而有效提高工作任务的完成效率。对于主机负载异常检测来说,主机负载预测精度越高,异常检测系统对于主机负载在某时刻是否出现异常的判断就更为准确和及时,从而能够更早的给安全管理人员发出异常报警,使拒绝服务等造成主机负载异常的网络攻击的发生在攻击早期就得以有效控制,将安全事件消灭在萌芽状态,避免网络攻击给网络用户造成损失。通常,主机负载预测的均方误差的值每降低1,就能将发现负载异常的时间提前1秒左右,这一时间提前量对于防范电子空间的攻击是极其宝贵的。因此如何提高主机负载预测精度成为以上两个应用领域中的核心研究问题。
根据预测时所使用的序列的个数,可以将现有主机负载预测分为单一序列预测和多序列组合预测。
关于单一序列预测,Dinda P.等人的文献《Host Load Prediction Using LinearModels》(Cluster Computer.2000,3(4):265-280)研究了如何采用线性模型进行主机负载预测,并特别验证了使用AR模型进行主机负载预测可以取得较好的精度。姚淑萍等人的文献《基于非平稳序列的主机负载预测及合成技术研究》(北京理工大学学报.2007,27(1):42-45)构建了基于小波和支持向量回归的负载预测及合成模型。该方法将主机负载序列进行多层小波分解与单支重构;低频信号采用AR模型预测,最小尺度高频信号采用加权移动平均方法预测,其它分支采用支持向量回归(SVR)预测;各信号预测值基于SVR方法加以合成,获得最终预测值。该文献通过理论分析和实验表明,将小波与支持向量回归应用于负载预测效果明显好于AR等线性方法。实现原理如图1所示。
其中,为原始序列,是预测时刻t之前N个负载值按时间顺序的排列,表示为 H ( t ) = { h k } k = 1 N .
考虑一步预测,即求hN+1的预测值,记为
Figure BBM2014010300040000023
对H(t)进行三层小波分解。原始序列分离为第1至3层共三个高频信号(细节信号)Wj={wj,i}(j=1,2,3)和一个最大尺度的第三层低频信号(逼近信号)V3={v3,i}。
由于每进行一层分解所得的高频信号和低频信号的点数会比分解前的信号减少一倍,对预测不利。为使各分支长度保持不变,对其进行单支重构,重构后的4个分支与原始序列长度一致,即:
Figure BBM2014010300040000024
(j=1,2,3)和其中
Figure BBM2014010300040000026
为重构后的第j层高频信号,为重构后的第3层低频信号。
针对各分支不同特点,对
Figure BBM2014010300040000028
建立自回归预测(AR)模型,对
Figure BBM2014010300040000029
Figure BBM20140103000400000210
分别建立支持向量回归预测(SVR)模型,对
Figure BBM20140103000400000211
建立加权移动平均预测(MA)模型,进行一步预测,获得4个预测值
Figure BBM20140103000400000212
将其合成得最终预测值
Figure BBM20140103000400000214
但是,从预测精度来看,如果需要对重点时段、重点时刻的负载进行监控,以上文献提出的单一序列方法还有欠缺,多序列组合预测方法更为有效。
多序列组合预测,是指利用采集的数据,从不同角度构造与预测相关的序列,通过组合各序列的预测值提高精度。本质上,基于多序列的组合预测可以看作是多源数据的信息融合,因而也可以将其称为融合预测,该方法是对传统组合预测概念的扩展。
多序列组合预测的形式化定义为:
设某一预测对象F在某一时段的实际值为yt(t=1,2,…,n),基于预测对象F的不同属性特征构造N个时间序列,记为S1(t)、S2(t)、…、SN(t),分别基于各条单一序列进行预测,获得N个预测值
Figure BBM2014010300040000031
则经过非线性组合预测后的最终预测值
Figure BBM2014010300040000035
为:
y ^ t = ξ ( y ^ t ( 1 ) , y ^ t ( 2 ) , · · · y ^ t ( N ) ) - - - ( 1 )
其中,ξ为线性或非线性函数。
姚淑萍等人的文献《基于小波的Web流量组合预测方法研究》(中国矿业大学学报.2006,35(4):540-544)提出一种基于小波、神经网络和自回归的主机负载组合预测方法。文中,首先将Web流量构造为两个相关序列:历史序列和相似值序列。然后对具有平稳特征的相似值序列用AR模型进行预测;对体现了Web流量非线性、非平稳特性的历史序列则经过小波分解与单支重构后,针对各分支特点分别采用神经网络和自回归模型预测,即采用小波-AR-BP模型进行预测。最后组合两条序列的预测结果获得最终预测值。理论分析与实验表明:由于增加了相似值信息(即连续若干天同一时刻主机负载构成的序列),该文献所建方法比单一序列方法预测精度更高。其原理如图2所示。
但是该方法的不足之处在于,针对历史序列,小波分解后的各分支采用的是BP神经网络和AR预测,而文献《基于支持向量机与小波理论的混沌时间序列预测研究》(中国科技大学博士论文.2003)明确指出,BP神经网络与支持向量机(SVM)方法相比较具有明显缺陷,如学习容易陷入局部极小点、容易造成过拟合而影响网络的泛化能力等。以上缺陷成为影响预测精度的主要原因。当SVM方法用于预测时,即称为支持向量回归(SVR)方法。
发明内容
本发明的目的是为了进一步提高主机负载预测精度而提出一种基于多序列组合的主机负载预测方法。本发明从非线性、非平稳信息处理角度出发,通过构造多条序列,并利用各序列与负载相关的多种数据关系,将小波-AR-SVR-MA模型和AR模型组合来预测主机负载,以提高主机负载预测精度。该方法适合于对重点时段或重点时刻点的主机负载预测。
本发明的一种基于多序列组合的主机负载预测方法整体框架设计流程如图3所示。具体实现步骤如下:
步骤一、构造历史序列和相似值序列
首先利用获取的流量数据构造历史序列和相似值序列,具体构造方法采用文献《基于小波的Web流量组合预测方法研究》中介绍的构造历史序列和相似值序列的方法来构造。
步骤二、针对历史序列采用小波-AR-SVR-MA模型进行预测,获得t时刻的预测值,称为预测值1
在步骤一构造历史序列和相似值序列的基础上,对历史序列进行小波-AR-SVR-MA预测,获得t时刻的预测值。本发明使用的小波-AR-SVR-MA模型即为文献《基于非平稳序列的主机负载预测及合成技术研究》中介绍的基于小波和支持向量回归的负载预测及合成模型。
步骤三、针对相似值序列进行AR预测,获得t时刻预测值,称为预测值2
在步骤一构造历史序列和相似值序列的基础上,对相似值序列进行AR模型预测,获得t时刻的预测值2。本发明采用的AR模型即文献《基于小波的Web流量组合预测方法研究》中使用的相似值序列AR预测模型。
步骤四、计算两条序列预测值的平均值,获得最终预测值
在步骤二和步骤三的基础上,计算两条序列预测值的平均值,获得最终预测值。
有益效果
本发明针对重点时段、重点时刻主机负载预测的需求,从非线性、非平稳信息处理角度出发,将传统的组合预测思想推广到多序列的组合,通过构造多条序列,并将小波-AR-SVR-MA模型引入组合预测,有效的提高了主机负载预测精度。
附图说明
图1为已有技术的基于小波和支持向量回归的负载预测及合成模型图;
图2为已有技术的一种多序列组合预测原理图;
图3为本发明的一种基于多序列组合的主机负载预测方法整体框架设计流程图。
具体实施方式
根据上述技术方案,下面结合实施例对本发明进行详细说明。
对某单位Web服务器的流量进行收集,信号周期为60s,每天有1440个数据,共收集61天87840个流量数据。利用收集到的前60天数据对第61天8:00-9:00的流量进行预测。
预测采用单步滚动方式。步骤为:
步骤一、构造历史序列和相似值序列
首先利用获取的流量数据构造历史序列和相似值序列,具体构造方法采用文献《基于小波的Web流量组合预测方法研究》中介绍的构造历史序列和相似值序列的方法来构造。
具体构造方法如下:
第①步:原始负载时间序列的表达式如公式2所示:
X=x(t)={x(1),x(2),x(3),…,x(k),…}              (2)
第②步:根据负载时间序列表达式,分别构造与主机负载相关的历史序列和相似值序列。
设与待预测时刻t相关的两条序列为H(t)、S(t),则
H(t)={x(t-i),N≥i≥1}               (3)
S(t)={x(t-j×T),M≥j≥1}              (4)
其中T为一个周期的长度。
H(t)表示t时刻之前N个负载数据按时间顺序的排列,称为历史序列。
S(t)表示t时刻之前相邻M个周期内与t对应的观测点负载序列,称为相似值序列。
第③步:对两条序列中各元素分别重新编号,则H(t)和S(t)可分别表示为 H ( t ) = { h k } k = 1 N S ( t ) = { s j } j = 1 M .
步骤二、针对历史序列采用小波-AR-SVR-MA模型进行预测,获得t时刻的预测值1
在步骤一构造历史序列和相似值序列的基础上,对历史序列进行小波-AR-SVR-MA预测,获得t时刻的预测值1。本发明使用的小波-AR-SVR-MA模型即为文献《基于非平稳序列的主机负载预测及合成技术研究》中介绍的基于小波和支持向量回归的负载预测及合成模型。
具体实现步骤如下:
第①步:对历史序列进行小波分解
小波分解通过Mallat算法实现。确定尺度函数φ(t)和小波函数ψ(t)以及小波分解的低通滤波器H、高通滤波器G及其对偶算子H*、G*,选定分解层数L=3,分解层数确定标准是使预测误差基本达到最小。
对历史序列进行小波分解的过程为:
Vi+1=HVi:Wi+1=GVii=0,1,2,…,L           (5)
其中,Vi和Wi分别是分辨率为2-j的原始信号的逼近信号(低频信号)和细节信号(高频信号),V0即原始信号H(t)。
当分解进行到第3层时,历史序列被分解为3个高频信号和1个低频信号。
V 3 = { v 3 , i } W j = { w j , i } j = 1,2,3 - - - ( 6 )
其中,V3表示第3层低频信号,Wj表示第j层高频信号。
第②步:对小波分解后的序列进行重构
由于每进行一层分解所得的高频信号和低频信号的点数都会比分解前的信号减少一倍,这对预测是不利的,为了使各分支的长度保持不变,对L+1个分支利用Mallat重构算法进行单支重构:
Vi-1=H*Vi+G*Wi  i=L,L-1,…,1               (7)
重构到原尺度上,即
V0=(H*)LVL+(H*)L-1G*WL+…+G*Wl              (8)
重构后的4个分支与原始序列的长度一致,即:
V ~ 3 = { v ~ 3 , i , 1 ≤ i ≤ N } W ~ j = { w ~ j , i , 1 ≤ i ≤ N } j = 1,2,3 - - - ( 9 )
其中
Figure BBM2014010300040000072
为重构后的第3层低频信号,
Figure BBM2014010300040000073
为重构后的第j层高频信号。
依据对重构后各分支信号的定义,上式变为
H ( t ) = V 0 = V ~ L + W ~ L + · · · + W ~ 1 - - - ( 10 )
进一步可得
h i = v ~ L , i + w ~ L , i + · · · w ~ 2 , i + w ~ 1 , i - - - ( 11 )
Figure BBM2014010300040000076
表示hN+1的预测值,则对hN+1的预测转化为求各分支的预测值
Figure BBM2014010300040000078
即推出:
h ^ N + 1 = v ~ ^ 3 , N + 1 + w ~ ^ 3 , N + 1 + w ~ ^ 2 , N + 1 + w ~ ^ 1 , N + 1 - - - ( 12 )
第③步:低频信号
Figure BBM20140103000400000710
的AR预测
AR模型的数学表达式为:
xt=φ1xt-12xt-2+…+φpxt-p+at              (13)
其中,p为AR模型的阶数,φi为模型的系数,为待估参数,ai是白噪声。
模型的参数φi采用LS(最小二乘)估计法,具体为:
假设待预测序列为{x1,x2,…,xN},求
Figure BBM20140103000400000711
的LS估计。由于t<1的xt是未知的,故上式实际包含的方程是:
x p + 1 = φ 1 x p + φ 2 x p - 1 + · · · + φ p x 1 + a p + 1 x p + 2 = φ 1 x p + 1 + φ 2 x p + · · · + φ p x 2 + a p + 2 · · · x N = φ 1 x N - 1 + φ 2 x N - 2 + · · · + φ p x N - p + a N - - - ( 14 )
亦即认为a1=a2=…=ap=0。当p<<N时,可以忽略前p个at对整个平方和
Figure BBM20140103000400000713
的影响。
定义:
R ′ ^ ( m - n ) = 1 N Σ t = 1 N - p x t + p - n x t + p - m - - - ( 15 )
为最小二乘估计的自相关函数,则可得到AR模型参数估计的近似式为
Figure BBM2014010300040000082
求解上式即可得到模型的参数。
关于模型的阶可采用在一定范围内从低阶到高阶逐个拟合,利用最小信息准则(AIC)确定。
第④步:高频信号
Figure BBM2014010300040000083
Figure BBM2014010300040000084
的SVR预测
Figure BBM2014010300040000085
表示任意一个高频信号,由t时刻前的n个值预测t时刻的值dt的问题可以表示为寻找如下的对应关系F的问题
d ^ t = F ( d t - n , d t - n + 1 , · · · , d t - 1 ) - - - ( 17 )
对回归模型的训练来说,由N个训练样本就可以构建N-n个训练样本对,即输入(d1,d2,…,dn),对应的输出为dn+1;输入(d2,d3,…,dn+1),对应的输出为dn+2;…依此类推。
具体算法步骤为:
a.数据准备。将采集到的数据分为两部分,一部分作为训练数据,记为
Figure BBM2014010300040000087
另一部分作为测试数据,记为
Figure BBM2014010300040000088
首先将训练数据以n为步长组织为学习样本对(xi,yi),如表1所示。
表1 SVM预测模型学习样本
Figure BBM2014010300040000089
b.选取适当的支持向量机模型。
c.确定回归步长n。
d.根据确定的支持向量拓扑结构,利用训练数据集
Figure BBM2014010300040000091
训练模型。
e.利用测试数据集
Figure BBM2014010300040000092
中的数据进行单步预测。
f.根据预测结果进行模型评价。计算预测精度,如果精度满足预先设定的阈值,则结束算法,否则调整参数,转(4)。
第⑤步:高频信号
Figure BBM2014010300040000093
的MA预测
加权移动平均法的预测公式为:
w ~ ^ 1 , N + 1 = ( Σ i = 0 m - 1 w 1 , N - i ) / m - - - ( 18 )
式中:m为移动平均的项数,即每次预测需要使用的观察值的个数。
第⑥步:各分支预测值的合成
本发明采用支持向量回归实现合成。其中学习样本对以分解层数L+1为步长组织,输入样本为
Figure BBM2014010300040000095
输出样本yi=hi。算法其他步骤与步骤二采用小波-AR-SVR-MA模型进行预测的第④步相同。
步骤三、针对相似值序列进行AR预测,获得t时刻的预测值2
在步骤一构造历史序列和相似值序列的基础上,对相似值序列进行AR模型预测,获得t时刻的预测值2。本发明采用的AR模型即文献《基于小波的Web流量组合预测方法研究》中使用的相似值序列AR预测模型。
具体操作步骤与步骤二采用小波-AR-SVR-MA模型进行预测的第③步低频信号
Figure BBM2014010300040000096
的AR预测中的步骤相同。
步骤四、计算两条序列预测值的平均值,获得最终预测值
在步骤二和步骤三的基础上,计算两条序列预测值的平均值,获得最终预测值。
本实施例中,两个相关序列H(t)和S(t)基于原始负载时间序列X=x(t)={x(i),1≤i≤87840}构造。其中,H(t)为时刻t前的540个历史数据,S(t)为最近60天t时刻的流量记录,即公式(3)中N=540,公式(4)中T=1440,M=60。
为说明本发明的效果,利用上述数据,分别用以下四种方法进行测试。
方法1:本发明提出的多序列组合主机负载预测方法;
方法2:文献《基于小波的Web流量组合预测方法研究》的方法;
方法3:文献《基于小波的Web流量组合预测方法研究》中提到的历史序列的小波-AR-BP模型;
方法4:文献《基于非平稳序列的主机负载预测及合成技术研究》的方法,该方法基于历史序列完成。
测试结果如表2所示。
表2 四种预测方法的均方误差
Figure BBM2014010300040000101
σ表示均方误差,计算公式为:
σ = Σ t = 1 N ( x t - x ^ t ) 2 / N - - - ( 19 )
其中,xt是流量真实值,
Figure BBM2014010300040000103
是预测值。
通过测试结果可以得到以下结论:
一、多序列组合预测方法的精度高于相应单一序列预测方法。实验中,方法3和方法4是两种单一序列预测方法,方法2是在方法3的基础上进行的多序列组合预测,方法1是在方法4的基础上进行的多序列组合预测。显然,方法2的预测精度高于方法3;方法1的预测精度高于方法4。
二、四种方法中,本发明提出的方法预测精度最高。

Claims (1)

1. 一种基于多序列组合的主机负载预测方法,其特征在于具体实现步骤为:
步骤一、构造历史序列和相似值序列
首先利用获取的流量数据构造历史序列和相似值序列,具体构造方法如下:
第①步:原始负载时间序列的表达式如公式2所示:
X=x(t)={x(1),x(2),x(3),…,x(k),…}    (2)
第②步:根据负载时间序列表达式,分别构造与主机负载相关的历史序列和相似值序列;
设与待预测时刻t相关的两条序列为H(t)、S(t),则
H(t)={x(t-i),N≥i≥1}    (3)
S(t)={x(t-j×T),M≥j≥1}    (4)
其中T为一个周期的长度;
H(t)表示t时刻之前N个负载数据按时间顺序的排列,称为历史序列;
S(t)表示t时刻之前相邻M个周期内与t对应的观测点负载序列,称为相似值序列;
第③步:对两条序列中各元素分别重新编号,则H(t)和S(t)可分别表示为
Figure DEST_PATH_FBM2014010300150000011
Figure DEST_PATH_FBM2014010300150000012
步骤二、针对历史序列采用小波-AR-SVR-MA模型进行预测,获得t时刻的预测值1
在步骤一构造历史序列和相似值序列的基础上,对历史序列进行小波-AR-SVR-MA预测,获得t时刻的预测值1;具体实现步骤如下:
第①步:对历史序列进行小波分解
小波分解通过Mallat算法实现;确定尺度函数φ(t)和小波函数ψ(t)以及小波分解的低通滤波器H、高通滤波器G及其对偶算子H*、G*,选定分解层数L=3,分解层数确定标准是使预测误差基本达到最小;
对历史序列进行小波分解的过程为:
Vi+1=HVi;Wi+1=GVi  i=0,1,2,…,L    (5)
其中,Vi和Wi分别是分辨率为2-j的原始信号的逼近信号和细节信号,其中逼近信号为低频信号,细节信号为高频信号,V0即原始信号H(t);
当分解进行到第3层时,历史序列被分解为3个高频信号和1个低频信号;
Figure DEST_PATH_FBM2014010300150000021
其中,V3表示第3层低频信号,Wj表示第j层高频信号;
第②步:对小波分解后的序列进行重构
由于每进行一层分解所得的高频信号和低频信号的点数都会比分解前的信号减少一倍,这对预测是不利的,为了使各分支的长度保持不变,对L+1个分支利用Mallat重构算法进行单支重构:
Vi-1=H*Vi+G*Wi  i=L,L-1,…,1    (7)
重构到原尺度上,即
V0=(H*)LVL+(H*)L-1G*WL+…+G*Wl    (8)
重构后的4个分支与原始序列的长度一致,即:
其中
Figure DEST_PATH_FBM2014010300150000023
为重构后的第3层低频信号,为重构后的第j层高频信号;
依据对重构后各分支信号的定义,上式变为
Figure DEST_PATH_FBM2014010300150000031
进一步可得
Figure DEST_PATH_FBM2014010300150000032
Figure DEST_PATH_FBM2014010300150000033
表示hN+1的预测值,则对hN+1的预测转化为求各分支的预测值
Figure DEST_PATH_FBM2014010300150000035
即推出:
Figure DEST_PATH_FBM2014010300150000036
(12)
第③步:低频信号
Figure DEST_PATH_FBM2014010300150000037
的AR预测
AR模型的数学表达式为:
xt=φ1xt-12xt-2+…+φpxt-p+at    (13)
其中,p为AR模型的阶数,φi为模型的系数,为待估参数,at是白噪声;
模型的参数φi采用LS即最小二乘估计法,具体为:
假设待预测序列为{x1,x2,…,xN},求的LS估计;由于t<1的xt是未知的,故上式实际包含的方程是:
Figure DEST_PATH_FBM2014010300150000038
亦即认为a1=a2=…=ap=0;当p<<N时,可以忽略前p个at对整个平方和
Figure DEST_PATH_FBM2014010300150000039
的影响;
定义:
为最小二乘估计的自相关函数,则可得到AR模型参数估计的近似式为
求解上式即可得到模型的参数;
关于模型的阶可采用在一定范围内从低阶到高阶逐个拟合,利用最小信息准则(AIC)确定;
第④步:高频信号
Figure DEST_PATH_FBM2014010300150000042
Figure DEST_PATH_FBM2014010300150000043
的SVR预测
Figure DEST_PATH_FBM2014010300150000044
表示任意一个高频信号,由t时刻前的n个值预测t时刻的值dt的问题可以表示为寻找如下的对应关系F的问题
Figure DEST_PATH_FBM2014010300150000045
对回归模型的训练来说,由N个训练样本就可以构建N-n个训练样本对,即输入(d1,d2,…,dn),对应的输出为dn+1;输入(d2,d3,…,dn+1),对应的输出为dn+2;…依此类推;
具体算法步骤为:
a.数据准备;将采集到的数据分为两部分,一部分作为训练数据,记为
Figure DEST_PATH_FBM2014010300150000048
另一部分作为测试数据,记为
Figure DEST_PATH_FBM2014010300150000047
首先将训练数据以n为步长组织为学习样本对(xi,yi),如表1所示;
表1SVM预测模型学习样本
Figure DEST_PATH_FBM2014010300150000051
b.选取适当的支持向量机模型;
c.确定回归步长n;
d.根据确定的支持向量拓扑结构,利用训练数据集
Figure DEST_PATH_FBM2014010300150000052
训练模型;
e.利用测试数据集中的数据进行单步预测;
f.根据预测结果进行模型评价;计算预测精度,如果精度满足预先设定的阈值,则结束算法,否则调整参数,转(4);
第⑤步:高频信号
Figure DEST_PATH_FBM2014010300150000054
的MA预测
加权移动平均法的预测公式为:
Figure DEST_PATH_FBM2014010300150000055
式中:m为移动平均的项数,即每次预测需要使用的观察值的个数;
第⑥步:各分支预测值的合成
本发明采用支持向量回归实现合成;其中学习样本对以分解层数L+1为步长组织,输入样本为
Figure DEST_PATH_FBM2014010300150000056
输出样本yi=hi;算法其他步骤与步骤二采用小波-AR-SVR-MA模型进行预测的第④步相同;
步骤三、针对相似值序列进行AR预测,获得t时刻的预测值2
在步骤一构造历史序列和相似值序列的基础上,对相似值序列进行AR模型预测,获得t时刻的预测值2;
具体操作步骤与步骤二采用小波-AR-SVR-MA模型进行预测的第③步低频信号
Figure DEST_PATH_FBM2014010300150000061
的AR预测中的步骤相同;
步骤四、计算两条序列预测值的平均值,获得最终预测值
在步骤二和步骤三的基础上,计算两条序列预测值的平均值,获得最终预测值。
CN200910121385.6A 2009-05-31 一种基于多序列组合的主机负载预测方法 Active CN103748993B (zh)

Publications (1)

Publication Number Publication Date
CN103748993B true CN103748993B (zh) 2011-02-16

Family

ID=

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502799A (zh) * 2016-12-30 2017-03-15 南京大学 一种基于长短时记忆网络的主机负载预测方法
CN103729528B (zh) * 2012-10-15 2017-06-16 富士通株式会社 对序列进行处理的装置和方法
CN106933649A (zh) * 2016-12-21 2017-07-07 华南师范大学 基于移动平均和神经网络的虚拟机负载预测方法及系统
CN107045654A (zh) * 2016-01-29 2017-08-15 中华电信股份有限公司 预测请求流量的凭证预签系统及方法
CN107608781A (zh) * 2016-07-11 2018-01-19 华为软件技术有限公司 一种负载预测方法、装置以及网元
CN108241533A (zh) * 2016-12-26 2018-07-03 摩根士丹利服务集团有限公司 一种基于预测和分层抽样的资源池未来负载生成方法
CN108632082A (zh) * 2018-03-27 2018-10-09 北京国电通网络技术有限公司 一种服务器的负载信息的预测方法及装置
CN104881271B (zh) * 2014-02-27 2018-11-23 中国移动通信集团重庆有限公司 云动态管理方法及装置
CN110059289A (zh) * 2019-03-01 2019-07-26 吉林大学 一种基于卡尔曼滤波神经网络的工程车辆负载功率预测方法
CN113849374B (zh) * 2021-09-28 2023-06-20 平安科技(深圳)有限公司 中央处理器占用率预测方法、系统、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1248361A (zh) * 1997-12-18 2000-03-22 Ntt移动通信网株式会社 信道预测设备以及设有此设备的cdma接收设备和cdma收发设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1248361A (zh) * 1997-12-18 2000-03-22 Ntt移动通信网株式会社 信道预测设备以及设有此设备的cdma接收设备和cdma收发设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
叶茂等.基于小波的Web测试流量生成.仪器仪表学报. 2006,27(6)增刊43-44页. *
姚淑萍等.基于小波的Web流量组合预测方法研究.中国矿业大学学报. 2006, 35(4)541-542页图1. *
姚淑萍等.基于非平衡序列的主机负载预测及合成技术.北京理工大学学报. 2007,27(1)43-44页图1. *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729528B (zh) * 2012-10-15 2017-06-16 富士通株式会社 对序列进行处理的装置和方法
CN104881271B (zh) * 2014-02-27 2018-11-23 中国移动通信集团重庆有限公司 云动态管理方法及装置
CN107045654A (zh) * 2016-01-29 2017-08-15 中华电信股份有限公司 预测请求流量的凭证预签系统及方法
CN107045654B (zh) * 2016-01-29 2020-12-25 中华电信股份有限公司 预测请求流量的凭证预签系统及方法
CN107608781B (zh) * 2016-07-11 2021-06-22 华为技术有限公司 一种负载预测方法、装置以及网元
CN107608781A (zh) * 2016-07-11 2018-01-19 华为软件技术有限公司 一种负载预测方法、装置以及网元
CN106933649B (zh) * 2016-12-21 2020-11-06 华南师范大学 基于移动平均和神经网络的虚拟机负载预测方法及系统
CN106933649A (zh) * 2016-12-21 2017-07-07 华南师范大学 基于移动平均和神经网络的虚拟机负载预测方法及系统
CN108241533A (zh) * 2016-12-26 2018-07-03 摩根士丹利服务集团有限公司 一种基于预测和分层抽样的资源池未来负载生成方法
CN108241533B (zh) * 2016-12-26 2022-12-02 摩根士丹利服务集团有限公司 一种基于预测和分层抽样的资源池未来负载生成方法
CN106502799A (zh) * 2016-12-30 2017-03-15 南京大学 一种基于长短时记忆网络的主机负载预测方法
CN108632082A (zh) * 2018-03-27 2018-10-09 北京国电通网络技术有限公司 一种服务器的负载信息的预测方法及装置
CN110059289A (zh) * 2019-03-01 2019-07-26 吉林大学 一种基于卡尔曼滤波神经网络的工程车辆负载功率预测方法
CN110059289B (zh) * 2019-03-01 2022-08-26 吉林大学 一种基于卡尔曼滤波神经网络的工程车辆负载功率预测方法
CN113849374B (zh) * 2021-09-28 2023-06-20 平安科技(深圳)有限公司 中央处理器占用率预测方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Shiri et al. Short-term and long-term streamflow forecasting using a wavelet and neuro-fuzzy conjunction model
Kim et al. Urban traffic flow prediction system using a multifactor pattern recognition model
Kisi Wavelet regression model for short-term streamflow forecasting
Kisi Wavelet regression model as an alternative to neural networks for river stage forecasting
Mirrashid Earthquake magnitude prediction by adaptive neuro-fuzzy inference system (ANFIS) based on fuzzy C-means algorithm
ElNozahy et al. A probabilistic load modelling approach using clustering algorithms
Li et al. Urban water demand forecasting based on HP filter and fuzzy neural network
Li et al. Taxi booking mobile app order demand prediction based on short-term traffic forecasting
Kişi Wavelet regression model as an alternative to neural networks for monthly streamflow forecasting
Reggiani et al. Neural networks and logit models applied to commuters’ mobility in the metropolitan area of Milan
Liu et al. Artificial neural network based method for seismic fragility analysis of steel frames
Singh Wavelet-ANN model for flood events
Azadeh et al. An adaptive network based fuzzy inference system–auto regression–analysis of variance algorithm for improvement of oil consumption estimation and policy making: The cases of Canada, United Kingdom, and South Korea
Ma et al. Dynamic factor model for network traffic state forecast
CN102270302A (zh) 一种基于灰色支持向量机的多应力加速寿命试验预测方法
CN103268525A (zh) 一种基于wd-rbf的水文时间序列模拟预测方法
CN102279928B (zh) 基于支持向量机和模糊信息粒化的产品性能退化区间预测方法
Shu et al. A multi-task learning-based automatic blind identification procedure for operational modal analysis
Kusdarwati et al. System for prediction of non stationary time series based on the wavelet radial bases function neural network model
Huang et al. Application of optimized GM (1, 1) model based on EMD in landslide deformation prediction
CN102749584B (zh) 基于Kalman滤波的ESN的涡轮发动机的剩余寿命预测方法
Yu et al. A novel discussion on two long-term forecast mechanisms for hydro-meteorological signals using hybrid wavelet-NN model
Wang et al. A DES-BDNN based probabilistic forecasting approach for step-like landslide displacement
CN105933138A (zh) 一种时空维度相结合的云服务可信态势评估与预测方法
CN103748993B (zh) 一种基于多序列组合的主机负载预测方法

Legal Events

Date Code Title Description
GR03 Grant of secret patent right
DC01 Secret patent status has been lifted