CN101267362B - 一种性能指标值正常波动范围的动态确定方法及其装置 - Google Patents

一种性能指标值正常波动范围的动态确定方法及其装置 Download PDF

Info

Publication number
CN101267362B
CN101267362B CN2008100979115A CN200810097911A CN101267362B CN 101267362 B CN101267362 B CN 101267362B CN 2008100979115 A CN2008100979115 A CN 2008100979115A CN 200810097911 A CN200810097911 A CN 200810097911A CN 101267362 B CN101267362 B CN 101267362B
Authority
CN
China
Prior art keywords
predicted
performance index
value
time point
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008100979115A
Other languages
English (en)
Other versions
CN101267362A (zh
Inventor
于艳华
王海清
宋俊德
潘阳发
林春庭
任志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Bright Oceans Inter Telecom Co Ltd
Original Assignee
Beijing University of Posts and Telecommunications
Bright Oceans Inter Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications, Bright Oceans Inter Telecom Co Ltd filed Critical Beijing University of Posts and Telecommunications
Priority to CN2008100979115A priority Critical patent/CN101267362B/zh
Publication of CN101267362A publication Critical patent/CN101267362A/zh
Application granted granted Critical
Publication of CN101267362B publication Critical patent/CN101267362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种性能指标值正常波动范围的动态确定方法,包括步骤:获取网络性能指标的历史值,动态获取最新的历史样本数据;进行预处理,获得正常样本数据;进行相空间重构,获得训练样本数据;进行训练建模,以残差白噪声作为选取最优支持向量机模型的条件;使用所述最优支持向量机模型对待预测时间点上的数据进行预测,并计算预测值的置信区间从而获得性能指标值正常波动范围;检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用进行重新训练。同时本发明还公开了一种性能指标值正常波动范围的动态确定装置。本发明大大提高了性能动态监控预警的准确性,减少了性能告警的误报和漏报。

Description

一种性能指标值正常波动范围的动态确定方法及其装置
技术领域
本发明涉及电信网络管理领域,尤其涉及一种电信网络性能的实时监控方法,具体涉及到电信网络性能指标的波动范围预测。
背景技术
随着通信市场竞争的日趋激烈,各大电信运营商先后提出了战略转型。传统上,作为电信运营商的支撑部门所运作的运维管理,一直属于业务流程的后台部分,直接面向网络和设备的管理,与市场和客户没有直接的关系。而随着市场竞争的日益激烈,提升客户对网络服务的满意度逐渐成为电信运营商提升市场竞争能力的重要方面,因此运营商将直接面向网络的管理转为面向服务的管理迫在眉睫。未来的运维工作将逐渐走向前台,运维工作与客户感知之间的联系将越来越密切。由于用户在使用网络的过程中,不仅感知终端设备,还体验了各种业务和网络的服务能力,因此,为了改善客户体验,在网络监控上针对以前的被动、事后解决问题方式,目前提出一种新的主动、事前的网络监控技术,即以和用户感知相关的网络性能指标为监控对象,例如监控话务量、来话占用次数、来话应答次数、来话接通率等性能指标,分析该性能指标在某时的实际值是否落在正常范围内,如果溢出正常范围,则会出现业务质量降低和网络性能下降,可能存在网络故障或网络配置数据存在问题等,此时应发出实时性能告警警报,通知运维人员介入相关处理,加快问题的解决或避免问题出现,从而提高业务服务质量,改善用户感知,减少用户投诉。而正常范围的设置一般来源于网络运维经验、网络管理要求或者设备能力限制,设置的精确度决定了发出实时性能告警的准确性。如果设置范围过窄(如上限取值过小、下限取值过大)可能导致误报告警;范围设置过宽(如上限取值过大、下限取值过小)又可能导致漏报告警,加大运维人员的工作量、影响运维人员的积极性,最终都会降低该网络监控技术的作用。因此,在网络性能指标的实时监控过程中,网络性能指标的正常值基准线有效准确预测是一个关键问题。
目前在性能监控指标的基准线的确定上,应用的方法一般包括排序法、数理统计的方法等。排序法是指:1)首先对有效数据进行排序,假定共有N*个,分别记为X1~XN*;2)假定有效数据的Y%(如95%)为可以接受而不用产生告警的指标值,取中间的数字为正常波动区间;3)以其最大值作为基线上限BaseHigh,以其最小值作为基线的下限BaseLow。而数理统计的方法与排序算法类似,区别在于:其95%的正常数据不是取正中间的,而是取方差最小的95%的连续数据。这两种方法的优点是简单易算,但对于具有周期性和趋势性特点较强的动态性能指标来说,例如话务量、来话占用次数、来话应答次数、来话接通率等指标,其指标会随着时间的变化发生周期性、趋势性特点,节假日的峰值特点使得在平日的话务量正常值范围和节假日的话务量正常值范围有很大的不同,这样应用以上两种方法确定性能指标预警基线就不够精确,这一方面会导致性能告警的误报,另一方面又存在该报的告警没有报出来的情况,从而降低了主动性能监控技术的可用性。
因此,本发明将时间序列的预测方法引入该领域来动态确定性能指标的预警基线和波动范围,具体采用的方法是支持向量机建模及预测方法。目前也有提出将基于统计学习理论的支持向量机预测方法进行话务量的预测,见《科技创新导报》2008No.2中文章“支持向量机在电信话务量预测中的应用分析”,其中应用支持向量机对电信话务量的指标进行了预测分析。但其对支持向量机的自由参数的选择并没有给出新的方法,目前普遍采用的是使样本校验集的MSE最小,所述MSE(Mean Squared Error)是一个统计量,其含义是:设在某集合中利用训练模型的预测值为
Figure GSB00000224887000021
(i=1...n),而实际值为yi(i=1...n),则
Figure GSB00000224887000022
这种方法存在的问题是,仅仅使已知样本数据训练集上的误差最小,这与支持向量机模型中已得到很好验证的结构风险最小化SRM(Structral Risk Minimization)原则相悖;另一个问题是,这种方法在应用于基于时间序列的性能指标的建模及预测时,对非平稳时间序列的样本数据适用性不是很强。针对这种情况本发明提出一种新的支持向量机的自由参数选择方法,更加适合非平稳时间序列预测的支持向量机模型选取,另外还给出预测值误差的置信范围,从而得到待预测时间点上的正常波动范围。最后,利用该模型选取方法还给出了实时动态建模预测的机制。
以下简单介绍本发明一种性能指标波动范围的确定方法及其装置所用到的基本技术理论-支持向量机原理。
支持向量机的最大特点是基于结构风险最小化(SRM-Structural Risk Minimization)原则提出的,因其完备的理论基础,近年来在模式识别(分类)和函数逼近方面得到广泛关注。在函数逼近的应用方面,利用不同的核函数可进行线性、非线性系统的逼近,目前已被引入时间序列预测方面。支持向量机是由Vapnik及其同事在1995年提出的,建立在结构风险最小和VC维理论基础上,解决了神经网络在应用中存在的局部极小问题,网络结构可完全通过计算自动确定;更重要的是为求得由经验风险和置信区间综合确定的期望风险最小为训练目标,支持向量机模型有更好的泛化效果,被视为替代神经网络的较好方法。
所述结构风险最小化(SRM)是统计学习理论中提出的训练原则,与传统统计学中的经验风险最小原则(ERM)相对。传统的统计理论的ERM原则是基于样本容量无穷大的假设的,但在实际中可得到的样本数总是有限的,比如基于ERM的BP神经网络就会因此存在“过拟合”的现象,因此用有限样本数基于ERM原则进行预测的效果并不理想。针对这种情况,Vapnik等人提出新的统计学习理论,即不仅考虑经验风险,还力求假设函数复杂度尽量小,以期获得最小的期望风险上界,而不是单纯的经验风险最小,这一原则称为结构风险最小化原则(SRM)。
关于函数逼近的支持向量回归机的原理是这样的,利用训练数据集进行建模,找到输入向量xi和输出yi的一个决策函数yi=f(xi),使得期望风险函数最小,其中,xi∈Rn,即属于n维的向量空间,yi∈R,i=1...l,l为训练样本点数;即输入参数为n维向量,而输出为一个标量值。综合考虑线性和非线性的所有情况,不妨令f(x)=(w.Ф(x))+b,其中,Ф:Rn->H,w为特征空间的系数向量。这样,f(x)本来是输入向量空间上的非线性函数,但经过Ф(x)的映射后就变成在特征空间H上的线性函数。用支持向量机的方法求解该回归问题,不仅要使经验损失值尽量小,同时还要考虑置信区间尽量小,以期得到最小的期望风险。在该方法中,采用的经验损失函数为ε-不敏感损失函数,而置信区间用
Figure GSB00000224887000041
来衡量,用于表示决策函数模型的复杂度,则求解回归问题就变为求解以下的不等式约束优化问题(以下s.t.代表约束条件):
min w ∈ R n , b ∈ R , ξ ( * ) ∈ R 2 l R ( w , ξ , ξ * ) = 1 2 | | w | | 2 + C · 1 l Σ i = 1 l ( ξ i + ξ i * ) - - - ( 1 )
s.t.((w·φ(xi))+b)-yi≤ε+ξi;i=1,2,…,l
yi-((w·φ(xi))+b)≤ε+ξi *;i=1,2,…,l
ξi (*)≥0;i=1,2,…,l
Figure GSB00000224887000043
为ε-不敏感条件下的经验损失,参数C为用于调节比重的惩罚参数,其作用是在经验风险和模型复杂度之间取一折衷。
为求解该不等式约束优化问题,利用Lagrange对偶原理。先对其Lagrange对偶问题即以下优化问题求α(*)
min 1 2 Σ i = 1 l Σ j = 1 l ( α i * - α i ) ( α j * - α j ) ( φ ( x i ) · φ ( x j ) ) + ϵ Σ i = 1 l ( α i * + α i ) - Σ i = 1 l y i ( α i * - α i ) - - - ( 2 )
s . t . Σ i = 1 l ( α i * - α i ) = 0
0 ≤ α i * , α i ≤ C l
为了解决φ(x)不易于确定的问题,以及即使确定出来在特征空间计算时计算量太大以至出现维度灾难等问题,引入了核函数K(xi,xj)代替高维空间的内积运算来处理,使K(xi,xj)=(φ(xi))·φ(xj)),解决了高维空间的复杂运算问题。根据Hilbert-Schimidt原理,只要一种运算满足Mercer条件,它就可以作为核函数。用K(xi,xj)来代替式(2)中的(φ(xi)·φ(xj))。求得
Figure GSB00000224887000051
后,决策函数为:
f ( x ) = Σ i = 1 l ( α i * - α i ) K ( x i , x ) + b - - - ( 3 )
以上公式(3)是经过简化的支持向量回归机的回归函数表达式。
其中常值偏差b的值可由KKT(Karush-Kuhn_Tucker)条件来求得。因为只有
Figure GSB00000224887000053
时,xi才对f(x)有影响,f(x)的值取决于这些输入向量的值,所以这些向量也称为支持向量。所述KKT条件,指的是对于如下约束优化问题minf(x),x=([x]1,…,[x]n)T∈Rns.t.ci(x)=0,i=1...q,其存在解的必要条件是
ci(x*)≤0i=1...p
cj(x*)=0j=1...q,该条件称为KKT条件。根据这一条件中的第4式
Figure GSB00000224887000054
i=1...p
α i ( * ) c i ( x * ) = 0 i=1...p
(i=1...p),可以知道当
Figure GSB00000224887000057
时,ci(x*)=0即若Lagrange系数不为0则该点在边界上,从而可求解相关函数参数。
发明内容
本发明中将性能监控指标的正常值的基准线称为预警基线。
本发明的目的是提供一种性能指标值正常波动范围的动态确定方法及其装置,解决当前对网络性能指标的正常波动范围的动态预测的精准性问题,提出一种新的基于时间序列和支持向量机方法进行的网络性能指标的正常波动范围的动态预测。在选择支持向量机的训练模型时,将残差白噪声作为最优模型的选择依据,可以根据残差是白噪声时符合正态分布的特点,得到预测误差的在给定置信度下的置信区间,从而得到性能指标在待预测时间点上的正常波动范围。
本发明采用的技术方案如下:
一种性能指标值正常波动范围的动态确定方法,包括步骤:
01)获取网络性能指标的历史值,动态获取最新的历史样本数据;
02)对所述最新的历史样本数据进行预处理,获得正常样本数据;
03)对所述正常样本数据进行相空间重构,获得训练样本数据;
04)对所述训练样本数据进行训练,以残差白噪声为依据来选取基于所述训练样本数据的最优支持向量机模型;
05)使用所述最优支持向量机模型对待预测时间点上的数据进行预测,并利用残差白噪声符合正态分布的特性来计算置信区间,从而获得所述待预测时间点上的性能指标值正常波动范围。
其中,所述步骤04)包括:
A、设置支持向量机模型的自由参数值;
B、根据所设置的自由参数值,按照结构风险最小化原则对训练样本数据进行训练,获得一个回归方程式作为建模结果;
C、将训练样本数据的实际值与所得回归方程式下的计算值求差,得到拟合残差序列,计算残差序列的自相关函数;
D、根据所述残差序列的自相关函数计算结果,检验所述残差序列是否为白噪声序列,如果是,则所获得的支持向量机训练模型最优,保存并输出该模型和对应的自由参数值;否则如果不是白噪声序列,返回步骤A,重新设置自由参数的值,按照以上过程重新训练,直到获得最优的支持向量机模型。
所述的性能指标预警基线的确定方法,还可以包括步骤:
06)检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用则转步骤01)以重新获取样本数据进行重新训练,选取新的最优支持向量机模型,若适用则转步骤05)直接进行下一个待预测时间点数据的预测。
进一步地,计算性能指标的预警基线值及置信范围的过程包括:
用所述最优的支持向量机训练模型和对应的自由参数值进行一步预测,将得到的计算值作为待预测时间点上的预警基线值计算该基线值在指定置信度下的置信区间,从而获得在待预测时间点上的波动范围。
进一步地,检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测过程是,计算下一个待预测时间点上的残差,将其加入原残差序列并更新为新残差序列,若新残差序列仍然是白噪声序列,则所述最优支持向量机模型仍然适用下一个待预测时间点的数据预测,否则所述最优支持向量机模型不适用下一个待预测时间点的数据预测。
本发明还提出一种性能指标值正常波动范围的动态确定装置,所述装置包括样本数据获取单元,样本数据预处理单元,训练样本数据获取单元,模型选取单元,性能指标波动范围预测单元,其中,
样本数据获取单元,用于获取网络性能指标的历史值,动态获取最新的历史样本数据;
样本数据预处理单元,用于对所述最新的历史样本数据进行预处理,得到正常样本数据;
训练样本数据获取单元,用于对所述正常样本数据进行相空间重构得到训练样本数据;
模型选取单元,用于对所述训练样本数据进行训练,用残差白噪声来选取基于所述训练样本数据的最优支持向量机模型;
性能指标波动范围预测单元,使用所述最优支持向量机模型对待预测时间点上的数据进行预测,并利用白噪声符合正态分布的特性计算误差的置信区间,从而获得所述待预测时间点上的性能指标值正常波动范围。
其中,模型选取单元可以包括:
参数设置模块,用于预置或调整支持向量机模型的自由参数值;
训练建模模块,用于根据参数设置模块所设置的自由参数值,按照结构风险最小化原则对训练样本数据进行优化训练,获得一个回归方程式作为建模结果;
残差计算模块,根据训练建模模块得到的回归方程式计算训练数据在该回归方程式下的计算值,与训练样本数据获取单元得到的样本数据的实际值求差,得到拟合残差序列,计算残差序列的自相关函数;
白噪声检验及模型确定模块,用于检验残差计算模块所计算残差序列是否为白噪声序列,如果是,则所确定的支持向量机模型最优,输出设置的自由参数值和最优的支持向量机模型;否则转到参数设置模块,调整支持向量机模型的自由参数值,以重新训练。
所述的性能指标值正常波动范围的动态确定装置还可以包括,
模型继续适用判断单元,检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用则指示样本数据获取单元基于下一个待预测时间点重新获取样本数据以重新建模,若适用则转到性能指标波动范围预测单元预测下一个待预测时间点上的性能指标波动范围。
进一步地,所述性能指标波动范围预测单元可以包括,
一步预测模块,用所述最优支持向量机训练模型和对应的自由参数值在待预测时间点进行一步预测,将得到的计算值作为待预测时间点上的性能指标预警基线值;
置信区间计算模块,计算所述性能指标预警基线值在指定置信度下的置信区间;
波动范围确定模块,根据一步预测模块得到的待预测时间点上的性能指标预警基线值,以及置信区间计算模块得到的置信区间,确定在待预测时间点上的性能指标波动范围。
进一步地,所述模型继续适用判断单元包括,
新残差计算模块,根据模型选取单元得到的最优支持向量机模型的回归方程式,在下一个待预测时间点上计算该回归方程式下的计算值,与训练样本数据获取单元得到的样本数据的实际值求差,将其加入原残差序列并更新为新残差序列,计算新残差序列的自相关函数;
白噪声检验及重新建模判断模块,用于检验新残差计算模块所得到的新残差序列是否为白噪声序列,如果是,则所述最优支持向量机模型仍然适用下一个待预测时间点的数据预测,指示性能指标波动范围预测单元预测下一个待预测时间点上的性能指标波动范围,否则所述最优支持向量机模型不适用下一个待预测时间点的数据预测,指示样本数据获取单元基于下一个待预测时间点重新获取样本数据以重新建模。
采用本发明所述的性能指标值正常波动范围的确定方法,以残差白噪声为支持向量机模型的选择依据进行动态建模,得到较准确的性能指标值正常波动范围预测效果。同时,根据白噪声一般符合正态分布的特点,可以得到性能指标值基线预测值在指定置信度下的置信区间,将预测值和置信区间结合就得到指标值的波动范围,根据该范围就可以判断性能指标的实际值是否正常。在这一过程中,运维人员可以根据实际应用效果来选择合适的置信度,如置信度为95%或97%甚至更大。该方法大大提高了性能监控预警基线预测的准确性,减少了性能告警的误报和漏报。
附图说明
图1为本发明中一种性能指标值正常波动范围的动态确定方法的流程图。
图2为本发明技术方案的实施例一所述的一种性能指标值正常波动范围的动态确定方法的详细实现流程图。
图3为本发明中一种基于动态建模的性能指标值正常波动范围的动态确定方法流程图。
图4为本发明技术方案的实施例二所述的一种基于动态建模的性能指标值正常波动范围的动态确定方法的详细实现流程图。
图5为本发明技术方案的实施例三中所述的支持向量机训练建模步骤中计算残差序列的自相关函数的结果示意图。
图6为本发明一种性能指标值正常波动范围的确定装置的结构示意图。
图7为本发明一种基于动态建模的性能指标值正常波动范围的动态确定装置的结构示意图。
图8为本发明技术方案的实施例四所述的一种性能指标值正常波动范围的动态确定装置的一种优化实现结构。
图9为本发明技术方案的实施例五所述的一种基于动态建模的性能指标值正常波动范围的动态确定装置的一种优化实现结构。
具体实施方式
本发明提出一种性能指标正常波动范围的动态确定方法,用基于时间序列的支持向量机方法进行性能指标预警基线及波动范围的预测过程如图1所示,遵从以下步骤:
步骤S101:获取网络性能指标的历史值,动态获取最新的历史样本数据;
步骤S102:对所述最新的历史样本数据进行预处理,获得正常样本数据;
步骤S103:对所述正常样本数据进行相空间重构,获得训练样本数据;
步骤S104:对所述训练样本数据进行训练,以残差白噪声为依据来选取基于所述训练样本数据的最优支持向量机模型;
步骤S105:使用所述最优支持向量机模型对待预测时间点上的数据进行预测,并利用残差白噪声符合正态分布的特性来计算置信区间,从而获得所述待预测时间点上的性能指标值正常波动范围。
根据以上步骤,参见图2,给出本发明的实施例一详细说明如下:
步骤S201:获取网络性能指标的历史值,动态获取最新的历史样本数据。
从网络性能指标库中动态获取基于时间点的性能指标历史样本数据,每个时间点最少选取过去一个月以上的历史数据。按照经验,少于一个月的数据一般难以保证统计结果的有效性,因此这一步需要保证获取样本数据的有效性。所述动态获取的实现可以是,根据对性能指标的预测需求,定期或接受指示信息后从网络性能指标库中获取最新历史数据,存储在最新历史数据缓冲区中,保持该缓冲区数据的滚动更新。
步骤S202:对所述最新的历史样本数据进行预处理,获得正常样本数据。
对获取的网络性能指标最新历史样本数据,可以选择进行以下三种方式的预处理过程,获得正常样本数据:
方式一,结合运维期间发现的故障、或者节假日、重大事件等有关情况,确定异常时间点的样本数据,并将异常点排除,保留反映变化规律的典型数据作为正常样本数据。
方式二,根据异常时间点的样本数据占整个样本数据的比例,删除最大和最小的数值,其余作为正常样本数据。
方式三,基于历史统计数据确定的正常数据比例,按照概率算法自动选出最为集中分布的数据作为正常样本数据。
步骤S203:对所述正常样本数据进行相空间重构,获得训练样本数据。
对获得的网络性能指标正常样本数据,进行相空间重构得到训练集样本点。
设基于时间序列的样本数据为{x(1),x(2),…,x(l),…},其中1...l表示时间点,x(l)表示第l个时间点的性能指标值。时间序列预测即根据当前时间点t的历史数据指标值形成的时间序列{x(t),x(t-1),…,x(t-m+1)预测未来第t+k(k>0)时刻的值x(t+k),方法是利用x(t+k)与历史数据{x(t),x(t-1),…,x(t-m+1)}之间的关系。这个参数m称为嵌入维数,m值的确定是一个关键问题。这样,当历史数据包含l个样本点数据时,进行相空间重构后得到训练集的容量为(l-m)。
X = x ( 1 ) x ( 2 ) · · · x ( m ) x ( 2 ) x ( 3 ) · · · x ( m + 1 ) · · · x ( l - m ) x ( l - ( m - 1 ) ) x ( l - 1 ) = x ( 1 ) x ( 2 ) · · · x ( l - m )
相应的输入向量x(i)对应的输出为y(i)=x(i+m),展开如下:
Y = y ( 1 ) y ( 2 ) · · · y ( l - m ) = x ( m + 1 ) x ( m + 2 ) x ( l )
这样,经过这个过程后,训练集样本点为(x(i),y(i)),i=1...(l-m)。
在进行以上的相空间重构过程中,嵌入维数m的确定是一个关键要素,对能否达到预测的结果至关重要,嵌入维数的确定目前没有标准的统一的方法,一般采用FPE的方法。FPE(Final Prediction Error)是相空间重构时确定维数的一种常用方法,其方法是:设序列长度为l,试验的嵌入维是m,则
Figure GSB00000224887000123
其中
Figure GSB00000224887000124
计算m在2开始的FPE值,会发现FPE先变小后变大的下凸曲线,该下凸曲线的极小值点的m值即为最后选定嵌入维维数。
步骤S204:对所述训练样本数据空间进行训练,以残差白噪声为依据来选取基于所述训练样本数据的最优支持向量机模型;
然后针对上一步获得的训练集样本点进行以残差为白噪声为约束条件的SVM建模。这一步是本发明的关键。
当支持向量机的参数确定后,支持向量机的模型就可以通过前述的公式(1)至公式(3)计算自动确定。不同的自由参数将自动计算出不同的决策函数模型。从式(1)可知,这些自由参数包括ε-不敏感损失函数中的参数ε、惩罚(正则)参数C以及核函数的参数。比如我们采用得最多的高斯径向基核核函数
Figure GSB00000224887000131
γ>0,其中参数γ就是核函数参数。在这些参数如何选择能达到最好的建模效果问题上,目前没有结构化的方法,普遍采用的是交叉验证法和校验集的误差最小的方法。但交叉验证法是从分类问题借鉴过来的,效果并不好。而在训练集之外提供一个校验集的方法也存在问题,一个问题是,这个方法采用的还是传统的统计思想:使已知训练集上的误差最小,这与SVM中已得到很好验证的统计学习理论提出的SRM(Structral Risk Minimization)相悖;另一个问题是,这种方法在应用于时间序列建模及预测时,对非平稳时间序列不是很适用。
基于时间序列训练样本的建模和利用普通的训练样本的建模有一个很大的不同:普通的训练集中的样本点都是独立的,而在时间序列的训练样本点上通过相空间重构而形成的训练集中,训练样本点的目标值间存在着很大的相关性。简单地说,训练的目标,就是要找到一个函数,将其中的相关性信息提炼出来,剩余的残差应该是无法进一步提炼相关性信息的白噪声
Figure GSB00000224887000132
其中f(x)代表训练样本点的目标值,
Figure GSB00000224887000133
代表由相关性信息确定的模型的预测值,ε代表残差,是无法进一步提炼相关性信息的白噪声序列。
残差是指回归方程式的预测值和实际值的差距
Figure GSB00000224887000134
预测值为样本数据在回归方程式下的计算值,实际值为实际样本数据值。
一个时间序列如果是纯随机的,即任意>0的滞后阶数的相关系数都为0(当然滞后阶数为0时相关系数为1),这个随机序列就是白噪声。因为其谱密度为自相关系数的付氏变换,则此种随机序列谱密度为均匀的,这和白色的光谱一样,故称白噪声。
基于这一点,在用支持向量机进行训练样本的拟合时,可以直接以所得训练模型对训练样本的拟合残差是否为白噪声序列来决定回归方程式导出的训练模型是否最优。如果不是白噪声,说明要么拟合不够,原时间序列中还有相关性的信息没有提取出来;要么出现过拟合,一些信息多提取了导致残差出现伪相关。
白噪声的验证方法是:如果一个时间序列满足Zt~WN(0,σ2),则Zt的j阶自相关系数有所以验证训练集残差为白噪声的方法就是,计算其各阶相关系数是否为零,或者说是否不是显著非零,只有当各阶相关系数都不是显著非零才接受残差为白噪声的假设。一般采用的置信度是95%来检验该阶滞后系数是否显著非零,即若存在自相关系数满足
Figure GSB00000224887000142
则rj显著非零,表示该残差不是白噪声。当然,当阶数太高,其计算结果可能失去意义,一般认为检查至
Figure GSB00000224887000144
就可以了。
基于这一点,在用支持向量机进行训练样本的数据拟合训练时,可以直接以所得训练模型对训练样本的拟合残差序列是否为白噪声序列来决定模型是否最优。如果不是白噪声,说明要么拟合不够,原时间序列中还有相关性的信息没有提取出来;要么出现过拟合,一些信息多提取了导致残差出现伪相关。
因此,通过如下步骤实现对所述训练样本数据空间进行数据拟合,用残差白噪声来选取支持向量机模型。
步骤S2041、设置或调整支持向量机模型的自由参数值。
步骤S2042、根据所设置的自由参数值,按照结构风险最小化原则对训练样本数据进行训练建模,获得一个回归方程式M(i)作为建模结果。
步骤S2043、将训练样本数据的实际值与所得回归方程式M(i)下的计算值求差,得到残差序列,计算残差序列的自相关函数。
步骤S2044、根据所述残差序列的自相关函数计算结果,检查所述残差序列是否为白噪声序列,如果是,则所获得的支持向量机训练模型最优,输出该最优的支持向量机模型M(i)和对应的自由参数值,转步骤S205;否则如果不是白噪声序列,返回步骤S2041,重新设置自由参数的值,按照以上过程重新进行训练,直到获得最优的支持向量机训练模型。
步骤S205:使用所述最优支持向量机模型对待预测时间点上的数据进行预测,获得所述待预测时间点上的性能指标值正常波动范围。
利用得到的最优支持向量机模型对未来待预测时间点的指标值进行一步预测,并计算置信区间。
用所述的最优支持向量机训练模型和对应的自由参数进行一步预测,所述一步预测是指,以训练样本中的样本数据粒度间隔为步的单位预测下一个单位的同粒度的数据,如训练样本中的数据是以今天以前的1天为间隔的每天上午9:00的数据,一步预测指预测明天上午9:00的数据。所述一步预测的输入是指待预测时间点之前的m个时间点数据形成的m维输入向量,利用得到的模型进行计算,将得到的计算值作为待预测时间点上的性能指标预警基线值,并计算该基线值在指定置信度下的置信区间和在未来时刻的波动范围。
置信区间的估计过程是这样的:
如果一个时间序列上的样本点满足白噪声序列即Zt~WN(0,σ2),则一般认为其符合正态分布,σ为残差的标准差,。根据正态分布表,可计算在支持向量机训练模型下计算出的预测值在指定置信度下的置信区间为
Figure GSB00000224887000151
如若α=0.05,即置信度zα/2为95%,则其置信区间为
Figure GSB00000224887000152
若α=0.03即置信度为97%,则其置信区间为
Figure GSB00000224887000153
根据性能指标的预警基线值和该基线值在指定置信度下的置信区间,即可得到未来时刻的波动范围。
另外,本发明还提出了一种基于在线动态训练建模的性能指标值正常波动范围动态确定的方法,可以通过动态建模的方式达到连续地预测待预测时间点上的性能指标值。该方法认为,在一段时间内一个序列是平稳的,这种情况下已有模型可直接用于新的指标值和波动范围的预测。基于此,该在线动态建模方法在重新训练前,首先检查原模型是否可以继续适用,检查方法是将新的误差加入原残差序列,若仍然是白噪声,则认为已有模型仍然适用新的预测。只有当新的残差序列不再满足白噪声的假设时才进行重新训练和重新建模。使用该动态建模方法,可极大减少系统的训练建模负荷,提高预测的效率。
所述的基于动态训练建模的性能指标值正常波动范围动态确定方法的实现步骤是,在前述的步骤S101至S105基础上,还包括步骤S106,参见图3所示,描述如下:
步骤S101:获取网络性能指标的历史值,动态获取最新的历史样本数据;
步骤S102:对所述最新的历史样本数据进行预处理,获得正常样本数据;
步骤S103:对所述正常样本数据进行相空间重构,获得训练样本数据;
步骤S104:对所述训练样本数据进行训练,用残差白噪声来选取基于所述训练样本数据的最优支持向量机模型;
步骤S105:使用所述最优支持向量机模型对待预测时间点上的数据进行预测,并利用残差白噪声符合正态分布的特性来计算置信区间,从而获得所述待预测时间点上的性能指标值正常波动范围;
步骤S106:检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用则转步骤S101,重新获取样本数据进行重新训练,选取新的最优支持向量机模型,若适用转步骤S105,进行下一个待预测时间点数据的预测。
因此,为清楚地说明以上步骤,参见图4,在实施例一的基础上给出本发明的实施例二,实现步骤陈述如下:
步骤S201至步骤S205的实现过程同实施例一,不再赘述。
步骤S206:检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用则转步骤S201,重新获取样本数据进行重新训练,选取新的最优支持向量机模型,若适用转步骤S205,进行下一个待预测时间点数据的预测。
根据实际应用需求,性能指标的预测需要进行多次,例如今天预测明天的话务量波动范围,明天预测后天的话务量波动范围,理论上应该要用更新的样本数据空间来建模并预测,但从实用角度出发,为了提高预测效率,减少训练次数,也可以在当前的最优模型基础上,先检验当前最优模型是否适用继续预测,如果不适用,才重新建模训练。检验的方法是,每次根据待预测时间点在当前回归方程式下的计算值与实际值,计算新的残差
Figure GSB00000224887000171
加入原来的残差序列,进行白噪声检验,若是白噪声序列则表示使用当前回归方程式所约束的模型仍然适用该时间序列,当前的最优支持向量机模型可以继续用于下次预测,如果不是白噪声序列,则转步骤S201。
另外,除了一步预测的方法,还可以选择进行多步预测,但支持向量机的模型解析式(见背景技术中式(3))很复杂,是非线性的,所以多步预测时预测误差很难象ARMA算法那样用解析式表达,故本发明采用一步预测方法,以便同时计算预测值的置信度为1-α置信区间。所述ARMA(Auto Regression Moving Average)算法即自回归滑动平均法,是一种常用时间序列预测方法,但其仅适用于线性平稳时间序列建模及预测。
为了达到更好的建模效果,本发明还给出一个更为优化的实施例三来说明,如下所述。
本发明实施例三与上述实施例二的实现步骤类似,但S204中采用支持向量机回归算法的一个分支v-SVR,在该类支持向量机中不用直接设ε的值,而是通过设v的值来自动计算调整ε的值,v代表SVR中在ε带外的点的份额的上界,或者说是错误样本个数占总样本个数份额的上界,介于0到1之间。这样,需要设定的参数是γ、C和v。调整这几个参数的值来使得模型对训练样本的拟合残差为白噪声可编程实现,v-SVR和ε-SVR的算法公式类似,解法基本相同,由于篇幅原因在此不对算法再作进一步介绍,请参见由邓乃扬、田英杰编著的《数据挖掘中的新方法-支持向量机》中关于v-SVR的介绍(北京:科学出版社,2004.ISBN 7-03-013281-5)书中的6.3节。
以下是该实施例的具体实现步骤:
(1)从某省某交换机的管理数据库中,动态获取连续的话务量数据。取2007年3月1日开始的连续160天的运营话务量数据,截取每天上午9:00的数据,原始数据如下列表1所示。
表1:某MSC连续160天的每天9:00话务量数据,单位为爱尔兰
Figure GSB00000224887000181
(2)根据2007年3月1日开始的160天内的运营记录,没有查到有异常时间点的话务故障发生信息,因此,这一步不再对以上样本数据进行预处理,这些数据将作为正常样本数据。
(3)由于话务量数据具有以一周7天为单位的周期性特点,采用FPE方法计算出嵌入维数m=7,依此对上述数据进行时间序列的相空间重构。前160个数据为训练集,后面的数据是测试集,用于准备测试后面步骤中模型确定之后的模型有效性。
(4)对2007-3-19:00到2007-8-79:00形成的样本点数据为7维的训练数据进行支持向量机训练建模,并以残差为白噪声作为模型选择的依据。
a)初始化支持向量机模型的自由参数值g=0,c=0,v=0.1;//c代表惩罚参数,g即为γ代表核函数的参数
b)设置或调整支持向量机模型的自由参数值g=g+0.1;//设置参数γ的循环递增调整值;
c)设置或调整支持向量机模型的自由参数值c=c+1;//设置参数C的循环递增调整值;
d)在当前的g、c、v值下用SMO算法求解二次优化问题公式(2),求出自由参数后得到公式(3)的一个支持向量机训练模型M(i);
e)用模型M(i)对训练集样本点进行训练拟合,得到计算值i=1...(l-m),将训练样本数据的实际值与回归方程式M(i)下的计算值求差,然后求得各训练集样本点的残差
Figure GSB00000224887000192
i=1...(l-m),得到残差序列;
f)计算残差序列的自相关函数,如图5所示,计算阶数取20,即为图中的横坐标取值1至20,如果计算自相关系数满足下式
Figure GSB00000224887000193
Figure GSB00000224887000194
则自相关系数接近于0,意味着残差序列是白噪声,如图5所示纵坐标为相关系数的计算值,所示计算出的20个自相关系数介于图中两条横线之间;
g)根据所述残差序列的自相关函数计算结果,检验所述残差序列是否为白噪声序列,若残差是白噪声,则停止循环,如图5为g=0.7,c=1673时的残差序列自相关系数,首次检验到使残差为白噪声成立的自由参数值g=0.7,c=1673,则所获得的支持向量机训练模型M(i)最优,保存并输出所述最优的支持向量机训练模型M(i)和所对应的自由参数值g=0.7,c=1673。否则,若c<=Cmax(惩罚参数的最大值),则转入c)继续调整参数C,本实施例中Cmax=2000,若c>Cmax且g<=Gmax(核函数参数的最大值)则转入b)继续调整参数g。
(5)进行一步预测并计算预测值的置信区间和未来待测时间点的波动范围。对第161天的数据即2007-8-89:00的话务量进行一步预测,预测值
Figure GSB00000224887000201
为2301.3,残差的标准差为σ=52.9,故在置信度为95%的情况下置信区间为(2301.3-103.68,2301.3+103.68)=(2197.42,2404.98),由表1知,2007-8-89:00的话务量实际值为2228.08,落在置信区间内,说明预测值是比较可信的。
(6)检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用则转步骤(1),重新取样本数据重新训练,选取新的最优支持向量机模型,若适用转步骤(5),进行下一个待预测时间点数据的预测。
计算新的时间点在2007-8-8 9:00的残差是73.22,加入原残差序列并检验新残差序列是否为白噪声,若新残差仍然是白噪声,则表明原模型M(i)仍然适用于下一个待预测时间点2007-8-9 9:00话务量数据的预测,时间序列基本平稳,转入(5)可计算新的预测值及置信区间估计,获得2007-8-9 9:00话务量数据的正常波动范围。否则需重新训练模型。
重复这一过程,直到2007-9-7,利用2007-3-1到2007-8-7所建立的模型一直适用,只是在计算了2007-8-7的误差后再进行新的白噪声检验时才发现此时已不满足白噪声假设,所以需要重新训练。2007-8-8到2007-9-7的预测结果如表2-1至表2-3所示。
表2-1白噪声限制支持向量机的预测值与实际值对比表
Figure GSB00000224887000202
表2-2白噪声限制支持向量机的预测值与实际值对比表
表2-3白噪声限制支持向量机的预测值与实际值对比表
将2007-9-7的话务量计算的残差加入原残差序列后,发现已不是白噪声序列。所以需要重新训练,训练数据为2007-4-1 9:00:00到2007-9-7 9:00:00的160个数据,重复以上过程(4),在g=0.7,c=306,n=0.1时残差序列为白噪声,2007-9-8预测值为2188.4,残差标准差σ=60.7,实际值2084.79落在置信度为95%的置信范围内。并且该模型在后面的较长时间内适用。
由表2可以看出,预测的相对误差在10%以内,预测比较准确,而且因为这段时间网络正常,所以实际值全部落在置信区间内。而且当时间序列出现不平稳特性后,模型会及时被重新训练,实现了高效动态的话务量预测。
本发明还提供了一种性能指标值正常波动范围的动态确定装置,以执行上述方法流程。图6示出了该装置结构示意图。
该装置主要包括样本数据获取单元101,样本数据预处理单元102,训练样本获取单元103,模型选取单元104和性能指标波动范围预测单元105。
同时,本发明还提出了一种基于动态建模的性能指标值正常波动范围的动态确定装置,参见图7,包括样本数据获取单元101,样本数据预处理单元102,训练样本获取单元103,模型选取单元104,性能指标波动范围预测单元105,以及模型继续适用判断单元106。
参见图8,作为本发明技术方案的实施例四,说明性能指标值正常波动范围的动态确定装置的一种优化实现结构。
样本数据获取单元101,用于获取网络性能指标的历史值,动态获取最新的历史样本数据。该单元从网络性能指标库107中动态获取基于待预测时间点的性能指标历史样本数据,每个时间点最少选取过去一个月以上的历史数据,按照经验,少于一个月的数据一般难以保证统计结果的有效性。所述动态获取的实现可以是,根据对性能指标的预测需求,定期或接受指示信息后从网络性能指标库中获取最新历史数据,存储在最新历史数据缓冲区中,保持该缓冲区数据的滚动更新。
样本数据预处理单元102,用于对所述最新的历史样本数据进行预处理,得到正常样本数据。可以选择以下三种方式进行预处理过程:
方式一,根据运维故障管理系统中所显示的异常时间点,排除异常时间点的样本数据,保留反映变化规律的典型数据作为正常样本数据;
方式二,根据异常时间点的样本数据占整个样本数据的比例,删除最大和最小的数值,其余作为正常样本数据;
方式三,基于历史统计数据确定的正常数据比例,按照概率算法自动选出最为集中分布的数据作为正常样本数据。
训练样本获取单元103,用于对所述正常样本数据进行相空间重构得到训练样本数据。可以包括嵌入维数确定模块1031,用于根据FPE方法确定重构相空间的嵌入维数;还包括相空间重构模块1032,用于对所述正常样本数据进行相空间重构,得到训练样本数据。过程同实施例一的步骤203中所述,不再赘述。
模型选取单元104,用于对所述训练样本数据进行训练,用残差白噪声来选取基于所述训练样本数据的最优支持向量机模型。
可以进一步包括如下四个模块:
参数设置模块1041,用于预置或调整支持向量机模型的自由参数值;
训练建模模块1042,用于根据参数设置模块所设置的自由参数值,按照结构风险最小化原则对训练样本数据进行优化训练,获得一个回归方程式作为建模结果;
残差计算模块1043,根据训练建模模块得到的回归方程式计算该回归方程式下的计算值,与训练样本数据获取单元得到的样本数据的实际值进行比较求差,得到残差序列,计算残差序列的自相关函数;
白噪声检验及模型确定模块1044,用于检查残差计算模块所计算残差序列是否为白噪声序列,如果是,则所确定的支持向量机模型最优,输出该最优的支持向量机模型和对应的自由参数值,指示性能指标波动范围预测单元105完成对待预测时间点的数据预测;否则指示参数设置模块1041调整支持向量机模型的自由参数值准备重新训练。
性能指标波动范围预测单元105,接受指示预测的信息后,使用白噪声检验及模型确定模块1044获得的最优支持向量机模型,在待预测时间点上进行数据预测,并利用残差白噪声符合正态分布的特性来计算置信区间,从而获得所述待预测时间点上的性能指标值正常波动范围。可以通过如下三个模块来实现:
一步预测模块1051,使用白噪声检验及模型确定模块1044获得的最优支持向量机训练模型和对应的自由参数值,在待预测时间点进行一步预测,将得到的计算值作为待预测时间点上的性能指标预警基线值;
置信区间计算模块1052,计算所述性能指标预警基线值在指定置信度下的置信区间;
波动范围确定模块1053,根据一步预测模块得到的待预测时间点上的性能指标预警基线值,以及置信区间计算模块得到的置信区间,确定在待预测时间点上的波动范围。
参见图9,作为本发明技术方案的实施例五,说明基于动态建模的性能指标值正常波动范围的动态确定装置的基本实现结构。
在实施例四的实现技术方案基础上,添加模型继续适用判断单元106,用于检验所述最优支持向量机是否适用于下一个待预测时间点数据的预测,如果不适用则指示样本数据获取单元101基于下一个待预测时间点重新获取样本数据以重新建模,若适用则指示性能指标波动范围预测单元105继续预测下一个待预测时间点上的性能指标波动范围。
所述模型继续适用判断单元106可以进一步包括,
新残差计算模块1061,根据模型选取单元得到的最优支持向量机模型的回归方程式,在下一个待预测时间点上计算该回归方程式下的计算值,与训练样本数据获取单元得到的样本数据的实际值求差,将其加入原残差序列并更新为新残差序列,计算新残差序列的自相关函数。
白噪声检验及重新建模判断模块1062,用于检验新残差计算模块所得到的新残差序列是否为白噪声序列,如果是,则所述最优支持向量机模型仍然适用下一个待预测时间点的数据预测,指示性能指标波动范围预测单元105预测下一个待预测时间点上的性能指标波动范围,否则所述最优支持向量机模型不适用下一个待预测时间点的数据预测,指示样本数据获取单元101基于下一个待预测时间点重新获取样本数据以重新建模。
需要说明的是,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种性能指标值正常波动范围的动态确定方法,其特征在于,所述方法包括步骤:
01)获取网络性能指标的历史值,动态获取最新的历史样本数据;
02)对所述最新的历史样本数据进行预处理,获得正常样本数据;
03)对所述正常样本数据进行相空间重构,获得训练样本数据;
04)对所述训练样本数据进行训练,以残差白噪声为依据来选取基于所述训练样本数据的最优支持向量机模型;
05)使用所述最优支持向量机模型对待预测时间点上的数据进行预测,并利用残差白噪声符合正态分布的特性来计算置信区间,从而获得所述待预测时间点上的性能指标值正常波动范围;
其中,所述步骤04)包括:
A)设置支持向量机模型的自由参数值;
B)根据所设置的自由参数值,按照结构风险最小化原则对训练样本数据进行训练,获得一个回归方程式作为建模结果;
C)将训练样本数据的实际值与所得回归方程式下的计算值求差,得到拟合残差序列,计算残差序列的自相关函数;
D)根据所述残差序列的自相关函数计算结果,检验所述残差序列是否为白噪声序列,如果是,则所获得的支持向量机训练模型最优,保存并输出该模型和对应的自由参数值;否则如果不是白噪声序列,返回步骤A,重新设置自由参数的值,按照以上过程重新训练,直到获得最优的支持向量机模型。
2.根据权利要求1所述的性能指标值正常波动范围的动态确定方法,其特征在于,还包括步骤:
06)检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用则转步骤01)以重新训练,选取新的最优支持向量机模型,若适用则转步骤05)直接进行下一个待预测时间点数据的预测。
3.根据权利要求2所述的性能指标值正常波动范围的动态确定方法,其特征在于,获得所述待预测时间点上的性能指标值正常波动范围的过程包括:
用所述最优的支持向量机训练模型和对应的自由参数值进行一步预测,将得到的计算值作为待预测时间点上的性能指标预警基线值计算该基线值在指定置信度下的置信区间,从而获得在待预测时间点上的波动范围。
4.根据权利要求3所述的性能指标值正常波动范围的动态确定方法,其特征在于,检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测过程是,计算下一个待预测时间点上的残差,将其加入原残差序列并更新为新残差序列,若新残差序列仍然是白噪声序列,则所述最优支持向量机模型仍然适用下一个待预测时间点的数据预测,否则所述最优支持向量机模型不适用下一个待预测时间点的数据预测。
5.一种性能指标值正常波动范围的动态确定装置,其特征在于,所述装置包括,
样本数据获取单元,用于获取网络性能指标的历史值,动态获取最新的历史样本数据;
样本数据预处理单元,用于对所述最新的历史样本数据进行预处理,得到正常样本数据;
训练样本数据获取单元,用于对所述正常样本数据进行相空间重构得到训练样本数据;
模型选取单元,用于对所述训练样本数据进行训练,用残差白噪声来选取基于所述训练样本数据的最优支持向量机模型;
性能指标波动范围预测单元,使用所述最优支持向量机模型对待预测时间点上的数据进行预测,并利用白噪声符合正态分布的特性计算误差的置信区间,从而获得所述待预测时间点上的性能指标值正常波动范围;
其中,模型选取单元包括:
参数设置模块,用于预置或调整支持向量机模型的自由参数值;
训练建模模块,用于根据参数设置模块所设置的自由参数值,按照结构风险最小化原则对训练样本数据进行优化训练,获得一个回归方程式作为建模结果;
残差计算模块,根据训练建模模块得到的回归方程式计算训练数据在该回归方程式下的计算值,与训练样本数据获取单元得到的样本数据的实际值求差,得到拟合残差序列,计算残差序列的自相关函数;
白噪声检验及模型确定模块,用于检验残差计算模块所计算残差序列是否为白噪声序列,如果是,则所确定的支持向量机模型最优,输出设置的自由参数值和最优的支持向量机模型;否则转到参数设置模块,调整支持向量机模型的自由参数值,以重新训练。
6.根据权利要求5所述的性能指标值正常波动范围的动态确定装置,其特征在于,所述装置还包括,
模型继续适用判断单元,检验所述最优支持向量机模型是否适用于下一个待预测时间点数据的预测,如果不适用则指示样本数据获取单元基于下一个待预测时间点重新获取样本数据以重新建模,若适用则转到性能指标波动范围预测单元预测下一个待预测时间点上的性能指标波动范围。
7.根据权利要求6所述的性能指标值正常波动范围的动态确定装置,其特征在于,所述性能指标波动范围预测单元进一步包括,
一步预测模块,用所述最优支持向量机训练模型和对应的自由参数值对待预测时间点数据进行一步预测,将得到的计算值作为待预测时间点上的性能指标预警基线值;
置信区间计算模块,计算所述性能指标预警基线值在指定置信度下的置信区间;
波动范围确定模块,根据一步预测模块得到的待预测时间点上的性能指标预警基线值,以及置信区间计算模块得到的置信区间,确定在待预测时间点上的性能指标波动范围。
8.根据权利要求7所述的性能指标值正常波动范围的动态确定装置,其特征在于,所述模型继续适用判断单元进一步包括,
新残差计算模块,根据模型选取单元得到的最优支持向量机模型的回归方程式,在下一个待预测时间点上计算该回归方程式下的计算值,与训练样本数据获取单元得到的样本数据的实际值求差,将其加入原残差序列并更新为新残差序列,计算新残差序列的自相关函数;
白噪声检验及重新建模判断模块,用于检验新残差计算模块所得到的新残差序列是否为白噪声序列,如果是,则所述最优支持向量机模型仍然适用下一个待预测时间点的数据预测,指示性能指标波动范围预测单元预测下一个待预测时间点上的性能指标波动范围,否则所述最优支持向量机模型不适用下一个待预测时间点的数据预测,指示样本数据获取单元基于下一个待预测时间点重新获取样本数据以重新建模。
CN2008100979115A 2008-05-16 2008-05-16 一种性能指标值正常波动范围的动态确定方法及其装置 Active CN101267362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100979115A CN101267362B (zh) 2008-05-16 2008-05-16 一种性能指标值正常波动范围的动态确定方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100979115A CN101267362B (zh) 2008-05-16 2008-05-16 一种性能指标值正常波动范围的动态确定方法及其装置

Publications (2)

Publication Number Publication Date
CN101267362A CN101267362A (zh) 2008-09-17
CN101267362B true CN101267362B (zh) 2010-11-17

Family

ID=39989509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100979115A Active CN101267362B (zh) 2008-05-16 2008-05-16 一种性能指标值正常波动范围的动态确定方法及其装置

Country Status (1)

Country Link
CN (1) CN101267362B (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101771758B (zh) * 2008-12-31 2012-11-07 北京亿阳信通科技有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
CN101583147B (zh) * 2009-06-17 2011-01-05 哈尔滨工业大学 一种应用于话务量预测的分段在线支持向量回归方法
CN102111307B (zh) * 2009-12-29 2013-09-04 亿阳信通股份有限公司 网络风险监控方法和装置
CN102195814B (zh) * 2011-05-04 2013-11-20 成都勤智数码科技有限公司 一种利用相关性的it运维指标预报与预测方法和装置
CN103560925A (zh) * 2011-05-04 2014-02-05 成都勤智数码科技股份有限公司 利用相关性的it运维指标预报方法
CN102801548B (zh) * 2011-05-27 2015-11-04 腾讯科技(深圳)有限公司 一种智能预警的方法、装置及信息系统
CN102891761B (zh) * 2011-07-18 2017-08-11 中兴通讯股份有限公司 设备性能预测处理方法及装置
CN103200039B (zh) * 2012-01-09 2017-01-18 阿里巴巴集团控股有限公司 数据监控方法及装置
CN103236953A (zh) * 2012-10-30 2013-08-07 吉林大学 一种基于模糊时间序列预测模型的ip承载网性能指标主动监控方法
CN104125346A (zh) * 2013-04-27 2014-10-29 中国移动通信集团广东有限公司 语音质量的告警方法和装置
CN103746750B (zh) * 2013-08-23 2016-06-01 西华大学 无线电监测电磁态势预测系统
CN103840970B (zh) * 2014-01-24 2017-09-15 珠海多玩信息技术有限公司 一种获取业务运行状态的方法及装置
CN103744771A (zh) * 2014-01-28 2014-04-23 中国工商银行股份有限公司 一种监控主机性能基准偏差的方法、设备及系统
CN104537228B (zh) * 2014-12-23 2017-08-11 清华大学 基于残差熵和分层双支持向量机的玻璃窑炉温度预报方法
CN104640137B (zh) * 2015-01-30 2018-09-11 南京邮电大学 一种基于无线泛在网接入选择的QoE优化方法
CN105406991A (zh) * 2015-10-26 2016-03-16 上海华讯网络系统有限公司 基于网络监控指标由历史数据生成业务阈值的方法及系统
CN105517019B (zh) * 2015-12-17 2019-03-08 南京华苏科技有限公司 采用集成回归系统检测lte网络性能的方法
CN106908258A (zh) * 2015-12-23 2017-06-30 阿里巴巴集团控股有限公司 性能测试的方法及装置
CN106940701B (zh) * 2016-01-05 2021-06-29 阿里巴巴集团控股有限公司 一种指标预期期望动态更新方法、装置和系统
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
KR101687169B1 (ko) * 2016-04-06 2016-12-16 한전원자력연료 주식회사 반복 교차검증을 이용한 상관식 공차한계 설정시스템 및 그 방법
CN107357714B (zh) * 2016-05-09 2020-09-08 腾讯科技(深圳)有限公司 一种基于监控平台的故障分析方法和装置
CN107809766B (zh) * 2017-10-20 2021-03-19 北京神州泰岳软件股份有限公司 一种用于网络优化的机器学习样本的生成方法及装置
CN109842563A (zh) * 2017-11-24 2019-06-04 中国电信股份有限公司 内容分发网络流量调度方法、装置和计算机可读存储介质
WO2019109338A1 (en) * 2017-12-08 2019-06-13 Nokia Shanghai Bell Co., Ltd Methods and systems for generation and adaptation of network baselines
CN108718303B (zh) * 2018-05-09 2021-03-23 北京仁和诚信科技有限公司 安全运维管理方法及系统
CN108920310B (zh) * 2018-05-23 2022-05-03 携程旅游网络技术(上海)有限公司 接口数据的异常值检测方法及系统
CN109242133B (zh) * 2018-07-11 2022-03-22 北京石油化工学院 一种地表灾害预警的数据处理方法及系统
CN111258863B (zh) * 2018-12-03 2023-09-22 北京嘀嘀无限科技发展有限公司 数据异常检测方法、装置、服务器和计算机可读存储介质
CN111950822B (zh) * 2019-05-15 2024-03-29 上海杰之能软件科技有限公司 交通工具牵引变压器冷却系统的性能检测方法及装置、存储介质、终端
CN110390999B (zh) * 2019-06-10 2023-04-28 南京医基云医疗数据研究院有限公司 一种临床数据的值域计算方法、装置、可读介质及电子设备
CN110782045A (zh) * 2019-10-17 2020-02-11 成都四方伟业软件股份有限公司 一种运维告警系统动态阈值的生成方法及装置
CN111459746B (zh) * 2020-02-27 2023-06-27 北京三快在线科技有限公司 告警生成方法、装置、电子设备及可读存储介质
CN113495909A (zh) * 2020-04-06 2021-10-12 中信百信银行股份有限公司 客诉单量预警方法、装置、电子设备及存储介质
CN113722975B (zh) * 2020-12-28 2023-12-05 京东城市(北京)数字科技有限公司 网络模型训练方法、室温预测方法、装置、设备及介质
CN112651564A (zh) * 2020-12-29 2021-04-13 国网电力科学研究院武汉南瑞有限责任公司 基于机器学习的电力物联动态基线告警系统及方法
CN112905419B (zh) * 2021-03-02 2022-11-15 广州虎牙科技有限公司 指标数据监测阈值范围确定方法、装置和可读存储介质
CN113743738A (zh) * 2021-08-11 2021-12-03 湖北省食品质量安全监督检验研究院 食品安全风险等级区间预测的方法和装置
CN114091710B (zh) * 2022-01-20 2022-04-12 广东立升数字技术有限公司 一种全国维修维护技术支撑方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1588535A (zh) * 2004-09-29 2005-03-02 上海交通大学 嵌入式语音识别系统的自动语音识别处理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1588535A (zh) * 2004-09-29 2005-03-02 上海交通大学 嵌入式语音识别系统的自动语音识别处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩慧敏等.支持向量机在电信话务量预测中的应用分析.《科技创新导报》.2008,(第2期),第24页. *

Also Published As

Publication number Publication date
CN101267362A (zh) 2008-09-17

Similar Documents

Publication Publication Date Title
CN101267362B (zh) 一种性能指标值正常波动范围的动态确定方法及其装置
CN101771758B (zh) 一种性能指标值正常波动范围的动态确定方法及其装置
CN109587713B (zh) 一种基于arima模型的网络指标预测方法、装置及存储介质
CN104424598A (zh) 现金需求量预测装置与方法
CN109816221A (zh) 项目风险决策方法、装置、计算机设备和存储介质
CN111897673A (zh) 运维故障根因识别方法、装置、计算机设备和存储介质
CN103024762A (zh) 基于业务特征的通信业务预测方法
CN101888087A (zh) 一种在配网终端中实现分布式超短期区域负荷预测的方法
CN104468413B (zh) 一种网络服务方法及系统
KR20200128232A (ko) 전력 수요 예측 장치 및 그 방법
CN108964023A (zh) 一种用于电网的母线电压态势短期预测方法及系统
Zhu et al. Hybrid of EMD and SVMs for short-term load forecasting
Bhandari et al. An artificial intelligence ATM forecasting system for hybrid neural networks
CN111738507A (zh) 银行清算头寸资金备付量预测方法和装置、设备及介质
Sudipa et al. Trend Forecasting of the Top 3 Indonesian Bank Stocks Using the ARIMA Method
CN117578440A (zh) 一种基于神经网络的电网负荷预测方法
CN110740063B (zh) 基于信号分解和周期特性的网络流量特征指标预测方法
CN114037138A (zh) 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法
Pan et al. Study on short-term load forecasting of distributed power system based on wavelet theory
Lv et al. A traffic interval prediction method based on ARIMA
Stefenon et al. Hypertuned temporal fusion transformer for multi-horizon time series forecasting of dam level in hydroelectric power plants
CN109829115B (zh) 搜索引擎关键词优化方法
CN112529682B (zh) 一种基于数据建模现金配钞的方法、智能终端、存储介质
Wang et al. On-line traffic forecasting of mobile communication system
Yu et al. Network traffic analysis and prediction based on APM

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090918

Address after: Building 1, hi tech Development Zone, Songshan Road, Nangang District, Heilongjiang, Harbin Province, China: 150090

Applicant after: Bright Oceans Inter-Telecom Corporation

Co-applicant after: Beijing University of Posts and Telecommunications

Address before: Building 1, hi tech Development Zone, Songshan Road, Nangang District, Heilongjiang, Harbin Province, China: 150090

Applicant before: Yiyang Xintong Co., Ltd.

C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Yu Yanhua

Inventor after: Wang Haiqing

Inventor after: Song Junde

Inventor after: Pan Yangfa

Inventor after: Lin Chunting

Inventor after: Ren Zhijun

Inventor before: Yu Yanhua

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: YU YANHUA TO: YU YANHUA WANG HAIQING SONG JUNDE PAN YANGFA LIN CHUNTING REN ZHIJUN

C14 Grant of patent or utility model
GR01 Patent grant