发明内容
本发明目的在于提供一种电信网络普通节日话务量的预测方法和装置,对普通节日的话务量进行预测,并保证话务量预测的准确性。
一种电信网络普通节日话务量预测方法,所述方法包括下述步骤:
获取网络话务量的历史值作为历史样本数据,对所述历史样本数据进行预处理,获得正常样本数据;
针对所述的正常样本数据利用预测模型进行建模并预测;
利用方差分析法对所述正常样本数据进行节日话务量与平时话务量差异显著性检验;
若节日话务量与平时话务量的差异性显著,则对所述预测模型的预测值进行修正,得到最终预测值;否则,所述预测模型的预测值即为最终预测值。
具体的,获取普通节日网络性能指标的历史值作为历史样本数据,对所述历史样本数据进行预处理的过程具体为:
从网络性能指标库中动态获取基于时间序列的话务量历史值作为历史样本数据,至少选取过去一个月以上的历史样本数据;
对所述历史样本数据进行包括补足缺失数据的预处理。
更进一步的,利用方差分析法对所述正常样本数据进行节日话务量与平时话务量差异显著性检验的过程具体为:
根据以往n年的同期历史数据,n为正整数,计算以往n年中每年该节日的话务量与该节日前一天的话务量的比值,并将求得的所有比值组成一个节日列向量;
计算该节日前m周、后m周同期的相邻两天话务量的比值,m为正整数,求得这些比值的平均值,并将所述平均值作为另一个非节日列向量;
将所述两个列向量中的值作为节日与非节日两个水平的试验指标,利用单因素方差分析检验所述两个水平下的话务量差异是否显著。
更进一步的,对所述预测模型的预测值进行修正的方法具体为:
按所述预测模型计算往年该节日话务量的预测误差与预测值的比例来修正本年该节日的预测值。
优选的,修正本年该节日的预测值的方法具体为:
计算以往n年的同一节日话务量预测模型预测结果偏差与预测值的比例并将这些比例形成一个列向量D=[d1,d2,…,dn]T;
确定往年偏差的权重值并形成一个权重向量W=[w1,…,wn]T,求D与W两个向量的内积即得待预测节日的偏差d0=W·D;
设待预测节日根据预测模型的预测值为e0,计算e0+e0*d0的值作为待预测节日的话务量预测值。
优选的,可以使用ARIMA模型进行预测,针对所述的正常样本数据利用ARIMA模型进行建模并预测的过程具体为:
对所述正常样本数据进行季节差分处理得到平稳化的样本数据;
对所述进行季节差分处理后的样本数据建立ARMA(p,q)模型;
利用所述建立的ARMA(p,q)模型进行节日话务量预测。
具体的,对所述进行季节差分处理后的样本数据建立ARMA(p,q)模型还包括以下步骤:
设阶数p的初始值为1,从p=1开始利用ARMA(p,p-1)进行建模;
检测训练集上残差是否为白噪声,并记此时p值为p1;
从p=p1开始对ARMA(p,p-1)利用F检验法进行定阶。
本发明还公开了一种电信网络普通节日话务量预测装置,包括:
样本数据获取及预处理单元,获取网络话务量的历史值作为历史样本数据,对所述历史样本数据进行预处理,获得正常样本数据;
差异显著性检验单元,利用方差分析法,对所述样本数据获取及预处理单元获得的正常样本数据进行节日话务量与平时话务量差异显著性检验;
建模预测单元,针对所述样本数据获取及预处理单元获得的正常样本数据,利用预测模型进行建模并预测;
预测值修正及确定单元,根据所述差异显著性检验单元的检验结果,对所述建模预测单元的预测值进行处理,若差异性显著则对预测值进行修正,得到最终预测值;若差异性不显著则将所述建模预测单元的预测值确定为最终预测值。
具体的,所述的样本数据获取及预处理单元进一步包括:
样本数据获取模块,用于从网络性能指标库中动态获取基于时间序列的性能指标历史值作为历史样本数据,至少选取过去一个月以上的历史样本数据;
预处理模块,用于对所述样本数据获取单元获取的历史样本数据进行包括补足缺失数据的预处理。
更进一步的,所述的差异显著性检验单元进一步包括:
节日指标计算模块,用于根据所述预处理单元处理过的历史样本数据,计算以往n年中每年该节日的话务量与该节日前一天的话务量的比值,并将所述求得的所有比值组成一个节日列向量;
非节日指标计算模块,用于根据所述预处理单元处理过的历史样本数据,计算该节日前m周、后m周同期的相邻两天话务量的比值,求得这些比值的平均值,并将所述平均值作为另一个非节日列向量;
检验模块,用于将所述节日列向量和非节日列向量中的值作为节日与非节日两个水平的试验指标,利用单因素方差分析检验所述两种水平下的话务量差异是否显著,得出结论。
更进一步的,所述的预测值修正及确定单元进一步包括:
预测值修正模块:若所述差异显著性检验单元的检验结论为显著,根据建模预测单元预测的往年该节日预测话务量以及获取的往年该节日实际话务量,计算预测误差,用所述预测误差与预测值的比例来修正本年该节日的预测值;
预测值确定模块:若所述差异显著性检验单元的检验结论为显著,确定将预测值修正模块修正后的预测值为最终预测值,否则将所述建模预测单元的预测值确定为最终预测值。
优选的,所述的预测值修正模块进一步包括:
预测偏差比例计算模块,用于计算以往n年的同一节日话务量按预测模型预测结果偏差与预测值的比例,并将这些比例形成一个列向量D=[d1,d2,…,dn]T;
偏差值计算模块,用于确定往年偏差的权重值并形成一个权重向量W=[w1,…,wn]T,求D与W两个向量的内积即得待预测节日的偏差d0=W·D;
预测值修正计算模块,用于设待预测节日根据预测模型的预测值为e0,计算e0+e0*d0的值作为待预测节日的话务量预测值。
优选的,所述的建模预测单元进一步包括:
样本平稳化模块,用于对经过所述样本数据获取及预处理单元预处理过所述正常样本数据进行季节差分处理得到平稳化的样本数据;
建模模块,用于对经过所述样本平稳化单元差分处理过的平稳化样本数据建立ARMA(p,q)模型;
预测模块,用于根据所述建模单元建立的ARMA(p,q)模型进行节日话务量预测。
通过上述技术方案可知,本发明所述的电信网络普通节日话务量的预测方法,利用样本数据检验节日话务量与平时话务量差异是否显著,若差异性不显著则可以用根据样本数据建立的预测模型对该节日话务量进行预测;若差异性显著,则根据对检验模型的预测值进行修正,从而得到准确的节日预测值。本发明采用判断节日话务量水平与平时话务量水平的差异性的方法,来确定对该节日话务量预测的手段,达到了对具体时间段话务量情况进行具体分析的目的,使得对各种节日的预测区分更加精细化,这样,一方面可以加强电信网络的运营管理质量,通过普通节日话务量的预测,达到对话务量异常情况的分析目的,对于网管系统中性能主动监控有重要意义,另一方面也为话务市场营销带来数据参考值,设计更加满足客户需求的业务种类,争取到更多的潜在用户,从而进一步提高运营商的收入,提升服务管理水平。
具体实施方式
为使本发明实施例的目的、技术方案、及优点更加清楚明白,以下参照附图对本发明实施例提供的技术方案进行详细说明。
请参见图1,为本发明第一实施例提供的电信网络普通节日话务量的预测方法流程图,该方法包括如下步骤:
步骤S101:获取网络话务量的历史值作为历史样本数据,对所述历史样本数据进行预处理,获得正常样本数据。
从现有的网络管理系统中动态获取最新的历史样本数据,按照正常样本数据的规则排除异常样本数据。
步骤S102:针对所述的正常样本数据利用预测模型进行建模并预测。
建立的预测模型可以是现有技术中对话务量进行预测的模型,如ARIMA模型、神经网络模型、支持向量机模型等,只要预测模型在基于样本数据的训练集上的拟合效果良好(训练残差很小且训练残差为白噪声)即可。
步骤S103:利用方差分析法对所述正常样本数据进行节日话务量与平时话务量差异的显著性检验。
对正常样本数据进行节日话务量与平日话务量差异显著性检验的目的在于判断该节日话务量与平日的话务量有多大的差别,如情人节、母亲节、建军节、建党节等,其话务量既受一周“M”型话务量分布规律的支配,同时又受节日的影响,分析话务量在这两种情况的综合影响下所呈现的特点,就可以利用方差分析来判别。
需要说明的是,以上步骤S102和S103的先后顺序是可以调换的。
步骤S104:若节日话务量与平时话务量的差异性显著,则对所述预测模型的预测值进行修正,得到最终预测值;否则,所述预测模型的预测值即为最终预测值。
若差异不显著,则说明该节日话务量和往日话务量的差别不大,直接用预测模型的预测值即可,其节日特性可忽略。而对于与平时话务量差异性显著的节日,则需在预测模型预测值的基础上进行适当修正,以涵盖其因为节日特性而产生的话务量变化。
以上实施例说明了根据差异显著性检验的结果,利用预测模型和对预测值进行修正的方法实现普通节日话务量预测的过程。
如图2所示,为进一步说明如何获取历史样本数据,以及对历史样本数据进行预处理的过程,给出本发明的实施例二,包括如下步骤:
步骤S201:从网络性能指标库中动态获取基于时间序列的话务量历史值作为历史样本数据,至少选取过去一个月以上的历史样本数据。
从网络性能指标库中动态获取基于时间序列的历史样本数据,每个时间点最少选取过去一个月以上的历史数据。
步骤S202:对所述历史样本数据进行包括补足缺失数据的预处理。
样本数据的预处理过程可以包括以下三种方式的选择:
方式一,结合运维期间发现的故障、或者节日、重大事件等有关情况,确定异常时间点的样本数据,并将异常点排除,保留反映变化规律的典型数据作为正常样本数据。
方式二,根据异常时间点的样本数据占整个样本数据的比例,删除最大和最小的数值,其余作为正常样本数据。
方式三,基于历史统计数据确定的正常数据比例,按照概率算法自动选出最为集中分布的数据作为正常样本数据。
步骤S203:针对所述的正常样本数据利用预测模型进行建模并预测。
步骤S204:利用方差分析法对所述正常样本数据进行节日话务量与平时话务量差异显著性检验。
步骤S205:若节日话务量与平时话务量的差异性显著,则对所述预测模型的预测值进行修正,得到最终预测值;若节日话务量与平时话务量的差异性不显著,则所述预测模型的预测值即为最终预测值。
如图3所示,以下给出实施例三,进一步清楚地说明如何利用方差分析法对正常样本数据进行节日话务量与平时话务量差异显著性检验的方法。
步骤S301:根据以往n年的同期历史数据,n为正整数,计算以往n年中每年该节日的话务量与该节日前一天的话务量的比值,并将求得的所有比值组成一个节日列向量。
如要预测2008年母亲节的话务量,要确定其话务量与平时差异的显著性,在n=3时则取2007、2006、2005年的每年4、5、6月的话务量数据,并计算以往3年中该节日的话务量与之前一天的话务量的比值,将这些比值组成一个节日列向量。
2007年,查数据库知其母亲节是5/13日,则首先求取该日话务量与其前一天话务量的比值:话务量(5-13)/话务量(5-12);还需要分别计算出2006年、2005年每年母亲节当日与前一日的话务量比值,将这些比值组成一个节日列向量。
步骤S302:计算该节日前m周、后m周同期的相邻两天话务量的比值,m为正整数,求得这些比值的平均值,并将所述平均值作为另一个非节日列向量。
计算该节日前m周、后m周同期相邻两天话务量比值的平均值。设m=3,则求其前三周与其后三周同期相邻两天话务量比值的平均值,还以2007年母亲节为例,考虑到母亲节前面的3个周末都受到五一放假的影响,故其前m周的同期还要前推3周,亦即求:话务量(4-22)/话务量(4-21)、话务量(4-15)/话务量(4-14)、话务量(4-8)/话务量(4-7)这3个比值,另外求母亲节后的3周的同期比值,亦即求:话务量(5-20)/话务量(5-19)、话务量(5-27)/话务量(5-26)、话务量(6-3)/话务量(6-2)。然后求这6个比值的平均值作为2007年与母亲节日期特征类似的平时的话务量的代表,并将这个平均值作为另一个非节日列向量。
一般来说,日话务量数据呈现很强的以7天为周期的周期性,而且,每个周期内亦即周一到周日内的话务量呈现很强的线性相关性,基本上来说,是呈M型的。所以,正常情况下每个周日和周六的比值应该是基本相同的。如果母亲节的影响显著,则会使得其周日和周六的比值呈现出和平常的比值的显著不同。因此不直接取话务量的值,而是用比值来代替可以使得差异性的判断更加准确,以确保最终预测值的准确性。
取n年每年附近同期比值的平均值作为另一个列向量,是因为如果只取一年作为样本,即使有显著不同,这也可能只是一个随机的事件,但如果取多年的数据,其是否与平常有显著不同则可以得到验证。
步骤S303:将所述两个列向量中的值作为节日与非节日两个水平的试验指标,利用单因素方差分析检验所述两个水平下的话务量差异是否显著。
将话务量作为试验指标,节日与否作为可能影响试验指标值的因素,节日与非节日分别是该因素的两个水平,利用单因素方差分析检验两种水平下的话务量差异是否显著。
对于预测2008年母亲节来说,我们取到的2005年到2007年的母亲节与平时的话务量情况的两种比值如表1所示:
表12005到2007年母亲节与前一天的话务量比值与平时的同期比值
根据该数据进行单因素方差分析,则
(1)总偏差平方和
其中,
s代表影响试验指标的因素水平个数,本应用中s=2。n
j代表第j个水平下独立试验的次数,本应用中j=1...2,n
1=n
2=3。
试验误差平方和
其中,
(2)偏差平方和
(3)检验以上两个水平是否显著不同,有以下两个假设:
H0:两个水平相同,两个水平下的均值相同μ母=μ平.
H1:μ母≠μ平。
则,若有H0成立,则有下式成立:
其中
在该实验中F=15.394>F0.05=7.71。表示在显著性水平α=0.05下,拒绝假设H0,亦即认为母亲节的话务量与平时的话务量是有显著性的差异的。
而对于2005年到2007年父亲节,节日的比值与平时的比值如表2所示。
表22005年到2007年父亲节与前一天的话务量比值与平时的同期比值
F=1.128<F0.05(1,4)=7.71,也小于F0.10(1,4)=4.54。故父亲节的话务量与平时的话务量差异不显著。
如图4所示,为了进一步说明完整的普通节日话务量预测方法和对话务量预测值进行修正的方法,给出本发明的实施例四。
步骤S401:获取网络话务量的历史值作为历史样本数据,对所述历史样本数据进行预处理,获得正常样本数据。
步骤S402:针对所述的正常样本数据利用预测模型进行建模并预测。
步骤S403:利用方差分析法对所述正常样本数据进行节日话务量与平时话务量差异显著性检验,若差异性显著则进入步骤S405,否则进入步骤S404。
步骤S404:按照预测模型得到的预测值确定为最终预测值。
步骤S405:按所述预测模型计算往年该节日话务量的预测误差与预测值的比例,修正本年该节日的预测值,确定修正后的预测值为最终预测值。
采用判断节日话务量水平与平时话务量水平的差异性的方法,来确定对该节日话务量预测的手段,达到了对具体时间段话务量情况进行具体分析的目的,使得对各种节日的预测区分更加精细化,可以大大提高电信网络电信管理质量。
下面进一步说明对预测值的修正方法,如图5所示,优选的,这里采用线性修正方法,包含步骤:
步骤4051:按预测模型计算过往n年的同一节日话务量预测结果偏差与预测值的比例为d1,...di,...,dn。
即根据往年该节日的话务量预测的误差与预测值的比例来修正本年的该节日的预测值。考虑到每年都有一些随机因素,该修正比例因子采用计算该比例的线性加权和。具体如下。
di表示从本年开始前推第i年的偏差比例,且有
其中yi表示本年前推第i年的实际话务量,而
则表示前推第i年的话务量的预测值。将该n个偏差比例组成一个向量D=[d1,d2,…,dn]
T。
步骤4052:确定往年预测偏差的权重值并形成一个权重向量W=[w1,…,wn]T,求D与W两个向量的内积即得待预测节日的偏差d0=W·D。
利用过往n年的偏差比例来求得今年的偏差比例d0时,算法可以根据实际情况来设置,例如可以利用多年的偏差比例数据,形成一个比例值的时间序列,来求一个比例值间的自回归模型AR(p),用极大似然估计或最小二乘估计来求参数值。
在历史数据不是很多时,也可以采用相对简单的算法。例如按照从近到远递减的方法确定权重值w1,...,wi,...wn,并形成一个权重向量W=[w1,…,wn],然后求D与W两个向量的内积即得修正比例d0=W·D。
步骤4053:设待预测节日根据预测模型的预测值为e0,计算e0+e0*d0的值作为待预测节日的话务量预测值。
用预测模型来求得待预测节日的话务量e0,当检测到该节日的话务量与平时差异性显著时,则需对该预测值e0进行修正,修正采用比例修正法。由步骤4052得,本年的话务量的误差值与预测值的比例为d0,则在预测值e0的基础上做比例为d0的修正,修正公式为:
。
优选的,对于电信网络普通节日话务量的预测模型,可以选用季节ARIMA模型进行建模和预测,以体现季节ARIMA模型预测的准确性,下面给出实施例五,用以说明使用ARIMA模型进行预测,针对所述的正常样本数据利用ARIMA模型进行建模并预测的过程。如图6所示:
步骤S501:对所述正常样本数据进行季节差分处理得到平稳化的样本数据。
步骤S502:对所述进行季节差分处理后的样本数据建立ARMA(p,q)模型。
在建立ARMA(p,q)模型时,需要确定模型的阶数,确定目前模型定阶的方法中,残差平方和方法的主观性很强,适于粗略估计,无法精确建模。AIC定阶方法在使用时存在所定模型阶数大于实际阶数的问题,BIC定阶方法则存在所定模型阶数小于实际阶数的问题。本实施例中利用F检验进行模型定阶,该方法可用程序来实现自动定阶。
从ARMA(p,q)形式可知,对于ARMA(p,q)来说,与该模型最近的模型可以是ARMA(p+1,q),也可以是ARMA(p,q+1),但显然,这两种待检验模型的区别是很大的,而现有技术中已提出的ARMA(p,p-1)从理论上证明:它可以任意精度逼近任意线性平稳序列,从而代替ARMA(p,q)进行任意线性平稳序列建模。利用该模型框架建模,关键问题就是要找到合适的p值,因此实施例采用F检验法针对训练样本数据进行ARMA(p,p-1)模型的计算机自动定阶,实现利用ARMA(p,p-1)模型进行建模。
步骤S503:利用所述建立的ARMA(p,q)模型进行节日话务量预测。
如图6所示,更进一步地说明实施例五中步骤S502的建模过程。
步骤S5021:设阶数p的初始值为1,从p=1开始利用ARMA(p,p-1)进行建模。
从p=1开始检验,即先检验模型ARMA(1,0)的建模效果。
步骤S5022:检测训练集上残差是否为白噪声,并记此时p值为p1。
用ARMA(p,p-1)模型进行平稳数据建模,并检测残差是否为白噪声,若不是则返回步骤S5022,令p=p+1再次建模检测,重复以上过程直到残差确认为白噪声时,计算其残差平方和Q1。
步骤S5023:从p=p1开始对ARMA(p,p-1)利用F检验法进行定阶。
p=p+1再次建模,并计算训练数据残差平方和Q0,利用ARMA(p,p-1)下的训练残差平方和Q1与ARMA(p,p-1)下的训练残差平方和Q0进行2种模型下训练残差是否显著不同的检验,零假设H0:模型ARMA(p-1,p-2)和ARMA(p,p-1)是无差别的。H1:拒绝零假设。
检验的方法是F检验法:若H0成立,则其中N为训练集样本点数。亦即F的值满足自由度为n1=2,n2=N-p-q的F分布。选择一个合适的显著性水平α,比如令α=0.05,则若计算所得F>Fα(2,N-2p+1)则在该显著性水平下应该拒绝H0,表示ARMA(p,p-1)与ARMA(p-1,p-2)是显著不同的,ARMA(p,p-1)比ARMA(p-1,p-2)是更优的模型。
当然ARMA(p,p-1)是否就是最合适的模型还要用同样的方法和过程-升阶,求残差平方和,F分布检验差别是否显著-来判断,直到升阶后差别不显著,最后选定模型阶数为p-1。
如图7所示,下面结合实例给出本发明的实施例六,用以说明整个普通节日话务量预测的详细过程。
以某话务量大省2008年母亲节的日话务量预测为例。表3中数据为2008年母亲节前(最后一天为母亲节实际话务量)38天的话务量数据(5月1日和5月2日数据为修正值)。
步骤S601:获取母亲节日前38天(含母亲节)的话务量数据作为历史样本数据,并对这些数据进行预处理,获得正常样本数据。如表3所示:
表3某省话务量历史样本数据(单位:爱尔兰)
根据2008年4月、5月的运营记录,没有查到有异常时间点的话务故障发生信息,因此不再对以上样本数据进行预处理,这些数据将作为正常样本数据。
步骤S6021:对正常样本数据求时间序列的自相关函数,得到平稳化的样本数据。
求该时间序列的自相关函数,参见图8,在滞后阶数为7、14处,自相关系数的值显著非零,表示该时间序列存在以7天为周期的季节性。进行s=7的季节差分,实现原序列的平稳化处理。
步骤S60221:设阶数P的初始值为1,从ARMA(1,0)开始建模。
对差分后序列定阶,从ARMA(1,0)开始建模。
步骤S60222:检测训练集上的残差进行是否是白噪声,将此时的p记为p1,若检验残差不是白噪声,则返回步骤S60222继续进行检验,直到残差确认为白噪声时,计算其残差平方和Q1。
采用检验残差序列的自相关系数是否全部为0的方法,由图9可见,ARMA(1,0)的训练集残差的自相关系数全部小于即全部是非显著非零的,判断该序列为白噪声序列,计算其残差平方和Q1。
步骤S60223:从p=p1开始对ARMA(p,p-1)利用F检验法进行定阶。
计算ARMA(2,1)模型在训练集的残差Q0,并计算F值。得F=10.126146>F0.05(2,34)=3.276,认为这两个模型是显著不同的,ARMA(2,1)是比ARMA(1,0)更优的模型。用同样的方法检验ARMA(3,2)是否比ARMA(2,1)更优,此时F值为10.008>F0.05(2,32)=3.295,认为ARMA(3,2)与ARMA(2,1)显著不同,且ARMA(3,2)比ARMA(2,1)更优。用ARMA(4,3)建模,求得此时F值:F=1.12<F0.10(2,30)=2.49。则认为在比较小的显著性α=0.1时ARMA(4,3)和ARMA(3,2)也是没有显著不同的。认为ARMA(3,2)是差分后序列合适的模型。用极大似然估计法求得模型的参数。如下表4所示:
表4对表3中数据差分后的ARMA(3,2)模型的参数值
|
φ1 |
φ2 |
φ3 |
AR参数 |
0.54503932 |
-0.09234649 |
-0.37535465 |
|
θ1 |
θ2 |
|
MA参数 |
-1.2453558 |
-0.7091105 |
|
步骤S6023:根据ARMA(3,2)模型进行话务量预测,得出预测值e0。
用ARMA(3,2)该模型(将表4中的参数带入公式:
求得一步预测值-2970.853,然后做s=7差分的逆运算即该值与上周同一天(周日)的话务量396765.8789求和,得2008年母亲节的日话务量预测值为336648.953。
步骤S6031:根据以往3年的同期历史数据,计算以往3年中每年母亲节的话务量与该节日前一天的话务量的比值,并将求得的所有比值组成一个节日列向量。
取2007、2006、2005年的每年4、5、6月的话务量数据,并计算以往3年中该节日的话务量与之前一天的话务量的比值,将这些比值组成一个节日列向量。延用实施例三中的实例,2007、2006、2005三年的节日比值分别为:0.927073、0.937073、0.956462。
步骤S6032:计算该节日前3周、后3周同期的相邻两天话务量的比值,求得这些比值的平均值,并将所述平均值作为另一个非节日列向量。
延用实施例三中的实例,2007、2006、2005三年的非节日比值分别为:0.906140017、0.904833186、0.88886。
步骤S6033:将所述两个列向量中的值作为节日与非节日两个水平的试验指标,利用单因素方差分析检验所述两个水平下的话务量差异是否显著。若差异性不显著则进入步骤S604,若差异性显著则进入步骤S6051。
对于预测2008年母亲节的话务量,需要计算2005年至2007年的母亲节与平时的话务量情况的两种比值。对节日比值和非节日笔记数据进行单因素方差分析,并通过假设检验,得到F=15.394>F0.05=7.71。表示在显著性水平α=0.05下,拒绝假设H0,亦即认为母亲节的话务量与平时的话务量是有显著性的差异的,其检验的具体过程如实施例三中具体所示,不再赘述。
步骤S604:将模型预测值e0直接确定为最终预测值。结束流程。
步骤S6051:计算过往n年的同一节日话务量预测模型预测结果偏差与预测值的比例为d1,...di,...,dn。
步骤S6052:确定往年偏差的权重值并形成一个权重向量W=[w1,…,wn]T,求D与W两个向量的内积即得待预测节日的偏差d0=W·D。
对于本例中2008年母亲节的话务量数据,求得过往三年的偏差比例向量D=[0.054 0.11 0.071]T,因为其数据仓库系统建立时间不久,历史数据比较少,所以可以采用由近到远权值递减的方法,令W=[0.5 0.35 0.15]。则2008年母亲节的预测偏差比例值为d0=(W·D)=0.076。
步骤S6053:计算e0+e0*d0的值作为待预测节日的话务量预测值,并将其作为最终预测值。结束流程。
本例中母亲节的日话务量的初步预测值为e0=336648.953,而修正比例因子d0=0.076,则有e0+e0*d0=362234.273428。根据表3中的实际值361575.091,修正后的预测误差绝对值为659.182428,相对值为0.2%,预测精度很高。
同样的,对于那些差异性并不显著的节日来说,例如实施例三中经过验证的父亲节,其话务量的预测就不需要进行修正,直接根据预测模型得到的预测值即可。通过对不同节日进行差异性验证,将节日的话务量差别划分的更加细致,通过对差异性显著的节日话务量预测值进行修正,提高了话务量预测的准确性,对网管话务量监控方面有着积极的作用。
本发明实施例同时还公开了一种电信网络普通节日话务量的预测装置,其结构如图10所示,包括:
样本数据获取及预处理单元101,用于获取网络话务量的历史值作为历史样本数据,对所述历史样本数据进行预处理,获得正常样本数据。
差异显著性检验单元102,利用方差分析法,对所述样本数据获取及预处理单元101获得的正常样本数据进行节日话务量与平时话务量差异显著性检验。
建模预测单元103,针对所述样本数据获取及预处理单元101获得的正常样本数据,利用预测模型进行建模并预测。
建立的预测模型可以是现有技术中对话务量进行预测的模型,如ARIMA模型、神经网络模型、支持向量机模型等,只要预测模型可以预测并得到话务量预测值即可。
预测值修正及确定单元104,根据所述差异显著性检验单元102的检验结果,对所述建模预测单元103的预测值进行处理,若差异性显著则对预测值进行修正,得到最终预测值;若差异性不显著则将所述建模预测单元的预测值确定为最终预测值。
优选的,样本数据获取及预处理单元101还可以进一步包括:
样本数据获取模块,用于从网络性能指标库中动态获取基于时间序列的性能指标历史值作为历史样本数据,至少选取过去一个月以上的历史样本数据。
预处理模块,用于对所述样本数据获取单元获取的历史样本数据进行包括补足缺失数据的预处理。
按照正常样本数据的规则排除异常样本数据,预处理过程可以包括以下三种方式的选择:
方式一,结合运维期间发现的故障、或者节日、重大事件等有关情况,确定异常时间点的样本数据,并将异常点排除,保留反映变化规律的典型数据作为正常样本数据。
方式二,根据异常时间点的样本数据占整个样本数据的比例,删除最大和最小的数值,其余作为正常样本数据。
方式三,基于历史统计数据确定的正常数据比例,按照概率算法自动选出最为集中分布的数据作为正常样本数据。
为详细说明所述差异显著性检验单元102的实现机理,如图11所示为本发明实施例八,所述差异显著性检验单元102可以进一步包括,
节日指标计算模块1021,用于根据所述预处理单元处理过的历史样本数据,计算以往n年中每年该节日的话务量与该节日前一天的话务量的比值,并将所述求得的所有比值组成一个节日列向量。
非节日指标计算模块1022,用于根据所述预处理单元处理过的历史样本数据,计算该节日前m周、后m周同期的相邻两天话务量的比值,求得这些比值的平均值,并将所述平均值作为另一个非节日列向量。
检验模块1023,用于将所述节日列向量和非节日列向量中的值作为节日与非节日两个水平的试验指标,利用单因素方差分析检验所述两种水平下的话务量差异是否显著,得出结论。
利用单因素方差分析检验两种水平下的话务量差异是否显著的具体过程,在上面方法的论述中已有详细说明,因此不再赘述。
如图12所示,为了详细说明所述预测值修正及确定单元104的实现机理,所述预测值修正及确定单元进一步包括:
预测值修正模块1041,若所述差异显著性检验单元的检验结论为显著,根据建模预测单元预测的往年该节日预测话务量以及获取的往年该节日实际话务量,计算预测误差,用所述预测误差与预测值的比例来修正本年的该节日的预测值;
预测值确定模块1042,若所述差异显著性检验单元的检验结论为显著,确定将预测值修正模块修正后的预测值为最终预测值,否则将所述建模预测单元的预测值确定为最终预测值。
优选的,预测值修正模块1041进一步包括:
预测偏差比例计算模块,用于计算以往n年的同一节日话务量按预测模型预测结果偏差与预测值的比例,并将这些比例形成一个列向量D=[d1,d2,…,dn]T。
偏差值计算模块,用于确定往年偏差的权重值并形成一个权重向量W=[w1,…,wn]T,求D与W两个向量的内积即得待预测节日的偏差d0=W·D。
预测值修正计算模块,设待预测节日根据预测模型的预测值为e0,计算e0+e0*d0的值作为待预测节日的话务量预测值。
对于预测值修正的具体实现过程在上述方法部分已有详细说明,在此不再赘述。
如图13所示,优选的,可以选用季节ARIMA模型进行建模和预测,因此建模预测单元103进一步包括:
样本平稳化模块1031,用于对经过所述样本数据获取及预处理单元预处理过所述正常样本数据进行季节差分处理得到平稳化的样本数据;
建模模块1032,用于对经过所述样本平稳化单元差分处理过的平稳化样本数据建立ARMA(p,q)模型;
预测模块1033,用于根据所述建模单元建立的ARMA(p,q)模型进行节日话务量预测。
具体的ARIMA建模过程,与上述方法描述类似在此不再赘述。由于季节ARIMA模型与话务量的季节性变化非常吻合,因此采用季节ARIMA模型进行话务量预测,可使得预测结果更加准确。
以上所公开的实施例说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改变换对本领域的专业技术人员来说将是显而易见的,本文中所定义的原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。