CN102629299A - 一种基于计算智能的时间序列多步预报方法 - Google Patents

一种基于计算智能的时间序列多步预报方法 Download PDF

Info

Publication number
CN102629299A
CN102629299A CN2012100674804A CN201210067480A CN102629299A CN 102629299 A CN102629299 A CN 102629299A CN 2012100674804 A CN2012100674804 A CN 2012100674804A CN 201210067480 A CN201210067480 A CN 201210067480A CN 102629299 A CN102629299 A CN 102629299A
Authority
CN
China
Prior art keywords
algorithm
forecast
time series
fitness
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100674804A
Other languages
English (en)
Inventor
胡亮
车喜龙
赵阔
初剑锋
张猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN2012100674804A priority Critical patent/CN102629299A/zh
Publication of CN102629299A publication Critical patent/CN102629299A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于计算智能的时间序列多步预报方法。使用基于全局最值缩放策略和散点向量化策略对时间序列进行预处理;使用基于计算智能的建模策略,建模过程通过样本训练来实现;使用适应度函数作为算法的评价标准;适应度与精度、效率之间存在反比例关系,且支持精度优先与效率优先;提出了预报算法的参数选择策略与样本特征选择策略,将组合选择策略编码为实数与二进制的混合向量,同时进行预报算法的参数选择与样本特征选择。本发明根据时间序列的变化规律寻求未来发展趋势,可广泛应用于科研、工业、农业、商业等各个领域,优点如下:高精度,高效率,支持未来多步预报,方法具有通用性,对数据有自适应性,能够全程自动化实现。

Description

一种基于计算智能的时间序列多步预报方法
技术领域
本发明属于时间序列分析的主要组成部分,涉及使用计算智能方法预报时间序列的未来变化情况。该方法根据时间序列的变化规律寻求未来发展趋势,可广泛应用于科研、工业、农业、商业等各个领域,例如:金融预报、大气污染预报、电力预报、产量预报、水位预报、灾难预报、等等。
以大气污染预报为例,给出一个典型的应用场景:已知某大气污染观测站连续3年(36个月)的历史记录X={x1,x2,x3,…x36},X中的每一个元素表示当月平均大气污染指数,需要对第4年中每个月的平均大气污染指数进行预报。本发明所公开的方法十分适合解决此类问题,且具有领域无关性,因此具有推广意义。
背景技术
时间序列预报是时间序列分析的主要组成部分,它根据事物的变化规律寻求未来发展趋势,在科研,工业,商业等各个领域中发挥着重要作用。随着社会生产和人们生活的不断发展,传统的时间序列预报技术已经无法满足实际预报问题的需要,新的预报求解算法必须同时满足以下条件:
1)更低的预报误差;
2)更快的预报速度;
3)“支持未来单步预报”升级为“支持未来多步预报”;
4)算法能够自动化的进行智能调整以适应数据的变化规律。
针对时间序列预报的问题,国内外提出了一些解决方案:
(1)线性时间序列方法
将时间序列变化过程看成是线性回归过程。最具代表性的是Box-Jenkins线性时间序列算法,又称AR族算法,包括AR(purely autoregressive),MA(purely moving average),ARMA(autoregressive moving average),ARIMA(autoregressive integrated moving average),andARFIMA(autoregressive fractionally integrated moving average)。后来又有学者将算法的残差进行二次建模,为AR族增添了ARCH(autoregressive conditional heteroskedasticity)以及GARCH(generalized autoregressive conditional heterosjedasticity)等。AR族算法涵盖的范围较广,其它线性算法如Markov过程,Mean/Median过程等都可以部分或全部用AR族算法来表达。线性时间序列方法的优点是效率较高,主要不足之处在于:所有算法的建立都以线性作为前提条件,而实际问题往往是非线性的,因而用线性算法概括其变化规律,难以获得准确结果。
(2)小波分析方法
将时间序列变化过程看成是多重波形的迭加过程。根据事件发生的周期性来预报将来要发生的事件。优点是对周期性的行为预报较好,自适应性强。缺点是不适合随机性应用,所以这种方法通常无法单独完成预报任务,需要与其他技术相结合使用。
(3)随机信息方法
将时间序列变化过程看成是随机过程。这种方法认为时间序列信息是正态分布的。然而在实际应用中,数据信息不可能完全服从正态分布,如果把它改成区间分布,即时间序列预报值是这个区间的一个随机值,这种方法的可靠性将会有所提高。优点是简单,直观,快速。局限性是区间算法的前提是区间上值的分布必须是统一的,这在实际应用中完全无法满足。
(4)人工神经网络方法
人工神经网络(Artificial Neural Network)具有强大的自学习功能,通过适当的训练就能准确获得时间序列特征并产生预报。这种预报本质上具有并行分布式处理结构,适用于多信息融合,可同时综合定量,定性信息,具有鲁棒性。人工神经网络已经被很多研究用于时间序列预报。众多研究表明人工神经网络预报要比传统的线性时间序列预报方法更加精确。然而,人工神经网络的学习过程比较复杂,算法参数的确定过程难以规范化,算法拟合速度慢,而且容易陷入局部极小。
(5)支持向量机方法
支持向量机(Support Vector Machine,SVM)以其良好的泛化性,凸集上最优值的唯一性,以及解的稀疏性等优点,成为多种非线性问题的首选解决方法。传统的回归技术,包括神经网络方法在内,都是基于经验风险最小化(Empirical Risk Minimization,ERM)原则,这就不可避免会出现算法过拟合和欠拟合风险;而SVM则是基于结构风险最小化(Structural RiskMinimization,SRM)原则,它同时控制算法复杂度与泛化风险,而非仅仅控制训练误差。因而与传统方法相比,SVM有望获得更好的性能。众多研究验证了SVM用于时间序列预报的可行性。不过SVM算法中存在多个参数,参数的选择过程难以规范化,不支持样本特征的选择,而且其向量化操作的要求也提高了其应用门槛。
总之,现有的时间序列预报方法无法满足实际预报问题的需要,亟待低误差、高效率、自动化、自适应的时间序列多步预报解决方案。
发明内容
本发明的目的在于克服现有时间序列预报技术的不足,提供完整的低误差、高效率、自动化、自适应的时间序列多步预报解决方案。本发明克服了现有技术中的不足,提供了一种基于计算智能的时间序列多步预报方法,所述方法其要点包括:
1、基于全局最值的时间序列数据缩放策略
时间序列数据会随实际应用问题的不同而带有不同的量纲,因此时序数据的数值范围可能会很大,较大的数值计算会给算法和计算机带来负担,导致较大误差。预报算法通常只对有限数据区间反应灵敏,因此本发明在应用预报算法以前,基于全局最值对时间序列数据按比例映射到目标缩放数据区间,预报结束后再将预报结果按照相同比例映射回原始的数据区间。
2、基于滑动时间窗口的向量化样本生成策略
时间序列数据是一个散点集,而预报过程中需要向量化的样本集才能完成预报过程,因此本发明在预报过程以前,基于滑动时间窗口规则将时序散点集转化为向量化的样本集。同时,该样本生成策略还将未来单步预报扩展为未来多步预报。
3、基于计算智能的预报策略
计算智能算法能够满足非线性、数据适应性、预报过程自动化等要求,因此本发明采用计算智能算法作为时间序列预报问题的基础算法。人工神经网络和支持向量机,是计算智能算法的典型代表,都可以用来实现预报过程,当然其他相似的计算智能算法也可以适用于此预报策略。
4、基于精度与效率并重的算法评价策略
精度与效率是评价预报算法性能的两项主要指标,本发明的目的是要建立同时满足高精度和高效率的预报算法,因此提出了精度与效率并重的算法评价策略。进一步说,随着实际应用领域的不同,预报算法对精度或效率可能会有所偏重,本发明提出的算法评价策略也支持精度优先与效率优先的情况。
5、预报算法的参数选择策略与样本特征选择策略
基于计算智能算法的时间序列预报,其算法通常有多个可以调节的参数,如何调节这些参数找到最佳的参数组合是一个重要的性能提升策略;其次,向量化的样本集中存在的不相关特征也会影响算法的精度与效率,如何发现并去掉这些特征是另一个重要的性能提升策略;另外,两种策略还是相关关联的,可作为组合策略来处理。本发明采用进化计算方法来实现此组合策略。粒子群算法和遗传算法,是进化计算方法的典型代表,都可以用来实现组合策略,当然其他相似的进化计算方法也可以适用于此策略。
与现有技术相比,本发明的优点是:
1、使用预报算法的灵敏区间对数据进行处理,有效降低了算法的误差。
2、弥补了散点数据集与向量样本集之间的鸿沟,将未来单步预报扩展到未来多步预报。
3、采用了基于计算智能算法的预报策略,算法能够根据数据集的特征动态建立,具有通用性、自适应性和自动化的特点,且不局限于某一种算法。
4、提出了精度与效率并重的性能评价策略,并且支持实际问题中精度优先或效率优先的情况。
5、提出了预报算法的参数选择策略与样本特征选择策略,能够根据数据集的特征动态选择算法参数和样本特征,具有通用性、自适应性和自动化的特点,且不局限于某一种算法。
附图说明
图1.时间序列多步预报流程图。
图2.预报算法原理图。
图3.支持向量机的输出函数结构图。
图4.参数选择与样本特征选择的组合求解过程。
具体实施方式
有关本发明的技术内容及详细说明,现配合附图说明如下:
本发明公开的一种基于计算智能的时间序列多步预报方法,涵盖了数据缩放、样本生成、自动化预报算法生成、算法评价、自动化参数选择、自动化样本特征选择等方面,是一套完整的系统化解决方案,该方法能够全程自动化实现,具有数据自适应性,是时间序列多步预报的通用方法,图1给出了时间序列多步预报的流程图。下面给出具体的实现方式:
1、基于全局最值的时间序列数据缩放策略
本策略建立原始区间到目标缩放区间的数据映射关系。
令集合Z={zu}u=1 n表示原始区间上的时间序列数据集,z为原始值,zmax与zmin分别表示集合Z的全局最大值与全局最小值;
令集合Z’={z’u}u=1 n表示目标区间上的时间序列数据集,z’为目标区间[lb,up]内的缩放值,lb与ub分别表示目标区间的下界与上界;
则数据缩放策略的正向映射函数与反向映射函数分别由公式1和2给出:
z ′ = g ( z ) = ( ub - lb ) ( z - z min ) z max - z min + lb - - - ( 1 )
z = g - 1 ( z ′ ) = ( z max - z min ) ( z ′ - lb ) ub - lb + z min - - - ( 2 )
2、基于滑动时间窗口的向量化样本生成策略
本策略将时间序列散点集转化成向量化的样本集。
首先,给出向量化的样本格式。令{y,x1,x2,...,xm-1,xm}表示向量化的样本,则y为预报算法的输出指导数据,{x1,x2,...,xm-1,xm}为预报算法的输入特征向量,其中y,x1,x2,...,xm-1,xm均为时间序列Z={zu}u=1 n中的数据点。
在转化过程中引入滑动时间窗口规则,对应预报函数表示见公式3,从式中可以看出,一旦确定预报算法f,只要输入m个历史监测值,就能获得未来q步的预报值,这里q为预报步长,m为样本特征的个数。不同预报步长下的样本转化见表1-3。
f:y=f(x1,x2,...xm-1,xm)
Figure BDA0000143248930000051
表1.未来1步预报(q=1)
Figure BDA0000143248930000052
表2.未来2步预报(q=2)
Figure BDA0000143248930000053
表3.未来q步预报
Figure BDA0000143248930000054
Figure BDA0000143248930000061
3、基于计算智能算法的预报策略
根据公式3给出的多步预报函数,时间序列多步预报算法是一个具有多维输入一维输出的数学算法。我们使用样本训练的方法建立这个算法,建立过程如图2,预报策略具体实现如下:
(1)令X={zm,zm-1,...,z2,z1}作为输入特征向量,令y=zm+q作为输出值,则{y,X}组成一个样本,用此样本训练预报算法;
(2)令X={zm+1,zm,...,z3,z2}作为输入特征向量,令y=zm+q+1作为输出值,则{y,X}组成一个样本,用此样本训练预报算法;
(3)如此类推,直到所有历史数据用尽,则一轮训练结束。对于某些类型的数学算法,一轮训练即可获得稳定的预报算法,如支持向量机;对于另外一些类型的数学算法,需要多轮训练才能获得稳定的预报算法,如人工神经网络。
(4)算法建立好以后,令X={zn,zn-1,...,zn-m+2,zn-m+1}作为输入特征向量,则算法将会输出y=zn+q的预报值。
人工神经网络算法和支持向量机算法,是计算智能算法的典型代表,都可以用来实现预报过程,当然其他相似的计算智能算法也可以适用于此预报策略,此处引入支持向量回归原理进行预报,过程如下:
先从最基本的线性方程开始,即使用线性回归函数对时间序列预报进行表示:
y=f(X)=wTX+b    (4)
上式中w为与向量X维度相同的权重向量,b为偏置值。式4不能表示非线性问题,改进方法是引入非线性映射函数
Figure BDA0000143248930000062
将输入空间映射到具有更高维度的特征空间。例如,假设X=(g,h),则可将X扩充为
Figure BDA0000143248930000063
通过映射,
Figure BDA0000143248930000064
可达到无穷多维以使f接近任意非线性函数。无穷多维在实际计算过程中无法达到,事实上根本就不需要计算只需要计算两个
Figure BDA0000143248930000066
的内积
Figure BDA0000143248930000067
即可,这种巧妙替换的细节在本推导过程的后期将会提及。引入
Figure BDA0000143248930000068
后,线性方程4扩展为非线性方程5,其中W为与向量
Figure BDA0000143248930000069
维度相同的权重向量。
Figure BDA00001432489300000610
SVM引入了ε(epsilon)-非敏感损失函数Lε来度量“靠近程度”,由下式6给出。它衡量预报值与真实值之间的绝对误差,同时能够容忍误差小于或等于ε。如果f(X)在y±ε的区间内,不考虑损失;如果样本超出了这个区间,则引入松弛变量ζ,ζ*表示样本到y±ε区间的距离。另一方面,函数f(X)的范数||W||2=WTW用来衡量“平滑程度”:范数越小则函数越平滑。
L ϵ = 0 | y i - f ( X i ) | ≤ ϵ | y i - f ( X i ) | - ϵ elsewhere - - - ( 6 )
根据结构风险最小化原理,综合以上两个度量,我们希望最小化经验风险∑i=1 lLε(yi,f(Xi)),并同时最小化范数||W||2。由此可得如下规划问题,称为ESVR原始问题:
min 1 2 W T W + C ∑ i = 1 l ( ζ i + ζ i * )
Figure BDA0000143248930000073
上式中C被称为正规化常数,它的取值决定着经验风险同函数范数的平衡关系。引入非负拉格朗日乘子αi (*),η(*),其中(*)表示带*和不带*情况,构造拉格朗日方程L:
Figure BDA0000143248930000074
Figure BDA0000143248930000075
上式中的拉格朗日乘子必须满足正项约束,即αi (*),η(*)≥0。根据鞍点条件,L对于原始变量(W,b,ξ(*))的偏导数均为零,即:
Figure BDA0000143248930000077
∂ b L = 0 → ∑ i = 1 l ( α i - α i * ) = 0 - - - ( 9 )
∂ ζ ( * ) L = 0 → C - α i ( * ) - η i ( * ) = 0
将公式9代入公式7中,可得到如下规划问题:
min 1 2 ∑ i , j = 1 l ( α i * - α i ) Q ij ( α j * - α j ) -
∑ i = l y i ( α i * - α i ) + ϵ ∑ i = 1 l ( α i * + α ) - - - ( 10 )
s . t . ∑ i , j = 1 l ( α i * - α i ) = 0 , 0 ≤ α i * , α i ≤ C , i = 1 , . . . , l .
式10中Q为核函数矩阵,
Figure BDA00001432489300000713
为核函数。从公式10中可以看出,求解对偶问题的过程中,根本不需要计算
Figure BDA00001432489300000714
只需要计算两个
Figure BDA00001432489300000715
的内积
Figure BDA00001432489300000716
即可。将偏导
Figure BDA0000143248930000082
代入公式5可得预报函数:
y = f ( X ) = ∑ i = 1 l ( α i - α i * ) K ( X i , X ) + b - - - ( 11 )
公式11即为时间序列预报算法的支持向量展开式,根据KKT(Karush-Kuhn-Tucker)条件,在以上规划问题中,系数(αii *)中只有一部分为非零值,与之对应的输入向量带有等于或大于ε的近似误差,它们被称为支持向量。图3给出了SVM的输出函数结构图。
在以上获得的预报函数11中,核函数是计算扩展样本内积的关键。核函数决定了预报函数的复杂度,因而将影响支持向量回归算法的性能,所以需要谨慎选取核函数。最常见的核函数有四种:
(1)多项式核函数(Polynomial Function,PF):
K(Xi,Xj)=(γXi TXj)+a)b,γ>0,a∈R,b∈N    (12)
(2)径向基核函数(Radial Basis Function,RBF):
K(Xi,Xj)=exp(-γ||Xi-Xj||2)γ>0    (13)
(3)双曲正切核函数(Sigmoid Function,SF):
K(Xi,Xj)=tanh(γXi TXj)-c),γ>0,c∈R    (14)
(4)线性核函数(Linear Function,LF):
K(Xi,Xj)=Xi TXj    (15)
在通常情况下,首选RBF核函数通常是比较合理的。Keerthi与Lin的研究证明,使用特定参数的RBF核函数可以获得与LF核函数或SF核函数同样的性能。RBF核函数可以将输入非线性的映射到高维特征空间,这使它能够适用于属性值和输出值满足非线性关系的情况,这些优点是LF核函数所不具备的。并且RBF核函数的输出值在0到1之间,给数据运算带来的负担较小,而PF核函数的输出值分布为(0,+∞),与RBF核函数相比难以控制回归误差。另外,与PF核函数的多个参数相比,RBF核函数只使用一个参数γ进行算法控制。因而选择RBF核函数训练SVM。通过求解以上二次规划(Quadratic Programming,QP)问题对(αii *)与b进行参数估计,即可求得时间序列多步预报函数。
4、基于精度与效率并重的算法评价策略
定义适应度函数作为预报算法的评价标准。适应度的设计同时包含了精度与效率两个因素,通过分析我们发现,适应度与精度、效率之间存在着对称的反比例关系。换言之,一个预报算法较好(适应度较大)的充分必要条件是同时具备较低误差及较少训练时间,适应度相对于误差和时间的关系可初步看作对称的反比例,此时用公式16表示,其中MSEt表示训练均方误差,使用k-均分交叉验证(k=5)计算,Tt表示训练时间,h为常量,用于控制适应度的取值范围。
进一步说,随着实际应用领域的不同,预报算法对精度或效率的可能会有所偏重。精度优先的情况为:在训练时间允许的情况下,精确度更加重要,此时用公式17表示;效率优先的情况为:在误差允许的情况下,算法效率更加重要,此时用公式18表示。
Fitness ( · ) = h MSE t × T t (16)
MSE t = 1 l ∑ i = 1 l ( y i - f ( X i ) ) 2
Fitness ( · ) = h MSE t × ln T t (17)
MSE t = 1 l ∑ i = 1 l ( y i - f ( X i ) ) 2
Fitness ( · ) = h ln MSE t × T t (18)
MSE t = 1 l ∑ i = 1 l ( y i - f ( X i ) ) 2
5、预报算法的参数选择策略与样本特征选择策略
我们将预报算法的参数选择与样本特征选择问题编码为实数与二进制的混合向量PR,用适应度Fitness(·)作为目标函数。令p1,p2,...,pk表示实数域的预报算法参数,令bfs为1或0表示对应的输入特征是否被选中,单独考虑特征选择的策略可以表示为公式19。
max Fitness(PR)
s . t . PR = { p 1 , p 2 , . . . , pk , bf 1 , bf 2 , . . . , bf m } p 1 = p 1 0 , p 2 = p 2 0 , . . . pk = pk 0 p 1 0 , p 2 0 , . . . , pk 0 ∈ R , bf s ∈ { 0,1 } , s = 1,2 , . . . , m . - - - ( 19 )
反之,单独考虑参数选择的策略可以表示为:
max Fitness(PR)
s . t . PR = { p 1 , p 2 , . . . , pk , bf 1 , bf 2 , . . . , bf m } p 1 , p 2 , . . . , pk ∈ R , bf s = 1 , s = 1,2 , . . . , m . - - - ( 20 )
综合两者,同时考虑特征选择与参数选择的组合策略可以表示为:
max Fitness(PR)
s . t . PR = { p 1 , p 2 , . . . , pk , bf 1 , bf 2 , . . . , bf m } p 1 , p 2 , . . . , pk ∈ R , bf s ∈ { 0 , 1 } , s = 1,2 , . . . , m . - - - ( 21 )
本发明采用进化计算方法实现该组合策略。粒子群算法和遗传算法,是进化计算方法的典型代表,都可以用来实现该策略,当然其他相似的进化计算方法也可以适用于此策略,此处给出改进的粒子群算法(PSO)的实现,过程如下:
本发明综合连续型PSO与离散型PSO的优点,提出混合粒子群优化(Hybrid ParticleSwarm Optimization,HPSO),算法设计思路如下:
系统先初始化一群表示随机解的粒子,通过多代更新寻找最优解。每个粒子朝着局部最优解和全局最优解的方向移动,在迭代过程中计算自己的移动速度并更新自己的位置。假设HPSO系统中有P个粒子,在D维解空间进行搜索:
定义1:矩阵AP×D表示所有粒子的位置,p=1,2,...,P,d=1,2,...,D,A的行向量代表第p个粒子的位置,记为ap={ap1,ap2,...,apD};
定义2:矩阵VP×D表示所有粒子的速度,V的行向量代表第p个粒子的速度,记为
vp={vp1,vp2,...,vpD};
定义3:矩阵LBP×D表示所有粒子的局部最优位置,LB的行向量代表第p个粒子的局部最优
位置,记为lbp={lbp1,lbp2,...,lbpD};
定义4:行向量gb={gbp1,gbp2,...,gbpD}表示全局最优位置,被所有粒子共享。
根据参数选择与样本特征选择的特点,我们使用实数与二进制的混合向量PR对粒子进行编码,实数码段对应算法参数,二进制码段对应样本特征,两者使用不同的规则联合更新:每个粒子实数码段的更新规则由公式22,23给出;二进制码段的更新规则由公式24给出。
vpd(t+1)=w×vpd(t)+
c1×rdm1(0,1)×(lbpd(t)-apd(t))+
                                    (22)
c2×rdm2(0,1)×(gbd(t)-apd(t)).
apd(t+1)=apd(t)+vpd(t+1).
a pd = A min a pd < A min a pd A min < a pd < A max A max a pd > A max v pd = - V max v pc < - V max v pd - V max < v pd < - V max V max v pd > V max - - - ( 23 )
vpd(t+1)=w×vpd(t)+
c1×rdm1(0,1)×(lbpd(t)-apd(t))+
c2×rdm2(0,1)×(gbd(t)-apd(t)).
if(rdm(0,1)<Sg(vpd(t+1)))    (24)
then apd(t+1)=1,
else apd(t+1)=0;
Sg ( v ) = 1 1 + e - v &CenterDot;
上式中Amin,Amax以及Vmax都是需要根据特定问题确定的常量,目的是为了防止粒子的过度漫游。尤其是Vmax直接决定了求解过程的分辨率(精细程度)。如果Vmax过大,粒子将越过最佳解;反之,如果Vmax过小,粒子的探索能力将下降,陷入局部极小,因为过小步长降低了探寻更好的解的可能性。
rdm(0,1),rdm1(0,1)与rdm2(0,1)各为[0,1]区间内服从均匀分布的随机数,t表示迭代次数。惯性权值w在全局搜索与局部搜索的平衡中发挥重要作用,w>0,可以为常数,也可以是关于时间的线性/非线性函数。加速度常量c1和c2分别表示个体学习因子和群体学习因子:如果c1=0,则粒子只具有群体经验,这种情况下算法收敛快,易陷入局部极小;如果c2=0,则粒子只具有个体经验,这种情况下所有粒子自行搜索,粒子间没有任何交互,找到最佳解的概率很小;如果c1=c2=0,则粒子群体呈现无系统状态。Sg(·)为限制速度变化的S型函数。
适应度适应度函数的定义至关重要,因为它决定了PH-PSO算法的求解目标,而且在迭代过程中,适应度越高的粒子影响其它粒子位置的概率越大。本发明中适应度使用公式17计算(精度优先)。
终止准则许多条件都可以作为判定算法终止的准则,下面列出最常用的4种,为了便于比较不同算法的性能,本发明选择第一种作为终止准则。
(1)迭代次数上限;
(2)迭代时间上限;
(3)适应度上限;
(4)其间适应度必须有明显提高的连续迭代次数。
组合选择策略求解图4给出了参数选择与样本特征选择的组合求解过程,主要步骤如下:
(1)系统初始化:系统参数,包括粒子总数P,迭代次数IT;解空间参数,包括搜索范围[Amin,Amax]与速度限制Vmax(维度均为D);粒子参数,包括惯性权值w,个体学习因子c1,群体学习因子c2;根据混合向量PR的表示方式,随机生成每个粒子的位置与初速度;
(2)预处理:解析粒子表示,根据对应的样本特征准备样本集,根据对应的参数建立预报算法;
(3)适应度计算:用验证集训练预报算法,并根据公式17计算粒子的适应度;
(4)更新局部最优与全局最优:当粒子的适应度大于局部最优时,更新局部最优;当其大于全局最优时,更新全局最优;
(5)终止条件判定:如果满足迭代次数上限,则转步骤(7),否则转步骤(6);
(6)粒子更新:根据公式22~24,为粒子更新速度与位移,转步骤(2)进入下一轮迭代;
(7)算法终止:解析全局最优解,根据它来选择样本特征和算法参数,进行时间序列多步预报。
上述仅为本发明的较佳实施示例而已,并非用来限定本发明实施范围。即凡依本发明申请专利范围所作的均等变化与修饰,皆为本发明专利范围所涵盖。

Claims (6)

1.一种基于计算智能的时间序列多步预报方法,其特征在于,包含以下步骤:
(a)基于全局最值对时间序列进行数据缩放,包括:建立原始区间到目标缩放区间的数据映射关系;在输入数据进入预报算法前,将数据从原始区间映射到目标缩放区间;在预报数据输出预报算法后,将数据从目标缩放区间映射回原始区间;
(b)基于滑动时间窗口生成向量化样本,包括:将时间序列散点集转化成向量化的样本集,在转化过程中引入滑动时间窗口规则,预报步长作为控制转化过程的参数;
(c)基于计算智能的预报策略,包括:时间序列多步预报算法是一个具有多维输入一维输出的数学算法,算法的建立过程通过样本训练的方法实现,训练结束后形成预报算法;预报算法将历史时间点的数据作为输入,未来时间点的数据作为输出;
(d)基于精度与效率进行算法评价,包括:定义适应度函数作为预报算法的评价标准;适应度的设计同时包含了精度与效率两个因素,适应度与精度、效率之间存在着对称的反比例关系;使用ln函数表示精度优先或效率优先的情况;
(e)预报算法的参数选择策略与样本特征选择策略,包括:将预报算法的参数与样本的组合选择问题编码为实数与二进制的混合向量,向量的实数部分表示预报算法的参数选择情况,二进制部分表示预报算法的特征选择情况;求解过程同时考虑预报算法的参数选择与样本的特征选择,用适应度函数作为组合求解过程的目标函数;使用实数版本的优化算法优化参数的选取,使用二进制版本的优化算法优化样本特征的选取,两项优化过程联合工作。
2.根据权利要求1所述的一种基于计算智能的时间序列多步预报方法,其特征在于,所述原始区间到目标缩放区间的数据映射关系通过以下方式建立:
令集合Z={zu}u=1 n表示原始区间上的时间序列数据集,z为原始值,zmax与zmin分别表示集合Z的全局最大值与全局最小值;
令集合Z’={z’u}u=1 n表示目标区间上的时间序列数据集,z’为目标区间[lb,up]内的缩放值,lb与ub分别表示目标区间的下界与上界;
则数据缩放策略的正向映射函数与反向映射函数分别由公式1和2给出:
Figure DEST_PATH_FDA0000153426060000011
Figure DEST_PATH_FDA0000153426060000012
3.根据权利要求1或2所述的一种基于计算智能的时间序列多步预报方法,其特征在于,所述将时间序列散点集转化成向量化的样本集采用以下步骤:
首先,给出向量化的样本格式:令y,x1,x2,...,xm-1,xm表示向量化的样本,则y为预报 算法的输出指导数据,x1,x2,...,xm-1,xm为预报算法的输入特征向量,其中y,x1,x2,...,xm-1,xm均为时间序列Z={zu}u=1 n中的数据点;
所述在转化过程中引入滑动时间窗口规则,对应预报函数按以下公式表示:
f:y=f(x1,x2,...xm-1,xm)
Figure DEST_PATH_FDA0000153426060000021
上式中,一旦确定预报算法f,只要输入m个历史监测值,就能获得未来q步的预报值,这里q为预报步长,m为样本特征的个数;所述预报步长作为控制转化过程的参数,是指针对同一个时间序列Z={zu}u=1 n,不同的q会得到不同的向量化训练样本,用于未来q步预报的样本见下表:
Figure DEST_PATH_FDA0000153426060000022
4.根据权利要求1所述的一种基于计算智能的时间序列多步预报方法,其特征在于,所述适应度与精度、效率之间存在着对称的反比例关系,用以下公式4表示,其中MSEt表示训练均方误差,使用k-均分交叉验证k=5计算,Tt表示训练时间,h为常量,用于控制适应度的取值范围,
Figure DEST_PATH_FDA0000153426060000023
(4)
Figure DEST_PATH_FDA0000153426060000024
由于实际应用领域不同,预报算法对精度或效率会有所偏重,精度优先的情况为:在训练时间允许的情况下,精确度更加重要,此时用公式5表示;效率优先的情况为:在误差允许的情况下,算法效率更加重要,此时用公式6表示,
Figure DEST_PATH_FDA0000153426060000025
(5)
Figure DEST_PATH_FDA0000153426060000026
(6)
5.根据权利要求1所述的一种基于计算智能的时间序列多步预报方法,其特征在于,将预报算法的参数选择与样本特征选择问题编码为实数与二进制的混合向量PR,用适应度Fitness(·)作为目标函数,令p1,p2,...,pk表示实数域的预报算法参数,令bfs为1或0表示对应的输入特征是否被选中,单独考虑特征选择的策略表示为公式7,
max Fitness(PR)
Figure DEST_PATH_FDA0000153426060000034
反之,单独考虑参数选择的策略可以表示为:
max Fitness(PR)
Figure DEST_PATH_FDA0000153426060000036
综合两者,同时考虑特征选择与参数选择的组合策略可以表示为:
max Fitness(PR)
Figure DEST_PATH_FDA0000153426060000038
所述组合策略的实现采用混合粒子群优化方法,其他相似的进化计算方法也适用于此策略。
6.根据权利要求1所述的一种基于计算智能的时间序列多步预报方法,其特征在于,所述的组合选择策略求解包括以下主要步骤:
(a)系统初始化:系统参数,包括粒子总数P,迭代次数IT;解空间参数,包括搜索范围[Amin,Amax]与速度限制Vmax,维度均为D;粒子参数,包括惯性权值w,个体学习因子c1,群体学习因子c2;根据混合向量PR的表示方式,随机生成每个粒子的位置与初速度;
(b)预处理:解析粒子表示,根据对应的样本特征准备样本集,根据对应的参数建立预报算法;
(c)适应度计算:用验证集训练预报算法,并根据公式5计算粒子的适应度;
(d)更新局部最优与全局最优:当粒子的适应度大于局部最优时,更新局部最优;当 其大于全局最优时,更新全局最优;
(e)终止条件判定:如果满足迭代次数上限,则转步骤(g),否则转步骤(f);
(f)粒子更新:为粒子更新速度与位移,转步骤(2)进入下一轮迭代;
(g)算法终止:解析全局最优解,根据它来选择样本特征和算法参数,进行时间序列多步预报。 
CN2012100674804A 2011-12-02 2012-03-14 一种基于计算智能的时间序列多步预报方法 Pending CN102629299A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100674804A CN102629299A (zh) 2011-12-02 2012-03-14 一种基于计算智能的时间序列多步预报方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110395907.9 2011-12-02
CN201110395907 2011-12-02
CN2012100674804A CN102629299A (zh) 2011-12-02 2012-03-14 一种基于计算智能的时间序列多步预报方法

Publications (1)

Publication Number Publication Date
CN102629299A true CN102629299A (zh) 2012-08-08

Family

ID=46587557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100674804A Pending CN102629299A (zh) 2011-12-02 2012-03-14 一种基于计算智能的时间序列多步预报方法

Country Status (1)

Country Link
CN (1) CN102629299A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678322A (zh) * 2012-09-03 2014-03-26 阿里巴巴集团控股有限公司 一种样本数据的整合系统及方法
CN104537228A (zh) * 2014-12-23 2015-04-22 清华大学 基于残差熵和分层双支持向量机的指标预报方法及应用
CN104914978A (zh) * 2014-03-13 2015-09-16 通用汽车环球科技运作有限责任公司 用于识别节能时机的方法
CN108805384A (zh) * 2017-04-27 2018-11-13 塔塔顾问服务有限公司 用于评估与推荐农作物规范的符合度的系统和方法
CN111724004A (zh) * 2020-07-13 2020-09-29 浙江大学 一种基于改进量子灰狼算法的水库可供水量预报方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678322A (zh) * 2012-09-03 2014-03-26 阿里巴巴集团控股有限公司 一种样本数据的整合系统及方法
CN103678322B (zh) * 2012-09-03 2016-12-28 阿里巴巴集团控股有限公司 一种样本数据的整合系统及方法
CN104914978A (zh) * 2014-03-13 2015-09-16 通用汽车环球科技运作有限责任公司 用于识别节能时机的方法
CN104537228A (zh) * 2014-12-23 2015-04-22 清华大学 基于残差熵和分层双支持向量机的指标预报方法及应用
CN104537228B (zh) * 2014-12-23 2017-08-11 清华大学 基于残差熵和分层双支持向量机的玻璃窑炉温度预报方法
CN108805384A (zh) * 2017-04-27 2018-11-13 塔塔顾问服务有限公司 用于评估与推荐农作物规范的符合度的系统和方法
CN108805384B (zh) * 2017-04-27 2022-11-18 塔塔顾问服务有限公司 用于评估与推荐农作物规范的符合度的系统和方法
CN111724004A (zh) * 2020-07-13 2020-09-29 浙江大学 一种基于改进量子灰狼算法的水库可供水量预报方法

Similar Documents

Publication Publication Date Title
Liu et al. Random forest solar power forecast based on classification optimization
Saleh et al. A data mining based load forecasting strategy for smart electrical grids
Cheng et al. Fuzzy time series forecasting based on fuzzy logical relationships and similarity measures
Yousuf et al. Current perspective on the accuracy of deterministic wind speed and power forecasting
Gotmare et al. Nonlinear system identification using a cuckoo search optimized adaptive Hammerstein model
Fu et al. Using support vector machine to predict next day electricity load of public buildings with sub-metering devices
Yu et al. Support vector regression for real-time flood stage forecasting
Poczęta et al. Learning fuzzy cognitive maps using structure optimization genetic algorithm
Caputo et al. Photovoltaic plants predictive model by means of ANN trained by a hybrid evolutionary algorithm
CN107590567A (zh) 一种基于信息熵聚类和注意力机制的循环神经网络短期负荷预测方法
CN102629299A (zh) 一种基于计算智能的时间序列多步预报方法
CN109063939A (zh) 一种基于邻域门长短期记忆网络的风速预测方法及系统
Lixing et al. Support vector regression and ant colony optimization for HVAC cooling load prediction
Ghanbari et al. Artificial Neural Networks and regression approaches comparison for forecasting Iran's annual electricity load
Asfaw et al. Optimal short-term cascade reservoirs operation using genetic algorithm
Zhao et al. Spatio‐temporal Markov chain model for very‐short‐term wind power forecasting
Phyo et al. Electricity load forecasting using a deep neural network.
Chen et al. Research on wind power prediction method based on convolutional neural network and genetic algorithm
Chen et al. The optimal design and application of LSTM neural network based on the hybrid coding PSO algorithm
Li et al. Short-term load forecasting system based on sliding fuzzy granulation and equilibrium optimizer
Sheng et al. Map-reduce framework-based non-iterative granular echo state network for prediction intervals construction
Hong et al. Hybrid deep learning and quantum-inspired neural network for day-ahead spatiotemporal wind speed forecasting
Agrawal et al. Transformer‐based time series prediction of the maximum power point for solar photovoltaic cells
Qu et al. Probability prediction method of short-term electricity price based on quantile neural network model
KR20230066927A (ko) 발전량 예측 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120808