CN112215404A - 基于相空间重构和集合经验模态分解的预测方法及装置 - Google Patents

基于相空间重构和集合经验模态分解的预测方法及装置 Download PDF

Info

Publication number
CN112215404A
CN112215404A CN202011005487.4A CN202011005487A CN112215404A CN 112215404 A CN112215404 A CN 112215404A CN 202011005487 A CN202011005487 A CN 202011005487A CN 112215404 A CN112215404 A CN 112215404A
Authority
CN
China
Prior art keywords
phase space
space reconstruction
empirical mode
mode decomposition
ensemble empirical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011005487.4A
Other languages
English (en)
Inventor
陈庆春
苏冠楠
类先富
阮文达
范立生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou University
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN202011005487.4A priority Critical patent/CN112215404A/zh
Publication of CN112215404A publication Critical patent/CN112215404A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于相空间重构和集合经验模态分解的预测方法,步骤包括:通过采样器获取样本数据后,对所述样本数据进行集合经验模态分解;对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构;将相空间重构后的数据输入至神经网络计算模块进行计算,得到若干个子序列的预测结果;将所有子序列的预测结果传输至数据中心处理器进行叠加,得到总预测结果。本发明提供了一种基于相空间重构和集合经验模态分解的预测方法及装置,能够提高计算机的数据处理能力,提高短期预测准确率。

Description

基于相空间重构和集合经验模态分解的预测方法及装置
技术领域
本发明涉及计算机应用技术领域,尤其是涉及一种基于相空间重构和集合经验模态分解的预测方法及装置。
背景技术
目前,随着计算机计算能力大幅提升,人们对计算机的应用场景抱有更高的期望,例如,人们希望利用计算机的数据处理能力处理数据库保存的历史数据以预测短期内未来发生的现象。根据现有的技术方案,人们已经可以利用计算机实现气象预测、股市指数涨跌预测、短期电力负荷预测等等,未来人们将在更多技术领域、更多应用场景运用计算机强大的预测能力。
但是,目前计算机的预测能力还不够强大,预测准确率尚待提高。例如,现有的技术方案采用了传统的时间序列预测方法,却不能利用时间序列中包含的丰富信息,因此预测结果的准确率不高。另外,现有的技术方案采用基于简单遗传算法的神经网络,存在训练速度慢、易陷入局部极值等缺点。若要提高计算机的数据处理能力以让人们运用计算机技术在更多领域实现短期预测,人们还需要投入更多时间、资源做研究。
发明内容
针对上述技术问题,本发明提供了一种基于相空间重构和集合经验模态分解的预测方法及装置,能够提高计算机的数据处理能力,提高短期预测准确率。所述技术方案如下:
第一方面,本发明实施例提供了一种基于相空间重构和集合经验模态分解的预测方法,步骤包括:
通过采样器获取样本数据后,对所述样本数据进行集合经验模态分解;
对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构;
将相空间重构后的数据输入至神经网络计算模块进行计算,得到若干个子序列的预测结果;
将所有子序列的预测结果传输至数据中心处理器进行叠加,得到总预测结果。
在本发明第一方面的第一种可能的实现方式中,所述通过采样器获取样本数据后,还包括:
解析所述样本数据得到时间序列;
对所述时间序列进行相空间重构,得到相点序列;
计算所述相点序列的最大Lyapunov指数;
若所述最大Lyapunov指数大于零则判定所述时间序列为混沌系统且可进行短期预测。
在本发明第一方面的第二种可能的实现方式中,所述最大Lyapunov指数的计算方法的步骤包括:
对获取到的时间序列进行傅里叶变换,并计算出平均周期;
在所述平均周期内,对应所述相点序列中每一相点搜索出与该相点距离最近的邻点;
计算每一所述邻点经过若干个离散时间步长后的距离dj(i);其中,i表示i个离散时间步长,j表示相点数;
计算距离dj(i)的平均值:
Figure BDA0002694287320000021
其中,q是非零dj(i)的数目,△t为时间间隔;
利用最小二乘法生成平均值y(i)的回归直线,计算出的斜率即为最大Lyapunov指数。
在本发明第一方面的第三种可能的实现方式中,所述相空间重构的优选方式具体为:
利用关联积分算法同时估算出延迟时间和延迟时间窗口;
基于所述延迟时间和所述延迟时间窗口计算出嵌入维数;
以进行相空间重构的相点数为行数,同时以所述嵌入维数为列数,在相空间构造出相型分布矩阵。
在本发明第一方面的第四种可能的实现方式中,在所述将相空间重构后的数据输入至神经网络计算模块进行计算的步骤中,神经网络的构建方法具体为:
将神经网络的输入层神经元数对应设置为相空间重构的嵌入维数,神经网络的输出层神经元数对应设置为1;
选择由学习样本构成的训练集对所述神经网络进行训练。
在本发明第一方面的第五种可能的实现方式中,对所述样本数据进行集合经验模态分解,优选实施方式为:
从所述样本数据中分解出包括原始数据在内的所有局部极大值和局部极小值;
根据每一所述局部极大值和所述局部极小值分别连接形成上包络线和下包络线,并计算上包络线和下包络线的均值;
计算所述均值与所述原始数据的差值,并且判断所述差值是否满足预设的筛选条件;
若所述差值满足预设的筛选条件,则根据所述差值筛选出差值信号,并且将所述差值信号替代所述原始数据重复进行计算,直至计算出原始数据的残差分量。
在本发明第一方面的第六种可能的实现方式中,在进行集合经验模态分解时,还包括步骤:
在原始数据中加入幅值相同的白噪声;
根据设定的迭代次数对加入白噪声的原始数据执行多次经验模态分解,得到若干个IMF分量;
计算所有IMF分量的平均值。
在本发明第一方面的第七种可能的实现方式中,在获得样本数据后,采用线性插值法对所述样本数据进行补充,t+j时刻的缺失值为:
Figure BDA0002694287320000031
其中,xt为t时刻的缺失值,xt+i为t+i时刻的值。
在本发明第一方面的第八种可能的实现方式中,在所述对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构的步骤之后还包括:
采用线性归一化函数对相空间重构后的数据进行归一化处理,并且将相空间重构后的数据压缩在区间[0,1]内。
第二方面,本发明实施例提供了一种基于相空间重构和集合经验模态分解的预测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于相空间重构和集合经验模态分解的预测方法。
相比于现有技术,本发明实施例具有如下有益效果:
本发明提供了一种基于相空间重构和集合经验模态分解的预测方法及装置,由本技术方案可知,在获取样本数据后,对所述样本数据进行集合经验模态分解。由于经验模态分解不需要选定任何定义好的函数作为基函数,仅根据信号自身的时间尺度特征进行信号分解,对于样本数据,尤其非线性、非平稳的电力负荷序列数据具有良好的适应性;经过集合经验模态分解,能够为神经网络提供更有效的输入数据,有利于提高神经网络的预测能力。除此之外,对序列数据进行EMD分解后的子序列分别进行相空间重构并使用神经网络进行预测,从而利用神经网络的学习能力和数据处理能力实现短期负荷预测,而且有效降低建模难度和提高预测精度。
附图说明
图1是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的步骤流程图;
图2是本发明实施例中的一种包括时间序列混沌性判定的基于相空间重构和集合经验模态分解的预测方法的步骤流程图;
图3是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的时间序列混沌性判定的流程图;
图4是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的EMD分解流程图;
图5是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的GRU神经网络结构示意图;
图6是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的C-C方法计算黄金期货交易金额序列统计量Smean示意图;
图7是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的C-C方法计算黄金期货交易金额序列统计量deltaSmean示意图;
图8是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的C-C方法计算黄金期货交易金额序列统计量Scor示意图;
图9是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的基于小数据量法的最大Lyapunov指数的曲线图;
图10是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的最终得预测结果的曲线图;
图11是本发明实施例中的一种基于相空间重构和集合经验模态分解的预测方法的最终得预测结果误差值的曲线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,本发明提供一种示例性实施例,一种基于相空间重构和集合经验模态分解的预测方法,步骤包括:
S101、通过采样器获取样本数据后,对所述样本数据进行集合经验模态分解;
S102、对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构;
S103、将相空间重构后的数据输入至神经网络计算模块进行计算,得到若干个子序列的预测结果;
S104、将所有子序列的预测结果传输至数据中心处理器进行叠加,得到总预测结果。
请参见图2,本发明还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法还包括时间序列混沌性判定的步骤,即所述通过采样器获取样本数据后,还包括:
解析所述样本数据得到时间序列;
对所述时间序列进行相空间重构,得到相点序列;
计算所述相点序列的最大Lyapunov指数;
若所述最大Lyapunov指数大于零则判定所述时间序列为混沌系统且可进行短期预测。
请参见图3,具体地,根据最大Lyapunov指数,
当Lyapunov指数λ<0时,系统相对稳定,对初值的敏感性较差,长期行为将收敛到一个平衡点;
当Lyapunov指数λ=0时,系统对初值不敏感,呈现周期性运动;
当Lyapunov指数λ>0时,系统对初值敏感,系统是混沌的。
所述相空间重构的优选方式具体为:
利用关联积分算法同时估算出延迟时间和延迟时间窗口;
基于所述延迟时间和所述延迟时间窗口计算出嵌入维数;
以进行相空间重构的相点数为行数,同时以所述嵌入维数为列数,在相空间构造出相型分布矩阵。
本实施例还提供一种优选的实施方式,在获得样本数据后,考虑到数据是离线状态获得的,对数据的预处理主要集中在对缺失数据进行补充。对于缺失数据前后时间间隔不大的情况,采用线性插值对其补充,即数据预处理方式具体为:采用线性插值法对所述样本数据进行补充,t+j时刻的缺失值为:
Figure BDA0002694287320000071
其中,xt为t时刻的缺失值,xt+i为t+i时刻的值。
具体地,本方案提供一个具体的实施例以说明相空间重构。相空间重构将低维时间序列映射到高维相空间中并保持微分同胚的特性,将混沌吸引子恢复出来。
将要进行相空间重构的时间序列为x={xi|i=1,2,...,N},重构的相空间中的点为:
Xi=(xi,xi+τ,...,xi+(m-1)τ),i=1,2,...,M (2)
嵌入时间序列的关联积分定义为:
Figure BDA0002694287320000072
其中,r为控制半径,i、j为重构的相空间中任意两个相点,dij=||Xi-Xj||为Heaviside函数,若x<0,θ(x)=0;若x≥0,θ(x)=1;关联积分表示相空间中任意两个相点之间的距离小于r的概率。
将序列x={xi|i=1,2,...,N}分成t个不相交的子序列,每个子序列的检验统计量定义为:
Figure BDA0002694287320000073
当N→∞时,
Figure BDA0002694287320000074
如果序列是独立同分布的,对于固定的m、t,当N→∞时,对于所有的r,S(m,r,t)≡0;但是实际的序列是有限长的,并且序列的元素间可能相关,此时S(m,r,t)一般不等于0;半径r的最大偏差为:
ΔS(m,t)=max{S(m,rj,t)}-min{S(m,rj,t)} (6)
根据BDS统计对N、m和r进行恰当的估计,取m=2,3,4,5;j=1,2,3,4,得到三个统计量的计算公式:
Figure BDA0002694287320000081
Figure BDA0002694287320000082
Figure BDA0002694287320000083
其中,
Figure BDA0002694287320000084
σ为时间序列的标准差。
Figure BDA0002694287320000085
的第一个极小值点为延迟时间τ,Scor(t)的最小值点为延迟时间窗口τω,由τω=(m-1)τ估算出嵌入维数m。
设x={xi|i=1,2,...,N}为长度为N的时间序列,选择适当的时间延迟τ和嵌入维数m重构相空间得到序列x在m维的相空间中构成的一个相型分布X,其表示系统在某一瞬间的状态。
Figure BDA0002694287320000086
其中,X是维数为M×m的矩阵,τ为时间延迟,m为嵌入维数,M为相点个数,且M=N-(m-1)τ。
优选地,本方案提供一种优选的最大Lyapunov指数计算方法,步骤包括:
对获取到的时间序列进行傅里叶变换,并计算出平均周期;
在所述平均周期内,对应所述相点序列中每一相点搜索出与该相点距离最近的邻点;
计算每一所述邻点经过若干个离散时间步长后的距离dj(i);其中,i表示i个离散时间步长,j表示相点数;
计算距离dj(i)的平均值:
Figure BDA0002694287320000087
其中,q是非零dj(i)的数目,△t为时间间隔;
利用最小二乘法生成平均值y(i)的回归直线,计算出的斜率即为最大Lyapunov指数。
具体地,Lyapunov指数刻画了混沌运动的局部特征;最大Lyapunov指数计算方法的数学表示方式如下:
对于一维动力系统
xn+1=F(xn),n=0,1,2,... (12)
λ为平均每次迭代引起的指数分离的指数,称为原动力系统的Lyapunov指数,初始距离为ε的两点经过n次后的距离为:
Figure BDA0002694287320000091
取极限ε→0,n→∞
Figure BDA0002694287320000092
在n维动力系统中,可以计算得到n个Lyapunov指数,最小的Lyapunov指数决定轨道收缩的快慢,最大的Lyapunov指数决定轨道发散的快慢,即覆盖到整个混沌吸引子的快慢。在实际应用中并不需要计算出所有的Lyapunov指数,仅仅通过最大Lyapunov指数就可以判断一个时间序列是否为混沌系统。最大Lyapunov指数的计算步骤如下:
对序列x={xi|i=1,2,...,N}进行傅里叶变换,求出平均周期P;
根据C-C方法计算得到的延迟时间τ和嵌入维数m,对序列进行相空间重构得到相点序列X={Xj|j=1,2,...,M};
对于相空间的点Xj,找到距离其最近的点Xk,即:
Figure BDA0002694287320000093
对相空间的每个点Xj,计算该邻点对经过i个离散时间步长后的距离:
dj(i)=|Xj+i-Xk+i|,i=1,2,...,min(M-j,M-k) (16)
对每个i,计算所有j的lndj(i)平均值:
Figure BDA0002694287320000101
其中,q是非零dj(i)的数目,△t为时间间隔。
利用最小二乘法生成y(i)的回归直线,其斜率为序列的最大Lyapunov指数。
请参见图4,本方案还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法还包括集合经验模态分解算法,具体如下:
从所述样本数据中分解出包括原始数据在内的所有局部极大值和局部极小值;
根据每一所述局部极大值和所述局部极小值分别连接形成上包络线和下包络线,并计算上包络线和下包络线的均值;
计算所述均值与所述原始数据的差值,并且判断所述差值是否满足预设的筛选条件;其中,所述筛选条件包括:
(1)穿零点和极值点的数量需要相同或最大相差1;
(2)由局部极大值所构成的包络线以及由局部极小值所构成的包络线的平均值为零。
可以理解的是,条件(1)类似于平稳高斯过程的窄带要求,条件(2)将全局条件修改为局部条件,解决了因波形不对称而产生瞬时频率波动的现象。
若所述差值满足预设的筛选条件,则根据所述差值筛选出差值信号,并且将所述差值信号替代所述原始数据重复进行计算,直至计算出原始数据的残差分量。
所述集合经验模态分解算法通过计算方式表示如下:
把原始数据x(t)作为待处理信号,找到所有局部极大值点和极小值点,并分别连接形成上下包络线emax1(t)、emin1(t),上下包络线的均值为:
Figure BDA0002694287320000102
计算m1(t)和x(t)之间的差值
h1(t)=x(t)-m1(t) (19)
判断h1(t)是否满足约束条件,若满足,则h1(t)为从原始数据中筛选出来的第一阶IMF,记c1(t)=h1k(t);若不满足,h1(t)视为待处理数据,重复步骤(1)~(3),直到满足约束条件。
将c1(t)从x(t)中分解出来,并将差值信号r1(t)=x(t)-c1(t)作为待处理数据,重复步骤重复(1)~(4),最后剩下原始数据的残差分量rn(t)。当残差分量rn(t)成单调函数,从中不能再分解出固有模态函数,EMD停止。最终,原始数据x(t)可表示为:
Figure BDA0002694287320000111
从时域上来看,通过EMD分解得到的IMF分量的特征时间尺度由小逐渐到大;从频域上来看,IMF分量的频率从高频逐渐到低频。各个IMF分量代表信号不同频率段的成分,每个频率段包含的频率均不相同。在同一个IMF分量中,不同时刻的瞬时频率是不相同的,不同频率成分的局部时间分布是随着信号本身的变化而变化的。
经验模态分解不需要选定任何定义好的函数作为基函数,仅根据信号自身的时间尺度特征进行信号分解,克服了基函数无适应性的问题,对非线性、非平稳的信号和线性、平稳的信号均具有良好的适应性。
由于集合经验模态分解易出现模态混叠的问题,因此本方案还提供一种优选实施例以解决模态混叠的问题。
在所述优选实施例中,所述基于相空间重构和集合经验模态分解的预测方法,在进行集合经验模态分解时,还包括步骤:
在原始数据中加入幅值相同的白噪声;
根据设定的迭代次数对加入白噪声的原始数据执行多次经验模态分解,得到若干个IMF分量;
计算所有IMF分量的平均值。
由上述可得,集合经验模态分解算法通过将高斯白噪声添加到信号中,进行多次EMD分解,使得得到的每个分量都都包含了有限幅值的白噪声,最后通过对多次的EMD分解结果取均值,抑制甚至消除掉加入的白噪声对分解结果的影响。计算方式表示如下:
(1)在原始信号中加入幅值相同的白噪声:
si(t)=x(t)+ni(t) (21)
(2)对si(t)进行EMD分解,得到IMF分量
(3)重复步骤(1)~(2),对M次分解得到的每一个分量进行集成平均:
Figure BDA0002694287320000121
其中,cj,m表示第m次EMD算法分解出的第j个分量。
可以理解的是,上述计算过程需要设定的两个重要参数:
信号中添加的白噪声序列幅值系数k和算法执行EMD的总次数M;
噪声对于分解结果的影响e与M、k有下列关系:
Figure BDA0002694287320000122
k越小,越有利于分解精度的提高,但是当k小到一定程度时,有可能不足以引起信号局部极值点的变化,从而不能改变信号的局部时间跨度,就达不到多次试验应有的从尽可能多的尺度了解信号的目的。同时,M越大,e也会减小甚至忽略不计,但计算负担又会增加。根据经验,建议在M=100时,k取为0.01~0.5倍信号的标准偏差较为适宜。
为了避免数据湮灭以及降低奇异数据对算法的敏感度,本方案还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法,在所述对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构的步骤之后还包括:
采用线性归一化函数对相空间重构后的数据进行归一化处理,并且将相空间重构后的数据压缩在区间[0,1]内。
具体地,所述归一化处理的数学表示方式为:
Figure BDA0002694287320000131
其中,x′为归一化后某一时刻的值,x为该一时刻的值,xmax、xmin分别为时间序列中的最大值和最小值。
本方案还提供一种优选实施例,所述基于相空间重构和集合经验模态分解的预测方法,在所述将相空间重构后的数据输入至神经网络计算模块进行计算的步骤中,神经网络的构建方法具体为:
将神经网络的输入层神经元数对应设置为相空间重构的嵌入维数,神经网络的输出层神经元数对应设置为1;
选择由学习样本构成的训练集对所述神经网络进行训练。
请参见图5,所示神经网络为GRU网络,其中的rt代表重置门,决定前一时刻隐藏状态ht-1中有多少信息传递到当前候选集
Figure BDA0002694287320000132
中,rt越小,传递的信息就越少,zt代表更新门,决定前一时刻隐藏状态ht-1中有多少信息能到当前时刻隐藏状态ht中。其中:
rt=sigmoid(Wr·[ht-1,xt]) (25)
zt=sigmoid(Wz·[ht-1,xt]) (26)
Figure BDA0002694287320000133
Figure BDA0002694287320000134
yo=sigmoid(Wo·ht) (29)
本发明还提高一种示例性实施例,一种基于相空间重构和集合经验模态分解的预测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于相空间重构和集合经验模态分解的预测方法。
本发明还提供一种基于相空间重构和集合经验模态分解的预测方法的具体实施例。以2011年1月3日至2013年5月20日股市交易日内采样时间间隔为12小时的1200个黄金期货每盎司交易金额为例,将前1100个采样点作为训练集,后100个采样点作为测试集,进行单点单步的黄金期货交易金额预测。
请参见图6、7、8,首先通过C-C方法计算得出三个统计量
Figure BDA0002694287320000141
Scor(t),Scor(t)的最小值对应的时间为延迟时间窗口τω=175,
Figure BDA0002694287320000142
的第一个极小值点对应的时间为延迟时间τ=7,因此嵌入维数m≈26。
请参见图9,通过对黄金期货每盎司交易金额时间序列进行仿真,从图7中可以看出,通过最小二乘法拟合得到的直线斜率λ>0。根据混沌理论,该黄金期货交易金额序列具有短期可预测性。
对黄金期货每盎司交易金额的时间序列进行EEMD分解,得到了9个IMF分量(IMF1至IMF9)和1个残差分量(res),将其视为交易金额受到不同因素影响的振荡特征和趋势特征。
对各个分量计算相空间重构参数,如表1所示:
表1各个分量的时间延迟τ和嵌入维数m
IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 IMF9 res
τ 14 4 2 3 4 3 7 10 13 14
m 6 16 27 13 12 22 10 12 12 14
选择嵌入维数m作为GRU神经网络的输入神经元个数,将经过归一化处理的各分量序列输入到GRU神经网络中进行预测。
请参见图10,将各分量的预测结果叠加得到最终预测结果;请参见图11,最终预测结果的误差值如图所示。
本实施例还对最终预测结果的预测效果进行评价,评价方式如下所示:
采用拟合度(Equalization Coefficient,EC)、平均绝对误差(Mean AbsoluteError,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、均方误差(MeanSquaredError,MSE)来评价模型的预测效果。
Figure BDA0002694287320000151
Figure BDA0002694287320000152
Figure BDA0002694287320000153
Figure BDA0002694287320000154
其中,Yp(t)为t时刻交易金额的预测值,Yr(t)为t时刻交易金额的实际值。EC表示预测值与真实值之间的拟合程度,EC越大,预测效果越好,EC大于0.9可认为模型的较高的可用性;MAE是所有预测值与实际值的偏差的绝对值的平均,MAE可以避免误差相互抵消的问题;MAPE以百分比形式表示预测准确度,MSE对于异常大的误差值相比于MAE更加敏感。
为了验证提出的EEMD-GRU混合模型的有效性,对黄金期货交易金额序列数据经过相空间重构后分别使用反向传播(Back Propagation,BP)神经网络、径向基函数(RadialBasis Function,RBF)神经网络、小波神经网络(Wavelet Neural Network,WNN)、GRU神经网络进行预测,除此之外,对黄金期货交易金额序列数据进行EMD分解,对分解后的子序列分别进行相空间重构后使用GRU神经网络进行预测。表2为经过多次实验取均值后,各类模型对黄金期货交易金额序列的预测结果的性能对比。各模型的拟合度EC均达到了0.9以上,具有较高的可用性,EEMD-GRU模型的拟合度EC高于其他各类模型,达到了0.9954;平均绝对误差MAE相比于其他模型降低了30.3%到90.3%;平均绝对百分比误差MAPE和均方误差MSE相比于其他模型降低了0.2到2个数量级。实验证明,EEMD-GRU模型能够有效降低建模难度和提高预测精度。
表2各类模型预测性能对比
Figure BDA0002694287320000155
Figure BDA0002694287320000161
此外,本发明还提供一种基于相空间重构和集合经验模态分解的预测方法的具体实施例。以PJM网站美国伊利诺伊州2016年3月1日至5月7日采样时间间隔为1小时的1632个电力负荷数据为例,将前31天1464个采样点作为训练集,后7天共168个采样点作为测试集,进行单点单步的电力负荷预测。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。

Claims (10)

1.一种基于相空间重构和集合经验模态分解的预测方法,其特征在于,步骤包括:
通过采样器获取样本数据后,对所述样本数据进行集合经验模态分解;
对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构;
将相空间重构后的数据输入至神经网络计算模块进行计算,得到若干个子序列的预测结果;
将所有子序列的预测结果传输至数据中心处理器进行叠加,得到总预测结果。
2.如权利要求1所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,所述通过采样器获取样本数据后,还包括:
解析所述样本数据得到时间序列;
对所述时间序列进行相空间重构,得到相点序列;
计算所述相点序列的最大Lyapunov指数;
若所述最大Lyapunov指数大于零则判定所述时间序列为混沌系统且可进行短期预测。
3.如权利要求2所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,所述最大Lyapunov指数的计算方法的步骤包括:
对获取到的时间序列进行傅里叶变换,并计算出平均周期;
在所述平均周期内,对应所述相点序列中每一相点搜索出与该相点距离最近的邻点;
计算每一所述邻点经过若干个离散时间步长后的距离dj(i);其中,i表示i个离散时间步长,j表示相点数;
计算距离dj(i)的平均值:
Figure FDA0002694287310000021
其中,q是非零dj(i)的数目,△t为时间间隔;
利用最小二乘法生成平均值y(i)的回归直线,计算出的斜率即为最大Lyapunov指数。
4.如权利要求1或2所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,所述相空间重构的优选方式具体为:
利用关联积分算法同时估算出延迟时间和延迟时间窗口;
基于所述延迟时间和所述延迟时间窗口计算出嵌入维数;
以进行相空间重构的相点数为行数,同时以所述嵌入维数为列数,在相空间构造出相型分布矩阵。
5.如权利要求4所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,在所述将相空间重构后的数据输入至神经网络计算模块进行计算的步骤中,神经网络的构建方法具体为:
将神经网络的输入层神经元数对应设置为相空间重构的嵌入维数,神经网络的输出层神经元数对应设置为1;
选择由学习样本构成的训练集对所述神经网络进行训练。
6.如权利要求1所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,对所述样本数据进行集合经验模态分解,优选实施方式为:
从所述样本数据中分解出包括原始数据在内的所有局部极大值和局部极小值;
根据每一所述局部极大值和所述局部极小值分别连接形成上包络线和下包络线,并计算上包络线和下包络线的均值;
计算所述均值与所述原始数据的差值,并且判断所述差值是否满足预设的筛选条件;
若所述差值满足预设的筛选条件,则根据所述差值筛选出差值信号,并且将所述差值信号替代所述原始数据重复进行计算,直至计算出原始数据的残差分量。
7.如权利要求6所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,在进行集合经验模态分解时,还包括步骤:
在原始数据中加入幅值相同的白噪声;
根据设定的迭代次数对加入白噪声的原始数据执行多次经验模态分解,得到若干个IMF分量;
计算所有IMF分量的平均值。
8.如权利要求1所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,在获得样本数据后,采用线性插值法对所述样本数据进行补充,t+j时刻的缺失值为:
Figure FDA0002694287310000031
其中,xt为t时刻的缺失值,xt+i为t+i时刻的值。
9.如权利要求1所述的基于相空间重构和集合经验模态分解的预测方法,其特征在于,在所述对经过集合经验模态分解得到的本征模态函数和残差分量分别进行相空间重构的步骤之后还包括:
采用线性归一化函数对相空间重构后的数据进行归一化处理,并且将相空间重构后的数据压缩在区间[0,1]内。
10.一种基于相空间重构和集合经验模态分解的预测装置,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至9任一项所述的基于相空间重构和集合经验模态分解的预测方法。
CN202011005487.4A 2020-09-22 2020-09-22 基于相空间重构和集合经验模态分解的预测方法及装置 Pending CN112215404A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011005487.4A CN112215404A (zh) 2020-09-22 2020-09-22 基于相空间重构和集合经验模态分解的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011005487.4A CN112215404A (zh) 2020-09-22 2020-09-22 基于相空间重构和集合经验模态分解的预测方法及装置

Publications (1)

Publication Number Publication Date
CN112215404A true CN112215404A (zh) 2021-01-12

Family

ID=74049843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011005487.4A Pending CN112215404A (zh) 2020-09-22 2020-09-22 基于相空间重构和集合经验模态分解的预测方法及装置

Country Status (1)

Country Link
CN (1) CN112215404A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688771A (zh) * 2021-09-02 2021-11-23 重庆大学 Lng储罐加速度响应数据补全方法及装置
CN116011680A (zh) * 2023-02-20 2023-04-25 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种f10.7指数的预测方法及设备
CN116401534A (zh) * 2023-06-08 2023-07-07 中国空气动力研究与发展中心高速空气动力研究所 一种脉动压力模态成分分离方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688771A (zh) * 2021-09-02 2021-11-23 重庆大学 Lng储罐加速度响应数据补全方法及装置
CN113688771B (zh) * 2021-09-02 2024-04-05 重庆大学 Lng储罐加速度响应数据补全方法及装置
CN116011680A (zh) * 2023-02-20 2023-04-25 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种f10.7指数的预测方法及设备
CN116401534A (zh) * 2023-06-08 2023-07-07 中国空气动力研究与发展中心高速空气动力研究所 一种脉动压力模态成分分离方法
CN116401534B (zh) * 2023-06-08 2023-08-01 中国空气动力研究与发展中心高速空气动力研究所 一种脉动压力模态成分分离方法

Similar Documents

Publication Publication Date Title
Tokdar et al. Simultaneous linear quantile regression: a semiparametric Bayesian approach
Yoon et al. Semi-supervised learning with deep generative models for asset failure prediction
CN112215404A (zh) 基于相空间重构和集合经验模态分解的预测方法及装置
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN106022954B (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
CN113705864A (zh) 基于VMD-CNN-BiLSTM-ATT混合模型的气象干旱预测方法及装置
CN110930996B (zh) 模型训练方法、语音识别方法、装置、存储介质及设备
CN108399434B (zh) 基于特征提取的高维时间序列数据的分析预测方法
Tokdar et al. Simultaneous linear quantile regression: A semiparametric bayesian approach
CN110633859B (zh) 一种两阶段分解集成的水文序列预测方法
CN114399032A (zh) 一种电能表计量误差预测方法及系统
CN115601182A (zh) 一种基于改进型XGBoost类方法的数据分析方法、定价方法以及相关设备
CN110705600A (zh) 一种基于互相关熵的多深度学习模型融合方法、终端设备及可读存储介质
CN114548586A (zh) 一种基于混合模型的短期电力负荷预测方法及系统
Lee et al. Deep learning for hydrometeorology and environmental science
CN113988415A (zh) 一种中长期电力负荷预测方法
Kayim et al. Time series forecasting with volatility activation function
US11682069B2 (en) Extending finite rank deep kernel learning to forecasting over long time horizons
CN114065996A (zh) 基于变分自编码学习的交通流预测方法
CN117173883A (zh) 一种城市交通流量预测方法及系统
CN116739168A (zh) 一种基于灰色理论与编解码器的径流量预测方法
CN111028086A (zh) 基于聚类与lstm网络的增强指数跟踪方法
CN115730845A (zh) 一种电力系统动态估计方法、装置、设备和可读存储介质
CN110991604A (zh) 一种基于小波循环神经网络的时序金融数据预测方法
Al-Thelaya et al. Forecasting of bahrain stock market with deep learning: Methodology and case study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination