CN114881369B - 基于核化循环神经网络的风速预测方法及系统 - Google Patents
基于核化循环神经网络的风速预测方法及系统 Download PDFInfo
- Publication number
- CN114881369B CN114881369B CN202210679326.6A CN202210679326A CN114881369B CN 114881369 B CN114881369 B CN 114881369B CN 202210679326 A CN202210679326 A CN 202210679326A CN 114881369 B CN114881369 B CN 114881369B
- Authority
- CN
- China
- Prior art keywords
- wind speed
- neural network
- nucleated
- mode
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 57
- 125000004122 cyclic group Chemical group 0.000 title claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000009826 distribution Methods 0.000 claims abstract description 32
- 238000011160 research Methods 0.000 claims abstract description 8
- 239000000126 substance Substances 0.000 claims abstract description 7
- 238000012360 testing method Methods 0.000 claims description 22
- 238000000354 decomposition reaction Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 10
- 230000000306 recurrent effect Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于核化循环神经网络的风速预测方法及系统;其中,所述方法,包括:获取研究地区的待预测风速时间序列;计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;找到散度最小值对应的模式;根据找到的模式,查找与当前模式一一对应的训练后的核化循环神经网络参数;其中,所述训练后的核化循环神经网络,是根据当前模式对应的历史风速时间序列对核化循环神经网络进行预先训练得到的;采用训练后核化循环神经网络,对待预测的风速时间序列进行预测,输出预测的风速值。
Description
技术领域
本发明涉及风速预测技术领域,特别是涉及基于核化循环神经网络的风速预测方法及系统。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
目前,在风速预测问题中主要有三类研究方法:
(1)利用自然环境中存在的一些物理信息来预测风速,例如外界温度、湿度等;
(2)基于各种数学模型建立的预测系统,例如早期学者们常用自回归移动平均(ARMA)、自回归积分滑动平均(ARIMA)等时间序列模型来构建系统;
(3)随着人工智能各项技术的快速发展,越来越多的学者将机器学习、深度学习方法应用到风速预测问题中,最常用的有支持向量机(SVM)、各种神经网络(NN)等。此外,对风力原始信号进行分解后组合预测的研究思路也受到了广泛关注。
现如今,将核方法、神经网络或组合方法应用到复杂时间序列中的研究也越来越多,目前现有的一些预测方法主要存在以下缺点:
(1)风速规律实际具有较强的随机性,例如其在不同的季节或不同的时间段,它的变化规律也会大不相同。因此单一传统的ARMA、ARIMA等时间序列模型并不能很好的适应复杂的风速时间序列预测问题。
(2)传统的神经网络方法可能会在训练阶段陷入局部极小的情况,且这些方法大多要求提前准备好训练数据,定期训练也需要大量的计算和存储资源。而核方法(例如核自适应滤波器)相比于一些神经网络(例如Regularization Network神经网络等),显著降低了计算复杂度,并提高了性能。
(3)单一线性的自适应滤波器在线性系统的信号处理方面具有鲁棒性强,结构简单、实时性强等特点,但在面对非线性、非平稳的复杂时间序列预测问题时效果并不理想。
发明内容
为了解决现有技术的不足,本发明提供了基于核化循环神经网络的风速预测方法及系统;通过对风速历史数据的分析与建模,建立可实现在线实时预测的预测网络模型。
第一方面,本发明提供了基于核化循环神经网络的风速预测方法;
基于核化循环神经网络的风速预测方法,包括:
获取研究地区的待预测风速时间序列;
计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;找到散度最小值对应的模式;根据找到的模式,查找与当前模式一一对应的训练后的核化循环神经网络参数;其中,所述训练后的核化循环神经网络,是根据当前模式对应的历史风速时间序列对核化循环神经网络进行预先训练得到的;
采用训练后核化循环神经网络,对待预测的风速时间序列进行预测,输出预测的风速值。
第二方面,本发明提供了基于核化循环神经网络的风速预测系统;
基于核化循环神经网络的风速预测系统,包括:
获取模块,其被配置为:获取研究地区的待预测风速时间序列;
计算模块,其被配置为:计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;找到散度最小值对应的模式;根据找到的模式,查找与当前模式一一对应的训练后的核化循环神经网络参数;其中,所述训练后的核化循环神经网络,是根据当前模式对应的历史风速时间序列对核化循环神经网络进行预先训练得到的;
输出模块,其被配置为:采用训练后核化循环神经网络,对待预测的风速时间序列进行预测,输出预测的风速值。
第三方面,本发明还提供了一种电子设备,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。
第四方面,本发明还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。
第五方面,本发明还提供了一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现上述第一方面所述的方法。
与现有技术相比,本发明的有益效果是:
本发明结合了单一神经网络和单一核自适应滤波器的优势,建立核化的循环神经网络,在数学上简化了非线性神经元的分析与计算;本发明将时间序列片段的匹配转化为序列分布的匹配,经过合适的片段划分算法,本发明能够有效减少计算量,降低计算复杂度并减少存储资源;此外,本发明关注到风速时序数据的多时间尺度特征,通过对原始序列进行离散小波分解提取出不同尺度下的分量,更高效地利用数据特征,降低预测误差。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例一提出的基于多尺度和核化循环神经网络的风速预测方法流程图;
图2(a)-图2(c)为本发明实施例一中核化循环神经网络内部的核自适应滤波器示意图;
图3为本发明实施例一中核化循环神经网络示意图;
图4为本发明实施例一离散小波二层分解示意图;
图5为本发明实施例一模式字典构造示意图;
图6为本发明实施例一模式字典结构示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。
实施例一
本实施例提供了基于核化循环神经网络的风速预测方法;
如图1所示,基于核化循环神经网络的风速预测方法,包括:
S101:获取待预测风速时间序列;
S102:计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;找到散度最小值对应的模式;根据找到的模式,查找与当前模式一一对应的训练后的核化循环神经网络参数;其中,所述训练后的核化循环神经网络,是根据当前模式对应的历史风速时间序列对核化循环神经网络进行预先训练得到的;
S103:采用训练后核化循环神经网络,对待预测的风速时间序列进行预测,输出预测的风速值。
示例性地,S101:获取待预测风速时间序列;具体包括:
获取研究地区风电场的不同年份风速历史数据,按照时间顺序形成历史风速时间序列集合,其中,风速时间序列中相邻两点之间的时间间隔为15min,具体可表示为:
S={s1,s2,s3,…,sn}
Γ={S1,S2,S3,…,SN}
其中,S表示历史风速时间序列,st表示风速时间序列中时间t的风速大小,n为风速时序中时间点个数,Γ表示多个历史风速时间序列组成的序列集合。
进一步地,所述计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;其中,散度值,是指KL散度(Kullback Leibler Divergence)。
KL散度,是一种量化两种概率分布P和Q之间差异的方式,也被称为相对熵,散度值越小,表示两种概率分布越相似。其中要注意的是,KL散度是非对称的,即D(P||Q)≠D(Q||P)。
计算待预测风速样本分布与模式字典中的子序列分布之间的KL散度,找到对应KL散度值最小的模式,利用存储的参数构建核化循环神经网络。
进一步地,所述核化循环神经网络,其结构包括:
依次连接的输入层、核自适应滤波层、全连接层和输出层。
如图2(a)~图2(c)所示,所述核自适应滤波层,采用最小均方算法(Kernel LeastMean Square,KLMS)来实现。
应理解地,本申请实施例选择核自适应滤波器算法中使用较为广泛的核最小均方算法作为滤波器的自适应算法,并通过计算选择使得预测误差相对较小的参数值。选择将低维数据映射到高维空间中的转化函数。设计循环神经网络并设置网络参数,将循环神经网络中的神经元结构替换为核自适应滤波器,得到核化的循环神经网络。
这种由内核机器而不是神经元驱动的神经网络,在有监督的环境中学习前馈神经网络架构时,需要使用反向传播算法训练内部组件。经过分层训练的核化神经网络与单一的核机器或单一神经网络相比,具有更良好的性能。
建立核化神经网络中的核自适应滤波层,选择核自适应滤波算法中使用较为广泛的核最小均方算法(KLMS)作为滤波器的自适应算法,该方法的关注重点是克服最小均方线性的限制,将核技巧和最小均方(LMS)算法结合,为再生核希尔伯特空间(ReproducingKernel Hilbert Space,RKHS)中的自适应滤波器提供了一个样本到样本的更新。
假设其核映射Φ将输入st转换为高维特征空间Г,对于假设训练集中的输入ψ={ut,yt:t∈[1,n]},其中ut表示输入向量,ut是由滑动窗口划分得到的历史风速时间序列S中的序列片段,即U={u1,u2,u3…,um}={{s1,s2,s3,…si},{s2,s3,s4…si+1},{s3,s4,s5…si+2},…,{sm-i,sm-i+1,sm-i+2,…,sm}},其中i为设置窗口的分解大小。yt表示的是所期望的输出,即ut序列片段的下一个值,那么滤波器中的自适应算法表示如下:
其中,et是计算得到的预测误差,ft表示迭代t时需要学习的映射,η∈R+表示步长参数,κσ(·,·)∈R+表示一个大小为σ(σ∈R+)的Mercer内核,αi表示参与内核计算的其他参数值。此计算规则通过为每个输入向量分配一个新的内核单元,ut为内核单元的中心,生成了一个不断增长的径向基函数(Radial Basis Function Network,RBFN)。
进一步地,所述训练后核化循环神经网络,其训练过程包括:
构建训练集和测试集;所述训练集和测试集,均为历史风速时间序列;
将训练集和测试集中的历史风速时间序列均进行标准化处理;
将训练集和测试集中的历史风速时间序列采用小波分解算法(Discrete WaveletTransformation,DWT)进行若干次分解,得到高频分量和低频分量,再将得到的低频分量采用滑动窗口进行片段划分,计算每一个划分片段与模式字典中每一个模式下不同片段的散度值;判断散度值是否小于设定阈值,如果小于设定阈值,则找到模式字典中散度值小于设定阈值的片段,将当前片段的模式设定为与模式字典中散度值小于设定阈值的片段的模式相同;如果大于设定阈值,则将当前片段作为一个新的模式保存在模式字典中;
将同一模式下训练集的低频分量和已知风速时间序列,作为核化循环神经网络的输入值,对核化循环神经网络进行训练,得到当前模式下初步训练后的核化循环神经网络;
采用同一模式下测试集的低频分量和已知风速时间序列,作为初步训练后核化循环神经网络的输入值,对核化循环神经网络进行测试,得到当前模式下训练后核化循环神经网络。
进一步地,所述模式字典,包括若干种模式,每一种模式下包括至少一个片段;模式字典中的第一个片段自身为一种模式,第二个片段与第一个片段进行散度值计算,若散度值小于设定阈值,则将第二个片段与第一个片段划分到相同的模式下;如果散度值大于设定阈值,则将第二片段作为新的模式保存;以此类推,对后续片段依次与模式字典中的已有片段进行散度值计算,将散度值与设定阈值进行比较,若散度值小于设定阈值,则将待划分模式的片段划分到对应最小散度值的片段的模试下;如果散度值大于设定阈值,则将待划分模式的片段作为一个新的模式保存到模式字典中。
进一步地,所述训练集,包括待研究地区风电场的不同年份历史风速时间序列集合。
进一步地,所述对核化循环神经网络进行测试,测试过程中采用均方误差和平均绝对误差作为评价指标衡量测试结果的准确性,将满足评价要求的核化循环神经网络作为训练后的核化循环神经网络。
示例性地,所述将训练集和测试集中的历史风速时间序列均进行标准化处理;具体包括:
将历史风速时间序列数据进行归一化处理,表示归一化后的数据,st为序列原始数据,其具体计算方法为:
将Γ中所有历史风速时间序列ST的前80%划分为训练集,后20%划分为测试集。
示例性地,所述将训练集和测试集中的历史风速时间序列采用小波分解算法(Discrete Wavelet Transformation,DWT)进行若干次分解,得到高频分量和低频分量;具体包括:
如图4所示,将历史风速时间序列ST利用离散小波分解算法(DWT)进行分解,其中低频分量表示为SL,也称为近似分量,可表示为高频分量表示为SH,也称为细节分量,可表示为/>原始信号的分解可以表示为:
ln=∑tL<2n-t>st (2)
hn=∑tH<2n-t>st (3)
其中,L表示低通滤波器(LPF),H表示高通滤波器(HPF),n和t表示对应分量的索引。
若对小波分解后的低频序列SL继续进行离散小波分解,得到的即为小波二次分解的低频序列和高频序列,可表示为l2和h2,以此类推。
低频分量能够反映历史数据中的长期趋势信息,高频分量能够反映历史数据中的短期趋势信息。
这里要注意的是,多次进行小波分解可以更大程度上提取时间序列的不同频率的特征,然而过多层数的分解也会导致重构和预测过程中产生较多的噪声,从而影响实验结果。
多层小波分解的迭代过程可表示为:
其中m表示分解层数的索引,lm-1表示上层近似分量。
经过小波分解后可得到时间序列分量,
进一步地,所述不同模式下历史风速时间序列;具体包括:
将训练集中的历史风速时间序列按照滑动窗口进行划分,划分为若干个片段;
依次输入核化循环神经网络进行训练,得到多个不同的模式输出,其中每个模式中存储的是内核单元最相似的多个片段,以及对应的参数和权重。
对集合中的单个时间序列分别利用核化神经网络进行训练,再将所得到的模式存储在一起,形成模式字典,从而建立短期风速预测模型。
为了进一步减少预测时的计算量并降低存储需求,核自适应滤波层在得到序列片段之后的训练过程中,会判断是否需生成新的内核单元,在生成新的内核单元时,本发明设计了一些必要的数据冗余消除机制,通过最大限度地减少信息丢失来抑制径向基函数的增长。
进一步地,所述训练过程,还包括:
通过公式(7)计算每次迭代t时新输入向量{ut,yt}学习前后与最相似模式的Y={y1,y2,y3,…,yt-1}序列的数据分布变化,根据预设阈值判断当前输入向量对于模式字典的信息贡献量,从而决定是否为该输入向量分配新的内核单元,达到抑制网络无限增长的目的。
计算公式如下:
∈(yt,pt-1)=-log pt-1(yt) (7)
其中,yt即为t时刻输入的所期望的输出值,pt-1表示序列{y1…yt-1}的概率密度函数,该公式在数学上的意义为:yt相对于概率密度函数pt-1的预测损失。其中若∈(yt,pt-1)的计算值大于所设阈值(例如在实验时选择阈值为10),表明数据分布发生了变化,信息含量较高,则为该输入向量ut分配新的内核单元,将输入向量ut、t-1时刻学习的映射ft-1(根据定义,即为yt-1)、当前的内核权重ηet存储为一个新的模式,为了保证序列的连续性,将最相似模式中的所有内容也都复制到该新模式中,示意如下:
其中C={Ci:i∈[1,|C|]}
其中Y={Yi:i∈[1,|Y|]}
其中W={Wi:i∈[1,|W|]}
上述|C|=|Y|=|W|,表示字典中的字典项个数;Ci*、Yi*、Wi*代表最相似模式字典项。
若∈(yt,pt-1)的计算值小于等于所设阈值,表明数据分布没有发生变化或变化较小,输入向量的信息含量较低,则不为该输入向量ut分配新的内核单元,而是将当前输入向量与最相似模式的中心序列合并,形成新的中心序列,同时将新的ft-1并入模式,并更新内核权重ηet,示意如下:
其中C={Ci:i∈[1,|C|]}
其中Y={Yi:i∈[1,|Y|]}
其中W={Wi:i∈[1,|W|]}
仍代表最相似模式字典项。
该模式的结构如图5所示。
上述最相似模式的计算方法,是通过KL散度比较两个数据分布之间的距离DKL(p||q):
在这里,D(p||q)表示当用概率分布q来拟合已存在的分布p时,产生的信息损耗,||表示p(xi)表示的是学习yt-1之前的序列概率密度函数,q(xi)表示的是学习yt-1之后的序列概率密度函数。KL散度的值越趋近于0,则表示两个序列分布之间的差距越小,即表示与所比较模式中心序列更相似。xi表示序列中的具体元素,N表示序列内元素的个数。
模式字典整体构造的过程如图6所示。
RNN从数据中学习到的非线性自适应函数更新隐藏状态ht,预测输出ft也是ht其中的一个从数据中学习的非线性函数。其关系也可以简单描述为:
ft=fout(ht);
fout即表示与最终任务相关的预测函数。
通过损失函数均方误差和最小化KL散度的计算目标,可以训练得到最佳预测性能的核自适应滤波层。
核自适应滤波-循环神经网络(KAF-RNN)的整体结构如图3所示。
对于核化循环神经网络的输入,可以重新表示为{st,yt,wt:t∈[1,n]},其中w0表示初始化的参数向量。权重的更新由输入向量st、前状态参数wt-1以及隐藏状态ht影响,令fobs表示权重的学习函数,η仍然表示步长参数,进一步的我们有:
wt=fobs(st,ht)wt-1 (8)
此外定义时间i的代价函数为其中et=yt-ft-1(st)。
那么可以得到在时间i相对于再生核希尔伯特空间(Reproducing KernelHilbert Space,RKHS)中权重的误差梯度:
其中偏导数对应的是不同状态的维度。
在循环网络中,过去的状态通过反馈与当前状态输入耦合。
因此,先前状态相对于当前滤波器权重的偏导数为非零。在每次适应当前的在线学习模型后,相对于这个更新的网络重建下一个状态梯度
根据上述方法对训练集中的风速序列ST进行片段划分,依次输入核自适应滤波-循环神经网络进行训练,最终得到不同的模式。
将所得到的模式存储在一起,形成模式字典,从而建立短期风速预测模型。
计算待预测风速样本分布与模式字典中的子序列分布之间的KL散度,找到对应KL散度值最小的模式,利用存储的参数计算待预测的风速值,进一步检测预测结果,判断是否需要补充训练。
为了评估该方法预测所得到的结果准确性,本发明使用了一些评价指标来衡量结果准确性:均方误差MSE和平均绝对误差MAE。
MSE是在训练自适应系统时常用的二阶统计量,衡量的是期望值与预测值之间的平均平方差,其计算公式如式(10)所示;
MAE是绝对误差的平均值,可以更好地反映预测值误差的实际情况。其计算公式如式(11)所示。
其中St表示t时刻的真实风速值,表示计算所得的预测值,也就是ft。
实施例二
本实施例提供了基于核化循环神经网络的风速预测系统;
基于核化循环神经网络的风速预测系统,包括:
获取模块,其被配置为:获取待预测风速时间序列;
计算模块,其被配置为:计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;找到散度最小值对应的模式;根据找到的模式,查找与当前模式一一对应的训练后的核化循环神经网络参数;其中,所述训练后的核化循环神经网络,是根据当前模式对应的历史风速时间序列对核化循环神经网络进行预先训练得到的;
输出模块,其被配置为:采用训练后核化循环神经网络,对待预测的风速时间序列进行预测,输出预测的风速值。
此处需要说明的是,上述获取模块、计算模块和输出模块对应于实施例一中的步骤S101至S103,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.基于核化循环神经网络的风速预测方法,其特征是,包括:
获取研究地区的待预测风速时间序列;
计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;找到散度最小值对应的模式;根据找到的模式,查找与当前模式一一对应的训练后的核化循环神经网络参数;其中,所述训练后的核化循环神经网络,是根据当前模式对应的历史风速时间序列对核化循环神经网络进行预先训练得到的;
所述核化循环神经网络,其结构包括:
依次连接的输入层、核自适应滤波层、全连接层和输出层;
所述核自适应滤波层,采用最小均方算法来实现;
采用训练后核化循环神经网络,对待预测的风速时间序列进行预测,输出预测的风速值;
所述训练后核化循环神经网络,其训练过程包括:
构建训练集和测试集;所述训练集和测试集,均为历史风速时间序列;
将训练集和测试集中的历史风速时间序列均进行标准化处理;
将训练集和测试集中的历史风速时间序列采用小波分解算法进行若干次分解,得到高频分量和低频分量,再将得到的低频分量采用滑动窗口进行片段划分,计算每一个划分片段与模式字典中每一个模式下不同片段的散度值;判断散度值是否小于设定阈值,如果小于设定阈值,则找到模式字典中散度值小于设定阈值的片段,将当前片段的模式设定为与模式字典中散度值小于设定阈值的片段的模式相同;如果大于设定阈值,则将当前片段作为一个新的模式保存在模式字典中;
将同一模式下训练集的低频分量和已知风速时间序列,作为核化循环神经网络的输入值,对核化循环神经网络进行训练,得到当前模式下初步训练后的核化循环神经网络;
采用同一模式下测试集的低频分量和已知风速时间序列,作为初步训练后核化循环神经网络的输入值,对核化循环神经网络进行测试,得到当前模式下训练后核化循环神经网络;
所述模式字典,包括若干种模式,每一种模式下包括至少一个片段;模式字典中的第一个片段自身为一种模式,第二个片段与第一个片段进行散度值计算,若散度值小于设定阈值,则将第二个片段与第一个片段划分到相同的模式下;如果散度值大于设定阈值,则将第二片段作为新的模式保存;以此类推,对后续片段依次与模式字典中的已有片段进行散度值计算,将散度值与设定阈值进行比较,若散度值小于设定阈值,则将待划分模式的片段划分到对应最小散度值的片段的模式下;如果散度值大于设定阈值,则将待划分模式的片段作为一个新的模式保存到模式字典中。
2.如权利要求1所述的基于核化循环神经网络的风速预测方法,其特征是,所述计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;其中,散度值,是指KL散度。
3.如权利要求1所述的基于核化循环神经网络的风速预测方法,其特征是,所述对核化循环神经网络进行测试,测试过程中采用均方误差和平均绝对误差作为评价指标衡量测试结果的准确性,将满足评价要求的核化循环神经网络作为训练后的核化循环神经网络。
4.如权利要求1所述的基于核化循环神经网络的风速预测方法,其特征是,所述将训练集和测试集中的历史风速时间序列均进行标准化处理;具体包括:
将历史风速时间序列数据进行归一化处理,表示归一化后的数据,st为序列原始数据,其具体计算方法为:
5.基于核化循环神经网络的风速预测系统,采用如权利要求1所述的基于核化循环神经网络的风速预测方法,其特征是,包括:
获取模块,其被配置为:获取研究地区的待预测风速时间序列;
计算模块,其被配置为:计算待预测风速时间序列样本分布与不同模式下历史风速时间序列样本分布之间的散度值;找到散度最小值对应的模式;根据找到的模式,查找与当前模式一一对应的训练后的核化循环神经网络参数;其中,所述训练后的核化循环神经网络,是根据当前模式对应的历史风速时间序列对核化循环神经网络进行预先训练得到的;
输出模块,其被配置为:采用训练后核化循环神经网络,对待预测的风速时间序列进行预测,输出预测的风速值。
6.一种电子设备,其特征是,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求1-4任一项所述的方法。
7.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述计算机可读指令由计算机执行时,执行权利要求1-4任一项所述方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210679326.6A CN114881369B (zh) | 2022-06-16 | 2022-06-16 | 基于核化循环神经网络的风速预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210679326.6A CN114881369B (zh) | 2022-06-16 | 2022-06-16 | 基于核化循环神经网络的风速预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114881369A CN114881369A (zh) | 2022-08-09 |
CN114881369B true CN114881369B (zh) | 2024-05-21 |
Family
ID=82681008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210679326.6A Active CN114881369B (zh) | 2022-06-16 | 2022-06-16 | 基于核化循环神经网络的风速预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114881369B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146162A (zh) * | 2018-08-07 | 2019-01-04 | 河海大学 | 一种基于集成循环神经网络的概率风速预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11479243B2 (en) * | 2018-09-14 | 2022-10-25 | Honda Motor Co., Ltd. | Uncertainty prediction based deep learning |
-
2022
- 2022-06-16 CN CN202210679326.6A patent/CN114881369B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146162A (zh) * | 2018-08-07 | 2019-01-04 | 河海大学 | 一种基于集成循环神经网络的概率风速预测方法 |
Non-Patent Citations (2)
Title |
---|
Multiple Wind Speed Forecast Using Simple Recurrent Unit;Xin Gao et al.;《IAEAC 2021》;20211231;1706-1710 * |
基于改进自适应粒子滤波的无线传感网船舶追踪;梅骁峻等;《上海海事大学学报》;20180630;第39卷(第2期);12-16 * |
Also Published As
Publication number | Publication date |
---|---|
CN114881369A (zh) | 2022-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN112364975A (zh) | 基于图神经网络的终端运行状态预测方法及系统 | |
CN117389824A (zh) | 一种基于信号分解和混合模型的云服务器负载预测方法 | |
CN116316591A (zh) | 基于混合双向门控循环的短期光伏功率预测方法及系统 | |
CN114676645B (zh) | 一种非平稳时间序列预测方法及系统 | |
Zhang et al. | Features fusion exaction and KELM with modified grey wolf optimizer for mixture control chart patterns recognition | |
Sun et al. | A composite uncertainty forecasting model for unstable time series: Application of wind speed and streamflow forecasting | |
Tian et al. | Joint learning model for underwater acoustic target recognition | |
CN114500325A (zh) | 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法 | |
CN111415008B (zh) | 一种基于vmd-foa-grnn的船舶流量预测方法 | |
CN115587964A (zh) | 一种基于熵筛选的伪标签交叉一致性变化检测方法 | |
Zheng et al. | An automatic data process line identification method for dam safety monitoring data outlier detection | |
CN114444668A (zh) | 网络量化方法及系统及装置及介质及图像处理方法 | |
Jiang et al. | A short-term wind power prediction approach based on ensemble empirical mode decomposition and improved long short-term memory | |
Liu et al. | Product Processing Quality Classification Model for Small‐Sample and Imbalanced Data Environment | |
CN110852522A (zh) | 一种短期电力负荷预测方法及系统 | |
CN114494783A (zh) | 一种基于动态图神经网络的预训练方法 | |
CN114881369B (zh) | 基于核化循环神经网络的风速预测方法及系统 | |
CN117155806A (zh) | 一种通信基站流量预测方法与装置 | |
Feng et al. | Spatiotemporal prediction based on feature classification for multivariate floating-point time series lossy compression | |
Cai et al. | Hybrid variational autoencoder for time series forecasting | |
CN115423091A (zh) | 一种条件对抗神经网络训练方法、场景生成方法和系统 | |
CN114595641A (zh) | 组合优化问题的求解方法和系统 | |
Li et al. | Eapruning: evolutionary pruning for vision transformers and cnns | |
Fang et al. | Interval prediction of PV power based on double sample entropy framework and integrated bidomain decomposition deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |