CN115711612A - 一种波浪有效波高的预测方法 - Google Patents
一种波浪有效波高的预测方法 Download PDFInfo
- Publication number
- CN115711612A CN115711612A CN202211360808.1A CN202211360808A CN115711612A CN 115711612 A CN115711612 A CN 115711612A CN 202211360808 A CN202211360808 A CN 202211360808A CN 115711612 A CN115711612 A CN 115711612A
- Authority
- CN
- China
- Prior art keywords
- wave
- data
- value
- wave data
- effective
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000003062 neural network model Methods 0.000 claims abstract description 34
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 13
- 230000015654 memory Effects 0.000 claims description 22
- 238000007637 random forest analysis Methods 0.000 claims description 15
- 230000007246 mechanism Effects 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种波浪有效波高的预测方法,方法包括获取多份原始波浪数据;根据EMD分别将每份原始波浪数据分解成对应的IMF分量和剩余项,并将每份原始波浪数据与对应的IMF分量和剩余项合并,得到增强波浪数据;从所有增强波浪数据中选取出特征集;通过特征集输入至训练完成的神经网络模型中,得到波浪有效波高的预测结果。本方法首先对原始波浪数据进行EMD分解为多个IMF分量和剩余项,然后将每份原始波浪数据与对应的IMF分量和剩余项合并,得到增强波浪数据,利用增强波浪数据结合神经网络模型进行预测,能够使神经网络模型有效地分析非线性和非平稳数据,从而提高波浪有效波高的预测结果。
Description
技术领域
本发明涉及波浪有效波高预测技术领域,特别涉及一种波浪有效波高的预测方法。
背景技术
复杂多变的海洋环境严重影响着船舶、人类和沿海工程的安全。有效波高(SWH)是描述波浪(海浪)的重要参数,准确地预测有效波高对于海洋作业、船舶工程、港口建设、波浪能发电、航路规划等领域具有重要意义。准确、及时的有效波高预测可避免造成社会经济损失。然而,由于海洋环境的不确定性,准确预测有效波高具有一定的挑战性。
在过去的几十年中,SWH预测方法得到了持续的发展与改进,其预测效果也在稳步提高,但仍存在如下问题亟待解决:
现有的方法很少详细地评估浮标数据中包含的对SWH预测有潜在价值的特征;而且由于波浪的非平稳、非线性特性,SWH的预测精度有待进一步提高。
发明内容
本发明旨在至少解决现有技术中存在的技术问题。为此,本发明提出一种波浪有效波高的预测方法、系统、设备及存储介质,能够提高有效波高的预测准确度。
本发明的第一方面,提供了一种波浪有效波高的预测方法,所述预测方法包括:
获取多份原始波浪数据;
根据EMD分别将每份所述原始波浪数据分解成对应的IMF分量和剩余项,并将每份所述原始波浪数据与对应的所述IMF分量和剩余项合并,得到与每份所述原始波浪数据对应的增强波浪数据;
从所有所述增强波浪数据中选取出特征集;
通过所述特征集输入至训练完成的神经网络模型中,得到所述神经网络模型输出的波浪有效波高的预测结果。
根据本发明的实施例,至少具有如下技术效果:
本方法首先对原始波浪数据进行EMD分解为多个IMF分量和剩余项,然后将每份原始波浪数据与对应的IMF分量和剩余项合并,得到增强波浪数据,利用增强波浪数据结合神经网络模型进行预测,能够使神经网络模型有效地分析非线性和非平稳数据,从而提高波浪有效波高的预测结果。
根据本发明的一些实施例,所述从所有所述增强波浪数据中选取出特征集,包括:
生成由所有所述增强波浪数据组成的数据集,并获取每一份所述增强波浪数据对应的有效波高观测值;
从所述数据集的所述增强波浪数据中提取特征,按特征重要性对所有所述特征进行排序,得到由排序好的所述特征组成的第一特征集;并构建初始为空的第二特征集、初始为空的历史平均误差、初始为零的耐心值和最大耐心值;
将所述第一特征集中的所述特征按特征重要性由高到低依次添加到所述第二特征集中;其中,每一次添加所述特征到所述第二特征集中时,通过预设的辅助预测模型计算当前所述第二特征集对应的当前有效波高预测值,计算当前有效波高预测值与对应的所述有效波高观测值之间的当前平均误差,若当前平均误差大于当前历史平均误差时,保留当前所述第二特征集中的所有所述特征;否则,去除当前所述第二特征集中最近一次添加的所述特征,并将所述耐心值增加一;依次类推,直至所述耐心值增加到大于所述最大耐心值或者所述第一特征集中的所有所述特征都判断完成,得到判断完成后的所述第二特征集;其中,当前历史平均误差通过对应若干次的当前平均误差计算得出;
将所述判断完成后的所述第二特征集作为输入至训练完成的神经网络中的特征集。
根据本发明的一些实施例,所述辅助预测模型为所述神经网络模型。
根据本发明的一些实施例,所述按特征重要性对所有所述特征进行排序,包括:通过随机森林对所有所述特征的相对重要性进行排序。
根据本发明的一些实施例,所述神经网络模型为门控循环单元网络模型。
根据本发明的一些实施例,所述门控循环单元网络模型中包括有自注意力机制。
根据本发明的一些实施例,所述神经网络模型通过如下方式计算波浪有效波高的预测结果:
通过所述神经网络模型的线性层输出查询张量Query、键张量Key和值张量Value;
将所述查询张量Query、所述键张量Key和所述值张量Value分别与对应的权重矩阵进行线性变换,得到变换后的张量Query、张量Key和张量Value;
通过如下公式计算相应的权重矩阵W:
其中,di表示偏移系数;
将张量Value乘以权重矩阵W,得到波浪有效波高的预测结果。
本发明的第二方面,提供了一种波浪有效波高的预测系统,所述预测系统包括:
数据获取单元,用于获取多份原始波浪数据;
波浪数据增强单元,用于根据EMD分别将每份所述原始波浪数据分解成对应的IMF分量和剩余项,并将每份所述原始波浪数据与对应的所述IMF分量和剩余项合并,得到与每份所述原始波浪数据对应的增强波浪数据;
特征选取单元,用于从所有所述增强波浪数据中选取出特征集;
有效波高预测单元,用于通过所述特征集输入至训练完成的神经网络模型中,得到所述神经网络模型输出的波浪有效波高的预测结果。
本发明的第三方面,提供了一种电子设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如上述波浪有效波高的预测方法。
本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述的波浪有效波高的预测方法。
可以理解的是,上述第二方面至第四方面与相关技术相比存在的有益效果与上述第一方面与相关技术相比存在的有益效果相同,可以参见上述第一方面中的相关描述,在此不再赘述。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一个实施例提供的一种波浪有效波高的预测方法的流程示意图;
图2是原始数据集和增强数据集的示意图;
图3是图1中步骤S103的流程示意图;
图4是本发明另一个实施例提供的一种波浪有效波高的预测方法的流程示意图;
图5是本发明一个实施例提供的41046站点SWH数据进行EMD分解后的结果;
图6是本发明一个实施例提供的41046站点数据经过EMD分解后的结果;
图7是本发明一个实施例提供的4种方法对41008站24小时预报的观测值与预测值比较;
图8是本发明一个实施例提供的4种方法对41046站24小时预报的观测值与预测值比较;
图9是本发明一个实施例提供的四种方法在两站点24小时预报的性能比较;
图10是本发明一个实施例提供的四种方法在两站点48小时预报的性能比较;
图11是本发明一个实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在介绍本申请实施例之前,先对本申请实施例的技术概念进行简要说明:
有效波高(SWH)预测的问题定义:给定波浪数据其中,n表示浮标的特征数量,t1表示每个特征的时间长度,即且i=1,2,...,n。此外,t2长度的待预测有效波高表示为SWH预测目标是找到一个函数F,它满足以下条件,使预测值和真实观测值之间的误差尽可能小:
Y=F(X) (1)
经验模态分解(Empirical Mode Decomposition,EMD):EMD由Huang等人首先提出。在EMD中,信号分解是根据数据本身的时间尺度特征进行的,事先不需要基函数。该方法将复杂信号分解为有限本征模态函数(IMF)。分解后的IMF分量包含了原始信号不同时间尺度的局部特征信号,可以有效地用于分析非线性和非平稳数据集。分解方程如式所示:
门控循环单元(Gated Recurrent Unit,GRU):GRU是一种常用的门控循环神经网络(Gated Recurrent Neural Network),GRU的每个单元都有一个当前输入xt,从上一个节点传递过来的隐藏状态ht-1,它包含关于上一个节点的信息。给定xt,和ht-1,通过一系列操作,GRU为当前节点提供输出yt,为下一个节点提供隐藏状态ht。每个GRU单元包含一个重置门r和一个更新门zt。重置门r决定了有多少信息将从前一个隐藏状态转移到当前隐藏状态,更新门zt决定了前一个时间的记忆和当前时间临时记忆的权重,并将它们组合起来形成当前时间的记忆。
随机森林算法:随机森林算法作为bagging算法和决策树算法的结合,被广泛应用于特征选择。给定具有c个特征X1,...,Xc的数据集,想要计算不同特征Xi;和Xj,i≠j之间的相对重要性。在随机森林算法中,一个特征的重要性是该特征在随机森林的每棵决策树中的平均贡献度,由基尼指数计算出。基尼指数如式(3)所示:
其中,K表示所有样本可分为K个类别,phk表示类别k在节点h中所占的比例。在确定节点h的基尼指数后,可以计算特征Xj在节点h的重要性,即节点h分支前后基尼指数的变化:
其中,GIm和GIo分别表示分支后两个新节点的基尼指数。将特征Xj在决策树冲出现的集合表示为H,则Xj在树i中的重要性为:
假设随机森林中有N棵树,特征j的重要性评分为:
按照重要性评分从高到低排序重要性。
自注意力机制:自注意力机制是对注意力机制的改进,通过引入神经网络来计算不同分量之间的权值。
实施例部分;
参照图1,本申请的第一实施例,提供了一种波浪有效波高的预测方法,本方法包括如下步骤S101至S104,其中:
步骤S101、获取多份原始波浪数据。
步骤S102、根据EMD分别将每份原始波浪数据分解成对应的IMF分量和剩余项,并将每份原始波浪数据与对应的IMF分量和剩余项合并,得到与每份原始波浪数据对应的增强波浪数据。如图2所示,图2(a)是由多份原始波浪数据组成的原始数据集,图2(b)是由多份增强波浪数据组成的增强数据集。
步骤S103、从所有增强波浪数据中选取出特征集。
步骤S104、通过特征集输入至训练完成的神经网络模型中,得到神经网络模型输出的波浪有效波高的预测结果。
在步骤S101中,原始波浪数据通过站点(海洋中的观测站点)采集,需要注意的是,本申请实施例对站点的类型和数量、原始波浪数据的数量不作限制。在步骤S102中,将原始波浪数据EMD分解为多个IMF分量和剩余项,分解后的IMF分量包含了原始数据不同时间尺度的局部特征数据。
由于波浪具有非平稳、非线性的特性,因此首先对原始波浪数据进行EMD分解为多个IMF分量和剩余项,然后将每份原始波浪数据与对应的IMF分量和剩余项合并,得到增强波浪数据,利用增强波浪数据结合神经网络模型进行预测,能够使神经网络模型有效地分析非线性和非平稳数据,从而提高波浪有效波高的预测准确度。
参照图3,本申请的第二实施例,步骤S103中的从所有增强波浪数据中选取出特征集,包括步骤S1031至S1034,其中:
步骤S1031、生成由所有增强波浪数据组成的数据集,并获取每一份增强波浪数据对应的有效波高观测值。
步骤S1032、从数据集的增强波浪数据中提取特征,按特征重要性对所有特征进行排序,得到由排序好的特征组成的第一特征集;并构建初始为空的第二特征集、初始为空的历史平均误差、初始为零的耐心值和最大耐心值。在本申请的一些实施例中,通过随机森林对所有特征的相对重要性进行排序。
步骤S1033、将第一特征集中的特征按特征重要性由高到低依次添加到第二特征集中;其中,每一次添加特征到第二特征集中时,通过预设的辅助预测模型计算当前第二特征集对应的当前有效波高预测值,计算当前有效波高预测值与对应的有效波高观测值之间的当前平均误差,若当前平均误差大于当前历史平均误差时,保留当前第二特征集中的所有特征;否则,去除当前第二特征集中最近一次添加的特征,并将耐心值增加一;依次类推,直至耐心值增加到大于最大耐心值或者第一特征集中的所有特征都判断完成,得到判断完成后的第二特征集;其中,当前历史平均误差通过对应若干次的当前平均误差计算得出。在本申请的一些实施例中,这里的辅助预测模型为步骤S104中的神经网络模型。
步骤S1034、将判断完成后的第二特征集作为输入至训练完成的神经网络中的特征集。
在上述已对波浪数据进行经验模态分解,然后将分解后的子数据加入到原始波浪数据中进行特征增强,得到了增强波浪数据。本实施例的步骤S1031至S1034需要对增强波浪数据中的特征进行提取,本申请的目的是为了提高海浪有效波高的预测准确度,而并非所有的特征都有助于波浪有效波高的预测,因此为了消除冗余特征以改善预测并减少计算开销,这里首先使用随机森林算法来计算关于SWH的每个特征的相对重要性,然后使用正向选择的方法将特征按重要性由高到低的顺序添加到空特征集中,每次添加后,使用当前的特征集进行SWH预测,并记录预测值与观测值之间的平均误差(MAE),最后,选择最优MAE对应的特征集作为模型的输入。
本实施例首先对原始波浪数据进行经验模态分解,然后将分解后的子信号加入到原始波浪数据中进行特征增强,最后对增强波浪数据进行特征选择,确定神经网络模型的最终输入特征。本方法能够充分的挖掘波浪数据中潜在的有价值的特征以改进SWH预测。
本申请的第三实施例,步骤S104中的神经网络模型为包括有自注意力机制的门控循环单元网络模型。由于设计上的缺陷,在使用长序列作为输入时,RNN(循环神经网络)都不可避免地会存在遗忘问题,这样将降低SWH预测的准确度,为了解决这一技术缺陷,本实施例在门控循环单元网络模型中加入了自注意力机制,自注意力机制通过引入神经网络来计算不同分量之间的权值,在本实施例中,运用该机制,可以使波浪数据的关键部分可以获得更多的权值,优化异常值预测,达到更好的预测结果。
步骤S104中的神经网络模型通过如下方式计算波浪有效波高的预测结果:
步骤S1041、通过神经网络模型的线性层输出查询张量Query、键张量Key和值张量Value。需要注意的是,由于门控循环单元网络模型的训练过程为本领域公知常识,此处不再细述,本实施例的步骤重点说明自注意力机制在门控循环单元网络模型中的工作流程。
步骤S1042、将查询张量Query、键张量Key和值张量Value分别与对应的权重矩阵进行线性变换,得到变换后的张量Query、张量Key和张量Value:
Query=QWQ (7)
Key=KWK (8)
Value=VWV (9)
步骤S1043、通过如下公式计算相应的权重矩阵W:
其中,di表示偏移系数,根据实际情况进行设定。
步骤S1044、将张量Value乘以权重矩阵W,得到波浪有效波高的预测结果。
Z=W·Value (11)
本方法实施例为了解决因RNN的遗忘问题而导致的SWH预测准确度低的缺陷,在门控循环单元网络模型中引入自注意力机制来优化异常值预测。根据神经网络来计算不同分量之间的权值,运用该机制,可以使数据的关键部分可以获得更多的权值,达到更好的预测结果。
参照图4至图10,本申请的第四实施例,为了进一步阐释,提出一种波浪有效波高的预测方法(后续使用lSP-FESAN表示本方法),结合后续实验证明,本方法比现有的方法的预测精度更高。本方法采用特征工程,包括基于EMD的特征增强和基于随机森林算法的特征选择,以提高模型对非线性和非平稳数据的处理能力;然后,在GRU中引入自我注意网络来优化异常值预测,具体的:
步骤S201、基于EMD算法和随机森林算法构建特征工程,挖掘波浪数据中潜在的有价值的特征以改进SWH预测。
首先,使用EMD方法,通过式(2)将数据分解为几个IMF分量和剩余项,之后被添加到原始数据集(由多份原始波浪数据组成),从而获得增益数据集(由增强波浪数据组成)。
然后,由于消除冗余特征可以改善神经网络的预测精度并减少计算开销,因此使用随机森林算法来计算关于SWH的每个特征的相对重要性,然后进一步进行特征的选择,将选择的特征的作为模型的输入以达到最佳的预测效果。这里,为每个站设计了一个自适应特征选择方法,方法流程如下:
1)原始数据集中的数据经过EMD处理之后,得到几个IMF分量和剩余项,添加至原始数据集,并得到增益数据集。
2)获取增益数据集中的有效波高观测值,初始化历史平均误差为零,初始化第一波浪特征集、第二波浪特征集为空数据集,初始化耐心值为零,预设最大耐心值。
3)使用随机森林算法对增益数据集中提取的特征按特征重要性由高到低进行排序,获得由排好序的特征组成的第一波浪特征集。
4)将排好序的第一波浪特征集中的特征按特征重要性由高到低依次添加到第二波浪特征集中,每添加一次数据到第二波浪特征集中时,则通过神经网络(即步骤S202中的神经网络模型)计算一次有效波高预测值。
5)计算有效波高预测值与有效波高观测值之间的当前平均误差,将当前平均误差和历史平均误差进行判断。
6)若当前平均误差大于历史平均误差,则将第一波浪特征集中的当前一次添加的特征添加到第二波浪特征集中;若当前平均误差小于或等于历史平均误差,则将耐心值增加一,并移除当前相关系数对应的第一波浪特征集中的特征。
7)在第一波浪特征集中的所有的特征均判断完或耐心值增加到大于最大耐心值后结束判断,获得特征选择后的第二波浪特征集。
上述1)至7),通过随机森林得到特征的重要度排序后,使用正向选择的方法将特征按重要性由高到低的顺序添加到空特征集中,每次添加后,使用当前的特征集进行SWH预测,并记录预测值与观测值之间的平均误差MAE。最后,选择最优MAE对应的特征集作为模型的输入。
步骤S202、在门控循环单元网络模型(GRU)中引入自注意力机制,得到优化的神经网络模型(本实施例命名为FE-GRU),通过FE-GRU来优化预测效果。
参照图4,示出了自注意力机制的基本模块的构造。自注意力机制需要输入三个值,即查询张量Query、键张量Key和值张量Value。根据计算Query和Key张量对应的分数来获得相应的权重。然后,利用上面得到的权值对Value张量进行加权平均,最后得到输出。具体计算过程如下:
首先,将Query、Key和Value分别与它们的权重矩阵进行线性变换,得到变换后的张量Query、Key和Value。
然后通过式(10)计算相应的权重矩阵W,其中本实施例设置偏移系数dI为128。
最后,将值矩阵Value乘以权重矩阵W,得到最终输出。
以下提供第四实施例的实验结果:
首先,比较普通的GRU模型与本申请提供的FE-GRU模型的预测效果来评价特征工程对SWH预测的增益效应;然后,选择GRU(通过GRU方法进行SWH预测)、FE-GRU(仅利用FE-GRU进行SWH预测)、EMD-LSTM(Hao等人和Zhou等人分别将EMD方法与LSTM相结合,提出EMD-LSTM方法进行SWH预测)和ISP-FESAN(包括步骤S201的特征工程和步骤S202的FE-GRU)对SWH进行预测,并从不同的角度评估其的性能。
第一部分:数据及数据预处理;
使用美国国家海洋和大气管理局(NOAA)国家数据浮标中心(Na-tional dataBuoy Center)41008站和41046站的小时标准气象数据,浮标数据的缺失值用99或999表示。由于设备的稳定性问题,浮标有时不能正常工作,导致缺失值的出现,这里使用线性插值来填补缺失的值。
第二部分:采用平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)和相关系数(R2)等4个常用的评价指标来评估预测效果。其中MAE、MAPE和RMSE从不同方面反映了预测值与观测值之间的误差,R2反映了预测值与观测值之间的拟合程度。
第三部分、特征工程效果评估;
这里用41046站的数据为例,给出了分析过程和结果。
图5表示EMD算法分解后的SWH时间历程。如果时间序列是非平稳的,递归图是非均匀分布的。结果表明,所分析的IMF分量递归图是非均匀分布的,表明原始SWH具有非平稳特性。EMD方法将SWH分解为多个IMF分量和残差,分离出非平稳项,可以很好地用于原始数据集的特征增强。
图6(a)表示特征重要性排序结果。可以看出,IMF分量和平均波浪周期(APD)的相对重要性最高,而气温(ATMP)、主导波浪周期(DPD)和海表温度(WTMP)的相对重要性较低。这个排名结果与物理定律是一致的,令人信服的。图6(b)显示了随着特征数量的增加,预测值和观测值之间的MAE变化。可以看到,当k<8时,随着特征按重要性顺序添加到数据集,预测误差稳步下降;当k=8时,预测误差达到全局最优;当k>8时,预测误差向上振荡。因此,在41046站点,选择了特征重要性最高的8个特征作为模型的输入。
表1显示了特征工程对24小时SWH预测的增益效应。可以看出,引入特征工程后,各评价指标的预测效果均有较大提高,MAE、MAPE和RMSE平均分别下降39%、42%和41%,R2平均增加28%。
表1:(GRU和FE-GRU的24小时预测结果)
第四部分、整体表现;
24小时预报结果和每个站的观测值的散点分布图如图7和图8所示。GRU、FE-GRU、EMD-LSTM和ISP-FESAN的24小时SWH预测结果的最佳拟合线斜率在41008站点分别为0.6788、0.9088、0.8092和0.9135,在41046站点分别为0.7854、0.9141、0.8378和0.9331。这表明ISP-FESAN可以有效消除非平稳性引起的相位偏差,从而获得更好的拟合结果。
表2和表3分别列出上述四种方案在41008和41046站的24小时和48小时SWH预测结果,其中最优结果以粗体显示。值得注意的是,ISP-FESAN取得了最好的效果。以41046站的24小时预报为例,FE-GRU比GRU方法有很大的改进。特别是,整体误差分别减少了31%和26%。与FE-GRU相比,ISP-FESAN的预测效果最好,总误差降低了23%。综上所述,通过引入特征工程对非平稳波的波浪时间序列进行平滑处理,有效地抑制了相移带来的误差,大大提高了预测精度。通过引入自注意力机制,进一步提高了预测精度。
表2:(24小时预测结果)
表3:(48小时预测结果)
第五部分、异常值预测评估;
将各站点SWH高度排在前20%的定义为异常值,图9和图10可以很好地反映24小时预测误差随着SWH增加的变化趋势。对于坐标上的每一点,其纵坐标值代表SWH预测值与观测值之间的绝对误差,大于对应的横坐标值。预测误差随SWH的增大而增大。值得注意的是,ISP-FESAN在异常值预测方面比其他方法具有更低的误差。在41008和41046站,与其他三种方法的模型相比,对24小时的预测误差分别减小了16%和24%,对48小时的预测误差分别减小了33%和28%。
通过对FE-GRU方法和ISP-FESAN的预测结果进行比较,ISP-FESAN将特征工程与自注意网络相结合可以改善非平稳波浪的预测结果,从而显著提高预测精度。而且利用自注意网络可以提高GRU模型对非平稳时间序列的预测精度,具有一定的科学性和实用性。
综上所述,本实施例方法引入特征工程,通过EMD分解对波浪时间序列进行平滑处理,得到对预测有益的IMF分量,然后基于随机森林算法选择波浪数据中最重要的特征;通过在GRU模型中引入自注意力机制,提高了对异常值的预测能力。此外,还进行了24小时和48小时SWH预测实验,并比较了4种模型的预测效果。结果表明,随着预测时间的增加,波浪信号非平稳性对预测的影响逐渐增大,本方法在整体效果和异常值预测上都取得了比传统方法更好的效果。
本申请的一个实施例,提供了一种波浪有效波高的预测系统,本系统包括数据获取单元1100、波浪数据增强单元1200、特征选取单元1300和有效波高预测单元1400,其中:
数据获取单元1100用于获取多份原始波浪数据。
波浪数据增强单元1200用于根据EMD分别将每份原始波浪数据分解成对应的IMF分量和剩余项,并将每份原始波浪数据与对应的IMF分量和剩余项合并,得到与每份原始波浪数据对应的增强波浪数据。
特征选取单元1300用于从所有增强波浪数据中选取出特征集。
有效波高预测单元1400用于通过特征集输入至训练完成的神经网络模型中,得到神经网络模型输出的波浪有效波高的预测结果。
需要注意的是,本系统实施例与上述的方法实施例是基于相同的发明构思,因此上述方法实施例的内容同样适用于本系统实施例,此处不再赘述。
参照图11,本申请实施例还提供了一种电子设备,本电子设备包括:
至少一个存储器;
至少一个处理器;
至少一个程序;
程序被存储在存储器中,处理器执行至少一个程序以实现本公开实施上述的波浪有效波高的预测方法。
该电子设备可以为包括手机、平板电脑、个人数字助理(Personal DigitalAssistant,PDA)、车载电脑等任意智能终端。
电子设备包括:
处理器1600,可以采用通用的中央处理器(Central Processing Unit,CPU)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本公开实施例所提供的技术方案;
存储器1700,可以采用只读存储器(Read Only Memory,ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory,RAM)等形式实现。存储器1700可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1700中,并由处理器1600来调用执行本公开实施例的波浪有效波高的预测方法。
输入/输出接口1800,用于实现信息输入及输出;
通信接口1900,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;
总线2000,在设备的各个组件(例如处理器1600、存储器1700、输入/输出接口1800和通信接口1900)之间传输信息;
其中处理器1600、存储器1700、输入/输出接口1800和通信接口1900通过总线2000实现彼此之间在设备内部的通信连接。
本公开实施例还提供了一种存储介质,该存储介质是计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述波浪有效波高的预测方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序的介质。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种波浪有效波高的预测方法,其特征在于,所述预测方法包括:
获取多份原始波浪数据;
根据EMD分别将每份所述原始波浪数据分解成对应的IMF分量和剩余项,并将每份所述原始波浪数据与对应的所述IMF分量和剩余项合并,得到与每份所述原始波浪数据对应的增强波浪数据;
从所有所述增强波浪数据中选取出特征集;
通过所述特征集输入至训练完成的神经网络模型中,得到所述神经网络模型输出的波浪有效波高的预测结果。
2.根据权利要求1所述的波浪有效波高的预测方法,其特征在于,所述从所有所述增强波浪数据中选取出特征集,包括:
生成由所有所述增强波浪数据组成的数据集,并获取每一份所述增强波浪数据对应的有效波高观测值;
从所述数据集的所述增强波浪数据中提取特征,按特征重要性对所有所述特征进行排序,得到由排序好的所述特征组成的第一特征集;并构建初始为空的第二特征集、初始为空的历史平均误差、初始为零的耐心值和最大耐心值;
将所述第一特征集中的所述特征按特征重要性由高到低依次添加到所述第二特征集中;其中,每一次添加所述特征到所述第二特征集中时,通过预设的辅助预测模型计算当前所述第二特征集对应的当前有效波高预测值,计算当前有效波高预测值与对应的所述有效波高观测值之间的当前平均误差,若当前平均误差大于当前历史平均误差时,保留当前所述第二特征集中的所有所述特征;否则,去除当前所述第二特征集中最近一次添加的所述特征,并将所述耐心值增加一;依次类推,直至所述耐心值增加到大于所述最大耐心值或者所述第一特征集中的所有所述特征都判断完成,得到判断完成后的所述第二特征集;其中,当前历史平均误差通过对应若干次的当前平均误差计算得出;
将所述判断完成后的所述第二特征集作为输入至训练完成的神经网络中的特征集。
3.根据权利要求2所述的波浪有效波高的预测方法,其特征在于,所述辅助预测模型为所述神经网络模型。
4.根据权利要求3所述的波浪有效波高的预测方法,其特征在于,所述按特征重要性对所有所述特征进行排序,包括:通过随机森林对所有所述特征的相对重要性进行排序。
5.根据权利要求3所述的波浪有效波高的预测方法,其特征在于,所述神经网络模型为门控循环单元网络模型。
6.根据权利要求5所述的波浪有效波高的预测方法,其特征在于,所述门控循环单元网络模型中包括有自注意力机制。
8.一种波浪有效波高的预测系统,其特征在于,所述预测系统包括:
数据获取单元,用于获取多份原始波浪数据;
波浪数据增强单元,用于根据EMD分别将每份所述原始波浪数据分解成对应的IMF分量和剩余项,并将每份所述原始波浪数据与对应的所述IMF分量和剩余项合并,得到与每份所述原始波浪数据对应的增强波浪数据;
特征选取单元,用于从所有所述增强波浪数据中选取出特征集;
有效波高预测单元,用于通过所述特征集输入至训练完成的神经网络模型中,得到所述神经网络模型输出的波浪有效波高的预测结果。
9.一种电子设备,其特征在于:包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至7任一项所述的波浪有效波高的预测方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的波浪有效波高的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211360808.1A CN115711612B (zh) | 2022-11-02 | 2022-11-02 | 一种波浪有效波高的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211360808.1A CN115711612B (zh) | 2022-11-02 | 2022-11-02 | 一种波浪有效波高的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115711612A true CN115711612A (zh) | 2023-02-24 |
CN115711612B CN115711612B (zh) | 2024-06-11 |
Family
ID=85231936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211360808.1A Active CN115711612B (zh) | 2022-11-02 | 2022-11-02 | 一种波浪有效波高的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115711612B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021218424A1 (zh) * | 2020-04-30 | 2021-11-04 | 江苏科技大学 | 基于rbf神经网络的航海雷达图像反演海面风速方法 |
CN114912077A (zh) * | 2022-05-27 | 2022-08-16 | 中国海洋大学 | 一种融合随机搜索与混合分解误差订正的海浪预报算法 |
CN115032682A (zh) * | 2022-06-01 | 2022-09-09 | 东南大学 | 一种基于图论的多站台地震震源参数估计方法 |
CN115169439A (zh) * | 2022-06-16 | 2022-10-11 | 中国人民解放军国防科技大学 | 一种基于序列到序列网络的有效波高预测方法和系统 |
-
2022
- 2022-11-02 CN CN202211360808.1A patent/CN115711612B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021218424A1 (zh) * | 2020-04-30 | 2021-11-04 | 江苏科技大学 | 基于rbf神经网络的航海雷达图像反演海面风速方法 |
CN114912077A (zh) * | 2022-05-27 | 2022-08-16 | 中国海洋大学 | 一种融合随机搜索与混合分解误差订正的海浪预报算法 |
CN115032682A (zh) * | 2022-06-01 | 2022-09-09 | 东南大学 | 一种基于图论的多站台地震震源参数估计方法 |
CN115169439A (zh) * | 2022-06-16 | 2022-10-11 | 中国人民解放军国防科技大学 | 一种基于序列到序列网络的有效波高预测方法和系统 |
Non-Patent Citations (4)
Title |
---|
SHUYI ZHOU 等: "Improving Significant Wave Height Forecasts Using a Joint Empirical Mode Decomposition–Long Short-Term Memory Network", JOURNAL OF MARINE SCIENCE AND ENGINEERING, 5 July 2021 (2021-07-05), pages 2 - 3 * |
张小龙 等: "基于EOF分析中西太平洋金枪鱼围网渔场的海洋环境", 海洋学研究, vol. 37, no. 2, 30 June 2019 (2019-06-30), pages 81 - 94 * |
王刚 等: "自然语言处理基础教程", 31 January 2022, 机械工程出版社, pages: 199 - 203 * |
谭可易 等: "基于EMD方法的SAR海浪参数反演", 广东海洋大学学报, vol. 38, no. 4, 31 July 2018 (2018-07-31), pages 77 - 84 * |
Also Published As
Publication number | Publication date |
---|---|
CN115711612B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256697B (zh) | 一种用于电力系统短期负荷的预测方法 | |
US20150254554A1 (en) | Information processing device and learning method | |
CN110149237B (zh) | 一种Hadoop平台计算节点负载预测方法 | |
Yang et al. | Hybrid prediction method for wind speed combining ensemble empirical mode decomposition and Bayesian ridge regression | |
CN111507521A (zh) | 台区电力负荷预测方法及预测装置 | |
CN113157771A (zh) | 一种数据异常检测方法及电网数据异常检测方法 | |
CN111368887B (zh) | 雷雨天气预测模型的训练方法及雷雨天气预测方法 | |
CN111461445B (zh) | 短期风速预测方法、装置、计算机设备及存储介质 | |
CN113657668A (zh) | 基于lstm网络的电力负荷预测方法及系统 | |
CN113988477A (zh) | 基于机器学习的光伏功率短期预测方法、装置及存储介质 | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
CN103413038A (zh) | 基于矢量量化的长期直觉模糊时间序列预测方法 | |
CN111985719A (zh) | 一种基于改进的长短期记忆网络的电力负荷预测方法 | |
CN115169746A (zh) | 基于融合模型的电力负荷短期预测方法、装置及相关介质 | |
CN113807951A (zh) | 一种基于深度学习的交易数据趋势预测方法和系统 | |
CN114676645A (zh) | 一种非平稳时间序列预测方法及系统 | |
CN104217296A (zh) | 一种上市公司绩效综合评价方法 | |
CN109816165A (zh) | 风电超短期功率预测方法及系统 | |
CN113627685A (zh) | 一种考虑风电上网负荷限制的风力发电机功率预测方法 | |
CN115711612A (zh) | 一种波浪有效波高的预测方法 | |
CN116739172A (zh) | 一种基于爬坡识别的海上风电功率超短期预测方法及装置 | |
CN116885699A (zh) | 基于双重注意力机制的电力负荷预测方法 | |
CN115619449A (zh) | 基于深度学习模型的化肥价格预测方法、设备及存储介质 | |
CN114037051A (zh) | 一种基于决策边界的深度学习模型压缩方法 | |
CN114239945A (zh) | 短期电力负荷预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |