CN115099318A - 一种风速时空预测网络的训练方法、应用方法及电子设备 - Google Patents

一种风速时空预测网络的训练方法、应用方法及电子设备 Download PDF

Info

Publication number
CN115099318A
CN115099318A CN202210673229.6A CN202210673229A CN115099318A CN 115099318 A CN115099318 A CN 115099318A CN 202210673229 A CN202210673229 A CN 202210673229A CN 115099318 A CN115099318 A CN 115099318A
Authority
CN
China
Prior art keywords
wind speed
time
sequence
prediction network
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210673229.6A
Other languages
English (en)
Inventor
张华军
孙幼军
苏义鑫
张丹红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN202210673229.6A priority Critical patent/CN115099318A/zh
Publication of CN115099318A publication Critical patent/CN115099318A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种风速时空预测网络的训练方法、应用方法及电子设备,包括:获取包含标注信息的风速训练样本集,其中,标注信息包括所述风速训练样本集中的每个当前风速时空序列在未来时刻的不同区域的实际未来风速序列;将风速训练样本集输入至构建的风速时空预测网络,确定预测未来风速序列,并根据实际未来风速序列和预测未来风速序列确定损失函数,其中,风速时空预测网络包括多个由长短期记忆结构和卷积结构构成的卷积时序模块;根据损失函数的值调整风速时空预测网络的参数至满足收敛条件,确定训练完备的风速时空预测网络。本发明构造高分辨率输入矩阵和相同分辨率输出矩阵的映射,以获得准确的多站点预测结果。

Description

一种风速时空预测网络的训练方法、应用方法及电子设备
技术领域
本发明风速预测技术领域,尤其涉及一种风速时空预测网络的训练方法、应用方法及电子设备。
背景技术
随着水运需求的不断提升,人们对海上航行的安全、经济、绿色标准有了更高的要求。水文气象条件对船舶安全有着重大影响,因此如何综合考虑水文气象条件,为船舶规划安全可靠、经济绿色的航线,以此来保障航运业的健康快速发展成为了如今水上交通运输业研究的热点之一。船舶在海上航行时,会受到各种水文气象要素的影响,而风速预测是远洋船舶气象水文保障的重要组成部分。准确的水文气象要素的预报既能保证船舶航行安全,又能尽量节省航时和燃油,能为远洋客船的正常运营提供保障。
在海风、海浪、洋流三大影响航行的气象水文要素中,海风具有非线性、不确定性、高波动性特征和复杂的频率特性,预报难度较大。目前,国内外多数风速预测研究都建立在单个地点上,对区域风速研究还比较少。由于时空预测输出数据量较大,难以解析深层特征;且有些方法采用了像素级预测,但其不能从全局图像表示中直接预测,同样不能达到准确预测的目的。因此,如何进行准确、高效且快速的风速时空预测是亟待解决的问题。
发明内容
有鉴于此,有必要提供一种风速时空预测网络的训练方法、应用方法及电子设备,用以克服现有技术中难以对区域内的风速进行预测的问题。
为了解决上述技术问题,本发明提供一种风速时空预测网络的训练方法,包括:
获取包含标注信息的风速训练样本集,其中,所述标注信息包括所述风速训练样本集中的每个当前风速时空序列在未来时刻的不同区域的实际未来风速序列;
将所述风速训练样本集输入至构建的风速时空预测网络,确定预测未来风速序列,并根据所述实际未来风速序列和所述预测未来风速序列确定损失函数,其中,所述风速时空预测网络包括多个由长短期记忆结构和卷积结构构成的卷积时序模块;
根据所述损失函数的值调整所述风速时空预测网络的参数至满足收敛条件,确定训练完备的风速时空预测网络。
进一步地,所述构建的风速时空预测网络包括编码器和解码器,其中,所述编码器和所述解码器分别包括依次连接的多个所述卷积时序模块。
进一步地,所述编码器包括依次连接的第一时序卷积层至第六时序卷积层,其中,所述第一时序卷积层、第三时序卷积层和第五时序卷积层分别包括依次连接的所述卷积时序模块和激活模块,第二时序卷积层、第四时序卷积层和第六时序卷积层分别包括依次连接的所述卷积时序模块和归一化模块。
进一步地,所述解码器包括依次连接的第七时序卷积层至第十二时序卷积层,其中,所述第七时序卷积层、第九时序卷积层和第十一时序卷积层分别包括依次连接的所述卷积时序模块和归一化模块,第八时序卷积层、第十时序卷积层分别包括依次连接的所述卷积时序模块和激活模块,所述第十二时序卷积层包括两个依次连接的所述卷积时序模块和激活模块。
进一步地,所述当前风速时空序列通过如下公式表示:
X1:k={x1,x2,...,xk}∈RM×N×k
其中,xk表示在(i,j)地点的风速在第k时刻的观测值,通过如下公式表示:
Figure RE-GDA0003779382220000031
其中,i表示经度,j表示纬度,M表示经度i的总数目,N表示纬度j的总数目。
进一步地,所述卷积时序模块通过如下公式表示:
Figure RE-GDA0003779382220000041
Figure RE-GDA0003779382220000042
Figure RE-GDA0003779382220000043
Figure RE-GDA0003779382220000044
Figure RE-GDA0003779382220000045
其中,i表示输入门,f表示遗忘门,
Figure RE-GDA0003779382220000048
表示控制单元,o表示输出门,Wxi、Whi、Wci、Wxf、Whf、Wcf、Wxc、Whc、Wxo、Wco、 Wco皆为权值矩阵,*表示卷积算子,o表示哈达玛乘积,σ(·)表示激活函数,
Figure RE-GDA0003779382220000046
表示t时刻神经元的输入、Ct-1、Ct分别表示t-1时刻、t 时刻神经元的信息状态、Ht-1
Figure RE-GDA0003779382220000047
表示t-1时刻、t时刻向下一层传递的信息状态,ot表示输出门中的门控信息,bi、bf、bc和bo分别表示输入门、遗忘门、控制单元和输出门对应的偏移函数。
进一步地,所述卷积时序模块将当前时刻神经元的输入和上一时刻神经元的输出在进行向量乘法之后,直接将得到的乘法信息传输到输入门、遗忘门、控制单元和输出门,并在各个门的输入之前加入了窥视连接。
进一步地,所述卷积时序模块将向量的乘积操作,换成了矩阵的卷积操作,实现样本行和样本列的空间信息的获取所述卷积时序模块将向量的乘积操作,换成了矩阵的卷积操作,实现样本行和样本列的空间信息的获取。
本发明还提供一种风速时空预测网络的应用方法,包括:
获取待测的当前风速时空序列;
将所述待测的当前风速时空序列输入至训练完备的风速时空预测网络,确定预测未来风速序列,其中,所述训练完备的风速时空预测网络根据如上所述的风速时空预测网络的训练方法确定。
本发明还提供一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现根据如上所述的风速时空预测网络的训练方法,和/或根据如上所述的风速时空预测网络的应用方法。
与现有技术相比,本发明的有益效果包括:首先,对风速训练样本集进行有效的获取,利用多个时间段不同经纬度的海域风速数据来预测未来时间段不同经纬度的海域风速;然后,基于风速时空预测网络,利用多个由长短期记忆结构和卷积结构构成的卷积时序模块,结合CNN卷积网络和LSTM长短时记忆结构的优点,更好地进行像素级的精确输出,有效提取了时间信息特征,并充分考虑了空间相关性;最后,根据损失函数,对于整个网络进行训练,实现精确的像素级空间输出,更好地捕捉全球空间信息并映射到所需的多位置输出,在保证像素级区域风速输出的同时能够进行多步预测,并且可以从不同的预测时刻学习样本,实现准确的时空预测。综上,本发明构造高分辨率输入矩阵和相同分辨率输出矩阵的映射,有效挖掘数据中的有效信息,自动捕获隐藏的线性及非线性特征,还可以高效处理大规模时空序列数据,以获得准确的多站点预测结果,不仅可以实现海域的多站点、多步长预测,可以从前若干小时预测未来若干小时,而且在该步长下的时间和空间预测可以保持较低的误差值。此发明在远洋船舶气象水文保障中具有应用前景。
附图说明
图1为本发明提供的风速时空预测网络的训练方法一实施例的流程示意图;
图2为本发明提供的图1中风速时空预测网络一实施例的结构示意图;
图3为本发明提供的卷积时序模块一实施例的单元维度结构示意图;
图4为本发明提供的卷积时序模块一实施例的内部结构示意图;
图5为本发明提供的风速时空预测网络的应用方法一实施例的流程示意图;
图6为本发明提供的样本预测一实施例的预测效果示意图;
图7为本发明提供的样本预测另一实施例的预测效果示意图;
图8为本发明提供的预测值与真实值一实施例的比较示意图;
图9为本发明提供的风速时空预测网络的训练装置一实施例的结构示意图;
图10为本发明提供的风速时空预测网络的应用装置一实施例的结构示意图;
图11为本发明提供的电子设备一实施例的结构示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。此外,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明的描述中,提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,所描述的实施例可以与其它实施例相结合。
本发明提供了一种风速时空预测网络的训练方法、应用方法及电子设备,结合CNN网络结构和LSTM网络结构,构造高分辨率输入矩阵和相同分辨率输出矩阵的映射,为进一步实现高效的风速时空预测提供了新思路。
在实施例描述之前,对相关词语进行释义:
风速预测:是远洋船舶气象水文保障的重要组成部分,通过预测未来时刻海面的风速,保证航行安全。
基于上述技术名词的描述,现有技术中,基于传统参数模型的预测方法难以捕获数据中的非线性特征,基于传统机器学习的时空序列预测方法可以自动捕获数据中的非线性特征,在小样本上具有很好的泛化能力,但对于巨大的样本数据,无法进行高效的处理,难以达到准确的预测效果。因而,本发明旨在提出一种高效准确的海面风速区域多步预测方法,解决上述问题。
以下分别对具体实施例进行详细说明:
本发明实施例提供了一种风速时空预测网络的训练方法,结合图 1来看,图1为本发明提供的风速时空预测网络的训练方法一实施例的流程示意图,包括步骤S101至步骤S103,其中:
在步骤S101中,获取包含标注信息的风速训练样本集,其中,所述标注信息包括所述风速训练样本集中的每个当前风速时空序列在未来时刻的不同区域的实际未来风速序列;
在步骤S102中,将所述风速训练样本集输入至构建的风速时空预测网络,确定预测未来风速序列,并根据所述实际未来风速序列和所述预测未来风速序列确定损失函数,其中,所述风速时空预测网络包括多个由长短期记忆结构和卷积结构构成的卷积时序模块;
在步骤S103中,根据所述损失函数的值调整所述风速时空预测网络的参数至满足收敛条件,确定训练完备的风速时空预测网络。
在本发明实施例中,首先,对风速训练样本集进行有效的获取,利用多个时间段不同经纬度的海域风速数据来预测未来时间段不同经纬度的海域风速;然后,基于风速时空预测网络,利用多个由长短期记忆结构和卷积结构构成的卷积时序模块,结合CNN卷积网络和 LSTM长短时记忆结构的优点,更好地进行像素级的精确输出,有效提取了时间信息特征,并充分考虑了空间相关性;最后,根据损失函数,对于整个网络进行训练,实现精确的像素级空间输出,更好地捕捉全球空间信息并映射到所需的多位置输出,在保证像素级区域风速输出的同时能够进行多步预测,并且可以从不同的预测时刻学习样本,实现准确的时空预测。
作为优选的实施例,结合图2来看,图2为本发明提供的图1中风速时空预测网络一实施例的结构示意图,上述构建的风速时空预测网络包括编码器和解码器,其中,所述编码器和所述解码器分别包括依次连接的多个所述卷积时序模块。
在本发明实施例中,使用基于convLSTM的编码器解码器结构来对海面风速进行时空预测。
作为优选的实施例,仍结合图2来看,所述编码器包括依次连接的第一时序卷积层至第六时序卷积层,其中,所述第一时序卷积层、第三时序卷积层和第五时序卷积层分别包括依次连接的所述卷积时序模块和激活模块,第二时序卷积层、第四时序卷积层和第六时序卷积层分别包括依次连接的所述卷积时序模块和归一化模块。
在本发明实施例中,编码器的作用是将输入数据编码为连续特征空间中的向量表示。
作为优选的实施例,仍结合图2来看,所述解码器包括依次连接的第七时序卷积层至第十二时序卷积层,其中,所述第七时序卷积层、第九时序卷积层和第十一时序卷积层分别包括依次连接的所述卷积时序模块和归一化模块,第八时序卷积层、第十时序卷积层分别包括依次连接的所述卷积时序模块和激活模块,所述第十二时序卷积层包括两个依次连接的所述卷积时序模块和激活模块。
在本发明实施例中,解码器用于对编码后的输入序列进行解码并输出目标序列。
在本发明一个具体的实施例中,使用基于convLSTM的编码器解码器结构来对海面风速进行时空预测。深度神经网络(DNN)不能使输入序列和输出序列不同,因为DNN要求输入和输出都是固定维度。编码器的作用是将输入数据编码为连续特征空间中的向量表示。解码器用于对编码后的输入序列进行解码并输出目标序列。这两个模型联合训练以最大化目标序列的条件概率。在本发明中,基于 convLSTM的编解码器网络结构如图2所示。该网络由编码器和解码器网络两部分组成。编码器网络由六个convlstm2D层和三个 groupnorm归一化层组成。解码器网络由七个ConvLSTM2D和三个组规范化层组成。图2中ConvLSTM2D单元中括号中的数字分别表示卷积内核大小、步长和填充。
作为优选的实施例,所述当前风速时空序列通过如下公式表示:
X1:k={x1,x2,...,xk}∈RM×N×k
其中,xk表示在(i,j)地点的风速在第k时刻的观测值,通过如下公式表示:
Figure RE-GDA0003779382220000101
其中,i表示经度,j表示纬度,M表示经度i的总数目,N表示纬度j的总数目。
在本发明实施例中,通过不同时间段不同经纬度的风速观测值,构建有效的样本数据集。
在本发明一个具体的实施例中,样本数据集的建立过程包括:
第一步,下载数据,具体如下:
数据来源于欧洲中期气象预报中心(ECMWF)发布的第5版欧洲再分析数据集(ERA5),再分析使用物理定律将模型数据与来自世界各地的观测结果结合到一个全球完整且一致的数据集中,以最佳方式将以前的预报与新可用的观测结果相结合,以产生对大气状态的新的最佳估计,从而得到高质量和高时空分辨率的再分析气象数据集。 ECMWF以31km大小划分全球陆地和海洋为1440×721的网格,数据精度的网格大小是0.25°×0.25°,使用的气象数据更新间隔为1 小时。ERA5提供了从1979年到至今的每小时压力水平的数据集,其中风速集为海面U、V分量风速,其中风速单位为m/s。其正负U、 V值分别代表东-西向风速和北-南向风速,通过矢量合成得到风速数据。本发明下载的气象数据文件格式采用的是网络通用数据格式 NetCDF(Network Common Data Format)的形式,使用气象数据包括“1000hPa U-component of wind”和“1000hPa V-component of wind”。网格大小为64×64,为满足数据格式不损失空间相关性的要求,使用二维矩阵表示时刻的区域风速观测值如(1)式所示。以中国东海一块矩形区域为例,四个顶点经纬度分别是(28.75N,126E)、(28.75N、 141.75E)、(13N,126E)和(28.75N、141.25E),采用python中的basemap库进行海面区域风速的可视化展现。其中,元素xt(i,j)代表在 (i,j)地点的风速第t时刻观测值。本发明中M和N优选都等于64。
第二步,数据预处理,具体如下:
使用netCDF4读取下载的NetCDF格式的U和V分量的风速数据,将其矢量合成,存为numpy二维数组,将其存放在npy格式文件中。再按照时间顺序,将k个时刻的风速变量矩阵通道组合为一个如(2)式所示的三维矩阵。该矩阵即代表该区域的风速时空序列,矩阵维度为(不同纬度,不同经度,时间步长)。本发明中由于采取前 12步预测,故上述xk中,k是12,数据集样本按照3:1:1的比例划分为训练集、验证集和测试集。风速数据进行z-score标准化。
作为优选的实施例,结合图3、图4来看,图3为本发明提供的卷积时序模块一实施例的单元维度结构示意图,图4为本发明提供的卷积时序模块一实施例的内部结构示意图,其中:
上述卷积时序模块通过如下公式表示:
Figure RE-GDA0003779382220000121
Figure RE-GDA0003779382220000122
Figure RE-GDA0003779382220000123
Figure RE-GDA0003779382220000124
Figure RE-GDA0003779382220000125
其中,i表示输入门,f表示遗忘门,
Figure RE-GDA0003779382220000126
表示控制单元,o表示输出门,Wxi、Whi、Wci、Wxf、Whf、Wcf、Wxc、Whc、Wxo、Wco、 Wco皆为权值矩阵,*表示卷积算子,o表示哈达玛乘积,σ(·)表示激活函数,
Figure RE-GDA0003779382220000131
表示t时刻神经元的输入、Ct-1、Ct分别表示t-1时刻、t 时刻神经元的信息状态、Ht-1
Figure RE-GDA0003779382220000132
表示t-1时刻、t时刻向下一层传递的信息状态,ot表示输出门中的门控信息,bi、bf、bc和bo分别表示输入门、遗忘门、控制单元和输出门对应的偏移函数。
在本发明实施例中,结合CNN和LSTM的优点构建基本模型在海面风速的多步区域预测,实现时空信息的多重提取。
作为优选的实施例,仍结合图3、图4来看,所述卷积时序模块将当前时刻神经元的输入和上一时刻神经元的输出在进行向量乘法之后,直接将得到的乘法信息传输到输入门、遗忘门、控制单元和输出门,并在各个门的输入之前加入了窥视连接。
在本发明实施例中,利用乘法信息的传递,有效构建卷积时序模块。
作为优选的实施例,仍结合图3、图4来看,所述卷积时序模块将向量的乘积操作,换成了矩阵的卷积操作,实现样本行和样本列的空间信息的获取。
在本发明实施例中,利用卷积操作,有效进行空间信息的提取。
需要说明的是,针对传统RNN和CNN基本深度学习模型在海面风速的多步区域预测方面的不足,CNN学习到的是图片局部的一些特征,主要是短期的,但忽略了时间相关性。LSTM主要学习到的是一种时间上的信息特征,主要是长期的,但忽略了空间相关性。本发明针对CNN和LSTM基本模型在海面风速的多步区域预测方面的缺陷,结合两者的优点提出了一种基于convLSTM编解码网络结构的区域多步预测模型。海面风速预测需要同时输出多个地点的预测值,是一种像素级预测,该模型能够实现精确的像素级空间输出,更好地捕捉全球空间信息并映射到所需的多位置输出,在保证像素级区域风速输出的同时能够进行多步预测,并且可以从不同的预测时刻学习样本,实现准确的时空预测。此外,本发明实施例还使用了LeakyReLU 激活函数来进一步提高预测精度。其中,ConvLSTM可以更好的处理边缘,具有更好的泛化能力。另外,convLSTM的编码器-解码器结构更便于使用。基于convLSTM的编码器-解码器网络结构是本发明中的关键部分。
在本发明一个具体的实施例中,卷积时序模块(convLSTM模块) 的模块设置原理如下:
设计卷积长短时记忆convLSTM模块,ConvLSTM结构不仅可以像LSTM一样建立时序关系,而且可以像CNN一样刻画局部空间特征。ConvLSTM网络的一个显著特征是,前两个维度的三维张量是空间维度(行和列),后一个维度是时间维度,如图3所示。输入和状态可以看作是空间网格上的向量。ConvLSTM网络通过输入时空序列中过去时间的状态矩阵来确定未来的某个矩阵状态,如图4所示。这种设计的一个特点和优点是,所有的输入和输出元素都是三维张量,它保留了空间信息,同时仍然使用一个递归的视角;
其中,LSTM只是将当前时刻神经元的输入和上一时刻神经元的输出在进行向量乘法之后,直接将信息传输到三个门,由于在各个门的输入之前加入了窥视连接,相较于传统LSTM,ConvLSTM会在将信息传输到三个门之前,将上一层神经元保留下来的信息同时传输到三个门中,使神经元能够捕获更多前一时刻保留下的信息。除此之外, ConvLSTM将向量的乘积操作,换成了矩阵的卷积操作,通过卷积结构就可以捕获到样本行和样本列的空间信息。
本发明实施例还提供了一种风速时空预测网络的应用方法,结合图5来看,图5为本发明提供的风速时空预测网络的应用方法一实施例的流程示意图,包括步骤S501至步骤S502,其中:
在步骤S501中,获取待测的当前风速时空序列;
在步骤S502中,将所述待测的当前风速时空序列输入至训练完备的风速时空预测网络,确定预测未来风速序列,其中,所述训练完备的风速时空预测网络根据如上所述的风速时空预测网络的训练方法确定。
在本发明实施例中,利用上述风速时空预测网络从待测的当前风速时空序列提取有效的时空信息,进行准确的预测。
在本发明一个具体的实施例中,结合图6至图8来看,图6为本发明提供的样本预测一实施例的预测效果示意图,图7为本发明提供的样本预测另一实施例的预测效果示意图,图8为本发明提供的预测值与真实值一实施例的比较示意图,本发明实施例提出了一种基于卷积长短时记忆(convLSTM)的编码器解码器预测网络的海面风速区域多步预测模型。构造高分辨率输入矩阵和相同分辨率输出矩阵的映射,以获得准确的多站点预测结果。该模型在输入数据中加入日期外生变量,并在网络中使用LeakyReLU激活函数进一步提高预测精度。使用网格大小为64×64的前12小时海域风速数据来预测未来12小时海域风速,训练过程具体包括:
第1步,硬件软件配置具体如下:
硬件平台搭载NVIDIA GeForce RTX 3060,GPU配置CUDA 11.3 并行框架和cuDNN8.2加速库.模型基于Pytorch1.11.0和Numpy 1.18.5 搭建,代码基于Python 3.7。或者更高的硬件软件配置。此外,还需安装netCDF4和matplotlib库;
第2步,构建样本数据集,详细过程参见上述描述,在此不再赘述:
第3步,构建风速时空预测网络,详细过程参见上述描述,在此不再赘述;
第4步,模型训练具体如下:
使用基于convLSTM的编码器解码器结构来对海面风速进行时空预测。深度神经网络(DNN)不能使输入序列和输出序列不同,因为DNN要求输入和输出都是固定维度。编码器的作用是将输入数据编码为连续特征空间中的向量表示。解码器用于对编码后的输入序列进行解码并输出目标序列。这两个模型联合训练以最大化目标序列的条件概率。参见上述图3,该网络由编码器和解码器网络两部分组成。编码器网络由六个convlstm2D层和三个groupnorm归一化层组成。解码器网络由七个ConvLSTM2D和三个组规范化层组成。图中ConvLSTM2D单元中括号中的数字分别表示卷积内核大小、步长和填充;
其中,模型的超参数为批次大小是16,学习率是0.001。深度学习模型使用批量训练,最大训练次数为100次,优化器使用Adam。激活函数使用LeakyReLU;
第5步,模型性能评估具体如下:
对模型进行性能评估,选用平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE),公式如下所示:
Figure RE-GDA0003779382220000171
Figure RE-GDA0003779382220000172
Figure RE-GDA0003779382220000173
其中,三个评价函数作为衡量模型泛化能力的标准,选取评价函数数值最小的训练权重进行保存并将其相应的预测结果进行输出。其中,Yi为实际观测值,
Figure RE-GDA0003779382220000174
为预测值,n为观测(样本)数。
进一步地,以中国东海一块矩形区域为例,随机挑选2个预测样本,根据前12小时(input)得到未来12小时的预测值(predictd),并将预测值与实际值(target)相比较,效果如图6和图7所示。其中高风速显示为浅色,低风速显示为深色。模型风速集中分布区间预测值与真实值比较的散点图如图8所示。
本发明实施例还提供了一种风速时空预测网络的训练装置,结合图9来看,图9为本发明提供的风速时空预测网络的训练装置一实施例的结构示意图,风速时空预测网络的训练装置900包括:
第一获取单元901,用于获取包含标注信息的风速训练样本集,其中,所述标注信息包括所述风速训练样本集中的每个当前风速时空序列在未来时刻的不同区域的实际未来风速序列;
处理单元902,用于将所述风速训练样本集输入至构建的风速时空预测网络,确定预测未来风速序列,并根据所述实际未来风速序列和所述预测未来风速序列确定损失函数,其中,所述风速时空预测网络包括多个由长短期记忆结构和卷积结构构成的卷积时序模块;
训练单元903,用于根据所述损失函数的值调整所述风速时空预测网络的参数至满足收敛条件,确定训练完备的风速时空预测网络。
风速时空预测网络的训练装置的各个单元的更具体实现方式可以参见对于上述风速时空预测网络的训练方法的描述,且具有与之相似的有益效果,在此不再赘述。
本发明实施例还提供了一种风速时空预测网络的应用装置,结合图10来看,图10为本发明提供的风速时空预测网络的应用装置一实施例的结构示意图,风速时空预测网络的应用装置1000包括:
第二获取单元1001,用于获取待测的当前风速时空序列;
应用单元1002,用于将所述待测的当前风速时空序列输入至训练完备的风速时空预测网络,确定预测未来风速序列,其中,所述训练完备的风速时空预测网络根据如上所述的风速时空预测网络的训练方法确定。
风速时空预测网络的应用装置的各个单元的更具体实现方式可以参见对于上述风速时空预测网络的应用方法的描述,且具有与之相似的有益效果,在此不再赘述。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如上所述的速时空预测网络的训练方法和/或如上所述的风速时空预测网络的应用方法。
一般来说,用于实现本发明方法的计算机指令的可以采用一个或多个计算机可读的存储介质的任意组合来承载。非临时性计算机可读存储介质可以包括任何计算机可读介质,除了临时性地传播中的信号本身。
计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器 (RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言,特别是可以使用适于神经网络计算的Python语言和基于TensorFlow、PyTorch等平台框架。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网 (LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明实施例还提供了一种电子设备,结合图11来看,图11为本发明提供的电子设备一实施例的结构示意图,电子设备1100包括处理器1101、存储器1102及存储在存储器1102上并可在处理器1101 上运行的计算机程序,处理器1101执行程序时,实现如上所述的速时空预测网络的训练方法和/或如上所述的风速时空预测网络的应用方法。
作为优选的实施例,上述电子设备1100还包括显示器1103,用于显示处理器1101执行如上所述的速时空预测网络的训练方法和/或如上所述的风速时空预测网络的应用方法。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器1102中,并由处理器1101执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在电子设备1100中的执行过程。例如,计算机程序可以被分割成上述实施例中的各个单元,各单元的具体功能如上所述,在此不一一赘述。
电子设备1100可以是带可调摄像头模组的桌上型计算机、笔记本、掌上电脑或智能手机等设备。
其中,处理器1101可能是一种集成电路芯片,具有信号的处理能力。上述的处理器1101可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器(Network Processor,NP) 等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,存储器1102可以是,但不限于,随机存取存储器 (Random Access Memory,RAM),只读存储器(Read Only Memory, ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器 (Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器1102用于存储程序,所述处理器1101在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的方法可以应用于处理器1101中,或者由处理器1101实现。
其中,显示器1103可以是LCD显示屏,也可以是LED显示屏。例如,手机上的显示屏。
可以理解的是,图11所示的结构仅为电子设备1100的一种结构示意图,电子设备1100还可以包括比图11所示更多或更少的组件。图11中所示的各组件可以采用硬件、软件或其组合实现。
根据本发明上述实施例提供的计算机可读存储介质和电子设备,可以参照根据本发明实现实现如上所述的速时空预测网络的训练方法和/或如上所述的风速时空预测网络的应用方法具体描述的内容实现,并具有与实现如上所述的速时空预测网络的训练方法和/或如上所述的风速时空预测网络的应用方法类似的有益效果,在此不再赘述。
本发明公开了一种风速时空预测网络的训练方法、应用方法及电子设备,首先,对风速训练样本集进行有效的获取,利用多个时间段不同经纬度的海域风速数据来预测未来时间段不同经纬度的海域风速;然后,基于风速时空预测网络,利用多个由长短期记忆结构和卷积结构构成的卷积时序模块,结合CNN卷积网络和LSTM长短时记忆结构的优点,更好地进行像素级的精确输出,有效提取了时间信息特征,并充分考虑了空间相关性;最后,根据损失函数,对于整个网络进行训练,实现精确的像素级空间输出,更好地捕捉全球空间信息并映射到所需的多位置输出,在保证像素级区域风速输出的同时能够进行多步预测,并且可以从不同的预测时刻学习样本,实现准确的时空预测。
本发明技术方案,构造高分辨率输入矩阵和相同分辨率输出矩阵的映射,有效挖掘数据中的有效信息,自动捕获隐藏的线性及非线性特征,还可以高效处理大规模时空序列数据,以获得准确的多站点预测结果,不仅可以实现海域的多站点、多步长预测,可以从前若干小时预测未来若干小时,而且在该步长下的时间和空间预测可以保持较低的误差值。此发明在远洋船舶气象水文保障中具有应用前景。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种风速时空预测网络的训练方法,其特征在于,包括:
获取包含标注信息的风速训练样本集,其中,所述标注信息包括所述风速训练样本集中的每个当前风速时空序列在未来时刻的不同区域的实际未来风速序列;
将所述风速训练样本集输入至构建的风速时空预测网络,确定预测未来风速序列,并根据所述实际未来风速序列和所述预测未来风速序列确定损失函数,其中,所述风速时空预测网络包括多个由长短期记忆结构和卷积结构构成的卷积时序模块;
根据所述损失函数的值调整所述风速时空预测网络的参数至满足收敛条件,确定训练完备的风速时空预测网络。
2.根据权利要求1所述的风速时空预测网络的训练方法,其特征在于,所述构建的风速时空预测网络包括编码器和解码器,其中,所述编码器和所述解码器分别包括依次连接的多个所述卷积时序模块。
3.根据权利要求2所述的风速时空预测网络的训练方法,其特征在于,所述编码器包括依次连接的第一时序卷积层至第六时序卷积层,其中,所述第一时序卷积层、第三时序卷积层和第五时序卷积层分别包括依次连接的所述卷积时序模块和激活模块,第二时序卷积层、第四时序卷积层和第六时序卷积层分别包括依次连接的所述卷积时序模块和归一化模块。
4.根据权利要求2所述的风速时空预测网络的训练方法,其特征在于,所述解码器包括依次连接的第七时序卷积层至第十二时序卷积层,其中,所述第七时序卷积层、第九时序卷积层和第十一时序卷积层分别包括依次连接的所述卷积时序模块和归一化模块,第八时序卷积层、第十时序卷积层分别包括依次连接的所述卷积时序模块和激活模块,所述第十二时序卷积层包括两个依次连接的所述卷积时序模块和激活模块。
5.根据权利要求1所述的风速时空预测网络的训练方法,其特征在于,所述当前风速时空序列通过如下公式表示:
X1:k={x1,x2,...,xk}∈RM×N×k
其中,xk表示在(i,j)地点的风速在第k时刻的观测值,通过如下公式表示:
Figure RE-FDA0003779382210000021
其中,i表示经度,j表示纬度,M表示经度i的总数目,N表示纬度j的总数目,R表示实数。
6.根据权利要求1所述的风速时空预测网络的训练方法,其特征在于,所述卷积时序模块通过如下公式表示:
Figure RE-FDA0003779382210000031
Figure RE-FDA0003779382210000032
Figure RE-FDA0003779382210000033
Figure RE-FDA0003779382210000034
Figure RE-FDA0003779382210000035
其中,i表示输入门,f表示遗忘门,
Figure RE-FDA0003779382210000036
表示控制单元,o表示输出门,Wxi、Whi、Wci、Wxf、Whf、Wcf、Wxc、Whc、Wxo、Wco、Wco皆为权值矩阵,*表示卷积算子,o表示哈达玛乘积,σ(·)表示激活函数,χt表示t时刻神经元的输入、Ct-1、Ct分别表示t-1时刻、t时刻神经元的信息状态、Ht-1
Figure RE-FDA0003779382210000037
表示t-1时刻、t时刻向下一层传递的信息状态,ot表示输出门中的门控信息,bi、bf、bc和bo分别表示输入门、遗忘门、控制单元和输出门对应的偏移函数。
7.根据权利要求6所述的风速时空预测网络的训练方法,其特征在于,所述卷积时序模块将当前时刻神经元的输入和上一时刻神经元的输出在进行向量乘法之后,直接将得到的乘法信息传输到输入门、遗忘门、控制单元和输出门,并在各个门的输入之前加入了窥视连接。
8.根据权利要求7所述的风速时空预测网络的训练方法,其特征在于,所述卷积时序模块将向量的乘积操作,换成了矩阵的卷积操作,实现样本行和样本列的空间信息的获取。
9.一种风速时空预测网络的应用方法,其特征在于,包括:
获取待测的当前风速时空序列;
将所述待测的当前风速时空序列输入至训练完备的风速时空预测网络,确定预测未来风速序列,其中,所述训练完备的风速时空预测网络根据权利要求1至8任一项所述的风速时空预测网络的训练方法确定。
10.一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,处理器执行程序时,实现根据权利要求1至8任一项所述的风速时空预测网络的训练方法,和/或根据权利要求9所述的风速时空预测网络的应用方法。
CN202210673229.6A 2022-06-15 2022-06-15 一种风速时空预测网络的训练方法、应用方法及电子设备 Pending CN115099318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210673229.6A CN115099318A (zh) 2022-06-15 2022-06-15 一种风速时空预测网络的训练方法、应用方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210673229.6A CN115099318A (zh) 2022-06-15 2022-06-15 一种风速时空预测网络的训练方法、应用方法及电子设备

Publications (1)

Publication Number Publication Date
CN115099318A true CN115099318A (zh) 2022-09-23

Family

ID=83290036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210673229.6A Pending CN115099318A (zh) 2022-06-15 2022-06-15 一种风速时空预测网络的训练方法、应用方法及电子设备

Country Status (1)

Country Link
CN (1) CN115099318A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117420615A (zh) * 2023-11-10 2024-01-19 国网江苏省电力有限公司 基于时空注意力联合门控网络的沿海站点风速预测方法
CN118171058A (zh) * 2024-02-27 2024-06-11 广东海洋大学 一种基于区域环境的沿海线列车风速预测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117420615A (zh) * 2023-11-10 2024-01-19 国网江苏省电力有限公司 基于时空注意力联合门控网络的沿海站点风速预测方法
CN118171058A (zh) * 2024-02-27 2024-06-11 广东海洋大学 一种基于区域环境的沿海线列车风速预测方法及系统

Similar Documents

Publication Publication Date Title
CN109902885B (zh) 基于深度学习混合cnn-lstm模型的台风预测方法
CN107703564B (zh) 一种降雨预测方法、系统及电子设备
CN115099318A (zh) 一种风速时空预测网络的训练方法、应用方法及电子设备
Xu et al. A deep learning approach to predict sea surface temperature based on multiple modes
Gong et al. Temperature forecasting by deep learning methods
CN115660041A (zh) 海浪高度预测及模型训练方法、电子设备及存储介质
CN116229248A (zh) 海洋物种的分布预测方法、装置、设备及存储介质
Liu et al. Short-term daily prediction of sea ice concentration based on deep learning of gradient loss function
Leinonen et al. Unsupervised classification of snowflake images using a generative adversarial network and K-medoids classification
Li et al. Visual prediction of typhoon clouds with hierarchical generative adversarial networks
Kim et al. Resolution reconstruction of climate data with pixel recursive model
Yu et al. Spatio-temporal ocean wave conditions forecasting using MA-TrajGRU model in the South China sea
Chen et al. A Spatio-Temporal Attention Graph Convolutional Networks for Sea Surface Temperature Prediction
Fu et al. Prediction and analysis of sea surface temperature based on LSTM-transformer model
CN110648030A (zh) 海水温度的预测方法及装置
Wang et al. Dynamic graphs attention for ocean variable forecasting
Bosma et al. Estimating solar and wind power production using computer vision deep learning techniques on weather maps
US20220327335A1 (en) Controlling asynchronous fusion of spatio-temporal multimodal data
Li et al. ASTMEN: an adaptive spatiotemporal and multi-element fusion network for ocean surface currents forecasting
Sun et al. Spatio-Temporal Wind Speed Prediction Based on CNN-GRU
Nan et al. Prediction of three-dimensional ocean temperature in the South China Sea based on time series gridded data and a dynamic spatiotemporal graph neural network
Pan et al. Effective attention model for global sea surface temperature prediction
Xiao et al. GSSA: A Network for Short to Medium-Term Regional Sea Surface Temperature Prediction
Chen et al. Aviation visibility forecasting by integrating Convolutional Neural Network and long short-term memory network
Zhang et al. Fine-Grained Conditional Convolution Network With Geographic Features for Temperature Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination