CN117076893B - 一种基于长短期记忆神经网络的声速分布预报方法 - Google Patents
一种基于长短期记忆神经网络的声速分布预报方法 Download PDFInfo
- Publication number
- CN117076893B CN117076893B CN202311331695.7A CN202311331695A CN117076893B CN 117076893 B CN117076893 B CN 117076893B CN 202311331695 A CN202311331695 A CN 202311331695A CN 117076893 B CN117076893 B CN 117076893B
- Authority
- CN
- China
- Prior art keywords
- sound velocity
- data
- time
- training
- velocity distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 24
- 238000013277 forecasting method Methods 0.000 title claims abstract description 10
- 230000007787 long-term memory Effects 0.000 title claims abstract description 7
- 230000006403 short-term memory Effects 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 49
- 230000006870 function Effects 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 95
- 238000012795 verification Methods 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000000306 recurrent effect Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000011160 research Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000009529 body temperature measurement Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H5/00—Measuring propagation velocity of ultrasonic, sonic or infrasonic waves, e.g. of pressure waves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于长短期记忆神经网络的声速分布预报方法,属于海洋观测技术领域。本发明基于长短时神经网络的声速分布预报模型,利用预报任务所在空间区域的历史声速剖面数据为参考,用按照时间先后顺序排序的历史声速剖面分布情况对目标区域未来声速分布进行准确预报。本发明解决了水下声速剖面分布在时间维度上的预测问题,解决了海洋声速分布估计的时间分辨率不足以及未来声速预报功能缺失的问题,能够对未来时刻声速分布进行实时、准确预报,并对未来指定时间分辨率间隔的声速分布进行估计,对预测地点未来指定时间分辨率间隔的声速分布进行预报,准确率与预报效率均比较高。
Description
技术领域
本发明属于海洋观测技术领域,具体涉及一种基于长短期记忆神经网络的声速分布预报方法。
背景技术
目前大多数关于水下声速分布的研究都是基于空间上的,它们大多数都依赖实时声呐观测数据以及温度场、盐度场等相关数据,基于时间上的声速场研究相对较少。武汉大学黄威博士及其团队提出了一种利用不同地区多基站群在无声场观测数据条件下构建大尺度区域三维声速场的策略,该策略能够在基站群闭合区域内获得声速场的估计结果,但目前仍面临设备研发成本较高的问题。根据深海声速剖面分层模型及实测数据,哈尔滨工程大学张林虎等提出了一种基于分层经验正交函数的区域小时间尺度声速剖面时变模型构建方法,这种方法利用分层经验正交方法反演声速场,精度相对较高;然而,该方法并未解决声速在时间上的预报等问题。海军潜艇学院韩梅等人提出了一种在传统经验正交函数法的基础上改进的声速剖面的预测方法,该方法改进了求解协方差矩阵的方法,有效地将原数据的空间、时间信息结合到协方差矩阵中,同时,通过大量声速分布数据分析得出基于时间函数的经验公式,最终生成声速剖面。然而,这种方法难以充分捕捉声速分布随时间、空间的变化规律,且声速分布预报精度不足。山东科技大学李倩倩提出了一种联合表层声速的自组织映射(self-organizing map, SOM)神经网络的声速剖面反演方法,该方法利用了全球卫星遥感系统的海表温度测量数据和历史声速剖面数据作为输入,并且可选性地融入海表声速测量结果,为无实时声呐观测数据的情况下的声速场构建提供了一个可靠的解决思路;但是该模型主要依赖于海洋表面的浅海温度和浅海声速数据,仍需实时表面声速数据以及遥感数据无法对未来声速分布情况进行预测。
综上所述,上述相关研究均实现了较为准确的空间维度声速场构建,难以捕捉声速分布随时间变化的规律,过度依赖于实时海面观测数据,实时应用受限。且现有的水下声速剖面分布估计方法需要进行现场声呐观测数据测量工作,难以实现未来时间声速分布估计,而采用非声呐观测数据的声速分布预报方法,不能准确捕捉声速分布周期性规律,预报精度不足。
发明内容
本发明的目的在于提供一种基于长短期记忆神经网络(long short-termmemory, LSTM)的声速分布预报方法,以弥补现有技术的不足。
本发明提出一种基于长短时神经网络的声速分布预报方法,利用预报任务所在空间区域的历史声速剖面数据为参考,用按照时间先后顺序排序的历史声速剖面分布情况对目标区域未来声速分布进行准确预报。
为达到上述目的,本发明是通过以下技术方案实现的:
一种基于长短期记忆递归神经网络的声速分布预报方法,如图1所示,具体步骤如下所示:
S1:确定声速分布预报地点及提取空间历史声速数据集:根据声速分布预报任务指定空间坐标为经度M°,纬度N°,从全球Argo数据集中选择本空间区域历史不同时刻测量的声速剖面数据形成空间历史声速数据集,作为声速剖面参考数据;
S2:确定声速分布预报时间分辨率、预报起始时间以及预报最大时间长度:根据声速分布预报任务需求确定时间分辨率,用表示、预报起始时间,用/>表示、以及预报最大时间长度,用/>表示;
S3:所述空间历史声速数据集二次筛选及深度、时间维度标准化插值:根据声速分布预报时间分辨率,从S1的空间历史声速数据集中动态二次筛选数据形成历史声速分布时间标准化数据集,作为训练参考数据;对筛选的数据依次进行深度方向标准化线性分层插值、时间方向标准化插值;历史声速分布时间标准化数据集收集完毕后,转入S4;
S4:对声速分布样本数据预处理:声速分布样本数据预处理分为两部分:划分训练集和验证集以及训练集的具体处理;声速分布样本数据预处理完毕后,转入S5;
S5:构建LSTM神经网络声速分布预报的模型:
S5-1:模型构建:根据深度分层不同,声速分布预报分层执行,每一个深度层构建一个LSTM网络,其输入层节点数为1,对应长度为i-C-1的输入声速值时间序列;
对于每一个深度层构建的LSTM网络,预测结果为长度为i-C-1的输出声速值时间序列,输出声速值时间序列与输入声速值时间序列时间差为1个时间分辨率,以具有线性激活函数的全连接层作为输出层;
S5-2:模型训练:对每一个深度层的LSTM网络分别训练;模型训练之前,先确定每一深度层的学习率为及迭代次数为/>,/> 代表相应的深度层,j=1,2,…,J;
S5-3:模型验证:用训练输出集的最后一列数据作为模型的输入进行预测,去预测未来一个时间周期的数据,即长度为C的序列数据;
S6:对S5预测输出数据去归一化;
S7:计算均方根误差(RMSE),如果RMSE值相比于上一轮无明显变化,则执行S8,否则返回S5;
S8:模型预测:根据任务指定预报时间分辨率、预报起始时间、预报最大时间长度,确定预报迭代次数,预报起始时间对应的历史声速分布参考数据,把预报起始时间之前时刻的多个整变化周期数据作为模型的训练集即可得出预测结果,对结果执行S6的去归一化过程,输出预报的未来声速分布数据。
进一步的,所述S3中,所述训练参考数据覆盖时间范围至少包含不低于1个整变化周期数据,如当预报时间分辨率单位为“时”,需令样本覆盖不少于1个整天周期,即筛选预报时刻前不少于1天的样本数据,样本采样时间精确到“时”;当预报时间分辨率为“月”时,需令样本覆盖不少于1个整年周期,即筛选预报时刻前不少于1年的样本数据,样本采样时间精确到“月”,优化选择为3个及以上整周期数据。
进一步的,所述S3中,所述深度方向标准化插值方式具体如下:从0到10米,每隔5米划分一层;从10到180米,每隔10米划分一层;从180到460米,每隔20米划分一层;从500到1250米,每隔50米划分一层;从1300到1900米,每隔100米划分一层;超过1900米深度为一层,总共划分成58层;对筛选的数据进行时间方向标准化插值,插值时间间隔与预报时间分辨率相等;
令历史声速分布时间标准化数据集表示为:
(1)
其中表示第i个声速剖面,共I个,第i个声速剖面进一步表示为:
(2)
其中为声速值,单位为:m/s,下标/>表示为第/>个深度层/>上标“/>”代表向量的转置。公式(1)中S数据集按照时间上的顺序排列,时间间隔与时间分辨率/>一致;/>= 0,1,…,J,式中,/>为深度层索引标签,全海深声速分布的最大共同深度层为dJ。
展开写收集的历史声速分布时间标准化数据集S为j行i列的声速值数据矩阵:
(3)。
进一步的,所述S4具体为:
S4-1:划分训练集和验证集:数据变化时间周期由数据随时间变化的客观规律决定,此处数据变化时间周期取C;历史声速分布时间标准化数据集S的前i-C条声速分布数据作为训练数据集,后面C条声速分布数据做验证数据集,其中i-C≥3C;
S4-2:训练集的具体处理:
历史声速分布时间标准化数据集S为一个j行i列的声速值数据矩阵;划分历史声速分布时间标准化数据集S的前i-C列为训练数据集T,如公式(4)所示;S的后C列作为验证数据集V,如公式(5)所示;对训练数据集T进行归一化处理为,如公式(6)所示;再将归一化处理后的训练数据集 /> 具体划分为训练输入集/>和训练输出集/>,对训练集采取交错一步的训练方式,即用第一列数据去预测第二列,用第二列数据去预测第三列,其后以此类推;训练输入集/>如公式7所示,训练输出集/>如公式(8)所示;
(4)
(5)
(6)
(7)
(8)。
进一步的,所述S5具体为:
S5-1:所述模型构建中,取1层LSTM层作为隐含层,隐含层神经元个数取N;
具体的LSTM神经网络模型如图2所示,包括序列输入层、LSTM层和全连接层;
LSTM是一种特殊类型的循环神经网络,它通过引入门控机制来控制信息的传递,门控机制包括输入门、遗忘门和输出门。LSTM包含了一个称为"细胞状态"的内部状态,可以在序列的不同时间步中读取、写入和清除信息。输入门决定了新的输入信息的权重,遗忘门决定了哪些信息需要从细胞状态中删除,输出门决定了输出信息的权重。
LSTM的单元结构如图3所示,LSTM神经网络通过更新内部门的状态可以实现较长时间的数据信息存储,图中‘X’和‘+’分别代表乘法和加法运算,“LSTM单元”表示和中间单元具有相同的内部结构, 代表Sigmoid激活函数:
(9)
其中,表示输入/>经过Sigmoid函数的输出,输出值映射区间[0,1];
tanh代表Tanh激活函数:
(10)
输出值映射区间[-1,1]。
LSTM 神经网络单元计算流程分为下面四个步骤,其中、/>、/>分别代表t-1至t+1时刻的输入值;相似地,/>、/>、/>分别代表t-1、t、t+1时刻的记忆单元,/>、/>、 则分别代表t-1至t+1时刻LSTM神经元隐藏层的输出,上述的t-1时刻代表上一时刻,t时刻代表当前时刻,t+1时刻代表下一时刻。/>和b为三种门或输入分别对应的权重矩阵与偏置。
(a)遗忘门的输出
(11)
其中表示遗忘门的权重矩阵,/>代表遗忘门的偏置。
(b)输入门的输出及候选细胞状态的输入/>:
(12)
(13)
其中和/> 分别表示输入门和候选细胞状态输入时的权重矩阵,/> 和 />分别代表输入门和候选细胞状态输入时的偏置。
(c)更新细胞状态:
(14)。
(d)输出门的输出及隐含层的输出/>:
(15)
(16)
其中表示输出门的权重矩阵,/> 代表输出门的偏置。
S5-2:所述模型训练中,训练第一深度层的网络时,模型的输入为长度为i-C-1的声速值时间序列 />= [/>],对应的模型输出也为长度为i-C-1的声速值时间序列/> = [/>];训练第J深度层的/>网络时,训练模型输入和输出分别为训练输入集和训练输出集的第J行数据,即 = [/>] 和 />= [/>],其中、/> 分别代表训练输入集/>和训练输出集 />的第一行数据,即第一深度层的数据。
其余各层训练方式与之类似。
S5-3:所述模型验证中:对第一个深度层进行验证时,模型的输入为(end)=[/>] ,可得到下一时刻的声速数据预测的第一个数据为/>(1)= [/>],其中代表第一深度层预测的第一个结果。对其进行一个数据变化时间周期的预测,即要预测C步。继续对模型输入预测结果的第一个数据,即输入/> ,用该数据去预测第一深度层的第二个数据/>(2) = />,其后的以此类推,一直预测到第C个预测结果/>,其余深度层的预测与第一个深度层类似。其中,/>(K)代表预测的第一深度层 />网络预测的未来第K个时间分辨率的声速值。
第一深度层的预测结果为长度为C的声速值时间序列,如公式(17)所示:
(17)
其余各深度层同理,则最终预测的声速数据集为P,如公式(18)所示:
(18)
模型验证完毕后,转入S6。
进一步的,所述S6中,由于模型训练之前对训练数据集进行了归一化处理,故应对预测的声速数据进行去归一化处理(原有归一化操作的逆操作),即对预测的数据恢复到原始数据的尺度范围,便于和验证数据进行对比分析。
去归一化处理后的预测结果为:
(19)
其中,代表第J深度层的第C个时间分辨率预测的声速值去归一化的结果;去归一化操作完毕后,转入S7。
进一步的,所述S7中:计算各深度层预测声速数据和验证数据之间的均方根误差(RMSE),第j个深度层的均方根误差的具体计算如公式(20)所示:
(20)。
与现有技术相比,本发明的优点和有益效果是:
本发明解决了水下声速剖面分布在时间维度上的预测问题,解决了海洋声速分布估计的时间分辨率不足以及未来声速预报功能缺失的问题,能够对未来时刻声速分布进行实时、准确预报,并对未来指定时间分辨率间隔的声速分布进行估计,对预测地点未来指定时间分辨率间隔的声速分布进行预报,准确率与预报效率均比较高。本发明为海洋科学研究提供了重要的指导意义。
附图说明
图1是本发明所提供方法的基本流程图。
图2是LSTM神经网络模型示意图。
图3是LSTM神经网络的单元结构示意图。
图4是预测的全海深声速分布与实际的全海深声速分布对比示意图。
图5是第3个深度层(即对应海深10米)预测趋势与原有趋势的对比示意图。
具体实施方式
下面结合实施例对本发明所述的技术方案作进一步地描述说明。
实施例:
一种基于长短期记忆神经网络的声速分布预报方法,如图1所示,具体实施如下:
步骤1:声速分布预报地点确定及空间历史声速数据集提取
根据声速分布预报任务指定空间坐标为东经168.5°,北纬16.5°,从全球Argo数据集中选择本空间区域2017-2021五年中60个月的测量的声速剖面数据形成空间历史声速数据集,作为声速剖面参考数据。
步骤2:确定声速分布预报时间分辨率、预报起始时间以及预报最大时间长度
本实施例中,根据声速分布预报任务需求取时间分辨率为1个月、取预报起始时间/>为2021年1月、取预报最大时间/>为1年。
步骤3:空间历史声速数据集二次筛选及深度、时间维度标准化插值
根据声速分布预报时间分辨率,从步骤1的空间历史声速数据集中动态二次筛选数据形成历史声速分布时间标准化数据集,作为训练参考数据,训练数据覆盖时间范围至少包含不低于1个整变化周期数据,此时取预报时间分辨率为“月”时,需令样本覆盖不少于1个整年周期,即筛选预报时刻前不少于1年的样本数据,样本采样时间精确到“月”。在此示例中,本空间区域2017-2021五年中测量的声速剖面数据作为空间历史声速数据集,预报起始时间为2021年1月,在此之前有4个整年周期的训练参考数据,满足训练要求。
对筛选的数据依次进行深度方向标准化线性分层插值,时间方向标准化插值。深度方向标准化插值方式具体如下:从0到10米,每隔5米划分一层;从10到180米,每隔10米划分一层;从180到460米,每隔20米划分一层;从500到1250米,每隔50米划分一层;从1300到1900米,每隔100米划分一层;超过1900米深度为一层,总共划分成58层。对筛选的数据进行时间维度插值,插值时间间隔与预报时间分辨率相等。
则历史声速分布时间标准化数据集表示为:
;
其中i = 1~60表示2017年1月至2021年12月5年60个月按时间顺序排列,则是表示的对应时间的声速分布数据。
第i个声速剖面可进一步表示为:= 0,1,…,58;
其中为声速值,单位为:m/s,下标/>表示为第/>个深度层,/> 的最大值为58,即全海深声速分布的最大共同深度层为58层,上标“/>”代表向量的转置。
展开写收集的历史声速分布时间标准化数据集S为58行60列的声速值数据矩阵:
;
历史声速分布时间标准化数据集收集完毕后,转入步骤4。
步骤4:对声速分布样本数据预处理
声速分布样本数据预处理主要分为两部分:划分训练集和验证集以及训练集的具体处理。
(1)划分训练集和验证集
在此实施示例中数据变化时间周期为预报最大时间长度和预报时间分辨率的比值,即,则C = 12。
历史声速分布时间标准化数据集S的前48条声速分布数据作为训练数据集,后面12条声速分布数据做验证数据集。
(2)训练集的具体处理
划分历史声速分布时间标准化数据集S的前48列为训练数据集T,S的后12列作为验证数据集V。
训练数据集:;
验证数据集:;
对训练数据集T进行归一化处理为。
归一化后的训练集:;
将归一化处理后的训练数据集 具体划分为训练输入集/> 和训练输出集/>,对其采取交错一步的训练方式,即用第一列数据去预测第二列数据(即2017年1月数据作训练输入时,2017年2月数据作为训练的输出),用第二列数据去预测第三列数据(即2017年2月数据作训练输入时,2017年3月数据作为训练的输出),其后以此类推。
训练输入集:;
训练输出集:;
声速分布样本数据预处理完毕后,转入步骤5。
步骤5:构建LSTM神经网络声速分布预报的模型,如图2、3所示:
长短期记忆神经网络模型的构建分为三个部分,神经网络模型构建、模型训练以及模型验证。
(1)模型构建
根据深度分层不同,声速分布预报分层执行,每一个深度层构建一个LSTM网络,其输入层节点数为1,对应长度为47的输入声速值时间序列。
对于每一个深度层构建的LSTM网络,预测结果为长度为47的输出声速值时间序列,输出声速值时间序列与输入声速值时间序列时间差为1个月,以具有线性激活函数的全连接层作为输出层。
取1层LSTM层作为隐含层,隐含层神经元个数取N为150。
(2)模型训练
模型训练时,对每一个深度层的LSTM网络分别训练。
模型主要参数设置为:学习率 为0.01 ,迭代次数为/>为300次,/> 代表相应的深度层,j=1,2,…,58。
训练第一深度层的网络时,模型的输入为长度为47的声速值时间序列= [/>],对应的模型输出也为长度为47的声速值时间序列 = [/>];训练第2深度层/>网络时,训练模型输入和输出分别为训练输入集和训练输出集的第2行数据,即/> = [/>]和/> = [/>],其中 />、/> 分别代表训练输入集和训练输出集/>的第二行数据,即第二深度层的数据。其余各层训练方式与之类似。
(3)模型验证
用训练输出集的最后一列数据作为模型的输入进行预测,去预测未来一个时间周期的数据,即长度为12的序列数据。对第一个深度层进行验证时,模型的输入为(end)= [/>] ,可得到下一时刻的声速数据预测的第一个数据为/>(1) = [],其中/>代表第一深度层预测的第一个结果。对其进行一个数据变化时间周期的预测,即预测12步。继续对模型输入预测结果的第一个数据,即输入/>,用该数据去预测第一深度层的第二个数据/>,其后的以此类推,一直预测到第12个预测结果/>(12)= [/>] ,其余深度层的预测与第一个深度层类似。
第一深度层的预测结果为长度为12的声速值时间序列:
其余各深度层同理,则最终预测的声速数据集为 P :
;
模型验证完毕后,转入步骤6。
步骤6:对预测输出数据去归一化
用原归一化操作的逆操作对预测的声速数据集去归一化处理,即把预测的数据恢复到原始数据的尺度范围,便于和验证数据进行对比分析。
去归一化处理后的预测结果如下所示:
;
去归一化操作完毕后,转入步骤7。
步骤7:计算均方根误差(RMSE)
计算各深度层预测声速数据和验证数据之间的均方根误差(RMSE),第j个深度层的均方根误差的具体计算如下:
;
如果 值相比于上一轮无明显变化,则进行步骤8,否则返回步骤5。
为验证预测声速剖面的精确性,对预测的第一个全海深声速剖面数据和实际的第一个全海深声速剖面数据作对比。
由于历史声速分布时间标准化数据集不是全海深数据,而是58个深度层的数据,则预测出的结果也是58个深度层的数据,采用线性插值法对预测出的数据和实际数据在全海深范围内进行插值处理,此处的全海深取1~1975米。
插值处理后的全海深声速分布预测数据和全海深声速分布实际数据/>如下所示:
;/>;
其中,此时的代表海深1975米。
则全海深声速分布预测数据与全海深声速分布实际数据之间的均方根误差为:
。
对模型验证多次的全海深声速分布预测数据和全海深声速分布实际数据之间的均方根误差()均在1 m/s以内,平均的/>约为0.65 m/s。预测的全海深声速分布与实际的全海深声速分布对比示意图如图4所示,从图中可以看出预测的声速分布和实际的声速分布高度相似,即此方法可以对未来的声速分布准确预测。
为确保时间上的严谨性,一列声速分布数据在时间上是一致的,故在深度层1~58之间随机取了第3层数据来测试此方法能否准确捕捉声速分布的周期性变化规律,取出预测结果的第3深度层数据/>,取出训练集/>的第3深度层数据/>。则第3个深度层(即对应海深10米处)预测趋势与原有趋势的对比示意图如图5所示,上半图的前48个实线数据为10米海深处2017-2020年四年48个月的真实声速分布数据,后12个虚线数据为预测的10米深度处2021年12个月的声速分布数据;下半图为2017年10米深度处2017-2021年五年60个月的实际声速分布数据。可以看出此方法能准确捕捉声速分布的周期性规律。
步骤8:模型预测
根据任务指定预报时间分辨率、预报起始时间、预报最大时间长度,确定预报迭代次数,预报起始时间对应的历史声速分布参考数据,把预报起始时间之前时刻的3个及以上的整变化周期数据作为模型的训练集即可得出预测结果,对结果执行步骤6的去归一化过程,输出预报的未来声速分布数据。
本发明解决了水下声速剖面分布在时间维度上的预测问题,能够对未来时刻声速分布进行实时、准确预报,并对历史时间区间内指定时刻声速分布进行估计,解决了海洋声速分布估计的时间分辨率不足以及未来声速预报功能缺失的问题。随着水下声速场测量和构建技术的发展,本发明可以广泛应用到水下通信、定位、导航、海洋勘测以及海洋地质研究等诸多领域。
在上述实施例的基础上,本发明继续对其中涉及到的技术特征及该技术特征在本发明中所起到的功能、作用进行详细的描述,以帮助本领域的技术人员充分理解本发明的技术方案并且予以重现。
最后,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (7)
1.一种基于长短期记忆递归神经网络的声速分布预报方法,其特征在于,包括如下步骤:
S1:确定声速分布预报地点及提取空间历史声速数据集:根据声速分布预报任务指定空间坐标为经度M°,纬度N°,从全球Argo数据集中选择本空间区域历史不同时刻测量的声速剖面数据形成空间历史声速数据集,作为声速剖面参考数据;
S2:确定声速分布预报时间分辨率、预报起始时间以及预报最大时间长度:根据声速分布预报任务需求确定时间分辨率,用表示、预报起始时间,用/>表示、以及预报最大时间长度,用/>表示;
S3:所述空间历史声速数据集二次筛选及深度、时间维度标准化插值:根据声速分布预报时间分辨率,从S1的空间历史声速数据集中动态二次筛选数据形成历史声速分布时间标准化数据集,作为训练参考数据;对筛选的数据依次进行深度方向标准化线性分层插值、时间方向标准化插值;
S4:对声速分布样本数据预处理:划分训练集和验证集以及训练集;
S5:构建LSTM神经网络声速分布预报的模型,具体为:
S5-1:模型构建:根据深度分层不同,声速分布预报分层执行,每一个深度层构建一个LSTM网络,其输入层节点数为1,对应长度为i-C-1的输入声速值时间序列;
对于每一个深度层构建的LSTM网络,预测结果为长度为i-C-1的输出声速值时间序列,输出声速值时间序列与输入声速值时间序列时间差为1个时间分辨率,以具有线性激活函数的全连接层作为输出层;
S5-2:模型训练:对每一个深度层的LSTM网络分别训练;模型训练之前,先确定每一深度层的学习率为及迭代次数为/>,/> 代表相应的深度层,j=1,2,…,J;
S5-3:模型验证:用训练输出集的最后一列数据作为模型的输入进行预测,去预测未来一个时间周期的数据,即长度为C的序列数据;
S6:对S5预测输出数据去归一化;
S7:计算均方根误差RMSE,如果RMSE值相比于上一轮无明显变化,则执行S8,否则返回S5;
S8:模型预测:根据任务指定预报时间分辨率、预报起始时间、预报最大时间长度,确定预报迭代次数,预报起始时间对应的历史声速分布参考数据,把预报起始时间之前时刻的1个及以上的整变化周期数据作为模型的训练集即可得出预测结果,对结果执行S6的去归一化过程,输出预报的未来声速分布数据。
2.如权利要求1所述的基于长短期记忆递归神经网络的声速分布预报方法,其特征在于,所述S3中,所述训练参考数据覆盖时间范围至少包含不低于1个整变化周期数据。
3.如权利要求1所述的基于长短期记忆递归神经网络的声速分布预报方法,其特征在于,所述S3中,所述深度方向标准化插值方式具体如下:从0到10米,每隔5米划分一层;从10到180米,每隔10米划分一层;从180到460米,每隔20米划分一层;从500到1250米,每隔50米划分一层;从1300到1900米,每隔100米划分一层;超过1900米深度为一层,总共划分成58层;对筛选的数据进行时间方向标准化插值,插值时间间隔与预报时间分辨率相等;
令历史声速分布时间标准化数据集表示为:
(1)
其中表示第i个声速剖面,共I个,第i个声速剖面表示为:
(2)
其中为声速值,单位为:m/s,下标/>表示为第/>个深度层/>上标“/>”代表向量的转置;公式(1)中S数据集按照时间上的顺序排列,时间间隔与时间分辨率/>一致;/>= 0,1,…,J,式中,/>为深度层索引标签,全海深声速分布的最大共同深度层为dJ;收集的历史声速分布时间标准化数据集S为j行i列的声速值数据矩阵为:
(3)。
4.如权利要求1所述的基于长短期记忆递归神经网络的声速分布预报方法,其特征在于,所述S4具体为:
S4-1:划分训练集和验证集:数据变化时间周期由数据随时间变化的客观规律决定,此处数据变化时间周期取C;历史声速分布时间标准化数据集S的前i-C条声速分布数据作为训练数据集,后面C条声速分布数据做验证数据集,其中i-C≥3C;
S4-2:训练集的具体处理:
历史声速分布时间标准化数据集S为一个j行i列的声速值数据矩阵;划分历史声速分布时间标准化数据集S的前i-C列为训练数据集T,如公式(4)所示;S的后C列作为验证数据集V,如公式(5)所示;对训练数据集T进行归一化处理为,如公式(6)所示;再将归一化处理后的训练数据集/>具体划分为训练输入集/>和训练输出集/>,对训练集采取交错一步的训练方式,即用第一列数据去预测第二列,用第二列数据去预测第三列,其后以此类推;训练输入集/>如公式(7)所示,训练输出集/>如公式(8)所示:
(4);
(5);
(6);
(7);
(8)。
5.如权利要求1所述的基于长短期记忆递归神经网络的声速分布预报方法,其特征在于,所述S5具体为:
S5-1:所述模型构建中,取1层LSTM层作为隐含层,隐含层神经元个数取N;LSTM神经网络模型包括序列输入层、LSTM层和全连接层;
S5-2:所述模型训练中,训练第一深度层的网络时,模型的输入为长度为i-C-1的声速值时间序列 />= [/>],对应的模型输出也为长度为i-C-1的声速值时间序列/> = [/>];训练第J深度层的网络时,训练模型输入和输出分别为训练输入集和训练输出集的第J行数据,即 = [/>] 和 /> [/>],其中/>、/> 分别代表训练输入集/>和训练输出集 />的第一行数据,即第一深度层的数据,其余各层训练方式与之相似;
S5-3:所述模型验证中:对第一个深度层进行验证时,模型的输入为(end)=[],得到下一时刻的声速数据预测的第一个数据为/>(1)= [/>],其中代表第一深度层预测的第一个结果;对其进行一个数据变化时间周期的预测,即要预测C步;继续对模型输入预测结果的第一个数据,即输入/> ,用该数据去预测第一深度层的第二个数据/>(2) = />,其后的以此类推,一直预测到第C个预测结果/>,其余深度层的预测与第一个深度层类似;其中,/>(K)代表预测的第一深度层 />网络预测的未来第K个时间分辨率的声速值;第一深度层的预测结果为长度为C的声速值时间序列,如下式所示:
(17)
其余各深度层同理,则最终预测的声速数据集为P,如下式所示:
(18)
模型验证完毕后,转入S6。
6.如权利要求1所述的基于长短期记忆递归神经网络的声速分布预报方法,其特征在于,所述S6中,去归一化处理后的预测结果为:
(19)
其中,代表第J深度层的第C个时间分辨率预测的声速值去归一化的结果。
7.如权利要求1所述的基于长短期记忆递归神经网络的声速分布预报方法,其特征在于,所述S7中:计算各深度层预测声速数据和验证数据之间的均方根误差,第j个深度层的均方根误差的具体计算如下式所示:
(20)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311331695.7A CN117076893B (zh) | 2023-10-16 | 2023-10-16 | 一种基于长短期记忆神经网络的声速分布预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311331695.7A CN117076893B (zh) | 2023-10-16 | 2023-10-16 | 一种基于长短期记忆神经网络的声速分布预报方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117076893A CN117076893A (zh) | 2023-11-17 |
CN117076893B true CN117076893B (zh) | 2024-01-09 |
Family
ID=88713770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311331695.7A Active CN117076893B (zh) | 2023-10-16 | 2023-10-16 | 一种基于长短期记忆神经网络的声速分布预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117076893B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117892096B (zh) * | 2024-03-14 | 2024-05-14 | 中国海洋大学 | 一种基于迁移学习的小样本海洋声速剖面预报方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110353729A (zh) * | 2019-07-30 | 2019-10-22 | 北京航空航天大学 | 一种基于双向长短期记忆网络的声波渡越时间检测方法 |
CN111222677A (zh) * | 2019-10-22 | 2020-06-02 | 浙江运达风电股份有限公司 | 一种基于长短期记忆时间神经网络的风速预测方法及系统 |
CN113269363A (zh) * | 2021-05-31 | 2021-08-17 | 西安交通大学 | 一种高超声速飞行器的轨迹预测方法、系统、设备及介质 |
CN115307714A (zh) * | 2022-10-12 | 2022-11-08 | 中国海洋大学 | 基于跨时空声速剖面聚类的声速分布快速估计方法 |
CN115640743A (zh) * | 2022-09-30 | 2023-01-24 | 国网江苏省电力有限公司常州供电分公司 | 基于贝叶斯优化参数神经网络的配电负荷-馈线智能匹配方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210125073A1 (en) * | 2019-10-24 | 2021-04-29 | Rubikloud Technologies Inc. | Method and system for individual demand forecasting |
-
2023
- 2023-10-16 CN CN202311331695.7A patent/CN117076893B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110353729A (zh) * | 2019-07-30 | 2019-10-22 | 北京航空航天大学 | 一种基于双向长短期记忆网络的声波渡越时间检测方法 |
CN111222677A (zh) * | 2019-10-22 | 2020-06-02 | 浙江运达风电股份有限公司 | 一种基于长短期记忆时间神经网络的风速预测方法及系统 |
CN113269363A (zh) * | 2021-05-31 | 2021-08-17 | 西安交通大学 | 一种高超声速飞行器的轨迹预测方法、系统、设备及介质 |
CN115640743A (zh) * | 2022-09-30 | 2023-01-24 | 国网江苏省电力有限公司常州供电分公司 | 基于贝叶斯优化参数神经网络的配电负荷-馈线智能匹配方法 |
CN115307714A (zh) * | 2022-10-12 | 2022-11-08 | 中国海洋大学 | 基于跨时空声速剖面聚类的声速分布快速估计方法 |
Non-Patent Citations (1)
Title |
---|
基于图卷积STG-LSTM 的 京杭运河水质时空预测研究;宦娟;中国农村水利水电;2022(第8期);14-22页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117076893A (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7175415B1 (ja) | Steof-lstmに基づく海洋環境要素予測方法 | |
Zhang et al. | Prediction of sea surface temperature using long short-term memory | |
CN111695299B (zh) | 一种中尺度涡轨迹预测方法 | |
CN111199270B (zh) | 一种基于深度学习的区域波高预报方法及终端 | |
CN117076893B (zh) | 一种基于长短期记忆神经网络的声速分布预报方法 | |
CN107563574A (zh) | 一种基于长短时记忆模型循环神经网络的地磁场预测方法 | |
CN111767517B (zh) | 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质 | |
Ouali et al. | Fully nonlinear statistical and machine‐learning approaches for hydrological frequency estimation at ungauged sites | |
CN110619432A (zh) | 一种基于深度学习的特征提取水文预报的方法 | |
CN114399073A (zh) | 一种基于深度学习的海洋表面温度场预测方法 | |
CN108334943A (zh) | 基于主动学习神经网络模型的工业过程半监督软测量建模方法 | |
Contractor et al. | Efficacy of Feedforward and LSTM Neural Networks at predicting and gap filling coastal ocean timeseries: Oxygen, nutrients, and temperature | |
CN112712214A (zh) | 海事搜救对象轨迹预测方法、系统、装置和存储介质 | |
CN111428419A (zh) | 悬浮泥沙浓度预测方法、装置、计算机设备和存储介质 | |
CN112100911A (zh) | 一种基于深度bisltm的太阳辐射预测方法 | |
CN110517494A (zh) | 基于集成学习的交通流预测模型、预测方法、系统、装置 | |
Song et al. | A significant wave height prediction method based on deep learning combining the correlation between wind and wind waves | |
CN113393027B (zh) | 一种基于深度学习的航标漂移智能预测方法 | |
CN112668606B (zh) | 基于梯度提升机与二次规划的阶跃型滑坡位移预测方法 | |
Datta | Self-organizing map based surrogate models for contaminant source identification under parameter uncertainty | |
CN117408167A (zh) | 基于深度神经网络的泥石流灾害易发性预测方法 | |
CN117371303A (zh) | 一种海浪下有效波高的预测方法 | |
CN114398819A (zh) | 一种基于深度学习的非结构网格有效波高预测方法与系统 | |
CN115618988A (zh) | 基于深度神经网络的海水温度、盐度与流速的三维时空场联合预测方法 | |
Jiao | Prediction of fish migration based on LSTM model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |