CN117113857B - 全连接深度神经网络模型及反演海底地形的方法 - Google Patents
全连接深度神经网络模型及反演海底地形的方法 Download PDFInfo
- Publication number
- CN117113857B CN117113857B CN202311368812.7A CN202311368812A CN117113857B CN 117113857 B CN117113857 B CN 117113857B CN 202311368812 A CN202311368812 A CN 202311368812A CN 117113857 B CN117113857 B CN 117113857B
- Authority
- CN
- China
- Prior art keywords
- model
- data
- depth
- neural network
- inverting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012876 topography Methods 0.000 title claims abstract description 40
- 238000003062 neural network model Methods 0.000 title claims abstract description 31
- 230000005484 gravity Effects 0.000 claims abstract description 60
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 33
- 238000013507 mapping Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000011160 research Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 37
- 230000006870 function Effects 0.000 claims description 34
- 230000004913 activation Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 11
- 238000013461 design Methods 0.000 claims description 10
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 238000013135 deep learning Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 238000013136 deep learning model Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000013535 sea water Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V11/00—Prospecting or detecting by methods combining techniques covered by two or more of main groups G01V1/00 - G01V9/00
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geophysics (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种全连接深度神经网络模型及反演海底地形的方法,属于地球物理学和人工智能技术领域;包括S1:获取卫星重力场数据和船载单波束测深数据,确保获取的数据覆盖整个研究区域;S2对步骤S1中获取的数据进行预处理,剔除出现差异的点;S3通过公式计算控制点的短波重力异常分量,以该短波重力异常分量数值作为全连接深度网络模型预测海深时的输入之一;S4设计适用于重力场反演水深的全连接深度神经网络模型,通过FC‑DNN模型学习卫星重力场数据和船载单波束测深数据之间的非线性映射关系进行预测海底深度与实际船载测量的深度之间的关系实现海底地形的反演;模型包括输入层、输出层和至少3个隐藏;提高反演的精度和效率,扩大反演的应用范围。
Description
技术领域
本发明涉及一种全连接深度神经网络模型及反演海底地形的方法,属于地球物理学和人工智能技术领域。
背景技术
海底地形是海洋科学研究的重要组成部分,对于海洋环境研究、海洋资源开发、海洋灾害预防等方面具有重要的应用价值。传统的海底地形反演方法主要包括声纳测深、卫星重力场数据反演等。其中,卫星重力场数据反演是一种重要的海底地形获取方法,其优点是覆盖面广,不受海洋环境影响,但是其反演精度和效率受到限制。
传统的卫星重力场数据反演方法通常依赖于复杂的物理模型,这些模型需要大量的计算,且可能无法准确地描述实际的地球物理过程(非线性关系),从而影响反演结果的精度。
现有技术的主要缺点如下:
反演精度受限:传统的卫星重力场数据反演方法通常依赖于复杂的物理模型,这些模型可能无法准确地描述实际的地球物理过程(非线性关系),从而影响反演结果的精度。
反演效率低:传统的重力场数据反演方法通常需要大量的计算,这在实际应用中可能不太实用。尤其是在处理大规模的卫星重力场数据时,计算量巨大,反演效率低。
应用范围受限:由于传统的方法需要依赖复杂的物理模型,因此其应用范围受到限制。例如,对于存在复杂地球物理非线性关系的海域,传统的方法可能无法得到满意的反演结果。
例如,中国专利公开号CN113466941A,提出了一种海底地形校正方法,具体是一种基于声速剖面反演的多波束海底地形校正方法,基于相邻条带重叠区域多个ping对应波束的测深一致性,构建目标函数;确定初始温度;设置初始解、EOF系数的取值范围及邻域函数;根据前几个特征向量和实测的SVP计算得到EOF时间系数的取值范围,邻域函数应使产生的候选解遍布解空间;利用目标函数的加权平均值判断内循环是否达到“热平衡状态”;构建温度冷却函数;确定外循环终止准则;搜寻最优解;最终校正海底畸变地形;该方法首先利用EOF对SVP进行分解,然后,基于由相邻条带重叠区域的多组ping对应波束的测深一致性构造的代价函数,最后,根据最优时间系数反演SVP,并利用反演的SVP对海底地形畸变进行校正。但是,需要大量的计算,且可能无法准确地描述实际的地球物理过程,影响反演结果的精度。
再如,中国专利公开号CN 11326782A,提出了一种基于地形约束因子权重优化提高海底地形反演精度的方法,充分考虑海底地形信息对普通Kriging法变异函数的影响,分别从水平与深度方向构建变异函数模型,并顾及到水平方向变异函数各向异性影响,通过增加外部相关信息重新优化Kriging法格网化的权重,以提高低频重力场模型构建的精度,为高精度海底地形反演提供较好的基础数据。但是,依然需要大量的计算,且可能无法准确地描述实际的地球物理过程,影响反演结果的精度。
近年来,深度学习技术在许多领域都取得了显著的成果,但在卫星重力场数据反演海底地形的应用中,还未见到有效的解决方案。
因此,急需一种新的方法,能够充分利用深度学习的优势,提高卫星重力场数据反演海底地形的精度和效率,扩大其应用范围。
发明内容
本发明要解决的技术问题是:提供一种全连接深度神经网络模型及反演海底地形的方法,旨在提高反演的精度和效率,扩大反演的应用范围。
本发明所述的一种全连接深度神经网络模型反演海底地形的方法,包括以下步骤:
S1:获取卫星重力场数据和船载单波束测深数据,确保获取的数据覆盖整个研究区域;
S2:对步骤S1中获取的数据进行预处理,剔除出现差异的点;
S3:通过公式计算控制点的短波重力异常分量,以该短波重力异常分量数值作为全连接深度网络模型预测海深时的输入之一;
S4:设计适用于重力场反演水深的全连接深度神经网络模型,全连接深度神经网络模型是一个具有多个隐藏层的FC-DNN模型,通过FC-DNN模型学习卫星重力场数据和船载单波束测深数据之间的非线性映射关系进行预测海底深度与实际船载测量的深度之间的关系实现海底地形的反演。
优选的,所述的步骤S1中获取卫星重力场数据和船载单波束测深数据具体包括以下:从公开的数据库或者数据源获取海洋重力异常数据网格模型和船载单波束测深数据。
优选的,所述的步骤S2中对获取数据进行预处理具体包括以下:通过与最新的多波束海底地形GEBCO模型进行比对,剔除了出现差异的点,确保训练数据集中数据的准确可靠性。
优选的,所述的步骤S3中计算短波重力异常分离具体包括以下步骤:
S11:使用以下公式计算控制点的短波重力异常分量:
式中: 为船测水深控制点/>处的重力异常分量,/>为引力常数; />为海水和海底的密度差异常数; />为控制点/>处的海深; />为参考海深,取最大水深值;
S12:使用 计算控制点处的 />,式中 />为控制点船测海深:
S13:空间插值方法得到反演区域规则网格的长波重力数据,并进一步计算无船测水深的点的长波重力网格数据,方法如下所示:
以该短波重力数据归一化之后数值作为全连接深度神经网络模型预测海深时的输入之一。
优选的,所述的步骤S4中设计适用于重力场反演水深的全连接深度神经网络模型,具体包括以下:
模型设计:设计适用于重力场反演水深的全连接深度神经网络模型;
张量的构建:设置输入、输出及模型训练的参数;
模型优化:更新和计算模型中影响模型训练和模型输出的网络参数;
模型实现:使用TensorFlow深度学习框架来实现和训练全连接深度神经网络模型。
优选的,所述的步骤S4中张量的构建和张量归一化设置:张量包含训练模型的输入参数和输出参数,首先构建一个输入张量,以存储模型的输入数据,输入数据包括:经度、纬度和短波重力异常分量,视为输入张量的三个维度;张量归一化用于将张量的一个变量的取值缩放到[0~1]之间;张量归一化的取值,其中 />是原始张量,/>是均值,是数据的标准差。
优选的,所述的步骤S4中还包括激活函数设置,选择ReLU函数作为激活函数,ReLU函数的表达式为:
式中,表示激活函数输出,/>表示激活函数输入。
优选的,所述的步骤S4中模型优化具体包括以下:
设置优化器:选择Adam优化器更新和计算模型中影响模型训练和模型输出的网络参数;
选择损失函数:选择均方误差作为损失函数;
设置评价指标:选择均方误差作为评价指标;
其中,所述Adam优化器更新和计算的具体步骤如下;
计算梯度的一阶矩估计和二阶矩估计:
其中,和/>分别是梯度的一阶矩均值和二阶矩末中心化的方差的估计值,/>是在时间步/>的梯度,/>和/>是超参数;
由于和 />被初始化为零,所以它们会偏向于零,特别是在训练初期;为了减少这种偏差,引入了偏差修正:
其中,是/>的偏差修正值,/>是 />;
步骤(3),参数更新:
其中,是在时间步/>的参数,/>是在时间步/>的参数,/>是学习率,/>是为了防止除以零而添加的小常数。
优选的,所述均方误差的表达式为:
其中,是均方误差,/>是真实值,/>是预测值,/>是样本数量。
本发明所述的上述一种全连接深度神经网络模型反演海底地形的方法的全连接神经网络模型,包括输入层、输出层和至少3个隐藏层,所述隐藏层均包含有神经元,且每一层的每个神经元都与上一层的每个神经元相连;所述输入层的输入参数是经度、纬度和短波重力异常分量,输出层的输出参数是输入参数对应的单波束水深,所述至少3个隐藏层通过深度学习模型训练得出。
与现有技术相比,本发明具有以下有益效果:
1. 提高了水深反演的准确性:通过使用全连接深度神经网络(FC-DNN)模型,我们能够更准确地从卫星重力场数据中反演出水深。这是因为FC-DNN模型能够有效地学习卫星重力场数据和船载单波束测深数据之间的复杂非线性映射关系,从而提高了水深反演的准确性。
2. 提高了水深反演的效率:与传统的水深反演方法相比,我们的方法大大提高了水深反演的效率。这是因为我们的方法只需要一次训练,然后就可以用于预测任何新的卫星重力场数据的水深。而传统的方法则需要对每个新的卫星重力场数据进行复杂的计算,这在大规模的水深反演任务中会非常耗时。
3. 创新地引入了短波重力异常作为输入参数:我们发现,将短波重力异常作为输入参数之一,可以显著提高模型的预测精度。短波重力异常反映了海底地形的变化,因此在水深反演中具有重要的作用,因此该发明将短波重力异常应用于FC-DNN模型。
附图说明
图1为本发明所述的一种反演海底地形的全连接深度神经网络模型的结构图;
图2为本发明所述的试验区域和船测单波束航迹数据图;
图3为本发明所述的FC-DNN和GGM反演结果图,a为FC-DNN反演结果图,b为GGM反演结果图;
图4为本发明所述的短波重力异常在改善FC-DNN模型海底地形反演精度中的作用展示图。
图中:1、输入层;2、第一隐藏层;3、第二隐藏层;4、第三隐藏层;5、输出层。
具体实施方式
为了更清楚地说明本发明实施例或技术方案,下面将对实施例或技术方案描述作简单地介绍,显而易见地,下面描述仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些实施例获得其他的实施例。
实施例1
在本实施例中,我们设计并实现了反演海底地形的全连接深度神经网络模型。以下是反演海底地形的全连接深度神经网络模型的步骤:
1.收集卫星重力场数据和船载单波束测深数据
从公开的数据库或者数据源获取海洋重力异常数据网格模型和船载单波束测深数据。确保获取的数据覆盖了研究区域,并且数据的质量和精度满足研究的需求。
2.对收集的数据进行预处理
在这个步骤中,通过与最新的多波束海底地形GEBCO模型进行比对,剔除了差异超过300m的点。这样确保训练数据集中的数据是准确和可靠的,从而提高模型的预测性能。
3. 计算短波重力异常分量
在海洋测深中,短波重力异常分量主要反映了海底地形的起伏变化,因此,通过分析短波重力异常分量,可以间接获得海底地形的信息,从而实现海洋测深。
首先我们使用以下公式计算控制点的短波重力异常分量:
式中,为船测水深控制点/>处的重力异常分量,/>为引力常数;/>为海水和海底的密度差异常数;/>为控制点 />处的海深;/>为参考海深,取最大水深值。
然后,使用计算控制点处的/>,式中/>为控制点船测海深:
空间插值方法得到反演区域规则网格的长波重力数据,并进一步计算无船测水深的点的长波重力网格数据,方法如下所示:
以该短波重力数据归一化之后数值作为FC-DNN模型预测海深时的输入之一。
4. 模型设计
设计适用于重力场反演水深的全连接深度神经网络(FC-DNN)模型。模型的设计原理基于深度学习的理论,特别是全连接神经网络。全连接意味着每一层的每个神经元都与上一层的每个神经元相连。这种设计允许模型学习输入数据的复杂模式,并使其能够进行精确的海底深度反演。如图1所示,本实施例设计模型包括一个输入层1、三个隐藏层和一个输出层5。三个隐藏层分别为第一隐藏层2、第二隐藏层3、第三隐藏层4,第一隐藏层2、第二隐藏层3、第三隐藏层4的神经元数量分别为20、10和5。
全连接深度神经网络模型是一个具有多个隐藏层的FC-DNN模型,该模型能够有效地学习卫星重力场数据和船载单波束测深数据之间的复杂非线性映射关系。这种设计使得我们的模型能够在没有精确数学关系的情况下处理这些参数之间的非线性关系,从而提高了水深反演的准确性。将短波重力异常作为输入参数之一,可以显著提高模型的预测精度。短波重力异常反映了海底地形的变化,因此在水深反演中具有重要的作用。
5. 张量的构建
人工智能的数据表示方式是张量,张量包含训练模型的输入参数和输出参数。首先构建一个输入张量,以存储模型的输入数据。在这个实施例中,输入数据由三个参数组成:经度(Longitude)、纬度(Latitude)和短波重力异常分量(Short-wavelength gravityanomaly)。这三个参数可以视为输入张量的三个维度。为了表示这些数据,我们可以创建一个形状为[n,3]的张量,其中n是样本的数量。
然后构建一个输出张量,以存储模型的输出数据。在这个实施例中,输出数据是对应的单波束水深(Single-beam depth)。这是一个标量值,因此输出张量的形状为[n, 1]。
6.张量归一化:归一化是将一个变量的取值缩放到[0~1]之间,也称数据标准化(Normalization)。由于不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要对数据进行归一化处理,解决数据指标之间的可比性问题,同时可以提高梯度下降求解最优解的速度。本实施例采用方法为Z-score标准化法,Z-score标准化的公式为,其中/>是原始张量,/>是均值,/>是数据的标准差。
7. 超参数设置
在深度学习模型的训练过程中,学习率、训练的迭代次数(epochs)和批处理大小(batch size)是三个非常关键的超参数。
学习率:学习率是一个决定模型学习速度的参数。如果学习率设置得太大,模型在训练过程中可能会在最优解附近震荡而无法收敛;如果学习率设置得太小,则模型的训练速度可能会过慢,需要更多的迭代次数才能收敛。在本实施例中,我们将学习率设为0.001,这是一个相对较小的值,能够确保模型的稳定训练。
训练的迭代次数(Epochs):迭代次数是模型训练过程中数据集被完整遍历的次数。如果迭代次数设置得太少,模型可能会因为学习不足而无法达到最优;如果迭代次数设置得过多,模型可能会过拟合,降低对未知数据的预测能力。在本实施例中,我们将迭代次数设为30,以在保证模型学习效果的同时,避免过拟合。
批处理大小(Batch Size):批处理大小是每次模型训练时,一次性输入模型的样本数量。批处理大小的选择会影响模型的训练速度和效果。在本实施例中,我们将批处理大小设为120,这个值既不会使得训练速度过慢,也不会导致模型无法有效学习。
通过这样的超参数设置,我们可以控制模型的训练过程,从而使模型能够更好地学习和预测海底深度。
8. 激活函数设置
深度学习模型中的激活函数是用于增加模型的非线性表达能力的重要组件。在本实施例中,我们选择了ReLU(Rectified Linear Unit)作为隐藏层的激活函数。
ReLU函数的表达式为:
如果输入大于0,那么输出就是/>本身,如果/>小于或等于0,那么输出就是0。ReLU函数简单、高效,并且具有稀疏激活的特性,能够有效减少模型的过拟合,提高模型的泛化能力。通过选择合适的激活函数,我们可以提高模型的非线性表达能力,使模型能够学习到复杂的海底深度与地理、重力等因素之间的非线性关系。
9.选择Adam作为优化器:
优化器是用于更新和计算模型中影响模型训练和模型输出的网络参数的方法。在本实施例中,我们选择了 Adam (Adaptive Moment Estimation) 作为优化器。Adam 是一种常用的、效果良好的深度学习优化算法,它结合了 RMSProp 和Momentum 两种优化算法的思想。
Adam 的更新过程可以通过以下几个步骤来描述:
(1)计算梯度的一阶矩估计和二阶矩估计:
其中,和/>分别是梯度的一阶矩 (均值) 和二阶矩 (末中心化的方差) 的估计值,/>是在时间步/>的梯度, />和/>是超参数,通常取值为 0.9 和 0.999 。
(2)由于和 />被初始化为零,所以它们会偏向于零,特别是在训练初期。为了减少这种偏差,引入了偏差修正:
(3)最后,参数更新步骤如下:
其中,是在时间步/>的参数,/>是学习率,/>是为了防止除以零而添加的小常数 (通常为/> )。
通过以上步骤,Adam 优化器在每个训练步骤中都对模型的参数进行更新,使得模型能够在训练过程中找到更好的解,提高模型的水深反演精度。
10. 损失函数的设置
在本实施例中,我们选择均方误差(Mean Squared Error,MSE)作为损失函数。损失函数是用来衡量模型的预测值与真实值之间的差距,是一种反映误差的度量方式。选择合适的损失函数能使模型更好地学习数据特征,提高预测精度。
均方误差 (mean squared error) 数学表达为:,其中/>是真实值,/>是预测值,/>是样本数量。MSE 能够很好地反映模型预测的平均水平误差,有利于我们评估和优化模型。
11. 设置评价指标
在本实施例中,我们使用均方误差(Mean Squared Error, MSE)来评估模型的性能。MSE是一个常见的回归问题的评价指标,它衡量的是模型预测值与实际值之间的平均平方误差,具有较好的直观性和计算简便性。MSE 的值越小,说明模型的预测性能越好。在训练过程中,我们的目标是最小化 MSE。
12. 模型训练
本实施例使用TensorFlow深度学习框架来实现和训练我们的全连接深度神经网络(FC-DNN)模型。训练数据集由预处理后的卫星重力场数据和对应的船载单波束测深数据组成。
在模型训练过程中,每完成一次迭代,我们就在验证数据集上评估模型的性能。这一步骤有助于我们监控模型训练过程中是否出现了过拟合现象,即模型在训练数据上的性能提高,但在验证数据上的性能下降。如果发现模型出现过拟合,我们可以采取一些策略来应对,例如调整模型的参数(如学习率、正则化参数等)、采用早停(early stopping)策略、增大训练数据等。
实施例2
本实施例公开了一种基于全连接深度神经网络模型的反演海底地形方法,应用实施例1所述的反演海底地形的全连接深度神经网络模型生成方法所生成的模型进行反演,具体的:我们可以使用实施例1训练得到的模型进行预测。在模型预测阶段,我们需要准备新的预测数据。这些预测数据包括网格化的经度、纬度和短波重力异常数据。将这些数据作为模型的输入,模型将输出预测的全区域网格化水深。
该种基于全连接深度神经网络模型的反演海底地形方法,通过以下两点共同使得我们的模型在水深反演任务上表现出优越的性能:
(1)适用于水深反演的全连接深度神经网络(FC-DNN)结构设计:我们设计了一个具有多个隐藏层的FC-DNN模型,该模型能够有效地学习卫星重力场数据和船载单波束测深数据之间的复杂非线性映射关系。这种设计使得我们的模型能够在没有精确数学关系的情况下处理这些参数之间的非线性关系,从而提高了水深反演的准确性。
(2)短波重力异常在FC-DNN的应用:我们发现,将短波重力异常作为输入参数之一,可以显著提高模型的预测精度。短波重力异常反映了海底地形的变化,因此在水深反演中具有重要的作用,故该实施例将短波重力异常应用于FC-DNN模型。
总的来说,本实施例提供了一种准确、高效、创新的水深反演方法,对于海洋科学研究和相关应用具有重要的价值。
如图2-3所示,在实验中,我们使用FC-DNN模型和传统的重力地质法(Gravity-Geology Method,GGM)在指定海域进行了海底地形反演的试验,从而验证了这两种方法的效果。
结果显示,当我们在FC-DNN模型中引入短波重力异常作为输入参数时,预测的海底深度与实际船载测量的深度之间的标准差(STD)显著降低,仅为73.4米,且绝对平均偏差也只有0.2米。相较于未引入短波重力异常时(标准差为227.7米,绝对平均偏差为0.7米),其精度明显提高,表明短波重力异常在提高预测精度方面起到了重要作用。
我们进一步将FC-DNN模型的结果与传统的GGM模型进行比较,发现FC-DNN模型的预测精度也显著优于GGM。在GGM中,标准差为84.8米,绝对平均偏差为1.4米,而FC-DNN模型的相应值为73.4米和0.2米,分别下降了约13%和85%。
通过对比预测深度与实际船载测量深度,我们发现FC-DNN模型的预测结果在引入短波重力异常作为输入参数后,能更准确地预测实际的海底深度。
此外,如图4所示,我们还计算了不同方向的功率谱密度(PSD),图中的X轴为径向波长、单位km,Y轴为能量谱密度,发现在短波长(小于约6公里)下,FC-DNN模型的表现略优于GGM,并显著优于CNN模型,这表明FC-DNN模型在恢复小尺度海底深度方面更为有效。
综上,我们的实验结果表明,FC-DNN模型在预测海底深度方面具有显著的优势,尤其是在引入短波重力异常作为输入参数的情况下,其性能显著优于传统的GGM模型和CNN模型,这为我们的发明提供了有力的实验证据。
Claims (5)
1.一种全连接深度神经网络模型反演海底地形的方法,其特征在于,所述的方法包括以下步骤:
S1:获取卫星重力场数据和船载单波束测深数据,确保获取的数据覆盖整个研究区域;
S2:对步骤S1中获取的数据进行预处理,剔除出现差异的点;
S3:通过公式计算控制点的短波重力异常分量,以该短波重力异常分量数值作为全连接深度网络模型预测海深时的输入之一;
S4:设计适用于重力场反演水深的全连接深度神经网络模型,全连接深度神经网络模型是一个具有多个隐藏层的FC-DNN模型,通过FC-DNN模型学习卫星重力场数据和船载单波束测深数据之间的非线性映射关系进行预测海底深度与实际船载测量的深度之间的关系实现海底地形的反演;
所述适用于重力场反演水深的全连接深度神经网络模型,包括输入层(1)、输出层(5)和至少3个隐藏层,所述隐藏层均包含有神经元,且每一层的每个神经元都与上一层的每个神经元相连;所述输入层(1)的输入参数是经度、纬度和短波重力异常分量,输出层(5)的输出参数是输入参数对应的单波束水深,所述至少3个隐藏层通过深度学习模型训练得出;
所述的步骤S1中获取卫星重力场数据和船载单波束测深数据具体包括以下:从公开的数据库或者数据源获取海洋重力异常数据网格模型和船载单波束测深数据;
所述的步骤S2中对获取数据进行预处理具体包括以下:通过与最新的多波束海底地形GEBCO模型进行比对,剔除了出现差异的点,确保训练数据集中数据的准确可靠性;
所述的步骤S4中设计适用于重力场反演水深的全连接深度神经网络模型,具体包括以下:
模型设计:设计适用于重力场反演水深的全连接深度神经网络模型;
张量的构建:设置输入、输出及模型训练的参数;
模型优化:更新和计算模型中影响模型训练和模型输出的网络参数;
模型实现:使用TensorFlow深度学习框架来实现和训练全连接深度神经网络模型。
2.根据权利要求1所述的全连接深度神经网络模型反演海底地形的方法,其特征在于,所述的步骤S4中张量的构建和张量归一化设置:张量包含训练模型的输入参数和输出参数,首先构建一个输入张量,以存储模型的输入数据,输入数据包括:经度、纬度和短波重力异常分量,视为输入张量的三个维度;张量归一化用于将张量的一个变量的取值缩放到[0~1]之间;张量归一化的取值,其中/>是原始张量,/>是均值,/>是数据的标准差。
3.根据权利要求1所述的全连接深度神经网络模型反演海底地形的方法,其特征在于,所述的步骤S4中还包括激活函数设置,选择ReLU函数作为激活函数,ReLU函数的表达式为:
式中,表示激活函数输出,/>表示激活函数输入。
4.根据权利要求1所述的全连接深度神经网络模型反演海底地形的方法,其特征在于,所述的步骤S4中模型优化具体包括以下:
设置优化器:选择Adam优化器更新和计算模型中影响模型训练和模型输出的网络参数;
选择损失函数:选择均方误差作为损失函数;
设置评价指标:选择均方误差作为评价指标;
其中,所述Adam优化器更新和计算的具体步骤如下;
计算梯度的一阶矩估计和二阶矩估计:
其中,和/>分别是梯度的一阶矩均值和二阶矩末中心化的方差的估计值,/>是在时间步/>的梯度,/>和/>是超参数;
由于和/>被初始化为零,所以它们会偏向于零;为了减少这种偏差,引入了偏差修正后:
其中,是/>的偏差修正值,/>是/>的偏差修正值;
参数更新:
其中,是在时间步/>的参数,/>是在时间步/>的参数,/>是学习率,/>是为了防止除以零而添加的小常数。
5.根据权利要求4所述的全连接深度神经网络模型反演海底地形的方法,其特征在于,所述均方误差的表达式为:
其中,是均方误差,/>是控制点i处的真实值,/>是控制点i处的预测值,/>是样本数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311368812.7A CN117113857B (zh) | 2023-10-23 | 2023-10-23 | 全连接深度神经网络模型及反演海底地形的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311368812.7A CN117113857B (zh) | 2023-10-23 | 2023-10-23 | 全连接深度神经网络模型及反演海底地形的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117113857A CN117113857A (zh) | 2023-11-24 |
CN117113857B true CN117113857B (zh) | 2024-01-30 |
Family
ID=88809394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311368812.7A Active CN117113857B (zh) | 2023-10-23 | 2023-10-23 | 全连接深度神经网络模型及反演海底地形的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117113857B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114137624A (zh) * | 2021-10-27 | 2022-03-04 | 中国海洋大学 | 一种基于卫星高度计反演海底地形的方法和系统 |
JP2022090529A (ja) * | 2020-12-07 | 2022-06-17 | 五洋建設株式会社 | 海底地形推定方法、学習済モデル生成方法、海底地形推定装置およびプログラム |
WO2022227206A1 (zh) * | 2021-04-26 | 2022-11-03 | 中国科学院地质与地球物理研究所 | 一种基于全卷积神经网络的大地电磁反演方法 |
CN115905877A (zh) * | 2023-01-07 | 2023-04-04 | 自然资源部第二海洋研究所 | 基于VGGNet的测深模型反演方法及系统 |
CN116861799A (zh) * | 2023-09-04 | 2023-10-10 | 自然资源部第一海洋研究所 | 基于残差的海底地形反演模型生成及海底地形反演方法 |
CN116861955A (zh) * | 2023-06-27 | 2023-10-10 | 山东科技大学 | 一种基于地形单元分区使用机器学习反演海底地形的方法 |
-
2023
- 2023-10-23 CN CN202311368812.7A patent/CN117113857B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022090529A (ja) * | 2020-12-07 | 2022-06-17 | 五洋建設株式会社 | 海底地形推定方法、学習済モデル生成方法、海底地形推定装置およびプログラム |
WO2022227206A1 (zh) * | 2021-04-26 | 2022-11-03 | 中国科学院地质与地球物理研究所 | 一种基于全卷积神经网络的大地电磁反演方法 |
CN114137624A (zh) * | 2021-10-27 | 2022-03-04 | 中国海洋大学 | 一种基于卫星高度计反演海底地形的方法和系统 |
CN115905877A (zh) * | 2023-01-07 | 2023-04-04 | 自然资源部第二海洋研究所 | 基于VGGNet的测深模型反演方法及系统 |
CN116861955A (zh) * | 2023-06-27 | 2023-10-10 | 山东科技大学 | 一种基于地形单元分区使用机器学习反演海底地形的方法 |
CN116861799A (zh) * | 2023-09-04 | 2023-10-10 | 自然资源部第一海洋研究所 | 基于残差的海底地形反演模型生成及海底地形反演方法 |
Non-Patent Citations (3)
Title |
---|
Seafloor classification based on deep-sea multibeam data—Application to the Southwest Indian Ridge at 50.47°E;Ao Wang等;Journal of Applied Geophysics;第185卷;全文 * |
基于BP神经网络的海底地形复杂度自动分类方法研究;纪雪;周兴华;陈义兰;唐秋华;赵洪臣;;海岸工程(第04期);全文 * |
基于重力地质法反演南海海底地形;彭聪;王鹏;周兴华;杨磊;;海洋测绘(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117113857A (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiang et al. | Multi-objective algorithm for the design of prediction intervals for wind power forecasting model | |
CN114966685B (zh) | 基于InSAR和深度学习的大坝形变监测及预测方法 | |
CN112446559B (zh) | 一种基于深度学习的大范围地面沉降时空预测方法和系统 | |
CN115935834B (zh) | 一种基于深度自回归网络和持续学习策略的历史拟合方法 | |
CN114970290B (zh) | 一种地面瞬变电磁法并行反演方法及系统 | |
Jeon et al. | Data gap analysis of ship and maritime data using meta learning | |
CN115841076A (zh) | 基于bp神经网络模型的浅海分层海底地声参数反演方法 | |
CN116910534A (zh) | 一种不同海域海洋环境要素时空智能预测方法和装置 | |
Titus et al. | Conditioning surface-based geological models to well data using artificial neural networks | |
CN111722283A (zh) | 一种地层速度模型建立方法 | |
CN117113857B (zh) | 全连接深度神经网络模型及反演海底地形的方法 | |
CN117271979A (zh) | 一种基于深度学习的赤道印度洋表层海流流速预测方法 | |
CN116933152A (zh) | 一种基于多维emd-pso-lstm神经网络的海浪信息预测方法及系统 | |
Pochampalli et al. | Machine learning enhancement of Spalart-Allmaras turbulence model using convolutional neural network | |
CN114841892A (zh) | 一种基于全连接网络的稀疏导波数据恢复方法 | |
Liu et al. | Applying machine learning methods to river topography prediction under different data abundances | |
CN117892096B (zh) | 一种基于迁移学习的小样本海洋声速剖面预报方法 | |
CN117405175B (zh) | 海洋环境智能监测系统 | |
Yang et al. | A new mathematical model for dispersion of Rayleigh wave and a machine learning based inversion solver | |
Ho | Hybrid computational intelligence approach for defect identification in Vietnamese structures | |
Park et al. | Maximum entropy: a special case of minimum cross-entropy applied to nonlinear estimation by an artificial neural network | |
Duan et al. | PINNs for Sound Propagation and Sound Speed Field Estimation Simultaneously | |
CN112396203B (zh) | 一种基于bp神经网络估计法和改进比例系数法的光伏功率区间预测方法 | |
Garibbo et al. | Taylor TD-learning | |
CN112801407A (zh) | 一种基于长短期记忆网络的蒸发波导高度预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |