CN116524352A - 一种遥感图像水体提取方法及装置 - Google Patents
一种遥感图像水体提取方法及装置 Download PDFInfo
- Publication number
- CN116524352A CN116524352A CN202310326280.4A CN202310326280A CN116524352A CN 116524352 A CN116524352 A CN 116524352A CN 202310326280 A CN202310326280 A CN 202310326280A CN 116524352 A CN116524352 A CN 116524352A
- Authority
- CN
- China
- Prior art keywords
- water body
- attention
- remote sensing
- feature map
- sensing image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 153
- 238000000605 extraction Methods 0.000 title claims abstract description 67
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000007246 mechanism Effects 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 22
- 210000000746 body region Anatomy 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000003809 water extraction Methods 0.000 claims abstract description 15
- 238000002372 labelling Methods 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000011176 pooling Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/30—Assessment of water resources
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种遥感图像水体提取方法及装置,该方法包括:获取包含水体区域的遥感图像数据集并标注水体区域;对遥感图像数据集进行增强处理,得到水体提取数据集;基于空间注意力机制和自注意力机制构建深度卷积神经网络,以得到的水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型;基于训练好的预测模型对实时获取的遥感图像进行水体提取,得到水体提取结果。本发明通过充分挖掘遥感图像中水体空间细节信息,提高了遥感图像水体提取的精度。
Description
技术领域
本发明属于图像处理技术领域,尤其涉及一种遥感图像水体提取方法及装置。
背景技术
从遥感图像中准确提取水体对于水资源管理、水质检测以及人类社会经济发展等方面具有重要的意义。传统的水体提取方法一般使用人工或利用一些水体特征从遥感图像中提取水体。一些主要的水体特征包括修正归一化差异水分指数、归一化差异水体指数等等。然而,这些方法在现实场景下提取精度不高,且易受专家知识等因素影响,限制了其应用场景。
目前,更加主流的方法是基于深度学习的方法。其主要思想是通过卷积神经网络对输入数据进行拟合与估计,通过下采样抽象和上采样还原的方式实现对于输入图像各像素的密集预测,达到对于遥感图像中水体特征自动判别的目的。然而,由于水体在形状、光谱特征上差异明显,使得水体存在较大的类内差异,这降低了模型的分割性能。
发明内容
本发明的目的在于提供一种遥感图像水体提取方法及装置,通过采用双重注意力机制融合,实现遥感图像中的水体信息增强,增强水体可区分性,达到遥感图像水体精准提取的目的。
为达到上述目的,本发明采用的技术方案如下:
本发明提供一种遥感图像水体提取方法,包括:
获取包含水体区域的遥感图像数据集并标注水体区域;
对所述遥感图像数据集进行增强处理,得到水体提取数据集;
基于空间注意力机制和自注意力机制构建深度卷积神经网络,以所述水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型;
基于训练好的预测模型对实时获取的遥感图像进行水体提取,得到水体提取结果。
进一步的,对所述遥感图像数据集进行增强处理,得到水体提取数据集,包括:
对所述遥感图像数据集中的所有图像做随机裁剪,随机水平滑动、随机翻转、旋转,以及色彩增强操作,将增强后的图像和原图像共同作为水体提取数据集。
进一步的,所述基于空间注意力机制和自注意力机制构建深度卷积神经网络,以水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型,包括:
将所述水体提取数据集输入至所构建的深度卷积神经网络,对所述水体提取数据集进行特征提取,得到多尺度水体特征图;
对得到的所述多尺度水体特征图进行空间注意力计算得到对应的空间注意力图,并采用所述空间注意力图对原水体特征图进行加权,得到加权后的空间注意力特征图;
对得到的所述多尺度水体特征图进行自注意力计算得到对应的自注意力图,并采用所述自注意力图对原水体特征图进行加权,得到加权后的自注意力特征图;
将所述加权后的空间注意力特征图和所述加权后的自注意力特征图进行级联,得到最终的特征图;
将所述最终的特征图恢复到原始图像大小,作为预测结果输出;
计算预测结果与真实标注的水体区域之间的损失,更新所构建的深度卷积神经网络参数;
基于上述方式对所构建的深度卷积神经网络进行迭代训练,直至达到设定的最大迭代次数,保存损失最小的网络参数,得到训练好的预测模型。
进一步的,对所述水体提取数据集进行特征提取,得到多尺度水体特征图,包括:
采用50个残差块对所述水体提取数据集进行特征提取,得到多尺度水体特征图。
进一步的,设置4个特征提取层,得到4个尺度的水体特征图。
进一步的,将所述最终的特征图恢复到原始图像大小,作为预测结果输出,包括:
通过上采样将所述最终的特征图恢复到原始图像大小,并使用1×1卷积输出预测结果。
进一步的,所述更新所构建的深度卷积神经网络参数,包括:
通过反向传播的方式更新网络参数。
进一步的,所述最大迭代次数设定为200次。
本发明还提供一种遥感图像水体提取装置,包括:
源数据获取模块,用于获取包含水体区域的遥感图像数据集并标注水体区域;
训练数据获取模块,用于对所述遥感图像数据集进行增强处理,得到水体提取数据集;
模型训练模块,用于基于空间注意力机制和自注意力机制构建深度卷积神经网络,以所述水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型;
预测模块,用于基于所述训练好的预测模型对实时获取的遥感图像进行水体提取,得到水体提取结果。
进一步的,所述模型训练模块包括:
特征提取模块,用于对所述水体提取数据集进行特征提取,得到多尺度水体特征图;
空间注意力模块,用于对提取的所述多尺度水体特征图进行空间注意力计算得到对应的空间注意力图,并采用得到的空间注意力图对原水体特征图进行加权,得到加权后的空间注意力特征图;
自注意力模块,用于对得到的所述多尺度水体特征图进行自注意力计算得到对应的自注意力图,并采用得到的自注意力图对原水体特征图进行加权,得到加权后的自注意力特征图;
特征融合模块,用于将所述加权后的空间注意力特征图和所述加权后的自注意力特征图进行级联,得到最终的特征图;
结果输出模块,用于将所述最终的特征图恢复到原始图像大小,作为预测结果输出;
参数更新模块,用于计算所述结果输出模块输出的预测结果与真实标注的水体区域之间的损失,更新所构建的深度卷积神经网络参数。
本发明所达到的有益效果为:
本发明提供一种遥感图像水体提取方法,将空间注意力机制和自注意力机制向融合,实现水体高级语义特征增强,的水体提取方法及装置能够克服水体差异带来的困难,实现模型对于水体的精确分割,提升模型的性能。
附图说明
图1是本发明提供的一种遥感图像水体提取方法流程图;
图2是本发明实施例提供的空间注意力模块架构;
图3是本发明实施例提供的自注意力模块架构;
图4是本发明实施例提供的特征融合模块示意图。
具体实施方式
下面对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明提供一种遥感图像水体提取方法,参见图1,包括:
获取包含水体区域的遥感图像数据集并标注水体区域;
对所获取的遥感图像数据集进行增强处理,得到水体提取数据集;
基于空间注意力机制和自注意力机制构建深度卷积神经网络,以所述水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型;
基于训练好的预测模型对实时获取的遥感图像进行水体提取,得到水体提取结果。
本发明的一个实施例中,获取包含水体区域的遥感图像数据集选择青藏高原湖泊语义分割数据集。
本发明的一个实施例中,对所获取的遥感图像数据集进行增强处理,得到水体提取数据集,包括:
对所获取的遥感图像数据集中的所有图像做随机裁剪,随机水平滑动、随机翻转、旋转,以及色彩增强操作,将增强后的图像和原图像共同作为水体提取数据集。
需要说明的是,预测模型训练过程中,每次迭代前对,都对所获取的遥感图像数据集进行增强处理。
本发明的一个实施例中,基于空间注意力机制和自注意力机制构建深度卷积神经网络,以水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型,具体实现过程如下:
对水体提取数据集进行特征提取,得到多尺度水体特征图;
对得到的多尺度水体特征图进行空间注意力计算得到对应的空间注意力图,并采用得到的空间注意力图对水体特征图进行加权,得到加权后的空间注意力特征图;
对得到的多尺度水体特征图进行自注意力计算得到对应的自注意力图,并采用得到的自注意力图对水体特征图进行加权,得到加权后的自注意力特征图;
将加权后的空间注意力特征图和加权后的自注意力特征图进行级联,得到最终的特征图;
将得到的最终的特征图恢复到原始图像大小,作为预测结果输出;
计算预测结果与真实标注的水体区域之间的损失,更新所构建的深度卷积神经网络参数;
基于上述方式对所构建的深度卷积神经网络进行迭代训练,直至达到设定的最大迭代次数,保存损失最小的网络参数,得到训练好的预测模型。
本实施例中,对水体提取数据集进行特征提取,得到多尺度水体特征图,包括:
采用50个残差块对水体提取数据集进行特征提取,得到多尺度水体特征图,表示为:
Fi∈Hi×Wi×Ci,
其中,Hi,Wi,Ci分别表示第i个特征提取层输出的特征图的高、宽和通道数。
本实施例通过残差连接使得卷积神经网络中的浅层特征得以向更深层的网络层中传递,可以有效避免梯度爆炸或梯度消失。
本实施例中,i=1,2,3,4。
本实施例中,对得到的多尺度水体特征图进行空间注意力计算得到对应的空间注意力图,并采用得到的空间注意力图对水体特征图进行加权,得到加权后的空间注意力特征图,具体实现过程如下:
对水体特征图Fi进行平均池化和最大池化:
Fimax=MaxPool(Fi),Fiavg=AvgPool(Fi),
其中,MaxPool(·)和AvgPool(·)分别表示在通道维度上对特征图做平均池化和最大池化,Fimax和Fiavg的形状均为Hi×Wi×1;
对平均池化和最大池化操作后的特征图进行级联和卷积,得到空间注意力图,表示为:
其中,Concat(·)表示级联操作,Conv7×7表示7×7的卷积操作,σ(·)表示Sigmoid激活函数,的形状为Hi×Wi×1;
采用对水体特征图Fi加权,得到加权后的空间注意力特征图,表示为:
其中,⊙表示像素相乘。
上述具体实现过程可参见图2的空间注意力模块架构。
本实施例中,对得到的多尺度水体特征图进行自注意力计算得到对应的自注意力图,并采用得到的自注意力图对水体特征图进行加权,得到加权后的自注意力特征图,具体实现过程如下:
对水体特征图进行重塑,表示为:
Xi=reshape(Fi)=[xi1,xi2,...,xiN],其中,N=Hi×Wi。
预设三个矩阵进而生成查询矩阵Q,键矩阵K和值矩阵V:
计算所有查询矩阵和键矩阵位置对之间的相似性作为权重给值矩阵赋值:
Fi self=ρ(QiKi T)Vi;
其中,ρ(·)是归一化函数,用来表示查询特征和键特征之间的相似性。
一般来说,采用softmax函数来作为归一化函数:
ρ(QiKi T)=softmaxrow(QiKi T),
其中,softmaxrow(·)表示对于矩阵QiKi T的每一行做归一化。
上述具体实现过程可参见图3的自注意力模块架构。
本实施例中,将加权后的空间注意力特征图和加权后的自注意力特征图进行级联,得到最终的特征图,表示为:
Fi final=Concat(Fi spatial,Fi self);
其中,Concat(·)表示特征的级联操作。
本实施例中,将得到的最终的特征图恢复到原始图像大小,作为预测结果输出,包括:
通过上采样将Fi final恢复到原始图像大小,并使用1×1卷积输出最终的预测结果。
本实施例中,通过反向传播的方式更新网络参数。
本实施例中,设定最大迭代次数为200次。
基于相同的发明构思,本发明还提供一种遥感图像水体提取装置,包括:
源数据获取模块,用于获取包含水体区域的遥感图像数据集并标注水体区域;
训练数据获取模块,用于对所获取的遥感图像数据集进行增强处理,得到水体提取数据集;
模型训练模块,用于基于空间注意力机制和自注意力机制构建深度卷积神经网络,以水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型;
预测模块,用于基于训练好的预测模型对实时获取的遥感图像进行水体提取,得到水体提取结果。
本发明的一个实施例中,模型训练模块具体包括:
特征提取模块,用于对水体提取数据集进行特征提取,得到多尺度水体特征图;
空间注意力模块,用于对提取的多尺度水体特征图进行空间注意力计算得到对应的空间注意力图,并采用得到的空间注意力图对水体特征图进行加权,得到加权后的空间注意力特征图;
自注意力模块,用于对得到的多尺度水体特征图进行自注意力计算得到对应的自注意力图,并采用得到的自注意力图对水体特征图进行加权,得到加权后的自注意力特征图;
特征融合模块,用于将加权后的空间注意力特征图和加权后的自注意力特征图进行级联,得到最终的特征图;
结果输出模块,用于将得到的最终的特征图恢复到原始图像大小,作为预测结果输出;
参数更新模块,用于计算预测结果与真实标注的水体区域之间的损失,更新所构建的深度卷积神经网络参数。
本实施例中,空间注意力模块结构及其数据处理流程如图2所示。
本实施例中,自注意力模块结构及其数据处理流程如图3所示。
本实施例中,特征融合模块结构及其数据处理流程如图4所示。
值得指出的是,该装置实施例是与上述方法实施例对应的,上述方法实施例的实现方式均适用于该装置实施例中,并能达到相同或相似的技术效果,故不在此赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种遥感图像水体提取方法,其特征在于,包括:
获取包含水体区域的遥感图像数据集并标注水体区域;
对所述遥感图像数据集进行增强处理,得到水体提取数据集;
基于空间注意力机制和自注意力机制构建深度卷积神经网络,以所述水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型;
基于训练好的预测模型对实时获取的遥感图像进行水体提取,得到水体提取结果。
2.根据权利要求1所述的一种遥感图像水体提取方法,其特征在于,对所述遥感图像数据集进行增强处理,得到水体提取数据集,包括:
对所述遥感图像数据集中的所有图像做随机裁剪,随机水平滑动、随机翻转、旋转,以及色彩增强操作,将增强后的图像和原图像共同作为水体提取数据集。
3.根据权利要求1所述的一种遥感图像水体提取方法,其特征在于,所述基于空间注意力机制和自注意力机制构建深度卷积神经网络,以水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型,包括:
将所述水体提取数据集输入至所构建的深度卷积神经网络,对所述水体提取数据集进行特征提取,得到多尺度水体特征图;
对得到的所述多尺度水体特征图进行空间注意力计算得到对应的空间注意力图,并采用所述空间注意力图对原水体特征图进行加权,得到加权后的空间注意力特征图;
对得到的所述多尺度水体特征图进行自注意力计算得到对应的自注意力图,并采用所述自注意力图对原水体特征图进行加权,得到加权后的自注意力特征图;
将所述加权后的空间注意力特征图和所述加权后的自注意力特征图进行级联,得到最终的特征图;
将所述最终的特征图恢复到原始图像大小,作为预测结果输出;
计算预测结果与真实标注的水体区域之间的损失,更新所构建的深度卷积神经网络参数;
基于上述方式对所构建的深度卷积神经网络进行迭代训练,直至达到设定的最大迭代次数,保存损失最小的网络参数,得到训练好的预测模型。
4.根据权利要求3所述的一种遥感图像水体提取方法,其特征在于,对所述水体提取数据集进行特征提取,得到多尺度水体特征图,包括:
采用50个残差块对所述水体提取数据集进行特征提取,得到多尺度水体特征图。
5.根据权利要求4所述的一种遥感图像水体提取方法,其特征在于,设置4个特征提取层,得到4个尺度的水体特征图。
6.根据权利要求3所述的一种遥感图像水体提取方法,其特征在于,将所述最终的特征图恢复到原始图像大小,作为预测结果输出,包括:
通过上采样将所述最终的特征图恢复到原始图像大小,并使用1×1卷积输出预测结果。
7.根据权利要求3所述的一种遥感图像水体提取方法,其特征在于,所述更新所构建的深度卷积神经网络参数,包括:
通过反向传播的方式更新网络参数。
8.根据权利要求3所述的一种遥感图像水体提取方法,其特征在于,所述最大迭代次数设定为200次。
9.一种遥感图像水体提取装置,其特征在于,包括:
源数据获取模块,用于获取包含水体区域的遥感图像数据集并标注水体区域;
训练数据获取模块,用于对所述遥感图像数据集进行增强处理,得到水体提取数据集;
模型训练模块,用于基于空间注意力机制和自注意力机制构建深度卷积神经网络,以所述水体提取数据集为输入,以提取的水体特征为输出,对所构建的深度卷积神经网络进行训练,得到训练好的预测模型;
预测模块,用于基于所述训练好的预测模型对实时获取的遥感图像进行水体提取,得到水体提取结果。
10.根据权利要求9所述的一种遥感图像水体提取装置,其特征在于,所述模型训练模块包括:
特征提取模块,用于对所述水体提取数据集进行特征提取,得到多尺度水体特征图;
空间注意力模块,用于对提取的所述多尺度水体特征图进行空间注意力计算得到对应的空间注意力图,并采用得到的空间注意力图对原水体特征图进行加权,得到加权后的空间注意力特征图;
自注意力模块,用于对得到的所述多尺度水体特征图进行自注意力计算得到对应的自注意力图,并采用得到的自注意力图对原水体特征图进行加权,得到加权后的自注意力特征图;
特征融合模块,用于将所述加权后的空间注意力特征图和所述加权后的自注意力特征图进行级联,得到最终的特征图;
结果输出模块,用于将所述最终的特征图恢复到原始图像大小,作为预测结果输出;
参数更新模块,用于计算所述结果输出模块输出的预测结果与真实标注的水体区域之间的损失,更新所构建的深度卷积神经网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310326280.4A CN116524352A (zh) | 2023-03-30 | 2023-03-30 | 一种遥感图像水体提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310326280.4A CN116524352A (zh) | 2023-03-30 | 2023-03-30 | 一种遥感图像水体提取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116524352A true CN116524352A (zh) | 2023-08-01 |
Family
ID=87394864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310326280.4A Pending CN116524352A (zh) | 2023-03-30 | 2023-03-30 | 一种遥感图像水体提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116524352A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116758401A (zh) * | 2023-08-16 | 2023-09-15 | 阳光学院 | 基于深度学习和遥感图像的城市内河水质评估方法 |
-
2023
- 2023-03-30 CN CN202310326280.4A patent/CN116524352A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116758401A (zh) * | 2023-08-16 | 2023-09-15 | 阳光学院 | 基于深度学习和遥感图像的城市内河水质评估方法 |
CN116758401B (zh) * | 2023-08-16 | 2023-10-27 | 阳光学院 | 基于深度学习和遥感图像的城市内河水质评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108052911B (zh) | 基于深度学习的多模态遥感影像高层特征融合分类方法 | |
Liu et al. | Scene classification via triplet networks | |
CN111191583B (zh) | 基于卷积神经网络的空间目标识别系统及方法 | |
WO2022001623A1 (zh) | 基于人工智能的图像处理方法、装置、设备及存储介质 | |
CN111242841A (zh) | 一种基于语义分割和深度学习的图片背景风格迁移方法 | |
CN106295613A (zh) | 一种无人机目标定位方法及系统 | |
US11935213B2 (en) | Laparoscopic image smoke removal method based on generative adversarial network | |
CN113269224B (zh) | 一种场景图像分类方法、系统及存储介质 | |
CN111652273A (zh) | 一种基于深度学习的rgb-d图像分类方法 | |
Douillard et al. | Tackling catastrophic forgetting and background shift in continual semantic segmentation | |
CN110119455A (zh) | 一种基于卷积深度置信网络的图像分类检索方法 | |
CN113378812A (zh) | 一种基于Mask R-CNN和CRNN的数字表盘识别方法 | |
CN116524352A (zh) | 一种遥感图像水体提取方法及装置 | |
CN113920516A (zh) | 一种基于孪生神经网络的书法字骨架匹配方法及系统 | |
CN115222998A (zh) | 一种图像分类方法 | |
Afzal et al. | Discriminative feature abstraction by deep L2 hypersphere embedding for 3D mesh CNNs | |
CN116740362B (zh) | 一种基于注意力的轻量化非对称场景语义分割方法及系统 | |
CN114187590A (zh) | 同色系背景下目标果实识别方法及系统 | |
CN111695507B (zh) | 一种基于改进VGGNet网络和PCA的静态手势识别方法 | |
CN111985487A (zh) | 一种遥感影像目标提取方法、电子设备及存储介质 | |
CN116386803A (zh) | 一种基于图的细胞病理报告生成方法 | |
Hudagi et al. | Bayes-probabilistic-based fusion method for image inpainting | |
WO2022133814A1 (en) | Omni-scale convolution for convolutional neural networks | |
CN114596466A (zh) | 一种基于张量网络模型的多模态图像缺失补全的分类方法 | |
CN113011506A (zh) | 一种基于深度重分形频谱网络的纹理图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |