CN116524352A

CN116524352A - 一种遥感图像水体提取方法及装置

Info

Publication number: CN116524352A
Application number: CN202310326280.4A
Authority: CN
Inventors: 房艺伟; 吕鑫; 马宇飞; 丁辰龙; 李鑫; 王鑫元; 徐振楠; 吴采凤; 蒋文轩; 张庆凯; 于洁; 李�亨
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2023-03-30
Filing date: 2023-03-30
Publication date: 2023-08-01

Abstract

本发明公开了一种遥感图像水体提取方法及装置，该方法包括：获取包含水体区域的遥感图像数据集并标注水体区域；对遥感图像数据集进行增强处理，得到水体提取数据集；基于空间注意力机制和自注意力机制构建深度卷积神经网络，以得到的水体提取数据集为输入，以提取的水体特征为输出，对所构建的深度卷积神经网络进行训练，得到训练好的预测模型；基于训练好的预测模型对实时获取的遥感图像进行水体提取，得到水体提取结果。本发明通过充分挖掘遥感图像中水体空间细节信息，提高了遥感图像水体提取的精度。

Description

一种遥感图像水体提取方法及装置

技术领域

本发明属于图像处理技术领域，尤其涉及一种遥感图像水体提取方法及装置。

背景技术

从遥感图像中准确提取水体对于水资源管理、水质检测以及人类社会经济发展等方面具有重要的意义。传统的水体提取方法一般使用人工或利用一些水体特征从遥感图像中提取水体。一些主要的水体特征包括修正归一化差异水分指数、归一化差异水体指数等等。然而，这些方法在现实场景下提取精度不高，且易受专家知识等因素影响，限制了其应用场景。

目前，更加主流的方法是基于深度学习的方法。其主要思想是通过卷积神经网络对输入数据进行拟合与估计，通过下采样抽象和上采样还原的方式实现对于输入图像各像素的密集预测，达到对于遥感图像中水体特征自动判别的目的。然而，由于水体在形状、光谱特征上差异明显，使得水体存在较大的类内差异，这降低了模型的分割性能。

发明内容

本发明的目的在于提供一种遥感图像水体提取方法及装置，通过采用双重注意力机制融合，实现遥感图像中的水体信息增强，增强水体可区分性，达到遥感图像水体精准提取的目的。

为达到上述目的，本发明采用的技术方案如下：

本发明提供一种遥感图像水体提取方法，包括：

获取包含水体区域的遥感图像数据集并标注水体区域；

对所述遥感图像数据集进行增强处理，得到水体提取数据集；

基于空间注意力机制和自注意力机制构建深度卷积神经网络，以所述水体提取数据集为输入，以提取的水体特征为输出，对所构建的深度卷积神经网络进行训练，得到训练好的预测模型；

基于训练好的预测模型对实时获取的遥感图像进行水体提取，得到水体提取结果。

进一步的，对所述遥感图像数据集进行增强处理，得到水体提取数据集，包括：

对所述遥感图像数据集中的所有图像做随机裁剪，随机水平滑动、随机翻转、旋转，以及色彩增强操作，将增强后的图像和原图像共同作为水体提取数据集。

进一步的，所述基于空间注意力机制和自注意力机制构建深度卷积神经网络，以水体提取数据集为输入，以提取的水体特征为输出，对所构建的深度卷积神经网络进行训练，得到训练好的预测模型，包括：

将所述水体提取数据集输入至所构建的深度卷积神经网络，对所述水体提取数据集进行特征提取，得到多尺度水体特征图；

对得到的所述多尺度水体特征图进行空间注意力计算得到对应的空间注意力图，并采用所述空间注意力图对原水体特征图进行加权，得到加权后的空间注意力特征图；

对得到的所述多尺度水体特征图进行自注意力计算得到对应的自注意力图，并采用所述自注意力图对原水体特征图进行加权，得到加权后的自注意力特征图；

将所述加权后的空间注意力特征图和所述加权后的自注意力特征图进行级联，得到最终的特征图；

将所述最终的特征图恢复到原始图像大小，作为预测结果输出；

计算预测结果与真实标注的水体区域之间的损失，更新所构建的深度卷积神经网络参数；

基于上述方式对所构建的深度卷积神经网络进行迭代训练，直至达到设定的最大迭代次数，保存损失最小的网络参数，得到训练好的预测模型。

进一步的，对所述水体提取数据集进行特征提取，得到多尺度水体特征图，包括：

采用50个残差块对所述水体提取数据集进行特征提取，得到多尺度水体特征图。

进一步的，设置4个特征提取层，得到4个尺度的水体特征图。

进一步的，将所述最终的特征图恢复到原始图像大小，作为预测结果输出，包括：

通过上采样将所述最终的特征图恢复到原始图像大小，并使用1×1卷积输出预测结果。

进一步的，所述更新所构建的深度卷积神经网络参数，包括：

通过反向传播的方式更新网络参数。

进一步的，所述最大迭代次数设定为200次。

本发明还提供一种遥感图像水体提取装置，包括：

源数据获取模块，用于获取包含水体区域的遥感图像数据集并标注水体区域；

训练数据获取模块，用于对所述遥感图像数据集进行增强处理，得到水体提取数据集；

模型训练模块，用于基于空间注意力机制和自注意力机制构建深度卷积神经网络，以所述水体提取数据集为输入，以提取的水体特征为输出，对所构建的深度卷积神经网络进行训练，得到训练好的预测模型；

预测模块，用于基于所述训练好的预测模型对实时获取的遥感图像进行水体提取，得到水体提取结果。

进一步的，所述模型训练模块包括：

特征提取模块，用于对所述水体提取数据集进行特征提取，得到多尺度水体特征图；

空间注意力模块，用于对提取的所述多尺度水体特征图进行空间注意力计算得到对应的空间注意力图，并采用得到的空间注意力图对原水体特征图进行加权，得到加权后的空间注意力特征图；

自注意力模块，用于对得到的所述多尺度水体特征图进行自注意力计算得到对应的自注意力图，并采用得到的自注意力图对原水体特征图进行加权，得到加权后的自注意力特征图；

特征融合模块，用于将所述加权后的空间注意力特征图和所述加权后的自注意力特征图进行级联，得到最终的特征图；

结果输出模块，用于将所述最终的特征图恢复到原始图像大小，作为预测结果输出；

参数更新模块，用于计算所述结果输出模块输出的预测结果与真实标注的水体区域之间的损失，更新所构建的深度卷积神经网络参数。

本发明所达到的有益效果为：

本发明提供一种遥感图像水体提取方法，将空间注意力机制和自注意力机制向融合，实现水体高级语义特征增强，的水体提取方法及装置能够克服水体差异带来的困难，实现模型对于水体的精确分割，提升模型的性能。

附图说明

图1是本发明提供的一种遥感图像水体提取方法流程图；

图2是本发明实施例提供的空间注意力模块架构；

图3是本发明实施例提供的自注意力模块架构；

图4是本发明实施例提供的特征融合模块示意图。

具体实施方式

下面对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

本发明提供一种遥感图像水体提取方法，参见图1，包括：

获取包含水体区域的遥感图像数据集并标注水体区域；

对所获取的遥感图像数据集进行增强处理，得到水体提取数据集；

本发明的一个实施例中，获取包含水体区域的遥感图像数据集选择青藏高原湖泊语义分割数据集。

本发明的一个实施例中，对所获取的遥感图像数据集进行增强处理，得到水体提取数据集，包括：

对所获取的遥感图像数据集中的所有图像做随机裁剪，随机水平滑动、随机翻转、旋转，以及色彩增强操作，将增强后的图像和原图像共同作为水体提取数据集。

需要说明的是，预测模型训练过程中，每次迭代前对，都对所获取的遥感图像数据集进行增强处理。

本发明的一个实施例中，基于空间注意力机制和自注意力机制构建深度卷积神经网络，以水体提取数据集为输入，以提取的水体特征为输出，对所构建的深度卷积神经网络进行训练，得到训练好的预测模型，具体实现过程如下：

对水体提取数据集进行特征提取，得到多尺度水体特征图；

对得到的多尺度水体特征图进行空间注意力计算得到对应的空间注意力图，并采用得到的空间注意力图对水体特征图进行加权，得到加权后的空间注意力特征图；

对得到的多尺度水体特征图进行自注意力计算得到对应的自注意力图，并采用得到的自注意力图对水体特征图进行加权，得到加权后的自注意力特征图；

将加权后的空间注意力特征图和加权后的自注意力特征图进行级联，得到最终的特征图；

将得到的最终的特征图恢复到原始图像大小，作为预测结果输出；

本实施例中，对水体提取数据集进行特征提取，得到多尺度水体特征图，包括：

采用50个残差块对水体提取数据集进行特征提取，得到多尺度水体特征图，表示为：

F_i∈H_i×W_i×C_i，

其中，H_i,W_i,C_i分别表示第i个特征提取层输出的特征图的高、宽和通道数。

本实施例通过残差连接使得卷积神经网络中的浅层特征得以向更深层的网络层中传递，可以有效避免梯度爆炸或梯度消失。

本实施例中，i＝1,2,3,4。

本实施例中，对得到的多尺度水体特征图进行空间注意力计算得到对应的空间注意力图，并采用得到的空间注意力图对水体特征图进行加权，得到加权后的空间注意力特征图，具体实现过程如下：

对水体特征图F_i进行平均池化和最大池化：

F_imax＝MaxPool(F_i),F_iavg＝AvgPool(F_i)，

其中，MaxPool(·)和AvgPool(·)分别表示在通道维度上对特征图做平均池化和最大池化，F_imax和F_iavg的形状均为H_i×W_i×1；

对平均池化和最大池化操作后的特征图进行级联和卷积，得到空间注意力图，表示为：

其中，Concat(·)表示级联操作，Conv_7×7表示7×7的卷积操作，σ(·)表示Sigmoid激活函数，的形状为H_i×W_i×1；

采用对水体特征图F_i加权，得到加权后的空间注意力特征图，表示为：

其中，⊙表示像素相乘。

上述具体实现过程可参见图2的空间注意力模块架构。

本实施例中，对得到的多尺度水体特征图进行自注意力计算得到对应的自注意力图，并采用得到的自注意力图对水体特征图进行加权，得到加权后的自注意力特征图，具体实现过程如下：

对水体特征图进行重塑，表示为：

X_i＝reshape(F_i)＝[x_i1,x_i2,...,x_iN]，其中，N＝H_i×W_i。

预设三个矩阵进而生成查询矩阵Q，键矩阵K和值矩阵V：

计算所有查询矩阵和键矩阵位置对之间的相似性作为权重给值矩阵赋值：

F_i ^self＝ρ(Q_iK_i ^T)V_i；

其中，ρ(·)是归一化函数，用来表示查询特征和键特征之间的相似性。

一般来说，采用softmax函数来作为归一化函数：

ρ(Q_iK_i ^T)＝softmax_row(Q_iK_i ^T)，

其中，softmax_row(·)表示对于矩阵Q_iK_i ^T的每一行做归一化。

上述具体实现过程可参见图3的自注意力模块架构。

本实施例中，将加权后的空间注意力特征图和加权后的自注意力特征图进行级联，得到最终的特征图，表示为：

F_i ^final＝Concat(F_i ^spatial,F_i ^self)；

其中，Concat(·)表示特征的级联操作。

本实施例中，将得到的最终的特征图恢复到原始图像大小，作为预测结果输出，包括：

通过上采样将F_i ^final恢复到原始图像大小，并使用1×1卷积输出最终的预测结果。

本实施例中，通过反向传播的方式更新网络参数。

本实施例中，设定最大迭代次数为200次。

基于相同的发明构思，本发明还提供一种遥感图像水体提取装置，包括：

训练数据获取模块，用于对所获取的遥感图像数据集进行增强处理，得到水体提取数据集；

模型训练模块，用于基于空间注意力机制和自注意力机制构建深度卷积神经网络，以水体提取数据集为输入，以提取的水体特征为输出，对所构建的深度卷积神经网络进行训练，得到训练好的预测模型；

预测模块，用于基于训练好的预测模型对实时获取的遥感图像进行水体提取，得到水体提取结果。

本发明的一个实施例中，模型训练模块具体包括：

特征提取模块，用于对水体提取数据集进行特征提取，得到多尺度水体特征图；

空间注意力模块，用于对提取的多尺度水体特征图进行空间注意力计算得到对应的空间注意力图，并采用得到的空间注意力图对水体特征图进行加权，得到加权后的空间注意力特征图；

自注意力模块，用于对得到的多尺度水体特征图进行自注意力计算得到对应的自注意力图，并采用得到的自注意力图对水体特征图进行加权，得到加权后的自注意力特征图；

特征融合模块，用于将加权后的空间注意力特征图和加权后的自注意力特征图进行级联，得到最终的特征图；

结果输出模块，用于将得到的最终的特征图恢复到原始图像大小，作为预测结果输出；

参数更新模块，用于计算预测结果与真实标注的水体区域之间的损失，更新所构建的深度卷积神经网络参数。

本实施例中，空间注意力模块结构及其数据处理流程如图2所示。

本实施例中，自注意力模块结构及其数据处理流程如图3所示。

本实施例中，特征融合模块结构及其数据处理流程如图4所示。

值得指出的是，该装置实施例是与上述方法实施例对应的，上述方法实施例的实现方式均适用于该装置实施例中，并能达到相同或相似的技术效果，故不在此赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种遥感图像水体提取方法，其特征在于，包括：

获取包含水体区域的遥感图像数据集并标注水体区域；

2.根据权利要求1所述的一种遥感图像水体提取方法，其特征在于，对所述遥感图像数据集进行增强处理，得到水体提取数据集，包括：

3.根据权利要求1所述的一种遥感图像水体提取方法，其特征在于，所述基于空间注意力机制和自注意力机制构建深度卷积神经网络，以水体提取数据集为输入，以提取的水体特征为输出，对所构建的深度卷积神经网络进行训练，得到训练好的预测模型，包括：

4.根据权利要求3所述的一种遥感图像水体提取方法，其特征在于，对所述水体提取数据集进行特征提取，得到多尺度水体特征图，包括：

5.根据权利要求4所述的一种遥感图像水体提取方法，其特征在于，设置4个特征提取层，得到4个尺度的水体特征图。

6.根据权利要求3所述的一种遥感图像水体提取方法，其特征在于，将所述最终的特征图恢复到原始图像大小，作为预测结果输出，包括：

7.根据权利要求3所述的一种遥感图像水体提取方法，其特征在于，所述更新所构建的深度卷积神经网络参数，包括：

通过反向传播的方式更新网络参数。

8.根据权利要求3所述的一种遥感图像水体提取方法，其特征在于，所述最大迭代次数设定为200次。

9.一种遥感图像水体提取装置，其特征在于，包括：

10.根据权利要求9所述的一种遥感图像水体提取装置，其特征在于，所述模型训练模块包括：