CN115115647A

CN115115647A - 一种融合注意力机制和残差aspp的遥感影像语义分割方法

Info

Publication number: CN115115647A
Application number: CN202210691801.1A
Authority: CN
Inventors: 刘润瑞; 周侗; 吕亚乔; 秦广辉; 徐林飞; 陶菲
Original assignee: Nantong University
Current assignee: Nantong University
Priority date: 2022-06-17
Filing date: 2022-06-17
Publication date: 2022-09-27
Anticipated expiration: 2042-06-17
Also published as: CN115115647B

Abstract

本发明公开一种融合注意力机制和残差ASPP的遥感影像语义分割方法，包括以下方法；步骤S1:构建融合注意力机制和残差ASPP的神经网络；步骤S2:训练步骤S1中构建的融合注意力机制和残差ASPP的神经网络；步骤S3:利用步骤S2中训练好的模型，进行遥感影像语义分割，具体的，通过将获取的遥感图像输入到步骤S2训练好的融合注意力机制和残差ASPP的语义分割模型中进行遥感图像语义分割。本发明采用注意力机制与残差结构对现有模型进行改进，提出了一种融合注意力机制和残差ASPP的遥感影像语义分割算法模型，其采用训练集和验证集对该模型进行训练、验证，高效、准确地分割遥感影像的地物类别，实现注意力机制与残差结构在ASPP模型之中的嵌入式使用，提高语义分割的准确率。

Description

一种融合注意力机制和残差ASPP的遥感影像语义分割方法

技术领域

本发明涉及一种融合注意力机制和残差ASPP的遥感影像语义分割方法，属于自然资源管理和城市规划领域。

背景技术

随着遥感技术的发展，遥感影像提供的覆盖范围越来越广，空间分辨率越来越高，近年来遥感图像的分辨率已经达到了厘米级别。技术进步产生了更多的冗余图像信息和噪声，遥感影像语义分割的任务变得更有挑战性,传统的语义分割方法只考虑每个像素的数字值，与周围的其他像素分开，存在分类精度低和难以适应复杂样例的局限性。

发明内容

针对上述现有技术存在的问题，本发明提供一种融合注意力机制和残差ASPP的遥感影像语义分割方法，从而解决上述技术问题。

为了实现上述目的，本发明采用的技术方案是：一种融合注意力机制和残差ASPP的遥感影像语义分割方法，其特征在于，包括以下方法；

步骤S1:构建融合注意力机制和残差ASPP的神经网络；

步骤S2:训练步骤S1中构建的融合注意力机制和残差ASPP的神经网络；

步骤S3:利用步骤S2中训练好的模型，进行遥感影像语义分割，具体的，通过将获取的遥感图像输入到步骤S2训练好的融合注意力机制和残差ASPP的语义分割模型中进行遥感图像语义分割。

进一步的，所述步骤S1中融合注意力机制和残差ASPP的神经网络的构建以编码器-解码器作为基础结构，其中模型内融合有ASPP模块，注意力机制和残差结构；。

进一步的，所述编码器利用注意力机制和残差结构对所述ASPP模块进行了改进进而形成包含5个空洞卷积注意力单元和1个残差单元的残差ASPP模块；所述解码器用于接收编码器输出的浅层和深层特征，具体的，将浅层特征输入注意力模块，并使用1×1卷积进行处理，将深层特征进行8倍上采样处理，然后将处理后的浅层特征与深层特征融合，融合后的特征用3×3卷积进行处理，进行8倍上采样处理，经过卷积与上采样处理最终得到网络的预测依据。

进一步的，所述注意力机制采用Dual Attention(DA)模块来预测道路，荒地和森林；通过采用The convolutional block attention module(CBAM)模块来预测背景，水体，建筑。

进一步的，所述步骤S2的具体方法为：

S21:从开源的遥感影像数据集(LoveDA)获取遥感影像的数据集，并将其按8：1：1的比例划分为训练集、验证集和测试集。

S22:将数据预处理后的遥感图像输入步骤S1构建的融合注意力机制和残差ASPP的模型中进行训练。

进一步的，所述步骤S22的具体方法为：

S221:遥感图像输入融合注意力机制和残差ASPP的语义分割网络模型中，前向传播获得语义分割网络模型输出的遥感影像样本地物类型的形状信息；

S222:采用损失函数计算预测结果与实际结果之间的损失并通过反向传播算法来不断优化模型的参数，损失函数使用DiceLoss+CELoss；

其损失函数计算公式如下:

Total Loss＝L_CE+L_dice (5)。

本发明的有益效果是：与现有技术相比，本发明采用注意力机制与残差结构对现有模型进行改进，提出了一种融合注意力机制和残差ASPP的遥感影像语义分割算法模型。采用训练集和验证集对该模型进行训练、验证，高效、准确地分割遥感影像的地物类别，实现注意力机制与残差结构在ASPP模型之中的嵌入式使用，提高语义分割的准确率。

附图说明

图1为本发明提供的一种融合注意力机制和残差ASPP的遥感影像语义分割方法流程图；

图2是本发明实施例中构建的融合注意力机制和残差ASPP的遥感影像语义分割算法模型的结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面通过附图及实施例，对本发明进行进一步详细说明。但是应该理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限制本发明的范围。

除非另有定义，本文所使用的所有的技术术语和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同，本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

如图1所示，本实施例提供的一种融合注意力机制和残差ASPP的遥感影像语义分割方法(RAANet)，包括以下步骤：

S1.构建融合注意力机制和残差ASPP的神经网络。

基于编码器-解码器的基础架构，在编码器中采用Xception NetWork作为骨干网络，将输入的特征分为浅层特征和深层特征。其深层特征通过一个注意力模块(CBAM),再将其分别输入到残差单元和五个空洞卷积率为3，6，12，18，24的注意力空洞卷积单元，将每个空洞卷积注意力单元的输出与残差单元的输出进行矩阵加法，再将五个空洞卷积注意力单元的结果堆叠起来，然后1×1卷积整合特征并输出。

在解码器中，先将编码器输出的浅层特征输入至注意力模块中，用1×1卷积整合特征，再将编码器中最后输出的深层特征进行8倍上采样，堆叠组合后经过卷积核大小为3×3的卷积层，再进行8倍上采样。

S2.训练融合注意力机制和残差ASPP的神经网络。

S21.从开源的LoveDA中获取遥感影像的数据集，并将其按8：1：1的比例划分为训练集、验证集和测试集。

S22.选用Adam作为优化器，并设置等间隔调整学习率，调整间隔为1，学习率调整倍数为0.92，损失函数使用DiceLoss+CELoss。

其损失函数计算公式如下:

Total Loss＝L_CE+L_dice (5)。

S23.将从数据集中获取的数据输入至S1中所构建的融合注意力机制和残差ASPP的神经网络模型之中，然后再利用反向传播算法，对模型进行训练。

S3.利用训练好的融合注意力机制和残差ASPP的神经网络进行遥感图像语义分割。

S31.将遥感图像输入步骤S2训练好的融合注意力机制和残差ASPP的语义分割模型中进行遥感图像语义分割。进行语义分割后，利用精度，召回率，和交并比三个指标对模型进行评估。各地物类型的评价结果如表1所示，对比PSPNet，U-Net和DeeplabV3plus都有较大提升，由此可见本模型在遥感影像语义分割上效果出色。

表1

本发明实施例中所采集的遥感影像样本来自LovaDA数据集，遥感影像数据共包含5987张3米分辨率的遥感影像。具体环境为Pycharm和ArcGIS软件平台以及GeForce RTX3060GPU等硬件平台，利用Python及其相关库进行开发实验，如Numpy、Pytorch、PIL、Opencv等。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等，均应包含在本发明的保护范围之内。

Claims

1.一种融合注意力机制和残差ASPP的遥感影像语义分割方法，其特征在于，包括以下方法；

步骤S1:构建融合注意力机制和残差ASPP的神经网络；

2.根据权利要求1所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法，其特征在于，所述步骤S1中融合注意力机制和残差ASPP的神经网络的构建以编码器-解码器作为基础结构，其中模型内融合有ASPP模块，注意力机制和残差结构。

3.根据权利要求2所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法，其特征在于，所述编码器利用注意力机制和残差结构对所述ASPP模块进行了改进，进而形成包含5个空洞卷积注意力单元和1个残差单元的残差ASPP模块；所述解码器用于接收编码器输出的浅层和深层特征，具体的，将浅层特征输入注意力模块，并使用1×1卷积进行处理，将深层特征进行8倍上采样处理，然后将处理后的浅层特征与深层特征融合，融合后的特征用3×3卷积进行处理，进行8倍上采样处理，经过卷积与上采样处理最终得到网络的预测依据。

4.根据权利要求2所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法，其特征在于，所述注意力机制采用DualAttention(DA)模块来预测道路，荒地和森林；通过采用The convolutional block attention module(CBAM)模块来预测背景，水体，建筑。

5.根据权利要求1所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法，其特征在于，所述步骤S2的具体方法为：

6.根据权利要求5所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法，其特征在于，所述步骤S22的具体方法为：

其损失函数计算公式如下:

Total Loss＝L_CE+L_dice (5)

上式中，N代表样本的总数，ti代表目标值；yi代表预测值；I代表目标值乘预测值的和；U代表；U表示预测值和目标值的和，ε表示平滑系数，在本发明中取1e-5,K表示类别数，

是预测的可能类别分布，y是真实类别分布。