CN114387512B

CN114387512B - 基于多尺度特征融合与增强的遥感影像建筑物提取方法

Info

Publication number: CN114387512B
Application number: CN202111627701.4A
Authority: CN
Inventors: 陈一祥; 成行; 姚帅
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2024-04-19
Anticipated expiration: 2041-12-28
Also published as: CN114387512A

Abstract

本发明公开了一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，包括：采集目标区域的遥感影像并进行预处理，将预处理后的遥感影像输入预构建的建筑物提取模型中进行建筑物提取；其中，建筑物提取模型的构建过程包括：采用编码‑解码结构构建深度学习网络模型，深度学习网络模型包括编码阶段和解码阶段，并且在编码阶段和解码阶段之间引入多尺度特征融合模块和双通道池化加权模块；本发明能够提高建筑物语义分割的准确率的同时，大大减小了网络模型参数量，提高了训练和识别的速度；进而提升建筑物提取模型的性能，提升建筑物提取的精度。

Description

基于多尺度特征融合与增强的遥感影像建筑物提取方法

技术领域

本发明涉及一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，属于遥感图像识别技术领域。

背景技术

传统的计算机视觉技术进行高分遥感影像地面建筑物识别提取主要是利用建筑物的多边形形状信息、颜色和纹理特征，随后使用传统机器学习分类算法(AdaBoost、支持向量机、随机森林等)对这些特征进行分类，并完成建筑物的提取。但是真实环境下，城市建筑物有着复杂多变的纹理和颜色，以及会受到阴影的遮挡，这些因素使上述算法在复杂的建筑物提取场景下处理能力不足。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，在提高建筑物语义分割的准确率的同时，减小了网络模型参数量的大小，提高了模型训练速度和识别速度。

为达到上述目的，本发明是采用下述技术方案实现的：

第一方面，本发明提供了一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，包括：

采集目标区域的遥感影像并进行预处理，将预处理后的遥感影像输入预构建的建筑物提取模型中进行建筑物提取；

其中，所述建筑物提取模型的构建过程包括：

采集目标区域的遥感影像，并人工标注遥感影像中建筑物区域得到对应的建筑物标签；

将遥感影像和建筑物标签按照预设比例划分为独立的训练样本、验证样本以及测试样本，以构成样本数据集，并对样本数据集进行预处理；

采用编码-解码结构构建深度学习网络模型，所述深度学习网络模型包括编码阶段和解码阶段，并且在编码阶段和解码阶段之间引入多尺度特征融合模块和双通道池化加权模块；

通过训练样本对网络模型进行训练，通过验证样本对训练后的网络模型进行验证及模型选择；

将测试样本输入选择后的网络模型中，根据模型输出的预测建筑物标签与真实建筑物标签进行比较得到精度指标；

若精度指标满足预设要求，则将选择后的网络模型作为建筑物提取模型。

可选的，所述编码阶段包括：

采用DenseNet-45网络作为编码器从输入的样本数据中提取含有深层以及浅层语义特征的特征图；

其中，所述编码器包括5个串联的dense block，每个dense block输出的特征图依次记为C₁、C₂、C₃、C₄、C₅，所述特征图的尺寸分别为样本数据的1/2、1/4、1/8、1/16、1/32。

可选的，所述多尺度特征融合模块获取编码器末端dense block输出的特征图C₅；

所述多尺度特征融合模块为四个分支并行结构；其中，前两个所述分支分别按照等差和等比的规律来组合不同扩张率的空洞卷积来获取特征图C₅的不同尺度特征；后两个所述分支分别使用平均池化和最大池化来提取特征图C₅的突出特征和平均特性；

四个所述分支末端均经过BN层和Relu激活函数层来调整多尺度特征融合模块输出的数据分布；对四个所述分支的输出进行通道拼接，将拼接结果通过一个1*1的卷积层来融合特征以及调整输出特征图的数量，从而输出特征图C₅ ^′。

可选的，所述解码阶段包括：

获取特征图C₁、C₂、C₃、C₄、C₅ ^′，通过上采样逐步将特征图恢复为样本数据的尺寸，并通过4个双通道池化加权模块辅助上采样；

所述4个双通道池化加权模块分别记为第一双通道池化加权模块、第二双通道池化加权模块、第三双通道池化加权模块和第四双通道池化加权模块；

所述上采样过程如下：

将特征图C₄和C₅ ^′分别作为第四双通道池化加权模块的两个输入，将第四双通道池化加权模块的输出进行2倍上采样，得到特征图P₄；

将特征图C₃和P₄分别作为第三双通道池化加权模块的两个输入，将第三双通道池化加权模块的输出进行2倍上采样，得到特征图P₃；

将特征图C₂和P₃分别作为第二双通道池化加权模块的两个输入，将第二双通道池化加权模块的输出进行2倍上采样，得到特征图P₂；

将特征图C₁和P₂分别作为第一双通道池化加权模块的两个输入，将第一双通道池化加权模块的输出进行2倍上采样，得到特征图P₁；

将特征图P₁进行2倍上采样的到样本数据的尺寸的特征图P，特征图P经过像素分类器输出单通道特征分割结果。

可选的，所述双通道池化加权模块包括上分支和下分支；

所述上分支获取编码器输出的特征图，并对特征图进行全局平均池化操作得到通道级别的全局特征；

对全局特征通过一次全连接操作、ReLU激活函数激活、二次全连接操作、Sigmoid激活函数激活，学习通道之间的相互关系，并计算出不同通道的权重；

将得到的权重与解码阶段上采样输出的特征图相乘获取增强特征图；

对增强特征图进行1*1卷积操作实现通道之间的融合以及调整输出通道数量；

所述下分支获取编码器输出的特征图，并对特征图进行局部最大池化和局部平均池化操作得到通道级别的局部特征；

将局部特征进行逐通道相加学习，将学习到的权重通过1*1卷积操作进行融合以及调整输出通道数；将融合结果通过Sigmoid激活函数激活，与解码阶段上采样输出的特征图相乘来选择性的聚焦每个像素点；

对上分支和下分支的输出进行逐通道相加并通过1*1卷积操作进行融合得到双通道池化加权模块的输出。

可选的，所述网络模型的训练过程包括优化函数和损失函数，所述优化函数为Adam，学习率为0.0001；所述损失函数为交叉熵损失函数；通过计算损失函数误差，采用梯度反向传播算法不断优化调整网络权值和偏置，当损失函数误差收敛，则训练完成。

第二方面，本发明提供了一种基于多尺度特征融合与增强的遥感影像建筑物提取装置，所述提取装置包括：

数据获取模块：用于采集目标区域的遥感影像并进行预处理；

建筑物提取模块：用于将预处理后的遥感影像输入预构建的建筑物提取模型中进行建筑物提取；

其中，所述建筑物提取模型的构建过程包括：

第三方面，本发明提供了一种基于多尺度特征融合与增强的遥感影像建筑物提取装置，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行根据上述任一项所述方法的步骤。

第四方面，本发明提供了计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现上述任一项所述方法的步骤。

与现有技术相比，本发明所达到的有益效果：

本发明提供的一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，通过构建建筑物提取模型对遥感影像进行建筑物提取；在建筑物提取模型的构建过程中，通过编码器获取含有深层以及浅层语义特征的特征图，将编码器末端的输出的特征图输入到多尺度特征融合模块，获得新的特征图；将新的特征图进行双线性插值上采样之后的特征图输入到双通道池化加权模块，再将编码器输出的对应的特征图输入双通道池化加权模块，获得合并特征图，再合并特征图，再次进行双线性差值上采样恢复到原图大小；通过上述方法，能够提高建筑物语义分割的准确率的同时，大大减小了网络模型参数量，提高了训练和识别的速度，进而提升建筑物提取模型的性能，从而提升建筑物提取的准确性。

附图说明

图1是本发明实施例提供的一种基于多尺度特征融合与增强的遥感影像建筑物提取方法流程图；

图2是本发明实施例提供的建筑物提取模型的构建过程流程图；

图3是本发明实施例提供的编码阶段和解码阶段流程示意图；

图4是本发明实施例提供的多尺度特征融合模块的原理示意图；

图5是本发明实施例提供的双通道池化加权模块的原理示意图；

图6是本发明实施例提供的编码器消融实验效果示意图；

图7是本发明实施例提供的多尺度特征融合模块消融实验效果示意图；

图8是本发明实施例提供的双通道池化加权模块消融实验效果示意图；

图9是本发明实施例提供的建筑物提取模型实验效果示意图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

实施例一：

如图1所示，本发明实施例提供了一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，包括：

S1、采集目标区域的遥感影像并进行预处理；

S2、将预处理后的遥感影像输入预构建的建筑物提取模型中进行建筑物提取。

如图2所示，建筑物提取模型的构建过程包括：

S101、采集目标区域的遥感影像，并人工标注遥感影像中建筑物区域得到对应的建筑物标签。

S102、将遥感影像和建筑物标签按照预设比例划分为独立的训练样本、验证样本以及测试样本，以构成样本数据集，并对样本数据集进行预处理。

S103、采用编码-解码结构构建深度学习网络模型，深度学习网络模型包括编码阶段和解码阶段，并且在编码阶段和解码阶段之间引入多尺度特征融合模块和双通道池化加权模块。

S104、通过训练样本对网络模型进行训练，通过验证样本对训练后的网络模型进行验证及模型选择；

网络模型的训练过程包括优化函数和损失函数，优化函数为Adam，学习率为0.0001；损失函数为交叉熵损失函数；通过计算损失函数误差，采用梯度反向传播算法不断优化调整网络权值和偏置，当损失函数误差收敛，则训练完成。

S105、将测试样本输入选择后的网络模型中，根据模型输出的预测建筑物标签与真实建筑物标签进行比较得到精度指标。

S106、若精度指标满足预设要求，则将选择后的网络模型作为建筑物提取模型。

具体的，编码阶段和解码阶段如图3所示。

编码阶段包括：

其中，编码器包括5个串联的dense block，每个dense block输出的特征图依次记为C₁、C₂、C₃、C₄、C₅，特征图的尺寸分别为样本数据的1/2、1/4、1/8、1/16、1/32。

编码器的效果图如图6所示，图中Image为遥感影像，Ground Truth为建筑物标签，Proposed(k＝24)，Proposed(VGG-19)，Proposed(k＝16)，Proposed(k＝32)，Proposed(k＝48)为搭载不同编码器的模型输出的效果图。

如图3所示，多尺度特征融合模块获取编码器末端dense block输出的特征图C₅；

多尺度特征融合模块为四个分支并行结构；其中，前两个分支分别按照等差和等比的规律来组合不同扩张率的空洞卷积来获取特征图C₅的不同尺度特征；后两个分支分别使用平均池化和最大池化来提取特征图C₅的突出特征和平均特性；

四个分支末端均经过BN层和Relu激活函数层来调整多尺度特征融合模块输出的数据分布；对四个分支的输出进行通道拼接，将拼接结果通过一个1*1的卷积层来融合特征以及调整输出特征图的数量，从而输出特征图C₅ ^′。

验证：如图7所示，图中Image为遥感影像，Ground Truth为建筑物标签，Baseline+MSSFM为添加多尺度特征融合模块的效果图，Baseline+ASPP为添加了传统ASPP模型的效果图，Baseline为直接效果图；通过在WHU数据集上进行对比消融实验，添加多尺度特征融合模块之后对大型建筑物内部以及边缘分割的完整性和连续性更好，减少了“虫洞”现象。对于大型建筑物旁边的非建筑物的分割更加准确，在一定程度上避免了错误分割，MIOU、召回率、精度以及F1-Score均有所提高。同时添加多尺度特征融合模块比添加ASPP模块具有更好的性能，MIOU提升了0.89％。可以看出我们的多尺度特征融合模块可以很好的起到融合多通道特征扩大感受野的作用。

解码阶段包括：

4个双通道池化加权模块分别记为第一双通道池化加权模块、第二双通道池化加权模块、第三双通道池化加权模块和第四双通道池化加权模块；

上采样过程如下：

如图5所示，双通道池化加权模块包括上分支和下分支；

上分支获取编码器输出的特征图，并对特征图进行全局平均池化操作得到通道级别的全局特征；

下分支获取编码器输出的特征图，并对特征图进行局部最大池化和局部平均池化操作得到通道级别的局部特征；

验证：如图8-图9所示，图中Image为遥感影像，Ground Truth为建筑物标签，Proposed为添加双通道池化加权模块效果图，Proposed_Without_DAPWM为未添加双通道池化加权模块效果图；MA-FCN，DeeplabV3+、U-Net、Segnet、FCN为各种网络效果图。

在WHU数据集上进行实验将含有双通道池化加权模块与不含双通道池化加权模块的同一模型进行比对，分析建筑物分割性能。同时为了证明该模块的通用性，将该模块添加到U-net网络中与原始的U-net网络进行比对。实验表明双通道注意力池化加权模块对于模型的整体分割精度提升较大，添加前后建筑物分割MIOU指标提升了4.61％，在召回率、精度以及F1-Score方面也有较大提升。同时在U-net网络中添加了该模块也相较于添加前有更好的性能，其中MIOU提升了0.76％，可见该模块拥有较好的通用性能。

实施例二：

本发明实施例提供了一种基于多尺度特征融合与增强的遥感影像建筑物提取装置，提取装置包括：

其中，建筑物提取模型的构建过程包括：

采用编码-解码结构构建深度学习网络模型，深度学习网络模型包括编码阶段和解码阶段，并且在编码阶段和解码阶段之间引入多尺度特征融合模块和双通道池化加权模块；

实施例三：

本发明实施例提供了一种基于多尺度特征融合与增强的遥感影像建筑物提取装置，包括处理器及存储介质；

存储介质用于存储指令；

处理器用于根据指令进行操作以执行根据实施例一所述方法的步骤。

实施例四：

本发明提供了计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现实施例一所述方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，其特征在于，包括：

其中，所述建筑物提取模型的构建过程包括：

若精度指标满足预设要求，则将选择后的网络模型作为建筑物提取模型；

其中，所述编码阶段包括：

其中，所述编码器包括5个串联的dense block，每个dense block输出的特征图依次记为C₁、C₂、C₃、C₄、C₅，所述特征图的尺寸分别为样本数据的1/2、1/4、1/8、1/16、1/32；

所述多尺度特征融合模块获取编码器末端dense block输出的特征图C₅；

四个所述分支末端均经过BN层和Relu激活函数层来调整多尺度特征融合模块输出的数据分布；对四个所述分支的输出进行通道拼接，将拼接结果通过一个1*1的卷积层来融合特征以及调整输出特征图的数量，从而输出特征图C₅ ^′；

所述解码阶段包括：

所述上采样过程如下：

将特征图P₁进行2倍上采样的到样本数据的尺寸的特征图P，特征图P经过像素分类器输出单通道特征分割结果；

所述双通道池化加权模块包括上分支和下分支；

2.根据权利要求1所述的一种基于多尺度特征融合与增强的遥感影像建筑物提取方法，其特征在于，所述网络模型的训练过程包括优化函数和损失函数，所述优化函数为Adam，学习率为0.0001；所述损失函数为交叉熵损失函数；通过计算损失函数误差，采用梯度反向传播算法不断优化调整网络权值和偏置，当损失函数误差收敛，则训练完成。

3.一种基于多尺度特征融合与增强的遥感影像建筑物提取装置，其特征在于，采用如权利要求1-2任一项所述方法的步骤，所述提取装置包括：

其中，所述建筑物提取模型的构建过程包括：

4.一种基于多尺度特征融合与增强的遥感影像建筑物提取装置，其特征在于，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行根据权利要求1-2任一项所述方法的步骤。

5.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-2任一项所述方法的步骤。