CN113436198A

CN113436198A - 一种协同图像超分辨率重建的遥感图像语义分割方法

Info

Publication number: CN113436198A
Application number: CN202110658772.4A
Authority: CN
Inventors: 张倩; 黄志锋; 杨光; 张桂戌
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2021-06-15
Filing date: 2021-06-15
Publication date: 2021-09-24

Abstract

本发明公开了一种协同图像超分辨率重建的遥感图像语义分割方法，其特点是语义分割具体包括：训练数据集预处理；建立协同图像超分辨率重建的遥感图像语义分割神经网络模型；训练网络模型并保存最佳网络模型；模型推理，得到预测结果等步骤。本发明与现有技术相比具有使用低分辨率的遥感图像得到高精度语义分割结果，大大降低了计算成本，有效解决了高精度语义分割方法依赖于高分辨率的输入图像的问题，模型输出的高精确分割图像以及超分辨率重建图像为下一步应用提供了高质量数据。

Description

一种协同图像超分辨率重建的遥感图像语义分割方法

技术领域

本发明涉及遥感图像处理技术领域，尤其是一种协同图像超分辨率重建的遥感图像语义分割方法。

背景技术

作为遥感图像处理的基础任务之一，遥感图像分割为土地资源规划、城市建设管理、自然灾害救援等方面有着重要作用。深度学习快速发展的十年来，以深度卷积神经网络为代表的方法大大提高了遥感图像语义分割的效果。

目前，高精度语义分割方法都依赖于高分辨率的输入图像。但是，现有的遥感影像的分辨率较低，深度神经网络在低分辨率的输入中学习到的特征有限，无法满足深度卷积神经网络的学习要求。另外，机载或航天设备拍摄的图像通常受到地面采样区域、大气衰减和大气路径辐射等不同因素以及不同程度的影响，导致难获得高质量的高分辨率图像。获取高分辨率遥感图像的不但成本高昂，而且处理高分辨率遥感图像对计算资源的需求也很大。因此，如何使用低分辨率图像训练深度卷积神经网络获取高质量的语义分割图像具有挑战性。

发明内容

本发明的目的是针对现有技术的不足而提出的一种协同图像超分辨率重建的遥感图像语义分割方法，采用协同图像超分辨率重构的遥感图像语义分割神经网络模型，将待处理图像输入到训练好的模型中进行高精度遥感图像的分割，模型输出的高精确分割图像以及超分辨率重建图像，为遥感图像场景分类及目标检测识别的应用提供了高质量数据，较好解决了高精度语义分割依赖于高分辨率的输入图像以及图像处理占用大量计算资源的问题。

本发明的目的是这样实现的：一种协同图像超分辨率重建的遥感图像语义分割方法，其特点是遥感图像语义分割具体包括下述步骤：

步骤S1：训练数据集预处理

选择现有遥感影像数据集，对数据集中的训练集，通过随机水平翻转、随机垂直翻转、随机缩放和随机裁切操作对训练集中样本进行数据增强。

步骤S2：构建协同图像超分辨率重建的遥感图像语义分割神经网络模型

基于Pytorch机器学习库，构建协同图像超分辨率重建的遥感图像语义分割神经网络模型，该模型由五个部分组成，分别为：编码器(Encoder)、解码器(Decoder)、语义分割分支(SSB)、超分辨率分支(SRB)和结构相似性模块(SAB)。

步骤S3：网络模型训练

将增强后的训练集中的数据样本送入网络模型训练，训练过程中会保存在验证数据集中表现最好的网络模型。

步骤S4：遥感图像的语义分割

利用步骤S3保存的最佳网络模型进行遥感图像语义分割，输出高分辨率遥感图像以及高精确分割结果。

本发明与现有技术相比具有以下有益的技术效果：

1)构建的网络模型结合了超像素重建，使用低分辨率的遥感图像数据集也能训练高精度语义分割网络模型；

2)使用低分辨率遥感图像作为输入，计算成本低；

3)使用的结构相似性模块使超分辨率重建分支和语义分割分支相辅相成，输出的结果比单独对低分辨率图像进行超分辨率重建或语义分割好；

4)输出的结果是超分辨率重建后的高分辨率遥感图像以及高精确分割结果，为后续应用提供了高质量的数据源。

附图说明

图1为本发明构建的网络模型示意图；

图2为像素洗牌示意图；

图3为超分辨率重建分支结构示意图；

图4为实施例的模型实验结果的图像。

具体实施方式

参阅附图1，本发明的按下述步骤进行遥感图像语义分割的：

步骤S1：训练数据集预处理

基于Pytorch机器学习库，构建协同图像超分辨率重建的遥感图像语义分割神经网络模型，模型主要由编码器神经网络模型由五个部分组成，分别为：编码器(Encoder)、解码器(Decoder)、语义分割分支(SSB)、超分辨率分支(SRB)、结构相似性模块(SAB)。

步骤S3：网络模型训练

将增强后的训练集中的数据样本送入网络模型训练，训练过程中保存在验证数据集中表现最好的网络模型。

步骤S4：遥感图像的语义分割

所述步骤S2中构建的网络模型由五个部分组成，分别为：编码器(Encoder)、解码器(Decoder)、语义分割分支(SSB)、超分辨率分支(SRB)、结构相似性模块(SAB)。

所述的语义分割分支(SRB)在原有语义分割分支(SSB)的基础上又引入了超分辨率分支(SRB)，并且SSB和SRB共享一个解码器。

所述结构相似性模块(SAB)以语义分割分支组最后一层的输入(SSB)以及超分辨率重建分支(SRB)最后一层的输入作为该模块的输入，利用SSB和SRB中间特征图之间的结构相似性(SSIM)，引导训练过程中神经网络模型的SSB学习图像细节信息；同时也引导SRB学习图像高级语义信息，SAB仅在网络训练阶段使用。

以下通过具体实施例对本发明作进一步的详细说明。

实施例1

步骤S1：训练数据集预处理

本实例选择国际摄影测量与遥感协会(ISPRS)公开的Potsdam数据集建立遥感图像分割训练样本集、验证样本集和测试样本集。Potsdam数据集包含38张大小为6000×6000像素的图像，每张图像由红(R)，绿(G)，蓝(B)，近红外(IR)四个通道组成，每个通道等空间分辨率为5厘米。数据集中还有38张标注图像，遥感图像与标注图像之间一一对应。选择其中的5张图像作为验证集(编号分别为：3_13,4_12,5_12,6_12,7_12)，14张图片作为测试集(编号分别为：2_13,2_14,3_13,3_14,4_13,4_14,4_15,5_13,5_14,5_15,6_13,6_14,6_15,7_13)，剩余的19张图像作为训练集。

对训练集中原始图像及标注图像进行预处理，用步长为300像素的滑动窗口将图片切割为多个大小为512×512像素的小图像。对切割后的小图像进行随机水平翻转、随机垂直翻转和随机缩放操作增强训练数据集样本多样性。

参阅附图1，本发明构建的协同图像超分辨率重建的遥感图像语义分割神经网络模型主要由编码器神经网络模型由五个部分组成，分别为：编码器(Encoder)、解码器(Decoder)、语义分割分支(SSB)、超分辨率分支(SRB)、结构相似性模块(SAB)。

本实例使用在ImageNet数据集上预训练的ResNet-50作为编码器，去除最后的池化成以及所有全连接层，其余部分不做改动。

参阅附图2，解码器由多个上采样层组成，本实施例中使用4层像素重组(pixelshuffle)上采样层。

语义分割分支使用目标上下文表示(OCR)分割。

参阅附图3，超分辨率分支由多个超分辨率上采样层组成。

结构相似性模块，结构相似性模块能利用超分辨率分支的细节信息解决语义分割分支中缺乏图像细节信息的问题；利用语义分割分支的高级语义特征帮助超分辨率分支解决忽略高级语义特征的问题。

步骤S3：网络模型训练

本实施例训练网络时使用Adam优化器，优化器参数设定为β₁＝0.9,β₂＝0.999,学习率初始值为0.001，学习率衰减策略为多项式衰减，每次更新参数后学习率的衰减率为

除了编码器之外，本实施例的神经网络参数初始化均使用Kaiming初始化。本实施例使用两张GeForce RTX 2080Ti显卡，神经网络训练200个时期(Epoch)。

使用总体准确率(OA)、平均F1得分(F1)、平均召回率(recall)和平均交并比(mIoU)四个常见的评估指标对模型语义分割性能进行了量化；使用结构相似性(SSIM)和峰值信噪比(PSNR)两个常见的图像超分辨率评估指标对模型超分辨率重建性能进行了量化。

所述总体准确率(OA)由下述1式计算：

所述平均F1得分(F1)由下述2式计算：

所述平均召回率(recall)由下述3式计算：

所述平均交并比(mIoU)由下述4式计算：

所述结构相似性(SSIM)由下述5式计算：

所述峰值信噪比(PSNR)由下述6式计算：

其中，TP、TN、FP和FN分别表示在SSB的预测中被正确分类的正例、被正确分类的负例、被错误分类的正例和被错误分类的负例；μ_x表示x的平均值；μ_y表示y的平均值；σ_x为x的方差；σ_y为y的方差；σ_xy为x和y的协方差；c是常量，分别为c₁＝0.01²,c₂＝0.03²；x和y分别为结构相似性模块的输入；MSE(x,y)是超分辨率重建分支的预测和标签的均方差损失；Max_I是输入图像的最大值，在本实施例中Max_I＝1。

训练过程中，保存在测试集中表现最好的模型作为最佳模型。

步骤S4：输出结果

将待处理的遥感图像输入训练好的神经网络模型中，得到语义分割结果。

参阅附图4，将待处理的遥感图像(4a)送入步骤S3中保存的最佳网络模型，经过网络模型处理后得到语义分割结果图(4b)以及输入图像的超分辨率重建结果图(4c)。

采用本发明构建的神经网络与BiseNet、DeeplabV3+和EaNet相比，其参数量更少，运行速度更快，各网络的参数量、推理时间和浮点运算数比较详见下表1所示：

表1各网络的参数量、推理时间和浮点运算数比较

本发明构建的神经网络在总体准确率(OA)，平均F1得分(F1)，平均召回率(recall)，平均交并比(mIoU)上均优于其他模型，各网络在ISPRS Potsdam测试集上的评价指标值详见下表2所示：

表2各网络在ISPRS Potsdam测试集上的评价指标值

以上的实施例对本发明所提出的一种协同图像超分辨率重建的遥感图像语义分割方法进行了详细介绍。对于本领域的研究人员，依据本发明的思想，在具体实施方式以及应用范围上均会有改变之处，例如网络模型的编码器可替换成AlexNet、VGG、EfficientNet等编码器提取特征，网络的语义分割分支可以替换成Deeplabv3+，EANet等，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种协同图像超分辨率重建的遥感图像语义分割方法，其特征在于遥感图像语义分割具体包括下述步骤：

步骤S1：训练数据集的预处理

选择现有遥感影像数据集，对数据集中的训练集，通过随机的水平翻转、垂直翻转、缩放和裁切，对训练集中的样本进行数据增强；

步骤S2：神经网络模型的构建

基于Pytorch机器学习库，构建协同图像超分辨率重建的遥感图像语义分割神经网络模型；

步骤S3：网络模型的训练

将增强后的训练集中的数据样本送入神经网络模型训练，训练过程中保存在验证数据集中表现最好的网络模型；

步骤S4：遥感图像的语义分割

利用步骤S3保存的最佳网络模型进行遥感图像语义分割并输出结果。

2.根据权利要求1所述协同图像超分辨率重建的遥感图像语义分割方法，其特征在于所述步骤S2中构建的神经网络模型由编码器、解码器、语义分割分支、超分辨率分支和结构相似性模块组成。

3.根据权利要求2所述协同图像超分辨率重建的遥感图像语义分割方法，其特征在于在原有语义分割分支的基础上引入超分辨率分支，且原有语义分割分支与新引入的超分辨率分支共享编码器和解码器。

4.根据权利要求2所述协同图像超分辨率重建的遥感图像语义分割方法，其特征在于所述结构相似性模块以语义分割分支组最后一层的输入，以及超分辨率重建分支最后一层的输入作为结构相似性模块的输入，利用语义分割分支和超分辨率分支中间特征图的结构相似性，在训练过程中引导语义分割分支学习图像细节信息，同时也引导超分辨率分支学习图像高级语义信息，所述结构相似性模块仅在网络训练阶段使用。