CN117115563A

CN117115563A - 基于区域语义感知的遥感土地覆盖分类方法及系统

Info

Publication number: CN117115563A
Application number: CN202311352076.6A
Authority: CN
Inventors: 郑先伟; 马启源; 岳林蔚; 宦麟茜; 熊汉江
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2023-10-19
Filing date: 2023-10-19
Publication date: 2023-11-24

Abstract

本发明公开了一种基于区域语义感知的遥感土地覆盖分类方法及系统，将遥感影像输入语义分割网络，经过特征提取获得特征图F，再经过语义分割网络的分类层获得类别预测概率图；所述语义分割网络，包括多尺度连续上下文特征编码模块和密集特征聚合解码模块；为缓解遥感图像中类内差异性和类间相似性对网络分类的干扰，本发明提出了类内相似性损失函数和类间差异性损失函数，分别通过增强同类语义超像素平均特征间的相似性和不同类超像素平均特征间的差异性来提升特征的类内一致性和类间可区分性，从而改善遥感土地覆盖分类的效果。

Description

基于区域语义感知的遥感土地覆盖分类方法及系统

技术领域

本发明属于遥感影像处理技术领域，涉及一种遥感土地覆盖分类方法及系统，具体涉及一种基于区域语义感知的遥感土地覆盖分类方法及系统。

背景技术

遥感土地覆盖分类的目标是获取遥感影像中每个像素的土地覆盖类别，以便高效地获取大范围地表的土地覆盖情况，在自然资源调查与管理、城市规划与管理、地图制图和环境监测等领域中具有广泛的应用。随着对地观测技术和传感器技术的发展，遥感影像的空间分辨率得到了大幅提升，为精细的遥感土地覆盖分类创造了条件。

随着卷积神经网络(CNN)的发展，其凭借强大的层次特征提取能力在自然图像语义分割任务中取得了巨大成功，CNN因此在遥感土地覆盖分类中也得到了广泛应用。然而，高分辨率遥感土地覆盖分类仍存在一些难点，主要包含以下两个方面：1）高分辨率遥感影像含有丰富的细节，这使CNN难以在同类区域内获得一致的分类结果，甚至在视觉一致区域内也常出现不一致的分类结果；2）遥感影像具有光谱复杂和场景多样的特点，遥感影像中各类土地覆盖因此具有较高的类内差异性和类间相似性，这为CNN正确识别各类土地覆盖造成了挑战。

发明内容

为了解决上述的技术问题，本发明提供了一种基于区域语义感知的遥感土地覆盖分类方法及系统，实现了高精度的遥感土地覆盖分类。

本发明的方法所采用的技术方案是：一种基于区域语义感知的遥感土地覆盖分类方法，其特征在于：将遥感影像输入语义分割网络，经过特征提取获得特征图F，再经过语义分割网络的分类层获得类别预测概率图；

所述语义分割网络，包括多尺度连续上下文特征编码模块和密集特征聚合解码模块；

所述多尺度连续上下文特征编码模块，首先使用加入混合空洞卷积的ResNet-101网络从输入图像中提取连续上下文特征图，网络中第三个残差块包含5组空洞率依次为{1,2,5,9}的空洞卷积层和1组空洞率依次为{1,2,5}的空洞卷积层，网络中第四个残差块包含1组空洞率分别为{5,9,17}的空洞卷积层，随后输出的特征图被输入空洞空间金字塔池化模块来提取多尺度特征，空洞空间金字塔池化模块各分支采用的空洞卷积的空洞率分别为1,2,4,6；

所述密集特征聚合解码模块，逐层地扩大编码器输出的特征图的空间尺寸，并逐层地将特征图与编码器中尺寸一致的特征图相加来融合多层次的特征，密集特征聚合解码模块为：

；

其中表示/>卷积操作，/>表示2倍双线性上采样操作，/>表示矩阵相加运算，/>表示编码器中由浅到深第i个残差块输出的特征图，/>表示解码器中由输出到输入第i个卷积层输出的特征图；当i=3时，/>表示编码器中空洞空间金字塔池化模块输出的特征图。

作为优选，所述语义分割网络，是训练好的语义分割网络；训练过程具体包括以下步骤：

步骤1：构建训练数据集；

获取若干遥感影像X及对应的土地覆盖类别标签图Y，并扩大逐像素的土地覆盖类别标签图中不同类别的数值间隔，再将增强后的标签图作为新的通道插入标签图所标注的遥感影像X，获得语义增强的遥感影像，随后在此基础上分割出内部具有视觉一致性和语义一致性的语义超像素S，并利用标签分割语义超像素来保证语义超像素内部的语义一致性；

步骤2：语义分割网络训练；

将原始遥感影像输入语义分割网络，经过特征提取获得特征图F，再经过网络的分类层和上采样操作获得类别预测概率图，上采样特征图F至输入图像尺寸得到特征图/>；

步骤3：基于土地覆盖类别标签图Y和类别预测概率图计算交叉熵损失函数/>，基于语义超像素S、土地覆盖类别标签图Y和特征图/>计算语义感知的区域损失函数/>，其包括超像素方差损失函数/>、类内相似性损失函数/>和类间差异性损失函数/>，将/>与/>的各损失函数加权求和获得总的损失函数，在此基础上利用反向传播更新语义分割网络参数；

步骤4：重复步骤2和3直至损失函数收敛，获得训练好的语义分割网络。

作为优选，步骤1中，使用LSC超像素分割算法分割出内部具有视觉一致性和语义一致性的语义超像素；

具体实现包括以下子步骤：

步骤1.1：将土地覆盖类别标签图中各像素的数值由c按下式转变为；

；

其中，c为类别序号，，C表示类别数，/>表示向下取整。

步骤1.2：将变换后的标签图作为新的通道插入标签图所标注的通道数为B的遥感影像X，获得通道数为/>的语义增强的遥感影像/>；

步骤1.3：用LSC超像素分割算法分割语义增强的遥感影像，为训练集中每张影像生成语义超像素S，用于后续监督网络训练；

步骤1.4：当一个语义超像素的内部出现多个类别的像素时，组合属于同一类别的像素作为新的语义超像素加入语义超像素集合，并删除该原始语义超像素，从而利用标签分割语义超像素来保证语义超像素内部的语义一致性。

作为优选，步骤2中，采用双线性内插方法将特征图F上采样至输入图像的尺寸，获得特征图。

作为优选，步骤3中，；其中，N和C分别表示像素和类别的数量；/>和/>分别代表各个像素的标签和类别预测概率，若第n个像素属于第c类，则/>，否则/>，/>是第n个像素被预测为第c个类别的概率。

作为优选，步骤3中，；其中，/>表示第s个语义超像素中第n个像素的第d维特征值，/>则表示第s个语义超像素的第d维平均特征值，其不参与梯度回传，S、/>和D分别为超像素的数量、第s个超像素内的像素数量和特征图/>通道数。

作为优选，步骤3中，

；其中，/>和/>表示两个同属于第i类的语义超像素的第d维平均特征值，D和C分别代表特征图/>的通道数量和分类的类别数；

；其中，/>和/>分别表示属于第i类和第j类的语义超像素的第d维平均特征值。

作为优选，步骤3中，加权求和各损失函数获得总的损失函数L来监督语义分割网络的学习；

；

其中，、/>和/>为平衡各项损失函数的权重参数。

本发明的系统所采用的技术方案是：一种基于区域语义感知的遥感土地覆盖分类系统，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现所述的基于区域语义感知的遥感土地覆盖分类方法。

本发明的有益效果包括：

1）提出了一种语义超像素分割方法，通过为超像素分割引入语义信息来为训练集中的遥感影像生成内部具有视觉一致性和语义一致性的超像素，克服常规方法在遥感影像上分割的超像素内部语义不一致的问题，以便为网络学习区域一致信息和区域关联信息提供有效的监督。

2）为解决遥感土地覆盖分类中视觉一致区域内分类结果不一致的问题，提出了超像素方差损失函数，通过降低语义超像素内部的特征方差来提升网络在视觉一致且语义一致的区域内提取的特征的相似性，进而预测得到一致的分类结果。

3）为缓解遥感图像中类内差异性和类间相似性对网络分类的干扰，提出了类内相似性损失函数和类间差异性损失函数/>，分别通过增强同类语义超像素平均特征间的相似性和不同类超像素平均特征间的差异性来提升特征的类内一致性和类间可区分性，从而改善遥感土地覆盖分类的效果。

附图说明

下面使用实施例，以及具体实施方式作进一步说明本文的技术方案。另外，在说明技术方案的过程中，也使用了一些附图。对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图以及本发明的意图。

图1是本发明实施例的语义分割网络结构图；

图2是本发明实施例的语义超像素分割方法示意图；

图3是本发明实施例的基于语义超像素的损失函数示意图；

图4是本发明实施例在DeepGlobe数据集上部分对比实验的结果图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1，本实施例提供的一种基于区域语义感知的遥感土地覆盖分类方法，将遥感影像输入语义分割网络，经过特征提取获得特征图F，再经过语义分割网络的分类层获得类别预测概率图；

请见图1，所述语义分割网络，包括多尺度连续上下文特征编码模块和密集特征聚合解码模块；

所述多尺度连续上下文特征编码模块，首先使用加入混合空洞卷积的ResNet-101网络从输入图像中提取连续上下文特征图，网络中第三个残差块包含5组空洞率依次为{1,2,5,9}的空洞卷积层和1组空洞率依次为{1,2,5}的空洞卷积层，网络中第四个残差块包含1组空洞率分别为{5,9,17}的空洞卷积层，随后输出的特征图被输入空洞空间金字塔池化（ASPP）模块来提取多尺度特征，空洞空间金字塔池化（ASPP）模块各分支采用的空洞卷积的空洞率分别为1,2,4,6；

；

其中表示/>卷积操作，/>表示2倍双线性上采样操作，/>表示矩阵相加运算，/>表示编码器中由浅到深第i个残差块输出的特征图，/>表示解码器中由输出到输入第i个卷积层输出的特征图；当i=3时，/>表示编码器中空洞空间金字塔池化（ASPP）模块输出的特征图。

在一种实施方式中，所述语义分割网络，是训练好的语义分割网络；训练过程具体包括以下步骤：

步骤1：构建训练数据集；

请见图2，在一种实施方式中，使用LSC超像素分割算法分割出内部具有视觉一致性和语义一致性的语义超像素；

具体实现包括以下子步骤：

；

其中，c为类别序号，，C表示类别数（包括背景类），/>表示向下取整。

步骤2：语义分割网络训练；

在一种实施方式中，采用双线性内插方法将特征图F上采样至输入图像的尺寸，获得特征图。

请见图3，基于标签图Y和类别预测概率图计算交叉熵损失函数/>，其计算公式如下：

；

其中，N和C分别表示像素和类别的数量；和/>分别代表各个像素的标签和类别预测概率，若第n个像素属于第c类，则/>，否则/>，/>是第n个像素被预测为第c个类别的概率。

基于语义超像素S、土地覆盖类别标签图Y和特征图计算语义感知的区域损失函数/>来分别增强特征的区域一致性、类内相似性和类间可区分性。/>由超像素方差损失函数/>、类内相似性损失函数/>和类间差异性损失函数/>三部分组成。

首先，基于语义超像素和特征图按下式计算超像素方差损失函数/>：

；

其中，表示第s个语义超像素中第n个像素的第d维特征值，/>则表示第s个语义超像素的第d维平均特征值，其不参与梯度回传，S、/>和D分别为超像素的数量、第s个超像素内的像素数量和特征图/>通道数。

接着，基于语义超像素、标签图Y和特征图按下式计算类内相似性损失函数：

；

其中，和/>表示两个同属于第i类的语义超像素的第d维平均特征值，D和C分别代表特征图/>的通道数量和分类的类别数；

然后，基于语义超像素、标签图Y和特征图下式计算类间差异性损失函数/>：

；

其中，和/>分别表示属于第i类和第j类的语义超像素的第d维平均特征值，D和C分别代表特征图/>的通道数量和分类的类别数。

最后，加权求和各损失函数获得总的损失函数L监督语义分割网络的学习，L可用下式表达：

；

其中，、/>和/>为平衡各项损失函数的权重参数。

本实施例还提供了一种基于区域语义感知的遥感土地覆盖分类系统，包括：

一个或多个处理器；

本实施例进行了广泛的消融研究，用以评估网络框架的各个组成部分和训练阶段各损失函数的影响。实验结果如下表所示：

1）多尺度连续上下文特征编码模块（MSCC）的效果：采用混合空洞卷积提取了空间上连续的上下文信息，增强了相邻特征间的关联性，在GID数据集上平均交并比mIoU分割结果提高了0.42%。

2）密集特征聚合解码模块（DFF）的效果：采用密集的上采样和特征融合，充分融合了高层次的语义特征和低层次的几何特征，GID数据集平均交并比mIoU提升了0.57%。

对损失函数的消融实验结果如下表所示：

1）超像素方差损失函数（L _var）的效果：通过减小语义超像素内部的特征方差提升了网络在视觉一致区域内提取的特征的一致性，在GID数据集上平均交并比mIoU分割结果提高了2.52%。

2）类内相似性损失函数（L _intra）的效果：通过减小同类语义超像素间的特征差异性提升了同类特征的相似性，GID数据集平均交并比mIoU相比只使用L _var时提升了0.11%。

3）类间差异性损失函数（L _inter）的效果：通过提升不同类语义超像素间的特征差异性增强了不同类特征的可区分性，在GID数据集上平均交并比mIoU分割结果提高了2.19%。

此外，本实施例进行了广泛的对比研究，用以评估网络框架和训练方法的有益效果。实验结果如下表所示：

在GID和DeepGlobe数据集上，本实施例均取得了最高的mIoU分割精度。

请见图4，为本实施例在DeepGlobe数据集上部分对比实验的结果图，与GLNet和MagNet相比，本实施例能够更准确地区分各类土地覆盖，能够有效减少碎片化分割的现象，在视觉一致区域获得更一致的分类结果。在GID数据集和DeepGlobe数据集上的实验结果表明，本发明提出的基于区域语义感知的遥感土地分类网络在遥感土地覆盖分类领域有显著提升。

为本实施提供一种基于区域语义感知的遥感土地覆盖分类方法及系统。提出了一种语义超像素分割方法，通过为超像素分割引入语义信息来为训练集中的遥感影像生成内部具有视觉一致性和语义一致性的超像素，克服常规方法在遥感影像上分割的超像素内部语义不一致的问题，以便为网络学习区域一致信息和区域关联信息提供有效的监督。为解决遥感土地覆盖分类中视觉一致区域内分类结果不一致的问题，提出了超像素方差损失函数，通过降低语义超像素内部的特征方差来提升网络在视觉一致且语义一致的区域内提取的特征的相似性，进而预测得到一致的分类结果。为缓解遥感图像中类内差异性和类间相似性对网络分类的干扰，提出了类内相似性损失函数/>和类间差异性损失函数，分别通过增强同类语义超像素平均特征间的相似性和不同类超像素平均特征间的差异性来提升特征的类内一致性和类间可区分性，从而改善遥感土地覆盖分类的效果。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种基于区域语义感知的遥感土地覆盖分类方法，其特征在于：将遥感影像输入语义分割网络，经过特征提取获得特征图F，再经过语义分割网络的分类层获得类别预测概率图；

；

其中表示/>卷积操作，/>表示2倍双线性上采样操作，/>表示矩阵相加运算，表示编码器中由浅到深第i个残差块输出的特征图，/>表示解码器中由输出到输入第i个卷积层输出的特征图；当i=3时，/> 表示编码器中空洞空间金字塔池化模块输出的特征图。

2.根据权利要求1所述的基于区域语义感知的遥感土地覆盖分类方法，其特征在于：所述语义分割网络，是训练好的语义分割网络；训练过程具体包括以下步骤：

步骤1：构建训练数据集；

步骤2：语义分割网络训练；

3.根据权利要求2所述的基于区域语义感知的遥感土地覆盖分类方法，其特征在于：步骤1中，使用LSC超像素分割算法分割出内部具有视觉一致性和语义一致性的语义超像素；

具体实现包括以下子步骤：

；

其中，c为类别序号，，C表示类别数，/>表示向下取整；

4.根据权利要求2所述的基于区域语义感知的遥感土地覆盖分类方法，其特征在于：步骤2中，采用双线性内插方法将特征图F上采样至输入图像的尺寸，获得特征图。

5.根据权利要求2所述的基于区域语义感知的遥感土地覆盖分类方法，其特征在于：步骤3中，；其中，N和C分别表示像素和类别的数量；和/>分别代表各个像素的标签和类别预测概率，若第n个像素属于第c类，则/>，否则/>，/>是第n个像素被预测为第c个类别的概率。

6.根据权利要求2所述的基于区域语义感知的遥感土地覆盖分类方法，其特征在于：步骤3中，；其中，/>表示第s个语义超像素中第n个像素的第d维特征值，/>则表示第s个语义超像素的第d维平均特征值，其不参与梯度回传，S、/>和D分别为超像素的数量、第s个超像素内的像素数量和特征图/>通道数。

7.根据权利要求2所述的基于区域语义感知的遥感土地覆盖分类方法，其特征在于：步骤3中，

8.根据权利要求2所述的基于区域语义感知的遥感土地覆盖分类方法，其特征在于：步骤3中，加权求和各损失函数获得总的损失函数L来监督语义分割网络的学习；

；

其中，、/>和/>为平衡各项损失函数的权重参数。

9.一种基于区域语义感知的遥感土地覆盖分类系统，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至8中任一项所述的基于区域语义感知的遥感土地覆盖分类方法。