CN112767413A

CN112767413A - 综合区域连通和共生知识约束的遥感影像深度语义分割方法

Info

Publication number: CN112767413A
Application number: CN202110011549.0A
Authority: CN
Inventors: 李彦胜; 欧阳松; 张永军; 史特
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2021-01-06
Filing date: 2021-01-06
Publication date: 2021-05-07
Anticipated expiration: 2041-01-06
Also published as: CN112767413B

Abstract

本发明公开了一种综合区域连通和共生知识约束的遥感影像深度语义分割方法。该方法在深度语义分割网络的损失函数项中加入基于区域连通的目标整体性约束和基于空间共生知识的目标空间分布约束，网络通过优化加入约束的综合损失函数项来调整网络模型，从而自主学习目标级特征表示和利用空间共生知识自动优化分割目标的空间分布。本发明创新性地提出了综合区域连通约束和空间共生知识约束的遥感影像深度语义分割方法，首次在语义分割领域实现对目标整体的约束；并通过空间共生条件概率将空间共生知识量化，成功地将非结构化的知识嵌入到数据驱动的深度语义分割网络中，有效改善深度语义分割网络的分割精度和分割结果。

Description

综合区域连通和共生知识约束的遥感影像深度语义分割方法

技术领域

本发明属于遥感影像解译与人工智能的交叉领域，涉及一种综合区域连通和共生知识约束的深度语义分割方法，具体包含一种联合基于区域连通的目标整体性约束和基于空间共生知识的目标空间分布约束的遥感影像深度语义分割方法。

背景技术

视觉是人类获取信息的重要途径，时刻提供给人们对周围环境的感知信息，包括目标轮廓、位置、空间关系等语义信息。得益于计算机技术和机器观测技术的发展，计算机视觉已成为了自动识别现实世界的主要技术手段，赋予了机器智能感知的能力。作为计算机视觉三大任务之一，语义分割通过指定每个像素的类别来完成对图像的像素级描述，广泛地应用于自然影像处理、医学影像分析，遥感影像解译等领域，具有巨大的应用价值。图像是复杂的数据，包含了丰富的颜色特征、纹理特征、形状特征和空间关系语义信息，在语义分割过程中需要综合考虑这些信息才能取得好的分割结果。相比于自然影像，遥感影像的“同谱异物、同物异谱”现象显著，这给语义分割带来了巨大的挑战。

传统的图像语义分割方法包括最大似然法(MLE)、随机森林(RF)、决策树(DT)和支持向量机(SVM)等基于浅层特征判别的监督分类方法。这类方法一般根据人工设计的特征描述子从图像中提取得到的光谱、纹理和几何结构特征进行分类。传统的分割方法高度依赖于人工设计特征，难以跨越底层图像数据与高层逻辑信息的语义鸿沟，其鲁棒性和精度较差。随着人工智能理论与技术的快速发展，深度学习方法广泛地运用到了图像解译中，在图像语义分割任务中取得了突破性的进展。基于深度学习的语义分割方法包括全卷积网络(FCN)、U型网络(U-Net)、金字塔场景解析网络(PSPNet)、掩模区域卷积网络(Mask R-CNN)和深度分割网络(DeepLab)等深度语义分割网络方法。深度语义分割网络通过端到端的学习机制完成对特征提取与分类一体化模型的自动学习，从而自适应地完成分割工作，使得分割的准确度大幅提高、分割的过程也更加智能化。然而，深度语义分割网络是大数据驱动的像素级别的分类方法，通过聚合像素信息来提取特征和减低每个像素上的损失来反向优化网络模型。由于缺乏目标级别的学习，无法有效提取出目标形状特征，导致分割结果边界模糊、缺乏整体性、随机噪声分布现象明显。同时受制于数据驱动方法的缺陷，往往难以利用目标间丰富的语义信息(如空间关系)和地学先验知识。以上两点严重制约了深度语义分割网络性能的提升，亟需在分割过程中综合考虑目标级别的整体性约束以及目标间的空间语义信息和地学先验知识。

发明内容

本发明主要是解决现有技术在遥感影像语义分割过程中由目标级别学习的缺乏、空间关系和地学先验知识利用不足所导致的分割结果整体性差和精度低等问题，提供了一种综合区域连通和空间共生知识约束的遥感影像深度语义分割方法，可以有效地提高遥感影像语义分割结果的准确性和可靠性。

生物视觉系统之所以能从复杂目标组成的影像中快速准确地完成检测和识别，是因为生物视觉感知从整体出发，以目标而不是像素为处理单元，综合光谱特征、形状特征、空间关系等信息和先验知识进行推理，从而完成识别。目标级建模可以有效减低像素级随机噪声的干扰，有助于构建目标级特征和空间关系知识，这些目标级的信息能够极大增强识别的性能和鲁棒性。目标之间的空间关系是人类感知周围环境时需要借助的重要信息。事实上，不同类别物体的空间分布具有很强的共生关系，例如建筑物往往靠近道路，桥梁一般横跨在水面上等。这些事实说明了空间共生等空间关系知识对于视觉识别系统至关重要。尽管深度学习在图像解译领域取得了巨大的进步，但并未达到生物视觉系统的水平，究其原因，生物视觉系统是在目标级单元的基础上综合运用视觉特征、语义信息和先验知识进行感知的，而深度语义分割网络本质上是大数据驱动的面向像素的分类方法，一方面受制于像素级别尺度，无法完成目标级别的建模，缺乏整体性，另一方面无法跨越结构化数据和非结构化知识之间的鸿沟，难以充分利用空间关系语义信息和地学先验知识。

基于上述分析，为在深度语义分割网络分割过程中实现目标级别的学习以及充分利用目标之间的空间关系和先验知识，本发明提出了一种综合区域连通和空间共生知识约束的遥感影像深度语义分割方法。该方法在深度语义分割网络的损失函数项中加入基于区域连通的目标整体性约束和基于空间共生知识的目标空间分布约束，网络通过优化加入约束的综合损失函数项来调整网络模型，从而学习到目标级特征表示和自主利用空间共生知识引导分割。数据集中人工标注的标签影像包含大量的连通域，这些连通域是地物目标的分割结果。地物目标的空间分布是领域先验知识的体现，空间共生等知识可以从地物目标的空间分布中抽取。基于区域连通的约束和基于空间共生知识的约束均以目标连通域为处理单元，前者计算每一个目标单元而不是像素的损失，以实现对目标整体的约束；后者利用空间共生知识完成邻域内目标对中心目标的打分，再根据分值计算每个目标的损失，从而实现对目标的空间分布的约束。在区域连通约束和空间共生知识约束损失的引导下，深度语义分割网络在训练的过程中自主学习目标级别的特征表示、根据空间共生知识自动优化目标的空间分布，使得最终输出的分割结果更具整体性、边界模糊和随机噪声现象得到抑制，分割精度较大幅度提高，同时目标的空间分布更接近真实地物的空间分布。

本发明所采用的技术方案是：综合区域连通和共生知识约束的遥感影像深度语义分割方法，包括以下步骤：

步骤1，遥感知识图谱构建。所述遥感知识图谱作为语义网络，用于描述地物目标的属性以及目标之间的关系。其中，遥感本体是遥感知识图谱的骨架，标签影像中的地物目标作为本体的实例化对象组成了遥感知识图谱的基本单元。所述遥感本体作为地物目标的本体表达，用于定义地物类及其属性关系。

步骤2，空间共生知识提取。所述空间共生关系是指不同目标在图像局部或全局区域内同时出现的情况。本发明以空间相邻(具有公共边)作为空间共生关系，空间共生知识可由空间关系的统计概率表示，具体做法是在遥感知识图谱中推理得出邻域内不同类别目标出现的条件概率。

步骤3，目标单元构建。所述目标单元是对图像中物体的表达，作为基本的处理单元。从训练样本的每幅标签图像中按类别提取连通域，将获取的连通域视为目标单元，并赋予每个单元类别(真实类别)，从而离线地完成目标构建。

步骤4，基于区域连通约束的损失设计。图像原始数据输入深度语义分割网络，输出分类置信图，在置信图上按通道取最大值对应的序号即得到分割结果。为构建目标整体性约束，基于区域连通约束的损失以步骤3中目标为单元进行损失计算。首先在分类置信图上对每个目标单元区域内所有像素的分类置信度向量按通道计算均值向量，这个向量作为该目标单元的分类置信度向量；然后根据目标的分类置信度向量和真实类别计算损失；最后对所有目标单元的损失求均值，该均值即为基于区域连通约束的损失。

步骤5，基于空间共生知识约束的损失构建。与基于区域连通约束的损失构建一样，基于空间共生知识约束的损失以步骤3中目标为单元进行损失计算。首先确定每个目标单元的分类类别，取步骤4中每个目标单元的分类置信度向量的最大值及其对应的序号分别作为该目标单元的分类置信度和分类类别；其次给对每个目标单元打分，取中心目标单元邻域内的目标单元对中心目标单元打分，中心目标单元的分值向量由邻域内所有目标单元的分类置信度和步骤2中的共生条件概率按类别加权求和而来，该向量代表中心目标单元在当前邻域空间分布下所属各类的分类置信度；最后根据目标单元的基于空间分布的分类置信度向量和真实类别计算损失，取所有目标单元损失项的均值作为基于空间共生知识约束的损失。

步骤6，深度语义分割网络训练。图像原始数据输入深度语义分割网络，输出分类置信度图，根据分类置信度图及其标签影像计算总体损失，通过后向传播算法降低总体损失，从而优化深度语义分割网络。其中总体损失包括基于像素计算的常规损失项、基于区域连通约束的损失项和基于空间共生知识约束的损失项。

步骤7，图像语义分割。利用训练好的深度语义分割网络模型对待分割的原始图像进行分割，即得到语义分割结果。

进一步的，步骤1中遥感知识图谱构建包括以下内容，

所述遥感知识图谱作为语义网络，用于描述地物目标的属性以及目标之间的关系。其中，遥感本体是遥感知识图谱的骨架，标签影像中的地物目标作为本体的实例化对象组成了遥感知识图谱的基本单元。所述遥感本体作为地物目标的本体表达，用于定义地物类及其属性关系。本体地物类分为根类、一级子类和二级子类。地物对象类为根类，其余子类从中衍生。一级子类包括水体类、植被类、地面类、农业用地类、城镇用地类、交通工具类和其他类。二级子类在一级子类的基础上细分为湖泊类、河流类、海洋类、草地类、树木类、裸地类、荒地类、耕地类、牧场类、建筑类、道路类、车辆类、船只类和飞机类。遥感本体的属性关系主要包括从属等层级关系，方位、相邻、环绕等空间关系属性以及多数类等统计属性。本发明以原始影像上超像素分割块对应于标签影像的区域作为本体类的实体。利用超像素(实体)实例化本体类，超像素中具有多数像素的地物类别作为对应实体的本体类类别，即实体的多数类属性。超像素的空间关系属性和统计属性作为实体的属性。

进一步的，步骤2中空间共生知识提取包括以下内容，

所述空间共生关系是指不同目标在图像局部或全局区域内同时出现的情况。本发明以空间相邻(具有公共边)作为空间共生关系，空间共生知识可由空间关系的统计概率表示，具体做法是在遥感知识图谱中推理得出邻域内不同类别实体出现的条件概率。以类别C_i(1≤i≤C)为例，统计遥感知识图谱中出现C_i类实体的概率P(C_i)以及邻域内同时出现类别为C_i和C_j的实体的概率P(C_i,C_j)，再根据下式即可计算出在C_i类实体出现的条件下邻域内出现C_j类实体的概率P(C_j|C_i)。

进一步的，步骤3中目标单元构建包括以下内容，

所述目标单元是对图像中物体的表达，作为基本的处理单元。目标单元的分割结果构成一个连通域。训练样本具有C类。从训练样本的每幅标签图像中按类别提取连通域，将获取的连通域视为目标单元S_i(1≤i≤N，N表示目标单元的个数)，并赋予每个单元类别Y(真实类别，1≤Y≤C)，从而离线完成目标单元构建。

进一步的，步骤4中设计基于区域连通约束的损失l_R，具体实现方式如下，

图像原始数据I输入深度语义分割网络，输出分类置信度图F，在F上按通道取最大值对应的序号即得到分割结果。为构建目标整体性约束，基于区域连通约束的损失以步骤3中目标为单元进行损失计算。首先在分类置信度图F上对S_i(1≤i≤N)目标单元区域内所有像素P_i的分类置信度向量D按通道计算均值，得到维数为C的向量，这个向量作为该目标单元的分类置信度向量

然后根据目标单元的分类置信度向量

和真实类别Y_i计算损失；最后对所有目标单元的损失求均值，该均值即为基于区域连通域约束的损失l_R。

进一步的，步骤5中构建基于空间共生知识约束的损失l_K，具体实现方式如下，

与基于区域连通约束的损失构建一样，基于空间共生知识约束的损失以步骤3中目标为单元进行损失计算。首先确定每个目标单元的分类类别，取目标单元S_i(1≤i≤N)的分类置信度向量

将向量

中最大值及其对应序号分别作为该目标单元的分类置信度

和分类类别k(1≤k≤C)；其次给目标单元S_i打分，取中心目标单元S_i邻域内的目标单元{S_j|S_j Adjacent to S_i}对S_i打分(邻域内共N_i个目标单元)，S_i的分值由邻域内所有目标单元的分类置信度向量

的最大值

和步骤2中的共生条件概率P按类别加权求和而来，得到分值向量

该向量代表中心目标单元在当前邻域空间分布下所属各类的分类置信度；最后根据目标单元的基于空间分布的分类置信度向量H_i和真实类别Y_i计算损失，取所有目标单元损失的均值作为基于空间共生知识约束的损失l_K。

其中，1≤i≤N，N_i是指中心节点i的相邻节点个数，q代指类别，1≤q≤C，P(C_q|C_k)表示条件概率。

进一步的，步骤6中训练深度语义分割网络，具体实现方式如下，

图像原始数据I输入深度语义分割网络，输出分类置信度图

根据分类置信度图F及其标签影像

计算总体损失，通过后向传播算法降低总体损失，从而优化深度语义分割网络。其中总体损失

包括基于像素计算的常规损失项l_P、基于区域连通约束的损失项l_R和基于空间共生知识约束的损失项l_K。

F＝φ(I,W_θ)(式7)

l_P＝loss(F,Y)(式8)

其中，φ(·)为深度语义分割网络的层次化映射函数，代表网络模型。W_θ为深度语义分割网络的参数。C、H和W分别为图像的通道数、高度和宽度。l_P指基于像素计算的常规损失项，l_R是基于区域连通约束的损失项，l_K为基于空间共生知识约束的损失项。α和β为常数，α,β∈{0,1}。当α＝β＝0时，深度语义分割网络进行无约束的常规训练；当α＝1,β＝0时，深度语义分割网络进行基于区域连通域约束的训练；当α＝0,β＝1时，深度语义分割网络进行基于空间共生约束的训练；当α＝β＝1时，网络进行综合区域连通约束和空间共生约束的训练。

进一步的，步骤7中图像语义分割，具体实现方式如下，

使用训练好的深度语义分割网络模型φ(·)对原始图像I进行分割，即得到语义分割结果。

本发明具有以下优点：现有深度语义分割网络训练过程基本采用常规的基于像素计算的损失函数，无法完成对目标整体性学习，同时受制于结构化数据驱动的缺陷，难以充分利用空间关系等非结构化的语义信息和先验知识。针对以上问题，本发明创新性地提出了综合区域连通和空间共生知识约束的遥感影像深度语义分割方法。前者计算每一个目标单元而不是像素的损失，实现对目标整体的约束；后者通过共生条件概率将空间共生知识量化，成功地将非结构化的知识嵌入到数据驱动的深度语义分割网络中，具体实现上利用空间共生知识完成邻域内目标对中心目标的打分，再根据分值计算每个目标的损失，从而实现对目标的空间分布的约束。基于区域连通的约束损失引导深度语义分割网络在训练的过程中自主学习目标级别的特征表示，使得网络输出的分割结果更具整体性、边界模糊和随机噪声现象得到抑制。基于空间共生知识约束的损失根据空间先验知识调整目标的空间分布，从而实现对目标的空间分布的自动优化。在综合区域连通和空间共生知识约束损失的引导下，可以有效地改善深度语义分割网络的分割精度和分割结果。

附图说明

图1：为本发明实施例的总体流程图。

图2：为本发明实施例的遥感本体层级图。

图3：为本发明实施例的图像语义分割结果示意图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

步骤1，遥感知识图谱构建。所述遥感知识图谱作为语义网络(这里的“语义网络”是指地物目标及其之间的语义关系所形成的网络)，用于描述地物目标的属性以及目标之间的关系。其中，遥感本体是遥感知识图谱的骨架，标签影像中的地物目标作为本体的实例化对象组成了遥感知识图谱的基本单元。所述遥感本体作为地物目标的本体表达，用于定义地物类及其属性关系。使用网络本体语言(Web Ontology Language，OWL)符号化描述遥感本体。遥感本体地物类分为根类、一级子类和二级子类。地物对象类(rs:GeoObject)为根类，其余子类从中衍生。一级子类包括水体类(rs:Water)、植被类(rs:Vegetation)、地面类(rs:Ground)、农业用地类(rs:Agriculturaland)、城镇用地类(rs:Urbanland)、交通工具类(rs:Vehicle)和其他类(rs:Unknown)。二级子类在一级子类的基础上细分为湖泊类(rs:Lake)、河流类(rs:River)、海洋类(rs:Sea)、草地类(rs:Grass)、树木类(rs:Tree)、裸地类(rs:Bareland)、荒地类(rs:Wasteland)、耕地类(rs:Farmland)、牧场类(rs:Rangeland)、建筑类(rs:Building)、道路类(rs:Pavement)、车辆类(rs:Car)、船只类(rs:Ship)和飞机类(rs:Airplane)。遥感本体的属性关系主要包括从属等层级关系(geo:isA)，方位(geo:directionOf)、相邻(geo:adjacentTo)、环绕(geo:surround)等空间关系属性以及多数类(geo:voteClass)等统计属性。本发明以原始影像上超像素分割块对应于标签影像的区域作为本体类的实体。利用超像素(实体)实例化本体类，超像素中具有多数像素的地物类别作为对应实体的本体类类别，即实体的多数类属性。超像素的空间关系属性和统计属性作为实体的属性。超像素块由简单线性迭代聚类(Simple Linear Iterative Cluster，SLIC)超像素分割方法分割得到，SLIC超像素分割方法基于颜色和距离相似性进行分割，可以分割出大小基本一致、形状趋于规则的超像素。

步骤2，空间共生知识提取。所述空间共生关系是指不同目标在图像局部或全局区域内同时出现的情况。本发明以空间相邻(具有公共边)作为空间共生关系，空间共生知识可由空间关系的统计概率表示，具体做法是在遥感知识图谱中推理得出邻域内不同类别实体出现的条件概率。本发明以公开的UCM遥感地物分类数据集为例，数据集中包含8类(C＝8)地物类，分别为植被(rs:Vegetation)、建筑(rs:Building)、道路(rs:Pavement)、裸地(rs:Bareland)、水体(rs:Water)、车辆(rs:Car))、船(rs:Ship)和飞机(rs:Airplane)，令C₁代表植被类，依此类推。以类别C_building(C₂)建筑类为例，首先遥感知识图谱中出现建筑类的实体的概率P(C_building)以及邻域内同时出现类别为建筑类和C_pavement(C₃)道路类实体的概率P(C_building,C_pavement)，再根据下式即可计算出在建筑类实体出现的条件下邻域内出现道路类实体的概率P(C_pavement|C_building)；最后得到空间共生条件概率P(C_i,C_j),1≤i,j≤C如表1。

表1空间共生条件概率

步骤3，目标单元构建。所述目标单元是对图像中物体的表达，作为基本的处理单元。目标单元的分割结果构成一个连通域。训练样本具有C类。从训练样本的每幅标签图像中按类别提取连通域，将获取的连通域视为目标单元S_i(1≤i≤N)，并赋予每个目标单元类别Y(真实类别，1≤Y≤C)，从而离线完成目标单元构建。

步骤4，基于区域连通约束的损失设计。图像原始数据I输入深度语义分割网络，输出分类置信度图F，在F上按通道取最大值对应的序号即得到分割结果。为构建目标整体性约束，基于区域连通约束的损失以步骤3中目标为单元进行损失计算。首先在分类置信度图F上对S_i(1≤i≤N)目标单元区域内所有像素P_i的分类置信度向量D按通道计算均值，得到维数为C的向量，这个向量作为该目标单元的分类置信度向量

然后根据目标单元的分类置信度向量

步骤5，基于空间共生知识约束的损失构建。与基于区域连通约束的损失构建一样，基于空间共生知识约束的损失以步骤3中目标为单元进行损失计算。首先确定每个目标单元的分类类别，取目标单元S_i(1≤i≤N)的分类置信度向量

将向量

中最大值及其对应序号分别作为该目标单元的分类置信度

的最大值

步骤6，深度语义分割网络训练。图像原始数据I输入深度语义分割网络，输出分类置信度图

根据分类置信度图F及其标签影像

计算损失，通过后向传播算法降低损失，从而优化深度语义分割网络。其中总体损失

包括基于像素计算的常规损失项l_P、基于区域连通约束的损失项l_R和基于空间共生知识约束的损失项l_K。本发明以深度语义分割网络U-Net为例进行阐述，U-Net是一个经典的编解码结构的图像语义分割网络，其中编码器由卷积层、最大池化层和激活层组合，解码器由卷积层、反卷积层以及激活层组成。交叉熵(Cross Entropy)和随机梯度下降法(Stochastic Gradient Descent，SGD)分别作为深度语义分割网络的损失函数loss(·)和优化器。

F＝φ(I,W_θ) (式7)

l_P＝loss(F,Y) (式8)

步骤7，图像语义分割。使用训练好的深度语义分割网络模型φ(·)对原始图像I进行分割，即得到语义分割结果。各方法分割精度对比如表2。

表2.各方法分割精度对比

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种综合区域连通和共生知识约束的遥感影像深度语义分割方法，其特征在于，包括以下步骤：

步骤1，遥感知识图谱构建；所述遥感知识图谱作为语义网络，用于描述地物目标的属性以及目标之间的关系，其中，遥感本体是遥感知识图谱的骨架，标签影像中的地物目标作为本体的实例化对象组成了遥感知识图谱的基本单元，所述遥感本体作为地物目标的本体表达，用于定义地物类及其属性关系；

步骤2，空间共生知识提取；所述空间共生关系是指不同目标在图像局部或全局区域内同时出现的情况，以空间相邻作为空间共生关系，空间共生知识由空间关系的统计概率表示，具体做法是在遥感知识图谱中推理得出邻域内不同类别目标出现的条件概率；

步骤3，目标单元构建；所述目标单元是对图像中物体的表达，作为基本的处理单元，从训练样本的每幅标签图像中按类别提取连通域，将获取的连通域视为目标单元，并赋予每个单元类别，从而离线地完成目标单元构建；

步骤4，基于区域连通约束的损失设计；图像原始数据输入深度语义分割网络，输出分类置信图，在置信图上按通道取最大值对应的序号即得到分割结果；为构建目标整体性约束，基于区域连通约束的损失以步骤3中目标为单元进行损失计算，首先在分类置信图上对每个目标单元区域内所有像素的分类置信度向量按通道计算均值向量，这个向量作为该目标单元的分类置信度向量；然后根据目标单元的分类置信度向量和真实类别计算损失；最后对所有目标单元的损失求均值，该均值即为基于区域连通约束的损失；

步骤5，基于空间共生知识约束的损失构建；与基于区域连通约束的损失构建一样，基于空间共生知识约束的损失以步骤3中目标为单元进行损失计算；首先确定每个目标单元的分类类别，取步骤4中每个目标单元的分类置信度向量的最大值及其对应的序号分别作为该目标单元的分类置信度和分类类别；其次给对每个目标单元打分，取中心目标单元邻域内的目标单元对中心目标单元打分，中心目标单元的分值向量由邻域内所有目标单元的分类置信度和步骤2中的共生条件概率按类别加权求和而来，该向量代表中心目标单元在当前邻域空间分布下所属各类的分类置信度；最后根据目标单元的基于空间分布的分类置信度向量和真实类别计算损失，取所有目标单元损失项的均值作为基于空间共生知识约束的损失；

步骤6，深度语义分割网络训练；图像原始数据输入深度语义分割网络，输出分类置信度图，根据分类置信度图及其标签影像计算总体损失，通过后向传播算法降低总体损失，从而优化深度语义分割网络；其中总体损失包括基于像素计算的常规损失项、基于区域连通约束的损失项和基于空间共生知识约束的损失项；

步骤7，图像语义分割；利用训练好的深度语义分割网络对待分割的原始图像进行分割，即得到语义分割结果。

2.根据权利要求1所述的一种综合区域连通和共生知识约束的遥感影像深度语义分割方法，其特征在于：步骤1遥感本体的具体内容包括，

所述遥感本体作为地物目标的本体表达，用于定义地物类及其属性关系；本体地物类分为根类、一级子类和二级子类；地物对象类为根类，其余子类从中衍生；一级子类包括水体类、植被类、地面类、农业用地类、城镇用地类、交通工具类和其他类；二级子类在一级子类的基础上细分为湖泊类、河流类、海洋类、草地类、树木类、裸地类、荒地类、耕地类、牧场类、建筑类、道路类、车辆类、船只类和飞机类；遥感本体的属性关系包括从属层级关系，方位、相邻、环绕空间关系属性以及多数类统计属性；以原始影像上超像素分割块对应于标签影像的区域作为本体类的实体，利用超像素实例化本体类，超像素中具有多数像素的地物类别作为对应实体的本体类类别，即实体的多数类属性；超像素的空间关系属性和统计属性作为实体的属性。

3.根据权利要求1所述的一种综合区域连通和共生知识约束的遥感影像深度语义分割方法，其特征在于：步骤2中在遥感知识图谱中推理得出邻域内不同类别目标出现的条件概率，具体实现方式如下，

以类别C_i为例，1≤i≤C，统计遥感知识图谱中出现C_i类实体的概率P(C_i)以及邻域内同时出现类别为C_i和C_j的实体的概率P(C_i,C_j)，再根据下式即可计算出在C_i类实体出现的条件下邻域内出现C_j类实体的概率P(C_j|C_i)

4.根据权利要求1所述的一种综合区域连通和共生知识约束的遥感影像深度语义分割方法，其特征在于：步骤4中设计基于区域连通约束的损失l_R，具体实现方式如下，

图像原始数据I输入深度语义分割网络，输出分类置信度图F，在F上按通道取最大值对应的序号即得到分割结果；为构建目标整体性约束，基于区域连通约束的损失以步骤3中目标为单元进行损失计算；首先在分类置信度图F上对S_i目标单元区域内所有像素P_i的分类置信度向量D按通道计算均值，得到维数为C的向量，这个向量作为该目标单元的分类置信度向量

然后根据目标单元的分类置信度向量

和真实类别Y_i计算损失；最后对所有目标单元的损失求均值，该均值即为基于区域连通域约束的损失l_R；

其中，1≤i≤N，N表示目标单元的个数。

5.根据权利要求1所述的一种综合区域连通和共生知识约束的遥感影像深度语义分割方法，其特征在于：步骤5中构建基于空间共生知识约束的损失l_K，具体实现方式如下，

与基于区域连通约束的损失构建一样，基于空间共生知识约束的损失以步骤3中目标为单元进行损失计算；首先确定每个目标单元的分类类别，取目标单元S_i的分类置信度向量

将向量

中最大值及其对应序号分别作为该目标单元的分类置信度

和分类类别k，1≤k≤C；其次给目标单元S_i打分，取中心目标单元S_i邻域内的目标单元{S_j|S_j Adjacent toS_i}对S_i打分，邻域内共N_i个目标单元，S_i的分值由邻域内所有目标单元的分类置信度向量

的最大值

该向量代表中心目标单元在当前邻域空间分布下所属各类的分类置信度；最后根据目标单元的基于空间分布的分类置信度向量H_i和真实类别Y_i计算损失，取所有目标单元损失的均值作为基于空间共生知识约束的损失l_K；

6.根据权利要求1所述的一种综合区域连通和共生知识约束的遥感影像深度语义分割方法，其特征在于：步骤6中训练深度语义分割网络，具体实现方式如下，

图像原始数据I输入深度语义分割网络，输出分类置信度图

根据分类置信度图F及其标签影像

计算总体损失，通过后向传播算法降低总体损失，从而优化深度语义分割网络；其中总体损失

包括基于像素计算的常规损失项l_P、基于区域连通约束的损失项l_R和基于空间共生知识约束的损失项l_K；

F＝φ(I,W_θ) (式7)

l_P＝loss(F,Y) (式8)

其中，φ(·)为深度语义分割网络的层次化映射函数，代表网络模型；W_θ为深度语义分割网络的参数，C、H和W分别为图像的通道数、高度和宽度；l_P指基于像素计算的常规损失项，l_R是基于区域连通约束的损失项，l_K为基于空间共生知识约束的损失项；α和β为常数，α,β∈{0,1}；当α＝β＝0时，深度语义分割网络进行无约束的常规训练；当α＝1,β＝0时，深度语义分割网络进行基于区域连通域约束的训练；当α＝0,β＝1时，深度语义分割网络进行基于空间共生约束的训练；当α＝β＝1时，网络进行综合区域连通约束和空间共生约束的训练。