WO2023201772A1

WO2023201772A1 - 基于迭代域内适应和自训练的跨域遥感图像语义分割方法

Info

Publication number: WO2023201772A1
Application number: PCT/CN2022/090009
Authority: WO
Inventors: 尹建伟; 蔡钰祥; 杨莹春; 尚永衡; 陈振乾; 沈正伟
Original assignee: 浙江大学
Priority date: 2022-04-18
Filing date: 2022-04-28
Publication date: 2023-10-26
Also published as: CN114708434A

Abstract

本发明公开了一种基于迭代域内适应和自训练的跨域遥感图像语义分割方法，包括源域-目标域域间域适应模型训练、目标域类别分割概率以及伪标签生成、目标域图像分割概率可信度得分排序、目标域域内迭代域适应模型训练和目标域分割结果生成。本发明利用源-目标域域间域适应减小了源-目标域域间差异，同时利用目标域域内域适应减小了目标域域内差异，提高了跨域遥感图像语义分割模型的准确率，进一步通过提出的基于分割概率可信度对目标域图像进行分类和排序从而挑选出分割效果好的预测结果作为伪标签，同时提出新的伪标签筛选策略去掉伪标签中极有可能出错的像素点，从而避免了目标域内自训练时伪标签错误所带来的影响。

Description

基于迭代域内适应和自训练的跨域遥感图像语义分割方法

技术领域

本发明属于遥感图像语义分割技术领域，具体涉及一种基于迭代域内适应和自训练的跨域遥感图像语义分割方法。

背景技术

随着遥感技术的不断发展，卫星和无人机等遥感设备能够收集大量的遥感卫星图像，例如无人机可以在城市和乡村上空捕获大量高空间分辨率的遥感图像。如此海量的遥感数据提供了许多应用机会，如城市监测、城市管理、农业、自动制图和导航；在这些应用中，关键技术都是遥感图像的语义分割或图像分类。

在最近几年里，卷积神经网络(CNN)已经成为语义分割和图像分类中最常用的技术，一些基于CNN的模型已经在这个任务中显示了它们的有效性，例如FCN、SegNet、U-Net系列、PSPNets和Deeplab系列。当训练图像和测试图像来自相同的卫星或城市时，这些模型都能得好不错的语义分割结果，但是当我们将这些模型用于不同卫星或城市获取的遥感图像的分类时，因为不同卫星和城市图像之间的数据分布不同(域偏移)，模型的测试结果会变得很糟糕，无法让人满意。在一些相关文献中，这个问题被称为域适应；在遥感领域，域偏移通常是由遥感设备成像时不同的大气条件、采集差异(这些差异将会改变物体的光谱特征)、传感器的光谱特征的差异或与不同类型的光谱波段(比如一些图片可能时红色，绿色和蓝色波段，而其他可能时近红外，红色和绿色波段)引起的。

在一个典型的域适应问题中，训练图像和测试图像通常被指定为源域和目标域，处理域适应的一个普通解决方案是在目标域上创建一个新的语义标记数据集，并在其上训练模型。由于目标城市收集大量像素标记的图像将是耗时和昂贵的，这种解决方案非常昂贵且不切实际，为了减少人工按像素分类的工作量，已经有了一些解决方案，比如从弱监督标记中合成数据。然而，这些方法仍然有局限性，因为它们也需要耗费大量的人工劳动。

为了提高基于CNN的语义分割模型的泛化能力，另一种常用的方法是随机变化颜色进行数据扩充，例如伽马校正和图像亮度转换，在遥感中得到了广泛的应用。尽管如此，当数据分布之间存在显著差异时，上述数据增强方法无法在跨域语义分割中取得不错的效果。使用这种简单的增强方法，不可能将一个包含红、绿、蓝波段的域的模型应用到另一个包含近红外、红、绿通道的域。为了克服这一限制，生成对抗网络(Generative Adversarial Network，GAN)[I.Goodfellow,J.Pouget-Abadie,M.Mirza,B.Xu,D.Warde-Farley,S.Ozair,A.Courville,and Y.Bengio.Generative adversarial nets[C].Proceedings of the international conference on Neural Information Processing Systems(NIPS).2014:2672～2680]被用来生成与目标域图像的数据分布相似的拟目标域图像，这些生成的拟目标域图像可以用来训练目标域上分类器。与此同时，一些基于对抗学习[Y.-H.Tsai,W.-C.Hung,S.Schulter,K.Sohn,M.-H.Yang,and M.Chandraker.Learning to adapt structured output space for semantic segmentation[C].”Proceedings of the international conference on computer vision and pattern recognition(CVPR).2018:7472～7481]和自训练[Y.Zou,Z.Yu,B.Kumar,and J.Wang.Unsupervised domain adaptation for semantic segmentation via class-balanced self-training[C].Proceedings of the international conference on European conference on computer vision(ECCV).2018:289～305]的方法也被研究人员提出来用来解决域适应问题。虽然这些方法在自然图像上取得了不错的效果，但将这些方法直接运用遥感图像上仍存在一定的问题，其中最重要的一点就是这些方法忽略了目标域图像自身存在的差异，例如同一个城市中的建筑物风格形状等也会存在较大的差异。

由于目标域图像自身存在的差异，从源域迁移到目标域的域间语义分割模型在所有目标域图像上的分割效果也会存在差异，即在一部分目标域图像上能获得较为准确的分割结果，但在另一部分目标域图像上获得的分割结果会变得十分糟糕。因此如何对目标域图像进行进一步的域内域适应从而减小目标域内的差异，让跨域语义分割模型在所有目标域图像上都能取得不错的分割效果，这是跨域遥感图像语义分割面临的重要问题。其次，因为目标域图像没有对应的标签，目前常用的方法是采用自训练技术，将训练后的跨域语义分割模型生成的语义分割结果作为目标域图像的伪标签，然后用伪标签来继续训练跨域语义分割模型，从而得到最终的目标域语义分割模型。这种基于伪标签的自训练模型的训练效果取决于伪标签质量，当伪标签质量较差时，模型的训练效果也会大大减弱，模型的语义分割能力也会大大减弱。因此，如何挑选模型分割效果好的图像结果作为伪标签以及如何提升伪标签的质量也是自训练技术中一个重要的问题。

发明内容

鉴于上述，本发明提供了一种基于迭代域内适应和自训练的跨域遥感图像语义分割方法，能够将一个域的遥感图像上训练的语义分割模型迁移到其他域遥感图像上，并在目标域遥感图像内进行进一步的域内域适应训练，在减小源域-目标域域间差异的同时减小目标域域内差异，从而进一步提高跨域遥感图像语义分割模型的性能和鲁棒性。

一种基于迭代域内适应和自训练的跨域遥感图像语义分割方法，包括如下步骤：

(1)利用源域图像x _s、源域标签y _s、源域语义分割模型F _S以及目标域图像x _t训练出源域-目标域域间语义分割模型F _inter；

(2)将目标域图像x _t输入至源域-目标域域间语义分割模型F _inter中，得到目标域图像x _t的类别分割概率P _t，进而利用类别分割概率P _t计算出分割概率可信度S _t和目标域伪标签

(3)将所有目标域图像x _t根据分割概率可信度S _t大小进行降序排列，进而根据排列次序将所有目标域图像x _t平均分成K个目标域图像子集

K为大于1的自然数；

(4)利用分割概率可信度最高的一组目标域图像子集

及其对应的伪标签子集

以及源域-目标域域间语义分割模型F _inter和目标域图像子集

迭代训练出目标域域内语义分割模型F _intra；

(5)将目标域图像x _t输入至目标域域内语义分割模型F _intra中，即可得到目标域图像x _t最终的类别分割概率P及分割结果map。

进一步地，所述步骤(1)的具体实现过程如下：

1.1利用源域图像x _s和源域标签y _s训练出源域语义分割模型F _S；

1.2利用源域图像x _s以及目标域图像x _t训练源-目标域图像双向转换器，其包含源→目标方向的图像转换器和目标→源方向的图像转换器；

1.3对于上述训练过程中生成的所有图像转换器的中间保存模型，从中选择一组最优的结果作为源→目标方向的图像转换器G _S→T和目标→源方向的图像转换器G _T→S；

1.4利用图像转换器G _S→T将源域图像x _s从源域转换到目标域，得到拟目标域图像G _S→T(x _s)；

1.5利用拟目标域图像G _S→T(x _s)和源域标签y _s训练出源域-目标域域间语义分割模型F _inter。

进一步地，所述步骤(2)中分割概率可信度S _t的计算表达式如下：

其中：H和W分别为目标域图像x _t的长度和宽度，C为目标域图像x _t的分割类别数量，

表示目标域图像x _t中坐标为(h,w)的像素点对应类别c _i的分割概率，c _i表示第i个类别，i为自然数且1≤i≤C，θ()为用于度量像素点各类别分割概率之间似然度的函数。

进一步地，所述步骤(2)中目标域伪标签

的计算表达式如下：

其中：

表示目标域伪标签

中坐标为(h,w)的像素点的类别，

表示目标域图像x _t中坐标为(h,w)的像素点对应类别c的分割概率，μ ^c为类别c对应的分割概率阈值，

表示目标域图像x _t中坐标为(h,w)的像素点对应类别c _i的分割概率，c _i表示第i个类别，i为自然数且1≤i≤C，C为目标域图像x _t的分割类别数量，

表示目标域图像x _t中坐标为(h,w)的像素点的分割概率混乱度，υ为分割概率混乱度阈值。

进一步地，所述分割概率混乱度

的计算表达式如下：

其中：δ()为用于度量像素点各类别分割概率之间混乱程度的函数。

进一步地，所述步骤(4)的具体实现过程如下：

4.1初始将分割概率可信度最高的一组目标域图像子集

及其对应的伪标签子集

作为训练集

及其对应的标签集

将源域-目标域域间语义分割模型F _inter作为目标域域内语义分割模型

4.2利用训练集

标签集

目标域域内语义分割模型

以及目标域图像子集

训练出目标域域内语义分割模型

k为自然数且2≤k≤K；该训练过程与步骤(1)类似；

4.3将目标域图像子集

输入至目标域域内语义分割模型

中，得到对应的类别分割概率

进而利用该类别分割概率

计算出目标域图像子集

的伪标签子集

4.4将目标域图像子集

及其伪标签子集

分别加入到训练集

和标签集

中；

4.5令k＝k+1；

4.6重复执行步骤4.2～4.5，直至k＝K，训练得到目标域域内语义分割模型

即作为目标域域内语义分割模型F _intra。

本发明方法是一个完整的跨域遥感图像语义分割框架，包含源域-目标域域间域适应模型训练、目标域类别分割概率以及伪标签生成、目标域图像分割概率可信度得分排序、目标域域内迭代域适应模型训练和目标域分割结果生成。

本发明提出了一个目标域域内的迭代域适应训练网络，在训练该迭代域适应训练网络时，本发明使用了常用的自训练学习技术，用分割效果较好的那一部分图像以及其分割结果作为伪标签来指导训练目标域分割模型，使目标域模型能在原本分割效果较差的那一部分图像上也能获得较好的分割结果。

除此之外，为了应对目标域内分布复杂和多样化的特点，本发明还提出将目标域分成多个子域，并对多个子域进行迭代域内适应训练；为了将目标域分成多个子域，本发明提出了一种分割概率可信度计算方法，根据目标域模型的分割结果好坏得分对目标域图像进行排序和分类，从而挑选出分割效果好的那一部分目标域图像以及其伪标签来对目标域模型进行进一步的优化。

在获得伪标签的过程中，本发明提出一种分割概率阈值和分割概率混乱度阈值结合的方法，去掉伪标签中分割结果比较差的像素点，从而避免了低质量伪标签干扰目标域模型训练。

基于迭代域适应训练框架，本发明实现了目标域域内域适应训练，在获得了源域到目标域的迁移模型和目标域分割结果后，本发明采用的迭代域适应训练框架对目标域模型进行进一步的域内适应训练，得到了最后的目标域模型和语义分割结果，提高了跨域遥感图像语义分割的准确率。

附图说明

图1为本发明跨域遥感图像语义分割方法的步骤示意图。

图2为本发明跨域遥感图像语义分割方法的具体实施流程示意图。

具体实施方式

为了更为具体地描述本发明，下面结合附图及具体实施方式对本发明的技术方案进行详细说明。

如图1和图2所示，本发明基于迭代域内适应和自训练的跨域遥感图像语义分割方法，包括如下步骤：

(1)利用源域图像x _s，源域标签y _s，源域语义分割模型F _S以及目标域图像x _t训练出源域-目标域域间语义分割模型F _inter。

本实施方式在没有源域语义分割模型F _S时，可利用源域图像x _s和源域标签y _s训练得到，模型网络结构可采用常用的deeplab、U-net等，损失函数采用具有K类别的交叉熵损失，对应公式如下：

式中：x _s为源域图像，y _s为源域图像标签，K为标签类别数量，F _S为源域上的语义分割模型，

为指示函数(当k＝y _s时，

当k≠y _s时，

指示函数参考—周志华.机器学习[M].北京:清华大学出版社,2016年.主要符号表)，

表示数学期望函数，

为x _s输入至模型F _S中得到的输出结果中第k 类的结果。

本实施方式将带建筑物标签的Potsdam城市图像作为源域，并将其大小裁剪为512*512像素，保留RGB 3通道，图像和对应建筑物标签数量各为4000张，模型网络结构可采用deeplabV3+，学习率为10 ^-4，优化算法为adam，训练900个epoch得到Potsdam域上的语义分割模型F _S。

常用的源域到目标域的域间域适应训练有基于图像转化和对抗学习，本实例以基于GAN的图像转换方法做说明，但不仅限于基于图像转换的方法。基于图像转换的方法首先需要训练一个源域到目标域之间的双向图像转换模型，双向图像转换模型包含源域图像x _s到目标域图像x _t的图像转换器G _S→T、目标域图像x _t到源域图像x _s的图像转换器G _T→S以及源域判别器D _S和目标域判别器D _T，训练损失函数包含循环一致损失函数、语义一致损失函数、自损失函数和对抗损失函数。

循环一致损失函数的方程表达式如下：

式中：x _s为源域图像，x _t为目标域图像，G _S→T为源域图像x _s到目标域图像x _t的图像转换器，G _T→S为目标域图像x _t到源域图像x _s的图像转换器，

为数学期望函数，‖‖ ₁为L1范数。

语义一致损失函数的方程表达式如下：

为数学期望函数，F _T为目标域上语义分割模型，F _S为源域上语义分割模型，KL(||)为两个分布之间的KL散度。

对抗损失函数的方程表达式如下：

为数学期望函数，D _S为源域判别器，D _T为目标域判别器。

自损失函数的方程表达式如下：

为数学期望函数，‖·‖ ₁为L1范数。

本实施方式将Potsdam城市图像作为源域，Vaihingen城市图像作为目标域，图像大小均为512*512像素，3通道，其中Potsdam城市图像(源域)832张，Vaihingen城市图像(目标域)845张，图像中均包含建筑物。图像转换模型使用GAN，包含Potsdam图像x _s到Vaihingen图像x _t的图像转换器G _S→T、Vaihingen图像x _t到Potsdam图像x _s的图像转换器G _T→S以及Potsdam域判别器D _S和Vaihingen域判别器D _T，生成器网络结构为9层ResNet，判别器网络结构为4层CNN，训练损失函数包含循环一致损失函数、语义一致损失函数、对抗损失函数以及自损失函数，学习率为10 ^-4，优化算法为adam，训练100个epoch后停止，训练结束后得到Potsdam-Vaihingen方向的图像转换器G _S→T和10个Vaihingen-Potsdam方向的图像转换器G _T→S。然后用转换器G _S→T将4000张512*512像素，3通道的Potsdam卫星图像从Potsdam域转换到Vaihingen域，得到拟Vaihingen图像G _S→T(x _s)。再利用拟Vaihingen(目标域)图像G _S→T(x _s)和Potsdam(源域)标签y _s训练出拟Vaihingen(目标域)语义分割模型F _inter。

模型网络结构可采用常用的deeplab、U-net等，损失函数采用具有K类别的交叉熵损失，对应公式如下：

式中：x _s为源域图像，y _s为源域图像标签，K为标签类别数量，F _inter为目标域上的语义分割模型，

为指示函数(当k＝y _s时，

当k≠y _s时，

表示数学期望函数，G _S→T(x _s)为拟目标域图像，

为G _S→T(x _s)输入至模型F _inter中得到的输出结果中第k类的结果。

本实施方式使用步骤(1)中生成的4000张512*512像素，3通道的拟Vaihingen域图像G _S→T(x _s)和源域标签y _s训练Vaihingen域上的语义分割模型F _inter；模型网络结构采用deeplabV3+，学习率为10 ^-4，优化算法为adam，训练100个epoch得到拟Vaihingen域上的语义分割模型F _inter。

(2)将目标域图像x _t输入至源域-目标域域间语义分割模型F _inter中，得到目标域图像x _t的类别分割概率P _t，并利用类别分割概率P _t计算得到分割概率可信度S _T和目标域伪标签

本实施方式将500张512*512像素，3通道的Vaihingen域图像x _t输入至源域-目标域域间语义分割模型F _inter中，得到目标域图像x _t的类别分割概率P _t，并利用类别分割概率P _t计算得到分割概率可信度S _T和目标域伪标签

计算分割概率可信度S _t的计算方式如下：

其中：∑表示数学求和符号，∏表示数学乘积符号，H为目标域图像x _t的长度，W为目标域图像x _t的宽度，C为目标域图像x _t的分类类别数量，P _t为将目标域图像x _t输入语义分割模型F _inter后得到的类别分割概率(其大小为H×W×C的矩阵)，

为类别分割概率P _t中坐标为(h,w)，类别为c的像素点的类别分割概率，

为计算坐标为(h,w)的像素点每一类别c对应的类别分割概率的乘积。

利用类别分割概率P _t得到目标域伪标签

的方式如下：

其中：argmax为取最大值函数，

为类别分割概率P _t中坐标为(h,w)的像素点中类别分割概率最大的类别

μ ^c为用于生成类别c的伪标签的分割概率阈值，

为目标域图像x _t在坐标为(h,w)的像素点的分割概率混乱度，υ为用于生成伪标签的分割概率混乱度阈值。其中分割概率混乱度

的计算方式如下：

其中：∏表示数学乘积符号，H为目标域图像x _t的长度，W为目标域图像x _t的宽度，C为目标域图像x _t的分类类别数量，

(3)将500张Vaihingen(目标)域图像x _t的分割概率可信度S _t根据数值大小进行降序排序，并根据排序后的分割概率可信度S _t将目标域图像x _t平均分成4个目标域图像集合

(4)利用分割概率可信度最高的Vaihingen(目标)域图像子集

及其对应的伪标签子集

源域-目标域域间语义分割模型F _inter和目标域图像子集

迭代训练得到目标域域内语义分割模型F _intra。

本实施方式采用的域内单次域适应方式以基于对抗学习的方法做说明，但不仅限于基于对抗学习的方法。基于对抗学习的方法需要域内语义分割模型F _intra和判别器D _intra，训练损失函数包括语义分割损失函数和对抗损失函数。

语义分割损失函数的方程表达式如下：

式中：X _i为第i部分的目标域图像子集，y _i为x _i对应的伪标签子集，K为标签类别数量，F _intra为目标域上的语义分割模型，

为指示函数(当k＝Y _i时，

当k≠Y _i时，

表示数学期望函数，

为X _i输入至模型F _intra中得到的输出结果中第k类的结果。

对抗损失函数的方程表达式如下：

式中：X _i为第i部分的目标域图像子集，

为数学期望函数，D _intra为目标域判别器。

本实施方式需要进行3次迭代域内适应，首先第一次迭代将125张的目标域图像子集

和其对应的伪标签子集

分别加入原本为空的训练集

以及对应标签集

然后用125张的训练集

以及对应标签集

和125张的目标域图像子集

进行对抗训练，用源域-目标域域间语义分割模型F _inter作为初始目标域域内语义分割模型

分割模型网络结构采用deeplabV3+，判别器网络结构为4层CNN，学习率为10 ^-4，优化算法为adam，训练100个epoch后停止，训练结束后得到

将125张的目标域图像子集

输入至目标域域内语义分割模型

中，得到类别分割概率

并根据分割概率

得到目标域图像子集

的伪标签子集

将目标域图像子集

和对应伪标签子集

分别加入训练集

和对应标签集

中，然后用250张的训练集

以及对应标签集

和125张的目标域图像子集

以及域内语义分割模型

进行对抗训练，分割模型网络结构采用deeplabV3+，判别器网络结构为4层CNN，学习率为10 ^-4，优化算法为adam，训练100个epoch后停止，训练结束后得到

将125张的目标域图像子集

输入至目标域域内语义分割模型

中，得到类别分割概率

并根据分割概率

得到目标域图像子集

的伪标签子集

将目标域图像子集

和对应伪标签子集

分别加入训练集

和对应标签集

中，然后用375张的训练集

以及对应标签集

和125张的目标域图像子集

以及域内语义分割模型

进行对抗训练，分割模型网络结构采用deeplabV3+，判别器网络结构为4层CNN，学习率为10 ^-4，优化算法为adam，训练100个epoch后停止，训练结束后得到最终的目标域域内语义分割模型F _intra

(5)将目标域图像x _t输入至目标域域内语义分割模型F _intra中，得到目标域图像x _t最终的分割结果map。

表1为通过相关实验测试出的迁移前、直方图匹配(传统方法)、基于GAN的域间域适应方法、单次域内域适应以及本发明迭代域内域适应策略得到的结果与标签真值计算得到的precision、recall、F1和IoU指标。

表1

	迁移前	直方图匹配	域间域适应	域内域适应	迭代域内域适应
precision	0.8387	0.4184	0.8920	0.8899	0.8884
recall	0.1548	0.2847	0.3704	0.4033	0.4226
F1	0.2614	0.3389	0.5234	0.5551	0.5728
IoU	0.1503	0.2040	0.3545	0.3841	0.4013

从上述实验结果可以看出，本实施方式与迁移前相比有效的提升语义分割的IoU指标，提升达到了0.2510。同时，与简单的直方图匹配相比，本实施方式的IoU指标也提升了0.1973；将单次域内域适应和域间域适应相比，单次域内域适应的IoU指标提升了0.0296，这说明了域内域适应能减少域内差异。与此同时，迭代域内域适应与单次域内域适应相比，IoU指标进一步提升了0.0172，这说明了迭代域内域适应能进一步减少域内差异。因此，本发明对提高跨卫星遥感图像语义分割的性能有很大的帮助。

上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明，熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims

一种基于迭代域内适应和自训练的跨域遥感图像语义分割方法，包括如下步骤：

(1)利用源域图像x _s、源域标签y _s、源域语义分割模型F _S以及目标域图像x _t训练出源域-目标域域间语义分割模型F _inter；

(2)将目标域图像x _t输入至源域-目标域域间语义分割模型F _inter中，得到目标域图像x _t的类别分割概率P _t，进而利用类别分割概率P _t计算出分割概率可信度S _t和目标域伪标签

(3)将所有目标域图像x _t根据分割概率可信度S _t大小进行降序排列，进而根据排列次序将所有目标域图像x _t平均分成K个目标域图像子集
K为大于1的自然数；

(4)利用分割概率可信度最高的一组目标域图像子集
及其对应的伪标签子集
以及源域-目标域域间语义分割模型F _inter和目标域图像子集
迭代训练出目标域域内语义分割模型F _intra；

(5)将目标域图像x _t输入至目标域域内语义分割模型F _intra中，即可得到目标域图像x _t最终的类别分割概率P及分割结果map。
根据权利要求1所述的跨域遥感图像语义分割方法，其特征在于：所述步骤(1)的具体实现过程如下：

1.1利用源域图像x _s和源域标签y _s训练出源域语义分割模型F _S；

1.2利用源域图像x _s以及目标域图像x _t训练源-目标域图像双向转换器，其包含源→目标方向的图像转换器和目标→源方向的图像转换器；

1.3对于上述训练过程中生成的所有图像转换器的中间保存模型，从中选择一组最优的结果作为源→目标方向的图像转换器G _S→T和目标→源方向的图像转换器G _T→S；

1.4利用图像转换器G _S→T将源域图像x _s从源域转换到目标域，得到拟目标域图像G _S→T(x _s)；

1.5利用拟目标域图像G _S→T(x _s)和源域标签y _s训练出源域-目标域域间语义分割模型F _inter。
根据权利要求1所述的跨域遥感图像语义分割方法，其特征在于：所述步骤(2)中分割概率可信度S _t的计算表达式如下：

其中：H和W分别为目标域图像x _t的长度和宽度，C为目标域图像x _t的分割类别数量，
表示目标域图像x _t中坐标为(h,w)的像素点对应类别c _i的分割概率，c _i表示第i个类别，i为自然数且1≤i≤C，θ()为用于度量像素点各类别分割概率之间似然度的函数。
根据权利要求1所述的跨域遥感图像语义分割方法，其特征在于：所述步骤(2)中目标域伪标签
的计算表达式如下：

其中：
表示目标域伪标签
中坐标为(h,w)的像素点的类别，
表示目标域图像x _t中坐标为(h,w)的像素点对应类别c的分割概率，μ ^c为类别c对应的分割概率阈值，
表示目标域图像x _t中坐标为(h,w)的像素点对应类别c _i的分割概率，c _i表示第i个类别，i为自然数且1≤i≤C，C为目标域图像x _t的分割类别数量，
表示目标域图像x _t中坐标为(h,w)的像素点的分割概率混乱度，v为分割概率混乱度阈值。
根据权利要求4所述的跨域遥感图像语义分割方法，其特征在于：所述分割概率混乱度
的计算表达式如下：

其中：δ()为用于度量像素点各类别分割概率之间混乱程度的函数。
根据权利要求1所述的跨域遥感图像语义分割方法，其特征在于：所述步骤(4)的具体实现过程如下：

4.1初始将分割概率可信度最高的一组目标域图像子集
及其对应的伪标签子集
作为训练集
及其对应的标签集
将源域-目标域域间语义分割模型F _inter作为目标域域内语义分割模型

4.2利用训练集
标签集
目标域域内语义分割模型
以及目标域图像子集
训练出目标域域内语义分割模型
k为自然数且2≤k≤K；

4.3将目标域图像子集
输入至目标域域内语义分割模型
中，得到对应的类别分割概率
进而利用该类别分割概率
计算出目标域图像子集
的伪标签子集

4.4将目标域图像子集
及其伪标签子集
分别加入到训练集
和标签集
中；

4.5令k＝k+1；

4.6重复执行步骤4.2～4.5，直至k＝K，训练得到目标域域内语义分割模型
即作为目标域域内语义分割模型F _intra。
根据权利要求1所述的跨域遥感图像语义分割方法，其特征在于：该方法是一个完整的跨域遥感图像语义分割框架，包含源域-目标域域间域适应模型训练、目标域类别分割概率以及伪标签生成、目标域图像分割概率可信度得分排序、目标域域内迭代域适应模型训练和目标域分割结果生成。