CN113221905B

CN113221905B - 基于均匀聚类的语义分割的无监督域适应方法、装置、系统和存储介质

Info

Publication number: CN113221905B
Application number: CN202110539925.3A
Authority: CN
Inventors: 尹建伟; 苏鸽; 尚永衡; 杨莹春; 邓水光
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-05-18
Filing date: 2021-05-18
Publication date: 2022-05-17
Anticipated expiration: 2041-05-18
Also published as: CN113221905A; US11734390B2; US20220383052A1

Abstract

本发明公开了一种基于均匀聚类的语义分割的无监督域适应方法、装置、系统和存储介质，首先，建立了基于原型的源域均匀聚类损失和基于经验原型的目标域均匀聚类损失，缩小了同一类别像素的类内差异，同时驱动结构相似但类别不同的像素相互远离，趋向均匀分布，增大了类间距离，克服了域适应过程中类别边界不清晰的问题；接着，将基于原型的源域均匀聚类损失和基于经验原型的目标域均匀聚类损失融入对抗训练框架，缩小了源域和目标域之间的域差异，增强了跨域数据在语义分割模型上的适应性，进而提升了语义分割的准确性。

Description

基于均匀聚类的语义分割的无监督域适应方法、装置、系统和存储介质

技术领域

本发明属于无监督域适应领域，具体涉及一种基于均匀聚类的语义分割的无监督域适应方法、装置、系统和存储介质。

背景技术

在过去的几十年里，基于卷积神经网络的语义分割模型依赖大规模标注数据集取得了卓越的成功并在自动驾驶、机器人等领域展现了极大的潜力。可是，这些大规模标注数据集需要具备专业知识的技术人员长期密集地手工标注，这消耗了昂贵的人力成本和时间成本。

为缓解这一问题，最近的研究工作逐步尝试合成数据集，例如：GTA5、SYNTHIA和Synscapes。合成数据集可由游戏引擎或模拟器自动合成，降低了人力成本。然而，由于域差异，这些基于合成数据集的训练模型不能很好地应用到真实场景。因此，无监督域适应技术被提出，旨在将具备标签的源域知识迁移到无标签的目标域。

在无监督域适应任务中，大多数方法利用最小化源域和目标域之间的域差异来获取域不变特征，同时利用聚类或者重加权策略获取任务可判别的特征。一方面，减小域差异可泛化模型至目标域；另一方面，学习可判别特征提升了分类准确率。可是，大量的实验表明学习的语义特征是类别边界不清晰的，导致一些小的和密集性的物体难以区分。例如：一些重要的交通信号灯常常被分类模型误认为背景建筑物，这会造成严重的安全事故，在真实应用场景中是难以容忍的。因此，需要解决无监督域适应任务中类别边界不清晰问题。

目前，主流的无监督域适应技术以对抗训练为核心，通过一个域判别器对齐源域和目标域。可是，这些对抗训练方法忽略了像素级别的类别结构。最近的工作，例如：SSF-DAN、MaxSquare，利用类别级别的判别器和重加权策略改善了语义特征的类别结构。然而，这些间接的策略依然没有克服类别结构不清晰的问题。另一方面，大多数基于聚类的无监督域适应方法虽然调节了类别结构，但是主要被应用到图像级别的分类任务，没有考虑高维的语义特征空间，导致有限的识别语义信息的能力。

因此，探索一种应用于语义分割任务的类别结构清晰的无监督域适应方法，进而来提升语义分割模型的语义标签预测能力，成为一个亟待解决的技术问题。

发明内容

鉴于上述，本发明的目的是提供一种基于均匀聚类的语义分割的无监督域适应方法，通过克服无监督域适应任务中类别边界不清晰的技术缺陷，来提升语义分割的准确性。

为实现上述目的，本发明提供了如下方案：

第一方面，实施例提供的一种基于均匀聚类的语义分割的无监督域适应方法，包括以下步骤：

建立具备标签的源域数据集和不具备标签的目标域数据集；所述源域数据集包括源域图像、源域图像的语义标签，所述目标域数据集包括目标域图像；

建立无监督域适应网络模型；所述无监督域适应网络模型包括用于对源域图像和目标域图像进行语义分割的语义分割网络模型和用于对抗训练的判别器模型；

建立无监督域适应网络模型的目标函数；所述无监督域适应网络模型的目标函数包括用于监督语义分割网络模型性能的语义分割损失、基于原型的源域均匀聚类损失、基于经验原型的目标域均匀聚类损失和用于监督判别器模型性能的对抗损失；

利用源域数据集和目标域数据集，并采用目标函数优化无监督域适应网络模型的网络参数，得到参数优化后的语义分割网络模型；

利用参数优化后的语义分割网络模型对待检测的目标域图像进行检测，得到目标域图像的语义标签。

第二方面，实施例提供的一种基于均匀聚类的语义分割的无监督域适应装置，包括：

数据集构建模块，用于建立具备标签的源域数据集和不具备标签的目标域数据集；所述源域数据集包括源域图像、源域图像的语义标签，所述目标域数据集包括目标域图像；

模型构建模块，用于建立无监督域适应网络模型；所述无监督域适应网络模型包括用于对源域图像和目标域图像进行语义分割的语义分割网络模型和用于对抗训练的判别器模型；

目标函数构建模块，用于建立无监督域适应网络模型的目标函数；所述无监督域适应网络模型的目标函数包括用于监督语义分割网络模型性能的语义分割损失、基于原型的源域均匀聚类损失、基于经验原型的目标域均匀聚类损失和用于监督判别器模型性能的对抗损失；

参数优化模块，用于利用源域数据集和目标域数据集，并采用目标函数优化无监督域适应网络模型的网络参数，得到参数优化后的语义分割网络模型；

检测模块，用于利用参数优化后的语义分割网络模型对待检测的目标域图像进行检测，得到目标域图像的语义标签。

第三方面，实施例提供的一种基于均匀聚类的语义分割的无监督域适应系统，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现第一方面所述的基于均匀聚类的语义分割的无监督域适应方法。

第四方面，实施例提供的一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理执行时实现第一方面所述的基于均匀聚类的语义分割的无监督域适应方法的步骤。

上述实施例提供的基于均匀聚类的语义分割的无监督域适应方法、装置、系统和存储介质，与现有技术相比，具有的有益效果至少包括：

首先，建立了基于原型的源域均匀聚类损失和基于经验原型的目标域均匀聚类损失，缩小了同一类别像素的类内差异，同时驱动结构相似但类别不同的像素相互远离，趋向均匀分布，增大了类间距离，克服了域适应过程中类别边界不清晰的问题；接着，将基于原型的源域均匀聚类损失和基于经验原型的目标域均匀聚类损失融入对抗训练框架，缩小了源域和目标域之间的域差异，增强了跨域数据在语义分割模型上的适应性，进而提升了语义分割的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动前提下，还可以根据这些附图获得其他附图。

图1是一实施例中基于均匀聚类的语义分割的无监督域适应方法的流程图；

图2是一实施例中无监督域适应网络模型及训练过程示意图；

图3是一实施例中无监督域适应网络模型的目标函数中均匀聚类的原理示意图；

图4是一实施例中基于均匀聚类的语义分割的无监督域适应装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

当前主流的无监督域适应方法主要以对抗训练为基础框架，通过对齐源域特征和目标域特征缩小了域差异。这些方法虽然增强了模型的泛化能力，但是忽略了特征的边界结构存在歧义，进而导致类别边界不清晰的技术缺陷，为了解决由于类别边界不清晰的技术缺陷导致语义分割不准确的问题，本发明实施例提出了一种基于均匀聚类的语义分割的无监督域适应方法，旨在通过驱动不同类别的特征结构趋于均匀分布来最大化类间距离，同时最小化类内差异，形成边界清晰的类别结构，另外，本发明还融合现有的对抗训练损失，对齐源域和目标域之间类别结构清晰的深度特征，实现了源域知识至目标域知识的迁移。实施例提供的基于均匀聚类的语义分割的无监督域适应方法可以应用到从虚拟场景到真实场景的域适应任务，例如：使用虚拟数据集GTA5训练获得的模型适用于真实数据集Cityscapes，还可以应用到自动驾驶领域和机器人领域。

图1是一实施例中基于均匀聚类的语义分割的无监督域适应方法的流程图。图2是一实施例中无监督域适应网络模型及训练过程示意图。图3是一实施例中无监督域适应网络模型的目标函数中均匀聚类的原理示意图。

如图1-图3所示，实施例提供的基于均匀聚类的语义分割的无监督域适应方法，包括以下步骤：

步骤1，建立具备标签的源域数据集和不具备标签的目标域数据集。

实施例中，源域数据集包括源域图像、源域图像的语义标签，其中，语义标签是指图像中需要分割的某一类目标的标签。目标域数据集不具有标签，所以只包括目标域图像。这些源域图像、源域图像的语义标签、目标域图像分别构成源域图像集合、源域图像的语义标签集合、目标域图像集合，用于无监督域适应网络模型的训练。

步骤2，建立无监督域适应网络模型。

实施例中，建立的无监督域适应网络模型包括语义分割网络模型和判别器模型，其中，语义分割网络模型中生成器和判别器模型采用对抗训练的方式相互优化。语义分割网络模型主要用于对源域图像和目标域图像进行语义分割得到语义分割结果，判别器模型用于对抗训练，即判别输入的语义分割结果是来自于目标域图像还是源域图像。

实施例中，语义分割网络模型和判别器模型采用但不限于以下网络结构，下面提供一个可用的语义分割网络模型和判别器模型示例。所述语义分割网络模型采用ResNet为基础框架并利用ImageNet数据集预训练得到，包括特征生成器和分类器；所述判别器模型包括顺序连接的多个Block块和多个卷积层，其中，Block块包括顺序连接的卷积层和激活层。

可选地，语义分割网络模型可采用以ResNet-101为基础框架并使用ImageNet数据集预训练的Deeplab-v2网络模型，包含特征生成器和分类器。

判别器模型是一个由复合组件和基本组件按顺序堆叠组成的神经网络，其中，复合组件由基本组件按顺序堆叠构成，基础组件包括一个输入通道数为α、输出通道数为β、核尺寸为4×4、步幅为2的卷积层，一个LeakyReLU激活层，复合组件记作Block(α,β)，α、β是复合组件的参数。基于此，判别器模型由以下组件按顺序堆叠构成：Block(C,64)、Block(64,128)、Block(128,256)、Block(256,512)和一个输入通道数为512、输出通道数为1、核尺寸为4×4、步幅为2的卷积层，其中，C表示语义分割网络模型的分类类别的总数量。

步骤3，建立无监督域适应网络模型的目标函数。

实施例中，建立的无监督域适应网络模型的目标函数包括用于监督语义分割网络模型性能的语义分割损失、基于原型的源域均匀聚类损失、基于经验原型的目标域均匀聚类损失和用于监督判别器模型性能的对抗损失。具体而言，语义分割损失、源域均匀聚类损失、目标域均匀聚类损失以及对抗损失加权求和组成无监督域适应网络模型的目标函数；优选地，各损失的权重均为1。下面针对每个损失进行详细说明。

针对语义分割损失，实施例中，采用源域图像相对于语义分割网络模型的交叉熵损失作为监督语义分割网络模型性能的语义分割损失。其中，语义分割损失表示为

计算过程为：

其中，

是语义分割网络模型的交叉熵损失，

表示源域图像xs中(h，w)位置像素

是否属于类别c的语义标签，

是语义分割网络模型对源域图像x_s中(h，w)位置像素

预测为类别c的概率，S＝{X_s，Y_s}表示源域数据集，X_s是源域图像集合，Y_s是源域图像的语义标签集合，H、W分别表示图像高度和宽度，C表示语义分割网络模型的分类类别的总数量，其中，

x_s∈X_s，

y_s∈Y_s。f表示语义分割网络模型的特征生成器，Θ是f的参数；

表示语义分割网络模型的分类器，θ是

的参数，

表示特征生成器f从源域图像x_s中(h，w)位置像素

提取的特征，

表示分类器按照特征

做出的预测结果。

针对源域均匀聚类损失，实施例中，基于原型的源域均匀聚类损失用于减小源域类内差异、增大类间距离，表示为

计算过程为：

针对目标域均匀聚类损失，实施例中，基于经验原型的目标域均匀聚类损失用于减小目标域类内差异、增大类间距离，表示为

计算过程为：

其中，σ是激活函数，

表示如果像素

的语义标签

属于类别c即输出1，如果像素

的语义标签

不属于类别c即输出0，

表示源域图像x_s中(h，w)位置像素

提取的特征

与类别c的原型表示

之间的L-2范数的平方，

表示源域图像中预测为类别c的像素的经验概率，

表示特征生成器f从目标域图像x_t中(h，w)位置像素

提取的特征，

表示分类器按照特征

做出的预测结果，

表示目标域图像x_t中(h，w)位置像素

提取的特征与类别c的经验原型表示

之间的L-2范数的平方，

表示目标域图像中预测为类别c的像素的经验概率。

实施例中，原型表示

依据源域图像x_s的特征

计算得到，所述经验原型表示

依据目标域图像x_t的特征

计算得到；所述经验概率

依据分类器

对特征

做出相对于类别c的预测结果

计算得到；所述经验概率

依据分类器

对特征

做出相对于类别c的预测结果

计算得到。具体计算过程为：

其中，S^c是源域数据集S的子集，表示属于类别c的源域像素集合，|S^c|表示S^c集合的模；T＝{X_t}表示目标域数据集，X_t是目标域图像集合，T^c是目标域数据集T的子集，表示预测为类别c的目标域像素集合，|T^c|表示T^c集合的模，

x_t∈X_t；

表示分类器

按照特征

做出的预测结果。

针对对抗损失，实施例中，用于监督判别器模型性能的对抗损失采用

表示，计算过程为：

其中，

是源域图像x_s中(h，w)位置像素

的熵图，

是目标域图像x_t中(h，w)位置像素

的熵图，D()表示判别器模型D判断输入熵图来自目标域的域概率，域概率越接近1，输入熵图来自目标域的概率越高，域概率越接近0，输入熵图来自源域的概率越高。

实施例中，熵图

熵图

通过以下公式计算得到：

基于以上语义分割损失

源域均匀聚类损失

目标域均匀聚类损失

以及对抗损失

建立的目标函数

可以为：

通过该目标函数

并结合训练样本来优化无监督域适应网络模型的参数。

步骤4，利用源域数据集和目标域数据集，并采用目标函数优化无监督域适应网络模型的网络参数，得到参数优化后的语义分割网络模型。

实施例中，在对无监督域适应网络模型进行参数优化时，固定判别器模型的网络参数，分别计算语义分割损失对应的语义分割网络模型的参数梯度，源域均匀聚类损失对应的语义分割网络模型的参数梯度，目标域均匀聚类损失的对应的语义分割网络模型的参数梯度；计算对抗损失

对于语义分割网络模型和判别器模型的参数梯度；依据参数梯度更新语义分割网络模型的网络参数和判别器模型的参数梯度。具体过程包括：

训练的初始化阶段，从源域图像集合、源域图像的语义标签集合和目标域图像集合获取预设个数的训练数据样本，组成训练数据样本集合；建立语义分割网络模型的框架并导入基于ImageNet数据集预训练的参数，建立判别器模型的框架并随机初始化判别器模型参数；建立随机梯度下降(SGD)优化器和自适应矩估计(Adam)优化器；设置模型迭代训练的次数N和最优目标损失函数数值

例如设置N可以为120,000，

可以为100，并保存当前语义分割网络模型作为最优语义分割网络模型，保存当前判别器模型作为最优判别器模型；将所述训练数据样本集合中的第i个训练数据样本输入所述的无监督域适应网络模型，第i个训练数据样本包括一幅源域图像、一幅源域图像的语义标签、一幅目标域图像；设置域标签，源域域标签设置为0，目标域域标签设置为1；初始化语义分割网络模型的参数梯度为0，初始化判别器模型的参数梯度为0。

训练阶段，首先，固定判别器模型参数，具体包括：使用所述语义分割网络模型预测第i个训练数据样本中源域图像的语义分割结果，并按照公式

使用源域图像的语义标签和源域图像的语义分割结果计算语义分割损失

将语义分割损失数值反向传播计算语义分割网络模型的参数梯度。

实施例中，从源域图像的语义分割结果中筛选高置信度的源域图像的语义分割结果，依据高置信度的源域图像的语义分割结果计算源域均匀聚类损失。具体过程可以为：

保留源域图像的语义分割结果中每个类别预测概率排名前b％的像素并将源域图像的语义分割结果中每个类别预测概率排名不在前b％的像素概率设置为0，获得高置信度的源域图像的语义分割结果，实施例中，b％可设置为30％；按照公式

使用源域图像、源域图像的语义标签和高置信度的源域图像的语义分割结果计算基于原型的源域均匀聚类损失

将基于原型的源域均匀聚类损失数值反向传播计算语义分割网络模型的参数梯度。

实施例中，使用所述语义分割网络模型预测第i个训练数据样本中目标域图像的语义分割结果。从目标域图像的语义分割结果中筛选高置信度的目标域图像的语义分割结果，依据高置信度的目标域图像的语义分割结果计算目标域均匀聚类损失。具体过程可以为：

保留目标域图像的语义分割结果中每个类别预测概率排名前b％的像素并将目标域图像的语义分割结果中每个类别预测概率排名不在前b％的像素概率设置为0，获得高置信度的目标域图像的语义分割结果；按照公式

使用目标域图像和高置信度的目标域图像的语义分割结果计算基于经验原型的目标域均匀聚类损失

将基于经验原型的目标域均匀聚类损失数值反向传播计算语义分割网络模型的参数梯度。

实施例中，按照公式

使用源域图像的语义分割结果计算源域图像语义分割结果熵图；按照公式

使用目标域图像的语义分割结果计算目标域图像语义分割结果熵图。

输入目标域图像语义分割结果熵图到判别器模型，输出目标域图像语义分割结果熵图的域概率，计算目标域图像语义分割结果熵图的域概率和源域域标签的二进制交叉熵损失，将目标域图像语义分割结果熵图的域概率和源域域标签的二进制交叉熵损失数值反向传播计算语义分割网络模型的参数梯度。

然后，固定语义分割网络模型参数并设置判别器模型参数为可更新状态，包括：输入源域图像语义分割结果熵图到判别器模型，输出源域图像语义分割结果熵图的域概率，计算源域图像语义分割结果熵图的域概率和源域域标签的二进制交叉熵损失，将源域图像语义分割结果熵图的域概率和源域域标签的二进制交叉熵损失数值反向传播计算判别器模型的参数梯度。

输入目标域图像语义分割结果熵图到判别器模型，输出目标域图像语义分割结果熵图的域概率，计算目标域图像语义分割结果熵图的域概率和目标域域标签的二进制交叉熵损失，将目标域图像语义分割结果熵图的域概率和目标域域标签的二进制交叉熵损失数值反向传播计算判别器模型的参数梯度。

实施例中，基于上述参数梯度，使用随机梯度下降(SGD)优化器更新语义分割网络模型参数；使用自适应矩估计(Adam)优化器更新判别器模型参数。

在训练时，还按照公式

计算无监督域适应网络模型的目标函数

数值，判断无监督域适应网络模型的目标函数

数值是否小于最优目标损失函数数值

得到第一判断结果；如果第一判断结果表示是，则使用当前语义分割网络模型参数更新最优语义分割网络模型，使用当前判别器模型参数更新最优判别器模型，并使用无监督域适应网络模型的目标函数数值更新最优目标损失函数数值

如果第一判断结果表示否，则继续迭代次数的判断步骤。

在训练时，还判断i是否大于模型迭代训练的次数N，得到第二判断结果；如果第二判断结果表示否，则令i的数值增加1，使用多项式衰减策略更新随机梯度下降(SGD)优化器和自适应矩估计(Adam)优化器的学习率，返回步骤“将所述训练数据样本集合中的第i个训练数据样本输入所述的无监督域适应网络模型，第i个训练数据样本包括一幅源域图像、一幅源域图像的语义标签、一幅目标域图像”；如果第二判断结果表示是，则输出最优语义分割网络模型和最优判别器模型。

步骤5，利用参数优化后的语义分割网络模型对待检测的目标域图像进行检测，得到目标域图像的语义标签。

训练结束后，即可以利用参数优化的语义分割网络模型进行语义分割任务。可以将选择的待预测的目标域图像输入至语义分割网络模型，经计算获得目标域图像的语义标签。

上述基于均匀聚类的语义分割的无监督域适应方法，在语义分割模型的域适应场景下提出的，且具备标签的源域数据集和不具备标签的目标域数据集是可获取的。其次，提出了基于原型的源域均匀聚类损失和基于经验原型的目标域均匀聚类损失，缩小了同一类别像素的类内差异，同时驱动结构相似但类别不同的像素相互远离，趋向均匀分布，增大了类间距离，克服了域适应过程中类别边界不清晰的问题；接着，将基于原型的源域均匀聚类损失和基于经验原型的目标域均匀聚类损失融入对抗训练框架，缩小了源域和目标域之间的域差异，增强了跨域数据在语义分割模型上的适应性。

实施例还提供了一种基于均匀聚类的语义分割的无监督域适应装置，如图4所示，无监督域适应装置400包括：

数据集构建模块410，用于建立具备标签的源域数据集和不具备标签的目标域数据集；所述源域数据集包括源域图像、源域图像的语义标签，所述目标域数据集包括目标域图像；

模型构建模块420，用于建立无监督域适应网络模型；所述无监督域适应网络模型包括用于对源域图像和目标域图像进行语义分割的语义分割网络模型和用于对抗训练的判别器模型；

目标函数构建模块430，用于建立无监督域适应网络模型的目标函数；所述无监督域适应网络模型的目标函数包括用于监督语义分割网络模型性能的语义分割损失、基于原型的源域均匀聚类损失、基于经验原型的目标域均匀聚类损失和用于监督判别器模型性能的对抗损失；

参数优化模块440，用于利用源域数据集和目标域数据集，并采用目标函数优化无监督域适应网络模型的网络参数，得到参数优化后的语义分割网络模型；

检测模块450，用于利用参数优化后的语义分割网络模型对待检测的目标域图像进行检测，得到目标域图像的语义标签。

需要说明的是，实施例提供的基于均匀聚类的语义分割的无监督域适应装置在进行语义分割学习和应用过程时，应以上述各功能模块的划分进行举例说明，可以根据需要将上述功能分配由不同的功能模块完成，即在终端或服务器的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，实施例提供的无监督域适应装置与无监督域适应方法实施例属于同一构思，其具体实现过程详见基于均匀聚类的语义分割的无监督域适应方法实施例，这里不再赘述。

实施例还提供了一种基于均匀聚类的语义分割的无监督域适应系统，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序，所述处理器执行所述计算机程序时实现上述基于均匀聚类的语义分割的无监督域适应方法，具体包括：

步骤1，建立具备标签的源域数据集和不具备标签的目标域数据集；

步骤2，建立无监督域适应网络模型；

步骤3，建立无监督域适应网络模型的目标函数；

步骤4，利用源域数据集和目标域数据集，并采用目标函数优化无监督域适应网络模型的网络参数，得到参数优化后的语义分割网络模型；

实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理执行时实现上述基于均匀聚类的语义分割的无监督域适应方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的最优选实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换等，均应包含在本发明的保护范围之内。

Claims

1.一种基于均匀聚类的语义分割的无监督域适应方法，其特征在于，包括以下步骤：

其中，采用源域图像相对于语义分割网络模型的交叉熵损失作为监督语义分割网络模型性能的语义分割损失；

所述基于原型的源域均匀聚类损失用于减小类内差异、增大类间距离，表示为

计算过程为：

所述基于经验原型的目标域均匀聚类损失用于减小类内差异、增大类间距离，表示为

计算过程为：

其中，σ是激活函数，

表示如果像素

的语义标签

属于类别c即输出1，如果像素

的语义标签

不属于类别c即输出0，

表示源域图像x_s中(h,w)位置像素

提取的特征

与类别c的原型表示

之间的L-2范数的平方，

表示源域图像中预测为类别c的像素的经验概率，

表示特征生成器f从目标域图像x_t中(h,w)位置像素

提取的特征，

表示分类器按照特征

做出的预测结果，

表示目标域图像x_t中(h,w)位置像素

提取的特征与类别c的经验原型表示

之间的L-2范数的平方，

表示目标域图像中预测为类别c的像素的经验概率，C表示语义分割网络模型的分类类别的总数量，Θ是特征生成器f的参数；θ是分类器

的参数；

其中，所述原型表示

依据源域图像x_s的特征

计算得到，所述经验原型表示

依据目标域图像x_t的特征

计算得到；

所述经验概率

依据分类器

对特征

做出相对于类别c的预测结果

计算得到；

所述经验概率

依据分类器

对特征

做出相对于类别c的预测结果

计算得到；

所述用于监督判别器模型性能的对抗损失采用

表示，计算过程为：

其中，

是源域图像x_s中(h,w)位置像素

的熵图，

是目标域图像x_t中(h,w)位置像素

的熵图，D()表示判别器模型D判断输入熵图来自目标域的域概率；

所述熵图

熵图

通过以下公式计算得到：

2.如权利要求1所述的基于均匀聚类的语义分割的无监督域适应方法，其特征在于，所述语义分割网络模型采用ResNet为基础框架并经过图像预训练得到，包括特征生成器和分类器；所述判别器模型包括顺序连接的多个Block块和多个卷积层，其中，Block块包括顺序连接的卷积层和激活层。

3.如权利要求1所述的基于均匀聚类的语义分割的无监督域适应方法，其特征在于，所述语义分割损失、源域均匀聚类损失、目标域均匀聚类损失以及对抗损失加权求和组成无监督域适应网络模型的目标函数；优选地，各损失的权重均为1；

在对无监督域适应网络模型进行参数优化时，固定判别器模型的网络参数，分别计算语义分割损失对应的语义分割网络模型的参数梯度，源域均匀聚类损失对应的语义分割网络模型的参数梯度，目标域均匀聚类损失的对应的语义分割网络模型的参数梯度；计算对抗损失对于语义分割网络模型和判别器模型的参数梯度；依据参数梯度更新语义分割网络模型的网络参数和判别器模型的参数梯度。

4.如权利要求1或3所述的基于均匀聚类的语义分割的无监督域适应方法，其特征在于，从源域图像的语义分割结果中筛选高置信度的源域图像的语义分割结果，依据高置信度的源域图像的语义分割结果计算源域均匀聚类损失；

从目标域图像的语义分割结果中筛选高置信度的目标域图像的语义分割结果，依据高置信度的目标域图像的语义分割结果计算目标域均匀聚类损失。

5.一种基于均匀聚类的语义分割的无监督域适应装置，其特征在于，包括：