CN112541580A

CN112541580A - 一种基于主动对抗学习的半监督域自适应方法

Info

Publication number: CN112541580A
Application number: CN202011643102.7A
Authority: CN
Inventors: 朱旗; 徐翔宇; 杨启明; 张道强
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2020-12-31
Filing date: 2020-12-31
Publication date: 2021-03-23

Abstract

本发明公开了一种基于主动对抗学习的半监督域自适应方法。由于源领域和目标领域之间的领域迁移，常常导致学习性能下降，现实中的许多机器学习任务都可以归结为领域适应问题。当前的大部分工作都集中在无监督域自适应(UDA)上，他们试图通过深度神经网络来减轻源域和目标域之间的分布差异。由于缺少目标域数据的标签信息，当域偏移较大时，UDA方法可能会导致负迁移。在合理的假设下，即使目标域中有限的标记数据也可以促进域适应性学习，本发明公开了一种采用主动对抗方法的半监督域适应方法。具体来说，我们首先使用领域对抗训练来减轻领域偏移。然后，我们通过主动学习方法标记最有价值的目标域数据。最后，我们使用多类判别器缓解了标记的目标域样本与源域样本之间的分布差异。

Description

一种基于主动对抗学习的半监督域自适应方法

技术领域

本发明属于机器学习领域，具体涉及基于主动对抗学习的半监督域自适应方法。

背景技术

一般而言，如果我们可以获得更多的标签信息，我们将训练一个更好的模型来完成诸如分类，分割和回归之类的任务。但是这种情况非常苛刻，一般要求我们的数据来自于同一分布中。收集来自相同分布的数据并对其进行标记可能既费时又费力。在实际遇到的问题中，我们的数据通常是异类的，例如不同相机拍摄的照片，不同网站收集的图片以及多家医院的医学图像数据。在这种情况下，直接训练数据并不总是会产生令人满意的结果。域自适应主要是用来解决域偏移的问题，一般将样本量大且具有标记信息的域称为源域，然后将样本最相对较少且缺乏标记的域称为目标域。域自适应可以是监督的，无监督的或半监督的，这取决于目标域有多少已标记的样本信息。目前针对域自适应问题提出的方法都是基于无监督的，这经常会带来一个问题，在没有任何目标域标记的情况下，当源域和目标域之间的分布差异稍大的话就会造成严重的负迁移的情况，使得源域和目标域不同类的样本被误认为是同一类而进行分布的对齐。基于对抗方式的域自适应方法是目前最流行的域自适应算法，其主要思想是通过判别器网络与特征提取网络进行一个博弈从而使得源域和目标与的分布被对齐。由于缺少目标域的标记，在对齐的时候缺少目标域的鉴别信息很容易导致错误的对齐从而造成错误的学习。但是如果大量的在目标域进行标记就失去问题本身的意义，依然会造成很多不必要的资源浪费且耗时耗力。因此利用目标域上尽量少的标记样本且能更好的辅助域间迁移问题会很有意义。不同样本对于模型的学习起到的作用是不同的。主动学习通过挑选重要性的样本在降低标注代价的同时更好的学习模型。

发明内容

发明目的：为了克服现有域自适应中域间偏移问题，本发明提供一种基于主动对抗学习的半监督域自适应方法。

技术方案：为实现上述目的，本发明采用的技术方案为：

一种基于主动对抗学习的半监督域自适应方法，包括以下步骤：

(一)初始化特征提取网络E以及域判别器D和分类器C。

(二)利用域判别器和分类器来训练网络E，进行一个对抗的博弈从而提取与不变的特征。

(三)通过主动学习的策略从目标域样本中挑选少量有价值的标签进行标记。

(四)单次挑选的目标域样本量标记后，跳转到步骤(五)。

(五)利用少量标记标签的目标域样本和源于样本按类分组训练多类判别器来辅助目标域和源域更好的迁移。

(六)重复上述步骤训练，直到挑选出的目标域样本数量达到设定的最大值；

进一步的，所述步骤(二)实现域自适应对抗训练的具体方法：

在原始特征经过卷积神经网络的特征提取器E之后，我们使用域判别器D来分辨数据来自源域或是目标域，特征提取器通过混淆判别器来起到一个相互博弈的效果，以此来拉近两个分布的距离。同时使用带标签的源域和目标域数据经过全连接分类器C来训练特征提取器E。与原始的生成对抗网络相似，特征提取器E的任务是去让域标签尽可能不被判别器D识别出来。对于与判别器的域标签信息，我们将源域数据标记为0，目标域标记为1。然后样本可以通过特征提取器E从原始空间被投影到源域和目标域数据难以分辨的空间。对抗损失如下所示：

θ_E和θ_D是特征提取器E的与判别器D的参数。在域偏移被减轻的同时，我们可以使用已标记的样本信息训练分类器，从而使特征提取器E的特征更具有鉴别性。理想情况下我们可以在未标记标签的目标域样本下也有好的分类效果。分类损失可以用如下标准的交叉熵损失表示：

α是平衡调节参数，θ_Y是分类器C的参数。因此，域对抗架构部分的学习目标函数可以被计算如下：

β是调节两个损失的平衡参数。

进一步的，所述步骤(三)用主动学习策略挑选按目标域样本的具体方法为：

不同于无监督域自适应中目标域的样本都没有标记，在半监督的设置下我们可以尽量挑选出少的目标域样本去标记。我们需要尽量少的去挑选一些在目标域对域自适应任务最有价值的样本。主动学习的提出正是旨在用有限的标注代价最大化模型的效果。所有主动学习任务的场景都涉及评估未标记样本的信息量。最简单和最常用的就是不确定性采样，即通过选择对于任务最不确定的样本进行标记。交叉熵在不确定采样策略中有着广泛的作用：

y_i代表模型的输出，包含了所有样本的预测标签。熵是一种信息理论度量，它表示匹配另一分布所需的信息量。在基于主动对抗学习的半监督域自适应方法中，我们选择样本的策略是使鉴别器更容易根据目标域和分类器来区分难以分类的样本。挑选策略如下所示：

s(x)＝D(G(x))+γH(C(G(x)))

我们可以使用调节参数γ来平衡两个子项。该测度的两个分量分别是不确定性信息和自适应泛化信息。这个不确定的信息建议选择模型预测最不可靠的数据。在自适应泛化信息的约束下，选择目标域域内的未标记数据，这类数据较难与标记源数据共享分布。通过将这些难以共享分布的数据挑选出来给与标签信息辅助其在训练中引导模型往更好的方向学习。

进一步的，所述步骤(五)实现多类判别器对抗训练的具体方法为：

在半监督域自适应的设定下，我们得到这部分少量的标记标签的目标域数据后，我们需要充分的在模型中利用起来这部分目标域数据。通过目标域的标签信息，我们可以将这部分数据按类别组合，与相应类别的源域数据进行进行一个缩小分布差异的训练。我们采用的是多类判别器的方式，通过对抗学习的方式来缩小相同类别的源域和目标域的分布距离。多类判别器方法损失函数如下所示：

这样，目标样本和源样本中相同类型的样本在特征中具有相似的语义表征。

附图说明

图1是基于主动对抗学习的半临督域自适应方法的总体框架图；

图2是基于领域对抗结构部分的工作流程图；

图3是基于主动学习在目标域标记样本的工作流程图；

图4是基于多类判别器的目标域小样本学习的工作流程图；

具体实施方式

下面结合附图对本发明作更进一步的说明。

如图2所示为基于领域自适应对抗学习的工作流程图。首先，初始化特征提取网络E。然后重复以下步骤达到要求：

1)固定特征提取网络E，训练域判别器D。根据特征提取网络的结果来鉴别样本来自源域或是目标域：

2)固定域判别器D，训练。训练特征提取网络E。以混淆判别器D不能识别出样本来自源域或是目标域：

图3所示为基于主动学习在目标域标记样本的工作流程图。是通过图1步骤2的结果来制定主动学习策略。具体的，主动学习的提出正是旨在用有限的标注代价最大化模型的效果。所有主动学习任务的场景都涉及评估未标记样本的信息量。最简单和最常用的就是不确定性采样，即通过选择对于任务最不确定的样本进行标记。交叉熵在不确定采样策略中有着广泛的作用：

s(x)＝D(G(x))+γH(C(G(x)))

我们可以使用调节参数γ来平衡两个子项。

图4所示为基于多类判别器的目标域小样本学习的工作流程图，是在图3步骤3通过主动学习挑选标记样本后进行的操作，通过多类的源域和目标域的组合，训练多类域判别器来引导源域和目标域之间分布距离的缩小，其多类判别器MD损失按如下方式计算：

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于主动对抗学习的半监督域自适应方法，其特征在于：包括以下步骤：

(一)初始化特征提取网络E以及域判别器D和分类器C。

(三)通过主动学飞的策略从目标域样本中挑选少量有价值的标签进行标记。

(四)单次挑选的目标域样本量标记后，跳转到步骤(五)。

(六)重复上述步骤训练，直到挑选出的目标域样本数量达到设定的最大值。

2.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法，其特征在于：所述步骤(二)训练域不变特征提取网络的具体方法：

θ_E和θ_D是特征提取器E的与判别器D的参数。在域偏移被减轻的同时，我们可以使用已标记的样本信息训练分类器，从而使特征提取器E的特征更具有鉴别性。理想情况下我们可以在未标记标签的目标域样本下也有奸的分类效果。分类损失可以用如下标准的交叉熵损失表示：

β是调节两个损失的平衡参数。

3.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法，其特征在于：所述步骤(三)通过主动学习策略挑选目标域样本的具体方法为：

s(x)＝D(G(x))+γH(C(G(x)))

4.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法，其特征在于：所述步骤(五)分组训练多类域判别器的具体方法：

在半监督域自适应的设定下，我们得到这部分少量的标记标签的目标域数据后，我们需要充分的在模型中利用起来这部分目标域数据。通过目标域的标签信息，我们可以将这部分数据按类别组合，与相应类别的源域数据进行进行一个缩小分布差异的训练。我们采用的是多类判别器的方式，通过对抗学习的方式米缩小相同类别的源域和目标域的分布距离。多类判别器方法损失函数如下所示：

5.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法，其特征在于：通过主动学习挑选目标域的有价值的样本进行标记和对抗学习减轻域间偏移，提高了领域迁移任务的效率，同时减少了目标域的标注代价。