CN112541580A - 一种基于主动对抗学习的半监督域自适应方法 - Google Patents

一种基于主动对抗学习的半监督域自适应方法 Download PDF

Info

Publication number
CN112541580A
CN112541580A CN202011643102.7A CN202011643102A CN112541580A CN 112541580 A CN112541580 A CN 112541580A CN 202011643102 A CN202011643102 A CN 202011643102A CN 112541580 A CN112541580 A CN 112541580A
Authority
CN
China
Prior art keywords
domain
target domain
target
samples
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011643102.7A
Other languages
English (en)
Inventor
朱旗
徐翔宇
杨启明
张道强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202011643102.7A priority Critical patent/CN112541580A/zh
Publication of CN112541580A publication Critical patent/CN112541580A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于主动对抗学习的半监督域自适应方法。由于源领域和目标领域之间的领域迁移,常常导致学习性能下降,现实中的许多机器学习任务都可以归结为领域适应问题。当前的大部分工作都集中在无监督域自适应(UDA)上,他们试图通过深度神经网络来减轻源域和目标域之间的分布差异。由于缺少目标域数据的标签信息,当域偏移较大时,UDA方法可能会导致负迁移。在合理的假设下,即使目标域中有限的标记数据也可以促进域适应性学习,本发明公开了一种采用主动对抗方法的半监督域适应方法。具体来说,我们首先使用领域对抗训练来减轻领域偏移。然后,我们通过主动学习方法标记最有价值的目标域数据。最后,我们使用多类判别器缓解了标记的目标域样本与源域样本之间的分布差异。

Description

一种基于主动对抗学习的半监督域自适应方法
技术领域
本发明属于机器学习领域,具体涉及基于主动对抗学习的半监督域自适应方法。
背景技术
一般而言,如果我们可以获得更多的标签信息,我们将训练一个更好的模型来完成诸如分类,分割和回归之类的任务。但是这种情况非常苛刻,一般要求我们的数据来自于同一分布中。收集来自相同分布的数据并对其进行标记可能既费时又费力。在实际遇到的问题中,我们的数据通常是异类的,例如不同相机拍摄的照片,不同网站收集的图片以及多家医院的医学图像数据。在这种情况下,直接训练数据并不总是会产生令人满意的结果。域自适应主要是用来解决域偏移的问题,一般将样本量大且具有标记信息的域称为源域,然后将样本最相对较少且缺乏标记的域称为目标域。域自适应可以是监督的,无监督的或半监督的,这取决于目标域有多少已标记的样本信息。目前针对域自适应问题提出的方法都是基于无监督的,这经常会带来一个问题,在没有任何目标域标记的情况下,当源域和目标域之间的分布差异稍大的话就会造成严重的负迁移的情况,使得源域和目标域不同类的样本被误认为是同一类而进行分布的对齐。基于对抗方式的域自适应方法是目前最流行的域自适应算法,其主要思想是通过判别器网络与特征提取网络进行一个博弈从而使得源域和目标与的分布被对齐。由于缺少目标域的标记,在对齐的时候缺少目标域的鉴别信息很容易导致错误的对齐从而造成错误的学习。但是如果大量的在目标域进行标记就失去问题本身的意义,依然会造成很多不必要的资源浪费且耗时耗力。因此利用目标域上尽量少的标记样本且能更好的辅助域间迁移问题会很有意义。不同样本对于模型的学习起到的作用是不同的。主动学习通过挑选重要性的样本在降低标注代价的同时更好的学习模型。
发明内容
发明目的:为了克服现有域自适应中域间偏移问题,本发明提供一种基于主动对抗学习的半监督域自适应方法。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于主动对抗学习的半监督域自适应方法,包括以下步骤:
(一)初始化特征提取网络E以及域判别器D和分类器C。
(二)利用域判别器和分类器来训练网络E,进行一个对抗的博弈从而提取与不变的特征。
(三)通过主动学习的策略从目标域样本中挑选少量有价值的标签进行标记。
(四)单次挑选的目标域样本量标记后,跳转到步骤(五)。
(五)利用少量标记标签的目标域样本和源于样本按类分组训练多类判别器来辅助目标域和源域更好的迁移。
(六)重复上述步骤训练,直到挑选出的目标域样本数量达到设定的最大值;
进一步的,所述步骤(二)实现域自适应对抗训练的具体方法:
在原始特征经过卷积神经网络的特征提取器E之后,我们使用域判别器D来分辨数据来自源域或是目标域,特征提取器通过混淆判别器来起到一个相互博弈的效果,以此来拉近两个分布的距离。同时使用带标签的源域和目标域数据经过全连接分类器C来训练特征提取器E。与原始的生成对抗网络相似,特征提取器E的任务是去让域标签尽可能不被判别器D识别出来。对于与判别器的域标签信息,我们将源域数据标记为0,目标域标记为1。然后样本可以通过特征提取器E从原始空间被投影到源域和目标域数据难以分辨的空间。对抗损失如下所示:
Figure BSA0000229457090000021
θE和θD是特征提取器E的与判别器D的参数。在域偏移被减轻的同时,我们可以使用已标记的样本信息训练分类器,从而使特征提取器E的特征更具有鉴别性。理想情况下我们可以在未标记标签的目标域样本下也有好的分类效果。分类损失可以用如下标准的交叉熵损失表示:
Figure BSA0000229457090000022
α是平衡调节参数,θY是分类器C的参数。因此,域对抗架构部分的学习目标函数可以被计算如下:
Figure BSA0000229457090000023
β是调节两个损失的平衡参数。
进一步的,所述步骤(三)用主动学习策略挑选按目标域样本的具体方法为:
不同于无监督域自适应中目标域的样本都没有标记,在半监督的设置下我们可以尽量挑选出少的目标域样本去标记。我们需要尽量少的去挑选一些在目标域对域自适应任务最有价值的样本。主动学习的提出正是旨在用有限的标注代价最大化模型的效果。所有主动学习任务的场景都涉及评估未标记样本的信息量。最简单和最常用的就是不确定性采样,即通过选择对于任务最不确定的样本进行标记。交叉熵在不确定采样策略中有着广泛的作用:
Figure BSA0000229457090000031
yi代表模型的输出,包含了所有样本的预测标签。熵是一种信息理论度量,它表示匹配另一分布所需的信息量。在基于主动对抗学习的半监督域自适应方法中,我们选择样本的策略是使鉴别器更容易根据目标域和分类器来区分难以分类的样本。挑选策略如下所示:
s(x)=D(G(x))+γH(C(G(x)))
我们可以使用调节参数γ来平衡两个子项。该测度的两个分量分别是不确定性信息和自适应泛化信息。这个不确定的信息建议选择模型预测最不可靠的数据。在自适应泛化信息的约束下,选择目标域域内的未标记数据,这类数据较难与标记源数据共享分布。通过将这些难以共享分布的数据挑选出来给与标签信息辅助其在训练中引导模型往更好的方向学习。
进一步的,所述步骤(五)实现多类判别器对抗训练的具体方法为:
在半监督域自适应的设定下,我们得到这部分少量的标记标签的目标域数据后,我们需要充分的在模型中利用起来这部分目标域数据。通过目标域的标签信息,我们可以将这部分数据按类别组合,与相应类别的源域数据进行进行一个缩小分布差异的训练。我们采用的是多类判别器的方式,通过对抗学习的方式来缩小相同类别的源域和目标域的分布距离。多类判别器方法损失函数如下所示:
Figure BSA0000229457090000032
这样,目标样本和源样本中相同类型的样本在特征中具有相似的语义表征。
附图说明
图1是基于主动对抗学习的半临督域自适应方法的总体框架图;
图2是基于领域对抗结构部分的工作流程图;
图3是基于主动学习在目标域标记样本的工作流程图;
图4是基于多类判别器的目标域小样本学习的工作流程图;
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图2所示为基于领域自适应对抗学习的工作流程图。首先,初始化特征提取网络E。然后重复以下步骤达到要求:
1)固定特征提取网络E,训练域判别器D。根据特征提取网络的结果来鉴别样本来自源域或是目标域:
Figure BSA0000229457090000041
2)固定域判别器D,训练。训练特征提取网络E。以混淆判别器D不能识别出样本来自源域或是目标域:
Figure BSA0000229457090000042
图3所示为基于主动学习在目标域标记样本的工作流程图。是通过图1步骤2的结果来制定主动学习策略。具体的,主动学习的提出正是旨在用有限的标注代价最大化模型的效果。所有主动学习任务的场景都涉及评估未标记样本的信息量。最简单和最常用的就是不确定性采样,即通过选择对于任务最不确定的样本进行标记。交叉熵在不确定采样策略中有着广泛的作用:
Figure BSA0000229457090000043
yi代表模型的输出,包含了所有样本的预测标签。熵是一种信息理论度量,它表示匹配另一分布所需的信息量。在基于主动对抗学习的半监督域自适应方法中,我们选择样本的策略是使鉴别器更容易根据目标域和分类器来区分难以分类的样本。挑选策略如下所示:
s(x)=D(G(x))+γH(C(G(x)))
我们可以使用调节参数γ来平衡两个子项。
图4所示为基于多类判别器的目标域小样本学习的工作流程图,是在图3步骤3通过主动学习挑选标记样本后进行的操作,通过多类的源域和目标域的组合,训练多类域判别器来引导源域和目标域之间分布距离的缩小,其多类判别器MD损失按如下方式计算:
Figure BSA0000229457090000044
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于主动对抗学习的半监督域自适应方法,其特征在于:包括以下步骤:
(一)初始化特征提取网络E以及域判别器D和分类器C。
(二)利用域判别器和分类器来训练网络E,进行一个对抗的博弈从而提取与不变的特征。
(三)通过主动学飞的策略从目标域样本中挑选少量有价值的标签进行标记。
(四)单次挑选的目标域样本量标记后,跳转到步骤(五)。
(五)利用少量标记标签的目标域样本和源于样本按类分组训练多类判别器来辅助目标域和源域更好的迁移。
(六)重复上述步骤训练,直到挑选出的目标域样本数量达到设定的最大值。
2.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法,其特征在于:所述步骤(二)训练域不变特征提取网络的具体方法:
在原始特征经过卷积神经网络的特征提取器E之后,我们使用域判别器D来分辨数据来自源域或是目标域,特征提取器通过混淆判别器来起到一个相互博弈的效果,以此来拉近两个分布的距离。同时使用带标签的源域和目标域数据经过全连接分类器C来训练特征提取器E。与原始的生成对抗网络相似,特征提取器E的任务是去让域标签尽可能不被判别器D识别出来。对于与判别器的域标签信息,我们将源域数据标记为0,目标域标记为1。然后样本可以通过特征提取器E从原始空间被投影到源域和目标域数据难以分辨的空间。对抗损失如下所示:
Figure FSA0000229457080000011
θE和θD是特征提取器E的与判别器D的参数。在域偏移被减轻的同时,我们可以使用已标记的样本信息训练分类器,从而使特征提取器E的特征更具有鉴别性。理想情况下我们可以在未标记标签的目标域样本下也有奸的分类效果。分类损失可以用如下标准的交叉熵损失表示:
Figure FSA0000229457080000012
α是平衡调节参数,θY是分类器C的参数。因此,域对抗架构部分的学习目标函数可以被计算如下:
Figure FSA0000229457080000013
β是调节两个损失的平衡参数。
3.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法,其特征在于:所述步骤(三)通过主动学习策略挑选目标域样本的具体方法为:
不同于无监督域自适应中目标域的样本都没有标记,在半监督的设置下我们可以尽量挑选出少的目标域样本去标记。我们需要尽量少的去挑选一些在目标域对域自适应任务最有价值的样本。主动学习的提出正是旨在用有限的标注代价最大化模型的效果。所有主动学习任务的场景都涉及评估未标记样本的信息量。最简单和最常用的就是不确定性采样,即通过选择对于任务最不确定的样本进行标记。交叉熵在不确定采样策略中有着广泛的作用:
Figure FSA0000229457080000021
yi代表模型的输出,包含了所有样本的预测标签。熵是一种信息理论度量,它表示匹配另一分布所需的信息量。在基于主动对抗学习的半监督域自适应方法中,我们选择样本的策略是使鉴别器更容易根据目标域和分类器来区分难以分类的样本。挑选策略如下所示:
s(x)=D(G(x))+γH(C(G(x)))
我们可以使用调节参数γ来平衡两个子项。该测度的两个分量分别是不确定性信息和自适应泛化信息。这个不确定的信息建议选择模型预测最不可靠的数据。在自适应泛化信息的约束下,选择目标域域内的未标记数据,这类数据较难与标记源数据共享分布。通过将这些难以共享分布的数据挑选出来给与标签信息辅助其在训练中引导模型往更好的方向学习。
4.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法,其特征在于:所述步骤(五)分组训练多类域判别器的具体方法:
在半监督域自适应的设定下,我们得到这部分少量的标记标签的目标域数据后,我们需要充分的在模型中利用起来这部分目标域数据。通过目标域的标签信息,我们可以将这部分数据按类别组合,与相应类别的源域数据进行进行一个缩小分布差异的训练。我们采用的是多类判别器的方式,通过对抗学习的方式米缩小相同类别的源域和目标域的分布距离。多类判别器方法损失函数如下所示:
Figure FSA0000229457080000022
这样,目标样本和源样本中相同类型的样本在特征中具有相似的语义表征。
5.根据权利要求1所述的基于主动对抗学习的半监督域自适应方法,其特征在于:通过主动学习挑选目标域的有价值的样本进行标记和对抗学习减轻域间偏移,提高了领域迁移任务的效率,同时减少了目标域的标注代价。
CN202011643102.7A 2020-12-31 2020-12-31 一种基于主动对抗学习的半监督域自适应方法 Pending CN112541580A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011643102.7A CN112541580A (zh) 2020-12-31 2020-12-31 一种基于主动对抗学习的半监督域自适应方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011643102.7A CN112541580A (zh) 2020-12-31 2020-12-31 一种基于主动对抗学习的半监督域自适应方法

Publications (1)

Publication Number Publication Date
CN112541580A true CN112541580A (zh) 2021-03-23

Family

ID=75018063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011643102.7A Pending CN112541580A (zh) 2020-12-31 2020-12-31 一种基于主动对抗学习的半监督域自适应方法

Country Status (1)

Country Link
CN (1) CN112541580A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128620A (zh) * 2021-05-11 2021-07-16 北京理工大学 一种基于层次关系的半监督领域自适应图片分类方法
CN113420888A (zh) * 2021-06-03 2021-09-21 中国石油大学(华东) 一种基于泛化域自适应的无监督联邦学习方法
CN113469273A (zh) * 2021-07-20 2021-10-01 南京信息工程大学 基于双向生成及中间域对齐的无监督域适应图像分类方法
CN114444605A (zh) * 2022-01-30 2022-05-06 南京邮电大学 一种基于双重不平衡场景下的无监督域适应方法
CN115063692A (zh) * 2022-07-06 2022-09-16 西北工业大学 一种基于主动学习的遥感图像场景分类方法
CN116469498A (zh) * 2023-06-19 2023-07-21 深圳市信润富联数字科技有限公司 材料去除率的预测方法、装置、终端设备及存储介质
CN116821408A (zh) * 2023-08-29 2023-09-29 南京航空航天大学 一种多任务一致性对抗的检索方法及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128620A (zh) * 2021-05-11 2021-07-16 北京理工大学 一种基于层次关系的半监督领域自适应图片分类方法
CN113128620B (zh) * 2021-05-11 2022-10-21 北京理工大学 一种基于层次关系的半监督领域自适应图片分类方法
CN113420888B (zh) * 2021-06-03 2023-07-14 中国石油大学(华东) 一种基于泛化域自适应的无监督联邦学习方法
CN113420888A (zh) * 2021-06-03 2021-09-21 中国石油大学(华东) 一种基于泛化域自适应的无监督联邦学习方法
CN113469273A (zh) * 2021-07-20 2021-10-01 南京信息工程大学 基于双向生成及中间域对齐的无监督域适应图像分类方法
CN113469273B (zh) * 2021-07-20 2023-12-05 南京信息工程大学 基于双向生成及中间域对齐的无监督域适应图像分类方法
CN114444605A (zh) * 2022-01-30 2022-05-06 南京邮电大学 一种基于双重不平衡场景下的无监督域适应方法
CN114444605B (zh) * 2022-01-30 2024-04-05 南京邮电大学 一种基于双重不平衡场景下的无监督域适应方法
CN115063692A (zh) * 2022-07-06 2022-09-16 西北工业大学 一种基于主动学习的遥感图像场景分类方法
CN115063692B (zh) * 2022-07-06 2024-02-27 西北工业大学 一种基于主动学习的遥感图像场景分类方法
CN116469498A (zh) * 2023-06-19 2023-07-21 深圳市信润富联数字科技有限公司 材料去除率的预测方法、装置、终端设备及存储介质
CN116469498B (zh) * 2023-06-19 2023-11-17 深圳市信润富联数字科技有限公司 材料去除率的预测方法、装置、终端设备及存储介质
CN116821408A (zh) * 2023-08-29 2023-09-29 南京航空航天大学 一种多任务一致性对抗的检索方法及系统
CN116821408B (zh) * 2023-08-29 2023-12-01 南京航空航天大学 一种多任务一致性对抗的检索方法及系统

Similar Documents

Publication Publication Date Title
CN112541580A (zh) 一种基于主动对抗学习的半监督域自适应方法
Kim et al. Attract, perturb, and explore: Learning a feature alignment network for semi-supervised domain adaptation
Chong et al. Simultaneous image classification and annotation
Wu et al. Soft sampling for robust object detection
Bi et al. Multi-label classification on tree-and dag-structured hierarchies
Wang et al. Relaxed multiple-instance SVM with application to object discovery
Xu et al. Augmenting strong supervision using web data for fine-grained categorization
US7570816B2 (en) Systems and methods for detecting text
Har-Peled et al. Constraint classification: A new approach to multiclass classification
CN110647907B (zh) 利用多层分类和字典学习的多标签图像分类算法
CN102324046A (zh) 结合主动学习的四分类器协同训练方法
CN111222471A (zh) 基于自监督域感知网络的零样本训练及相关分类方法
CN113076994A (zh) 一种开集域自适应图像分类方法及系统
CN110225001A (zh) 一种基于主题模型的动态自更新网络流量分类方法
CN104680193A (zh) 基于快速相似性网络融合算法的在线目标分类方法与系统
CN110912917A (zh) 恶意url检测方法及系统
CN114863091A (zh) 一种基于伪标签的目标检测训练方法
Irie et al. A bayesian approach to multimodal visual dictionary learning
Zhang et al. Web-supervised network for fine-grained visual classification
CN114357221A (zh) 一种基于图像分类的自监督主动学习方法
CN115439715A (zh) 基于反标签学习的半监督少样本图像分类学习方法及系统
US8699796B1 (en) Identifying sensitive expressions in images for languages with large alphabets
CN116108853A (zh) 一种基于知识迁移的跨领域情感分析方法及存储介质
CN115797701A (zh) 目标分类方法、装置、电子设备及存储介质
CN111539417A (zh) 一种基于深度神经网络的文本识别训练优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination