CN111160553B

CN111160553B - 一种新的领域自适应学习方法

Info

Publication number: CN111160553B
Application number: CN201911342565.7A
Authority: CN
Inventors: 肖良; 许娇龙; 商尔科; 赵大伟; 朱琪; 聂一鸣; 戴斌
Original assignee: National Defense Technology Innovation Institute PLA Academy of Military Science
Current assignee: National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date: 2019-12-23
Filing date: 2019-12-23
Publication date: 2022-10-25
Anticipated expiration: 2039-12-23
Also published as: CN111160553A

Abstract

提本发明属于新一代信息技术领域自适应学习技术领域，提出了一种新的领域自适应学习方法，该方法面向图像分类任务，不需要复杂的对抗学习，而是通过一个目标领域图像旋转预测的辅助分类任务和目标领域无标记样本插值后预测结果一致性约束，构建多任务学习模型，最终学习得到适用于目标领域的特征和适用于目标领域数据分布的分类模型。本发明不依赖目标领域样本标注的情况下学习得到适用于目标领域的分类器，大大降低了在测试数据分布发生变化时手工标注样本的压力。本发明结合目标领域样本的插值一致性先验和目标领域无标记样本的旋转角度预测这一辅助任务进行多任务学习，既能学习到适用于目标领域的特征，又能确保分类边界在目标领域数据分布中处在合适位置，能够有效提高目标领域的分类性能。

Description

一种新的领域自适应学习方法

技术领域

本发明涉及领域自适应深度学习领域，特别是面向图像分类的领域自适应深度学习方法。

背景技术

目前大多数深度学习方法采用监督学习，通过手工标记大量的样本进行模型训练。但是，手工标注样本十分耗费体力，成本高昂。此外，标记的训练样本和真实的测试样本之间很有可能存在分布不同的问题，这种情况下，训练的模型在测试数据上的性能往往会急剧下降。

领域自适应学习就是一种为了解决由于训练数据和测试数据的分布不同导致机器学习性能下降而提出了一种迁移学习方法。领域自适应学习利用源领域的标注数据学习得到目标领域依然适用的模型。根据目标领域数据是否有标注信息，领域自适应学习可以分为有监督领域自适应学习、半监督领域自适应学习和无监督领域自适应学习。无监督领域自适应学习由于完全不依赖目标领域数据标注信息而应用更加广泛。近年来，深度学习快速发展并在计算机视觉领域取得空前成功。最近提出的领域自适应学习方法也大都采用深度神经网络模型，这些深度领域自适应学习方法可以分为两类，一类是基于最小化差异(discrepancy)的方法，这些方法通过最小化源领域和目标领域的特征之间的差异实现领域不变特征学习。另一类方法是基于对抗学习(adversarial learning)的方法，这类方法通过最小最大化博弈，学习一个领域判别器实现对源领域和目标领域的鉴别，同时学习一个特征提取器(生成器)迷惑之前的领域判别器，当最小最大化优化达到均衡时可以实现领域特征的对齐。这两类方法存在的问题是优化目标和训练过程较为复杂。

自监督学习是近年来发展迅速的一类机器学习方法，它通过设置不依赖手工标注的辅助任务，学习得到适用于下游任务的特征。文献(Revisiting Self-SupervisedVisual Representation Learning,Alexander Kolesnikov,CVPR2019)证明，自监督学习是一种有效的特征学习方法。基于自监督学习的思想，文献(Self-Supervised DomainAdaptation for Computer Vision Tasks,Jiaolong Xu,IEEE Access 2019(7):156694-156706)和专利(201910139916.8)提出一种自监督领域自适应学习方法，利用目标领域的图像旋转预测这一辅助任务学习适用于目标领域的特征，能够有效提升模型在目标领域数据上的性能。

文献(Self-Ensembling For Visual Domain Adaptation,Geoff French,ICLR18)提出了一种基于自集成的领域自适应方法，这种方法利用训练过程中不同迭代获得的模型的参数均值(自集成)作为教师模型，同时对目标领域的无标记样本进行随机增广，利用增广后样本在教师模型和学生模型上的预测的一致性作为监督信号，以学习适用于目标领域的模型。

上述文献记载的方法挖掘了目标领域无标记样本的自监督信息，通过辅助任务构建多任务学习系统，能够学习到适用于目标领域的特征，但是这两种方法没有显式地考虑目标领域的聚类假设，也就是在目标领域的数据分布中，相近的样本很可能具有相同的类别，导致学习得到的分类边界可能存在不合理现象。

发明内容

本发明的目的是解决自监督领域自适应学习方法中欠缺对目标领域的聚类假设，从而造成学习得到的分类边界不合理的技术问题。

为达到上述目的解决上述技术问题，本发明提出一种新的领域自适应学习方法，该方法的技术方案包括如下步骤：

S1.准备源领域有标记样本集D_s(x,y)和目标领域无标记样本集D_t(x)；

S2.构建主任务深度卷积神经网络分类模型f_θ(x)，该模型由特征提取网络

和分类网络

级联而成，即

其中θ＝{θ_v,θ_c}为可训练的参数；

S3.构建四类旋转预测辅助分类模型

该模型与主任务分类模型共享特征提取网络g及其参数θ_v，辅助分类网络

级联在特征提取网络后端，用于对图像的旋转角度进行预测；

S4.构建由源领域有监督分类任务、目标领域无标记样本插值一致性任务和目标领域样本旋转预测任务组成的多任务学习模型并在D_s(x,y)和D_t(x)上进行训练，以获取主任务分类模型的最优参数θ^*；

S4.1.确定训练的迭代次数T、移动平均系数α、[0,1]之间的随机分布Q；

S4.2.初始化网络参数Θ＝{θ_v,θ_c,θ_a}，初始化主任务分类模型θ＝{θ_v,θ_c}的移动均值：θ′∶＝θ；

S4.3.利用随机梯度下降法进行迭代，更新模型参数；

S4.3.1.从源领域样本集D_s(x,y)中采集小批量样本

S4.3.2.计算源领域小批量样本的主任务分类损失

其中损失函数可采用交叉熵损失

进行计算。

S4.3.3.从目标领域数据集D_t(x)采样两组无标记小批量样本

S4.3.4.利用主分类网络的均值教师模型计算目标领域样本的伪标记

S4.3.5.从随机分布Q中采样插值系数λ；

S4.3.6.计算样本和预测的插值，样本插值的计算方法为：

预测的伪标记插值结果为：

S4.3.7.计算插值一致性损失

具体可采用均值平方误差

进行计算。

S4.3.8.将目标领域的样本集

中的样本随机旋转0°、90°、180°或270°，构建辅助分类任务样本集

表示四种不同的旋转角度；

S4.3.9.计算目标领域样本的辅助分类任务损失

其中损失函数可采用交叉熵损失

进行计算。

S4.3.10.根据主任务分类损失、插值一致性损失和辅助任务分类损失计算总损失:

其中

和

为权重参数；

进一步的，

和

设置为常数或函数。

S4.3.11计算总损失L相对模型参数Θ的梯度；

S4.3.12.更新主任务分类模型参数的移动平均值

θ′∶＝αθ′+(1-α)θ； (12)

S4.3.13.利用随机梯度下降法更新模型参数Θ；

S5.利用最优测试模型

对目标领域的图像进行分类。

与现有技术相比，本发明有效收益在于：

(1)本发明在不依赖目标领域样本标注的情况下学习得到适用于目标领域的分类器，大大降低了在测试数据分布发生变化时手工标注样本的压力。

(2)本发明结合目标领域样本的插值一致性先验和目标领域无标记样本的旋转角度预测这一辅助任务进行多任务学习，既能学习到适用于目标领域的特征，又能确保分类边界在目标领域数据分布中处在合适位置，能够有效提高目标领域的分类性能。

附图说明

图1是本发明的流程示意图；

图2是本发明中主任务分类模型和辅助任务分类模型示意图；

图3是本发明中多任务学习的损失函数示意图。

具体实施方式

本发明提出一种新的领域自适应学习方法，该方法面向图像分类任务，不需要复杂的对抗学习，而是通过一个目标领域图像旋转预测的辅助分类任务和目标领域无标记样本插值后预测结果一致性约束，构建多任务学习模型，最终学习得到适用于目标领域的特征和适用于目标领域数据分布的分类模型。

下面结合附图和实施例对本发明作进一步的详细描述，本实例采用MNIST数据集作为源领域数据集,MNIST数据集为来自NIST(National Institute of Standards andTechnology,美国国家标准与技术研究所)的手写数据集，包括0～9一共10个类别，图像为分辨率为28*28；采用USPS(US Postal Servers,美国邮政服务)手写数据集作为目标领域数据集，该数据集同样包含0～9共10个类别，图像分辨率为16*16。本发明的实现流程如附图1所示。

第一步，收集源领域有标记训练样本集D_s(x,y)和目标领域无标记训练样本集D_t(x)，其中标记y采用one-hot向量表示，为了使神经网络分类模型能有同时应用于源领域和目标领域，需要对图像进行预处理，因此将USPS数据集的图像尺寸利用双线性插值上采样至与MNIST数据集一致；

第二步，如图2所示，根据主分类任务中输入图像的尺寸和类别数等特点，构造深度卷积神经网络分类模型，本实施例中，输入图像分辨率较小，类别为0～9一共10类手写数字，任务相对较为简单，所以可以采取层数较少的网络模型，例如可以采用7层的LeNet5网络，前6层为特征提取网络

(参数为θ_v)，最后一层为10类softmax输出层

(参数为θ_c)，并将该级联网络模型

记为f_θ(x)，其中θ＝{θ_v,θ_c}；

第三步，如图2所示，构造四类旋转预测辅助分类网络，该网络与主分类网络LeNet5共用前6层特征提取网络

(共享参数θ_v)，之后在连接一层4类输出的softmax层

(参数为θ_a)；

第四步，构建由源领域有监督分类任务、目标领域无标记样本插值一致性任务和目标领域样本旋转预测任务组成的多任务学习模型并在D_s(x,y)和D_t(x)上进行训练，获取主任务分类模型最优参数

该步骤通过以下分步骤实现。

1、确定训练的迭代次数T，移动平均系数α，[0,1]之间的随机分布Q；

2、随机初始化模型参数Θ＝{θ_v,θ_c,θ_a}，初始化θ的移动均值：θ′∶＝θ；

3、利用随机梯度下降法进行T次迭代，更新模型参数Θ；

上述第3小步中，需要通过T次迭代对模型参数进行训练，训练的损失函数计算如图3所示，每次迭代t包括如下步骤：

1)从源领域样本集D_s(x,y)中采集小批量样本

2)利用前向传播计算源领域小批量样本的主任务分类损失

可选地，主任务分类损失可以采用交叉熵损失函数

其中M为主分类任务的总类别数，对于MNIST手写数字识别，M＝10；

3)从目标领域样本集D_t(x)采样两组无标记小批量样本

4)利用主分类模型的均值教师模型计算目标领域样本的伪标记

此处采用均值教师模型的作用是相比当前迭代的模型，均值教师模型可以获得更加温和的正则；

5)从随机分布Q采样插值系数λ；

6)计算样本和伪标记的插值，样本插值的计算方法为：

伪标记的插值结果为：

7)根据样本插值和伪标记的插值结果计算插值一致性损失：

可选地，一致性损失采用均值平方误差

8)将目标领域的样本集

为随机旋转后的图像，

表示四种不同的旋转角度，在计算过程中采用one-hot向量表示；

9)利用旋转后的图像在辅助分类网络上前向传播，计算辅助分类任务损失

可选地，辅助分类任务损失可以采用交叉熵损失函数

10)根据主任务分类损失、插值一致性损失和辅助任务分类损失计算总损失

其中

和

为一致性损失的和辅助分类任务损失的权重系数，可以设置为常数，也可以设置为函数，例如将

采用斜坡函数，随着迭代次数t的增加逐步加大一致性损失的权重；

11)利用反向传播算法计算总损失相对模型参数Θ的梯度

12)更新主任务模型参数的移动平均值

θ′∶＝αθ′+(1-α)θ (12)

13)利用随机梯度下降法更新模型参数Θ，参数更新方式为：

其中γ_t为当前迭代t的学习率。

第五步，选取最优模型应用于目标领域的图像并计算分类结果。

虽然本发明已通过实施例进行了描述，然而本发明并非局限于这里所描述的实施例，在不脱离本发明所做出的各种改变以及变化仍属于本发明的范围。

Claims

1.一种新的领域自适应学习方法，其特征在于，包含如下步骤：

和分类网络

级联而成，即

其中θ＝{θ_v,θ_c}为可训练的参数；

S3.构建四类旋转预测辅助分类模型

S4.1.确定训练的迭代次数T，移动平均系数α，[0,1]之间的随机分布Q；

S4.2.初始化网络参数Θ＝{θ_v,θ_c,θ_a}，初始化主任务分类模型θ＝{θ_v,θ_c}的移动均值：θ'∶＝θ；

S4.3.利用随机梯度下降法进行迭代，更新模型参数；

S4.3.1.从源领域样本集D_s(x,y)中采集数量为B_s的小批量样本

S4.3.2.计算源领域小批量样本的主任务分类损失：

S4.3.3.从目标领域数据集D_t(x)采样两组数量为B_t的无标记小批量样本

S4.3.5.从随机分布Q采样插值系数λ；

S4.3.6.计算样本和预测的插值，样本插值的计算方法为：

预测的伪标记插值结果为：

S4.3.7.计算插值一致性损失

S4.3.8.将目标领域的样本集

表示四种不同的旋转角度；

S4.3.9.计算目标领域样本的辅助分类任务损失

其中

和

为权重参数；

S4.3.11计算总损失L相对模型参数Θ的梯度；

S4.3.12.更新主任务分类模型参数的移动平均值

θ′：＝αθ′+(1-α)θ； (12)

S4.3.13.利用随机梯度下降法更新模型参数Θ；

S5.利用最优测试模型

对目标领域的图像进行分类。

2.根据权利要求1所述的一种新的领域自适应学习方法，其特征在于，所述步骤S4.3.2.中的主任务分类损失可采用交叉熵损失函数

进行计算。

3.根据权利要求1所述的一种新的领域自适应学习方法，其特征在于，所述步骤S4.3.7中的插值一致性损失可采用均值平方误差

进行计算。

4.根据权利要求1所述的一种新的领域自适应学习方法，其特征在于，所述步骤S4.3.9中的辅助分类任务损失可采用交叉熵损失函数

进行计算。

5.根据权利要求1-4任一权利要求所述的一种新的领域自适应学习方法，其特征在于，所述步骤S4.3.10中，

和

设置为常数或函数。