CN112308158B

CN112308158B - 一种基于部分特征对齐的多源领域自适应模型及方法

Info

Publication number: CN112308158B
Application number: CN202011223578.5A
Authority: CN
Inventors: 徐行; 傅阳烨; 杨阳; 邵杰; 汪政
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2021-09-24
Anticipated expiration: 2040-11-05
Also published as: US11960568B2; US20220138495A1; CN112308158A

Abstract

本发明公开了一种基于部分特征对齐的多源领域自适应模型及方法，其中部分特征提取的特征选择模块在常规卷积神经网络或残差神经网络特征提取器的基础上，根据源域与目标域各个特征维度的相似性，生成特征层面的选择向量，该选择向量作用于初始的特征图后，可以筛选出源域中与目标域高度相关的部分特征。在此基础上，本发明进一步提出了三种分别针对类别内、域间和类别间的部分特征对齐损失函数，使得提纯后的特征图对于分类器的可分辨性更好，源域与目标域相关的部分特征被凸显出来。本发明用于多源领域自适应分类数据集，与现有多源领域自适应模型相比，其分类正确率更高，特征选择的效果更好。

Description

一种基于部分特征对齐的多源领域自适应模型及方法

技术领域

本发明属于计算机视觉与迁移学习中的多源领域自适应分支，具体涉及一种通过高阶矩匹配对部分特征进行对齐的多源领域自适应模型结构，以及在特征图上设计对齐损失函数以达到特征对分类器可分辨的目的。

背景技术

在机器学习中，利用深度神经网络的监督和半监督学习已经取得了较为显著的成果，依赖于众多公开数据集，监督和半监督学习在多种任务如图像分类、人脸识别、语义分析上具有广泛的应用。但是，现实世界的数据标签收集十分困难，往往需要大量人力来完成，由于域间偏移的存在，在其它数据集上训练的模型并不能直接应用在实际生产中，因此提出了无监督领域自适应的技术。

传统的无监督领域自适应技术使用一个带标签的源域作为信息来源，将其与无标签的目标域共同训练，通过减小源域与目标域数据之间的分布差异来实现领域自适应，从而在目标域上完成所期望的任务，而单源域的领域自适应所获取的信息对于目标任务来说是有限的，因此引入了多源领域自适应的方法，即使用多个源域数据集作为模型学习的依据，将多个源域的数据与目标域样本进行对齐，从而达到更好的性能提升。

在现有的多源领域自适应模型中，研究者们提出了多种前沿技术基于深度学习提升模型在目标域上的表现，例如：基于对抗学习、基于知识传递与聚集、基于数据蒸馏、基于数据动态选择、基于特征提取与对齐、基于子空间学习等。其中基于特征提取与对齐的技术使用较为广泛，可以使得源域与目标域的数据在特征空间上相互对齐，在目标域的任务上取得较好的结果。

通常在现有的基于特征提取与对齐的多源域领域自适应策略中，使用一个共享权重的特征提取器提取多个源域以及目标域的图像特征，在所获得的特征图上设计关注于不同维度的对齐和匹配损失函数以减小源域特征与目标域特征之间的分布差异。

尽管研究者们提出的诸多特征对齐方法已经在大量公开数据集中取得了较高的正确率，但现有的特征提取与对齐方法中，还存在一些不足。例如，现有的一些方法在进行特征对齐时，使用的是通过特征提取器获得的全部图像特征，这些特征中不仅包含了源域和目标域之间相关的特征，还包含了只在某些源域中出现的域特有的特征，如果这些特征也参与到特征对齐中，将造成对齐效果的下降。

综上，在多源域领域自适应中，在所有源域特征的并集包含目标域的所有特征的基本假设上，有必要在特征图上进一步讨论各个特征维度对于目标域任务的重要性，以及源域和目标域在各个特征维度上的相似性，以此提出一种针对特征图中的一部分与目标域相关的特征的对齐策略，以在目标域任务上取得更好的结果。

发明内容

本发明的发明目的在于：提供一种在图像特征层面上利用高阶矩差异进行部分特征的对齐的策略，以获得多源域之间与目标域紧密相关的部分特征，并在部分特征上应用三种不同维度的部分特征对齐损失函数，实现更好的分类性能。

本发明是一种基于部分特征对齐的多源领域自适应模型，包括特征提取模块、部分特征提取的特征选择模块及其对应的损失函数、三种部分特征对齐损失函数和两个对抗训练的分类器，其中，三种部分特征对齐损失函数包括类别内部分特征对齐损失、域间部分特征对齐损失和类别间部分特征对齐损失，经过特征选择模块提取出的部分特征再通过三种不同的部分特征对齐损失以达到同类别聚集，不同类别分散的目的；

其中，所述特征提取模块使用常规的卷积神经网络CNN或预训练的残差神经网络ResN et-101，分别针对简单图像和复杂图像，用于提取图像的初始特征图，多个源域和目标域的初始特征图之间分别计算L₁距离后作为部分特征提取的特征选择模块的输入；

所述卷积神经网络CNN使用三层卷积层和两层全连接层，最终得到特征维度为2048维，所述残差神经网络ResNet-101去掉最后一层全连接层后，获得特征维度为2048维；

所述部分特征提取的特征选择模块通过两层全连接层，使用如上所述的L₁距离作为输入，将该距离中数值较小的维度看作是源域与目标域相关的特征维度，特征选择模块的输出为初始特征图的特征选择向量。将特征选择向量以点乘的方式作用于特征提取模块提取出的初始特征图，获得提纯后的特征图；

进一步地，本发明在提纯后的特征图上设计部分特征对齐的特征选择模块的损失函数以及三种部分特征对齐的损失函数，在提纯的特征图上分别计算部分特征提取的特征选择模块对应的损失、类别内的部分特征对齐损失、域间的部分特征对齐损失和类别间的部分特征对齐损失，取上述所有损失函数的加权和作为除分类损失以外的所有损失函数；

所述部分特征提取的特征选择模块的损失函数如下：

其中

分别表示提纯后源域和目标域的特征图，k表示矩的阶数，λ_reg是规范化的权重参数，N为一次批量训练中的样本数量，v_i表示源域i的特征选择向量，

为各个源域特征选择向量的平均值，

表示某个源域的一批样本，

表示目标域的一批样本，

表示求期望值，G是常规的特征提取器，

是提取出来得到的源域i的初始特征图，

是提取出来得到的目标域的初始特征图；

所述三种部分特征对齐损失建立在提纯特征图的类别中心点的基础上，其定义如下：

其中f_c表示某一个类别的中心点，F表示上述部分特征提取的过程，即经过F获得提纯后的特征图，n为一次批量训练中对应类别的样本数量；

为了保留所述基于部分特征对齐的多源领域自适应模型在前面训练所获得的信息，使用指数级流动平均值在每一次批训练中更新所有中心点：

其中β_c用来设置前面计算得到的中心点的权重，

表示在第b次批量训练时所维护的类别中心点；

所述类别内部分特征对齐损失如下：

其中f_c表示某个域中某一类的中心点，f_s表示对应域的对应类的部分特征样本点，k为矩的阶数。

所述域间部分特征对齐损失如下：

其中

分别表示目标域和源域某一个类别的中心点，使用欧几里得距离限制不同源域的每个类的中心点与其对应的目标域类中心点相互靠近；

所述类别间部分特征对齐损失如下：

其中

表示目标域中两个不同类的中心点，B是一个偏移超参数，用来设置目标域特征图上各个类别中心点之间的离散程度；

所述基于部分特征对齐的多源领域自适应模型整体的损失函数为：

L＝L_s+λ_pL_p+λ_cL_c+λ_domL_dom+λ_discL_disc

其中L_s为源域的交叉熵分类损失，由两个分类器的交叉熵损失之和得到，λ_p,λ_c,λ_dom,λ_disc分别为L_p,L_c,L_dom,L_disc的权重参数。

一种基于部分特征对齐的多源领域自适应方法，具体包括以下步骤：

步骤1：数据预处理，得到预处理后的数据；

步骤2：对预处理后的数据使用特征提取模块提取图像基本特征；

步骤3：将源域与目标域特征之间的绝对值差异输入到部分特征对齐的特征选择模块，得到特征选择向量，将其作用于初始特征图，获得提纯后特征图，在提纯后的特征图上计算上述损失函数L并更新各个模块的参数，包括特征提取模块、部分特征提取的特征选择模块以及两个分类器；

步骤4：重复步骤2-3，获得提纯特征图和两个分类器的分类概率，计算两个分类器的源域分类交叉熵损失之和L_s以及两个分类器在目标域上的分类概率的绝对值差异L_dis。固定除分类器以外的其他模块的参数，用分类损失减去绝对值差异L_s-L_dis作为损失函数去更新两个分类器的参数，再固定除特征提取模块以外的其它模块的参数，重新计算两分类器在目标域上的分类概率的绝对值差异L_dis作为损失函数去更新特征提取模块的参数，进行特征提取模块与两个分类器的对抗训练；

步骤5：训练完成后，在测试数据集上只经过特征提取和分类步骤，获得分类预测结果，验证模型有效性。

与现有技术相比，本发明具有如下优点和有益效果：

(1)本发明提出了一个适用于特征提纯的部分特征提取和选择策略，在常规特征提取模块的基础上，使用该策略可以获得源域中与目标域高度相关的特征，同时过滤掉源域数据中与目标域不相关或关系较弱的特征，从而避免了不相关特征对特征对齐造成的负面影响。

(2)在提纯特征的基础上，本发明关注于类别内的特征对齐问题，提出类别内的特征对齐损失函数，使得源域和目标域中属于同一类别的图像在提纯后的特征图上相互聚集，有益于分类器进行分类预测。

(3)在领域自适应方面，本发明关注于不同域的图像之间的相关性，提出域间的特征对齐损失函数，将源域与目标域中对应类别的中心点联系起来，降低源域与目标域的分布差异，实现领域自适应，使得在源域上训练获得的知识可以迁移到目标域中。

(4)针对与提纯特征中不同类别的可分辨性，本发明提出了类别间的特征对齐损失函数，使得源域和目标域中，不同类别的数据中心点相互分离，在提纯后的特征图上体现为多个相互分离的数据聚集区域，提升数据点对于分类器的可分辨性。

附图说明

图1为本发明进行部分特征对齐的实现流程图；

图2为本发明的部分特征提取框架示意图；

图3为本发明的部分特征对齐损失示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面结合实施方式和附图，对本发明作进一步地详细描述，以便相关领域的技术人员能更好地理解本发明。需要特别注意的是，所描述的实施例是本发明一部分实施例，而不是全部的实施例，也非旨在限制要求保护的本发明的范围。本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

考虑到现有的多源域领域自适应模型在进行特征提取和对齐时，往往将所有的特征一起进行对齐，忽略了某些特征属于源域所特有的特征而不在目标域中表现这一事实，本发明提出了一种基于部分特征对齐的多源领域自适应方法。本发明在图像的特征层面上对源域和目标域的特征进行筛选，使得剩下的特征与目标域任务高度相关，并提出三种关注于不同层面的部分特征对齐的损失函数，提升了在目标域上图像分类的效果。下面结合具体实例，对本发明进行详细完整的说明。

如图2所示，本发明提出的一种基于部分特征对齐的多源领域自适应模型包括特征提取模块、部分特征提取的特征选择模块及其对应的损失函数、三种部分特征对齐损失函数和两个对抗训练的分类器，其中，三种部分特征对齐损失函数包括类别内部分特征对齐损失、域间部分特征对齐损失和类别间部分特征对齐损失；

其中，所述特征提取模块使用常规的卷积神经网络CNN或预训练的残差神经网络ResNet-101，分别针对简单图像和复杂图像，用于提取图像的初始特征图，多个源域和目标域的初始特征图之间分别计算L₁距离后作为部分特征提取的特征选择模块的输入；所述卷积神经网络CNN使用三层卷积层和两层全连接层，最终得到特征维度为2048维，所述残差神经网络ResNet-101去掉最后一层全连接层后，获得特征维度为2048维；

所述部分特征提取的特征选择模块通过两层全连接层，使用所述L₁距离作为输入，将该距离中数值较小的维度看作是源域与目标域相关的特征维度，特征选择模块的输出为初始特征图的特征选择向量，将特征选择向量以点乘的方式作用于特征提取模块提取出的初始特征图，获得提纯后的特征图；

在提纯后的特征图上设计部分特征提取的特征选择模块的损失函数以及三种部分特征对齐损失函数，在提纯的特征图上分别计算部分特征提取的特征选择模块对应的损失、类别内部分特征对齐损失、域间部分特征对齐损失和类别间部分特征对齐损失，取上述所有损失函数的加权和作为除分类损失以外的所有损失函数；

所述部分特征提取的特征选择模块的损失函数如下：

其中

为各个源域特征选择向量的平均值，

表示某个源域的一批样本，

表示目标域的一批样本，

表示求期望值，G是常规的特征提取器，

是提取出来得到的源域i的初始特征图，

是提取出来得到的目标域的初始特征图；

其中β_c用来设置前面计算得到的中心点的权重，

表示在第b次批量训练时所维护的类别中心点；

如图3所示，所述类别内部分特征对齐损失如下：

其中f_c表示某个域中某一类的中心点，f_s表示对应域的对应类的部分特征样本点，k为矩的阶数；

所述域间部分特征对齐损失如下：

其中

分别表示目标域和源域某一个类别的中心点；

所述类别间部分特征对齐损失如下：

其中

L＝L_s+λ_pL_p+λ_cL_c+λ_domL_dom+λ_discL_disc

其中L_s为源域的交叉熵分类损失，由所述两个对抗训练的分类器的交叉熵损失之和得到，λ_p,λ_c,λ_dom,λ_disc分别为L_p,L_c,L_dom,L_disc的预设权重参数。

如图1所示，本发明中基于部分特征对齐的多源领域自适应方法包含如下步骤：

步骤1：数据预处理。本实例选取三个本领域使用较多的公开数据集进行实验，包括Digit-Five、Office31和DomainNet。

Digit-Five中收集了五个不同种类的手写数字识别数据集的子集，分别为MNIST-M、MNIST、USPS、SVHN和Synthetic Digits，其中USPS含有9298张图片，其余数据集均含有25000张训练图片和9000张测试图片。

Office31是一个传统的多源领域自适应数据集，包含4652张图片，31个类别。图像收集于办公室的环境，展现在三个域中：Amazon、Webcam和DSLR。

DomainNet是近年才提出的新数据集，并且是目前为止数量最大、最具挑战性的多源领域自适应数据集，总共包含六个域的数据：clipart、infograph、painting、quickdraw、real和sketch，其中每个域都包含有345个类别的图像。

选择以上三种数据集用于验证模型在不同类型和数量的数据集上的鲁棒性，三个数据集中类别的个数依次递增，域间差异也越来越大，挑战性也随之增加，可以比较好地反映模型的性能。数据的预处理过程包含简单的图像缩放以及随机翻转和裁剪等操作。

步骤2：使用特征提取模块提取图像基本特征。

对于Digit-Five数据集，图像大小缩放为32×32，特征提取模块选用三层卷积层和两层全连接层的卷积神经网络，卷积核大小均为5，全连接层的输出为2048维的特征向量；对于Office31数据集，图像大小为252×252，特征提取模块选用预训练的AlexNet，输出为4096维的特征向量；对于DomainNet数据集，图像大小为224×224，特征提取模块选用预训练的ResNet-101，输出为2048维的特征向量，用

f_T分别表示第i个源域和目标域的特征图。

在训练中，除Digit-Five的一批数据量为128张图片以外，其余数据集均使用一批16张图片的方式训练，因此训练时Digit-Five的特征图维度为128×2048，Office31的特征图维度为16×4096，DomainNet的特征图维度为16×2048。训练时，Digit-Five和Office31均训练100个epoch，DomainNet由于数据量非常大，只训练20个epoch。

步骤3：特征选择以及部分特征对齐损失函数计算。

计算源域特征图与目标域特征图的绝对值差异

将其作为特征选择模块的输入，其输出为特征选择向量v_i，然后计算源域提纯的特征图

对于目标域，可以选择使用所有源域选择向量的均值

作为选择向量，或者不进行目标域特征提纯，因为目标域的特征与自身已经是高度相关的，最终得到目标域的特征图用F_T表示。

在

和F_T上计算所述部分特征提取的损失函数L_p，具体形式如下：

其中k表示矩的阶数，λ_reg是规范化的权重参数，N为一次批量训练中的样本数量，

表示求期望值。

为计算部分特征对齐的损失函数，需要维护提纯特征每个域中每个类别的中心点，如前所述，中心点的维护方式如下：

其中f_c表示某个域某个类别的中心点，F表示

或F_T，b表示当前批训练的序号，β_c是中心点的累积值与新值之间的权衡参数。

在此基础上，计算所述类别内、域间和类别间的部分特征对齐损失函数。

如图3所示，类别内部分特征对齐损失具体形式如下：

其中f_c表示某个域中某一类的中心点，f_s表示对应域的对应类的部分特征样本点，在源域和目标域上均进行计算，目标域的标签使用当前分类器预测的伪标签来替代。

域间部分特征对齐损失具体形式如下：

其中

分别表示目标域和源域某一个类别的中心点，此时仅计算目标域各个类别的中心点与源域对应类别中心点之间的距离。

类别间部分特征对齐损失具体形式如下：

其中

表示目标域中两个不同类的中心点，该损失仅在目标域上计算，首先计算不同类别中心点之间的欧式距离，然后计算该距离与预设偏移值B之间的L₂距离。

将提纯后的特征图输入给两个分类器，获得分类概率，计算所有源域上的交叉熵损失L_s。

将前述所有损失函数按折衷参数求合，获得模型的整体损失函数：

L＝L_s+λ_pL_p+λ_cL_c+λ_domL_dom+λ_discL_disc

其中L_s的计算使用两个分类器交叉熵损失之和。按此损失函数对整个模型所有模块参数进行更新，包括特征提取模块、部分特征提取的特征选择模块以及两个分类器的参数。

步骤4：特征提取模块与两个分类器对抗训练。

重复步骤2-3，获得源域和目标域提纯后的特征而不计算相关特征对齐损失函数，在此特征图上，使用两个分类器分别生成目标域的预测概率，计算两者经过softmax激活函数后的绝对值差异L_dis以及两个分类器在源域上的交叉熵损失L_s。此时固定特征提取模块的参数，使用L_s-L_dis作为损失函数去更新两个分类器，增大目标域分类概率差异，然后固定分类器参数，重新计算L_dis作为损失函数去更新特征提取模块，减小分类差异，实现特征提取器与两个分类器的对抗训练。其中，对于特征提取模块，损失函数L_dis的计算和参数的更新可以重复1～4次，该重复次数用于在特征提取器和分类器之间进行折衷。

步骤5：预测测试数据集的分类结果。

本发明提出的模型在上述步骤1中所提到的三种数据集上均进行了如步骤2-4所述的训练，并进行测试集的测试。实验结果显示，本发明提出的基于部分特征对齐的多源领域自适应模型在Digit-Five、Office31和DomainNet上的平均分类正确率分别为92.7％、84.6％和48％，其中Digit-Five和DomainNet的结果优于已有的多源领域自适应方法，Office31的结果也达到了前沿水平，说明本发明提出的模型能够有效地在原始特征图上进一步提取出源域中与目标域高度相关的部分特征，并通过类别内、域间和类别间的部分特征对齐损失实现部分特征图中相同类别的数据点相互聚集、源域与目标域对应同类别的数据中心点相互靠近、目标域中不同类别的数据点相互分散的目的。

为进一步验证本发明提出各个模块以及损失函数的有效性，在Digit-Five数据集上进行了剔除部分模块的实验，其中去除部分特征提取的特征选择模块后，分类正确率为90.9％；去除类别内部分特征对齐损失后，分类正确率为90.8％；去除域间部分特征对齐损失后，分类正确率为89.4％；去除类别间部分特征对齐损失后，分类正确率为90.8％；即去掉本发明提出的模型的不同模块后，正确率均有不同程度的下降。由此说明，本发明提出的部分特征提取的特征选择模块以及三种部分对齐损失函数在多个层面上对当前的针对全部特征对齐的多源领域自适应方法的改进是有效的。

以上所述，仅为本发明的具体实施方式，本说明书中所公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换；所公开的所有特征、或所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以任何方式组合。

Claims

1.一种基于部分特征对齐的多源领域自适应模型，其特征在于，该多源领域自适应模型包括特征提取模块、部分特征提取的特征选择模块及其对应的损失函数、三种部分特征对齐损失函数和两个对抗训练的分类器，其中，三种部分特征对齐损失函数包括类别内部分特征对齐损失函数、域间部分特征对齐损失函数和类别间部分特征对齐损失函数；

所述部分特征提取的特征选择模块通过两层全连接层，使用所述L₁距离作为输入，根据该距离分析源域与目标域相关的特征维度，所述部分特征提取的特征选择模块的输出为初始特征图的特征选择向量，将特征选择向量以点乘的方式作用于特征提取模块提取出的初始特征图，获得提纯后的特征图；

在提纯后的特征图上设计部分特征提取的特征选择模块的损失函数以及三种部分特征对齐损失函数，即在提纯后的特征图上分别计算部分特征提取的特征选择模块对应的损失函数、类别内部分特征对齐损失函数、域间部分特征对齐损失函数和类别间部分特征对齐损失函数，取上述所有损失函数的加权和作为除分类损失以外的所有损失函数；

所述部分特征提取的特征选择模块的损失函数如下：

其中

为各个源域特征选择向量的平均值，

表示某个源域的一批样本，

表示目标域的一批样本，

表示求期望值，G是常规的特征提取器，

是提取出来得到的源域i的初始特征图，

是提取出来得到的目标域的初始特征图；

所述三种部分特征对齐损失函数建立在提纯特征图的类别中心点的基础上，其定义如下：

其中f_c表示某一个类别的中心点，F表示部分特征提取的过程，即经过F获得提纯后的特征图，n为一次批量训练中对应类别的样本数量；

其中β_c用来设置前面计算得到的中心点的权重，

表示在第b次批量训练时所维护的类别中心点；

所述类别内部分特征对齐损失函数如下：

所述域间部分特征对齐损失函数如下：

其中

分别表示目标域和源域某一个类别的中心点；

所述类别间部分特征对齐损失函数如下：

其中

L＝L_s+λ_pL_p+λ_cL_c+λ_domL_dom+λ_discL_disc

2.一种基于部分特征对齐的多源领域自适应方法，采用如权利要求1所述的基于部分特征对齐的多源领域自适应模型实现，其特征在于，所述多源领域自适应方法包括如下步骤：

步骤1：数据预处理，选取三个公开数据集进行实验，包括Digit-Five、Office31和DomainNet；

Digit-Five中收集了五个不同种类的手写数字识别数据集的子集，分别为MNIST-M、MNIST、USPS、SVHN和Synthetic Digits，其中USPS含有9298张图片，其余数据集均含有25000张训练图片和9000张测试图片；

Office31是一个传统的多源领域自适应数据集，包含4652张图片，31个类别，图像收集于办公室的环境，展现在三个域中：Amazon、Webcam和DSLR；

DomainNet是近年才提出的新数据集，并且是目前为止数量最大、最具挑战性的多源领域自适应数据集，总共包含六个域的数据：clipart、infograph、painting、quickdraw、real和sketch，其中每个域都包含有345个类别的图像；

数据的预处理过程包含简单的图像缩放以及随机翻转和裁剪的操作；

步骤2：对预处理后的数据使用特征提取模块提取图像基本特征，对于Digit-Five数据集，图像大小缩放为32×32，特征提取模块选用三层卷积层和两层全连接层的卷积神经网络，卷积核大小均为5，全连接层的输出为2048维的特征向量；对于Office31数据集，图像大小为252×252，特征提取模块选用预训练的AlexNet，输出为4096维的特征向量；对于DomainNet数据集，图像大小为224×224，特征提取模块选用预训练的ResNet-101，输出为2048维的特征向量，用

f_T分别表示第i个源域和目标域的特征图；

在训练中，除Digit-Five的一批数据量为128张图片以外，其余数据集均使用一批16张图片的方式训练，因此训练时Digit-Five的特征图维度为128×2048，Office31的特征图维度为16×4096，DomainNet的特征图维度为16×2048；训练时，Digit-Five和Office31均训练100个epoch，DomainNet由于数据量非常大，只训练20个epoch；

步骤3：特征选择以及部分特征对齐损失函数计算，计算源域特征图与目标域特征图的绝对值差异

将其作为部分特征提取的特征选择模块的输入，其输出为特征选择向量v_i，然后计算源域提纯的特征图

对于目标域，使用所有源域选择向量的均值

作为选择向量，最终得到目标域的特征图用F_T表示；

在

表示求期望值；

为计算部分特征对齐的损失函数，需要维护提纯特征每个域中每个类别的中心点，中心点的维护方式如下：

其中f_c表示某个域某个类别的中心点，F表示

或F_T，b表示当前批训练的序号，β_c是中心点的累积值与新值之间的权衡参数；

在此基础上，计算所述类别内、域间和类别间部分特征对齐损失函数，

类别内部分特征对齐损失函数具体形式如下：

其中f_c表示某个域中某一类的中心点，f_s表示对应域的对应类的部分特征样本点，在源域和目标域上均进行计算，目标域的标签使用当前分类器预测的伪标签来替代；

域间部分特征对齐损失函数具体形式如下：

其中

分别表示目标域和源域某一个类别的中心点，此时仅计算目标域各个类别的中心点与源域对应类别中心点之间的距离；

类别间部分特征对齐损失函数具体形式如下：

其中

表示目标域中两个不同类的中心点，该损失函数仅在目标域上计算，首先计算不同类别中心点之间的欧式距离，然后计算该距离与预设偏移值B之间的L₂距离；

将提纯后的特征图输入给所述两个对抗训练的分类器，获得分类概率，计算所有源域上的交叉熵损失L_s，

L＝L_s+λ_pL_p+λ_cL_c+λ_domL_dom+λ_discL_disc

其中L_s的计算使用所述两个对抗训练的分类器交叉熵损失之和，λ_p,λ_c,λ_dom,λ_disc分别为L_p,L_c,L_dom,L_disc的预设权重参数，按损失函数L对整个基于部分特征对齐的多源领域自适应模型所有模块参数进行更新，包括特征提取模块、部分特征提取的特征选择模块以及两个对抗训练的分类器的参数；

步骤4：特征提取模块与两个分类器对抗训练，重复步骤2-步骤3，获得源域和目标域提纯后的特征而不计算相关特征对齐损失函数，在此特征图上，使用两个分类器分别生成目标域的预测概率，计算两者经过softmax激活函数后的绝对值差异L_dis以及两个分类器在源域上的交叉熵损失L_s，此时固定特征提取模块的参数，使用L_s-L_dis作为损失函数去更新两个分类器，增大目标域分类概率差异，然后固定两个分类器参数，重新计算L_dis作为损失函数去更新特征提取模块，减小分类差异，实现特征提取器与两个分类器的对抗训练，其中，对于特征提取模块，损失函数L_dis的计算和参数的更新重复4次，该重复次数用于在特征提取器和分类器之间进行折衷；

步骤5：预测测试数据集的分类结果，使用所述基于部分特征对齐的多源领域自适应模型在所述步骤1中所提到的三种数据集上均进行了如步骤2-4所述的训练，并进行测试集的测试。