CN113822353A

CN113822353A - 一种基于类相关矩阵特征值分解的域自适应方法

Info

Publication number: CN113822353A
Application number: CN202111079811.1A
Authority: CN
Inventors: 樊敏; 蔡子贇; 张腾飞; 王保云
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2021-09-15
Filing date: 2021-09-15
Publication date: 2021-12-21
Anticipated expiration: 2041-09-15
Also published as: CN113822353B

Abstract

一种基于类相关矩阵特征值分解的域自适应方法。该种域自适应方法，解决了源域和目标域之间的欠适配和不平等问题，使得对参数的选择敏感度降低，而收敛度更高分类精度更加准确。该种域自适应方法，与现有的经典分类方法相比，能够做出更准确的判断。本发明方法并没有使用过于繁杂的函数设计，使得网络的训练时间大大缩短。本发明方法使用基于对抗性的方法，使得特征提取器和分类器能够自动学习目标域和源域之间的度量区别。而不是通过人为定义，避免了可能出现的人工偏差。

Description

一种基于类相关矩阵特征值分解的域自适应方法

技术领域

本发明属于计算机视觉技术领域，具体涉及一种基于类相关矩阵特征值分解的域自适应方法。

背景技术

在科技日益发达的今天，机器学习为我们增添了许多便利。但是机器学习的应用需要良好的标注数据，如果使用人工标注那将花费大量的时间与金钱，并且因为人与人之间的区别可能导致一些模棱两可的标注出现。为了避免这一现象，很多研究人员提出了迁移学习。迁移学习是指将一个领域学习到的知识迁移到另一个领域使用，并且能够起到良好效果。而域自适应属于迁移学习中的一个特殊情况，它要求两个领域的任务是一致的。

域自适应的问题定义为：给定两个域，分别为源域D_s和目标域D_t，各自的分布为P(Y^s|X^s)和P(Y^t|X^t)，源域和目标域的分布是不同的。给定有标注的源域数据(X^s，Y^s)和无标注的目标域数据X^t，目标是对目标域数据进行良好分类。

如果不考虑域自适应，直接使用在源域数据上训练出的分类网络，将会导致一定程度的性能下降，这是由于源域和目标域存在一定程度的分布差异。而域自适应就是为了降低由于源域和目标域存在一定程度的分布差异而给分类网络带来的损耗。

发明内容

本发明所要解决的技术问题是克服现有技术的不足，提供一种基于类相关矩阵特征值分解的域自适应方法，使用基于对抗性的方法，使得特征提取器和分类器能够自动学习目标域和源域之间的度量区别，避免了可能出现的人工偏差。

本发明提供一种基于类相关矩阵特征值分解的域自适应方法，包括如下步骤，

步骤S1、设定一个源域D_s＝(X^s，Y^s)和目标域D_t＝(X^t)；

步骤S2、基于GANs利用对抗性训练同时训练特征提取器F和域分类器D，最后通过标签分类器G对样本进行分类；

步骤S3、用Resnet50作为特征提取器，将源域样本x_s和目标域样本x_t输入Resnet50提取出的特征分别记为f_s和f_t，f_g和f_t再输入标签分类器G得到g_s和g_t；将整个网络公式化为具有两个竞争误差项的极小极大优化问题，第一，E(G)是最小化标签分类器G上的源域分类风险；第二，E(D，G)在D上最小化，但在特征提取器F和标签分类器G上最大化，则，

在式中，L(·)代表交叉熵损失函数，总的优化目标为：

min_GE(G)-λE(d，G)，

min_DE(D，G)；

通过联合变量h＝(f，g)在标签分类器的预测g上调节域鉴别器D；

步骤S4、目标域上的分类器输出为

其中B是目标数据的批量大小，|C|是源类的数量，F是特征提取器，G是标签分类器；第i个实例属于第j类的概率Y_ij为

其中Z_ij是分类器层的logit输出，T是用于概率缩放的温度超参数。由于Y_ij揭示了第i个实例和第j类之间的关系，将两个类第j类和第j′类之间的类相关性初步定义为

其中，y_·j′为每个批次中的B个示例来自第j类的概率，

对主对角线上的值进行加权操作，并基于信息熵对类相关性进行加权操作，则，

其中，w_ii为量化第i个示例对类混淆建模的重要性的概率，W是对角矩阵；所以加权后的类相关矩阵为；

然后对加权后的类相关矩阵进行特征值分解，得到特征值的和，以特征值的和的均值作为标签分类器损失。

作为本发明的进一步技术方案，还包括步骤S4、对标签分类器G加以限制，将目标域上的分类器输出表示为

其中B是目标数据的批量大小，|C|是源类的数量，F是特征提取器，G是标签分类器；使用温度参数，第i个实例属于第j类的概率Y_ij为

其中，Z_ij为分类器层的logit输出，T为用于概率缩放的温度超参数；由于Y_ij揭示了第i个实例和第j类之间的关系；

将两个类第j类和第j′类之间的类相关性初步定义为

y_·j′为每个批次中的B个示例来自第j类的概率；

对主对角线上的值进行加权操作，则

其中，熵是对不确定性的度量，

其中W_ii是量化第i个示例对类混淆建模的重要性的概率，W是相应的对角矩阵。所以加权后的类相关矩阵为：

对加权后的类相关矩阵进行特征值分解，得到特征值的和，以特征值的和的均值作为标签分类器损失。

本发明的优点在于，

1、解决了源域和目标域之间的欠适配和不平等问题，使得对参数的选择敏感度降低，而收敛度更高分类精度更加准确。

2、与现有的经典分类方法相比，能够做出更准确的判断。

3、该方法并没有使用过于繁杂的函数设计，使得网络的训练时间大大缩短。

4、该方法使用基于对抗性的方法，使得特征提取器和分类器能够自动学习目标域和源域之间的度量区别。而不是通过人为定义，避免了可能出现的人工偏差。

附图说明

图1为本发明的网络结构示意图；

具体实施方式

请参阅图1，本实施例提供本发明基于类相关矩阵特征值分解的域自适应方法，包括以下步骤，

S1、给定一个源域D_s＝(X^s，Y^s)和目标域D_t＝(X^t)，本例中使用OFFICE-31数据集；

S2、我们基于GANs的思想利用对抗性训练同时训练特征提取器F和域分类器D，最后通过标签分类器G对样本进行分类；

S3、我们采用Resnet50作为特征提取器，将源域样本x_s和目标域样本x_t输入Resnet50提取出的特征分别记为f_s和f_t，f_s和f_t再输入标签分类器G得到g_s和g_t。我们将整个网络公式化为具有两个竞争误差项的极小极大优化问题：第一：E(G)是最小化标签分类器G上的源域分类风险；第二：E(D，G)，它在D上最小化，但在特征提取器F和标签分类器G上最大化：

式中，L(·)代表交叉熵损失函数，总的优化目标为：

min_GE(G)-λE(D，G)

min_DE(D，G)

式中，λ是源域分类风险和域分类的两个目标之间的超参数。我们通过联合变量h＝(f，g)在标签分类器的预测g上调节域鉴别器D。D的一个简单情况是

我们将向量

中的特征表示和分类器预测连接起来，并将其提供给条件域鉴别器D。这种条件策略被现有的条件GAN广泛采用。

S4、我们继续对标签分类器G加以限制，我们需要找到一个合适的标准来衡量目标域上的成对类混淆。与之前关注特征的CORAL等方法不同，我们扩展了类别预测。将目标域上的分类器输出表示为

其中B是目标数据的批量大小，|C|是源类的数量，F是特征提取器，G是标签分类器。在我们的方法中，我们专注于分类器预测并为了清楚起见省略了域下标t。使用温度参数，第i个实例属于第j类的概率Y_ij可以表示为

在式中，Z_ij是分类器层的logit输出，T是用于概率缩放的温度超参数。由于Y_ij揭示了第i个实例和第j类之间的关系，我们将两个类第j类和第j′类之间的类相关性初步定义为

要注意的是，y_·j′表示每个批次中的B个示例来自第j类的概率。类别相关性衡量分类器同时将B个样本分类为第j类和第j′类类别的可能性。这种成对的类相关性是相对安全的，高度自信的错误预测对类相关性的影响可以忽略不计。因为式(17)还是个粗略的定义，我们希望主对角线上的值为1而其他地方的值为0，所以对主对角线上的值进行加权操作。我们基于信息熵对类相关性进行加权操作。

在式中，熵是对不确定性的度量，

但我们想要的是一种概率分布，它将更大的概率放在具有更大类别预测确定性的示例上。其中W_ii是量化第i个示例对类混淆建模的重要性的概率，W是相应的对角矩阵。所以加权后的类相关矩阵为：

然后对加权后的类相关矩阵进行特征值分解，得到特征值的和，以特征值的和的均值作为标签分类器损失。该方法能够通过对抗性训练使得通过源域中已知的类别为目标域中未知的类别勾画一个准确的边界。在OFFICE-31数据集上，在各个域自适应任务上性能如下表1所示。

方法	A2W	D2W	W2D	A2D	D2A	W2A	AVG
								DANN	91.4	97.9	100.0	83.6	73.3	70.4	86.1
DAN	84.2	98.4	100.0	87.3	66.9	65.2	83.7
								CDAN	93.8	98.5	100.0	89.9	73.4	70.4	87.7
AFN	94.0	98.9	100.0	94.4	72.9	71.1	88.6
								OURs	94.0	99.0	100.0	92.0	76.7	73.1	89.1

表1自适应任务性能表

以上显示和描述了本发明的基本原理、主要特征和优点。本领域的技术人员应该了解，本发明不受上述具体实施例的限制，上述具体实施例和说明书中的描述只是为了进一步说明本发明的原理，在不脱离本发明精神范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由权利要求书及其等效物界定。

Claims

1.一种基于类相关矩阵特征值分解的域自适应方法，其特征在于，包括如下步骤，

步骤S1、设定一个源域D_s＝(X^s，Y^s)和目标域D_t＝(X^t)；

步骤S3、用Resnet50作为特征提取器，将源域样本x_g和目标域样本x_t输入Resnet50提取出的特征分别记为f_s和f_t，f_s和f_t再输入标签分类器G得到g_s和g_t；将整个网络公式化为具有两个竞争误差项的极小极大优化问题，第一，E(G)是最小化标签分类器G上的源域分类风险；第二，E(D,G)在D上最小化，但在特征提取器F和标签分类器G上最大化，则，