CN116910571A

CN116910571A - 一种基于原型对比学习的开集域适应方法及系统

Info

Publication number: CN116910571A
Application number: CN202311176914.9A
Authority: CN
Inventors: 许扬汶; 韩冬; 刘天鹏; 罗广宁; 孙腾中; 李彦辰
Original assignee: Nanjing Big Data Group Co ltd
Current assignee: Nanjing Big Data Group Co ltd
Priority date: 2023-09-13
Filing date: 2023-09-13
Publication date: 2023-10-20
Anticipated expiration: 2043-09-13
Also published as: CN116910571B

Abstract

本发明公开了一种基于原型对比学习的开集域适应方法及系统，所述方法包括：基于深度神经网络构建分类模型并进行预训练，初始化类别原型并构建原型记忆库；基于类别原型的类间距离自适应区分目标域中未知类别样本；基于原型对比损失构建目标函数进行网络参数学习，基于特征提取器更新类别原型；扩充原型记忆库，进行类别扩展。本发明基于原型对比学习实现域间共享知识挖掘和迁移，以及未知类识别和分类，更适用于域间类分布失配下知识迁移，同时扩展了目标域开放类别的识别能力。

Description

一种基于原型对比学习的开集域适应方法及系统

技术领域

本发明涉及域适应技术领域，尤其涉及一种基于原型对比学习的开集域适应方法及系统。

背景技术

随着深度神经网络等复杂模型的发展，对标记数据的需求越来越高。然而数据标注需要专业人工参与，耗时耗力，代价高昂，数据标注稀缺已然成为制约机器学习发展的瓶颈之一；与此同时，机器学习模型在现实任务中常面临新场景，模型的迁移泛化能力亟需关注。域适应学习（Domain Adaptation, DA）将源域知识迁移至目标域，以应对目标域遇到的标注稀缺、新场景等问题，是提升学习模型泛化能力的一种有效手段。而随着学习任务越来越面临开放类环境，除特征分布外，域间类先验分布也将发生漂移。因此，面向开放类环境的开集域适应学习（Open-Set DA, OSDA）是一项重要的研究内容。

现有技术大多基于分布差异最小化或对抗方式对齐域间特征分布（Weikai Li,Songcan Chen, Partial Domain Adaptation without Domain Alignment. IEEETransactions on Pattern Analysis and Machine Intelligence, 2022. doi:10.1109/TPAMI.2022.3228937），但是目标域中的开放类别给域间特征分布对齐带来了挑战，错误类匹配将导致模式坍塌或负迁移问题。

申请号为202210927707.1的中国专利公开了一种基于自监督对比学习的跨域遥感场景分类与检索方法，对于目标域数据，分别进行数据强增强和弱增强，进行特征自监督对比学习，并在输出空间约束强弱增强样本的预测一致性。该方案是通过最大类预测概率与预设定阈值间比较区分已知和未知类别。申请号为202210253606.0的中国专利公开了一种基于文物图像开集识别的分类算法，在训练阶段通过基于特征迁移先验误差的文物图像开集识别算法，利用迁移学习前后模型所提取特征之间的差异，在测试阶段进一步提升网络对已知类文物样本和开集文物样本的判断能力。该方案是通过利用激活特征值与预设定阈值间的比较来区分已知和未知类别。上述方法通过预设定阈值的方法来识别目标域中未知类别，但阈值是数据依赖的，很难提前设定。且现有技术仅致力于对未知类别进行识别，无法对新类别有效分类。

发明内容

发明目的：本发明旨在提供一种能够避免域间分布误匹配、自适应识别目标域中未知类样本的基于原型对比学习的开集域适应方法及系统。

技术方案：本发明所述的一种基于原型对比学习的开集域适应方法，包括：

（1）基于深度神经网络构建分类模型并进行预训练，初始化类别原型，构建原型记忆库；

（2）基于类别原型的类间距离自适应区分目标域中未知类别样本；

（3）基于原型对比损失构建目标函数进行网络参数学习，基于特征提取器更新类别原型；

（4）扩充原型记忆库，进行类别扩展。

优选地，步骤（1）中，所述分类模型包括特征提取器和类别分类器，采用源域样本对分类模型进行预训练，分类损失函数为：

式中，表示第i个样本，表示对应的样本类别标签，表示源域样本集，表示交叉熵损失，表示样本在分类器中的概率输出；其中，表示维分类器的概率输出，表示源域已知类别的个数，和分别表示特征提取器和类别分类器，表示softmax函数。

优选地，步骤（1）中，所述初始化类别原型包括：

式中，表示第类的类别原型，表示样本的特征，为样本对应的类别标签；表示第类中包含样本数。

优选地，步骤（1）中，所述构建原型记忆库包括：

式中，、和分别表示第类样本的原型、对应的类别标签以及原型总数，此时。

优选地，步骤（2）包括：构造目标域样本和原型之间的相似度向量，其中为样本特征与原型之间的相似度，表示为：

式中，当时，目标域样本属于未知类；表示类间距离，为自适应阈值，由类别原型间相似度的均值计算。

优选地，步骤（3）中包括：

（3.1）构建源域原型对比损失函数；

将样本和原型分别经由非线性转换G映射为，并基于映射表示构建源域原型对比损失函数：

式中，为温度参数，为指示函数，表示源域样本集，、、分别为样本、、经由非线性转换后的特征表示，、、分别为样本、、的类别标签，为对应类别原型的非线性映射表示，为其它类别原型的非线性映射表示，为余弦相似度；

（3.2）构建目标域原型对比损失函数；

对于目标域已知类样本，根据类别分类器前个神经元的概率输出确定其伪标签，则目标域原型对比损失函数为：

式中，表示目标域已知类集合；表示样本的伪标签，为对应伪标签类别原型的非线性映射表示；

（3.3）构建目标域增强对比损失函数；

对于目标域样本，通过数据增强构建正样本，则目标域增强对比损失函数为：

式中，表示目标域样本集；和分别表示样本和其增强样本对应的非线性映射表示；、分别为样本、经由非线性转换后的特征表示；

（3.4）构建分类损失函数；

式中，表示未知类目标域的集合。

优选地，步骤（3）中所述目标函数为：

式中，表示平衡参数。

优选地，步骤（3）中所述基于特征提取器更新类别原型包括：

每一个小批量训练后，同时使用源域原型和目标域原型更新类别原型，

式中，为原型权重参数，为源域第k类的原型，为目标域第k类的原型。

优选地，步骤（4）中所述扩充原型记忆库包括：根据步骤（2）区分已知类和未知类，在原型记忆库中增加新类别原型的存储，对未知类进一步识别。

本发明所述的一种基于原型对比学习的开集域适应系统，包括：

分类模型构建模块，用于基于深度神经网络构建分类模型并进行预训练，并初始化类别原型和构建原型记忆库；

自适应分类模块，用于基于类别原型的类间距离自适应区分目标域中未知类别样本；

类别原型更新模块，用于基于原型对比损失构建目标函数进行网络参数学习，基于特征提取器更新类别原型；

类别扩展模块，用于扩充原型记忆库，进行类别扩展。

有益效果：与现有技术相比，本发明具有如下显著优点：采用原型对比学习，实现域间知识迁移，施加对比约束实现域间和域内同类近、不同类远，从而在挖掘域间类共性知识同时，避免域间分布误匹配问题；基于类别原型，在特征层面自动获取类间距离用于自适应识别未知类样本，以缓解未知类别与已知类中误分样本的混淆问题，且无需预先设定阈值；通过原型记忆库实现对新类别扩展分类。本发明基于原型对比学习实现域间共享知识挖掘和迁移，以及未知类识别和分类，更适用于域间类分布失配下知识迁移，同时扩展了目标域开放类别的识别能力。

附图说明

图1为本发明的方法流程图；

图2为本发明的模型训练流程图；

图3为本发明的方法与其他方法对比结果图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

如图1-2所示，本发明所述的一种基于原型对比学习的开集域适应方法，包括以下步骤：

（1）预处理阶段：对目标域数据进行数据增强预处理，基于源域样本预训练深度神经网络分类模型，并初始化类别原型。

（1.1）基于深度神经网络构建分类模型，包括特征提取器、类别分类器两个部分并对采用源域样本对分类模型进行预训练，分类损失函数如下所示，

式中，表示第i个样本；表示对应的样本类别标签；表示源域样本集；表示交叉熵损失；表示样本在分类器的概率输出；具体地，表示维分类器的概率输出，表示源域已知类别的个数，和分别表示特征提取器和类别分类器，表示softmax函数。

通过有标签的源域样本进行有监督学习，最小化优化特征提取器和类别分类器参数。

（1.2）初始化类别原型；

所述的原型是指特定类别样本的特征中心，原型初始化公式如下所示，

式中，表示类别的原型，表示样本特征，为对应的类别标记，表示类别为的样本数。

（1.3）构建原型记忆库：

式中，、和分别表示第类样本的原型、对应的类别标签和原型总数，此时。

（2）迭代训练阶段：首先基于类别原型的类间距离自适应区分目标域中未知类别样本；然后基于原型对比损失学习网络参数，挖掘能迁移域间共享类中共性知识，同时保持类内近与类间远特性的高判别性特征；最后基于特征提取器更新类别原型。具体包括以下步骤：

（2.1）构造目标域样本和原型之间的相似度向量，其中为样本特征与原型之间的相似度，表示为：

当时，目标域样本属于未知类；表示类间距离，为自适应阈值，由类别原型间相似度的均值计算。

（2.2）基于原型对比损失学习网络参数。

（2.2.1）构建源域原型对比损失函数；

将样本和原型分别经由非线性映射G，并基于映射后的表示构建源域原型对比损失函数：

式中，是温度参数，为指示函数，表示源域样本集，、、分别是样本、、经由非线性转换后的特征表示，、、分别是样本、、的类别标签，为对应类别原型的非线性映射表示，为其它类别原型的非线性映射表示，表示余弦相似度；

（2.2.2）构建目标域原型对比损失，对于每个目标域样本，首先根据步骤（2. 1）挑选已知类，然后根据类别分类器前个神经元的概率输出确定其伪标签，目标域原型对比损失函数为：

式中，表示目标域已知类集合；表示样本的伪标签，为对应伪标签类别原型的非线性映射表示。基于该损失函数拉近域间距离。

（2.2.3）构建目标域增强对比损失，对于无标签的目标域样本，采用基于数据增强的对比损失进行聚类，最大化同一类别中的样本互信息。给定任一样本，其正样本为自身进行数据增强后的视图，构建目标域样本的对比损失函数为，

式中，表示目标域样本集；和分别表示样本和其增强样本对应的非线性映射表示；、分别为样本、经由非线性转换后的特征表示。

（2.2.4）构建分类损失函数，定义为，

式中，表示未知类目标域的集合；训练时源域样本按真实标签分到前维，根据步骤（2.1）选择有未知类标记的目标域样本分到第维。

（2.2.5）结合上述损失函数，构建目标函数如下表示，

式中，表示平衡参数。

（2.3）基于特征提取器更新类别原型。

每一个小批量训练后，同时使用源域原型和目标域原型更新类别原型，建立源域和目标域间的稳定联系，更新过程为，

（3）分类已知类样本，并根据类间距离自适应识别未知类样本，扩充原型记忆库对未知类样本细化分类，实现新类别扩展。

（3.1）根据步骤（2.1）分类已知类样本，并自适应识别未知类样本；对已知类通过类别分类器输出类别；

（3.2）基于专家标注的未知类样本，扩充原型记忆库。未知类别的目标域样本在模型训练完毕后持续输入，在不更新网络参数的情况下可以使用原型记忆库记录未知类样本原型，进而分类。

根据步骤（2.1）思想，识别出目标域中未知类别后，计算未知类样本与各未知类原型间相似度，以确定未知类样本的类别，对其进一步细化分类。可通过主动查询方式，给予人工标签，用于扩充原型记忆库，以对未知新类别进行分类。

类别扩展模块，用于扩充原型记忆库，进行类别扩展。

为了进一步说明本发明的方法，以图像分类Office-31数据集和在ImageNet上预训练的ResNet网络为例进行实验。

（1）预训练阶段

基于Office-31中AMAZON（A）和DSLR（D）构建跨域分类任务，其中A为源域，D为目标域，选择0-9类作为已知类别，10-19类作为未知类别。

（1.1）构建分类模型并进行预训练。

选择在ImageNet数据集上预训练的ResNet网络的特征提取部分作为特征提取器，类别分类器的输出维度调整为K+1维，本实施例取11维。输入源域样本优化交叉熵损失对模型参数预训练，损失函数如下所示，

式中，表示第i个样本，表示对应的样本类别标签，表示源域样本集，表示交叉熵损失，表示样本在分类器中的概率输出；其中，表示维分类器的概率输出。

实验使用Pytorch框架，批大小设置为64，使用动量0.9、学习率为0.001的SGD优化器。

（1.2）初始化类别原型，类别原型初始化公式如下所示，

（1.3）构建原型记忆库：

（2）迭代训练阶段

（2.1）基于类别原型的类间距离自适应区分目标域中未知类别样本

构造目标域样本和原型之间的相似度向量，其中为：

当时，目标域样本属于未知类，是类间距离，可由类别原型间相似度的均值计算，即

（2.2）基于原型对比损失学习网络参数，挖掘能迁移域间共享类中共性知识，同时保持类内近与类间远特性的高判别性特征。

（2.2.1）将样本和原型分别经由非线性转换G映射为，并基于映射表示构建源域原型对比损失函数：

式中，为温度参数，为指示函数，表示源域样本集，、、分别为样本、、经由非线性转换后的特征表示，、、分别为样本、、的类别标签，为对应类别原型的非线性映射表示，为其它类别原型的非线性映射表示，为余弦相似度。

（2.2.2）构建目标域原型对比损失，对于每个目标域样本，首先根据步骤（2.1）挑选已知类，然后根据类别分类器前10个神经元的概率输出确定其伪标签，目标域原型对比损失函数为：

式中，表示目标域已知类集合，表示样本的伪标签，为对应伪标签类别原型的非线性映射表示。

（2.2.3）构建目标域对比损失，对于无标签的目标域样本，采用基于数据增强的对比损失进行聚类，最大化同一类别中的样本互信息。所述数据增强包括随机裁剪、随机颜色失真和随机高斯模糊等随机处理。

给定任一样本，其正样本为自身进行数据增强后的视图，构建目标域样本的对比损失函数为，

式中，表示目标域样本集；和分别表示样本和其增强样本对应的非线性映射表示。

（2.2.4）构建分类损失，定义为，

（2.2.5）结合上述损失函数，最终的目标函数如下表示，

式中，表示平衡参数。

（2.3）基于特征提取器更新类别原型

（3）预测阶段

对测试样本进行分类，基于类间距离自适应区分已知和未知类样本，若样本属于已知类，则由类别分类器输出类别，由原型记忆库进行进一步细化分类。

原型记忆库由专家标注的未知类样本进行扩充，在不更新网络参数的情况下可以使用原型记忆库记录未知类样本原型，进而分类。根据步骤（2.1）思想，识别出目标域中未知类别后，计算未知类样本与各未知类原型间相似度，以确定未知类样本的类别，对其进一步细化分类。本实施例中，取200个D域样本（其中10个共有类，3个私有类），识别私有类后，基于主动学习方式请专家给3个样本赋类别标记，取其特征平均作为原型扩充原型存储记忆库。而后对其余未知类样本进一步细化分类，分类精度可达70%左右，以上实验结果证明本发明不仅能有效识别未知类别，更能通过扩充原型记忆库，对未知样本进一步细化分类。

为了进一步验证本发明的效果，采用不同的方法进行对比实验，如图3所示。其中，OSBP是基于对抗训练的OSDA方法，通过训练分类器和特征生成器，并基于分类器和预设的阈值，区分已知类别和未知类别样本；UAN是一种通用的域适应算法，综合了领域相似性和预测不确定性对样本加权；DANCE是一种新的邻域聚类技术，以自监督的方式学习目标域的结构，基于熵区分已知未知类；DCC是基于循环一致性匹配设计出领域共识得分指标来匹配类别；OURS即为本发明提出的方法。

采用不同的指标评估各方法预测的准确率。其中，ACC_kn表示已知类分类准确率，ACC_unk表示未知类分类准确率，HOS表示ACC_kn和ACC_unk的调和平均值。

实验结果如下表1所示。从表中可以看出，本发明的方法预测分类准确率均高于其他方法，其中对未知类的识别性能提高了2.3%，而已知类和未知类的总体识别性能也提高了2.1%。

表1：Office-31数据集在A->D任务上的分类准确率对比（单位：%）

方法	ACC_kn	ACC_unk	HOS
				OSBP	90.5	75.5	82.3
UAN	87.5	52.9	65.9
				DANCE	90.6	81.1	85.6
DCC	93.3	79.9	86.1
				OURS	93.6	83.4	88.2

Claims

1.一种基于原型对比学习的开集域适应方法，其特征在于，包括：

（4）扩充原型记忆库，进行类别扩展。

2.根据权利要求1所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（1）中，所述分类模型包括特征提取器和类别分类器，采用源域样本对分类模型进行预训练，分类损失函数为：

式中，表示第i个样本，/>表示对应的样本类别标签，/>表示源域样本集，/>表示交叉熵损失，/>表示样本/>在分类器中的概率输出；其中，/>表示/>维分类器的概率输出，/>表示源域已知类别的个数，/>和/>分别表示特征提取器和类别分类器，/>表示softmax函数。

3.根据权利要求2所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（1）中，所述初始化类别原型包括：

式中，表示第/>类的类别原型，/>表示样本/>的特征，/>为样本/>对应的类别标签；/>表示第/>类中包含样本数。

4.根据权利要求3所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（1）中，所述构建原型记忆库包括：

式中，、/>和/>分别表示第/>类样本的原型、对应的类别标签以及原型总数，此时。

5.根据权利要求4所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（2）包括：构造目标域样本和原型之间的相似度向量，其中/>为样本特征/>与原型/>之间的相似度，表示为：

式中，当时，目标域样本属于未知类；/>表示类间距离，为自适应阈值，由类别原型间相似度的均值计算。

6.根据权利要求5所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（3）包括：

（3.1）构建源域原型对比损失函数；

将样本和原型分别经由非线性转换G映射为，并基于映射表示构建源域原型对比损失函数/>：

式中，为温度参数，/>为指示函数，/>表示源域样本集，/>、/>、/>分别为样本/>、/>、/>经由非线性转换后的特征表示，/>、/>、/>分别为样本/>、/>、/>的类别标签，/>为/>对应类别原型的非线性映射表示，/>为其它类别原型的非线性映射表示，/>为余弦相似度；

（3.2）构建目标域原型对比损失函数；

对于目标域已知类样本，根据类别分类器前个神经元的概率输出确定其伪标签，则目标域原型对比损失函数/>为：

式中，表示目标域已知类集合；/>表示样本/>的伪标签，/>为对应伪标签类别原型的非线性映射表示；

（3.3）构建目标域增强对比损失函数；

对于目标域样本，通过数据增强构建正样本/>，则目标域增强对比损失函数/>为：

式中，表示目标域样本集；/>和/>分别表示样本/>和其增强样本/>对应的非线性映射表示；/>、/>分别为样本/>、/>经由非线性转换后的特征表示；

（3.4）构建分类损失函数；

式中，表示未知类目标域的集合。

7.根据权利要求6所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（3）中所述目标函数为：

式中，表示平衡参数。

8.根据权利要求7所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（3）中所述基于特征提取器更新类别原型包括：

式中，为原型权重参数，/>为源域第k类的原型，/>为目标域第k类的原型。

9.根据权利要求8所述的基于原型对比学习的开集域适应方法，其特征在于，步骤（4）中所述扩充原型记忆库包括：根据步骤（2）区分已知类和未知类，在原型记忆库中增加新类别原型的存储，对未知类进一步识别。

10.一种基于原型对比学习的开集域适应系统，其特征在于，包括：

类别扩展模块，用于扩充原型记忆库，进行类别扩展。