CN114863175A - 一种无监督多源部分域适应图像分类方法 - Google Patents
一种无监督多源部分域适应图像分类方法 Download PDFInfo
- Publication number
- CN114863175A CN114863175A CN202210505184.1A CN202210505184A CN114863175A CN 114863175 A CN114863175 A CN 114863175A CN 202210505184 A CN202210505184 A CN 202210505184A CN 114863175 A CN114863175 A CN 114863175A
- Authority
- CN
- China
- Prior art keywords
- domain
- source
- samples
- target
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 21
- 238000009826 distribution Methods 0.000 claims abstract description 40
- 238000005259 measurement Methods 0.000 claims abstract description 18
- 238000013508 migration Methods 0.000 claims abstract description 16
- 230000005012 migration Effects 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 abstract description 26
- 238000005457 optimization Methods 0.000 abstract description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种无监督多源部分域适应图像分类方法,包括:对源域和目标域的每一个样本进行域不变特征和域私有特征的提取;采用最大平均差异度量以及条件分布差异度量计算源域和目标域样本分布的对齐程度,以缩小两者的分布差异,并由所得样本间欧式距离的度量结果在进行归一化处理后,计算平衡因子ω;将源域样本导入训练所得的分类器,根据概率标签对源域样本进行加权以降低无关类样本造成的负迁移;构建域分类器,进一步训练域私有特征提取器,使所得域私有特征更具判别性;计算总体损失,迭代更新优化模型参数。本发明能够解决域对齐任务和分类任务本身之间的优化不一致性问题以及部分域适应中无关类样本造成的负迁移问题。
Description
技术领域
本发明属于迁移学习中的域适应技术领域,尤其涉及一种基于多样性特征学习和贡献动态加权学习的无监督多源部分域适应图像分类方法。
背景技术
域适应,主要解决的问题是具有相同特征和类别,但是数据特征分布不同的源域和目标域。通过将源域的知识迁移到目标域中,解决目标域任务。在传统机器学习中往往假设训练集样本与测试集样本具有相同的分布,从而提高其预测模型在预测标签时的精度。但当前很多学习场景中,这两者往往存在不同分布,其不同分布体现在边缘分布和条件分布上。现实场景中往往存在大量的训练数据集,通过大量数据的训练能够较好的提升预测精度,而若在多个数据集中进行模型的训练,其不同数据集内的数据间分布差异对于模型的测试结果可能会造成更大的影响,而忽略分布差异往往会导致模型的过拟合,从而使得预测结果不能达到理想精度。
虽然现有域适应模型在不同领域得到了较好的应用,但是其主要通过减少域差异且依赖于完全共享标记空间的假设。然而在现实应用中,目标域标记空间往往为源域标记空间的子集,这种场景的域适应称为部分域适应(Partial Domain Adaptation,PDA)。从大数据层面上对域适应问题进行讨论,可以假设大规模数据集的多样性足以覆盖小规模数据集的所有类别,其正符合部分域适应问题场景的设定。随着大数据的普及,部分域适应问题将受到更广泛的关注和研究。部分域适应问题相较于标准的域适应问题更具有普遍性和挑战性。
此外,目前域适应领域的研究,虽针对无监督多源域场景以及部分域适应问题均有所研究,然而鲜有无监督多源域场景下部分域适应问题的相关研究。
发明内容
解决的技术问题:针对现有技术的不足以及相关研究的缺失,本发明提出了一种基于多样性特征学习和贡献动态加权学习的无监督多源部分域适应图像分类方法,以解决现有的无监督多源域场景下部分域适应方法中域对齐任务和分类任务本身之间的优化不一致性问题以及部分域适应中无关类样本造成的负迁移问题。
技术方案:。
一种无监督多源部分域适应图像分类方法,所述分类方法包括以下步骤:
S1,多样性特征提取:对源域和目标域的每一个样本进行域不变特征和域私有特征的提取;
S2,构造动态权重因子:采用最大平均差异度量以及条件分布差异度量计算源域和目标域样本分布的对齐程度,以缩小两者的分布差异,并由所得样本间欧式距离的度量结果在进行归一化处理后,计算平衡因子ω;
S3,源域样本动态加权:将源域样本导入训练所得的分类器,根据概率标签对源域样本进行加权以降低无关类样本造成的负迁移;
S4,构建域分类器,进一步训练域私有特征提取器,使所得域私有特征更具判别性;
S5,计算总体损失,迭代更新优化模型参数。
进一步地,步骤S1中,多样性特征提取的过程包括以下步骤:
构建两个特征提取器,采用两个特征特征提取器分别得到域不变特征fc和域私有特征fd;所述域不变特征表示形式如式(1)所示:
所述域私有特征表示形式如式(2)所示:
其中,j=1,2,…,nt,k=1,2,…,K;表示第k个源域中的样本数,nt表示目标域中的样本数,表示第k个域不变特征提取器提取的第k个源域的第i个样本的特征,表示第k个域不变特征提取器提取的目标域第j个样本的特征,表示第k个域私有特征提取器提取的第k个源域的第i个样本的特征,表示第k个域私有特征提取器提取的第k个源域的第j个样本的特征,表示第k个源域的特征提取器,分别为相关的参数,分别表示第k个源域中第i个样本共享特征空间中的特征和目标域中第i个样本共享特征空间中的特征,K表示源域数量。。
进一步地,步骤S2中,构造动态权重因子的过程包括以下步骤:
S26,针对源域和目标域样本间的距离度量构建平衡因子w:
进一步地,步骤S3中,源域样本动态加权的过程包括以下步骤:
构建分类器获取概率标签,利用所得概率标签对权重γ进行计算,消除源域中无关类样本所造成的负迁移;根据式(10)更新域不变特征提取器和分类器的网络参数:
其中,Gc,Gy分别为域不变特征提取器和分类器,θc,θy分别表示域不变特征提取器和分类器参数,y为源域真实标签,Ly(θc,θy)表示分类器训练损失,ns表示源域样本数量;
将目标域样本通过分类器所得概率标签y定义为目标域样本伪标签,根据式(11)计算得到权重γ:
其中,nt表示目标域样本数。
进一步地,步骤S4中,根据式(12)更新域私有特征提取器和域分类器的网络参数:
其中,Gp,Gd分别为域私有特征提取器和域分类器,θp,θd分别表示域私有特征提取器和域分类器参数,d为域标签,ns表示源域样本数。
进一步地,步骤S5中,根据式(13)计算总体损失:
其中,α,β为超参数。
进一步地,所述分类方法还包括以下步骤:
有益效果:
本发明提出一种基于多样性特征学习和贡献动态加权学习的无监督多源部分域适应图像分类方法,首先构建域不变特征提取器和域私有特征提取器对源域样本和目标域样本的特征提取,再通过最大平均差异度量以及条件分布差异度量对源域和目标域边缘分布和条件分布进行对齐,以消除其分布差异;其次通过距离度量对不同计算出不同源域对域适应过程的贡献度平衡因子w进行动态加权学习;然后,通过构建分类器以及域分类器对进一步训练域不变特征提前器和域私有特征提取器;最后通过不断迭代计算总体目标损失,并对模型参数进行优化更新。通过这种方式可以使的域对齐学习和分类学习这两种学习处于有效的学习状态,且能够有效地解决部分域适应过程中的负迁移问题。本发明将无监督域适应中的域对齐学习与加权学习,在多源域适应问题以及部分域适应问题中,通过计算域对齐损失和分类损失,并得到相应得权重;本发明通过计算出的域对齐损失,更新网络参数θ,将θ用于计算分类损失,以此来加强优化网络参数的一致性;本发明使模型泛化能力更强,分类准确率更高。
附图说明
图1为本发明实施例的无监督多源部分域适应图像分类方法流程图;
图2为本发明实施例的无监督多源部分域适应图像分类方法的网络模型图。
具体实施方式
下面的实施例可使本专业技术人员更全面地理解本发明,但不以任何方式限制本发明。
本发明提出的一种基于多样性特征学习和贡献动态加权学习的无监督多源部分域适应图像分类方法包括下述步骤,流程如图1所示:
步骤1:多样性特征提取。
在无监督多源域适应问题中,单一源域的知识可能不足以预测目标任务,因此考虑利用具有更丰富可迁移知识的多个源域来完成目标任务。但不同源域具有不同的知识,若忽略其之间的差异往往并不能取得较为理想的迁移效果,从而在域适应过程造成负迁移现象。
为了更有效地利用多个源域中所富含的知识,本发明构建域不变特征和域私有特征提取器,对多个源域的特征进行提取从而促进模型迁移和泛化能力。具体而言,对源域和目标域的每一个样本进行域不变特征和域私有特征的提取方式如下:构建两个特征提取器,其表示形式如式(1)和式(2)所示,得到域不变特征fc和域私有特征fp。
所述域不变特征表示形式如式(1)所示:
所述域私有特征表示形式如式(2)所示:
步骤2:构造动态权重因子。
在无监督多源域适应中,不同源域对目标域迁移任务有不同的贡献度,因此合理对不同源域和目标域间相似度的度量是解决多源域适应问题的关键。本发明采用最大平均差异度量以及条件分布差异度量计算源域和目标域样本分布的对齐程度,在一定程度上缩小两者的分布差异,并由所得样本间欧式距离的度量结果在进行归一化处理后,计算平衡因子ω。
具体而言,计算源域各样本之间的数据分布对齐程度,以最小化源域的域不变特征的差异:
根据式(4)计算源域各样本之间的数据分布对齐程度,以最大化源域的域私有特征的差异:
因此综合上述步骤可以得出源域分布对齐目标,如式(5)所示:
根据式(3)计算源域和目标域的可判别性:
再对源域和目标域样本进行条件分布对齐,即缩小类内距离和扩大类间距离:
其中,C为源域类数目,r1,r2为对应的类别。
结合上述式(6)和(7)构成目标域适应损失:
针对源域和目标域样本间的距离度量构建平衡因子ω:
步骤3:源域样本动态加权。
在部分域适应问题源域中的无关类样本在迁移的过程中会造成较严重的负迁移的现象,为了有效消除其产生的负迁移,本发明通过利用其概率标签对源域样本进行对应的加权,从而减少源域中无关类样本在迁移过程中的重要性。具体而言,本发明构建分类器获取概率标签,再利用所得概率标签对权重γ进行计算从而消除源域中无关类样本所造成的负迁移。
所述计算分类损失,根据式(10)更新网络参数θ:
其中,Gc,Gy分别为域不变特征提取器和分类器,θc,θy分别表示域不变特征提取器和分类器参数,y为源域真实标签。
将目标域样本通过分类器所得概率标签y为目标域样本伪标签,并由此得到权重γ:
步骤4:进一步训练特征提取器。
为了促进域适应过程中的正迁移,即促进所提方法中的边缘分布对齐以及条件分布对齐,本发明对所构建的域私有特征提取器进行进一步训练,从而使得提取所得域私有特征更具判别性。具体而言,通过构建域分类器,进一步训练域私有特征提取器,使得提前所得域私有特征更具判别性,计算其分类损失,根据式(12)更新网络参数θ:
其中,Gp,Gd分别为域私有特征提取器和域分类器,θp,θd分别表示域私有特征提取器和域分类器参数,d为域标签。
步骤5:计算整体损失,对模型参数进行迭代更新优化。
结合上述过程所提目标损失,构建本发明所构建模型整体目标损失,其形式如式(13):
其中,α,β为超参数。
本发明提供了一种基于多样性特征学习和贡献动态加权学习的无监督多源部分域适应图像分类方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (7)
1.一种无监督多源部分域适应图像分类方法,其特征在于,所述分类方法包括以下步骤:
S1,多样性特征提取:对源域和目标域的每一个样本进行域不变特征和域私有特征的提取;
S2,构造动态权重因子:采用最大平均差异度量以及条件分布差异度量计算源域和目标域样本分布的对齐程度,缩小源域和目标域样本之间的分布差异,并由所得样本间欧式距离的度量结果在进行归一化处理后,计算平衡因子ω;
S3,源域样本动态加权:将源域样本导入训练所得的分类器,根据概率标签对源域样本进行加权以降低无关类样本造成的负迁移;
S4,构建域分类器,进一步训练域私有特征提取器,使所得域私有特征更具判别性;
S5,计算总体损失,迭代更新优化模型参数。
2.根据权利要求1所述的无监督多源部分域适应图像分类方法,其特征在于,步骤S1中,多样性特征提取的过程包括以下步骤:
构建两个特征提取器,采用两个特征特征提取器分别得到域不变特征fc和域私有特征fd;
所述域不变特征表示形式如式(1)所示:
所述域私有特征表示形式如式(2)所示:
3.根据权利要求2所述的无监督多源部分域适应图像分类方法,其特征在于,步骤S2中,构造动态权重因子的过程包括以下步骤:
S26,针对源域和目标域样本间的距离度量构建平衡因子w:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210505184.1A CN114863175A (zh) | 2022-05-10 | 2022-05-10 | 一种无监督多源部分域适应图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210505184.1A CN114863175A (zh) | 2022-05-10 | 2022-05-10 | 一种无监督多源部分域适应图像分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114863175A true CN114863175A (zh) | 2022-08-05 |
Family
ID=82637562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210505184.1A Pending CN114863175A (zh) | 2022-05-10 | 2022-05-10 | 一种无监督多源部分域适应图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863175A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115546567A (zh) * | 2022-12-01 | 2022-12-30 | 成都考拉悠然科技有限公司 | 一种无监督领域适应分类方法、系统、设备及存储介质 |
CN116883735A (zh) * | 2023-07-05 | 2023-10-13 | 江南大学 | 基于公有特征和私有特征的域自适应小麦种子分类方法 |
CN117407693A (zh) * | 2023-10-20 | 2024-01-16 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
-
2022
- 2022-05-10 CN CN202210505184.1A patent/CN114863175A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115546567A (zh) * | 2022-12-01 | 2022-12-30 | 成都考拉悠然科技有限公司 | 一种无监督领域适应分类方法、系统、设备及存储介质 |
CN116883735A (zh) * | 2023-07-05 | 2023-10-13 | 江南大学 | 基于公有特征和私有特征的域自适应小麦种子分类方法 |
CN116883735B (zh) * | 2023-07-05 | 2024-03-08 | 江南大学 | 基于公有特征和私有特征的域自适应小麦种子分类方法 |
CN117407693A (zh) * | 2023-10-20 | 2024-01-16 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
CN117407693B (zh) * | 2023-10-20 | 2024-05-24 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Incdet: In defense of elastic weight consolidation for incremental object detection | |
CN114863175A (zh) | 一种无监督多源部分域适应图像分类方法 | |
CN114169442B (zh) | 基于双原型网络的遥感图像小样本场景分类方法 | |
CN110659378B (zh) | 基于对比相似性损失函数的细粒度图像检索方法 | |
Liang et al. | Comparison detector for cervical cell/clumps detection in the limited data scenario | |
CN113326731A (zh) | 一种基于动量网络指导的跨域行人重识别算法 | |
CN111832511A (zh) | 一种增强样本数据的无监督行人重识别方法 | |
CN104112018A (zh) | 一种大规模图像检索方法 | |
Picek et al. | Plant recognition by AI: Deep neural nets, transformers, and kNN in deep embeddings | |
CN116910571B (zh) | 一种基于原型对比学习的开集域适应方法及系统 | |
Yu et al. | Recognition method of soybean leaf diseases using residual neural network based on transfer learning | |
CN106569954A (zh) | 一种基于kl散度的多源软件缺陷预测方法 | |
CN115761408A (zh) | 一种基于知识蒸馏的联邦域适应方法及系统 | |
CN115880723A (zh) | 一种基于样本加权的无监督多源域适应的行人重识别方法 | |
Wu et al. | Boundaryface: A mining framework with noise label self-correction for face recognition | |
Wang et al. | Weakly supervised object detection based on active learning | |
Sun et al. | A Deep Model for Partial Multi-label Image Classification with Curriculum-based Disambiguation | |
Jin-Heng et al. | CDBSCAN: Density clustering based on silhouette coefficient constraints | |
Xu et al. | Prdp: Person reidentification with dirty and poor data | |
CN112149556B (zh) | 一种基于深度互学习和知识传递的人脸属性识别方法 | |
Chulif et al. | Herbarium-Field Triplet Network for Cross-domain Plant Identification. NEUON Submission to LifeCLEF 2020 Plant. | |
CN111651660A (zh) | 一种跨媒体检索困难样本的方法 | |
CN116681128A (zh) | 一种带噪多标签数据的神经网络模型训练方法和装置 | |
Guo et al. | Classification of marine plankton based on few-shot learning | |
Wang et al. | Towards adaptive unknown authentication for universal domain adaptation by classifier paradox |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |