CN112836795B - 一种多源非均衡域自适应方法 - Google Patents
一种多源非均衡域自适应方法 Download PDFInfo
- Publication number
- CN112836795B CN112836795B CN202110111137.4A CN202110111137A CN112836795B CN 112836795 B CN112836795 B CN 112836795B CN 202110111137 A CN202110111137 A CN 202110111137A CN 112836795 B CN112836795 B CN 112836795B
- Authority
- CN
- China
- Prior art keywords
- domain
- source
- network
- source domain
- unbalanced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种多源非均衡域自适应方法,具体包括如下步骤:步骤1,对各个源域的图像数据进行预处理;步骤2,计算源域数据和目标域数据之间的Wasserstein距离;步骤3:构建多源域自适应网络,确定多源域自适应过程中各源域自适应损失权重λi;步骤4:构建多源非均衡域自适应网络框架,确定各源域整体在多源域自适应过程的非平衡因子;步骤5:在多源域自适应过程中为各源域整体加入动态调节因子,使目标域数据的平均识别准确率超过96%。本发明解决了现有技术在多源域自适应过程中,均衡地采用各个源域的特征信息所产生的负迁移现象,进而导致训练的图像分类器准确率不高的问题。
Description
技术领域
本发明属于多源域深度迁移学习中的域自适应技术领域,涉及一种多源非均衡域自适应方法。
背景技术
目前,深度学习算法成功的主要因素在于其拥有大量的有标注的数据样本,同时深度学习要求其训练数据集和测试数据集必须满足来自同一分布的假设前提。迁移学习可以从其他领域的标注信息去学习知识,降低了深度学习中测试数据与训练数据同分布的要求,有效地在相似的领域或任务之间进行信息的共享和迁移。研究者将迁移学习的方法引入到深度学习当中,提出了深度迁移学习算法,弥补了深度学习算法的不足,同时利用深度学习的优点来学习迁移学习中的域不变特征,取得了比传统迁移学习更好的分类识别能力。因此,深度迁移学习成为了当前的研究热点。
当前,深度迁移学习算法已经取得了巨大成功,研究者大多数都是在研究单个源域到目标域的学习,即单源域深度迁移学习。然而在实际生活中,源域数据通常是通过各种渠道获得的,不同渠道得到的源域数据与目标域数据在数据分布上相似但是相似程度不同,而且不同渠道得到的源域数据在数据分布上也会存在差异。单源域深度迁移学习算法在解决这种实际情况时将会产生一个较差的性能,因此,多源域深度迁移学习逐渐成为了研究的热点。
多源域深度迁移学习主要是利用多个源域学习到的知识对目标域中的数据进行正确分类。目前,多源域深度迁移学习方法存在以下不足:它们平等地对待各个源域,均衡地进行域自适应处理,没有考虑到将各源域与目标域特征分布之间的差异信息加入到网络的迭代训练过程中,当有多个源域与目标域的差异较大时,这种处理就会产生负迁移现象,从而导致训练的图像分类器准确率不高。
发明内容
本发明的目的是提供一种多源非均衡域自适应方法,解决了现有技术在多源域自适应过程中,均衡地采用各个源域的特征信息所产生的负迁移现象,进而导致训练的图像分类器准确率不高的问题。
本发明所采用的技术方案是,一种多源非均衡域自适应方法,具体包括如下步骤:
步骤1,对各个源域的图像数据进行预处理;
步骤2,将经步骤1处理的各个源域的图像数据分别与目标域数据放进预训练好的单源域自适应网络中做前向传播,通过网络迭代,计算源域数据和目标域数据之间的Wasserstein距离;
步骤3:构建基于Wasserstein度量准则的多源域自适应网络,将经步骤1处理的源域数据输入到该多源域自适应网络中,确定多源域自适应过程中各源域自适应损失权重λi;
步骤4:在步骤3的基础上,构建基于Wasserstein度量准则的多源非均衡域自适应网络框架,再次将经步骤1处理的源域数据输入到网络中,确定各源域整体在多源域自适应过程的非平衡因子;
步骤5:在多源域自适应过程中为各源域整体加入动态调节因子,对步骤4构建的多源非均衡域自适应网络进行训练,当目标域平均识别准确率达到96%时,调节网络参数,再次进行多源非均衡域自适应网络的训练,使目标域数据的平均识别准确率超过96%。
本发明的特点还在于:
步骤1的具体过程为:
将各源域与目标域的图像处理成统一的大小,并将各源域图像进行归一化处理。
步骤2的具体过程为:
步骤2.1,固定AlexNet网络的第7层全连接层,在第7层全连接层后加入领域判别器;
步骤2.2,设置网络的损失函数为:
Losstotal=Lclf+λ(LwdβLgrad) (1);
公式(1)中,Lclf为源域数据的分类损失项,Lwd表示Wassertein距离,并Lwd设置为领域判别损失项,Lgrad表示领域判别器参数的梯度惩罚项,λ,β为超参数;
Lclf定义为:
表示源域样本真实的概率分布;
yi的定义为:
yi表示深度网络将源域样本估计为第i个类别的概率值;表示源域数据通过神经元计算得到其属于第i类的数值,/>表示源域数据通过神经元计算得到其属于各个类的数值,/>表示将所有的/>相加所得的数值:
Lwd表达式为:
公式(4)中,xs和xt分别表示各源域与目标域的数据,ns和nt分别表示各源域与目标域数据的总量,fg为网络前五层卷积层作为特征提取器的函数,fw为领域判别器的学习函数;
Lgrad的表达式为:
公式(5)中,fw(h)为领域判别器学习的一个函数,fw(h)表示将特征提取器fg计算得到的数据特征h转化为一个具体的数字,表示h梯度,h表示利用特征提取器fg计算得到的数据特征;
步骤2.3,将各源域数据分别与目标域数据输入到单源域自适应网络中做前向传播,通过网络迭代,最大化Lwd-βLgrad来训练领域判别器,最小化网络损失函数,当步骤2.2中的网络损失函数拟合时,利用Lwd评估各源域与目标域特征分布之间的Wasserstein距离。
步骤3的具体过程为:
步骤3.1,构建基于Wasserstein度量准则的多源域自适应网络,该网络是基于Alexnet卷积神经网络设计的多源域深度迁移学习网络框架,该网络包含5层卷积层、3层全连接层、n个判别器;
步骤3.2,设计多源域自适应网络的损失函数为:
公式(6)中,表示第i个源域的分类损失,即交叉熵损失,/>表示第i个源域与目标域特征分布之间的Wasserstein距离损失,λi则表示第i源域与目标域自适应损失项的权重;
步骤3.3,将经步骤1处理后的各源域数据及目标域数据共同输入到步骤3.1构建的多源域自适应网络中,进行若干次网络迭代,直到损失函数拟合,并且当目标域数据平均识别准确率大于等于95%时,记录各源域自适应损失项权重λi。
步骤4的具体过程为:
步骤4.1,基于步骤3.1构建的多源域自适应网络,在该网络基础上为各源域整体加入非平衡因子,构建基于Wasserstein度量准则的多源非均衡域自适应网络;
步骤4.2,设置多源非均衡域自适应网络损失函数为:
公式(7)中,αi表示多源非均衡域自适应网络为各源域添加的非平衡因子;
步骤4.3,基于步骤2.3得到的各源域与目标域之间的Wasserstein距离,将这些Wasserstein距离数值进行排序;
步骤4.4,将Wasserstein距离数值最大时对应的非平衡因子αi设置为最小值1,将Wasserstein距离数值最小时对应的非平衡因子αi设置为最大值10,位于Wasserstein距离最大值与Wasserstein距离最小值之间的其余源域非平衡因子αi,根据步骤4.3中Wasserstein距离数值的排序,依据Wasserstein距离数值越大,多源非均衡域自适应网络为与该Wasserstein距离对应的源域设置一个越小的非平衡因子αi的原则,设置非平衡因子αi数值,其余源域非平衡因子αi的初始设置范围均为1~10之间;
步骤4.5,将经步骤1处理的所有源域数据及目标域数据共同输入到步骤4.1构建的基于Wasserstein度量准则的多源非均衡域自适应网络中,手动调节步骤4.4中各源域整体的非平衡因子αi,通过网络的迭代,最小化步骤4.2中的损失函数,当目标域数据平均识别准确率达到95.5%时,记录各源域整体的非平衡因子αi,该平衡因子αi即各源域整体的权重。
步骤5的具体过程为:
步骤5.1,根据步骤4.5所得到的各源域权重,多源非均衡域自适应网络基于正态分布原理为各源域添加动态调节因子δi,如下公式(8)所示:
公式(8)中,θi表示动态调节因子的超参数;
步骤5.2:基于步骤5.1所得的动态调节因子,重新设置多源非均衡域自适应网络损失函数为:
步骤5.3:将经步骤1处理的源域数据及目标域数据共同输入到步骤4.1构建的基于Wasserstein度量准则的多源非均衡域自适应网络中,最小化步骤5.2中的网络损失函数,当网络损失函数拟合时,并且目标域平均识别准确率达到96%,调节动态调节因子的超参数θi、λi、β,使目标域平均识别准确率超过96%。
本发明的有益效果是,本发明提出的一种多源非均衡域自适应方法,在其网络训练迭代过程中,非均衡地借鉴各源域的特征信息,充分利用各源域的有效特征信息,提高了目标域的识别准确率。
附图说明
图1是本发明一种多源非均衡域自适应方法的流程图;
图2是本发明一种多源非均衡域自适应方法中基于Wasserstein度量准则的多源域自适应网络框架图;
图3是本发明一种多源非均衡域自适应方法中基于Wasserstein度量准则的多源非均衡域自适应网络框架图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种多源非均衡域自适应方法,如图1所示,包括如下步骤:
步骤1,对各个源域的图像数据进行预处理;
步骤1具体按照以下步骤实施:
将各源域与目标域的图像处理成统一的大小,并将图片进行归一化处理;
步骤2,将经步骤1处理的各个源域的图像数据分别与目标域数据放进预训练好的单源域自适应网络中做前向传播,通过网络迭代,计算源域数据和目标域数据之间的Wasserstein距离;
步骤2中所涉及到的单源域自适应网络为在ImageNet上训练好的AlexNet网络模型,该网络由5层卷积层和3层全连接层组成;
步骤2具体按照以下步骤实施:
步骤2.1:固定AlexNet网络的第7层全连接层,在第7层全连接层后加入域自适应层来减小领域之间的差异,即加入领域判别器;
步骤2.2:设置网络的损失函数为:
Losstotal=Lclf+λ(Lwd-βLgrad) (1)
公式(1)中Lclf为源域数据的分类损失项,Lwd表示Wassertein距离,将Lwd设置为领域判别损失项,Lgrad表示领域判别器参数的梯度惩罚项,λ,β为超参数;
步骤2.2公式(1)中,Lclf定义为:
公式(2)中,表示源域样本真实的概率分布,yi的定义为:
公式(3)中,yi表示深度网络将源域样本估计为第i个类别的概率值,表示源域数据通过神经元计算得到其(其指源域数据)属于第i类的数值,/>表示源域数据通过神经元计算得到其(其指源域数据)属于各个类别的数值,/>表示将所有的/>相加所得的数值。
步骤2.2公式(1)中,Lwd表达式为:
公式(4)中,xs和xt分别表示各源域与目标域的数据,和ns nt分别表示各源域与目标域数据的总量,fg为网络前五层卷积层作为特征提取器的函数表示,fg学习领域不变特征表示,fw为领域判别器学习的一个函数,fw将特征提取器fg计算得到的源域数据特征表示hs=fg(xs)以及目标域数据特征表示ht=fg(xt)转化为一个具体的数字,用来计算源域及目标域特征分布之间的Wassertein距离;
步骤2.2公式(1)中,Lgrad表示领域判别器参数的梯度惩罚,为网络添加梯度惩罚,避免了梯度消失以及梯度爆炸,其表达式为:
公式(5)中,Lgrad表示领域判别器参数的梯度惩罚,fw(h)为领域判别器学习的一个函数,它表示将特征提取器fg计算得到的数据特征表示h转化为一个具体的数字,表示h梯度,h表示利用特征提取器fg计算得到的数据特征表示;
步骤2.3:将各源域数据分别与目标域数据输入到单源域自适应网络中做前向传播,通过网络迭代,最大化Lwd-βLgrad来训练领域判别器,最小化网络损失函数,当网络损失函数拟合时,利用Lwd评估各源域与目标域特征分布之间的Wasserstein距离;
步骤3:构建基于Wasserstein度量准则的多源域自适应网络,将经步骤1处理的源域数据输入到该多源域自适应网络中,确定多源域自适应过程中各源域自适应损失权重λi;
步骤3具体按照以下步骤实施:
步骤3.1:构建基于Wasserstein度量准则的多源域自适应网络,如图2所示,该网络是基于Alexnet卷积神经网络设计的多源域深度迁移学习网络框架,该网络包含5层卷积层(Conv1-5)、3层全连接层(Fc6-Fc8)、多个判别器(源域总个数n),前5层卷积层负责提取各源域与目标域数据的图像特征,在第7层全连接层后加入领域判别器来减小领域之间的差异,最后一层全连接层负责计算各源域的分类损失;
步骤3.2:设计多源域自适应网络的损失函数为:
公式(6)中表示第i个源域的分类损失,即交叉熵损失,/>表示第i个源域与目标域特征分布之间的Wasserstein距离损失,λi则表示第i源域与目标域自适应损失项的权重,λi设置为相同数值,β实验设置为固定值,Lgrad表示领域判别器参数的梯度惩罚,具体公式在步骤2.2中已说明。
步骤3.3:将各源域与目标域的数据共同输入到多源域自适应网络中,通过网络迭代,最小化损失函数,直到损失函数拟合,并且当目标域数据平均识别准确率超过95%时,记录各源域自适应损失项权重λi的数值。
步骤4:在步骤3的基础上,构建基于Wasserstein度量准则的多源非均衡域自适应网络框架,再次将经步骤1处理的源域数据输入到网络中,确定各源域整体在多源域自适应过程的非平衡因子(非平衡因子即各源域整体的权重);
步骤4具体按照以下步骤实施:
步骤4.1:基于步骤3.1图2所构建的多源域自适应网络,在该网络基础上为各源域整体加入非平衡因子(各源域整体的权重),如图3所示,构建基于Wasserstein度量准则的多源非均衡域自适应网络;
步骤4.2:设置多源非均衡域自适应网络损失函数为:
公式(7)中,αi表示多源非均衡域自适应网络为各源域添加的权重(非平衡因子),表示第i个源域的分类损失,/>表示第i个源域与目标域特征分布之间的Wasserstein距离损失,λi则表示第i源域与目标域自适应损失项的权重,具体公式细节已于步骤2.2说明。
步骤4.3:基于步骤2.3得到的各源域与目标域之间的Wasserstein距离,将这些Wasserstein距离数值进行排序;
步骤4.4:将Wasserstein距离数值最大的对应源域权重αi设置为最小值1,将Wasserstein距离数值最小的对应源域权重αi设置为最大值10,其他源域权重根据步骤4.3中Wasserstein距离数值的排序,Wasserstein距离数值越大的,网络为其对应的源域添加一个较小的权重,反之亦然,其他源域权重初始设置范围均为1~10之间;
步骤4.5:将所有源域与目标域数据共同输入到网络中,手动微调步骤4.4中各源域整体的权重,通过网络的迭代,最小化步骤4.2中的损失函数,当目标域数据平均识别准确率达到95.5%时,记录各源域整体的非平衡因子(各源域整体的权重);
步骤5:在多源域自适应过程中为各源域整体加入动态调节因子,对步骤4构建的多源非均衡域自适应网络进行训练,当目标域平均识别准确率达到96%时,调节网络参数,再次进行多源非均衡域自适应网络的训练,使目标域数据的平均识别准确率超过96%。
步骤5具体按照以下步骤实施:
步骤5.1:根据步骤4.5所得到的各源域权重,为各源域设置动态调节因子,如图3所示,多源非均衡域自适应网络基于正态分布原理为各源域添加动态调节因子,且该因子的数值应在步骤4.5效果较佳的实验范围之中,动态调节因子设置为:
将步骤4.2公式(7)中各源域权重αi替换成公式(8)中的动态调节因子δi,公式(8)中,θi表示动态调节因子的超参数,用来调整δi的取值范围;
步骤5.2:本发明最终提出的基于Wasserstein度量准则的多源非均衡域自适应网络(Multi-sources Unbalanced Domain Adaptation,MUBDA)框架,如图3所示,该网络包含5层卷积层作为特征提取器(Conv1-5)、3层全连接层(Fc6-Fc8)、多个领域判别器(源域总个数n),该网络为各源域整体在多源域自适应过程中添加动态调节因子,基于步骤5.1,重新设置该网络损失函数为:
具体公式已于前面步骤说明,其中δi为各源域的动态调节因子。
步骤5.3:将所有源域数据以及目标域数据共同输入到本发明提出的基于Wasserstein度量准则的多源非均衡域自适应网络(Multi-sources Unbalanced DomainAdaptation,MUBDA),最小化网络损失函数,当网络损失函数拟合时,并且目标域平均识别准确率达到96%,微调动态调节因子的超参数θi,λi,β,使目标域平均识别准确率超过96%。
实施例
本发明最终采用office-caltech10数据集来验证该方法的有效性,该数据集包含Amazon(A)、Dslr(D)、Webcam(W)、Caltech(C)4个子数据集,各子数据集均包含相同的10类数据,选取其中3个子数据集作为源域。本发明的方法与当前多源域自适应技术做对比,包含深度鸡尾酒网络(DCTN),矩匹配网络(M3SDA),对比结果如下表1所示:
表1
实验中的具体参数αi根据步骤4.4得到的各源域整体的权重进行调节,使其在一定范围内,本实例中αi最终取值范围均在1到5之间,θi取值为1022,λi在确定具体数值后进行微调,其取值如下表示,β取值为15,当源域为Amazon、dslr、caltech或者webcam、caltech10、dslr时网络参数batch size设置为150,当源域为dslr,amazon,webcam或amazon,webcam,caltech时网络参数bach size设置为120。
Claims (3)
1.一种多源非均衡域自适应方法,其特征在于:具体包括如下步骤:
步骤1,对各个源域的图像数据进行预处理;
步骤2,将经步骤1处理的各个源域的图像数据分别与目标域数据放进预训练好的单源域自适应网络中做前向传播,通过网络迭代,计算源域数据和目标域数据之间的Wasserstein距离;
步骤3:构建基于Wasserstein度量准则的多源域自适应网络,将经步骤1处理的源域数据输入到该多源域自适应网络中,确定多源域自适应过程中各源域自适应损失权重λi;
所述步骤3的具体过程为:
步骤3.1,构建基于Wasserstein度量准则的多源域自适应网络,该网络是基于Alexnet卷积神经网络设计的多源域深度迁移学习网络框架,该网络包含5层卷积层、3层全连接层、n个判别器;
步骤3.2,设计多源域自适应网络的损失函数为:
公式(1)中,表示第i个源域的分类损失,即交叉熵损失,/>表示第i个源域与目标域特征分布之间的Wasserstein距离损失,λi则表示第i源域与目标域自适应损失项的权重;
步骤3.3,将经步骤1处理后的各源域数据及目标域数据共同输入到步骤3.1构建的多源域自适应网络中,进行若干次网络迭代,直到损失函数拟合,并且当目标域数据平均识别准确率大于等于95%时,记录各源域自适应损失项权重λi;
步骤4:在步骤3的基础上,构建基于Wasserstein度量准则的多源非均衡域自适应网络框架,再次将经步骤1处理的源域数据输入到网络中,确定各源域整体在多源域自适应过程的非平衡因子;
步骤4的具体过程为:
步骤4.1,基于步骤3.1构建的多源域自适应网络,在该网络基础上为各源域整体加入非平衡因子,构建基于Wasserstein度量准则的多源非均衡域自适应网络;
步骤4.2,设置多源非均衡域自适应网络损失函数为:
公式(2)中,αi表示多源非均衡域自适应网络为各源域添加的非平衡因子;
步骤4.3,基于步骤2.3得到的各源域与目标域之间的Wasserstein距离,将这些Wasserstein距离数值进行排序;
步骤4.4,将Wasserstein距离数值最大时对应的非平衡因子αi设置为最小值1,将Wasserstein距离数值最小时对应的非平衡因子αi设置为最大值10,位于Wasserstein距离最大值与Wasserstein距离最小值之间的其余源域非平衡因子αi,根据步骤4.3中Wasserstein距离数值的排序,依据Wasserstein距离数值越大,多源非均衡域自适应网络为与该Wasserstein距离对应的源域设置一个越小的非平衡因子αi的原则,设置非平衡因子αi数值,其余源域非平衡因子αi的初始设置范围均为1~10之间;
步骤4.5,将经步骤1处理的所有源域数据及目标域数据共同输入到步骤4.1构建的基于Wasserstein度量准则的多源非均衡域自适应网络中,手动调节步骤4.4中各源域整体的非平衡因子αi,通过网络的迭代,最小化步骤4.2中的损失函数,当目标域数据平均识别准确率达到95.5%时,记录各源域整体的非平衡因子αi,该平衡因子αi即各源域整体的权重;
步骤5:在多源域自适应过程中为各源域整体加入动态调节因子,对步骤4构建的多源非均衡域自适应网络进行训练,当目标域平均识别准确率达到96%时,调节网络参数,再次进行多源非均衡域自适应网络的训练,使目标域数据的平均识别准确率超过96%;
步骤5的具体过程为:
步骤5.1,根据步骤4.5所得到的各源域权重,多源非均衡域自适应网络基于正态分布原理为各源域添加动态调节因子δi,如下公式(3)所示:
公式(3)中,θi表示动态调节因子的超参数;
步骤5.2:基于步骤5.1所得的动态调节因子,重新设置多源非均衡域自适应网络损失函数为:
步骤5.3:将经步骤1处理的源域数据及目标域数据共同输入到步骤4.1构建的基于Wasserstein度量准则的多源非均衡域自适应网络中,最小化步骤5.2中的网络损失函数,当网络损失函数拟合时,并且目标域平均识别准确率达到96%,调节动态调节因子的超参数θi、λi、β,使目标域平均识别准确率超过96%。
2.根据权利要求1所述的一种多源非均衡域自适应方法,其特征在于:所述步骤1的具体过程为:
将各源域与目标域的图像处理成统一的大小,并将各源域图像进行归一化处理。
3.根据权利要求2所述的一种多源非均衡域自适应方法,其特征在于:所述步骤2的具体过程为:
步骤2.1,固定AlexNet网络的第7层全连接层,在第7层全连接层后加入领域判别器;
步骤2.2,设置网络的损失函数为:
Losstotal=Lclf+λ(Lwd-βLgrad) (5);
公式(5)中,Lclf为源域数据的分类损失项,Lwd表示Wassertein距离,将Lwd设置为领域判别损失项,Lgrad表示领域判别器参数的梯度惩罚项,λ,β为超参数;
Lclf定义为:
表示源域样本真实的概率分布;
yi的定义为:
yi表示深度网络将源域样本估计为第i个类别的概率值;表示源域数据通过神经元计算得到其属于第i类的数值,/>表示源域数据通过神经元计算得到其属于各个类的数值,/>表示将所有的/>相加所得的数值:
Lwd表达式为:
公式(8)中,xs和xt分别表示各源域与目标域的数据,ns和nt分别表示各源域与目标域数据的总量,fg为网络前五层卷积层作为特征提取器的函数,fw为领域判别器的学习函数;
Lgrad的表达式为:
L grad(h)=(||▽h fw(h)||2-1)2 (9);
公式(9)中,fw(h)为领域判别器学习的一个函数,fw(h)表示将特征提取器fg计算得到的数据特征h转化为一个具体的数字,▽h表示h梯度,h表示利用特征提取器fg计算得到的数据特征;
步骤2.3,将各源域数据分别与目标域数据输入到单源域自适应网络中做前向传播,通过网络迭代,最大化Lwd-βLgrad来训练领域判别器,最小化网络损失函数,当步骤2.2中的网络损失函数拟合时,利用Lwd评估各源域与目标域特征分布之间的Wasserstein距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110111137.4A CN112836795B (zh) | 2021-01-27 | 2021-01-27 | 一种多源非均衡域自适应方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110111137.4A CN112836795B (zh) | 2021-01-27 | 2021-01-27 | 一种多源非均衡域自适应方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112836795A CN112836795A (zh) | 2021-05-25 |
CN112836795B true CN112836795B (zh) | 2023-08-18 |
Family
ID=75931919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110111137.4A Active CN112836795B (zh) | 2021-01-27 | 2021-01-27 | 一种多源非均衡域自适应方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112836795B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610219B (zh) * | 2021-08-16 | 2024-05-14 | 中国石油大学(华东) | 一种基于动态残差的多源域自适应方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018109505A1 (en) * | 2016-12-15 | 2018-06-21 | Google Llc | Transforming source domain images into target domain images |
CN108256561A (zh) * | 2017-12-29 | 2018-07-06 | 中山大学 | 一种基于对抗学习的多源域适应迁移方法及系统 |
CN109816593A (zh) * | 2019-01-18 | 2019-05-28 | 大连海事大学 | 一种基于注意力机制的生成对抗网络的超分辨率图像重建方法 |
CN110428004A (zh) * | 2019-07-31 | 2019-11-08 | 中南大学 | 数据失衡下基于深度学习的机械零部件故障诊断方法 |
CN111428803A (zh) * | 2020-03-31 | 2020-07-17 | 山东大学 | 一种基于Wasserstein距离的深度域适应图像分类方法 |
CN111738315A (zh) * | 2020-06-10 | 2020-10-02 | 西安电子科技大学 | 基于对抗融合多源迁移学习的图像分类方法 |
US10839269B1 (en) * | 2020-03-20 | 2020-11-17 | King Abdulaziz University | System for fast and accurate visual domain adaptation |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200130177A1 (en) * | 2018-10-29 | 2020-04-30 | Hrl Laboratories, Llc | Systems and methods for few-shot transfer learning |
-
2021
- 2021-01-27 CN CN202110111137.4A patent/CN112836795B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018109505A1 (en) * | 2016-12-15 | 2018-06-21 | Google Llc | Transforming source domain images into target domain images |
CN108256561A (zh) * | 2017-12-29 | 2018-07-06 | 中山大学 | 一种基于对抗学习的多源域适应迁移方法及系统 |
CN109816593A (zh) * | 2019-01-18 | 2019-05-28 | 大连海事大学 | 一种基于注意力机制的生成对抗网络的超分辨率图像重建方法 |
CN110428004A (zh) * | 2019-07-31 | 2019-11-08 | 中南大学 | 数据失衡下基于深度学习的机械零部件故障诊断方法 |
US10839269B1 (en) * | 2020-03-20 | 2020-11-17 | King Abdulaziz University | System for fast and accurate visual domain adaptation |
CN111428803A (zh) * | 2020-03-31 | 2020-07-17 | 山东大学 | 一种基于Wasserstein距离的深度域适应图像分类方法 |
CN111738315A (zh) * | 2020-06-10 | 2020-10-02 | 西安电子科技大学 | 基于对抗融合多源迁移学习的图像分类方法 |
Non-Patent Citations (1)
Title |
---|
多源域混淆的双流深度迁移学习;闫美阳;李原;;中国图象图形学报(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112836795A (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107392919B (zh) | 基于自适应遗传算法的灰度阈值获取方法、图像分割方法 | |
CN110097060B (zh) | 一种面向树干图像的开集识别方法 | |
CN111738303B (zh) | 一种基于层次学习的长尾分布图像识别方法 | |
CN108710948B (zh) | 一种基于聚类均衡和权重矩阵优化的迁移学习方法 | |
CN109993236A (zh) | 基于one-shot Siamese卷积神经网络的少样本满文匹配方法 | |
CN109344856B (zh) | 一种基于多层判别式特征学习的脱机签名鉴别方法 | |
CN112836795B (zh) | 一种多源非均衡域自适应方法 | |
CN112861982A (zh) | 一种基于梯度平均的长尾目标检测方法 | |
CN111239137B (zh) | 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法 | |
CN110991554B (zh) | 一种基于改进pca的深度网络图像分类方法 | |
CN115578248A (zh) | 一种基于风格引导的泛化增强图像分类算法 | |
CN114006870A (zh) | 一种基于自监督卷积子空间聚类网络的网络流量识别方法 | |
CN116452862A (zh) | 基于领域泛化学习的图像分类方法 | |
CN111652264A (zh) | 基于最大均值差异的负迁移样本筛选方法 | |
CN116721343A (zh) | 一种基于深度卷积神经网络的跨域田间棉铃识别方法 | |
CN116662833A (zh) | 基于高斯混合模型的多视图动态迁移聚类方法及系统 | |
CN113408610B (zh) | 一种基于自适应矩阵迭代极限学习机的图像识别方法 | |
CN116129215A (zh) | 一种基于深度学习的长尾目标检测方法 | |
CN114581407A (zh) | 一种光伏模块的自适应缺陷检测方法 | |
CN109359677B (zh) | 一种耐噪在线多分类核学习算法 | |
CN116030287A (zh) | 一种基于非平衡类深度学习的绝缘子检测方法 | |
CN113869463A (zh) | 一种基于交叉增强匹配的长尾噪声学习方法 | |
CN112418317A (zh) | 一种基于pso-svm的精密加工结构件识别分类的方法 | |
CN117173494B (zh) | 基于类别平衡样本选择的含噪声标签图像识别方法及系统 | |
Chunni | SVM visual classification based on weighted feature of genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |