CN110321926A - 一种基于深度残差修正网络的迁移方法及系统 - Google Patents

一种基于深度残差修正网络的迁移方法及系统 Download PDF

Info

Publication number
CN110321926A
CN110321926A CN201910441363.1A CN201910441363A CN110321926A CN 110321926 A CN110321926 A CN 110321926A CN 201910441363 A CN201910441363 A CN 201910441363A CN 110321926 A CN110321926 A CN 110321926A
Authority
CN
China
Prior art keywords
data set
source domain
classification
network model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910441363.1A
Other languages
English (en)
Other versions
CN110321926B (zh
Inventor
李爽
刘驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910441363.1A priority Critical patent/CN110321926B/zh
Publication of CN110321926A publication Critical patent/CN110321926A/zh
Application granted granted Critical
Publication of CN110321926B publication Critical patent/CN110321926B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度残差修正网络的迁移方法及系统,包括:基于网络中源域数据集和目标域数据集设置预先构建的目标网络模型中参数的值;基于设置参数值后的所述目标网络模型,对所述目标域数据集中的各数据进行图像类别分类,获得每一个数据对应的类别;基于每一个数据对应的类别为所述目标域数据集中对应的数据进行标注,获得带有标签的目标域数据集;其中,所述目标网络模型是基于残差修正块和损失函数进行构建;所述源域数据集包括多个图片和每个图片对应的标签;所述目标域数据集包括多个图片。本发明构思提出的残差修正块和损失函数可以通过深化网络来提高原网络的泛化能力,进而提高跨域图像分类准确性。

Description

一种基于深度残差修正网络的迁移方法及系统
技术领域
本发明涉及迁移学习领域,具体涉及一种基于深度残差修正网络的迁移方法 及系统。
背景技术
近年来,随着数据规模和计算资源的快速增长,机器学习在理论和实践两方 面都取得了长足进展,成为大数据分析的主要技术基础之一。尤其是深度神经网 络DNNs在信息检索、计算机视觉、自然语言处理等多种学习任务中的应用使得实 验性能得到了显著提高。然而,往往表现优异的模型主要依赖于大量的标注数据, 而足够数量的数据标注是一个耗时且昂贵的操作。在标注稀缺性和数据分布异构 性两方面需求下,提出了迁移学习,其工作原理如图1所示。当辅助领域(如Amazon、 Facebook)存在大量标注数据,并且其他类似的目标领域(如监控、Twitter) 存在大量无标注数据或者只有少量标注数据时,辅助领域可以共享知识结构到目 标领域。因此迁移学习的思想是从相关的辅助领域中迁移标注数据或知识结构, 进而完成或改进目标领域或任务的学习效果。在自然语言处理、计算机视觉、医 疗健康与生物信息学等领域,目标任务的标注数据稀缺、领域分布异构等问题十分突出,迁移学习具有很强的现实需求。
现有的基于适配层匹配分布的迁移学习,一种方式是在通过基于最大均值差 异(Maximum Mean Discrepancy,MMD)适配源域和目标域数据的边缘分布,从 而使得分布差异变小,源领域知识可以迁移到目标领域。例如DAN作为深度迁移 学习的代表性方法,充分利用了深度网络的可迁移特性,然后在多层适配层引入 MK-MMD距离减小域差异,取得了良好的效果,但DAN的方法仅仅考虑了领域的边 缘分布适配问题,认为适配后领域的条件分布不变,这样的想法有局限性。深度 网络在训练的过程中所学到的特征由一般性变到特定性,特征和标签的联合概率 分布的差异在高层的时候仍然存在。
另一种方式是在通过基于MMD适配源域和目标域数据的联合分布,从而使得 分布差异变小,源领域知识可以迁移到目标领域。文章“Deep Transfer Learning with JointAdaptation Networks”的出发点是认为域之间的分布P(Xs,Ys)以及 Q(Xt,Yt)可以通过中间层的分布来体现P(Zt1,...,ZtL)和Q(Zt1,...,ZtL)。之前的研 究工作还是在单独的缩小每一层的特征向量之间的边缘概率分布的差异,在这篇 文章中更进一步,考虑到缩小全局的联合概率分布。以JAN为例,将若干个高层 特征做连乘得到它们的联合概率分布。横向表示一个神经网络从底层到高层的变 化,中间的z就是每个中间层的特征表示结果。同时利用一个判别模块源域和目 标域进行二分类,即学习如何减小两个域差异的更适配性特征。JAN使用了对抗 思想训练JMMD,由于对抗学习难以训练,会造成训练速度慢,收敛困难;另一方 面,在原始网络结构的层数限制下,JAN性能会有一定上限。
发明内容
为了解决现有技术中所存在的上述不足,本发明提供一种基于深度残差修正 网络的迁移方法及系统。基于深度域自适应问题,将一般的特征级和任务级知识 从源域转移到目标域,即匹配源域与目标域之间的联合分布,进而最大限度地减 少域之间的差异,提高目标域图像的分类准确性。
本发明提供的技术方案是:一种基于深度残差修正网络的迁移方法,包括:
基于网络中源域数据集和目标域数据集对预先构建的目标网络模型中的参 数值进行设置;
基于设置参数值后的所述目标网络模型,对所述目标域数据集中的各数据进 行图像类别分类,获得每一个数据对应的类别;
基于每一个数据对应的类别为所述目标域数据集中对应的数据进行标注,获 得带有标签的目标域数据集;
其中,所述目标网络模型是基于残差修正块和损失函数进行构建;
所述源域数据集包括多个图片和每个图片对应的标签;所述目标域数据集包 括多个图片。
优选的,所述目标网络模型的构建,包括:
在源域网络结构中的任务特征层后添加残差修正块;
基于任务特征层和/或残差修正块,以及分类层构成目标网络模型;
基于源域与目标域进行适配时生成损失函数的最小值为所述目标网络模型 构建目标函数;
其中,所述残差修正块包括:全连接层、批规范化层、ReLu非线性激活函 数和全连接层。
优选的,所述目标函数,如下式所示:
式中:目标函数;分类损失项;联合分布损失项;类匹配分布损失项;α:联合分布损失项的权重参数;β:类匹配分布损失项的 权重参数。
优选的,所述分类损失项如下式所示:
式中:ysi:源域数据xsi对应的标签,ns:源域数据集的数目;交叉 熵损失函数;fs(·):在源域数据集上训练的分类器;
所述联合分布损失项如下式所示:
式中:κ1(·):第一高斯内核函数;κ2(·):第二高斯内核函数;源 域数据通过任务特征层后的特征;n:源域数据集的数目和目标域数据集的数 目之和;目标域数据通过残差修正块后的特征;源域数据 通过分类层后的特征;目标域数据通过分类层后的特征;
所述类匹配分布损失项如下式所示:
式中:第k类的源域数据和目标域数据之间MK-MMD距离 的平方;Cs:类别的集合;
其中,所述第k类的源域数据和目标域数据之间MK-MMD距离的平方按下式计算:
式中:所有源域样本数据中真正标签为k的数据;在源域数据 集中标签为k的数据量;标签为k的源域数据xs经过任务特征层后的特征; 在目标域数据集中标签为k的数据量;目标域样本数据tj在k类下的 概率;具有特征核κ的再生核;特征投影;标签为k的目标域数据xt通过 残差修正块后的特征。
优选的,所述基于网络中源域数据集和目标域数据集对预先构建的目标网络 模型中的参数值进行设置,包括:
对所述源域数据集和目标域数据集进行预处理;
基于预处理后的所述源域数据集对所述目标网络模型进行初始化;
基于预处理后的所述源域数据集和预处理后的所述目标域数据集通过迭代 对初始化后的目标网络模型进行训练,并设置所述目标网络模型中参数的值。
优选的,所述对所述源域数据集和目标域数据集进行预处理,包括:
分别对所述源域数据集和目标域数据集中的样本数据添加随机噪声,获得固 定大小的样本数据;
基于设置的样本数量分别对所述源域数据集和目标域数据集中固定大小的 样本数据进行分组,获得多组训练数据。
优选的,所述基于预处理后的所述源域数据集对所述目标网络模型进行初始 化,包括:
将所述源域数据集输入ResNet网络模型进行预训练,每次训练更新ResNet 网络模型的权重参数和偏置参数;
迭代达到设置的迭代次数后保存ResNet网络模型的参数;
基于所述ResNet网络模型的参数初始化所述目标网络模型,并基于正态分 布初始化所述残差修正块的网络权重参数和偏置参数。
优选的,所述基于预处理后的所述源域数据集和预处理后的所述目标域数据 集通过迭代对初始化后的目标网络模型进行训练,并设置所述目标网络模型中参 数的值,包括:
步骤a、从所述源域数据集和目标域数据集中各抽取一组训练数据导入所述 目标网络模型;
步骤b、将源域数据通过任务特征层和分类层进行特征学习,并提取源域数 据通过任务特征层和分类层后的特征分布;将目标域数据依次通过任务特征层、 残差修正块和分类层进行特征学习,并提取目标域数据通过任务特征层、残差修 正块和分类层后的特征分布;
步骤c、基于提取的特征分布分别进行域适配、特征适配和类适配,获得分 类损失项、联合分布和类分布匹配损失;
步骤d、基于分类损失项、联合分布和类分布匹配损失,获得目标函数的最 小值;并基于目标函数的最小值,按随机梯度下降法更新所述目标网络模型参数;
步骤e、判断迭代次数是否满足设置的训练次数,如果满足,则按当前参数 进行设置所述目标网络模型的参数,否则,更新迭代次数,返回步骤a;
优选的,所述域适配,包括:基于源域数据通过任务特征层后提取的特征分 布,获得最小化源域分类器中的分类损失;
所述特征适配,包括:基于源域数据通过任务特征层和分类层后提取的特征 分布,以及目标域数据通过任务特征层、残差修正块和分类层后提取的特征分布, 计算联合分布;
所述类适配,包括:基于目标域数据在各类别下的概率获取对应类别下源域 数据到目标域数据距离的平方,并基于所有类别下源域数据到目标域数据距离的 平方获得类分布匹配损失。
优选的,所述基于设置参数值后的所述目标网络模型,对所述目标域数据集 中的各数据进行图像类别分类,获得每一个数据对应的类别,包括:
将所述目标域数据集中的样本数据输入设置参数值后的目标网络模型,获取 从分类层输出类标签分布;
将所述样本数据的类别确定为所述类标签分布中概率最大的类别。
基于同一发明构思,本发明还提供了一种基于深度残差修正网络的迁移系统, 包括:
设置模块,用于基于网络中源域数据集和目标域数据集对预先构建的目标网 络模型中的参数值进行设置;
预测模块,用于基于设置参数值后的所述目标网络模型,对所述目标域数据 集中的各数据进行图像类别分类,获得每一个数据对应的类别;
结果模块,用于基于每一个数据对应的类别为所述目标域数据集中对应的数 据进行标注,获得带有标签的目标域数据集;
其中,所述目标网络模型是基于残差修正块和损失函数进行构建;
所述源域数据集包括多个图片和每个图片对应的标签;所述目标域数据集包 括多个图片。
与最接近的现有技术相比,本发明提供的技术方案具有以下有益效果:
本发明提供的技术方案,基于网络中源域数据集和目标域数据集设置预先构 建的目标网络模型中参数的值;基于设置参数值后的所述目标网络模型,对所述 目标域数据集中的各数据进行图像类别分类,获得每一个数据对应的类别;基于 每一个数据对应的类别为所述目标域数据集中对应的数据进行标注,获得带有标 签的目标域数据集;其中,所述目标网络模型是基于残差修正块和损失函数进行 构建;发明构思中增加的残差修正块通过深化网络来提高原网络的泛化能力,并 且沿着特定的任务层补偿域偏移,同时损失函数能够正确衡量并减小样本域之间 的分布差异,进而提高跨域图像分类准确性。
本发明提供的技术方案,提出了基于概率分布的MK-MMD计算公式,通过最小 化该公式,能够有效地匹配共享标签空间中的域分类分布,减小条件分布的发散。
本发明提供的技术方案,将一个残差修正块插入到经过训练的源网络中,可 以明确地学习源域和目标域之间的特征差异,同时通过实验有效的证明了增加的 残差修正块可以通过深化网络来提高其泛化能力。
本发明提供的技术方案,在Office-Home数据集下,将本发明提供的方法与 其他几个无监督迁移学习方法进行对比实验准确率结果,可以得出本发明提供的 方法(DRCN)在准确率上均高于对比方法,尤其在Pr->Ar任务中,相比于JAN 达到了约13%的提升。
附图说明
图1为现有技术中迁移学习原理的结构示意图;
图2为本发明提供的基于深度残差修正网络的迁移学习方法的流程图;
图3为本发明实施例中基于深度残差修正网络的迁移学习方法的详细流程 图;
图4为本发明中残差修正块的网络结构示意图。
具体实施方式
为了更好地理解本发明,下面结合说明书附图和实例对本发明的内容做进一 步的说明。
为了更好的理解本发明构思,本实施例中对迁移学习进行简单的介绍:
1、迁移学习的研究背景:
近年来,随着数据规模和计算资源的快速增长,机器学习在理论和实践两方 面都取得了长足进展,成为大数据分析的主要技术基础之一。尤其是深度神经网 络DNNs在信息检索、计算机视觉、自然语言处理等多种学习任务中的应用使得 实验性能得到了显著提高。然而,往往表现优异的模型主要依赖于大量的标注数 据,而足够数量的数据标注是一个耗时且昂贵的操作,例如:在互联网领域存在 一部分高质量图像、视频数据、并且包括丰富的标注信息,这样的数据容易进行 监督学习和深度分析。但在众多非互联网领域(如安全监控、人物追踪)仅能获 得普通规模的低质量视频、并且几乎没有标注信息,现有机器学习技术难以获得 较好效果,而这一类无标注的数据的训练和学习更贴近现实需求。同时,传统的 机器学习方法往往有一个共同的假设,即训练和测试数据来自相同或相似的概率分布,这在现实应用中并不总是能够得到满足。
迁移学习的工作原理是从辅助领域的大量标注数据中迁移知识、改进目标域 学习任务。
迁移学习被认为是在最小人工标注代价下进行机器学习的一种崭新策略。
2、迁移学习的主要挑战
迁移学习利用丰富标注的辅助领域来提高标注缺失的目标领域的泛化性能。 然而,对于如何利用隐含表征学习和概率分布适配提高跨领域、跨任务迁移学习 的泛化性能,在问题和方法层面都还存在较多未确定性,具体来说可以分为以下 三个挑战:
1)负迁移
为实现知识迁移,现有方法均假设领域间具有公共知识结构,如公共隐含语 义、话题、本征谱等。然而,当领域间的概率分布差异很大时,上述假设通常难 以成立,这会导致严重的负迁移问题,即指辅助领域任务对目标领域任务有负面 效果。目前已有少数工作从算法设计角度对负迁移问题进行研究,主要思想是减 少在领域间迁移的知识结构,例如仅在领域间共享模型的先验概率、而不共享模 型参数或似然函数。这些工作通过降低知识迁移来避免负迁移,因而难免又陷入 “欠迁移”困境,所以如何权衡欠迁移和负迁移成为主要挑战之一。此外,这类 算法难以应对各种假设场景,即如果假设条件变化就需要尝试其他迁移学习模型, 应用代价很大。
2)欠适配
欠适配问题是指跨领域的概率分布失配问题未能充分修正。概率分布适配方 法通过最小化领域间概率分布差异,获得了具有理论保证的泛化误差上界,并在 很多实际任务上取得了不错的效果,例如低维回归任务和高维分类任务等。尽管 如此,现有的概率分布相似性度量函数,如最大均值差异、布雷格曼散度等仍然 过于简单,不能充分刻画概率分布的相似程度。例如被广泛采用的MMD准则仅 能匹配不同概率分布的各阶矩(如均值、方差)、而不能匹配各种更为复杂的模 式(如类簇、流形)。因此,最小化这类度量函数并不能充分减小领域间的概率 分布距离,导致欠适配问题。此外,当目标领域没有标注数据时,现有方法通常 不考虑条件分布适配问题,但该问题对分类性能具有决定性的影响。
3)欠拟合
欠拟合问题是指学习模型未能充分刻画概率分布的重要结构。概率分布适配 方法能有效工作的前提是能对概率分布自身的统计特性进行深度拟合,但现在基 于浅层网络的学习模型显然难以挖掘概率分布中的复杂结构,特别是领域无关特 征的抽象模式,这也是深度学习方法在部分迁移学习任务中取得优异效果的原因。 显然,现有工作仅通过在浅层网络中最小化领域间概率分布差异是不足以挖掘领 域不变的抽象特征表示的,需要同时进行深度特征学习和概率分布适配。
3、迁移学习相关技术
迁移学习先前工作考虑到训练和测试数据遵循不同的特征空间和数据分布 的问题,因此通常试图通过基于实例加权的方法和域不变特征表示法来最小化域 差异。
基于实例加权法对辅助领域中的实例进行权重调整、提升位于目标领域高密 度区域的辅助领域实例权重,从而更好地对齐辅助领域和目标领域数据的分布。 然而,当训练和测试数据遵循不同的条件分布时,实例加权法存在限制。另一方 面,域不变特征表示法试图找到原始数据的新特征表示,使得辅助领域和目标领 域的数据分布更加相似,从而减少跨域分布差异,或使得领域相关的具体特征可 以被领域无关的抽象特征所表示。例如,SCA寻求最大化类别的可分离性,最小 化域之间的不匹配以及最大化数据的可分离性。TCA使用MMD来学习RKHS中 的一些传递分量,以最小化辅助和目标领域边缘分布的距离。利用目标领域伪标 签,JDA试图通过要求它们的总平均值和类平均值彼此接近来匹配两个域的边缘 分布和条件分布。然而,这些方法都只能学习两个域的浅层特征,与基于深度学 习的迁移学习方法相比,提取的特征仍不能做到很好的效果。
近些年来的研究工作表明,深度学习已经可以成功帮助迁移学习提取更加抽 象的特征表示以帮助解读数据分布变化的部分和不变的部分,增强迁移学习的效 果。
一部分工作是通过添加适配层来匹配分布的均值,试图计算MMD损失来最 小化领域分布。例如:DAN通过多核MMD实现多层适配,能够对任务特定层中 的不同域分布进行对齐。JAN提出了一种联合最大平均差异的损失函数,该函数 具体刻画了特征和标签的联合分布,并且可以通过线性时间的反向传播来计算。 此外,一些研究工作表明将对抗性学习与领域适应相结合,显示出了优异的性能 提升。因此,另一种方法是基于对抗性损失,它引入了一种新的域分类器来促进 域混淆,导致实验数据无法通过域标签加以区分。例如,ADDA使用独立的源域 和目标域映射网络,两个网络不共享参数,利用域对抗损失学习域不变特征,因 此能够减少源域和目标领域之间的分布差异。还有一些研究通过对两个领域在特 征水平或图像水平上的对抗性损失进行探讨,也已经有了很多研究成果。其基本 思想是通过混淆鉴别器以跨域生成域不变的特征。在对抗性方法中,通常采用极 大极小策略来优化对抗方法中的两个参与者,与基于MMD的损失法相比,难以 实现稳定的解决方案。
实施例1
根据对现有技术的分析,本发明提出了基于深度残差修正网络的迁移学习技 术,通过将一个残差修正块(包含多个层)插入到深度网络中,并且使用了多层 的联合分布将源域的特征级和任务级知识迁移到目标域。
如图2所示,本发明提出方法的流程为:
步骤一、基于网络中源域数据集和目标域数据集对预先构建的目标网络模型 中的参数值进行设置;
步骤二、基于设置参数值后的所述目标网络模型,对所述目标域数据集中的 各数据进行图像类别分类,获得每一个数据对应的类别;
步骤三、基于每一个数据对应的类别为所述目标域数据集中对应的数据进行 标注,获得带有标签的目标域数据集;
其中,所述目标网络模型是基于残差修正块和损失函数进行构建;
所述源域数据集包括多个图片和每个图片对应的标签;所述目标域数据集包 括多个图片。
如图3所示,本发明提出方法的详细实现流程为:
步骤一、基于网络中源域数据集和目标域数据集对预先构建的目标网络模型 中的参数值进行设置,包括:
步骤S1、准备图像数据;
步骤S2、目标网络初始化;
步骤S3、目标网络训练;
步骤二、基于设置参数值后的所述目标网络模型,对所述目标域数据集中的 各数据进行图像类别分类,获得每一个数据对应的类别,包括:
步骤S4、图像类别分类。
本发明根据上述的实现流程,说明具体步骤:
步骤S1:准备图像数据,包括:准备源域图像数据和目标域图像数据,具体 分为以下几个子步骤:
步骤1.1:定义有标签的源域数据集和无标签的目标域数据集;
基于迁移学习的任务构建源域数据集源域数据集 和目标域数据集
其中,ysi是源域数据xsi对应的标签,ns和nt分别是源域和目标域数据集的 数目;并且源域和目标域的特征分布是不同的,
步骤1.2:将数据进行预处理,包括:对每张图片加入随机噪声,并且统一 调整为固定大小。
步骤1.3:分别构建源域和目标域的训练集和测试集。将源域和目标域的训 练集分成mini-batch,即先将训练集里的数据随机打乱,然后按照设定的大小将 训练集分成若干小数据集。
步骤S2:目标网络初始化,即使用预训练好的网络模型对目标网络进行初始 化,具体分为以下几个子步骤:
步骤2.1:将处理后的源域数据集输入ResNet网络模型进行预训练。每次训 练更新ResNet网络结构的权重参数Wi和偏置参数Bi,Wi为第i层网络的权重,Bi为 第i层网络的偏置。
在us个迭代后停止训练,并保存ResNet网络模型的参数。
步骤2.2:构建目标网络模型,包括:
在源域网络结构中的任务特征层之后添加一个残差修正块。如图4所示,所 述残差修正块包括:全连接层、批规范化层、ReLu非线性激活函数和全连接层。
步骤2.3:初始化目标网络权重,包括:
利用预训练好的ResNet网络模型的参数直接初始化目标网络,并将残差修正 块的网络权重参数和偏置参数进行正态分布初始化。
步骤S3:目标网络训练,即使用预处理过的源域数据和目标域数据对目标 网络模型进行训练,更新目标网络模型的参数,具体的一次训练过程分为以下几 个子步骤:
步骤3.1:输入图像数据,包括:从已处理的源域训练集和目标域训练集中 各抽取一个mini-batch,导入目标网络模型。
步骤3.2:进行特征学习,包括:
源域数据xs和目标域数据xt通过同一神经网络的层次结构提取出抽象的特 征分布Fs(xs)和Fs(xt)。
步骤3.3:进行域适配,包括:
源域数据xs和目标域数据xt通过任务特征层后分别为Fs(xs)和Fs(xt),之后进 行域适配,具体的过程分为以下几个子步骤:
步骤3.3.1:残差修正块学习,包括:
如图4所示,源域训练集中的数据继续通过原始网络,而目标域训练集中的 数据除了通过原始网络以外,还需要通过新添加的残差修正块。目的是为了学习 一个域差异ΔFs(xt)。这样在进行域适配之后,修正的目标域特征表示 Ft(xt)=Fs(xt)+ΔFs(xt)会尽可能的接近源域特征表示Fs(xs)。
经过残差修正块学习可以将在源域上分类效果很好的图像分类器,也可以很 好的解决目标域上的分类问题。
步骤3.3.2:计算分类损失项,包括:
对于如何定义分类器fs在源域上能很好工作,我们要求需要最小 化分类损失:
其中ysi是真实样本标签并且是one-hot编码,是交叉熵损失函数,f(·)为在源域数据集上训练的分类器。
步骤3.4:进行特征适配。
为了进行特征适配,我们最小化跨域的多个特征层(任务特征层和softmax 层)的JMMD,具体分为以下几个子步骤:
步骤3.4.1:获取特征层输出,包括:
源域数据ns通过任务特征层和softmax层后分别为
所有的目标域数据会同时经过任务特征层和残差修正块最后进入softmax 层,因此目标域数据nt分别通过残差修正块和softmax层后分别为
步骤3.4.2:计算联合分布,即为了有效适配这两个特征层,这里定义使用 特征层输出和任务层输出之间的张量积来进行联合分布对齐,具体为:
其中,κ1(·)和κ2(·)是分别对应的高斯内核函数。
为了提高运算速度,简化时间复杂度,我们使用了一种改进的无偏差估计 JMMD,具体为:
式中:κ1(·):第一高斯内核函数;κ2(·):第二高斯内核函数;源 域数据通过任务特征层后的特征;n:源域数据集的数目和目标域数据集的数 目之和;目标域数据通过残差修正块后的特征;源域数据 通过分类层后的特征;目标域数据通过分类层后的特征。
在训练中,计算上述公式时,我们将mini-batch的样本分成四元组,每个 四元组包含两个源域样本和两个目标域样本。这种改进后的JMMD只需线性时间, 使我们能够有效地快速处理大型数据集。
步骤3.5:进行类适配,即通过最小化一个新颖的概率分布多核MMD来明确 匹配共享标签空间中域的类别分布,具体分为以下几个子步骤:
步骤3.5.1:得到目标域样本数据的“软标签”,包括:
首先定义源分类器预测目标数据所输出的概率分布为“软标签”,即概率越 大的那一类为目标数据最有可能所属类。例如,对于每个目标数据xtj,源分类 器fs对其的预测为ptj,ptj是一个标签向量,其中第k个元素表示在Cs类中将xtj归 于k类的概率。
步骤3.5.2:匹配第k类分布,包括:
对类进行分布匹配,将源域和目标域的同类距离拉近,即利用MMD的多核变 体,MK-MMD来有效减少跨域类之间的差异。例如,第k类的源数据和目标数 据表示的MK-MMD距离的平方公式为:
其中,表示所有源域样本数据中真正标签为k的数据,是具有特征核 k的再生核(Reproducing Kernel Hilbert Space,RKHS),是相应的特征投影; 在源域数据集中标签为k的数据量;标签为k的源域数据xs经过任务 特征层后的特征;在目标域数据集中标签为k的数据量;目标域样本 数据tj在k类下的概率;标签为k的目标域数据xt通过残差修正块后的特征。
步骤3.5.3:匹配全类分布,包括:
DRCN中的类分布匹配的损失项可以表示为:
相当于,求解每个类下的源域和目标域数据下的MK-MMD距离,然后相加。 通过最小化类匹配分布损失项,DRCN可以从源域迁移有用的特征和任务知识到 目标域。
步骤3.6:计算目标函数,即将之前在域适配、特征适配、类适配下计算的 损失项进行求和,具体如下:
其中,α和β分别代表对应损失项的权重参数,且α,β∈[0,1]。通过最小化该目 标函数可以将一般地特征级和任务级知识从源域到目标域进行联合适配,并且将 共享标签空间中跨域地特征分布进行对齐。
步骤3.7:更新目标网络模型参数,本发明中按照随机梯度下降法更新目标 网络模型参数。
步骤S4:图像类别分类,包括:
经过N次迭代训练后,目标网络模型参数固定,可以用于跨域图像分类。将 目标域测试集样本输入目标网络,最终从softmax层输出一个Cs类标签分布,哪 一类的概率大,则认为该样本属于这一类。
步骤三、基于每一个数据对应的类别为所述目标域数据集中对应的数据进行 标注,获得带有标签的目标域数据集。
实施例2
本实施例是使用python实现,同时使用了pytorch库搭建神经网络,在 Office-Home数据集上做了实验,并且将结果与其他无监督迁移学习算法进行了 比较。由于Office-Home数据集下有四个域的子集,两两组合,则有4*4=16种 跨域分类任务,例如源域Ar到目标域Cl的跨域分类操作,记为Ar->Cl,其他 任务类似。具体包括以下步骤:
步骤1:分别构建源域数据集和目标域数据集样本的训练集和测试集,并对 每个样本添加随机噪声,调整图像大小到256×256像素。然后以32个样本数量 为大小将源域训练数据集和目标域训练数据集分成若干mini-batch。
步骤2:构建ResNet网络模型,按照高斯正态分布随机初始化网络中每层 的参数,每层权重初始化为0.1。然后将处理后的源域训练数据集导入ResNet 网络进行训练。每次训练取batchsize个样本,得到预测结果,计算损失函数。 每次训练结束后,按照随机梯度下降法更新网络参数。
步骤3:在300个iteration后训练停止。保存网络的模型参数。
步骤4:构建目标网络。具体是在原网络结构中的任务特征层之后添加一个 包含全连接层、批规范化层、ReLu非线性激活函数和全连接层的残差修正块网 络,并且初始化权重和偏差。
步骤5:将预训练好的原网络模型参数直接初始化目标网络。设定学习率为0.0003。
步骤6:规定目标网络训练次数为8000次。
步骤7:从源域和目标域样本集中各取batchsize个样本导入目标网络,训 练开始。
步骤8:源域样本通过任务特征层后直接进入分类层,即softmax层,而目 标域样本通过任务特征层后要先经过残差修正块再进入分类层。目的是学习一个 域差异。最终所有样本均通过softmax层输出概率分布,取概率最大的那一类为 预测类。
步骤9:取源域样本经过分类层后的输出fs(xsi),计算分类损失。
步骤10:取源域样本分别通过任务特征层和softmax层之后的另外取目标域样本通过残差修正块和softmax层之后的计算联合分布项。
步骤11:取目标域样本经过softmax层输出的“软标签”ptj,从1到65 类计算每一类下的MK-MMD。这里的分别是经过任务特征层和残差修正 块后的源域样本输出和目标域样本输出。
然后进行求和,得到类匹配分布损失项。
步骤12:计算目标函数。将分类损失项、联合分布项、类匹配损失项相加 得到:
步骤13:最小化目标函数,按照随机梯度下降法更新目标网络参数。
步骤14:重复步骤7-步骤13,直到训练次数上限。
步骤15:将目标域测试样本导入网络,最终从softmax层输出涵盖65类的 概率分布,输出结果中对应某一类的概率最大,则预测为该类。该65类包括书 包、鼠标、显示屏等常见办公或家用物品。
本实施例中以文件柜的图像为例,利用本发明提供的方法进行分类,结果如 表1所示:
表1从softmax层输出概率最大的10类
类别 概率
File_Cabinet/文件柜 0.5741
Refrigerator/冰箱 0.1348
Printer/打印机 0.0644
Computer/电脑 0.0554
Shelf/架子 0.0523
Laptop/笔记本电脑 0.0332
Folder/文件夹 0.03
Monitor/显示器 0.0164
Calendar/日历 0.0148
Oven/烤箱 0.0097
从表1的输出结果可以得出该图像对应文件柜这一类的概率最大,因此预测 该图像为文件柜类。
本发明构思通过增加残差修正块来提高原网络的泛化能力,并且沿着特定的 任务层补偿域偏移。同时,本发明定义的损失函数能够正确衡量并减小样本域之 间的分布差异,进而提高跨域图像分类准确性。
本实施例中在Office-Home数据集下,将本发明提供的方法与其他几个无监 督迁移学习方法进行对比,分别是DAN、RevGrad、JAN,实验准确率结果如表2 所示。一共有16个跨域任务,最后一列是所有任务分类准确率的均值。可以看 出本发明提供的方法(DRCN)在准确率上均高于对比方法,在Pr->Ar任务中,相 比于JAN达到了约13%的提升。
表2 DRCN与其他对比方法在Office-Home上跨域图像分类任务的准确率(%)
实施例3
基于同一发明构思,本实施例还提供了一种基于深度残差修正网络的迁移系 统,包括:
设置模块,用于基于网络中源域数据集和目标域数据集对预先构建的目标网 络模型中的参数值进行设置;
预测模块,用于基于设置参数值后的所述目标网络模型,对所述目标域数据 集中的各数据进行图像类别分类,获得每一个数据对应的类别;
结果模块,用于基于每一个数据对应的类别为所述目标域数据集中对应的数 据进行标注,获得带有标签的目标域数据集;
其中,所述目标网络模型是基于残差修正块和损失函数进行构建;
所述源域数据集包括多个图片和每个图片对应的标签;所述目标域数据集包 括多个图片。
实施例中,所述迁移系统,还包括:构建模块,用于构建目标网络模型;
所述构建模块,包括:
添加单元,用于在源域网络结构中的任务特征层后添加残差修正块;
构建模型单元,用于基于任务特征层和/或残差修正块,以及分类层构成目 标网络模型;
构建目标函数单元,用于基于源域与目标域进行适配时生成损失函数的最小 值为所述目标网络模型构建目标函数;
其中,所述残差修正块包括:全连接层、批规范化层、ReLu非线性激活函 数和全连接层。
本实施例中出现的缩略语和关键术语定义如下:
DNNs:深度神经网络;
Amazon:亚马逊,一个商务网站;
Facebook:脸书,一个社交服务网站;
Twitter:推特,一个社交服务网站;
SCA:Scatter Component Analysis一种浅层迁移学习算法;
TCA:Transfer Component Analysis,迁移主成分分析,是一种降维方法, 具体是学习具备样本外数据泛化能力的核函数,解决一个本征分解问题;
RKHS:Reproducing Kernel Hilbert Space,再生核希尔伯特空间,一种高 维特征空间;
MMD:Maximum Mean Discrepancy,最大均值差异,是一种域分布度量函数;
JDA:Joint Distribution Adaption,是一种浅层迁移学习算法;
AlexNet:由5个卷积层和3个全连接层组成的神经网络,用于图像分类识 别;
ReLU:Rectified Linear Unit,线性整流函数;
ResNet:在2015年赢得ILSVRC比赛,之后很多方法都建立在ResNet50或 者ResNet101的基础上完成,本实施例是基于ResNet50进行实践的;
Fine-tune:微调,即使用预训练好的模型,使用新的数据进行训练,使得 网络参数进行更新的过程;
MK-MMD:多核MMD,基于原有的MMD提出的新的分布度量函数;
batchsize:批大小,在深度学习中,一般采用SGD训练,即每次训练只取batchsize个样本训练;
mini-batch:小数据集,batchsize个样本;
iteration:1个iteration等于使用batchsize个样本训练一次;
one-hot:只有一位为1,其余位为0,常用于表示样本标签;
Softmax:将输入的多个标量映射为一个概率分布,其输出的每个值范围在 (0,1);
Office-Home:一个跨域图像识别数据集;它包含来自4个域的不同物体图 像(办公或者家用物品),这四个域分别是艺术图像(Ar)、剪贴画(Cl)、产品 图像(Pr)和真实世界图像(Rw),并且所有域下均有65个相同类别的图像;
JMMD:联合最大均值偏差;
DAN:Deep Adaptation Networks,一种迁移学习方法;
DRCN:本发明提供的方法的简称,基于深度残差修正网络的迁移方法。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品 的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或 方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框 的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机 或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可 编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个 流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备 以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指 令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得 在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从 而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或 多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和 原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的 权利要求范围之内。

Claims (10)

1.一种基于深度残差修正网络的迁移方法,其特征在于,包括:
基于网络中源域数据集和目标域数据集对预先构建的目标网络模型中的参数值进行设置;
基于设置参数值后的所述目标网络模型,对所述目标域数据集中的各数据进行图像类别分类,获得每一个数据对应的类别;
基于每一个数据对应的类别为所述目标域数据集中对应的数据进行标注,获得带有标签的目标域数据集;
其中,所述目标网络模型是基于残差修正块和损失函数进行构建;
所述源域数据集包括多个图片和每个图片对应的标签;所述目标域数据集包括多个图片。
2.如权利要求1所述的方法,其特征在于,所述目标网络模型的构建,包括:
在源域网络结构中的任务特征层后添加残差修正块;
基于任务特征层和/或残差修正块,以及分类层构成目标网络模型;
基于源域与目标域进行适配时生成损失函数的最小值为所述目标网络模型构建目标函数;
其中,所述残差修正块包括:全连接层、批规范化层、ReLu非线性激活函数和全连接层。
3.如权利要求2所述的方法,其特征在于,所述目标函数,如下式所示:
式中:目标函数;分类损失项;联合分布损失项;类匹配分布损失项;α:联合分布损失项的权重参数;β:类匹配分布损失项的权重参数。
4.如权利要求3所述的方法,其特征在于,所述分类损失项如下式所示:
式中:ysi:源域数据xsi对应的标签,ns:源域数据集的数目;交叉熵损失函数;fs(·):在源域数据集上训练的分类器;
所述联合分布损失项如下式所示:
式中:κ1(·):第一高斯内核函数;κ2(·):第二高斯内核函数;源域数据通过任务特征层后的特征;n:源域数据集的数目和目标域数据集的数目之和;目标域数据通过残差修正块后的特征;源域数据通过分类层后的特征;目标域数据通过分类层后的特征;
所述类匹配分布损失项如下式所示:
式中:第k类的源域数据和目标域数据之间MK-MMD距离的平方;Cs:类别的集合;
其中,所述第k类的源域数据和目标域数据之间MK-MMD距离的平方按下式计算:
式中:所有源域样本数据中真正标签为k的数据;在源域数据集中标签为k的数据量;标签为k的源域数据xs经过任务特征层后的特征;在目标域数据集中标签为k的数据量;目标域样本数据tj在k类下的概率;具有特征核κ的再生核;特征投影;标签为k的目标域数据xt通过残差修正块后的特征。
5.如权利要求2所述的方法,其特征在于,所述基于网络中源域数据集和目标域数据集对预先构建的目标网络模型中的参数值进行设置,包括:
对所述源域数据集和目标域数据集进行预处理;
基于预处理后的所述源域数据集对所述目标网络模型进行初始化;
基于预处理后的所述源域数据集和预处理后的所述目标域数据集通过迭代对初始化后的目标网络模型进行训练,并设置所述目标网络模型中参数的值。
6.如权利要求5所述的方法,其特征在于,所述对所述源域数据集和目标域数据集进行预处理,包括:
分别对所述源域数据集和目标域数据集中的样本数据添加随机噪声,获得固定大小的样本数据;
基于设置的样本数量分别对所述源域数据集和目标域数据集中固定大小的样本数据进行分组,获得多组训练数据;
优选的,所述基于预处理后的所述源域数据集对所述目标网络模型进行初始化,包括:
将所述源域数据集输入ResNet网络模型进行预训练,每次训练更新ResNet网络模型的权重参数和偏置参数;
迭代达到设置的迭代次数后保存ResNet网络模型的参数;
基于所述ResNet网络模型的参数初始化所述目标网络模型,并基于正态分布初始化所述残差修正块的网络权重参数和偏置参数。
7.如权利要求6所述的方法,其特征在于,所述基于预处理后的所述源域数据集和预处理后的所述目标域数据集通过迭代对初始化后的目标网络模型进行训练,并设置所述目标网络模型中参数的值,包括:
步骤a、从所述源域数据集和目标域数据集中各抽取一组训练数据导入所述目标网络模型;
步骤b、将源域数据通过任务特征层和分类层进行特征学习,并提取源域数据通过任务特征层和分类层后的特征分布;将目标域数据依次通过任务特征层、残差修正块和分类层进行特征学习,并提取目标域数据通过任务特征层、残差修正块和分类层后的特征分布;
步骤c、基于提取的特征分布分别进行域适配、特征适配和类适配,获得分类损失项、联合分布和类分布匹配损失;
步骤d、基于分类损失项、联合分布和类分布匹配损失,获得目标函数的最小值;并基于目标函数的最小值,按随机梯度下降法更新所述目标网络模型参数;
步骤e、判断迭代次数是否满足设置的训练次数,如果满足,则按当前参数进行设置所述目标网络模型的参数,否则,更新迭代次数,返回步骤a。
8.如权利要求7所述的方法,其特征在于,所述域适配,包括:基于源域数据通过任务特征层后提取的特征分布,获得最小化源域分类器中的分类损失;
所述特征适配,包括:基于源域数据通过任务特征层和分类层后提取的特征分布,以及目标域数据通过任务特征层、残差修正块和分类层后提取的特征分布,计算联合分布;
所述类适配,包括:基于目标域数据在各类别下的概率获取对应类别下源域数据到目标域数据距离的平方,并基于所有类别下源域数据到目标域数据距离的平方获得类分布匹配损失。
9.如权利要求1所述的方法,其特征在于,所述基于设置参数值后的所述目标网络模型,对所述目标域数据集中的各数据进行图像类别分类,获得每一个数据对应的类别,包括:
将所述目标域数据集中的样本数据输入设置参数值后的目标网络模型,获取从分类层输出类标签分布;
将所述样本数据的类别确定为所述类标签分布中概率最大的类别。
10.一种基于深度残差修正网络的迁移系统,其特征在于,包括:
设置模块,用于基于网络中源域数据集和目标域数据集对预先构建的目标网络模型中的参数值进行设置;
预测模块,用于基于设置参数值后的所述目标网络模型,对所述目标域数据集中的各数据进行图像类别分类,获得每一个数据对应的类别;
结果模块,用于基于每一个数据对应的类别为所述目标域数据集中对应的数据进行标注,获得带有标签的目标域数据集;
其中,所述目标网络模型是基于残差修正块和损失函数进行构建;
所述源域数据集包括多个图片和每个图片对应的标签;所述目标域数据集包括多个图片。
CN201910441363.1A 2019-05-24 2019-05-24 一种基于深度残差修正网络的迁移方法及系统 Active CN110321926B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910441363.1A CN110321926B (zh) 2019-05-24 2019-05-24 一种基于深度残差修正网络的迁移方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910441363.1A CN110321926B (zh) 2019-05-24 2019-05-24 一种基于深度残差修正网络的迁移方法及系统

Publications (2)

Publication Number Publication Date
CN110321926A true CN110321926A (zh) 2019-10-11
CN110321926B CN110321926B (zh) 2024-03-26

Family

ID=68119007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910441363.1A Active CN110321926B (zh) 2019-05-24 2019-05-24 一种基于深度残差修正网络的迁移方法及系统

Country Status (1)

Country Link
CN (1) CN110321926B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111161239A (zh) * 2019-12-27 2020-05-15 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN111191072A (zh) * 2019-12-26 2020-05-22 广州荔支网络技术有限公司 一种基于迁移学习的音频分类方法
CN111242220A (zh) * 2020-01-14 2020-06-05 广东博智林机器人有限公司 基于编解码网络的图像处理方法、装置、设备及介质
CN111274973A (zh) * 2020-01-21 2020-06-12 同济大学 基于自动划分域的人群计数模型训练方法及应用
CN111275092A (zh) * 2020-01-17 2020-06-12 电子科技大学 一种基于无监督域适应的图像分类方法
CN111523680A (zh) * 2019-12-23 2020-08-11 中山大学 一种基于Fredholm学习和对抗学习的域适应方法
CN111582449A (zh) * 2020-05-07 2020-08-25 广州视源电子科技股份有限公司 一种目标域检测网络的训练方法、装置、设备及存储介质
CN111667000A (zh) * 2020-06-05 2020-09-15 成都理工大学 自适应领域深度神经网络的地震预警方法
CN111709315A (zh) * 2020-05-27 2020-09-25 西安交通大学 一种基于领域适配的水声目标辐射噪声识别方法
CN111723780A (zh) * 2020-07-22 2020-09-29 浙江大学 基于高分辨率遥感图像的跨域数据的定向迁移方法及系统
CN111814871A (zh) * 2020-06-13 2020-10-23 浙江大学 一种基于可靠权重最优传输的图像分类方法
CN111862136A (zh) * 2020-06-22 2020-10-30 南开大学 基于卷积神经网络的多模态核磁影像缺血性脑卒中病变分割方法
CN112116024A (zh) * 2020-09-28 2020-12-22 北京嘀嘀无限科技发展有限公司 用户分类模型的方法、装置、电子设备和存储介质
CN112613410A (zh) * 2020-12-24 2021-04-06 江苏大学 基于迁移学习的寄生虫虫卵识别方法
CN113420775A (zh) * 2021-03-31 2021-09-21 中国矿业大学 基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法
CN113569940A (zh) * 2021-07-23 2021-10-29 中山大学 一种基于知识迁移和概率校正的少样本目标检测方法
CN113569887A (zh) * 2021-01-18 2021-10-29 腾讯科技(深圳)有限公司 图片识别模型训练和图片识别方法、装置和存储介质
CN113657651A (zh) * 2021-07-27 2021-11-16 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 基于深度迁移学习的柴油车排放预测方法、介质及设备
CN115186773A (zh) * 2022-09-13 2022-10-14 杭州涿溪脑与智能研究所 一种无源的主动领域自适应模型训练方法及装置
CN116341640A (zh) * 2023-05-29 2023-06-27 深圳须弥云图空间科技有限公司 文本处理模型训练方法及装置
CN117671673A (zh) * 2023-11-21 2024-03-08 江南大学 一种基于自适应张量子空间的小样本宫颈细胞分类方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078359A1 (en) * 2014-09-12 2016-03-17 Xerox Corporation System for domain adaptation with a domain-specific class means classifier
CN109753992A (zh) * 2018-12-10 2019-05-14 南京师范大学 基于条件生成对抗网络的无监督域适应图像分类方法
CN109784237A (zh) * 2018-12-29 2019-05-21 北京航天云路有限公司 基于迁移学习的残差网络训练的场景分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078359A1 (en) * 2014-09-12 2016-03-17 Xerox Corporation System for domain adaptation with a domain-specific class means classifier
CN109753992A (zh) * 2018-12-10 2019-05-14 南京师范大学 基于条件生成对抗网络的无监督域适应图像分类方法
CN109784237A (zh) * 2018-12-29 2019-05-21 北京航天云路有限公司 基于迁移学习的残差网络训练的场景分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
E. TZENG, J 等: "Adversarial discriminative domain adaptation", 《COMPUT. VIS. AND PATTERN RECOGNITION (CVPR)》 *
WEIFENG GE 等: "Borrowing treasures from the wealthy:Deep transfer learning through selective joint fine-tuning", 《2017 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
赵鹏 等: "基于迁移鲁棒稀疏编码的图像表示方法", 《计算机学报》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523680A (zh) * 2019-12-23 2020-08-11 中山大学 一种基于Fredholm学习和对抗学习的域适应方法
CN111523680B (zh) * 2019-12-23 2023-05-12 中山大学 一种基于Fredholm学习和对抗学习的域适应方法
CN111191072A (zh) * 2019-12-26 2020-05-22 广州荔支网络技术有限公司 一种基于迁移学习的音频分类方法
CN111191072B (zh) * 2019-12-26 2023-06-30 广州荔支网络技术有限公司 一种基于迁移学习的音频分类方法
CN111161239B (zh) * 2019-12-27 2024-02-27 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN111161239A (zh) * 2019-12-27 2020-05-15 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN111242220A (zh) * 2020-01-14 2020-06-05 广东博智林机器人有限公司 基于编解码网络的图像处理方法、装置、设备及介质
CN111275092B (zh) * 2020-01-17 2022-05-13 电子科技大学 一种基于无监督域适应的图像分类方法
CN111275092A (zh) * 2020-01-17 2020-06-12 电子科技大学 一种基于无监督域适应的图像分类方法
CN111274973A (zh) * 2020-01-21 2020-06-12 同济大学 基于自动划分域的人群计数模型训练方法及应用
CN111582449A (zh) * 2020-05-07 2020-08-25 广州视源电子科技股份有限公司 一种目标域检测网络的训练方法、装置、设备及存储介质
CN111709315A (zh) * 2020-05-27 2020-09-25 西安交通大学 一种基于领域适配的水声目标辐射噪声识别方法
CN111667000A (zh) * 2020-06-05 2020-09-15 成都理工大学 自适应领域深度神经网络的地震预警方法
CN111667000B (zh) * 2020-06-05 2023-02-07 成都理工大学 自适应领域深度神经网络的地震预警方法
CN111814871B (zh) * 2020-06-13 2024-02-09 浙江大学 一种基于可靠权重最优传输的图像分类方法
CN111814871A (zh) * 2020-06-13 2020-10-23 浙江大学 一种基于可靠权重最优传输的图像分类方法
CN111862136A (zh) * 2020-06-22 2020-10-30 南开大学 基于卷积神经网络的多模态核磁影像缺血性脑卒中病变分割方法
CN111723780A (zh) * 2020-07-22 2020-09-29 浙江大学 基于高分辨率遥感图像的跨域数据的定向迁移方法及系统
CN111723780B (zh) * 2020-07-22 2023-04-18 浙江大学 基于高分辨率遥感图像的跨域数据的定向迁移方法及系统
CN112116024A (zh) * 2020-09-28 2020-12-22 北京嘀嘀无限科技发展有限公司 用户分类模型的方法、装置、电子设备和存储介质
CN112116024B (zh) * 2020-09-28 2021-08-13 北京嘀嘀无限科技发展有限公司 用户分类模型的方法、装置、电子设备和存储介质
CN112613410B (zh) * 2020-12-24 2024-05-14 江苏大学 基于迁移学习的寄生虫虫卵识别方法
CN112613410A (zh) * 2020-12-24 2021-04-06 江苏大学 基于迁移学习的寄生虫虫卵识别方法
CN113569887A (zh) * 2021-01-18 2021-10-29 腾讯科技(深圳)有限公司 图片识别模型训练和图片识别方法、装置和存储介质
CN113420775B (zh) * 2021-03-31 2024-03-29 中国矿业大学 基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法
CN113420775A (zh) * 2021-03-31 2021-09-21 中国矿业大学 基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法
CN113569940A (zh) * 2021-07-23 2021-10-29 中山大学 一种基于知识迁移和概率校正的少样本目标检测方法
CN113569940B (zh) * 2021-07-23 2023-06-06 中山大学 一种基于知识迁移和概率校正的少样本目标检测方法
CN113657651A (zh) * 2021-07-27 2021-11-16 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 基于深度迁移学习的柴油车排放预测方法、介质及设备
CN115186773B (zh) * 2022-09-13 2022-12-09 杭州涿溪脑与智能研究所 一种无源的主动领域自适应模型训练方法及装置
CN115186773A (zh) * 2022-09-13 2022-10-14 杭州涿溪脑与智能研究所 一种无源的主动领域自适应模型训练方法及装置
CN116341640A (zh) * 2023-05-29 2023-06-27 深圳须弥云图空间科技有限公司 文本处理模型训练方法及装置
CN116341640B (zh) * 2023-05-29 2023-08-11 深圳须弥云图空间科技有限公司 文本处理模型训练方法及装置
CN117671673A (zh) * 2023-11-21 2024-03-08 江南大学 一种基于自适应张量子空间的小样本宫颈细胞分类方法
CN117671673B (zh) * 2023-11-21 2024-05-28 江南大学 一种基于自适应张量子空间的小样本宫颈细胞分类方法

Also Published As

Publication number Publication date
CN110321926B (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
CN110321926A (zh) 一种基于深度残差修正网络的迁移方法及系统
Jiang et al. Fingerspelling Identification for Chinese Sign Language via AlexNet‐Based Transfer Learning and Adam Optimizer
CN108829763B (zh) 一种基于深度神经网络的影评网站用户的属性预测方法
Schneible et al. Anomaly detection on the edge
Razmjooy et al. Training wavelet neural networks using hybrid particle swarm optimization and gravitational search algorithm for system identification
CN109740057B (zh) 一种基于知识萃取的增强神经网络及信息推荐方法
CN103810266B (zh) 语义网络目标识别判证方法
CN105956603A (zh) 一种基于张量时域关联模型的视频序列分类方法
CN106649658A (zh) 针对用户角色无差异对待和数据稀疏的推荐系统及方法
Saffari et al. Fuzzy Grasshopper Optimization Algorithm: A Hybrid Technique for Tuning the Control Parameters of GOA Using Fuzzy System for Big Data Sonar Classification.
Wang et al. Few-shot learning based balanced distribution adaptation for heterogeneous defect prediction
CN111414555A (zh) 一种基于协同过滤的个性化推荐方法
Zhu et al. Dual-decoder transformer network for answer grounding in visual question answering
Wan et al. Coupling the reduced-order model and the generative model for an importance sampling estimator
Zhang et al. Instance transfer learning with multisource dynamic TrAdaBoost
Kuo et al. Integration of particle swarm optimization and immune genetic algorithm-based dynamic clustering for customer clustering
Han et al. Prototype Enhancement-Based Incremental Evolution Learning for Urban Garbage Classification
Gvaladze et al. PCovR2: A flexible principal covariates regression approach to parsimoniously handle multiple criterion variables
Rezaei et al. An extended MKNN: Modified k-nearest neighbor
Khanuja et al. GAN challenges and optimal solutions
Ann et al. Automated-tuned hyper-parameter deep neural network by using arithmetic optimization algorithm for Lorenz chaotic system.
Dong et al. Dual Pseudo Label Refinement for Unsupervised Domain Adaptive Person Re-identification
CN109886105A (zh) 基于多任务学习的价格牌识别方法、系统及存储介质
Gowda et al. Dual Cognitive Architecture: Incorporating Biases and Multi-Memory Systems for Lifelong Learning
CN108805628A (zh) 一种电子商务推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant