CN113435546B - 基于区分置信度水平的可迁移图像识别方法及系统 - Google Patents

基于区分置信度水平的可迁移图像识别方法及系统 Download PDF

Info

Publication number
CN113435546B
CN113435546B CN202110984978.6A CN202110984978A CN113435546B CN 113435546 B CN113435546 B CN 113435546B CN 202110984978 A CN202110984978 A CN 202110984978A CN 113435546 B CN113435546 B CN 113435546B
Authority
CN
China
Prior art keywords
target domain
pseudo
class
confidence
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110984978.6A
Other languages
English (en)
Other versions
CN113435546A (zh
Inventor
张凯
王帆
王潇涵
孔妍
张梅玉
杨光远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Liju Robot Technology Co.,Ltd.
Original Assignee
Shandong Liju Robot Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Liju Robot Technology Co ltd filed Critical Shandong Liju Robot Technology Co ltd
Priority to CN202110984978.6A priority Critical patent/CN113435546B/zh
Publication of CN113435546A publication Critical patent/CN113435546A/zh
Application granted granted Critical
Publication of CN113435546B publication Critical patent/CN113435546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于区分置信度水平的可迁移图像识别方法及系统,其首先采用源域数据训练得到源域预训练模型,利用源域模型训练得到的参数作为目标域模型的特征提取参数和分类参数,使目标域模型基于源域模型的训练参数从目标域数据中选出伪标签可信样本,并利用选出的可信样本为不可信样本赋予伪标签和权重,有效地降低了当前所有目标域图像伪标签的不确定性;最后通过带有伪标签的目标域数据和源域数据一起训练优化目标域模型,使最终得到的目标域模型的目标图像识别性能得到了极大提高,能够进行快速的迁移和有效的图像识别工作;并有效减少对于目标图像识别的标注,大量减少人力物力。

Description

基于区分置信度水平的可迁移图像识别方法及系统
技术领域
本发明涉及图像分类识别技术领域,尤其是涉及一种基于区分置信度水平的可迁移图像识别方法及系统。
背景技术
可迁移的图像识别是指在进行图像识别时,利用分布相似但不同的已标注图像来指导当前无标签的图像进行准确识别的技术。大数据时代下,分析数据中隐含的价值信息来指导人们的生活和生产已成为一个良性的发展趋势。但在现实场景下,收集到大量无标签的数据非常容易,而在某些任务上进行准确的人工标注是非常耗时耗力的,比如对大规模的传感器图像的准确标注。在这种限制下,我们可以借助已有标注图像,利用标注图像和欲识别图像分布之间的相似性,指导当前图像识别的任务。例如,当两个不同的传感器A和B采集相同任务的图像时,且传感器A的图像(一般称为源域图像)已被标注,由于传感器A和B中采集的图像类别相同,传感器B可以借助传感器A已经标注数据进行有效的图像识别,而不用为传感器B得到的数据进行大规模的标注。但是由于传感器A和B设备内部构造等的不同,两者收集到的图像数据存在着分布差异,那么如何在图像分布差异存在的情况下,实现对传感器B收集到的图像(一般称为目标域图像)进行准确识别是当前可迁移图像识别问题中的一个难点。传统方法:在传感器收集的数据上进行准确的标注,重新训练一个模型,将模型用以图像识别任务,但是此过程产生昂贵人力浪费,且在大数据背景下,对所有收集到的数据进行准确的人工标注极其不现实。
目前,解决可迁移图像识别方法的主要分为以下四种类型:
(1)基于图像样本重要性估计的图像识别方法,基本思想是假设源域图像和目标域图像的分布之间存在着交集,通过计算源域图像样本点与重叠分布的距离估计源域图像样本中的重要性,优化加权后的损失函数;
(2)基于高阶矩匹配的方法,其核心思路是试图最小化源域的图像分布和目标域图像分布之间的高维统计量差异;
(3)基于伪标签的方法试图给目标域每个图像先赋予伪标签,并筛选可信图像样本实现模型的监督训练;
(4)基于对抗训练的方法,通过引入域判别器来区分图像样本是来自源域图像还是目标域图像,并在此过程中学习有效的特征表示,以此实现对目标域图像的准确识别。
其主要体现在以下两点:(1)在已有标注的源域图像上训练可以有效识别源域图像的模型(2)最小化源域图像分布和目标域图像分布之间的差距。这些方法的重心并未放在目标域图像上,即使基于伪标签技术也只用到了部分的目标域样本,但被标注为不可信的目标图像数据在模型的训练中还是丢弃了,而这些被过滤掉的图像极有可能是进行有效图像识别的关键,故如何降低这部分样本的不确定性,并将其用到模型的训练中,是有效提升图像识别性能的核心。
发明内容
本发明的目的在于克服上述技术不足,提出一种基于区分置信度水平的可迁移图像识别方法及系统,其能有效降低目标域图像样本伪标签的不确定性,将其用于模型的训练中,而不是仅仅选择可信伪标签标签的目标域样本用以训练。
为达到上述技术目的,本发明的技术方案第一方面提供一种基于区分置信度水平的可迁移图像识别方法,其包括如下步骤:
S1、采用源域数据对基础训练模型进行训练,得到源域预训练模型,
S2、利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;
S3、利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;
S4、计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;
S5、综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;
S6、迭代步骤S2至S5,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
本发明第二方面提供一种基于区分置信度水平的可迁移图像识别系统,其包括如下功能模块:
预训练模块,用于采用源域数据对基础训练模型进行训练,得到源域预训练模型;
初始化模块,用于利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;
样本分类模块,用于利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;
标签赋予模块,用于计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;
损失优化模块,用于综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;
迭代优化模块,用于通过初始化模块、样本分类模块、标签赋予模块、损失优化模块形成迭代优化回路,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
本发明第三方面提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于区分置信度水平的可迁移图像识别方法的步骤。
本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于区分置信度水平的可迁移图像识别方法的步骤。
与现有技术相比,本发明利用源域模型训练得到的参数作为目标域模型的特征提取参数和分类参数,使目标域模型基于源域模型的训练参数从目标域数据中选出伪标签可信样本,并利用选出的可信样本为不可信样本赋予伪标签和权重,有效地降低了当前所有目标域图像伪标签的不确定性;最后通过带有伪标签的目标域数据和源域数据一起训练优化目标域模型,使最终得到的目标域模型的目标图像识别性能得到了极大提高,能够进行快速的迁移和有效的图像识别工作;并有效减少对于目标图像识别的标注,大量减少人力物力。
其以往的方法相比,将所有不确定性已经大幅度降低的目标域图像都用于模型的训练,而不是使用部分可信数据,目标域在训练中的权重占比增加,使得最终的图像识别模型的性能更偏向于目标图像的识别,有效地提高目标图像识别的性能。
附图说明
图1是本发明实施例所述的基于区分置信度水平的可迁移图像识别方法的流程框图;
图2是图1中步骤S3的分步骤流程框图;
图3是图1中步骤S4的分步骤流程框图;
图4是图1中步骤S5的分步骤流程框图;
图5是本发明实施例所述的基于区分置信度水平的可迁移图像识别系统的模块框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
基于上述内容,本发明实施例提供一种基于区分置信度水平的可迁移图像识别方法,如图1所示,其包括如下步骤:
S1、采用源域数据对基础训练模型进行训练,得到源域预训练模型。
其中,所述源域和目标域类别一样,但是存在类别中存在分布变化,但是这种分布变化程度不是很大,故源域模型具备初步为目标域数据赋予伪标签的能力,但是伪标签准确率比较低。
S2、利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数。
基于源域图像和目标域图像的相似性,通过利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数,使目标域模型具备初步为目标域数据赋予伪标签的能力。
S3、利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本。
其中,如图2所示,所述步骤S3具有如下分步骤:
S31、利用初始化的目标域模型为全体目标域数据赋予伪标签。
S32、计算每一个样本的信息熵,利用伪标签将所有样本分为不同类别;
S33、在每一个类别中对该类的所有样本的信息熵进行排序,将每一类别中信息熵较小的部分样本标注为高置信度样本,将剩余部分信息熵较大的样本标注为低置信度样本。
具体的,由于目标域模型具备初步为目标域数据赋予伪标签的能力,所以利用初始化的目标域模型为全体目标域数据赋予伪标签。
基于样本的信息熵越小表示该样本伪标签的可信程度越大的特性,因此,可以通过目标域数据样本的信息熵来判断样本伪标签的可信度。具体可以通过softmax函数计算每个样本的概率值,并利用所得概率值计算得到每一个目标域数据样本的信息熵;所述标准的信息熵衡量模型预测结果的计算公式如下:
Figure 2523DEST_PATH_IMAGE001
上式中,
Figure 833338DEST_PATH_IMAGE002
表示目标域数据样本,
Figure 32238DEST_PATH_IMAGE003
表示Softmax函数输出的该目标域数据样本属于每一类伪标签的概率集合,
Figure 701117DEST_PATH_IMAGE004
表示信息熵值。
经过上述计算,每一个目标域数据样本都具有伪标签和信息熵,然后利用伪标签将所有样本分为不同类别,并在每一个类别中对该类的所有样本的信息熵进行排序,取每一类别中信息熵较小的50%样本标注为高置信度样本,即可信样本,将剩余50%信息熵较大的样本标注为低置信度样本,即不可信样本。并计算高置信度样本的权重为:
Figure 694481DEST_PATH_IMAGE005
上式中,
Figure 776707DEST_PATH_IMAGE006
表示高置信度样本的权重。
S4、计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本。
其中,如图3所示,所述步骤S4包括如下分步骤:
S41、对高置信度样本的特征进行求均值得到高置信度样本的特征均值;
S42、将每一类的高置信度样本的特征均值作为该类的类原型;
S43、计算低置信度样本与每一类伪标签的类原型之间的距离,将距离最近的类原型的伪标签赋予给所述低置信度样本。
其中,所述类原型的计算公式为:
Figure 513718DEST_PATH_IMAGE007
上式中,
Figure 37104DEST_PATH_IMAGE008
表示第k类的类原型,也就是平均特征,
Figure 326002DEST_PATH_IMAGE009
表示第k类高置信度样本集合,
Figure 148988DEST_PATH_IMAGE010
表示第k类高置信度样本集合中样本数量,
Figure 424111DEST_PATH_IMAGE011
表示第k类目标域数据样本通过神经网络输出的图像特征。
所述低置信度样本与每一类伪标签的类原型之间的距离的计算公式如下:
Figure 67582DEST_PATH_IMAGE012
上式中,
Figure 402749DEST_PATH_IMAGE013
表示低置信度样本
Figure 193987DEST_PATH_IMAGE014
经过特征提取器输出的特征值,
Figure 272802DEST_PATH_IMAGE015
表示
Figure 770779DEST_PATH_IMAGE014
和k类类原型
Figure 542426DEST_PATH_IMAGE016
之间的余弦相似度,
Figure 820961DEST_PATH_IMAGE017
表示
Figure 703466DEST_PATH_IMAGE014
和k类类原型
Figure 55950DEST_PATH_IMAGE016
之间的距离,
Figure 998498DEST_PATH_IMAGE018
表示通过神经网络输出的图像特征,
Figure 233170DEST_PATH_IMAGE019
表示所有可信样本类原型的集合。
为了进一步降低利用距离为低置信度样本赋予伪标签的不确定性,本发明将距离最近的类原型的伪标签的余弦相似度作为该类伪标签的权重一起用于交叉熵损失函数的训练中,所述低置信度样本权重的计算公式如下:
Figure 653787DEST_PATH_IMAGE020
上式中,
Figure 18035DEST_PATH_IMAGE021
表示低置信度样本的权重。
最终得到所有目标域样本的伪标签和权重。
S5、综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化。
其中,如图4所示,所述步骤S5包括如下分步骤:
S51、利用赋予伪标签的目标域样本对目标域模型进行自监督训练,并计算目标域伪标签数据的自监督损失函数;
S52、利用源域数据对目标域模型进行训练,并计算源域数据的交叉熵损失函数;
S53、根据目标域伪标签数据的自监督损失函数和源域数据的交叉熵损失函数综合计算得到的总损失函数;
S54、利用总损失函数对目标域模型进行优化。
其中,为防止目标域模型中包含在特征提取参数和分类参数中的初始化的源域信息随着训练的逐步进行而丢失,所以需要继续训练源域数据。
具体的,所述目标域数据的自监督损失函数为:
Figure 131484DEST_PATH_IMAGE022
Figure 853453DEST_PATH_IMAGE023
源域数据的交叉熵损失函数为:
Figure 77761DEST_PATH_IMAGE024
Figure 139258DEST_PATH_IMAGE025
总损失函数为:
Figure 423608DEST_PATH_IMAGE026
其中,
Figure 836135DEST_PATH_IMAGE027
表示所有目标域样本的集合,
Figure 926451DEST_PATH_IMAGE028
表示softmax函数,
Figure 108034DEST_PATH_IMAGE029
表示指示函数,
Figure 297706DEST_PATH_IMAGE030
表示每一个目标域样本的伪标签,就是传统的交叉熵损失函数,只不是每一个目标域样本有一个自己的权重,
Figure 197529DEST_PATH_IMAGE031
表示所有源域样本的集合,使用传统的交叉熵损失函数,
Figure 327422DEST_PATH_IMAGE032
表示源域样本的标签,
Figure 629090DEST_PATH_IMAGE033
表示权衡参数;
Figure 989664DEST_PATH_IMAGE034
表示目标域样本的损失期望;
Figure 376783DEST_PATH_IMAGE035
表示源域样本的损失期望;K表示目标域样本的类别总数;
Figure 808902DEST_PATH_IMAGE036
表示网络特征提取器模块;
Figure 699497DEST_PATH_IMAGE037
表示分类器模块;
Figure 496552DEST_PATH_IMAGE038
表示单个源域样本;
Figure 105388DEST_PATH_IMAGE039
表示单个目标域样本。
S6、迭代步骤S2至S5,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
本发明利用源域模型训练得到的参数作为目标域模型的特征提取参数和分类参数,使目标域模型基于源域模型的训练参数从目标域数据中选出伪标签可信样本,并利用选出的可信样本为不可信样本赋予伪标签和权重,有效地降低了当前所有目标域图像伪标签的不确定性;最后通过带有伪标签的目标域数据和源域数据一起训练优化目标域模型,使最终得到的目标域模型的目标图像识别性能得到了极大提高,能够进行快速的迁移和有效的图像识别工作;并有效减少对于目标图像识别的标注,大量减少人力物力。
其以往的方法相比,将所有不确定性已经大幅度降低的目标域图像都用于模型的训练,而不是使用部分可信数据,目标域在训练中的权重占比增加,使得最终的图像识别模型的性能更偏向于目标图像的识别,有效地提高目标图像识别的性能。
如图5所示,本发明实施例还提供一种基于区分置信度水平的可迁移图像识别系统,其包括如下功能模块:
预训练模块10,用于采用源域数据对基础训练模型进行训练,得到源域预训练模型;
初始化模块20,用于利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;
样本分类模块30,用于利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;
标签赋予模块40,用于计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;
损失优化模块50,用于综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;
迭代优化模块60,用于通过初始化模块、样本分类模块、标签赋予模块、损失优化模块形成迭代优化回路,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
本实施例一种基于区分置信度水平的可迁移图像识别系统的执行方式与上述基于区分置信度水平的可迁移图像识别方法基本相同,故不作详细赘述。
本实施例服务器为提供计算服务的设备,通常指具有较高计算能力,通过网络提供给多个消费者使用的计算机。该实施例的服务器包括:存储器、处理器以及系统总线,所述存储器包括存储其上的可运行的程序,本领域技术人员可以理解,本实施例的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行终端的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在存储器上包含一种基于区分置信度水平的可迁移图像识别方法的可运行程序,所述可运行程序可以被分割成一个或多个模块/单元,所述一个或多个模块/单元被存储在所述存储器中,并由处理器执行,以完成信息的获取及实现过程,所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述服务器中的执行过程。例如,所述计算机程序可以被分割为预训练模块10、初始化模块20、样本分类模块30、标签赋予模块40、损失优化模块50、迭代优化模块60。
处理器是服务器的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,执行终端的各种功能和处理数据,从而对终端进行整体监控。可选的,处理器可包括一个或多个处理单元;优选的,处理器可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器中。
系统总线是用来连接计算机内部各功能部件,可以传送数据信息、地址信息、控制信息,其种类可以是例如PCI总线、ISA总线、VESA总线等。处理器的指令通过总线传递至存储器,存储器反馈数据给处理器,系统总线负责处理器与存储器之间的数据、指令交互。当然系统总线还可以接入其他设备,例如网络接口、显示设备等。
所述服务器应至少包括CPU、芯片组、内存、磁盘系统等,其他构成部件在此不再赘述。
在本发明实施例中,该终端所包括的处理器执行的可运行程序具体为:一种基于区分置信度水平的可迁移图像识别方法,其包括如下步骤:
S1、采用源域数据对基础训练模型进行训练,得到源域预训练模型,
S2、利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;
S3、利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;
S4、计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;
S5、综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;
S6、迭代步骤S2至S5,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实施例的模块、单元和/或方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于区分置信度水平的可迁移图像识别方法,其特征在于,包括如下步骤:
S1、采用源域数据对基础训练模型进行训练,得到源域预训练模型,
S2、利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;
S3、利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;
S4、计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;
S5、综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;
S6、迭代步骤S2至S5,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
2.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,所述步骤S3包括如下分步骤:
S31、利用初始化的目标域模型为全体目标域数据赋予伪标签;
S32、计算每一个样本的信息熵,利用伪标签将所有样本分为不同类别;
S33、在每一个类别中对该类的所有样本的信息熵进行排序,将每一类别中信息熵较小的部分样本标注为高置信度样本,将剩余部分信息熵较大的样本标注为低置信度样本。
3.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,所述步骤S4包括如下分步骤:
S41、对高置信度样本的特征进行求均值得到高置信度样本的特征均值;
S42、将每一类的高置信度样本的特征均值作为该类的类原型;
S43、计算低置信度样本与每一类伪标签的类原型之间的距离,将距离最近的类原型的伪标签赋予给所述低置信度样本。
4.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,所述步骤S5包括如下分步骤:
S51、利用赋予伪标签的目标域样本对目标域模型进行自监督训练,并计算目标域伪标签数据的自监督损失函数;
S52、利用源域数据对目标域模型进行训练,并计算源域数据的交叉熵损失函数;
S53、根据目标域伪标签数据的自监督损失函数和源域数据的交叉熵损失函数综合计算得到的总损失函数;
S54、利用总损失函数对目标域模型进行优化。
5.根据权利要求2所述基于区分置信度水平的可迁移图像识别方法,其特征在于,在步骤S32中,通过softmax函数计算每个样本的概率值,并利用所得概率值计算每一个样本的信息熵。
6.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,在为低置信度样本赋予标签后,将距离最近的类原型的伪标签的余弦相似度作为该类伪标签的权重一起用于交叉熵损失函数的训练中。
7.根据权利要求1所述基于区分置信度水平的可迁移图像识别方法,其特征在于,所述低置信度样本与每一类伪标签的类原型之间的距离的计算公式如下:
Figure DEST_PATH_IMAGE001
上式中,
Figure DEST_PATH_IMAGE002
表示低置信度样本
Figure DEST_PATH_IMAGE003
经过特征提取器输出的特征值,
Figure DEST_PATH_IMAGE004
表示
Figure 499676DEST_PATH_IMAGE003
和k类类原型
Figure DEST_PATH_IMAGE005
之间的余弦相似度,
Figure DEST_PATH_IMAGE006
表示
Figure DEST_PATH_IMAGE007
和k类类原型
Figure 980598DEST_PATH_IMAGE005
之间的距离,
Figure DEST_PATH_IMAGE008
表示通过神经网络输出的图像特征,
Figure DEST_PATH_IMAGE009
表示所有可信样本类原型的集合。
8.一种基于区分置信度水平的可迁移图像识别系统,其特征在于,包括如下功能模块:
预训练模块,用于采用源域数据对基础训练模型进行训练,得到源域预训练模型;
初始化模块,用于利用源域预训练模型的参数初始化目标域模型的特征提取参数和分类参数;
样本分类模块,用于利用初始化的目标域模型为全体目标域数据赋予伪标签,将每一类伪标签中具有较小信息熵的部分样本标注为高置信度样本,并将每一类伪标签中剩余具有较大信息熵的部分样本标注为低置信度样本;
标签赋予模块,用于计算低置信度样本的图像特征和所有类伪标签的类原型之间的距离,将距离最小的类原型的类别标签赋给低置信度样本;
损失优化模块,用于综合计算源域数据的交叉熵损失函数以及目标域伪标签数据的交叉熵损失函数,将计算得到的总损失函数对目标域模型进行优化;
迭代优化模块,用于通过初始化模块、样本分类模块、标签赋予模块、损失优化模块形成迭代优化回路,利用带有伪标签的目标域数据和源域数据不断迭代训练优化目标域模型。
9.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于区分置信度水平的可迁移图像识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于区分置信度水平的可迁移图像识别方法的步骤。
CN202110984978.6A 2021-08-26 2021-08-26 基于区分置信度水平的可迁移图像识别方法及系统 Active CN113435546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110984978.6A CN113435546B (zh) 2021-08-26 2021-08-26 基于区分置信度水平的可迁移图像识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110984978.6A CN113435546B (zh) 2021-08-26 2021-08-26 基于区分置信度水平的可迁移图像识别方法及系统

Publications (2)

Publication Number Publication Date
CN113435546A CN113435546A (zh) 2021-09-24
CN113435546B true CN113435546B (zh) 2021-12-24

Family

ID=77797924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110984978.6A Active CN113435546B (zh) 2021-08-26 2021-08-26 基于区分置信度水平的可迁移图像识别方法及系统

Country Status (1)

Country Link
CN (1) CN113435546B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550315A (zh) * 2022-01-24 2022-05-27 云南联合视觉科技有限公司 身份比对识别方法、装置及终端设备
CN114220016B (zh) * 2022-02-22 2022-06-03 山东融瓴科技集团有限公司 面向开放场景下的无人机航拍图像的域自适应识别方法
CN114239753B (zh) * 2022-02-23 2022-07-22 山东力聚机器人科技股份有限公司 可迁移的图像识别方法及装置
CN114722826B (zh) * 2022-04-07 2024-02-02 平安科技(深圳)有限公司 模型的训练方法和装置、电子设备、存储介质
CN114881129A (zh) * 2022-04-25 2022-08-09 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN114998602B (zh) * 2022-08-08 2022-12-30 中国科学技术大学 基于低置信度样本对比损失的域适应学习方法及系统
CN115186773B (zh) * 2022-09-13 2022-12-09 杭州涿溪脑与智能研究所 一种无源的主动领域自适应模型训练方法及装置
CN116359738A (zh) * 2022-12-02 2023-06-30 清华大学 电池的健康状态监测方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10635751B1 (en) * 2019-05-23 2020-04-28 Capital One Services, Llc Training systems for pseudo labeling natural language
CN112686316A (zh) * 2020-12-30 2021-04-20 上海掌门科技有限公司 一种用于确定标签的方法与设备
CN112699892A (zh) * 2021-01-08 2021-04-23 北京工业大学 一种无监督领域自适应语义分割方法
CN112766334A (zh) * 2021-01-08 2021-05-07 厦门大学 一种基于伪标签域适应的跨域图像分类方法
CN113191385A (zh) * 2021-03-25 2021-07-30 之江实验室 一种基于预训练标注数据不可知的图像分类自动标注方法
CN113326731A (zh) * 2021-04-22 2021-08-31 南京大学 一种基于动量网络指导的跨域行人重识别算法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10885383B2 (en) * 2018-05-16 2021-01-05 Nec Corporation Unsupervised cross-domain distance metric adaptation with feature transfer network
CN112464005B (zh) * 2020-11-26 2021-12-03 大连理工大学 一种深度强化图像聚类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10635751B1 (en) * 2019-05-23 2020-04-28 Capital One Services, Llc Training systems for pseudo labeling natural language
CN112686316A (zh) * 2020-12-30 2021-04-20 上海掌门科技有限公司 一种用于确定标签的方法与设备
CN112699892A (zh) * 2021-01-08 2021-04-23 北京工业大学 一种无监督领域自适应语义分割方法
CN112766334A (zh) * 2021-01-08 2021-05-07 厦门大学 一种基于伪标签域适应的跨域图像分类方法
CN113191385A (zh) * 2021-03-25 2021-07-30 之江实验室 一种基于预训练标注数据不可知的图像分类自动标注方法
CN113326731A (zh) * 2021-04-22 2021-08-31 南京大学 一种基于动量网络指导的跨域行人重识别算法

Also Published As

Publication number Publication date
CN113435546A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN113435546B (zh) 基于区分置信度水平的可迁移图像识别方法及系统
CN107133569B (zh) 基于泛化多标记学习的监控视频多粒度标注方法
CN111353491B (zh) 一种文字方向确定方法、装置、设备及存储介质
CN110728252B (zh) 一种应用于区域人员运动轨迹监控的人脸检测方法
CN111444939A (zh) 电力领域开放场景下基于弱监督协同学习的小尺度设备部件检测方法
CN113537070B (zh) 一种检测方法、装置、电子设备及存储介质
CN109063790B (zh) 对象识别模型优化方法、装置和电子设备
CN111368682A (zh) 一种基于faster RCNN台标检测与识别的方法及系统
CN112766218A (zh) 基于非对称联合教学网络的跨域行人重识别方法和装置
CN115690514A (zh) 图像识别方法及相关设备
CN112784494B (zh) 假阳性识别模型的训练方法、目标识别方法及装置
CN114708645A (zh) 物件辨识装置及物件辨识方法
CN115482436B (zh) 图像筛选模型的训练方法、装置以及图像筛选方法
CN110765900A (zh) 一种基于dssd的自动检测违章建筑方法及系统
CN116665390A (zh) 基于边缘计算及优化YOLOv5的火灾检测系统
Wang et al. Extraction of main urban roads from high resolution satellite images by machine learning
CN114724089A (zh) 一种基于互联网的智慧城市监测方法
CN111291624B (zh) 一种挖掘机目标识别方法及系统
CN114239753B (zh) 可迁移的图像识别方法及装置
Li et al. On traffic density estimation with a boosted SVM classifier
CN113269278B (zh) 基于领域翻转的机器人巡航目标识别方法及系统
CN114882376B (zh) 基于最优锚点尺度的卷积神经网络遥感影像目标检测方法
CN117407733B (zh) 一种基于对抗生成shapelet的流量异常检测方法及系统
CN115565008A (zh) 一种可迁移图像识别检测系统、方法及计算机可读存储介质
Yang et al. AF-KNN: A Machine Learning-based Algorithm for Automatic Recognition of Logistics Numbering Images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211117

Address after: 276808 No.99, Yuquan 2nd Road, antonwei street, Lanshan District, Rizhao City, Shandong Province

Applicant after: Shandong Liju Robot Technology Co.,Ltd.

Address before: Room 156-8, No.5 Lingbin Road, Dangan Town, Xiangzhou District, Zhuhai City, Guangdong Province 519000

Applicant before: Guangdong Zhongju Artificial Intelligence Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Li Peng

Inventor after: Zhang Kai

Inventor after: Wang Fan

Inventor after: Wang Xiaohan

Inventor after: Kong Yan

Inventor after: Zhang Meiyu

Inventor after: Yang Guangyuan

Inventor before: Zhang Kai

Inventor before: Wang Fan

Inventor before: Wang Xiaohan

Inventor before: Kong Yan

Inventor before: Zhang Meiyu

Inventor before: Yang Guangyuan