CN112949590A - 一种跨域行人重识别模型构建方法及构建系统 - Google Patents

一种跨域行人重识别模型构建方法及构建系统 Download PDF

Info

Publication number
CN112949590A
CN112949590A CN202110350260.1A CN202110350260A CN112949590A CN 112949590 A CN112949590 A CN 112949590A CN 202110350260 A CN202110350260 A CN 202110350260A CN 112949590 A CN112949590 A CN 112949590A
Authority
CN
China
Prior art keywords
model
models
data set
iteration
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110350260.1A
Other languages
English (en)
Other versions
CN112949590B (zh
Inventor
赵秀阳
张�林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Jinan
Original Assignee
University of Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Jinan filed Critical University of Jinan
Priority to CN202110350260.1A priority Critical patent/CN112949590B/zh
Publication of CN112949590A publication Critical patent/CN112949590A/zh
Application granted granted Critical
Publication of CN112949590B publication Critical patent/CN112949590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种跨域行人重识别模型构建方法及构建系统,均能够实现以下步骤:对源域训练集进行有监督预训练,生成三个不同的预训练模型;利用上述生成的三个预训练模型构造三个协作网络模型;利用目标域数据集对上述构造的三个协作网络模型进行迭代训练,对应得到三个训练好的协作网络模型;从上述得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。本发明用于提高无监督跨域行人重识别的能力。

Description

一种跨域行人重识别模型构建方法及构建系统
技术领域
本发明涉及计算机视觉和模式识别领域,具体涉及一种跨域行人重识别模型构建方法及构建系统。
背景技术
行人重识别(PersonReID)旨在跨相机下检索出特定行人的图像,被广泛应用于监控场景。如今许多带有人工标注的大规模数据集推动了这项任务的快速发展,也为这项任务带来了精度上质的提升。
然而,在实际应用中,即使是用大规模数据集训练好的模型,若直接部署于一个新的监控系统,显著的领域差异通常会导致明显的精度下降。而且,在每个监控系统上都重新进行数据采集和人工标注,因太过费时费力,也很难实现。由此,无监督领域自适应的任务被提出以解决上述问题,使在有标注的源域(SourceDomain)上训练好的模型适应于无标注的目标域(TargetDomain),以获得在目标域上检索精度的提升。
然而,有别于一般的无监督领域自适应问题(目标域与源域共享类别),在行人重识别的任务中,目标域的类别数无法预知,且通常与源域没有重复,这里称之为开放集(Open-set)的无监督领域自适应任务,该任务更为实际,也更具挑战性。鉴于此,在跨域行人重识别时,如何将源域上训练好的结果转移到目标域上并取得良好的效果,已成为目前亟需解决的问题。
目前基于聚类的适应是域适应行人重识别模型的直接方法。Han等人提出了合作教学(CT),这是一种常用的带有噪声伪标签的训练模型算法,它通过将一个网络的小损失样本馈送到另一个网络来学习其他网络,这种协同学习方式倾向于同时选择简单样本特征,会使得网络在训练过程中趋于一致,会导致网络崩塌,进而使得协同训练失效。
为此,本发明提供一种跨域行人重识别模型构建方法及构建系统,用于解决上述问题。
发明内容
针对现有技术的上述不足,本发明提供一种跨域行人重识别模型构建方法及构建系统,用于提高无监督跨域行人重识别的能力。
第一方面,本发明提供一种跨域行人重识别模型构建方法,包括步骤:
Q1:对源域训练集进行有监督预训练,生成三个不同的预训练模型;
Q2:利用上述生成的三个预训练模型构造三个协作网络模型;
Q3:利用目标域数据集对上述构造的三个协作网络模型进行迭代训练,对应得到三个训练好的协作网络模型;
Q4:从上述得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。
进一步地,步骤Q1包括:
向骨干网络输入源域训练集;
根据预先设定的三个不同的随机种子,通过所述骨干网络对所输入的源域训练集进行有监督预训练,生成三个预训练模型。
进一步地,步骤Q2包括:
构造完全相同的三个神经网络模型;
向所构造的三个神经网络模型中一对一加载步骤Q1中所生成的三个预训练模型,得到三个协作网络模型。
进一步地,步骤Q3包括,在每一次迭代中:分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图;之后对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型;之后将本次迭代得到的三个优化后的协作网络模型用于下一次迭代,直至迭代结束,其中,最后一次迭代所得到的三个优化后的协作网络模型即为最终得到的三个训练好的协作网络模型。
进一步地,步骤Q3在每一次迭代中,分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图,具体实现方法为:
步骤Q31:复制用于本次迭代的三个协作网络模型,得到三个复制的协作网络模型;
步骤Q32:分别采用移动加权平均法更新上述三个复制的协作网络模型模型的参数,对应得到三个平均时间模型;
步骤Q33:分别利用上述得到的三个平均时间模型,提取目标域数据集中各图像的特征图;
步骤Q34:分别采用聚类方法,对利用上述得到的三个平均时间模型各自提取到的特征图分别进行聚类,并将每一个聚类结果作为基于各自对应的平均时间模型得到的目标域数据集中图像的伪标签;
步骤Q35:分别利用步骤Q34中基于各平均时间模型对应得到的目标域数据集中图像的伪标签,构建目标域数据集中所有图像的0-1稀疏图;
步骤Q36:分别使用步骤Q35中得到的每一个0-1稀疏图,对步骤Q33中利用对应平均时间模型提取到的目标域数据集中各图像的特征图进行特征平滑,得到各平均时间模型各自对应的目标域数据集中所有图像的优化后的特征图。
进一步地,步骤Q3在每一次迭代中,对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型,具体实现方法为:对用于本次迭代的每一个协作网络模型,分别执行如下步骤:
将目标模型的模型参数以及将所获取到的用于本次迭代的其他两个协作网络模型各自对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图,输入预先定义的损失函数进行损失计算;
利用损失函数的反向传播更新该目标模型的模型参数,得到该目标模型对应的优化后的协作网络模型;
其中,目标模型为上述用于本次迭代的每一个协作网络模型。
第二方面,本发明提供一种跨域行人重识别模型构建系统,包括:
预训练模型生成单元,用于对源域训练集进行有监督预训练,生成三个不同的预训练模型;
协作网络模型构造单元,用于利用上述生成的三个预训练模型构造三个协作网络模型;
迭代训练单元,用于利用目标域数据集对上述构造的三个协作网络模型进行迭代训练,对应得到三个训练好的协作网络模型;
行人重识别模型获取单元,用于从所得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。
进一步地,所述预训练模型生成单元包括:
输入模块,用于向骨干网络输入源域训练集;
模型生成模块,用于根据预先设定的三个不同的随机种子,通过所述骨干网络对所输入的源域训练集进行有监督预训练,生成三个预训练模型。
进一步地,所述的协作网络模型构造单元包括:
第一模块,用于构造完全相同的三个神经网络模型;
第二模块,用于向所构造的三个神经网络模型中一对一加载预训练模型生成单元所生成的三个预训练模型,得到三个协作网络模型。
进一步地,所述迭代训练单元被配置为执行如下步骤:
在每一次迭代中:分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图;之后对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型;之后将本次迭代得到的三个优化后的协作网络模型用于下一次迭代,直至迭代结束,其中,最后一次迭代所得到的三个优化后的协作网络模型即为最终得到的三个训练好的协作网络模型。
进一步地,所述迭代训练单元在每一次迭代中获取用于本次迭代的三个协作网络模型的优化后的协作网络模型的实现方法包括步骤:
步骤Q31:复制用于本次迭代的三个协作网络模型,得到三个复制的协作网络模型;
步骤Q32:分别采用移动加权平均法更新上述三个复制的协作网络模型模型的参数,对应得到三个平均时间模型;
步骤Q33:分别利用上述得到的三个平均时间模型,提取目标域数据集中各图像的特征图;
步骤Q34:分别采用聚类方法,对利用上述得到的三个平均时间模型各自提取到的特征图分别进行聚类,并将每一个聚类结果作为基于各自对应的平均时间模型得到的目标域数据集中图像的伪标签;
步骤Q35:分别利用步骤Q34中基于各平均时间模型对应得到的目标域数据集中图像的伪标签,构建目标域数据集中所有图像的0-1稀疏图;
步骤Q36:分别使用步骤Q35中得到的每一个0-1稀疏图,对步骤Q33中利用对应平均时间模型提取到的目标域数据集中各图像的特征图进行特征平滑,得到各平均时间模型各自对应的目标域数据集中所有图像的优化后的特征图;
步骤Q37:对用于本次迭代的每一个协作网络模型,分别执行如下步骤:
将目标模型的模型参数以及将所获取到的用于本次迭代的其他两个协作网络模型各自对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图,输入预先定义的损失函数进行损失计算;
利用损失函数的反向传播更新该目标模型的模型参数,得到该目标模型对应的优化后的协作网络模型;
其中,目标模型为上述用于本次迭代的每一个协作网络模型。
本发明的有益效果在于,
(1)本发明提供的跨域行人重识别模型构建方法及构建系统,利用三个网络模型从不同角度学习不同的鉴别性特征,保证了获取信息的多样性,一定程度上有助于避免该三个网络模型在训练过程中趋于一致产生网络崩塌,继而有助于提高无监督跨域行人重识别的能力。
(2)本发明提供的跨域行人重识别模型构建方法及构建系统,在每一次迭代训练中,均可构建协作网络模型的平均时间模型以代替当前模型用于提取目标域数据集中各图像的特征图,具有一定的记忆效应,有助于确保用于迭代的三个协同网络模型在训练过程中具有一定的健壮性,继而有助于避免该三个网络模型在训练过程中趋于一致产生网络崩塌,可见进一步有助于提高无监督跨域行人重识别的能力。
(3)本发明提供的跨域行人重识别模型构建方法及构建系统,在每一次迭代中,均能对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,可见本发明在协同学习的过程中,每个模型均在其他模型的多重监督下进行训练,有助于增强模型的鲁棒性能与泛化性能,进一步有助于提高无监督跨域行人重识别的能力。
(4)本发明提供的跨域行人重识别模型构建方法及构建系统,引入了0-1稀疏图,并可使用0-1稀疏图对利用平均时间模型提取到的目标域数据集中各图像的特征图进行特征平滑,然后将特征平滑的特征图用于后续的多重训练,可使用于后续多重训练的特征图能够在一个平滑和连贯的特征空间获得更好的抽象表示,继而有助于促进下一轮迭代给出更准确的跨域行人重识别模型,继而有助于提高模型的无监督跨域行人重识别能力。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的系统的示意性框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
图1是本发明一个实施例的跨域行人重识别模型构建方法的示意性流程图。
如图1所示,该跨域行人重识别模型构建方法包括:
步骤Q1:对源域训练集进行有监督预训练,生成三个不同的预训练模型;
步骤Q2:利用上述生成的三个预训练模型构造三个协作网络模型;
步骤Q3:利用目标域数据集对上述构造的三个协作网络模型进行迭代训练,对应得到三个训练好的协作网络模型;
步骤Q4:从上述得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。
可选地,作为本发明的一个示意性实施例,步骤Q1包括:
向骨干网络输入源域训练集;
根据预先设定的三个不同的随机种子,通过所述骨干网络对所输入的源域训练集进行有监督预训练,生成三个预训练模型。
作为本发明的一个示意性实施例,步骤Q2包括:
构造完全相同的三个神经网络模型;
向所构造的三个神经网络模型中一对一加载步骤Q1中所生成的三个预训练模型,得到三个协作网络模型。
作为本发明的一个示意性实施例,步骤Q3包括,在每一次迭代中:分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图;之后对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型;之后将本次迭代得到的三个优化后的协作网络模型用于下一次迭代,直至迭代结束,其中,最后一次迭代所得到的三个优化后的协作网络模型即为最终得到的三个训练好的协作网络模型。
作为本发明的一个示意性实施例,步骤Q3在每一次迭代中,分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图,具体实现方法为:
步骤Q31:复制用于本次迭代的三个协作网络模型,得到三个复制的协作网络模型;
步骤Q32:分别采用移动加权平均法更新上述三个复制的协作网络模型模型的参数,对应得到三个平均时间模型;
步骤Q33:分别利用上述得到的三个平均时间模型,提取目标域数据集中各图像的特征图;
步骤Q34:分别采用聚类方法,对利用上述得到的三个平均时间模型各自提取到的特征图分别进行聚类,并将每一个聚类结果作为基于各自对应的平均时间模型得到的目标域数据集中图像的伪标签;
步骤Q35:分别利用步骤Q34中基于各平均时间模型对应得到的目标域数据集中图像的伪标签,构建目标域数据集中所有图像的0-1稀疏图;
步骤Q36:分别使用步骤Q35中得到的每一个0-1稀疏图,对步骤Q33中利用对应平均时间模型提取到的目标域数据集中各图像的特征图进行特征平滑,得到各平均时间模型各自对应的目标域数据集中所有图像的优化后的特征图。
作为本发明的一个示意性实施例,步骤Q3在每一次迭代中,对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型,具体实现方法为:对用于本次迭代的每一个协作网络模型,分别执行如下步骤:
将目标模型的模型参数以及将所获取到的用于本次迭代的其他两个协作网络模型各自对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图,输入预先定义的损失函数进行损失计算;
利用损失函数的反向传播更新该目标模型的模型参数,得到该目标模型对应的优化后的协作网络模型;
其中,目标模型为上述用于本次迭代的每一个协作网络模型。
为了便于对本发明的理解,下面以本发明跨域行人重识别模型构建方法的原理,结合实施例中对跨域行人重识别模型进行构建的过程,对本发明提供的跨域行人重识别模型构建方法做进一步地描述。
具体的,所述跨域行人重识别模型构建方法包括:
步骤S1:对源域训练集进行有监督预训练,生成三个不同的预训练模型。
其中,源域训练集中的图像(即行人图像或训练样本),均带有身份标签。
在本实施例中,定义源域训练集
Figure BDA0003001969020000101
其中
Figure BDA0003001969020000111
Figure BDA0003001969020000112
依次为源域训练集中第i个训练样本(即第i个图像)及其标签,Ns是源域训练集中所有图像的总数。
在本实施例中,步骤S1的实现方法为:
向骨干网络输入源域训练集Ds;
根据预先设定的三个不同的随机种子,通过所述骨干网络对所输入的源域训练集进行有监督预训练,生成三个预训练模型。
在本实施例中,预先设定三个不同的随机种子为1、2和3。
具体实现时,向骨干网络输入源域训练集Ds,根据随机种子“1”,通过所述骨干网络对所输入的源域训练集Ds进行有监督预训练,生成一个预训练模型。
同理,可参照随机种子“1”,根据随机种子“2”与“3”,生成另外两个预训练模型。
步骤S2:利用上述生成的三个预训练模型构造三个协作网络模型。
记步骤S1中生成的三个预训练模型依次为预训练模型1、预训练模型2和预训练模型3。
在本实施例中,该步骤S2的具体实现方法为:
构造完全相同的三个神经网络模型,该三个神经网络模型依次为第一神经网络模型、第二神经网络模型和第三神经网络模型;
向第一神经网络模型、第二神经网络模型和第三神经网络模型中一对一加载预训练模型1、预训练模型2和预训练模型3,加载完成后便得到三个协作网络模型。
比如,可以往第一神经网络模型中加载预训练模型1、往第二神经网络模型中加载预训练模型2以及往第三神经网络模型中加载预训练模型3,其中往第一神经网络模型中加载预训练模型1得到第一个协作网络模型,往第二神经网络模型中加载预训练模型2得到第二个协作网络模型,往第三神经网络模型中加载预训练模型3得到第三个协作网络模型。
具体实现时,可将步骤S2中所得到的三个协作网络模型表示为特征转换函数F(·|θk),k=1,2,3,即步骤S2中所得到的三个协作网络模型为F(·|θk),其中,θk代表协作网络模型F(·|θk)的参数,k=1,2,3。
所述k用于区分步骤S2中得到的三个协作网络模型。具体地,F(·|θ1)表示上述第一个协作网络模型(此时k取值为1),F(·|θ2)表示上述第二个协作网络模型(此时k取值为2),F(·|θ3)表示上述第三个协作网络模型(此时k取值为3)。
步骤S3:利用目标域数据集对上述构造的三个协作网络模型F(·|θk)(k=1,2,3),进行迭代训练,对应得到三个训练好的协作网络模型。
目标域数据集中的图像(即行人图像或训练样本),均没有身份标签。
在本实施例中,定义目标域数据集
Figure BDA0003001969020000121
其中,
Figure BDA0003001969020000122
为目标域数据集中第j个训练样本,Nt是目标域数据集中所有图像的总数量。
在本实施例中,步骤S3包括,在每一次迭代中:分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图;之后对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型;之后将本次迭代得到的三个优化后的协作网络模型用于下一次迭代,直至迭代结束,其中,最后一次迭代所得到的三个优化后的协作网络模型即为最终得到的三个训练好的协作网络模型。
具体实现时,步骤S3在每一次迭代中均执行如下步骤:
步骤S31:复制用于本次迭代的三个协作网络模型F(·|θk)(k=1,2,3),得到三个复制的协作网络模型F′(·|θk),k=1,2,3。
其中,F′(·|θk)与F(·|θk)完全相同(k用于区分模型),即F(·|θ1)与F′(·|θ1)完全相同,F(·|θ2)与F′(·|θ2)完全相同,F(·|θ3)与F′(·|θ3)完全相同。
步骤S32:分别采用移动加权平均法更新上述三个复制的协作网络模型模型F′(·|θk)(k=1,2,3)的参数,对应得到三个平均时间模型。
具体地,该实施例中采用移动加权平均法更新上述三个复制的协作网络模型模型F′(·|θk)(k=1,2,3)的参数,所采用的参数更新公式为:
M(T)k]=β×M(T-1)k]+(1-β)×θk
式中,M(T)k]为协作网络模型模型F(·|θk)在第T次迭代中得到的平均时间模型的模型参数(时间平均参数),T=1,2,3,...,r,r为预先设定的迭代训练次数,r为整数,r>40(具体可依据实际情况设定),M(T-1)k]表示协作网络模型模型F(·|θk)在第T-1次迭代中得到的平均时间模型的模型参数;θk代表协作网络模型F(·|θk)在第T-1次迭代后的模型参数,β是预先设定的常数,
Figure BDA0003001969020000131
式中x∈N且30≤x≤40,k=1,2,3,k用于区分模型。特别的,第一次迭代时,M(T)k]=F(·|θk)此时平均模型等于协作模型。
相对应地,在第T次迭代中,步骤S32中所得到的三个平均时间模型可以对应表示为平均时间模型F(·|M(T)k]),k=1,2,3,k用以区分所得到的三个平均时间模型。
步骤S33:分别利用上述得到的三个平均时间模型,提取目标域数据集中各图像的特征图。
具体实现时,可利用上述平均时间模型F(·|M(T)k]),提取目标域数据集Dt中每一个图像
Figure BDA0003001969020000132
的特征图
Figure BDA0003001969020000133
其中,j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量,k=1,2,3。具体地:利用平均时间模型F(·|M(T)1])提取目标域数据集Dt中每一个图像
Figure BDA0003001969020000141
的特征图
Figure BDA0003001969020000142
此时对应k=1;利用平均时间模型F(·|M(T)2])提取目标域数据集Dt中每一个图像
Figure BDA0003001969020000143
的特征图
Figure BDA0003001969020000144
此时k=2;利用平均时间模型F(·|M(T)3])提取目标域数据集Dt中每一个图像
Figure BDA0003001969020000145
的特征图
Figure BDA0003001969020000146
此时对应k=3。
步骤S34:分别采用聚类方法,对利用上述得到的三个平均时间模型各自提取到的特征图分别进行聚类,并将每一个聚类结果作为基于各自对应的平均时间模型得到的目标域数据集中图像的伪标签。
具体实现时,采用DBSCAN聚类方法,分别对利用平均时间模型F(·|M(T)k])提取到的特征图
Figure BDA0003001969020000147
进行聚类,并将聚类结果作为平均时间模型F(·|M(T)k])对应的目标域数据集Dt中每一个图像
Figure BDA0003001969020000148
的伪标签
Figure BDA0003001969020000149
其中j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量,k=1,2,3。具体为:
采用DBSCAN聚类方法,对利用平均时间模型F(·|M(T)1])提取到的各特征图
Figure BDA00030019690200001410
进行聚类,并将聚类结果作为平均时间模型F(·|M(T)1])对应的目标域数据集Dt中每一个图像
Figure BDA00030019690200001411
(j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量)的伪标签
Figure BDA00030019690200001412
此时对应k=1;
采用DBSCAN聚类方法,对利用平均时间模型F(·|M(T)2])提取到的各特征图
Figure BDA00030019690200001413
进行聚类,并将聚类结果作为平均时间模型F(·|M(T)2])对应的目标域数据集Dt中每一个图像
Figure BDA00030019690200001414
(j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量)的伪标签
Figure BDA00030019690200001415
此时对应k=2;
采用DBSCAN聚类方法,对利用平均时间模型F(·|M(T)3])提取到的各特征图
Figure BDA00030019690200001416
进行聚类,并将聚类结果作为平均时间模型F(·|M(T)3])对应的目标域数据集Dt中每一个图像
Figure BDA00030019690200001417
(j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量)的伪标签
Figure BDA00030019690200001418
此时对应k=3。
步骤S35:分别利用步骤S34中得到的基于平均时间模型对应得到的目标域数据集中图像的伪标签,构建目标域数据集中所有图像的0-1稀疏图。具体为:
利用上述得到的目标域数据集Dt中每一个图像
Figure BDA0003001969020000151
(j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量)的伪标签
Figure BDA0003001969020000152
构建目标域数据集中各图像的0-1稀疏图
Figure BDA0003001969020000153
此时对应k=1;
利用上述得到的目标域数据集Dt中每一个图像
Figure BDA0003001969020000154
(j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量)的伪标签
Figure BDA0003001969020000155
构建目标域数据集中各图像的0-1稀疏图
Figure BDA0003001969020000156
此时对应k=2;
利用上述得到的目标域数据集Dt中每一个图像
Figure BDA0003001969020000157
(j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量)的伪标签
Figure BDA0003001969020000158
构建目标域数据集中各图像的0-1稀疏图
Figure BDA0003001969020000159
此时对应k=3。
即在k取1、2、3中的每一个值时,分别利用上述得到的目标域数据集Dt中每一个图像
Figure BDA00030019690200001510
(j=1,2,...,Nt,Nt是目标域数据集Dt中所有图像的总数量)的伪标签
Figure BDA00030019690200001511
构建目标域数据集中每一个图像的0-1稀疏图
Figure BDA00030019690200001512
在本实施例中有:
Figure BDA00030019690200001513
式中
Figure BDA00030019690200001514
Figure BDA00030019690200001515
分别为目标域数据集中的第a个图像和第b个图像,a=1,3,...,Nt-1,b=2,4,...,Nt,Nt是目标域数据集Dt中所有图像的总数量,
Figure BDA00030019690200001516
依次为目标域数据集中的图像
Figure BDA00030019690200001517
和图像
Figure BDA00030019690200001518
的伪标签。
在本实施例中,限制
Figure BDA00030019690200001519
来构造0-1稀疏图,可将具有非零项的对被视为“邻居”。
步骤S36:分别使用步骤S35中得到的每一个0-1稀疏图
Figure BDA00030019690200001520
(a=1,3,...,Nt-1,b=2,4,...,Nt,Nt是目标域数据集Dt中所有图像的总数量),对步骤S33中利用各平均时间模型F(·|M(T)k])提取到的目标域数据集中各图像的特征图
Figure BDA00030019690200001521
进行特征平滑,得到各平均时间模型F(·|M(T)k])各自对应的目标域数据集中所有图像的优化后的特征图。具体地:
使用所得到的每一个0-1稀疏图
Figure BDA0003001969020000161
(a=1,3,...,Nt-1,b=2,4,...,Nt,Nt是目标域数据集Dt中所有图像的总数量),对利用平均时间模型F(·|M(T)1])提取到的每一个特征图
Figure BDA0003001969020000162
进行特征平滑,得到平均时间模型F(·|M(T)1])对应的目标域数据集中所有图像的优化后的特征图,即得到协作网络模型F(·|θ1)所对应的目标域数据集中所有图像的优化后的特征图;
使用所得到的每一个0-1稀疏图
Figure BDA0003001969020000163
(a=1,3,...,Nt-1,b=2,4,...,Nt,Nt是目标域数据集Dt中所有图像的总数量),对利用平均时间模型F(·|M(T)2])提取到的每一个特征图
Figure BDA0003001969020000164
进行特征平滑,得到平均时间模型F(·|M(T)2])对应的目标域数据集中所有图像的优化后的特征图,即得到协作网络模型F(·|θ2)所对应的目标域数据集中所有图像的优化后的特征图;
使用所得到的每一个0-1稀疏图
Figure BDA0003001969020000165
(a=1,3,...,Nt-1,b=2,4,...,Nt,Nt是目标域数据集Dt中所有图像的总数量),对利用平均时间模型F(·|M(T)3])提取到的每一个特征图
Figure BDA0003001969020000166
进行特征平滑,得到平均时间模型F(·|M(T)3])对应的目标域数据集中所有图像的优化后的特征图,即得到协作网络模型F(·|θ3)所对应的目标域数据集中所有图像的优化后的特征图。
步骤S37:对上述用于本次迭代的三个协作网络模型F(·|θk)(k=1,2,3)中的每一个协作网络模型F(·|θk)(即目标模型),分别执行如下步骤:
将协作网络模型F(·|θk)的模型参数以及将用于本次迭代的其他两个协作网络模型各自对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图,输入预先定义的损失函数进行损失计算;
利用损失函数的反向传播更新该协作网络模型F(·|θk)的模型参数,得到该协作网络模型F(·|θk)对应的优化后的协作网络模型。
具体地,预先定义损失函数包括:平滑邻域损失函数、平均交叉熵损失函数、平均三元组损失函数和总损失函数,其中:
①定义平滑邻域损失函数:
Figure BDA0003001969020000171
式中,k=1,2,3,lG为孪生神经网络(SiameseNetwork)的对比损失函数,其中
Figure BDA0003001969020000172
其中m>0是预定义的边距,m为常数,‖·||是为L2范式距离,H代表欧氏距离,
Figure BDA0003001969020000173
Figure BDA0003001969020000174
分别为目标域数据集中的第a个图像和第b个图像,
Figure BDA0003001969020000175
为以上步骤中所得到的
Figure BDA0003001969020000176
Figure BDA0003001969020000177
的0-1稀疏图,a=1,3,...,Nt-1,b=2,4,...,Nt,Nt是目标域数据集Dt中所有图像的总数量,θk为协作网络模型F(·|θk)在进行本次迭代之前的模型参数。
该平滑邻域损失函数鼓励邻域拥有一致的预测,而非邻域(即不同类的点)以最小距离m彼此推开。
Figure BDA0003001969020000178
时,即两个样本为同一分类,此时直接计算L2范式距离,L2范式距离越远loss(即Lsneighbor(θk)的损失)越大,从而拉近同类物体间的距离;当
Figure BDA0003001969020000179
时:设置了一个边界值(对应上述m),当两个样本点间距离小于m时,由于类别不一致,距离越近loss越大;而当距离大于m时,不再计算loss。此时的loss使得不同类样本间距离尽可能远。
②定义平均交叉熵损失函数:
Figure BDA00030019690200001710
式中:
Figure BDA00030019690200001711
为定义的平均交叉熵损失函数,F(·|θk)为所述的目标模型,F(·|M(T)k′])和F(·|M(T)k″])为用于迭代的其他两个协作网络模型在迭代中产生的两个平均时间模型,Nt是目标域数据集Dt中所有图像的总数量;
Figure BDA0003001969020000181
为利用平均时间模型F(·|M(T)k,])提取到的目标域数据集Dt中每一个图像
Figure BDA0003001969020000182
的特征图,
Figure BDA0003001969020000183
为利用平均时间模型F(·|M(T)k″])提取到的目标域数据集Dt中每一个图像
Figure BDA0003001969020000184
的特征图;
Figure BDA0003001969020000185
是基于平均时间模型F(·|M(T)k′])得到的目标域数据集中Dt中每一个图像
Figure BDA0003001969020000186
的伪标签;
Figure BDA0003001969020000187
是基于平均时间模型F(·|M(T)k″])得到的目标域数据集中Dt中每一个图像
Figure BDA0003001969020000188
的伪标签;
Figure BDA0003001969020000189
为迭代第一次时(即第一次迭代时)基于所述目标模型F(·|θk)得到的目标域数据集Dt中每一个图像
Figure BDA00030019690200001810
的特征图
Figure BDA00030019690200001811
Figure BDA00030019690200001812
代表迭代第一次时基于目标平均时间模型获取到的目标域数据集Dt中每一个图像
Figure BDA00030019690200001813
的伪标签(具体获取方法可参照前文所述),所述目标平均时间模型采用所述的目标模型F(·|θk);
log为以e为底的对数函数;
K=1,2,3。
在每一次迭代中,目标模型F(·|θk)均受用于迭代的其他两个协作网络模型在迭代中产生的平均时间模型的共同监督。
③定义平均三元组损失函数为:
Figure BDA00030019690200001814
式中:
Figure BDA00030019690200001815
为定义的平均三元组损失函数,lb为二进制交叉熵损失函数,k=1,2,3,
Figure BDA00030019690200001816
Figure BDA00030019690200001817
各自代表的含义参见平均交叉熵损失函数部分。
(2)定义总损失函数
利用上述自定义的平滑邻域损失函数Lsneighbork)、平均交叉熵损失函数
Figure BDA0003001969020000191
和平均三元组损失函数
Figure BDA0003001969020000192
定义总损失函数Lk,具体地:
Figure BDA0003001969020000193
式中,μ、γ、ν均为常数,用于表示各自对应损失函数所占的比例;k=1,2,3。
利用总损失函数Lk的反向传播更新协作网络F(·|θk)的模型参数,生成三个(对应k的三个取值)带有最新参数的协作网络模型。
每一次迭代中生成的三个带有最新参数的协作网络模型均用于下一次迭代,直至迭代结束,然后输出最后一次迭代得到的三个协作网络模型。所述最后一次迭代得到的三个协作网络模型,即为三个训练好的协作网络模型。
步骤S34:从上述得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。
图2为本发明提供的一种跨域行人重识别模型构建系统的实施例。
如图2所示,该系统200包括:
预训练模型生成单元201,用于对源域训练集进行有监督预训练,生成三个不同的预训练模型;
协作网络模型构造单元202,用于利用上述生成的三个预训练模型构造三个协作网络模型;
迭代训练单元203,用于利用目标域数据集对上述构造的三个协作网络模型进行迭代训练,对应得到三个训练好的协作网络模型;
行人重识别模型获取单元204,用于从所得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。
作为本发明的一个示意性实施例,所述预训练模型生成单元201包括:
输入模块,用于向骨干网络输入源域训练集;
模型生成模块,用于根据预先设定的三个不同的随机种子,通过所述骨干网络对所输入的源域训练集进行有监督预训练,生成三个预训练模型。
所述的协作网络模型构造单元202包括:
第一模块,用于构造完全相同的三个神经网络模型;
第二模块,用于向所构造的三个神经网络模型中一对一加载预训练模型生成单元201所生成的三个预训练模型,得到三个协作网络模型。
作为本发明的一个示意性实施例,迭代训练单元203被配置为执行如下步骤:
在每一次迭代中:分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图;之后对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型;之后将本次迭代得到的三个优化后的协作网络模型用于下一次迭代,直至迭代结束,其中,最后一次迭代所得到的三个优化后的协作网络模型即为最终得到的三个训练好的协作网络模型。
作为本发明的一个示意性实施例,所述迭代训练单元203在每一次迭代中获取用于本次迭代的三个协作网络模型的优化后的协作网络模型的实现方法包括步骤:
步骤Q31:复制用于本次迭代的三个协作网络模型,得到三个复制的协作网络模型;
步骤Q32:分别采用移动加权平均法更新上述三个复制的协作网络模型模型的参数,对应得到三个平均时间模型;
步骤Q33:分别利用上述得到的三个平均时间模型,提取目标域数据集中各图像的特征图;
步骤Q34:分别采用聚类方法,对利用上述得到的三个平均时间模型各自提取到的特征图分别进行聚类,并将每一个聚类结果作为基于各自对应的平均时间模型得到的目标域数据集中图像的伪标签;
步骤Q35:分别利用步骤Q34中基于各平均时间模型对应得到的目标域数据集中图像的伪标签,构建目标域数据集中所有图像的0-1稀疏图;
步骤Q36:分别使用步骤Q35中得到的每一个0-1稀疏图,对步骤Q33中利用对应平均时间模型提取到的目标域数据集中各图像的特征图进行特征平滑,得到各平均时间模型各自对应的目标域数据集中所有图像的优化后的特征图;
步骤Q37:对用于本次迭代的每一个协作网络模型,分别执行如下步骤:
将目标模型的模型参数以及将所获取到的用于本次迭代的其他两个协作网络模型各自对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图,输入预先定义的损失函数进行损失计算;
利用损失函数的反向传播更新该目标模型的模型参数,得到该目标模型对应的优化后的协作网络模型;
其中,目标模型为所述用于本次迭代的每一个协作网络模型。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种跨域行人重识别模型构建方法,其特征在于,包括步骤:
Q1:对源域训练集进行有监督预训练,生成三个不同的预训练模型;
Q2:利用上述生成的三个预训练模型构造三个协作网络模型;
Q3:利用目标域数据集对上述构造的三个协作网络模型进行迭代训练,对应得到三个训练好的协作网络模型;
Q4:从上述得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。
2.根据权利要求1所述的跨域行人重识别模型构建方法,其特征在于,步骤Q1包括:
向骨干网络输入源域训练集;
根据预先设定的三个不同的随机种子,通过所述骨干网络对所输入的源域训练集进行有监督预训练,生成三个预训练模型。
3.根据权利要求1所述的跨域行人重识别模型构建方法,其特征在于,步骤Q2包括:
构造完全相同的三个神经网络模型;
向所构造的三个神经网络模型中一对一加载步骤Q1中所生成的三个预训练模型,得到三个协作网络模型。
4.根据权利要求1所述的跨域行人重识别模型构建方法,其特征在于,步骤Q3包括,在每一次迭代中:分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图;之后对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型;之后将本次迭代得到的三个优化后的协作网络模型用于下一次迭代,直至迭代结束,其中,最后一次迭代所得到的三个优化后的协作网络模型即为最终得到的三个训练好的协作网络模型。
5.根据权利要求4所述的跨域行人重识别模型构建方法,其特征在于,步骤Q3在每一次迭代中,分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图,具体实现方法为:
步骤Q31:复制用于本次迭代的三个协作网络模型,得到三个复制的协作网络模型;
步骤Q32:分别采用移动加权平均法更新上述三个复制的协作网络模型模型的参数,对应得到三个平均时间模型;
步骤Q33:分别利用上述得到的三个平均时间模型,提取目标域数据集中各图像的特征图;
步骤Q34:分别采用聚类方法,对利用上述得到的三个平均时间模型各自提取到的特征图分别进行聚类,并将每一个聚类结果作为基于各自对应的平均时间模型得到的目标域数据集中图像的伪标签;
步骤Q35:分别利用步骤Q34中基于各平均时间模型对应得到的目标域数据集中图像的伪标签,构建目标域数据集中所有图像的0-1稀疏图;
步骤Q36:分别使用步骤Q35中得到的每一个0-1稀疏图,对步骤Q33中利用对应平均时间模型提取到的目标域数据集中各图像的特征图进行特征平滑,得到各平均时间模型各自对应的目标域数据集中所有图像的优化后的特征图。
6.根据权利要求4所述的跨域行人重识别模型构建方法,其特征在于,步骤Q3在每一次迭代中,对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型,具体实现方法为:对用于本次迭代的每一个协作网络模型,分别执行如下步骤:
将目标模型的模型参数以及将所获取到的用于本次迭代的其他两个协作网络模型各自对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图,输入预先定义的损失函数进行损失计算;
利用损失函数的反向传播更新该目标模型的模型参数,得到该目标模型对应的优化后的协作网络模型;
其中,目标模型为上述用于本次迭代的每一个协作网络模型。
7.一种跨域行人重识别模型构建系统,其特征在于,包括:
预训练模型生成单元,用于对源域训练集进行有监督预训练,生成三个不同的预训练模型;
协作网络模型构造单元,用于利用上述生成的三个预训练模型构造三个协作网络模型;
迭代训练单元,用于利用目标域数据集对上述构造的三个协作网络模型进行迭代训练,对应得到三个训练好的协作网络模型;
行人重识别模型获取单元,用于从所得到的三个训练好的协作网络模型中选取出性能最好的一个模型,该选取出的性能最好的模型即为构建得到的跨域行人重识别模型。
8.根据权利要求7所述的跨域行人重识别模型构建系统,其特征在于,所述预训练模型生成单元包括:
输入模块,用于向骨干网络输入源域训练集;
模型生成模块,用于根据预先设定的三个不同的随机种子,通过所述骨干网络对所输入的源域训练集进行有监督预训练,生成三个预训练模型;
所述的协作网络模型构造单元包括:
第一模块,用于构造完全相同的三个神经网络模型;
第二模块,用于向所构造的三个神经网络模型中一对一加载预训练模型生成单元所生成的三个预训练模型,得到三个协作网络模型。
9.根据权利要求7所述的跨域行人重识别模型构建系统,其特征在于,迭代训练单元被配置为执行如下步骤:
在每一次迭代中:分别获取用于本次迭代的三个协作网络模型的平均时间模型,并分别基于所获取的每一个平均时间模型,对应获取目标域数据集中所有图像的伪标签以及获取目标域数据集中所有图像的优化后的特征图;之后对用于本次迭代的每一个协作网络模型,分别采用所获取到的其他两个协作网络模型所对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图进行无监督优化,对应得到用于本次迭代的三个协作网络模型的优化后的协作网络模型;之后将本次迭代得到的三个优化后的协作网络模型用于下一次迭代,直至迭代结束,其中,最后一次迭代所得到的三个优化后的协作网络模型即为最终得到的三个训练好的协作网络模型。
10.根据权利要求9所述的跨域行人重识别模型构建系统,其特征在于,所述迭代训练单元在每一次迭代中获取用于本次迭代的三个协作网络模型的优化后的协作网络模型的实现方法包括步骤:
步骤Q31:复制用于本次迭代的三个协作网络模型,得到三个复制的协作网络模型;
步骤Q32:分别采用移动加权平均法更新上述三个复制的协作网络模型模型的参数,对应得到三个平均时间模型;
步骤Q33:分别利用上述得到的三个平均时间模型,提取目标域数据集中各图像的特征图;
步骤Q34:分别采用聚类方法,对利用上述得到的三个平均时间模型各自提取到的特征图分别进行聚类,并将每一个聚类结果作为基于各自对应的平均时间模型得到的目标域数据集中图像的伪标签;
步骤Q35:分别利用步骤Q34中基于各平均时间模型对应得到的目标域数据集中图像的伪标签,构建目标域数据集中所有图像的0-1稀疏图;
步骤Q36:分别使用步骤Q35中得到的每一个0-1稀疏图,对步骤Q33中利用对应平均时间模型提取到的目标域数据集中各图像的特征图进行特征平滑,得到各平均时间模型各自对应的目标域数据集中所有图像的优化后的特征图;
步骤Q37:对用于本次迭代的每一个协作网络模型,分别执行如下步骤:
将目标模型的模型参数以及将所获取到的用于本次迭代的其他两个协作网络模型各自对应的目标域数据集中所有图像的伪标签及目标域数据集中所有图像的优化后的特征图,输入预先定义的损失函数进行损失计算;
利用损失函数的反向传播更新该目标模型的模型参数,得到该目标模型对应的优化后的协作网络模型;
其中,目标模型为上述用于本次迭代的每一个协作网络模型。
CN202110350260.1A 2021-03-31 2021-03-31 一种跨域行人重识别模型构建方法及构建系统 Active CN112949590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110350260.1A CN112949590B (zh) 2021-03-31 2021-03-31 一种跨域行人重识别模型构建方法及构建系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110350260.1A CN112949590B (zh) 2021-03-31 2021-03-31 一种跨域行人重识别模型构建方法及构建系统

Publications (2)

Publication Number Publication Date
CN112949590A true CN112949590A (zh) 2021-06-11
CN112949590B CN112949590B (zh) 2023-02-21

Family

ID=76231695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110350260.1A Active CN112949590B (zh) 2021-03-31 2021-03-31 一种跨域行人重识别模型构建方法及构建系统

Country Status (1)

Country Link
CN (1) CN112949590B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191461A (zh) * 2021-06-29 2021-07-30 苏州浪潮智能科技有限公司 一种图片识别方法、装置、设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784182A (zh) * 2018-12-17 2019-05-21 北京飞搜科技有限公司 行人重识别方法和装置
CN110414462A (zh) * 2019-08-02 2019-11-05 中科人工智能创新技术研究院(青岛)有限公司 一种无监督的跨域行人重识别方法及系统
CN110427813A (zh) * 2019-06-24 2019-11-08 中国矿业大学 基于姿态指导行人图像生成的孪生生成式对抗网络的行人重识别方法
CN110941734A (zh) * 2019-11-07 2020-03-31 南京理工大学 基于稀疏图结构的深度无监督图像检索方法
CN110992433A (zh) * 2018-10-02 2020-04-10 通用电气公司 用于利用空数据一致性来稀疏图像重建的系统和方法
CN112036322A (zh) * 2020-09-01 2020-12-04 清华大学 多任务网络跨域行人重识别模型构建方法、系统及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110992433A (zh) * 2018-10-02 2020-04-10 通用电气公司 用于利用空数据一致性来稀疏图像重建的系统和方法
CN109784182A (zh) * 2018-12-17 2019-05-21 北京飞搜科技有限公司 行人重识别方法和装置
CN110427813A (zh) * 2019-06-24 2019-11-08 中国矿业大学 基于姿态指导行人图像生成的孪生生成式对抗网络的行人重识别方法
CN110414462A (zh) * 2019-08-02 2019-11-05 中科人工智能创新技术研究院(青岛)有限公司 一种无监督的跨域行人重识别方法及系统
CN110941734A (zh) * 2019-11-07 2020-03-31 南京理工大学 基于稀疏图结构的深度无监督图像检索方法
CN112036322A (zh) * 2020-09-01 2020-12-04 清华大学 多任务网络跨域行人重识别模型构建方法、系统及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIANGCHEN SONG ET AL.: "Unsupervised Domain Adaptive Re-Identification:Theory and Practice", 《ARXIV》 *
RAFAEL MÜLLER ET AL.: "When Does Label Smoothing Help?", 《ARXIV》 *
YIXIAO GE ET AL.: "MUTUAL MEAN-TEACHING:PSEUDO LABEL REFINERY FOR UNSUPERVISED DOMAIN", 《ARXIV》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191461A (zh) * 2021-06-29 2021-07-30 苏州浪潮智能科技有限公司 一种图片识别方法、装置、设备及可读存储介质
CN113191461B (zh) * 2021-06-29 2021-09-17 苏州浪潮智能科技有限公司 一种图片识别方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN112949590B (zh) 2023-02-21

Similar Documents

Publication Publication Date Title
CN110309331B (zh) 一种基于自监督的跨模态深度哈希检索方法
CN110188227B (zh) 一种基于深度学习与低秩矩阵优化的哈希图像检索方法
CN110674323B (zh) 基于虚拟标签回归的无监督跨模态哈希检索方法及系统
CN109741341B (zh) 一种基于超像素和长短时记忆网络的图像分割方法
CN112132014B (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
CN110598869B (zh) 基于序列模型的分类方法、装置、电子设备
CN113987236B (zh) 基于图卷积网络的视觉检索模型的无监督训练方法和装置
Huo et al. Semisupervised learning based on a novel iterative optimization model for saliency detection
CN113377964A (zh) 知识图谱链接预测方法、装置、设备及存储介质
CN110163206B (zh) 车牌识别方法、系统、存储介质和装置
CN113920382B (zh) 基于类一致性结构化学习的跨域图像分类方法和相关装置
CN115439715A (zh) 基于反标签学习的半监督少样本图像分类学习方法及系统
CN112949590B (zh) 一种跨域行人重识别模型构建方法及构建系统
CN111695526B (zh) 网络模型生成方法、行人重识别方法及装置
CN111126420A (zh) 一种建立识别模型的方法及装置
CN112766354B (zh) 一种基于知识图谱的小样本图片识别方法及系统
CN114693997A (zh) 基于迁移学习的图像描述生成方法、装置、设备及介质
JP6993250B2 (ja) コンテンツ特徴量抽出装置、方法、及びプログラム
CN112948617A (zh) 基于特定类原型的深度哈希网络图像检索方法及装置
CN113392867A (zh) 一种图像识别方法、装置、计算机设备及存储介质
US11609936B2 (en) Graph data processing method, device, and computer program product
CN116012569B (zh) 一种基于深度学习的含噪数据下的多标签图像识别方法
CN114037866B (zh) 一种基于可辨伪特征合成的广义零样本图像分类方法
CN114926721A (zh) 一种场景图像解析方法和系统
CN115392382A (zh) 一种基于跨模态密集注意力的视觉语言对象分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant