CN112016402A - 基于无监督学习的行人重识别领域自适应方法及装置 - Google Patents
基于无监督学习的行人重识别领域自适应方法及装置 Download PDFInfo
- Publication number
- CN112016402A CN112016402A CN202010777248.4A CN202010777248A CN112016402A CN 112016402 A CN112016402 A CN 112016402A CN 202010777248 A CN202010777248 A CN 202010777248A CN 112016402 A CN112016402 A CN 112016402A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- image
- feature extraction
- enhanced
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000000605 extraction Methods 0.000 claims abstract description 208
- 238000005286 illumination Methods 0.000 claims abstract description 51
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 41
- 230000003044 adaptive effect Effects 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 12
- 230000000007 visual effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000005065 mining Methods 0.000 claims description 10
- 230000006978 adaptation Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 abstract description 6
- 238000007796 conventional method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种基于无监督学习的行人重识别领域自适应方法及装置,所述方法包括:通过将带有身份标识的行人图像输入领域自适应特征提取模型,确定其初始特征和增强特征,并计算待进行行人重识别的图像特征与初始特征和增强特征的相似度,进行行人重识别;其中,领域自适应特征提取模型包括用于生成存在视角差异和/或不同光照差异的特征增强图像的循环对抗生成网络模块、提取图像初始特征和增强特征的特征提取模块,以及确定初始特征和增强特征的外观相似特征的对比学习模块。本发明实施例在面对新场景时不需要重新训练网络,成本较低,且能够准确提取带有身份标识行人图像的初始特征和增强特征得到识别结果,具有较高的鲁棒性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于无监督学习的行人重识别领域自适应方法及装置。
背景技术
行人重识别作为智能安防监控中非常重要的子系统,其任务主要是在行人图像数据库中检索给定行人的其他图像,任务难点在于跨摄像头视角、姿态、尺度变化等因素的影响。同时当前行人重识别极度依赖于训练数据集,基于深度学习的方法往往会在训练数据集上学习到当前数据集摄像机的参数分布,因此,当网络迁移到新的场景下时会存在显著的性能下降。而对新的场景重现标注再训练的成本非常高,因此利用跨场景的无标签数据对网络进行领域自适应提高性能是一种非常有效的做法。领域自适应是指迁移模型到与训练集不同分布数据上时性能能够提升,而不是显著下降。
现有技术方案采用无监督图像表示学习中对比学习,通过数据增强的方式使得网络能够从无监督的样本中学习图像有用的表示迁移到下游的学习任务并使得下游学习任务性能提升。基于大规模的无标签数据,每一个图像样本都被当作单独的类别,网络的任务就是面对不同数据增强过后的样本输出相似的特征输出。
然而,无监督图像表示学习中对比学习主要利用的是大规模的无标签图像,并不关注图像的类别概念。在行人重识别中,图像的特征需要学习到摄像机视角不变性、姿态不变性以及尺度不变性。所以使用现有的数据增强方法会损害行人的特征描述从而不能直接使用到当前任务中,而且对比学习不能够利用行人的身份信息进行进一步学习鲁棒的行人特征。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于无监督学习的行人重识别领域自适应方法及装置。
具体地,本发明实施例提供了如下技术方案:
第一方面,本发明实施例提供一种基于无监督学习的行人重识别领域自适应方法,包括:
获取带有身份标识的行人图像,将所述带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;
获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;
计算所述待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别;
其中,所述领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块,所述领域自适应特征提取模型为采用行人重识别样本图像训练得到的;
其中,所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像;所述特征提取模块,用于对所述样本图像进行特征提取,获取初始特征提取结果,以及,用于对所述特征增强图像进行特征提取,获得增强特征提取结果;所述对比学习模块,用于在特征提取模块获取初始特征提取结果和增强特征提取结果后,通过最近邻特征挖掘,确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征,提高所述初始特征提取结果和所述增强特征提取结果中外观相似特征的使用权重;其中,所述外观相似特征是指所述初始特征提取结果和所述增强特征提取结果中的相似外观特征;
其中,在对所述领域自适应特征提取模型进行训练时,通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块,以及通过计算对比损失来优化所述特征提取模块,直至满足预设收敛条件。
进一步地,所述通过计算对比损失来优化所述特征提取模块,包括:
在对比学习模块确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征后,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数。
进一步地,若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则将待进行行人重识别的图像特征添加至特征提取模块。
进一步地,所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像,包括:
获取真摄像头下的样本图像和假摄像头下的样本图像;
第一生成器将真摄像头下的样本图像转化为假摄像头下的样本图像,第二生成器将假摄像头下的样本图像转化为真摄像头下的样本图像,第一判别器识别输入图像是否为真摄像头下的样本图像,第二判别器识别输入图像是否为假摄像头下的样本图像;
其中,所述真摄像头下的样本图像和假摄像头下的样本图像是存在视角差异和/或光照差异的样本图像;
相应地,所述通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块,包括:
根据循环一致性损失以及对抗生成损失,优化循环生成对抗网络模块参数。
进一步地,所述对比损失函数为:
其中,LS表示对比损失,f(x)表示中心特征,f(x+)表示正例特征,f(x-)表示负例特征。
第二方面,本发明实施例提供一种基于无监督学习的行人重识别领域自适应装置,包括:
第一获取单元,用于获取带有身份标识的行人图像,将所述带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;
第二获取单元,用于获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;
识别单元,用于计算所述待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别;
其中,所述领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块,所述领域自适应特征提取模型为采用行人重识别样本图像训练得到的;
其中,所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像;所述特征提取模块,用于对所述样本图像进行特征提取,获取初始特征提取结果,以及,用于对所述特征增强图像进行特征提取,获得增强特征提取结果;所述对比学习模块,用于在特征提取模块获取初始特征提取结果和增强特征提取结果后,通过最近邻特征挖掘,确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征,提高所述初始特征提取结果和所述增强特征提取结果中外观相似特征的使用权重;其中,所述外观相似特征是指所述初始特征提取结果和所述增强特征提取结果中的相似外观特征;
其中,在对所述领域自适应特征提取模型进行训练时,通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块,以及通过计算对比损失来优化所述特征提取模块,直至满足预设收敛条件。
进一步地,所述通过计算对比损失来优化所述特征提取模块,包括:
在对比学习模块确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征后,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数。
进一步地,还包括:若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则将待进行行人重识别的图像特征添加至特征提取模块。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述基于无监督学习的行人重识别领域自适应方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述基于无监督学习的行人重识别领域自适应方法的步骤。
本发明实施例提供的基于无监督学习的行人重识别领域自适应方法及装置,通过将带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征,并计算待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别;其中,领域自适应特征提取模型为采用行人重识别样本图像训练得到的,包括用于生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像的循环对抗生成网络模块、用于提取样本图像初始特征和增强特征的特征提取模块,以及用于通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征的对比学习模块。本发明实施例基于循环生成对抗网络生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像,从而在面对新的场景时不需要重新训练网络,成本较低,并通过特征提取模块提取样本图像初始特征和增强特征,以及通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征,提高初始特征与增强特征的相似度,并根据图像特征计算对比损失优化特征提取模块参数,进而特征提取模块在不同场景中能够准确提取带有身份标识行人图像的初始特征和增强特征,并确定其与待进行行人重识别图像特征的相似度,使得可以应用于不同场景且准确得到识别结果,实现领域自适应,具有较高的鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一个实施例提供的基于无监督学习的行人重识别领域自适应方法的流程示意图;
图2是本发明第一个实施例提供的网络训练流程示意图;
图3是本发明第二个实施例提供的基于无监督学习的行人重识别领域自适应装置的结构示意图;
图4是本发明第三个实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
行人重识别本质上是图像检索任务,现有技术中基于深度学习的行人重识别网络模型极度依赖于原有训练数据集,而行人图像的差异主要包括跨视角差异、外观差异以及光照差异,这些差异会导致原有的行人重识别网络模型迁移到新的场景下时无法适应新的场景,从而使模型性能显著下降。为了在无监督场景下进行领域自适应,本发明实施例使用循环对抗生成网络来生成跨视角差异、光照差异的行人图像,以及基于邻近算法挖掘外观最接近的图像来解决特征对外观差异的建模,提高同一行人初始特征与增强特征的相似度,从而在面对新的场景时不需要重新训练网络,不仅成本较低,而且能够使用于不同场景中且获取准确的识别结果,实现领域自适应,具有较高的鲁棒性。
图1是本发明第一个实施例提供的基于无监督学习的行人重识别领域自适应方法的流程示意图,如图1所示,本发明第一个实施例提供的基于无监督学习的行人重识别领域自适应方法,包括如下步骤:
步骤110、获取带有身份标识的行人图像,将带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征。
其中,领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块,领域自适应特征提取模型为采用行人重识别样本图像训练得到的。
在本步骤中,行人重识别也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。例如通过给定摄像头A下一个带有身份标识的监控行人图像,检索跨设备下如摄像头B是否存在该行人图像。通过行人重识别可以弥补固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。例如摄像头A在路口拍摄的行人图像,当该行人走进路口拐角巷子时,由于摄像头A是固定的,从而当该行人进入巷子时无法拍摄到该行人,因此需要借助巷子中的摄像头B来搜索该行人图像。
因此,为了从上述摄像头B拍摄的行人图像中搜索是否存在摄像头A拍摄的行人图像,传统方法中采用摄像头A拍摄的图像作为训练集,基于深度学习的方法进行行人重识别模型的训练,但传统方法极度依赖于训练数据集,也就是只能识别出训练集中摄像头A拍摄的图像特征(比如在摄像头A的视角或者光照下拍摄图像的特征),一旦转换到新的应用场景(比如摄像头B拍摄的图像跨视角或者光照不同),由于传统方法是基于摄像头A拍摄的图像进行训练的,则会判断同一行人的图像特征不同(摄像头A与摄像头B拍摄的同一行人图像特征不同),从而认为摄像头B拍摄的图像中不存在摄像头A拍摄的行人图像,造成误判。
由此可见,传统方法中基于深度学习的方法进行行人重识别模型,通过摄像头B来搜索该行人图像,但是由于摄像头拍摄的行人图像会存在跨视角差异、光照差异以及外观差异,会导致摄像头B拍摄的行人图像特征与摄像头A拍摄的同一行人图像特征不同,从而导致无法从摄像头B拍摄的行人图像中准确识别是否存在摄像头A中拍摄的行人图像,因此,传统方法会因为场景的改变而影响其识别结果的准确度,存在显著的性能下降。
举例来说,同一行人站在同一地点,此时光照条件相同,但是由于摄像头A安装于5m高处,而摄像头B安装于4m高处,此时摄像头A和摄像头B拍摄角度不同,拍摄得到的同一行人图像的视角会存在差异,从而导致摄像头A与摄像头B拍摄的行人图像中的形状特征不同;又如,摄像头A在上午9点拍摄的同一行人,与其在晚上8点拍摄的同一行人,由于光照条件不同,拍摄得到的同一行人图像的光照会存在差异,从而导致摄像头A与摄像头B拍摄的行人图像中的颜色特征不同。
为了解决上述由于行人图像存在跨视角差异和/或光照差异导致无法在摄像头B拍摄的行人图像中准确识别是否存在摄像头A中拍摄的行人图像的技术问题,本实施例采用领域自适应特征提取模型中的循环对抗生成网络模块,来生成跨视角差异和/或光照差异的行人图像,从而不像传统方法中只能提取行人图像在固定视角和/或光照下的特征,本实施例通过循环对抗生成网络模块生成不同视角和/或光照下的图像特征,丰富增强了后续特征提取模块中的图像特征,从而能够准确识别待进行识别的行人是否与带有身份标识的行人图像中的行人为同一身份。
其中,循环对抗生成网络模块用于对样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像。
举例来说,对于摄像头A拍摄的行人图像,本实施例通过将摄像头A拍摄的行人图像输入已经训练好的循环对抗生成网络模块,则可以生成多个存在跨视角差异和/或光照差异的同一行人图像,后续特征提取模块可以提取多个该行人图像跨视角差异和/或光照差异的图像,以供进行图像中行人身份的识别,而不是仅依赖于摄像头A拍摄条件下的视角和光照图像。
在本实施例中,采用循环对抗生成网络模块生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像,可以通过对抗训练,令原始噪声的分布逼近真实图片的分布。然而传统方法中通过数据增强的方式学习图像,关注的是最明显的特征,而不关注图像本身的类别。例如,行人A侧面站立的图像,行人B背面站立的图像,若待识别行人身份图像是行人A背面站立的图像,则传统方法的数据增强方式会认为待识别行人身份图像中是行人B,而不是行人A,明显判断失误。因为传统方法的数据增强方式关注的是最明显的特征,即侧面站立和背面站立,从而损害了行人A的特征描述。由此可见,本实施例采用的循环对抗生成网络模块能够使生成的增强图像更接近原始图像的特征描述,而且为后续判断待识别身份行人的图像提供了大量的比对样本,减小误差,提高识别结果的准确率。
因此,在本实施例中,通过获取带有身份标识的行人图像,将带有身份标识的行人图像输入领域自适应特征提取模型中,利用循环对抗生成网络模块生成与带有身份标识的行人图像对应的存在视角差异和/或不同光照差异的特征增强图像,从而获取的图像包括原始图像(带有身份标识的行人图像)以及与原始图像对应的增强图像,通过提取特征模块提取原始图像的特征(初始特征)以及增强图像的特征(增强特征)。
其中,特征提取模块,用于对样本图像进行特征提取,获取初始特征提取结果,以及,用于对特征增强图像进行特征提取,获得增强特征提取结果。图2是本发明第一个实施例提供的网络训练流程示意图,如图2所示,本实施例将提取得到的初始特征和增强特征存储到特征提取模块中的缓存模块,将其作为进行行人重识别的图像数据库,当待进行行人重识别的图像需要进行识别时,就将待进行行人重识别的图像特征与缓存模块中存储的特征进行比对,从而确定图像中的行人身份。
可以理解的是,获取的带有身份标识的行人图像可以是一张,也可以是多张同一行人的图像。举例来说,若要搜索在摄像头A下拍摄到的行人A的图像,则可以将摄像头A拍摄的行人A图像输入领域自适应特征提取模型中,若摄像头B也同时拍摄到了行人A的图像,则也可以将摄像头B下拍摄的行人A的图像也同时输入领域自适应特征提取模型中,从而可以生成多个行人A图像的原始图像特征(初始特征)以及增强图像特征(增强特征),构成一个对比数据库,用来逐一与待进行行人重识别的图像进行对比,从而确定行人重识别的结果。
进一步地,图2中缓存模块存储的每一个行人图像的初始特征和增强特征,由于都是属于同一身份行人的图像特征,因此可以将其看作同一类;同理,不同行人图像的初始特征和增强特征则将其看作不同类别。然而,由于外观差异会导致同一类特征相似度较低,不同类特征相似度反而较高。例如,行人A的正面图像经增强后,会得到变换角度的行人A的侧面增强图像,两张图像由于站位角度(正面和侧面)不同,会导致外观差异,从而行人A的正面图像特征和行人A的侧面增强图像特征相似度较低。同理,行人A与行人B的衣着相同,那么行人A的背面图像特征与行人B的背面图像特征相似度就会较高。
因此,为了使上述同一类图像特征的相似度尽可能高,不同类图像特征的相似度尽可能低,本实施例通过利用对比学习模块,基于最近邻来寻找外观最接近的图像特征,提高同一类图像特征的相似度。其中,对比学习模块具体用于在特征提取模块获取初始特征提取结果和增强特征提取结果后,通过最近邻特征挖掘,确定初始特征提取结果和增强特征提取结果中的外观相似特征,并在初始特征提取结果和增强特征提取结果中标记外观相似特征,提高初始特征提取结果和增强特征提取结果中外观相似特征的使用权重;其中,外观相似特征是指所述初始特征提取结果和增强特征提取结果中的相似外观特征。
本实施例采用邻近算法,对特征提取模块中的图像特征进行分类,使同一身份行人的图像特征距离越近,不同身份行人的图像特征距离越远,从而提高待进行行人重识别的图像特征与同一身份行人的图像特征的相似度,使得识别结果更准确,具有较高的鲁棒性。
由此可见,为了在无监督场景下进行领域自适应(领域自适应是指迁移模型到与训练集不同分布数据上时性能能够提升,而不是显著下降),本实施例通过领域自适应特征提取模型包含的循环对抗生成网络模块、特征提取模块和对比学习模块,能够准确提取图像特征,使提取的特征与同一类图像特征相似度尽可能较高,不同类图像特征相似度尽可能较低,而且本实施例中通过循环对抗生成网络模块,只需要通过转换单一的原始图像就可适用到新的场景中,不仅能保持原始图像,同时还能获取丰富的增强后的图像,从而在应用到新的场景中可以不依赖于原始图像,保证识别的准确度,实现领域自适应,具有较高的鲁棒性。
此外,在对领域自适应特征提取模型进行训练时,通过计算循环一致性损失、对抗生成损失来优化循环对抗生成网络模块,以及通过计算对比损失来优化特征提取模块,直至满足预设收敛条件,如当训练次数达到阈值,满足收敛条件,停止模型训练。本实施例通过优化训练循环对抗生成网络模块,可以使生成对应的存在视角差异和/或不同光照差异的特征增强图像与原始图像相似度尽可能高;通过优化训练特征提取模块,可以准确提取初始特征和增强特征。
步骤120、获取待进行行人重识别的图像,确定待进行行人重识别的图像特征。
在本步骤中,由于上述步骤110中通过领域自适应特征提取模型,获取了带有身份标识的行人图像初始特征和增强特征,因此,本实施例通过获取待进行行人重识别的图像,并确定待进行行人重识别的图像特征,如可以采用方向梯度直方图(HOG)确定待进行行人重识别的图像特征,即通过计算和统计图像局部区域的梯度方向直方图来提取图像特征。在本实施例中,需要说明的是,本实施例还可以采用灰度差分统计法确定待进行行人重识别的图像特征,还可以根据实际情况选取图像特征的提取方法,本实施例对此不作具体限定。
在本实施例中,确定待进行行人重识别的图像特征后,将待进行行人重识别的图像特征与带有身份标识的行人图像初始特征和增强特征进行比对,从而可以确定待进行重识别的行人是否为带有身份标识的行人。
在本实施例中,需要说明的是,本实施例可以采用方向梯度直方图、灰度差分统计法等确定待进行行人重识别的图像特征,本实施例对此不作具体限定。
步骤130、计算待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别。
在本步骤中,根据步骤120获取的待进行行人重识别的图像特征,以及步骤110获取的带有身份标识的行人图像的初始特征和增强特征,计算步骤120的图像特征与步骤110中获取的每个图像特征的相似度,并对相似度结果进行排序,与待进行行人重识别的图像特征相似度最高的初始特征或者增强特征对应的行人身份,即为待进行识别的行人身份。
举例来说,待进行行人重识别的图像特征A,与带有身份标识的行人图像的初始特征B1的相似度为100%,与增强特征B2的相似度为50%,与增强特征B3的相似度为0%,那么根据相似度从大到小进行排序对应的特征为B1>B2>B3,则初始特征B1对应图像中的行人身份即为待进行行人重识别图像中的行人身份。
本发明实施例提供的基于无监督学习的行人重识别领域自适应方法,通过将带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征,并计算待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别;其中,领域自适应特征提取模型为采用行人重识别样本图像训练得到的,包括用于生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像的循环对抗生成网络模块、用于提取样本图像初始特征和增强特征的特征提取模块,以及用于通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征的对比学习模块。本发明实施例基于循环生成对抗网络生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像,从而在面对新的场景时不需要重新训练网络,成本较低,并通过特征提取模块提取样本图像初始特征和增强特征,以及通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征,提高初始特征与增强特征的相似度,并根据图像特征计算对比损失优化特征提取模块参数,进而特征提取模块在不同场景中能够准确提取带有身份标识行人图像的初始特征和增强特征,并确定其与待进行行人重识别图像特征的相似度,使得可以应用于不同场景且准确得到识别结果,实现领域自适应,具有较高的鲁棒性。
基于上述实施例的内容,作为一种可选实施例,通过计算对比损失来优化特征提取模块,包括:
在对比学习模块确定初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在初始特征提取结果和所述增强特征提取结果中标记外观相似特征后,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数。
在本步骤中,由于提取特征模块是负责提取带有身份标识的行人图像的初始特征和增强特征,为了保证准确提取特征,需要对特征提取模块的参数进行优化,本实施例通过在对比学习模块确定初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在初始特征提取结果和所述增强特征提取结果中标记外观相似特征后,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数,从而使特征提取模块能够准确提取初始特征和增强特征。
本发明实施例提供的基于无监督学习的行人重识别领域自适应方法,通过,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数,使特征提取模块准确提取初始特征和增强特征,提高行人重识别结果的准确性。
基于上述实施例的内容,作为一种可选实施例,若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则将待进行行人重识别的图像特征添加至特征提取模块。
在本步骤中,特征提取模块中存储有大量带有身份标识的行人图像特征,但由于存储的图像特征无法穷举所有光照和/或视角条件下的图像特征,因此,为了使识别的准确度更高,需要对模块中的图像特征进行动量更新,从而抑制噪声的影响。
如图2所示,若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则认为待进行行人重识别的图像已经具有身份标签,可以与其同类身份的图像一起作为后续识别的对比对象,从而将待进行行人重识别的图像特征添加至特征提取模块缓存中,保证缓存中的图像特征动量更新。
本发明实施例提供的基于无监督学习的行人重识别领域自适应方法,若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则将待进行行人重识别的图像特征添加至特征提取模块,从而对特征提取模块缓存中的图像特征动量更新,作为后续识别的对比对象,提高行人重识别结果的准确度。
基于上述实施例的内容,作为一种可选实施例,循环对抗生成网络模块用于对样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像,包括:
获取真摄像头下的样本图像和假摄像头下的样本图像;
第一生成器将真摄像头下的样本图像转化为假摄像头下的样本图像,第二生成器将假摄像头下的样本图像转化为真摄像头下的样本图像,第一判别器识别输入图像是否为真摄像头下的样本图像,第二判别器识别输入图像是否为假摄像头下的样本图像;
其中,真摄像头下的样本图像和假摄像头下的样本图像是存在视角差异和/或光照差异的样本图像;
相应地,通过计算循环一致性损失、对抗生成损失来优化循环对抗生成网络模块,包括:
根据循环一致性损失以及对抗生成损失,优化循环生成对抗网络模块参数。
在本步骤中,由于不同摄像头角度参数的影响,使得行人图像的风格差异明显。因此本实施例采用循环对抗生成网络可以实现端到端的行人图像在不同摄像头视角下的风格转换。循环对抗生成网络为了能不依赖一一对应的图像,需要匹配的图像来学习图像转换引入了循环操作。因此,本实施例采用真摄像头下的样本图像与假摄像头下的样本图像训练循环生成对抗网络,从而可以对不同身份行人的样本图像进行数据增强,得到不同身份行人不同视角和/或不同光照下的图像。其中,真摄像头下的样本图像可以理解为摄像头在光照条件A和视角A下拍摄得到的行人图像,假摄像头下的样本图像可以理解为与真摄像头下的样本图像存在视角差异和/或光照差异,如假摄像头下的样本图像可以理解为在光照条件A和视角B下拍摄得到的行人图像,也可以理解为在光照条件B和视角A下拍摄得到的行人图像,还可以理解为光照条件B和视角B下拍摄得到的行人图像。
简单来说,就是用真图像A生成假图像B,后将假图像B映射回A,产生一个假图像A,并判断这假图像A是否同真图像A近似,用这样的方式来确保模型真正能学习到一对一的映射而不是一对多。
本实施例中,在模型中定义第一生成器G和第二生成器F,分别表示从输入域x(真摄像头下的样本图像)到目标域y(假摄像头下的样本图像)的变换和逆变换,并且使用第一判别器Dx和第二判别器Dy来分辨判断F和G的效果。然后,根据循环一致性损失以及对抗生成损失,使循环一致性损失以及对抗生成损失最小化,优化训练循环生成对抗网络,直至循环生成对抗网络训练次数达到阈值,网络收敛,停止训练。其中循环一致性损失以及对抗生成损失,计算公式如下:
其中,表示对抗生成网络损失,Dy(y)表示判别器y对y输出,Dy(G(x))表示判别器y对生成x的输出,表示循环一致性损失,F(G(x))表示判别器F对生成x的输出,G(F(y))表示生成器对输入y的生成图像,x表示源域输入,y表示目标域输入,表示总损失。
本发明实施例提供的基于无监督学习的行人重识别领域自适应方法,基于真摄像头下的样本图像和假摄像头下的样本图像进行训练循环生成对抗网络模块,从而得到不同光照和/或视角下的增强图像,能够适用到不同场景中进行行人重识别,大幅度降低了成本,提高了效率。
基于上述实施例的内容,作为一种可选实施例,对比损失函数为:
其中,LS表示对比损失,f(x)表示中心特征,f(x+)表示正例特征,f(x-)表示负例特征。
在本步骤中,根据对比损失函数计算对比损失,可以优化提取特征模块参数,从而使提取特征模块可以准确提取初始特征和增强特征。例如,对比损失越大,证明提取特征模块的效果越好,提取的初始特征和增强特征越准确。
本发明实施例提供的基于无监督学习的行人重识别领域自适应方法,基于对比损失函数计算对比损失,从而能够优化提取特征模块参数,准确提取初始特征和增强特征,提高行人重识别结果的准确性。
图3是本发明第二个实施例提供的基于无监督学习的行人重识别领域自适应装置的结构示意图,如图3所示,本发明第二个实施例提供的基于无监督学习的行人重识别领域自适应装置,包括:
第一获取单元310,用于获取带有身份标识的行人图像,将带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;
第二获取单元320,用于获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;
识别单元330,用于计算待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别;
其中,领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块,领域自适应特征提取模型为采用行人重识别样本图像训练得到的;
其中,循环对抗生成网络模块用于对样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像;特征提取模块,用于对样本图像进行特征提取,获取初始特征提取结果,以及,用于对特征增强图像进行特征提取,获得增强特征提取结果;对比学习模块,用于在特征提取模块获取初始特征提取结果和增强特征提取结果后,通过最近邻特征挖掘,确定初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在初始特征提取结果和所述增强特征提取结果中标记外观相似特征,提高初始特征提取结果和增强特征提取结果中外观相似特征的使用权重;其中,外观相似特征是指初始特征提取结果和增强特征提取结果中的相似外观特征;
其中,在对领域自适应特征提取模型进行训练时,通过计算循环一致性损失、对抗生成损失来优化循环对抗生成网络模块,以及通过计算对比损失来优化特征提取模块,直至满足预设收敛条件。
本实施例所述的基于无监督学习的行人重识别领域自适应装置可以用于执行上述第一个实施例所述的基于无监督学习的行人重识别领域自适应方法,其原理和技术效果类似,此处不再详述。
基于上述实施例的内容,作为一种可选实施例,通过计算对比损失来优化特征提取模块,包括:
在对比学习模块确定初始特征提取结果和增强特征提取结果中的外观相似特征,并在初始特征提取结果和增强特征提取结果中标记外观相似特征后,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数。
本实施例所述的基于无监督学习的行人重识别领域自适应装置可以用于执行上述第一个实施例所述的基于无监督学习的行人重识别领域自适应方法,其原理和技术效果类似,此处不再详述。
基于上述实施例的内容,作为一种可选实施例,若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则将待进行行人重识别的图像特征添加至特征提取模块。
本实施例所述的基于无监督学习的行人重识别领域自适应装置可以用于执行上述第一个实施例所述的基于无监督学习的行人重识别领域自适应方法,其原理和技术效果类似,此处不再详述。
图4是本发明第三个实施例提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行基于无监督学习的行人重识别领域自适应方法,该方法包括:获取带有身份标识的行人图像,将带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;计算待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的基于无监督学习的行人重识别领域自适应方法,该方法包括:获取带有身份标识的行人图像,将带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;计算待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的基于无监督学习的行人重识别领域自适应方法,该方法包括:获取带有身份标识的行人图像,将带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;计算待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于无监督学习的行人重识别领域自适应方法,其特征在于,包括:
获取带有身份标识的行人图像,将所述带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;
获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;
计算所述待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别;
其中,所述领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块,所述领域自适应特征提取模型为采用行人重识别样本图像训练得到的;
其中,所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像;所述特征提取模块,用于对所述样本图像进行特征提取,获取初始特征提取结果,以及,用于对所述特征增强图像进行特征提取,获得增强特征提取结果;所述对比学习模块,用于在特征提取模块获取初始特征提取结果和增强特征提取结果后,通过最近邻特征挖掘,确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征,提高所述初始特征提取结果和所述增强特征提取结果中外观相似特征的使用权重;其中,所述外观相似特征是指所述初始特征提取结果和所述增强特征提取结果中的相似外观特征;
其中,在对所述领域自适应特征提取模型进行训练时,通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块,以及通过计算对比损失来优化所述特征提取模块,直至满足预设收敛条件。
2.根据权利要求1所述的基于无监督学习的行人重识别领域自适应方法,其特征在于,所述通过计算对比损失来优化所述特征提取模块,包括:
在对比学习模块确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征后,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数。
3.根据权利要求1所述的基于无监督学习的行人重识别领域自适应方法,其特征在于,还包括:
若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则将待进行行人重识别的图像特征添加至特征提取模块。
4.根据权利要求1所述的基于无监督学习的行人重识别领域自适应方法,其特征在于,所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像,包括:
获取真摄像头下的样本图像和假摄像头下的样本图像;
第一生成器将真摄像头下的样本图像转化为假摄像头下的样本图像,第二生成器将假摄像头下的样本图像转化为真摄像头下的样本图像,第一判别器识别输入图像是否为真摄像头下的样本图像,第二判别器识别输入图像是否为假摄像头下的样本图像;
其中,所述真摄像头下的样本图像和假摄像头下的样本图像是存在视角差异和/或光照差异的样本图像;
相应地,所述通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块,包括:
根据循环一致性损失以及对抗生成损失,优化循环生成对抗网络模块参数。
6.一种基于无监督学习的行人重识别领域自适应装置,其特征在于,包括:
第一获取单元,用于获取带有身份标识的行人图像,将所述带有身份标识的行人图像输入领域自适应特征提取模型中,确定带有身份标识的行人图像的初始特征和增强特征;
第二获取单元,用于获取待进行行人重识别的图像,确定待进行行人重识别的图像特征;
识别单元,用于计算所述待进行行人重识别的图像特征,与带有身份标识的行人图像的初始特征和增强特征的相似度,进行行人重识别;
其中,所述领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块,所述领域自适应特征提取模型为采用行人重识别样本图像训练得到的;
其中,所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换,生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像;所述特征提取模块,用于对所述样本图像进行特征提取,获取初始特征提取结果,以及,用于对所述特征增强图像进行特征提取,获得增强特征提取结果;所述对比学习模块,用于在特征提取模块获取初始特征提取结果和增强特征提取结果后,通过最近邻特征挖掘,确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征,提高所述初始特征提取结果和所述增强特征提取结果中外观相似特征的使用权重;其中,所述外观相似特征是指所述初始特征提取结果和所述增强特征提取结果中的相似外观特征;
其中,在对所述领域自适应特征提取模型进行训练时,通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块,以及通过计算对比损失来优化所述特征提取模块,直至满足预设收敛条件。
7.根据权利要求6所述的基于无监督学习的行人重识别领域自适应装置,其特征在于,所述通过计算对比损失来优化所述特征提取模块,包括:
在对比学习模块确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征,并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征后,将特征提取模块中的图像特征输入对比损失函数,计算对比损失,并根据对比损失优化特征提取模块参数。
8.根据权利要求6所述的基于无监督学习的行人重识别领域自适应装置,其特征在于,还包括:
若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人,则将待进行行人重识别的图像特征添加至特征提取模块。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述基于无监督学习的行人重识别领域自适应方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一项所述基于无监督学习的行人重识别领域自适应方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010777248.4A CN112016402B (zh) | 2020-08-04 | 2020-08-04 | 基于无监督学习的行人重识别领域自适应方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010777248.4A CN112016402B (zh) | 2020-08-04 | 2020-08-04 | 基于无监督学习的行人重识别领域自适应方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112016402A true CN112016402A (zh) | 2020-12-01 |
CN112016402B CN112016402B (zh) | 2024-05-17 |
Family
ID=73499109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010777248.4A Active CN112016402B (zh) | 2020-08-04 | 2020-08-04 | 基于无监督学习的行人重识别领域自适应方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112016402B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488035A (zh) * | 2020-12-14 | 2021-03-12 | 南京信息工程大学 | 一种基于对抗神经网络的跨域行人重识别方法 |
CN112883774A (zh) * | 2020-12-31 | 2021-06-01 | 厦门易仕特仪器有限公司 | 行人重识别数据增强方法、装置、设备及可读存储介质 |
CN113627352A (zh) * | 2021-08-12 | 2021-11-09 | 塔里木大学 | 一种行人重识别方法和系统 |
CN114494789A (zh) * | 2022-04-02 | 2022-05-13 | 中国科学技术大学 | 图像风格迁移模型的训练方法、系统、设备及存储介质 |
CN114694171A (zh) * | 2022-02-22 | 2022-07-01 | 电子科技大学 | 一种基于自监督模式特征增强的行人属性识别方法 |
CN115905913A (zh) * | 2022-10-14 | 2023-04-04 | 支付宝(杭州)信息技术有限公司 | 数字藏品的检测方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084108A (zh) * | 2019-03-19 | 2019-08-02 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) | 基于gan神经网络的行人重识别系统及方法 |
CN110414462A (zh) * | 2019-08-02 | 2019-11-05 | 中科人工智能创新技术研究院(青岛)有限公司 | 一种无监督的跨域行人重识别方法及系统 |
CN110796057A (zh) * | 2019-10-22 | 2020-02-14 | 上海交通大学 | 行人重识别方法、装置及计算机设备 |
CN110942025A (zh) * | 2019-11-26 | 2020-03-31 | 河海大学 | 一种基于聚类的无监督跨域行人重识别方法 |
CN111126250A (zh) * | 2019-12-20 | 2020-05-08 | 长沙千视通智能科技有限公司 | 一种基于ptgan的行人重识别方法及装置 |
CN111259812A (zh) * | 2020-01-17 | 2020-06-09 | 上海交通大学 | 基于迁移学习的内河船舶重识别方法、设备及存储介质 |
US20200226421A1 (en) * | 2019-01-15 | 2020-07-16 | Naver Corporation | Training and using a convolutional neural network for person re-identification |
-
2020
- 2020-08-04 CN CN202010777248.4A patent/CN112016402B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200226421A1 (en) * | 2019-01-15 | 2020-07-16 | Naver Corporation | Training and using a convolutional neural network for person re-identification |
CN110084108A (zh) * | 2019-03-19 | 2019-08-02 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) | 基于gan神经网络的行人重识别系统及方法 |
CN110414462A (zh) * | 2019-08-02 | 2019-11-05 | 中科人工智能创新技术研究院(青岛)有限公司 | 一种无监督的跨域行人重识别方法及系统 |
CN110796057A (zh) * | 2019-10-22 | 2020-02-14 | 上海交通大学 | 行人重识别方法、装置及计算机设备 |
CN110942025A (zh) * | 2019-11-26 | 2020-03-31 | 河海大学 | 一种基于聚类的无监督跨域行人重识别方法 |
CN111126250A (zh) * | 2019-12-20 | 2020-05-08 | 长沙千视通智能科技有限公司 | 一种基于ptgan的行人重识别方法及装置 |
CN111259812A (zh) * | 2020-01-17 | 2020-06-09 | 上海交通大学 | 基于迁移学习的内河船舶重识别方法、设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
JUN-YAN ZHU等: "Unpaired image-to-image translation using cycle-consistent adversarial networks", 《PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
SUNCHENG XIANG等: "Unsupervised Domain Adaptation Through Synthesis For Person Re-Identification", 《2020 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO (ICME)》 * |
肖小霞: "行人重识别中数据增强技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488035A (zh) * | 2020-12-14 | 2021-03-12 | 南京信息工程大学 | 一种基于对抗神经网络的跨域行人重识别方法 |
CN112488035B (zh) * | 2020-12-14 | 2024-04-26 | 南京信息工程大学 | 一种基于对抗神经网络的跨域行人重识别方法 |
CN112883774A (zh) * | 2020-12-31 | 2021-06-01 | 厦门易仕特仪器有限公司 | 行人重识别数据增强方法、装置、设备及可读存储介质 |
CN113627352A (zh) * | 2021-08-12 | 2021-11-09 | 塔里木大学 | 一种行人重识别方法和系统 |
CN114694171A (zh) * | 2022-02-22 | 2022-07-01 | 电子科技大学 | 一种基于自监督模式特征增强的行人属性识别方法 |
CN114694171B (zh) * | 2022-02-22 | 2023-10-10 | 电子科技大学 | 一种基于自监督模式特征增强的行人属性识别方法 |
CN114494789A (zh) * | 2022-04-02 | 2022-05-13 | 中国科学技术大学 | 图像风格迁移模型的训练方法、系统、设备及存储介质 |
CN114494789B (zh) * | 2022-04-02 | 2022-07-15 | 中国科学技术大学 | 图像风格迁移模型的训练方法、系统、设备及存储介质 |
CN115905913A (zh) * | 2022-10-14 | 2023-04-04 | 支付宝(杭州)信息技术有限公司 | 数字藏品的检测方法及装置 |
CN115905913B (zh) * | 2022-10-14 | 2024-03-12 | 支付宝(杭州)信息技术有限公司 | 数字藏品的检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112016402B (zh) | 2024-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112016402B (zh) | 基于无监督学习的行人重识别领域自适应方法及装置 | |
Atoum et al. | Face anti-spoofing using patch and depth-based CNNs | |
Neumann et al. | Efficient scene text localization and recognition with local character refinement | |
CN112016401B (zh) | 基于跨模态行人重识别方法及装置 | |
Duan et al. | Detecting small objects using a channel-aware deconvolutional network | |
Bedagkar-Gala et al. | Multiple person re-identification using part based spatio-temporal color appearance model | |
Lee et al. | Place recognition using straight lines for vision-based SLAM | |
CN103605972A (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
Lei et al. | Person re-identification by semantic region representation and topology constraint | |
CN106127222B (zh) | 一种基于视觉的字符串相似度计算方法及相似性判断方法 | |
WO2021243947A1 (zh) | 对象再识别方法及装置、终端和存储介质 | |
CN105654054A (zh) | 基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法 | |
CN107330363B (zh) | 一种快速的互联网广告牌检测方法 | |
Direkoglu et al. | Player detection in field sports | |
Chen et al. | Pose-guided spatial alignment and key frame selection for one-shot video-based person re-identification | |
CN114092873A (zh) | 一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统 | |
Lin et al. | Region-based context enhanced network for robust multiple face alignment | |
Iqbal et al. | Bayesian network scores based text localization in scene images | |
Kejun et al. | Automatic nipple detection using cascaded adaboost classifier | |
CN111104857A (zh) | 一种基于步态能量图的身份识别方法及系统 | |
Qu et al. | Long-term reliable visual tracking with UAVs | |
Wang et al. | Deep features for person re-identification | |
Rojas Quiñones et al. | Automatic detection of facial feature points via HOGs and geometric prior models | |
CN115019365B (zh) | 一种基于模型适用性度量的分级人脸识别方法 | |
Wang et al. | Skin color and feature-based face detection in complicated backgrounds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |