CN112016402A

CN112016402A - 基于无监督学习的行人重识别领域自适应方法及装置

Info

Publication number: CN112016402A
Application number: CN202010777248.4A
Authority: CN
Inventors: 王金鹏; 王金桥; 胡建国; 唐明; 林格; 招继恩; 朱贵波
Original assignee: Nexwise Intelligence China Ltd
Current assignee: Nexwise Intelligence China Ltd
Priority date: 2020-08-04
Filing date: 2020-08-04
Publication date: 2020-12-01
Anticipated expiration: 2040-08-04
Also published as: CN112016402B

Abstract

本发明实施例提供一种基于无监督学习的行人重识别领域自适应方法及装置，所述方法包括：通过将带有身份标识的行人图像输入领域自适应特征提取模型，确定其初始特征和增强特征，并计算待进行行人重识别的图像特征与初始特征和增强特征的相似度，进行行人重识别；其中，领域自适应特征提取模型包括用于生成存在视角差异和/或不同光照差异的特征增强图像的循环对抗生成网络模块、提取图像初始特征和增强特征的特征提取模块，以及确定初始特征和增强特征的外观相似特征的对比学习模块。本发明实施例在面对新场景时不需要重新训练网络，成本较低，且能够准确提取带有身份标识行人图像的初始特征和增强特征得到识别结果，具有较高的鲁棒性。

Description

基于无监督学习的行人重识别领域自适应方法及装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于无监督学习的行人重识别领域自适应方法及装置。

背景技术

行人重识别作为智能安防监控中非常重要的子系统，其任务主要是在行人图像数据库中检索给定行人的其他图像，任务难点在于跨摄像头视角、姿态、尺度变化等因素的影响。同时当前行人重识别极度依赖于训练数据集，基于深度学习的方法往往会在训练数据集上学习到当前数据集摄像机的参数分布，因此，当网络迁移到新的场景下时会存在显著的性能下降。而对新的场景重现标注再训练的成本非常高，因此利用跨场景的无标签数据对网络进行领域自适应提高性能是一种非常有效的做法。领域自适应是指迁移模型到与训练集不同分布数据上时性能能够提升，而不是显著下降。

现有技术方案采用无监督图像表示学习中对比学习，通过数据增强的方式使得网络能够从无监督的样本中学习图像有用的表示迁移到下游的学习任务并使得下游学习任务性能提升。基于大规模的无标签数据，每一个图像样本都被当作单独的类别，网络的任务就是面对不同数据增强过后的样本输出相似的特征输出。

然而，无监督图像表示学习中对比学习主要利用的是大规模的无标签图像，并不关注图像的类别概念。在行人重识别中，图像的特征需要学习到摄像机视角不变性、姿态不变性以及尺度不变性。所以使用现有的数据增强方法会损害行人的特征描述从而不能直接使用到当前任务中，而且对比学习不能够利用行人的身份信息进行进一步学习鲁棒的行人特征。

发明内容

针对现有技术存在的问题，本发明实施例提供一种基于无监督学习的行人重识别领域自适应方法及装置。

具体地，本发明实施例提供了如下技术方案：

第一方面，本发明实施例提供一种基于无监督学习的行人重识别领域自适应方法，包括：

获取带有身份标识的行人图像，将所述带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征；

获取待进行行人重识别的图像，确定待进行行人重识别的图像特征；

计算所述待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别；

其中，所述领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块，所述领域自适应特征提取模型为采用行人重识别样本图像训练得到的；

其中，所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换，生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像；所述特征提取模块，用于对所述样本图像进行特征提取，获取初始特征提取结果，以及，用于对所述特征增强图像进行特征提取，获得增强特征提取结果；所述对比学习模块，用于在特征提取模块获取初始特征提取结果和增强特征提取结果后，通过最近邻特征挖掘，确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征，并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征，提高所述初始特征提取结果和所述增强特征提取结果中外观相似特征的使用权重；其中，所述外观相似特征是指所述初始特征提取结果和所述增强特征提取结果中的相似外观特征；

其中，在对所述领域自适应特征提取模型进行训练时，通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块，以及通过计算对比损失来优化所述特征提取模块，直至满足预设收敛条件。

进一步地，所述通过计算对比损失来优化所述特征提取模块，包括：

在对比学习模块确定所述初始特征提取结果和所述增强特征提取结果中的外观相似特征，并在所述初始特征提取结果和所述增强特征提取结果中标记所述外观相似特征后，将特征提取模块中的图像特征输入对比损失函数，计算对比损失，并根据对比损失优化特征提取模块参数。

进一步地，若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人，则将待进行行人重识别的图像特征添加至特征提取模块。

进一步地，所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换，生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像，包括：

获取真摄像头下的样本图像和假摄像头下的样本图像；

第一生成器将真摄像头下的样本图像转化为假摄像头下的样本图像，第二生成器将假摄像头下的样本图像转化为真摄像头下的样本图像，第一判别器识别输入图像是否为真摄像头下的样本图像，第二判别器识别输入图像是否为假摄像头下的样本图像；

其中，所述真摄像头下的样本图像和假摄像头下的样本图像是存在视角差异和/或光照差异的样本图像；

相应地，所述通过计算循环一致性损失、对抗生成损失来优化所述循环对抗生成网络模块，包括：

根据循环一致性损失以及对抗生成损失，优化循环生成对抗网络模块参数。

进一步地，所述对比损失函数为：

其中，L_S表示对比损失，f(x)表示中心特征，f(x⁺)表示正例特征，f(x^-)表示负例特征。

第二方面，本发明实施例提供一种基于无监督学习的行人重识别领域自适应装置，包括：

第一获取单元，用于获取带有身份标识的行人图像，将所述带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征；

第二获取单元，用于获取待进行行人重识别的图像，确定待进行行人重识别的图像特征；

识别单元，用于计算所述待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别；

进一步地，还包括：若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人，则将待进行行人重识别的图像特征添加至特征提取模块。

第三方面，本发明实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所述基于无监督学习的行人重识别领域自适应方法的步骤。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面所述基于无监督学习的行人重识别领域自适应方法的步骤。

本发明实施例提供的基于无监督学习的行人重识别领域自适应方法及装置，通过将带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征，并计算待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别；其中，领域自适应特征提取模型为采用行人重识别样本图像训练得到的，包括用于生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像的循环对抗生成网络模块、用于提取样本图像初始特征和增强特征的特征提取模块，以及用于通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征的对比学习模块。本发明实施例基于循环生成对抗网络生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像，从而在面对新的场景时不需要重新训练网络，成本较低，并通过特征提取模块提取样本图像初始特征和增强特征，以及通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征，提高初始特征与增强特征的相似度，并根据图像特征计算对比损失优化特征提取模块参数，进而特征提取模块在不同场景中能够准确提取带有身份标识行人图像的初始特征和增强特征，并确定其与待进行行人重识别图像特征的相似度，使得可以应用于不同场景且准确得到识别结果，实现领域自适应，具有较高的鲁棒性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一个实施例提供的基于无监督学习的行人重识别领域自适应方法的流程示意图；

图2是本发明第一个实施例提供的网络训练流程示意图；

图3是本发明第二个实施例提供的基于无监督学习的行人重识别领域自适应装置的结构示意图；

图4是本发明第三个实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

行人重识别本质上是图像检索任务，现有技术中基于深度学习的行人重识别网络模型极度依赖于原有训练数据集，而行人图像的差异主要包括跨视角差异、外观差异以及光照差异，这些差异会导致原有的行人重识别网络模型迁移到新的场景下时无法适应新的场景，从而使模型性能显著下降。为了在无监督场景下进行领域自适应，本发明实施例使用循环对抗生成网络来生成跨视角差异、光照差异的行人图像，以及基于邻近算法挖掘外观最接近的图像来解决特征对外观差异的建模，提高同一行人初始特征与增强特征的相似度，从而在面对新的场景时不需要重新训练网络，不仅成本较低，而且能够使用于不同场景中且获取准确的识别结果，实现领域自适应，具有较高的鲁棒性。

图1是本发明第一个实施例提供的基于无监督学习的行人重识别领域自适应方法的流程示意图，如图1所示，本发明第一个实施例提供的基于无监督学习的行人重识别领域自适应方法，包括如下步骤：

步骤110、获取带有身份标识的行人图像，将带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征。

其中，领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块，领域自适应特征提取模型为采用行人重识别样本图像训练得到的。

在本步骤中，行人重识别也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。例如通过给定摄像头A下一个带有身份标识的监控行人图像，检索跨设备下如摄像头B是否存在该行人图像。通过行人重识别可以弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。例如摄像头A在路口拍摄的行人图像，当该行人走进路口拐角巷子时，由于摄像头A是固定的，从而当该行人进入巷子时无法拍摄到该行人，因此需要借助巷子中的摄像头B来搜索该行人图像。

因此，为了从上述摄像头B拍摄的行人图像中搜索是否存在摄像头A拍摄的行人图像，传统方法中采用摄像头A拍摄的图像作为训练集，基于深度学习的方法进行行人重识别模型的训练，但传统方法极度依赖于训练数据集，也就是只能识别出训练集中摄像头A拍摄的图像特征(比如在摄像头A的视角或者光照下拍摄图像的特征)，一旦转换到新的应用场景(比如摄像头B拍摄的图像跨视角或者光照不同)，由于传统方法是基于摄像头A拍摄的图像进行训练的，则会判断同一行人的图像特征不同(摄像头A与摄像头B拍摄的同一行人图像特征不同)，从而认为摄像头B拍摄的图像中不存在摄像头A拍摄的行人图像，造成误判。

由此可见，传统方法中基于深度学习的方法进行行人重识别模型，通过摄像头B来搜索该行人图像，但是由于摄像头拍摄的行人图像会存在跨视角差异、光照差异以及外观差异，会导致摄像头B拍摄的行人图像特征与摄像头A拍摄的同一行人图像特征不同，从而导致无法从摄像头B拍摄的行人图像中准确识别是否存在摄像头A中拍摄的行人图像，因此，传统方法会因为场景的改变而影响其识别结果的准确度，存在显著的性能下降。

举例来说，同一行人站在同一地点，此时光照条件相同，但是由于摄像头A安装于5m高处，而摄像头B安装于4m高处，此时摄像头A和摄像头B拍摄角度不同，拍摄得到的同一行人图像的视角会存在差异，从而导致摄像头A与摄像头B拍摄的行人图像中的形状特征不同；又如，摄像头A在上午9点拍摄的同一行人，与其在晚上8点拍摄的同一行人，由于光照条件不同，拍摄得到的同一行人图像的光照会存在差异，从而导致摄像头A与摄像头B拍摄的行人图像中的颜色特征不同。

为了解决上述由于行人图像存在跨视角差异和/或光照差异导致无法在摄像头B拍摄的行人图像中准确识别是否存在摄像头A中拍摄的行人图像的技术问题，本实施例采用领域自适应特征提取模型中的循环对抗生成网络模块，来生成跨视角差异和/或光照差异的行人图像，从而不像传统方法中只能提取行人图像在固定视角和/或光照下的特征，本实施例通过循环对抗生成网络模块生成不同视角和/或光照下的图像特征，丰富增强了后续特征提取模块中的图像特征，从而能够准确识别待进行识别的行人是否与带有身份标识的行人图像中的行人为同一身份。

其中，循环对抗生成网络模块用于对样本图像进行不同视角差异和/或不同光照差异的图像转换，生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像。

举例来说，对于摄像头A拍摄的行人图像，本实施例通过将摄像头A拍摄的行人图像输入已经训练好的循环对抗生成网络模块，则可以生成多个存在跨视角差异和/或光照差异的同一行人图像，后续特征提取模块可以提取多个该行人图像跨视角差异和/或光照差异的图像，以供进行图像中行人身份的识别，而不是仅依赖于摄像头A拍摄条件下的视角和光照图像。

在本实施例中，采用循环对抗生成网络模块生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像，可以通过对抗训练，令原始噪声的分布逼近真实图片的分布。然而传统方法中通过数据增强的方式学习图像，关注的是最明显的特征，而不关注图像本身的类别。例如，行人A侧面站立的图像，行人B背面站立的图像，若待识别行人身份图像是行人A背面站立的图像，则传统方法的数据增强方式会认为待识别行人身份图像中是行人B，而不是行人A，明显判断失误。因为传统方法的数据增强方式关注的是最明显的特征，即侧面站立和背面站立，从而损害了行人A的特征描述。由此可见，本实施例采用的循环对抗生成网络模块能够使生成的增强图像更接近原始图像的特征描述，而且为后续判断待识别身份行人的图像提供了大量的比对样本，减小误差，提高识别结果的准确率。

因此，在本实施例中，通过获取带有身份标识的行人图像，将带有身份标识的行人图像输入领域自适应特征提取模型中，利用循环对抗生成网络模块生成与带有身份标识的行人图像对应的存在视角差异和/或不同光照差异的特征增强图像，从而获取的图像包括原始图像(带有身份标识的行人图像)以及与原始图像对应的增强图像，通过提取特征模块提取原始图像的特征(初始特征)以及增强图像的特征(增强特征)。

其中，特征提取模块，用于对样本图像进行特征提取，获取初始特征提取结果，以及，用于对特征增强图像进行特征提取，获得增强特征提取结果。图2是本发明第一个实施例提供的网络训练流程示意图，如图2所示，本实施例将提取得到的初始特征和增强特征存储到特征提取模块中的缓存模块，将其作为进行行人重识别的图像数据库，当待进行行人重识别的图像需要进行识别时，就将待进行行人重识别的图像特征与缓存模块中存储的特征进行比对，从而确定图像中的行人身份。

可以理解的是，获取的带有身份标识的行人图像可以是一张，也可以是多张同一行人的图像。举例来说，若要搜索在摄像头A下拍摄到的行人A的图像，则可以将摄像头A拍摄的行人A图像输入领域自适应特征提取模型中，若摄像头B也同时拍摄到了行人A的图像，则也可以将摄像头B下拍摄的行人A的图像也同时输入领域自适应特征提取模型中，从而可以生成多个行人A图像的原始图像特征(初始特征)以及增强图像特征(增强特征)，构成一个对比数据库，用来逐一与待进行行人重识别的图像进行对比，从而确定行人重识别的结果。

进一步地，图2中缓存模块存储的每一个行人图像的初始特征和增强特征，由于都是属于同一身份行人的图像特征，因此可以将其看作同一类；同理，不同行人图像的初始特征和增强特征则将其看作不同类别。然而，由于外观差异会导致同一类特征相似度较低，不同类特征相似度反而较高。例如，行人A的正面图像经增强后，会得到变换角度的行人A的侧面增强图像，两张图像由于站位角度(正面和侧面)不同，会导致外观差异，从而行人A的正面图像特征和行人A的侧面增强图像特征相似度较低。同理，行人A与行人B的衣着相同，那么行人A的背面图像特征与行人B的背面图像特征相似度就会较高。

因此，为了使上述同一类图像特征的相似度尽可能高，不同类图像特征的相似度尽可能低，本实施例通过利用对比学习模块，基于最近邻来寻找外观最接近的图像特征，提高同一类图像特征的相似度。其中，对比学习模块具体用于在特征提取模块获取初始特征提取结果和增强特征提取结果后，通过最近邻特征挖掘，确定初始特征提取结果和增强特征提取结果中的外观相似特征，并在初始特征提取结果和增强特征提取结果中标记外观相似特征，提高初始特征提取结果和增强特征提取结果中外观相似特征的使用权重；其中，外观相似特征是指所述初始特征提取结果和增强特征提取结果中的相似外观特征。

本实施例采用邻近算法，对特征提取模块中的图像特征进行分类，使同一身份行人的图像特征距离越近，不同身份行人的图像特征距离越远，从而提高待进行行人重识别的图像特征与同一身份行人的图像特征的相似度，使得识别结果更准确，具有较高的鲁棒性。

由此可见，为了在无监督场景下进行领域自适应(领域自适应是指迁移模型到与训练集不同分布数据上时性能能够提升，而不是显著下降)，本实施例通过领域自适应特征提取模型包含的循环对抗生成网络模块、特征提取模块和对比学习模块，能够准确提取图像特征，使提取的特征与同一类图像特征相似度尽可能较高，不同类图像特征相似度尽可能较低，而且本实施例中通过循环对抗生成网络模块，只需要通过转换单一的原始图像就可适用到新的场景中，不仅能保持原始图像，同时还能获取丰富的增强后的图像，从而在应用到新的场景中可以不依赖于原始图像，保证识别的准确度，实现领域自适应，具有较高的鲁棒性。

此外，在对领域自适应特征提取模型进行训练时，通过计算循环一致性损失、对抗生成损失来优化循环对抗生成网络模块，以及通过计算对比损失来优化特征提取模块，直至满足预设收敛条件，如当训练次数达到阈值，满足收敛条件，停止模型训练。本实施例通过优化训练循环对抗生成网络模块，可以使生成对应的存在视角差异和/或不同光照差异的特征增强图像与原始图像相似度尽可能高；通过优化训练特征提取模块，可以准确提取初始特征和增强特征。

步骤120、获取待进行行人重识别的图像，确定待进行行人重识别的图像特征。

在本步骤中，由于上述步骤110中通过领域自适应特征提取模型，获取了带有身份标识的行人图像初始特征和增强特征，因此，本实施例通过获取待进行行人重识别的图像，并确定待进行行人重识别的图像特征，如可以采用方向梯度直方图(HOG)确定待进行行人重识别的图像特征，即通过计算和统计图像局部区域的梯度方向直方图来提取图像特征。在本实施例中，需要说明的是，本实施例还可以采用灰度差分统计法确定待进行行人重识别的图像特征，还可以根据实际情况选取图像特征的提取方法，本实施例对此不作具体限定。

在本实施例中，确定待进行行人重识别的图像特征后，将待进行行人重识别的图像特征与带有身份标识的行人图像初始特征和增强特征进行比对，从而可以确定待进行重识别的行人是否为带有身份标识的行人。

在本实施例中，需要说明的是，本实施例可以采用方向梯度直方图、灰度差分统计法等确定待进行行人重识别的图像特征，本实施例对此不作具体限定。

步骤130、计算待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别。

在本步骤中，根据步骤120获取的待进行行人重识别的图像特征，以及步骤110获取的带有身份标识的行人图像的初始特征和增强特征，计算步骤120的图像特征与步骤110中获取的每个图像特征的相似度，并对相似度结果进行排序，与待进行行人重识别的图像特征相似度最高的初始特征或者增强特征对应的行人身份，即为待进行识别的行人身份。

举例来说，待进行行人重识别的图像特征A，与带有身份标识的行人图像的初始特征B1的相似度为100％，与增强特征B2的相似度为50％，与增强特征B3的相似度为0％，那么根据相似度从大到小进行排序对应的特征为B1>B2>B3，则初始特征B1对应图像中的行人身份即为待进行行人重识别图像中的行人身份。

本发明实施例提供的基于无监督学习的行人重识别领域自适应方法，通过将带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征，并计算待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别；其中，领域自适应特征提取模型为采用行人重识别样本图像训练得到的，包括用于生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像的循环对抗生成网络模块、用于提取样本图像初始特征和增强特征的特征提取模块，以及用于通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征的对比学习模块。本发明实施例基于循环生成对抗网络生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像，从而在面对新的场景时不需要重新训练网络，成本较低，并通过特征提取模块提取样本图像初始特征和增强特征，以及通过最近邻特征挖掘确定初始特征和增强特征的外观相似特征，提高初始特征与增强特征的相似度，并根据图像特征计算对比损失优化特征提取模块参数，进而特征提取模块在不同场景中能够准确提取带有身份标识行人图像的初始特征和增强特征，并确定其与待进行行人重识别图像特征的相似度，使得可以应用于不同场景且准确得到识别结果，实现领域自适应，具有较高的鲁棒性。

基于上述实施例的内容，作为一种可选实施例，通过计算对比损失来优化特征提取模块，包括：

在对比学习模块确定初始特征提取结果和所述增强特征提取结果中的外观相似特征，并在初始特征提取结果和所述增强特征提取结果中标记外观相似特征后，将特征提取模块中的图像特征输入对比损失函数，计算对比损失，并根据对比损失优化特征提取模块参数。

在本步骤中，由于提取特征模块是负责提取带有身份标识的行人图像的初始特征和增强特征，为了保证准确提取特征，需要对特征提取模块的参数进行优化，本实施例通过在对比学习模块确定初始特征提取结果和所述增强特征提取结果中的外观相似特征，并在初始特征提取结果和所述增强特征提取结果中标记外观相似特征后，将特征提取模块中的图像特征输入对比损失函数，计算对比损失，并根据对比损失优化特征提取模块参数，从而使特征提取模块能够准确提取初始特征和增强特征。

本发明实施例提供的基于无监督学习的行人重识别领域自适应方法，通过，将特征提取模块中的图像特征输入对比损失函数，计算对比损失，并根据对比损失优化特征提取模块参数，使特征提取模块准确提取初始特征和增强特征，提高行人重识别结果的准确性。

基于上述实施例的内容，作为一种可选实施例，若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人，则将待进行行人重识别的图像特征添加至特征提取模块。

在本步骤中，特征提取模块中存储有大量带有身份标识的行人图像特征，但由于存储的图像特征无法穷举所有光照和/或视角条件下的图像特征，因此，为了使识别的准确度更高，需要对模块中的图像特征进行动量更新，从而抑制噪声的影响。

如图2所示，若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人，则认为待进行行人重识别的图像已经具有身份标签，可以与其同类身份的图像一起作为后续识别的对比对象，从而将待进行行人重识别的图像特征添加至特征提取模块缓存中，保证缓存中的图像特征动量更新。

本发明实施例提供的基于无监督学习的行人重识别领域自适应方法，若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人，则将待进行行人重识别的图像特征添加至特征提取模块，从而对特征提取模块缓存中的图像特征动量更新，作为后续识别的对比对象，提高行人重识别结果的准确度。

基于上述实施例的内容，作为一种可选实施例，循环对抗生成网络模块用于对样本图像进行不同视角差异和/或不同光照差异的图像转换，生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像，包括：

获取真摄像头下的样本图像和假摄像头下的样本图像；

其中，真摄像头下的样本图像和假摄像头下的样本图像是存在视角差异和/或光照差异的样本图像；

相应地，通过计算循环一致性损失、对抗生成损失来优化循环对抗生成网络模块，包括：

在本步骤中，由于不同摄像头角度参数的影响，使得行人图像的风格差异明显。因此本实施例采用循环对抗生成网络可以实现端到端的行人图像在不同摄像头视角下的风格转换。循环对抗生成网络为了能不依赖一一对应的图像，需要匹配的图像来学习图像转换引入了循环操作。因此，本实施例采用真摄像头下的样本图像与假摄像头下的样本图像训练循环生成对抗网络，从而可以对不同身份行人的样本图像进行数据增强，得到不同身份行人不同视角和/或不同光照下的图像。其中，真摄像头下的样本图像可以理解为摄像头在光照条件A和视角A下拍摄得到的行人图像，假摄像头下的样本图像可以理解为与真摄像头下的样本图像存在视角差异和/或光照差异，如假摄像头下的样本图像可以理解为在光照条件A和视角B下拍摄得到的行人图像，也可以理解为在光照条件B和视角A下拍摄得到的行人图像，还可以理解为光照条件B和视角B下拍摄得到的行人图像。

简单来说，就是用真图像A生成假图像B，后将假图像B映射回A，产生一个假图像A，并判断这假图像A是否同真图像A近似，用这样的方式来确保模型真正能学习到一对一的映射而不是一对多。

本实施例中，在模型中定义第一生成器G和第二生成器F，分别表示从输入域x(真摄像头下的样本图像)到目标域y(假摄像头下的样本图像)的变换和逆变换，并且使用第一判别器Dx和第二判别器Dy来分辨判断F和G的效果。然后，根据循环一致性损失以及对抗生成损失，使循环一致性损失以及对抗生成损失最小化，优化训练循环生成对抗网络，直至循环生成对抗网络训练次数达到阈值，网络收敛，停止训练。其中循环一致性损失以及对抗生成损失，计算公式如下：

其中，

表示对抗生成网络损失，Dy(y)表示判别器y对y输出，Dy(G(x))表示判别器y对生成x的输出，

表示循环一致性损失，F(G(x))表示判别器F对生成x的输出，G(F(y))表示生成器对输入y的生成图像，x表示源域输入，y表示目标域输入，

表示总损失。

本发明实施例提供的基于无监督学习的行人重识别领域自适应方法，基于真摄像头下的样本图像和假摄像头下的样本图像进行训练循环生成对抗网络模块，从而得到不同光照和/或视角下的增强图像，能够适用到不同场景中进行行人重识别，大幅度降低了成本，提高了效率。

基于上述实施例的内容，作为一种可选实施例，对比损失函数为：

在本步骤中，根据对比损失函数计算对比损失，可以优化提取特征模块参数，从而使提取特征模块可以准确提取初始特征和增强特征。例如，对比损失越大，证明提取特征模块的效果越好，提取的初始特征和增强特征越准确。

本发明实施例提供的基于无监督学习的行人重识别领域自适应方法，基于对比损失函数计算对比损失，从而能够优化提取特征模块参数，准确提取初始特征和增强特征，提高行人重识别结果的准确性。

图3是本发明第二个实施例提供的基于无监督学习的行人重识别领域自适应装置的结构示意图，如图3所示，本发明第二个实施例提供的基于无监督学习的行人重识别领域自适应装置，包括：

第一获取单元310，用于获取带有身份标识的行人图像，将带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征；

第二获取单元320，用于获取待进行行人重识别的图像，确定待进行行人重识别的图像特征；

识别单元330，用于计算待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别；

其中，领域自适应特征提取模型包括循环对抗生成网络模块、特征提取模块和对比学习模块，领域自适应特征提取模型为采用行人重识别样本图像训练得到的；

其中，循环对抗生成网络模块用于对样本图像进行不同视角差异和/或不同光照差异的图像转换，生成与样本图像对应的存在视角差异和/或不同光照差异的特征增强图像；特征提取模块，用于对样本图像进行特征提取，获取初始特征提取结果，以及，用于对特征增强图像进行特征提取，获得增强特征提取结果；对比学习模块，用于在特征提取模块获取初始特征提取结果和增强特征提取结果后，通过最近邻特征挖掘，确定初始特征提取结果和所述增强特征提取结果中的外观相似特征，并在初始特征提取结果和所述增强特征提取结果中标记外观相似特征，提高初始特征提取结果和增强特征提取结果中外观相似特征的使用权重；其中，外观相似特征是指初始特征提取结果和增强特征提取结果中的相似外观特征；

其中，在对领域自适应特征提取模型进行训练时，通过计算循环一致性损失、对抗生成损失来优化循环对抗生成网络模块，以及通过计算对比损失来优化特征提取模块，直至满足预设收敛条件。

本实施例所述的基于无监督学习的行人重识别领域自适应装置可以用于执行上述第一个实施例所述的基于无监督学习的行人重识别领域自适应方法，其原理和技术效果类似，此处不再详述。

在对比学习模块确定初始特征提取结果和增强特征提取结果中的外观相似特征，并在初始特征提取结果和增强特征提取结果中标记外观相似特征后，将特征提取模块中的图像特征输入对比损失函数，计算对比损失，并根据对比损失优化特征提取模块参数。

图4是本发明第三个实施例提供的电子设备的结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行基于无监督学习的行人重识别领域自适应方法，该方法包括：获取带有身份标识的行人图像，将带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征；获取待进行行人重识别的图像，确定待进行行人重识别的图像特征；计算待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别。

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的基于无监督学习的行人重识别领域自适应方法，该方法包括：获取带有身份标识的行人图像，将带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征；获取待进行行人重识别的图像，确定待进行行人重识别的图像特征；计算待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别。

又一方面，本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的基于无监督学习的行人重识别领域自适应方法，该方法包括：获取带有身份标识的行人图像，将带有身份标识的行人图像输入领域自适应特征提取模型中，确定带有身份标识的行人图像的初始特征和增强特征；获取待进行行人重识别的图像，确定待进行行人重识别的图像特征；计算待进行行人重识别的图像特征，与带有身份标识的行人图像的初始特征和增强特征的相似度，进行行人重识别。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于无监督学习的行人重识别领域自适应方法，其特征在于，包括：

2.根据权利要求1所述的基于无监督学习的行人重识别领域自适应方法，其特征在于，所述通过计算对比损失来优化所述特征提取模块，包括：

3.根据权利要求1所述的基于无监督学习的行人重识别领域自适应方法，其特征在于，还包括：

若判断待进行行人重识别的图像中的行人为带有身份标识的行人图像中的行人，则将待进行行人重识别的图像特征添加至特征提取模块。

4.根据权利要求1所述的基于无监督学习的行人重识别领域自适应方法，其特征在于，所述循环对抗生成网络模块用于对所述样本图像进行不同视角差异和/或不同光照差异的图像转换，生成与所述样本图像对应的存在视角差异和/或不同光照差异的特征增强图像，包括：

获取真摄像头下的样本图像和假摄像头下的样本图像；

5.根据权利要求2所述的基于无监督学习的行人重识别领域自适应方法，其特征在于，所述对比损失函数为：

6.一种基于无监督学习的行人重识别领域自适应装置，其特征在于，包括：

7.根据权利要求6所述的基于无监督学习的行人重识别领域自适应装置，其特征在于，所述通过计算对比损失来优化所述特征提取模块，包括：

8.根据权利要求6所述的基于无监督学习的行人重识别领域自适应装置，其特征在于，还包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至5任一项所述基于无监督学习的行人重识别领域自适应方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至5任一项所述基于无监督学习的行人重识别领域自适应方法的步骤。