CN111428612A

CN111428612A - 行人重识别方法、终端、装置及存储介质

Info

Publication number: CN111428612A
Application number: CN202010197158.8A
Authority: CN
Inventors: 张�浩; 邵新庆; 刘强; 徐�明; 宋咏君
Original assignee: Shenzhen ZNV Technology Co Ltd; Nanjing ZNV Software Co Ltd
Current assignee: Shenzhen ZNV Technology Co Ltd; Nanjing ZNV Software Co Ltd
Priority date: 2020-03-19
Filing date: 2020-03-19
Publication date: 2020-07-17
Anticipated expiration: 2040-03-19
Also published as: CN111428612B

Abstract

本发明公开了一种行人重识别方法，包括以下步骤：将训练数据输入预设卷积神经网络，提取目标层对应的特征图，对特征图进行混合分割，得到分割后的子特征图，并对特征图以及各个子特征图进行平均池化以及特征提取，得到特征向量组，基于特征向量组进行损失计算得到损失值，并基于损失值进行网络训练，直至收敛，得到目标卷积神经网络，利用目标卷积神经网络对待检测图像进行行人重识别。本发明还公开了一种装置、终端及存储介质。通过先提取目标层对应的特征图，然后再进行分割特征图分割，与减轻了卷积神经网络的计算量，同时采用横向和纵向的混合分割方式，在行人重识别过程中结合了两种分割方式的优点，从而提升了行人重识别的正确率。

Description

行人重识别方法、终端、装置及存储介质

技术领域

本发明涉及行人重识别技术领域，尤其涉及一种行人重识别方法、终端、装置及存储介质。

背景技术

行人重识别(Person Re-identification也称行人再识别，简称为ReID，是近年来计算机视觉的一个研究重点，即给定一个监控行人图像，跨设备检索该行人的图像。由于不同摄像设备之间存在差异，行人外观易受穿着、尺度、遮挡、姿态和视角等影响，行人再识别是一个既具研究价值同时又极富挑战性的课题。

行人重识别领域已经存在一种较常见的划分方法是PCB，即通过对图像进行横向划分，以身体语义信息(如头部、上肢、下肢等)进行特征抽取和对比，提升行人重识别的效果。由于直接对图片进行划分后卷积神经网络的计算量会显著增大，因此影响了行人重识别速度和效率。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种行人重识别方法、终端、装置及存储介质，旨在解决现有行人重识别算法的计算量大，从而导致行人重识别效率不高的技术问题。

为实现上述目的，本发明提供一种行人重识别方法，所述的行人重识别方法包括以下步骤：

将训练数据输入预设卷积神经网络，提取目标层对应的特征图，其中，所述目标层是所述预设卷积神经网络的一个中间层或最后层；

对所述特征图进行混合分割，得到分割后的子特征图，对各个子特征图分别进行平均池化以及特征提取，同时对所述特征图进行平均池化以及特征提取，得到特征向量组；

基于所述特征向量组进行损失计算得到损失值，并基于所述损失值进行卷积神经网络训练，得到目标卷积神经网络；

利用所述目标卷积神经网络对待检测图像进行行人重识别。

进一步地，所述分割方向包括纵向分割和横向分割，所述对所述特征图进行混合分割，得到分割后的子特征图的步骤包括：

获取预设分割次数M、每次分割对应的分割方向以及每次分割对应的分割份数N，其中，所述M和N是正整数；

将所述特征图进行M次分割，每次分割根据所述分割方向将所述特征图平均分割成N块，得到N个子特征图，并将所述N个子特征图串联后得到每次分割的合并子特征图；

将每次分割各自对应的N个子特征图以及合并子特征图，作为所述分割后的子特征图。

进一步地，所述特征向量组包括：每次分割各自对应的N个子特征图的子特征向量，M个合并子特征图各自对应的合并子特征向量，以及特征图对应的整体特征向量。

进一步地，所述分割方向包括纵向分割和横向分割，所述每次分割根据所述分割方向将所述特征图平均分割成N块，得到N个子特征图的步骤包括：

当所述分割方向为纵向分割时，将所述特征图从左到右平均分成N块，得到N个纵向的子特征图；

当所述分割方向为横向分割时，将所述特征图从上到下平均分成N块，得到N个横向的子特征图。

进一步地，所述基于所述特征向量组进行损失计算得到损失值的步骤包括：

基于所述特征向量组中的子特征向量和整体特征向量，获取交叉熵损失；

基于所述合并子特征向量和所述整体特征向量，获取三元损失和中心损失；

基于所述交叉熵损失、所述三元损失以及所述中心损失得到所述损失值。

进一步地，所述基于所述交叉熵损失、所述三元损失以及所述中心损失得到所述损失值的步骤包括：

将所述交叉熵损失、所述三元损失以及所述中心损失进行加权求和，得到所述损失值。

进一步地，其特征在于，所述利用所述目标卷积神经网络对待检测图像进行行人重识别的步骤包括：

利用所述目标卷积神经网络获取检测图像对应的检测特征向量，以及各个基准图像对应的基准特征向量；

计算所述检测特征向量与各个基准特征向量的向量相似度；

根据所述向量相似度得到行人重识别结果。

进一步地，所述行人重识别装置包括：

生成模块，用于将训练数据输入预设卷积神经网络，提取目标层对应的特征图，其中，所述目标层是所述预设卷积神经网络的一个中间层或最后层；

特征提取模块，用于对所述特征图进行混合分割，得到分割后的子特征图，对各个子特征图分别进行平均池化以及特征提取，同时对所述特征图进行平均池化以及特征提取，得到特征向量组；

处理模块，用于基于所述特征向量组进行损失计算得到损失值，并基于所述损失值进行卷积神经网络训练，得到目标卷积神经网络；

识别模块，用于利用所述目标卷积神经网络对待检测图像进行行人重识别。

此外，为实现上述目的，本发明还提供一种终端，所述终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的行人重识别程序，所述行人重识别程序被所述处理器执行时实现上述任一项所述的行人重识别方法的步骤。

此外，为实现上述目的，本发明还提供一种存储介质，所述存储介质上存储有行人重识别程序，所述行人重识别程序被处理器执行时实现上述任一项所述的行人重识别方法的步骤。

本发明将训练数据输入预设卷积神经网络，提取目标层对应的特征图，其中，所述目标层是所述预设卷积神经网络的一个中间层或最后层，而后对所述特征图进行混合分割，得到分割后的子特征图，对各个子特征图分别进行平均池化以及特征提取，同时对所述特征图进行平均池化以及特征提取，得到特征向量组，接下来基于所述特征向量组进行损失计算得到损失值，并基于所述损失值进行卷积神经网络训练，得到目标卷积神经网络，最后利用所述目标卷积神经网络对待检测图像进行行人重识别。通过先提取目标层对应的特征图，然后再进行分割特征图分割，与现有技术相比，减轻了卷积神经网络的计算量，同时在特征图分割过程中采用横向和纵向的混合分割方式，在行人重识别过程中结合了两种分割方式的优点，从而提升了行人重识别的正确率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境中终端的结构示意图；

图2为本发明行人重识别方法第一实施例的流程示意图；

图3为本发明行人重识别方法一实施例中混合分割示意图；

图4为本发明行人重识别方法一实施例中纵向分割示意图；

图5为本发明行人重识别装置实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境中终端的结构示意图。

如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的目标检测系统结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及行人重识别程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接用户端，与用户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的行人重识别程序。

在本实施例中，终端包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的行人重识别程序，其中，处理器1001调用存储器1005中存储的行人重识别程序时，执行本申请各个实施例提供的行人重识别方法的步骤。

本发明还提供一种行人重识别方法，参照图2，图2为本发明行人重识别方法第一实施例的流程示意图。

本发明实施例提供了行人重识别方法的实施例，需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

在本实施例中，该行人重识别方法包括：

步骤S10，将训练数据输入预设卷积神经网络，提取目标层对应的特征图，其中，所述目标层是所述预设卷积神经网络的一个中间层或最后层；

在本实施例中，行人重识别(Person re-identification)也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像，旨在弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。

如前所述，目前行人重识别领域已经存在一种较常见的划分方法是PCB，即通过对图像进行横向划分，以身体语义信息(如头部、上肢、下肢等)进行特征抽取和对比，提升行人重识别的效果。由于直接对图片进行划分后卷积神经网络的计算量会显著增大，因此影响了行人重识别速度和效率。本申请提出的行人重识别方法通过先提取目标层对应的特征图，然后再进行分割特征图分割，与现有技术相比，减轻了卷积神经网络的计算量，同时在特征图分割过程中采用横向和纵向的混合分割方式，在行人重识别过程中结合了两种分割方式的优点，从而提升了行人重识别的正确率。

具体地，预设卷积神经网络可选择当前神经网络技术中通用的网络，如Resnet、MobileNet、InceptionNet等，在本申请中，以Resnet-50为例进行举例说明。输入为256*128*3的图像，得到不同层对应不同尺度的特征图，记作(大小为32*16*512)，(大小为16*8*1024)，(大小为8*4*2048)，在本申请中，目标层是预设卷积神经网络的一个中间层或最后层。将训练数据输入预设卷积神经网络，提取目标层对应的特征图，训练数据采用行人重识别领域举足轻重的数据库Market1501中的数据。

步骤S20，对所述特征图进行混合分割，得到分割后的子特征图，对各个子特征图分别进行平均池化以及特征提取，同时对所述特征图进行平均池化以及特征提取，得到特征向量组；

在本实施例中，提取目标层对应的特征图后，进一步进行特征图分割，混合分割包括横向等分和纵向等分，等分次数可以为二等分、三等分或四等分等，当为横向等分时，将特征图从上到下平均分成N块，当为纵向等分时，将特征图从左到右平均分成N块，得到N个子特征图。需要说明的是，选择不同的方案可对卷积神经网络的运行速度、精度、大小产生不同的变化，在实际应用中可根据具体需求选择具体方案。进一步地，对特征图以及各个子特征图再通过池化(平均池化Avgpool)和卷积(1*1卷积Conv(1*1))，得到特征向量组。

步骤S30，基于所述特征向量组进行损失计算得到损失值，并基于所述损失值进行卷积神经网络训练，得到目标卷积神经网络；

在本实施例中，确定损失函数，然后根据损失函数计算损失值。损失函数可以选择四元损失、三元损失、中心损失、边界挖掘损失或交叉熵损失等主流损失函数，在实际应用中可根据具体需求选择。在本申请中，选择三元损失、中心损失或交叉熵损失训练卷积神经网络，计算损失值，并基于损失值进行网络训练，直至收敛，得到目标卷积神经网络。

具体的，步骤S30包括：

步骤S31，基于所述特征向量组中的子特征向量和整体特征向量，获取交叉熵损失；

步骤S32，基于所述合并子特征向量和所述整体特征向量，获取三元损失和中心损失；

步骤S33，基于所述交叉熵损失、所述三元损失以及所述中心损失得到所述损失值。

具体地，步骤S33包括：将所述交叉熵损失、所述三元损失以及所述中心损失进行加权求和，得到所述损失值。

在本实施例中，特征向量组包括每次分割各自对应的多个子特征图的子特征向量，多个合并子特征图各自对应的合并子特征向量，以及特征图对应的整体特征向量。将特征向量组中的子特征向量和整体特征向量输入全连接层，进行降维处理，然后取他们的交叉熵损失(CrossEntrypyLoss)，同时取合并子特征向量和整体特征向量的三元损失和中心损失，最后将交叉熵损失、三元损失以及中心损失进行加权求和，得到损失值。需要说明的是，加权求和中的权重值，根据实际情况确定。

步骤S40，利用所述目标卷积神经网络对待检测图像进行行人重识别。

具体地，步骤S40包括：

步骤S41，利用所述目标卷积神经网络获取检测图像对应的检测特征向量，以及各个基准图像对应的基准特征向量；

步骤S42，计算所述检测特征向量与各个基准特征向量的向量相似度；

步骤S43，根据所述向量相似度得到行人重识别结果。

在本实施例中，采用余弦相似度进行计算待检测图像与基准图像的相似度，从而得到行人重识别结果。余弦相似度又称为余弦相似性，是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值，绘制到向量空间中，如最常见的二维空间。

具体地，利用目标卷积神经网络获取检测图像对应的检测特征向量，以及各个基准图像对应的基准特征向量，然后利用余弦距离公式，计算检测特征向量与各个基准特征向量的余弦相似性。余弦相似性通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1，而其他任何角度的余弦值都不大于1；并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时，余弦相似度的值为1；两个向量夹角为90°时，余弦相似度的值为0；两个向量指向完全相反的方向时，余弦相似度的值为-1。因此，根据余弦相似性的大小确定行人重识别结果。

本实施例提出的行人重识别方法，将训练数据输入预设卷积神经网络，提取目标层对应的特征图，其中，所述目标层是所述预设卷积神经网络的一个中间层或最后层，而后对所述特征图进行混合分割，得到分割后的子特征图，对各个子特征图分别进行平均池化以及特征提取，同时对所述特征图进行平均池化以及特征提取，得到特征向量组，接下来基于所述特征向量组进行损失计算得到损失值，并基于所述损失值进行卷积神经网络训练，得到目标卷积神经网络，最后利用所述目标卷积神经网络对待检测图像进行行人重识别。通过先提取目标层对应的特征图，然后再进行分割特征图分割，与现有技术相比，减轻了卷积神经网络的计算量，同时在特征图分割过程中采用横向和纵向的混合分割方式，在行人重识别过程中结合了两种分割方式的优点，从而提升了行人重识别的正确率。

基于第一实施例，提出本发明行人重识别方法的第二实施例，在本实施例中，步骤S20包括：

步骤S21，获取预设分割次数M、每次分割对应的分割方向以及每次分割对应的分割份数N，其中，所述M和N是正整数；

在本实施例中，提取目标层对应的特征图后，进一步进行特征图分割。对特征图进行多次分割，可采用不同的分割方向以及每次分割的份数。需要说明的是，选择不同的方案可对卷积神经网络的运行速度、精度、大小产生不同的变化，在实际应用中可根据具体需求选择具体方案。举例说明，如图3所示，预设分割次数M为5，第1次分割对应的分割方向为纵向分割，分割份数为2；第2次分割对应的分割方向为纵向分割，分割份数为3；第3次分割对应的分割方向为横向分割，分割份数为2；第4次分割对应的分割方向为横向分割，分割份数为3；第5次分割对应的分割方向为横向分割，分割份数为4。

步骤S22，将所述特征图进行M次分割，每次分割根据所述分割方向将所述特征图平均分割成N块，得到N个子特征图，并将所述N个子特征图串联后得到每次分割的合并子特征图；

步骤a，当所述分割方向为纵向分割时，将所述特征图从左到右平均分成N块，得到N个子特征图；

步骤b，当所述分割方向为横向分割时，将所述特征图从上到下平均分成N块，得到N个子特征图。

步骤S23，将每次分割各自对应的N个子特征图以及合并子特征图，作为所述分割后的子特征图。

在本实施例中，将特征图进行M次分割，每次分割根据分割方向将特征图平均分割成N块，得到N个子特征图，并将N个子特征图串联后得到每次分割的合并子特征图。横向分割和纵向分割的原理一样，为了描述方便，以纵向分割为例进行说明，如图4所示，Backbone是卷积神经网络，图片通过卷积神经网络可以得到一个矩阵表示的特征图，通过Branch-p2和Branch-p3复制卷积得到的特征图进行不同划分，Branch-p2进行纵向二等分，Branch-p3进行纵向三等分，再通过池化(平均池化Avgpool)和卷积(1*1卷积Conv(1*1))得到5个子特征向量f2_0，f2_1，f3_0，f3_1和f3_2(f2_0是特征图纵向划分的一半对应的特征向量，同理f2_1,f3_0等)，整体特征向量f2和f3，以及合并子特征向量f2_0+1和f3_0+1+2(f2_0+1指的是直接将f2_0向量和f2_1向量拼接成一个更长的向量，f3_0+1+2同理)。子特征向量和整体特征向量输入全连接层，进行降维处理，然后取他们的交叉熵损失(CrossEntrypyLoss)，同时取合并子特征向量和整体特征向量的三元损失和中心损失，最后将交叉熵损失、三元损失以及中心损失进行加权求和，得到损失值。

本实施例提出的行人重识别方法，将所述特征图进行M次分割，每次分割根据所述分割方向将所述特征图平均分割成N块，得到N个子特征图，并将所述N个子特征图串联后得到每次分割的合并子特征图，实现了特征图的混合分割。

本发明进一步提供一种行人重识别装置，参照图5，图5为本发明行人重识别装置实施例的功能模块示意图。

生成模块10，用于将训练数据输入预设卷积神经网络，提取目标层对应的特征图，其中，所述目标层是所述预设卷积神经网络的一个中间层或最后层；

特征提取模块20，用于对所述特征图进行混合分割，得到分割后的子特征图，对各个子特征图分别进行平均池化以及特征提取，同时对所述特征图进行平均池化以及特征提取，得到特征向量组；

处理模块30，用于基于所述特征向量组进行损失计算得到损失值，并基于所述损失值进行卷积神经网络训练，得到目标卷积神经网络；

识别模块40，用于利用所述目标卷积神经网络对待检测图像进行行人重识别。

进一步地，所述特征提取模块20还用于：

当所述分割方向为纵向分割时，将所述特征图从左到右平均分成N块，得到N个子特征图；

当所述分割方向为横向分割时，将所述特征图从上到下平均分成N块，得到N个子特征图。

进一步地，所述处理模块30还用于：

进一步地，所述识别模块40还用于：

计算所述检测特征向量与各个基准特征向量的向量相似度；

根据所述向量相似度得到行人重识别结果。

在本实施例中，将训练数据输入预设卷积神经网络，提取目标层对应的特征图，其中，所述目标层是所述预设卷积神经网络的一个中间层或最后层，而后对对所述特征图进行混合分割，得到分割后的子特征图，对各个子特征图分别进行平均池化以及特征提取，同时对所述特征图进行平均池化以及特征提取，得到特征向量组，接下来基于所述特征向量组进行损失计算得到损失值，并基于所述损失值进行卷积神经网络训练，得到目标卷积神经网络，最后利用所述目标卷积神经网络对待检测图像进行行人重识别。通过先提取目标层对应的特征图，然后再进行分割特征图分割，与现有技术相比，减轻了卷积神经网络的计算量，同时在特征图分割过程中采用横向和纵向的混合分割方式，在行人重识别过程中结合了两种分割方式的优点，从而提升了行人重识别的正确率。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有行人重识别程序，所述行人重识别程序被处理器执行时实现上述各个实施例中行人重识别方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台系统设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种行人重识别方法，其特征在于，所述的行人重识别方法包括以下步骤：

利用所述目标卷积神经网络对待检测图像进行行人重识别。

2.如权利要求1所述的行人重识别方法，其特征在于，所述对所述特征图进行混合分割，得到分割后的子特征图的步骤包括：

3.如权利要求2所述的行人重识别方法，其特征在于，所述特征向量组包括：每次分割各自对应的N个子特征图的子特征向量，M个合并子特征图各自对应的合并子特征向量，以及特征图对应的整体特征向量。

4.如权利要求2所述的行人重识别方法，其特征在于，所述分割方向包括纵向分割和横向分割，所述每次分割根据所述分割方向将所述特征图平均分割成N块，得到N个子特征图的步骤包括：

5.如权利要求1所述的行人重识别方法，其特征在于，所述基于所述特征向量组进行损失计算得到损失值的步骤包括：

6.如权利要求5所述的行人重识别方法，其特征在于，所述基于所述交叉熵损失、所述三元损失以及所述中心损失得到所述损失值的步骤包括：

7.如权利要求1所述的行人重识别方法，其特征在于，所述利用所述目标卷积神经网络对待检测图像进行行人重识别的步骤包括：

计算所述检测特征向量与各个基准特征向量的向量相似度；

根据所述向量相似度得到行人重识别结果。

8.一种行人重识别装置，其特征在于，所述行人重识别装置包括：

9.一种终端，其特征在于，所述终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的行人重识别程序，所述行人重识别程序被所述处理器执行时实现如权利要求1至7中任一项所述的行人重识别方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有所述行人重识别程序，所述行人重识别程序被处理器执行时实现如权利要求1至7中任一项所述的行人重识别方法的步骤。