CN109635695A

CN109635695A - 基于三元组卷积神经网络的行人再识别方法

Info

Publication number: CN109635695A
Application number: CN201811469383.1A
Authority: CN
Inventors: 王林; 杨乐
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2018-11-28
Filing date: 2018-11-28
Publication date: 2019-04-16
Anticipated expiration: 2038-11-28
Also published as: CN109635695B

Abstract

本发明基于三元组卷积神经网络的行人再识别方法：步骤1、形成一个小批量样本；步骤2、输出每个行人图像的全局特征和局部特征；步骤3、计算小批量样本中每两个行人图像全局特征之间的距离、对应身体部位的局部特征之间的距离；步骤4、形成P×K对三元组样本；步骤5、利用Log‑logistic函数代替铰链函数改进三元组卷积神经网络损失函数；步骤6、得到训练好的三元组卷积神经网络；步骤7、利用训练好的三元组卷积神经网络识别目标行人图像，并结合置信度测量机制来进一步避免目标行人图像和待识别行人图像之间的误匹配。本发明一种基于三元组卷积神经网络的行人再识别方法，能够准确进行行人再识别，避免不同行人之间的误匹配。

Description

基于三元组卷积神经网络的行人再识别方法

技术领域

本发明属于计算机视觉技术领域，具体涉及一种基于三元组卷积神经网络的行人再识别方法。

背景技术

行人再识别是图像处理和模式识别研究的重要领域之一。所谓行人再识别是指：将某个特定的被搜索行人作为搜索源，在其他的没有重复视线的摄像头所采集到的视频图像里自动地找到这一搜索源。当有情况发生时，目标对象一定会在多个摄像头以及不同场景中移动，如何识别出在不同摄像头下出现的同一个人，并绘制出该目标走过的路径，是行人再识别所研究的重点。

虽然行人再识别技术在视频控制、智能交通、多媒体检索等领域有着广泛的应用前景，但行人外观易受遮挡、视角以及光照条件的影响，同时视频图像存在分辨率低、亮度变换的干扰的问题，因此呈现出很大的类内差异。而且不同的行人有可能因为所穿的衣服颜色相同，身形很相似，很容易被误认为是同一个人。人的外观形体既具有刚性的特性，也具有柔性的特征，很容易因所穿的衣服、视角、尺度等的影响，因此，目前行人再识别仍然存在着巨大的应用挑战。

现有的基于深度学习的行人再识别方法虽然取得了一定的效果，但是研究的焦点一直围绕如何设计新颖的网络识别架构，或如何学习有效的相似性度量函数，而卷积神经网络与度量学习的结合并没有受到广泛的关注。三元组损失函数通过将特征学习和相似性度量合并到一个统一的框架中，使网络根据最终的任务学习有辨识力的特征，不需要附加特定的层而可达到与设计新颖的网络识别架构相提并论的效果。然而，若直接将该方法应用于行人再识别中，将会出现以下两大弊端：1)传统三元组损失函数中的间隔参数需要事先指定，训练中无法自适应特征学习过程中值域的变化，缺乏灵活性，不利于改善行人再识别性能；2)数据集中相似样本较多，往往会出现负样本比正样本更匹配测试图像的情况，对表观特征较相似的不同行人会出现误匹配的现象。

发明内容

本发明的目的在于提供一种基于三元组卷积神经网络的行人再识别方法，能够准确进行行人再识别，避免不同行人之间的误匹配。

本发明所采用的技术方案是，基于三元组卷积神经网络的行人再识别方法，具体按照以下步骤实施：

步骤1、在行人数据集图像中随机采样P个行人，并从每个行人中随机选择K个图像，形成具有P×K个图像的一个小批量样本；

步骤2、将经步骤1得到的小批量样本依次输入至三元组卷积神经网络中，输出小批量样本中每个行人图像的全局特征和局部特征；

步骤3、利用欧氏距离公式计算经步骤1得到的小批量样本中每两个行人图像全局特征之间的距离并确定全局特征之间的相似性，通过引入最短路径损失计算小批量样本中每两个行人图像之间对应身体部位的局部特征之间的距离，对齐每两个行人图像之间对应身体部位的局部特征；

步骤4、利用步骤3得到的每两个行人图像全局特征之间的相似性结合小批量难样本挖掘策略，在步骤1得到的具有P×K个图像的一个小批量样本中形成P×K对三元组样本；

步骤5、利用Log-logistic函数代替铰链函数改进三元组卷积神经网络损失函数，得到改进后的三元组卷积神经网络损失函数；

步骤6、利用经步骤4得到的P×K对三元组样本和经步骤5得到的改进后的三元组卷积神经网络损失函数训练三元组卷积神经网络，确定能够有效提取特征来识别行人的网络参数，得到训练好的三元组卷积神经网络；

步骤7、利用经步骤6得到的训练好的三元组卷积神经网络识别目标行人图像，并结合置信度测量机制得到目标行人图像的最终相似性排名列表识别矩阵来进一步避免目标行人图像和待识别行人图像之间的误匹配。

本发明的特点还在于：

步骤2.1、将经步骤1得到的小批量样本依次输入至三元组卷积神经网络中提取所需图像特征，输出特征图，对特征图采用池化窗口得到全局特征；

步骤2.2、对特征图每一行执行水平池化提取得到局部特征。

步骤3具体按照以下步骤实施：

步骤3.1、选取经步骤2得到的小批量样本中每两个行人图像的全局特征，利用欧氏距离公式(1)计算每两个行人图像全局特征之间的距离，所述欧氏距离公式(1)为：

式中，d₁₂表示两个行人图像全局特征之间的距离，x_1k表示第一个行人图像的第k维全局特征，x_2k表示表示第二个行人图像的第k维全局特征，

d₁₂与两个行人图像全局特征之间的相似性成正比；

步骤3.2、选取经步骤2得到的小批量样本中每两个行人图像之间对应身体部位的局部特征，利用公式(2)计算每两个行人图像中第一个行人图像的局部特征中的第i个水平块与第二个行人图像的局部特征中的第j个水平块之间的距离，所述公式(2)为：

式中，d_i,j表示第一个行人图像的局部特征中的第i个水平块与第二个行人图像的局部特征中的第j个水平块之间的距离，d_i,j与两个行人图像对应局部特征之间的相似性成正比，f_i表示第一个行人图像的局部特征，g_j表示第二个行人图像的局部特征，

再将计算得到的若干d_i,j组成距离矩阵D，通过公式(3)计算每两个行人图像之间对应身体部位的局部特征之间的距离，所述公式(3)为：

式中，S_i,j表示距离矩阵D中元素(1，1)到(i，j)之间最短路径的距离总和，

计算得出S_H,H，S_H,H表示距离矩阵D中从(1，1)到(H，H)最短路径的总和即每两个行人图像之间对应身体部位的局部特征之间的距离，至此对齐每两个行人图像之间对应身体部位的局部特征。

步骤4具体按照以下步骤实施：

步骤4.1、在经步骤1得到的具有P×K个图像的一个小批量样本中，通过小批量难样本挖掘策略，选择该小批量样本中的每一个样本X在此小批量样本中的最难正样本和最难负样本，共组成P×K对三元组样本，所述小批量难样本挖掘策略为：

式(3)表示最难正样本挖掘策略，式(4)表示最难负样本挖掘策略，表示小批量样本中的第i个行人的第a个图像，表示小批量样本中的第j个行人的第n个图像，f_θ(x)表示样本X经过三元组卷积神经网络输出的全局或局部特征，和表示样本X与小批量样本中其他样本的全局特征之间的距离。

步骤5具体按照以下步骤实施：

步骤5.1、利用Log-logistic函数代替铰链函数改进三元组卷积神经网络损失函数，改进后的三元组卷积神经网络损失函数如下：

式中，PK表示经步骤4得到的PK对三元组样本，_i指的是P个行人中的任意一个行人，a指的是一个行人图像上K个图片中的任意一张图片。

步骤6具体按照以下步骤实施：

步骤6.1、将步骤1中的小批量样本输入至三元组卷积神经网络中重复步骤2提取目标行人图像的特征和待识别行人图像的特征，重复步骤3计算目标行人图像和待识别行人图像全局特征之间的相似性，计算目标行人图像和待识别行人图像之间对应身体部位的局部特征之间的距离，对齐每两个行人图像之间对应身体部位的局部特征；

步骤6.2、利用经步骤5得到的改进型三元组损失函数训练三元组卷积神经网络的网络参数，直至达到预期精度或预期的迭代次数，得到训练好的三元组卷积神经网络。

步骤7具体按照以下步骤实施：

步骤7.1、重复步骤2将目标行人图像和待识别行人图像输入至经步骤6得到的训练好的三元组卷积神经网络提取输出全局、局部特征；

步骤7.2、重复步骤3计算目标行人图像和待识别行人图像全局特征之间的距离与局部特征之间的距离，按照全局特征间的相似性与局部特征间的相似性之和对目标行人图像中所有行人图像按照相似性由小到大进行排序，形成排序列表如下：

R＝[r₁,，r₂，…，r_N] (6)

列表中，r_N表示目标行人图像中第N个行人图像的排序；

步骤7.3、将经步骤7.2得到的排列序表重新排序：

步骤7.3.1、重复步骤3计算目标行人图像中两两行人之间的全局特征之间的距离；

步骤7.3.2、计算目标行人图像中每个行人相对于待识别行人图像的置信度得分：

目标行人图像中每个行人相对于待识别行人图像的置信度得分，等于目标行人图像中每个行人与其余行人全局特征之间的距离小于目标行人图像中每个行人和待识别行人图像全局特征之间的距离的个数之和；

步骤7.3.3、将目标行人图像中每个行人相对于待识别行人图像的置信度得分汇总为排序列表如下：

S_g＝[sg₁,sg₂,…,sg_c] (7)

式中，g_i表示目标行人图像中每个行人，sg_i表示每一个目标行人图像的置信度得分；

步骤7.4、将步骤7.2输出的排序列表(6)和步骤7.3输出的排序列表(7)融合得到目标行人图像的最终相似性排名列表识别矩阵，即Rf矩阵如下：

式中，表示R和S_g之间逐元素哈达马积。

本发明的有益效果在于：

1)本发明基于三元组卷积神经网络的行人再识别方法中改进后的三元组损失函数采用Log-logistic函数代替铰链函数不仅方便了训练，同时使学习的特征空间具有同类样本相似性距离尽可能小，异类与同类样本间相似性距离尽可能大的特点，提高了特征与度量函数联合优化的效果，更好地提升了行人再识别性能；

2)本发明基于三元组卷积神经网络的行人再识别方法，利用置信度测量机制，充分考虑与图像相关的其它图像的判别信息，可以有效避免误匹配，从而进一步提升对行人的识别率。

附图说明

图1是三元组卷积神经网络每一个分支的特征提取模型图；

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明基于三元组卷积神经网络的行人再识别方法，具体按照以下步骤实施：

步骤2具体按照以下步骤实施：

步骤2.1、如图1所示，将经步骤1得到的小批量样本依次输入至三元组卷积神经网络中提取所需图像特征，输出特征图，对特征图采用池化窗口得到全局特征；

步骤2.2、对特征图每一行执行水平池化提取得到局部特征。

步骤3具体按照以下步骤实施：

d₁₂与两个行人图像全局特征之间的相似性成正比；

步骤4具体按照以下步骤实施：

步骤4.1、在经步骤1得到的具有P×K个图像的一个小批量样本中，通过小批量难样本挖掘策略，选择该小批量样本中的每一个样本X在此小批量样本中的最难正样本和最难负样本，共组成P×K对三元组样本，每一对三元组样本包括一个样本和这个样本所对应的最难正样本、最难负样本，所述小批量难样本挖掘策略为：

步骤5具体按照以下步骤实施：

步骤6具体按照以下步骤实施：

步骤7具体按照以下步骤实施：

R＝[r₁,，r₂，…，r_N] (6)

列表中，r_N表示目标行人图像中第N个行人图像的排序；

步骤7.3、将经步骤7.2得到的排列序表重新排序：

S_g＝[sg₁,sg₂,…,sg_c] (7)

式中，表示R和S_g之间逐元素哈达马积。

从最终相似性排名列表识别矩阵中可以看出待识别行人与目标行人越相似，则排名越靠前，即从相似性排名列表识别矩阵中可以看出与目标行人相似的待识别行人。

本发明基于三元组卷积神经网络的行人再识别方法，首先通过图像间最短路径损失自动对齐局部特征，然后采用Log-logistic函数代替传统三元组卷积神经网络中的铰链函数，同时改进了损失函数的优化策略，从而克服了间隔参数因人工设定而具有的局限性，最后结合置信度测量机制，充分利用其他图像的判别信息进一步避免了目标行人欲待识别行人之间的误匹配。

本发明基于三元组卷积神经网络的行人再识别方法中利用Log-logistic函数代替铰链函数得到改进后的三元组损失函数，不仅方便了训练三元组卷积神经网络，同时使学习的特征空间具有同类样本相似性距离尽可能小，异类与同类样本间相似性距离尽可能大的特点，提高了特征与度量函数联合优化的效果，更好地提升了行人再识别性能，再者，结合置信度测量机制，充分考虑与图像相关的其它图像的判别信息，可以有效避免目标行人图像与待识别行人图像之间的误匹配，达到进一步提升对行人的识别率的目的。

Claims

1.基于三元组卷积神经网络的行人再识别方法，其特征在于，具体按照以下步骤实施：

步骤3、利用欧氏距离公式计算经步骤2得到的小批量样本中每两个行人图像全局特征之间的距离并确定全局特征之间的相似性，通过引入最短路径损失计算小批量样本中每两个行人图像之间对应身体部位的局部特征之间的距离，对齐每两个行人图像之间对应身体部位的局部特征；

2.根据权利要求1所述的基于三元组卷积神经网络的行人再识别方法，其特征在于，所述步骤2具体按照以下步骤实施：

步骤2.2、对特征图每一行执行水平池化提取得到局部特征。

3.根据权利要求1所述的基于三元组卷积神经网络的行人再识别方法，其特征在于，所述步骤3具体按照以下步骤实施：

d₁₂与两个行人图像全局特征之间的相似性成正比；

步骤3.2、选取经步骤2得到的小批量样本中每两个行人图像的局部特征，利用公式(2)计算每两个行人图像中第一个行人图像的局部特征中的第i个水平块与第二个行人图像的局部特征中的第j个水平块之间的距离，所述公式(2)为：

4.根据权利要求1所述的基于三元组卷积神经网络的行人再识别方法，其特征在于，所述步骤4具体按照以下步骤实施：

5.根据权利要求1所述的基于三元组卷积神经网络的行人再识别方法，其特征在于，所述步骤5具体按照以下步骤实施：

6.根据权利要求3所述的基于三元组卷积神经网络的行人再识别方法，其特征在于，所述步骤6具体按照以下步骤实施：

7.根据权利要求1所述的基于三元组卷积神经网络的行人再识别方法，其特征在于，所述步骤7具体按照以下步骤实施：

R＝[r₁,，r₂，…，r_N] (6)

列表中，r_N表示目标行人图像中第N个行人图像的排序；

步骤7.3、将经步骤7.2得到的排列序表重新排序：

S_g＝[sg₁,sg₂,…,sg_c] (7)

式中，表示R和S_g之间逐元素哈达马积。