CN107480631A

CN107480631A - 一种基于视角关联与深度网络学习的行人再识别方法

Info

Publication number: CN107480631A
Application number: CN201710686243.9A
Authority: CN
Inventors: 赖剑煌; 冯展祥
Original assignee: National Sun Yat Sen University
Current assignee: Sun Yat Sen University; National Sun Yat Sen University
Priority date: 2017-08-11
Filing date: 2017-08-11
Publication date: 2017-12-15
Anticipated expiration: 2037-08-11
Also published as: CN107480631B

Abstract

本发明提供了一种基于视角关联与深度网络学习的行人再识别方法，其通过对每个视角建立视角关联的深度网络从而提取视角相关的底层视角特征，通过迭代的跨视角欧氏距离约束和跨视角中心度量约束（ICV‑ECCL）约束不同网络之间的特征以减少不同视角之间行人特征的差异。实验表明，本发明能较大幅度地提高现有的深度网络在行人再识别上的性能，具有广泛的应用价值。

Description

一种基于视角关联与深度网络学习的行人再识别方法

技术领域

本发明涉及计算机视觉技术领域，更具体地，涉及一种基于视角关联与深度网络学习的行人再识别方法。

背景技术

随着技术的不断发展与成本的降低，监控摄像头已经被普遍应用于日常生活及社会安防各个领域，尤其是在公共场所，如银行、医院、商场、车站等人流较多的地方，发挥了重要的作用。行人再识别技术能跨摄像头跨视角进行目标行人匹配，是未来智能监控系统的重要组成部分，能极大地减少日常监控所需的人力物力，具有广阔的应用前景。行人再识别技术通过比较来自不同摄像头的行人图像和行人库里的图像来确定监控行人的身份。由于众多摄像头分布于城市的各个区域，因此成像质量和成像条件各不相同，光照变化、视角变化、图像分辨率变化等因素使得最终得到的监控行人图像在外观上有很大的差异，也是行人再识别技术研究的主要挑战。

主流的行人再识别技术先提取人工特征再结合距离度量或视角鲁棒的投影来减少不同视角造成的外观变化带来的影响。这种策略能一定程度上增强所提特征的鲁棒性和描述能力，但是仍然有以下的一些局限性：1)传统的人工特征是基于经验设计的，主要用来提取目标外观特征，在跨视角行人再识别的问题上具有很大的局限性，无法解决视角变化带来的外观剧变；2)对于不同的监控视角，采用的都是同样的模型和特征提取模块，忽视了视角相关的信息；3)所提的特征并没有利用到监控行人数据，因此鲁棒性不强。最近几年，深度学习得到了快速的发展，在行人再识别领域也正在升温，深度网络的性能已经不弱于现有最好的一些传统特征。另外，由于深度网络端对端学习的优势，能在特征提取的时候更好地融入视角特征，从而增强鲁棒性。但是，现有的基于深度网络的技术往往用同样的深度网络对来自不同视角的行人图像提取特征，忽略了视角变化带来的影响。因此，开发视角关联的深度网络并基于这些网络进行行人再识别能弥补现有技术的缺陷，提高再识别技术性能。

发明内容

本发明为解决现有技术提供的行人再识别方法存在的受监控视角变化影响而导致跨视角识别受局限的技术缺陷，提供了一种基于视角关联与深度网络学习的行人再识别方法。

为实现以上发明目的，采用的技术方案是：

一种基于视角关联与深度网络学习的行人再识别方法，包括以下步骤：

S1.通过行人图像预训练一个深度网络，并将该深度网络作为深度网络的初始化模型；

S2.为摄像头的各个监控视角分别以步骤S1的初始化模型为基础构建一个深度网络，然后分别使用各个监控视角下的行人图像对相应监控视角的深度网络进行训练，训练过程中，利用迭代的跨视角欧氏距离约束和跨视角中心度量约束方法对不同视角的深度网络进行联合训练，减少来自不同视角的行人图像间的特征差距，直至深度网络的参数收敛；

S3.对于某个监控视角下的目标行人图像及行人图像库，首先使用相应监控视角的深度网络对目标行人图像及行人图像库中的行人图像分别进行特征的提取，然后将从目标行人图像中提取的特征依次与从图像库中的行人图像中提取的特征进行匹配，基于匹配的结果确定目标行人图像的身份。

与现有技术相比，本发明的有益效果是：

本发明提供了一种基于视角关联与深度网络学习的行人再识别方法，其通过对每个视角建立视角关联的深度网络从而提取视角相关的底层视角特征，通过迭代的跨视角欧氏距离约束和跨视角中心度量约束(ICV-ECCL)约束不同网络之间的特征以减少不同视角之间行人特征的差异。实验表明，本发明能较大幅度地提高现有的深度网络在行人再识别上的性能，具有广泛的应用价值。

附图说明

图1为本发明的方法的实施示意图。

图2为CUHK03和SYSU-mREID数据库的示例图。

图3为本发明提升Alexnet深度网络的性能结果示意图。

图4为本发明各部分的效果图。

图5为本发明在CUHK03数据库与主流算法比较结果图。

图6为本发明在SYSU-mREID数据库与主流算法比较结果图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

以下结合附图和实施例对本发明做进一步的阐述。

实施例1

如图1所示，本发明提供的方法具有包括有以下步骤：

其中，其中跨视角欧氏距离约束的作用是减少不同的深度网络最后一层特征输出之间的欧氏距离，假设来自两个视角的行人图像的深度特征为其中上标{1,2}表示对应的视角，下标{i,j}表示对应的行人身份，{k_i,k_j}对应每个行人在对应视角下的某个训练样本，令{K_i,K_j}表示每个行人的训练样本数目，则跨视角欧氏距离约束为：与常用的softmax损失函数组成的目标函数表示为：而跨视角中心度量约束用于保证同类训练样本特征与不同视角下类中心的特征尽量接近，从而保证特征的跨视角鲁棒性。假设来自两个视角的行人图像深度特征为可以计算出对应每一类以及所有样本的类中心为下标{i,j}表示对应的行人身份，{k_i,k_j}对应每个行人在对应视角下的某个训练样本，令{K_i,K_j}表示每个行人的训练样本数目，{M}表示行人类别总数，则跨视角中心度量为：

，与softmax损失函数组成的目标函数表示为：

本发明采取迭代的框架联合跨视角欧氏距离约束和跨视角中心度量约束采用迭代的方式对不同视角关联的网络进行参数优化和更新。给定训练样本和视角关联的深度网络，本发明首先用跨视角欧氏距离约束进行参数更新，等到优化收敛，改为用跨视角中心度量约束进行参数更新和网络优化，等到收敛之后再次使用跨视角欧氏距离约束进行优化，如此迭代反复，直到网络参数最终彻底收敛为止。迭代优化过程能达到一个从坏到好的调优效果，每一步都能保证算法得到更好的优化结果。

实施例2

本实施例通过实验对方法的效果进行说明，实验数据库选择CUHK03行人数据库和SYSU-mREID行人数据库：其中CUHK03数据库包含1467个不同的行人，超过14000张图像，选择其中1367个行人的图像组成训练集，剩余的100个行人则作为测试集；SYSU-mREID数据集包含502人的超过24000张的图像，选择其中251人进行训练，剩余251人进行测试。CUHK03行人数据库和SYSU-mREID行人数据库的实例如图2所示。

本发明选择Alexnet作为初始化网络，在CUHK03和SYSU-mREID数据库上验证所提方法的有效性。实验结果如图3所示，可以看到，在加入了迭代的跨视角欧氏距离约束和跨视角中心度量约束之后，Alexnet网络在CUHK03数据库上的准确率提升了17.5％，在SYSU-mREID数据库上的准确率提升了7.1％。

进一步地，在CUHK03数据库上验证所提出的跨视角欧氏距离约束、跨视角中心度量约束和迭代优化更新策略的有效性，如图4所示。由图4可得，跨视角中心度量约束提高了14.16％的识别准确率，跨视角中心度量约束提高了12.32％的识别准确率，而迭代优化更新策略则在跨视角中心度量约束基础上提高了5.18％的识别准确率。

本实施例还将本发明的方法与现有的一些主流的基于传统描述子和深度网络的方法进行了比较，在CUHK03数据库上的比较结果如图5所示，而在SYSU-mREID数据库上的比较结果如图6所示，通过以上比较结果可知，Alexnet网络在加入了ICV-ECCL之后，识别准确率已经达到了领域先进水平。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于视角关联与深度网络学习的行人再识别方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于视角关联与深度网络学习的行人再识别方法，其特征在于：所述深度网络为Alexnet深度网络。

3.根据权利要求1所述的基于视角关联与深度网络学习的行人再识别方法，其特征在于：所述步骤S2中，1）首先使深度网络通过跨视角欧氏距离约束进行参数的更新，直至参数优化收敛；2）然后使深度网络通过跨视角中心度量约束进行参数更新和优化，直至参数优化收敛；3）然后再次使深度网络通过跨视角中心度量约束进行优化；重复迭代1）、2）、3），直至深度网络彻底收敛。