CN108491884A

CN108491884A - 基于轻量级网络的行人再识别系统及实现方法

Info

Publication number: CN108491884A
Application number: CN201810259439.4A
Authority: CN
Inventors: 郑伟诗; 吴伟基; 吴岸聪
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2018-03-27
Filing date: 2018-03-27
Publication date: 2018-09-04

Abstract

本发明公开了一种基于轻量级网络的行人再识别系统及实现方法，系统包括：图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块；所述图像处理模块通过数据增广技术增加图片数据量以及图片的变化性；所述行人再识别神经网络训练模块包括神经网络构架模块和网络训练模块；所述神经网络构架模块根据神经网络的特点，构建轻量级双通道神经网络，所述网络训练模块，对扩充后的图像数据进行训练；所述测试模块用于验证行人测试系统的性能，所述测试性能通过累计匹配特性曲线和Rank‑k正确率来表征。本发明通过轻量级双通道网络来实现，通过加入两个子网络，使本发明的轻量级网络能更好的去学习有用的信息，提取的特征可以更好地识别行人。

Description

基于轻量级网络的行人再识别系统及实现方法

技术领域

本发明涉及行人再识别的技术领域，更具体地说，涉及一种基于轻量级网络的行人再识别系统及实现方法。

背景技术

行人再标识，也被称为行人再识别，主要的任务是为了从视角不重叠的摄像机拍摄到的人物图片中，识别出特定的人来，如图1所示。如今的生活中，许多的场所都安装监控摄像头，但如果只是依靠人工来进行识别，不仅浪费时间和金钱，同时得到的结果也不尽人意。通过人工来操作，人们更容易于依赖自己的主观判断，不容易有一个客观的评价，通过人工来进行识别准确率不高。

用深度学习做行人再识别的方法有很多。例如，在“Person Re-Identificationby camera correlation aware feature augmentation”中则是利用Alexnet提取特征，然后利用度量学习来进行行人再识别。在“Learning Deep Feature Representations withGuided Dropout for Person Re-identification”中，文章提出依据各个数据库来使用随机忽略神经网络的某些神经元，所用的神经网络参数规模大，不适合在内存受限的设备上使用。"Deeply-Learned Part-Aligned Representations for Person Re-Identification"中这是使用googlenet来做图像对准，然后匹配。

现有的基于深度学习的行人再识别系统，追求识别效果的提升而采用很深、参数规模很大的神经网络，识别效果不错，但庞大的神经网络无法在内存受限的设备上运行。

首先，庞大的神经网络训练速度慢；对于分布式数据并行训练，服务器之间的交互时间和神经网络的规模成正比关系，神经网络的规模大，训练慢。

其次，庞大的神经网络传输慢；应用了神经网络技术的领域，例如车联网，内置的程序更新如果采用大型网络，那下载更新应用速度会变得更慢。

发明内容

本发明的主要目的在于克服现有技术的缺点与不足，提供一种基于轻量级网络的行人再识别系统，应用于内存受限的设备上，由于参数规模小，在并行化运算过程中，各服务器的交互快，训练时间少；对应使用轻量级网络的程序，更新下载速度快。

为了达到上述目的，本发明采用以下技术方案：

本发明基于轻量级网络的行人再识别系统，包括：图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块；

所述图像处理模块，用于通过数据增广技术增加图片数据量以及图片的变化性，以达到神经网络模型训练结果的提升；

所述行人再识别神经网络训练模块包括神经网络构架模块和网络训练模块；

所述神经网络构架模块，用于根据神经网络的特点，构建轻量级双通道神经网络，所述神经网络构架模块，采用如下的策略构建神经网络；

A、利用全局池化层来代替全连接层，用全局池化层可大大减少参数量；

B、采用bottle-neck的网络结构，用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层；

C、通过增加使用双通道轻量级网络提升网络性能；

所述网络训练模块，将训练数据集合划分为两个数据子集合，一个作为训练集合，一个作为验证集合，对扩充后的图像数据进行训练；

所述行人再识别系统测试模块用于验证行人测试系统的性能，所述测试性能通过累计匹配特性曲线和Rank-k正确率来表征。

作为优选的技术方案，所述图像处理模块包括旋转模块、平移模块、随机剪裁模块、颜色增强模块、尺度变换模块、噪声模块以及随机擦除模块；

所述旋转模块，用于将原始图片旋转来获得图片数据的扩充；

所述平移模块，用于图像平移变换，通过移动若干像素点来获得图片数据的扩充；

所述颜色增强模块，用于通过对图片亮度、饱和度和对比度的变化来获得颜色的多种变换，来提高图片数据量；

所述尺度变换模块，用于改变图片的尺度大小；

所述噪声模块，用于通过在图片加入噪声来增加图片数据的多样性；

所述随机擦除模块，通过随机选取图片的局部区域用随机的值去代替原来的值，以达到类似遮挡的效果。

作为优选的技术方案，所述神经网络构架模块是在caffe设计神经网络结构，并编写训练代码和交叉验证代码。

作为优选的技术方案，所述双通道轻量级网络的网络结构如下：

所述双通道轻量级网络由两个子通道组成，每个子通道由三个Fire模块和一个卷积层组成，其中Fire模块是来自SqueezeNet的组件，最后，两个子通道会由一个Fusion层连接在一起，经过一个softmax层进行训练。

作为优选的技术方案，所述网络训练模块，采用下述具体方法进行训练：

首先，将训练数据分成两个部分，一个作为训练数据一个作为验证集数据；

其次，将训练数据进行数据扩充，输入到双通道轻量级神经网络训练，并用验证集合来验证实验的效果；

最后，在训练的过程中，当损失函数收敛时候，停止训练。

作为优选的技术方案，所述累计匹配特性曲线的计算方法如下：给定一张测试样本行人图片，经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离，然后将这些距离从小到大排序，距离越小表示样本越有可能属于同一类；

所述Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率，由此得到累计匹配特性曲线，累计匹配特性曲线横坐标是排名1到k，纵坐标是从Rank-1到Rank-k的正确率，随排名增大，正确率升高，曲线位置越高，表示分类的效果越好。

本发明基于轻量级网络的行人再识别系统的实现方法，包括下述步骤：

S1、图像数据预处理，利用数据增广技术增加图片数据量以及图片的变化性，以达到神经网络模型训练结果的提升；

S2、在caffe设计神经网络结构，编写训练代码和交叉验证代码，将训练数据集合划分为两个数据子集合，一个作为训练集合，一个作为验证集合，所述神经网络结构采用下述策略构建：

A、利用全局池化层来代替全连接层，用全局池化层减少参数量；

C、通过增加使用双通道轻量级网络提升网络性能；

S3、对扩充后的图像数据进行训练，训练方法如下：

根据数据集合的人数，将一半的人的数据用于训练，用剩下的一半人的数据用来测试，使用的损失函数是softmax损失函数，并采用随机梯度下降的方法进行训练。

作为优选的技术方案，步骤S1中，采用旋转、平移、随机裁剪、颜色增强、尺度变换、噪声以及随机擦除方式增加图片数量。

作为优选的技术方案，步骤S3之后，还包括对行人再识别系统测试的步骤，测试性能通过累计匹配特性曲线和Rank-k正确率来表征，

所述累计匹配特性曲线的计算方法如下：给定一张测试样本行人图片，经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离，然后将这些距离从小到大排序，距离越小表示样本越有可能属于同一类；

本发明与现有技术相比，具有如下优点和有益效果：

1、本发明的网络规模小，通过构建规模小的神经网络，利用全局池化层来代替全连接层；由于全连接层所含有的参数规模在一个神经网络中占有很大的比重，用全局池化层可以大大减少参数。

2、本发明采用bottle-neck的网络结构，用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层的做法。

3、本发明通过加入双通道来获得特征互补特征，以此提高网络的性能。

附图说明

图1是本发明行人再标识的原理示意图；

图2是本发明基于轻量级双通道网络的行人重识别系统原理图；

图3是本发明基于轻量级双通道网络的行人重识别方法流程图；

图4(a)是处理时的原图；

图4(b)是加了颜色扰动的示意图；

图4(c)是对原图进行随机裁剪的示意图；

图4(d)是加了高斯噪声的结果的示意图；

图4(e)和图4(f)是对原图进行不同角度翻转得到的示意图；

图5是本发明双通道轻量级网络的结构示意图；

图6是本发明Fire模块的结构示意图；

图7是本发明训练模量流程图；

图8是本发明对行人重识别系统的测试流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1

术语解释：bottle-neck：结构上细长的神经网络，参数规模较小。

累计匹配特性曲线：(Cumulative Matching Characteristic Curve，简称CMC曲线)；其计算方法如下，给定一张测试样本行人图片，经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离。

Rank-k正确率：Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率，由此得到累计匹配特性曲线。

如图2示，本实施例1的基于轻量级网络的行人再识别系统，包括：图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块。

所述图像处理模块，用于通过数据增广技术增加图片数据量以及图片的变化性，以达到神经网络模型训练结果的提升；所述图像处理模块包括旋转模块、平移模块、随机剪裁模块、颜色增强模块、尺度变换模块、噪声模块以及随机擦除模块；

所述尺度变换模块，用于改变图片的尺度大小；

所述神经网络构架模块，神经网络构架模块是在caffe设计神经网络结构，并编写训练代码和交叉验证代码，用于根据神经网络的特点，构建轻量级双通道神经网络，所述神经网络构架模块，采用如下的策略构建神经网络；

C、通过增加使用双通道轻量级网络提升网络性能；

所述网络训练模块，将训练数据集合划分为两个数据子集合，一个作为训练集合，一个作为验证集合，对扩充后的图像数据进行训练。

所述双通道轻量级网络由两个子通道组成，每个子通道由三个Fire模块和一个卷积层组成，其中Fire模块是来自SqueezeNet的组件，最后，两个子通道会由一个Fusion层连接在一起，经过一个softmax层进行训练。所述FIRE模块是取自文章“SqueezeNet:AlexNet-level accuracy with 50x fewer parameters and<0.5MB model size”。

本发明的系统识别效果好，通过双通道子网络来实现，两个子网络的加入，使得本发明的轻量级网络能更好的去学习有用的信息，提取的特征可以更好地识别行人。

实施例2

本实施例2是基于上述基于轻量级网络的行人再识别系统对应的行人再识别方法，如图3所示，包括下述步骤：

(1)图像数据处理，利用数据增广技术增加图片数据量以及图片的变化性，以达到神经网络模型训练结果的提升；

对图4(a)的原图进行扩充，分别得到了图4(b)-图4(f)，常见的数据扩充方法有如下，

(1-1)旋转；将原始图片旋转一定角度，来获得数据的扩充，学习旋转不变的特征。

(1-2)平移；图像平移变换，通过移动若干个像素点来获得数据的扩充。

(1-3)随机裁剪；对一个图片随机裁剪某个局部，来达到数据扩充的目的。

(1-4)颜色增强；通过对图片亮度、饱和度和对比度的变化来获得颜色的多种变换，以此来提高数据量。

(1-5)尺度变换；改变图片的尺度大小。

(1-6)噪声；通过在图片加入噪声来增加图片数据的多样性。

(1-7)随机擦除；随机选取图片的局部区域用随机的值去代替原来的值，以达到类似遮挡的效果；可以提高网络的泛化能力。

B、采用bottle-neck的网络结构，用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层，本发明采用了文章“SqueezeNet:AlexNet-level accuracy with50x fewer parameters and<0.5MB model size”中的Fire模块，如图5、图6所示；

C、通过增加使用双通道轻量级网络提升网络性能；

S3、对扩充后的图像数据进行训练，如图7所示，训练方法如下：

所用的数据集合总共有1501个人，我们取训练的数据是751人，对于数据扩充后的训练数据，本发明依然按照未扩充的方法训练。不同在于，此时需要对caffe训练数据的接口文件增添扩充了图片路径。

S4、完成训练后，对系统进行测试，测试方法如图8所示，具体为：

本发明将测试数据分成两个部分，一个Gallery集合，一个Prob集合。其中，Gallery集合给定类标，是已知信息。Prob集合的数据类别不给出。本发明通过计算Prob和Gallery集合中每个样本之间的距离，来计算相似度。最后通过CMC曲线以及RANK-1来评价我们识别的准确率。

为了验证本发明的有效性，本发明在Market-1501数据库上进行实验。这个数据库是充满挑战性的数据库，它具有多种跨摄像头带来的问题，例如，遮挡、光照变化、角度变化和背景不一致等问题。这个数据库中，总共有32，668张标注好的框出来的图片，来自与1501个人。拍摄的地点是清华大学的超市。六个摄像头被使用，其中5个是高分辨率的，一个是低分辨率的。

验证模型性能的主要方式是：

累计匹配特性曲线(Cumulative Matching Characteristic Curve，简称CMC曲线)，其计算方法如下，给定一张测试样本行人图片，经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离。然后将这些距离从小到大排序，距离越小表示样本越有可能属于同一类。

Rank-k正确率，Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率，由此得到累计匹配特性曲线。累计匹配特性曲线横坐标是排名1到k，纵坐标是从Rank-1到Rank-k的正确率，随排名增大，正确率升高。一般比较看重排名靠前面的正确率，比如Rank-1到Rank-20正确率。曲线位置越高，表示分类的效果越好。

实验结果：

本实验采用标准的训练测试方案，同时，还加入只用一个通道的网络比较，得到如表1的实验结果：双通道的性能优于单通道的性能；网络的参数规模是4.1M，远远小于常用的240M的ALEXNET，且识别效果良好。其中，本发明提到的参数规模指的是将网络参数存储所需要的字节数。

表1实验结果

通过上述实验可以看出，使用轻量级的神经网络做行人再识别,现有用深度学习做行人再识别的神经网络规模都很大，例如采用resnet、alexnet来做行人再识别，网络的参数规模有几百兆，不适合在内存受限的设备上运行。而本发明提出的神经网络规模大小在4M左右，且识别效果良好，识别性能对比如表2所示。

表2性能比较

	网络规模	Rank1	Rank5	Rank5
					双通道轻量级网络	4.1M	60.43％％	75.72％	84.88％
AlexNet	240M	65.23％	81.66％	89.53％

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.基于轻量级网络的行人再识别系统，其特征在于，包括：图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块；

C、通过增加使用双通道轻量级网络提升网络性能；

2.根据权利要求1所述基于轻量级网络的行人再识别系统，其特征在于，所述图像处理模块包括旋转模块、平移模块、随机剪裁模块、颜色增强模块、尺度变换模块、噪声模块以及随机擦除模块；

所述尺度变换模块，用于改变图片的尺度大小；

3.根据权利要求1所述基于轻量级网络的行人再识别系统，其特征在于，所述神经网络构架模块是在caffe设计神经网络结构，并编写训练代码和交叉验证代码。

4.根据权利要求1所述基于轻量级网络的行人再识别系统，其特征在于，所述双通道轻量级网络的网络结构如下：

5.根据权利要求1所述基于轻量级网络的行人再识别系统，其特征在于，所述网络训练模块，采用下述具体方法进行训练：

最后，在训练的过程中，当损失函数收敛时候，停止训练。

6.根据权利要求1所述基于轻量级网络的行人再识别系统，其特征在于，

7.根据权利要求1-6中任一项所述基于轻量级网络的行人再识别系统的实现方法，其特征在于，包括下述步骤：

C、通过增加使用双通道轻量级网络提升网络性能；

S3、对扩充后的图像数据进行训练，训练方法如下：

8.根据权利要求7所述基于轻量级网络的行人再识别系统的实现方法，其特征在于，步骤S1中，采用旋转、平移、随机裁剪、颜色增强、尺度变换、噪声以及随机擦除方式增加图片数量。

9.根据权利要求7所述基于轻量级网络的行人再识别系统的实现方法，其特征在于，步骤S3之后，还包括对行人再识别系统测试的步骤，测试性能通过累计匹配特性曲线和Rank-k正确率来表征，