CN108491884A - 基于轻量级网络的行人再识别系统及实现方法 - Google Patents
基于轻量级网络的行人再识别系统及实现方法 Download PDFInfo
- Publication number
- CN108491884A CN108491884A CN201810259439.4A CN201810259439A CN108491884A CN 108491884 A CN108491884 A CN 108491884A CN 201810259439 A CN201810259439 A CN 201810259439A CN 108491884 A CN108491884 A CN 108491884A
- Authority
- CN
- China
- Prior art keywords
- network
- module
- pedestrian
- training
- lightweight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 238000012360 testing method Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000001537 neural effect Effects 0.000 claims abstract description 10
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000013434 data augmentation Methods 0.000 claims abstract description 7
- 230000000694 effects Effects 0.000 claims description 17
- 238000013519 translation Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 10
- 230000001965 increasing effect Effects 0.000 claims description 8
- 238000000205 computational method Methods 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 5
- 238000002474 experimental method Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003475 lamination Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 102100040160 Rabankyrin-5 Human genes 0.000 description 1
- 101710086049 Rabankyrin-5 Proteins 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于轻量级网络的行人再识别系统及实现方法,系统包括:图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块;所述图像处理模块通过数据增广技术增加图片数据量以及图片的变化性;所述行人再识别神经网络训练模块包括神经网络构架模块和网络训练模块;所述神经网络构架模块根据神经网络的特点,构建轻量级双通道神经网络,所述网络训练模块,对扩充后的图像数据进行训练;所述测试模块用于验证行人测试系统的性能,所述测试性能通过累计匹配特性曲线和Rank‑k正确率来表征。本发明通过轻量级双通道网络来实现,通过加入两个子网络,使本发明的轻量级网络能更好的去学习有用的信息,提取的特征可以更好地识别行人。
Description
技术领域
本发明涉及行人再识别的技术领域,更具体地说,涉及一种基于轻量级网络的行人再识别系统及实现方法。
背景技术
行人再标识,也被称为行人再识别,主要的任务是为了从视角不重叠的摄像机拍摄到的人物图片中,识别出特定的人来,如图1所示。如今的生活中,许多的场所都安装监控摄像头,但如果只是依靠人工来进行识别,不仅浪费时间和金钱,同时得到的结果也不尽人意。通过人工来操作,人们更容易于依赖自己的主观判断,不容易有一个客观的评价,通过人工来进行识别准确率不高。
用深度学习做行人再识别的方法有很多。例如,在“Person Re-Identificationby camera correlation aware feature augmentation”中则是利用Alexnet提取特征,然后利用度量学习来进行行人再识别。在“Learning Deep Feature Representations withGuided Dropout for Person Re-identification”中,文章提出依据各个数据库来使用随机忽略神经网络的某些神经元,所用的神经网络参数规模大,不适合在内存受限的设备上使用。"Deeply-Learned Part-Aligned Representations for Person Re-Identification"中这是使用googlenet来做图像对准,然后匹配。
现有的基于深度学习的行人再识别系统,追求识别效果的提升而采用很深、参数规模很大的神经网络,识别效果不错,但庞大的神经网络无法在内存受限的设备上运行。
首先,庞大的神经网络训练速度慢;对于分布式数据并行训练,服务器之间的交互时间和神经网络的规模成正比关系,神经网络的规模大,训练慢。
其次,庞大的神经网络传输慢;应用了神经网络技术的领域,例如车联网,内置的程序更新如果采用大型网络,那下载更新应用速度会变得更慢。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于轻量级网络的行人再识别系统,应用于内存受限的设备上,由于参数规模小,在并行化运算过程中,各服务器的交互快,训练时间少;对应使用轻量级网络的程序,更新下载速度快。
为了达到上述目的,本发明采用以下技术方案:
本发明基于轻量级网络的行人再识别系统,包括:图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块;
所述图像处理模块,用于通过数据增广技术增加图片数据量以及图片的变化性,以达到神经网络模型训练结果的提升;
所述行人再识别神经网络训练模块包括神经网络构架模块和网络训练模块;
所述神经网络构架模块,用于根据神经网络的特点,构建轻量级双通道神经网络,所述神经网络构架模块,采用如下的策略构建神经网络;
A、利用全局池化层来代替全连接层,用全局池化层可大大减少参数量;
B、采用bottle-neck的网络结构,用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层;
C、通过增加使用双通道轻量级网络提升网络性能;
所述网络训练模块,将训练数据集合划分为两个数据子集合,一个作为训练集合,一个作为验证集合,对扩充后的图像数据进行训练;
所述行人再识别系统测试模块用于验证行人测试系统的性能,所述测试性能通过累计匹配特性曲线和Rank-k正确率来表征。
作为优选的技术方案,所述图像处理模块包括旋转模块、平移模块、随机剪裁模块、颜色增强模块、尺度变换模块、噪声模块以及随机擦除模块;
所述旋转模块,用于将原始图片旋转来获得图片数据的扩充;
所述平移模块,用于图像平移变换,通过移动若干像素点来获得图片数据的扩充;
所述颜色增强模块,用于通过对图片亮度、饱和度和对比度的变化来获得颜色的多种变换,来提高图片数据量;
所述尺度变换模块,用于改变图片的尺度大小;
所述噪声模块,用于通过在图片加入噪声来增加图片数据的多样性;
所述随机擦除模块,通过随机选取图片的局部区域用随机的值去代替原来的值,以达到类似遮挡的效果。
作为优选的技术方案,所述神经网络构架模块是在caffe设计神经网络结构,并编写训练代码和交叉验证代码。
作为优选的技术方案,所述双通道轻量级网络的网络结构如下:
所述双通道轻量级网络由两个子通道组成,每个子通道由三个Fire模块和一个卷积层组成,其中Fire模块是来自SqueezeNet的组件,最后,两个子通道会由一个Fusion层连接在一起,经过一个softmax层进行训练。
作为优选的技术方案,所述网络训练模块,采用下述具体方法进行训练:
首先,将训练数据分成两个部分,一个作为训练数据一个作为验证集数据;
其次,将训练数据进行数据扩充,输入到双通道轻量级神经网络训练,并用验证集合来验证实验的效果;
最后,在训练的过程中,当损失函数收敛时候,停止训练。
作为优选的技术方案,所述累计匹配特性曲线的计算方法如下:给定一张测试样本行人图片,经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离,然后将这些距离从小到大排序,距离越小表示样本越有可能属于同一类;
所述Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率,由此得到累计匹配特性曲线,累计匹配特性曲线横坐标是排名1到k,纵坐标是从Rank-1到Rank-k的正确率,随排名增大,正确率升高,曲线位置越高,表示分类的效果越好。
本发明基于轻量级网络的行人再识别系统的实现方法,包括下述步骤:
S1、图像数据预处理,利用数据增广技术增加图片数据量以及图片的变化性,以达到神经网络模型训练结果的提升;
S2、在caffe设计神经网络结构,编写训练代码和交叉验证代码,将训练数据集合划分为两个数据子集合,一个作为训练集合,一个作为验证集合,所述神经网络结构采用下述策略构建:
A、利用全局池化层来代替全连接层,用全局池化层减少参数量;
B、采用bottle-neck的网络结构,用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层;
C、通过增加使用双通道轻量级网络提升网络性能;
S3、对扩充后的图像数据进行训练,训练方法如下:
根据数据集合的人数,将一半的人的数据用于训练,用剩下的一半人的数据用来测试,使用的损失函数是softmax损失函数,并采用随机梯度下降的方法进行训练。
作为优选的技术方案,步骤S1中,采用旋转、平移、随机裁剪、颜色增强、尺度变换、噪声以及随机擦除方式增加图片数量。
作为优选的技术方案,步骤S3之后,还包括对行人再识别系统测试的步骤,测试性能通过累计匹配特性曲线和Rank-k正确率来表征,
所述累计匹配特性曲线的计算方法如下:给定一张测试样本行人图片,经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离,然后将这些距离从小到大排序,距离越小表示样本越有可能属于同一类;
所述Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率,由此得到累计匹配特性曲线,累计匹配特性曲线横坐标是排名1到k,纵坐标是从Rank-1到Rank-k的正确率,随排名增大,正确率升高,曲线位置越高,表示分类的效果越好。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明的网络规模小,通过构建规模小的神经网络,利用全局池化层来代替全连接层;由于全连接层所含有的参数规模在一个神经网络中占有很大的比重,用全局池化层可以大大减少参数。
2、本发明采用bottle-neck的网络结构,用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层的做法。
3、本发明通过加入双通道来获得特征互补特征,以此提高网络的性能。
附图说明
图1是本发明行人再标识的原理示意图;
图2是本发明基于轻量级双通道网络的行人重识别系统原理图;
图3是本发明基于轻量级双通道网络的行人重识别方法流程图;
图4(a)是处理时的原图;
图4(b)是加了颜色扰动的示意图;
图4(c)是对原图进行随机裁剪的示意图;
图4(d)是加了高斯噪声的结果的示意图;
图4(e)和图4(f)是对原图进行不同角度翻转得到的示意图;
图5是本发明双通道轻量级网络的结构示意图;
图6是本发明Fire模块的结构示意图;
图7是本发明训练模量流程图;
图8是本发明对行人重识别系统的测试流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
术语解释:bottle-neck:结构上细长的神经网络,参数规模较小。
累计匹配特性曲线:(Cumulative Matching Characteristic Curve,简称CMC曲线);其计算方法如下,给定一张测试样本行人图片,经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离。
Rank-k正确率:Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率,由此得到累计匹配特性曲线。
如图2示,本实施例1的基于轻量级网络的行人再识别系统,包括:图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块。
所述图像处理模块,用于通过数据增广技术增加图片数据量以及图片的变化性,以达到神经网络模型训练结果的提升;所述图像处理模块包括旋转模块、平移模块、随机剪裁模块、颜色增强模块、尺度变换模块、噪声模块以及随机擦除模块;
所述旋转模块,用于将原始图片旋转来获得图片数据的扩充;
所述平移模块,用于图像平移变换,通过移动若干像素点来获得图片数据的扩充;
所述颜色增强模块,用于通过对图片亮度、饱和度和对比度的变化来获得颜色的多种变换,来提高图片数据量;
所述尺度变换模块,用于改变图片的尺度大小;
所述噪声模块,用于通过在图片加入噪声来增加图片数据的多样性;
所述随机擦除模块,通过随机选取图片的局部区域用随机的值去代替原来的值,以达到类似遮挡的效果。
所述行人再识别神经网络训练模块包括神经网络构架模块和网络训练模块;
所述神经网络构架模块,神经网络构架模块是在caffe设计神经网络结构,并编写训练代码和交叉验证代码,用于根据神经网络的特点,构建轻量级双通道神经网络,所述神经网络构架模块,采用如下的策略构建神经网络;
A、利用全局池化层来代替全连接层,用全局池化层可大大减少参数量;
B、采用bottle-neck的网络结构,用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层;
C、通过增加使用双通道轻量级网络提升网络性能;
所述网络训练模块,将训练数据集合划分为两个数据子集合,一个作为训练集合,一个作为验证集合,对扩充后的图像数据进行训练。
所述双通道轻量级网络由两个子通道组成,每个子通道由三个Fire模块和一个卷积层组成,其中Fire模块是来自SqueezeNet的组件,最后,两个子通道会由一个Fusion层连接在一起,经过一个softmax层进行训练。所述FIRE模块是取自文章“SqueezeNet:AlexNet-level accuracy with 50x fewer parameters and<0.5MB model size”。
本发明的系统识别效果好,通过双通道子网络来实现,两个子网络的加入,使得本发明的轻量级网络能更好的去学习有用的信息,提取的特征可以更好地识别行人。
实施例2
本实施例2是基于上述基于轻量级网络的行人再识别系统对应的行人再识别方法,如图3所示,包括下述步骤:
(1)图像数据处理,利用数据增广技术增加图片数据量以及图片的变化性,以达到神经网络模型训练结果的提升;
对图4(a)的原图进行扩充,分别得到了图4(b)-图4(f),常见的数据扩充方法有如下,
(1-1)旋转;将原始图片旋转一定角度,来获得数据的扩充,学习旋转不变的特征。
(1-2)平移;图像平移变换,通过移动若干个像素点来获得数据的扩充。
(1-3)随机裁剪;对一个图片随机裁剪某个局部,来达到数据扩充的目的。
(1-4)颜色增强;通过对图片亮度、饱和度和对比度的变化来获得颜色的多种变换,以此来提高数据量。
(1-5)尺度变换;改变图片的尺度大小。
(1-6)噪声;通过在图片加入噪声来增加图片数据的多样性。
(1-7)随机擦除;随机选取图片的局部区域用随机的值去代替原来的值,以达到类似遮挡的效果;可以提高网络的泛化能力。
S2、在caffe设计神经网络结构,编写训练代码和交叉验证代码,将训练数据集合划分为两个数据子集合,一个作为训练集合,一个作为验证集合,所述神经网络结构采用下述策略构建:
A、利用全局池化层来代替全连接层,用全局池化层减少参数量;
B、采用bottle-neck的网络结构,用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层,本发明采用了文章“SqueezeNet:AlexNet-level accuracy with50x fewer parameters and<0.5MB model size”中的Fire模块,如图5、图6所示;
C、通过增加使用双通道轻量级网络提升网络性能;
S3、对扩充后的图像数据进行训练,如图7所示,训练方法如下:
所用的数据集合总共有1501个人,我们取训练的数据是751人,对于数据扩充后的训练数据,本发明依然按照未扩充的方法训练。不同在于,此时需要对caffe训练数据的接口文件增添扩充了图片路径。
S4、完成训练后,对系统进行测试,测试方法如图8所示,具体为:
本发明将测试数据分成两个部分,一个Gallery集合,一个Prob集合。其中,Gallery集合给定类标,是已知信息。Prob集合的数据类别不给出。本发明通过计算Prob和Gallery集合中每个样本之间的距离,来计算相似度。最后通过CMC曲线以及RANK-1来评价我们识别的准确率。
为了验证本发明的有效性,本发明在Market-1501数据库上进行实验。这个数据库是充满挑战性的数据库,它具有多种跨摄像头带来的问题,例如,遮挡、光照变化、角度变化和背景不一致等问题。这个数据库中,总共有32,668张标注好的框出来的图片,来自与1501个人。拍摄的地点是清华大学的超市。六个摄像头被使用,其中5个是高分辨率的,一个是低分辨率的。
验证模型性能的主要方式是:
累计匹配特性曲线(Cumulative Matching Characteristic Curve,简称CMC曲线),其计算方法如下,给定一张测试样本行人图片,经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离。然后将这些距离从小到大排序,距离越小表示样本越有可能属于同一类。
Rank-k正确率,Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率,由此得到累计匹配特性曲线。累计匹配特性曲线横坐标是排名1到k,纵坐标是从Rank-1到Rank-k的正确率,随排名增大,正确率升高。一般比较看重排名靠前面的正确率,比如Rank-1到Rank-20正确率。曲线位置越高,表示分类的效果越好。
实验结果:
本实验采用标准的训练测试方案,同时,还加入只用一个通道的网络比较,得到如表1的实验结果:双通道的性能优于单通道的性能;网络的参数规模是4.1M,远远小于常用的240M的ALEXNET,且识别效果良好。其中,本发明提到的参数规模指的是将网络参数存储所需要的字节数。
表1实验结果
通过上述实验可以看出,使用轻量级的神经网络做行人再识别,现有用深度学习做行人再识别的神经网络规模都很大,例如采用resnet、alexnet来做行人再识别,网络的参数规模有几百兆,不适合在内存受限的设备上运行。而本发明提出的神经网络规模大小在4M左右,且识别效果良好,识别性能对比如表2所示。
表2性能比较
网络规模 | Rank1 | Rank5 | Rank5 | |
双通道轻量级网络 | 4.1M | 60.43%% | 75.72% | 84.88% |
AlexNet | 240M | 65.23% | 81.66% | 89.53% |
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (9)
1.基于轻量级网络的行人再识别系统,其特征在于,包括:图像处理模块、行人再识别神经网络训练模块以及行人再识别系统测试模块;
所述图像处理模块,用于通过数据增广技术增加图片数据量以及图片的变化性,以达到神经网络模型训练结果的提升;
所述行人再识别神经网络训练模块包括神经网络构架模块和网络训练模块;
所述神经网络构架模块,用于根据神经网络的特点,构建轻量级双通道神经网络,所述神经网络构架模块,采用如下的策略构建神经网络;
A、利用全局池化层来代替全连接层,用全局池化层可大大减少参数量;
B、采用bottle-neck的网络结构,用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层;
C、通过增加使用双通道轻量级网络提升网络性能;
所述网络训练模块,将训练数据集合划分为两个数据子集合,一个作为训练集合,一个作为验证集合,对扩充后的图像数据进行训练;
所述行人再识别系统测试模块用于验证行人测试系统的性能,所述测试性能通过累计匹配特性曲线和Rank-k正确率来表征。
2.根据权利要求1所述基于轻量级网络的行人再识别系统,其特征在于,所述图像处理模块包括旋转模块、平移模块、随机剪裁模块、颜色增强模块、尺度变换模块、噪声模块以及随机擦除模块;
所述旋转模块,用于将原始图片旋转来获得图片数据的扩充;
所述平移模块,用于图像平移变换,通过移动若干像素点来获得图片数据的扩充;
所述颜色增强模块,用于通过对图片亮度、饱和度和对比度的变化来获得颜色的多种变换,来提高图片数据量;
所述尺度变换模块,用于改变图片的尺度大小;
所述噪声模块,用于通过在图片加入噪声来增加图片数据的多样性;
所述随机擦除模块,通过随机选取图片的局部区域用随机的值去代替原来的值,以达到类似遮挡的效果。
3.根据权利要求1所述基于轻量级网络的行人再识别系统,其特征在于,所述神经网络构架模块是在caffe设计神经网络结构,并编写训练代码和交叉验证代码。
4.根据权利要求1所述基于轻量级网络的行人再识别系统,其特征在于,所述双通道轻量级网络的网络结构如下:
所述双通道轻量级网络由两个子通道组成,每个子通道由三个Fire模块和一个卷积层组成,其中Fire模块是来自SqueezeNet的组件,最后,两个子通道会由一个Fusion层连接在一起,经过一个softmax层进行训练。
5.根据权利要求1所述基于轻量级网络的行人再识别系统,其特征在于,所述网络训练模块,采用下述具体方法进行训练:
首先,将训练数据分成两个部分,一个作为训练数据一个作为验证集数据;
其次,将训练数据进行数据扩充,输入到双通道轻量级神经网络训练,并用验证集合来验证实验的效果;
最后,在训练的过程中,当损失函数收敛时候,停止训练。
6.根据权利要求1所述基于轻量级网络的行人再识别系统,其特征在于,
所述累计匹配特性曲线的计算方法如下:给定一张测试样本行人图片,经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离,然后将这些距离从小到大排序,距离越小表示样本越有可能属于同一类;
所述Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率,由此得到累计匹配特性曲线,累计匹配特性曲线横坐标是排名1到k,纵坐标是从Rank-1到Rank-k的正确率,随排名增大,正确率升高,曲线位置越高,表示分类的效果越好。
7.根据权利要求1-6中任一项所述基于轻量级网络的行人再识别系统的实现方法,其特征在于,包括下述步骤:
S1、图像数据预处理,利用数据增广技术增加图片数据量以及图片的变化性,以达到神经网络模型训练结果的提升;
S2、在caffe设计神经网络结构,编写训练代码和交叉验证代码,将训练数据集合划分为两个数据子集合,一个作为训练集合,一个作为验证集合,所述神经网络结构采用下述策略构建:
A、利用全局池化层来代替全连接层,用全局池化层减少参数量;
B、采用bottle-neck的网络结构,用1*1的卷积层与3*3的卷积层的组合去代替传统的只用3*3的卷积层;
C、通过增加使用双通道轻量级网络提升网络性能;
S3、对扩充后的图像数据进行训练,训练方法如下:
根据数据集合的人数,将一半的人的数据用于训练,用剩下的一半人的数据用来测试,使用的损失函数是softmax损失函数,并采用随机梯度下降的方法进行训练。
8.根据权利要求7所述基于轻量级网络的行人再识别系统的实现方法,其特征在于,步骤S1中,采用旋转、平移、随机裁剪、颜色增强、尺度变换、噪声以及随机擦除方式增加图片数量。
9.根据权利要求7所述基于轻量级网络的行人再识别系统的实现方法,其特征在于,步骤S3之后,还包括对行人再识别系统测试的步骤,测试性能通过累计匹配特性曲线和Rank-k正确率来表征,
所述累计匹配特性曲线的计算方法如下:给定一张测试样本行人图片,经过特征提取用匹配模型得到测试样本和图库中所有样本之间的距离,然后将这些距离从小到大排序,距离越小表示样本越有可能属于同一类;
所述Rank-k正确率是测试样本与图库中从距离排名第一到排名第k的样本的累计匹配正确率,由此得到累计匹配特性曲线,累计匹配特性曲线横坐标是排名1到k,纵坐标是从Rank-1到Rank-k的正确率,随排名增大,正确率升高,曲线位置越高,表示分类的效果越好。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810259439.4A CN108491884A (zh) | 2018-03-27 | 2018-03-27 | 基于轻量级网络的行人再识别系统及实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810259439.4A CN108491884A (zh) | 2018-03-27 | 2018-03-27 | 基于轻量级网络的行人再识别系统及实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108491884A true CN108491884A (zh) | 2018-09-04 |
Family
ID=63316569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810259439.4A Pending CN108491884A (zh) | 2018-03-27 | 2018-03-27 | 基于轻量级网络的行人再识别系统及实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108491884A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583502A (zh) * | 2018-11-30 | 2019-04-05 | 天津师范大学 | 一种基于对抗擦除注意力机制的行人再识别方法 |
CN109635643A (zh) * | 2018-11-01 | 2019-04-16 | 暨南大学 | 一种基于深度学习的快速人脸识别方法 |
CN109740480A (zh) * | 2018-12-26 | 2019-05-10 | 浙江捷尚视觉科技股份有限公司 | 一种监控场景下的基于非机动车再识别的行人检索方法 |
CN110008913A (zh) * | 2019-04-08 | 2019-07-12 | 南京工业大学 | 基于姿态估计与视点机制融合的行人再识别方法 |
CN110096947A (zh) * | 2019-03-15 | 2019-08-06 | 昆明理工大学 | 一种基于深度学习的行人再识别算法 |
CN110516533A (zh) * | 2019-07-11 | 2019-11-29 | 同济大学 | 一种基于深度度量的行人再辨识方法 |
CN111310591A (zh) * | 2020-01-20 | 2020-06-19 | 复旦大学 | 多类型样本数据制作装置及方法 |
CN111523469A (zh) * | 2020-04-23 | 2020-08-11 | 苏州浪潮智能科技有限公司 | 一种行人重识别方法、系统、设备及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130343642A1 (en) * | 2012-06-21 | 2013-12-26 | Siemens Corporation | Machine-learnt person re-identification |
CN106778527A (zh) * | 2016-11-28 | 2017-05-31 | 中通服公众信息产业股份有限公司 | 一种基于三重损失的改进的神经网络行人再识别方法 |
CN107273502A (zh) * | 2017-06-19 | 2017-10-20 | 重庆邮电大学 | 一种基于空间认知学习的图像地理标注方法 |
CN107609399A (zh) * | 2017-09-09 | 2018-01-19 | 北京工业大学 | 基于nin神经网络的恶意代码变种检测方法 |
CN107704866A (zh) * | 2017-06-15 | 2018-02-16 | 清华大学 | 基于新型神经网络的多任务场景语义理解模型及其应用 |
CN107808129A (zh) * | 2017-10-17 | 2018-03-16 | 南京理工大学 | 一种基于单个卷积神经网络的面部多特征点定位方法 |
-
2018
- 2018-03-27 CN CN201810259439.4A patent/CN108491884A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130343642A1 (en) * | 2012-06-21 | 2013-12-26 | Siemens Corporation | Machine-learnt person re-identification |
CN106778527A (zh) * | 2016-11-28 | 2017-05-31 | 中通服公众信息产业股份有限公司 | 一种基于三重损失的改进的神经网络行人再识别方法 |
CN107704866A (zh) * | 2017-06-15 | 2018-02-16 | 清华大学 | 基于新型神经网络的多任务场景语义理解模型及其应用 |
CN107273502A (zh) * | 2017-06-19 | 2017-10-20 | 重庆邮电大学 | 一种基于空间认知学习的图像地理标注方法 |
CN107609399A (zh) * | 2017-09-09 | 2018-01-19 | 北京工业大学 | 基于nin神经网络的恶意代码变种检测方法 |
CN107808129A (zh) * | 2017-10-17 | 2018-03-16 | 南京理工大学 | 一种基于单个卷积神经网络的面部多特征点定位方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635643A (zh) * | 2018-11-01 | 2019-04-16 | 暨南大学 | 一种基于深度学习的快速人脸识别方法 |
CN109635643B (zh) * | 2018-11-01 | 2023-10-31 | 暨南大学 | 一种基于深度学习的快速人脸识别方法 |
CN109583502A (zh) * | 2018-11-30 | 2019-04-05 | 天津师范大学 | 一种基于对抗擦除注意力机制的行人再识别方法 |
CN109583502B (zh) * | 2018-11-30 | 2022-11-18 | 天津师范大学 | 一种基于对抗擦除注意力机制的行人再识别方法 |
CN109740480A (zh) * | 2018-12-26 | 2019-05-10 | 浙江捷尚视觉科技股份有限公司 | 一种监控场景下的基于非机动车再识别的行人检索方法 |
CN110096947A (zh) * | 2019-03-15 | 2019-08-06 | 昆明理工大学 | 一种基于深度学习的行人再识别算法 |
CN110008913A (zh) * | 2019-04-08 | 2019-07-12 | 南京工业大学 | 基于姿态估计与视点机制融合的行人再识别方法 |
CN110516533A (zh) * | 2019-07-11 | 2019-11-29 | 同济大学 | 一种基于深度度量的行人再辨识方法 |
CN111310591A (zh) * | 2020-01-20 | 2020-06-19 | 复旦大学 | 多类型样本数据制作装置及方法 |
CN111523469A (zh) * | 2020-04-23 | 2020-08-11 | 苏州浪潮智能科技有限公司 | 一种行人重识别方法、系统、设备及计算机可读存储介质 |
WO2021212737A1 (zh) * | 2020-04-23 | 2021-10-28 | 苏州浪潮智能科技有限公司 | 一种行人重识别方法、系统、设备及计算机可读存储介质 |
CN111523469B (zh) * | 2020-04-23 | 2022-02-18 | 苏州浪潮智能科技有限公司 | 一种行人重识别方法、系统、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108491884A (zh) | 基于轻量级网络的行人再识别系统及实现方法 | |
Porzi et al. | Predicting and understanding urban perception with convolutional neural networks | |
CN106599907B (zh) | 多特征融合的动态场景分类方法与装置 | |
CN104915643B (zh) | 一种基于深度学习的行人再标识方法 | |
CN107977647B (zh) | 一种适合公安实战的人脸识别算法评测方法 | |
Kalka et al. | Ijb–s: Iarpa janus surveillance video benchmark | |
CN109948425A (zh) | 一种结构感知自注意和在线实例聚合匹配的行人搜索方法及装置 | |
CN109241808A (zh) | 一种时尚图像中二维码自动筛选方法 | |
CN108256426A (zh) | 一种基于卷积神经网络的人脸表情识别方法 | |
CN106776842A (zh) | 多媒体数据检测方法及装置 | |
CN105574550A (zh) | 一种车辆识别方法及装置 | |
CN110533051B (zh) | 基于卷积神经网络的x光安检图像中违禁品自动检测方法 | |
CN108960409A (zh) | 标注数据生成方法、设备及计算机可读存储介质 | |
CN108764269A (zh) | 一种基于时空约束增量学习的跨数据集行人再识别方法 | |
CN109509187A (zh) | 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法 | |
CN107092883A (zh) | 物体识别追踪方法 | |
Parikh | Recognizing jumbled images: The role of local and global information in image classification | |
CN106022273A (zh) | 基于动态样本选择策略的bp神经网络手写体识别系统 | |
CN110245711A (zh) | 基于角度旋转生成网络的sar目标识别方法 | |
Chandran et al. | Missing child identification system using deep learning and multiclass SVM | |
CN113780435B (zh) | 车辆损伤检测方法、装置、设备及存储介质 | |
CN106126593B (zh) | 基于网络开放照片资源的地表实景信息生成方法及装置 | |
CN109919060A (zh) | 一种基于特征匹配的身份证内容识别系统及方法 | |
CN109801265A (zh) | 一种基于卷积神经网络的实时输电设备异物检测系统 | |
CN109977832A (zh) | 一种图像处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180904 |
|
RJ01 | Rejection of invention patent application after publication |