CN107451607A

CN107451607A - 一种基于深度学习的典型人物的身份识别方法

Info

Publication number: CN107451607A
Application number: CN201710571449.7A
Authority: CN
Inventors: 贾伟光; 杨阳; 牟骏; 邢辰; 刘晓骐; 袁鑫; 刘云霞; 周林林; 李夏; 曾天亮
Original assignee: SHANDONG CHINA MAGNETIC VIDEO CO Ltd
Current assignee: Shandong Baoshengxin Information Technology Co ltd
Priority date: 2017-07-13
Filing date: 2017-07-13
Publication date: 2017-12-08
Anticipated expiration: 2037-07-13
Also published as: CN107451607B

Abstract

本发明涉及一种基于深度学习的典型人物的身份识别方法，涉及深度学习方法，从图像视频中自动判断典型人物的身份；包括构建具有标注信息的数据集；向加速区域生成神经网络输入具有标注信息的数据集得到模型框架，并进行模型训练得到典型人物身份识别的神经网络模型；利用训练后的典型人物身份识别的神经网络模型进行人物身份的识别和检测；即可较为成功的识别比较典型的人物身份，提高人物身份识别速度和准确性，在监狱管理和交通管理的工作中能起到很大的推进作用。

Description

一种基于深度学习的典型人物的身份识别方法

技术领域

本发明涉及人物识别领域，特别涉及一种基于深度学习的典型人物的身份识别方法。

背景技术

以下对本发明的相关技术背景进行说明，但这些说明并不一定构成本发明的现有技术。

传统的机器学习一般都是经过原始数据到特征提取器到分类器或者检测器，最后在得到结果；而深度学习则不需要人工设计特征提取器，机器本身就可自动学习获得的，非常适合变化多样，类别繁多的自然数据，具有非常好的泛化能力和鲁棒性。

目前可以实现典型人物身份识别的算法有很多种，比较传统的算法就是先用选择搜索进行候选区域的选择，然后再对其进行特征的提取，最后使用支持向量机等的分类器进行分类，最后得到一些可能的目标；但是这种传统的算法有很大的弊端，一是因为选择搜索非常的慢，这会消耗很长的时间，提高时间成本；二是因为像支持向量机之类的分类器分类结果并不理想，多样性差而且鲁棒性也不高。

现今出现的神经网络由于具有很强的特征提取的特点，所以已经将目标检测人物识别放到了神经网络上来做，出现了后来的快速区域卷积神经网络对典型人物的身份进行识别；但是其识别的速度，准确性仍旧不高。

因此，现有技术中需要一种能提高人物身份识别速度和准确性，增强实用性和价值性的解决方案。

发明内容

本发明的目的在于提出一种基于深度学习的典型人物的身份识别方法，增强识别的速度和准确性，具有很好的实用性和价值性。

根据本发明的一种基于深度学习的典型人物的身份识别方法，包括：

通过整合标注信息及图像建立具有标注信息的数据集；

构建加速区域生成神经网络，并向其输入具有标注信息的数据集得到模型框架；所述加速区域生成神经网络包括用于提取候选框的区域建议生成网络和用于检测并识别目标的快速区域卷积神经网络；

对模型框架进行模型训练得到典型人物身份识别的神经网络模型；

利用训练后的典型人物身份识别的神经网络模型进行人物身份的识别和检测。

根据本发明的一个优选的实施例，在建立具有标注信息的数据集之前，采用图像标注对收集的典型人物图像进行特征标注，同时生成标注信息。

根据本发明的再一个优选的实施例，所述标注信息包括图像的名字，位置的坐标以及标签，所述标签为典型人物的身份；所述特征标注采用框图的形式。

根据本发明的又一个优选的实施例，所述区域建议生成网络包括共享卷积层、滑动窗口、第一全连接层；所述快速区域卷积神经网络包括第一卷积层、池化层、第二全连接层；

向加速区域生成神经网络输入具有标注信息的数据集后进行典型人物身份识别的神经网络模型的框架构建，步骤如下：

首先具有标注信息的数据集传播入区域建议生成网络的共享卷积层用于进行原始特征的提取得到区域区域特征图，并且具有标注信息的数据集继续前向传播入快速区域卷积神经网络的第一卷积层用于进行特征的提取得到高维特征图；

经过共享卷积层得到的区域特征图通过第一全连接层分类后得到区域建议信息和区域得分信息；

将区域建议信息以及通过第一卷积层得到的高维特征图一起输入至快速区域卷积神经网络的池化层从而提取出区域建议信息的特征；

将得到的区域建议信息的特征通过第二全连接层分类得到分类得分信息和回归后的边界框，即分类层和回归层；

通过分类层确定类别，通过回归层确定位置，即可得到典型人物身份识别的神经网络模型的模型框架。

根据本发明的还一个优选的实施例，所述共享卷积层为包括五个卷积层的网络模型，通过共享卷积层产生原始图像的区域特征图；所述第一全连接层为两个全连接层。

根据本发明的再一个优选的实施例，所述区域特征图进入第一全连接层前需要经过滑动窗口，滑动窗口在特征图上进行滑动扫描，每个滑动窗口通过卷积层映射为256维的特征向量送入第一全连接层。

根据本发明的又一个优选的实施例，在对模型框架进行模型训练前，需要预先设置网络参数，对数据集的设置类别分类，对分类层和回归层的输出设置。

根据本发明的还一个优选的实施例，模型框架进行模型训练得到典型人物身份识别的神经网络模型，步骤如下：

区域建议生成网络的网络预训练，数据集中包括正样本、负样本，样本中只含有标签信息和位置信息；经过区域建议生成网络中的网络模型即共享卷积层对区域建议生成网络进行有监督预训练，利用网络模型中预先设置的网络参数对其进行初始化，用高斯分布对第一全连接层初始化；

区域建议生成网络的微调训练，数据集中包括物体类别的标签，也含有物体位置的标签，其中正样本表示前景、负样本表示背景，对正样本进行回归操作；并将正样本和负样本与真实区域重叠比较，且在训练过程中丢弃所有超出图像边界的滑动窗口，对超出图像边界的滑动窗口集采用极大值抑制，未超出图像边界的滑动窗口用于训练；

快速区域卷积神经网络的网络预训练，数据集中包括正样本、负样本，样本中只含有标签信息和位置信息；经过区域建议生成网络中的网络模型即共享卷积层对快速区域卷积神经网络进行有监督预训练，利用网络模型中预先设置的网络参数对其进行初始化，用高斯分布对第二全连接层初始化；

快速区域卷积神经网络的微调训练，数据集中包括物体类别的标签，也含有物体位置的标签，其中正样本表示前景、负样本表示背景，对正样本进行回归操作；并将正样本和负样本与真实区域重叠比较，且在训练过程中丢弃所有超出图像边界的滑动窗口，对超出图像边界的滑动窗口集采用极大值抑制，未超出图像边界的滑动窗口用于训练；

使用微调训练后的加速区域生成神经网络重新初始化区域建议生成网络，固定共享卷积层，仅微调区域建议生成网络的第一全连接层将区域建议生成网络的前五层学习率设为0，重新训练得到新的卷积模型；

在训练样本上运用重新训练得到的新的卷积模型，重新进行训练样本的目标粗选框，即区域得分信息和区域建议信息；

使用微调训练后的加速区域生成神经网络重新初始化快速区域卷积神经网络，固定共享卷积层，仅微调区域建议生成网络的第一全连接层将区域建议生成网络的前五层学习率设为0，重新训练得到新的快速区域卷积神经网络，至此形成统一的网络，训练得到典型人物身份识别的神经网络模型。

根据本发明的再一个优选的实施例，快速区域卷积神经网络的网络预训练和区域建议生成网络的微调训练中将正样本与真实区域重叠比较，正样本与真实区域重叠大于0.7。

根据本发明的又一个优选的实施例，快速区域卷积神经网络的网络预训练和区域建议生成网络的微调训练中将负样本与真实区域重叠比较，负样本与真实区域重叠小于0.3。

本发明涉及深度学习方法，从图像视频中自动判断典型人物的身份；包括构建具有标注信息的数据集；向加速区域生成神经网络输入具有标注信息的数据集得到模型框架，并进行模型训练得到典型人物身份识别的神经网络模型；利用训练后的典型人物身份识别的神经网络模型进行人物身份的识别和检测；即可较为成功的识别比较典型的人物身份，提高人物身份识别速度和准确性，在监狱管理和交通管理的工作中能起到很大的推进作用。

本发明制作训练的数据集，通过加速区域生成神经网络算法中的区域建议生成网络和快速区域卷积神经网络，协同合作，将含有典型人物身份的图像数据集送入加速区域生成神经网络里面训练，训练出一个能够识别人物身份的模型，能很准确的辨别出一个人的身份，如是警察还是犯人；应用非常广泛，而且准确率高，不仅可以应用在监狱系统内，在交通系统内也可以应用，比如路上的行人和交警的身份识别，也很准确；利用深度学习进行的典型人物身份识别不仅大大的提高了识别的速度，而且还提升了其准确率，目前加速区域生成神经网络算法是目前目标识别最先进的识别方法，具有很好的实用性和价值性。

与现有技术相比，本发明的有益之处在于：1)能识别出典型的人物身份；2)对制服与非制服进行区分；3)提高人物身份识别速度和准确性；4)应用非常广泛。

附图说明

通过以下参照附图而提供的具体实施方式部分，本发明的特征和优点将变得更加容易理解，在附图中：

图1是本发明的身份识别方法的流程图。

图2是本发明的身份识别方法的模型框架构建的流程图。

图3是本发明的身份识别方法的模型训练的流程图。

图4是本发明的身份识别方法的实施例中的滑动窗口示意图。

具体实施方式

下面参照附图对本发明的示例性实施方式进行详细描述；对示例性实施方式的描述仅仅是出于示范目的，而绝不是对本发明及其应用或用法的限制。

本发明中的术语解释：

术语一：加速区域生成神经网络，加速区域生成神经网络可以简单看做“区域建议生成网络+快速区域卷积神经网络”的系统，用区域生成网络代替快速区域卷积神经网络中的选择搜索方法。

术语二：滑动窗口，滑动窗口是一组大小固定的参考窗口：三种尺度{128*128，256*256，512*512}，有三种长宽比{1:1，1:2，2:1}，如图四所示。

实施例1：在监狱系统中对警察和犯人的识别：

步骤1，数据集的制作，首先获得一些警察和犯人的大量图片，至少4万张以上，优选为5万张，做一个VOC2007格式的数据集；开始构建数据集，采用图像标注技术对收集得到的图片进行特征标注并采用框图的形式，同时生成标注信息；标注信息包括图片的名字，位置坐标和标签，标签为典型人物的身份，例如在图片中用工具对警察和犯人进行标注，同时生成警察和犯人的坐标信息，人物标签即确认是警察还是犯人；将这些标注信息做成VOC2007数据集的格式，生成一个新的具有标注信息的数据集。

步骤2，构建加速区域生成神经网络，其有区域建议生成网络和快速区域卷积神经网络组成，所述区域建议生成网络包括由五个卷积层组成的共享卷积层、滑动窗口、由两个全连接层组成的第一全连接层；所述快速区域卷积神经网络包括第一卷积层、池化层、第二全连接层。

步骤3，对区域建议生成网络中的网络模型即共享卷积层预先设置，即进行网络参数的设置，首先在数据层设置类别为3类：犯人、警察、背景；接着在分类层把类别输出设置为3；然后再回归层把输出数字设置为12，为检测类别个数乘以4，比如数据层设置类别为3类那就是3*4＝12。

步骤4，向加速区域生成神经网络输入具有标注信息的数据集，首先传播入区域建议生成网络的共享卷积层进行警察和犯人的原始特征的提取得到区域特征图，并且数据集继续前向传播入快速区域卷积神经网络的第一卷积层用于进行警察和犯人的特征提取得到高维特征图。

步骤5，经过共享卷积层得到的区域特征图经过滑动窗口产生特征向量送入以及第一全连接层分类后得到区域建议信息和区域得分信息，将区域建议信息和步骤4中得到的高维特征图一起输入至快速区域卷积神经网络的池化层从而提取出区域建议信息的特征；将得到的区域建议信息的特征通过第二全连接层分类得到分类得分信息和回归后的边界框，即分类层和回归层；通过分类层确定类别，通过回归层确定位置，即可得到警察和犯人身份识别的神经网络模型的模型框架。

步骤6，对得到的模型框架进行模型训练：

S1:区域建议生成网络的网络预训练，数据集中包括正样本、负样本，样本中只含有标签信息和位置信息，就是经过区域建议生成网络中的网络模型即共享卷积层对区域建议生成网络进行有监督预训练，利用网络模型中预先设置的网络参数即步骤3中设置的参数对其进行初始化，用高斯分布对第一全连接层初始化；

S2：区域建议生成网络的微调训练，警察和犯人的数据集采用PASCAL VOC2007，其中包括物体类别的标签，也含有物体位置的标签，正样本表示前景、负样本表示背景，对正样本进行回归操作；将正样本与真实区域重叠大于0.7，负样本，与真实区域重叠小于0.3；且在训练过程中丢弃所有超出图像边界的滑动窗口，否则在训练过程中将出现很大的误差；对超出图像边界的滑动窗口集采用极大值抑制，最终未超出图像边界的2000个滑动窗口用于训练；

S3：快速区域卷积神经网络的网络预训练，数据集中包括正样本、负样本，样本中只含有标签信息和位置信息；经过区域建议生成网络中的网络模型即共享卷积层对快速区域卷积神经网络进行有监督预训练，利用网络模型中预先设置的网络参数即步骤3中设置的参数对其进行初始化，用高斯分布对第二全连接层初始化；

S4：快速区域卷积神经网络的微调训练，数据集中包括物体类别的标签，也含有物体位置的标签，其中正样本表示前景、负样本表示背景，对正样本进行回归操作；将正样本与真实区域重叠大于0.7，负样本，与真实区域重叠小于0.3；且在训练过程中丢弃所有超出图像边界的滑动窗口，否则在训练过程中将出现很大的误差；对超出图像边界的滑动窗口集采用极大值抑制，最终未超出图像边界的2000个滑动窗口用于训练；

S5：使用微调训练后的加速区域生成神经网络重新初始化区域建议生成网络，固定共享卷积层，仅微调区域建议生成网络的第一全连接层将区域建议生成网络的前五层学习率设为0，重新训练得到新的卷积模型；

S6：在训练样本上运用重新训练得到的新的卷积模型，重新进行训练样本的目标粗选框，即区域得分信息和区域建议信息；

S7：使用微调训练后的加速区域生成神经网络重新初始化快速区域卷积神经网络，固定共享卷积层，仅微调区域建议生成网络的第一全连接层将区域建议生成网络的前五层学习率设为0，重新训练得到新的快速区域卷积神经网络，至此形成统一的网络，训练得到警察和犯人身份识别的神经网络模型。

步骤7，用警察和犯人身份识别的神经网络模型进行普通图像中警察和犯人的识别，既能准确的找出警察和犯人的位置还能辨别出人物的身份。

实施例2：在交通系统中对交警和行人的识别。

步骤a，数据集的制作，首先获得一些交警和行人的大量图片，至少5万张以上，优选为6万张，做一个VOC2007格式的数据集；开始构建数据集，采用图像标注技术对收集得到的图片进行特征标注并采用框图的形式，同时生成标注信息；标注信息包括图片的名字，位置坐标和标签，标签为典型人物的身份，例如在图片中用工具对交警和行人进行标注，同时生成交警和行人的坐标信息，人物标签即确认是交警还是行人；将这些标注信息做成VOC2007数据集的格式，生成一个新的具有标注信息的数据集。

步骤b，构建加速区域生成神经网络，其有区域建议生成网络和快速区域卷积神经网络组成，所述区域建议生成网络包括由五个卷积层组成的共享卷积层、滑动窗口、由两个全连接层组成的第一全连接层；所述快速区域卷积神经网络包括第一卷积层、池化层、第二全连接层。

步骤c，对区域建议生成网络中的网络模型即共享卷积层预先设置，即进行网络参数的设置，首先在数据层设置类别为3类：交警、行人、背景；接着在分类层把类别输出设置为3；然后再回归层把输出数字设置为12，为检测类别个数乘以4，比如数据层设置类别为3类那就是3*4＝12。

步骤d，向加速区域生成神经网络输入具有标注信息的数据集，首先传播入区域建议生成网络的共享卷积层进行交警和行人的原始特征的提取得到区域特征图，并且数据集继续前向传播入快速区域卷积神经网络的第一卷积层用于进行交警和行人的特征提取得到高维特征图。

步骤e，经过共享卷积层得到的区域特征图经过滑动窗口产生特征向量送入以及第一全连接层分类后得到区域建议信息和区域得分信息，将区域建议信息和步骤d中得到的高维特征图一起输入至快速区域卷积神经网络的池化层从而提取出区域建议信息的特征；将得到的区域建议信息的特征通过第二全连接层分类得到分类得分信息和回归后的边界框，即分类层和回归层；通过分类层确定类别，通过回归层确定位置，即可得到交警和行人识别的神经网络模型的模型框架。

步骤f，对得到的模型框架进行模型训练：

S1)区域建议生成网络的网络预训练，数据集中包括正样本、负样本，样本中只含有标签信息和位置信息，就是经过区域建议生成网络中的网络模型即共享卷积层对区域建议生成网络进行有监督预训练，利用网络模型中预先设置的网络参数即步骤3中设置的参数对其进行初始化，用高斯分布对第一全连接层初始化；

S2)区域建议生成网络的微调训练，交警和行人的数据集采用PASCAL VOC2007，其中包括物体类别的标签，也含有物体位置的标签，正样本表示前景、负样本表示背景，对正样本进行回归操作；将正样本与真实区域重叠大于0.65，负样本，与真实区域重叠小于0.35；且在训练过程中丢弃所有超出图像边界的滑动窗口，否则在训练过程中将出现很大的误差；对超出图像边界的滑动窗口集采用极大值抑制，最终未超出图像边界的2200个滑动窗口用于训练；

S3)快速区域卷积神经网络的网络预训练，数据集中包括正样本、负样本，样本中只含有标签信息和位置信息；经过区域建议生成网络中的网络模型即共享卷积层对快速区域卷积神经网络进行有监督预训练，利用网络模型中预先设置的网络参数即步骤3中设置的参数对其进行初始化，用高斯分布对第二全连接层初始化；

S4)快速区域卷积神经网络的微调训练，数据集中包括物体类别的标签，也含有物体位置的标签，其中正样本表示前景、负样本表示背景，对正样本进行回归操作；将正样本与真实区域重叠大于0.65，负样本，与真实区域重叠小于0.35；且在训练过程中丢弃所有超出图像边界的滑动窗口，否则在训练过程中将出现很大的误差；对超出图像边界的滑动窗口集采用极大值抑制，最终未超出图像边界的2200个滑动窗口用于训练；

S5)使用微调训练后的加速区域生成神经网络重新初始化区域建议生成网络，固定共享卷积层，仅微调区域建议生成网络的第一全连接层将区域建议生成网络的前五层学习率设为0，重新训练得到新的卷积模型；

S6)在训练样本上运用重新训练得到的新的卷积模型，重新进行训练样本的目标粗选框，即区域得分信息和区域建议信息；

S7)使用微调训练后的加速区域生成神经网络重新初始化快速区域卷积神经网络，固定共享卷积层，仅微调区域建议生成网络的第一全连接层将区域建议生成网络的前五层学习率设为0，重新训练得到新的快速区域卷积神经网络，至此形成统一的网络，训练得到交警和行人身份识别的神经网络模型。

步骤g，用交警和行人身份识别的神经网络模型进行普通图像中交警和行人的识别，既能准确的找出交警和行人的位置还能辨别出人物的身份。

综上所述，本发明制作训练的数据集，通过加速区域生成神经网络算法中的区域建议生成网络和快速区域卷积神经网络，协同合作，将含有典型人物身份的图像数据集送入加速区域生成神经网络里面训练，训练出一个能够识别人物身份的模型，能很准确的辨别出一个人的身份，如是警察还是犯人；应用非常广泛，而且准确率高，不仅可以应用在监狱系统内，在交通系统内也可以应用，比如路上的行人和交警的身份识别，也很准确；利用深度学习进行的典型人物身份识别不仅大大的提高了识别的速度，而且还提升了其准确率，目前加速区域生成神经网络算法是目前目标识别最先进的识别方法，具有很好的实用性和价值性。

虽然参照示例性实施方式对本发明进行了描述，但是应当理解，本发明并不局限于文中详细描述和示出的具体实施方式，在不偏离权利要求书所限定的范围的情况下，本领域技术人员可以对所述示例性实施方式做出各种改变。

Claims

1.一种基于深度学习的典型人物的身份识别方法，其特征在于包括：

通过整合标注信息及图像建立具有标注信息的数据集；

2.根据权利要求1所述的身份识别方法，在建立具有标注信息的数据集之前，所述身份识别方法还包括：采用图像标注对收集的典型人物图像进行特征标注，同时生成标注信息。

3.根据权利要求2所述的身份识别方法，其特征在于：所述标注信息包括图像的名字，位置的坐标以及标签，所述标签为典型人物的身份；所述特征标注采用框图的形式。

4.根据权利要求3所述的身份识别方法，其特征在于：所述区域建议生成网络包括共享卷积层、滑动窗口、第一全连接层；所述快速区域卷积神经网络包括第一卷积层、池化层、第二全连接层；

首先具有标注信息的数据集传播入区域建议生成网络的共享卷积层用于进行原始特征的提取得到区域特征图，并且具有标注信息的数据集继续前向传播入快速区域卷积神经网络的第一卷积层用于进行特征的提取得到高维特征图；

5.根据权利要求4所述的身份识别方法，其特征在于：所述共享卷积层为包括五个卷积层的网络模型，通过共享卷积层产生原始图像的区域特征图；所述第一全连接层为两个全连接层。

6.根据权利要求5所述的身份识别方法，其特征在于：所述区域特征图进入第一全连接层前需要经过滑动窗口，滑动窗口在特征图上进行滑动扫描，每个滑动窗口通过卷积层映射为256维的特征向量送入第一全连接层。

7.根据权利要求6所述的身份识别方法，在对模型框架进行模型训练前，所述身份识别方法还包括：预先设置网络参数，对数据集的设置类别分类，对分类层和回归层的输出设置。

8.根据权利要求7所述的身份识别方法，模型框架进行模型训练得到典型人物身份识别的神经网络模型，步骤如下：

9.根据权利要求8所述的身份识别方法，其特征在于：快速区域卷积神经网络的网络预训练和区域建议生成网络的微调训练中将正样本与真实区域重叠比较，正样本与真实区域重叠大于0.7。

10.根据权利要求8所述的身份识别方法，其特征在于：快速区域卷积神经网络的网络预训练和区域建议生成网络的微调训练中将负样本与真实区域重叠比较，负样本与真实区域重叠小于0.3。