CN106845415A

CN106845415A - 一种基于深度学习的行人精细化识别方法及装置

Info

Publication number: CN106845415A
Application number: CN201710050765.XA
Authority: CN
Inventors: 张卫山; 王志超; 徐亮; 赵德海; 李忠伟; 卢清华; 宫文娟; 宫法明
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2017-01-23
Filing date: 2017-01-23
Publication date: 2017-06-13
Anticipated expiration: 2037-01-23
Also published as: CN106845415B

Abstract

本发明公开了一种基于深度学习的行人精细化识别方法及装置，该方法包括：构建行人图像数据库，利用行人图像数据库制作包含行人特征的训练数据集，将训练数据集输入到SSD网络进行训练；根据训练结果构建行人精细化图像数据库，制作包含行人各个部位特征的训练数据集，将训练数据集输入到卷积神经网络进行训练；利用训练好的SSD网络提取来自流媒体服务器的实时视频流中的行人特征，根据提取到的行人特征，利用训练好的卷积神经网络提取行人各个部位的特征；将提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配，将匹配结果进行组合得到行人精细化识别结果。本发明有效地提高了行人精细化识别的准确率。

Description

一种基于深度学习的行人精细化识别方法及装置

技术领域

本发明涉及行人精细化识别领域，具体涉及一种基于深度学习的行人精细化识别方法及装置。

背景技术

深度学习是目前机器学习发展的最高度，卷积神经网络作为深度学习的一种方法，在物体识别、图像处理等领域有着较好的效果。对于特征提取，卷积神经网络有着可以自动学习图像特征的优势，减少了人工干预，提取出高质量的特征，从而为提高图像匹配的准确率打下了坚实的基础。

由于深度学习的方法可能消耗大量的GPU(Graphics Processing Unit，图形处理器)资源，计算量过大可能达不到实际应用场景中实时的效果，为了解决大数据实时处理问题，分布式实时处理框架Storm应运而生，Storm有许多应用领域，包括实时分析、在线机器学习、信息流处理、连续性的计算、分布式RPC(Remote Procedure Call，远程过程调用)和ETL(Extract-Transform-Load，抽取、转换和加载)等。

行人作为视频监控中的重要目标之一，若能对其进行有效的外观识别，不仅能提高视频监控工作人员的工作效率，对视频的检索、行人行为的解析也具有重要意义。而且，行人的精细化识别在公司为智能交通、银行、平安城市和公共安全等行业提供的解决方案中有着重要的应用。

有鉴于此，急需解决对行人进行监控识别的准确率较低的问题。

发明内容

本发明所要解决的技术问题是解决对行人进行监控识别的准确率较低的问题。

为了解决上述技术问题，本发明所采用的技术方案是提供一种基于深度学习的行人精细化识别方法，包括以下步骤：

采集历史的行人图像数据构建行人图像数据库，并利用行人图像数据库制作包含行人特征的训练数据集，将训练数据集输入到SSD网络进行训练；

根据SSD网络的训练结果构建行人精细化图像数据库，并利用行人精细化图像数据库制作包含行人各个部位特征的训练数据集，将训练数据集输入到卷积神经网络进行训练；

利用训练好的SSD网络提取来自流媒体服务器的实时视频流中的行人特征，根据SSD网络提取到的行人特征，利用训练好的卷积神经网络提取行人各个部位的特征；

利用SVM分类器将提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配，并将匹配结果进行组合，得到行人精细化识别结果。

在上述技术方案中，提取行人特征、行人各个部位的特征以及进行特征匹配，具体包括以下步骤：

采集来自流媒体服务器的实时视频流，将实时视频流解析为帧图像，并通过分布式实时处理框架Storm的数据采集接口，将帧图像输入到分布式实时处理框架Storm的消息源；

在分布式实时处理框架Storm上，利用设有SSD网络的消息处理组件提取数据源中的行人特征，根据提取到的行人特征，再利用设有卷积神经网络的消息处理组件提取行人各个部位的特征；

最后通过设有SVM分类器的消息处理组件将提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配。

在上述技术方案中，将训练数据集输入到SSD网络进行训练，具体包括以下步骤：

所述SSD网络首先使用默认参数进行训练，根据训练中间结果，对初始权值、训练速率和迭代次数不断进行调整，直到得到的参数使得训练后的所述SSD网络以预设的处理速度达到预设的识别准确率。

在上述技术方案中，根据SSD网络的训练结果构建行人精细化图像数据库，具体包括以下步骤：

根据SSD网络的训练结果得到行人图像数据库中的行人图像，根据行人各个部位特征对行人图像进行切分，并按照行人的不同部位对切分好的行人图像进行分类，得到行人精细化图像数据库。

在上述技术方案中，将训练数据集输入到卷积神经网络进行训练，具体包括以下步骤：

将所述行人精细化图像数据库中不同种类的行人图像输入到对应的所述卷积神经网络中，所述卷积神经网络首先使用默认参数进行训练，根据训练中间结果，对初始权值、训练速率和迭代次数不断进行调整，直到得到的参数使得训练后的所述卷积神经网络以预设的处理速度达到预设的识别准确率。

在上述技术方案中，预设的处理速度为每秒25帧，预设的识别准确率为90％。

在上述技术方案中，所述卷积神经网络包括三层卷积层、三层池化层、三层全连接层以及位于最后的softmax回归分类器层。

本发明还提供了一种基于深度学习的行人精细化识别装置，包括：

行人图像数据库构建模块，采集历史的行人图像数据构建行人图像数据库；

SSD网络训练模块，利用所述行人图像数据库制作包含行人特征的训练数据集，将所述训练数据集输入到SSD网络进行训练；

行人精细化图像数据库构建模块，根据所述SSD网络的训练结果构建行人精细化图像数据库；

卷积神经网络训练模块，利用所述行人精细化图像数据库制作包含行人各个部位特征的训练数据集，将所述训练数据集输入到卷积神经网络进行训练；

行人特征提取模块，利用训练好的SSD网络提取来自流媒体服务器的实时视频流中的行人特征；

行人各个部位的特征提取模块，根据所述SSD网络提取到的行人特征，利用训练好的所述卷积神经网络提取行人各个部位的特征；

特征匹配模块，利用SVM分类器将所述行人各个部位的特征提取模块提取到的行人各个部位的特征，与所述行人精细化图像数据库的每个行人相应部位的特征进行匹配；

行人精细化识别模块，将所述特征匹配模块的匹配结果进行组合，得到行人精细化识别结果。

在上述技术方案中，所述行人特征提取模块、行人各个部位的特征提取模块、特征匹配模块以及行人精细化识别模块搭建在分布式实时处理框架Storm上，且各模块并行运行；

所述行人特征提取模块，利用设有SSD网络的消息处理组件提取所述分布式实时处理框架Storm的消息源中的行人特征，所述消息源中包括所述分布式实时处理框架Storm的数据采集接口接收到的帧图像，所述帧图像由来自流媒体服务器的实时视频流解析而成；

所述行人各个部位的特征提取模块，根据所述行人特征提取模块提取到的行人特征，利用设有卷积神经网络的消息处理组件提取行人各个部位的特征；

所述特征匹配模块，通过设有SVM分类器的消息处理组件将所述行人各个部位的特征提取模块提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配。

本发明将深度学习技术与行人精细化识别技术相结合，通过对SSD网络和卷积神经网络进行训练，利用训练好的SSD网络提取来自流媒体服务器的实时视频流中的行人特征，根据SSD网络提取到的行人特征，利用训练好的卷积神经网络提取行人各个部位的特征，将提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配，并将匹配结果进行组合，得到行人精细化识别结果，有效地提高了行人精细化识别的准确率。

附图说明

图1为本发明提供的一种基于深度学习的行人精细化识别方法流程图；

图2为本发明提供的一种基于深度学习的行人精细化识别方法示意图；

图3为本发明提供的训练卷积神经网络的结构示意图；

图4为本发明提供的一种基于深度学习的行人精细化识别装置示意图。

具体实施方式

下面结合说明书附图和具体实施方式对本发明做出详细的说明。

本发明实施例提供了一种基于深度学习的行人精细化识别方法，如图1、图2所示，包括以下步骤：

S1、采集历史的行人图像数据构建行人图像数据库，并利用行人图像数据库制作包含行人特征的训练数据集，将训练数据集输入到SSD网络进行训练，直至得到的参数使得训练后的SSD网络以预设的处理速度达到预设的识别准确率。

构建行人图像数据库具体为：采集流媒体服务器存储的视频流，解析成帧，并去除没帧的背景，利用这些历史的行人图像数据构建行人图像数据库。

S2、根据SSD网络的训练结果构建行人精细化图像数据库，并利用行人精细化图像数据库制作包含行人各个部位特征的训练数据集，将训练数据集输入到卷积神经网络进行训练，直至得到的参数使得训练后的卷积神经网络以预设的处理速度达到预设的识别准确率。

S3、在分布式实时处理框架Storm上，利用训练好的SSD网络提取来自流媒体服务器的实时视频流中的行人特征，根据SSD网络提取到的行人特征，利用训练好的卷积神经网络提取行人各个部位的特征(行人各个部位的特征包括行人各个部位的位置信息以及图像颜色信息等)。

S4、在分布式实时处理框架Storm上，利用SVM(支持向量机)分类器将提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配，并将匹配结果进行组合，得到实时的行人精细化识别结果。

具体地：通过采集来自流媒体服务器的实时视频流，将实时视频流解析为帧图像，并通过分布式实时处理框架Storm的数据采集接口，将每一帧图像输入到分布式实时处理框架Storm的消息源；在分布式实时处理框架Storm上，利用设有SSD网络的消息处理组件提取帧图像中的行人特征，根据提取到的行人特征，再利用设有卷积神经网络的消息处理组件提取行人各个部位的特征；最后通过设有SVM分类器的消息处理组件将提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配，并将匹配结果进行组合，最终得到实时的行人精细化识别结果。

行人精细化识别结果由行人的面目识别结果、上衣的位置及图像颜色、裤子的位置及图像颜色、鞋子的位置及图像颜色、帽子的位置及图像颜色、包的位置及图像颜色等信息组成。

本方案采用分布式实时处理框架Storm，实现了行人精细化识别的实时化。

在步骤S1中，将训练数据集输入到SSD网络进行训练，直至得到的参数使得训练后的SSD网络以预设的处理速度达到预设的识别准确率，具体包括以下步骤：

SSD网络首先使用默认参数进行训练，根据训练中间结果，对初始权值、训练速率和迭代次数进行不断调整，直到得到的参数使得训练后的SSD网络以每秒25帧的处理速度达到90％的识别准确率。

在步骤S2中，根据SSD网络的训练结果构建行人精细化图像数据库，具体包括以下步骤：

根据SSD网络的训练结果得到行人图像数据库中的行人图像，根据行人各个部位特征(例如行人的上衣、裤子、鞋子、帽子和包等等)对行人图像进行切分，并对切分好的行人图像进行分类，得到行人精细化图像数据库。

在步骤S2中，将训练数据集输入到卷积神经网络进行训练，直至得到的参数使得训练后的卷积神经网络以预设的处理速度达到预设的识别准确率，具体包括以下步骤：

将行人精细化图像数据库中不同种类的行人图像输入到对应的卷积神经网络中，卷积神经网络首先使用默认参数进行训练，根据训练中间结果，对初始权值、训练速率和迭代次数进行不断调整，直到得到的参数使得训练后的卷积神经网络以每秒25帧的处理速度达到90％的识别准确率。

如图3所示，将行人精细化图像数据集中的行人图像作为卷积神经网络的输入，训练卷积神经网络，该卷积神经网络包括三层卷积层、三层池化层、三层全连接层以及位于最后一层的softmax回归分类器层。

本发明实施例还提供了一种基于深度学习的行人精细化识别装置，如图4所示，包括：

行人图像数据库构建模块10，采集历史的行人图像数据构建行人图像数据库；

SSD网络训练模块20，利用所述行人图像数据库制作包含行人特征的训练数据集，将所述训练数据集输入到SSD网络进行训练；

行人精细化图像数据库构建模块30，根据所述SSD网络的训练结果构建行人精细化图像数据库；

卷积神经网络训练模块40，利用所述行人精细化图像数据库制作包含行人各个部位特征的训练数据集，将所述训练数据集输入到卷积神经网络进行训练；

行人特征提取模块50，利用训练好的SSD网络提取来自流媒体服务器的实时视频流中的行人特征；

行人各个部位的特征提取模块60，根据所述SSD网络提取到的行人特征，利用训练好的所述卷积神经网络提取行人各个部位的特征；

特征匹配模块70，利用SVM(支持向量机)分类器将所述行人各个部位的特征提取模块60提取到的行人各个部位的特征，与所述行人精细化图像数据库的每个行人相应部位的特征进行匹配；

行人精细化识别模块80，将所述特征匹配模块70的匹配结果进行组合，得到行人精细化识别结果。

上述行人特征提取模块50、行人各个部位的特征提取模块60、特征匹配模块70以及行人精细化识别模块80搭建在分布式实时处理框架Storm上，且各模块并行运行。

所述行人特征提取模块50，利用设有SSD网络的消息处理组件提取所述分布式实时处理框架Storm的消息源中的行人特征，所述消息源中包括所述分布式实时处理框架Storm的数据采集接口接收到的帧图像，所述帧图像由来自流媒体服务器的实时视频流解析而成。

所述行人各个部位的特征提取模块60，根据所述行人特征提取模块50提取到的行人特征，利用设有卷积神经网络的消息处理组件提取行人各个部位的特征。

所述特征匹配模块70，通过设有SVM分类器的消息处理组件将所述行人各个部位的特征提取模块60提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配。

本发明将深度学习技术和云计算技术与行人精细化识别相结合通过对SSD网络和卷积神经网络进行训练，利用训练好的SSD网络提取来自流媒体服务器的实时视频流中的行人特征，根据SSD网络提取到的行人特征，利用训练好的卷积神经网络提取行人各个部位的特征，将提取到的行人各个部位的特征与行人精细化图像数据库的每个行人相应部位的特征进行匹配，并将匹配结果进行组合，得到行人精细化识别结果，有效地提高了行人精细化识别的准确率。另外，利用分布式实时处理框架Storm处理行人精细化识别，达到实时识别的目的，有效地提高了行人精细化识别的效率。

本发明不局限于上述最佳实施方式，任何人在本发明的启示下作出的结构变化，凡是与本发明具有相同或相近的技术方案，均落入本发明的保护范围之内。

Claims

1.一种基于深度学习的行人精细化识别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于深度学习的行人精细化识别方法，其特征在于，提取行人特征、行人各个部位的特征以及进行特征匹配，具体包括以下步骤：

3.如权利要求1所述的基于深度学习的行人精细化识别方法，其特征在于，将训练数据集输入到SSD网络进行训练，具体包括以下步骤：

4.如权利要求3所述的基于深度学习的行人精细化识别方法，其特征在于，根据SSD网络的训练结果构建行人精细化图像数据库，具体包括以下步骤：

5.如权利要求4所述的基于深度学习的行人精细化识别方法，其特征在于，将训练数据集输入到卷积神经网络进行训练，具体包括以下步骤：

6.如权利要求3或5所述的基于深度学习的行人精细化识别方法，其特征在于，预设的处理速度为每秒25帧，预设的识别准确率为90％。

7.如权利要求1所述的基于深度学习的行人精细化识别方法，其特征在于，所述卷积神经网络包括三层卷积层、三层池化层、三层全连接层以及位于最后的softmax回归分类器层。

8.一种基于深度学习的行人精细化识别装置，其特征在于，包括：

9.如权利要求8所述的基于深度学习的行人精细化识别装置，其特征在于，

所述行人特征提取模块、行人各个部位的特征提取模块、特征匹配模块以及行人精细化识别模块搭建在分布式实时处理框架Storm上，且各模块并行运行；