CN107145546A

CN107145546A - 基于深度学习的监控视频人员模糊检索方法

Info

Publication number: CN107145546A
Application number: CN201710282865.5A
Authority: CN
Inventors: 翟佳; 谢晓丹; 贾雨生; 王衍祺
Original assignee: Beijing Institute of Environmental Features
Current assignee: Beijing Institute of Environmental Features
Priority date: 2017-04-26
Filing date: 2017-04-26
Publication date: 2017-09-08

Abstract

基于深度学习的监控视频人员模糊检索方法，涉及云计算领域，主要包括6个步骤，步骤(A)：采集视频数据并进行云存储；步骤(B)：构建训练数据库；步骤(C)：利用Hadoop的MapReduce并行化编程模型通过训练数据库所提供的数据进行深度学习训练；步骤(D)：通过训练后的卷积神经网络系统进行识别。本发明主要利用深度学习方法结合云计算，将摄像头采集的视频数据进行云存储和管理，利用Hadoop的MapReduce并行化编程模型结合深度学习对视频进行数据识别挖掘，实现对目标人员的模糊检索。

Description

基于深度学习的监控视频人员模糊检索方法

技术领域

本发明涉及卷积神经网络图像识别方法，尤其是一种通过云计算进行卷积神经网络图像识别方法。

背景技术

随着视频监控数据量的快速增长，以及摄像头高清化、超高清化的趋势的加强，监控视频在违法人员的追捕中发挥着越来越重要的作用。随着视频监控数据量的飞速增长，工作人员在用传统方式对视频进行分析和检索的时候遇到了很大的挑战。而大数据技术可以重构传统视频数据处理的架构，让公安系统可以更快速地分析监控视频。同时基于深度学习的CNN(卷积神经网络)已经在高级视觉领域取得了前所未有的成功，并广泛应用于图像分类、人脸识别、物体检测等领域中。

本发明主要利用深度学习方法结合云计算，将摄像头采集的视频数据进行云存储和管理，利用Hadoop的MapReduce并行化编程模型结合深度学习对视频进行数据识别挖掘，实现对目标人员的模糊检索。本发明旨在大幅度提高监控视频的人员目标识别自动化程度、速率和准确率以及提高监控视频数据的利用率。

发明内容

本发明针对现有技术中的不足，提供了基于深度学习的监控视频人员模糊检索方法，本发明提出了一种以深度学习为基础、以云计算为支撑的监控视频人员模糊检索方法。将摄像头采集的视频数据进行云存储和管理，利用Hadoop的MapReduce并行化编程模型结合深度学习对视频进行数据识别挖掘，实现对目标人员的快速准确的模糊检索。

为了解决上述技术问题，本发明通过下述技术方案得以解决：基于深度学习的监控视频人员模糊检索方法，应用在监控系统，所述的监控系统包括卷积神经网络系统和云平台系统，其特征为包括以下几个步骤：步骤(A)：通过云平台系统收集视频数据，并将视频数据进行云存储；步骤(B)：使用者建立训练条目数据库，每个训练条目由文字进行描述；步骤(C)：根据云存储内容以及训练条目数据库选取样本图片建立训练数据库；步骤(D)：卷积神经网络系统通过云平台系统的并行计算进行深度学习训练，以训练出用于识别的网络模型；步骤(E)：训练完成后卷积神经网络系统通过云平台系统的并行计算进行识别，识别时输入模糊描述后，卷积神经网络系统调取与模糊描述相关的若干个特征模型进行计算然后得到识别结果。

上述技术方案中，优选的，所述的卷积神经网络系统为Faster R-CNN网络结构。

上述技术方案中，优选的，所述的卷积神经网络系统为Fast R-CNN网络结构。

上述技术方案中，优选的，在步骤D和步骤E中的并行计算为利用Hadoop的MapReduce并行化编程模型的计算。

上述技术方案中，优选的，在步骤C中对每个样本图片进行标签，每个标签只标定唯一的特征信息，单个样本图片可具有多个标签。

上述技术方案中，优选的，在步骤D中，通过训练条目描述的内容，选取相应的至少一个标签，然后选取通标签下若干个样本图片进行训练，在训练前通过标签上的特征信息，对样本图片进行预处理，预处理包括消除噪声、校正失真、变换标准形式，预处理后使样本图片标签上所描述的特征信息更容易提取。

上述技术方案中，优选的，在步骤D中，每次训练后卷积神经网络系统都会建立相应的特征模型，如果训练结果为合格，则保留此特征模型，如果训练结果为不合格则对此特征模型进行自动修改，直至训练结果为合格，此特征模型才保持稳定。

上述技术方案中，优选的，在步骤D中，训练合格的标准由进行判断。

上述技术方案中，优选的，在步骤E中，对模糊描述进行分析，然后从模糊描述中提取至少一个特征信息，然后根据特征信息选取相对应的特征模型，最后根据若干个特征模型的组合进行识别。

本发明的主要步骤为通过卷积神经网络系统不断采集摄像头视频数据并将视频数据进行云存储。卷积神经网络系统的深度学习子系统从历史数据中选取样本图片构建训练数据库，结合对应的深度学习网络进行训练，不断优化识别模型。最后用户通过输入目标人员的描述时，卷积神经网络系统根据用户的模糊描述，在海量历史数据中检索具有该特征属性的人员。传统统计学习算法建立在特征提取的基础上，在进行算法训练之前，需要建立样本的特征空间。对于复杂的识别问题无法直接提取到反映分类目标的特征时，就需要可以自动学习特征空间和其对应分类器的算法。深度学习的本质是通过构建具有多个隐层的机器学习模型，建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，从海量的训练数据中学习更有用的特征，从而最终提升分类或预测的准确性。本发明将深度学习技术应用于目标检测识别领域，通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示，刻画出数据中更丰富的内在信息。深度学习采用了神经网络相似的分层结构，系统由卷积层、池化层、全连接层等多层网络组成，不同的网络层对应实现不同的功能。在目标检测识别领域中，深度学习技术在准确性、鲁棒性等方面具有优势，由R-CNN催生出适于不同需求的Fast R-CNN、Faster R-CNN等网络结构，网络的性能高，检测准确率和检测效率也有大幅提升。因此本发明通过实现主流深度学习网络结构，并调整优化各层结构，从而使得对监控视频中人物细节的检测准确率大幅提升。

与现有技术相比，本发明提出了一种以深度学习为基础、以云计算为支撑的监控视频人员模糊检索方法。将摄像头采集的视频数据进行云存储和管理，利用Hadoop的MapReduce并行化编程模型结合深度学习对视频进行数据识别挖掘，实现对目标人员的快速准确的模糊检索。

附图说明

图1为本发明实施例流程示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本发明进一步详细说明。

本实施例提供了基于深度学习的监控视频人员模糊检索方法，其具体步骤为视频人员模糊监控系统利用opencv，流媒体服务器，webcamcapture等技术手段，不断采集摄像头的视频数据。将不同摄像头不同时间段的视频数据进行编码压缩，存储到HDFS中。利用HBASE存储视频的索引，首先建立元数据的配置信息，其中包含HBASE中存放数据的表信息、需要存入HDFS视频的存储位置、命名规则及文件数据字段的描述与配置信息、文件字段与表字段的关系等。将视频分段存储到sequence file的键值对中，并将视频索引数据用HBASE API以put方式存储。利用深度学习子系统，从海量的视频监控数据中筛选出海量的训练样本组成训练数据库，对相应的CNN神经网络进行训练，通过不断的采集数据，不断的修改网络模型，改善识别效果。以深度神经网络为核心的训练学习过程，该过程首先将收集整理的人物特征图像库以及监控实际图像作为原始数据，为训练原始图片添加相应标签，标注出图像中感兴趣的部分，然后对获取的图像进行适当的预处理，这是因为无论是图像数据库中的样本图像，还是实时采集的图像，其质量都会对识别的结果有很大影响。为了快速、稳定地进行特征抽取，就必须消除噪声，校正失真，把图像变换成标准形式，使图像能够很容易地抽取特征。设计Faster R-CNN网络结构，并且利用上述构建的数据集对网络进行训练，得到最优的网络模型。

训练完成后，开始识别操作，对用户输入的人员描述进行检索，具体步骤如下：a)

利用Faster R-CNN检测出视频帧中的人员；b)利用先验知识切分人员的裤子和上衣，利用快速主题色分析算法确定衣物的颜色；c)利用人脸识别算法辅助头发检测识别人员的性别，利用先验知识识别出高矮以及胖瘦。上述步骤严格按照顺序执行，在不满足前一个条件的情况下，不进行后续步骤，以加速算法执行速度。

Claims

1.基于深度学习的监控视频人员模糊检索方法，应用在监控系统，所述的监控系统包括卷积神经网络系统和云平台系统，其特征为包括以下几个步骤：

步骤(A)：通过云平台系统收集视频数据，并将视频数据进行云存储；

步骤(B)：使用者建立训练条目数据库，每个训练条目由文字进行描述；

步骤(C)：根据云存储内容以及训练条目数据库选取样本图片建立训练数据库；

步骤(D)：卷积神经网络系统通过云平台系统的并行计算进行深度学习训练，以训练出用于识别的网络模型；

步骤(E)：训练完成后卷积神经网络系统通过云平台系统的并行计算进行识别，识别时输入模糊描述后，卷积神经网络系统调取与模糊描述相关的若干个特征模型进行计算然后得到识别结果。

2.根据权利要求1所述的基于深度学习的监控视频人员模糊检索方法，其特征为，所述的卷积神经网络系统为Faster R-CNN网络结构。

3.根据权利要求1所述的基于深度学习的监控视频人员模糊检索方法，其特征为，所述的卷积神经网络系统为Fast R-CNN网络结构。

4.根据权利要求1所述的基于深度学习的监控视频人员模糊检索方法，其特征为，在步骤D和步骤E中的并行计算为利用Hadoop的MapReduce并行化编程模型的计算。

5.根据权利要求1所述的基于深度学习的监控视频人员模糊检索方法，其特征为，在步骤C中对每个样本图片进行标签，每个标签只标定唯一的特征信息，单个样本图片可具有多个标签。

6.根据权利要求1所述的基于深度学习的监控视频人员模糊检索方法，其特征为，在步骤D中，通过训练条目描述的内容，选取相应的至少一个标签，然后选取通标签下若干个样本图片进行训练，在训练前通过标签上的特征信息，对样本图片进行预处理，预处理包括消除噪声、校正失真、变换标准形式，预处理后使样本图片标签上所描述的特征信息更容易提取。

7.根据权利要求1所述的基于深度学习的监控视频人员模糊检索方法，其特征为，在步骤D中，每次训练后卷积神经网络系统都会建立相应的特征模型，如果训练结果为合格，则保留此特征模型，如果训练结果为不合格则对此特征模型进行自动修改，直至训练结果为合格，此特征模型才保持稳定。

8.根据权利要求7所述的基于深度学习的监控视频人员模糊检索方法，其特征为，在步骤D中，训练合格的标准由进行判断。

9.根据权利要求1所述的基于深度学习的监控视频人员模糊检索方法，其特征为，在步骤E中，对模糊描述进行分析，然后从模糊描述中提取至少一个特征信息，然后根据特征信息选取相对应的特征模型，最后根据若干个特征模型的组合进行识别。