CN109409309A

CN109409309A - 一种基于人体检测的智能报警系统和方法

Info

Publication number: CN109409309A
Application number: CN201811308433.8A
Authority: CN
Inventors: 漆进; 史鹏; 张通
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2018-11-05
Filing date: 2018-11-05
Publication date: 2019-03-01

Abstract

本发明提供了一种基于深度学习和人体检测的智能报警系统。该方法包括:构建人体检测数据库；训练Yolo‑v3网络；搭建预测程序；摄像头与GPU服务器通信；GPU服务器与GSM通信。本发明的基于深度学习和人体检测的智能报警系统充分考虑了应用场景季节的多样性和人体外形的复杂性，使用基于Darknet的Yolo‑v3网络，因此，既保证了人体检测的速度也提高了人体检测准确度，有很好的实用性。

Description

一种基于人体检测的智能报警系统和方法

技术领域

本发明涉及计算机视觉技术领域，准确的说是一种基于人体检测的智能报警系统和方法。

背景技术

人体检测一直是计算机视觉研究与应用中的热点。人体检测主要解决的问题是：找出图像或者视频中的人，包括位置和大小。这具有很强的映红价值，可以与跟踪等技术相结合应用于无人驾驶汽车、智能机器人、客流量统计、智慧城市等领域。

家庭防盗是安防问题的一个重要问题，在可以查询到的智能报警产品中，目前有基于红外人体检测、蓝牙信号通信等较为传统的产品，它们有一个共同的缺点，准确率低，造成了财产的损失。对于人体检测这一问题，由于人体具有相当的柔性，因此会有各种姿态和形状，同时，其外观受穿着、姿态、视角等影响非常大，另外还面临着遮挡、光照等因素，所以在目前的应用中，准确度并不显著。

最近几年，深度学习技术得到了广泛的应用，产生了一系列检测网路，例如rcnn、fast-rcnn、faster-rcnn和SSD等，但是这些检测技术或由于精度低，或由于检测耗时长并不能很好的应用到商业产品中，基于此，本发明使用Yolo-v3网络来解决人体检测问题，并很好的嵌入到智能报警系统。

发明内容

鉴于以上所述过往技术的缺点，本发明提供一种基于人体检测的智能报警系统和方法，以保护家庭财产安全，

为了实现上述目的，本发明包括以下步骤：

步骤1)获取互联网上的包含人体的图片，并做好人工标注，同时利用Imagenet、coco 等公开数据集，将含有人的图片选出来，因为这部分自带标注文件，可以直接使用，再加入摄像头获取的数据，进行标注，将上面所有的数据按照等比例混合，按照9:1的比例划分为检测模型的训练集和验证集；

步骤2)构造Yolo-v3网络，使用的基础网络为Darknet-53；

步骤3)将上述检测网络使用训练集进行模型训练，并选出在验证集表现最优的模型；

步骤4)基于上述最优模型，在GPU服务器上跑预测程序，配置网络端口；

步骤5)将摄像头安装在住所门口，同时与后台匹配，每隔2秒传输一次图像数据；

步骤6)对图像数据进行人体检测，若包含人，则发送预留报警短信。

上述步骤1)中所述的人工标注是指：将每一张图片中的人都用矩形框框出，对应产生一个xml文件，xml文件中记录下图中每一辆车的坐标，记录格式为[左上角x坐标，左上角 y坐标，宽度w，高度h]，同时删掉图片模糊或者难以标注的图片。

上述步骤2)中所述的Darknet-53网络是指：由53层1*1卷积或者3*3卷积网络构成的全卷积网络，在分类任务中，与resnet152对比，准确率接近，但是速度更快。

上述步骤3)中所述模型训练是指：将步骤1中的训练集，进行左右翻转、HSL变换等数据增强操作，不断调整学习率、batch size、优化方法等超参数来训练Yolo-v3网络。

上述步骤3)中所述的最优模型是：在训练过程，没经过1/3个epoch存储一次模型，并将该模型在训练集和验证集测试，根据人体检测的精度来选出最优的模型。

上述步骤4)中所述的预测程序是：构建网络的前向推断过程，输入参数为图像数据、返回为预测结果，并可以进行一定后处理。

上述步骤4)中所述的配置网络端口是指：将GPU服务器配置一个端口，用来传送图像数据。

上述步骤5)中所述的与后台匹配是指：与GPU服务器建立网络连接，可以顺利传送图片和接受数据。

上述步骤6)中所述的发送预留报警短信是指：将GPU服务器通过串口通信协议与插入手机卡的GSM模块连接，控制发送短信内容。

附图说明

图1为待检测的人体图像

图2为基于深度学习的人体检测结果

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

请参阅图1与图2，本发明的基于深度学习和人体检测的智能报警系统包括人体数据的标定、训练网络、搭建报警系统。

包括以下步骤：

步骤2)构造Yolo-v3网络，使用的基础网络为Darknet-53；

本发明的基于深度学习和人体检测的智能报警系统充分利用了深度学习的准确度高性质，适应各种外界环境的变化，通过使用Yolo-v3网络，保证了实时性的要求，具有很高的实用性。

以上对本发明所提供的方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于深度学习和人体检测的智能报警系统，其特征在于，包括以下步骤：

步骤1)获取互联网上的包含人体的图片，并做好人工标注，同时利用Imagenet、coco等公开数据集，将含有人的图片选出来，因为这部分自带标注文件，可以直接使用，再加入摄像头获取的数据，进行标注，将上面所有的数据按照等比例混合，按照9:1的比例划分为检测模型的训练集和验证集；

步骤2)构造Yolo-v3网络，使用的基础网络为Darknet-53；

2.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤1)中所述的人工标注是指：将每一张图片中的人都用矩形框框出，对应产生一个xml文件，xml文件中记录下图中每一辆车的坐标，记录格式为[左上角x坐标，左上角y坐标，宽度w，高度h]，同时删掉图片模糊或者难以标注的图片。

3.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤2)中所述的Darknet-53网络是指：由53层1*1卷积或者3*3卷积网络构成的全卷积网络，在分类任务中，与resnet152对比，准确率接近，但是速度更快。

4.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤3)中所述模型训练是指：将步骤1中的训练集，进行左右翻转、HSL变换等数据增强操作，不断调整学习率、batch size、优化方法等超参数来训练Yolo-v3网络。

5.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤3)中所述的最优模型是：在训练过程，没经过1/3个epoch存储一次模型，并将该模型在训练集和验证集测试，根据人体检测的精度来选出最优的模型。

6.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤4)中所述的预测程序是：构建网络的前向推断过程，输入参数为图像数据、返回为预测结果，并可以进行一定后处理。

7.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤4)中所述的配置网络端口是指：将GPU服务器配置一个端口，用来传送图像数据。

8.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤5)中所述的与后台匹配是指：与GPU服务器建立网络连接，可以顺利传送图片和接受数据。

9.根据权利要求1所述的一种基于深度学习和人体检测的智能报警系统，其特征是，在步骤6)中所述的发送预留报警短信是指：将GPU服务器通过串口通信协议与插入手机卡的GSM模块连接，控制发送短信内容。