CN108765826A - 一种基于深度学习的多遮挡模糊场景人形识别方法及系统 - Google Patents

一种基于深度学习的多遮挡模糊场景人形识别方法及系统 Download PDF

Info

Publication number
CN108765826A
CN108765826A CN201810550258.7A CN201810550258A CN108765826A CN 108765826 A CN108765826 A CN 108765826A CN 201810550258 A CN201810550258 A CN 201810550258A CN 108765826 A CN108765826 A CN 108765826A
Authority
CN
China
Prior art keywords
pedestrian
deep learning
image
detection
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810550258.7A
Other languages
English (en)
Inventor
唐苏
马俊
胡德见
王朝志
杨波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Wulian Yida Technology Co Ltd
Original Assignee
Sichuan Wulian Yida Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Wulian Yida Technology Co Ltd filed Critical Sichuan Wulian Yida Technology Co Ltd
Priority to CN201810550258.7A priority Critical patent/CN108765826A/zh
Publication of CN108765826A publication Critical patent/CN108765826A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19602Image analysis to detect motion of the intruder, e.g. by frame subtraction
    • G08B13/19608Tracking movement of a target, e.g. by detecting an object predefined as a target, using target direction and or velocity to predict its new position
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的多遮挡模糊场景人形识别方法及系统,涉及人形识别与定位系统,尤其涉及一种基于深度学习的多遮挡模糊场景人形识别方法及系统,用以解决现有技术下的人形识别定位系统无法在光源复杂,场景多遮挡的情况下对行人进行快速识别和定位的问题,本发明采用基于深度学习的人形识别算法对行人进行检测和定位,再根据得到的检测和定位信息进行系统报警流程,本发明基于深度学习对行人检测模型进行训练得到高精度的检测模型,可以实现在多遮挡模糊场景对行人进行快速的识别和定位的目的,精度更高,可靠性更好。

Description

一种基于深度学习的多遮挡模糊场景人形识别方法及系统
技术领域
本发明涉及人形识别与定位系统,尤其涉及一种基于深度学习的多遮挡模糊场景人形识别方法及系统。
背景技术
多遮挡模糊场景主要是指真实的作业场景,区别于实验室中的模拟测试场景。多遮挡模糊场景具有以下特点:高光照度场景,夜间无光照场景,场景复杂度高,场景中行人遮挡严重,监控器分辨率不高。该算法完全针对真实场景,对于绝大多数极端场景有极好的容错性,在实际应用中具有极高的实际意义。
人形识别算法主要是针对场景中的行人进行识别,定位,跟踪的一套系统。该系统具有十分广泛的应用场景,例如:行人闯入报警,指定区域越界报警,行人热力图分布等。现主要应用于仓库内非工作时间的陌生人闯入报警,以及指定区域的越界报警,可以大量减少误报,错报,降低安防系统的整体工作压力,并显著提升报警精度,提高安防的安全性。因此,行人识别技术在物联网技术中扮演着非常重要的角色,同时使得报警系统更加智能化,精确化,安全化。
现有技术下的人形识别与定位系统主要应用于场景空旷行人稀少的地点,对于遮挡较为严重的复杂场景,如仓库,林园,建筑工地等场景的支持严重不足,同时一般识别系统主要应用于稳定光源的场景进行监控布防,夜间多使用红外摄像机实时监控,这种方式成本较高且不是十分稳定,对于光线变化频繁,光纤严重不足或者光线过于充足等情况不是很理想,此外常见的效果较好的人形识别系统对于算力要求较高,一般0.1~3fps无法达到实时监控的要求,同时摄像机数量增加时,对服务器压力也是非常大的。
因此设计一种能够在光源复杂情况下,实现多遮挡场景行人快速识别和定位的系统很有现实意义。
发明内容
本发明的目的在于:为了解决现有技术下人形识别与定位系统无法在光源复杂,场景多遮挡的情况下对行人进行快速识别和定位的问题,本发明提供了一种基于深度学习的多遮挡模糊场景人形识别方法及系统,基于深度学习对行人检测模型进行训练得到高精度的检测模型,可以实现在多遮挡模糊场景对行人进行快速的识别和定位的目的,精度更高,可靠性更好。
本发明采用的技术方案如下:
一种基于深度学习的多遮挡模糊场景人形识别方法,包括以下步骤:
S1、图像采集:通过图像采集模块采集图像数据样本,所述图像采集模块可采用摄像机。
S2、图像预处理:采用多种图像处理方法对S1中采集到的图像数据样本进行处理,得到数据集;
S3、行人检测模型训练:通过人工打标签的方式对上述S2中预处理后得到的数据集进行数据标注,同时搭建深度学习网络并调整网络参数后,再将标注后的数据集投入深度学习网络中进行训练;
S4、行人检测及定位:通过S3中训练后的行人检测模型处理实时图像,检测是否有行人并标定行人所在位置。
进一步地,根据S4得到的行人信息启动报警流程,并判断是否触发报警。
进一步地,所述系统报警流程为:
流程1、图像采集模块开始行人检测采集数据;
流程2、进行动态检测并判断是否发现移动目标,若不是,返回流程1,若是,进入下一流程;
流程3、加载行人检测模型;
流程4、进行行人识别并判断是否有人,若不是,返回流程1,若是,进入下一流程;
流程5、返回行人数量及行人坐标并根据布防策略判断是否报警,若无需报警,返回流程1,若需要报警,则进入下一流程;
流程6、拍照并上传服务器;
流程7、发送报警信息。
进一步地,所述步骤S1中摄像机进行动态检测,通过图像像素概率统计和图像像素叠加,生成标准背景图,将摄像机采集的图像和标准背景图做差,计算动差像素点数量,达到阀值即视为存在运动物体,再进行图像采集操作。
进一步地,所述多种图像处理方法包括椒盐噪声、随机剪裁、随机仿射变换、随机对比度明暗度变换、灰度化处理和二值化处理。
进一步地,所述深度学习网络的搭建过程为:将S1中图像尺寸调整为448*448,再将图像分割为7*7个网格,设计的网络结构总共包括24个卷积层,2个全连接层,包括预训练分类网络和训练检测网络,所述预训练分类网络由20个卷积网络+平均池化层+1个全连接层组成,所述训练检测网络由4个卷积层+1个全连接层组成,所述网络结构的最后一层输出7*7*30的维度,每个1*1*30的维度对应一个网格,该1*1*30的维度中含有类别预测和目标坐标预测。
一种基于深度学习的多遮挡模糊场景人形识别系统,包括摄像机和服务器,所述摄像机和服务器电连接,所述服务器中设有人形识别算法模块,所述人形识别算法模块根据摄像机采集到的数据,采用基于深度学习的人形识别算法对行人进行检测和定位
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明采用基于深度学习的人形识别算法,在绝大多数极端场景有极好的容错性,能够在多遮挡光源复杂场景的行人快速识别和定位。
2.本发明在人形识别算法的采集图像步骤中,通过图像像素概率统计和图像像素叠加生成的标准背景图解决了以往帧差动态检测法不稳定的问题。
3.本发明人形识别算法中采用多种图像预处理方法,使得有效数据量增大1~2个数量级,使得少量的数据样本同样可以实现较好的训练效果,同时大量的随机化处理,是人工模拟环境多样化的过程,使得模型在更多陌生场景的应用中具有较好的鲁棒性和较好的可移植性。
4.本发明建立的行人检测模型可以同时实现识别和定位,区别于以往的先定位后识别的传统识别算法,具有更高的精度和可靠性,同时对算力的消耗更小,识别速度更快可以达到50~100fps,完全可以实对视频当中的行人实现识别,定位和跟踪,在实际应用中有非常广泛的应用。
附图说明
本发明将通过例子并参照附图的方式说明,在附图中:
图1是本发明系统整体结构示意图;
图2是本发明模型训练流程图;
图3是本发明人形识别过程图;
图4是本发明人形识别网络结构图;
图5是本发明系统报警流程图。
具体实施方式
为了本技术领域的人员更好的理解发明,下面结合附图和实施例对本发明进行详细说明。
一种基于深度学习的多遮挡模糊场景人形识别方法,包括以下步骤:
S1、图像采集:通过设置在设备层的摄像机采集图像数据样本;
S2、图像预处理:采用多种图像处理方法随机对S1中采集到的图像数据样本进行处理,得到数据集;
S3、行人检测模型训练:通过人工打标签的方式对上述S2中预处理后得到的数据集进行数据标注,同时搭建深度学习网络,根据实际需求调整网络参数并将标注后的数据集投入深度学习网络中进行训练;
S4、行人检测及定位:通过S3中训练后的行人检测模型处理实时图像,检测是否有行人并标定行人所在位置。
为了检测图像中是否存在指定目标(行人),通过网络训练出来的行人检测模型处理图像中是否有行人并同时标定行人的所在位置,是一种同时实现识别和定位的算法,区别于以往的先定位后识别的传统识别算法,具有更高的精度和可靠性,同时对算力的消耗更小,识别速度更快可以达到50~100fps,完全可以实对视频当中的行人实现识别,定位和跟踪,在实际应用中有非常广泛的应用。
作为一种优选的实施方式,根据S4得到的行人信息启动报警流程,并判断是否触发报警。
作为一种优选的实施方式,所述系统报警流程为:
流程1、摄像机开始行人检测采集数据;
流程2、进行动态检测并判断是否发现移动目标,若不是,返回流程1,若是,进入下一流程;
流程3、加载行人检测模型;
流程4、进行行人识别并判断是否有人,若不是,返回流程1,若是,进入下一流程;
流程5、返回行人数量及行人坐标并根据布防策略判断是否报警,若无需报警,返回流程1,若需要报警,则进入下一流程;
流程6、拍照并上传服务器;
流程7、发送报警信息。
作为一种优选的实施方式,所述步骤S1中摄像机进行动态检测,通过图像像素概率统计和图像像素叠加,生成标准背景图,将摄像机采集的图像和标准背景图做差,计算动差像素点数量,达到阀值即视为存在运动物体,再进行图像采集操作。
作为一种优选的实施方式,所述多种图像处理方法包括椒盐噪声、随机剪裁、随机仿射变换、随机对比度明暗度变换、灰度化处理和二值化处理,随机处理的方式为:系统先自动生成随机数,根据该随机数随机选取图像处理方法,对原始数据图像进行特征提取,扩充有效数据量。这样使得有效数据量增大1~2个数量级,使得少量的数据样本同样可以实现较好的训练效果,同时大量的随机化处理,是人工模拟环境多样化的过程,使得模型在更多陌生场景的应用中具有较好的鲁棒性和较好的可移植性。
作为一种优选的实施方式,所述深度学习网卷积层+1个全连接层组成,所述网络结构的最后一层输出7*7*30的维度,每个1*1*30的络的搭建过程为:将S1中图像尺寸调整为 448*448,再将图像分割为7*7个网格,设计的网络结构总共包括24个卷积层,2个全连接层,包括预训练分类网络和训练检测网络,所述预训练分类网络由20个卷积网络+平均池化层+1个全连接层组成,所述训练检测网络由4个维度对应一个网格,该1*1*30的维度中含有类别预测和目标坐标预测,总的来讲就是让网格负责类别信息,过滤区主要负责坐标信息(部分负责类别信息和可信度信息)。
一种基于深度学习的多遮挡模糊场景人形识别系统,包括摄像机和服务器,所述摄像机和服务器电连接,所述服务器中设有人形识别算法模块,所述人形识别算法模块根据摄像机采集到的数据,采用基于深度学习的人形识别算法对行人进行检测和定位。
系统构建的步骤如下:
1.部署摄像机与计算所需计算机;
2.配置好程序运行所需环境;
3.使用摄像机采集图像;
4.初始化深度学习网络;
5.把图像输入识别出图像里的行人;
6.返回行人的坐标信息和事件触发时间;
7.根据返回信息触发报警,并拍照上传。
以上所述,仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以作出若干变形和改进,这些都属于发明的保护范围。

Claims (7)

1.一种基于深度学习的多遮挡模糊场景人形识别方法,其特征在于,包括以下步骤:
S1、图像采集:通过图像采集模块采集图像数据样本;
S2、图像预处理:采用多种图像处理方法随机对S1中采集到的图像数据样本进行处理,得到数据集;
S3、行人检测模型训练:通过人工打标签的方式对上述S2中预处理后得到的数据集进行数据标注,同时搭建深度学习网络并调整网络参数后,再将标注后的数据集投入深度学习网络中进行训练;
S4、行人检测及定位:通过S3中训练后的行人检测模型处理实时图像,检测并得到行人信息。
2.根据权利要求1所述的一种基于深度学习的多遮挡模糊场景人形识别方法,其特征在于,根据S4得到的行人信息启动报警流程,并判断是否触发报警。
3.根据权利要求2所述的一种基于深度学习的多遮挡模糊场景人形识别方法,其特征在于,所述系统报警流程为:
流程1、图像采集模块开始行人检测采集数据;
流程2、进行动态检测并判断是否发现移动目标,若不是,返回流程1,若是,进入下一流程;
流程3、加载行人检测模型;
流程4、进行行人识别并判断是否有人,若不是,返回流程1,若是,进入下一流程;
流程5、返回行人数量及行人坐标并根据布防策略判断是否报警,若无需报警,返回流程1,若需要报警,则进入下一流程;
流程6、拍照并上传服务器;
流程7、发送报警信息。
4.根据权利要求1所述的一种基于深度学习的多遮挡模糊场景人形识别方法,其特征在于,所述步骤S1中图像采集模块进行动态检测,通过图像像素概率统计和图像像素叠加,生成标准背景图,将图像采集模块采集的图像和标准背景图做差,计算动差像素点数量,达到阀值即视为存在运动物体,再进行图像采集操作。
5.根据权利要求1所述的一种基于深度学习的多遮挡模糊场景人形识别方法,其特征在于,所述多种图像处理方法包括椒盐噪声、随机剪裁、随机仿射变换、随机对比度明暗度变换、灰度化处理和二值化处理。
6.根据权利要求1所述的一种基于深度学习的多遮挡模糊场景人形识别方法,其特征在于,所述深度学习网络的搭建过程为:将S1中图像尺寸调整为448*448,再将图像分割为7*7个网格,设计的网络结构总共包括24个卷积层,2个全连接层,包括预训练分类网络和训练检测网络,所述预训练分类网络由20个卷积网络+平均池化层+1个全连接层组成,所述训练检测网络由4个卷积层+1个全连接层组成,所述网络结构的最后一层输出7*7*30的维度,每个1*1*30的维度对应一个网格,该1*1*30的维度中含有类别预测和目标坐标预测。
7.一种基于深度学习的多遮挡模糊场景人形识别系统,包括图像采集模块和服务器,所述图像采集模块和服务器电连接,其特征在于,所述服务器中设有人形识别算法模块,所述人形识别算法模块根据图像采集模块采集到的数据,采用基于深度学习的人形识别算法对行人进行检测和定位。
CN201810550258.7A 2018-05-31 2018-05-31 一种基于深度学习的多遮挡模糊场景人形识别方法及系统 Pending CN108765826A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810550258.7A CN108765826A (zh) 2018-05-31 2018-05-31 一种基于深度学习的多遮挡模糊场景人形识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810550258.7A CN108765826A (zh) 2018-05-31 2018-05-31 一种基于深度学习的多遮挡模糊场景人形识别方法及系统

Publications (1)

Publication Number Publication Date
CN108765826A true CN108765826A (zh) 2018-11-06

Family

ID=64001411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810550258.7A Pending CN108765826A (zh) 2018-05-31 2018-05-31 一种基于深度学习的多遮挡模糊场景人形识别方法及系统

Country Status (1)

Country Link
CN (1) CN108765826A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493336A (zh) * 2018-11-14 2019-03-19 上海艾策通讯科技股份有限公司 基于人工智能的视频马赛克识别自动学习的系统及方法
CN109840489A (zh) * 2019-01-24 2019-06-04 深圳市云恩科技有限公司 一种渡口行人运动跟踪检测系统及其检测方法
CN110533031A (zh) * 2019-08-21 2019-12-03 成都电科慧安科技有限公司 一种目标检测识别与定位的方法
CN113096337A (zh) * 2021-04-08 2021-07-09 中国人民解放军军事科学院国防工程研究院工程防护研究所 用于复杂背景的移动目标识别处理方法及智能安防系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104320617A (zh) * 2014-10-20 2015-01-28 中国科学院自动化研究所 一种基于深度学习的全天候视频监控方法
CN107985189A (zh) * 2017-10-26 2018-05-04 西安科技大学 面向高速驾驶环境下的驾驶员变道深度预警方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104320617A (zh) * 2014-10-20 2015-01-28 中国科学院自动化研究所 一种基于深度学习的全天候视频监控方法
CN107985189A (zh) * 2017-10-26 2018-05-04 西安科技大学 面向高速驾驶环境下的驾驶员变道深度预警方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
焦旭辉: "基于深度学习的行人再识别技术研究", 《万方数据库》 *
郝岩等: "卷积神经网络在SAR目标识别中的应用", 《重庆理工大学学报(自然科学)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493336A (zh) * 2018-11-14 2019-03-19 上海艾策通讯科技股份有限公司 基于人工智能的视频马赛克识别自动学习的系统及方法
CN109493336B (zh) * 2018-11-14 2022-03-04 上海艾策通讯科技股份有限公司 基于人工智能的视频马赛克识别自动学习的系统及方法
CN109840489A (zh) * 2019-01-24 2019-06-04 深圳市云恩科技有限公司 一种渡口行人运动跟踪检测系统及其检测方法
CN110533031A (zh) * 2019-08-21 2019-12-03 成都电科慧安科技有限公司 一种目标检测识别与定位的方法
CN113096337A (zh) * 2021-04-08 2021-07-09 中国人民解放军军事科学院国防工程研究院工程防护研究所 用于复杂背景的移动目标识别处理方法及智能安防系统

Similar Documents

Publication Publication Date Title
CN108765826A (zh) 一种基于深度学习的多遮挡模糊场景人形识别方法及系统
CN107437318B (zh) 一种可见光智能识别算法
CN111985365A (zh) 一种基于目标检测技术的秸秆焚烧监测方法和系统
CN104463869B (zh) 一种视频火焰图像复合识别方法
US10282601B2 (en) Electronic device and gesture recognition method applied therein
CN107341443A (zh) 视频处理方法、装置及存储介质
CN103810696B (zh) 一种目标对象图像检测方法及装置
CN110399908A (zh) 基于事件型相机的分类方法和装置、存储介质、电子装置
CN108470424A (zh) 一种基于图像特征的森林安全监测系统
CN106612385B (zh) 视频检测方法和视频检测装置
CN110288801A (zh) 电力现场视频监控方法、装置、计算机设备和存储介质
Ezzahout et al. Conception and development of a video surveillance system for detecting, tracking and profile analysis of a person
CN113012383A (zh) 火灾检测报警方法、相关系统、相关设备及存储介质
CN110766894A (zh) 社区围墙翻越预警方法、系统、服务器及计算机存储介质
CN111405249A (zh) 监控方法、装置及服务器和计算机可读存储介质
JP2010134927A (ja) 階層的外観モデルを用いた監視方法及び監視装置
CN112347526A (zh) 基于防摄屏的信息安全保护方法、装置、电子设备及介质
CN115294528A (zh) 一种行人安全监控方法及装置
CN114155551A (zh) 基于YOLOv3改进的复杂环境下的行人检测方法及装置
CN112580778A (zh) 基于YOLOv5和Pose-estimation的工地工人手机使用检测方法
CN116310979B (zh) 图像识别方法、风险管控平台及方法、安全管控平台
Moeys et al. Pred18: Dataset and further experiments with davis event camera in predator-prey robot chasing
CN112435240B (zh) 一种面向工人违规使用手机的深度视觉手机检测系统
CN110796008A (zh) 一种基于视频图像的早期火灾检测方法
CN115690584A (zh) 一种基于ssd改进的配电房异物检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181106

RJ01 Rejection of invention patent application after publication