CN113191182A - 一种基于深度学习的暴力异常行为检测方法 - Google Patents
一种基于深度学习的暴力异常行为检测方法 Download PDFInfo
- Publication number
- CN113191182A CN113191182A CN202110224967.8A CN202110224967A CN113191182A CN 113191182 A CN113191182 A CN 113191182A CN 202110224967 A CN202110224967 A CN 202110224967A CN 113191182 A CN113191182 A CN 113191182A
- Authority
- CN
- China
- Prior art keywords
- violent
- detection
- behavior detection
- abnormal behavior
- behaviors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 206010000117 Abnormal behaviour Diseases 0.000 title claims abstract description 22
- 238000013135 deep learning Methods 0.000 title claims abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 14
- 230000006399 behavior Effects 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 6
- 238000013528 artificial neural network Methods 0.000 claims abstract description 5
- 238000000605 extraction Methods 0.000 claims abstract description 4
- 230000003287 optical effect Effects 0.000 claims description 3
- 238000011410 subtraction method Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 18
- 206010001488 Aggression Diseases 0.000 abstract description 7
- 238000011160 research Methods 0.000 abstract description 3
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 208000003464 asthenopia Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/44—Event detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Social Psychology (AREA)
- Psychiatry (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的暴力异常行为检测方法,涉及暴力异常行为技术领域;它的检测方法如下:步骤一:研究异常行为检测的原理以及经典的检测方法;步骤二:研究基于3D卷积神经网络的特征提取方法;步骤三:搭建神经网络,通过网络训练得到最终的暴力异常行为检测网络模型;步骤四:提出将行为检测与目标检测相结合;本发明利用计算机视觉技术对监控视频中的暴力异常行为检测技术展开研究,实现对抢劫、打架斗殴等暴力行为能够进行实时的监测预警,并且实现在在大量视频中对暴力行为的快速检索定位功能;有效改善目前监控系统数据利用率低下的问题以及智能监控视频技术的完善和发展有着重大的意义。
Description
技术领域
本发明属于暴力异常行为技术领域,具体涉及一种基于深度学习的暴力异常行为检测方法。
背景技术
如今,随着社会经济不断发展,城市扩张,人口密度越来越高,在街道、商场等公共区域的人口密度较大,很容易发生抢劫、打斗等危险的异常事件。这些危险因素都给公共管理以及安全带来了极大的威胁和挑战。
面对这一问题,社会对于安防设施的需求不断增长,这促使政府在公共场所部署了大量的视频监控系统。但是传统的监控视频有如下两个弊端:(1)、在需要对监控视频实时监测的场景下,只能用人的肉眼进行监测,在长期监测过程中会让人产生视觉疲劳,从而导致监测信息的可靠性和效率降低。(2)、很多的监控系统处于“只记录不判断”的模式,在暴力事件发生后,相关部门需要对监控进行调查取证,存在很大的信息滞后性,不能实时地对暴力异常行为做出响应。所以,目前传统的监控系统对于视频数据的审查不仅费时费力,而且容易造成漏检或者误检,无法从根本上达到防患于未然。
发明内容
为解决背景技术中的问题;本发明的目的在于提供一种基于深度学习的暴力异常行为检测方法。
本发明的一种基于深度学习的暴力异常行为检测方法,它的检测方法如下:
步骤一:研究异常行为检测的原理以及经典的检测方法,其中包括背景减除法、光流法以及帧差法;
步骤二:研究基于3D卷积神经网络的特征提取方法,通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积核,卷积层中的特征图会与上一层中的多个相邻帧相连,从而捕获运动信息;
步骤三:搭建神经网络,通过网络训练得到最终的暴力异常行为检测网络模型;
步骤四:为提升识别准确率将识别算法进行优化和改进,提出将行为检测与目标检测相结合。
与现有技术相比,本发明的有益效果为:
一、利用计算机视觉技术对监控视频中的暴力异常行为检测技术展开研究,实现对抢劫、打架斗殴等暴力行为能够进行实时的监测预警,并且实现在在大量视频中对暴力行为的快速检索定位功能。
二、有效改善目前监控系统数据利用率低下的问题以及智能监控视频技术的完善和发展有着重大的意义。
附图说明
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
图1为本发明的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
本具体实施方式采用以下技术方案:基于深度学习的方法,结合目标检测技术、行为识别技术开展研究,构建人体暴力异常行为检测网络模型,实现在监控视频中实时检测出暴力行为。主要内容如下:
1、研究异常行为检测的原理以及经典的检测方法,其中包括背景减除法、光流法以及帧差法;
2、研究基于3D卷积神经网络的特征提取方法,通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积核,卷积层中的特征图会与上一层中的多个相邻帧相连,从而捕获运动信息。
3、搭建神经网络,通过网络训练得到最终的暴力异常行为检测网络模型。
4、为提升识别准确率将识别算法进行优化和改进,提出将行为检测与目标检测相结合。
如图1所示,本具体实施方式的具体实施方式如下:
一、在数据集的选择上,选择Hockey数据集、UCF-Crime数据集、CAVIAR数据集以及BEHAVE数据集四个公开数据集。其中Hockey数据集中包含了500个不同角度的暴力行为,500个正常比赛或站立的动作,该数据集用于训练集;UCF-Crime数据集有1900个带有标签的监控视频组成,涵盖真是场景中的纵火、打架斗殴、抢劫等暴力异常行为,此数据集将用于训练集;CAVIAR数据集和BEHAVE数据集包含了不同场景下人的行为,选取其中包含打架行为、奔跑行为、正常行走等30个视频作为测试集。
二、在训练方式方面,使用公开数据集,在模型训练方面将采用有监督学习。
三、采用Pytorch网络框架,选择基于CNN的目标检测网络模型,通过研究行为检测的算法,分析各类算法的特性,最终选择3D卷积神经网络。3DCNN可以同时在空间和时间两个维度捕获视频序列的运动和表现特征信息;采用三维的卷积核对多帧视频叠加组成的视频时空块在时间和空间维度上进行卷积,以考虑相邻帧的时序信息融合。具体公式为:
表示第i层卷积层的第j层特征图上(x,y,z)位置的特征值;表示计算第i层卷积层中第j层特征图的第m个3D卷积核中位置为(h,w,r)的权重;H,W,R表示3D卷积核的空间高度、宽度以及时间长度。卷积核的个数决定卷积层输出的特征图个数,且每个特征图是一个3维矩阵块。
四、为了提升识别的准确率,降低误报的情况,将在暴力行为识别的基础上,加入目标检测,检测发生暴力行为的人手中是否持有枪支、刀具、棍棒,进行暴力等级判定。在对比分析目前的各类目标检测算法,最后选择YOLO网络,YOLO网络是一种端到端的网络,可以将检测当做回归问题求解,而且YOLO的实时性在目前所有目标检测算法中是最好的。网络训练的大体流程如下:
(4.1)、将处理过得图像进行resize处理,调整图像尺寸作为整个网络的输出。
(4.2)、通过运行神经网络得到boundingbox(边界框)坐标,坐标中含有目标的置信度和类别概率。
(4.3)、在测试的时候,每个网格预测的类别信息和boundingbox(边界框)预测的信息相乘,得到每个boundingbox的具体类别和置信度。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (1)
1.一种基于深度学习的暴力异常行为检测方法,其特征在于:它的检测方法如下:
步骤一:研究异常行为检测的原理以及经典的检测方法,其中包括背景减除法、光流法以及帧差法;
步骤二:研究基于3D卷积神经网络的特征提取方法,通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积核,卷积层中的特征图会与上一层中的多个相邻帧相连,从而捕获运动信息;
步骤三:搭建神经网络,通过网络训练得到最终的暴力异常行为检测网络模型;
步骤四:为提升识别准确率将识别算法进行优化和改进,提出将行为检测与目标检测相结合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110224967.8A CN113191182A (zh) | 2021-03-01 | 2021-03-01 | 一种基于深度学习的暴力异常行为检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110224967.8A CN113191182A (zh) | 2021-03-01 | 2021-03-01 | 一种基于深度学习的暴力异常行为检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113191182A true CN113191182A (zh) | 2021-07-30 |
Family
ID=76973054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110224967.8A Pending CN113191182A (zh) | 2021-03-01 | 2021-03-01 | 一种基于深度学习的暴力异常行为检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113191182A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115049969A (zh) * | 2022-08-15 | 2022-09-13 | 山东百盟信息技术有限公司 | 一种改进YOLOv3和BiConvLSTM的不良视频检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614882A (zh) * | 2018-11-19 | 2019-04-12 | 浙江大学 | 一种基于人体姿态估计的暴力行为检测系统及方法 |
CN111738044A (zh) * | 2020-01-06 | 2020-10-02 | 西北大学 | 一种基于深度学习行为识别的校园暴力评估方法 |
-
2021
- 2021-03-01 CN CN202110224967.8A patent/CN113191182A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614882A (zh) * | 2018-11-19 | 2019-04-12 | 浙江大学 | 一种基于人体姿态估计的暴力行为检测系统及方法 |
CN111738044A (zh) * | 2020-01-06 | 2020-10-02 | 西北大学 | 一种基于深度学习行为识别的校园暴力评估方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115049969A (zh) * | 2022-08-15 | 2022-09-13 | 山东百盟信息技术有限公司 | 一种改进YOLOv3和BiConvLSTM的不良视频检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yogameena et al. | Computer vision based crowd disaster avoidance system: A survey | |
Lopez-Fuentes et al. | Review on computer vision techniques in emergency situations | |
CN109829429B (zh) | 基于YOLOv3的监控场景下的安防敏感物品检测方法 | |
Zhan et al. | A high-precision forest fire smoke detection approach based on ARGNet | |
CN106980829B (zh) | 基于视频分析的打架斗殴异常行为自动检测方法 | |
CN105426820B (zh) | 基于安防监控视频数据的多人异常行为检测方法 | |
Lin et al. | Learning to detect anomaly events in crowd scenes from synthetic data | |
Ko et al. | Survey of computer vision–based natural disaster warning systems | |
TW200841737A (en) | Video analytics for banking business process monitoring | |
CN110852179B (zh) | 基于视频监控平台的可疑人员入侵的检测方法 | |
CN114399734A (zh) | 一种基于视觉信息的森林火灾预警方法 | |
Qiang et al. | Forest fire smoke detection under complex backgrounds using TRPCA and TSVB | |
Tomar et al. | Dynamic Kernel CNN-LR model for people counting | |
CN114677640A (zh) | 基于机器视觉的智慧工地安全监测系统及方法 | |
CN115346157A (zh) | 入侵检测方法、系统、设备及介质 | |
CN117671602B (zh) | 基于图像识别的农田森林烟雾防火检测方法和设备 | |
CN118229085A (zh) | 基于注意力预测机制的智慧园区能管风险视觉管理系统 | |
CN113191182A (zh) | 一种基于深度学习的暴力异常行为检测方法 | |
Singh et al. | An intelligent video surveillance system using edge computing based deep learning model | |
Li et al. | Dynamic risk assessment of emergency evacuation in large public buildings: A case study | |
CN113269111A (zh) | 一种基于视频监控的电梯异常行为检测方法及系统 | |
CN111898440A (zh) | 一种基于三维卷积神经网络的山火检测方法 | |
Hubner et al. | Audio-video sensor fusion for the detection of security critical events in public spaces | |
Hao et al. | A detection method of abnormal event in crowds based on image entropy | |
Raj et al. | Estimation of Social Distance for COVID19 Prevention using K-Nearest Neighbor Algorithm through deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210730 |
|
WD01 | Invention patent application deemed withdrawn after publication |