CN115311740A - 一种电网基建现场人体异常行为识别方法及系统 - Google Patents
一种电网基建现场人体异常行为识别方法及系统 Download PDFInfo
- Publication number
- CN115311740A CN115311740A CN202210885390.XA CN202210885390A CN115311740A CN 115311740 A CN115311740 A CN 115311740A CN 202210885390 A CN202210885390 A CN 202210885390A CN 115311740 A CN115311740 A CN 115311740A
- Authority
- CN
- China
- Prior art keywords
- flow
- power grid
- network
- grid infrastructure
- human body
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 35
- 230000004927 fusion Effects 0.000 claims abstract description 74
- 238000013528 artificial neural network Methods 0.000 claims abstract description 57
- 206010000117 Abnormal behaviour Diseases 0.000 claims abstract description 52
- 230000003287 optical effect Effects 0.000 claims abstract description 26
- 238000012806 monitoring device Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000001514 detection method Methods 0.000 claims abstract description 15
- 238000010586 diagram Methods 0.000 claims abstract description 15
- 238000013527 convolutional neural network Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 12
- 230000002123 temporal effect Effects 0.000 claims description 11
- 241000282326 Felis catus Species 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 4
- 230000005856 abnormality Effects 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 3
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000011946 reduction process Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims 1
- 238000009440 infrastructure construction Methods 0.000 abstract 3
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000007500 overflow downdraw method Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011897 real-time detection Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/16—Image acquisition using multiple overlapping images; Image stitching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Psychiatry (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Social Psychology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
Abstract
一种电网基建现场人体异常行为识别方法及系统,识别方法包括,搭建双通道三维卷积神经网络和双流特征融合网络,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频最新16帧RGB图像及计算这16帧RGB图像的光流图;将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;根据分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
Description
技术领域
本发明属于电力系统安全监测技术领域,具体涉及一种电网基建现场人体异常行为识别方法及系统。
背景技术
近年来,将人工智能应用于基建现场的异常行为识别显得尤为迫切。异常行为可分为单人异常行为、交互异常行为及群体异常行为,其定义取决于现实生活的应用场景并且会受到一定程度的主观影响。目前,在电网基建现场人体异常行为检测领域,最通用的做法是通过日常的人工巡检或通过监控设备人工监督。
电网基建作业具有类型多样,基建规模大、施工人员多的特点,完全依靠人工巡检的办法已无法实时掌握所有施工人员的状态,而通过视频监控设备辅助的方式对于电网基建现场作业人员的监督作用也较为有限,且很多异常状态的发现均已处于事后阶段,没有达到预防电网基建现场作业人员异常行为发生的初衷。由此可见,研究电网基建现场人体异常行为检测方法有重要的理论意义和实用价值。
目前针对电网基建现场人体异常行为检测技术的研究比较少,但是国内外专家学者针对相关难点问题基于人工智能理论提出了一些卓有成效的实现方案。基于深度学习的行为识别在国内外也已经有了多方面的研究,一种基于双流卷积神经网络被提出,这种网络可以独立的使用RGB图片帧和连续帧之间的光流图像来获取静态特征和动态特征,最后将两个分支在全连接层进行分数的融合,将融合后分数最高的类别作为当前行为的类别。一种双分辨率卷积神经网络被提出,这种网络的一个通道输入原始分辨率的图片帧,另一个通道输入低分辨率的图片帧,独立训练两个模型后在全连接层进行融合,将融合后的特征用于后续的行为识别中。研究人员通过对原始的二维卷积神经网络进行改进,提出了三维卷积神经网络,更好的描述了视频的时序信息。
上述基于卷积神经网络的深度学习方法虽然检测准确率较高,但算法精度很大程度上受限于异常数据的数据规模;且整体算法的检测无法实时进行,这就意味着无法实时检测电网基建现场作业人员的异常行为,无法做到事前预防。
鉴于此,本文充分运用电网基建现场人员作业数据,基于双通道特征融合的方法,使用三维卷积神经网络解决传统模型实时性差,无法充分利用视频帧间时序信息的问题,进而科学有效的实现电网基建现场人体异常检测任务。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种电网基建现场人体异常行为识别方法及系统,解决传统模型实时性差,无法充分利用视频帧间时序信息的问题,进而科学有效的实现电网基建现场人体异常检测任务。
本发明采用如下的技术方案。一种电网基建现场人体异常行为识别方法,其特征在于,包括以下步骤,
步骤1,搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对双通道三维卷积神经网络和双流特征融合网络进行训练,得到电网基建现场人体异常行为识别模型;
步骤2,从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频流及光流图;
步骤3,将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
步骤4,根据步骤3的分类结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
优选地,
步骤1中,双通道三维卷积神经网络包括:空间流三维卷积神经网络和时间流三维卷积神经网络,空间流三维卷积神经网络用来提取和行为相关的空间特征,时间流三维卷积神经网络用来提取时间特征。
步骤1中,空间流三维卷积神经网络和时间流三维卷积神经网络网络参数共享,网络参数包括:网络权重和偏置值。
步骤1中,双通道三维卷积神经网络包括:8个三维卷积层和5个三维池化层,搭建双流特征融合网络,包括:1个拼接层,1个三维卷积层和1个三维池化层。
步骤2中,视频流为RGB视频流,实时获取16帧视频流,通过计算16帧视频流得出光流图。
优选地,步骤1包括:建立空间流三维卷积神经网络模型,其输入为XRGB即 RGB视频帧,输出特征记作输出的特征为X′RGB;
建立时间流三维卷积网络模型,其输入为XFLOW即RGB图像的光流图,输出时间流特征X′FLOW;具体包括:
其中,
XRGB表示输入空间流三维卷积神经网络的连续16帧RGB视频帧,
D1表示输入视频帧通道数,
T表示输入视频帧数,
W1和H1分别表示视频帧的宽和高;
其中,
XFLOW表示输入时间流三维卷积神经网络的x和y轴光流提取方向的光流图,
D2表示输入视频帧通道数,
B表示光流提取方向数,
W2和H2分别表示光流图的宽和高;
其中,
D1′表示空间流三维卷积网络输出的视频帧通道数,
T′表示空间流三维卷积网络输出的视频帧数,
W1′表示空间流三维卷积网络输出的视频帧的宽,
H1′表示空间流三维卷积网络输出的视频帧的高,
D2′表示时间流三维卷积网络输出的视频帧通道数,
B′表示时间流三维卷积网络输出的光流提取方向数,
W2′表示时间流三维卷积网络输出的光流图的宽,
H2′表示时间流三维卷积网络输出的光流图的高,
D1′=D2′,T′=B′,W1=W2′,H1=H2′。
步骤1.2,对时间流三维卷积网络输出特征和空间流三维卷积网络输出特征融合;首先将X′RGB和X′FLOW进行通道维度上的拼接,然后使用一层三维卷积层和一层三维池化层对拼接后的结果进行时间特征融合得到时间特征融合后的融合特征集合Z;具体包括:
对步骤1.1中输出的特征进行空间融合和时间融合,
首先,进行空间融合,将X′RGB和X′FLOW进行通道维度上的拼接:
Zcat=concat(X′RGB,X′FLOW)
其中,
其中,
2D′×U×W′×H′表示经过双流特征拼接融合后的融合特征维度,
2D′=D1′+D2′,U=T′=B′,W′=W1′=W2′,H′=H1′=H2′;
其中,
Z表示降维处理后的融合特征,
D″×U′×W″×H″表示降维处理后的融合特征的维度,D″=D′,U′=U, W″=W′,H″=H′。
步骤1.3,将融合特征集合Z输入3层全连接层,将特征降维,最终在最后一层全连接层输出所预测的第i个行为发生的概率;具体包括:
其中,
N表示电网基建现场人体异常行为类别的数量,
步骤1.4,经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,分别得到空间流网络输出所预测的第i个行为发生的概率和时间流网络输出所预测的第i个行为发生的概率;具体包括:
步骤1.5,利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y,将视频样本X输入步骤1.1至步骤1.4中搭建的网络训练,得到对应输出的空间流网络输出所预测行为发生的概率、时间流网络输出所预测行为发生的概率以及基于融合特征所输出的预测行为发生的概率,采用交叉熵损失计算法确定对视频样本X的拟合程度,从而确定空间流三维卷积神经网络、时间流三维卷积神经网络以及空间流特征与时间流特征融合的交叉熵损失影响因子,
其中,
λ1表示空间流三维卷积神经网络交叉熵损失影响因子,
λ2表示时间流三维卷积神经网络交叉熵损失影响因子,
λ3表示空间流特征与时间流特征融合交叉熵损失影响因子,
i∈[1,N],表示电网基建现场人体异常行为类别之一,
通过训练过程确定λ1,λ2,λ3具体数值。
一种电网基建现场人体异常行为识别系统,包括:模型搭建模块,数据采集模块,分类识别模块和结果输出模块,其中,
模型搭建模块用于搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;
数据采集模块用于从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频视频流及光流图;
分类识别模块用于将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
结果输出模块用于对分类识别模块的分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
本发明的有益效果在于,与现有技术相比,
(1)本发明采用基于双通道三维卷积神经网络的电网基建现场人体异常行为识别方法,在保证准确度的前期下,实现了电网基建现场人体异常行为的实时检测任务;
(2)本发明不同于现有技术仅使用二维卷积网络构建特征提取器的方法,提出了一种基于三维卷积神经网络的特征提取器,且通过双通道的方式,分别提取视频的空间特征和时间特征,实现端到端融合,提取到的时间维度上视频序列间的时间特征。在兼顾实时性和准确性的基础上解决了模型在电网基建现场人体异常数据上不能很好的学习视频帧间长时信息的问题;
(3)本发明不同于现有技术采取决策级融合的方法,本发明在网络模型训练过程中对空间网络和时间网络进行特征融合而不是决策分数的融合。采取在 5b卷积层进行空间流特征与时间流特征的融合,通过特征融合的方法可以获得更高维度的信息,有利于正确率的提升。
附图说明
图1是本发明提出的一种电网基建现场人体异常行为识别方法流程图;
图2是本发明搭建的双通道三维卷积神经网络结构示意图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
实施例1。
如图1所示,一种电网基建现场人体异常行为识别方法。包括以下步骤,
步骤1,搭建双通道三维卷积神经网络和融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,双通道三维卷积神经网络包括:空间流三维卷积神经网络和时间流三维卷积神经网络,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据对双通道三维卷积神经网络和双流特征融合网络网络进行训练,得到电网基建现场人体异常行为识别模型;
本实施例优选地,空间流三维卷积神经网络和时间流三维卷积神经网络网络参数共享,网络参数包括:网络权重和偏置值。
步骤1.1,搭建双通道三维卷积神经网络,如图2所示为空间流三维卷积神经网络和时间流三维卷积神经网络,两个网络均由8个三维卷积层和5个三维最大池化层组成,分别用以提取工作人员作业视频数据的空间特征和时间特征。
建立空间流三维卷积神经网络模型,其输入为XRGB即RGB视频帧,输出特征记作输出的特征为X′RGB;
建立时间流三维卷积网络模型,其输入为XFLOW即RGB图像的光流图,输出时间流特征X′FLOW;
其中,
XRGB表示输入空间流三维卷积神经网络的连续16帧RGB视频帧,
D1表示输入视频帧通道数,
T表示输入视频帧数,
W1和H1分别表示视频帧的宽和高。
其中,
XFLOW表示输入时间流三维卷积神经网络的x和y轴光流提取方向的光流图,
D2表示输入视频帧通道数,
B表示光流提取方向数,
W2和H2分别表示光流图的宽和高。
其中:
D1′表示空间流三维卷积网络输出的视频帧通道数,
T′表示空间流三维卷积网络输出的视频帧数,
W1′表示空间流三维卷积网络输出的视频帧的宽,
H1′表示空间流三维卷积网络输出的视频帧的高,
D2′表示时间流三维卷积网络输出的视频帧通道数,
B′表示时间流三维卷积网络输出的光流提取方向数,
W2′表示时间流三维卷积网络输出的光流图的宽,
H2′表示时间流三维卷积网络输出的光流图的高,
″
D1′=D2′,T′=B′,W1=W2′,H1=H2′;
此步骤的目的是为了双通道神经网络提取出相同维度的空间流特征和时间流特征。
步骤1.2,对时间流三维卷积网络输出特征和空间流三维卷积网络输出特征融合;首先将X′RGB和X′FLOW进行通道维度上的拼接,然后使用一层三维卷积层和一层三维池化层对拼接后的结果进行时间特征融合得到时间特征融合后的融合特征集合Z;
构建双流特征融合网络,如图2所示,融合网络用以融合空间流三维卷积神经网络输出的空间特征X′RGB和时间流三维卷积神经网络输出的时间特征X′FLOW。
本实施例优选地,双流特征融合网络,包括:1个拼接层、1个三维卷积层和1个三维池化层,
首先,进行空间融合,将X′RGB和X′FLOW进行通道维度上的拼接:
Zcat=concat(X′RGB,X′FLOW)
其中,
2D′×U×W′×H′表示经过双流特征拼接融合后的融合特征维度,
2D′=D1′+D2′,U=T′=B′,W′=W1′=W2′,H′=H1′=H2′;
其中,
Z表示降维处理后的融合特征,
D″×U′×W″×H″表示降维处理后的融合特征的维度,
D″=D′,U′=U,W″=W′,H″=H′。
得到通过空间和时间特征的融合,可以提取更高维度的特征,有利于算法正确率的提升。
其中,
N表示电网基建现场人体异常行为类别的数量,
步骤1.4,经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,分别得到空间流网络输出所预测的第i个行为发生的概率和时间流网络输出所预测的第i个行为发生的概率;具体包括:经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,将特征降维,最终在最后一层全连接层输出和
其中,
N为电网基建现场人体异常行为类别的数量,
步骤1.5,利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y,将视频样本X输入步骤1.1至步骤1.4中搭建的网络训练,得到对应输出的空间流网络输出所预测行为发生的概率、时间流网络输出所预测行为发生的概率以及基于融合特征所输出的预测行为发生的概率,采用交叉熵损失计算法确定对视频样本X的拟合程度,从而确定空间流三维卷积神经网络、时间流三维卷积神经网络以及空间流特征与时间流特征融合的交叉熵损失影响因子。
利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y={y1,y2,…,yN},将视频样本X输入上述步骤中的搭建的网络训练,得到对应输出和采用交叉熵损失计算算法输出和对视频样本X的拟合程度,使之尽可能接近标注真值Y:
其中,
λ1表示空间流三维卷积神经网络交叉熵损失影响因子,
λ2表示时间流三维卷积神经网络交叉熵损失影响因子,
λ3表示空间流特征与时间流特征融合交叉熵损失影响因子,
i∈[1,N],表示电网基建现场人体异常行为类别之一。
通过训练过程确定λ1、λ2、λ3具体数值。
通过计算损失函数,利用反向传播算法更新网络参数,使得最终损失函数收敛至一个极小的数值,即可完成算法的训练,生成电网基建现场人体异常行为识别模型。
步骤2,从电网基建现场作业监控装置实时采集电网基建现场作业视频数据,获取实时视频流及光流图,形成电网基建现场人体异常行为识别模型的输入X;
本实施例优选地,视频流为RGB视频流,实时获取16帧视频流,通过计算 16帧视频流得出光流图。
步骤3,将数据输入至上述算法训练阶段生成的电网基建现场人体异常行为识别模型,得到行为分类结果输出;
步骤4,根据步骤3中电网基建现场人体异常行为识别模型所得到的行为分类结果,若模型输出为异常行为类别,则进行报警,然后继续执行电网基建现场人体异常行为检测任务;若模型输出正常行为类别,则返回继续执行电网基建现场人体异常行为检测任务。
实施例2。
一种电网基建现场人体异常行为识别系统,包括:模型搭建模块,数据采集模块,分类识别模块和结果输出模块,其中,
模型搭建模块用于搭建双通道三维卷积神经网络和双流特征融合网络,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;
数据采集模块用于从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频最新16帧RGB图像及计算这16帧RGB图像的光流图;
分类识别模块用于将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
结果输出模块用于对分类识别模块的分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
本发明的有益效果在于,与现有技术相比,
(1)本发明采用基于双通道三维卷积神经网络的电网基建现场人体异常行为识别方法,在保证准确度的前期下,实现了电网基建现场人体异常行为的实时检测任务;
(2)本发明不同于现有技术仅使用二维卷积网络构建特征提取器的方法,提出了一种基于三维卷积神经网络的特征提取器,且通过双通道的方式,分别提取视频的空间特征和时间特征,实现端到端融合,提取到的时间维度上视频序列间的时间特征。在兼顾实时性和准确性的基础上解决了模型在电网基建现场人体异常数据上不能很好的学习视频帧间长时信息的问题;
(3)本发明不同于现有技术采取决策级融合的方法,本发明在网络模型训练过程中对空间网络和时间网络进行特征融合而不是决策分数的融合。采取在 5b卷积层进行空间流特征与时间流特征的融合,通过特征融合的方法可以获得更高维度的信息,有利于正确率的提升。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (13)
1.一种电网基建现场人体异常行为识别方法,其特征在于,包括以下步骤,
步骤1,搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对双通道三维卷积神经网络和双流特征融合网络进行训练,得到电网基建现场人体异常行为识别模型;
步骤2,从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频流及光流图;
步骤3,将视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
步骤4,根据步骤3中电网基建现场人体异常行为识别模型所得到的行为分类结果,若模型输出为异常行为类别,则进行报警,然后继续执行电网基建现场人体异常行为检测任务;若模型输出正常行为类别,则返回继续执行电网基建现场人体异常行为检测任务。
2.根据权利要求1所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤2中,视频流为RGB视频流,实时获取16帧视频流,通过计算16帧视频流得出光流图。
3.根据权利要求1所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1中,双通道三维卷积神经网络包括:空间流三维卷积神经网络和时间流三维卷积神经网络;
空间流三维卷积神经网络用来提取和行为相关的空间特征,时间流三维卷积神经网络用来提取时间特征。
4.根据权利要求3所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1中,空间流三维卷积神经网络和时间流三维卷积神经网络网络参数共享,网络参数包括:网络权重和偏置值。
5.根据权利要求4所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1中,双通道三维卷积神经网络包括:8个三维卷积层和5个三维池化层。
6.根据权利要求5所述的一种电网基建现场人体异常行为识别方法,其特征在于,
双流特征融合网络包括:1个拼接层,1个三维卷积层和1个三维池化层。
7.根据权利要求6所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1包括:
步骤1.1,建立空间流三维卷积神经网络模型,其输入为XRGB即RGB视频帧,输出特征记作输出的特征为X′RGB;
建立时间流三维卷积网络模型,其输入为XFLOW即RGB图像的光流图,输出时间流特征X′FLOW;
步骤1.2,对时间流三维卷积网络输出特征和空间流三维卷积网络输出特征融合;首先将X′RGB和X′FLOW进行通道维度上的拼接,然后使用一层三维卷积层和一层三维池化层对拼接后的结果进行时间特征融合得到时间特征融合后的融合特征集合Z;
步骤1.3,将融合特征集合Z输入3层全连接层,将特征降维,最终在最后一层全连接层输出所预测的第i个行为发生的概率;
步骤1.4,经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,分别得到空间流网络输出所预测的第i个行为发生的概率和时间流网络输出所预测的第i个行为发生的概率;
步骤1.5,利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y,将视频样本X输入步骤1.1至步骤1.4中搭建的网络训练,得到对应输出的空间流网络输出所预测行为发生的概率、时间流网络输出所预测行为发生的概率以及基于融合特征所输出的预测行为发生的概率,采用交叉熵损失计算法确定对视频样本X的拟合程度,从而确定空间流三维卷积神经网络、时间流三维卷积神经网络以及空间流特征与时间流特征融合的交叉熵损失影响因子。
8.根据权利要求7所述的一种电网基建现场人体异常行为识别方法,其特征在于,
在步骤1.1中,具体包括:
其中,
XRGB表示输入空间流三维卷积神经网络的连续16帧RGB视频帧,
D1表示输入视频帧通道数,
T表示输入视频帧数,
W1和H1分别表示视频帧的宽和高;
其中,
XFLOW表示输入时间流三维卷积神经网络的x和y轴光流提取方向的光流图,
D2表示输入视频帧通道数,
B表示光流提取方向数,
W2和H2分别表示光流图的宽和高;
其中,
D1′表示空间流三维卷积网络输出的视频帧通道数,
T′表示空间流三维卷积网络输出的视频帧数,
W1′表示空间流三维卷积网络输出的视频帧的宽,
H1′表示空间流三维卷积网络输出的视频帧的高,
D2′表示时间流三维卷积网络输出的视频帧通道数,
B′表示时间流三维卷积网络输出的光流提取方向数,
W2′表示时间流三维卷积网络输出的光流图的宽,
H2′表示时间流三维卷积网络输出的光流图的高,
D1′=D2′,T′=B′,W1′=W2′,H1′=H2′。
9.根据权利要求7或8所述的一种电网基建现场人体异常行为识别方法,其特征在于,
在步骤1.2中,具体包括:首先,进行空间融合,将X′RGB和X′FLOW进行通道维度上的拼接:
Zcat=concat(X′RGB,X′FLOW)
其中,
其中,
2D′×U×W′×H′表示经过双流特征拼接融合后的融合特征维度,
2D′=D1′+D2′,U=T′=B′,W′=W1′=W2′,H′=H1′=H2′;
其中,
Z表示降维处理后的融合特征,
D″×U′×W″×H″表示降维处理后的融合特征的维度,
D″=D′,U′=U,W″=W′,H″=H′。
13.利用权利要求1至12任意一项所述方法的电网基建现场人体异常行为识别系统,所述异常行为识别系统包括:模型搭建模块,数据采集模块,分类识别模块和结果输出模块;其特征在于,
模型搭建模块用于搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;
数据采集模块用于从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频流及光流图;
分类识别模块用于将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
结果输出模块用于对分类识别模块的分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210885390.XA CN115311740A (zh) | 2022-07-26 | 2022-07-26 | 一种电网基建现场人体异常行为识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210885390.XA CN115311740A (zh) | 2022-07-26 | 2022-07-26 | 一种电网基建现场人体异常行为识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115311740A true CN115311740A (zh) | 2022-11-08 |
Family
ID=83859240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210885390.XA Pending CN115311740A (zh) | 2022-07-26 | 2022-07-26 | 一种电网基建现场人体异常行为识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115311740A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311005A (zh) * | 2023-05-25 | 2023-06-23 | 成都睿瞳科技有限责任公司 | 一种用于运动图像处理装置、方法及存储介质 |
CN116311374A (zh) * | 2023-03-27 | 2023-06-23 | 淮阴工学院 | 一种化工厂工人异常行为识别与预警方法及系统 |
CN117710832A (zh) * | 2024-01-04 | 2024-03-15 | 广州智寻科技有限公司 | 一种电网卫星、无人机、视频监控图像智能识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188637A (zh) * | 2019-05-17 | 2019-08-30 | 西安电子科技大学 | 一种基于深度学习的行为识别技术方法 |
CN111178319A (zh) * | 2020-01-06 | 2020-05-19 | 山西大学 | 基于压缩奖惩机制的视频行为识别方法 |
CN111414876A (zh) * | 2020-03-26 | 2020-07-14 | 西安交通大学 | 一种基于时序引导空间注意力的暴力行为识别方法 |
CN112183240A (zh) * | 2020-09-11 | 2021-01-05 | 山东大学 | 一种基于3d时间流和并行空间流的双流卷积行为识别方法 |
US20210279519A1 (en) * | 2020-02-28 | 2021-09-09 | North Carolina State University | Volterra Neural Network and Method |
CN113435262A (zh) * | 2021-06-08 | 2021-09-24 | 上海电机学院 | 基于双流膨胀3d卷积网络的异常行为识别方法和预警系统 |
-
2022
- 2022-07-26 CN CN202210885390.XA patent/CN115311740A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188637A (zh) * | 2019-05-17 | 2019-08-30 | 西安电子科技大学 | 一种基于深度学习的行为识别技术方法 |
CN111178319A (zh) * | 2020-01-06 | 2020-05-19 | 山西大学 | 基于压缩奖惩机制的视频行为识别方法 |
US20210279519A1 (en) * | 2020-02-28 | 2021-09-09 | North Carolina State University | Volterra Neural Network and Method |
CN111414876A (zh) * | 2020-03-26 | 2020-07-14 | 西安交通大学 | 一种基于时序引导空间注意力的暴力行为识别方法 |
CN112183240A (zh) * | 2020-09-11 | 2021-01-05 | 山东大学 | 一种基于3d时间流和并行空间流的双流卷积行为识别方法 |
CN113435262A (zh) * | 2021-06-08 | 2021-09-24 | 上海电机学院 | 基于双流膨胀3d卷积网络的异常行为识别方法和预警系统 |
Non-Patent Citations (5)
Title |
---|
ABID MEHMOOD: "Abnormal Behavior Detection in Uncrowded Videos with Two-Stream 3D Convolutional Neural Networks", 《APPLIED SCIENCES》, pages 1 - 25 * |
何冰倩 等: "基于改进的深度神经网络的人体动作识别模型", 《计算机应用研究》, vol. 36, no. 10, pages 3107 - 3111 * |
卢静: "基于深度学习的行为识别及其在基建现场的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 01, pages 4 * |
吴冬梅;卢静;蒋瑜;: "基于双通道C3D的基建现场人体异常行为识别", 《信息技术与信息化》, no. 1, pages 28 - 31 * |
谢佳龙 等: "一种基于双流融合3D卷积神经网络的动态头势识别方法", 《电子学报》, no. 7, pages 1363 - 1368 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311374A (zh) * | 2023-03-27 | 2023-06-23 | 淮阴工学院 | 一种化工厂工人异常行为识别与预警方法及系统 |
CN116311374B (zh) * | 2023-03-27 | 2023-10-20 | 淮阴工学院 | 一种化工厂工人异常行为识别与预警方法及系统 |
CN116311005A (zh) * | 2023-05-25 | 2023-06-23 | 成都睿瞳科技有限责任公司 | 一种用于运动图像处理装置、方法及存储介质 |
CN117710832A (zh) * | 2024-01-04 | 2024-03-15 | 广州智寻科技有限公司 | 一种电网卫星、无人机、视频监控图像智能识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674772B (zh) | 电力作业现场智能安全管控辅助系统及方法 | |
CN115311740A (zh) | 一种电网基建现场人体异常行为识别方法及系统 | |
CN112183313B (zh) | 一种基于SlowFast的电力作业现场动作识别方法 | |
CN102915432B (zh) | 一种车载微机图像视频数据提取方法及装置 | |
CN115880558B (zh) | 农事行为检测方法、装置、电子设备及存储介质 | |
CN112541393A (zh) | 一种基于深度学习的变电站人员检测方法及装置 | |
CN116546023B (zh) | 一种油气作业区暴力行为识别方法及系统 | |
CN113361520B (zh) | 基于样本偏移网络的输电线路设备缺陷检测方法 | |
CN114742777A (zh) | 一种基于改进yolo模型的销钉状态的识别方法 | |
CN117078232B (zh) | 一种基于大数据的加工设备故障预防系统及方法 | |
CN113469938A (zh) | 基于嵌入式前端处理服务器的管廊视频分析方法及系统 | |
CN117671450A (zh) | 一种基于transformer的属地网络图像内容安全监管的DETR架构方法 | |
CN117294022A (zh) | 基于多源传感器协同的变电站巡检系统及方法 | |
CN113221667A (zh) | 一种基于深度学习的人脸口罩属性分类方法及系统 | |
CN117392568A (zh) | 一种复杂场景下无人机巡检变电设备的方法 | |
CN115719497A (zh) | 一种学生专注度识别方法及系统 | |
CN115601674A (zh) | 一种输电工程烟雾隐患识别方法、装置及存储介质 | |
CN115641550A (zh) | 一种用于化工场所中工作人员防护用具佩戴情况的检测方法及检测系统 | |
CN115995051A (zh) | 基于最小残差平方和法的变电站设备故障期识别方法 | |
Song et al. | Residual Squeeze-and-Excitation Network for Battery Cell Surface Inspection | |
CN115965883A (zh) | 一种基于Transformer的烟雾检测算法 | |
CN112240964B (zh) | 一种用于配电网故障类型识别的方法 | |
Wang et al. | Detecting temperature anomaly at the key parts of power transmission and transformation equipment using infrared imaging based on SegFormer | |
Sun et al. | Unsupervised learning based target localization method for pantograph video | |
Yang et al. | ICANet: A Method of Short Video Emotion Recognition Driven by Multimodal Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |