CN115311740A - 一种电网基建现场人体异常行为识别方法及系统 - Google Patents

一种电网基建现场人体异常行为识别方法及系统 Download PDF

Info

Publication number
CN115311740A
CN115311740A CN202210885390.XA CN202210885390A CN115311740A CN 115311740 A CN115311740 A CN 115311740A CN 202210885390 A CN202210885390 A CN 202210885390A CN 115311740 A CN115311740 A CN 115311740A
Authority
CN
China
Prior art keywords
flow
power grid
network
grid infrastructure
human body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210885390.XA
Other languages
English (en)
Inventor
张军民
王东林
张文彬
崔隽峰
席晓强
李海冰
刘晨
张国梁
吴鹏
杜泽旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Smart Grid Research Institute Co ltd
State Grid Corp of China SGCC
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Smart Grid Research Institute Co ltd
State Grid Corp of China SGCC
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Smart Grid Research Institute Co ltd, State Grid Corp of China SGCC, Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Smart Grid Research Institute Co ltd
Priority to CN202210885390.XA priority Critical patent/CN115311740A/zh
Publication of CN115311740A publication Critical patent/CN115311740A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/16Image acquisition using multiple overlapping images; Image stitching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Psychiatry (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Social Psychology (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)

Abstract

一种电网基建现场人体异常行为识别方法及系统,识别方法包括,搭建双通道三维卷积神经网络和双流特征融合网络,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频最新16帧RGB图像及计算这16帧RGB图像的光流图;将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;根据分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。

Description

一种电网基建现场人体异常行为识别方法及系统
技术领域
本发明属于电力系统安全监测技术领域,具体涉及一种电网基建现场人体异常行为识别方法及系统。
背景技术
近年来,将人工智能应用于基建现场的异常行为识别显得尤为迫切。异常行为可分为单人异常行为、交互异常行为及群体异常行为,其定义取决于现实生活的应用场景并且会受到一定程度的主观影响。目前,在电网基建现场人体异常行为检测领域,最通用的做法是通过日常的人工巡检或通过监控设备人工监督。
电网基建作业具有类型多样,基建规模大、施工人员多的特点,完全依靠人工巡检的办法已无法实时掌握所有施工人员的状态,而通过视频监控设备辅助的方式对于电网基建现场作业人员的监督作用也较为有限,且很多异常状态的发现均已处于事后阶段,没有达到预防电网基建现场作业人员异常行为发生的初衷。由此可见,研究电网基建现场人体异常行为检测方法有重要的理论意义和实用价值。
目前针对电网基建现场人体异常行为检测技术的研究比较少,但是国内外专家学者针对相关难点问题基于人工智能理论提出了一些卓有成效的实现方案。基于深度学习的行为识别在国内外也已经有了多方面的研究,一种基于双流卷积神经网络被提出,这种网络可以独立的使用RGB图片帧和连续帧之间的光流图像来获取静态特征和动态特征,最后将两个分支在全连接层进行分数的融合,将融合后分数最高的类别作为当前行为的类别。一种双分辨率卷积神经网络被提出,这种网络的一个通道输入原始分辨率的图片帧,另一个通道输入低分辨率的图片帧,独立训练两个模型后在全连接层进行融合,将融合后的特征用于后续的行为识别中。研究人员通过对原始的二维卷积神经网络进行改进,提出了三维卷积神经网络,更好的描述了视频的时序信息。
上述基于卷积神经网络的深度学习方法虽然检测准确率较高,但算法精度很大程度上受限于异常数据的数据规模;且整体算法的检测无法实时进行,这就意味着无法实时检测电网基建现场作业人员的异常行为,无法做到事前预防。
鉴于此,本文充分运用电网基建现场人员作业数据,基于双通道特征融合的方法,使用三维卷积神经网络解决传统模型实时性差,无法充分利用视频帧间时序信息的问题,进而科学有效的实现电网基建现场人体异常检测任务。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种电网基建现场人体异常行为识别方法及系统,解决传统模型实时性差,无法充分利用视频帧间时序信息的问题,进而科学有效的实现电网基建现场人体异常检测任务。
本发明采用如下的技术方案。一种电网基建现场人体异常行为识别方法,其特征在于,包括以下步骤,
步骤1,搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对双通道三维卷积神经网络和双流特征融合网络进行训练,得到电网基建现场人体异常行为识别模型;
步骤2,从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频流及光流图;
步骤3,将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
步骤4,根据步骤3的分类结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
优选地,
步骤1中,双通道三维卷积神经网络包括:空间流三维卷积神经网络和时间流三维卷积神经网络,空间流三维卷积神经网络用来提取和行为相关的空间特征,时间流三维卷积神经网络用来提取时间特征。
步骤1中,空间流三维卷积神经网络和时间流三维卷积神经网络网络参数共享,网络参数包括:网络权重和偏置值。
步骤1中,双通道三维卷积神经网络包括:8个三维卷积层和5个三维池化层,搭建双流特征融合网络,包括:1个拼接层,1个三维卷积层和1个三维池化层。
步骤2中,视频流为RGB视频流,实时获取16帧视频流,通过计算16帧视频流得出光流图。
优选地,步骤1包括:建立空间流三维卷积神经网络模型,其输入为XRGB即 RGB视频帧,输出特征记作输出的特征为X′RGB
建立时间流三维卷积网络模型,其输入为XFLOW即RGB图像的光流图,输出时间流特征X′FLOW;具体包括:
空间流三维卷积神经网络输入为
Figure BDA0003765449960000031
其中,
XRGB表示输入空间流三维卷积神经网络的连续16帧RGB视频帧,
Figure BDA0003765449960000032
表示包含若干连续16帧RGB视频帧的集合,
D1表示输入视频帧通道数,
T表示输入视频帧数,
W1和H1分别表示视频帧的宽和高;
时间流三维卷积网络输入为
Figure BDA0003765449960000033
其中,
XFLOW表示输入时间流三维卷积神经网络的x和y轴光流提取方向的光流图,
Figure BDA0003765449960000034
表示包含若干x和y轴光流提取方向的光流图的集合,
D2表示输入视频帧通道数,
B表示光流提取方向数,
W2和H2分别表示光流图的宽和高;
空间流三维卷积网络输出的特征为
Figure BDA0003765449960000035
时间流三维卷积网络输出的特征为
Figure BDA0003765449960000036
其中,
D1′表示空间流三维卷积网络输出的视频帧通道数,
T′表示空间流三维卷积网络输出的视频帧数,
W1′表示空间流三维卷积网络输出的视频帧的宽,
H1′表示空间流三维卷积网络输出的视频帧的高,
D2′表示时间流三维卷积网络输出的视频帧通道数,
B′表示时间流三维卷积网络输出的光流提取方向数,
W2′表示时间流三维卷积网络输出的光流图的宽,
H2′表示时间流三维卷积网络输出的光流图的高,
D1′=D2′,T′=B′,W1=W2′,H1=H2′。
步骤1.2,对时间流三维卷积网络输出特征和空间流三维卷积网络输出特征融合;首先将X′RGB和X′FLOW进行通道维度上的拼接,然后使用一层三维卷积层和一层三维池化层对拼接后的结果进行时间特征融合得到时间特征融合后的融合特征集合Z;具体包括:
对步骤1.1中输出的特征进行空间融合和时间融合,
首先,进行空间融合,将X′RGB和X′FLOW进行通道维度上的拼接:
Zcat=concat(X′RGB,X′FLOW)
其中,
Zcat表示空间流神经网络网络输出的空间特征和时间流网络输出的时间特征拼接后的空间融合特征集合为,
Figure BDA0003765449960000041
其中,
Figure BDA0003765449960000042
表示经过双流特征拼接融合后的融合特征的集合,
2D′×U×W′×H′表示经过双流特征拼接融合后的融合特征维度,
2D′=D1′+D2′,U=T′=B′,W′=W1′=W2′,H′=H1′=H2′;
接着,再使用一层三维卷积层和一层三维池化层对Zcat进行时间特征融合,得到时间特征融合后融合特征集合为
Figure BDA0003765449960000043
其中,
Z表示降维处理后的融合特征,
D″×U′×W″×H″表示降维处理后的融合特征的维度,D″=D′,U′=U, W″=W′,H″=H′。
步骤1.3,将融合特征集合Z输入3层全连接层,将特征降维,最终在最后一层全连接层输出所预测的第i个行为发生的概率;具体包括:
经过步骤1.2融合后的结果输入3层全连接层,将特征降维,最终在最后一层全连接层输出
Figure BDA0003765449960000051
其中,
N表示电网基建现场人体异常行为类别的数量,
Figure BDA0003765449960000052
表示融合网络输出所预测的第i个行为发生的概率。
步骤1.4,经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,分别得到空间流网络输出所预测的第i个行为发生的概率和时间流网络输出所预测的第i个行为发生的概率;具体包括:
经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,将特征降维,最终在最后一层全连接层输出
Figure BDA0003765449960000053
Figure BDA0003765449960000054
Figure BDA0003765449960000055
其中,
Figure BDA0003765449960000056
表示空间流网络输出所预测的第i个行为发生的概率。
Figure BDA0003765449960000057
表示时间流网络输出所预测的第i个行为发生的概率。
步骤1.5,利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y,将视频样本X输入步骤1.1至步骤1.4中搭建的网络训练,得到对应输出的空间流网络输出所预测行为发生的概率、时间流网络输出所预测行为发生的概率以及基于融合特征所输出的预测行为发生的概率,采用交叉熵损失计算法确定对视频样本X的拟合程度,从而确定空间流三维卷积神经网络、时间流三维卷积神经网络以及空间流特征与时间流特征融合的交叉熵损失影响因子,
交叉熵损失计算公式如下:
Figure BDA0003765449960000058
Figure BDA0003765449960000059
其中,
λ1表示空间流三维卷积神经网络交叉熵损失影响因子,
λ2表示时间流三维卷积神经网络交叉熵损失影响因子,
λ3表示空间流特征与时间流特征融合交叉熵损失影响因子,
i∈[1,N],表示电网基建现场人体异常行为类别之一,
通过训练过程确定λ1,λ2,λ3具体数值。
一种电网基建现场人体异常行为识别系统,包括:模型搭建模块,数据采集模块,分类识别模块和结果输出模块,其中,
模型搭建模块用于搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;
数据采集模块用于从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频视频流及光流图;
分类识别模块用于将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
结果输出模块用于对分类识别模块的分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
本发明的有益效果在于,与现有技术相比,
(1)本发明采用基于双通道三维卷积神经网络的电网基建现场人体异常行为识别方法,在保证准确度的前期下,实现了电网基建现场人体异常行为的实时检测任务;
(2)本发明不同于现有技术仅使用二维卷积网络构建特征提取器的方法,提出了一种基于三维卷积神经网络的特征提取器,且通过双通道的方式,分别提取视频的空间特征和时间特征,实现端到端融合,提取到的时间维度上视频序列间的时间特征。在兼顾实时性和准确性的基础上解决了模型在电网基建现场人体异常数据上不能很好的学习视频帧间长时信息的问题;
(3)本发明不同于现有技术采取决策级融合的方法,本发明在网络模型训练过程中对空间网络和时间网络进行特征融合而不是决策分数的融合。采取在 5b卷积层进行空间流特征与时间流特征的融合,通过特征融合的方法可以获得更高维度的信息,有利于正确率的提升。
附图说明
图1是本发明提出的一种电网基建现场人体异常行为识别方法流程图;
图2是本发明搭建的双通道三维卷积神经网络结构示意图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
实施例1。
如图1所示,一种电网基建现场人体异常行为识别方法。包括以下步骤,
步骤1,搭建双通道三维卷积神经网络和融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,双通道三维卷积神经网络包括:空间流三维卷积神经网络和时间流三维卷积神经网络,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据对双通道三维卷积神经网络和双流特征融合网络网络进行训练,得到电网基建现场人体异常行为识别模型;
本实施例优选地,空间流三维卷积神经网络和时间流三维卷积神经网络网络参数共享,网络参数包括:网络权重和偏置值。
步骤1.1,搭建双通道三维卷积神经网络,如图2所示为空间流三维卷积神经网络和时间流三维卷积神经网络,两个网络均由8个三维卷积层和5个三维最大池化层组成,分别用以提取工作人员作业视频数据的空间特征和时间特征。
建立空间流三维卷积神经网络模型,其输入为XRGB即RGB视频帧,输出特征记作输出的特征为X′RGB
建立时间流三维卷积网络模型,其输入为XFLOW即RGB图像的光流图,输出时间流特征X′FLOW
空间流三维卷积神经网络输入为
Figure BDA0003765449960000071
其中,
XRGB表示输入空间流三维卷积神经网络的连续16帧RGB视频帧,
Figure BDA0003765449960000072
表示包含若干连续16帧RGB视频帧的集合,
D1表示输入视频帧通道数,
T表示输入视频帧数,
W1和H1分别表示视频帧的宽和高。
时间流三维卷积网络输入为
Figure BDA0003765449960000081
其中,
XFLOW表示输入时间流三维卷积神经网络的x和y轴光流提取方向的光流图,
Figure BDA0003765449960000082
表示包含若干x和y轴光流提取方向的光流图的集合,
D2表示输入视频帧通道数,
B表示光流提取方向数,
W2和H2分别表示光流图的宽和高。
空间流三维卷积网络输出特征为
Figure BDA0003765449960000083
时间流三维卷积网络输出特征为
Figure BDA0003765449960000084
其中:
D1′表示空间流三维卷积网络输出的视频帧通道数,
T′表示空间流三维卷积网络输出的视频帧数,
W1′表示空间流三维卷积网络输出的视频帧的宽,
H1′表示空间流三维卷积网络输出的视频帧的高,
D2′表示时间流三维卷积网络输出的视频帧通道数,
B′表示时间流三维卷积网络输出的光流提取方向数,
W2′表示时间流三维卷积网络输出的光流图的宽,
H2′表示时间流三维卷积网络输出的光流图的高,
D1′=D2′,T′=B′,W1=W2′,H1=H2′;
此步骤的目的是为了双通道神经网络提取出相同维度的空间流特征和时间流特征。
步骤1.2,对时间流三维卷积网络输出特征和空间流三维卷积网络输出特征融合;首先将X′RGB和X′FLOW进行通道维度上的拼接,然后使用一层三维卷积层和一层三维池化层对拼接后的结果进行时间特征融合得到时间特征融合后的融合特征集合Z;
构建双流特征融合网络,如图2所示,融合网络用以融合空间流三维卷积神经网络输出的空间特征X′RGB和时间流三维卷积神经网络输出的时间特征X′FLOW
本实施例优选地,双流特征融合网络,包括:1个拼接层、1个三维卷积层和1个三维池化层,
首先,进行空间融合,将X′RGB和X′FLOW进行通道维度上的拼接:
Zcat=concat(X′RGB,X′FLOW)
Zcat表示空间流神经网络网络输出的空间特征和时间流网络输出的时间特征拼接后的空间融合特征集合为,
Figure BDA0003765449960000091
其中,
Figure BDA0003765449960000092
表示经过双流特征拼接融合后的融合特征的集合,
2D′×U×W′×H′表示经过双流特征拼接融合后的融合特征维度,
2D′=D1′+D2′,U=T′=B′,W′=W1′=W2′,H′=H1′=H2′;
接着,再使用一层三维卷积层和一层三维池化层对Zcat进行时间特征融合,得到时间特征融合后融合特征集合为,
Figure BDA0003765449960000093
其中,
Z表示降维处理后的融合特征,
D″×U′×W″×H″表示降维处理后的融合特征的维度,
D″=D′,U′=U,W″=W′,H″=H′。
得到通过空间和时间特征的融合,可以提取更高维度的特征,有利于算法正确率的提升。
步骤1.3,将融合特征集合Z输入3层全连接层,将特征降维,最终在最后一层全连接层输出所预测的第i个行为发生的概率;经过步骤1.2融合后的结果输入3层全连接层,将特征降维,最终在最后一层全连接层输出
Figure BDA0003765449960000094
Figure BDA0003765449960000095
其中,
N表示电网基建现场人体异常行为类别的数量,
Figure BDA0003765449960000096
表示融合网络输出所预测的第i个行为发生的概率。
步骤1.4,经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,分别得到空间流网络输出所预测的第i个行为发生的概率和时间流网络输出所预测的第i个行为发生的概率;具体包括:经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,将特征降维,最终在最后一层全连接层输出
Figure BDA0003765449960000101
Figure BDA0003765449960000102
Figure BDA0003765449960000103
其中,
N为电网基建现场人体异常行为类别的数量,
Figure BDA0003765449960000104
表示空间流网络输出所预测的第i个行为发生的概率,
Figure BDA0003765449960000105
表示时间流网络输出所预测的第i个行为发生的概率。
步骤1.5,利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y,将视频样本X输入步骤1.1至步骤1.4中搭建的网络训练,得到对应输出的空间流网络输出所预测行为发生的概率、时间流网络输出所预测行为发生的概率以及基于融合特征所输出的预测行为发生的概率,采用交叉熵损失计算法确定对视频样本X的拟合程度,从而确定空间流三维卷积神经网络、时间流三维卷积神经网络以及空间流特征与时间流特征融合的交叉熵损失影响因子。
利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y={y1,y2,…,yN},将视频样本X输入上述步骤中的搭建的网络训练,得到对应输出
Figure BDA0003765449960000106
Figure BDA0003765449960000107
采用交叉熵损失计算算法输出
Figure BDA0003765449960000108
Figure BDA0003765449960000109
对视频样本X的拟合程度,使之尽可能接近标注真值Y:
Figure BDA00037654499600001010
其中,
λ1表示空间流三维卷积神经网络交叉熵损失影响因子,
λ2表示时间流三维卷积神经网络交叉熵损失影响因子,
λ3表示空间流特征与时间流特征融合交叉熵损失影响因子,
i∈[1,N],表示电网基建现场人体异常行为类别之一。
通过训练过程确定λ1、λ2、λ3具体数值。
通过计算损失函数,利用反向传播算法更新网络参数,使得最终损失函数收敛至一个极小的数值,即可完成算法的训练,生成电网基建现场人体异常行为识别模型。
步骤2,从电网基建现场作业监控装置实时采集电网基建现场作业视频数据,获取实时视频流及光流图,形成电网基建现场人体异常行为识别模型的输入X;
本实施例优选地,视频流为RGB视频流,实时获取16帧视频流,通过计算 16帧视频流得出光流图。
步骤3,将数据输入至上述算法训练阶段生成的电网基建现场人体异常行为识别模型,得到行为分类结果输出;
步骤4,根据步骤3中电网基建现场人体异常行为识别模型所得到的行为分类结果,若模型输出为异常行为类别,则进行报警,然后继续执行电网基建现场人体异常行为检测任务;若模型输出正常行为类别,则返回继续执行电网基建现场人体异常行为检测任务。
实施例2。
一种电网基建现场人体异常行为识别系统,包括:模型搭建模块,数据采集模块,分类识别模块和结果输出模块,其中,
模型搭建模块用于搭建双通道三维卷积神经网络和双流特征融合网络,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;
数据采集模块用于从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频最新16帧RGB图像及计算这16帧RGB图像的光流图;
分类识别模块用于将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
结果输出模块用于对分类识别模块的分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
本发明的有益效果在于,与现有技术相比,
(1)本发明采用基于双通道三维卷积神经网络的电网基建现场人体异常行为识别方法,在保证准确度的前期下,实现了电网基建现场人体异常行为的实时检测任务;
(2)本发明不同于现有技术仅使用二维卷积网络构建特征提取器的方法,提出了一种基于三维卷积神经网络的特征提取器,且通过双通道的方式,分别提取视频的空间特征和时间特征,实现端到端融合,提取到的时间维度上视频序列间的时间特征。在兼顾实时性和准确性的基础上解决了模型在电网基建现场人体异常数据上不能很好的学习视频帧间长时信息的问题;
(3)本发明不同于现有技术采取决策级融合的方法,本发明在网络模型训练过程中对空间网络和时间网络进行特征融合而不是决策分数的融合。采取在 5b卷积层进行空间流特征与时间流特征的融合,通过特征融合的方法可以获得更高维度的信息,有利于正确率的提升。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (13)

1.一种电网基建现场人体异常行为识别方法,其特征在于,包括以下步骤,
步骤1,搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对双通道三维卷积神经网络和双流特征融合网络进行训练,得到电网基建现场人体异常行为识别模型;
步骤2,从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频流及光流图;
步骤3,将视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
步骤4,根据步骤3中电网基建现场人体异常行为识别模型所得到的行为分类结果,若模型输出为异常行为类别,则进行报警,然后继续执行电网基建现场人体异常行为检测任务;若模型输出正常行为类别,则返回继续执行电网基建现场人体异常行为检测任务。
2.根据权利要求1所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤2中,视频流为RGB视频流,实时获取16帧视频流,通过计算16帧视频流得出光流图。
3.根据权利要求1所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1中,双通道三维卷积神经网络包括:空间流三维卷积神经网络和时间流三维卷积神经网络;
空间流三维卷积神经网络用来提取和行为相关的空间特征,时间流三维卷积神经网络用来提取时间特征。
4.根据权利要求3所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1中,空间流三维卷积神经网络和时间流三维卷积神经网络网络参数共享,网络参数包括:网络权重和偏置值。
5.根据权利要求4所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1中,双通道三维卷积神经网络包括:8个三维卷积层和5个三维池化层。
6.根据权利要求5所述的一种电网基建现场人体异常行为识别方法,其特征在于,
双流特征融合网络包括:1个拼接层,1个三维卷积层和1个三维池化层。
7.根据权利要求6所述的一种电网基建现场人体异常行为识别方法,其特征在于,
步骤1包括:
步骤1.1,建立空间流三维卷积神经网络模型,其输入为XRGB即RGB视频帧,输出特征记作输出的特征为X′RGB
建立时间流三维卷积网络模型,其输入为XFLOW即RGB图像的光流图,输出时间流特征X′FLOW
步骤1.2,对时间流三维卷积网络输出特征和空间流三维卷积网络输出特征融合;首先将X′RGB和X′FLOW进行通道维度上的拼接,然后使用一层三维卷积层和一层三维池化层对拼接后的结果进行时间特征融合得到时间特征融合后的融合特征集合Z;
步骤1.3,将融合特征集合Z输入3层全连接层,将特征降维,最终在最后一层全连接层输出所预测的第i个行为发生的概率;
步骤1.4,经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,分别得到空间流网络输出所预测的第i个行为发生的概率和时间流网络输出所预测的第i个行为发生的概率;
步骤1.5,利用电网基建现场作业视频监控装置采集的历史作业人员监控视频数据集,进行人工标注,得到视频样本X与标注真值Y,将视频样本X输入步骤1.1至步骤1.4中搭建的网络训练,得到对应输出的空间流网络输出所预测行为发生的概率、时间流网络输出所预测行为发生的概率以及基于融合特征所输出的预测行为发生的概率,采用交叉熵损失计算法确定对视频样本X的拟合程度,从而确定空间流三维卷积神经网络、时间流三维卷积神经网络以及空间流特征与时间流特征融合的交叉熵损失影响因子。
8.根据权利要求7所述的一种电网基建现场人体异常行为识别方法,其特征在于,
在步骤1.1中,具体包括:
空间流三维卷积神经网络输入为
Figure FDA0003765449950000031
其中,
XRGB表示输入空间流三维卷积神经网络的连续16帧RGB视频帧,
Figure FDA0003765449950000032
表示包含若干连续16帧RGB视频帧的集合,
D1表示输入视频帧通道数,
T表示输入视频帧数,
W1和H1分别表示视频帧的宽和高;
时间流三维卷积网络输入为
Figure FDA0003765449950000033
其中,
XFLOW表示输入时间流三维卷积神经网络的x和y轴光流提取方向的光流图,
Figure FDA0003765449950000034
表示包含若干x和y轴光流提取方向的光流图的集合,
D2表示输入视频帧通道数,
B表示光流提取方向数,
W2和H2分别表示光流图的宽和高;
空间流三维卷积网络输出的特征为
Figure FDA0003765449950000035
时间流三维卷积网络输出的特征为
Figure FDA0003765449950000036
其中,
D1′表示空间流三维卷积网络输出的视频帧通道数,
T′表示空间流三维卷积网络输出的视频帧数,
W1′表示空间流三维卷积网络输出的视频帧的宽,
H1′表示空间流三维卷积网络输出的视频帧的高,
D2′表示时间流三维卷积网络输出的视频帧通道数,
B′表示时间流三维卷积网络输出的光流提取方向数,
W2′表示时间流三维卷积网络输出的光流图的宽,
H2′表示时间流三维卷积网络输出的光流图的高,
D1′=D2′,T′=B′,W1′=W2′,H1′=H2′。
9.根据权利要求7或8所述的一种电网基建现场人体异常行为识别方法,其特征在于,
在步骤1.2中,具体包括:首先,进行空间融合,将X′RGB和X′FLOW进行通道维度上的拼接:
Zcat=concat(X′RGB,X′FLOW)
其中,
Zcat表示空间流三维卷积神经网络输出的空间特征和时间流三维卷积神经网络输出的时间特征拼接后的空间融合特征集合,
Figure FDA0003765449950000041
其中,
Figure FDA0003765449950000042
表示经过双流特征拼接融合后的融合特征的集合,
2D′×U×W′×H′表示经过双流特征拼接融合后的融合特征维度,
2D′=D1′+D2′,U=T′=B′,W′=W1′=W2′,H′=H1′=H2′;
接着,再使用一层三维卷积层和一层三维池化层对Zcat进行时间特征融合,得到时间特征融合后融合特征集合为,
Figure FDA0003765449950000043
其中,
Z表示降维处理后的融合特征,
D″×U′×W″×H″表示降维处理后的融合特征的维度,
D″=D′,U′=U,W″=W′,H″=H′。
10.根据权利要求9所述的一种电网基建现场人体异常行为识别方法,其特征在于,
在步骤1.3中,具体包括:
经过步骤1.2融合后的结果输入3层全连接层,将特征降维,最终在最后一层全连接层输出
Figure FDA0003765449950000044
其中,
N表示电网基建现场人体异常行为类别的数量,
Figure FDA0003765449950000045
表示融合网络输出所预测的第i个行为发生的概率。
11.根据权利要求10所述的一种电网基建现场人体异常行为识别方法,其特征在于,
在步骤1.4中,具体包括:
经过步骤1.1双通道三维卷积神经网络所输出的空间流特征X′RGB和时间流特征X′FLOW分别输入各自的3层全连接层,将特征降维,最终在最后一层全连接层输出
Figure FDA0003765449950000051
Figure FDA0003765449950000052
Figure FDA0003765449950000053
其中,
Figure FDA0003765449950000054
表示空间流网络输出所预测的第i个行为发生的概率;
Figure FDA0003765449950000055
表示时间流网络输出所预测的第i个行为发生的概率。
12.根据权利要求11所述的一种电网基建现场人体异常行为识别方法,其特征在于,
在步骤1.5中,交叉熵损失计算公式如下:
Figure FDA0003765449950000056
其中,
λ1表示空间流三维卷积神经网络交叉熵损失影响因子,
λ2表示时间流三维卷积神经网络交叉熵损失影响因子,
λ3表示空间流特征与时间流特征融合交叉熵损失影响因子,
i∈[1,N],表示电网基建现场人体异常行为类别之一,
通过训练过程确定λ1,λ2,λ3具体数值。
13.利用权利要求1至12任意一项所述方法的电网基建现场人体异常行为识别系统,所述异常行为识别系统包括:模型搭建模块,数据采集模块,分类识别模块和结果输出模块;其特征在于,
模型搭建模块用于搭建双通道三维卷积神经网络和双流特征融合网络,在双通道三维卷积神经网络和双流特征融合网络后分别接入3层全连接层,利用电网基建现场作业监控装置采集的历史工作人员作业视频数据集对网络进行训练,得到电网基建现场人体异常行为识别模型;
数据采集模块用于从电网基建现场作业监控装置实时采集电网基建现场工作人员作业视频数据,获取实时视频流及光流图;
分类识别模块用于将最新视频流和光流图输入至电网基建现场人体异常行为识别模型,得到行为分类结果输出;
结果输出模块用于对分类识别模块的分类损失结果判断,若无异常发生,则返回继续执行电网基建现场人体异常行为检测任务;若有异常发生,则进行报警处理,然后继续执行电网基建现场人体异常行为检测任务。
CN202210885390.XA 2022-07-26 2022-07-26 一种电网基建现场人体异常行为识别方法及系统 Pending CN115311740A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210885390.XA CN115311740A (zh) 2022-07-26 2022-07-26 一种电网基建现场人体异常行为识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210885390.XA CN115311740A (zh) 2022-07-26 2022-07-26 一种电网基建现场人体异常行为识别方法及系统

Publications (1)

Publication Number Publication Date
CN115311740A true CN115311740A (zh) 2022-11-08

Family

ID=83859240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210885390.XA Pending CN115311740A (zh) 2022-07-26 2022-07-26 一种电网基建现场人体异常行为识别方法及系统

Country Status (1)

Country Link
CN (1) CN115311740A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116311005A (zh) * 2023-05-25 2023-06-23 成都睿瞳科技有限责任公司 一种用于运动图像处理装置、方法及存储介质
CN116311374A (zh) * 2023-03-27 2023-06-23 淮阴工学院 一种化工厂工人异常行为识别与预警方法及系统
CN117710832A (zh) * 2024-01-04 2024-03-15 广州智寻科技有限公司 一种电网卫星、无人机、视频监控图像智能识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188637A (zh) * 2019-05-17 2019-08-30 西安电子科技大学 一种基于深度学习的行为识别技术方法
CN111178319A (zh) * 2020-01-06 2020-05-19 山西大学 基于压缩奖惩机制的视频行为识别方法
CN111414876A (zh) * 2020-03-26 2020-07-14 西安交通大学 一种基于时序引导空间注意力的暴力行为识别方法
CN112183240A (zh) * 2020-09-11 2021-01-05 山东大学 一种基于3d时间流和并行空间流的双流卷积行为识别方法
US20210279519A1 (en) * 2020-02-28 2021-09-09 North Carolina State University Volterra Neural Network and Method
CN113435262A (zh) * 2021-06-08 2021-09-24 上海电机学院 基于双流膨胀3d卷积网络的异常行为识别方法和预警系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188637A (zh) * 2019-05-17 2019-08-30 西安电子科技大学 一种基于深度学习的行为识别技术方法
CN111178319A (zh) * 2020-01-06 2020-05-19 山西大学 基于压缩奖惩机制的视频行为识别方法
US20210279519A1 (en) * 2020-02-28 2021-09-09 North Carolina State University Volterra Neural Network and Method
CN111414876A (zh) * 2020-03-26 2020-07-14 西安交通大学 一种基于时序引导空间注意力的暴力行为识别方法
CN112183240A (zh) * 2020-09-11 2021-01-05 山东大学 一种基于3d时间流和并行空间流的双流卷积行为识别方法
CN113435262A (zh) * 2021-06-08 2021-09-24 上海电机学院 基于双流膨胀3d卷积网络的异常行为识别方法和预警系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ABID MEHMOOD: "Abnormal Behavior Detection in Uncrowded Videos with Two-Stream 3D Convolutional Neural Networks", 《APPLIED SCIENCES》, pages 1 - 25 *
何冰倩 等: "基于改进的深度神经网络的人体动作识别模型", 《计算机应用研究》, vol. 36, no. 10, pages 3107 - 3111 *
卢静: "基于深度学习的行为识别及其在基建现场的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 01, pages 4 *
吴冬梅;卢静;蒋瑜;: "基于双通道C3D的基建现场人体异常行为识别", 《信息技术与信息化》, no. 1, pages 28 - 31 *
谢佳龙 等: "一种基于双流融合3D卷积神经网络的动态头势识别方法", 《电子学报》, no. 7, pages 1363 - 1368 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116311374A (zh) * 2023-03-27 2023-06-23 淮阴工学院 一种化工厂工人异常行为识别与预警方法及系统
CN116311374B (zh) * 2023-03-27 2023-10-20 淮阴工学院 一种化工厂工人异常行为识别与预警方法及系统
CN116311005A (zh) * 2023-05-25 2023-06-23 成都睿瞳科技有限责任公司 一种用于运动图像处理装置、方法及存储介质
CN117710832A (zh) * 2024-01-04 2024-03-15 广州智寻科技有限公司 一种电网卫星、无人机、视频监控图像智能识别方法

Similar Documents

Publication Publication Date Title
CN110674772B (zh) 电力作业现场智能安全管控辅助系统及方法
CN115311740A (zh) 一种电网基建现场人体异常行为识别方法及系统
CN112183313B (zh) 一种基于SlowFast的电力作业现场动作识别方法
CN102915432B (zh) 一种车载微机图像视频数据提取方法及装置
CN115880558B (zh) 农事行为检测方法、装置、电子设备及存储介质
CN112541393A (zh) 一种基于深度学习的变电站人员检测方法及装置
CN116546023B (zh) 一种油气作业区暴力行为识别方法及系统
CN113361520B (zh) 基于样本偏移网络的输电线路设备缺陷检测方法
CN114742777A (zh) 一种基于改进yolo模型的销钉状态的识别方法
CN117078232B (zh) 一种基于大数据的加工设备故障预防系统及方法
CN113469938A (zh) 基于嵌入式前端处理服务器的管廊视频分析方法及系统
CN117671450A (zh) 一种基于transformer的属地网络图像内容安全监管的DETR架构方法
CN117294022A (zh) 基于多源传感器协同的变电站巡检系统及方法
CN113221667A (zh) 一种基于深度学习的人脸口罩属性分类方法及系统
CN117392568A (zh) 一种复杂场景下无人机巡检变电设备的方法
CN115719497A (zh) 一种学生专注度识别方法及系统
CN115601674A (zh) 一种输电工程烟雾隐患识别方法、装置及存储介质
CN115641550A (zh) 一种用于化工场所中工作人员防护用具佩戴情况的检测方法及检测系统
CN115995051A (zh) 基于最小残差平方和法的变电站设备故障期识别方法
Song et al. Residual Squeeze-and-Excitation Network for Battery Cell Surface Inspection
CN115965883A (zh) 一种基于Transformer的烟雾检测算法
CN112240964B (zh) 一种用于配电网故障类型识别的方法
Wang et al. Detecting temperature anomaly at the key parts of power transmission and transformation equipment using infrared imaging based on SegFormer
Sun et al. Unsupervised learning based target localization method for pantograph video
Yang et al. ICANet: A Method of Short Video Emotion Recognition Driven by Multimodal Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination