CN112560627A - 基于神经网的工地人员异常行为实时检测方法 - Google Patents

基于神经网的工地人员异常行为实时检测方法 Download PDF

Info

Publication number
CN112560627A
CN112560627A CN202011427696.8A CN202011427696A CN112560627A CN 112560627 A CN112560627 A CN 112560627A CN 202011427696 A CN202011427696 A CN 202011427696A CN 112560627 A CN112560627 A CN 112560627A
Authority
CN
China
Prior art keywords
neural network
abnormal
construction site
real
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011427696.8A
Other languages
English (en)
Inventor
田青
张华�
张正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Jicui Future City Application Technology Research Institute Co Ltd
Original Assignee
Jiangsu Jicui Future City Application Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Jicui Future City Application Technology Research Institute Co Ltd filed Critical Jiangsu Jicui Future City Application Technology Research Institute Co Ltd
Priority to CN202011427696.8A priority Critical patent/CN112560627A/zh
Publication of CN112560627A publication Critical patent/CN112560627A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

一种基于神经网的工地人员异常行为实时检测方法,步骤包括:1)在工地现场部署摄像机,用于采集人员图像信息;获取工地现场摄像机视频信流,并截取单帧图片;2)按照预先设定的输入图像的尺寸要求,改变输入图像大小;3)采用编码器‑解码器架构神经网络对经过步骤2)处理的图像进行处理,生成不同的尺度下的特征映射图;4)基于不同尺度下的特征映射图,获取不同尺寸目标的位置区域;5)过滤虚警检测;6)根据感兴趣目标的存在状态,推断异常行为是否发生;7)输出异常行为实时检测结果。本发明采用物联网、机器学习及区块链技术达到提升工地管理智能化、透明化程度的效果,解决工地管理难度大的问题。

Description

基于神经网的工地人员异常行为实时检测方法
技术领域
本技术方案是计算机技术在安监场景中的应用技术,具体是一种人员异常行为的实时检测方法,具体是该方法在工地场景的应用,本实时检测方法采用编码器-解码器架构神经网络。
背景技术
传统工地管理面临建筑工地环境复杂、从业人员管理难、事故多发且调查取证难、项目安全管理难等问题。
随着手机使用的普及,工地工人进行作业时使用手机,会增加安全事故发生的可能性。而依靠人员监督难以起到实时的监督作用,如果采用事后监控视频进行检查,也需要大量的人力和时间成本,而且对预防安全事故来说,其效果远不如即时发现、即时处理。
发明内容
为了解决上述技术问题,发明提出一种基于神经网的工地人员异常行为实时检测方法,步骤包括:
1)在工地现场部署摄像机,用于采集人员图像信息;获取工地现场摄像机视频信流,并截取单帧图片;
2)按照预先设定的输入图像的尺寸要求,改变输入图像大小(采用resize函数,常见的插值算法有:最近邻、双线性、双三次、基于像素区域关系以及兰索斯插值算法);其特征是步骤还包括:
3)采用编码器-解码器架构神经网络对经过步骤2)处理的图像进行处理,生成不同的尺度下的特征映射图;
所述编码器-解码器架构神经网络的构建方法为:
首先基于多分支卷积模块,生成不同的尺度下的特征映射图;
然后构建一个卷积神经网络,为编码器-解码器架构;其中编码器提取语义和细节信息,解码器恢复特征图尺寸,获得最终分割结果;
最后对不同分支上的特征进行融合,获得准确的目标分割结果;
4)基于不同尺度下的特征映射图,获取不同尺寸目标的位置区域;不同尺寸目标分别为:人体、人脸、手机、安全帽;
5)过滤虚警检测;
6)根据感兴趣目标的存在状态,推断异常行为是否发生;
目标的状态与异常行为之间的对应关系为:
若手机位置与人脸位置很接近,则判断为打电话,为异常;反之正常;
若安全帽位置与人体位置接近,则判断为异常;
若安全帽位置与人脸位置很接近,则判断为正常;反之异常;
7)输出异常行为实时检测结果。
所述步骤3)中,步骤2)得到的图像送入FPN特征网络(特征图金字塔网络)中,不同尺度的ROI使用不同特征层作为ROI pooling层的输入;
对于输入图像中的不同尺寸目标的不同特征,利用浅层的特征将简单的目标的区分开,利用深层的特征将复杂的目标区分开;
增加两个1024维的轻量级全连接层,跟上分类器和边框回归;对检测到的各个目标形成一个边界框即Boundingbox,返回检测到目标的位置信息,位置信息包括边界框四个顶点的坐标信息;
所述步骤5)中,过滤虚警检测的方法为:采用基于不同目标的相对位置约束惩罚函数,筛选最优分布组合:
设安全帽、安全服、手机的位置中心点分别表示为:M(x,y),F(x,y),J(x,y)最优分布算法为:
F={(x,y)|(x,y)∈R}
Figure BDA0002825589180000021
其中,F中的任何一个元素为可行解,(x,y)*为最优解。
建立相对位置约束惩罚函数的方法为:
约束优化问题的一般形式可表达如下:
min(f(x,y)),(x,y)=[(x1,y1),...,(xn,yn)]T
yM>yF,y>0
其中,(x,y)=[(x1,y1),...,(xn,yn)]T为决策变量,f((x,y))为目标函数。
应用场景中,规定安全服与安全帽的位置为:安全帽在安全服之上是正常;手机在安全帽附近是异常;
所述决策变量是安全帽安全服与手机的位置坐标(x,y);
空间位置约束模型参考图2,M、F、J分别代表安全帽、安全服、手机的位置。
所述步骤2)中,确定输入图像的尺寸的步骤为:
2.1)统计感兴趣目标在图像中的分布尺寸,确定输入图像的尺寸;(感兴趣的目标即为人员以及附属物,附属物是手机、安全帽、安全服等)
2.2)统计感兴趣目标位置分布规律,用来统计安全帽安全服及手机之间的相对位置关系,确定异常事件分类。
采用公开数据集预训练好的深度学习目标检测网络,根据部署场景微调训练后,得到部署后目标检测网络,再进行实时人员、各个物体检测。根据部署场景微调训练,方法为:现场场景与实验时会存在误检测和漏检测的情况,则根据实际场景数据进行调参处理。
检测到的人员和各个物体形成一个边界框即Boundingbox,返回检测到的人员、各个物体的位置信息,位置信息包括边界框四个顶点的坐标信息;
采用微小目标检测网络即特征金字塔网络FPN,进行实时人员、各个物体检测;返回检测到的人员、各个物体的位置信息。
所述步骤3)中的网络构建方法具体可以为:
3.1、把低分辨率、高语义信息的高层特征和高分辨率、低语义信息的低层特征进行自上而下的侧边连接,使得所有尺度下的特征都有丰富的语义信息;
3.2、采用FPN特征金字塔网络进行多尺度目标检测;不同尺度的ROI,使用不同特征层作为ROI pooling层的输入;
图像中不同尺寸的目标的不同特征,利用浅层的特征将简单的目标的区分开;利用深层的特征将复杂的目标区分开;
增加两个1024维的轻量级全连接层,跟上分类器和边框回归;对检测到的各个目标形成一个边界框即Boundingbox,返回检测到目标的位置信息,位置信息包括边界框四个顶点的坐标信息;
3.3、解码器输出的特征图经过Softmax函数,得到目标区域的分布概率图,在通过交叉熵函数与分割真值图比较计算损失;损失在网络中反向传播,得到网络中参数的梯度,再根据梯度下降法来调整参数,使损失值减小;网络达到最佳;交叉熵损失函数计算如下:
Figure BDA0002825589180000031
其中,W和H分别为分割真值图宽和高,yij代表像素(i,j)的真实类别,pij代表像素(i,j)的目标概率。
过滤虚警检测的方法为:采用基于不同目标的相对位置约束惩罚函数,筛选最优分布组合:
设安全帽、安全服、手机的位置中心点分别表示为:Z1(x1,y1),Z2(x2,y2),Z3(x3,y3)
最优分布算法为:
F={(x,y)|(x,y)∈R}
Figure BDA0002825589180000032
其中,F中的任何一个元素为可行解,(x,y)*为最优解。
建立相对位置约束惩罚函数的方法为:约束优化问题的一般形式可表达如下:
min(f(x,y)),(x,y)=[(x1,y1),...,(xn,yn)]T
yM>yF,y>0
其中,(x,y)=[(x1,y1),...,(xn,yn)]T为决策变量,f((x,y))为目标函数。
本发明采用物联网、机器学习及区块链技术达到提升工地管理智能化、透明化程度的效果,解决工地管理难度大的问题。
附图说明
图1为应用于智慧工地场景的人员异常行为实时检测方法流程图。
图2是空间位置约束模型示意图,其中,Z1,Z2,Z3代表目标相对位置。
具体实施方式
参考图1对技术方案进一步说明:
针对不同目标尺寸的差异,通过在不同尺度上的目标检测、不同目标相对位置约束惩罚等处理,实现对安全帽、安全服、手机等不同尺寸特定目标的一体化检测,从而判断是否存在异常行为。
具体地,智慧工地人员异常行为实时检测方法的步骤为:
步骤S1:获取摄像机视频信流,并截取单帧图片;
步骤S2:统计感兴趣目标在图像中的分布尺寸,确定输入图像的尺寸;
步骤S3:统计感兴趣目标位置分布规律;
采用公开数据集预训练好的深度学习目标检测网络模型,根据部署场景微调训练后,得到部署后目标检测网络,再进行实时人员、各个物体检测;
检测到的人员和各个物体形成一个边界框即Boundingbox,返回检测到的人员、各个物体的位置信息,位置信息包括边界框四个顶点的坐标信息;
进一步优选的,采用微小目标检测网络进行实时人员、各个物体检测,返回检测到的人员、各个物体的位置信息。
步骤S4:按照步骤2)中确定的尺寸要求,resize输入图像;
步骤S5:基于多分支卷积模块,生成不同的尺度下的特征映射图;
构建一个卷积神经网络,为编码器-解码器架构,其中编码器提取语义和细节信息,解码器恢复特征图尺寸,获得最终分割结果;最后对不同分支上的特征进行融合,获得准确的目标分割结果;
解码器输出的特征图经过Softmax函数,得到目标区域的分布概率图,在通过交叉熵函数与分割真值图比较计算损失;损失在网络中反向传播,得到网络中参数的梯度,再根据梯度下降法来调整参数,使损失值减小。网络达到最佳;交叉熵损失函数计算如下:
Figure BDA0002825589180000041
其中,W和H分别为分割真值图宽和高,yij代表像素(i,j)的真实类别,pij代表像素(i,j)的目标概率。
步骤S6:建立相对位置约束惩罚函数;
约束优化问题的一般形式可表达如下:
minf(x),x=[x1,...,xn]T
其满足以下m个约束条件:
gj(x)≤0,j=1,...,q
hj(x)=0,j=q+1,...,m
其中,x=[x1,...,xn]T为决策变量,f(x)为目标函数,q为不等式约束条件个数,m-q为等式约束条件个数。如果在候选解x处gj(x)=0,则约束条件gj(x)≤0称为候选解的积极约束条件。
步骤S7:基于不同尺度下的特征映射图,获取不同尺寸目标的位置区域;
步骤S8:基于步骤4)中建立的不同目标的相对位置约束惩罚函数,筛选最优分布组合,过滤虚警检测;最优分布算法如下:
F={x|x∈D,g(x)≥0}
f(x*)=min{f(x)|x∈F}
其中,F中的任何一个元素为可行解,x*为最优解。
步骤S9:根据感兴趣目标的存在状态,推断异常行为是否发生;
步骤S10:输出异常行为实时检测结果。

Claims (4)

1.一种基于神经网的工地人员异常行为实时检测方法,步骤包括:
1)在工地现场部署摄像机,用于采集人员图像信息;获取工地现场摄像机视频信流,并截取单帧图片;
2)按照预先设定的输入图像的尺寸要求,改变输入图像大小;
其特征是步骤还包括:
3)采用编码器-解码器架构神经网络对经过步骤2)处理的图像进行处理,生成不同的尺度下的特征映射图;
所述编码器-解码器架构神经网络的构建方法为:
首先基于多分支卷积模块,生成不同的尺度下的特征映射图;
然后构建一个卷积神经网络,为编码器-解码器架构;其中编码器提取语义和细节信息,解码器恢复特征图尺寸,获得最终分割结果;
最后对不同分支上的特征进行融合,获得准确的目标分割结果;
4)基于不同尺度下的特征映射图,获取不同尺寸目标的位置区域;不同尺寸目标分别为:人体、人脸、手机、安全帽;
5)过滤虚警检测;
6)根据感兴趣目标的存在状态,推断异常行为是否发生;
目标的状态与异常行为之间的对应关系为:
若手机位置与人脸位置很接近,则判断为打电话,为异常;反之正常;
若安全帽位置与人体位置接近,则判断为异常;
若安全帽位置与人脸位置很接近,则判断为正常;反之异常;
7)输出异常行为实时检测结果。
2.根据权利要求1所述的基于神经网的工地人员异常行为实时检测方法,其特征是所述步骤3)中,步骤2)得到的图像送入FPN特征网络中,不同尺度的ROI使用不同特征层作为ROIpooling层的输入;
对于输入图像中的不同尺寸目标的不同特征,利用浅层的特征将简单的目标的区分开,利用深层的特征将复杂的目标区分开;
增加两个1024维的轻量级全连接层,跟上分类器和边框回归;对检测到的各个目标形成一个边界框即Boundingbox,返回检测到目标的位置信息,位置信息包括边界框四个顶点的坐标信息。
3.根据权利要求1所述的基于神经网的工地人员异常行为实时检测方法,其特征是所述步骤5)中,过滤虚警检测的方法为:采用基于不同目标的相对位置约束惩罚函数,筛选最优分布组合。
4.根据权利要求1所述的基于神经网的工地人员异常行为实时检测方法,其特征是所述步骤2)中,确定输入图像的尺寸的步骤为:
2.1)统计感兴趣目标在图像中的分布尺寸,确定输入图像的尺寸;感兴趣的目标即为人员以及附属物,附属物是手机、安全帽、安全服;
2.2)统计感兴趣目标位置分布规律,用来统计安全帽安全服及手机之间的相对位置关系,确定异常事件分类。
CN202011427696.8A 2020-12-09 2020-12-09 基于神经网的工地人员异常行为实时检测方法 Pending CN112560627A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011427696.8A CN112560627A (zh) 2020-12-09 2020-12-09 基于神经网的工地人员异常行为实时检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011427696.8A CN112560627A (zh) 2020-12-09 2020-12-09 基于神经网的工地人员异常行为实时检测方法

Publications (1)

Publication Number Publication Date
CN112560627A true CN112560627A (zh) 2021-03-26

Family

ID=75060867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011427696.8A Pending CN112560627A (zh) 2020-12-09 2020-12-09 基于神经网的工地人员异常行为实时检测方法

Country Status (1)

Country Link
CN (1) CN112560627A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113486857A (zh) * 2021-08-03 2021-10-08 云南大学 一种基于YOLOv4的登高安全检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563281A (zh) * 2017-07-24 2018-01-09 南京邮电大学 一种基于深度学习的建筑工地人员安全隐患监测方法
CN108564097A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN111064935A (zh) * 2019-12-30 2020-04-24 中祖建设安装工程有限公司 一种智慧工地人员姿态检测方法及系统
WO2020132082A1 (en) * 2018-12-21 2020-06-25 Waymo Llc Object classification using extra-regional context
CN111523434A (zh) * 2020-04-18 2020-08-11 李亚茹 基于区块链与bim的工地人员异常聚集检测系统
CN111753705A (zh) * 2020-06-19 2020-10-09 神思电子技术股份有限公司 一种基于视频分析的智慧工地安全作业的检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563281A (zh) * 2017-07-24 2018-01-09 南京邮电大学 一种基于深度学习的建筑工地人员安全隐患监测方法
CN108564097A (zh) * 2017-12-05 2018-09-21 华南理工大学 一种基于深度卷积神经网络的多尺度目标检测方法
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
WO2020132082A1 (en) * 2018-12-21 2020-06-25 Waymo Llc Object classification using extra-regional context
CN111064935A (zh) * 2019-12-30 2020-04-24 中祖建设安装工程有限公司 一种智慧工地人员姿态检测方法及系统
CN111523434A (zh) * 2020-04-18 2020-08-11 李亚茹 基于区块链与bim的工地人员异常聚集检测系统
CN111753705A (zh) * 2020-06-19 2020-10-09 神思电子技术股份有限公司 一种基于视频分析的智慧工地安全作业的检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孔英会;王维维;张珂;戚银城;: "基于改进Mask R-CNN模型的电力场景目标检测方法", 科学技术与工程, no. 08, 18 March 2020 (2020-03-18), pages 191 - 199 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113486857A (zh) * 2021-08-03 2021-10-08 云南大学 一种基于YOLOv4的登高安全检测方法及系统

Similar Documents

Publication Publication Date Title
CN112216049B (zh) 一种基于图像识别的施工警戒区监测预警系统及方法
US9104914B1 (en) Object detection with false positive filtering
CN110135269B (zh) 一种基于混合颜色模型与神经网络的火灾图像检测方法
US20190012547A1 (en) Congestion-state-monitoring system
CN101406390B (zh) 检测人体部位和人的方法和设备以及对象检测方法和设备
CN101635835A (zh) 智能视频监控方法及系统
CN106373146B (zh) 一种基于模糊学习的目标跟踪方法
CN112183472A (zh) 一种基于改进RetinaNet的试验现场人员是否穿着工作服检测方法
CN109816745A (zh) 人体热力图展示方法及相关产品
CN111738336A (zh) 基于多尺度特征融合的图像检测方法
CN112613359B (zh) 用于人员异常行为检测的神经网络的构建方法
CN111582074A (zh) 一种基于场景深度信息感知的监控视频树叶遮挡检测方法
CN116343077A (zh) 一种基于注意力机制与多尺度特征的火灾检测预警方法
CN107483894A (zh) 基于场景判断实现客运管理的高铁车站视频监控系统
CN107103266A (zh) 二维人脸欺诈检测分类器的训练及人脸欺诈检测方法
CN112270381A (zh) 基于深度学习的人流量检测方法
CN116030361A (zh) 一种基于cim-t架构的高分辨率影像变化检测方法
CN116895098A (zh) 基于深度学习和隐私保护的视频人体动作识别系统与方法
CN111639668A (zh) 一种基于深度学习的人群密度检测方法
CN114332739A (zh) 一种基于运动目标检测和深度学习技术的烟雾检测方法
CN112560627A (zh) 基于神经网的工地人员异常行为实时检测方法
CN114399734A (zh) 一种基于视觉信息的森林火灾预警方法
CN113052139A (zh) 一种基于深度学习双流网络的攀爬行为检测方法及系统
KR20080079443A (ko) 영상으로부터의 객체 검출 방법 및 장치
CN112580449B (zh) 智慧工地现场的人员异常行为判别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination