CN115273146A - 一种基于改进ssd模型的自动扶梯乘客姿态异常检测方法 - Google Patents

一种基于改进ssd模型的自动扶梯乘客姿态异常检测方法 Download PDF

Info

Publication number
CN115273146A
CN115273146A CN202210840375.3A CN202210840375A CN115273146A CN 115273146 A CN115273146 A CN 115273146A CN 202210840375 A CN202210840375 A CN 202210840375A CN 115273146 A CN115273146 A CN 115273146A
Authority
CN
China
Prior art keywords
ssd
escalator
network
loss
box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210840375.3A
Other languages
English (en)
Inventor
李佐勇
陈健
许腾
叶伟华
郑祥盘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minjiang University
Original Assignee
Minjiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minjiang University filed Critical Minjiang University
Priority to CN202210840375.3A priority Critical patent/CN115273146A/zh
Publication of CN115273146A publication Critical patent/CN115273146A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Escalators And Moving Walkways (AREA)

Abstract

本发明涉及一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法。该方法将改进的单镜头检测器(SSD)算法,用于自动扶梯乘客姿势异常检测。首先,SSD网络的VGG16网络部分被Mobilenetv2网络取代,这使得模型结构更简单,检测速度更快。同时,引入了并集上的距离交集(DIoU)损失函数。根据IoU的特点,考虑到GIoU的缺点,DIoU直接回归两个盒子中心点之间的欧氏距离,以加速收敛。实验结果表明,改进的SSD扶梯乘客姿势异常检测算法能够准确、实时地识别扶梯乘客的危险姿势,以便制定相应的安全防护措施,提高自动扶梯运行的安全性能。

Description

一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法
技术领域
本发明属于计算机视觉识别技术领域,具体涉及一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法。
背景技术
自动扶梯是一种启动频繁、长期带负荷运行的机电设备,属于涉及人身安全和高风险的重型特种设备[1]。在过去的二十年里,随着社会经济的快速发展和政府基础设施建设的不断加强,对自动扶梯的需求越发强烈,自动扶梯数量也在不断增加。到2020年底,我国特种设备总量已达到164841万台,其中电梯(含自动扶梯)78655万台[2]。越来越多的自动扶梯安装在地铁、机场、火车站、商场等公共场所,它的出现给人们的日常生活带来了极大的便利。然而,由于活动部件不可避免地与乘客接触,因此自动扶梯的使用不存在小的安全隐患。自动扶梯事故的频繁发生也引起了公众对自动扶梯产品安全的极大关注。
乘客在自动扶梯上跌倒是最常见的事故类型[3]。跌倒的风险是不可预测的,但如果采取相应的措施,可以及时发现甚至避免跌倒。通过对国内近年来发生的100起自动扶梯事故的数据收集和整理,结果表明,各类事故的主观原因包括乘客做出危险行为[4]。因此,成功地检测出乘客的危险行为,并对危险行为进行相应的制动,可以大大降低安全事故发生的概率和事故造成的二次伤害。然而,传统的自动扶梯检测系统技术仅限于检测自动扶梯的机械运行状态,如梳齿板检测[5]、扶手带速度异常检测[6]等;在自动扶梯正常运行时,并没有检测乘客的姿势,比如危险的姿势,比如人摔倒。因此,随着自动扶梯在日常生活中的应用越来越广泛,迫切需要实现一种实时检测自动扶梯乘客异常姿势的算法。针对传统自动扶梯检测这一现状,本发明决定研究一种基于深度学习的人体姿势异常检测算法。
随着图像处理技术在现实生活中的广泛应用,特别是近年来,深度学习方法在计算机视觉领域的应用越来越广泛。与传统的检测方法相比,深度学习方法具有两个显著的优点:准确性和实时性,而深度学习方法更适合复杂多变的场景。基于图像处理和深度学习的目标异常检测系统将在未来的安全援助和医疗保健系统中发挥非常重要的作用。
目前,基于深度学习模型的目标检测算法主要分为两类:一类是两阶段检测算法。基于候选区域的目标检测和识别算法(fast-r-cnn[7],fast-r-cnn[8])需要首先生成区域建议,然后生成候选区域分类(通常在位置上进行细化)。该算法最大的缺点是分段检测方法检测速度慢,不能满足实时性要求。另一种是单级检测算法,代表性算法是YOLO[9]和SSD[10]。这种算法不需要生成候选区域,而是直接生成目标的类别概率和位置坐标。在高精度的条件下,可以在一定程度上提高检测速度,满足实时性要求。YOLO将对象检测问题视为回归问题。通过卷积神经网络结构,可以直接从输入图像中生成位置坐标和类别概率。虽然简化了过程,但降低了检测精度(尤其是较小的目标识别)。SSD主要由几个多尺度特征块和一个基本网络块组成,其算法是一种直接预测目标类别和包围盒的多目标检测算法。对于不同大小的目标检测,传统的方法是将图像转换成不同大小(图像金字塔),然后分别检测,最后合成结果(NMS)。SSD算法通过使用不同卷积层的特征映射,也可以达到相同的效果。
目前,大多数现有研究倾向于关注事后统计,这反映了自动扶梯设计和使用中的缺陷。因此,急需改进这些缺陷,以减少与自动扶梯相关的伤害的影响。然而,很少有研究关注正在发生和即将发生的伤害因素。
发明内容
本发明的目的在于提供一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,能够准确、实时地识别扶梯乘客的危险姿势;该发明可以控制自动扶梯系统,及时制定相应的安全防护措施,提高自动扶梯运行的安全性能。
为实现上述目的,本发明的技术方案是:一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,该方法将改进的单镜头检测器SSD算法,用于自动扶梯乘客姿势异常检测;将SSD 网络的VGG16网络采用Mobilenetv2网络取代;同时,引入并集上的距离交集DIoU损失函数。
相较于现有技术,本发明具有以下有益效果:本发明将深度学习技术引入自动扶梯乘客姿态异常检测领域,提出了一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法。同时,引入了并集上的距离交集(DIoU)损失函数。综合考虑IoU的特点和GIoU的缺点,本发明决定设计DIoU直接回归两个盒子中心点之间的欧氏距离,以加速收敛。实验结果表明,改进的SSD 扶梯乘客姿势异常检测算法能够准确、实时地识别扶梯乘客的危险姿势。具体创新点如下:
(1)将MobilenetV2引入SSD模型,使得模型结构更简单,检测速度更快。
(2)改进了SSD原有的损耗函数,采用DIOU损耗函数来降低损耗值,并进一步优化实验结果。
附图说明
图1为本发明方法流程图。
图2为本发明算法的网络结构。
图3为MobileNet V2模型架构。
图4为优化后的SSD网络模型。
图5为总体系统框架图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
如图1所示,本发明一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,提出了一种改进的单镜头检测器(SSD)算法,用于自动扶梯乘客姿势异常检测。首先,SSD网络的VGG16 网络部分将被Mobilenetv2网络取代,这使得模型结构更简单,检测速度更快。同时,引入了并集上的距离交集(DIoU)损失函数。根据IoU的特点,考虑到GIoU的缺点,DIoU直接回归两个盒子中心点之间的欧氏距离,以加速收敛。
以下为本发明具体实施过程。
1、SSD算法模型
Liu等人在ECCV2016[10]上提出了SSD算法模型,这是一种多尺度目标检测模型和单次多帧检测模型,该算法采用简单的“端到端”训练,进一步提高了速度和精度之间的权衡,即使输入图像的分辨率较低,也能保证检测的准确性。它以其简单、快速的特点得到了广泛的应用。
1)SSD网络
SSD网络由前端和后端组成,前端是一个VGG16网络,它贯穿到Conv5_3层,后端是一个不同大小的功能层网络。SSD算法采用六种不同的特征层来检测不同尺度的目标,即Conv4_3、Conv7、Conv8_2、Conv9_2、Conv10_2、Conv11_2,对应的大小为38×38×512、19×19×1024、 10×10×512、5×5×256、3×3×256、1×1×256,SSD网络结构如图2所示。SSD算法使用特征金字塔结构进行检测,其中,浅特征层更适合检测小目标,深特征层更适合检测大目标。最后,将多尺度特征层的组合作为分类和回归的基础,进行回归计算和非最大值抑制,并输出最终结果。
2)损失函数
SSD目标损失函数是定位损失(loc)和置信度损失(conf)的加权和。当训练模型时,本发明使用两个损失函数。一个用于测试正向预测边界框偏移的损失,另一个用于预测边界框类别的损失。SSD的损失函数表示如下:
Figure RE-GDA0003846314760000031
其中c代表类别置信度的预测值,l代表先验框对应边界框的位置预测值,g代表地面真值框的位置参数,N代表匹配默认框的数量,α是权重参数,x为指示器参数;
定位损失的计算公式为:
Figure RE-GDA0003846314760000032
其中
Figure RE-GDA0003846314760000033
用作指示器,指示第i个先验边界框和第j个地面真值框是否在k类上匹配。由于
Figure RE-GDA0003846314760000034
的存在,仅对正样本计算位置误差。需要注意的是,地面真值框的位置参数g应编码为
Figure RE-GDA0003846314760000041
(偏移量),
Figure RE-GDA0003846314760000042
为预测框,其公式如下:
Figure RE-GDA0003846314760000043
Figure RE-GDA0003846314760000044
Figure RE-GDA0003846314760000045
Figure RE-GDA0003846314760000046
cx和cy表示预测边界框的坐标,w和h表示预测边界框的大小;
Figure RE-GDA0003846314760000047
分别表示地面真实框与边界框中心偏移量(cx,cy)和其宽度w、高度h的偏移量,
Figure RE-GDA0003846314760000048
表示地面真实框编码值,
Figure RE-GDA0003846314760000049
表示大小比例因子;
位置丢失采用先验包围盒l参数与地面真值盒g参数之间的smooth L1丢失;smoothL1损失函数的公式如下:
Figure RE-GDA00038463147600000410
置信度损失的计算公式为:
Figure RE-GDA00038463147600000411
Figure RE-GDA00038463147600000412
表示预测框i与真实框j关于类别p匹配,p的概率越高,损失越小。
Figure RE-GDA00038463147600000413
表示预测框没有物体,预测为背景的概率越高,损失越小。
Figure RE-GDA00038463147600000414
表示类别p的第i个边界框的置信度,其计算公式如下:
Figure RE-GDA00038463147600000415
exp(x)函数的返回值为e的x次方,e是自然对数的底(约等于2.718281828459045…)。
由于smooth L1损失函数没有考虑坐标之间的相关性,因此采用DIoU损失函数替换 smoothL1损失函数,DIoU损失函数公式如下:
Figure RE-GDA00038463147600000416
其中
Figure RE-GDA00038463147600000417
B是预测框,Bgt是地面真值框。b和bgt表示B和Bgt的中心点,ρ是欧几里得距离,C是覆盖两个边界框的最小包围盒的对角线长度。
2、优化模型
1)Mobilenetv2
作为一种轻量级网络,Mobilenetv2[11]引入了深度可分离卷积和反向残差块,用线性激活函数替换反向残差网络结构中的最后一个ReLU6,来解决低维ReLU6操作导致的信息丢失问题 [11]。Mobilenetv2的架构如图3所示。
传统的SSD算法采用多尺度特征映射进行目标检测,提取多尺度特征,大大提高检测精度,但实时性仍然较差。SSD 80%的前馈时间花在主干上,即VGG16网络上,如果使用更快的主干,速度可以进一步提高。因此,本发明在Mobilenetv2网络中引入了反向残差块和深度可分离卷积,大大减少了计算量,提高了检测速度。在考虑模型大小的同时,对延迟进行了优化。因此,本发明用Mobilenetv2网络取代SSD网络中的VGG16网络部分,使模型结构更简单,检测速度更快。优化后的SSD网络模型如图4所示。
3)DIoU损失函数
Smooth L1作为目标检测回归Loss的缺点:
将bbox四个点分别求loss然后相加,并没有考虑坐标之间的相关性,bbox的4个部分应该是作为一个整体讨论。
把cx、cy、w、h独立看待,4个部分产生不同的loss会回归出不同的预测框,但是如果4 个部分的总体loss相同,多个检测帧可能具有相同的损失。
针对上述缺点,提出了IOU损失[12],即欠条损失回归由四个点组成的整体边界框。但是,如果两个盒子不相交,那么IoU的丢失并不能反映出两个盒子之间的距离,当它相交时,也不能准确反映出两个盒子之间的重叠程度。本发明提出的GIoU损失[13]基于IoU损失特性引入最小外接凸对象,解决了预测盒与地真盒不相交时损失值为0的问题,也存在一些不足,如在某些情况下退化为IOU,两个方框相交时水平和垂直方向收敛缓慢等。而DIoU损失[14]在基于IoU 损失特性的基础上考虑到GIoU损失的缺点,直接回归两个boxes中心点的欧式距离,加速收敛。因此,本发明采用DIoU[14]损失函数替换smoothL1损失函数。公式如下:
Figure RE-GDA0003846314760000051
其中
Figure RE-GDA0003846314760000052
B是预测框,Bgt是地面真值框。b和bgt表示B和Bgt的中心点,ρ是欧几里得距离,C是覆盖两个盒子的最小包围盒的对角线长度。
3、整体系统框架
本发明研究了基于改进SSD模型的自动扶梯乘客姿态异常检测,为了检测视频中的各种乘客身体姿势,提出了优化的SSD算法作为框架。整个扶梯乘客姿势异常检测系统的实现思路如下:首先,将待检测的视频输入检测系统,从不同的扶梯监控视频序列中提取视频帧,形成一个数据集,并对数据集进行手动标记,记录位置和大小信息。其次,将标记后的数据集输入优化后的SSD网络进行训练,直到网络收敛,得到能够检测目标的SSD权重模型。第三,将从不同特征地图中获得的边界框进行组合,通过NMS(非最大值抑制)方法抑制某些重叠或错误的边界框,并生成最终的边界框集(即检测结果)。最后,输出检测到的扶梯上的乘客姿势,判断乘客是否处于危险状态,使扶梯及时采取相应的安全防护措施。本发明提出的方法的总体框架如图5所示。
4、实施例
1、设置
数据集描述
因为关于乘客在自动扶梯上摔倒的公开监测视频很少,也没有相应的公开数据集。因此,本发明在解决数据集收集方面做了以下实际工作:
a)与监管部门负责人沟通,获得了在超市自动扶梯监控背景下拍摄视频的许可;
b)对拍摄的自动扶梯视频进行取景,然后,对乘客在自动扶梯上的相应姿态(包括站立、方正、弯曲和跌倒)进行标注,从而得到训练数据集。
1)模型参数设置
网络模型的训练参数设置如表1所示。
表1
Figure RE-GDA0003846314760000061
2)实验评估指标
召回率和精确度被用作评估网络模型性能的指标。召回用于评估模型找到所有阳性样本的能力,而精度用于评估模型检测的准确性。
探测器有四个预测结果。真阳性(TP):最初为阳性样本,归类为阳性样本。真阴性(TN):最初是阴性样本,分类为阴性样本,通常表示分类错误。假阳性(FP):最初,阴性样本被归类为阳性样本,通常称为假警报。假阴性(FN):最初,阳性样本被归类为阴性样本,通常称为遗漏。基于上述四个参数,评估指标召回率和精确度的公式可以表示为(11)(12):
Figure RE-GDA0003846314760000062
Figure RE-GDA0003846314760000071
2、实验结果
每种模型的实验结果总结见表2。
表2 各模型实验结果对比
Figure RE-GDA0003846314760000072
实验结果表明,速度较快的两阶段算法Faster R-CNN虽然精度较高,但实时性较差,不适合实时监控。本发明提出的方法简化了骨干网络,优化了损耗函数。与SSD相比,虽然精度和召回率略有降低,但帧速率和模型尺寸都得到了很大程度的优化。在真实的扶梯监控场景中,可以更好地发挥实时检测功能。
本发明的模型在确保了自动扶梯乘客姿态检测准确性保持不变的同时,大大提高了检测速度。
5、总结
本发明提出了一种基于改进SSD模型的自动扶梯乘客异常姿势检测方法。首先,在SSD算法中引入了轻量级MobilenetV2网络,确保检测的准确性,提高检测速度,减少参数数量,简化骨干网络。其次,在损耗函数中引入DIoU损耗函数,进一步优化实验结果。实验结果表明,本发明提出的方法不仅保证了乘客姿态异常检测的准确性,而且提高了乘客姿态异常检测的实时性。
[1]United Nations,Department of Economic and Social Affairs,Population Division.World population ageing 2020 Highlights:Livingarrangements of older persons[R].2020.
[2]None.Circular of the State Administration of market supervision onthe safety status of national special equipment in 2020[J]Western specialequipment,2021(2):4
[3]Beards P J,Frost G,Healey N,et al.A new Human factors incidenttaxonomy for members of the public(HFIT-MP):an investigation of escalatorincidents[J].Safety science,2022,147:105597.
[4]Tu Chunlei,Li Xiangdong,sun min,et al Escalator risk analysisbased on accident and fault statistics[J]China special equipment safety,2016(8):18-21
[5]Ma H,Li Z,Wang Z,et al.Research on measuring device andquantifiable risk assessment method based on FMEA of escalator brake[J].Advances in Mechanical Engineering,2021,13(3): 16878140211001963.
[6]Kwon Y S,Copeland G S,Park N G.A multibody dynamic model forescalator handrail systems and its application to dynamic characteristics[J].Multibody System Dynamics,2005,13(2): 253-266.
[7]Girshick R.Fast r-cnn[C]//Proceedings of the IEEE internationalconference on computer vision.2015:1440-1448.
[8]Ren S,He K,Girshick R,et al.Faster r-cnn:Towards real-time objectdetection with region proposal networks[J].Advances in neural informationprocessing systems,2015,28.
[9]Redmon J,Divvala S,Girshick R,et al.You only look once:Unified,real-time object detection[C]//Proceedings of the IEEE conference on computervision and pattern recognition.2016: 779-788.
[10]Liu W,Anguelov D,Erhan D,et al.Ssd:Single shot multibox detector[C]//European conference on computer vision.Springer,Cham,2016:21-37.
[11]Zheng D,Xiangqun L,Xu X.Vehicle and pedestrian detection networkbasedon lightweight SSD[J].Journal of Nanjing Normal University(NaturalScience Edition),2019,42(1):73-81.
[12]Yu J,Jiang Y,Wang Z,et al.Unitbox:An advanced object detectionnetwork[C]//Proceedings of the 24th ACM international conference onMultimedia.2016:516-520.
[13]Rezatofighi H,Tsoi N,Gwak J Y,et al.Generalized intersection overunion:A metric and a loss for bounding box regression[C]//Proceedings of theIEEE/CVF conference on computer vision and pattern recognition.2019:658-666.
[14]Zheng Z,Wang P,Liu W,et al.Distance-IoU loss:Faster and betterlearning for bounding box regression[C]//Proceedings of the AAAI Conferenceon Artificial Intelligence.2020,34(07): 12993-13000.。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (5)

1.一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,其特征在于,该方法将改进的单镜头检测器SSD算法,用于自动扶梯乘客姿势异常检测;将SSD网络的VGG16网络采用Mobilenetv2网络取代;同时,引入并集上的距离交集DIoU损失函数。
2.根据权利要求1所述的一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,其特征在于,所述SSD网络由前端和后端组成,前端为VGG16网络,后端为不同大小的功能层网络,将前端的VGG16网络采用Mobilenetv2网络替代,在Mobilenetv2网络中引入深度可分离卷积和反向残差块,并用线性激活函数替换反向残差块网络结构中的最后一个ReLU6。
3.根据权利要求1所述的一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,其特征在于,SSD算法采用六种不同的特征层来检测不同尺度的目标,即Conv4_3、Conv7、Conv8_2、Conv9_2、Conv10_2、Conv11_2,对应的大小为38×38×512、19×19×1024、10×10×512、5×5×256、3×3×256、1×1×256;SSD算法使用特征金字塔结构进行检测,其中,浅特征层检测小目标,深特征层检测大目标;最后,将多尺度特征层的组合作为分类和回归的基础,进行回归计算和非最大值抑制,并输出最终结果。
4.根据权利要求1所述的一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,其特征在于,SSD算法的目标损失函数是定位损失loc和置信度损失conf的加权和;当训练模型时,一个用于测试正向预测边界框偏移的损失,另一个用于预测边界框类别的损失;SSD算法的损失函数表示如下:
Figure FDA0003751040020000011
其中c代表类别置信度的预测值,l代表先验框对应边界框的位置预测值,g代表地面真值框的位置参数,N代表匹配默认框的数量,α是权重参数,x为指示器参数;
定位损失的计算公式为:
Figure FDA0003751040020000012
其中
Figure FDA0003751040020000013
用作指示器,指示第i个先验边界框和第j个地面真值框是否在k类上匹配;由于
Figure FDA0003751040020000014
的存在,仅对正样本计算位置误差;其中,地面真值框的g应编码为偏移
Figure FDA0003751040020000015
Figure FDA0003751040020000016
为预测框编码值,其公式如下:
Figure FDA0003751040020000017
Figure FDA0003751040020000018
Figure FDA0003751040020000019
Figure FDA0003751040020000021
cx和cy表示预测边界框的坐标,w和h表示预测边界框的大小;
Figure FDA0003751040020000022
分别表示地面真实框与边界框中心偏移量(cx,cy)和其宽度w、高度h的偏移量,
Figure FDA0003751040020000023
表示地面真实框编码值,
Figure FDA0003751040020000024
表示大小比例因子;
位置丢失采用先验边界框L参数与地面真值框g参数之间的smoothL1丢失;smoothL1损失函数的公式如下:
Figure FDA0003751040020000025
置信度损失的计算公式为:
Figure FDA0003751040020000026
Figure FDA0003751040020000027
表示预测框i与真实框j关于类别p匹配,p的概率越高,损失越小;
Figure FDA0003751040020000028
表示预测框没有物体,预测为背景的概率越高,损失越小;
Figure FDA0003751040020000029
表示类别p的第i个边界框的置信度,其计算公式如下:
Figure FDA00037510400200000210
exp(x)函数的返回值为e的x次方,e是自然对数的底;
由于smoothL1损失函数没有考虑坐标之间的相关性,因此采用DIoU损失函数替换smoothL1损失函数,DIoU损失函数公式如下:
Figure FDA00037510400200000211
其中
Figure FDA00037510400200000212
B是预测框,Bgt是地面真值框;b和bgt分别表示B和Bgt的中心点,ρ是欧几里得距离,C是覆盖两个边界框的最小包围盒的对角线长度。
5.根据权利要求1至4任一所述的一种基于改进SSD模型的自动扶梯乘客姿态异常检测方法,其特征在于,该方法应用于扶梯乘客姿势异常检测系统,具体实现如下:
首先,将待检测的视频输入检测系统,从不同的扶梯监控视频序列中提取视频帧,形成一个数据集,并对数据集进行手动标记,记录位置和大小信息;
其次,将标记后的数据集输入优化后的SSD网络进行训练,直到网络收敛,得到能够检测目标的SSD网络;
第三,将从不同特征地图中获得的边界框进行组合,通过非最大值抑制NMS方法抑制重叠或错误的边界框,并生成最终的边界框集即检测结果;
最后,输出检测到的扶梯上的乘客姿势,判断乘客是否处于危险状态,使扶梯及时采取相应的安全防护措施。
CN202210840375.3A 2022-07-18 2022-07-18 一种基于改进ssd模型的自动扶梯乘客姿态异常检测方法 Pending CN115273146A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210840375.3A CN115273146A (zh) 2022-07-18 2022-07-18 一种基于改进ssd模型的自动扶梯乘客姿态异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210840375.3A CN115273146A (zh) 2022-07-18 2022-07-18 一种基于改进ssd模型的自动扶梯乘客姿态异常检测方法

Publications (1)

Publication Number Publication Date
CN115273146A true CN115273146A (zh) 2022-11-01

Family

ID=83767661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210840375.3A Pending CN115273146A (zh) 2022-07-18 2022-07-18 一种基于改进ssd模型的自动扶梯乘客姿态异常检测方法

Country Status (1)

Country Link
CN (1) CN115273146A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116883907A (zh) * 2023-07-26 2023-10-13 中国信息通信研究院 基于帧间相关性的人工智能检测方法和系统
CN117315550A (zh) * 2023-11-29 2023-12-29 南京市特种设备安全监督检验研究院 自动扶梯乘客危险行为的检测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116883907A (zh) * 2023-07-26 2023-10-13 中国信息通信研究院 基于帧间相关性的人工智能检测方法和系统
CN117315550A (zh) * 2023-11-29 2023-12-29 南京市特种设备安全监督检验研究院 自动扶梯乘客危险行为的检测方法
CN117315550B (zh) * 2023-11-29 2024-02-23 南京市特种设备安全监督检验研究院 自动扶梯乘客危险行为的检测方法

Similar Documents

Publication Publication Date Title
CN115273146A (zh) 一种基于改进ssd模型的自动扶梯乘客姿态异常检测方法
CN112200043B (zh) 面向室外施工现场的危险源智能识别系统及方法
He et al. Softer-nms: Rethinking bounding box regression for accurate object detection
CN110765964B (zh) 基于计算机视觉的电梯轿厢内异常行为的检测方法
Salimi et al. Visual-based trash detection and classification system for smart trash bin robot
US20170344832A1 (en) System and method for event monitoring and detection
CN110097028B (zh) 基于三维金字塔图像生成网络的人群异常事件检测方法
CN111626199B (zh) 面向大型多人车厢场景的异常行为分析方法
CN113158983A (zh) 一种基于红外视频序列图像的机场场面活动行为识别方法
CN114283469A (zh) 一种基于改进YOLOv4-tiny的轻量型目标检测方法及系统
CN113743260B (zh) 一种地铁站台密集人流情况下的行人跟踪方法
CN115719475B (zh) 一种基于深度学习的三阶段轨旁设备故障自动检测方法
CN114926422B (zh) 一种上下车客流量检测方法及系统
CN114202803A (zh) 一种基于残差网络的多阶段人体异常动作检测方法
CN114581843B (zh) 一种基于深度学习的扶梯乘客危险行为识别方法
CN113011399B (zh) 基于生成协同判别网络的视频异常事件检测方法及系统
CN115410157A (zh) 一种物料输送巷道异物视觉检测方法
Yi et al. Research on Helmet Wearing Detection in Multiple Scenarios Based on YOLOv5
CN113989179A (zh) 基于目标检测算法的列车轮对踏面缺陷检测方法及系统
Wangli et al. Foxtail Millet ear detection approach based on YOLOv4 and adaptive anchor box adjustment
CN110659630A (zh) 一种基于骨架点轨迹动态分析的视频人体异常行为检测方法
CN113793241B (zh) 一种基于深度学习的铁路突发事件应急情景推演方法
Li et al. Efficient SSD: a real-time intrusion object detection algorithm for railway surveillance
CN113591773A (zh) 基于卷积神经网络的配电室物体检测方法、装置和设备
CN112307896A (zh) 一种社区监控场景下电梯猥亵行为异常检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination