CN110738163A - 一种矿井人员违规动作识别系统 - Google Patents

一种矿井人员违规动作识别系统 Download PDF

Info

Publication number
CN110738163A
CN110738163A CN201910968606.7A CN201910968606A CN110738163A CN 110738163 A CN110738163 A CN 110738163A CN 201910968606 A CN201910968606 A CN 201910968606A CN 110738163 A CN110738163 A CN 110738163A
Authority
CN
China
Prior art keywords
action
template
algorithm
tested
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910968606.7A
Other languages
English (en)
Inventor
赵小虎
有鹏
黄程龙
张凯
闫坤程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN201910968606.7A priority Critical patent/CN110738163A/zh
Publication of CN110738163A publication Critical patent/CN110738163A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Abstract

本发明涉及一种矿井人员违规动作识别系统,属于行为识别技术领域。该系统包括:动作捕捉模块,用于利用Kinect体感传感器获取矿井人员的人体三维骨骼点数据,并对人体三维骨骼点数据进行均值滤波处理;模板训练模块,用于采用聚类算法对滤波处理后的人体三维骨骼点数据进行训练得到违规动作模板;模板加载模板,用于接收并存储训练得到的违规动作模板;动作识别模块,用于采用分段线性逼近结合自适应权重动态时间规整算法或动态全局规划算法,将待测试的人体三维骨骼点数据与违规动作模板进行比对,若数据一致的帧数不低于指定阈值,则将相应的动作判定为违规动作。本发明解决了目前对矿井人员行为的主流识别方式存在奇异点以及时间复杂度问题。

Description

一种矿井人员违规动作识别系统
技术领域
本发明涉及行为识别技术领域,尤其涉及一种矿井人员违规动作识别系统。
背景技术
煤矿井下是一个环境多变复杂,工作环节较多,作业人员数量较多,设备庞大集中的综合性危险系数较大的产业,每时每刻都可能出现安全隐患,容易发生安全事故。通过对海量的煤矿安全事故案例分析可得,由于煤矿技术原因引起的灾害事故在逐年减少,近些年来发生的重特大事故最根本的原因都是在于作业人员的违规行为,它成为了煤矿灾害事故发生的主要原因。通过从大量的煤矿死亡事故统计中可以发现,80%以上的死亡事故都是由于作业人员的不安全行为所导致的。如今我国绝大部分煤炭企业在井下已经安装了视频监控系统,调度中心的工作人员通过传输到地面上的监控视频查看以及调度井下的生产情况。目前井下作业人员的违规行为还是通过传统的RGB摄像头进行监控,监控的方式还是依靠人工进行监控。这样就会产生两个很突出的问题,第一是随着监控时间的增加,监控人员可能会产生视觉疲劳,由于井下工作人员的违规行为可能只是一瞬间,监控人员可能无法发现违规行为,这样很可能会导致安全事故的发生;第二是由于井下使用传统的RGB摄像头进行视频监控,由于井下某些区域照度极低或是无光源,那么监控人员将根本无法在该区域的监控视频中发现井下工作人员的违规行为,这便产生了矿井安全监控的一个监控盲点。
人体的行为识别总体来说有很多不同种类的识别方式,目前有基于传统视频图像和基于骨骼点两种主流的识别方式。视频图像的识别方式的主要特别之处有,从视频图像中提取出像素点,然后再提取需要的特征,进行特征的降维,使用机器学习的方式获得行为识别结果。而基于骨骼点的识别方式,首先是取出骨骼点数据,然后使用骨骼点数据时空间的变化和骨骼点数据间的数学关系,降维、滤波由描述算子获得的骨骼表示,然后整合成所需的特征向量,最后使用机器学习算法训练得到行为识别结果。目前主流识别方式存在以下缺陷:
第一,井下某些地方照度极低,普通摄像头无法进行违规行为识别。
第二,使用动态时间规整(Dynamic Time Warping,DTW)算法进行违规行为识别,会出现奇异点问题及时间复杂度问题。奇异点问题会影响到识别的准确率,时间复杂度问题会影响到识别的时间。
发明内容
鉴于上述的分析,本发明旨在提供一种矿井人员违规动作识别系统,用以解决目前针对井下作业人员行为的主流识别方式存在奇异点导致识别的准确率降低,以及时间复杂度导致识别时间过长的问题。
本发明的目的主要是通过以下技术方案实现的:
本发明提供了一种矿井人员违规动作识别系统,包括动作捕捉模块、模板训练模块、模板加载模块和动作识别模块;所述动作捕捉模块,包括Kinect体感传感器和滤波处理模块,Kinect体感传感器用于获取矿井人员的人体三维骨骼点数据,滤波处理模块用于对所述人体三维骨骼点数据进行均值滤波处理;所述模板训练模块,用于采用聚类算法对滤波处理后的人体三维骨骼点数据进行训练得到违规动作模板;所述模板加载模板,用于接收并存储训练得到的所述违规动作模板;所述动作识别模块,用于采用分段线性逼近结合自适应权重动态时间规整算法或动态全局规划算法,将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,若数据一致的帧数不低于指定阈值,则将与待测试的人体三维骨骼点数据相应的动作判定为违规动作。
进一步地,所述动作识别模块包括算法切换器、数据比对器、动作判定器;所述算法切换器,用于根据用户需求在分段线性逼近结合自适应权重动态时间规整算法和动态全局规划算法之间进行择一切换;所述数据比对器,用于根据所述算法切换器切换选定的算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对;所述动作判定器,用于根据所述数据比对一致的帧数不低于指定阈值,将与待测试的人体三维骨骼点数据相应的动作判定为违规动作。
进一步地,所述数据对比器采用分段线性逼近结合自适应权重动态时间规整算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,执行的流程包括:通过采用分段线性逼近对原始非线性时间序列进行降维和去噪后得到所述时间序列;通过最小化时间序列的局部距离来判定所述待测试的人体三维骨骼点数据与所述违规动作模板相似性。
进一步地,通过采用分段线性逼近对原始非线性时间序列进行降维和去噪后得到所述时间序列,具体包括:首先将整个原始时间序列近似整合成一条直线,把距离直线最远的点当作划分点,分成两部分后分别合成直线,再次选择最远点作为划分点,分成两部分后,反复进行直到所有部分最远的点小于一定阈值后,根据分段的划分点得到每段时间序列;所述时间序列的公式如下:
Figure BDA0002231332380000031
其中,xa(1≤a≤p)表示第a段分段的时间下标,这其中P代表分段的数目,QPLA是原始非线性时间序列,由每段时间序列线段的起点及终点组成,Si为分段线性逼近后的每段时间序列,1≤i≤P。
进一步地,所述时间序列的局部距离的计算公式如下:
l(pm,dn)=(Msw(pm)-Msw(dn))2
其中,pm为待测试的人体三维骨骼点数据的时间序列,dn为所述违规动作模板的时间序列,Msw为时间序列的梯度信息。
进一步地,所述时间序列的梯度信息的计算公式分别为:
Figure BDA0002231332380000041
其中,max(|Δp|)和max(|Δd|)分别表示时间序列pm和dn中全部时间点的最大梯度,pm-pm-1和dn-dn-1分别表示pm和dn的梯度,m和n分别表示时间序列上的点,x和y分别表示时间序列的长度。
进一步地,所述数据对比器采用动态全局规划算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,执行的流程包括:将全局路径限制的范围由一个静态平行四边形变成一个始终包括起点及终点连线的动态平行四边形,通过最优匹配路径找到待测试的特征矢量和违规动作模板矢量的最大行为相似来完成行为识别。
进一步地,所述静态平行四边形为斜率1/2及2的平行四边形,所述动态平行四边形斜率的大小由待测试的特征矢量与违规动作模板矢量的比值决定。
进一步地,所述待测试的特征矢量长度及违规动作模板矢量长度需满足以下公式:
其中,X为待测试的特征矢量长度,Y为违规动作模板矢量长度,动态平行四边形为斜率a和1/a的平行四边形。
进一步地,所述最优匹配路径在动态平行四边形起点和终点的连线上,第一次动作的特征参数作为待测试的特征矢量,第二次动作的特征参数作为违规动作模板矢量,根据如下公式进行匹配:
Figure BDA0002231332380000052
其中,T1(Aj)和T2(Aj)为部分行为特性Aj相对应的第一次动作的特征参数和第二次动作的特征参数。
本发明技术方案的有益效果:本发明公开了一种矿井人员违规动作识别系统,使用Kinect捕捉人体骨骼图像,并利用人体骨骼点数据训练出违规动作模板矢量,进而使用改进的DTW算法进行违规动作的识别,提出分段线性逼近结合自适应权重动态时间规整算法有效地解决两条时间序列中一条时间序列的一点向另一条时间序列大部分映射的问题,即奇异点问题(简称为PLA-SWDTW),同时提出在全局匹配路径中使用动态全局规划算法使得搜索范围减小,从而减少了时间复杂度问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本现有行为识别模型建立过程示意图;
图2为本发明实施例的一种矿井人员违规动作识别系统结构示意图;
图3为本发明实施例的违规行为识别时奇异点示意图;
图4为本发明实施例的一种矿井人员违规动作识别算法框架图;
图5为本发明实施例的动态平行四边形的斜率a随X/Y变化示意图;
图6为本发明实施例的待测试特征矢量与模板矢量匹配路径示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
本发明的技术基础:Kinect是微软公司在2010年发布的一款拥有强大功能的外部体感捕捉摄像机,Kinect最初在开发阶段曾经使用拉丁语“Natal”的名称,带有初生(To beborn)的意思,展现了微软公司对Kincet在人机交互方面的强大信心。由于Kincet在行为识别领域内展现出了突出优势,可以高效地获取人体的骨骼数据。此外,Kinect还拥有动态实时追踪,物体识别以及音源方向识别等多项功能。所以,它在人体行为识别,跌倒检测以及手势识别领域获得了广泛的应用。2012年2月Kinect for Windows的版本正式发布,并且相应发布了官方正式版的开发包(Kinfor Windows SDK v1.0),由于其强大的深度感知能力以及关节点行为识别能力,引发了人体行为识别研究的新热潮。
人体的行为识别总体来说有很多不同种类的识别方式,目前有基于传统视频图像和基于骨骼点两种主流的识别方式,图1所示为目前行为识别模型建立的过程。视频图像的识别方式的主要特别之处有,从视频图像中提取出像素点,然后再提取需要的特征,进行特征的降维,使用机器学习的方式获得行为识别结果。而基于骨骼点的识别方式,首先是取出骨骼点数据,然后使用骨骼点数据时空间的变化和骨骼点数据间的数学关系,降维、滤波由描述算子获得的骨骼表示,然后整合成所需的特征向量,最后使用机器学习算法训练得到行为识别结果。
本发明技术方案所解决的问题在于:第一,现在的矿井人员违规行为识别,由于某些低照度的原因,会出现监控盲点。但是使用Kinect体感传感器就可以排除该照度的影响,并使用骨骼图像进行违规行为的识别。第二,使用PLA-SWDTW算法可以有效地解决两条时间序列中一条时间序列的一点向令一条时间序列大部分映射的问题,即奇异点问题。使用在全局匹配路径中使用动态时间规划算法可以使得搜索范围减小,从而减少时间复杂度问题。
本发明的一个具体实施例,如图2所示,公开了一种矿井人员违规动作识别系统,包括动作捕捉模块201、模板训练模块202、模板加载模块203和动作识别模块204;所述动作捕捉模块201,包括Kinect体感传感器和滤波处理模块,Kinect体感传感器用于获取矿井人员的人体三维骨骼点数据,滤波处理模块用于对所述人体三维骨骼点数据进行均值滤波处理;所述模板训练模块202,用于采用聚类算法对滤波处理后的人体三维骨骼点数据进行训练得到违规动作模板;所述模板加载模板203,用于接收并存储训练得到的所述违规动作模板;所述动作识别模块204,用于采用分段线性逼近结合自适应权重动态时间规整算法或动态全局规划算法,将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,若数据一致的帧数不低于指定阈值,则将与待测试的人体三维骨骼点数据相应的动作判定为违规动作。
与现有技术相比,本发明实施例能够解决目前技术在照度极低情况下普通摄像头无法进行违规行为识别,以及使用动态时间规整(Dynamic Time Warping,DTW)算法进行违规行为识别时会出现奇异点问题及时间复杂度问题,从而有效避免了奇异点问题影响到识别的准确率,时间复杂度问题影响到识别的时间长度。
需要说明的是,动作识别可以分成两个部分。第一个部分为动作模板训练;第二个部分为测试部分,即动作识别。DTW算法广泛应用于人体行为识别,是最常用的行为识别算法之一。DTW算法属于模板匹配算法,适用于不相同时间序列间的匹配,它是把一个繁杂的全局最优化问题分解成很多局部最优化的问题,求出所有的局部最优化问题的解,最终完成复杂全局最优化问题的最优解。动态时间规整(Dynamic Time Warping,DTW)算法是融合了时间规整以及距离测度,是一种对不同长度的时间序列规整的模板匹配算法。该算法在匹配时需要将待测的特征向量时间序列进行线性调整,使待测信号和模板信号间的匹配度达到最高。
从时间以及空间两个维度来看,DTW中的数值信息应当隶属于空间维度。时间和空间维度信息两者是相互作用的,解决空间维度上偏移或者尺度伸缩问题可以利用时间维度信息的计算去处理,同理时间维度上的偏移及尺度伸缩问题也可以通过计算空间维度信息去解决。目前DTW算法只是考虑了空间维度的信息,而没有考虑时间维度的信息,故它仅仅可以解决时间维度上的偏移以及尺度伸缩问题,空间维度上的偏移将无法解决,这直接导致了奇异点的产生。如图3中所示,b)图是a)图中两个时间序列的DTW映射,从图b)中发现奇异点最明显的是x点和y点。
假设两条时间序列P和D上分别有点pm和dn,两个点在时间序列上的值相等。但是,pm在时间序列的上坡部分,dn在时间序列的下坡部分,又由于两点的距离l(pm,dn)=0,最优的规整路径必经过(pm,dn),这样DTW算法将会把这两点进行映射,但实际上这两点没有存在映射关系。因此,一条时间序列上的其中某点和另一条时间序列上的多个点发生了映射,就是因为这个点和另外一条时间序列的多个点“太近”,把这种现象叫做“奇异点”问题。“奇异点(singularity)”情况是非常典型的一个问题,它对识别结果的影响也较为严重。奇异点问题就是一个时间序列的点映射到另一个时间序列时,一个点映射到多点的情况,这样会导致DTW距离不准确。
此外,动态时间规整算法还有一个十分严重的问题,那就是时间复杂度问题。对于传统的DTW算法,设其时间复杂度为T(xy),x和y代表两个单维时间序列的长度。随着时间序列长度的增加,DTW算法的计算时间就会增加,算法的时间复杂度就会增加。
图4为本发明实施例的矿井人员违规动作识别算法框架图。
本发明的一个具体实施例,结合图2,所述动作识别模块204包括算法切换器、数据比对器、动作判定器;所述算法切换器,用于根据用户需求在分段线性逼近结合自适应权重动态时间规整算法和动态全局规划算法之间进行择一切换;所述数据比对器,用于根据所述算法切换器切换选定的算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对;所述动作判定器,用于根据所述数据比对一致的帧数不低于指定阈值,将与待测试的人体三维骨骼点数据相应的动作判定为违规动作。
需要说明的是,如图4所示,采用聚类算法对Kincet骨骼图像训练得到违规动作模板后,动作识别模块中的算法切换器实现分段线性逼近结合自适应权重动态时间规整算法和动态全局规划算法之间的切换使用:使用分段线性逼近结合自适应权重动态时间规整算法解决奇异点问题或者在全局路径匹配中使用动态全局规划算法解决时间复杂度问题。
本发明的一个具体实施例,结合图4,所述数据对比器采用分段线性逼近结合自适应权重动态时间规整算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,执行的流程包括:通过采用分段线性逼近对原始非线性时间序列进行降维和去噪后得到所述时间序列;通过最小化时间序列的局部距离来判定所述待测试的人体三维骨骼点数据与所述违规动作模板相似性。
需要说明的是,本发明实施例的自适应权重动态时间规整算法(Self-adaptionWeight Dynamic Time Warping,SWDTW)同时兼顾了时间序列的数值信息以及时间信息。定义新的特征Msw(pm)如下式:
Figure BDA0002231332380000101
其中,max(|Δp|)代表了时间序列pm中全部时间点的最大梯度,时间序列中点的梯度用相邻点的差分来表示,即用pm-pm-1表示pm的梯度。max(|Δp|)的用处在于把各个梯度的值限制在[-1,1]之内,方便以比值的形式把梯度信息放入到特征之中。可知,新的特征中同时包含了数值信息以及梯度信息,梯度信息以比值的方式融入到特征中。因为数值信息和梯度信息所产生的偏差,都可以让DTW的距离增大,所以SWDTW的优点就在于可以同时改善时间轴及数值轴上的偏移以及尺度伸缩。在此发现数值信息的比值为1,要大于梯度信息的比值,可以得出数值信息占主要地位,梯度信息为次要地位。因此,SWDTW对数值上比较小的误差不会特别敏感。
从时间维度以及空间维度的方面来分析,数值pm代表的是空间维度的信息,而其pm的梯度代表的是时间维度的信息。由上述新的特征公式可知,对两种维度的信息都考虑在内,并且都可以改善数值轴及时间轴上的偏移以及尺度伸缩。
本发明的一个具体实施例,通过采用分段线性逼近对原始非线性时间序列进行降维和去噪后得到所述时间序列,具体包括:首先将整个原始时间序列近似整合成一条直线,把距离直线最远的点当作划分点,分成两部分后分别合成直线,再次选择最远点作为划分点,分成两部分后,反复进行直到所有部分最远的点小于一定阈值后,根据分段的划分点得到每段时间序列;所述时间序列的公式如下:
Figure BDA0002231332380000111
其中,xa(1≤a≤p)表示第a段分段的时间下标,这其中P代表分段的数目,QPLA是原始非线性时间序列,由每段时间序列线段的起点及终点组成,Si为分段线性逼近后的每段时间序列,1≤i≤P。
需要说明的是,本发明实施例在SWDTW算法的基础上提出了一种把PLA(PiecewiseLinear Approximation,PLA)和SWDTW融合的新算法,将该算法称为PLA-SWDTW。开始先使用PLA对初始的时间序列进行特征提取以及降维,这样可以大大减小初始时间序列的长度,最后在使用SWDTW对处理后的时间序列计算距离,此算法在解决奇异点问题的同时,可以一定程度地减小时间复杂度。分段线性逼近是一种利用分段线性近似的方式对非线性时间序列进行降维和去噪的方法。PLA就是一种对时间序列分段线性表示而且还可以特征提取和降维的方法,它具有计算便捷、提取的特征明显以及原始信息损耗小等特点。
设定非线性时间序列为Q={t1,t2,…,tM},使用PLA进行表示,可得公式如下:
Figure BDA0002231332380000121
其中,xa(1≤a≤p)代表第a段分段的时间下标,这其中p代表分段的数目,QPLA也是一个时间序列,由每段线段的起点及终点组成。
本发明的一个具体实施例,所述时间序列的局部距离的计算公式如下:
l(pm,dn)=(Msw(pm)-Msw(dn))2
其中,pm为待测试的人体三维骨骼点数据的时间序列,dn为所述违规动作模板的时间序列,Msw为时间序列的梯度信息。
本发明的一个具体实施例,所述时间序列的梯度信息的计算公式分别为:
Figure BDA0002231332380000122
其中,max(|Δp|)和max(|Δd|)分别表示时间序列pm和dn中全部时间点的最大梯度,pm-pm-1和dn-dn-1分别表示pm和dn的梯度,m和n分别表示时间序列上的点,x和y分别表示时间序列的长度。也就是说,两个时间序列P和D上分别有点pm和dn,根据新的特征公式分别得到相应时间序列的梯度信息。
本发明的一个具体实施例,结合图4,所述数据对比器采用动态全局规划算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,执行的流程包括:将全局路径限制的范围由一个静态平行四边形变成一个始终包括起点及终点连线的动态平行四边形,通过最优匹配路径找到待测试的特征矢量和违规动作模板矢量的最大行为相似来完成行为识别。
需要说明的是,设定待测试特征矢量的长度为X,模板矢量的长度为Y,最优路径匹配可以动态限定在斜率为a和1/a的动态平行四边形里,以下是a的两种表达方式。
(1)线性变换如式:
Figure BDA0002231332380000131
(2)非线性变换如式:
两式中,b1和b2为加权系数并且有0≤b1≤1,0≤b2≤2。如图5中所示a随着X/Y变化,其中,b1=0.5,b2=1。图5中传统限制代表的是全局路径限制范围为静态平行四边形也就是斜率始终为1/2和2的平行四边形,不随X/Y的变化而改变。
本发明的一个具体实施例,所述静态平行四边形为斜率1/2及2的平行四边形,所述动态平行四边形斜率的大小由待测试的特征矢量与违规动作模板矢量的比值决定。
需要说明的是,本发明实施例对全局路径限制进行改进,用于改善算法的时间复杂度。该新的改进算法是把全局路径限制的范围由一个静态平行四边形变成一个始终包括起点及终点连线的动态平行四边形,静态平行四边形为斜率1/2及2的平行四边形,并且规定动态平行四边形在该斜率为1/2及2的静态平行四边形范围内,且该动态平行四边形斜率的大小是由模板矢量Y及特征矢量X的比值组成。
本发明的一个具体实施例,所述待测试的特征矢量长度及违规动作模板矢量长度需满足以下公式:
Figure BDA0002231332380000141
其中,X为待测试的特征矢量长度,Y为违规动作模板矢量长度,动态平行四边形为斜率a和1/a的平行四边形。
需要说明的是,为了保证DTW算法可以在平行四边形范围内分段计算规整函数,则待测试特征矢量长度X及模板矢量长度Y必须满足以下公式:
Figure BDA0002231332380000142
如图5所示,当1/2≤X/Y≤1时,1/2≤a≤X/Y;当1≤X/Y≤2时,X/Y≤a≤2。因此,动态全局路径限制的范围也就是斜率a和1/a组成的动态平行四边形可以确保始终包含起点和终点的连线,并且始终在斜率为1/2和2构成的静态平行四边形内。
本发明的一个具体实施例,所述最优匹配路径在动态平行四边形起点和终点的连线上,第一次动作的特征参数作为待测试的特征矢量,第二次动作的特征参数作为违规动作模板矢量,根据如下公式进行匹配:
Figure BDA0002231332380000143
其中,T1(Aj)和T2(Aj)为部分行为特性Aj相对应的第一次动作的特征参数和第二次动作的特征参数。
需要说明的是,动态时间规整算法的核心就是找到一个最优匹配路径,找到特征矢量和模板矢量的最大的行为相似性进而完成行为识别。
具体举例来说,人多次重复做同一个动作所产生的动作信号的长度是不一样的。但是现实中人在任意一次做同一个动作时,整体动作速率是没有特别明显变化的,也可以说人在每一次做动作时,同一个动作的行为特性在时间上是均匀分布的。已知“摘安全帽”这个行为可以由“伸手”、“摘帽”和“手放下”三个行为状态构成,设定“摘安全帽”的动作行为特性可大约分成三个部分,分别为A1、A2和A3,其中A1对应“伸手”,A2对应“摘帽”,A3对应“手放下”。同一个人先后完成两次违规行为“摘安全帽”,时间长度分别为T1和T2且T1≠T2,其中第一次做该动作时,行为特性A1、A2和A3分别对应时长T1(A1)、T1(A2)、T1(A3);第二次做该动作时,行为特性A1、A2和A3分别对应时长T2(A1)、T2(A2)、T2(A3),同时满足下式:
Figure BDA0002231332380000151
虽然每次违规行为“摘安全帽”的动作时间长度不可能完全一致,但是基本上都是匀速的,因此它的各部分行为特性与所占的时间长度比值是大致相等的,如下式:
Figure BDA0002231332380000152
将第一次“摘安全帽”的特征参数作为特征矢量,第二次“摘安全帽”的特征参数作为模板矢量,使用该算法进行计算匹配,这“摘安全帽”部分行为特性A1、A2和A3相对应的第一次动作的特征参数和第二次动作的特征参数一定相互匹配,如下式:
Figure BDA0002231332380000161
通过上式可知,所求的最优匹配路径一定在起点和终点的连线之上起伏。如图6表示两段时间信号的特征矢量与对应的模板矢量的匹配路径,从中可以看出最优匹配路径始终在起点和终点的连线上起伏,这是因为动作是一个随机过程,只能满足整体时间轴上的均匀分布,不一定满足局部上的均匀分布。
综上所述,本发明公开了一种矿井人员违规动作识别系统,包括动作捕捉模块、模板训练模块、模板加载模块和动作识别模块;所述动作捕捉模块,包括Kinect体感传感器和滤波处理模块,Kinect体感传感器用于获取矿井人员的人体三维骨骼点数据,滤波处理模块用于对所述人体三维骨骼点数据进行均值滤波处理;所述模板训练模块,用于采用聚类算法对滤波处理后的人体三维骨骼点数据进行训练得到违规动作模板;所述模板加载模板,用于接收并存储训练得到的所述违规动作模板;所述动作识别模块,用于采用分段线性逼近结合自适应权重动态时间规整算法或动态全局规划算法,将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,若数据一致的帧数不低于指定阈值,则将与待测试的人体三维骨骼点数据相应的动作判定为违规动作。本发明实施例为了能更好的将DTW算法应用于矿井人员违规行为识别系统中,提出了一种新的识别系统结构,该系统采用改进的DTW模板训练及动作识别算法,针对DTW算法的两个典型缺点,即奇异点和时间复杂度问题,采用了算法切换器,用于切换分段线性逼近结合自适应权重动态时间规整算法和动态全局规划算法,这两种改进算法改善了这两类典型缺点,有效避免了奇异点问题影响到识别的准确率以及时间复杂度问题影响到识别的时间长度。
本领域技术人员可以理解,实现上述实施例中方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种矿井人员违规动作识别系统,其特征在于,包括动作捕捉模块、模板训练模块、模板加载模块和动作识别模块;
所述动作捕捉模块,包括Kinect体感传感器和滤波处理模块,Kinect体感传感器用于获取矿井人员的人体三维骨骼点数据,滤波处理模块用于对所述人体三维骨骼点数据进行均值滤波处理;
所述模板训练模块,用于采用聚类算法对滤波处理后的人体三维骨骼点数据进行训练得到违规动作模板;
所述模板加载模板,用于接收并存储训练得到的所述违规动作模板;
所述动作识别模块,用于采用分段线性逼近结合自适应权重动态时间规整算法或动态全局规划算法,将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,若数据一致的帧数不低于指定阈值,则将与待测试的人体三维骨骼点数据相应的动作判定为违规动作。
2.根据权利要求1所述的系统,其特征在于,所述动作识别模块包括算法切换器、数据比对器、动作判定器;
所述算法切换器,用于根据用户需求在分段线性逼近结合自适应权重动态时间规整算法和动态全局规划算法之间进行择一切换;
所述数据比对器,用于根据所述算法切换器切换选定的算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对;
所述动作判定器,用于根据所述数据比对一致的帧数不低于指定阈值,将与待测试的人体三维骨骼点数据相应的动作判定为违规动作。
3.根据权利要求2所述的系统,其特征在于,所述数据比对器采用分段线性逼近结合自适应权重动态时间规整算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,执行的流程包括:通过采用分段线性逼近对原始非线性时间序列进行降维和去噪后得到所述时间序列;通过最小化时间序列的局部距离来判定所述待测试的人体三维骨骼点数据与所述违规动作模板相似性。
4.根据权利要求3所述的系统,其特征在于,通过采用分段线性逼近对原始非线性时间序列进行降维和去噪后得到所述时间序列,具体包括:首先将整个原始时间序列近似整合成一条直线,把距离直线最远的点当作划分点,分成两部分后分别合成直线,再次选择最远点作为划分点,分成两部分后,反复进行直到所有部分最远的点小于一定阈值后,根据分段的划分点得到每段时间序列;所述时间序列的公式如下:
Figure FDA0002231332370000021
其中,xa(1≤a≤p)表示第a段分段的时间下标,这其中P代表分段的数目,QPLA是原始非线性时间序列,由每段时间序列线段的起点及终点组成,Si为分段线性逼近后的每段时间序列,1≤i≤P。
5.根据权利要求4所述的系统,其特征在于,所述时间序列的局部距离的计算公式如下:
l(pm,dn)=(Msw(pm)-Msw(dn))2
其中,pm为待测试的人体三维骨骼点数据的时间序列,dn为所述违规动作模板的时间序列,Msw为时间序列的梯度信息。
6.根据权利要求5所述的系统,其特征在于,所述时间序列的梯度信息的计算公式分别为:
其中,max(|Δp|)和max(|Δd|)分别表示时间序列pm和dn中全部时间点的最大梯度,pm-pm-1和dn-dn-1分别表示pm和dn的梯度,m和n分别表示时间序列上的点,x和y分别表示时间序列的长度。
7.根据权利要求2所述的系统,其特征在于,所述数据比对器采用动态全局规划算法将待测试的人体三维骨骼点数据与所述违规动作模板进行比对,执行的流程包括:将全局路径限制的范围由一个静态平行四边形变成一个始终包括起点及终点连线的动态平行四边形,通过最优匹配路径找到待测试的特征矢量和违规动作模板矢量的最大行为相似来完成行为识别。
8.根据权利要求7所述的系统,其特征在于,所述静态平行四边形为斜率1/2及2的平行四边形,所述动态平行四边形斜率的大小由待测试的特征矢量与违规动作模板矢量的比值决定。
9.根据权利要求8所述的系统,其特征在于,所述待测试的特征矢量长度及违规动作模板矢量长度需满足以下公式:
Figure FDA0002231332370000031
其中,X为待测试的特征矢量长度,Y为违规动作模板矢量长度,动态平行四边形为斜率a和1/a的平行四边形。
10.根据权利要求7所述的系统,其特征在于,所述最优匹配路径在动态平行四边形起点和终点的连线上,第一次动作的特征参数作为待测试的特征矢量,第二次动作的特征参数作为违规动作模板矢量,根据如下公式进行匹配:
其中,T1(Aj)和T2(Aj)为部分行为特性Aj相对应的第一次动作的特征参数和第二次动作的特征参数。
CN201910968606.7A 2019-10-12 2019-10-12 一种矿井人员违规动作识别系统 Pending CN110738163A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910968606.7A CN110738163A (zh) 2019-10-12 2019-10-12 一种矿井人员违规动作识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910968606.7A CN110738163A (zh) 2019-10-12 2019-10-12 一种矿井人员违规动作识别系统

Publications (1)

Publication Number Publication Date
CN110738163A true CN110738163A (zh) 2020-01-31

Family

ID=69268793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910968606.7A Pending CN110738163A (zh) 2019-10-12 2019-10-12 一种矿井人员违规动作识别系统

Country Status (1)

Country Link
CN (1) CN110738163A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881867A (zh) * 2020-08-03 2020-11-03 北京融链科技有限公司 视频分析方法及装置、电子设备
CN112861696A (zh) * 2021-02-01 2021-05-28 电子科技大学中山学院 一种异常行为识别方法、装置、电子设备及存储介质
CN113111844A (zh) * 2021-04-28 2021-07-13 中德(珠海)人工智能研究院有限公司 一种作业姿态评估方法、装置、本地终端及可读存储介质
CN113539383A (zh) * 2021-06-02 2021-10-22 中南大学 基于动态多目标优化和模糊多属性决策的除铜过程控制方法
CN115034280A (zh) * 2022-03-16 2022-09-09 宁夏广天夏科技股份有限公司 矿井下人员不安全行为检测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110230987A1 (en) * 2010-03-11 2011-09-22 Telefonica, S.A. Real-Time Music to Music-Video Synchronization Method and System
CN104750397A (zh) * 2015-04-09 2015-07-01 重庆邮电大学 一种基于体感的虚拟矿井自然交互方法
CN107392098A (zh) * 2017-06-15 2017-11-24 北京小轮科技有限公司 一种基于人体骨架信息的动作完成度识别方法
CN107908288A (zh) * 2017-11-30 2018-04-13 沈阳工业大学 一种面向人机交互的快速人体动作识别方法
CN109460702A (zh) * 2018-09-14 2019-03-12 华南理工大学 基于人体骨架序列的乘客异常行为识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110230987A1 (en) * 2010-03-11 2011-09-22 Telefonica, S.A. Real-Time Music to Music-Video Synchronization Method and System
CN104750397A (zh) * 2015-04-09 2015-07-01 重庆邮电大学 一种基于体感的虚拟矿井自然交互方法
CN107392098A (zh) * 2017-06-15 2017-11-24 北京小轮科技有限公司 一种基于人体骨架信息的动作完成度识别方法
CN107908288A (zh) * 2017-11-30 2018-04-13 沈阳工业大学 一种面向人机交互的快速人体动作识别方法
CN109460702A (zh) * 2018-09-14 2019-03-12 华南理工大学 基于人体骨架序列的乘客异常行为识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周炳良: "非特定人孤立词语音识别算法研究", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *
沈静逸: "基于DTW和LMNN的多维时间序列相似性分析方法", 《中国优秀博硕士学位论文全文数据库(硕士) 基础科学辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881867A (zh) * 2020-08-03 2020-11-03 北京融链科技有限公司 视频分析方法及装置、电子设备
CN112861696A (zh) * 2021-02-01 2021-05-28 电子科技大学中山学院 一种异常行为识别方法、装置、电子设备及存储介质
CN112861696B (zh) * 2021-02-01 2023-08-18 电子科技大学中山学院 一种异常行为识别方法、装置、电子设备及存储介质
CN113111844A (zh) * 2021-04-28 2021-07-13 中德(珠海)人工智能研究院有限公司 一种作业姿态评估方法、装置、本地终端及可读存储介质
CN113111844B (zh) * 2021-04-28 2022-02-15 中德(珠海)人工智能研究院有限公司 一种作业姿态评估方法、装置、本地终端及可读存储介质
CN113539383A (zh) * 2021-06-02 2021-10-22 中南大学 基于动态多目标优化和模糊多属性决策的除铜过程控制方法
CN115034280A (zh) * 2022-03-16 2022-09-09 宁夏广天夏科技股份有限公司 矿井下人员不安全行为检测系统

Similar Documents

Publication Publication Date Title
CN110738163A (zh) 一种矿井人员违规动作识别系统
CN102831439B (zh) 手势跟踪方法及系统
CN110807422A (zh) 一种基于深度学习的自然场景文本检测方法
US10445602B2 (en) Apparatus and method for recognizing traffic signs
CN109871780B (zh) 一种人脸质量判决方法、系统及人脸识别方法、系统
CN105518744A (zh) 行人再识别方法及设备
CN102422325B (zh) 用于识别对象及另一低级别对象的模式识别装置及其方法
CN110796018B (zh) 一种基于深度图像和彩色图像的手部运动识别方法
KR20070034966A (ko) 정보 처리 장치 및 그 제어방법
CN109145766A (zh) 模型训练方法、装置、识别方法、电子设备及存储介质
CN112036260B (zh) 一种自然环境下多尺度子块聚合的表情识别方法及系统
CN111462140B (zh) 一种基于区块拼接的实时图像实例分割方法
CN114758288A (zh) 一种配电网工程安全管控检测方法及装置
CN112085701A (zh) 一种人脸模糊度检测方法、装置、终端设备及存储介质
CN114937285B (zh) 动态手势识别方法、装置、设备及存储介质
CN114445853A (zh) 一种视觉手势识别系统识别方法
Zhang et al. Facial component-landmark detection with weakly-supervised lr-cnn
CN111368637B (zh) 一种基于多掩模卷积神经网络的搬运机器人识别目标方法
CN113297956A (zh) 一种基于视觉的手势识别方法及系统
Wang et al. Single shot multibox detector with deconvolutional region magnification procedure
Axyonov et al. Method of multi-modal video analysis of hand movements for automatic recognition of isolated signs of Russian sign language
CN113076916B (zh) 基于几何特征加权融合的动态人脸表情识别方法及系统
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
CN115690514A (zh) 图像识别方法及相关设备
CN114764941A (zh) 一种表情识别方法、装置以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination