CN110781847A

CN110781847A - 一种基于神经网络动作行为识别的方法

Info

Publication number: CN110781847A
Application number: CN201911047449.2A
Authority: CN
Inventors: 戴道伟; 李正倩; 陈兴来; 曲骏; 王毅
Original assignee: Liaoning Dinghan Qihui Electronic System Engineering Co Ltd
Current assignee: Liaoning Dinghan Qihui Electronic System Engineering Co Ltd
Priority date: 2019-10-30
Filing date: 2019-10-30
Publication date: 2020-02-11

Abstract

本发明公开了一种基于神经网络动作行为识别的方法，具体步骤：采集不同背景下工作人员的动作行为图像信息，将采集到的图像定义为学习样本，对每个学习样本进行标注；对标注的学习样本进行训练获得识别神经网络模型；利用像机捕捉动作行为视频，剔除不在识别范围内的视频帧、剔除动作行为视频中过度模糊、存在歧义、没有做动作行为的视频帧；采用识别神经网络模型进行动作识别，以所述识别神经网络模型为基础，利用图像目标检测方法获取图像中动作行为所分布的区域；根据不同类型的动作行为图像对应的识别精度阈值进行视频帧过滤，获取不同类型动作的精度值最高的视频帧。

Description

一种基于神经网络动作行为识别的方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于神经网络动作行为识别的方法。

背景技术

随着我国铁路发展，铁路运输安全越来越被重视，铁路运输安全问题是现代交通永恒不变的主题。机车乘务员在机车运行中起着核心作用，他直接决定了列车能否正常运行、事故发生等情况，因此对机车乘务员的安全管理成为了重中之重。在实际使用的环境当中，只能通过视频来监视机车乘务员的值乘标准化动作行为，但由于视频所需流量比较大，只能通过专人紧盯或者回放视频来查看被监视乘务员的动作行为，这种方法费时费力，效果很不理想，如何能通过一种自动识别动作行为的方法，把识别后的信息发送给管理者，可以不用派专人或通过视频回放来查看结果，就成为急需解决的问题。

发明内容

根据现有技术存在的问题，本发明公开了一种基于神经网络动作行为识别的方法，具体步骤如下：

采集不同背景下工作人员的动作行为的图像信息，将采集到的图像定义为学习样本，对每个学习样本进行标注；其中工作人员的动作至少包括举拳、剑指、固定位置站立和误判动作；

对标注的学习样本进行训练获得识别神经网络模型；

捕捉工作人员的动作行为视频，剔除不在识别范围内的视频帧，剔除动作行为视频中过度模糊、存在歧义、没有做动作行为的视频帧；

采用识别神经网络模型进行动作识别：以所述识别神经网络模型为基础，利用图像目标检测方法获取图像中动作行为所分布的区域；

设置不同类型的动作行为图像对应的识别精度阈值，根据该阈值对视频帧进行过滤，获取不同类型动作的精度值最高的视频帧。

作为优选的方式：利用图像目标检测方法获取图像中动作行为所分布的区域时采用如下方式：

SP1:利用多尺度特征进行对象检测，在未被标记的数据点中随机选择一个点作为起始中心点x；

SP2:找出以x为中心、将半径为h的区域中出现的所有数据点定义为集合M，设定集合M同属于一个聚类C，同时在该聚类C中记录数据点出现的次数；

SP3:以x为中心点，计算从x开始到集合M中每个元素的向量，将这些向量相加得到新向量，其中新向量计算方式为：

以x为圆心，h为半径做一个高维球,M_h(x)是从x指向质心的向量,n为点的数量，w(x_i)≥0是每一个样本的权重，H是一个正定的对称矩阵，G(x)是一个单位的核函数；

SP4:重复步骤SP2、SP3直到向量的值很小为止；

SP5:如果收敛时当前簇C的x与其它已经存在的簇C2中心的距离小于设定阈值，则将簇C2和前簇C合并，数据点出现次数也对应合并，否则把簇C作为新的聚类；

SP6:重复SP5直到所有的点都已经访问，根据每个类对每个点的访问频率，取访问频率最高的那个类作为当前点集的所属类，每个类即为当前动作行为所存在的区域。

进一步的，所述不同类型的动作行为图像对应的识别精度阈值至少包括

剑指识别精度阈值、齐眉举拳识别精度阈值、固定位置站立识别精度阈值，当对视频帧进行过滤时：剔除小于剑指识别精度阈值的视频帧、剔除小于齐眉举拳识别精度阈值的视频帧、剔除小于固定位置站立识别精度阈值的视频帧以及剔除非识别动作行为的视频帧。

由于采用了上述技术方案，本发明提供的一种基于神经网络动作行为识别的方法，首先采集铁路上工作人员的图像视频信息、剔除不符合要求的视频帧图像、然后再获取图像视频信息中的动作行为所分布的区域，再筛选出精度值最高的视频帧，根据视频帧中动作判断铁路上工作人员的指挥动作是否符合要求，从而明显降低运算时间，且能够综合利用视频图像，显著提高视频动作识别精度。因此本发明中的方法完全可以做到实时跟踪工作人员的指挥动作并进行判断，具有跟踪定位准确、应用性强、节省时间且流程简便的优点,同时较大程度排除了动作行为的非异常动作来提高运算速度，进而提升最终的动作识别准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方法的流程图。

具体实施方式

为使本发明的技术方案和优点更加清楚，下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚完整的描述：

如图1所示的一种基于神经网络动作行为识别的方法，具体包括如下步骤：

S1:采集不同背景下工作人员的动作行为图像信息，将采集到的图像定义为学习样本，对每个学习样本进行标注；其中工作人员的动作至少包括举拳、剑指、固定位置站立和误判动作。

S2:对标注的学习样本进行训练获得识别神经网络模型；

S3:利用像机捕捉动作行为视频，剔除不在识别范围内的视频帧、剔除动作行为视频中过度模糊、存在歧义、没有做动作行为的视频帧；

S4:采用识别神经网络模型进行动作识别，以所述识别神经网络模型为基础，利用图像目标检测方法获取图像中动作行为所分布的区域，具体采用如下方式：

S41：利用多尺度特征进行对象检测，在未被标记的数据点中随机选择一个点作为起始中心点x；

S42：找出以x为中心半径为h的区域中出现的所有数据点，认为这些点同属于一个聚类C。同时在该聚类中记录数据点出现的次数加1。

S43:以x为中心点，计算从x开始到集合M中每个元素的向量，将这些向量相加，得到向量。向量计算公式如下：

以x为圆心，h为半径做一个高维球,M_h(x)是从x指向质心的向量,n为点的数量。w(x_i)≥0是每一个样本的权重，H是一个正定的对称矩阵，G(x)是一个单位的核函数。

S44：重复步骤S42、S43，直到向量的值很小为止；

S45：如果收敛时当前簇C的x与其它已经存在的簇C2中心的距离小于阈值，那么把C2和C合并，数据点出现次数也对应合并。否则把C作为新的聚类。

S46:重复上述步骤，直到所有的点都已经访问，根据每个类，对每个点的访问频率，取访问频率最大的那个类，作为当前点集的所属类，每个类即为当前动作行为所存在的区域。

S5:根据不同类型的动作行为图像对应的识别精度阈值进行视频帧过滤，获取不同类型动作的精度值最高的视频帧。其中具体过程为根据动作行为分类分别从S4中获取的区域类中找到识别精度值最大的视频帧，再把所有的区域获取的视频帧形成图片，形成的图片即为识别的动作行为图片。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于神经网络动作行为识别的方法,其特征在于包括：

对标注的学习样本进行训练获得识别神经网络模型；

2.根据权利要求1所述的方法，其特征还在于：利用图像目标检测方法获取图像中动作行为所分布的区域时采用如下方式：

SP4:重复步骤SP2、SP3直到向量的值很小为止；

3.根据权利要求1所述的方法，其特征还在于：所述不同类型的动作行为图像对应的识别精度阈值至少包括