CN112528817B

CN112528817B - 一种基于神经网络的巡检机器人视觉检测及跟踪方法

Info

Publication number: CN112528817B
Application number: CN202011409502.1A
Authority: CN
Inventors: 宋永端; 黄力; 谈世磊; 赖俊峰; 刘欢; 蒋自强; 张�杰; 陈欢; 吴将娱; 龙鸿; 胡芳; 胡琴
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2020-12-04
Filing date: 2020-12-04
Publication date: 2024-03-19
Anticipated expiration: 2040-12-04
Also published as: CN112528817A; US20220180090A1; US11462053B2

Abstract

本发明公开了一种基于神经网络的巡检机器人视觉检测及跟踪方法，其包括步骤：1)机器人在移动过程中采集动态背景的环境图像；2)将采集到的图像进行预处理；3)在机器人本体上完成图像中人体目标和特定行为的检测，并保存满足特定行为的人体目标的大小、位置信息和特征；4)运用目标跟踪算法并控制机器人云台朝向使得特定目标始终位于图像中心位置；5)控制机器人运动跟随跟踪对象。本发明基于神经网络的巡检机器人视觉检测及跟踪方法，具有很强的自适应能力，在动态背景的场景下，对目标有较好的检测与跟踪效果，具有较高可靠性和鲁棒性。

Description

一种基于神经网络的巡检机器人视觉检测及跟踪方法

技术领域

本发明涉及智能机器人技术领域，特别涉及一种巡检机器人视觉检测及跟踪方法。

背景技术

随着神经网络和机器人技术的快速发展，智能自主巡检机器人的研发和应用逐渐成为可能。传统人工巡检需要大量的人力，并且要求巡检人员时刻保持高度的注意力，对于大型的室内外场景，存在着各种不可控的因素，突发事件的不确定性，暴露出人工巡检方式固有的低效率高风险的缺点。因此开发一款能够自主巡检以及辅助人工巡检的智能巡检机器人就显得格外重要。

对于安全性和保密性较高的应用场景，要求智能巡检机器人不仅能完成既定区域的巡检，还需要能够辨识区域场景中的人员信息和行为，及时发现非法或有重大风险行为的人员并对其进行稳定跟踪，例如在禁止吸烟区域吸烟以及未按照要求着装等行为的人员，并上报异常信息，能够及时有效地避免危害安全和保密行为的发生，相较于事后查看监控溯源的方式更加节省人力和资源。

目前巡检机器人视觉跟踪的方法大部分采用机器人本体采集图像信息，上传服务器端进行信息处理的形式，并不能很好的利用机器人搭载的经济高性能的处理器，导致资源的浪费和稳定性、实时性的下降。同时传统的用于巡检机器人的人员跟踪算法高度依赖环境光照等因素的稳定性，人体被短时间遮挡时算法就会失效，并且对于人体外观的形变和快速移动鲁棒性较低。

发明内容

有鉴于此，本发明的目的是一种基于神经网络的巡检机器人视觉检测及跟踪方法，以解决让巡检机器人能够快速准确地检测出特定行为以及人体目标，提高机器人视觉跟踪的可靠性和鲁棒性等技术问题。

本发明基于神经网络的巡检机器人视觉检测及跟踪方法，包括步骤：

1)机器人在巡检移动过程中使用摄像头采集环境动态图像；

2)使用机器人搭载的嵌入式系统对视频图像进行预处理；

其特征在于：还包括以下步骤：

3)使用目标检测算法构建目标检测器，将预处理后的图像传入目标检测器，目标检测器对图像中人体和特定行为进行检测，对满足特定行为的人体目标记录人体深度特征以及人体大小和位置信息；

4)使用目标跟踪算法构建目标跟踪器，调用目标跟踪器跟踪图像中满足特定行为的人体目标，并控制机器人摄像头云台转动角度θ，使得跟踪对象能够时刻处于图像的中心位置，并开启测距传感器获取跟踪对象与机器人相隔位置d；如果存在多个满足特定行为的人体目标，选择人体检测框最大并且行为危险程度最高的人体目标作为跟踪对象，以行为危险程度为优先考量准则；

5)使用机器人搭载的运动控制器控制机器人运动跟随跟踪对象；

6)当跟踪目标长时间消失在画面中时，重置目标检测器和跟踪器，并删除人体目标，复位摄像头云台的位置。

进一步，在步骤2)中，使用机器人搭载的嵌入式系统对视频图像进行预处理，压缩图片尺寸为608*608，通道数为3的RGB格式。

进一步，在步骤3)中，所述的目标检测算法为yolov4算法；

在步骤4)中，所述的目标跟踪算法包括：

上式中：f_s(x_i)是KCF核相关滤波算法使得样本x_i与其目标y_s的均方差尽可能小的线性回归函数，λ是正则化参数，其作用是控制过拟合，w是分类器参数；

通过核函数将样本x_i投影到高维特征空间，KCF算法的岭回归中的分类器参数w在高维空间表示为：

其中，是映射函数，用来将样本x_i映射到高维特征空间，将求解w的问题转为求解分类器系数α的问题；分类器系数α＝{α₁，α₂，...，α_i，...}。同时核函数具有如下形式：

对基于最小二乘法给出的岭回归的解进行傅里叶变换，得到下式：

其中为生成向量，是训练样本x_i的核矩阵K＝[K_ij]_n×n的第一行，其中K_ij＝k(x_i，x_j)，i，j＝1，2，...，n，y是所有样本x_i对应的期望y_s组成的集合，F(α)和F(y)分别表示系数α和期望集合y的离散傅里叶变换。

测试样本z＝{z₁，z₂，...，z_n}是当前目标位置使用循环移位产生的样本，由样本x_i和样本z_i构造核矩阵K^z＝[k(x_i，z_j)]，其中i，j＝1，2，...，n。

将核矩阵K^z进行傅里叶变换得到对角矩阵的形式，并代入回归函数f_s(x_i)当中，计算所有由测试样本z_i构造而成的候选样本响应具有如下形式：

其中是核矩阵K^z的生成向量；构造32维HOG和11维CN特征组合成高维的新特征，通过PCA算法将高维的新特征降维成低维特征L_down以加速跟踪算法确保运算的实时性；将特征L_down带入式：/>和，得到人工特征响应/>

使用Densenet卷积神经网络提取满足特定行为的人体目标的深度特征，将Densenet各层卷积输出特征带入式：/>中，得到每层的深度特征响应/>其中i＝1，2，……n，表示卷积层的顺序；进而得到一组响应特征图的集合用/>表示第k层的目标预测位置，由于前一层的响应受到后一层响应的影响，因此第k-1层的目标预测位置表示为/>其中μ为正则化参数，深度特征响应/>

综合人工特征响应和深度特征响应/>确定响应图的最优分布，其中最大值的元素对应区域即为跟踪对象：

对于上一帧中出现的跟踪对象，当前帧中的预测位置由上述基于人工特征响应和深度特征响应的相关滤波器的最大响应图确定，跟踪对象在当前帧中的位置p如下所示，其中p_l为上一帧中跟踪对象的位置，W和H分别为图像的宽、高像素：

进一步，在步骤3)中，还包括对人体目标的人脸进行检测，保存检测成功的人脸图片和Facenet128维人脸特征至数据库。

进一步，在步骤2)中对视频图像进行预处理还包括将采集的视频图像划分为若干固定长度帧，在步骤3)中对固定长度帧的头帧调用目标检测算法，在步骤4中)对固定长度帧的后续帧调用目标跟踪算法完成人体目标的视觉跟踪

本发明的有益效果：

1、本发明基于神经网络的巡检机器人视觉检测及跟踪方法，通过YOLOV4算法实现图像中人体对象的检测与定位，无需借助特殊标定物，能够检测特定行为的发生，并结合基于改进KCF的跟踪器实现巡检机器人的视觉跟踪，能够检测和定位具有特定行为的人员，确保作业环境的安全和规范，能提高巡检机器人视觉检测及跟踪的可靠性和鲁棒性，并能够降低机器人视觉跟踪对光照等环境的依赖程度。

2、本发明基于神经网络的巡检机器人视觉检测及跟踪方法，在机器人本体上完成图像中人体目标和特定行为的检测，不将采集的图像信息上传到服务器端处理，避免了资源的浪费，同时有利于提高视觉跟踪的稳定性、实时性。

3、本发明基于神经网络的巡检机器人视觉检测及跟踪方法，其不会因为人体被短时间遮挡时算法就会失效，并且对于人体外观的形变和快速移动鲁棒性较高。

附图说明

图1是基于神经网络的巡检机器人视觉检测及跟踪方法的实施流程图；

图2是YOLOv4结构图。

图3是改进KCF跟踪算法流程图。

具体实施方式

下面结合附图和实施例对本发明作进一步描述。

本实施例基于神经网络的巡检机器人视觉检测及跟踪方法，包括步骤：

1)机器人在巡检移动过程中使用摄像头采集环境动态图像。

2)使用机器人搭载的嵌入式系统对视频图像进行预处理。本实施例中具体为使用机器人搭载的Jetson Xavier NX嵌入式系统对视频图像进行预处理，压缩图片尺寸为608*608，通道数为3的RGB格式。嵌入式系统搭载Ubuntu16.04系统，调用OpenCV库中的函数使用Python语言进行图像操作。

3)使用目标检测算法构建目标检测器，将预处理后的图像传入目标检测器，目标检测器对图像中人体和特定行为进行检测，对满足特定行为的人体目标记录人体深度特征以及人体大小和位置信息。本实施例中具体使用yolov4算法构建目标检测器完成图像中人体以及特定行为的检测，当检测到特定行为时，目标检测器将会记录该人员的人体深度特征以及人体大小、位置等信息。当然在具体实施中还可同时对目标人脸进行检测，保存检测成功的人脸图片和Facenet128维人脸特征至数据库。

在具体实施中，yolov4算法在高性能主机上使用数据集完成离线监督训练，针对不同特定行为的独特性，所述的特定行为包括但不限于翻越围栏、抽烟、未按照规定佩戴口罩、安全帽等行为，通过人工的方式在训练集中对人体和不同的特定行为进行逐一标注，然后载入yolov4算法进行训练，输入像素大小为608*608的图片，yolov4将会提取三个特征层，输出尺寸分别为19*19、38*38以及76*76，通过三个尺度特征上的解码即可用于检测和定位具有相应行为的目标，完成训练后将获得的h5权值文件部署在Jetson Xavier NX嵌入式系统中。同时为了提高检测与跟踪的实时性和鲁棒性，本实施例在步骤2)中还将采集的视频图像划分为若干固定长度帧，在固定长度帧的头帧调用yolov4算法，后续帧调用目标跟踪算法完成特定人体目标的视觉跟踪。

4)使用目标跟踪算法构建目标跟踪器，调用目标跟踪器跟踪图像中满足特定行为的人体目标，并控制机器人摄像头云台转动角度θ，使得跟踪对象能够时刻处于图像的中心位置，并开启测距传感器获取跟踪对象与机器人相隔位置d，测距传感器可采用激光传感器或超声波传感器；如果存在多个满足特定行为的人体目标，选择人体检测框最大并且行为危险程度最高的人体目标作为跟踪对象，以行为危险程度为优先考量准则。

本步骤4)中，所述的目标跟踪算法包括：

其中，是映射函数，用来将样本x_i映射到高维特征空间，将求解w的问题转为求解分类器系数α的问题；分类器系数α＝{α₁,α₂,…,α_i,…}。同时核函数具有如下形式：

其中是核矩阵K^z的生成向量；构造32维HOG和11维CN特征组合成高维的新特征，通过PCA算法将高维的新特征降维成低维特征L_down以加速跟踪算法确保运算的实时性；将特征L_down带入式：/>中，得到人工特征响应/>

使用Densenet卷积神经网络提取满足特定行为的人体目标的深度特征，深层特征能够提取更丰富的语义信息，对人体的遮挡和形变有一定的鲁棒性，同时浅层特征能够提供丰富的局部特征，因此将Densenet各层卷积输出特征带入式：/>中，得到每层的深度特征响应/>其中i＝1，2，……n，表示卷积层的顺序；进而得到一组响应特征图的集合/>用/>表示第k层的目标预测位置，由于前一层的响应受到后一层响应的影响，因此第k-1层的目标预测位置表示为其中μ为正则化参数，深度特征响应/>

在具体实施中，当出现视觉跟踪的人体目标短时间消失时，需要开启目标检测器检测图像中所有目标，并且用跟踪目标历史特征进行匹配识别，匹配成功即输出跟踪结果继续跟踪过程，如图3所示。

5)使用机器人搭载的运动控制器控制机器人运动跟随跟踪对象。在具体实施中运动控制器可根据机器人上搭载的测距模块检测距离与跟踪对象的距离，并控制机器人行走速度以使跟踪距离保持在设定范围内。

6)当跟踪目标由于遮挡等原因长时间消失在画面中时，重置目标检测器和跟踪器，并删除人体目标，复位摄像头云台的位置。

本实施例中基于神经网络的巡检机器人视觉检测及跟踪方法，使用基于卷积神经网络的yolov4算法实现图像中人体对象的检测与定位，无需借助特殊标定物，能够检测特定行为的发生，结合基于改进KCF的跟踪器实现巡检机器人的视觉跟踪。本发明基于神经网络的巡检机器人视觉检测及跟踪方法，能够降低机器人视觉跟踪对光照等环境的依赖程度，能够检测和定位具有特定行为的人员，确保作业环境的安全和规范，提高了巡检机器人视觉跟踪的可靠性和鲁棒性。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于神经网络的巡检机器人视觉检测及跟踪方法，包括步骤：

1)机器人在巡检移动过程中使用摄像头采集环境动态图像；

2)使用机器人搭载的嵌入式系统对视频图像进行预处理；

其特征在于：还包括以下步骤：

3)使用目标检测算法构建目标检测器，将预处理后的图像传入目标检测器，目标检测器对图像中人体和特定行为进行检测，对满足特定行为的人体目标记录人体深度特征以及人体大小和位置信息；所述的目标检测算法为yolov4算法；

4)使用目标跟踪算法构建目标跟踪器，调用目标跟踪器跟踪图像中满足特定行为的人体目标，并控制机器人摄像头云台转动角度θ，使得跟踪对象能够时刻处于图像的中心位置，并开启测距传感器获取跟踪对象与机器人相隔位置d；如果存在多个满足特定行为的人体目标，选择人体检测框最大并且行为危险程度最高的人体目标作为跟踪对象，以行为危险程度为优先考量准则；所述的目标跟踪算法包括：

上式中：f_s(x_i)是KCF核相关滤波算法使得样本x_i与其目标y_s的均方差尽可能小的线性回归函数；λ是正则化参数，其作用是控制过拟合；w是分类器参数；

其中，是映射函数，用来将样本x_i映射到高维特征空间，将求解w的问题转为求解分类器系数α的问题；分类器系数α＝{α₁,α₂,…,α_i,…}；同时核函数具有如下形式：

对基于最小二乘法给出的岭回归的解进行离散傅里叶变换，得到下式：

其中为生成向量，是训练样本x_i的核矩阵K＝[K_ij]_n×n的第一行，其中K_ij＝k(x_i,x_j)，i,j＝1,2,…,n，y是所有样本x_i对应的期望y_s组成的集合，F(α)和F(y)分别表示系数α和期望集合y的离散傅里叶变换；

测试样本z＝{z₁,z₂,…,z_n}是当前目标位置使用循环移位产生的样本，由样本x_i和样本z_i构造核矩阵K^z＝[k(x_i,z_j)]，其中i,j＝1,2,…,n；

使用Densenet卷积神经网络提取满足特定行为的人体目标的深度特征，将Densenet各层卷积输出特征带入式：/>中，得到每层的深度特征响应/>其中i＝1,2，……n，表示卷积层的顺序；进而得到一组响应特征图的集合用/>表示第k层的目标预测位置，由于前一层的响应受到后一层响应的影响，因此第k-1层的目标预测位置表示为/>其中μ为正则化参数，深度特征响应/>

2.根据权利要求1所述的基于神经网络的巡检机器人视觉检测及跟踪方法，其特征在于：在步骤2)中，使用机器人搭载的嵌入式系统对视频图像进行预处理，压缩图片尺寸为608*608，通道数为3的RGB格式。

3.根据权利要求1所述的基于神经网络的巡检机器人视觉检测及跟踪方法，其特征在于：在步骤3)中，还包括对人体目标的人脸进行检测，保存检测成功的人脸图片和Facenet128维人脸特征至数据库。

4.根据权利要求1所述的基于神经网络的巡检机器人视觉检测及跟踪方法，其特征在于：在步骤2)中对视频图像进行预处理还包括将采集的视频图像划分为若干固定长度帧，在步骤3)中对固定长度帧的头帧调用目标检测算法，在步骤4中)对固定长度帧的后续帧调用目标跟踪算法完成人体目标的视觉跟踪。