CN109859158A

CN109859158A - 一种基于视觉的工作区域边界的检测系统、方法及机器设备

Info

Publication number: CN109859158A
Application number: CN201811428294.2A
Authority: CN
Inventors: 吴一飞; 张伟; 鲍鑫亮
Original assignee: Bang Bang Electronic Technology (shanghai) Co Ltd
Current assignee: Bang Bang Electronic Technology (shanghai) Co Ltd
Priority date: 2018-11-27
Filing date: 2018-11-27
Publication date: 2019-06-07
Also published as: US20220036562A1; WO2020107687A1

Abstract

本发明公开了一种基于视觉的工作区域边界的检测系统、方法及机器设备，本方案在实现时，首先将构建的神经网络模型基于训练数据集进行自主训练学习，提取和学习相应的工作区域特征；接着将完成训练学习的神经网络模型基于训练学习提取的工作区域特征对采集的视频图像进行实时的图像语义分割，由此来感知环境，并识别工作区域的边界。本发明提供的方案基于神经网络的机器视觉技术，通过前期对工作区域特征的提取和学习，能够高效的识别出工作区域的边界，对光照等环境的变化具有较强的鲁棒性。

Description

一种基于视觉的工作区域边界的检测系统、方法及机器设备

技术领域

本发明涉及机器视觉技术，具体涉及基于机器视觉的工作区域边界检测技术。

背景技术

随着机器视觉的发展和普及，越来越多的自主工作机器人使用机器视觉来感知周围的环境和工作区域，比如说植保无人机，物流仓储机器人，电力巡检机器人，厂区安防机器人，园林草坪修剪机器人等。而在这些自主机器人工作时，由于技术的限制，经常出现机器人驶出特定的工作区域，给其他区域造成了一定的风险和安全隐患。其中主要原因是现有的机器视觉技术不能实时的，准确的检测出工作区域的边界。

现有通过机器视觉技术来检测工作区域边界方案，主要采用的方法是颜色匹配法和形状分割法。这样的方式在实现过程中存在对光照等环境变化敏感，识别准确率不高等问题；同时这样的方案很难达到实时检测，需要高昂的硬件支持，性价比不高。如此问题，造成现有自主工作机器人感知周围环境和/或工作区域的精度差，大大影响整个自主工作机器人的性能。

发明内容

针对现有自主工作机器人所采用的检测工作区域边界方案所存在问题，需要一种高精度的工作区域边界检测方案。

为此，本发明的目的在于提供一种基于视觉的工作区域边界的检测系统，并据此进一步提供一种工作区域边界的检测方法以及采用该工作区域边界检测方案的机器设备。

为了达到上述目的，本发明提供的基于视觉的工作区域边界的检测系统，包括处理器，以及存储有计算机程序的计算机可读介质，所述计算机程序被处理器执行时：

构建的神经网络模型基于训练数据集进行自主训练学习，提取和学习相应的工作区域特征；

完成训练学习的神经网络模型基于训练学习提取的工作区域特征对采集的视频图像进行实时的图像语义分割，由此来感知环境，并识别工作区域的边界。

进一步的，所述检测系统中的神经网络模型包括多层卷积层，池化层以及输出层，所述多层卷积层与池化层进行堆叠，完成图像特征提取所述输出层在神经网络模型训练学习阶段更新参数，并在模型部署和实时语义分割阶段输出图片分割结果后的图像。

进一步的，所述池化层对多层卷积层的输出特征进行特征统计和数据降维，沿图像行和列的方向上进行统计，抽取N个像素的最大值作为该区域的统计特征，同时将数据量降维到原来的N分之一。

进一步的，所述神经网络模型中还包括空洞卷积层，所述空洞卷积层由若干空洞卷积子层之间并列形成，并设置在池化层之后，通过空洞卷积提取元素中间有相同的间隙，以扩大特征提取的视野，保留图像全局信息。

进一步的，所述神经网络模型中还设置有上采样单元层，该上采样单元层设置在输出层前，通过连续上采样层对降维后的图像抽象内容进行升维，对图像细节内容进行恢复。

为了达到上述目的，本发明提供的基于视觉的工作区域边界的检测方法，包括：

构建的神经网络模型基于训练数据集进行自主训练学习，提取和学习相应工作区域特征；

进一步的，通过获取室外真实工作场景的图片并对图片进行预处理，根据目标对象的类别分割图片制作形成训练数据集。

进一步的，神经网络模型通过训练数据集进行训练，主要包括：

初始化，确定神经网络模型中的神经网络层数和每一层网络的初始参数；

将训练数据集中的图像输入初始化的神经网络模型中进行参数计算；

将输出结果与图像标签进行比对，计算得到神经网络参数的更新值，并更新神经网络模型中相关的参数；

重复上述步骤直到效果最佳，完成神经网络模型训练。

进一步的，所述检测方法在对实时采集的视频图像进行图像语义分割，识别工作区域边界时，包括：

经过训练的深度神经网络模型对实时采集的视频图像进行特征提取；

深度神经网络模型对提取的特征数据进行数据统计及降维；

深度神经网络模型通过模型推理输出图片分割图像。

进一步的，所述深度神经网络模型进行模型推理时，针对实时输入的图像计算图像中每个像素点属于训练集中各类别的概率，将该像素点标记为最大概率的类别，据此完成图像中所有像素点标记，得到对应的分割图像。

进一步的，在通过模型推理形成分割图像时，将相同分类由同样颜色组成，在所得到的分割图像中，目标分类颜色与其他色块的交界线作为需要检测的工作区域的边界。

为了达到上述目的，本发明提供的机器设备，所述机器设备上设置有上述的基于视觉的工作区域边界的检测系统。

本发明提供的方案基于神经网络的机器视觉技术，通过前期对工作区域特征的提取和学习，能够高效的识别出工作区域的边界，对光照等环境的变化具有较强的鲁棒性。

同时，本方案中采用的精简的神经网络结构保证了在嵌入式平台上也有不错的实时性，非常适合搭载于室外移动机器人平台，如无人机，室外轮式机器人等。

附图说明

以下结合附图和具体实施方式来进一步说明本发明。

图1为本发明实例中构建的神经网络结构示意图；

图2为本发明实例中获取到的原始图的示例图；

图3为本发明实例中针对原始图实时输出的结果图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体图示，进一步阐述本发明。

本方案基于神经网络技术来对摄像头采集的视频图像进行图像语义分割, 由此来实现精确感知环境,识别工作区域的边界。

据此原理，本方案构建相应的神经网络模型，同时获取真实的工作场景图片来构成相应的训练数据集，再利用该训练数据集对构成的神经网络模型进行自主训练学习，提取和学习相应的工作区域特征，由此得到经过训练的深度神经网络模型。

在应用时，由训练得到的深度神经网络模型基于训练学习提取的工作区域特征对采集工作环境的视频图像进行实时的图像语义分割，由此来感知环境，并识别工作区域的边界。

参见图1，其所示为本方案基于上述原理所构建的一种神经网络结构示例。

该示例中给出的神经网络模型主要由多层卷积层、池化层，以及输出层相互配合构成。

本神经网络模型中的多层卷积层与池化层进行堆叠，完成图像特征提取；而输出层用于在训练学习阶段更新参数，以及在模型部署和实时语义分割阶段输出图片分割结果后的图像。

这里的多层卷积层用于对输入的图像文件进行多次卷积，每个卷积都有制定大小的卷积核，例如3x3，5x5等，卷积层通过计算提取卷积核大小的图像特征。提取的图像特征包括但不限于图像颜色深浅、纹理特征，轮廓特征和边缘特征。

这里的池化层用于对多层卷积层输出的不同的图像特征进行特征统计和数据降维。本池化层在进行特征统计和数据降维时，沿图像行和列的方向上进行统计，抽取N个像素的最大值作为该区域的统计特征，同时将数据量降维到原来的N分之一。作为举例，本方案中的池化层沿图像行和列的方向上，每两个像素进行统计，抽取四个像素的最大值作为该区域的统计特征，同时将数据量降维到原来的四分之一。

本方案采用多层卷积层和池化层来提取图像特征，不仅能够保持较高的准确度且能够大幅减少计算量，使得本方案能够适用于无法支持过量矩阵计算的嵌入式平台。

这里的输出层计算得到每个像素点属于训练集中各类别的概率，在训练学习阶段更新参数，在实时语义分割阶段输出图片分割图像。

作为举例，本输出层可采用softmax函数：

loss＝-logσ(z)j (2)；

其中，K表示共有K个分类，j表示第j个分类，zj表示通过模型计算第j个分类的数值，Zk表示通过模型计算第k个分类的数值，对所有K个分类数值进行计算累加；

公式(1)为softmax表达式，计算得到第j个分类的概率；

公式(2)为softmaxloss计算损失表达，在训练过程中通过反向传播更新模型参数值。

由此构成的输出层在训练学习阶段，将计算所得概率与图片标签做比对，用公式(2)损失值更新模型参数；在实时语义分割阶段将像素点标记为计算所得最大概率的类别，据此完成图像中所有像素点标记，输出对应的分割图像。

在上述神经网络模型方案的基础上，本实例还给出了进一步的改进方案，以进一步提高分割图像的精度。

作为方案，在上述神经网络模型方案中引入空洞卷积层，该空洞卷积层设置在神经网络模型的池化层之后。

该空洞卷积层具体由若干空洞卷积子层之间并列形成，该空洞卷积层进行的空洞卷积不同于传统卷积只提取相邻元素的特征，卷积核中提取元素并不是相邻的，其所提取元素中间存在相同距离的间隙。例如在3x3的传统卷积核中相邻元素间插入零值，则形成3x3卷积核的空洞卷积，其作用接近5x5 的传统卷积，而参数运算仅为原来36％。

作为举例，图1所示的空洞卷积层存在四个并列的空洞卷积子层，卷积核大小从小到大，四个堆叠的空洞卷积扩大滤波器的视野，实现使用很少的参数运算就能提取大范围的图像特征，保留图像全局信息。

进一步的，本改进方案还在上述神经网络模型的输出层前引入上采样过程。上采样过程通过连续上采样层对降维后的图像抽象内容进行升维，实现对图像细节内容进行恢复，再由输出层处理输出图片分割图像。

这里的连续上采样层对图像的抽象内容进行解码并对图像的细节内容进行恢复，每层上采样层将图像沿行和列的方向扩大，对图像大小进行升维。作为举例，本方案中，在每层上采样层将图像沿行和列的方向扩大两倍，使得图像大小升维为原来的四倍。

由于神经网络模型中多层卷积层与池化层在对图像的处理过程中，总有图片特征信息丢失，通过引入连续上采样层增加额外的学习过程还原丢失的特征信息，恢复图像细节内容。同时，上采样过程后的结果和原始图像大小相同，实现所有像素参与模型，分割结果更准确，实现端到端的输出。

上述神经网络方案在具体应用时，可以以计算机程序的形式存在于相应的计算机可读介质中，并可以由相应的处理器调取并执行，以实现上述的功能，形成相应的工作系统。

另外，由于本神经网络方案的计算量和复杂度都大大降低，由此构成的工作系统能够很好的适用于无法支持过量矩阵计算的嵌入式平台(如无人机，室外轮式机器人等等)，且运行在嵌入式平台中的工作系统能够智能识别周边环境,检测工作区域，即能够保证检测精度，又能够保证实时性效果。

由此，基于本神经网络方案所构成的工作区域边界检测系统，其感知环境，并识别工作区域的边界的过程主要包括几下步骤。

(1)获取训练数据。

通过获取室外真实工作场景的图片并对图片进行必要的预处理，根据目标对象的类别(例如，草地，道路，泥地，灌木等等)分割图片制作形成训练数据集。

由于训练图像的数量和图像清晰度对后期图像检测的结果至关重要，为此，针对获取到的室外真实工作场景图片，首先，对部分光照变化较强烈的图像进行光照归一化操作，减小光照的影响；接着，将所有图片剪裁至同一大小，根据目标对象的类别分配不同的RGB颜色并对相同类别目标进行上色处理，得到训练数据对应的标签图像，原始图像和标签图像即为制作的训练数据集。

(2)神经网络模型参数训练。

通过训练数据对模型参数进行训练，主要包括初始化，迭代更新网络参数和网络输出，具体如下：

将输出结果与图像标签进行比对，计算得到神经网络参数的更新值，并更新所有参数；

重复上述步骤直到效果最佳，完成神经网络模型训练。

(3)深度神经网络模型部署。

使用训练好的模型进行实际环境中的部署，将摄像头捕捉的实际工作环境视频输入训练所得的深度神经网络模，以检测工作区域的边界。

其中，深度神经网络模通过对实时采集的视频图像进行图像语义分割，以识别工作区域边界，具体包括：

(3-1)深度神经网络模型中卷积层、池化层进行参数运算，对实时采集的视频图像进行特征提取；

(3-2)深度神经网络模型对提取的特征数据进行数据统计及降维；本模型在进行数据统计和降维时，沿图像行和列的方向上进行统计，每两个像素进行统计，抽取四个像素的最大值作为该区域的统计特征，同时将数据量降维到原来的四分之一；

(3-3)深度神经网络模型中输出层通过模型推理输出图片分割图像；本步骤在过模型推理时，针对输入的图像计算图像中每个像素点属于训练集中各类别的概率，并将该像素点标记为最大概率的类别，据此完成图像中所有像素点标记，即得到对应的分割图像；由此形成的分割图像中，相同分类由同样颜色组成，目标分类颜色与其他色块的交界线则为需要检测的工作区域的边界。

在此基础上，为了提升输出图片分割的准确度，检测系统中的神经网络模型在提取特征数据的过程中，引入空洞卷积，实现使用较少参数就能完成大范围内的特征提取，扩大特征提取的视野，保留图片全局信息。

同时，还在输出层通过模型推理输出图片分割图像前引入上采样过程，通过连续上采样层对降维后的图像抽象内容进行升维，实现对图像细节内容进行恢复，再由输出层处理输出图片分割图像。

以一个具体的应用实例来说明一下运行本工作系统的嵌入式平台进行智能识别周边环境，检测工作区域的过程。

作为举例，本实例给出的基于机器视觉的工作区域边界检测设备主要包括数字摄像头模块，嵌入式处理器芯片模块以及计算机存储模块。

其中计算机存储模块中存储有本方案提供的基于机器视觉的工作区域边界检测系统程序；检测设备中的嵌入式处理器芯片模块通过运行计算机存储模块中的检测系统程序来完成工作区域边界检测。

本实例中把需要识别的对象分为4类，分别为人行地面，草坪，泥土地，和灌木，嵌入式处理器芯片模块运行检测系统程序，根据设定的对象以及形成的实际工作场景的训练数据集，对系统中的神经网络进行训练和学习，使得系统具有自主识别对象的能力。

在工作系统在运行时，由检测设备上的数字摄像头模块实时采集周围的视频图像，并转化为相应的图像形成原始图(如图2所示)。

接着，将该原始图实时输入训练所得的深度神经网络，通过深度神经网络的卷积层、池化层进行参数运算，提取图像特征；再由深度神经网络输出层计算实时采集图片中每个像素点属于训练集中各类别的概率经过深度神经网络参数运算后，得到实时采集图片中每个像素点属于训练集中各类别的概率，并将该像素点标记为最大概率的类别，据此完成图像中所有像素点标记，实时的输出如图3所示的分割图像。由此形成的分割图像中，相同分类由同样颜色组成，目标分类颜色与其他色块的交界线则为需要检测的工作区域的边界。

由上实例可见，本工作系统能够准确的区分目标类(用粉色代表人行路面，用红色代表草坪，用绿色代表泥土地，用蓝色代表灌木)，并确定出需要检测的工作区域的边界。

上述本发明的方法，或特定系统单元、或其部份单元，为纯软件架构，可以透过程序代码布设于实体媒体，如硬盘、光盘片、或是任何电子装置(如智能型手机、计算机可读取的储存媒体)，当机器加载程序代码且执行(如智能型手机加载且执行)，机器成为用以实行本发明的装置。上述本发明的方法与装置亦可以程序代码型态透过一些传送媒体，如电缆、光纤、或是任何传输型态进行传送，当程序代码被机器(如智能型手机)接收、加载且执行，机器成为用以实行本发明的装置。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.基于视觉的工作区域边界的检测系统，包括处理器，以及存储有计算机程序的计算机可读介质，其特征在于，所述计算机程序被处理器执行时：

2.根据权利要求1所述的基于视觉的工作区域边界的检测系统，其特征在于，所述检测系统中的神经网络模型包括多层卷积层，池化层以及输出层，所述多层卷积层与池化层进行堆叠，完成图像特征提取所述输出层在神经网络模型训练学习阶段更新参数，并在模型部署和实时语义分割阶段输出图片分割结果后的图像。

3.根据权利要求2所述的基于视觉的工作区域边界的检测系统，其特征在于，所述池化层对多层卷积层的输出特征进行特征统计和数据降维，沿图像行和列的方向上进行统计，抽取N个像素的最大值作为该区域的统计特征，同时将数据量降维到原来的N分之一。

4.根据权利要求2所述的基于视觉的工作区域边界的检测系统，其特征在于，所述神经网络模型中还包括空洞卷积层，所述空洞卷积层由若干空洞卷积子层之间并列形成，并设置在池化层之后，通过空洞卷积提取元素中间有相同的间隙，以扩大特征提取的视野，保留图像全局信息。

5.根据权利要求4所述的基于视觉的工作区域边界的检测系统，其特征在于，所述神经网络模型中还设置有上采样单元层，该上采样单元层设置在输出层前，通过连续上采样层对降维后的图像抽象内容进行升维，对图像细节内容进行恢复。

6.基于视觉的工作区域边界的检测方法，其特征在于，包括：

7.根据权利要求6所述的基于视觉的工作区域边界的检测方法，其特征在于，通过获取室外真实工作场景的图片并对图片进行预处理，根据目标对象的类别分割图片制作形成训练数据集。

8.根据权利要求6所述的基于视觉的工作区域边界的检测方法，其特征在于，神经网络模型通过训练数据集进行训练，主要包括：

重复上述步骤直到效果最佳，完成神经网络模型训练。

9.根据权利要求6所述的基于视觉的工作区域边界的检测方法，其特征在于，所述检测方法在对实时采集的视频图像进行图像语义分割，识别工作区域边界时，包括：

深度神经网络模型对提取的特征数据进行数据统计及降维；

深度神经网络模型通过模型推理输出图片分割图像。

10.根据权利要求9所述的基于视觉的工作区域边界的检测方法，其特征在于，所述深度神经网络模型进行模型推理时，针对实时输入的图像计算图像中每个像素点属于训练集中各类别的概率，将该像素点标记为最大概率的类别，据此完成图像中所有像素点标记，得到对应的分割图像。

11.根据权利要求9所述的基于视觉的工作区域边界的检测方法，其特征在于，在通过模型推理形成分割图像时，将相同分类由同样颜色组成，在所得到的分割图像中，目标分类颜色与其他色块的交界线作为需要检测的工作区域。

12.机器设备，其特征在于，所述机器设备上设置有上述的基于视觉的工作区域边界的检测系统。