WO2022088611A1

WO2022088611A1 - 障碍检测方法、装置、电子设备、存储介质及计算机程序

Info

Publication number: WO2022088611A1
Application number: PCT/CN2021/085927
Authority: WO
Inventors: 张展鹏; 成慧
Original assignee: 深圳市商汤科技有限公司
Priority date: 2020-10-28
Filing date: 2021-04-08
Publication date: 2022-05-05
Also published as: KR20220060500A; CN112183476B; JP2023503747A; CN112183476A

Abstract

本公开实施例公开了一种障碍检测方法、装置、电子设备、存储介质及计算机程序，该障碍检测方法包括：获取待检测图像；将待检测图像进行物体检测，获取待检测图像中物体的位置信息；将待检测图像进行语义分割，获取待检测图像中地面区域的位置信息；基于物体的位置信息以及地面区域的位置信息获取障碍区域。

Description

障碍检测方法、装置、电子设备、存储介质及计算机程序

相关申请的交叉引用

本专利申请要求2020年10月28日提交的中国专利申请号为202011172403.6，申请人为深圳市商汤科技有限公司，申请名称为“一种障碍检测方法、装置、电子设备以及存储介质”的优先权，该申请的全文以引用的方式并入本申请中。

技术领域

本公开实施例涉及路径规划技术领域，特别是涉及一种障碍检测方法、装置、电子设备、存储介质及计算机程序。

背景技术

近年来，随着移动机器人的快速发展，如何进行障碍物检测和避让是体现机器人智能化水平的重要标准，良好的避障功能是移动机器人安全行走的重要保障，而如何进行良好的避障就涉及到对机器人的路径规划。

机器人导航领域的路径规划是指：首先告知机器人行走的起始点和目标点，然后在存在障碍物的室内环境中根据已知地图信息规划出一条合理的路径供机器人行走。其中，合理的路径应当至少满足以下条件：路径是从起始点到达目标点的相对较短的路径；该路径能够极大程度的避开在已知地图中的障碍物。

发明内容

本公开实施例至少提供一种障碍检测方法、装置、电子设备、存储介质及计算机程序。

本公开实施例第一方面提供了一种障碍检测方法，所述障碍检测方法包括：获取待检测图像；将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息；将所述待检测图像进行语义分割，获取所述待检测图像中地面区域的位置信息；基于所述物体的位置信息以及所述地面区域的位置信息获取障碍区域。

因此，由于基于所述物体的位置信息以及所述地面区域的位置信息，共同确定障碍区域，而待检测图像中地面区域的位置信息是基于语义分割获取的，使得能够提高确定的地面区域的准确性，进而能够获取到准确度高的障碍区域，进而能够有效地对环境进行障碍物分析。

在一些实施例中，所述获取待检测图像，包括：获取相机的标定参数，其中，所述标定参数包括畸变参数；获取拍摄的目标图像，并基于所述畸变参数对所述目标图像进行矫正，得到所述待检测图像。

因此，通过畸变参数矫正目标图像，得到待检测图像，有利于提高路径规划的准确性。

在一些实施例中，所述标定参数还包括变换参数；所述将所述待检测图像进行语义分割，获取所述待检测图像中地面区域的位置信息，包括：将所述待检测图像输入第一深度神经网络，获取所述待检测图像中所有像素点的语义标签，其中，所述语义标签包括地面标签和背景标签；基于所述变换参数，将所述待检测图像中所述地面标签对应的像素点变换为在所述相机坐标系的地面区域，得到所述地面在所述相机坐标系的位置信息。

因此，通过第一深度神经网络的语义标签将待检测图像中的地面区域和背景区域区分开，进一步将待检测图像的信息通过变换参数投影到相机坐标系，有利于体现地面区域、背景区域与相机的距离关系。

在一些实施例中，所述标定参数还包括变换参数，所述待检测图像中物体包括非特定物体；所述将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息，还包括：将所述待检测图像输入第二深度神经网络，获取所述待检测图像中非特定物体的轮廓框；基于所述变换参数，将所述非特定物体的轮廓框变换为在所述相机坐标系的轮廓框，得到所述非特定物体在所述相机坐标系的位置信息。

因此，通过第二深度神经网络对待检测图像中的非特定物体进行语义分割，以标定非特定物体的轮廓框，通过轮廓框表示非特定物体的形状，有利于在路径规划中紧贴非特定物体得到实用性高的规划路径。

在一些实施例中，所述标定参数还包括变换参数，所述待检测图像中物体包括特定物体；所述将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息，包括：将所述待检测图像输入第三深度神经网络，获取所述待检测图像中特定物体的图像位置信息；基于所述变换参数，将所述物体的图像位置信息变换为所述特定物体在所述相机坐标系的位置信息。

因此，通过第三深度神经网络对待检测图像中的特定物体进行物体检测，得到特定物体的位置信息。

在一些实施例中，所述将所述待检测图像输入第三深度神经网络，获取所述待检测图像中特定物体的图像位置信息，包括：将所述待检测图像输入所述第三深度神经网络，获取所述待检测图像中特定物体的包围框；基于所述包围框的对角坐标计算所述特定物体的图像位置信息。

因此，提供通过包围框的对角坐标计算特定物体的位置信息的计算方法。

在一些实施例中，所述障碍检测方法还包括：基于所述物体的位置信息以及所述地面的位置信息形成当前规划地图，其中，所述当前规划地图包括可行驶区域，以及包括所述物体的障碍区域；基于所述当前规划地图的可行驶区域获取规划路径。

因此，通过地面的位置信息获得行驶区域，再通过物体的位置信息获得行驶区域中的障碍区域，从而生成当前规划地图，用于进行路径规划。

在一些实施例中，所述障碍检测方法还包括：响应于所述待检测图像中物体包括非特定物体的情况，确定所述障碍区域包括所述非特定物体在所述相机坐标系的轮廓框所对应的区域；和/或，响应于所述待检测图像中物体包括特定物体的情况，获取所述特定物体的类别信息；根据所述特定物体的位置信息和类别信息生成所述特定物体在相机坐标系的物体框；其中，所述障碍区域包括所述特定物体在所述相机坐标系的物体框所对应的区域。

因此，提出一种形成障碍区域的方法，有利于根据物体框快速生成行驶区域中的障碍区域；而对于特定物体，考虑特定物体的类别信息能够使障碍检测装置决定是否需要紧贴特定物体进行路径规划，有利于提高规划路径的实用性。

本公开实施例第二方面提供了一种障碍检测装置，所述障碍检测装置包括：相机部分，被配置为获取待检测图像；物体检测部分，被配置为将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息；语义分割部分，被配置为将所述待检测图像进行语义分割，获取所述待检测图像中地面区域的位置信息；障碍检测部分，被配置为基于所述物体的位置信息以及所述地面区域的位置信息获取障碍区域以及避开所述障碍区域的规划路径。

在一些实施例中，所述相机部分，被配置为获取相机的标定参数，其中，所述标定参数包括畸变参数；获取拍摄的目标图像，并基于所述畸变参数对所述目标图像进行矫正，得到所述待检测图像。

在一些实施例中，所述标定参数还包括变换参数；所述语义分割部分，被配置为将所述待检测图像输入第一深度神经网络，获取所述待检测图像中所有像素点的语义标签，其中，所述语义标签包括地面标签和背景标签；基于所述变换参数，将所述待检测图像中所述地面标签对应的像素点变换为在所述相机坐标系的地面区域，得到所述地面区域在所述相机坐标系的位置信息。

在一些实施例中，所述标定参数还包括变换参数，所述待检测图像中物体包括非特定物体；所述物体检测部分，还被配置为将所述待检测图像输入第二深度神经网络，获取所述待检测图像中所述非特定物体的轮廓框；基于所述变换参数，将所述非特定物体的轮廓框变换为在所述相机坐标系的轮廓框，得到所述非特定物体在所述相机坐标系的位置信息。

在一些实施例中，所述标定参数还包括变换参数，所述待检测图像中物体包括特定物体；所述物体检测部分，还被配置为将所述待检测图像输入第三深度神经网络，获取所述待检测图像中特定物体的图像位置信息；基于所述变换参数，将所述物体的图像位置信息变换为所述特定物体在所述相机坐标系的位置信息。

在一些实施例中，所述物体检测部分，还被配置为将所述待检测图像输入所述第三深度神经网络，获取所述待检测图像中特定物体的包围框；基于所述包围框的对角坐标计算所述特定物体的图像位置信息。

在一些实施例中，所述装置还包括：路径规划部分，被配置为基于所述物体的位置信息以及所述地面的位置信息形成当前规划地图，其中，所述当前规划地图包括可行驶区域，以及包括所述物体的障碍区域；基于所述当前规划地图的可行驶区域获取规划路径。

在一些实施例中，所述装置还包括：区域确定部分，被配置为响应于所述待检测图像中物体包括非特定物体的情况，确定所述障碍区域包括所述非特定物体在所述相机坐标系的轮廓框所对应的区域；和/或，被配置为响应于所述待检测图像中物体包括特定物体的情况，获取所述特定物体的类别信息；根据所述特定物体的位置信息和类别信息生成所述特定物体在相机坐标系的物体框；其中，所述障碍区域包括所述特定物体在所述相机坐标系的物体框所对应的区域。

本公开实施例第三方面提供了一种电子设备，包括相互耦接的存储器和处理器，处理器用于执行存储器中存储的程序指令，以实现上述第一方面中的障碍检测方法。

本公开实施例第四方面提供了一种计算机可读存储介质，其上存储有程序指令，程序指令被处理器执行时实现上述第一方面中的障碍检测方法。

本公开实施例第五方面提供了一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行用于实现上述第一方面中的障碍检测方法。

上述方案，障碍检测装置获取待检测图像；将待检测图像进行物体检测，获取待检测图像中物体的位置信息；将待检测图像进行语义分割，获取待检测图像中地面区域的位置信息；基于物体的位置信息以及地面区域的位置信息获取障碍区域。上述方案，能够对环境进行障碍物分析。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开实施例。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开实施例的技术方案。

图1是本公开实施例提供的障碍检测方法一实施例的流程示意图；

图2是图1所示障碍检测方法中步骤S11一实施例的流程示意图；

图3是本公开实施例提供的包括物体框的待检测图像的框架示意图；

图4是图1所示障碍检测方法中步骤S12一实施例的流程示意图；

图5是图1所示障碍检测方法中步骤S12另一实施例的流程示意图；

图6是图1所示障碍检测方法中步骤S13一实施例的流程示意图；

图7是本公开实施例提供的障碍检测装置一实施例的框架示意图；

图8是本公开实施例提供的电子设备一实施例的框架示意图；

图9是本公开实施例提供的计算机可读存储介质一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本公开实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本公开实施例。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括A、B、C中的至少一种，可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。

扫地机器人是家庭智能终端重要的一环，智能化的扫地机器人需要对自身的位置进行定位的同时，还需要感知周边的物体信息以进行路径规划，避开障碍物，例如鞋子、椅子脚、袜子等，实现高效的清扫过程。因此，障碍物检测分析是智能扫地机路径规划中重要的技术组成部分。

扫地机器人一般有两种类型：1)基于单线激光雷达的扫地机器人；2)基于双目或者单目摄像头的扫地机器人。对于单线激光雷达的方案，其优点是覆盖的角度范围大，一般的单线激光雷达都可以达到实时360度的扫描范围。然而，单线激光雷达只能对单一水平面进行扫描，因此，对于不同高度的障碍物无法完全覆盖。例如袜子紧贴地面时无法被检测。类似激光雷达，使用多线激光雷达可以一定程度上缓解这种问题，但目前多线激光雷达成本高，不适合应用在家庭扫地机这类消费级产品上。也有一些基于红外测距传感器的方案，但这类方案都有可检测范围稀疏的问题。对于第二种类型，基于双目或者单目视觉的方案，这类方案由于可以获得图像，避免了单线激光雷达返回结果稀疏的问题，同时成本也不高。目前基于视觉的方案有两种策略，一种策略是通过目标检测，检测出障碍物在图像中的位置，使用一个矩形框标注出来，然后根据相机的参数把障碍物位置从图像坐标投影到世界坐标。这种基于目标检测的方法，可以获得一定的语义信息，例如使用一个袜子检测器，可以检测出袜子，使用拖鞋检测器，可以检测出拖鞋。然而，家庭场景内还存在很多形状多变的物体，例如电线，桌子腿的一部分等，这些障碍物很难用一个矩形框紧致地框出来。即使用一个过大的矩形框框住，忽略了障碍物的形状信息，会使得后续扫地机器人避障的时候无法紧贴障碍物行驶。基于视觉的方案另外的一种策略是使用双目相机得到前方场景的深度图信息，然后通过深度信息进行障碍物分析实现避障。然而这种方法对双目相机两个相机传感器之间有一定的位置约束(例如两个相机必须间隔一定的距离，且水平向上所处高度相等)，而且该方案对于纹理比较小，例如白墙的场景适应性不好。

针对相关的基于视觉的障碍物分析方案中，无法描述障碍物形状不固定的情况、以及对白墙场景适应性不好等问题，本公开实施例提出使用单目相机的方案，融合目标检测技术和语义分割技术的障碍物分析方法。

因此，针对扫地机器人场景下的障碍物分析存在的问题，本公开实施例提出一种可以应用于家居场所扫地机器人实现的障碍检测方法。在一些可能的实施方法，本公开实施例提出的障碍检测方法也可以应用于其他机器人，如清洁机器人、割草机器人、户外送货机器人等，在此不再赘述。

请参阅图1，图1是本公开实施例提供的障碍检测方法一实施例的流程示意图。本公开实施例的障碍检测方法的执行主体可以是一种障碍检测装置，例如，障碍检测方法可以由终端设备或服务器或其它处理设备执行，其中，障碍检测装置可以为用户设备(User Equipment，UE)、移动设备、用户终端、终端、蜂窝电话、无线电话、个人数字处理(Personal Digital Assistant，PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中，该障碍检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

具体而言，本公开实施例的障碍检测方法可以包括以下步骤：

步骤S11：获取待检测图像。

本公开实施例中，障碍检测装置获取机器人所处环境的待检测图像。待检测图像可以由机器人上搭载的相机部分获取，相机部分具体可以为单目红绿蓝(RGB)相机。相机模型固定在机器人的固定位置，一般设置在机器人运行方向的正面位置，能够获取到机器人前行方向上的环境图像，即相机视野需要覆盖地面以及需要分析的可能存在的障碍物。

步骤S12：将待检测图像进行物体检测，获取待检测图像中物体的位置信息。

在本公开实施例中，障碍检测装置对待检测图像进行物体检测，获取待检测图像中物体的位置信息。对于机器人而言，待检测图像中的物体即障碍物；通过物体的位置信息，障碍检测装置可以生成有效的障碍区域。

在一些实施方式中，从形状的角度区分，本公开实施例的物体可以区分为特定物体和非特定物体。其中，特定物体是由工作人员提前预设的具有相对固定形状的物体，例如拖鞋、纸团、易拉罐等；非特定物体是形状多变的物体，例如桌子腿、电线等。

步骤S13：将待检测图像进行语义分割，获取待检测图像中地面区域的位置信息。

在本公开实施例中，障碍检测装置通过语义分割部分对待检测图像进行地面检测。其中，本步骤的语义分割部分与上述检测非特定物体的语义分割部分可以为同一部分，也可以为不同部分。

语义分割部分输入的是基于标定的畸变参数矫正后的待检测图像，输出的是待检测图像中标记为地面的若干像素点，以及若干像素点组成的地面区域。

步骤S14：基于物体的位置信息以及地面的位置信息获取障碍区域。

这样，通过障碍区域能够确定避开障碍区域的规划路径。

在本公开实施例中，障碍检测装置通过融合部分获取上述地面信息和物体信息。融合部分输入信息包括：(1)语义分割部分获取的信息，即相对于相机，当前区域中属于地面的区域以及非特定物体的位置和形状；(2)物体检测部分获取的信息，即相对于相机，运行前方特定物体的位置和类别。

由于上述地面信息和物体信息均属于相机空间中的信息，障碍检测装置可以根据上述地面信息和物体信息形成当前规划地图，其中，当前规划地图可以为二维地图或三维地图。

在本公开实施例中，由于基于物体的位置信息以及地面区域的位置信息，共同确定障碍区域，而待检测图像中地面区域的位置信息是基于语义分割获取的，使得能够提高确定的地面区域的准确性，进而能够获取到准确度高的障碍区域，进而能够有效地对环境进行障碍物分析。

在获取待检测图像的过程中，障碍检测装置还可以对待检测图像进行预处理，以提高待检测图像的精确度，具体预处理过程请参阅图2，图2是图1所示障碍检测方法中步骤S11一实施例的流程示意图。如图2所示，步骤S11具体包括以下步骤：

步骤S21：获取相机的标定参数，其中，标定参数包括畸变参数。

在本公开实施例中，在固定相机部分在机器人上的位置后，障碍检测装置需要对相机进行标定。在一些实施方式中，障碍检测装置可以通过张正友标定法标定相机部分的内参和外参。其中，内参可以包括但不限于相机的焦距以及畸变参数，外参可以包括但不限于相机的单应矩阵。畸变参数具体包括切向畸变和径向畸变，径向畸变发生在相机坐标系转图像物理坐标系的过程中，切向畸变发生在相机制作过程，由于感光元件平面与透镜平面不平行。单应矩阵为图像物理坐标系与相机坐标系之间投影映射的变换关系。

在一些可能的实施方式中，还可以通过其他标定法标定相机部分的内参和外参，例如孟胡的平面标定方法、以及吴毅红的平行圆标定方法等。

步骤S22：获取拍摄的目标图像，并基于畸变参数对目标图像进行矫正，得到待检测图像。

在本公开实施例中，切向畸变和径向畸变会导致相机部分采集的待检测图像发生部分变形。因此，障碍检测装置获取目标图像后，需要基于畸变参数对目标图像进行校正，以减少相机部分本身由于切向畸变和径向畸变导致的图像畸变的影响，有利于提高后续路径规划的准确性。

对于特定物体，障碍检测装置可以直接通过物体检测部分进行检测，具体检测过程请参阅图4，图4是图1所示障碍检测方法中步骤S12一实施例的流程示意图。在本实施例中，标定参数还包括变换参数，如图4所示，步骤S12具体包括以下步骤：

步骤S31：将待检测图像输入第三深度神经网络，获取待检测图像中特定物体的图像位置信息。

在本公开实施例中，物体检测部分包括一个第三深度神经网络和一个几何投影部分。第三深度神经网络输入的是基于标定的畸变参数矫正后的待检测图像，输出的是包含特定物体的图像位置信息的待检测图像。其中，特定物体的图像位置信息通过图3中的物体框体现。在图3示出了特定物体包括两个纸团和一个易拉罐。

在一些实施方式中，步骤S31可以通过以下方式实现：将待检测图像输入第三深度神经网络，获取待检测图像中特定物体的包围框；基于包围框的对角坐标计算特定物体的图像位置信息。

在一些实施方式中，第三深度神经网络预先对本公开实施例中的特定物体进行训练，第三深度神经网络可以识别出特定物体的位置和类别，通过物体框的形式体现。物体框可以由围绕特定物体的包围框以及语义标识组成，语义标识即标明对应包围框中的特定物体的类别。

步骤S32：基于变换参数，将物体的图像位置信息变换为特定物体在相机坐标系的位置信息。

在本公开实施例中，障碍检测装置基于变换参数将物体的图像位置信息变换为特定物体在相机坐标系的位置信息，并通过包围框的方式体现。其中，变换参数为标定的相机部分的外参，包括但不限于相机的单应矩阵。在一些实施方式中，障碍检测装置通过几何投影部分以包围框的左上角坐标和右下角坐标之间的中点位置，或者右上角坐标和左下角坐标之间的重点位置作为特定物体在图像中的位置，然后结合预先标定好的单应矩阵计算出特定物体相对相机的位置。

在一些实施方式中，在得到特定物体在相机坐标系的包围框后，障碍检测装置将特定物体的类别信息标注在包围框上，以形成图3所示的特定物体的物体框。在后续的路径规划过程中，考虑特定物体的类别信息有利于规划出更加贴近真实生活，具有较高实用性的规划路径。例如，在特定物体属于鞋子等不会影响到机器人的物体的情况下，规划路径可以紧贴特定物体进行规划；在特定物体属于台灯、电热器等较危险的物体的情况下，规划路径可以与特定物体保持一定距离进行规划，防止机器人运行过程中引发危险。

对于非特定物体，障碍检测装置可以通过语义分割的方式进行检测，值得说明的是，通过语义分割方式检测非特定物体的过程，可以是通过上述的物体检测部分进行检测，也可以是通过另一语义分割部分进行检测，具体检测过程请参阅图5，图5是图1所示障碍检测方法中步骤S12另一实施例的流程示意图。在本实施例中，标定参数还包括变换参数，待检测图像中物体包括非特定物体，如图5所示，步骤S12具体包括以下步骤：

步骤S41：将待检测图像输入第二深度神经网络，获取待检测图像中非特定物体的轮廓框。

在本公开实施例中，第二深度神经网络输入的是基于标定的畸变参数矫正后的待检测图像，输出的是包含非特定物体的图像位置信息的待检测图像。其中，非特定物体的图像位置信息通过围绕非特定物体的轮廓框体现。

步骤S42：基于变换参数，将非特定物体的轮廓框变换为在相机坐标系的轮廓框，得到非特定物体在相机坐标系的位置信息。

在本公开实施例中，障碍检测装置基于单应矩阵将非特定物体的图像位置信息变换为非特定物体在相机坐标系的位置信息，并通过轮廓框的方式体现。

上述第三深度神经网络只能输出特定物体的物体框，其中，物体框为包围特定物体的矩形框；第二深度神经网络的识别原理是：对非特定物体的边缘点进行识别，然后将若干个边缘点进行组合连接，从而形成一条闭合的边缘线，即围绕非特定物体的轮廓框。相较于特定物体的矩形物体框，非特定物体的轮廓框能够更好地体现物体的具体形状信息，有利于机器人的运行路径能够紧贴非特定物体进行规划，以提高机器人规划路径的实用性。

对待检测图像进行地面与背景的语义分割具体操作过程请参阅图6，图6是图1所示障碍检测方法中步骤S13一实施例的流程示意图。在本实施例中，标定参数还包括变换参数，如图6所示，步骤S13具体包括以下步骤：

步骤S51：将待检测图像输入第一深度神经网络，获取待检测图像中所有像素点的语义标签，其中，语义标签包括地面标签和背景标签。

在本公开实施例中，语义分割部分包括一个全卷积的第一深度神经网络和一个几何投影部分。第一深度神经络输入的是基于标定的畸变参数矫正后的待检测图像，输出的是待检测图像中每一个像素点的语义标签。

需要说明的是，语义分割部分同样可以用于分割出非特定物体的轮廓框，即上述第二深度神经网络与本步骤的第一深度神经网络可以为同一深度神经网络，在此不再赘述。

在一些实施方式中，语义标签具体包括地面标签和背景标签。在某一像素点识别为地面像素点的情况下，语义标签标记为1；在某一像素点识别为背景像素点的情况下，语义标签标记为0。

步骤S52：基于变换参数，将待检测图像中地面标签对应的像素点变换为在相机坐标系的地面区域，得到地面在相机坐标系的位置信息。

在本公开实施例中，障碍检测装置基于单应矩阵将每个语义标签为1的地面像素点从图像空间投影到相机空间，获取地面像素点在相机坐标系的位置信息。然后，障碍检测装置将投影后的地面像素点组合成为相机坐标系的地面区域，其余区域为背景区域。其中，地面区域为机器人的行驶区域。

上述方案，障碍检测装置获取待检测图像；将待检测图像进行物体检测，获取待检测图像中物体的位置信息；将待检测图像进行语义分割，获取待检测图像中地面的位置信息；基于物体的位置信息以及地面区域的位置信息获取障碍区域。上述方案中，障碍检测装置通过对待检测图像进行物体检测以及语义分割，能够自动识别并标注出待检测图像中的地面区域和物体位置，其中，地面区域为机器人的行驶区域，而检测出的物体位置出现在行驶区域中，即可分析出该物体为障碍物，从而能够有效地对环境进行障碍物分析，并进一步根据分析结果进行路径规划。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

在一些实施例中，障碍检测方法还可以包括：基于物体的位置信息以及地面的位置信息形成当前规划地图，其中，当前规划地图包括可行驶区域，以及包括物体的障碍区域；基于当前规划地图的可行驶区域获取规划路径。

当前规划地图包括可行驶区域和物体的障碍区域。障碍区域是根据物体的位置信息所生成的区域，可行驶区域在为地面区域中除去障碍区域的部分区域。在一些实施例中，在待检测图像中包括非特定物体的情况下，非特定物体在相机坐标系的轮廓框所围成的区域可认为非特定物体的所在，因此该区域即为障碍区域(或障碍区域的一部分)；在待检测图像中包括特定物体的情况下，可通过上述的第三深度神经网络(或其它方式)获取到特定物体的类别信息，然后根据特定物体的位置信息和类别信息生成该特定物体在相机坐标系的物体框，而特定物体在相机坐标系的物体框所围成的区域可认为特定物体的所在，因此该区域即为障碍区域(或障碍区域的一部分)。值得说明的是，对于不同的特定物体，其所对应的物体框大小可能会存在区别，这是考虑到不同的特定物体对于机器人的影响不同，因此会对应不同大小的物体框以便机器人规划出更精确的路径；例如在特定物体属于鞋子等不会影响到机器人的物体的情况下，物体框的尺寸较小，也即障碍区域较小，规划路径可以紧贴特定物体进行规划；在特定物体属于台灯、电热器等较危险的物体的情况下，物体框的尺寸较大，也即障碍区域较大，规划路径可以与特定物体保持一定距离进行规划，防止机器人运行过程中引发危险。在后续的路径规划过程中，考虑特定物体的类别信息有利于规划出更加贴近真实生活，具有较高实用性的规划路径。

通过排除障碍区域，障碍检测装置可以得到行驶区域中机器人的可行驶区域，然后将可行驶区域输入轨迹规划部分。障碍检测装置通过轨迹规划部分输入终点信息，获取避开障碍区域的规划路径。

在一些实施例中，障碍检测方法还可以包括：响应于待检测图像中物体包括非特定物体的情况，确定障碍区域包括非特定物体在相机坐标系的轮廓框所对应的区域。

在另一些实施例中，障碍检测方法还可以包括：响应于待检测图像中物体包括特定物体的情况，获取特定物体的类别信息；根据特定物体的位置信息和类别信息生成特定物体在相机坐标系的物体框；其中，障碍区域包括特定物体在相机坐标系的物体框所对应的区域。

请参阅图7，图7是本公开实施例提供的障碍检测装置一实施例的框架示意图。障碍检测装置70包括：

相机部分71，被配置为获取待检测图像。

物体检测部分72，被配置为将待检测图像进行物体检测，获取待检测图像中物体的位置信息。

语义分割部分73，被配置为将待检测图像进行语义分割，获取待检测图像中地面区域的位置信息。

障碍检测部分74，被配置为基于物体的位置信息以及地面区域的位置信息获取障碍区域。

在一些实施例中，相机部分71，被配置为获取相机的标定参数，其中，标定参数包括畸变参数；获取拍摄的目标图像，并基于畸变参数对目标图像进行矫正，得到待检测图像。

在一些实施例中，标定参数还包括变换参数；语义分割部分73，被配置为将待检测图像输入第一深度神经网络，获取待检测图像中所有像素点的语义标签，其中，语义标签包括地面标签和背景标签；基于变换参数，将待检测图像中地面标签对应的像素点变换为在相机坐标系的地面区域，得到地面区域在相机坐标系的位置信息。

在一些实施例中，标定参数还包括变换参数，待检测图像中物体包括非特定物体；物体检测部分72，还被配置为将待检测图像输入第二深度神经网络，获取待检测图像中非特定物体的轮廓框；基于变换参数，将非特定物体的轮廓框变换为在相机坐标系的轮廓框，得到非特定物体在相机坐标系的位置信息。

在一些实施例中，标定参数还包括变换参数，待检测图像中物体包括特定物体；物体检测部分72，还被配置为将待检测图像输入第三深度神经网络，获取待检测图像中特定物体的图像位置信息；基于变换参数，将物体的图像位置信息变换为特定物体在相机坐标系的位置信息。

在一些实施例中，物体检测部分72，还被配置为将待检测图像输入第三深度神经网络，获取待检测图像中特定物体的包围框；基于包围框的对角坐标计算特定物体的图像位置信息。

在一些实施例中，装置还包括：路径规划部分，被配置为基于物体的位置信息以及地面的位置信息形成当前规划地图，其中，当前规划地图包括可行驶区域，以及包括物体的障碍区域；基于当前规划地图的可行驶区域获取规划路径。

在一些实施例中，装置还包括：区域确定部分，被配置为响应于待检测图像中物体包括非特定物体的情况，确定障碍区域包括非特定物体在相机坐标系的轮廓框所对应的区域；或者，被配置为响应于待检测图像中物体包括特定物体的情况，获取特定物体的类别信息；根据特定物体的位置信息和类别信息生成特定物体在相机坐标系的物体框；其中，障碍区域包括特定物体在相机坐标系的物体框所对应的区域。

在本公开实施例中，用于实现本公开实施例的方案的系统可以包括以下部分：相机部分、物体检测部分、地面分割部分(对应上述实施例中的语义分割部分)、融合部分(对应上述实施例中的障碍检测部分)以及轨迹规划部分。

在实施过程中，需要定义一些有相对固定形状的物体，例如袜子，鞋子，这里先把这些物体称为集合A。

系统实际部署的时候，相机部分可以接受到当前的图片，把图片分别分发到物体检测部分和语义分割部分。物体检测部分检测出图片中所有集合A里面的物体，输出物体类别以及物体相对于当前机器人的位置。而地面分割部分则针对输入的图片，对图片中的像素打标签，输出属于平地的区域。结合平地区域以及物体集合A的位置，融合部分输出扫地机器人可行驶的区域地图。根据这个地图，轨迹规划部分规划出避障的轨迹，最后系统控制部分完成避障轨迹的执行。

相机部分需固定在扫地机器人某个固定的位置，以确定相机部分的视野能否覆盖地面以及需要分析的可能存在的障碍物。固定相机部分后，需要有一个标定的过程。一方面标定相机部分的内参I(包括焦距以及畸变参数)，另一方面标定外参E(这里外参指的是相机成像平面与地面两个平面之间的单应矩阵)。这里的标定可以采用张正友标定法。

物体检测部分的输入可以是基于标定的畸变参数矫正后的图像，输出是特定类型的障碍物的类别和位置。这里，特定类型的障碍物是由系统开发者开发前制定的具有相对固定形状的物体(例如拖鞋、纸团、易拉罐等)。具体来说，物体检测部分可以包括一个深度神经网络M1和一个几何投影部分G。神经网络A输入的是图片，输出是检测到的物体的包围框，然后，几何投影部分以包围框的左下角和右下角两点之间的中点作为物体在图像中的位置，结合预先标定好的外参E，可以算出物体相对相机部分的位置。

地面分割部分的输入是基于标定的畸变参数矫正后的图像，输出的是输入图像中每个像素的语义标签。具体来讲，语义标签等于0或者1，等于1的时候表示该像素为地面，否则为背景。地面分割部分可以由一个全卷积的深度网络M2实现。得到每个像素的语义标签后，通过几何部分G，可以把每个语义为地面的像素从图像空间投影到相机空间(即相对于相机的坐标)。

融合部分可以确定以下信息：1)地面分割部分得到的信息，即相对于相机部分，当前哪些区域是地面；2)物体检测部分得到的信息，即相对于相机部分，前方在什么位置有什么障碍物体。这两方面的信息都是在相机空间系里面的，所以综合分析这两方面的信息，融合部分得到当前相机部分覆盖的范围内，有哪些区域是可行驶的。可行驶的区域可以使用一个局部地图来描述。将局部地图输入到轨迹规划部分，即可以得到避障的轨迹。

在本公开实施例中，通过使用单目RGB相机完成扫地机通用障碍物规避功能，通过融合物体检测和语义分割技术实现单目RGB的场景障碍物分析功能，不仅可以降低扫地机器避障的硬件成本要求，还可以对特定类型以及非特定类型的障碍物进行检测分析，提高扫地机器人的避障效果。

在本公开实施例中，在自主导航的移动机器人上，使用本方案进行障碍物分析，从而得知机器人前面有哪些障碍物以及哪些是可以行走的区域，根据这些信息反馈给规划控制系统，从而实现障碍物规避。

请参阅图8，图8是本公开实施例提供的电子设备一实施例的框架示意图。电子设备80包括相互耦接的存储器81和处理器82，处理器82被配置为执行存储器81中存储的程序指令，以实现上述任一障碍检测方法实施例中的步骤。在一个实施场景中，电子设备80可以包括但不限于：微型计算机、服务器，此外，电子设备80还可以包括笔记本电脑、平板电脑等移动设备，在此不做限定。

具体而言，处理器82被配置为控制其自身以及存储器81以实现上述任一障碍检测方法实施例中的步骤。处理器82还可以称为中央处理单元(Central Processing Unit，CPU)。处理器82可能是一种集成电路芯片，具有信号的处理能力。处理器82还可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器82可以由集成电路芯片共同实现。

请参阅图9，图9是本公开实施例提供的计算机可读存储介质一实施例的框架示意图。计算机可读存储介质90存储有能够被处理器运行的程序指令901，程序指令901用于实现上述任一障碍检测方法实施例中的步骤。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的部分可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

本公开实施例还可以提供一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行用于实现上述任一项所述的障碍检测方法实施例中的步骤。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。

在本公开实施例所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，部分或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

另外，在本公开实施例各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开实施例的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本公开实施例各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

工业实用性

本公开实施例中，由于基于所述物体的位置信息以及所述地面区域的位置信息，共同确定障碍区域，而待检测图像中地面区域的位置信息是基于语义分割获取的，使得能够提高确定的地面区域的准确性，进而能够获取到准确度高的障碍区域，从而能够有效地对环境进行障碍物分析。

Claims

一种障碍检测方法，所述障碍检测方法包括：

获取待检测图像；

将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息；

将所述待检测图像进行语义分割，获取所述待检测图像中地面区域的位置信息；

基于所述物体的位置信息以及所述地面区域的位置信息获取障碍区域。
根据权利要求1所述的障碍检测方法，其中，

所述获取待检测图像，包括：

获取相机的标定参数，其中，所述标定参数包括畸变参数；

获取拍摄的目标图像，并基于所述畸变参数对所述目标图像进行矫正，得到所述待检测图像。
根据权利要求2所述的障碍检测方法，其中，所述标定参数还包括变换参数；

所述将所述待检测图像进行语义分割，获取所述待检测图像中地面区域的位置信息，包括：

将所述待检测图像输入第一深度神经网络，获取所述待检测图像中所有像素点的语义标签，其中，所述语义标签包括地面标签和背景标签；

基于所述变换参数，将所述待检测图像中所述地面标签对应的像素点变换为在所述相机坐标系的地面区域，得到所述地面区域在所述相机坐标系的位置信息。
根据权利要求2或3所述的障碍检测方法，其中，所述标定参数还包括变换参数，所述待检测图像中物体包括非特定物体；

所述将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息，还包括：

将所述待检测图像输入第二深度神经网络，获取所述待检测图像中所述非特定物体的轮廓框；

基于所述变换参数，将所述非特定物体的轮廓框变换为在所述相机坐标系的轮廓框，得到所述非特定物体在所述相机坐标系的位置信息。
根据权利要求2至4任一项所述的障碍检测方法，其中，所述标定参数还包括变换参数，所述待检测图像中物体包括特定物体；

所述将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息，包括：

将所述待检测图像输入第三深度神经网络，获取所述待检测图像中特定物体的图像位置信息；

基于所述变换参数，将所述物体的图像位置信息变换为所述特定物体在所述相机坐标系的位置信息。
根据权利要求5所述的障碍检测方法，其中，

所述将所述待检测图像输入第三深度神经网络，获取所述待检测图像中特定物体的图像位置信息，包括：

将所述待检测图像输入所述第三深度神经网络，获取所述待检测图像中特定物体的包围框；

基于所述包围框的对角坐标计算所述特定物体的图像位置信息。
根据权利要求1至6中任一项所述的障碍检测方法，其中，

所述障碍检测方法还包括：

基于所述物体的位置信息以及所述地面的位置信息形成当前规划地图，其中，所述当前规划地图包括可行驶区域，以及包括所述物体的障碍区域；

基于所述当前规划地图的可行驶区域获取规划路径。
根据权利要求7所述的障碍检测方法，其中，所述障碍检测方法还包括：

响应于所述待检测图像中物体包括非特定物体的情况，确定所述障碍区域包括所述非特定物体在所述相机坐标系的轮廓框所对应的区域；和/或，

响应于所述待检测图像中物体包括特定物体的情况，获取所述特定物体的类别信息；根据所述特定物体的位置信息和类别信息生成所述特定物体在相机坐标系的物体框；其中，所述障碍区域包括所述特定物体在所述相机坐标系的物体框所对应的区域。
一种障碍检测装置，所述障碍检测装置包括：

相机部分，被配置为获取待检测图像；

物体检测部分，被配置为将所述待检测图像进行物体检测，获取所述待检测图像中物体的位置信息；

语义分割部分，被配置为将所述待检测图像进行语义分割，获取所述待检测图像中地面区域的位置信息；

障碍检测部分，被配置为基于所述物体的位置信息以及所述地面区域的位置信息获取障碍区域。
根据权利要求9所述的装置，其中，所述相机部分，被配置为获取相机的标定参数，其中，所述标定参数包括畸变参数；获取拍摄的目标图像，并基于所述畸变参数对所述目标图像进行矫正，得到所述待检测图像。
根据权利要求10所述的装置，其中，所述标定参数还包括变换参数；所述语义分割部分，被配置为将所述待检测图像输入第一深度神经网络，获取所述待检测图像中所有像素点的语义标签，其中，所述语义标签包括地面标签和背景标签；基于所述变换参数，将所述待检测图像中所述地面标签对应的像素点变换为在所述相机坐标系的地面区域，得到所述地面区域在所述相机坐标系的位置信息。
根据权利要求10或11所述的装置，其中，所述标定参数还包括变换参数，所述待检测图像中物体包括非特定物体；所述物体检测部分，还被配置为将所述待检测图像输入第二深度神经网络，获取所述待检测图像中所述非特定物体的轮廓框；基于所述变换参数，将所述非特定物体的轮廓框变换为在所述相机坐标系的轮廓框，得到所述非特定物体在所述相机坐标系的位置信息。
根据权利要求10至12任一项所述的装置，其中，所述标定参数还包括变换参数，所述待检测图像中物体包括特定物体；所述物体检测部分，还被配置为将所述待检测图像输入第三深度神经网络，获取所述待检测图像中特定物体的图像位置信息；基于所述变换参数，将所述物体的图像位置信息变换为所述特定物体在所述相机坐标系的位置信息。
根据权利要求13所述的装置，其中，所述物体检测部分，还被配置为将所述待检测图像输入所述第三深度神经网络，获取所述待检测图像中特定物体的包围框；基于所述包围框的对角坐标计算所述特定物体的图像位置信息。
根据权利要求9至14任一项所述的装置，其中，所述装置还包括：

路径规划部分，被配置为基于所述物体的位置信息以及所述地面的位置信息形成当前规划地图，其中，所述当前规划地图包括可行驶区域，以及包括所述物体的障碍区域；基于所述当前规划地图的可行驶区域获取规划路径。
根据权利要求15所述的装置，其中，所述装置还包括：

区域确定部分，被配置为响应于所述待检测图像中物体包括非特定物体的情况，确定所述障碍区域包括所述非特定物体在所述相机坐标系的轮廓框所对应的区域；和/或，被配置为响应于所述待检测图像中物体包括特定物体的情况，获取所述特定物体的类别信息；根据所述特定物体的位置信息和类别信息生成所述特定物体在相机坐标系的物体框；其中，所述障碍区域包括所述特定物体在所述相机坐标系的物体框所对应的区域。
一种电子设备，包括相互耦接的存储器和处理器，所述处理器被配置为执行所述存储器中存储的程序指令，以实现权利要求1至8任一项所述的障碍检测方法。
一种计算机可读存储介质，其上存储有程序指令，所述程序指令被处理器执行时实现权利要求1至8任一项所述的障碍检测方法。
一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行用于实现如权利要求1至8任一项所述的障碍检测方法。