WO2021143935A1

WO2021143935A1 - 一种检测方法、装置、电子设备及存储介质

Info

Publication number: WO2021143935A1
Application number: PCT/CN2021/072750
Authority: WO
Inventors: 蔡颖婕; 曾星宇; 刘诗男; 闫俊杰; 王晓刚
Original assignee: 深圳市商汤科技有限公司
Priority date: 2020-01-19
Filing date: 2021-01-19
Publication date: 2021-07-22
Also published as: CN111274943B; SG11202108275VA; KR20220013565A; JP2022531625A; US20210358153A1; CN111274943A

Abstract

本公开提供了一种检测方法、装置、电子设备及存储介质，该方法包括：获取二维图像；基于所述获取的二维图像，构建二维图像中的至少一个待检测对象分别对应的结构化多边形，其中，每个待检测对象对应的结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影；针对每个待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的结构化多边形中竖边的高度信息，计算结构化多边形中顶点的深度信息；基于结构化多边形中顶点的深度信息、以及结构化多边形的顶点在二维图像中的二维坐标信息，确定待检测对象的三维空间信息，待检测对象的三维空间信息与待检测对象对应的三维边界框相关。

Description

一种检测方法、装置、电子设备及存储介质

相关申请的交叉引用

本公开要求于2020年1月19日提交的、申请号为202010060288.7、发明名称为“一种检测方法、装置、电子设备及存储介质”的中国专利申请的优先权，该中国专利申请公开的全部内容以引用的方式并入本文中。

技术领域

本公开涉及图像处理技术领域，具体而言，涉及一种检测方法、装置、电子设备及存储介质。

背景技术

在计算机视觉领域中，三维(3Division，3D)目标检测是最基本的任务之一。3D目标检测可应用于自动驾驶、机器人执行任务等场景中。

发明内容

有鉴于此，本公开至少提供一种检测方法、装置、电子设备及存储介质。

第一方面，本公开提供了一种检测方法，包括：获取二维图像；基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，其中，每个所述待检测对象对应的所述结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影；针对每个所述待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的所述结构化多边形中竖边的高度信息，计算所述结构化多边形中顶点的深度信息；基于所述结构化多边形中顶点的所述深度信息、以及所述结构化多边形的顶点在所述二维图像中的二维坐标信息，确定所述待检测对象的三维空间信息，所述待检测对象的所述三维空间信息与所述待检测对象对应的所述三维边界框相关。

由于构建的结构化多边形是待检测对象对应的三维边界框在二维图像中的投影，因此，构建的结构化多边形能够较好的表征待检测对象的三维特征。基于结构化多边形预测的深度信息与基于二维图像特征直接预测的深度信息相比，具有较高的准确度。进而，得到的待检测对象的三维空间信息的准确度较高，提高了3D检测结果的准确性。

第二方面，本公开提供了一种检测装置，所述检测装置包括：图像获取模块，用于获取二维图像；结构化多边形构建模块，用于基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，其中，每个所述待检测对象对应的所述结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影；深度信息确定模块，用于针对每个所述待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的所述结构化多边形中竖边的高度信息，计算所述结构化多边形中顶点的深度信息；三维空间信息确定模块，用于基于所述结构化多边形中顶点的所述深度信息、以及所述结构化多边形的顶点在所述二维图像中的二维坐标信息，确定所述待检测对象的三维空间信息，所述待检测对象的所述三维空间信息与所述待检测对象对应的所述三维边界框相关。

第三方面，本公开提供一种电子设备，包括：处理器；存储器，所述存储器存储有所述处理器可执行的机器可读指令；和总线，当所述电子设备运行时，所述处理器与所述存储器之间通过所述总线通信；所述机器可读指令被所述处理器执行时执行如上述第一方面或任一实施方式所述的检测方法的步骤。

第四方面，本公开提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述第一方面或任一实施方式所述的检测方法的步骤。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种检测方法的流程示意图；

图2a示出了本公开实施例所提供的一种检测方法中，待检测对象对应的结构化多边形的结构示意图；

图2b示出了本公开实施例所提供的一种检测方法中，待检测对象对应的三维边界框的结构示意图，该三维边界框在二维图像上的投影为图2a中的结构化多边形；

图3示出了本公开实施例所提供的一种检测方法中，构建待检测对象对应的结构化多边形的方法的流程示意图；

图4示出了本公开实施例所提供的一种检测方法中，确定待检测对象对应的结构化多边形的属性信息的方法的流程示意图；

图5示出了本公开实施例所提供的一种检测方法中，对待检测对象对应的目标图像进行特征提取的方法的流程示意图；

图6示出了本公开实施例所提供的一种检测方法中，特征提取模型的结构示意图；

图7示出了本公开实施例所提供的一种检测方法中，基于二维图像所确定的待检测对象对应的结构化多边形与该待检测对象对应的三维边界框之间对应关系的结构示意图；

图8示出了本公开实施例所提供的一种检测方法中，待检测图像的俯视图；

图9示出了本公开实施例所提供的一种检测方法中，得到待检测对象的调整后的三维空间信息的方法的流程示意图；

图10示出了本公开实施例所提供的一种检测方法中，图像检测模型的结构示意图；

图11示出了本公开实施例所提供的一种检测装置的架构示意图；

图12示出了本公开实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

为了实现无人车辆的安全行驶，避免车辆与周围对象发生碰撞，需要对车辆行驶过程中的周围对象进行检测，确定周围对象的位置、车辆的前进方向等空间信息，即需要进行3D目标检测。

在自动驾驶、机器人运输等场景中，一般会使用摄像设备拍摄得到二维图像，基于二维图像对车辆或机器人前方的目标对象进行识别，如识别前方障碍物，以使车辆或机器人对障碍物进行避让。由于从二维图像中仅能识别出目标对象在平面维度上的尺寸，无法准确掌握目标对象在真实世界中的三维空间信息，从而导致基于该识别结果执行自动驾驶、机器人运输等任务时，可能会出现一些危险状况，如撞车、撞到障碍物等。为了掌握目标对象在真实世界中的三维空间信息，本公开实施例提供了一种检测方法，基于二维图像得到待检测对象对应的结构化多边形以及深度信息，实现3D目标检测。

根据本公开实施例提供的检测方法，为获取的二维图像中涉及的每个待检测对象构建结构化多边形。由于构建的结构化多边形是待检测对象对应的三维边界框在二维图像中的投影，因此，构建的结构化多边形能够较好的表征待检测对象的三维特征。另外，根据本公开实施例提供的检测方法，基于待检测对象的高度信息、以及该待检测对象对应的结构化多边形中竖边的高度信息，计算结构化多边形中顶点的深度信息。这种基于结构化多边形预测的深度信息与基于二维图像特征直接预测的深度信息相比，具有较高的准确度。进而，在基于结构化多边形中顶点的深度信息、以及结构化多边形的顶点在二维图像中的二维坐标信息确定待检测对象的三维空间信息时，得到的三维空间信息的准确度较高，进而提高了3D目标检测结果的准确性。

为便于对本公开实施例进行理解，首先对本公开实施例所公开的一种检测方法进行详细介绍。

本公开实施例提供的检测方法可应用于服务器，或者应用于带有中央处理器的智能终端设备。服务器可以是本地服务器也可以是云端服务器等，智能终端设备可以是智能手机、平板电脑、个人数字处理(Personal Digital Assistant，PDA)等，本公开对此并不限定。

本公开提供的检测方法可以应用于任一需要感知待检测对象的场景中，例如，该检测方法可以应用于自动驾驶场景中，也可以应用于机器人执行任务的场景中。例如，该检测方法应用于自动驾驶场景中时，车辆上设置的摄像设备获取车辆行驶过程中的二维图像，并将获取的二维图像发送给服务器进行3D目标检测，或者，将获取的二维图像发送给智能终端设备。服务器或智能终端设备基于本公开实施例提供的检测方法对二维图像进行处理，确定二维图像中涉及的每个待检测对象的三维空间信息。

参见图1所示，为本公开实施例所提供的一种检测方法的流程示意图，以该检测方法应用于服务器为例进行说明。该检测方法包括以下步骤S101-S104。

在S101，获取二维图像。其中，所述二维图像涉及至少一个待检测对象。

在S102，基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形。其中，一个待检测对象对应的结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影。

在S103，针对每个待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的结构化多边形中竖边的高度信息，计算结构化多边形中顶点的深度信息。

在S104，基于计算得到的结构化多边形中顶点的深度信息、以及结构化多边形的顶点在二维图像中的二维坐标信息，确定待检测对象的三维空间信息，待检测对象的三维空间信息与待检测对象对应的三维边界框相关。

以下对S101～S104分别进行说明。

针对S101：本公开实施例中，服务器或智能终端设备可以实时获取摄像设备拍摄的二维图像，也可以从存储有二维图像的存储模块中获取在预设拍摄周期内的二维图像。其中，二维图像可以为摄像设备获取的红绿蓝(red-green-blue，RGB)图像。

在具体实施时，针对自动驾驶或机器人运输等场景，可以在车辆行驶或机器人运输过程中，实时的获取车辆或机器人当前位置对应的二维图像，并对获取的二维图像进行处理。

针对S102：本公开实施例中，参见图2a和图2b所示的一种检测方法中，待检测对象对应的结构化多边形和该待检测对象对应的三维边界框的结构示意图。其中，该待检测对象对应的结构化多边形24为长方体结构的三维边界框25在二维图像上的投影。在具体实施时，若二维图像中包括多个待检测对象，则为每个待检测对象构建对应的结构化多边形。在具体实施时，待检测对象可以为车辆行驶过程中，需要检测的任一对象。例如，待检测对象可以为车辆、动物、行人等。

一种可能的实施方式中，参见图3所示，基于获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，包括以下步骤S301-S302。

在S301，基于二维图像，确定每个待检测对象对应的结构化多边形的属性信息。其中，属性信息包括以下至少一种：顶点信息、表面信息、以及轮廓线信息。

在S302，基于每个待检测对象对应的结构化多边形的属性信息，构建每个待检测对象对应的结构化多边形。

示例性的，在属性信息包括顶点信息的情况下，可以基于二维图像，确定每个待检测对象对应的结构化多边形的多个顶点信息，通过得到的多个顶点信息，构建每个待检测对象对应的结构化多边形。以图2a为例进行说明，多个顶点信息可以为结构化多边形24的八个顶点的坐标信息，即顶点P ₁、P ₂、P ₃、P ₄、P ₅、P ₆、P ₇、P ₈中每个顶点的坐标信息。或者，多个顶点信息还可以为结构化多边形24中部分顶点的坐标信息，基于这部分顶点的坐标信息可以唯一确定一个结构化多边形。例如，部分顶点的坐标信息可以为顶点P ₃、P ₄、P ₅、P ₆、P ₇、P ₈中每个顶点的坐标信息，或者，部分顶点的坐标信息还可以为顶点P ₃、P ₆、P ₇、P ₈中每个顶点的坐标信息。具体使用哪些部分顶点来唯一确定一个结构化多边形可以根据实际情况进行确定，本公开实施例对此不进行具体限定。

示例性的，在属性信息包括表面信息的情况下，可以基于二维图像，确定每个待检测对象对应的结构化多边形的多个表面的平面信息，并通过得到的多个平面信息，构建每个待检测对象对应的结构化多边形。以图2a为例进行说明，多个平面信息可以为结构化多边形24的六个表面的形状及位置。或者，多个平面信息还可以为结构化多边形24中部分表面的形状及位置，基于这部分表面的形状及位置可以唯一确定一个结构化多边形。例如，部分表面可以为第一平面21、第二平面22、以及第三平面23，或者，部分表面还可以为第一平面21以及第二平面22。具体使用哪些部分平面来唯一确定一个结构化多边形，可以根据实际情况进行确定，本公开实施例对此不进行具体限定。

示例性的，在属性信息包括轮廓线信息的情况下，可以基于二维图像，确定每个待检测对象对应的结构化多边形的多条轮廓线信息，并通过得到的多条轮廓线信息，构建每个待检测对象对应的结构化多边形。以图2a为例进行说明，多条轮廓线信息可以为结构化多边形24的12条轮廓线的位置以及长度。或者，多条轮廓线信息还可以为结构化多边形24中部分轮廓线的位置以及长度，基于这部分轮廓线的位置以及长度可以唯一确定一个结构化多边形。例如，部分轮廓线可以为顶点P ₇与顶点P ₈构成的轮廓线(第一轮廓线)、顶点P ₇与顶点P ₃构成的轮廓线(第二轮廓线)、以及顶点P ₇与顶点P ₆构成的轮廓线(第三轮廓线)，或者，部分轮廓线可以为顶点P ₇与顶点P ₈构成的轮廓线(第一轮廓线)、顶点P ₇与顶点P ₃构成的轮廓线(第二轮廓线)、顶点P ₇与顶点P ₆构成的轮廓线(第三轮廓线)、以及顶点P ₄与顶点P ₈构成的轮廓线(第四轮廓线)。具体使用哪些轮廓线来唯一确定一个结构化多边形，可以根据实际情况进行确定，本公开实施例对此不进行具体限定。

通过上述步骤，顶点信息(结构化多边形一般包括多个顶点)、平面信息(结构化多边形一般包括多个表面)、轮廓线信息(结构化多边形一般包括多条轮廓线)为构成结构化多边形的基本信息，基于这些基本信息能够唯一构建一个结构化多边形，且较准确的表征待检测对象的形状。

一种可能的实施方式中，参见图4所示，基于二维图像，确定每个待检测对象对应的结构化多边形的属性信息，包括以下步骤S401-S403。

S401，对二维图像进行对象检测，得到二维图像中的至少一个对象区域。其中，每个对象区域包含一个待检测对象。

S402，基于每个待检测对象对应的对象区域以及第二预设尺寸信息，从二维图像中，截取每个待检测对象对应的目标图像。其中，第二预设尺寸信息表示大于或等于每个待检测对象的对象区域的尺寸。

S403，对每个待检测对象对应的目标图像进行特征提取，得到每个待检测对象对应的结构化多边形的属性信息。

本公开实施例中，可以通过训练好的第一神经网络模型对二维图像进行对象检测，得到二维图像中涉及的每个待检测对象对应的第一检测框(第一检测框中的区域即为对象区域)。其中，每个对象区域包含一个待检测对象。

在具体实施时，对每个待检测对象对应的目标图像进行特征提取时，可以使得每个待检测对象对应的目标图像的尺寸一致，故可以设置第二预设尺寸。这样，从二维图像中截取每个待检测对象对应的目标图像，可使得每个待检测对象对应的目标图像的尺寸与第二预设尺寸相同。

示例性的，第二预设尺寸信息可以根据历史经验进行确定。例如，可以基于历史经验中每个对象区域的尺寸，从多个对象区域对应的尺寸中选择最大的尺寸作为第二预设尺寸。这样，可使得设置的第二预设尺寸大于或等于每个对象区域的尺寸，进而使得对目标图像进行特征提取的模型的输入一致，且保证每个对象区域中包含的待检测对象的特征完整。换言之，可避免第二预设尺寸小于任一对象区域的尺寸时，造成该对象区域中涉及的待检测对象的特征遗漏。例如，若第二预设尺寸小于待检测对象A的对象区域的尺寸时，基于第二预设尺寸得到了待检测对象A对应的目标图像ImgA，则目标图像 ImgA中包含的待检测对象A的特征不完整，进而使得得到的待检测对象A对应的结构化多边形的属性信息不准确。示例性的，可以以每个对象区域的中心点作为目标图像的中心点、以第二预设尺寸为大小，从二维图像中截取每个待检测对象对应的目标图像。

在具体实施时，可以通过训练好的结构检测模型，对每个待检测对象对应的目标图像进行特征提取，得到每个待检测对象对应的结构化多边形的属性信息。其中，结构检测模型可以基于基础的深度学习模型训练得到。

例如，在结构检测模型包括顶点确定模型的情况下，通过训练基础的深度学习模型得到顶点确定模型，将每个待检测对象对应的目标图像输入至经训练的顶点确定模型，得到待检测对象对应的全部顶点坐标或者部分顶点坐标。或者，在结构检测模型包括平面确定模型的情况下，通过训练基础的深度学习模型得到平面确定模型，将每个待检测对象对应的目标图像输入至经训练的平面确定模型，得到待检测对象对应的全部平面的信息或者部分平面的信息，平面的信息包括平面位置、平面形状、平面尺寸中的至少一种。或者，在结构检测模型包括轮廓线确定模型的情况下，通过训练基础的深度学习模型得到轮廓线确定模型，将每个待检测对象对应的目标图像输入至经训练的轮廓线确定模型，得到待检测对象对应的全部轮廓线的信息或者部分轮廓线的信息，轮廓线的信息包括轮廓线位置、长度。

本公开实施例中，先从二维图像中截取每个待检测对象对应的目标图像，再对每个待检测对象对应的目标图像进行特征提取，得到每个待检测对象对应的结构化多边形的属性信息。其中，将每个待检测对象对应的目标图像处理成统一的尺寸大小，可以简化用于对目标图像进行特征提取的模型的处理，提高处理效率。

示例性的，参见图5所示，在属性信息包括顶点信息的情况下，可以根据以下步骤S501～S503对每个待检测对象对应的目标图像进行特征提取，得到每个所述待检测对象对应的结构化多边形的属性信息。

S501，基于卷积神经网络提取待检测对象对应的目标图像的特征数据。

S502，基于堆叠的至少一个沙漏网络对特征数据进行处理，得到待检测对象对应的热力图集。其中，热力图集中包括多个热力图，每个热力图包含待检测对象对应的结构化多边形的多个顶点中的一个顶点。

S503，基于待检测对象的热力图集，确定待检测对象对应的结构化多边形的属性信息。

本公开实施例中，可以通过训练好的特征提取模型对每个待检测对象对应的目标图像进行处理，确定每个待检测对象对应的结构化多边形的属性信息。其中，特征提取模型可包括卷积神经网络、堆叠的至少一个沙漏网络，堆叠的至少一个沙漏网络的数量可以根据实际需要进行确定。具体的，参见图6所示的特征提取模型的结构示意图，包括目标图像601、卷积神经网络602、堆叠的两个沙漏网络603。针对每个待检测对象，将该待检测对象对应的目标图像601输入至卷积神经网络602中进行特征提取，确定目标图像601对应的特征数据；将目标图像601对应的特征数据输入堆叠的两个沙漏网络603中进行处理，得到该待检测对象对应的热力图集。这样，可基于待检测对象对应的热力图集，确定待检测对象对应的结构化多边形的属性信息。

其中，一个热力图集中包括多个热力图，每个热力图中的每个特征点对应一概率值，该概率值为表征该特征点为顶点的概率。这样，可从热力图中选择概率值最大的特征点作为该热力图所属热力图集对应的结构化多边形的多个顶点中的一个顶点。此外，每个热力图对应的顶点位置不同，一个热力图集中包括的多个热力图的数量可以根据实际需要进行设置。

示例性的，若属性信息包含结构化多边形的八个顶点的坐标信息，则可以设置热力图集中包括八个热力图。第一热力图可以包含图2a中结构化多边形的顶点P ₁、第二热力图可以包含图2a中结构化多边形的顶点P ₂、…、第八热力图可以包含图2a中结构化多边形的顶点P ₈。若属性信息包含结构化多边形的部分顶点的坐标信息，例如，部分顶点P ₃、P ₄、P ₅、P ₆、P ₇、P ₈，则可以设置热力图集中包括六个热力图，第一热力图可以包含图2a中结构化多边形的顶点P ₃、第二热力图可以包含图2a中结构化多边形的顶点P ₄、…、第六热力图可以包含图2a中结构化多边形的顶点P ₈。

一种可能的实施方式中，基于二维图像，确定待检测对象对应的结构化多边形的属性信息，包括：对二维图像进行特征提取，得到二维图像中多个目标元素的信息，目标元素包括顶点、表面、和轮廓线中的至少一种；基于所述多个目标元素的信息，对各个所述目标元素进行聚类，得到至少一个聚类后的目标元素集合；针对每个所述目标元素集合：根据所述目标元素集合中的目标元素组成结构化多边形，并将该目标元素集合中的目标元素的信息作为该结构化多边形的属性信息。

本公开实施例中，还可以对二维图像进行特征提取，确定二维图像中每个待检测对象对应的结构化多边形的属性信息。例如，目标元素为顶点时，若二维图像中包括两个待检测对象，即第一待检测对象和第二待检测对象，则对二维图像进行特征提取，得到二维图像中包括的多个顶点的信息。基于多个顶点的信息，对各个顶点进行聚类(即基于顶点的信息，确定顶点对应的待检测对象，将属于同一待检测对象的顶点聚类在一起)，得到聚类后的目标元素集合。其中，第一待检测对象对应第一目标元素集合，第二待检测对象对应第二目标元素集合。可根据第一目标元素集合中的目标元素组成第一待检测对象对应的结构化多边形，并将第一目标元素集合中的目标元素的信息作为第一待检测对象对应的结构化多边形的属性信息。可根据第二目标元素集合中的目标元素组成第二待检测对象对应的结构化多边形，并将第二目标元素集合中的目标元素的信息作为第二待检测对象对应的结构化多边形的属性信息。

本公开实施例中，通过对二维图像中的各个目标元素进行聚类，得到每个类别下的目标元素集合，且这样得到的一个目标元素集合中的元素即为一个待检测对象中的元素。然后，基于每个目标元素集合，可以得到该目标元素集合对应的待检测对象的结构化多边形。

针对S103：考虑到二维图像中没有深度信息，为了确定二维图像的深度信息，本公开实施例中，可以通过待检测对象的高度信息、以及待检测对象对应的结构化多边形中至少一条边的高度信息，计算结构化多边形中顶点的深度信息。

一种可能的实施方式中，针对每个待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的结构化多边形中竖边的高度信息，计算结构化多边形中顶点的深度信息，包括：针对每个待检测对象，确定该待检测对象的高度与结构化多边形中的每条竖边的高度之间的比值；将每条竖边对应的比值与拍摄二维图像的摄像设备的焦距之间的乘积，确定为该条竖边对应的顶点的深度信息。

参见图7所示，图中示出了待检测对象对应的结构化多边形701、待检测对象在三维空间中的三维边界框702、以及摄像设备703。由图7可知，待检测对象的高度H、该待检测对象对应的结构化多边形中至少一条竖边的高度h _j、以及至少一条竖边对应的顶点的深度信息Z _j存在如下关系：

其中，f为摄像设备的焦距，；j＝{1,2,3,4}，为结构化多边形的四条竖边中的任一条竖边的序号(即h ₁对应第1竖边的高度，h ₂对应第2竖边的高度等)。

在具体实施时，f的值可以根据摄像设备进行确定。若j为4，则通过确定h ₄的值以及对应的待检测对象的高度H，可得到h ₄对应的竖边上任一点的深度信息，即得到了第 4竖边两端的顶点的深度信息。进一步，可以得到结构化多边形上每一个顶点的深度信息。

示例性的，h _j的值可以在结构化多边形上确定；或者，在属性信息为轮廓线信息时，在得到轮廓线信息后，基于得到的轮廓线信息确定h _j的值；或者，也可以设置高度信息检测模型，基于高度信息检测模型，确定结构化多边形中h _j的值。其中，高度信息检测模型可以基于神经网络模型训练得到。

一种可能的实施方式中，确定待检测对象的高度，包括：基于二维图像和预先训练的用于进行高度检测的神经网络，确定二维图像中每个待检测对象的高度；或者，预先采集多个不同姿态的待检测对象的真实高度值，将采集的多个真实高度值的平均值作为待检测对象的高度；或者，基于二维图像和预先训练的用于进行对象检测的神经网络，得到待检测对象的回归变量，并基于回归变量以及预先得到的多个不同姿态的待检测对象的平均高度确定待检测对象的高度。其中，回归变量用于表征待检测对象的高度与平均高度之间的偏差程度。

示例性的，在待检测对象为车辆时，可以预先采集多种不同型号的车辆的真实高度值，对采集的多个真实高度值求平均值，将得到的平均值作为待检测对象的高度。

示例性的，还可以将二维图像输入至训练好的进行高度检测的神经网络中，得到二维图像中涉及的每个待检测对象的高度。或者，还可以将裁剪后得到的每个待检测对象对应的目标图像输入至训练好的进行高度检测的神经网络中，得到目标图像对应的待检测对象的高度。

示例性的，还可以将二维图像输入至训练好的进行对象检测的神经网络中，得到每个待检测对象的回归变量，基于回归变量以及预先得到的多个不同姿态的待检测对象的平均高度，确定每个待检测对象的高度。或者，还可以将裁剪后得到的每个待检测对象对应的目标图像输入训练好的进行对象检测的神经网络中，得到每个待检测对象的回归变量，基于回归变量以及预先得到的多个不同姿态的待检测对象的平均高度，确定每个待检测对象的高度。其中，回归变量t _H、平均高度A _H、以及高度H之间存在如下关系：

通过上述公式(2)可得到每个待检测对象对应的高度H。

针对S104：本公开实施例中，可以基于计算得到的结构化多边形中顶点的深度信息，以及结构化多边形的顶点在二维图像中的二维坐标信息，确定待检测对象对应的三维边界框的三维坐标信息。基于待检测对象对应的三维边界框的三维坐标信息，确定待检测对象的三维空间信息。

具体的，待检测对象上的每一点均可以在二维图像上得到唯一的投影点。故待检测对象上的每一点与二维图像上的对应的特征点之间存在如下关系：

K·[X _i，Y _i，Z _i] ^T＝[u _i，v _i，1] ^T·Z _i； (3)

其中，K为摄像设备内参，i可以表征待检测对象上的任一点，[X _i，Y _i，Z _i]为待检测对象上任一点i对应的三维坐标信息，(u _i，v _i)为待检测对象上任一点i在二维图像上的投影点的二维坐标信息。Z _i为求解得到的对应的深度信息。其中，三维坐标信息为在建立的世界坐标系下的坐标信息，二维坐标信息为在建立的成像平面坐标系下的坐标信息。世界坐标系与成像平面坐标系的原点位置相同。

示例性的，i还可以表征待检测对象对应的三维边界框上的顶点，则i＝1、2、…、8，[X _i，Y _i，Z _i]为三维边界框上的顶点的三维坐标信息，(u _i，v _i)为三维边界框上的顶点投影在二维图像中的结构化多边形的顶点的二维坐标信息，Z _i为求解得到的对应的深度信息。

其中，待检测对象的三维空间信息与待检测对象对应的三维边界框相关。例如，根据一个待检测对象对应的三维边界框可以确定出该待检测对象的三维空间信息。在具体实施时，三维空间信息可以包括空间位置信息、朝向信息、以及尺寸信息中的至少一种。

本公开实施例中，空间位置信息可以为待检测对象对应的三维边界框的中心点的坐标信息，例如，图2中的线段P ₁P ₇(顶点P ₁与顶点P ₇的连线)与线段P ₂P ₈(顶点P ₂与顶点P ₈的连线)之间的交点的坐标信息；也可以为待检测对象对应的三维边界框中任一表面的中心点的坐标信息，例如，图2中顶点P ₂、顶点P ₃、顶点P ₆、顶点P ₇构成的平面的中心点的坐标信息，即线段P ₂P ₇与线段P ₃P ₆之间的交点的坐标信息。

本公开实施例中，朝向信息可以为三维边界框上设置的目标平面与预设的基准平面之间的夹角值。如图8所示的是一种待检测图像的俯视图。图8中包括待检测对象对应的三维边界框上设置的目标平面81以及预设的基准平面82(基准平面可以为摄像设备所在的平面)，可知待检测对象83的朝向信息可以为夹角θ ₁，待检测对象84的朝向信息可以为夹角θ ₂，待检测对象85的朝向信息可以为夹角θ ₃。

本公开实施例中，尺寸信息可以为待检测对象对应的三维边界框的长度、宽度、以及高度中的任意一个或多个。例如，三维边界框的长度可以为线段P ₃P ₇的值，三维边界框的宽度可以为线段P ₃P ₂的值，三维边界框的高度可以为线段P ₃P ₄的值。示例性的，在确定待检测对象对应的三维边界框的三维坐标信息之后，还可以计算四条长边的均值，将得到的长度均值确定为三维边界框的长度。例如，计算线段P ₃P ₇、P ₄P ₈、P ₁P ₅、P ₂P ₆的长度平均值，将得到的长度平均值确定为三维边界框的长度。同理，可得到待检测对象对应的三维边界框的宽度与高度。或者，由于三维边界框中的部分边存在被遮挡的情况，因此为了提高计算得到的尺寸信息的准确度，可以通过选择的部分长边确定三维边界框的长度、选择的部分宽边确定三维边界框的宽度、选择的部分竖边确定三维边界框的高度，来确定三维边界框的尺寸信息。示例性的，选择的部分长边可以为不被遮挡的长边、选择的部分宽边可以为不被遮挡的宽边、选择的部分竖边可以为不被遮挡的竖边。比如计算线段P ₃P ₇、P ₄P ₈、P ₁P ₅的长度平均值，将得到的长度平均值确定为三维边界框的长度。同理，可得到待检测对象对应的三维边界框的宽度与高度。

一种可能的实施方式中，确定待检测对象的三维空间信息之后，方法还包括：基于二维图像以及二维图像对应的深度图，生成二维图像对应的鸟瞰图；基于鸟瞰图调整每个待检测对象的三维空间信息，得到待检测对象的调整后的三维空间信息。

本公开实施例中，可以基于二维图像确定对应的深度图，例如，可以将二维图像输入至训练好的深度有序回归网络(deep ordinal regression network，DORN)中，得到二维图像对应的深度图。示例性的，还可以基于双目测距的方法确定二维图像对应的深度图。或者，还可以基于深度相机确定二维图像对应的深度图。具体的，确定二维图像对应的深度图的方法可以根据实际情况进行确定，只要所得到的深度图与二维图像的尺寸一致即可。

本公开实施例中，基于二维图像以及二维图像对应的深度图，生成二维图像对应的鸟瞰图，鸟瞰图包括深度值。基于鸟瞰图对待检测对象的三维空间信息进行调整时，可以使得调整后的三维空间信息与对应的待检测对象更加相符。

一种可能的实施方式中，基于二维图像以及二维图像对应的深度图，生成二维图像对应的鸟瞰图，包括：基于二维图像以及二维图像对应的深度图，得到二维图像对应的点云数据，其中，点云数据包括二维图像对应的真实空间中多个空间点的三维坐标值；基于点云数据中每个空间点的三维坐标值，生成二维图像对应的鸟瞰图。

本公开实施例中，针对二维图像上的特征点i，基于该特征点的二维坐标信息(u _i，v _i)以及对应的在深度图上的深度值Z _i，通过上述提供的公式(3)得到该特征点i对应的真实空间中的空间点的三维坐标值(X _i，Y _i，Z _i)，进而可得到二维图像所对应的真实空间中每个空间点的三维坐标值。进一步，基于点云数据中每个空间点的三维坐标值，生成二维图像对应的鸟瞰图。

一种可能的实施方式中，基于点云数据中每个空间点的三维坐标值，生成二维图像对应的鸟瞰图，包括：针对每个空间点，将该空间点的横轴坐标值确定为鸟瞰图中与该空间点对应的特征点的横轴坐标值，将该空间点的纵轴坐标值确定为鸟瞰图中与该空间点对应的特征点的像素通道值，将该空间点的竖轴坐标值确定为鸟瞰图中与该空间点对应的特征点的纵轴坐标值。

本公开实施例中，针对空间点A(X _A，Y _A，Z _A)，将该空间点的横轴坐标值X _A确定为鸟瞰图中与该空间点A对应的特征点的横轴坐标值，将该空间点的纵轴坐标值Y _A确定为鸟瞰图中与该空间点A对应的特征点的像素通道值，将该空间点的竖轴坐标值Z _A确定为鸟瞰图中与该空间点A对应的特征点的纵轴坐标值。

其中，鸟瞰图上的一个特征点可能对应多个空间点，所述多个空间点为处于同一水平位置、不同高度值的空间点。换言之，所述多个空间点的X _A，Y _A均相同，但Z _A不相同。在这种情况下，可从所述多个空间点对应的竖轴坐标值Z _A中选择最大的值作为该特征点对应的像素通道值。

一种可能的实施方式中，参见图9所示，针对每个待检测对象，基于鸟瞰图调整该待检测对象的三维空间信息，得到该待检测对象的调整后的三维空间信息，包括：S901，提取鸟瞰图对应的第一特征数据；S902，基于每个待检测对象的三维空间信息以及第一预设尺寸信息，在鸟瞰图对应的第一特征数据中，选取每个待检测对象对应的第二特征数据；S903，基于每个待检测对象对应的第二特征数据，确定该待检测对象的调整后的三维空间信息。

本公开实施例中，可以基于卷积神经网络提取鸟瞰图对应的第一特征数据。示例性的，可以基于每个待检测对象的三维空间信息，确定每个待检测对象对应的三维边界框。以三维边界框的中心点为中心，以第一预设尺寸为大小，确定每个待检测对象对应的选取框。基于确定的选取框，从鸟瞰图对应的第一特征数据中，选取每个待检测对象对应的第二特征数据。例如，若第一预设尺寸为长6厘米、宽4厘米，则以三维边界框的中心点为中心，确定长为6厘米、宽为4厘米的选取框，基于确定的目标选取框，从鸟瞰图对应的第一特征数据中，选取每个待检测对象对应的第二特征数据。

本公开实施例中，还可以将每个待检测对象对应的第二特征数据输入到至少一个卷积层进行卷积处理，得到第二特征数据对应的中间特征数据。将得到的中间特征数据输入至第一全连接层进行处理，得到待检测对象的三维空间信息的残差值。基于三维空间信息的残差值，确定该待检测对象的调整后的三维空间信息。或者，还可以将得到的中间特征数据输入至第二全连接层进行处理，直接得到该待检测对象的调整后的三维空间信息。

本公开实施例中，通过从鸟瞰图对应的第一特征数据中，选取每个待检测对象对应的第二特征数据，基于每个待检测对象对应的第二特征数据，确定该待检测对象的调整后的三维空间信息。这样，使得用于确定待检测对象的调整后的三维空间信息的模型的数据处理量较小，可以提高处理效率。

示例性的，可以设置图像检测模型，将获取的二维图像输入至训练好的图像检测模型中进行处理，得到二维图像中包括的每个待检测对象的调整后的三维空间信息。参见图10所示的一种检测方法中，图像检测模型的结构示意图。该图像检测模型包括第一卷积层1001、第二卷积层1002、第三卷积层1003、第四卷积层1004、第一检测模型1005、第二检测模型1006以及优化模型1007。其中，第一检测模型1005包括堆叠的两个沙漏网络10051，第二检测模型1006包括至少一个第一全连接层10061，优化模型1007包括深度有序回归网络10071、第五卷积层10072、第六卷积层10073、第七卷积层10074、第二全连接层10075。

具体的，将获取的二维图像1008输入至截取模型中进行处理，得到二维图像中包括的至少一个待检测对象对应的目标图像1009。其中，截取模型用于对二维图像进行检测，得到二维图像中包括的至少一个待检测对象对应的矩形检测框。然后，基于每个待检测对象对应的矩形检测框以及对应的第二预设尺寸信息，从二维图像中，选取每个待检测对象对应的目标图像。

在得到目标图像之后，将每个目标图像1009输入至第一卷积层1001进行卷积处理，得到每个目标图像对应的第一卷积特征数据。接着，将每个目标图像对应的第一卷积特征数据输入至第一检测模型1005中，第一检测模型1005中堆叠的两个沙漏网络10051对每个目标图像对应的第一卷积特征数据进行处理，得到每个目标图像对应的结构化多边形。然后，将得到的每个目标图像对应的结构化多边形输入至第二检测模型1006中。

同时，将每个目标图像对应的第一卷积特征数据依次输入至第二卷积层1002、第三卷积层1003、第四卷积层1004中进行卷积处理，得到每个目标图像对应的第二卷积特征数据。将第二卷积特征数据输入至第二检测模型1006中，第二检测模型1006中的至少一个第一全连接层10061对第二卷积特征数据进行处理，得到每个待检测对象的高度信息。基于每个待检测对象的高度信息以及接收到的结构化多边形，确定每个待检测对象中顶点的深度信息，进而得到了每个待检测对象的三维空间信息，将得到的三维空间信息输入至优化模型中。

同时，将二维图像输入至优化模型1007中，优化模型1007中的深度有序回归网络10071对二维图像进行处理，得到二维图像对应的深度图。基于二维图像以及二维图像对应的深度图，得到二维图像对应的鸟瞰图以输入至第五卷积层10072中进行卷积处理，得到鸟瞰图对应的第一特征数据。接着，基于得到的三维空间信息以及第一预设尺寸信息，从鸟瞰图对应的第一特征数据中，选取每个待检测对象对应的第二特征数据。然后，将第二特征数据依次输入至第六卷积层10073以及第七卷积层10074中进行卷积处理，得到第三卷积特征数据。最后，将第三卷积特征数据输入至第二全连接层10075中进行处理，得到每个待检测对象的调整后的三维空间信息。

根据本公开实施提供的一种检测方法，由于构建的结构化多边形是待检测对象对应的三维边界框在二维图像中的投影，因此，所构建的结构化多边形能够较好的表征待检测对象的三维特征。这使得，基于该结构化多边形预测的深度信息，与基于二维图像特征直接预测的深度信息相比，具有较高的准确度，进而使得相应得到的待检测对象的三维空间信息的准确度较高，提高了3D检测结果的准确性。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

本公开实施例还提供了一种检测装置，参见图11所示，为本公开实施例提供的检测装置的架构示意图，包括图像获取模块1101、结构化多边形构建模块1102、深度信息确定模块1103、三维空间信息确定模块1104，具体的：图像获取模块1101，用于获取二维图像；结构化多边形构建模块1102，用于基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，其中，每个所述待检测对象对应的所述结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影；深度信息确定模块1103，用于针对每个所述待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的所述结构化多边形中竖边的高度信息，计算所述结构化多边形中顶点的深度信息；三维空间信息确定模块1104，用于基于所述结构化多边形中顶点的所述深度信息、以及所述结构化多边形的顶点在所述二维图像中的二维坐标信息，确定所述待检测对象的三维空间信息，所述待检测对象的所述三维空间信息与所述待检测对象对应的所述三维边界框相关。

一种可能的实施方式中，所述检测装置还包括：鸟瞰图确定模块1105，用于基于所述二维图像以及所述二维图像对应的深度图，生成所述二维图像对应的鸟瞰图；调整模块1106，用于针对每个所述待检测对象，基于所述鸟瞰图调整每个所述检测对象的所述三维空间信息，得到所述待检测对象的调整后的三维空间信息。

一种可能的实施方式中，所述鸟瞰图确定模块用于：基于所述二维图像以及所述二维图像对应的深度图，得到所述二维图像对应的点云数据，其中，所述点云数据包括所述二维图像对应的真实空间中多个空间点的三维坐标值；基于所述点云数据中每个所述空间点的三维坐标值，生成所述二维图像对应的鸟瞰图。

一种可能的实施方式中，所述鸟瞰图确定模块用于：针对每个所述空间点：将该空间点的横轴坐标值确定为所述鸟瞰图中与该空间点对应的特征点的横轴坐标值，将该空间点的纵轴坐标值确定为所述鸟瞰图中与该空间点对应的特征点的像素通道值，将该空间点的竖轴坐标值确定为所述鸟瞰图中与该空间点对应的特征点的纵轴坐标值。

一种可能的实施方式中，所述调整模块用于：提取所述鸟瞰图对应的第一特征数据；基于每个所述待检测对象的所述三维空间信息以及第一预设尺寸信息，在所述鸟瞰图对应的所述第一特征数据中，选取每个所述待检测对象对应的第二特征数据；基于每个所述待检测对象对应的所述第二特征数据，确定该待检测对象的所述调整后的三维空间信息。

一种可能的实施方式中，所述结构化多边形构建模块用于：基于所述二维图像，确定每个所述待检测对象对应的所述结构化多边形的属性信息，其中，所述属性信息包括以下至少一种：顶点信息、表面信息、以及轮廓线信息；基于每个所述待检测对象对应的结构化多边形的所述属性信息，构建每个待检测对象对应的所述结构化多边形。

一种可能的实施方式中，所述结构化多边形构建模块用于：对所述二维图像进行对象检测，得到所述二维图像中的至少一个对象区域，其中，每个所述对象区域包含一个所述待检测对象；基于每个所述待检测对象对应的所述对象区域以及第二预设尺寸信息，从所述二维图像中，截取每个所述待检测对象对应的目标图像，其中，所述第二预设尺寸信息表示大于或等于每个所述待检测对象的对象区域的尺寸；对每个所述待检测对象对应的目标图像进行特征提取，得到每个所述待检测对象对应的所述结构化多边形的所述属性信息。

一种可能的实施方式中，所述结构化多边形构建模块用于：基于卷积神经网络提取所述目标图像的特征数据；基于堆叠的至少一个沙漏网络对所述特征数据进行处理，得到所述目标图像对应的所述待检测对象的热力图集，其中，所述热力图集中包括多个热力图，每个所述热力图包含所述待检测对象对应的所述结构化多边形的多个顶点中的一个顶点；基于所述待检测对象对应所述热力图集，确定所述待检测对象对应的所述结构化多边形的所述属性信息。

一种可能的实施方式中，所述结构化多边形构建模块用于：对所述二维图像进行特征提取，得到所述二维图像中多个目标元素的信息，所述目标元素包括顶点、表面、和轮廓线中的至少一种；基于所述多个目标元素的信息，对各个所述目标元素进行聚类，得到至少一个聚类后的目标元素集合；针对每个所述目标元素集合：根据所述目标元素集合中的目标元素组成结构化多边形，并将该目标元素集合中的目标元素的信息作为该结构化多边形的属性信息。

一种可能的实施方式中，所述深度信息确定模块用于：针对每个所述待检测对象，确定该待检测对象的高度与所述结构化多边形中的每条竖边的高度之间的比值；将每条所述竖边对应的所述比值与拍摄所述二维图像的摄像设备的焦距之间的乘积，确定为该条竖边对应的顶点的深度信息。

一种可能的实施方式中，所述深度信息确定模块用于：基于所述二维图像和预先训练的用于进行高度检测的神经网络，确定所述二维图像中每个所述待检测对象的高度；或者，预先采集多个不同姿态的待检测对象的真实高度值，将采集的多个真实高度值的平均值作为所述待检测对象的高度；或者，基于所述二维图像和预先训练的用于进行对象检测的神经网络，得到所述待检测对象的回归变量，并基于所述回归变量以及预先得到的多个不同姿态的待检测对象的平均高度，确定所述待检测对象的高度；其中，所述回归变量用于表征所述待检测对象的高度与所述平均高度之间的偏差程度。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模板可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

本公开实施例还提供了一种电子设备。参照图12所示，为本公开实施例提供的电子设备的结构示意图，包括处理器1201、存储器1202和总线1203。其中，存储器1202 用于存储执行指令，包括内存12021和外部存储器12022。内存12021也称内存储器，用于暂时存放处理器1201中的运算数据，以及与硬盘等外部存储器12022交换的数据。处理器1201通过内存12021与外部存储器12022进行数据交换，当电子设备1200运行时，处理器1201与存储器1202之间通过总线1203通信，使得处理器1201执行以下指令：获取二维图像；基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，其中，每个所述待检测对象对应的所述结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影；针对每个所述待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的所述结构化多边形中竖边的高度信息，计算所述结构化多边形中顶点的深度信息；基于所述结构化多边形中顶点的所述深度信息、以及所述结构化多边形的顶点在所述二维图像中的二维坐标信息，确定所述待检测对象的三维空间信息，所述待检测对象的所述三维空间信息与所述待检测对象对应的所述三维边界框相关。

此外，本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的检测方法的步骤。

本公开实施例所提供的检测方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行上述方法实施例中所述的检测方法的步骤，具体可参见上述方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

一种检测方法，包括：

获取二维图像；

基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，其中，每个所述待检测对象对应的所述结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影；

针对每个所述待检测对象，

基于该待检测对象的高度信息、以及该待检测对象对应的所述结构化多边形中竖边的高度信息，计算所述结构化多边形中顶点的深度信息；

基于所述结构化多边形中顶点的所述深度信息、以及所述结构化多边形的顶点在所述二维图像中的二维坐标信息，确定所述待检测对象的三维空间信息，所述待检测对象的所述三维空间信息与所述待检测对象对应的所述三维边界框相关。
根据权利要求1所述的检测方法，其中，确定所述待检测对象的所述三维空间信息之后，所述检测方法还包括：

基于所述二维图像以及所述二维图像对应的深度图，生成所述二维图像对应的鸟瞰图；

基于所述鸟瞰图调整每个所述待检测对象的所述三维空间信息，得到所述待检测对象的调整后的三维空间信息。
根据权利要求2所述的检测方法，其中，所述基于所述二维图像以及所述二维图像对应的深度图，生成所述二维图像对应的鸟瞰图，包括：

基于所述二维图像以及所述二维图像对应的深度图，得到所述二维图像对应的点云数据，其中，所述点云数据包括所述二维图像对应的真实空间中多个空间点的三维坐标值；

基于所述点云数据中每个所述空间点的三维坐标值，生成所述二维图像对应的鸟瞰图。
根据权利要求3所述的检测方法，其中，所述基于所述点云数据中每个所述空间点的三维坐标值，生成所述二维图像对应的鸟瞰图，包括：

针对每个所述空间点：

将该空间点的横轴坐标值确定为所述鸟瞰图中与该空间点对应的特征点的横轴坐标值；

将该空间点的纵轴坐标值确定为所述鸟瞰图中与该空间点对应的特征点的像素通道值；

将该空间点的竖轴坐标值确定为所述鸟瞰图中与该空间点对应的特征点的纵轴坐标值。
根据权利要求2所述的检测方法，其中，基于所述鸟瞰图调整所述待检测对象的所述三维空间信息，得到所述待检测对象的调整后的三维空间信息，包括：

提取所述鸟瞰图对应的第一特征数据；

基于所述待检测对象的所述三维空间信息以及第一预设尺寸信息，在所述鸟瞰图对应的所述第一特征数据中，选取所述待检测对象对应的第二特征数据；

基于所述待检测对象对应的所述第二特征数据，确定所述待检测对象的所述调整后的三维空间信息。
根据权利要求1所述的检测方法，其中，所述基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，包括：

基于所述二维图像，确定每个所述待检测对象对应的所述结构化多边形的属性信息，其中，所述属性信息包括以下至少一种：顶点信息、表面信息、以及轮廓线信息；

基于每个所述待检测对象对应的结构化多边形的所述属性信息，构建该待检测对象对应的所述结构化多边形。
根据权利要求6所述的检测方法，其中，所述基于所述二维图像，确定每个所述待检测对象对应的所述结构化多边形的属性信息，包括：

对所述二维图像进行对象检测，得到所述二维图像中的至少一个对象区域，其中，每个所述对象区域包含一个所述待检测对象；

基于每个所述待检测对象对应的所述对象区域以及第二预设尺寸信息，从所述二维图像中，截取每个所述待检测对象对应的目标图像，所述第二预设尺寸信息表示大于或等于每个所述待检测对象的对象区域的尺寸；

对每个所述待检测对象对应的目标图像进行特征提取，得到每个所述待检测对象对应的所述结构化多边形的所述属性信息。
根据权利要求7所述的检测方法，其中，在所述属性信息包括顶点信息的情况下，根据以下步骤对所述待检测对象对应的所述目标图像进行特征提取，得到所述待检测对象对应的所述结构化多边形的所述属性信息：

基于卷积神经网络提取所述目标图像的特征数据；

基于堆叠的至少一个沙漏网络对所述特征数据进行处理，得到所述目标图像对应的所述待检测对象的热力图集，其中，所述热力图集中包括多个热力图，每个所述热力图包含所述待检测对象对应的所述结构化多边形的多个顶点中的一个顶点；

基于所述待检测对象的所述热力图集，确定所述待检测对象对应的所述结构化多边形的所述属性信息。
根据权利要求6所述的检测方法，其中，所述基于所述二维图像，确定所述待检测对象对应的所述结构化多边形的属性信息，包括：

对所述二维图像进行特征提取，得到所述二维图像中多个目标元素的信息，所述目标元素包括顶点、表面、和轮廓线中的至少一种；

基于所述多个目标元素的信息，对各个所述目标元素进行聚类，得到至少一个聚类后的目标元素集合；

针对每个所述目标元素集合：

根据所述目标元素集合中的目标元素组成结构化多边形，并

将该目标元素集合中的目标元素的信息作为该结构化多边形的属性信息。
根据权利要求1所述的检测方法，其中，基于该待检测对象的高度信息、以及该待检测对象对应的所述结构化多边形中竖边的高度信息，计算所述结构化多边形中顶点的深度信息，包括：

确定该待检测对象的高度与所述结构化多边形中的每条竖边的高度之间的比值；

将每条所述竖边对应的所述比值与拍摄所述二维图像的摄像设备的焦距之间的乘积，确定为该条竖边对应的顶点的深度信息。
根据权利要求1所述的检测方法，其中，所述待检测对象的高度通过以下方式确定：

基于所述二维图像和预先训练的用于进行高度检测的神经网络，确定所述待检测对象的高度；或者，

预先采集多个不同姿态的待检测对象的真实高度值，将采集的多个真实高度值的平均值作为所述待检测对象的高度；或者，

基于所述二维图像和预先训练的用于进行对象检测的神经网络，得到所述待检测对象的回归变量；基于所述回归变量以及预先得到的多个不同姿态的待检测对象的平均高度，确定所述待检测对象的高度；其中，所述回归变量用于表征所述待检测对象的高度与所述平均高度之间的偏差程度。
一种检测装置，包括：

图像获取模块，用于获取二维图像；

结构化多边形构建模块，用于基于所述获取的二维图像，构建所述二维图像中的至少一个待检测对象分别对应的结构化多边形，其中，每个所述待检测对象对应的所述结构化多边形表征该待检测对象对应的三维边界框在所述二维图像上的投影；

深度信息确定模块，用于针对每个所述待检测对象，基于该待检测对象的高度信息、以及该待检测对象对应的所述结构化多边形中竖边的高度信息，计算所述结构化多边形中顶点的深度信息；

三维空间信息确定模块，用于基于所述结构化多边形中顶点的所述深度信息、以及所述结构化多边形的顶点在所述二维图像中的二维坐标信息，确定所述待检测对象的三维空间信息，所述待检测对象的所述三维空间信息与所述待检测对象对应的所述三维边界框相关。
一种电子设备，包括：

处理器；

存储器，所述存储器存储有所述处理器可执行的机器可读指令；和

总线，当所述电子设备运行时，所述处理器与所述存储器之间通过所述总线通信；

所述机器可读指令被所述处理器执行时执行如权利要求1至11任一所述的检测方法的步骤。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至11任一所述的检测方法的步骤。