CN117611762B

CN117611762B - 一种多层级地图构建方法、系统及电子设备

Info

Publication number: CN117611762B
Application number: CN202410090406.7A
Authority: CN
Inventors: 严超; 叶飞; 龚烨飞; 刘继承; 朱培逸; 赵广志; 薛国强
Original assignee: Changshu Institute of Technology
Current assignee: Changshu Institute of Technology
Priority date: 2024-01-23
Filing date: 2024-01-23
Publication date: 2024-04-30
Anticipated expiration: 2044-01-23
Also published as: CN117611762A

Abstract

本公开的实施例提供一种多层级地图构建方法、系统及电子设备。方法包括：获取点云数据、彩色图像数据和惯性数据；根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态；根据所述激光雷达在全局坐标系下的位置和姿态，得到激光点云地图数据；根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图；根据所述三维语义地图，得到物体级语义地图。本公开的实施例通过综合激光雷达和视觉相机的数据，构建多层级地图，包括准确的三维点云信息、环境语义信息和物体级别的信息，实现了高精度、多层级、多维度的地图构建，从而提高了环境感知和决策的准确性，提供了高度精确的环境感知和定位服务。

Description

一种多层级地图构建方法、系统及电子设备

技术领域

本公开的实施例属于自动驾驶技术领域，具体涉及一种多层级地图构建方法、系统及电子设备。

背景技术

地图构建在自动驾驶、机器人导航、环境感知和其他领域中具有关键作用。传统地图构建方法通常基于单一传感器或数据源，如激光雷达、视觉相机或GNSS（GlobalNavigation Satellite System，全球导航卫星系统）。目前常用的导航地图主要包括：点云地图和语义地图。点云地图：传统的点云地图构建方法依赖于激光雷达的高精度距离测量，可以提供准确的地图几何信息。然而，这些方法通常无法提供丰富的语义信息，如物体识别、道路分类等，从而限制了地图的应用范围。语义地图：视觉相机具有广泛的视野和颜色信息，可以用于物体识别和语义分析。然而，视觉相机在不同照明和天气条件下性能波动大，且容易受到遮挡和图像噪声的干扰，因此在某些情况下难以生成准确的地图。

传统地图构建方法主要基于激光雷达或视觉相机单独进行，这些方法存在一定的局限性，精度不足、信息不完整且对不同环境的适应性差，限制了地图的精度和信息内容。

发明内容

本公开的实施例旨在至少解决现有技术中存在的技术问题之一，提供一种多层级地图构建方法、系统及电子设备。

本公开的一个方面提供一种多层级地图构建方法，包括：

获取点云数据、彩色图像数据和惯性数据；

根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态；

根据所述激光雷达在全局坐标系下的位置和姿态，得到激光点云地图数据；

根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图；

根据所述三维语义地图，得到物体级语义地图。

可选的，在获取所述彩色图像数据后，所述方法还包括：

矫正所述彩色图像数据。

进一步地，所述根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态，包括：

将所述点云数据和所述惯性数据进行Fast-LIO处理，确定激光雷达在全局坐标系下的位置和姿态。

进一步地，所述根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图，包括：

利用目标检测网络对所述彩色图像数据进行目标检测和语义分割，生成二维标签；

根据所述激光点云地图数据、相机内参、相机与激光雷达的外参，将所述彩色图像数据与所述激光点云地图数据进行对应；

根据激光点云地图数据的深度信息，恢复所述二维标签的深度信息，生成三维标签，得到三维语义地图。

进一步地，根据所述三维语义地图，得到物体级语义地图，包括：

从所述三维语义地图图像中提取物体类别的二维边界框；

获取每个所述物体类别的三维点云的中心点三维坐标和对应的长宽高；

根据主成分分析算法获取每个所述物体类别在全局坐标系下的特征向量，为每个所述物体类别构建包围盒，得到物体级语义地图。

本公开的另一方面提供一种多层级地图构建系统，包括：

数据获取模块，用于获取点云数据、彩色图像数据和惯性数据；

位置姿态模块，用于根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态；

点云地图模块，用于根据所述激光雷达在全局坐标系下的位置和姿态，得到激光点云地图数据；

三维语义地图模块，用于根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图；

物体级语义地图模块，用于根据所述三维语义地图，得到物体级语义地图。

进一步地，所述位置姿态模块具体用于：

进一步地，所述三维语义地图模块具体用于：

进一步地，所述物体级语义地图模块具体用于：

从所述三维语义地图图像中提取物体类别的二维边界框；

本公开的又一方面提供一种电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器，用于存储一个或多个程序，当所述一个或多个程序被所述至少一个处理器执行时，能使得所述至少一个处理器实现上文所述的多层级地图构建方法。

本公开实施例的一种多层级地图构建方法、系统及电子设备，通过综合激光雷达和视觉相机的数据，构建多层级地图，包括准确的三维点云信息、环境语义信息和物体级别的信息，实现了高精度、多层级、多维度的地图构建，从而提高了环境感知和决策的准确性，提供了高度精确的环境感知和定位服务。

附图说明

图1为本公开一实施例的一种多层级地图构建方法的流程示意图；

图2为本公开另一实施例的一种多层级地图构建系统的结构示意图；

图3为本公开另一实施例的一种电子设备的结构示意图。

具体实施方式

为了满足自动驾驶、机器人导航和环境感知等领域的需求，需要一种能够提供多层级地图信息的新方法。多层级地图可以包括几何信息、语义信息和物体级信息，从而使智能系统能够更好地理解和与环境互动。此外，多层级地图可以适应不同的应用场景和环境条件，提供更高级别的地图语义信息，有助于提高决策和规划的精度和可靠性。

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开的一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应理解，虽然本公开中可能使用术语第一、第二、第三等来描述各种组件，但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此，下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本公开中所使用，术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

本领域技术人员可以理解，附图只是示例实施例的示意图，附图中的模块或流程并不一定是实施本公开所必须的，因此不能用于限制本公开的保护范围。

如图1所示，本公开的一个实施例提供一种多层级地图构建方法，包括：

步骤S1、获取点云数据、彩色图像数据和惯性数据。

具体地，使用载体如车辆、移动平台，装载激光雷达、视觉相机和IMU（Inertialmeasurement unit，惯性测量单元）等传感器，分别采集点云数据、彩色图像数据和惯性数据。其中，惯性数据包括加速度和角速度数据。视觉相机的内参已知，视觉相机、激光雷达和IMU的外参已知。矫正所述彩色图像数据，根据已知的相机内参信息及畸变系数，将原始的彩色图像通过OpenCV中的函数cv::undistort()得到去畸变的彩色图像，即矫正的彩色图像。

步骤S2、根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态。

具体地，将所述点云数据和所述惯性数据进行Fast-LIO处理，确定激光雷达在全局坐标系下的位置和姿态。首先将步骤S1中在t_k时刻得到的点云数据、加速度和角速度数据代入Fast-LIO公式，可以求得激光雷达t_k时刻在全局坐标系下的位置和姿态；随后根据已知的相机与激光雷达外参，求得相机t_k时刻在全局坐标系下的位置和姿态。

步骤S3、根据所述激光雷达在全局坐标系下的位置和姿态，得到激光点云地图数据。

具体地，首先，对于步骤S1中在t_k时刻得到的点云数据，使用高斯滤波去除噪声点，得到干净的点云数据。根据激光雷达t_k时刻在全局坐标系下的位置和姿态，将干净的点云数据从激光坐标系转换到全局坐标系，记为L_k。随后，将t_(k+m)时刻得到的干净点云数据从激光坐标系转换为全局坐标系，记为L_(k+m)。最后，将全局坐标系下t_k到t_(k+m)时刻的干净点云数据进行叠加，得到全局坐标系下的激光点云地图数据L_(t+k)，即L_(t+k)={L_k,⋯,L_(k+m)},m=1,2,⋯。使用Octree数据结构来组织和存储激光点云地图数据。

步骤S4、根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图。

具体地，利用SSD（Single Shot MultiBox Detector，单步多框目标检测）等目标检测网络对所述彩色图像数据进行目标检测和语义分割，生成二维标签，再根据步骤S3得到的激光点云地图数据、已知的相机内参、已知的激光雷达和相机外参，将步骤S1中采集并矫正的彩色图像数据与步骤S3中得到的激光点云地图数据进行对应，并根据激光点云地图数据的深度信息，恢复二维标签的深度信息，生成三维标签，从而形成三维语义地图。

作为具体示例，步骤S4包括：

步骤4.1、提前准备带有目标标注的彩色图像数据集和图像级别的语义分割标签，并使用准备好的数据集对SSD网络进行训练。

步骤4.2、为了考虑实时性，采用MobileNet网络作为SSD目标检测网络的前端来提取图像特征。SSD使用锚框（Anchor Boxes）来检测不同尺寸和宽高比的目标。在每个特征图层上，SSD使用目标检测头来预测锚框中是否包含目标以及目标的类别和边界框坐标。为了移除冗余的检测结果，使用非极大值抑制来选择最终的检测边界框。

步骤4.3、实时语义分割需要高效的解码器。为了在具有有限计算资源的环境中进行高效的分割任务，使用轻量级的金字塔池化解码器，通过在不同尺度上进行池化操作，捕获到不同尺度上的语义信息。输出与原始图像尺寸相匹配的二维标签图，其中每个像素包含其所属的类别信息。

步骤4.4、根据步骤S3得到的激光点云地图数据、已知的相机内参、已知的激光雷达和相机外参，将步骤S1中采集并矫正的彩色图像数据与步骤S3中得到的激光点云地图数据中同时刻的激光点云进行对应，并根据激光点云的深度信息，恢复步骤3.3中二维标签的深度信息，从而生成三维标签，从而将每个像素分配到语义类别。

步骤4.5、根据相机t_k时刻在全局坐标系下的位置、姿态、生成三维标签Lable_k和相机t_(k+m)时刻在全局坐标系下的位置、姿态、生成三维标签Lable_(k+m)，叠加得到全局坐标系下的三维语义地图LA_(t+k)，即LA_(t+k)={Lable_k,⋯,Lable_(k+m)},m=1,2,⋯。生成的三维语义地图LA_(t+k)存储在Voxel Grid数据结构中，将每个体素与语义标签相关联，每个体素可以包含语义标签、物体属性、颜色等。

步骤S5、根据所述三维语义地图，得到物体级语义地图。

具体地，从步骤4中的三维语义地图图像中提取物体类别的二维边界框，获取每个物体类别的三维点云的中心点三维坐标和对应的长宽高。再根据PCA（PrincipalComponent Analysis，主成分分析）获取每个物体类别在全局坐标系下的特征向量，为每个类别构建一个包围盒，从而将物体用具有方向性的三维矩形框表征，完成物体级语义地图的构建。

作为具体示例，步骤S5包括：

步骤5.1、根据步骤4得到的三维语义地图，从图像中提取物体类别的二维边界框，并根据对应的激光点云的深度信息，恢复图像中物体类别的深度信息，将其映射到三维点云上，将点云中所有点的坐标取平均值来获得中心点坐标，并测量二维边界框在三维点云中的长宽高。

步骤5.2、根据每个物体类别的三维点云数据、中心点坐标，执行PCA分析以找到主成分，即特征向量。主成分是描述数据变化方向的向量，通常按照降序排列，最大的主成分描述了数据的主要变化方向。使用PCA计算的主成分来构建包围盒，第一个主成分定义了包围盒的方向，并将将包围盒的边界设置为主成分方向上的2倍标准差，以确保包围盒能够包含大多数点云数据，从而将物体用具有方向性的三维矩形框表征，从而将三维语义地图转变成物体级语义地图。生成的物体级语义地图可存储在Graph Database数据结构中，每个节点可以代表一个物体，节点之间的关系表示语义关联或拓扑关系，供自动驾驶、机器人导航和环境感知等领域的设备使用。

本公开实施例的一种多层级地图构建方法，通过综合激光雷达和视觉相机的数据，构建多层级地图，包括准确的三维点云信息、环境语义信息和物体级别的信息，实现了高精度、多层级、多维度的地图构建，从而提高了环境感知和决策的准确性，提供了高度精确的环境感知和定位服务。

如图2所示，本公开的另一实施例提供一种多层级地图构建系统，包括：

数据获取模块201，用于获取点云数据、彩色图像数据和惯性数据；

位置姿态模块202，用于根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态；

点云地图模块203，用于根据所述激光雷达在全局坐标系下的位置和姿态，得到激光点云地图数据；

三维语义地图模204，用于根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图；

物体级语义地图模块205，用于根据所述三维语义地图，得到物体级语义地图。

具体地，数据获取模块201还可对彩色图像数据进行矫正，根据已知的相机内参信息及畸变系数，将原始的彩色图像通过OpenCV中的函数cv::undistort()得到去畸变的彩色图像，即矫正的彩色图像。所述位置姿态模块202具体用于将所述点云数据和所述惯性数据进行Fast-LIO处理，确定激光雷达在全局坐标系下的位置和姿态。所述三维语义地图模块204具体用于利用目标检测网络对所述彩色图像数据进行目标检测和语义分割，生成二维标签；根据所述激光点云地图数据、相机内参和外参、激光雷达外参，将所述彩色图像数据与所述激光点云地图数据进行对应；根据激光点云地图数据的深度信息，恢复所述二维标签的深度信息，生成三维标签，得到三维语义地图。所述物体级语义地图模块205具体用于从所述三维语义地图图像中提取物体类别的二维边界框；获取每个所述物体类别的三维点云的中心点三维坐标和对应的长宽高；根据主成分分析算法获取每个所述物体类别在全局坐标系下的特征向量，为每个所述物体类别构建包围盒，得到物体级语义地图。

本实施例的一种多层级地图构建系统用于实现上文实施例的一种多层级地图构建方法，具体流程在此不作赘述。

本公开实施例的一种多层级地图构建系统，通过综合激光雷达和视觉相机的数据，构建多层级地图，包括准确的三维点云信息、环境语义信息和物体级别的信息，实现了高精度、多层级、多维度的地图构建，从而提高了环境感知和决策的准确性，提供了高度精确的环境感知和定位服务。

如图3所示，本公开的又一实施例提供一种电子设备，包括：

至少一个处理器301；以及，与所述至少一个处理器301通信连接的存储器302，用于存储一个或多个程序，当所述一个或多个程序被所述至少一个处理器301执行时，能使得所述至少一个处理器301实现上文所述的多层级地图构建方法。

其中，存储器302和处理器301采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器301和存储器302的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器301处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器301。

处理器301负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器302可以被用于存储处理器301在执行操作时所使用的数据。

可以理解的是，以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式，然而本公开并不局限于此。对于本领域内的普通技术人员而言，在不脱离本公开的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本公开的保护范围。

Claims

1.一种多层级地图构建方法，其特征在于，所述方法包括：

获取点云数据、彩色图像数据和惯性数据；

根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态，具体为：首先将在t_k时刻得到的点云数据、加速度和角速度数据代入Fast-LIO公式，求得激光雷达t_k时刻在全局坐标系下的位置和姿态；随后根据已知的相机与激光雷达外参，求得相机t_k时刻在全局坐标系下的位置和姿态；

根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图，具体包括以下步骤：

步骤4.1、提前准备带有目标标注的彩色图像数据集和图像级别的语义分割标签，并使用准备好的数据集对SSD网络进行训练；

步骤4.2、采用MobileNet网络作为SSD目标检测网络的前端来提取图像特征；SSD使用锚框来检测不同尺寸和宽高比的目标；在每个特征图层上，SSD使用目标检测头来预测锚框中是否包含目标以及目标的类别和边界框坐标；为了移除冗余的检测结果，使用非极大值抑制来选择最终的检测边界框；

步骤4.3、使用轻量级的金字塔池化解码器，通过在不同尺度上进行池化操作，捕获到不同尺度上的语义信息；输出与原始图像尺寸相匹配的二维标签图，其中每个像素包含其所属的类别信息；

步骤4.4、根据得到的激光点云地图数据、已知的相机内参、已知的激光雷达和相机外参，将采集并矫正的彩色图像数据与得到的激光点云地图数据中同时刻的激光点云进行对应，并根据激光点云的深度信息，恢复二维标签的深度信息，生成三维标签，将每个像素分配到语义类别；

步骤4.5、根据相机t_k时刻在全局坐标系下的位置、姿态、生成三维标签Lable_k和相机t_(k+m)时刻在全局坐标系下的位置、姿态、生成三维标签Lable_(k+m)，叠加得到全局坐标系下的三维语义地图LA_(t+k)，即LA_(t+k)={Lable_k ,⋯ ,Lable_(k+m)} ,m=1，2 ,⋯；生成的三维语义地图LA_(t+k)存储在Voxel Grid数据结构中，将每个体素与语义标签相关联，每个体素包含语义标签、物体属性、颜色；

根据所述三维语义地图，得到物体级语义地图。

2.根据权利要求1所述的方法，其特征在于，在获取所述彩色图像数据后，所述方法还包括：

矫正所述彩色图像数据。

3.根据权利要求1所述的方法，其特征在于，根据所述三维语义地图，得到物体级语义地图，包括：

从所述三维语义地图图像中提取物体类别的二维边界框；

4.一种多层级地图构建系统，其特征在于，所述系统包括：

位置姿态模块，用于根据所述点云数据和所述惯性数据，确定激光雷达在全局坐标系下的位置和姿态，具体为：首先将在t_k时刻得到的点云数据、加速度和角速度数据代入Fast-LIO公式，求得激光雷达t_k时刻在全局坐标系下的位置和姿态；随后根据已知的相机与激光雷达外参，求得相机t_k时刻在全局坐标系下的位置和姿态；

三维语义地图模块，用于根据所述激光点云地图数据和所述彩色图像数据，得到三维语义地图，具体为：

5.根据权利要求4所述的系统，其特征在于，所述物体级语义地图模块具体用于：

从所述三维语义地图图像中提取物体类别的二维边界框；

6.一种电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器，用于存储一个或多个程序，当所述一个或多个程序被所述至少一个处理器执行时，能使得所述至少一个处理器实现权利要求1至3任一项所述的多层级地图构建方法。