WO2020073936A1

WO2020073936A1 - 地图要素提取方法、装置及服务器

Info

Publication number: WO2020073936A1
Application number: PCT/CN2019/110259
Authority: WO
Inventors: 舒茂; 陈偲
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-10-12
Filing date: 2019-10-10
Publication date: 2020-04-16
Also published as: US20210035314A1; CN110160502A; EP3779358A4; EP3779358B1; EP3779358A1; CN110160502B; US11380002B2

Abstract

一种地图要素提取方法、装置（900）及服务器（131，132，133，134，200，1000），地图要素提取方法包括：获取目标场景的激光点云（401）和图像（402）（步骤310），目标场景包括至少一要素实体对应于地图要素；进行激光点云（401）和图像（402）之间的配准，得到图像（402）的深度图（步骤330）；对图像（402）的深度图进行图像（402）分割，得到地图要素在深度图中的分割图像（步骤350）；根据激光点云（401）与图像（402）之间的配准关系，将分割图像在深度图中的二维位置转换为地图要素在目标场景中的三维位置（步骤370）。

Description

地图要素提取方法、装置及服务器

本申请要求于2018年10月12日提交中国专利局、申请号为201811186664.6，申请名称为“地图要素提取方法、装置及服务器”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种地图要素提取方法、装置及服务器。

背景技术

高精度地图，是用于辅助驾驶、半自动驾驶或者无人驾驶的地图，由一系列地图要素构成。地图要素包括：车道线、地面标志、路牙、栅栏、交通标志牌等要素。

发明内容

本申请各实施例提供一种地图要素提取方法、装置及服务器。

其中，本申请实施例所采用的技术方案为：

第一方面，一种地图要素提取方法，由电子设备执行，包括：获取目标场景的激光点云和图像，所述目标场景包括至少一要素实体对应于地图要素；进行所述激光点云与所述图像之间的配准，得到所述图像的深度图；对所述图像的深度图进行图像分割，得到所述地图要素在所述深度图中的分割图像；根据所述激光点云与所述图像之间的配准关系，将所述分割图像在所述深度图中的二维位置转换为所述地图要素在所述目标场景中的三维。

第二方面，一种地图要素提取装置，包括：图像获取模块，用于获取目标场景的激光点云和图像，所述目标场景包括至少一要素实体对应于地图要素；深度图构建模块，用于进行所述激光点云与所述图像之间的配准，得到所述图像的深度图；图像分割模块，用于对所述图像的深度图进行图像分割，得到所述地图要素在所述深度图中的分割图像；位置转换模块，用于根据所述激光点云与所述图像之间的配准关系，将所述分割图像在所述深度图中的二维位置转换为所述地图要素在所述目标场景中的三维位置。

第三方面，一种服务器，包括处理器及存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如上所述的地图要素提取方法。

第四方面，一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的地图要素提取方法。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并于说明书一起用于解释本申请实施例的原理。

图1是根据本申请实施例的一种地图要素提取方法所涉及的实施环境的示意图；

图2是根据一示例性实施例示出的一种服务器的硬件结构框图；

图3是根据一示例性实施例示出的一种地图要素提取方法的流程图；

图4是图3对应实施例所涉及的配准前目标场景的激光点云与图像的示意图；

图5是图3对应实施例所涉及的配准后目标场景的激光点云与图像的示意图；

图6是根据一示例性实施例示出的对所述激光点云与所述图像进行配准，得到所述图像中像素点对应的深度信息步骤的流程图；

图7是图3对应实施例中步骤350在一个实施例的流程图；

图8是根据一示例性实施例示出的语义分割网络的构建过程的流程图；

图9是图7对应实施例所涉及的地图要素在深度图中的分割图像的示意图；

图10是图7对应实施例中步骤351在一个实施例的流程图；

图11是图10对应实施例所涉及的残差神经网络的结构示意图；

图12是根据一示例性实施例示出的另一种地图要素提取方法的流程图；

图13是图12对应实施例所涉及的目标场景匹配地图中显示车道线要素的示意图；

图14是图12对应实施例所涉及的目标场景匹配地图中显示地面标志要素的示意图；

图15是根据一示例性实施例示出的一种地图要素提取装置的结构图；

图16是根据一示例性实施例示出的一种服务器的结构图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请实施例的一些方面相一致的装置和方法的例子。

通常，在高精度地图的生成过程中，首先从激光点云中提取地图要素，再通过人工方式对提取的地图要素进行手动编辑，以生成高精度地图。可以理解，如果地图要素提取的准确性不高，将导致人工手动编辑地图要素的耗时长、工序复杂、效率低，并最终影响高精度地图的生产效率。因此，如何提高高精度地图的生产效率仍亟待解决。

图1为根据本申请实施例的一种地图要素提取方法所涉及的实施环境的示意图。该实施环境包括用户端110和服务器端130。

其中，用户端110部署于车辆、飞机、机器人中，可以是台式电脑、笔记本电脑、平板电脑、智能手机、掌上电脑、个人数字助理、导航仪、智能计算机等，在此不进行限定。

用户端110与服务器端130通过无线或者有线网络等方式预先建立网络连接，并通过此网络连接实现用户端110与服务器端130之间的数据传输。例如，传输的数据包括：目标场景的高精度地图等。

在此说明的是，服务器端130可以是一台服务器，也可以是由多台服务器构成的服务器集群，如图1所示，还可以是由多台服务器构成的云计算中心。其中，服务器是为用户提供后台服务的电子设备，例如，后台服务包括：地图要素提取服务、高精度地图生成服务等。

服务器端130在获取到目标场景的激光点云和图像之后，便可通过目标场景的激光点云和图像进行地图要素提取，以获取地图要素在目标场景中的三维位置。

在获得地图要素在目标场景中的三维位置之后，便可通过服务器端130所配置的显示屏幕，按照此三维位置在目标场景地图中显示地图要素，以生成目标场景的高精度地图。

当然，根据实际需要，地图要素提取和地图要素编辑既可以部署于同一服务器中，也可以分别部署于不同服务器中，例如，地图要素提取部署于服务器131、132，地图要素编辑部署于服务器133、134。

然后，进一步存储目标场景的高精度地图，例如，存储至服务器端130，也可以存储至其它缓存空间，在此并未加以限定。

对于使用高精度地图的用户端110而言，例如，当无人驾驶车辆欲经过目标场景时，其所承载的用户端110将相应地获得目标场景的高精度地图，以便于辅助无人驾驶车辆安全经过目标场景。

值得一提的是，关于目标场景的激光点云和图像，可以是由另外的采集设备预先采集并存储至服务器端130，也可以是在承载用户端110的车辆、飞机、机器人经过目标场景时，由用户端110实时采集并上传至服务器端130，在此并未加以限定。

图2是根据一示例性实施例示出的一种服务器的硬件结构框图。该种服务器适用于图1所示实施环境中的服务器。

需要说明的是，该种服务器只是一个适配于本申请实施例的示例，不能认为是提供了对本申请实施例的使用范围的任何限制。该种服务器也不能解释为需要依赖于或者必须具有图2中示出的示例性的服务器 200中的一个或者多个组件。

服务器200的硬件结构可因配置或者性能的不同而产生较大的差异，如图2所示，服务器200包括：电源210、接口230、至少一个存储器250、以及至少一个中央处理器(CPU,Central Processing Units)270。

具体地，电源210用于为服务器200上的各组件提供工作电压。

接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等，用于与外部设备通信。例如，与图1所示出实施环境中的用户端110或服务端130中的其它服务器交互。

存储器250作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源包括操作系统251、应用程序253及数据255等，存储方式可以是短暂存储或者永久存储。

其中，操作系统251用于管理与控制服务器200上的各组件以及应用程序253，以实现中央处理器270对海量数据255的计算与处理，其可以是Windows Server ^TM、Mac OS X ^TM、Unix ^TM、Linux ^TM、FreeBSD ^TM等。

应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序，其可以包括至少一模块(图2中未示出)，每个模块都可以分别包含有对服务器200的一系列计算机可读指令。例如，地图要素提取装置可视为部署于服务器200的应用程序253，以实现本申请任一实施例所述的地图要素提取方法。

数据255可以是照片、图片，还可以是目标场景的激光点云和图像，存储于存储器250中。

中央处理器270可以包括一个或多个以上的处理器，并设置为通过通信总线与存储器250通信，以读取存储器250中存储的计算机可读指令，进而实现对存储器250中海量数据255的运算与处理。例如，通过中央处理器270读取存储器250中存储的一系列计算机可读指令的形式来完成本申请任一实施例所述的地图要素提取方法。

显示屏幕280可以是液晶显示屏或者电子墨水显示屏等，此显示屏幕280在电子设备200与用户之间提供一个输出界面，以通过该输出界面将文字、图片或者视频任意一种形式或者组合所形成的输出内容向用户显示输出。例如，将可供编辑的地图要素显示在目标场景匹配的地图中。

输入组件290，可以是显示屏幕280上覆盖的触摸层，也可以是电子设备200外壳上设置的按键、轨迹球或者触控板，还可以是外接的键盘、鼠标、触控板等，用于接收用户输入的各种控制指令，以便于生成目标场景的高精度地图。例如，针对地图中地图要素的编辑指令。

此外，通过硬件电路或者硬件电路结合软件也能同样实现本申请实施例，因此，实现本申请实施例并不限于任何特定硬件电路、软件以及两者的组合。

请参阅图3，在一示例性实施例中，一种地图要素提取方法适用于图1所示实施环境的服务器，该服务器的结构可以如图2所示。

该地图要素提取方法可以由服务器等电子设备执行，也可以理解为由服务器中部署的地图要素提取装置执行。在下述方法实施例中，为了便于描述，以各步骤的执行主体为地图要素提取装置加以说明，但是并不对此构成限定。

该地图要素提取方法可以包括以下步骤：

步骤310，获取目标场景的激光点云和图像。

其中，目标场景可以是可供车辆行驶的道路及其周边环境，还可以是可供机器人行进的建筑物内部，又或者是可供无人机低空飞行的航道及其周边环境，本实施例并未对此加以限定。

相应地，本实施例所提供的地图要素提取方法可根据目标场景的不同而适用于不同的应用场景，例如，道路及其周边环境适用于辅助车辆行驶场景，建筑物内部适用于辅助机器人行进场景，航道及其周边环境适用于辅助无人机低空飞行场景。

在本申请一实施例中，目标场景包括至少一要素实体，其对应于地图要素。其中，要素实体是真实存在于目标场景中的实体，而要素实体所对应的地图要素则是呈现于目标场景所匹配地图中的要素。

具体而言，地图要素及其对应的要素实体根据应用场景的不同有所区别。例如，在辅助车辆行驶场景中，地图要素包括：车道线、地面标志、路牙、栅栏、交通标志牌等要素，相应地，要素实体指的是车道线、地面标志、路牙、栅栏、交通标志牌等真实存在于目标场景的实体。又例如，在辅助无人机低空飞行场景中，地图要素包括：路灯、植被、建筑物、交通标志牌等要素，相应地，要素实体则是指路灯、植被、建筑物、交通标志牌等真实存在于目标场景的实体。

如前所述，为了生成高精度地图，需要从激光点云中提取地图要素。可以理解，激光点云是通过激光扫描目标场景中实体所生成的，其实质是点阵图像，即是由对应目标场景中实体的若干采样点构成。故而，激光点云仅反映了实体在目标场景中的空间结构，而无法体现实体在目标场景中的色彩纹理轮廓，这就可能因对应要素实体的采样点缺失而使得地图要素在激光点云中的轮廓缺失，进而影响地图要素提取的准确性。

基于此，在本实施例中，在获取目标场景的激光点云时，还获取目标场景的图像，以此来反映实体在目标场景中的色彩纹理轮廓。

针对目标场景，激光点云和图像可以来源于预先存储的激光点云和图像，还可以来源于实时采集的激光点云和图像，进而通过本地读取或者网络下载的方式获取。

换句话说，对于地图要素提取装置而言，可以获取实时采集的目标场景的激光点云和图像，以便于实时进行地图要素提取，还可以获取一历史时间段内采集的目标场景的激光点云和图像，以便于在处理任务较少的时候进行地图要素提取，或者，在适当的时机进行地图要素提取，本实施例并未对此作出具体限定。

应当说明的是，激光点云是由激光器发射的激光扫描生成，图像则是通过摄像设备(例如摄像机)采集。在采集过程中，激光器和摄像设备可预先部署于采集设备中，以便于采集设备针对目标场景进行激光点云和图像的采集。例如，采集设备为车辆，激光器和摄像设备作为车载组件预先部署于该车辆，当该车辆行驶经过目标场景时，便相应地采集得到该目标场景的激光点云和图像。

步骤330，进行所述激光点云与所述图像之间的配准，得到所述图像的深度图。

在获取到目标场景的激光点云和图像之后，便可根据激光点云所描述的空间结构，为图像构建深度图。

换句话说，本实施例中，深度图的构建过程，既利用了激光点云所反映的目标场景中要素实体的空间结构，还结合了图像所反映的目标场景中要素实体的色彩纹理轮廓，使得深度图不仅描述了地图要素的色彩纹理轮廓，而且描述了地图要素的空间结构，极大地丰富了图像分割的数据依据，从而充分地保证了后续地图要素在深度图中进行图像分割的准确性。

具体而言，根据图像中像素点对应的深度信息构建图像的深度图，也即是，图像的深度图实质上是携带了图像中像素点所对应深度信息的二维图像。其中，深度信息用于表示激光点云(三维)与图像(二维)之间的几何变换形式，亦即配准关系。

配准的目的在于保证针对同一目标场景却来源不同的激光点云与图像之间保持相匹配的地理位置，实质是确定激光点云与图像之间几何变换形式的过程。其中，激光点云来源于激光器，而图像来源于摄像设备。

针对同一目标场景，例如，配准前，如图4所示，激光点云401区域与图像402区域不匹配，仅存在部分区域重合。配准后，如图5所示，激光点云401区域与图像402区域基本重合，即视为达到最佳匹配效果，以此保证了配准后的激光点云与图像之间保持相匹配的地理位置，也即是，激光点云与图像可视为同源。

在一实施例中，配准可以根据灰度特征实现。在另一实施例中，配准还可以根据图像特征实现，其中，图像特征包括颜色特征、纹理特征、形状特征、空间关系特征等。

进一步地，配准包括：几何纠正、投影变换、统一比例尺等处理方式，本实施例并未对此加以限定。

通过激光点云与图像之间进行的配准，便可得到图像中像素点对应的深度信息，进而可基于该深度信息所表示的激光点云与图像之间的几何变换关系，得到图像的深度图。

步骤350，对所述图像的深度图进行图像分割，得到所述地图要素在所述深度图中的分割图像。

可以理解，目标场景中不仅包括对应地图要素的要素实体，还包括与地图要素无关的其它实体，例如车辆。那么，对于深度图而言，除了存在对应于要素实体的地图要素，也还存在对应于其它实体的非地图要素。

由此，本实施例中，图像分割是指将地图要素与非地图要素在深度图中区分开。那么，完成区分的地图要素在深度图中便形成了相应的分割图像。换而言之，分割图像可用于描述地图要素在深度图中的位置、类别、颜色等。其中，类别是指地图要素的种类，例如，车道线要素视为地图要素的一种。

在本申请一实施例中，图像分割包括：普通分割、语义分割、实例分割等，其中，普通分割进一步包括：阈值分割、区域分割、边缘分割、直方图分割等，本实施例并未对此作出具体限定。

值得一提的是，由于深度图仅是携带有深度信息的二维图像，故而，对于分割图像而言，所描述的地图要素在深度图中的位置，本质上是二维位置。

步骤370，根据所述激光点云与所述图像之间的配准关系，将所述分割图像在所述深度图中的二维位置，转换为所述地图要素在所述目标场景中的三维位置。

目标场景匹配的高精度地图，是按照指定比例真实地反映目标场景的实际样式。例如，实体为道路，则在高精度地图中，不仅需要按照道路在目标场景中的地理位置绘制道路，而且需要绘制该道路的形状，包括宽度、坡度、曲率等，甚至需要绘制该道路所包含的车道数，以此真实地反映该道路在目标场景中的实际样式。

那么，对于高精度地图而言，至少需要获知地图要素在目标场景中的三维位置。此三维位置即是指地图要素所对应的要素实体在目标场景中的地理位置。进一步地，三维位置可通过坐标进行唯一标识。

由此，在得到地图要素在深度图中的分割图像之后，便需要按照激光点云与图像之间的配准关系，针对该分割图像在深度图中的二维位置，进行坐标转换，进而得到地图要素在目标场景中的三维位置，以作为地图要素数据。

在本申请一实施例中，地图要素数据还包括地图要素在目标场景中的颜色、类别等。

例如，地图要素为车道线要素，相应地，地图要素数据包括：车道线在目标场景中的三维位置、车道线的颜色、车道线的形式等。其中，车道线的形式包括实线、虚线、双黄线等。

通过如上所述的过程，通过结合目标场景的激光点云与图像，实现了快速准确地自动化提取地图要素，为高精度地图的生成提供了准确性高的数据依据，避免人工手动编辑地图要素，不仅提高了高精度地图的生产效率，而且降低了高精度地图的生产成本。

此外，本申请实施例还充分利用了目标场景的图像，不仅有效地扩展了数据来源，还使得地图要素数据更加地丰富完整，进而有利于保障高精度地图的精度。

请参阅图6，在一示例性实施例中，所述对所述激光点云与所述图像进行配准，得到所述图像中像素点对应的深度信息步骤，可以进一步包括以下步骤：

步骤3311，构建所述激光点云与所述图像之间的投影变换函数。

步骤3313，提取所述激光点云与所述图像中相对应的特征点，并根据提取到的特征点估计所述投影变换函数的参数。

步骤3315，根据完成参数估计的投影变换函数，计算得到所述图像中像素点对应的深度信息。

本实施例中，配准是基于图像特征的投影变换方式实现的。

具体地，激光点云与图像之间构建的投影变换函数如计算公式(1)所示：

其中，f _x表示摄像机焦距和图像中像素点在x轴方向上的物理尺寸比值，f _y表示摄像机焦距和图像中像素点在y轴方向上的物理尺寸比值，(u ₀,v ₀)表示二维坐标系的原点，R表示摄像机坐标系与三维坐标系之间的旋转关系，t表示摄像机坐标系与三维坐标系之间的平移关系。应当说明的是，二维坐标系是指图像坐标系，三维坐标系是指目标场景所在坐标系，即真实世界坐标系。(u,v)表示图像中像素点的二维坐标，(X _w,Y _w,Z _w)表示该像素点所对应实体上某个点在目标场景中的三维坐标，亦即激光点云中对应实体的采样点的三维坐标，Z _c则表示该像素点对应的深度信息，亦即摄像机坐标系中该像素点沿z轴方向的坐标。

由上可知，确定激光点云与图像之间的配准关系，实质是估计投影变换函数的参数，即f _x、f _y、(u ₀,v ₀)、R、t。

为此，需要获取激光点云与图像中相对应的6组特征点。特征点是指能够描述图像特征的像素点。

在本申请一实施例中，针对激光点云中边界清晰显示、棱角分明的采样点(例如角点、顶点、端点、重心点、拐点等)，对应提取尽量均匀分布在图像中的6个像素点作为特征点，以此体现目标场景中实体的显著特征，进而有利于提高激光点云与图像之间配准的准确性。

在完成投影变换函数中参数的估计后，便确定了激光点云与图像之间的配准关系。那么，通过激光点云确定(X _w,Y _w,Z _w)，以及通过图像确定(u,v)，便可计算得到图像中像素点对应的深度信息，即Z _c。

在上述实施例的配合下，实现了基于图像特征的配准，不仅大幅度降低配准过程的计算量，还有利于提高地图要素提取的效率，进而促进高精度地图的生产效率，而且特征点体现了目标场景中实体的显著特征，能够对目标场景中实体空间结构的变化较敏感，有利于提高配准过程的精度。

进一步地，在一示例性实施例中，步骤370可以包括以下步骤：

将所述分割图像在所述深度图中的二维位置、以及所述图像中像素点对应的深度信息，输入完成参数估计的投影变换函数，计算得到所述地图要素在所述目标场景中的三维位置。

结合计算公式(1)对坐标变换过程加以说明如下：

当投影变换函数中的参数完成估计，即f _x、f _y、(u ₀,v ₀)、R、t已知。

那么，将图像中像素点对应的深度信息，即Z _c、以及分割图像在深度图中的二维位置，即(u,v)，输入计算公式(1)，便可计算得到地图要素在目标场景中的三维位置，即(X _w,Y _w,Z _w)，进而以此作为地图要素数据，以便于后续生成高精度地图。

请参阅图7，在一示例性实施例中，步骤350可以包括以下步骤：

步骤351，对所述图像的深度图进行特征提取，得到所述图像对应的特征图。

其中，特征图用于表示深度图的图像特征，此图像特征包括颜色特征、纹理特征、形状特征、空间关系特征等。那么，也可以理解为，特征图不仅体现了深度图的全局特征，例如颜色特征，还体现了深度图的局部特征，例如空间关系特征。

基于图像分割中的语义分割，在一实施例中，特征提取可采用卷积神经网络进行，在另一实施例中，特征提取还可以根据残差神经网络进行，本实施例中并未对此作出具体限定。

步骤353，对所述特征图中的像素点进行类别预测，得到所述特征图中像素点的类别。

本实施例中，在特征图上进行像素点级别的类别预测，是通过预先构建的语义分割网络实现的。

语义分割网络不限于：卷积神经网络、残差神经网络等。

下面对语义分割网络的构建过程加以说明。

如图8所示，语义分割网络的构建过程可以包括以下步骤：

步骤510，获取图像样本，所述图像样本进行了像素点类别标注。

步骤530，根据获取到的图像样本引导指定数学模型进行模型训练。

步骤550，由完成模型训练的指定数学模型构建得到所述语义分割网络。

语义分割网络是通过海量的图像样本对指定数学模型进行模型训练生成的。其中，图像样本，是指进行了像素点类别标注的图像。

模型训练，实质上是对指定数学模型的参数加以迭代优化，使得由此参数构建的指定算法函数满足收敛条件。

其中，指定数学模型，包括但不限于：逻辑回归、支持向量机、随机森林、神经网络等机器学习模型。

指定算法函数，包括但不限于：最大期望函数、损失函数等等。

举例来说，随机初始化指定数学模型的参数，根据当前一个图像样本计算随机初始化的参数所构建的损失函数的损失值。

如果损失函数的损失值未达到最小，则更新指定数学模型的参数，并根据后一个图像样本计算更新的参数所构建的损失函数的损失值。

如此迭代循环，直至损失函数的损失值达到最小，即视为损失函数收敛，此时，指定数学模型也收敛，并符合预设精度要求，则停止迭代。

否则，迭代更新指定数学模型的参数，并根据其余图像样本迭代计算所更新参数构建的损失函数的损失值，直至损失函数收敛。

值得一提的是，如果在损失函数收敛之前，迭代次数已经达到迭代阈值，也将停止迭代，以此保证模型训练的效率。

当指定数学模型收敛并符合预设精度要求时，表示指定数学模型完成模型训练，由此便可构建得到语义分割网络。

在完成语义分割网络的构建之后，对于地图要素提取装置而言，便具有了对特征图进行像素点类别预测的能力。

那么，将特征图输入语义分割网络，便能够对特征图中的像素点进行类别预测，由此得到特征图中像素点的类别。

步骤355，将所述特征图中同一类别的像素点，拟合形成对应地图要素在所述深度图中的分割图像，每一类别对应一种地图要素。

可以理解，对于像素点的类别而言，并不能够形成地图要素在深度图中的分割图像，即为非结构化表示，故而，本实施例中，采用拟合方法，对特征图中同一类别的像素点进行结构化表示。

在本申请一实施例中，拟合方法包括：最小二乘拟合方法、基于Ransac的曲线拟合方法等。

结合图9对地图要素在深度图中的分割图像进行如下说明。

当地图要素的类别为车道线，则针对特征图中属于车道线的像素点，即被拟合为一条直线，如图9中601所示。

当地图要素的类别为路牙、栅栏，则针对特征图中属于路牙、栅栏的像素点，亦被拟合为一条直线，分别如图9中602、603所示。

当地图要素的类别为交通标志牌，则针对特征图中属于交通标志牌的像素点，即被拟合为一个矩形框，如图9中604所示。

当地图要素的类别为地面标志，则针对特征图中属于地面标志的像素点，亦被拟合为一个矩形框，如图9中605所示。

通过上述过程，基于语义分割网络所形成的分割图像，便可直接获知地图要素所在的位置、类别，而避免以人工方式对不同类别的地图要素逐个编辑，大大节省了人工手动编辑所耗费的时间，充分地降低了高精度地图的生产成本，有效地提高了高精度地图的生产效率。

此外，利用丰富的语义信息，在图像分割过程中相互验证，避免出现误检，能够有效地提高地图要素提取的准确性。

请参阅图10，在一示例性实施例中，步骤351可以包括以下步骤：

步骤3511，采用残差神经网络中的高层网络提取得到所述深度图的全局特征，并采用所述残差神经网络中的低层网络提取得到所述深度图的局部特征。

本实施例中，语义分割网络为残差神经网络。

具体地，残差神经网络采用了Encoder-Decoder结构，包括若干高层网络和若干低层网络。

如图11所示，Image表示残差神经网络的输入，即深度图。

701表示残差神经网络的Encoder部分，用于进行深度图的特征提取；701’表示残差神经网络的Decoder部分，用于对提取到的特征进行融合。

7011、7012表示残差神经网络中的低层网络，用于提取深度图的局部特征；7013、7014表示残差神经网络中的高层网络，用于提取深度图的全局特征。

步骤3513，对提取得到的全局特征与局部特征进行融合，得到中间特征图。

结合图11，对残差神经网络提取图像所对应特征图的过程加以说明。

首先，对7014最高一层网络对应的全局特征进行反卷积处理7021和上采样处理7022，得到融合特征图。

然后，对次高一层网络7013对应的全局特征进行反卷积处理7023，并通过与融合特征图的融合，形成更新的融合特征图7031，再对更新的融合特征图7031进行上采样处理7024，形成二次更新的融合特征图。

接着，按照残差神经网络中网络由高至低的顺序，对其余高层网络对应的全局特征(图11中未体现)和低层网络7011、7012对应的局部特征进行遍历，根据遍历到的全局特征或者局部特征对二次更新的融合特征图进行更新。

具体而言，对低层网络7012对应的局部特征进行反卷积处理7025，并通过与二次更新的融合特征图的融合，形成再次更新的融合特征图7032，再对再次更新的融合特征图7032进行上采样处理7026，形成四次更新的融合特征图。

继续对低层网络7011对应的局部特征进行反卷积处理7027，并通过与四次更新的融合特征图的融合，形成最后更新的融合特征图7033，由此即完成残差神经网络中所有网络对应特征的遍历。

完成遍历后，则将最后更新的融合特征图7033作为中间特征图。

步骤3515，对所述中间特征图进行线性插值，得到所述图像对应的特征图。

如图11所示，可以看出，经过3次上采样处理，中间特征图的分辨率实质为深度图Image的分辨率的1/2，故而，在进行像素级的类别预测之前，需要针对中间特征图进行线性插值，以使得由此形成的特征图的分辨率与深度图Image的分辨率保持一致。

在上述过程中，实现了基于残差神经网络的特征提取，有利于提高特征提取的准确性，进而充分地保证了地图要素提取的鲁棒性和稳定性。

请参阅图12，在一示例性实施例中，如上所述的方法还可以包括以下步骤：

步骤810，根据所述地图要素在所述目标场景中的三维位置，在目标场景地图中显示所述地图要素。

步骤830，获取针对所述目标场景地图中地图要素的控制指令并响应，生成目标场景的高精度地图。

目标场景地图是指与目标场景相匹配的地图。

在本申请实施例中，可以选择同时对全部类别的地图要素进行编辑，也可以选择一个类别的地图要素进行编辑，本实施例并未对此加以限定。

如果选择编辑车道线要素，则目标场景地图中，将加载对应的车道线要素数据，以根据车道线要素数据所指示的该车道线要素在目标场景中的三维位置显示该车道线要素，如图13所示。

同理，如果选择编辑地面标志要素，则目标场景地图中相应地显示该地面标志要素，如图14所示。

值得一提的是，地图要素数据，例如车道线要素数据，在完成提取之后，将按照指定的存储格式预先存储，以便于进行地图要素编辑时读取。

在目标场景地图中显示出地图要素之后，便可以参照目标场景的激光点云和图像，对该地图要素进行查看。

如果地图要素不符合要求，例如，不符合精度要求，或者，位置、形状、类别有所偏差，又或者，因车辆阻挡而导致地图要素有所缺失，那么，便可进一步地对地图要素进行编辑操作，此时，将相应获取到针对地图中地图要素的编辑指令，进而通过对编辑指令的响应，对地图中的地图要素进行相应的编辑处理，并最终生成包含编辑后地图要素的高精度地图。

反之，如果地图要素符合要求，则无需任何修改，即可一键生成高精度地图，这大大减少了手动编辑的工作量，有效地提升了编辑效率，进而有利于降低高精度地图的生产成本，提高高精度地图的生产效率。

由上可知，控制指令至少包括编辑指令、一键生成指令。

在具体应用场景中，高精度地图是实现无人驾驶不可或缺的重要环节。它能够真实还原目标场景，以此提高无人驾驶设备(例如无人驾驶车辆、无人机、机器人)的定位精度；还能够解决特殊情况下无人驾驶设备中环境感知设备(例如传感器)失效的问题，有效地弥补了环境感知设备的不足；同时能够实现为无人驾驶设备进行路径全局规划，并且基于预判为无人驾驶设备制定合理的行进策略。因此，高精度地图在无人驾驶中发挥着不可替代的作用，通过本申请各实施例所提供的地图要素提取方法，不仅充分地保证了高精度地图的精度，还有效地降低了高精度地图的生产成本，提高了高精度地图的生产效率，有利于实现高精度地图的大规模批量生产。

下述为本申请装置实施例，可以用于执行本申请任一实施例所涉及的地图要素提取方法。对于本申请装置实施例中未披露的细节，请参照本申请所涉及的地图要素提取方法的方法实施例。

请参阅图15，在一示例性实施例中，一种地图要素提取装置900包括但不限于：图像获取模块910、深度图构建模块930、图像分割模块950和位置转换模块970。

其中，图像获取模块910用于获取目标场景的激光点云和图像，所述目标场景包括至少一要素实体对应于地图要素。

深度图构建模块930用于进行所述激光点云与所述图像之间的配准，得到所述图像的深度图。

图像分割模块950用于对所述图像的深度图进行图像分割，得到所述地图要素在所述深度图中的分割图像。

位置转换模块970用于根据所述激光点云与所述图像之间的配准关系，将所述分割图像在所述深度图中的二维位置转换为所述地图要素在所述目标场景中的三维位置。

在一示例性实施例中，所述深度图构建模块包括但不限于：配准单元和构建单元。

其中，配准单元，用于对所述激光点云与所述图像进行配准，得到所述图像中像素点对应的深度信息。

构建单元，用于根据所述图像中像素点对应的深度信息，为所述图像构建所述深度图。

在一示例性实施例中，所述配准单元包括但不限于：函数构建子单元、特征点提取子单元和信息计算子单元。

其中，函数构建子单元，用于构建所述激光点云与所述图像之间的投影变换函数。

特征点提取子单元，用于提取所述激光点云与所述图像中相对应的特征点，并根据提取到的特征点估计所述投影变换函数的参数。

信息计算子单元，用于根据完成参数估计的投影变换函数，计算得到所述图像中像素点对应的深度信息。

在一示例性实施例中，所述位置转换模块包括但不限于：位置转换单元。

其中，位置转换单元，用于将所述分割图像在所述深度图中的二维位置以及所述图像中像素点对应的深度信息，输入完成参数估计的投影变换函数，计算得到所述地图要素在所述目标场景中的三维位置。

在一示例性实施例中，所述图像分割模块包括但不限于：特征提取单元、类别预测单元和拟合单元。

其中，特征提取单元，用于对所述图像的深度图进行特征提取，得到所述图像对应的特征图。

类别预测单元，用于对所述特征图中的像素点进行类别预测，得到所述特征图中像素点的类别。

拟合单元，用于将所述特征图中同一类别的像素点，拟合形成对应地图要素在所述深度图中的分割图像，每一类别对应一种地图要素。

在一示例性实施例中，所述特征提取单元包括但不限于：特征提取子单元、特征融合子单元和插值子单元。

其中，特征提取子单元，用于采用残差神经网络中的高层网络提取得到所述深度图的全局特征，并采用所述残差神经网络中的低层网络提取得到所述深度图的局部特征。

特征融合子单元，用于进行提取得到的全局特征与局部特征的融合，得到中间特征图。

插值子单元，用于对所述中间特征图进行线性插值，得到所述图像对应的特征图。

在一示例性实施例中，所述特征融合子单元包括但不限于：处理子单元、反卷积处理子单元、上采样处理子单元、遍历子单元和定义子单元。

其中，处理子单元，用于对所述残差神经网络中最高一层网络对应的全局特征进行反卷积和上采样处理，得到融合特征图。

反卷积处理子单元，用于对所述残差神经网络中次高一层网络对应的全局特征进行反卷积处理，并通过与所述融合特征图的融合，更新所述融合特征图。

上采样处理子单元，用于对所述更新的融合特征图进行上采样处理，二次更新所述融合特征图。

遍历子单元，用于按照所述残差神经网络中网络由高至低的顺序，对其余高层网络对应的全局特征和低层网络对应的局部特征进行遍历，根据遍历到的全局特征或者局部特征对所述二次更新后的融合特征图进行更新。

定义子单元，用于完成所述遍历后，以最后更新的所述融合特征图作为所述中间特征图。

在一示例性实施例中，所述装置还包括网络构建模块，所述网络构建模块包括但不限于：样本获取单元、模型训练单元和网络构建单元。

其中，样本获取单元，获取图像样本，所述图像样本进行了像素点类别标注。

模型训练单元，用于根据获取到的图像样本引导指定数学模型进行模型训练。

网络构建单元，用于由完成模型训练的指定数学模型构建得到所述残差神经网络。

在一示例性实施例中，所述装置还包括但不限于：显示模块和编辑模块。

其中，显示模块，用于根据所述地图要素在所述目标场景中的三维位置，在目标场景地图中显示所述地图要素。

编辑模块，用于获取针对所述目标场景地图中地图要素的控制指令并响应所述控制指令，生成所述目标场景的高精度地图。

需要说明的是，上述实施例所提供的地图要素提取装置在进行地图要素提取时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即地图要素提取装置的内部结构将划分为不同的功能模块，以完成以上描述的全部或者部分功能。

另外，上述实施例所提供的地图要素提取装置与地图要素提取方法的实施例属于同一构思，其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述，此处不再赘述。

请参阅图16，在一示例性实施例中，一种服务器1000，包括至少一处理器1001、至少一存储器1002、以及至少一通信总线1003。

其中，存储器1002上存储有计算机可读指令，处理器1001通过通信总线1003读取存储器1002中存储的计算机可读指令。

该计算机可读指令被处理器1001执行时实现上述各实施例中的地图要素提取方法。

在一示例性实施例中，一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各实施例中的地图要素提取方法。

上述内容为本申请的示例性实施例，并非用于限制本申请实施例的实施方案，本领域普通技术人员根据本申请实施例的主要构思和精神，可以十分方便地进行相应的变通或修改，故本申请实施例的保护范围应以权利要求书所要求的保护范围为准。

Claims

一种地图要素提取方法，由电子设备执行，包括：

获取目标场景的激光点云和图像，所述目标场景包括至少一要素实体对应于地图要素；

进行所述激光点云与所述图像之间的配准，得到所述图像的深度图；

对所述图像的深度图进行图像分割，得到所述地图要素在所述深度图中的分割图像；

根据所述激光点云与所述图像之间的配准关系，将所述分割图像在所述深度图中的二维位置转换为所述地图要素在所述目标场景中的三维位置。
如权利要求1所述的方法，所述进行所述激光点云与所述图像之间的配准，得到所述图像的深度图，包括：

对所述激光点云与所述图像进行配准，得到所述图像中像素点对应的深度信息；

根据所述图像中像素点对应的深度信息，为所述图像构建所述深度图。
如权利要求2所述的方法，所述对所述激光点云与所述图像进行配准，得到所述图像中像素点对应的深度信息，包括：

构建所述激光点云与所述图像之间的投影变换函数；

提取所述激光点云与所述图像中相对应的特征点，并根据提取到的特征点估计所述投影变换函数的参数；

根据完成参数估计的投影变换函数，计算得到所述图像中像素点对应的深度信息。
如权利要求3所述的方法，所述根据所述激光点云与所述图像之间的配准关系，将所述分割图像在所述深度图中的二维位置转换为所述地图要素在所述目标场景中的三维位置，包括：

将所述分割图像在所述深度图中的二维位置以及所述图像中像素点对应的深度信息，输入完成参数估计的投影变换函数，计算得到所述地图要素在所述目标场景中的三维位置。
如权利要求1所述的方法，所述对所述图像的深度图进行图像分割，得到所述地图要素在所述深度图中的分割图像，包括：

对所述图像的深度图进行特征提取，得到所述图像对应的特征图；

对所述特征图中的像素点进行类别预测，得到所述特征图中像素点的类别；

将所述特征图中同一类别的像素点，拟合形成对应地图要素在所述深度图中的分割图像，其中，每一类别对应一种地图要素。
如权利要求5所述的方法，所述对所述图像的深度图进行特征提取，得到所述图像对应的特征图，包括：

采用残差神经网络中的高层网络提取得到所述深度图的全局特征，并采用所述残差神经网络中的低层网络提取得到所述深度图的局部特征；

对提取得到的全局特征与局部特征进行融合，得到中间特征图；

对所述中间特征图进行线性插值，得到所述图像对应的特征图。
如权利要求6所述的方法，所述对提取得到的全局特征与局部特征进行融合，得到中间特征图，包括：

对所述残差神经网络中最高一层网络对应的全局特征进行反卷积和上采样处理，得到融合特征图；

对所述残差神经网络中次高一层网络对应的全局特征进行反卷积处理，并通过与所述融合特征图的融合，更新所述融合特征图；

对所述更新的融合特征图进行上采样处理，二次更新所述融合特征图；

按照所述残差神经网络中网络由高至低的顺序，对其余高层网络对应的全局特征和低层网络对应的局部特征进行遍历，根据遍历到的全局特征或者局部特征对所述二次更新后的融合特征图进行更新；

完成所述遍历后，以最后更新的所述融合特征图作为所述中间特征图。
如权利要求6所述的方法，还包括：

获取图像样本，所述图像样本进行了像素点类别标注；

根据获取到的图像样本引导指定数学模型进行模型训练；

由完成模型训练的指定数学模型构建得到所述残差神经网络。
如权利要求1至8任一项所述的方法，还包括：

根据所述地图要素在所述目标场景中的三维位置，在目标场景地图中显示所述地图要素；

获取针对所述目标场景地图中地图要素的控制指令并响应所述控制指令，生成所述目标场景的高精度地图。
一种地图要素提取装置，包括：

图像获取模块，用于获取目标场景的激光点云和图像，所述目标场景包括至少一要素实体对应于地图要素；

深度图构建模块，用于进行所述激光点云与所述图像之间的配准，得到所述图像的深度图；

图像分割模块，用于对所述图像的深度图进行图像分割，得到所述地图要素在所述深度图中的分割图像；

位置转换模块，用于根据所述激光点云与所述图像之间的配准关系，将所述分割图像在所述深度图中的二维位置转换为所述地图要素在所述目标场景中的三维位置。
如权利要求10所述的装置，所述深度图构建模块包括：

配准单元，用于对所述激光点云与所述图像进行配准，得到所述图像中像素点对应的深度信息；

构建单元，用于根据所述图像中像素点对应的深度信息，为所述图像构建所述深度图。
如权利要求11所述的装置，所述配准单元包括：

函数构建子单元，用于构建所述激光点云与所述图像之间的投影变换函数；

特征点提取子单元，用于提取所述激光点云与所述图像中相对应的特征点，并根据提取到的特征点估计所述投影变换函数的参数；

信息计算子单元，用于根据完成参数估计的投影变换函数，计算得到所述图像中像素点对应的深度信息。
如权利要求10所述的装置，所述图像分割模块包括：

特征提取单元，用于对所述图像的深度图进行特征提取，得到所述图像对应的特征图；

类别预测单元，用于对所述特征图中的像素点进行类别预测，得到所述特征图中像素点的类别；

拟合单元，用于将所述特征图中同一类别的像素点，拟合形成对应地图要素在所述深度图中的分割图像，其中，每一类别对应一种地图要素。
一种服务器，包括：

处理器；及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如权利要求1至9中任一项所述的地图要素提取方法。
一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的地图要素提取方法。