WO2020172875A1

WO2020172875A1 - 道路结构信息的提取方法、无人机及自动驾驶系统

Info

Publication number: WO2020172875A1
Application number: PCT/CN2019/076568
Authority: WO
Inventors: 李鑫超
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2019-02-28
Filing date: 2019-02-28
Publication date: 2020-09-03
Also published as: CN111316288A

Abstract

本发明实施例提供一种道路结构信息的提取方法、无人机及自动驾驶系统。该方法包括：通过获取道路的至少一帧图像数据(S201)；根据至少一帧图像数据，确定道路的语义地图(S202)，并根据语义地图以及道路结构模型，确定道路的道路结构信息，道路结构信息包括车道分组信息(S203)，实现了对道路结构信息的自动提取，无需人工标注，能够实时提取道路结构信息，提高了道路结构信息的提取效率且道路结构信息不仅包括车道信息还包括车道分组信息，对道路结构的描述更加详细。

Description

道路结构信息的提取方法、无人机及自动驾驶系统

技术领域

本发明实施例涉及无人驾驶技术领域，尤其涉及一种道路结构信息的提取方法、无人机及自动驾驶系统。

背景技术

在无人驾驶场景中，道路结构信息是安全行车不可或缺的依赖信息。随着无人驾驶技术的快速发展，对地图精度以及信息量的要求逐渐提高，传统地图已经无法满足需求，需要一种能够提供高精度、详细道路结构信息的高精度地图。高精度地图不仅需要数据上的高精度，而且需要包含内容详细，条理清晰的道路结构信息。

现有技术中，通常在使用传感器，例如摄像机、激光雷达等，获取场景道路数据之后，通过人工标注的方式，对道路数据中所包含的道路结构信息进行标注，无法实时获取道路结构信息。

发明内容

本发明实施例提供一种道路结构信息的提取方法、无人机及自动驾驶系统，用以解决现有技术中需要人工标注，获取道路结构信息效率低的问题。

第一方面，本发明实施例提供一种道路结构信息的提取方法，包括：

获取道路的至少一帧图像数据；

根据所述至少一帧图像数据，确定所述道路的语义地图；

根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息，所述道路结构信息包括车道分组信息。

第二方面，本发明实施例提供一种无人机，包括机身和处理器；

所述处理器用于：

获取道路的至少一帧图像数据；

根据所述至少一帧图像数据，确定所述道路的语义地图；

第三方面，本发明实施例提供一种自动驾驶系统，包括存储器和处理器；

所述处理器用于：

获取道路的至少一帧图像数据；

根据所述至少一帧图像数据，确定所述道路的语义地图；

第四方面，本发明实施例提供一种道路结构信息的提取装置(例如芯片、集成电路等)，包括：存储器和处理器。所述存储器，用于存储执行道路结构信息的提取方法的代码。所述处理器，用于调用所述存储器中存储的所述代码，执行如第一方面本发明实施例所述的道路结构信息的提取方法。

第五方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包含至少一段代码，所述至少一段代码可由计算机执行，以控制所述计算机执行第一方面本发明实施例所述的道路结构信息的提取方法。

第六方面，本发明实施例提供一种计算机程序，当所述计算机程序被计算机执行时，用于实现第一方面本发明实施例所述的道路结构信息的提取方法。

本发明实施例提供的道路结构信息的提取方法、无人机及自动驾驶系统，通过获取道路的至少一帧图像数据，根据至少一帧图像数据，确定道路的语义地图，并根据语义地图以及道路结构模型，确定道路的道路结构信息，道路结构信息包括车道分组信息，实现了对道路结构信息的自动提取，无需人工标注，能够实时提取道路结构信息，提高了道路结构信息的提取效率，且道路结构信息不仅包括车道信息还包括车道分组信息，对道路结构的描述更加详细。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本发明的实施例提供的无人机系统的示意性架构图；

图2为本发明提供的道路结构信息的提取方法一实施例的流程图；

图3A至图3C为本发明提供的道路结构信息的提取方法一实施例的过程示意图；

图4为本发明提供的无人机一实施例的结构示意图；

图5为本发明提供的自动驾驶系统一实施例的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，当组件被称为“固定于”另一个组件，它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件，它可以是直接连接到另一个组件或者可能同时存在居中组件。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

下面结合附图，对本发明的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

图1为根据本发明的实施例提供的无人机系统的示意性架构图。如图1所示，本实施例提供的无人机系统100可以包括无人机110、显示设备130和控制端140。其中，无人机110可以包括动力系统150、移动控制系统160、机架(图中未示出)和承载在机架上的云台120。无人机110可以与控制端140和显示设备130进行无线通信。无人机可以是无人车或无人飞机，后文中的实施例以无人车为例进行说明。

动力系统150可以包括一个或多个电子调速器(简称为电调)151、一个或多个电机152。其中，电机152与电子调速器151连接；电子调速器151用于接收移动控制系统160产生的驱动信号，并根据驱动信号提供驱动电流给电机152，以控制电机152的转速。电机152用于驱动车轮转动，从而为无人车110的移动提供动力，该动力使得无人车110能够实现一个或多个自由度的运动。应理解，电机152可以是直流电机，也可以交流电机。另外，电机152可以是无刷电机，也可以是有刷电机。

移动控制系统160可以包括移动控制器161和传感系统162。传感系统162用于测量无人车110的运动信息，例如，无人车110在空间的位置信息和运动状态信息，例如，三维位置、三维角度、三维速度、三维加速度和三维角速度等。传感系统162例如可以包括陀螺仪、超声传感器、电子罗盘、惯性测量单元(Inertial Measurement Unit，IMU)、视觉传感器、全球导航卫星系统和气压计等传感器中的至少一种。例如，全球导航卫星系统可以是全球定位系统(Global Positioning System，GPS)。移动控制器161用于控制无人车110的移动，例如，可以根据传感系统162测量的运动信息控制无人车110的移动。应理解，移动控制器161可以按照预先编好的程序指令对无人车110进行控制，也可以通过响应来自控制端140的一个或多个控制指令对无人车110进行控制。

云台120可以包括电机122。云台120可以用于携带拍摄装置123。移动控制器161可以通过电机122控制云台120的运动。可选地，作为另一实施例，云台120还可以包括控制器，用于通过控制电机122来控制云台120的运动。应理解，云台120可以独立于无人车110，也可以为无人车110的一部分。应理解，电机122可以是直流电机，也可以是交流电机。另外，电机122可以是无刷电机，也可以是有刷电机。还应理解，云台120可以位于无人车110的顶部，也可以位于无人车110的底部或者其它地方。

拍摄装置123例如可以是照相机、摄像机、雷达等用于捕获图像的设备，拍摄装置123可以与移动控制器161通信，并在移动控制器161的控制下进行拍摄。本实施例的拍摄装置123至少包括感光元件，该感光元件例如为互补金属氧化物半导体(Complementary Metal Oxide Semiconductor，CMOS)传感器或电荷耦合元件(Charge-coupled Device，CCD)传感器。可以理解，拍摄装置123也可直接固定于无人车110上，从而云台120可以省略。拍摄装置123的数量可以根据需要进行设置，当拍摄装置123的数量为多个时，可以根据预设规则进行排列。

显示设备130可以通过无线方式与无人车110进行通信，并且可以用于显示无人车110的姿态信息。另外，还可以在显示设备130上显示拍摄装置123拍摄的图像。应理解，显示设备130可以是独立的设备，也可以集成在控制端140中。

在一些实施例中，控制端140可以为位于地面端的终端设备，包括但不限于移动电话、计算机、数字广播终端、消息收发设备、平板设备、医疗设备、个人数字助理等；在另一些实施例中，控制端140可以为位于云端的服务器，包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云。控制端140可以通过无线方式与无人车110进行通信，用于对无人车110进行远程操纵。

另外，无人车110还可以挂载有扬声器(图中未示出)，该扬声器用于播放音频文件，扬声器可直接固定于无人车110上，也可搭载在云台120上。

在一些实施例中，移动控制器161可以采用下面实施例所述的道路结构信息的提取方法获取道路结构信息，并结合传感系统162获取到的无人车110的运动信息，对无人车110进行控制，例如进行路径规划、导航、避障、变道、加速、减速等控制。

在另一些实施例中，无人车110将拍摄装置123获取到的图像数据发送至控制端140，控制端140根据获取到的图像数据，采用下面实施例所述的道路结构信息的提取方法获取道路结构信息，生成用于对无人车110进行控制的控制指令。

显示设备130还可以用于显示获取到的道路结构信息。

应理解，上述对于无人车系统各组成部分的命名仅是出于标识的目的，并不应理解为对本发明实施例的限制。本实施例提供的无人车系统例如可以采用下述方法实施例提供的道路结构信息的提取方法，获取道路结构信息，用于构建高精度地图。

图2为本发明提供的道路结构信息的提取方法一实施例的流程图。如图2所示，本实施例提供的方法可以包括：

S201、获取道路的至少一帧图像数据。

本实施例中的道路为待提取道路结构信息的目标道路。本实施例中的图像数据可以为同一拍摄装置所拍摄的时间序列上图像，也可以为多个拍摄装置在同一时刻所拍摄的不同角度上的图像，还可以为不同角度的多个拍摄装置所拍摄的时间序列上图像。本实施例对于图像数据的数据类型不做限制，例如可以包括但不限于RGB图像、灰度图像、深度图像、点云数据等。本实施例中图像数据的帧数可以根据实际需要进行设置，举例来说，当追求实时性时，可以减少图像数据的帧数；当追求精度时，可以增大图像数据的帧数。可选的，本实施例中道路的至少一帧图像数据可以是实时获取的。例如，当本实施例提供的方法应用于无人车时，可以通过安装在无人车上的拍摄装置实时获取道路的至少一帧图像数据。本实施例对于拍摄装置的类型不做限制，例如可以包括但不限于RGB相机、灰度相机、深度相机、激光雷达等。所获取的图像数据的帧数可以根据无人车的车速和/或拍摄装置的拍摄帧率确定，例如帧数可以与车速负相关，或者，帧数可以与拍摄帧率正相关。

S202、根据至少一帧图像数据，确定道路的语义地图。

本实施例中在获取到道路的至少一帧图像数据之后，则根据该至少一帧图像数据，确定道路的语义地图。其中，道路的语义地图包含了道路的语义信息。

S203、根据语义地图以及道路结构模型，确定道路的道路结构信息，道路结构信息包括车道分组信息。

本实施例中在确定了道路的语义地图之后，则根据该语义地图以及道路结构模型，确定道路的道路结构信息。其中，道路结构模型可以根据输入的语义地图，输出与该语义地图相匹配的道路结构信息。

可选的，本实施例中的道路结构模型可以是预先训练的和/或在线训练的。也就是说，道路结构模型可以是在确定道路结构信息之前就已经预先训练好的，即通过离线训练确定的，或者，也可以是在确定道路结构信息时进行在线训练的，或者还可以是通过将预先训练与在线训练进行结合确定的。可选的，本实施例中的道路结构模型可以基于神经网络训练得到，例如可以基于卷积神经网络训练得到。本实施例对于道路结构模型所采用的神经网络的具体实现方式不做限制，例如可以采用AlexNet、VGGNet、GoogleNet、ResNet 等深度卷积神经网络中的一种，或者其中一种的改进，或者其中多种的结合。基于神经网络训练得到的道路结构模型，能够实现对各种复杂场景下道路结构信息的提取。可选的，本实施例中的道路结构信息道路结构信息还可以包括车道信息。其中，车道信息可以用于表示道路标志物与车道的关联关系；车道分组信息可以用于表示道路标志物与车道线组的关联关系。

可选的，车道分组信息可以包括以下信息中的一种或者多种：哪些车道线可以划分为同一组别、限速标志与车道线组的对应关系和箭头与车道线组的对应关系。可以理解的是，车道分组信息所包括的具体种类可以根据道路类型确定，例如当道路类型为限速路段时，车道分组信息中可以包括限速标志与车道线组的对应关系；当道路类型为路口场景时，车道分组信息中可以包括箭头与车道线组的对应关系等。

可选的，车道信息可以包括以下信息中的一种或者多种：车道线的数量、车道线的位置信息、限速标志与车道的对应关系、导向箭头与车道的对应关系和车道类型与车道的对应关系。可以理解的是，车道信息所包括的具体种类可以根据道路类型确定，例如当道路类型为限速路段时，车道信息中可以包括限速标志与车道的对应关系；当道路类型为路口场景时，车道信息中可以包括导向箭头与车道的对应关系等。

本实施例提供的道路结构信息的提取方法，通过获取道路的至少一帧图像数据，根据至少一帧图像数据，确定道路的语义地图，并根据语义地图以及道路结构模型，确定道路的道路结构信息，道路结构信息包括车道分组信息，实现了对道路结构信息的自动提取，无需人工标注，能够实时提取道路结构信息，提高了道路结构信息的提取效率，且道路结构信息不仅包括车道信息还包括车道分组信息，对道路结构的描述更加详细。

下面通过一个具体的示例对道路结构信息的提取方法的过程进行说明。图3A至图3C为本发明提供的道路结构信息的提取方法一实施例的过程示意图。其中，图3A为获取到的道路的图像数据，如图3A所示，本实施例中采用了同一拍摄装置所拍摄的时间序列上的两帧图像数据；图3B为根据图3A所示的图像数据，确定的道路的语义地图；图3C为根据图3B所示的语义地图，采用道路结构模型，确定的道路结构信息示意图。

在一些实施例中，根据至少一帧图像数据，确定道路的语义地图的一种实现方式可以是：识别出每一帧图像数据中的道路标志物；根据至少一帧图像数据中的道路标志物，确定道路的语义地图。

可选的，道路标志物可以包括以下信息中的一种或者多种：车道线、箭头、禁停区域、路牙、护栏和可行驶区域。

在一些实施例中，识别出每一帧图像数据中的道路标志物的一种实现方式可以是：根据预先训练的语义分割模型，确定每一帧图像数据中各个像素点的语义标识，识别出每一帧图像数据中的道路标志物。

本实施例中的语义分割模型，可以根据输入的图像数据，确定该图像数据中各个像素点的语义标识。

可选的，在根据预先训练的语义分割模型，确定每一帧图像数据中各个像素点的语义标识之前，还可以包括：采用预先标注了各个像素点的语义标识的训练样本，对语义分割模型进行训练。

在一些实施例中，根据至少一帧图像数据中的道路标志物，确定道路的语义地图的一种实现方式可以是：根据一帧图像数据以及该图像数据中的道路标志物，确定道路的语义地图；

或者，

对多帧图像数据以及多帧图像数据中的道路标志物进行融合处理，确定道路的语义地图。

本实施例中当图像数据为一帧时，则直接根据该图像数据以及该图像数据中的道路标志物，确定道路的语义地图；当图像数据为多帧时，需要首先对其进行融合处理，然后再确定道路的语义地图。

可选的，对多帧图像数据以及多帧图像数据中的道路标志物进行融合处理，确定道路的语义地图，可以包括：基于多帧图像数据以及多帧图像数据中的道路标志物，利用同步定位与建图算法(Simultaneous Localization and Mapping，SLAM)，确定道路的语义地图。

在上述任一实施例的基础上，本实施例提供的方法在根据语义地图以及道路结构模型，确定道路的道路结构信息之前，还可以包括：获取多个训练样本的语义地图和道路结构信息，道路结构信息是预先标注的；将多个训练样本的语义地图作为道路结构模型的输入特征，将多个训练样本的道路结构信息作为道路结构模型的期望输出特征，对道路结构模型进行训练。

需要说明的是，本实施例中训练样本是语义地图以及与其相对应的道路结构信息成对出现的。其中，道路结构信息是经过预先标注的，可以包括车道信息和车道分组信息。

可选的，可以根据道路结构模型的期望输出特征与实际输出特征确定损失函数，对道路结构模型进行训练直至损失函数的取值满足预设条件。

可选的，多个训练样本覆盖了以下场景中的一种或者多种：直行场景、转弯场景、汇入汇出场景、路口场景、分岔场景和合流场景。需要说明的是，训练样本所覆盖的场景类型越多，训练出的道路结构模型的泛化能力越强，能够满足各种复杂场景下的道路结构信息的提取需求。不同场景下的道路结构信息具有不同的特点，以直行场景和分岔场景为例：车道信息中，分岔场景比直行场景可以多包括了分岔导向箭头；车道分组信息中，直行场景中所有车道线可以属于同一车道线组，而分岔场景中，分岔前的车道线可以属于一个车道线组，分岔后的每一个分岔中的车道线可以分别属于不同的车道线组，如图3C所示的分岔场景，所有车道线可以被划分为3个车道线组。

在一些实施例中，将多个训练样本的语义地图作为道路结构模型的输入特征，将多个训练样本的道路结构信息作为道路结构模型的期望输出特征，对道路结构模型进行训练的一种实现方式可以是：

根据场景类型，将多个训练样本划分为与场景类型相对应的训练样本子集。例如，可以将多个训练样本划分为直行场景训练样本子集、转弯场景训练样本子集、汇入汇出场景训练样本子集、路口场景训练样本子集、分岔场景训练样本子集和合流场景训练样本子集。

针对每一个训练样本子集，训练与之相匹配的道路结构模型。例如，采用直行场景训练样本子集训练直行场景道路结构模型、采用转弯场景训练样本子集训练转弯场景道路结构模型、采用汇入汇出场景训练样本子集训练汇入汇出场景道路结构模型、采用路口场景训练样本子集训练路口场景道路结构模型、采用分岔场景训练样本子集训练分岔场景道路结构模型和采用合流场景训练样本子集训练合流场景道路结构模型。

则根据语义地图以及道路结构模型，确定道路的道路结构信息的一种实现方式可以是：根据语义地图，确定场景类型；根据场景类型，确定与该场景类型相匹配的道路结构模型；根据语义地图以及与该场景类型相匹配的道路结构模型，确定道路的道路结构信息。

举例来说，若根据语义地图确定的场景类型为直行场景，则采用直行场景道路结构模型，确定道路结构信息；若根据语义地图确定的场景类型为转弯场景，则采用转弯场景道路结构模型，确定道路结构信息。

本实施例提供的道路结构信息的提取方法，在上述任一实施例的基础上，通过根据语义地图，确定场景类型；根据场景类型，确定与该场景类型相匹配的道路结构模型；根据语义地图以及与该场景类型相匹配的道路结构模型，确定道路的道路结构信息。实现了针对不同场景类型，采用与之相匹配的道路结构模型确定道路结构信息，提高了道路结构信息提取的准确性。

在一些实施例中，道路结构模型可以包括车道分组模块和车道信息模块。其中，车道分组模块用于确定车道分组信息，车道信息模块用于确定车道信息。

则根据语义地图以及道路结构模型，确定道路的道路结构信息，可以包括：根据语义地图以及车道分组模块，确定道路的车道分组信息；根据语义地图、车道分组信息以及车道信息模块，确定道路的车道信息。

在上述任一实施例的基础上，本实施例提供的方法还可以包括：根据道路结构信息，对语义地图进行纠错处理和/或补全处理。

举例来说，当由于障碍物如其他车辆的遮挡，可能会导致语义地图中出现部分缺失的现象，则可以根据所确定的道路结构信息对其进行补全处理，如补全缺失的部分车道线；可以根据道路结构信息的特点，如属于同一车道线组中的车道线平行的特性，对语义地图中属于同一车道线组中不平行的车道线进行纠错处理。

为了进一步提高道路结构信息的准确性，在上述实施例的基础上，本实施例提供的方法还可以包括：根据进行了纠错处理和/或补全处理之后的语义地图，以及道路结构模型，更新道路的道路结构信息。

本实施例中可以采用进行了纠错处理和/或补全处理之后的语义地图作为道路结构模型的输入特征，将道路结构模型的输出特征作为更新后的道路结构信息。通过闭环处理的方式，提高了道路结构信息的准确性。

本发明实施例提供的道路结构信息的提取方法，具有广阔的应用前景，例如可以用于自动驾驶领域、高精度地图领域、安防巡检领域等。举例来说，当本发明实施例提供的道路结构信息的提取方法应用于自动驾驶领域时，自动驾驶汽车可以采用该方法实时提取道路结构信息，根据获取到的道路结构信息指导自动驾驶，而无需再依赖于预先确定的高精度地图，提高了自动驾驶汽车对于环境的适应能力，如可以提高自动驾驶汽车在未知环境中驾驶的安全性；当本发明实施例提供的道路结构信息的提取方法应用于高精度地图领域时，采用该方法提取道路结构信息，然后基于所获取的道路结构信息构建高精度地图，无需人工标注道路结构信息，既能提高高精度地图的制作效率，降低高精度地图的制作成本，还能够避免由于人工标注而引入的错误，提高高精度地图的准确率。

图4为本发明提供的无人机一实施例的结构示意图。如图4所示，本实施例提供的无人机400可以包括机身401和处理器402。其中，处理器402可以用于：

获取道路的至少一帧图像数据；

根据至少一帧图像数据，确定道路的语义地图；

根据语义地图以及道路结构模型，确定道路的道路结构信息，道路结构信息包括车道分组信息。

可选的，无人机400可以为无人车或者无人飞机。

本实施例提供的无人机，通过获取道路的至少一帧图像数据，根据至少一帧图像数据，确定道路的语义地图，并根据语义地图以及道路结构模型，确定道路的道路结构信息，能够实时提取道路结构信息。基于所获取的道路结构信息构建高精度地图，无需人工标注道路结构信息，既能提高高精度地图的制作效率，降低高精度地图的制作成本，还能够避免由于人工标注而引入的错误，提高高精度地图的准确率。

可选的，处理器402用于获取道路的至少一帧图像数据，具体可以包括：

实时获取道路的至少一帧图像数据。

可选的，所述道路结构模型是预先训练的和/或在线训练的。

可选的，所述道路结构信息还包括车道信息。

可选的，所述道路结构模型是基于神经网络训练得到的。

可选的，所述道路结构模型是基于卷积神经网络训练得到的。

可选的，处理器402用于根据至少一帧图像数据，确定道路的语义地图，具体可以包括：

识别出每一帧图像数据中的道路标志物；

根据至少一帧图像数据中的道路标志物，确定道路的语义地图。

可选的，处理器402用于识别出每一帧图像数据中的道路标志物，具体可以包括：

根据预先训练的语义分割模型，确定每一帧图像数据中各个像素点的语义标识，识别出每一帧图像数据中的道路标志物。

可选的，处理器402用于根据至少一帧图像数据中的道路标志物，确定道路的语义地图，具体可以包括：

根据一帧图像数据以及该图像数据中的道路标志物，确定道路的语义地图；

或者，

可选的，处理器402用于对多帧图像数据以及多帧图像数据中的道路标志物进行融合处理，确定道路的语义地图，具体可以包括：

基于多帧图像数据以及多帧图像数据中的道路标志物，利用同步定位与建图算法SLAM，确定道路的语义地图。

可选的，处理器402用于根据语义地图以及道路结构模型，确定道路的道路结构信息之前，处理器402还可以用于：

获取多个训练样本的语义地图和道路结构信息，道路结构信息是预先标注的；

将多个训练样本的语义地图作为道路结构模型的输入特征，将多个训练样本的道路结构信息作为道路结构模型的期望输出特征，对道路结构模型进行训练。

可选的，多个训练样本覆盖了以下场景中的一种或者多种：直行场景、转弯场景、汇入汇出场景、路口场景、分岔场景和合流场景。

可选的，道路结构模型可以包括车道分组模块和车道信息模块，车道分组模块用于确定车道分组信息，车道信息模块用于确定车道信息；处理器402用于根据语义地图以及道路结构模型，确定道路的道路结构信息，具体可以包括：

根据语义地图以及车道分组模块，确定道路的车道分组信息；

根据语义地图、车道分组信息以及车道信息模块，确定道路的车道信息。

可选的，车道分组信息可以包括以下信息中的一种或者多种：哪些车道线可以划分为同一组别、限速标志与车道线组的对应关系和箭头与车道线组的对应关系。

可选的，车道信息可以包括以下信息中的一种或者多种：车道线的数量、车道线的位置信息、限速标志与车道的对应关系、导向箭头与车道的对应关系和车道类型与车道的对应关系。

可选的，处理器402还可以用于：

根据道路结构信息，对语义地图进行纠错处理和/或补全处理。

可选的，处理器402还可以用于：

根据进行了纠错处理和/或补全处理之后的语义地图，以及道路结构模型，更新道路的道路结构信息。

图5为本发明提供的自动驾驶系统一实施例的结构示意图。如图5所示，本实施例提供的自动驾驶系统500可以包括存储器501和处理器502。存储器501和处理器502可以通过总线通信连接，总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component，PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，EISA)总线等。上述处理器502可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

处理器502可以用于：

获取道路的至少一帧图像数据；

根据所述至少一帧图像数据，确定所述道路的语义地图；

本实施例提供的自动驾驶系统，可以应用于自动驾驶汽车中，通过获取道路的至少一帧图像数据，根据至少一帧图像数据，确定道路的语义地图，并根据语义地图以及道路结构模型，确定道路的道路结构信息，能够实时提取道路结构信息。自动驾驶汽车根据实时获取到的道路结构信息指导自动驾驶，而无需再依赖于预先确定的高精度地图，提高了自动驾驶汽车对于环境的适应能力和自动驾驶汽车在未知环境中驾驶的安全性。

可选的，处理器502用于获取道路的至少一帧图像数据，具体可以包括：

实时获取道路的至少一帧图像数据。

可选的，所述道路结构模型是预先训练的和/或在线训练的。

可选的，所述道路结构信息还包括车道信息。

可选的，所述道路结构模型是基于神经网络训练得到的。

可选的，处理器502用于根据至少一帧图像数据，确定道路的语义地图，具体可以包括：

识别出每一帧图像数据中的道路标志物；

可选的，处理器502用于识别出每一帧图像数据中的道路标志物，具体可以包括：

可选的，处理器502用于根据至少一帧图像数据中的道路标志物，确定道路的语义地图，具体可以包括：

或者，

可选的，处理器502用于对多帧图像数据以及多帧图像数据中的道路标志物进行融合处理，确定道路的语义地图，具体可以包括：

可选的，处理器502用于根据语义地图以及道路结构模型，确定道路的道路结构信息之前，处理器502还可以用于：

可选的，道路结构模型可以包括车道分组模块和车道信息模块，车道分组模块用于确定车道分组信息，车道信息模块用于确定车道信息；处理器502用于根据语义地图以及道路结构模型，确定道路的道路结构信息，具体可以包括：

可选的，处理器502还可以用于：

本发明实施例还提供一种道路结构信息的提取装置(例如芯片、集成电路等)，包括：存储器和处理器。所述存储器，用于存储执行道路结构信息的提取方法的代码。所述处理器，用于调用所述存储器中存储的所述代码，执行上述任一实施例提供的道路结构信息的提取方法。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：只读内存(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

一种道路结构信息的提取方法，其特征在于，包括：

获取道路的至少一帧图像数据；

根据所述至少一帧图像数据，确定所述道路的语义地图；

根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息，所述道路结构信息包括车道分组信息。
根据权利要求1所述的方法，其特征在于，所述获取道路的至少一帧图像数据，包括：

实时获取道路的至少一帧图像数据。
根据权利要求1所述的方法，其特征在于，所述道路结构模型是预先训练的和/或在线训练的。
根据权利要求1所述的方法，其特征在于，所述道路结构信息还包括车道信息。
根据权利要求1所述的方法，其特征在于，所述道路结构模型是基于神经网络训练得到的。
根据权利要求5所述的方法，其特征在于，所述道路结构模型是基于卷积神经网络训练得到的。
根据权利要求1所述的方法，其特征在于，所述根据所述至少一帧图像数据，确定所述道路的语义地图，包括：

识别出每一帧图像数据中的道路标志物；

根据所述至少一帧图像数据中的道路标志物，确定所述道路的语义地图。
根据权利要求7所述的方法，其特征在于，所述道路标志物包括以下信息中的一种或者多种：

车道线、箭头、禁停区域、路牙、护栏和可行驶区域。
根据权利要求7所述的方法，其特征在于，所述识别出每一帧图像数据中的道路标志物，包括：

根据预先训练的语义分割模型，确定每一帧图像数据中各个像素点的语义标识，识别出每一帧图像数据中的道路标志物。
根据权利要求7所述的方法，其特征在于，所述根据所述至少一帧图像数据中的道路标志物，确定所述道路的语义地图，包括：

根据一帧图像数据以及该图像数据中的道路标志物，确定所述道路的语义地图；

或者，

对多帧图像数据以及所述多帧图像数据中的道路标志物进行融合处理，确定所述道路的语义地图。
根据权利要求10所述的方法，其特征在于，所述对多帧图像数据以及所述多帧图像数据中的道路标志物进行融合处理，确定所述道路的语义地图，包括：

基于所述多帧图像数据以及所述多帧图像数据中的道路标志物，利用同步定位与建图算法SLAM，确定所述道路的语义地图。
根据权利要求1所述的方法，其特征在于，所述根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息之前，所述方法还包括：

获取多个训练样本的语义地图和道路结构信息，所述道路结构信息是预先标注的；

将所述多个训练样本的语义地图作为所述道路结构模型的输入特征，将所述多个训练样本的道路结构信息作为所述道路结构模型的期望输出特征，对所述道路结构模型进行训练。
根据权利要求12所述的方法，其特征在于，所述多个训练样本覆盖了以下场景中的一种或者多种：

直行场景、转弯场景、汇入汇出场景、路口场景、分岔场景和合流场景。
根据权利要求4所述的方法，其特征在于，所述道路结构模型包括车道分组模块和车道信息模块，所述车道分组模块用于确定车道分组信息，所述车道信息模块用于确定车道信息；

所述根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息，包括：

根据所述语义地图以及所述车道分组模块，确定所述道路的车道分组信息；

根据所述语义地图、所述车道分组信息以及所述车道信息模块，确定所述道路的车道信息。
根据权利要求14所述的方法，其特征在于，所述车道分组信息包括以下信息中的一种或者多种：

哪些车道线可以划分为同一组别、限速标志与车道线组的对应关系和箭头与车道线组的对应关系。
根据权利要求14所述的方法，其特征在于，所述车道信息包括以下信息中的一种或者多种：

车道线的数量、车道线的位置信息、限速标志与车道的对应关系、导向箭头与车道的对应关系和车道类型与车道的对应关系。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述道路结构信息，对所述语义地图进行纠错处理和/或补全处理。
根据权利要求17所述的方法，其特征在于，所述方法还包括：

根据进行了纠错处理和/或补全处理之后的语义地图，以及所述道路结构模型，更新所述道路的道路结构信息。
一种无人机，其特征在于，包括机身和处理器；

所述处理器用于：

获取道路的至少一帧图像数据；

根据所述至少一帧图像数据，确定所述道路的语义地图；

根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息，所述道路结构信息包括车道分组信息。
根据权利要求19所述的无人机，其特征在于，所述处理器用于获取道路的至少一帧图像数据，具体包括：

实时获取道路的至少一帧图像数据。
根据权利要求19所述的无人机，其特征在于，所述道路结构模型是预先训练的和/或在线训练的。
根据权利要求19所述的无人机，其特征在于，所述道路结构信息还包括车道信息。
根据权利要求19所述的无人机，其特征在于，所述道路结构模型是基于神经网络训练得到的。
根据权利要求23所述的无人机，其特征在于，所述道路结构模型是基于卷积神经网络训练得到的。
根据权利要求19所述的无人机，其特征在于，所述处理器用于根据所述至少一帧图像数据，确定所述道路的语义地图，具体包括：

识别出每一帧图像数据中的道路标志物；

根据所述至少一帧图像数据中的道路标志物，确定所述道路的语义地图。
根据权利要求25所述的无人机，其特征在于，所述道路标志物包括以下信息中的一种或者多种：

车道线、箭头、禁停区域、路牙、护栏和可行驶区域。
根据权利要求25所述的无人机，其特征在于，所述处理器用于识别出每一帧图像数据中的道路标志物，具体包括：

根据预先训练的语义分割模型，确定每一帧图像数据中各个像素点的语义标识，识别出每一帧图像数据中的道路标志物。
根据权利要求25所述的无人机，其特征在于，所述处理器用于根据所述至少一帧图像数据中的道路标志物，确定所述道路的语义地图，具体包括：

根据一帧图像数据以及该图像数据中的道路标志物，确定所述道路的语义地图；

或者，

对多帧图像数据以及所述多帧图像数据中的道路标志物进行融合处理，确定所述道路的语义地图。
根据权利要求28所述的无人机，其特征在于，所述处理器用于对多帧图像数据以及所述多帧图像数据中的道路标志物进行融合处理，确定所述道路的语义地图，具体包括：

基于所述多帧图像数据以及所述多帧图像数据中的道路标志物，利用同步定位与建图算法SLAM，确定所述道路的语义地图。
根据权利要求19所述的无人机，其特征在于，所述处理器用于根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息之前，所述处理器还用于：

获取多个训练样本的语义地图和道路结构信息，所述道路结构信息是预先标注的；

将所述多个训练样本的语义地图作为所述道路结构模型的输入特征，将所述多个训练样本的道路结构信息作为所述道路结构模型的期望输出特征，对所述道路结构模型进行训练。
根据权利要求30所述的无人机，其特征在于，所述多个训练样本覆盖了以下场景中的一种或者多种：

直行场景、转弯场景、汇入汇出场景、路口场景、分岔场景和合流场景。
根据权利要求22所述的无人机，其特征在于，所述道路结构模型包括车道分组模块和车道信息模块，所述车道分组模块用于确定车道分组信息，所述车道信息模块用于确定车道信息；

所述处理器用于根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息，具体包括：

根据所述语义地图以及所述车道分组模块，确定所述道路的车道分组信息；

根据所述语义地图、所述车道分组信息以及所述车道信息模块，确定所述道路的车道信息。
根据权利要求32所述的无人机，其特征在于，所述车道分组信息包括以下信息中的一种或者多种：

哪些车道线可以划分为同一组别、限速标志与车道线组的对应关系和箭头与车道线组的对应关系。
根据权利要求32所述的无人机，其特征在于，所述车道信息包括以下信息中的一种或者多种：

车道线的数量、车道线的位置信息、限速标志与车道的对应关系、导向箭头与车道的对应关系和车道类型与车道的对应关系。
根据权利要求19所述的无人机，其特征在于，所述处理器还用于：

根据所述道路结构信息，对所述语义地图进行纠错处理和/或补全处理。
根据权利要求35所述的无人机，其特征在于，所述处理器还用于：

根据进行了纠错处理和/或补全处理之后的语义地图，以及所述道路结构模型，更新所述道路的道路结构信息。
根据权利要求19所述的无人机，其特征在于，所述无人机包括无人车或者无人飞机。
一种自动驾驶系统，其特征在于，包括：存储器和处理器；

所述处理器用于：

获取道路的至少一帧图像数据；

根据所述至少一帧图像数据，确定所述道路的语义地图；

根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息，所述道路结构信息包括车道分组信息。
根据权利要求38所述的系统，其特征在于，所述处理器用于获取道路的至少一帧图像数据，具体包括：

实时获取道路的至少一帧图像数据。
根据权利要求38所述的系统，其特征在于，所述道路结构模型是预先训练的和/或在线训练的。
根据权利要求38所述的系统，其特征在于，所述道路结构信息还包括车道信息。
根据权利要求38所述的系统，其特征在于，所述道路结构模型是基于神经网络训练得到的。
根据权利要求42所述的系统，其特征在于，所述道路结构模型是基于卷积神经网络训练得到的。
根据权利要求38所述的系统，其特征在于，所述处理器用于根据所述至少一帧图像数据，确定所述道路的语义地图，具体包括：

识别出每一帧图像数据中的道路标志物；

根据所述至少一帧图像数据中的道路标志物，确定所述道路的语义地图。
根据权利要求44所述的系统，其特征在于，所述道路标志物包括以下信息中的一种或者多种：

车道线、箭头、禁停区域、路牙、护栏和可行驶区域。
根据权利要求44所述的系统，其特征在于，所述处理器用于识别出每一帧图像数据中的道路标志物，具体包括：

根据预先训练的语义分割模型，确定每一帧图像数据中各个像素点的语义标识，识别出每一帧图像数据中的道路标志物。
根据权利要求44所述的系统，其特征在于，所述处理器用于根据所述至少一帧图像数据中的道路标志物，确定所述道路的语义地图，具体包括：

根据一帧图像数据以及该图像数据中的道路标志物，确定所述道路的语义地图；

或者，

对多帧图像数据以及所述多帧图像数据中的道路标志物进行融合处理，确定所述道路的语义地图。
根据权利要求47所述的系统，其特征在于，所述处理器用于对多帧图像数据以及所述多帧图像数据中的道路标志物进行融合处理，确定所述道路的语义地图，具体包括：

基于所述多帧图像数据以及所述多帧图像数据中的道路标志物，利用同步定位与建图算法SLAM，确定所述道路的语义地图。
根据权利要求38所述的系统，其特征在于，所述处理器用于根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息之前，所述处理器还用于：

获取多个训练样本的语义地图和道路结构信息，所述道路结构信息是预先标注的；

将所述多个训练样本的语义地图作为所述道路结构模型的输入特征，将所述多个训练样本的道路结构信息作为所述道路结构模型的期望输出特征，对所述道路结构模型进行训练。
根据权利要求49所述的系统，其特征在于，所述多个训练样本覆盖了以下场景中的一种或者多种：

直行场景、转弯场景、汇入汇出场景、路口场景、分岔场景和合流场景。
根据权利要求41所述的系统，其特征在于，所述道路结构模型包括车道分组模块和车道信息模块，所述车道分组模块用于确定车道分组信息，所述车道信息模块用于确定车道信息；

所述处理器用于根据所述语义地图以及道路结构模型，确定所述道路的道路结构信息，具体包括：

根据所述语义地图以及所述车道分组模块，确定所述道路的车道分组信息；

根据所述语义地图、所述车道分组信息以及所述车道信息模块，确定所述道路的车道信息。
根据权利要求51所述的系统，其特征在于，所述车道分组信息包括以下信息中的一种或者多种：

哪些车道线可以划分为同一组别、限速标志与车道线组的对应关系和箭头与车道线组的对应关系。
根据权利要求51所述的系统，其特征在于，所述车道信息包括以下信息中的一种或者多种：

车道线的数量、车道线的位置信息、限速标志与车道的对应关系、导向箭头与车道的对应关系和车道类型与车道的对应关系。
根据权利要求38所述的系统，其特征在于，所述处理器还用于：

根据所述道路结构信息，对所述语义地图进行纠错处理和/或补全处理。
根据权利要求54所述的系统，其特征在于，所述处理器还用于：

根据进行了纠错处理和/或补全处理之后的语义地图，以及所述道路结构模型，更新所述道路的道路结构信息。