CN111771135B

CN111771135B - 自动驾驶车辆中使用rnn和lstm进行时间平滑的lidar定位

Info

Publication number: CN111771135B
Application number: CN201980002101.3A
Authority: CN
Inventors: 卢维欣; 周尧; 万国伟; 侯深化; 宋适宇
Original assignee: Baidu com Times Technology Beijing Co Ltd; Baidu USA LLC
Current assignee: Baidu com Times Technology Beijing Co Ltd; Baidu USA LLC
Priority date: 2019-01-30
Filing date: 2019-01-30
Publication date: 2023-03-21
Anticipated expiration: 2039-01-30
Also published as: EP3714285A1; US11364931B2; CN111771135A; EP3714285A4; EP3714285B1; KR102350181B1; JP7256758B2; US20210354718A1; KR20200096411A; JP2021515178A; WO2020154973A1

Abstract

一种在自动驾驶车辆的定位结果中进行时间平滑的方法包括：针对在线点云中的一系列连续的光探测和测距(LIDAR)帧中的每个来创建概率偏移量，该概率偏移量表示来自在线点云的第一组关键点与来自预先建立的点云地图的第二组关键点之间的整体匹配成本(1301)。该方法还包括：在X维度、Y维度和偏航角维度上将概率偏移量压缩成多个概率向量(1303)；将概率偏移量的每个概率向量提供给多个递归神经网络(RNN)(1305)；以及通过RNN在多个连续的LIDAR帧上生成定位结果的轨迹(1307)。

Description

自动驾驶车辆中使用RNN和LSTM进行时间平滑的LIDAR定位

技术领域

本公开的实施方式总体上涉及操作自动驾驶车辆。更具体地，本公开的实施方式涉及在光探测和测距(LIDAR)定位中使用神经网络进行时间平滑。

背景技术

自动驾驶车辆(ADV)可以将乘客(尤其是驾驶员)从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时，车辆可以使用车载传感器以及高清地图导航到各个位置，从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下驾驶。

为了安全驾驶，ADV需要精确且可靠地估计其位置和取向。理想情况下，ADV的定位需要精确到厘米和次级度(sub-degree)的方位角。使用光探测和测距(LIDAR)扫描仪的现有定位方法在定位管线中通常需要若干阶段。虽然现有方法中的一些在不同场景的定位精度和鲁棒性方面具有出色的性能，但它们通常需要大量的工程性工作来对管线中的一些阶段进行硬编码并进行微调，并且对某些场景具有强烈的偏好。另一方面，虽然神经网络已经用来处理语义并且已经实现了良好的结果，但是神经网络在解决与3D几何相关的任务(例如，定位问题)方面是存在欠缺的。

发明内容

在第一方面，本公开提供了一种用于在自动驾驶车辆(ADV)的定位结果中进行时间平滑的计算机实施方法，该方法包括：针对在线点云中的多个连续的光探测和测距(LIDAR)帧中的每个来创建概率偏移量，概率偏移量表示来自在线点云的第一组关键点与来自预建的点云地图的第二组关键点之间的整体匹配成本；在X维度、Y维度和偏航角维度上将概率偏移量压缩成多个概率向量；将概率偏移量的每个概率向量提供给多个递归神经网络(RNN)；以及通过多个RNN在多个连续的LIDAR帧上生成定位结果的轨迹。

在第二方面，本公开提供了一种用于在自动驾驶车辆(ADV)的定位结果中进行时间平滑的系统，该系统包括：处理器；以及存储器，存储器联接至处理器以存储指令，所述指令在由处理器运行时使得处理器执行以下操作，所述操作包括：针对在线点云中的多个连续的光探测和测距(LIDAR)帧中的每个来创建概率偏移量，概率偏移量表示来自在线点云的第一组关键点与来自预建的点云地图的第二组关键点之间的整体匹配成本；在X维度、Y维度和偏航角维度上将概率偏移量压缩成多个概率向量；将概率偏移量的每个概率向量提供给多个递归神经网络(RNN)；以及通过多个RNN在多个连续的LIDAR帧上生成定位结果的轨迹。

在第三方面，本公开提供了一种存储有指令的非暂时性机器可读介质，所述指令在由处理器运行时使得处理器执行在自动驾驶车辆(ADV)的定位结果中进行时间平滑的操作，所述操作包括：针对在线点云中的多个连续的光探测和测距(LIDAR)帧中的每个来创建概率偏移量，概率偏移量表示来自在线点云的第一组关键点与来自预建的点云地图的第二组关键点之间的整体匹配成本；在X维度、Y维度和偏航角维度上将概率偏移量压缩成多个概率向量；将概率偏移量的每个概率向量提供给多个递归神经网络(RNN)；以及通过多个RNN在多个连续的LIDAR帧上生成定位结果的轨迹。

附图说明

本公开的实施方式以示例而非限制的方式示出在附图的各图中，附图中相似的附图标记指示相似的元件。

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。

图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。

图3A至图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。

图4示出了根据本发明实施方式的基于学习的LIDAR定位系统。

图5示出了根据实施方式的用于提取点云特征的系统。

图6示出了根据实施方式的用于点云特征提取的系统的示例性实施方案。

图7示出了根据实施方式的示出提取点云特征的示例性过程的流程图。

图8示出了根据实施方式的用于在LIDAR定位中使用神经网络的解决方案推断的系统。

图9示出了根据实施方式的用于在LIDAR定位中使用神经网络进行解决方案推断的系统的示例性实施方案。

图10示出了根据实施方式的示出在LIDAR定位中使用神经网络的解决方案推断的示例性过程的流程图。

图11示出了根据实施方式的用于在ADV的定位结果中进行时间平滑的系统。

图12示出了根据实施方式的用于在ADV的定位结果中进行时间平滑的系统的示例性实施方案。

图13是示出了根据实施方式的用于在ADV的定位结果中进行时间平滑的示例性过程的流程图。

图14示出了根据实施方式的基于学习的LIDAR定位系统1400的整体架构。

图15更详细地示出了根据实施方式的基于学习的LIDAR定位系统1500的整体架构。

图16是示出可以与本公开的一个实施方式一起使用的数据处理系统的示例的框图。

具体实施方式

将参考以下所讨论的细节来描述本公开的各种实施方式和方面，附图将示出所述各种实施方式。下列描述和附图是对本公开的说明，而不应当解释为限制本公开。描述了许多特定细节以提供对本公开各种实施方式的全面理解。然而，在某些情况下，并未描述众所周知的或常规的细节以提供对本公开的实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的引述意味着结合该实施方式所描述的特定特征、结构或特性可包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各处的记载不必全部指同一实施方式。

根据一个实施方式，本文中描述的是基于学习的LIDAR定位系统，其包括供ADV使用的多个神经网络。基于学习的LIDAR定位系统在不需要大量工程性工作来对手工制作的系统进行硬编码的情况下，即可与现有技术的手工制作的定位系统的性能相配。

在一个实施方式中，基于学习的LIDAR定位系统可以接收在线LIDAR点云、预建的3D点云地图和ADV的预测姿势作为输入，从在线LIDAR点云和预建的3D点云地图学习特征，并在解空间上构建成本量。基于学习的LIDAR定位系统可以将卷积神经网络(CNN)和递归神经网络(RNN)应用于成本量以估计ADV的最佳姿势。

基于学习的LIDAR定位系统可以实现高精度(例如，厘米级)定位，这与具有手工制作的管线的现有技术系统相当。基于学习的LIDAR定位系统使用多种深度神经网络结构来建立基于学习的方法，而非依赖于手工制作模块。点云的所提取的局部特征描述符可以被特别优化以用于在各种真实世界的驾驶场景中进行匹配。对已经在解空间中构建的成本量应用的卷积神经网络可以显著改善ADV的定位精度。如本文中所使用的，在一个实施方式中，解空间是优化问题的一组可能点，该组可能点满足该问题的约束。例如，用于估计ADV的最佳姿势而选择的LIDAR点可以认为是解空间。

在一个实施方式中，基于学习的LIDAR定位系统通过这样的数据进行驱动：所述数据可以使用离线方法自动地或半自动地大量进行收集。大量数据包括标注真值(groundtruth)轨迹，并且可以用于训练定位系统以进行定位任务。基于学习的LIDAR定位系统要求对数据进行最少的人工标记工作，并且因此通常更具成本效益。

在一个实施方式中，预测姿势可以由ADV的惯性测量单元(IMU)或ADV的车辆动态模型生成，并且可以测量连续LIDAR帧之间的增量运动。预测姿势可能偏离ADV的groundtruth姿势，从而导致偏移。因此，恢复偏移等同于估计车辆位置。基于学习的LIDAR定位系统可以通过使在线点云与预建的3D点云地图之间的匹配成本最小化来生成预测姿势与ground truth姿势之间的最佳偏移。在一个实施方式中，最佳偏移可包括2D水平偏移和前向偏移。

在一个实施方式中，在线点云可以是从来自安装在ADV上的LIDAR装置的多个LIDAR扫描累积的单个或多个连续帧。在线点云可以表示为一组3D LIDAR点，其中每个LIDAR点都可以是包括LIDAR点在本地车辆或LIDAR坐标系中的坐标和反射强度的矢量。在线点云考虑ADV的运动补偿。因此，当ADV从A点移动到B点时，ADV的在线点云在A点和B点处将会不同。

在一个实施方式中，预建的3D点云地图可以是具有全局坐标的LIDAR点的集合。LIDAR点可以通过研究或绘制车辆进行收集，并且为了存储效率可以使用体素网格滤波器对LIDAR点进行下采样。另外，可以使用训练神经网络模型(例如，PointNet++)通过语义分割从预建的3D点云地图去除动态对象(例如，车辆、自行车和行人)。

在一个实施方式中，用于提取在定位自动驾驶车辆(ADV)时使用的点云特征的方法包括：从在线点云选择第一组关键点，所述在线点云通过ADV上的LIDAR装置而生成；以及使用在ADV上运行的特征学习神经网络，针对第一组关键点提取第一组特征描述符。该方法还包括在预建的点云地图上定位第二组关键点，所述第二组关键点中的每个关键点均与第一组关键点中的关键点对应；从预建的点云地图提取第二组特征描述符；以及基于第一组特征描述符、第二组特征描述符和ADV的预测姿势来估计ADV的位置和取向。

在一个实施方式中，该方法还包括从提取的第一组特征描述符和第二组特征描述符构建成本值。成本量中的每个单元(即，子量)表示第一组关键点中的一个与第二组关键点的具有给定偏移的相应关键点之间的匹配成本。可以减少成本量并使其正则化以供多种不同类型的神经网络使用来获得最佳偏移，从而确定出ADV的最佳姿势。

在一个实施方式中，第一组关键点和第二组关键点中的每个均是LIDAR点。第一组关键点和第二组关键点具有固定数量的关键点。当对第一组关键点进行选择时，可以执行以下操作：遍历在围绕ADV的预测姿势的预定区域中的LIDAR点以定位多个候选LIDAR点，每个候选LIDAR点在该候选LIDAR点的邻域中具有预定密度的LIDAR点；以及使用3D结构张量来评估候选LIDAR点中的每一个的线性度。每个候选LIDAR点的线性度可以基于该评估而被分配值。候选LIDAR点可以基于其分配的值进行排序。可以基于已排序的候选LIDAR点来选择固定数量的候选LIDAR点。当选择固定数量的候选LIDAR点时，每个新选择的LIDAR点需要与已选择的一个或多个现有LIDAR点保持预定距离。

在一个实施方式中，特征学习神经网络包括多个微型神经网络。每个微型神经网络可以针对第一组关键点中的一个而提供。每个微型神经网络可以沿着关键点的z轴应用柱体以收集预定数量的相邻LIDAR点，每个相邻的LIDAR点均具有反射强度和对于该关键点的相对坐标。每个微型神经网络可以基于相关联的相邻LIDAR点的相对坐标和反射强度来进一步提取关键点的特征描述符。类似地，每个微型神经网络可以针对第二组关键点中的一个而提供，并且可以用于基于关键点的相邻LIDAR点的相对坐标和反射强度来提取第二组关键点中的关键点的特征描述符。可以使用由2×2旋转矩阵和2D平移向量表示的变换来计算预建的点云地图上的第二组关键点的每个的坐标。

在一个实施方式中，在针对第二组关键点中的关键点没有找到预定数量的相邻LIDAR点的情况下，可以使用全连接网络来提取关键点的特征描述符，其中，对网络的输入可以设置为单位矢量。

在一个实施方式中，在LIDAR定位中使用神经网络进行解决方案推断的方法包括在解空间中构建用于ADV的预测姿势的成本量，该成本量包括多个子量，每个子量表示来自在线点云的关键点与预建的点云地图上的相应关键点之间的匹配成本。该方法还包括使用卷积神经网络(CNN)来使成本量正则化以细化(refine)匹配成本；以及从经正则化的成本量推断出预测姿势的最佳偏移。该最佳偏移可用于确定ADV的位置。

在一个实施方式中，每个CNN共享同一组参数，并且包括多个卷积层。卷积层中的至少一层是3D卷积层，其使用批量归一化和修正线性单元(ReLU)。

在一个实施方式中，预测姿势的解空间包括通过从在线点云选择的一组关键点限定的空间。该组关键点中的每一个均与预定数量的相邻点相关联，并且与该组关键点的其余关键点具有最小距离。

在一个实施方式中，构建成本量还包括计算每对相应的特征描述符之间的度量距离。该度量距离是多维向量，其中，每个元素通过将距描述符对中的相应的一个的距离求平方值而计算。另外，在构建成本量时，可以将解空间划分成多个离散空间，每个离散空间对应于关键点。

针对每个离散空间，可以基于由相应的关键点及其相关的相邻LIDAR点占据的空间，确定出x维度、y维度和yaw(偏航角)维度的大小。随后，可以基于用于预测姿势的多个特征描述符和用于每个离散空间的每个维度的大小来构建成本量。成本量的每个子量可以与来自在线点云的具有其相关特征描述符的关键点、转换以及来自预建的点云地图的相应特征描述符相关。

在一个实施方式中，在用于ADV的定位结果中进行时间平滑的方法包括：针对在线点云中的一系列连续光探测和测距(LIDAR)帧中的每个创建概率偏移量，概率偏移量表示来自在线点云的第一组关键点与来自预建的点云地图的第二组关键点之间的整体匹配成本。该方法还包括在x维度、y维度和yaw维度上将概率偏移量压缩成多个概率向量；将概率偏移量中的每个概率向量提供给多个递归神经网络(RNN)；以及在多个连续的LIDAR帧上通过RNN生成位置结果的轨迹。

在一个实施方式中，概率偏移量包括多个子量，每个子量表示针对ADV的特定位置偏移的在线点云与预建的点云地图之间的整体匹配成本。每个RNN均包括多个长短期记忆(LSTM)单元。将每个概率向量作为输入提供给LSTM单元中的一个。RNN基于来自连续的LIDAR帧的、所学习的历史信息在连续的LIDAR帧上平滑定位结果的轨迹。ADV可以在连续的LIDAR帧上具有多个预测姿势。

自动驾驶车辆

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1，网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。虽然示出一个自动驾驶车辆，但多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络，例如，有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集，诸如，Web或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器或者位置服务器等。

自动驾驶车辆是指可以被配置成处于自动驾驶模式下的车辆，在所述自动驾驶模式下，车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可包括传感器系统，所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。

在一个实施方式中，自动驾驶车辆101包括，但不限于，感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可包括普通车辆中包括的某些常用部件，诸如：发动机、车轮、方向盘、变速器等，所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制，该多种通信信号和/或命令例如，加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如，部件110至115可以经由控制器局域网(CAN)总线通信地联接到彼此。CAN总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议，但也用于许多其它环境。

现在参考图2，在一个实施方式中，传感器系统115包括但不限于一个或多个相机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214以及光探测和测距(LIDAR)单元215。GPS单元212可包括收发器，所述收发器可操作以提供关于自动驾驶车辆的位置的信息。IMU单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中，除感测对象之外，雷达单元214可以另外感测对象的速度和/或前进方向。LIDAR单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外，LIDAR单元215还可包括一个或多个激光源、激光扫描器以及一个或多个检测器。相机211可包括用来收集自动驾驶车辆周围环境的图像的一个或多个装置。相机211可以是静物相机和/或视频相机。相机可以是可机械地移动的，例如，通过将相机安装在旋转和/或倾斜平台上。

传感器系统115还可包括其它传感器，诸如：声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如，麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中收集声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下，油门传感器和制动传感器可以集成为集成式油门/制动传感器。

在一个实施方式中，车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制马达或发动机的速度，马达或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意，如图2所示的部件可以以硬件、软件或其组合实施。

回到图1，无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等的外部系统之间的通信。例如，无线通信系统112可以与一个或多个装置直接无线通信，或者经由通信网络进行无线通信，诸如，通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(WLAN)，例如，使用WiFi，以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如，乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分，包括例如键盘、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理，尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如，处理器、存储器、存储设备)和软件(例如，操作系统、规划和路线安排程序)，以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息，处理所接收的信息，规划从起始点到目的地点的路线或路径，随后基于规划和控制信息来驾驶车辆101。替代地，感知与规划系统110可以与车辆控制系统111集成在一起。

例如，作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如，感知与规划系统110可以从MPOI服务器中获得位置和路线信息，所述MPOI服务器可以是服务器103至104的一部分。位置服务器提供位置服务，并且MPOI服务器提供地图服务和某些位置的POI。替代地，此类位置和MPOI信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时，感知与规划系统110也可以从交通信息系统或服务器(TIS)获得实时交通信息。应注意，服务器103至104可以由第三方实体进行操作。替代地，服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、MPOI信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如，障碍物、对象、附近车辆)，感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101，以安全且高效到达指定目的地。

服务器103可以是为多种客户端执行数据分析服务的数据分析系统。在一个实施方式中，数据分析系统103包括数据收集器121和机器学习引擎122。数据收集器121从各种车辆(自动驾驶车辆或由人类驾驶员所驾驶的常规车辆)收集驾驶统计数据123。驾驶统计数据123包括表明在不同的时间点时发出的驾驶命令(例如，油门命令、制动命令、转向命令)以及车辆的传感器所捕获的车辆的响应(例如速度、加速、减速、方向)的信息。驾驶统计数据123还可包括描述在不同的时间点时的驾驶环境的信息，诸如，例如路线(包括起始位置和目的地位置)、MPOI、道路条件、天气条件等。

基于驾驶统计数据123，机器学习引擎122出于多种目的而生成或训练规则集、算法和/或预测模型124。例如，算法/模型124包括用于如下面进一步详细描述的LIDAR定位过程的算法和模型。算法124随后可被上传至ADV上以在自动驾驶期间实时地使用。

图3A和图3B是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以被实施为图1的自动驾驶车辆101的一部分，包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3A至图3B，感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306和路线安排模块307。

模块301至307中的一些或全部可以以软件、硬件或其组合实施。例如，这些模块可以安装在永久性存储装置352中、加载到存储器351中，并且由一个或多个处理器(未示出)执行。应注意，这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至307中的一些可以一起集成为集成模块。

定位模块301(例如，利用GPS单元212)确定包括系统300的自动驾驶车辆的当前位置，并管理与用户的行程或路线相关的任何数据。定位模块301(也被称为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与包括系统300的自动驾驶车辆的诸如地图和路线信息311的其它部件通信，以获得行程相关数据。例如，定位模块301可以从位置服务器和地图与POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务，并且MPOI服务器提供地图服务和某些位置的POI，这些服务和POI可以作为地图和路线信息311的一部分高速缓存。当包括系统300的自动驾驶车辆沿着路线移动时，定位模块301也可以从交通信息系统或服务器获得实时交通信息。

地图和路线数据311也可以被感测模块302用于对象检测中。例如，可以从地图和路线数据311中提取特征，并且可以将所提取的特征与从点云提取的特征组合以通过ADV来检测对象。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息，感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可包括例如采用对象形式的车道配置、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如，停止标志、让行标志)等。车道配置包括描述一条车道或多条车道的信息，例如，车道的形状(例如，直线或曲率)、车道的宽度、道路中的车道数目、单向车道或双向车道、合流车道或分流车道、出口车道等。

感知模块302可包括计算机视觉系统或计算机视觉系统的功能，以处理并分析由一个或多个相机捕获的图像，从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪以及其它计算机视觉技术。在一些实施方式中，计算机视觉系统可以绘制环境地图，跟踪对象，以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或LIDAR的其它传感器提供的其它传感器数据来检测对象。

针对每个对象，预测模块303预测所述对象在所述情况下的行为。基于在某时间点感知的驾驶环境的感知数据根据地图/路线信息311与交通规则312的集合来执行所述预测。例如，如果对象是相反方向处的车辆且当前驾驶环境包括十字路口，则预测模块303将预测该车辆是可能向前直行还是可能转弯。如果感知数据表明十字路口没有交通灯，则预测模块303可预测该车辆可能在进入十字路口之前必须完全停下。如果感知数据表明该车辆当前处于左转专用车道或右转专用车道，则预测模块303可分别预测该车辆更可能进行左转或右转。

针对每个对象，决策模块304作出关于如何处置对象的决定。例如，针对特定对象(例如，交叉路线中的另一车辆)以及描述对象的元数据(例如，速度、方向、转弯角度)，决策模块304决定如何与所述对象相遇(例如，超车、让行、停止、经过)。决策模块304可以根据诸如交通规则或驾驶规则312的规则集来作出此类决定，所述规则集可以存储在永久性存储装置352中。

路线安排模块307配置成提供从起始点到终点的一个或多个路线或路径。对于例如从用户处接收到的从起始位置到目的地位置的给定行程，路线安排模块307获取地图和路线信息311，并确定从起始位置到达目的地位置的所有可能的路线或路径。对于确定了从起始位置到达目的地位置的路线中的每一个，路线安排模块307可以以地形图的形式生成参考线路。参考线路表示没有诸如其它车辆、障碍物或交通状况的任何干扰的理想路线或理想路径。即，如果道路上没有其它车辆、行人或障碍物，则ADV应精确地或接近地遵循参考线路。随后可向决策模块304和/或规划模块305提供地形图。根据由其它模块提供的其它数据(诸如，来自定位模块301的交通状况、感知模块302感知的驾驶环境和预测模块303预测的交通状况)，决策模块304和/或规划模块305检验所有可能的路线，以选择并修正其中一个最佳路线。取决于在某时间点时的特定的驾驶环境，用于控制ADV的实际路径或路线可接近于或不同于由路线安排模块307提供的参考线路。

基于针对所感知到的对象中的每个的决定，规划模块305使用路线安排模块307提供的参考线路作为基础，为自动驾驶车辆规划路径或路线以及驾驶参数(例如，距离、速度和/或转弯角度)。即，针对给定的对象，决策模块304决定对对象做什么，而规划模块305确定如何去做。例如，针对给定的对象，决策模块304可以决定经过所述对象，而规划模块305可以确定在所述对象的左侧还是右侧经过。规划和控制数据由规划模块305生成，包括描述包括系统300的车辆在下一移动周期(例如，下一路线/路径段)中将如何移动的信息。例如，规划和控制数据可以指示包括系统300的车辆以30英里每小时(mph)的速度移动10米，随后以25mph的速度变到右侧车道。

基于规划和控制数据，控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息，以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如，油门、制动和转向命令)将车辆从路线或路径的第一点驾驶到第二点。

在一个实施方式中，规划阶段在多个规划周期(也称为驾驶周期)中执行，诸如，以例如每100毫秒(ms)的时间间隔执行。针对每个规划周期或驾驶周期，将基于规划和控制数据发出一个或多个控制命令。即，对于每个100ms，规划模块305规划下一路线段或路径段，例如，包括目标位置和ADV到达该目标位置所需的时间。替代地，规划模块305还可指定具体速度、方向和/或转向角度等。在一个实施方式中，规划模块305为下一预定的时间段(诸如5秒)规划路线段或路径段。对于每个规划周期，规划模块305基于先前周期中所规划的目标位置为当前周期(例如，下个5秒)规划目标位置。控制模块306随后基于当前周期的规划和控制数据生成一个或多个控制命令(例如，油门控制命令、制动控制命令、转向控制命令)。

应注意，决策模块304和规划模块305可以集成为集成模块。决策模块304/规划模块305可包括导航系统或导航系统的功能，以确定自动驾驶车辆的驾驶路径。例如，导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向：所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时，基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可以将来自GPS系统和一个或多个地图的数据合并，以确定用于自动驾驶车辆的驾驶路径。

应注意，如上文示出和描述的部件中的一些或全部可以以软件、硬件或其组合实施。例如，此类部件可以实施为安装并存储在永久性存储装置中的软件，所述软件可以加载在存储器中并通过处理器(未示出)执行以实施本申请全文中所述的过程或操作。替代地，此类部件可以实施为编程或嵌入到专用硬件(诸如，集成电路(例如，专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码，所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外，此类部件可以实施为处理器或处理器内核中的特定硬件逻辑，作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

点云特征提取

图4示出了根据本发明的实施方式的基于学习的LIDAR定位系统。如图4所示，定位模块301可以包括点云特征学习网络(例如，PointNet)409。该点云特征学习网络409可以采用ADV的预建的3D点云地图406、在线LIDAR点云404和预测姿势407作为输入，并且可以基于多个所选择的LIDAR点(也被称为关键点)从在线点云404提取多个特征描述符。可以定位相应的关键点，并且可以通过点云特征学习网络409类似地提取相应的LIDAR点的特征。

在一个实施方式中，可以基于从在线点云404和预建的3D点云地图406提取的特征描述符来构建成本量410。成本量的每个单元(即，子量)可以表示第一组关键点中的一个与第二组关键点中的具有给定偏移的相应关键点之间的匹配成本。如本文中所使用的，在一个实施方式中，可以基于预定算法来计算匹配成本，从而测量来自在线点云404和预建的3D点云地图406的每一对关键点(即，预先选择的LIDAR点)之间的相似性。

如进一步所示出的，在一个实施方式中，定位模块301可以包括多个CNN 411，多个CNN 411可应用于成本量410以将成本量410正则化，从而可以考虑成本量410中的更多背景来细化匹配成本。此外，可将多个RNN 413应用于经过正则化的成本量，来平滑在多个连续的LIDAR帧上的定位结果的轨迹。

在一个实施方式中，预测姿势407通常可以通过惯性测量单元(IMU)或车辆动态(运动模型)生成。预测姿势407可以测量序列LIDAR帧之间的增量运动。因此，基于学习的LIDAR定位系统400的任务是通过使在线点云404与3D点云地图406之间的匹配成本最小化来寻找最终姿势与预测姿势之间的最佳偏移。

在一个实施方式中，为了具有更好的效率和鲁棒性，系统可以仅估计ADV的2D水平偏移和前向偏移(Δx，Δy，Δψ)。

在一个实施方式中，系统400表示可以使用LIDAR扫描准确地估计ADV的位置和取向的深度神经网络架构。在深度神经网络中，如上所述，一组关键点通过其利用3D点的相邻点的特征值进行限定的线性度进行评估。微型PointNet集可用于提取特征描述符，并且对这些点的某些统计属性进行编码。可以对微型PointNet集进行训练以优化不同场景中的匹配鲁棒性。该系统可以在成本量通过由3D卷积而被正则化的X×Y×ψ(X，Y和Yaw)维度上在完全可微分的成本量中改善定位精度，从而产生与手工制作的管线相当的结果。对这些维度的匹配概率进行计算以获得最佳估计。因此，使用系统400，可以通过深度递归神经网络(RNN)对时间运动动态进行隐式封装，所述时间运动动态通常通过滤波方法进行建模。

因此，在基于学习的LIDAR框架400中，可以对基于微型PointNet的特征描述符提取进行训练以对于特征匹配鲁棒性而言(尤其是经过长时间的户外时段)是最佳的，从而能够实现基于学习的LIDAR定位。可以通过使用可微分的几何变换和特征描述符的双线性插值这样的设计来实现3D卷积的使用，以学习如何在X×Y×yaw维度上对成本量410进行滤波和正则化，从而改善定位精度。

图5示出了根据实施方式的用于提取点云特征的系统。如图5中所示，可以从在线点云在线点云通过由ADV上的LIDAR装置而生成的在线点云404选择一组关键点502，以用于ADV的预测姿势。每个关键点均是LIDAR点，并且可以基于包括密度、几何特征和分布的一组预定因素进行选择。可以针对所选关键点中的每一个来选择预定数量的相邻LIDAR点。每个所选的相邻点可以与包括坐标和反射强度的多个属性相关联。针对所选关键点的每个相邻LIDAR点的属性可以被放入至张量501、503或505中，并且可以提供给微型特征学习网络513、515和517中的一个，微型特征学习网络513、515和517可针对所选关键点来提取特征描述符519、521和523。

在一个实施方式中，相同数量的相应关键点504可以定位在预建的3D点云地图406上。可以针对每个相应的关键点来类似地定位相同预定数量的相邻LIDAR点。每个相邻LIDAR点的属性可以被包括在张量507、509和511中，并且可以提供给特征描述符微型特征学习网络513、515和517中的一个，微型特征学习网络513、515和517可针对该相应关键点来提取特征描述符525、527和529。

图6示出了根据实施方式的用于点云特征提取的系统的示例性实施方案。如图6所示的示例性实施包括在线点云605(即，LIDAR点云)和预建的3D点云地图607。该在线LIDAR点云605可以是来自安装在车辆上的LIDAR装置的、从考虑运动补偿的多个LIDAR扫描累积的单个或多个连续帧。在线LIDAR点云605表示为一组3D点{P_i|i＝1,…,n}，其中，每个点P_i都是包括各个点在本地车辆或LIDAR坐标系中的坐标和反射强度的(x，y，z，r)的向量。

该预建的3D点云地图607是具有全局坐标的LIDAR点的集合，所述LIDAR点通过研究或绘制车辆进行收集。为了具有更好的存储效率，使用体素网格滤波器对3D点云地图607进行下采样。此外，使用PointNet++执行语义分割以在点云地图中去除诸如车辆、自行车、行人等的动态对象。

作为第一步，该系统可以从一组局部斑点(也被称为关键点)中提取局部特征描述符。关键点的选择从不同方面来考虑数个局部和全局几何特征。在选择关键点之后，使用微型版PointNet 613来提取特征描述符。

考虑到包括密度、几何特征和分布在内的一些因素，从在线点云605提取固定数量的关键点。首先，遍历在线点云605中的所有LIDAR点以在其邻域中定位具有预定点密度的候选者。然后，使用3D结构张量来评估每个候选关键点的线性度。具有强线性结构的特征因其在常见道路场景中的独特性和丰富性而被认为适合于定位任务。第三，候选关键点按其线性度从最显著到最不显著进行排序，以选择最小数量的关键点。新选择的关键点需要与现有的关键点保持足够的距离。

一旦已选择了合格的关键点，就可以提取对其有意义的特征描述符。虽然传统特征(例如，简单的几何或统计特征)用于使用通过深度网络而学习到的特征来描述点云之间的相似性，但是PointNet用于提取特征描述符以解决在网络架构中消耗无序点的问题。

更具体地，在一个示例中，对于每个关键点，可以沿着z轴应用竖直柱体以收集64个相邻点。对于水平定位，与球形搜索区域相比，竖直柱体中的相邻点可以构建出更有意义的特征。对于每个相邻点，与关键点的相对坐标及其反射强度(x，y，z，r)用于描述符提取。因此，微型PointNet网络的输入是64×4的张量609或611；输出是表示关键点斑点的局部特征的32维向量614，所述局部特征可以来自在线点云605或预建的3D点云地图607。

用于特征提取的微型版本PointNet 613可以包括3个堆叠的全连接层的多层感知器(MLP)和用于聚合并获取特征描述符的最大池层。

对于来自在线点云605和离线3D点云地图607两者的提取特征，可以使用参数共享微型PointNet结构613。对于特定地图点，如果在地图点周围未看到最小数量的相邻点，则该地图点被视为空地图点/关键点。FCN可用于学习空地图点的特征描述符表示，其中对网络的输入可设置为单位向量。

以下描述实施方案的参数和阈值：

在关键点的选择期间，可以在LIDAR点云605的帧内选择128个关键点。如本文中所使用的，帧是LIDAR单元的旋转或摆动。然后，在沿着z轴具有0.5m半径的柱体内选择每个关键点的64个相邻点用于特征描述符提取。允许的最小相邻点数量设置成16。如果存在16至64个相邻点，则通过有效相邻点来简单地重复填充关键点的64×4输入向量609。否则，地图点将被视为空。成本量的解空间被设置为11×11×11，并且在x、y和ψ维度上的阶分别为0.25m、0.25m和0.5度。因此，预测姿势的最大可承受偏移约为(0.25×(11-1)/2＝1.25m，1.25m和2.5度)。在该实施方案中，微型PointNet结构是64×32×32MLP，3D CNN是Conv3d(16,1,1)-Conv3d(4,3,1)-Conv3d(1,3,1)，以及RNN是具有11个隐藏状态的两层LSTM。

图7示出了根据实施方式的示出提取点云特征的示例性过程的流程图。过程700可以由处理逻辑执行，所述处理逻辑可包括软件、硬件或两者的组合。过程700可以由处理逻辑执行，所述处理逻辑可包括硬件(例如，电路、专用逻辑、可编程逻辑、处理器、处理装置、中央处理单元(CPU)、片上系统(SoC)等)、软件(例如，在处理装置上运行/执行的指令)、固件(例如，微代码)或其组合。在一些实施方式中，过程700可以由如图3A和图3B所示的模块中的一个或多个执行。

参考图7，在操作701中，第一组关键点来自在线点云，该在线点云由ADV上的LIDAR装置而生成，以用于ADV的预测姿势。第一组关键点中的每个点都是LIDAR点。当选择第一组关键点时，可以遍历位于围绕ADV的预测姿势的预定区域中的所有LIDAR点以定位多个候选LIDAR点，每个候选LIDAR点在该候选LIDAR点的邻域中具有预定密度的LIDAR点。可以使用3D结构张量来评估候选LIDAR点中的每一个的线性度。每个候选LIDAR点的线性度可以基于该评估而被分配值。基于候选LIDAR点的被分配的值可以对候选LIDAR点进行排序。可以基于已排序的候选LIDAR点来选择固定数量的候选LIDAR点。当选择固定数量的候选LIDAR点时，每个新选择的LIDAR点需要与已选择的一个或多个现有LIDAR点保持预定距离。

在操作703中，可以使用在ADV上运行的特征学习神经网络来提取用于第一组关键点的第一组特征描述符。可以应用关键点的沿着z轴的柱体来为每个所选关键点收集预定数量的相邻LIDAR点，每个相邻LIDAR点具有反射强度和对于该关键点的相对坐标。基于针对每个所选关键点的相关相邻LIDAR点的属性，可以通过神经网络来提取每个关键点的特征。

在操作705中，可以将第二组关键点定位在预建的点云地图上，第二组关键点的每个关键点均与第一组关键点的关键点对应。使用由2×2旋转矩阵和2D平移向量表示的变换可以计算3D图中的相应坐标。

在操作707中，以与从在线点云提取第一组特征描述符的方式类似的方式，来从预建点云地图提取第二组特征描述符。

使用CNN进行解决方案推断

图8示出了根据实施方式的用于在光探测和测距(LIDAR)定位中使用神经网络的解决方案推断的系统。

如图8所示，成本量409可以包括多个子量(也被称为单元)813、815和817，其由从在线点云提取的特征描述符519、521和523以及从预建的点云地图提取的特征描述符525、527和529进行构建。

可以将子量中的每个均提供给多个CNN 411中的一个(例如，3D CNN A 823、3DCNN B 825和3D CNN N 827)，以使子量正则化。3D CNN的输出可以是经正则化的子量814中的一个(例如，经正则化的子量A 816、经正则化的子量B 818或经正则化的子量N 820)。在每个经正则化的子量中，匹配成本得以细化。对于解空间(x，y，ψ)中的每个解(Δxi，Δyj，Δψk)，解决了在线点云与现有地图的N个描述符对之间的差异。通过使用CNN而使该差异得以减少，因此易于计算并获得具有最小差异的解。

如图8所示，可以将经正则化的成本量814进一步压缩到概率偏移量831以表示偏移空间中的关键点的一致性，经正则化的成本量814为n_x×n_y×n_ψ量，其表示在线点云与给定偏移的3D点云地图之间整体匹配成本。

如图9所示，本文描述的示例性系统表示可以用于准确推断出定位偏移(Δx，Δy，Δψ)的网络。这是通过在解空间(x，y，ψ)中构建成本量916并用3D卷积神经网络(3D CNN)对成本量916进行正则化来完成的。首先，系统将解空间在x、y、ψ维度上划分成离散空间，并将n_x、n_y、n_ψ表示为各个维度中的大小。系统随后将{f₁，..，f_N}表示为在线LIDAR点云的关键点描述符。因此，成本量可以计算为N×n_x×n_y×n_ψ。每个单元可以表示相应关键点与具有给定偏移的3D地图点之间的匹配成本。

给定预测的姿势的情况下，在线点云的局部关键点变换为它们的全局坐标。预测姿势的在x、y和yaw维度中表示为{(Δx_i,Δy_j,Δψ_k)|1≤i≤nx,1≤n_x≤jn_y,1≤k≤n_ψ}的邻域，可以划分成多个离散空间。可以使用由2×2旋转矩阵和2D平移向量表示的变换来计算3D点云地图中的相应坐标：

在3D点云地图中的计算出的相应坐标的相邻点类似地用于通过微型PointNet结构提取其特征描述符。成本量916中的每个单元均与来自在线点云的具有其特征描述符的原始关键点、转换以及来自预建的点云地图的相应特征描述符相关。此外，也应用双线性插值滤波器来改善来自在x和y维度中具有其四个邻域的地图的相应特征描述符。作为桥接关键点特征和正则化网络的核心步骤，转换和双线性插值是可微分的，使得能够在训练阶段期间通过反向传播在微型PointNet结构中而实现特征学习。利用来自在线点云和地图的描述符对，N×n_x×n_y×n_ψ成本量可以通过计算它们之间的度量距离而在偏移解空间中形成，其中，所述度量距离是正则化网络的输入。度量距离是32维的向量，其中，每个元素通过将距描述符对中的相应一个的L2距离求平方值而进行计算。

给定以上输入的情况下，可以学习能够考虑到这个量中的背景并细化匹配成本的正则化函数。由于偏移空间中的匹配成本是针对每个关键点独立计算的，因此即使它们使用深度特征表示，它们也是不可取的。

本文提供的3D卷积915可用于量的正则化以有效地改善定位精度。3D CNN 915包括三层。前两个3D卷积层使用批量归一化和ReLU。最后一个卷积层直接发送其输出，省略了归一化和激活操作。对每个n_x×n_y×n_ψ子量上执行共享相同参数的3D CNN 915，并且3D CNN915可以显著增加收敛速度并有效地避免过度拟合。

如图9所示，通过3D CNN 915可以生成一个或多个被正则化的成本量918。经正则化的成本量或子量包括独立地针对每个关键点的所有偏移配置{Δx_i，Δy_j，Δψ_k}的匹配成本。

在一个实施方式中，可以计算概率偏移量(即，n_x×n_y×n_ψ量)来表示偏移空间中的所有关键点的一致性。概率偏移量可以表示在给定偏移的情况下的在线点云与3D地图之间的整体匹配成本。

在一个实施方式中，当关键点彼此独立时，可以通过公式

计算偏移ΔT＝(Δx_i，Δy_j，Δψ_k}的匹配概率，其中，Pi(ΔT)表示在偏移ΔT处第i个关键点的匹配概率。

在一个实施方式中，以上等式可以转换成对数似然函数：

在以上公式中，C(ΔT)表示在偏移ΔT处在线点云与3D点云地图之间的整体匹配成本。在如图9所示的这个示例性实施中，以上成本log(Pi(ΔT)被采用作为输入，并且可以通过应用减少平均(reduce average)运算919而在关键点维度上被压缩成与整体匹配成本C(ΔT)对应的n_x×n_y×n_ψ成本量。

在一个实施方式中，在经压缩的成本量中的每个单元的值是相应偏移的整体匹配成本。可以沿着x，y和yaw维度应用softmax运算922以将匹配成本C(ΔT)转换为概率C(ΔT)。可以通过应用减少和(reduce sum)运算921将概率偏移量P(ΔT)在x，y和yaw维度上进一步压缩成概率向量：P_i(Δx_i)＝∑_y,ψP(ΔT)，P_j(Δy_j)＝∑_x,ψP(ΔT)以及P(Δψ_k)＝∑_x,y P(ΔT)。

图10示出了根据实施方式的示出在LIDAR定位中使用神经网络的解决方案推断的示例性过程的流程图。过程1000可以由处理逻辑执行，所述处理逻辑可以包括软件、硬件或两者的组合。过程1000可以由处理逻辑执行，所述处理逻辑可以包括硬件(例如，电路、专用逻辑、可编程逻辑、处理器、处理装置、中央处理单元(CPU)、片上系统(SoC)等)、软件(例如，在处理装置上运行/执行的指令)、固件(例如，微代码)或其组合。在一些实施方式中，过程1000可以如图3A和图3B所示的模块中的一个或多个执行。

参考图10，在操作1001中，在解空间中构建用于自动驾驶车辆的预测姿势的成本量。成本量包括多个子量，每个子量均表示来自在线点云的关键点与预建的点云地图上的相应关键点之间的匹配成本。

在操作1003中，使用多个卷积神经网络(CNN)使成本量正则化以细化匹配成本。此外，可以使成本量正则化，以可以考虑成本量中的更多背景来细化匹配成本。此外，可以对经正则化的成本量应用多个RNN，以平滑在多个连续的LIDAR帧上的定位结果的轨迹。在操作1005中，可以推断出预测姿势与标注真值(ground truth)的最佳偏移，所述最佳偏移用于确定ADV的位置。

定位结果中进行时间平滑

如图11所示，可以将概率向量831作为输入提供给多个RNN 1109、1111和1113，以用于时间平滑。每个RNN均包括多个长短期记忆(LSTM)单元。概率向量1103、1105和1108中的每个均可以作为输入提供给RNN中的一个，其可以生成相应的概率向量1121、1123或1125。可以计算相应的概率向量1121、1123和1125的加权总和1127，并与原始概率向量1103、1105和1107结合使用以获得估计的偏移1117。利用所估计的偏移1117和groundtruth偏移，可以确定出ADV的最佳姿势。

在一个实施方式中，本文中描述的系统可以基于来自连续的LIDAR帧的、所学习的历史信息来平滑在连续的LIDAR帧上的定位结果的轨迹。ADV可以在连续的LIDAR帧上具有多个预测姿势。

图12示出了根据实施方式的在用于ADV的定位结果中进行时间平滑的系统的示例性实施方案。

如上所述，在线点云与预建的点云地图之间的匹配是空间的。因此，连续的LIDAR帧的概率偏移量彼此独立。然而，定位任务是连续的过程，因此应该联合考虑连续帧的姿势。在传统方法中，传递直方图滤波器内的历史分布以估计当前的匹配分布，这确保了输出的时间平滑。

该示例性实施使用递归神经网络(RNN)来实现类似的时间平滑。更具体地，使用LSTM单元。来自上述概率偏移量的针对这些维度(x，y，ψ)的概率向量1209中的每个均可以视为各参数独立的RNN单元的输入。通过由RNN对历史信息的学习，定位结果的轨迹将更平滑且更准确。

在一个实施方式中，在不使用特征空间距离作为损失的情况下，该示例性实施方案直接将损失限定为估计偏移

与ground truth偏移ΔT^*＝(Δx^*，Δy^*，Δψ^*之间的L2距离的平方。然后可以通过以下计算估计偏移1213：

因此，损失函数可以限定为：

其中，α是平衡因子。

过程1300可以由处理逻辑执行，所述处理逻辑可以包括软件、硬件或两者的组合。过程1300可以由处理逻辑执行，所述处理逻辑可以包括硬件(例如，电路、专用逻辑、可编程逻辑、处理器、处理装置、中央处理单元(CPU)、片上系统(SoC)等)、软件(例如，在处理装置上运行/执行的指令)、固件(例如，微代码)或其组合。在一些实施方式中，过程1300可以如图3A和图3B所示的模块中的一个或多个执行。

参考图13，在操作1301中，针对在线点云中的多个连续的光探测和测距(LIDAR)帧中的每个来创建概率偏移量。概率偏移量表示来自在线点云的第一组关键点与来自预建的点云地图的第二组关键点之间的整体匹配成本。在操作1303中，在X维度、Y维度和yaw维度上将概率偏移量压缩成多个概率向量。在操作1305中，将概率偏移量的每个概率向量提供给递归神经网络(RNN)以进行处理。在操作1307中，RNN在多个连续的LIDAR帧上生成定位结果的轨迹。

图14示出了根据实施方式的基于学习的LIDAR定位系统1400的整体架构。如图14所示，系统1400采用在线LIDAR扫描1400和1405、预建的点云地图1403和1407、预测姿势1408作为输入；并且通过PointNet 1409学习特征，在解空间上构建成本量，应用CNN 1411和RNN 1413以估计最佳姿势1415。

图15更详细地示出了根据实施方式的基于学习的LIDAR定位系统1500的整体架构。如图15所示，系统1500包括关键点选择阶段1501、特征描述符提取阶段1503、成本量创建和3D CNN应用阶段1505、概率偏移量创建阶段1507、时间平滑阶段1509和估计偏移创建阶段1511。如进一步所示出的，在每个阶段中，可以提供相应的结构(例如，一个或多个部件和输入)以实施该阶段的操作和功能。在本公开中，这些结构在上文进行了描述。

作为说明性示例，可以使用两步策略来训练系统1500。在第一步骤中，仅对描述符提取阶段1503中的微型PointNet结构和用于成本量创建阶段1505的3D CNN进行训练。为了实现这一点，去除网络架构中的用于时间平滑阶段1509的RNN，并且从根据概率偏移量推断出的概率向量直接计算损失。批量大小和学习率分别设置成1和0.1。为了使提取的特征更具鲁棒性，在x-y维度中添加[0～1.0]m的均匀分布的随机噪声，并且在yaw维度中将[0～2.0]o的随机误差添加到输入预测姿势中。

在第二步骤中，RNN的参数利用固定在微型PointNet结构和3D CNN中的参数来训练。批量大小和学习率分别设置成1和0.001。在RNN训练期间，对长度为10的序列进行采样。鉴于LIDAR帧的频率为10hz，RNN的实际可接收字段约为1.0秒。在这两个步骤中，将训练数据集随机划分成训练集和验证集，使得训练和验证的比值为4比1。在没有性能增益时，针对这两个步骤训练100个时期后停止。

图16是示出可以与本公开的一个实施方式一起使用的数据处理系统的示例的框图。例如，系统1600可以表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统。系统1600可包括许多不同的部件。这些部件可以实施为集成电路(IC)、集成电路的部分、分立电子装置或适用于电路板(诸如，计算机系统的主板或插入卡)的其它模块或者实施为以其它方式并入计算机系统的机架内的部件。

还应注意，系统1600旨在示出计算机系统的许多部件的高阶视图。然而，应当理解的是，某些实施方式中可以具有附加的部件，此外，其它实施方式中可以具有所示部件的不同布置。系统1600可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外，虽然仅示出单个机器或系统，但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。

在一个实施方式中，系统1600包括通过总线或互连件1610连接的处理器1601、存储器1603以及装置1605至1608。处理器1601可以表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1601可以表示一个或多个通用处理器，诸如，微处理器、中央处理单元(CPU)等。更具体地，处理器1601可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其它指令集的处理器、或实施指令集组合的处理器。处理器1601还可以是一个或多个专用处理器，诸如，专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、通信处理器、加密处理器、协处理器、嵌入式处理器、或者能够处理指令的任何其它类型的逻辑。

处理器1601(其可以是低功率多核处理器套接口，诸如超低电压处理器)可以用作用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(SoC)。处理器1601被配置成执行用于实施本文所讨论的操作和步骤的指令。系统1600还可包括与可选的图形子系统1604通信的图形接口，图形子系统1604可包括显示控制器、图形处理器和/或显示装置。

处理器1601可以与存储器1603通信，存储器1603在一个实施方式中可以经由多个存储器装置实施以提供给定量的系统存储。存储器1603可包括一个或多个易失性存储(或存储器)装置，诸如，随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或者其它类型的存储装置。存储器1603可以存储包括由处理器1601或任何其它装置执行的指令序列的信息。例如，各种操作系统、装置驱动程序、固件(例如，输入输出基本系统或BIOS)和/或应用的可执行代码和/或数据可以加载到存储器1603中并由处理器1601执行。操作系统可以是任何类型的操作系统，例如，机器人操作系统(ROS)、来自

公司的

操作系统、来自苹果公司的Mac

来自

公司的

LINUX、UNIX，或者其它实时或嵌入式操作系统。

系统1600还可包括IO装置，诸如装置1605至1608，包括网络接口装置1605、可选的输入装置1606，以及其它可选的IO装置1607。网络接口装置1605可包括无线收发器和/或网络接口卡(NIC)。所述无线收发器可以是WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如，全球定位系统(GPS)收发器)或其它射频(RF)收发器或者它们的组合。NIC可以是以太网卡。

输入装置1606可包括鼠标、触摸板、触敏屏幕(其可以与显示装置1604集成在一起)、指针装置(诸如，手写笔)和/或键盘(例如，物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如，输入装置1606可包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种、以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。

IO装置1607可包括音频装置。音频装置可包括扬声器和/或麦克风，以促进支持语音的功能，诸如语音识别、语音复制、数字记录和/或电话功能。其它IO装置1607还可包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如，PCI-PCI桥)、传感器(例如，诸如加速度计的运动传感器、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1607还可包括成像处理子系统(例如，相机)，所述成像处理子系统可包括用于促进相机功能(诸如，记录照片和视频片段)的光学传感器，诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)光学传感器。根据系统1600的具体配置或设计，某些传感器可以经由传感器集线器(未示出)联接到互连件1610，而诸如键盘或热传感器的其它装置可以由嵌入式控制器(未示出)控制。

为了提供对诸如数据、应用、一个或多个操作系统等的信息的永久性存储，大容量存储设备(未示出)也可以联接到处理器1601。在各种实施方式中，为了实现更薄且更轻的系统设计并且改进系统响应性，这种大容量存储设备可以经由固态装置(SSD)来实施。然而，在其它实施方式中，大容量存储设备可以主要使用硬盘驱动器(HDD)来实施，其中较小量的SSD存储设备充当SSD高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储，从而使得在系统活动重新启动时能够实现快速通电。另外，闪存装置可以例如经由串行外围接口(SPI)联接到处理器1601。这种闪存装置可以提供系统软件的非易失性存储，所述系统软件包括所述系统的BIOS以及其它固件。

存储装置1608可包括计算机可访问的存储介质1609(也被称为机器可读存储介质或计算机可读介质)，其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如，模块、单元和/或逻辑1628)。处理模块/单元/逻辑1628可以表示上述部件中的任一个，例如规划模块305以及控制模块306。处理模块/单元/逻辑1628还可以在其由数据处理系统1600、存储器1603和处理器1601执行期间完全地或至少部分地驻留在存储器1603内和/或处理器1601内，数据处理系统1600、存储器1603和处理器1601也构成机器可访问的存储介质。处理模块/单元/逻辑1628还可以通过网络经由网络接口装置1605进行传输或接收。

计算机可读存储介质1609也可以用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1609在示例性实施方式中被示为单个介质，但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如，集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质，所述指令集用于由机器执行并且使得所述机器执行本公开的任何一种或多种方法。因此，术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质，或者任何其它非暂时性机器可读介质。

本文所述的处理模块/单元/逻辑1628、部件以及其它特征可以实施为分立硬件部件或集成在硬件部件(诸如，ASICS、FPGA、DSP或类似装置)的功能中。此外，处理模块/单元/逻辑1628可以实施为硬件装置内的固件或功能电路。此外，处理模块/单元/逻辑1628可以以硬件装置和软件部件的任何组合来实施。

应注意，虽然系统1600被示出为具有数据处理系统的各种部件，但是并不旨在表示使部件互连的任何特定架构或方式；因为此类细节和本公开的实施方式没有密切关系。还应当认识到，具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可以与本公开的实施方式一起使用。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式，以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中，算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而，应当牢记，所有这些和类似的术语均旨在与适当的物理量关联，并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出，否则应当了解，在整个说明书中，利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理，所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据，并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储设备、传输或显示装置内类似地表示为物理量的其它数据。

本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如，计算机)可读的形式存储信息的任何机构。例如，机器可读(例如，计算机可读)介质包括机器(例如，计算机)可读存储介质(例如，只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可以由处理逻辑来执行，所述处理逻辑包括硬件(例如，电路、专用逻辑等)、软件(例如，实现在非暂时性计算机可读介质上)或两者的组合。虽然所述过程或方法在上文是依据一些顺序操作来描述的，但是应当了解，所述操作中的一些可以按不同的顺序执行。此外，一些操作可以并行地执行而不是顺序地执行。

本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到，可以使用多种编程语言来实施如本文描述的本公开的实施方式的教导。

在以上的说明书中，已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是，在不脱离所附权利要求书中阐述的本发明的更宽泛精神和范围的情况下，可以对本公开作出各种修改。因此，应当在说明性意义而不是限制性意义上来理解本说明书和附图。

Claims

1.一种用于在自动驾驶车辆的定位结果中进行时间平滑的计算机实施方法，所述方法包括：

针对在线点云中的多个连续的光探测和测距帧中的每个来创建概率偏移量，所述概率偏移量表示来自所述在线点云的第一组关键点与来自预建的点云地图的第二组关键点之间的整体匹配成本；

在X维度、Y维度和偏航角维度上将所述概率偏移量压缩成多个概率向量；

将所述概率偏移量的每个概率向量提供给多个递归神经网络；以及

通过所述多个递归神经网络在所述多个连续的光探测和测距帧上生成定位结果的轨迹。

2.根据权利要求1所述的方法，其中，所述概率偏移量包括多个子量，其中，每个子量表示针对所述自动驾驶车辆的特定位置偏移的在所述在线点云与所述预建的点云地图之间的整体匹配成本。

3.根据权利要求1所述的方法，其中，所述递归神经网络中的每个均包括多个长短期记忆单元。

4.根据权利要求3所述的方法，其中，将所述概率向量中的每个作为输入提供给所述多个长短期记忆单元中的一个。

5.根据权利要求1所述的方法，其中，所述多个递归神经网络基于来自所述多个连续的光探测和测距帧的、学习的历史信息来在所述多个连续的光探测和测距帧上平滑定位结果的轨迹。

6.根据权利要求1所述的方法，其中，所述自动驾驶车辆在所述多个连续的光探测和测距帧上具有多个预测姿势。

7.根据权利要求1所述的方法，其中，所述概率偏移量基于成本量，所述成本量根据所述在线点云提取的第一组特征描述符和从所述预建的点云地图提取的第二组特征描述符而构建。

8.一种用于在自动驾驶车辆的定位结果中进行时间平滑的系统，所述系统包括：

处理器；以及

存储器，所述存储器联接至所述处理器以存储指令，所述指令在由所述处理器运行时使得所述处理器执行以下操作，所述操作包括：

9.根据权利要求8所述的系统，其中，所述概率偏移量包括多个子量，其中，每个子量表示针对所述自动驾驶车辆的特定位置偏移的在所述在线点云与所述预建的点云地图之间的整体匹配成本。

10.根据权利要求8所述的系统，其中，所述递归神经网络中的每个均包括多个长短期记忆单元。

11.根据权利要求10所述的系统，其中，将所述概率向量中的每个作为输入提供给所述多个长短期记忆单元中的一个。

12.根据权利要求8所述的系统，其中，所述多个递归神经网络基于来自所述多个连续的光探测和测距帧的、学习的历史信息来在所述多个连续的光探测和测距帧上平滑定位结果的轨迹。

13.根据权利要求8所述的系统，其中，所述自动驾驶车辆在所述多个连续的光探测和测距帧上具有多个预测姿势。

14.根据权利要求8所述的系统，其中，所述概率偏移量基于成本量，所述成本量根据所述在线点云提取的第一组特征描述符和从所述预建的点云地图提取的第二组特征描述符而构建。

15.一种存储有指令的非暂时性机器可读介质，所述指令在由处理器运行时使得所述处理器执行在自动驾驶车辆的定位结果中进行时间平滑的操作，所述操作包括：

16.根据权利要求15所述的机器可读介质，其中，所述概率偏移量包括多个子量，其中，每个子量表示针对所述自动驾驶车辆的特定位置偏移的在所述在线点云与所述预建的点云地图之间的整体匹配成本。

17.根据权利要求15所述的机器可读介质，其中，所述递归神经网络中的每个均包括多个长短期记忆单元。

18.根据权利要求17所述的机器可读介质，其中，将所述概率向量中的每个作为输入提供给所述多个长短期记忆单元中的一个。

19.根据权利要求15所述的机器可读介质，其中，所述多个递归神经网络基于来自所述多个连续的光探测和测距帧的、学习的历史信息来在所述多个连续的光探测和测距帧上平滑定位结果的轨迹。

20.根据权利要求15所述的机器可读介质，其中，所述自动驾驶车辆在所述多个连续的光探测和测距帧上具有多个预测姿势。

21.根据权利要求15所述的机器可读介质，其中，所述概率偏移量基于成本量，所述成本量根据所述在线点云提取的第一组特征描述符和从所述预建的点云地图提取的第二组特征描述符而构建。