CN115761680A

CN115761680A - 地面要素信息获取方法、装置、电子设备及车辆

Info

Publication number: CN115761680A
Application number: CN202211488541.4A
Authority: CN
Inventors: 邢佳斌; 周尧; 万国伟; 张晔
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-11-25
Filing date: 2022-11-25
Publication date: 2023-03-07

Abstract

本公开提供了地面要素信息获取方法、装置、电子设备、车辆及存储介质，涉及人工智能领域，尤其涉及自动驾驶、智能交通等领域。具体实现方案为：基于当前帧的图像数据得到当前帧的图像特征，基于当前帧的点云数据得到当前帧的点云特征；基于所述当前帧的点云特征与历史帧的目标特征，得到当前帧的初始化特征；基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征；基于所述当前帧的目标特征，得到地面要素信息。上述方法可以提升地面要素信息的准确性。

Description

地面要素信息获取方法、装置、电子设备及车辆

技术领域

本公开涉及人工智能领域，尤其涉及自动驾驶、智能交通等领域。

背景技术

随着计算机技术的发展，智能交通等人工智能领域也得到了迅速发展，尤其是车辆的自动驾驶等技术得到了越来越广泛的应用。在车辆的自动驾驶处理中需要高精地图来进行驱动，该高精地图则需要底层的地面要素信息来支撑。然而，如何能够得到更加准确的地面要素信息，就成为需要解决的问题。

发明内容

本公开提供了一种地面要素信息获取方法、装置、电子设备、车辆及存储介质。

根据本公开的第一方面，提供了一种地面要素信息获取方法，包括：

基于当前帧的图像数据得到当前帧的图像特征，基于当前帧的点云数据得到当前帧的点云特征；

基于所述当前帧的点云特征与历史帧的目标特征，得到当前帧的初始化特征；

基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征；

基于所述当前帧的目标特征，得到地面要素信息。

根据本公开的第二方面，提供了一种地面要素信息获取装置，包括：

数据处理模块，用于基于当前帧的图像数据得到当前帧的图像特征，基于当前帧的点云数据得到当前帧的点云特征；

初始化处理模块，用于基于所述当前帧的点云特征与历史帧的目标特征，得到当前帧的初始化特征；

目标特征处理模块，用于基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征；

地面要素获取模块，用于基于所述当前帧的目标特征，得到地面要素信息。

根据本公开的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行前述第一方面的地面要素信息获取方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使该计算机执行前述方法。

根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现前述方法。

根据本公开的第六方面，提供了一种车辆，该车辆包括上述一方面实施例的电子设备。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本实施例提供的方案，可以基于当前帧的点云数据得到当前帧的点云特征，基于该当前帧的点云特征与历史帧的目标特征，可以得到当前帧的初始化特征，进而基于当前帧的初始化特征与当前帧的图像特征，可以得到当前帧的目标特征，最终能够基于当前帧的目标特征得到地面要素信息。如此，通过结合当前帧的点云数据、当前帧的图像数据、以及历史帧的目标特征进行时序上以及空间上的融合处理，可以有效的避免现实情况中环境因素对数据带来的影响，能够在保证实时得到地面要素信息的同时，提升了地面要素信息的准确性。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开一实施例的地面要素信息获取方法的流程示意图；

图2是根据本公开一实施例的调整历史帧的目标特征的处理场景示意图；

图3是根据本公开又一实施例的基于调整后的历史帧的目标特征得到当前帧的初始化特征的处理场景示意图；

图4是根据本公开一实施例的地面要素信息获取方法的一种示意性流程图；

图5是根据本公开一实施例的地面要素信息获取方法的另一种示意性流程图；

图6是根据本公开另一实施例的地面要素信息获取装置的一种组成结构示意图；

图7是用来实现本公开实施例的地面要素信息获取方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本公开第一方面实施例提供一种地面要素信息获取方法，如图1所示，包括：

S101：基于当前帧的图像数据得到当前帧的图像特征，基于当前帧的点云数据得到当前帧的点云特征；

S102：基于所述当前帧的点云特征与历史帧的目标特征，得到当前帧的初始化特征；

S103：基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征；

S104：基于所述当前帧的目标特征，得到地面要素信息。

上述第一方面实施例提供的地面要素信息获取方法，可以应用于电子设备。一种示例中，该电子设备可以为终端设备，比如可以是笔记本电脑、智能手机、平板电脑、台式机等等任意之一；又一种示例中，该电子设备可以是设置在车辆中的车载终端，又比如，该电子设备可以是能够与车辆进行数据传输的服务器集群或分布式系统的计算节点。应理解，以上仅为能够执行本实施例提供的地面要素信息获取方法的执行主体的示例性说明，实际处理中可以不限于以上示例中提到的设备，只要能够执行本实施例提供的地面要素信息获取方法的装置或设备，均在本实施例的保护范围内。

所述地面要素信息可以是地面上的交通要素，比如可以为地面上的可行驶区域内的交通要素，举例来说该地面要素信息可以包括以下至少之一：车道线、停止线、减速让行线、地面箭头、文字、导流线等等。前述地面要素信息可以是在构建或更新高精度地图时使用的。该高精地图至少可以用于执行路径规则、轨迹预测等任务，本实施例不对该高精地图所能够执行的处理或任务进行限定。

可见，通过采用上述方案，可以基于当前帧的点云数据得到当前帧的点云特征，基于该当前帧的点云特征与历史帧的目标特征，可以得到当前帧的初始化特征，进而基于当前帧的初始化特征与当前帧的图像特征，可以得到当前帧的目标特征，最终能够基于当前帧的目标特征得到本次地面要素信息。如此，通过结合当前帧的点云数据、当前帧的图像数据、以及历史帧的目标特征进行时序上以及空间上的融合处理，可以有效的避免现实情况中环境因素对数据带来的影响，能够在保证实时得到地面要素信息的同时，提升了地面要素信息的准确性以及鲁棒性。

在一些可能的实施方式中，所述方法还包括：实时获取当前帧的图像数据以及实时获取当前帧的点云数据。

具体的，所述实时获取当前帧的图像数据，可以是实时获取图像采集装置所采集的所述当前帧的图像信息。其中，所述图像采集装置的数量可以为一个或多个；任意一个图像采集装置可以是以下任意一种：相机、环视相机、红外相机、摄像头、飞行时间(Time ofFlight，ToF)相机等具有图像采集功能的类似设备。

所述实时获取当前帧的点云数据，可以是实时获取点云采集装置所采集的所述当前帧的点云数据。其中，所述点云采集装置的数量也可以是一个或多个；任意一个点云采集装置可以包括激光扫描设备，如激光雷达(LiDAR，Light Detection and Ranging)，当然还可以包括其他拥有扫描功能的类似设备。

需要指出，前述图像采集装置、前述点云采集装置可以是搭载(或设置)在同一个采集设备上的。该采集设备可以包括但不限于以下之一：车辆、飞行器、船舶、无人飞行器、机器人等可移动的设备。示例性的，该采集设备可以是地图采集车。

所述采集设备可以控制前述点云采集装置与前述图像采集装置，在同一时间下分别采集点云数据和图像数据，并且还可以控制图像数据的采集范围与点云数据的采集范围匹配。这里，图像数据的采集范围与点云数据的采集范围匹配包括：图像数据与点云数据的采集范围至少部分重合；也即图像数据与点云数据的采集范围有重合的范围(以下简称重合范围)。相应地，图像采集装置与点云采集装置的视野范围至少部分重合，也即图像采集装置与点云采集装置的视野范围有重合的范围。在一种优选的示例中，点云数据的采集范围与图像数据的采集范围可以完全重合。当然，还可以是点云数据的采集范围大于图像数据的采集范围，并包括图像数据的部分或全部采集范围。或者还可以是图像数据的采集范围大于点云数据的采集范围，并包括点云数据的部分或全部采集范围。本实施例不对全部可能的情况进行穷举。

进一步，所述方法还可以包括：实时获取该采集设备设置的位姿相关传感器所采集的当前帧的采集设备位姿。另外，还可以将所述当前帧的采集设备位姿保存在数据集中。所述当前帧的采集设备位姿，指的是当前帧对应的时刻下的采集设备位姿。

也就是，前述采集设备除了设置有图像采集装置、点云采集装置之外，还设置有位姿相关传感器。其中，位姿相关传感器可以包括但不限于以下至少之一：全球导航卫星系统(Global Navigation Satellite System，GNSS)、惯性测量单元(Inertial MeasurementUnit，IMU)等。该采集设备可以是在控制图像采集装置采集当前帧的图像信息、以及控制点云采集装置采集当前帧的点云数据的同时，通过位姿相关传感器采集当前帧的采集设备位姿；相应的，执行本实施例所提供的地图要素分割方法的电子设备，可以实时获取该采集设备的位姿相关传感器采集的当前帧的采集设备位姿。

其中，所述采集设备位姿可以包括：所述采集设备所在的地理位置、所述采集设备的相对角度等等。其中，所述采集设备所在的地理位置可以采用球面坐标系(或称为大地坐标系)中的经度和纬度表示；应理解，在实际应用时，该地理位置还可以采用其他坐标系统来表示，只是本实施例不做穷举。所述采集设备的相对角度可以指的是采集设备的朝向与参考方向之间的相对角度；所述参考方向可以是根据实际情况配置的，比如可以是正南、正北、正东、正西中任意之一，这里不对其进行限定。

在一些可能的实施方式中，所述基于当前帧的点云数据得到当前帧的点云特征，可以包括：将所述当前帧的点云数据输入第一模型，得到所述第一模型输出的当前帧的点云特征。所述基于当前帧的图像数据得到当前帧的图像特征，可以包括：将所述当前帧的图像数据输入第二模型，得到所述第二模型输出的当前帧的图像特征。

其中，所述第一模型、第二模型均为预先训练好的模型，该第一模型、第二模型可以是在其他电子设备中训练完成后，由前述电子设备获取该第一模型、第二模型并保存的；或者，该第一模型、第二模型可以是在前述电子设备中训练完成后并保存的。

前述第一模型可以是用于提取点云特征的模型；具体的，该第一模型可以包括用于提取点云特征的backbone(主干网络)。示例性的，该用于提取点云特征的backbone可以是SCEOND(Sparsely Embedded Convolutional Detection，稀疏嵌入的卷积目标检测)网络，应理解，这里仅为示例性说明，实际处理中还可以采用其他网络或模型实现提取点云特征的功能，只是本实施例不做穷举。

前述将所述当前帧的点云数据输入第一模型，得到所述第一模型输出的当前帧的点云特征的处理，可以是：将当前帧的点云数据输入至第一模型，在该第一模型中将该当前帧的点云数据压到目标空间，得到当前帧的点云特征；该当前帧的点云特征的尺寸为C_l×H_bev×W_bev。其中，所述目标空间具体可以是BEV(Bird's Eye View，鸟瞰图)空间。C_l可以为正整数，表示当前帧的点云特征的通道数；H_bev可以为正数，表示当前帧的点云特征的高；W_bev可以为正数，表示当前帧的点云特征的宽。本实施例中所述通道数可以指的是特征图的数量，下文中不做重复说明。

该第二模型可以是用于提取图像特征的模型；该第二模型可以包括用于提取图像特征的backbone(主干网络)。示例性的，该用于提取图像特征的backbone可以为以下至少之一：ResNet(残差网络)、EfficientNet(高效网络)等。

前述将所述当前帧的图像数据输入第二模型，得到所述第二模型输出的当前帧的图像特征的处理，可以是：将当前帧的图像数据输入至第二模型，在该第二模型中将对当前帧的图像数据进行特征提取，得到当前帧的图像特征；该当前帧的图像特征尺寸为n×C_cam×H×W。其中，n为正整数，表示图像采集装置的数量；C_cam为正整数，表示当前帧的图像特征的通道数；H为正数，表示当前帧的图像特征的高；W为正数，表示当前帧的图像特征的宽。在一种可能的示例中，n的取值可以为6，也就是在采集设备上可以设置6个图像采集装置。

在一些可能的实施方式中，所述基于所述当前帧的点云特征与历史帧的目标特征，得到初始化的目标特征，包括：调整所述历史帧的目标特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征；基于所述调整后的历史帧的目标特征、所述当前帧的点云特征，得到所述当前帧的初始化特征。

其中，前述历史帧的目标特征，具体可以是上一帧的目标特征。所述目标特征具体可以指的是BEV特征。所述当前帧的初始化特征，具体可以指的是当前帧的初始化BEV特征。

所述调整所述历史帧的目标特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征，可以指的是：基于当前帧的采集设备位姿以及历史帧的采集设备位姿，调整所述历史帧的目标特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征。

通过上述方式，能够先将所述当前帧的点云特征以及历史帧的目标特征进行位置对齐，进而基于该位置对齐后的所述当前帧的点云特征以及调整后的历史帧的目标特征进行时序融合处理，如此，能够保证时序融合后所得到的当前帧的初始化特征的准确性，使得最终得到的地面要素信息更加准确。

在一些可能的实施方式中，所述调整所述历史帧的目标特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征，具体可以包括：获取当前帧的采集设备位姿以及历史帧的采集设备位姿；基于所述当前帧的所述采集设备位姿以及所述历史帧的所述采集设备位姿，确定姿态变化信息；基于所述姿态变化信息，确定调整信息；基于所述调整信息对所述历史帧的目标特征的进行调整，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征。

其中，所述获取当前帧的采集设备位姿以及历史帧的采集设备位姿的方式，可以是：从数据集中获取当前帧的采集设备位姿以及历史帧的采集设备位姿。所述历史帧的采集设备位姿，指的是所述历史帧对应的时刻下的采集设备位姿；所述当前帧的采集设备位姿，指的是当前帧对应的时刻下的采集设备位姿。关于采集设备位姿以及该数据集保存采集设备位姿的处理方式，在前述实施例已经说明，不做赘述。

所述基于所述当前帧的所述采集设备位姿以及所述历史帧的所述采集设备位姿，确定所述姿态变化信息，可以指的是：基于所述当前帧的采集设备位姿以及所述历史帧的采集设备位姿，得到采集设备的位置变化信息以及角度变化信息；将所述采集设备的位置变化信息以及角度变化信息作为所述姿态变化信息。

具体来说，所述采集设备的位置变化信息可以指的是：该采集设备在当前帧对应的时刻下所在的地理位置、与该采集设备在历史帧对应的时刻下所在的地理位置之间的变化。该采集设备的位置变化信息可以包括：经度差值、纬度差值中至少之一。前述经度差值可以为0、正数或负数中任意之一；前述纬度差值可以为0、正数或负数中任意之一。

所述采集设备的角度变化信息可以指的是：该采集设备在当前帧对应的时刻下的相对角度、与该采集设备在历史帧对应的时刻下的相对角度之间的变化。该采集设备的角度变化信息可以包括角度差值；前述角度差值可以为0、正数或负数中任意之一。

所述基于所述姿态变化信息，确定调整信息，可以包括：基于所述采集设备的位置变化信息，确定位置调整值，基于所述采集设备的角度变化信息，确定角度调整值；将所述位置调整值以及所述角度调整值，作为所述调整信息。

所述基于所述调整信息对所述历史帧的目标特征的进行调整，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征，可以包括：基于所述调整信息中的位置调整值将所述历史帧的目标特征进行平移，以及基于所述调整信息中的角度调整值对所述历史帧的目标特征进行旋转，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征。

其中，所述基于所述采集设备的位置变化信息，确定位置调整值，可以指的是：取所述采集设备的位置变化信息的负值，作为位置调整值。举例来说，假设该采集设备在当前帧对应的时刻下所在的地理位置为位置1、该采集设备在历史帧对应的时刻下所在的地理位置为位置2，位置1相对于位置2在经度上增加了数值A、纬度上没有变化。若需要将历史帧的目标特征与当前帧的点云特征对齐，就需要将历史帧的目标特征在经度上减少数值A，因此该位置调整值可以为负的数值A。进一步，基于所述调整信息中的位置调整值将所述历史帧的目标特征进行平移，可以为：将历史帧的目标特征在经度上平移负的数值A。

所述基于所述采集设备的角度变化信息，确定角度调整值，可以指的是：取所述采集设备的角度变化信息的负值，作为角度调整值。举例来说，该采集设备在执行当前帧的采集时的相对角度为角度1、该采集设备在执行历史帧的采集时的相对角度为角度2，角度1相对于角度2在增加了角度差值B。若需要将历史帧的目标特征与当前帧的点云特征对齐，就需要将历史帧的目标特征反向旋转该角度差值B，因此该角度调整值可以为负的角度差值B。进一步，基于所述调整信息中的角度调整值对所述历史帧的目标特征进行旋转，可以为：将历史帧的目标特征在当前角度的基础上旋转负的角度差值B。

结合图2进行示例性说明，在图2中的200部分示意出历史帧的目标特征201以及当前帧的点云特征202；经过前述调整可以得到如图210部分所示的，所述当前帧的点云特征212、以及调整后的历史帧的目标特征211，调整后的历史帧的目标特征211与所述当前帧的点云特征为位置对齐的。

由于该采集设备可能是在实时移动的，因此该采集设备在不同帧对应的时刻下其位姿可能存在不同，也就是当前帧的图像数据与历史帧的图像数据之间存在地理位置和/或相对角度上的差异。通过采用本实施例提供的上述方案，能够根据当前帧的采集设备位姿和历史帧的采集设备位姿，确定采集设备的姿态变化信息，然后基于姿态变化信息来调整历史帧的目标特征，可以使得调整后的历史帧的目标特征、与当前帧的点云特征中相同位置的特征能够正确匹配，从而保证后续处理的准确度。

在一些可能的实施方式中，所述基于所述调整后的历史帧的目标特征、所述当前帧的点云特征，得到所述当前帧的初始化特征，包括：

对所述当前帧的点云特征进行调整，得到调整后的当前帧的点云特征；其中，所述调整后的当前帧的点云特征、与所述调整后的历史帧的目标特征的通道数相同；

对所述调整后的当前帧的点云特征、所述调整后的历史帧的目标特征进行融合，得到所述当前帧的初始化特征。

其中，所述调整后的历史帧的目标特征的通道数、与调整前的前述历史帧的目标特征的通道数是相同的，比如均可以表示为“C”，因此，这里也可以表述为所述调整后的当前帧的点云特征、与所述历史帧的目标特征的通道数相同。

所述对所述当前帧的点云特征进行调整，得到调整后的当前帧的点云特征，可以包括：将所述当前帧的点云特征输入卷积层，得到所述卷积层输出的结果，将所述卷积层输出的结果作为所述调整后的当前帧的点云特征。比如，将所述当前帧的点云特征输入卷积层，通过该卷积层的处理，将所述当前帧的点云特征的通道数由C_l变为与所述调整后的历史帧的目标特征相同的C，C为正整数。其中，当前帧的点云特征的通道数在前述已经示例性说明，这里不做赘述。

其中，所述卷积层的卷积核的个数可以是根据实际需求设置的，比如，实际需求为输出的通道数为C，则该卷积层的卷积核的个数可以设置为C。

通过采用以上处理，能够将当前帧的点云特征调整为与调整后的历史帧的目标特征的通道数相同，然后再对调整后的当前帧的点云特征、以及调整后的历史帧的目标特征进行融合，得到当前帧的初始化特征。如此，可以在时序融合处理中采用相同通道数量的特征进行融合，能够保证时序融合的准确性，最终可以保证最终所得到的地面要素信息的分割更加准确。

在一些可能的实施方式中，所述对所述调整后的当前帧的点云特征、所述调整后的历史帧的目标特征进行融合，得到所述当前帧的初始化特征，可以包括：基于所述调整后的历史帧的目标特征，确定第一掩膜；将所述调整后的历史帧的目标特征与所述调整后的当前帧的点云特征相加，得到所述当前帧的初始融合特征；基于所述第一掩膜对所述当前帧的初始融合特征进行归一化处理，得到所述当前帧的初始化特征。

所述基于所述调整后的历史帧的目标特征，确定第一掩膜，可以指的是：将所述调整后的历史帧的目标特征所覆盖的区域，作为第一掩膜。

所述将所述调整后的历史帧的目标特征与所述调整后的当前帧的点云特征相加，得到所述当前帧的初始融合特征，可以指的是：将所述调整后的历史帧的目标特征、与所述调整后的当前帧的点云特征的各个相同位置处的特征向量相加，得到所述当前帧的初始融合特征。

在一种示例中，前述调整后的历史帧的目标特征中，可以包含每个像素所分别对应的特征向量；同样的，前述调整后的当前帧的点云特征中，也包含每个像素所对应的特征向量。前述相同位置可以指的是相同的像素位置。在另一种示例中，前述调整后的历史帧的目标特征中，可以包含每个栅格所分别对应的特征向量；同样的，前述调整后的当前帧的点云特征中，也包含每个栅格所分别对应的特征向量。前述相同位置可以指的是可以指的是相同的栅格的位置。

所述基于所述第一掩膜对所述当前帧的初始融合特征进行归一化处理，得到所述当前帧的初始化特征，可以包括：基于所述第一掩膜，将所述当前帧的初始融合特征划分为重叠区域和非重叠区域；将所述重叠区域内的特征向量除以二，得到调整后的重叠区域的特征；将所述调整后的重叠区域的特征、与所述非重叠区域的特征合并，得到所述当前帧的初始化特征。应理解，前述特征向量在一些可能的示例中还可以称为特征值，本实施例不对全部可能的名称进行穷举。

参见图3进行示例性说明，在图3中300部分示意了前述实施例中的调整后的当前帧的点云特征302、以及调整后的历史帧的目标特征301；在图3中的310部分，示意了基于调整后的历史帧的目标特征301确定的第一掩膜311；在图3中的320部分，示意了基于所述第一掩膜311将所述当前帧的初始融合特征划分为重叠区域321和非重叠区域322。由于重叠区域321中各个像素(或各个栅格)位置处的特征向量为调整后的当前帧的点云特征的特征向量、与调整后的历史帧的目标特征向量相加得到的，因此可以将所述重叠区域321内的特征向量除以二，得到调整后的重叠区域的特征；而非重叠区域仅有调整后的当前帧的点云特征的特征向量，因此该非重叠区域的特征向量不需要调整；通过将所述调整后的重叠区域的特征、与所述非重叠区域的特征合并，就可以得到所述当前帧的初始化特征。

由于在得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征时，历史帧的目标特征经过旋转平移后，在当前帧的点云特征的区域内会存在部分位置没有对应的历史帧的目标特征，也就是这部分位置所对应的历史帧的目标特征的特征向量为0，若直接采用调整后的当前帧的点云特征、与调整后的历史帧的目标特征相加，可能会使得最终结果有误。本实施例通过采用上述方式，对所述当前帧的初始融合特征进行归一化处理，从而保证当前帧的初始化特征的准确性。另外，前述实施例所提供的时序融合的处理方式，仅需要将所述调整后的当前帧的点云特征、所述调整后的历史帧的目标特征相加即可实现，在操作简单且计算量的增加不明显的同时，还能够保证当前帧的初始化特征的准确性，进而保证后续进行空间融合能够得到准确的结果，最终可以保证最终所得到的地面要素信息的分割更加准确。

在一些可能的实施方式中，所述基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征，包括：对所述当前帧的初始化特征进行自注意力(self-attention)处理，得到包含注意力权重的当前帧的初始化特征；对所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征进行交叉注意力处理，得到所述当前帧的目标特征。

前述处理中使用到了注意力机制(attention mechanism，AM)，该注意力机制在计算机视觉系统中是一种模拟人的注意力机制，使得神经网络具备专注于一部分重要的输入信息的能力，也就是注意力机制可以被视为一个动态选择过程，通过输入的相关性或者重要性自适应地加权特征来实现。本公开涉及的注意力机制有自注意力机制(self-attention mechanism)和交叉注意力机制(cross-attention mechanism)。其中，自注意力机制，又称为内部注意力机制，减少了对外部信息的依赖，擅长捕捉特征的内部相关性，也就是自注意力机制旨在建模同一组输入特征的内部相关性，用来增强自身特征、获取更加有信息量的特征表达。交叉注意力机制是一般用于构建两组不同输入特征之间的交叉相关性，获取两组输入特征之间的关系，以达到将信息融合到其中一组输入特征上的作用。

前述对所述当前帧的初始化特征进行自注意力处理，得到包含自注意力权重的当前帧的目标特征，可以指的是：采用自注意力计算方式对所述当前帧的初始化特征进行自注意力计算，得到包含自注意力权重的当前帧的目标特征；或者，可以是将所述当前帧的初始化特征输入自注意力模型，得到所述自注意力模型输出的包含自注意力权重的当前帧的目标特征。其中，该自注意力模型可以是在前述电子设备中训练并保存的；也可以是在其他设备中对自注意力模型进行训练，在得到训练后的自注意力模型之后，由前述电子设备获取并保存的。

在一种优选的示例中，前述自注意力计算或自注意力模型，具体可以采用全局注意力(global attention)机制。相应的，前述注意力权重可以指的是：当前帧的初始化特征中每个像素位置处的特征向量、与其他全部像素分别对应的特征向量之间的权重值或相关性。举例来说，当前帧的初始化特征包含100个像素，针对其中的像素1，可以得到该像素1位置处的特征向量与像素2位置处的特征向量之间的权重值或相关性，得到像素1的特征向量与像素3位置处的特征向量之间的权重值或相关性，以此类推，该像素1位置处的特征向量与像素100位置处的特征向量之间的权重值或相关性；针对像素2～像素100也同样得到前述像素1类似的结果，直至得到该当前帧的初始化特征中每个像素位置处的特征向量、与其他全部像素分别对应的特征向量之间的权重值或相关性。

前述交叉注意力处理可以是采用交叉注意力模型实现的。所述对所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征进行交叉注意力处理，得到所述当前帧的目标特征，可以指的是：将所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征输入交叉注意力模型，得到所述交叉注意力模型输出的所述当前帧的目标特征。其中，所述当前帧的目标特征中可以包括：所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征之间的注意力权重值或相关性。

在一种优选的示例中，前述交叉注意力处理，可以采用可形变注意力(deformableattention)机制。具体的，所述将所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征输入交叉注意力模型，得到所述交叉注意力模型输出的所述当前帧的目标特征，可以包括：将所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征输入交叉注意力模型输入交叉注意力模型，在所述交叉注意力模型中将所述包含注意力权重的当前帧的初始化特征上的格子坐标，根据相机的内外参反投影回当前帧的图像特征上，在该当前帧的图像特征上找到与该包含注意力权重的当前帧的初始化特征上的格子坐标对应的像素位置，将该像素位置作为参考点，选择该参考点周围的一个或多个像素，得到包含注意力权重的当前帧的初始化特征上的格子坐标所对应的特征向量、与所述参考点周围的一个或多个像素分别对应的特征向量之间的注意力权重或相关性。

其中，所述将所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征输入交叉注意力模型，可以指的是：将所述包含注意力权重的当前帧的初始化特征作为查询(Q，Query)、将所述当前帧的图像特征既作为键(Key，K)又作为值(V，Value)；将上述Q、K、V输入所述交叉注意力模型。

本实施方式所提供的上述处理，即对所述当前帧的初始化特征进行自注意力处理，得到包含注意力权重的当前帧的初始化特征，对所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征进行交叉注意力处理，得到所述当前帧的目标特征的处理，可以称为空间融合的处理。在针对当前帧进行空间融合的处理时，该空间融合的处理可以仅执行一次，也可以执行多次。

示例性的，若该空间融合的处理执行多次，则执行次数可以根据实际情况设置，比如，可以是10次、20次、或更多或更少，这里不做限定。假设该空间融合的处理执行多次，若第一次执行空间融合的处理，则与前述实施例所述的处理相同，不做赘述。若第m次执行空间融合的处理，则可以将第m-1次得到的当前帧的目标特征，作为第m次处理的当前帧的初始化特征，同样执行前述处理之后，得到第m次处理的当前帧的目标特征；其中，m为大于1的整数。进一步，若第m次处理为最后一次空间融合处理，则该第m次处理所得到的当前帧的目标特征为本次最终得到的当前帧的目标特征。如此，通过重复执行空间融合的处理，可以使得最终得到的当前帧的目标特征更加准确。

还需要指出，在确定最终得到当前帧的目标特征的情况下，还可以保存该当前帧的目标特征用于下一帧的处理。

通过采用上述方案，可以将图像特征与初始化的目标特征进行空间融合，从而在实现了时序上融合了当前帧和历史帧的目标特征的基础上，进一步融合了当前帧的图像特征，如此，可以有效的避免现实情况中由于环境影响所带来的数据缺失、数据不准确等问题，能够得到准确的当前帧的目标特征即当前帧的BEV特征，从而提升了地面要素信息的准确性以及鲁棒性。

在一些可能的实施方式中，所述基于所述当前帧的目标特征，得到地面要素信息，可以包括：将所述当前帧的目标特征输入分割模型，得到所述分割模型输出的N种类别的地面要素分割结果；N为正整数；基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息。

所述分割模型可以包含卷积层和反卷积层。该分割模型可以是预先训练好的模型，比如可以是在电子设备中训练并保存的；或者该分割模型可以是在其他设备中训练完成之后，由电子设备获取并保存的。

所述将所述当前帧的目标特征输入分割模型，得到所述分割模型输出的N种类别的地面要素分割结果，可以包括：将所述当前帧的目标特征输入分割模型，在所述分割模型中对所述当前帧的目标特征进行a倍上采样，得到N×aH_bev×aW_bev的地面要素分割结果。其中，上采样的倍数可以预设的，比如可以为a倍，a为正数。前述N种类别可以指的是地面要素信息的N种类别。也就是通过分割模型对当前帧的目标特征进行a倍上采样之后，得到通道数(或特征图的数量)为N、尺寸为aH_bev×aW_bev的地面要素分割结果。

其中，所述基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息，可以包括：

在第i种类别的地面要素分割结果中的第j个位置处的概率值大于第i个概率阈值的情况下，确定在当前帧的目标特征中，与所述第j个位置对应的位置处存在所述第i种类别下的地面要素信息；其中i为小于或等于N的正整数，j为正整数；

在第i种类别的地面要素分割结果中的第j个位置处的概率值不大于第i个概率阈值的情况下，确定在当前帧的目标特征中，与所述第j个位置对应的位置处不存在所述第i种类别下的地面要素信息。

其中，前述第i种类别的地面要素分割结果为N种类别的地面要素分割结果中的任意之一。由于针对每种类别的地面要素分割结果的处理均为相同的，因此不做一一赘述。前述第j个位置具体可以指的是该第i种类别的地面要素分割结果中的任意一个像素的位置；该第j个位置与当前帧的目标特征的栅格可以具备对应关系。

所述方法还可以包括：将第i种类别的地面要素分割结果作为一个大小为aH_bev×aW_bev的第i个第二掩膜。相应的，前述基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息，具体可以包括：在该第i个第二掩膜的第j个像素位置处所对应的概率值大于第i个概率阈值的情况下，确定在当前帧的目标特征中，与第j个像素位置所对应的栅格处，存在第i种类别下的地面要素信息；在该第i个第二掩膜的第j个像素位置处所对应的概率值不大于第i个概率阈值的情况下，确定在当前帧的目标特征中，与第j个像素位置所对应的栅格处，不存在第i种类别下的地面要素信息。

其中，第i个概率阈值可以是根据实际情况配置的。在一种可能的示例中，不同的类别可以配置不同的概率阈值；举例来说，针对第i种类别的地面要素分割结果，可以设置第i个概率阈值为阈值A，针对第i+1中类别的地面要素分割结果，可以设置第i+1个概率阈值为阈值B，该阈值A和阈值B不同。在又一种可能的示例中，不同的类别可以配置相同的概率阈值；举例来说，针对每个类别的地面要素分割结果，可以设置其概率阈值均为阈值A。再一种可能的示例中，不同的类别可以配置相同的概率阈值、和/或不同的类别可以配置不同的概率值，也就是说，N个类别中，可能存在部分类别对应的概率阈值相同，部分类别对应的概率阈值不同；举例来说，针对第i种类别的地面要素分割结果，可以设置第i个概率阈值为阈值A，针对第i+1中类别的地面要素分割结果，可以设置第i+1个概率阈值为阈值B，针对第i+2中类别的地面要素分割结果，可以设置第i+2个概率阈值为也为阈值B，该阈值A和阈值B不同。应理解，以上仅为示例性说明，这里不对任意一个概率阈值的配置方式进行穷举。

所述每个类别下的地面要素信息的数量可以为一个或多个，本实施例不对其进行限定。

应理解的是，前述地面要素信息是基于本次当前帧的目标特征进行处理所得到的本次地面要素信息。由于前述得到当前帧的目标特征的处理是实时执行的，也就是不同时刻可以得到不同帧的目标特征，相应的就可以得到不同帧的目标特征所对应的该次地面要素信息。最终，可以在一定区域内执行一段时长的本实施例所提供的地面要素信息获取方法，就可以得到该区域内的全部地面要素信息。

针对前述实施例还需要说明的是，在一种示例中，前述当前帧可以指的是除第一帧之外的其他帧，这种示例可以适用于前述全部实施方式提供的方案。在另一种示例中，前述当前帧为第一帧；这种示例中，由于本地并未保存历史帧的目标特征，所以可以在基于当前帧的图像数据得到当前帧的图像特征，基于当前帧的点云数据得到当前帧的点云特征之后，直接将当前帧的点云特征作为所述当前帧的初始化特征，然后执行基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征，以及基于所述当前帧的目标特征，得到地面要素信息的处理，这里不做赘述。

可见，通过采用上述方案，能够基于时序以及空间融合后的当前帧的目标特征进行处理，得到多种类型的地面要素分割结果，进而可以确定每种类型下的地面要素信息。由于当前帧的目标特征融合的时序以及空间特征，因此可以避免由于遮挡等情况所导致的无法获得全面的特征信息的问题，保证了最终地面要素信息的准确性。

结合图4，以目标特征为BEV特征，当前帧的初始化特征为当前帧的初始化BEV特征，图像采集装置为相机，点云采集装置为激光雷达为例，对前述地面要素信息获取方法进行示例性说明：

S401、实时获取相机采集的当前帧的图像数据、实时获取激光雷达采集的当前帧的点云数据。

S402、将所述当前帧的点云数据输入第一模型，得到所述第一模型输出的当前帧的点云特征；以及将所述当前帧的图像数据输入第二模型，得到所述第二模型输出的当前帧的图像特征。

S403、执行时序融合和空间融合。具体可以包括：

S4031、基于所述当前帧的点云特征与历史帧的BEV特征，得到当前帧的初始化BEV特征。

S4032、基于所述当前帧的初始化BEV特征以及所述当前帧的图像特征，得到当前帧的BEV特征。

S404、将所述当前帧的BEV特征输入分割模型，得到所述分割模型输出的N种类别的地面要素分割结果；

S405、基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息。

结合图5，同样以目标特征为BEV特征，当前帧的初始化特征为当前帧的初始化BEV特征，图像采集装置为相机，点云采集装置为激光雷达为例，进行另一种示例性说明：

S501、实时获取相机采集的当前帧的图像数据、实时获取激光雷达采集的当前帧的点云数据。

S502、将所述当前帧的点云数据输入第一模型，得到所述第一模型输出的当前帧的点云特征；以及将所述当前帧的图像数据输入第二模型，得到所述第二模型输出的当前帧的图像特征。

S503、调整所述历史帧的BEV特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的BEV特征。

S504、对所述当前帧的点云特征进行调整，得到调整后的当前帧的点云特征；其中，所述调整后的当前帧的点云特征，与所述调整后的历史帧的目标特征的通道数相同；

S505、基于所述调整后的历史帧的BEV特征，确定第一掩膜，将所述调整后的历史帧的BEV特征与所述调整后的当前帧的点云特征相加，得到所述当前帧的初始融合特征；

S506、基于所述第一掩膜对所述当前帧的初始融合特征进行归一化处理，得到所述当前帧的初始化BEV特征。

S507、对所述当前帧的初始化BEV特征进行自注意力处理，得到包含注意力权重的当前帧的初始化BEV特征。

S508、对所述包含注意力权重的当前帧的初始化BEV特征、所述当前帧的图像特征进行交叉注意力处理，得到所述当前帧的BEV特征。

S509、将所述当前帧的BEV特征输入分割模型，得到所述分割模型输出的N种类别的地面要素分割结果；

S510、基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息。

最后结合相关技术对本实施例提供的方案的有益效果进行说明：相关技术的地面要素分割方法往往仅包含空间融合，将多传感器(一般为环视相机加激光雷达)信息在空间维度进行融合。但是，当某些地面要素被行人或车辆遮挡时，不论是相机或是激光雷达均无法得到正确的信息；或者当车速过快，造成相机拍摄的图像产生模糊；或者雨雪天气造成激光雷达的噪声误差等等，都可能会造成融合结果不够准确的问题。

另外，相关技术中地面要素分割方法的空间融合方式一般为将图像信息根据深度关系转换为伪雷达点云，或者将激光雷达点云信息投影到图像上。这使得特征信息难以进行时序上的融合，或者需要借助3D卷积进行时序融合，导致计算量成倍增加。而将点云投影到图像上的方法所得到的分割结果在图像空间，而不是BEV空间，并不能直接被后端任务所使用，需要额外的后处理步骤。

进一步地，鸟瞰图(BEV)视角下的地面要素分割任务可以得到BEV语义地图，为自动驾驶中更高层级的任务，如路径规划、轨迹预测等，提供便利。基于空间融合将多传感器的特征信息投影到BEV空间，以此来统一地面要素的表达，已经成为了自动驾驶技术中主流的方式之一。BEV空间可以方便地融合不同传感器，如常见的环视多相机、激光雷达，将不同的特征信息从它们自身的传感器坐标系统一投影到BEV空间。但是，仅有空间融合的地面要素分割方式，在前述车速过快造成相机的模糊、路上行人车辆的遮挡、恶劣天气等现实情况中复杂的周围环境的情况下，仍然存在融合结果不够准确的问题。

考虑到实际自动驾驶运行中，所有信息都是连续的，往往很容易可以得到历史帧的信息，可以不断迭代。其次，BEV空间的统一表达方式给融合当前帧的信息和历史帧的信息提供了便利。基于此，本实施例所提供的方式方案，可以在BEV空间下，有效地基于多相机采集的图像数据得到图像特征、和基于激光雷达采集的点云数据得到点云特征，进而在空间和时序上进行融合，并得到语义分割结果，最终得到地面要素信息。通过这种在线时序融合的方式，利用历史帧的信息有效地提高对复杂环境尤其是运动模糊、遮挡等情况的适应能力，从而提高分割精度、保证结果的准确性、并对地图要素分割的鲁棒性有明显的改善。进而通过采用以上方案所得到的地面要素信息，可以为自动驾驶的下游任务提供质量更高的输入。

本公开第二方面实施例提供一种地面要素信息获取装置，如图6所示，包括：

数据处理模块601，用于基于当前帧的图像数据得到当前帧的图像特征，基于当前帧的点云数据得到当前帧的点云特征；

初始化处理模块602，用于基于所述当前帧的点云特征与历史帧的目标特征，得到当前帧的初始化特征；

目标特征处理模块603，用于基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征；

地面要素获取模块604，用于基于所述当前帧的目标特征，得到地面要素信息。

所述初始化处理模块，用于调整所述历史帧的目标特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征；基于所述调整后的历史帧的目标特征、所述当前帧的点云特征，得到所述当前帧的初始化特征。

所述初始化处理模块，用于获取当前帧的采集设备位姿以及历史帧的采集设备位姿；基于所述当前帧的所述采集设备位姿以及所述历史帧的所述采集设备位姿，确定姿态变化信息；基于所述姿态变化信息，确定调整信息；基于所述调整信息对所述历史帧的目标特征的进行调整，得到与所述当前帧的点云特征位置对齐的所述调整后的历史帧的目标特征。

所述初始化处理模块，用于对所述当前帧的点云特征进行调整，得到调整后的当前帧的点云特征；其中，所述调整后的当前帧的点云特征，与所述调整后的历史帧的目标特征的通道数相同；对所述调整后的当前帧的点云特征、所述调整后的历史帧的目标特征进行融合，得到所述当前帧的初始化特征。

所述初始化处理模块，用于基于所述调整后的历史帧的目标特征，确定第一掩膜；将所述调整后的历史帧的目标特征与所述调整后的当前帧的点云特征相加，得到所述当前帧的初始融合特征；基于所述第一掩膜对所述当前帧的初始融合特征进行归一化处理，得到所述当前帧的初始化特征。

所述目标特征处理模块，用于对所述当前帧的初始化特征进行自注意力处理，得到包含注意力权重的当前帧的初始化特征；对所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征进行交叉注意力处理，得到所述当前帧的目标特征。

所述地面要素获取模块，用于将所述当前帧的目标特征输入分割模型，得到所述分割模型输出的N种类别的地面要素分割结果；N为正整数；基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息。

本实施例提供的地面要素信息获取装置可以设置在电子设备中。关于本实施例的装置中各个模块的具体处理与前述地面要素信息获取方法中相同，这里不进行重复说明。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种车辆、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，电子设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储电子设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

电子设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理。例如，在一些实施例中，上文所描述的各个方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到电子设备700上。当计算机程序加载到RAM703并由计算单元701执行时，可以执行上文所描述的各个方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行上文所描述的各个方法。

根据本公开的又一实施例提供了一种车辆，该车辆包括上述实施例的电子设备700。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种地面要素信息获取方法，包括：

基于所述当前帧的目标特征，得到地面要素信息。

2.根据权利要求1所述的方法，其中，所述基于所述当前帧的点云特征与历史帧的目标特征，得到初始化的目标特征，包括：

调整所述历史帧的目标特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征；

基于所述调整后的历史帧的目标特征、所述当前帧的点云特征，得到所述当前帧的初始化特征。

3.根据权利要求2所述的方法，其中，所述调整所述历史帧的目标特征，得到与所述当前帧的点云特征对齐的调整后的历史帧的目标特征，包括：

获取当前帧的采集设备位姿以及历史帧的采集设备位姿；

基于所述当前帧的所述采集设备位姿以及所述历史帧的所述采集设备位姿，确定姿态变化信息；

基于所述姿态变化信息，确定调整信息；

基于所述调整信息对所述历史帧的目标特征的进行调整，得到与所述当前帧的点云特征位置对齐的所述调整后的历史帧的目标特征。

4.根据权利要求2所述的方法，其中，所述基于所述调整后的历史帧的目标特征、所述当前帧的点云特征，得到所述当前帧的初始化特征，包括：

对所述当前帧的点云特征进行调整，得到调整后的当前帧的点云特征；其中，所述调整后的当前帧的点云特征，与所述调整后的历史帧的目标特征的通道数相同；

5.根据权利要求4所述的方法，其中，所述对所述调整后的当前帧的点云特征、所述调整后的历史帧的目标特征进行融合，得到所述当前帧的初始化特征，包括：

基于所述调整后的历史帧的目标特征，确定第一掩膜；

将所述调整后的历史帧的目标特征与所述调整后的当前帧的点云特征相加，得到所述当前帧的初始融合特征；

基于所述第一掩膜对所述当前帧的初始融合特征进行归一化处理，得到所述当前帧的初始化特征。

6.根据权利要求1所述的方法，其中，所述基于所述当前帧的初始化特征以及所述当前帧的图像特征，得到当前帧的目标特征，包括：

对所述当前帧的初始化特征进行自注意力处理，得到包含注意力权重的当前帧的初始化特征；

对所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征进行交叉注意力处理，得到所述当前帧的目标特征。

7.根据权利要求1-6任一项所述的方法，其中，所述基于所述当前帧的目标特征，得到地面要素信息，包括：

将所述当前帧的目标特征输入分割模型，得到所述分割模型输出的N种类别的地面要素分割结果；N为正整数；

基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息。

8.一种地面要素信息获取装置，包括：

9.根据权利要求8所述的装置，其中，所述初始化处理模块，用于调整所述历史帧的目标特征，得到与所述当前帧的点云特征位置对齐的调整后的历史帧的目标特征；基于所述调整后的历史帧的目标特征、所述当前帧的点云特征，得到所述当前帧的初始化特征。

10.根据权利要求9所述的装置，其中，所述初始化处理模块，用于获取当前帧的采集设备位姿以及历史帧的采集设备位姿；基于所述当前帧的所述采集设备位姿以及所述历史帧的所述采集设备位姿，确定姿态变化信息；基于所述姿态变化信息，确定调整信息；基于所述调整信息对所述历史帧的目标特征的进行调整，得到与所述当前帧的点云特征位置对齐的所述调整后的历史帧的目标特征。

11.根据权利要求9所述的装置，其中，所述初始化处理模块，用于对所述当前帧的点云特征进行调整，得到调整后的当前帧的点云特征；其中，所述调整后的当前帧的点云特征，与所述调整后的历史帧的目标特征的通道数相同；对所述调整后的当前帧的点云特征、所述调整后的历史帧的目标特征进行融合，得到所述当前帧的初始化特征。

12.根据权利要求11所述的装置，其中，所述初始化处理模块，用于基于所述调整后的历史帧的目标特征，确定第一掩膜；将所述调整后的历史帧的目标特征与所述调整后的当前帧的点云特征相加，得到所述当前帧的初始融合特征；基于所述第一掩膜对所述当前帧的初始融合特征进行归一化处理，得到所述当前帧的初始化特征。

13.根据权利要求8所述的装置，其中，所述目标特征处理模块，用于对所述当前帧的初始化特征进行自注意力处理，得到包含注意力权重的当前帧的初始化特征；对所述包含注意力权重的当前帧的初始化特征、所述当前帧的图像特征进行交叉注意力处理，得到所述当前帧的目标特征。

14.根据权利要求8-13任一项所述的装置，其中，所述地面要素获取模块，用于将所述当前帧的目标特征输入分割模型，得到所述分割模型输出的N种类别的地面要素分割结果；N为正整数；基于所述N种类别的地面要素分割结果，得到所述N种类别中每个类别下的地面要素信息。

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。

18.一种车辆，包括如权利要求15所述的电子设备。