CN114842454A

CN114842454A - 障碍物检测方法、装置、设备、存储介质、芯片及车辆

Info

Publication number: CN114842454A
Application number: CN202210735957.5A
Authority: CN
Inventors: 牛宝龙
Original assignee: Xiaomi Automobile Technology Co Ltd
Current assignee: Xiaomi Automobile Technology Co Ltd
Priority date: 2022-06-27
Filing date: 2022-06-27
Publication date: 2022-08-02
Anticipated expiration: 2042-06-27
Also published as: CN114842454B

Abstract

本公开涉及自动驾驶领域中的一种障碍物检测方法、装置、设备、存储介质、芯片及车辆，包括：获取本车在行驶过程中采集的路采图像；将路采图像输入到障碍物检测模型中得到障碍物检测结果；障碍物检测模型是根据第一样本图像对头部网络进行预训练得到预训练权重，根据预训练权重修改主干网络的损失函数，根据第二样本图像对修改损失函数后的主干网络进行模型微调后得到的，第一样本图像包括多个类型的样本图像，第二样本图像是根据本车的路采图像得到的。基于第一样本图像预训练头部网络后的预训练权重，对主干网络的损失函数进行修改，进而基于第二样本图像对主干网络进行微调，可以降低对第二样本图像的质量和数量要求，降低了模型部署的成本。

Description

障碍物检测方法、装置、设备、存储介质、芯片及车辆

技术领域

本公开涉及自动驾驶技术领域，尤其涉及一种障碍物检测方法、装置、设备、存储介质、芯片及车辆。

背景技术

障碍物检测在自动驾驶技术领域中具有重要作用，可以用于自动驾驶车辆检测行驶路径上是否存在障碍物，然而，由于车辆在车型上的差异，为提高障碍物检测模型与不同车型车辆的适配性，需要通过本车采集的大量样本图像对障碍物监测模型进行训练，导致采集样本图像的工作量较大，成本较大。

发明内容

为克服相关技术中存在的问题，本公开提供一种障碍物检测方法、装置、设备、存储介质、芯片及车辆。

根据本公开实施例的第一方面，提供一种障碍物检测方法，包括：

获取本车在行驶过程中采集的路采图像；

将所述路采图像输入到障碍物检测模型中，得到所述障碍物检测模型输出障碍物检测结果；

其中，所述障碍物检测模型是根据第一样本图像对障碍物检测模型的头部网络进行预训练，得到预训练权重，并根据所述预训练权重修改所述障碍物检测模型的主干网络的损失函数，再根据第二样本图像对修改损失函数后的障碍物检测模型的主干网络进行模型微调后得到的，所述第一样本图像包括多个类型的样本图像，所述第二样本图像是根据本车的路采图像得到的。

可选地，所述头部网络包括不同类型的头部子网络、且头部子网络成线性连接；

所述根据第一样本图像对障碍物检测模型的头部网络进行预训练，得到预训练权重，包括：

通过所述第一样本图像中多个类型的样本图像，分别对所述障碍物检测模型中对应类型的头部子网络进行预训练，得到所述预训练权重，其中，线性连接的头部子网络中前一头部子网络预训练得到的预训练权重用于调整后一头部子网络的网络参数。

可选地，所述第一样本图像包括2D子样本图像、深度子样本图像和3D子样本图像；

所述通过所述第一样本图像中多个类型的样本图像，分别对所述障碍物检测模型中对应类型的头部子网络进行预训练，得到所述预训练权重，包括：

通过所述2D子样本图像对所述障碍物检测模型的2D检测头部子网络进行预训练，得到2D预训练权重；

通过所述2D预训练权重调整所述障碍物检测模型的深度估计头部子网络的深度估计网络参数；

通过所述深度子样本图像对调整深度估计网络参数后的深度估计头部子网络进行预训练，得到深度预训练权重；

通过所述深度预训练权重调整所述障碍物检测模型的3D检测头部子网络的3D检测网络参数；

通过所述3D子样本图像对调整3D检测网络参数后的3D检测头部子网络进行预训练，得到所述预训练权重。

可选地，所述第一样本图像是通过如下方式得到的：

获取原始样本图像的2D标注框、点云、环视图和周视图，其中，所述2D标注框是根据任一顶点坐标和2D标注框的长宽信息构建的；

将所述2D标注框与所述原始样本图像进行匹配，得到所述2D子样本图像；

将所述点云投影到所述2D子样本图像上，并根据所述2D子样本图像上投影的点云，确定所述2D子样本图像上像素点的深度值，根据所述2D子样本图像和所述像素点的深度值，得到所述深度子样本图像；

根据所述2D子样本图像以及所述深度子样本图像，构建3D空间框；

将所述3D空间框与所述环视图以及所述周视图进行匹配，得到所述3D子样本图像。

可选地，所述第二样本图像的确定，包括：

获取本车的图像采集装置采集的路采图像；

根据本车的图像采集装置的视域大小，对所述路采图像进行正视投影处理，得到投影路采图像；

根据不同角度下的阳光照射，对所述投影路采图像进行光影补充，生成光影路采图像；

对所述光影路采图像进行标注，生成所述第二样本图像。

可选地，所述根据第二样本图像对修改损失函数后的障碍物检测模型的主干网络进行模型微调，包括：

将所述第二样本图像输入修改损失函数后的障碍物检测模型的主干网络，执行正向传播生成主干网络的微调模型参数；

根据微调模型参数执行反向传播，更新所述主干网络的网络参数；

迭代执行所述正向传播和所述反向传播，直到所述障碍物检测模型收敛。

根据本公开实施例的第二方面，提供一种障碍物检测装置，包括：

获取模块，被配置为获取本车在行驶过程中采集的路采图像；

输入模块，被配置为将所述路采图像输入到障碍物检测模型中，得到所述障碍物检测模型输出障碍物检测结果；

所述输入模块，被配置为通过所述第一样本图像中多个类型的样本图像，分别对所述障碍物检测模型中对应类型的头部子网络进行预训练，得到所述预训练权重，其中，线性连接的头部子网络中前一头部子网络预训练得到的预训练权重用于调整后一头部子网络的网络参数。

所述输入模块，被配置为：

可选地，所述第一样本图像是通过如下方式得到的：

可选地，所述第二样本图像的确定，包括：

获取本车的图像采集装置采集的路采图像；

对所述光影路采图像进行标注，生成所述第二样本图像。

可选地，所述输入模块，被配置为：

根据本公开实施例的第三方面，提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取本车在行驶过程中采集的路采图像；

根据本公开实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序指令，该程序指令被处理器执行时实现第一方面中任一项所述方法的步骤。

根据本公开实施例的第五方面，提供一种芯片，包括处理器和接口；所述处理器用于读取指令以执行第一方面中任一项所述的方法。

根据本公开实施例的第六方面，提供一种车辆，包括第三方面所述的电子设备，或者，第五方面所述的芯片。

本公开的实施例提供的技术方案可以包括以下有益效果：

通过获取本车在行驶过程中采集的路采图像；将路采图像输入到障碍物检测模型中得到障碍物检测结果；障碍物检测模型是根据第一样本图像对头部网络进行预训练得到预训练权重，根据预训练权重修改主干网络的损失函数，根据第二样本图像对修改损失函数后的主干网络进行模型微调后得到的，第一样本图像包括多个类型的样本图像，第二样本图像是根据本车的路采图像得到的。基于第一样本图像预训练头部网络后的预训练权重，对主干网络的损失函数进行修改，进而基于第二样本图像对主干网络进行微调，可以降低对第二样本图像的质量和数量要求，降低了自动驾驶样本图像构建成本，降低了模型部署的成本。并且，可以提高主干网络的特征提取能力，提高提高障碍物检测的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种障碍物检测方法的流程图。

图2是根据一示例性实施例示出的一种障碍物检测装置的框图。

图3是根据一示例性实施例示出的一种用于障碍物检测的装置的框图。

图4是一示例性实施例示出的一种车辆的功能框图示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

需要说明的是，本申请中所有获取本车路采图像的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。

图1是根据一示例性实施例示出的一种障碍物检测方法的流程图，如图1所示，该方法用于车辆终端中，包括以下步骤。

在步骤S11中，获取本车在行驶过程中采集的路采图像。

在本公开实施例中，路采图像是车载的图像采集装置在车辆的行驶过程中采集的，例如，在车辆启动之后，车载的图像采集装置启动，实时采集路采图像。

其中，图像采集装置可以是例如摄像头，并且被配置为采集车辆行驶方向上、预设视角内的路采图像。

在可能实现的方式中，可以在车辆上配置一个或多个图像采集装置，在车辆上配置一个图像采集装置时，可以是采集车辆正前方的路采图像，在车辆上配置多个图像采集装置时，可以通过多个图像采集装置分别从不同角度采集路采图像。

在步骤S12中，将所述路采图像输入到障碍物检测模型中，得到所述障碍物检测模型输出障碍物检测结果；

在本公开实施例中，第一样本图像可以是从其他车辆采集的图像，或者根据手持摄像机采集的图像构建的通用图像。即针对任意类型的车辆或者任一台车辆，第一样本图像可以是相同。而第二样本图像是根据本车上的图像采集装置采集的路采图像进行标定后得到的。即每一台车辆上的障碍物检测模型是根据相同的第一样本图像进行预训练的，而根据不同的第二样本图像对预训练后的模型微调得到的。

示例地，第一样本图像可以是在获得用户授权的情况下，从其他车辆的图像采集装置上获取路采图像，进而对其他车辆的路采图像进行标注后得到的，而第二样本图像是在获得本车的用户授权的情况下，从本车的图像采集装置上获取路采图像，并对本车的路采图像进行标注后得到的。

上述技术方案通过获取本车在行驶过程中采集的路采图像；将路采图像输入到障碍物检测模型中得到障碍物检测结果；障碍物检测模型是根据第一样本图像对头部网络进行预训练得到预训练权重，根据预训练权重修改主干网络的损失函数，根据第二样本图像对修改损失函数后的主干网络进行模型微调后得到的，第一样本图像包括多个类型的样本图像，第二样本图像是根据本车的路采图像得到的。基于第一样本图像预训练头部网络后的预训练权重，对主干网络的损失函数进行修改，进而基于第二样本图像对主干网络进行微调，可以降低对第二样本图像的质量和数量要求，降低了自动驾驶样本图像构建成本，降低了模型部署的成本。并且，可以提高主干网络的特征提取能力，提高提高障碍物检测的准确性。

在一种实施方式中，不同类型的头部子网络可以为2D检测头部子网络、深度估计头部子网络、3D检测头部子网络，且2D检测头部子网络、深度估计头部子网络、3D检测头部子网络呈线性连接。

在本公开实施例中，2D检测头部子网络预训练得到的预训练权重用于调整深度估计头部子网络的网络参数，深度估计头部子网络预训练得到的预训练权重用于调整3D检测头部子网络的网络参数。

例如，深度估计网络参数可以是深度估计头部子网络的超参数、深度估计头部子网络的损失函数等。

同理，3D检测网络参数可以是的3D检测头部子网络的超参数、的3D检测头部子网络的损失函数等。

在本公开实施例中，2D检测头部子网络与主干网络连接，并且2D检测头部子网络、深度估计头部子网络、3D检测头部子网络均可以作为障碍检测模型的输出层。

可选地，所述第一样本图像是通过如下方式得到的：

在一种可能实现的方式中，2D标注框和点云均可以用于表征障碍物信息，2D标注框表征障碍物在二维平面上的位置，点云用于表征障碍物的深度值。2D标注框例如可以是（x，y，w，h），其中，x和y为2D标注框的任一顶点坐标，例如，x和y可以为2D标注框的右上角顶点坐标，w为2D标注框的长度，h为2D标注框的宽度。

在一种可能实现的方式中，可以获取多帧的环视图和多帧的周视图，例如获取4帧的环视图和7帧的周视图。

其中，将2D标注框与所述原始样本图像进行匹配，获得原始样本图像和2D标注框匹配的数据对。

其中，将2D标注框与点云进行匹配，获得原始样本图像和深度图匹配的数据对。

其中，3D空间框可以表征障碍物在三维坐标系下的位置，3D空间框可以通过（x，y，z，l，w，h，rot）表示，其中，（x，y，z）是3D空间框的中心点坐标，l、w、h是3D空间框分别在x、y、z方向上的取值，即3D空间框的长宽高，rot是3D空间框在z轴方向上的偏航角。

在一种可能实施的方式中，将多帧环视图和多帧周视图均与3D空间框进行匹配，得到环视图、周视图与3D空间框匹配的数据对。

可选地，所述第二样本图像的确定，包括：

获取本车的图像采集装置采集的路采图像；

本公开实施例中，在第二样本图像确定时，路采图像可以是本车的历史路采图像。

本公开实施例中，由于摄像头等图像采集装置采集的图像存在角度，因此需要根据视域的大小，对路采图像进行正视投影处理。

为降低不同角度下的光照对障碍物检测的影响，可以对投影路采图像中的障碍物补充不同角度的光照，从而得到多个光照角度下的障碍物光影，进而根据多个光照角度下的障碍物光影生成光影路采图像。

对所述光影路采图像进行标注，生成所述第二样本图像。

本公开实施例中，可以通过机器标注和人工标注的方式进行标注。

将所述第二样本图像输入修改损失函数后的障碍物检测模型的主干网络，执行正向传播生成主干网络的微调模型参数。

其中，将第二样本图像输入修改损失函数后的障碍物检测模型的主干网络，对主干网络和头部网络沿着从输入层到输出层的顺序，依次计算并存储模型的中间变量。

根据微调模型参数执行反向传播，更新所述主干网络的网络参数。

其中，通过导数链式法则计算损失函数对各网络参数的梯度，并根据网络参数的梯度进行主干网络的网络参数的更新。

迭代执行正向传播和反向传播，直到障碍物检测模型收敛，得到最终的障碍物检测模型的网络权重。

基于相同的构思，本公开还提供一种障碍物检测装置，用于执行上述方法实施例提供的障碍物检测方法的部分或全部步骤，该装置200可以以软件、硬件或者两者相结合的方式实现障碍物检测方法。图2是根据一示例性实施例示出的一种障碍物检测装置的框图，参见图2所示，所述装置200包括：获取模块210和输入模块220。

其中，该获取模块210，被配置为获取本车在行驶过程中采集的路采图像；

该输入模块220，被配置为将所述路采图像输入到障碍物检测模型中，得到所述障碍物检测模型输出障碍物检测结果；

所述输入模块220，被配置为通过所述第一样本图像中多个类型的样本图像，分别对所述障碍物检测模型中对应类型的头部子网络进行预训练，得到所述预训练权重，其中，线性连接的头部子网络中前一头部子网络预训练得到的预训练权重用于调整后一头部子网络的网络参数。

所述输入模块，被配置为：

可选地，所述第一样本图像是通过如下方式得到的：

可选地，所述第二样本图像的确定，包括：

获取本车的图像采集装置采集的路采图像；

对所述光影路采图像进行标注，生成所述第二样本图像。

可选地，所述输入模块220，被配置为：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

此外值得说明的是，为描述的方便和简洁，说明书中所描述的实施例均属于优选实施例，其所涉及的部分并不一定是本发明所必须的，例如，获取模块210和输入模块220，在具体实施时可以是相互独立的装置也可以是同一个装置，本公开对此不作限定。

根据本公开实施例还提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取本车在行驶过程中采集的路采图像；

根据本公开实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序指令，该程序指令被处理器执行时实现前述实施例中任一项所述方法的步骤。

根据本公开实施例的第五方面，提供一种芯片，包括处理器和接口；所述处理器用于读取指令以执行前述实施例中任一项所述的方法。

根据本公开实施例还提供一种车辆，包括前述实施例中所述的电子设备，或者，前述实施例中所述的芯片。

图3是根据一示例性实施例示出的一种用于障碍物检测的装置300的框图。例如，装置300可以是整车控制器，或者驾驶辅助系统的控制器，或者车道偏移系统的控制器。

参照图3，装置300可以包括以下一个或多个组件：处理组件302，第一存储器304，电源组件306，多媒体组件308，音频组件310，输入/输出接口312，传感器组件314，以及通信组件316。

处理组件302通常控制装置300的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件302可以包括一个或多个第一处理器320来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件302可以包括一个或多个模块，便于处理组件302和其他组件之间的交互。例如，处理组件302可以包括多媒体模块，以方便多媒体组件308和处理组件302之间的交互。

第一存储器304被配置为存储各种类型的数据以支持在装置300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。第一存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器（SRAM），电可擦除可编程只读存储器（EEPROM），可擦除可编程只读存储器（EPROM），可编程只读存储器（PROM），只读存储器（ROM），磁存储器，快闪存储器，磁盘或光盘。

电源组件306为装置300的各种组件提供电力。电源组件306可以包括电源管理系统，一个或多个电源，及其他与为装置300生成、管理和分配电力相关联的组件。

多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器（LCD）和触摸面板（TP）。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件308包括一个前置摄像头和/或后置摄像头。当装置300处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件310被配置为输出和/或输入音频信号。例如，音频组件310包括一个麦克风（MIC），当装置300处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在第一存储器304或经由通信组件316发送。在一些实施例中，音频组件310还包括一个扬声器，用于输出音频信号。

输入/输出接口312为处理组件302和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件314包括一个或多个传感器，用于为装置300提供各个方面的状态评估。例如，传感器组件314可以检测到装置300的打开/关闭状态，组件的相对定位，例如所述组件为装置300的显示器和小键盘，传感器组件314还可以检测装置300或装置300一个组件的位置改变，用户与装置300接触的存在或不存在，装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件314还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件316还包括近场通信（NFC）模块，以促进短程通信。例如，在NFC模块可基于射频识别（RFID）技术，红外数据协会（IrDA）技术，超宽带（UWB）技术，蓝牙（BT）技术和其他技术来实现。

在示例性实施例中，装置300可以被一个或多个应用专用集成电路（ASIC）、数字信号处理器（DSP）、数字信号处理设备（DSPD）、可编程逻辑器件（PLD）、现场可编程门阵列（FPGA）、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的第一存储器304，上述指令可由装置300的第一处理器320执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器（RAM）、CD-ROM、磁带、软盘和光数据存储设备等。

上述装置除了可以是独立的电子设备外，也可是独立电子设备的一部分，例如在一种实施例中，该装置可以是集成电路（Integrated Circuit，IC）或芯片，其中该集成电路可以是一个IC，也可以是多个IC的集合；该芯片可以包括但不限于以下种类：GPU（GraphicsProcessing Unit，图形处理器）、CPU（Central Processing Unit，中央处理器）、FPGA（Field Programmable Gate Array，可编程逻辑阵列）、DSP（Digital Signal Processor，数字信号处理器）、ASIC（Application Specific Integrated Circuit，专用集成电路）、SOC（System on Chip，SoC，片上系统或系统级芯片）等。上述的集成电路或芯片中可以用于执行可执行指令（或代码），以实现上述的障碍物检测方法。其中该可执行指令可以存储在该集成电路或芯片中，也可以从其他的装置或设备获取，例如该集成电路或芯片中包括处理器、存储器，以及用于与其他的装置通信的接口。该可执行指令可以存储于该存储器中，当该可执行指令被处理器执行时实现上述的障碍物检测方法；或者，该集成电路或芯片可以通过该接口接收可执行指令并传输给该处理器执行，以实现上述的障碍物检测方法。

参阅图4，图4是一示例性实施例示出的一种车辆400的功能框图示意图。车辆400可以被配置为完全或部分自动驾驶模式。例如，车辆400可以通过感知系统420获取其周围的环境信息，并基于对周边环境信息的分析得到自动驾驶策略以实现完全自动驾驶，或者将分析结果呈现给用户以实现部分自动驾驶。

车辆400可包括各种子系统，例如，信息娱乐系统410、感知系统420、决策控制系统430、驱动系统440以及计算平台450。可选的，车辆400可包括更多或更少的子系统，并且每个子系统都可包括多个部件。另外，车辆400的每个子系统和部件可以通过有线或者无线的方式实现互连。

在一些实施例中，信息娱乐系统410可以包括通信系统411，娱乐系统412以及导航系统413。

通信系统411可以包括无线通信系统，无线通信系统可以直接地或者经由通信网络来与一个或多个设备无线通信。例如，无线通信系统可使用3G蜂窝通信，例如CDMA、EVD0、GSM/GPRS，或者4G蜂窝通信，例如LTE。或者5G蜂窝通信。无线通信系统可利用WiFi与无线局域网（wireless local area network，WLAN）通信。在一些实施例中，无线通信系统可利用红外链路、蓝牙或ZigBee与设备直接通信。其他无线协议，例如各种车辆通信系统，例如，无线通信系统可包括一个或多个专用短程通信（dedicated short range communications，DSRC）设备，这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。

娱乐系统412可以包括显示设备，麦克风和音响，用户可以基于娱乐系统在车内收听广播，播放音乐；或者将手机和车辆联通，在显示设备上实现手机的投屏，显示设备可以为触控式，用户可以通过触摸屏幕进行操作。

在一些情况下，可以通过麦克风获取用户的语音信号，并依据对用户的语音信号的分析实现用户对车辆400的某些控制，例如调节车内温度等。在另一些情况下，可以通过音响向用户播放音乐。

导航系统413可以包括由地图供应商所提供的地图服务，从而为车辆400提供行驶路线的导航，导航系统413可以和车辆的全球定位系统421、惯性测量单元422配合使用。地图供应商所提供的地图服务可以为二维地图，也可以是高精地图。

感知系统420可包括感测关于车辆400周边的环境的信息的若干种传感器。例如，感知系统420可包括全球定位系统421（全球定位系统可以是GPS系统，也可以是北斗系统或者其他定位系统）、惯性测量单元（inertial measurement unit，IMU）422、激光雷达423、毫米波雷达424、超声雷达425以及摄像装置426。感知系统420还可包括被监视车辆400的内部系统的传感器（例如，车内空气质量监测器、燃油量表、机油温度表等）。来自这些传感器中的一个或多个的传感器数据可用于检测对象及其相应特性（位置、形状、方向、速度等）。这种检测和识别是车辆400的安全操作的关键功能。

全球定位系统421用于估计车辆400的地理位置。

惯性测量单元422用于基于惯性加速度来感测车辆400的位姿变化。在一些实施例中，惯性测量单元422可以是加速度计和陀螺仪的组合。

激光雷达423利用激光来感测车辆400所位于的环境中的物体。在一些实施例中，激光雷达423可包括一个或多个激光源、激光扫描器以及一个或多个检测器，以及其他系统组件。

毫米波雷达424利用无线电信号来感测车辆400的周边环境内的物体。在一些实施例中，除了感测物体以外，毫米波雷达424还可用于感测物体的速度和/或前进方向。

超声雷达425可以利用超声波信号来感测车辆400周围的物体。

摄像装置426用于捕捉车辆400的周边环境的图像信息。摄像装置426可以包括单目相机、双目相机、结构光相机以及全景相机等，摄像装置426获取的图像信息可以包括静态图像，也可以包括视频流信息。

决策控制系统430包括基于感知系统420所获取的信息进行分析决策的计算系统431，决策控制系统430还包括对车辆400的动力系统进行控制的整车控制器432，以及用于控制车辆400的转向系统433、油门434和制动系统435。

计算系统431可以操作来处理和分析由感知系统420所获取的各种信息以便识别车辆400周边环境中的目标、物体和/或特征。目标可以包括行人或者动物，物体和/或特征可包括交通信号、道路边界和障碍物。计算系统431可使用物体识别算法、运动中恢复结构（Structure from Motion，SFM）算法、视频跟踪等技术。在一些实施例中，计算系统431可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。计算系统431可以将所获取的各种信息进行分析并得出对车辆的控制策略。

整车控制器432可以用于对车辆的动力电池和引擎441进行协调控制，以提升车辆400的动力性能。

转向系统433可操作来调整车辆400的前进方向。例如在一个实施例中可以为方向盘系统。

油门434用于控制引擎441的操作速度并进而控制车辆400的速度。

制动系统435用于控制车辆400减速。制动系统435可使用摩擦力来减慢车轮444。在一些实施例中，制动系统435可将车轮444的动能转换为电流。制动系统435也可采取其他形式来减慢车轮444转速从而控制车辆400的速度。

驱动系统440可包括为车辆400提供动力运动的组件。在一个实施例中，驱动系统440可包括引擎441、能量源442、传动系统443和车轮444。引擎441可以是内燃机、电动机、空气压缩引擎或其他类型的引擎组合，例如汽油发动机和电动机组成的混动引擎，内燃引擎和空气压缩引擎组成的混动引擎。引擎441将能量源442转换成机械能量。

能量源442的示例包括汽油、柴油、其他基于石油的燃料、丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源442也可以为车辆400的其他系统提供能量。

传动系统443可以将来自引擎441的机械动力传送到车轮444。传动系统443可包括变速箱、差速器和驱动轴。在一个实施例中，传动系统443还可以包括其他器件，比如离合器。其中，驱动轴可包括可耦合到一个或多个车轮444的一个或多个轴。

车辆400的部分或所有功能受计算平台450控制。计算平台450可包括至少一个第二处理器451，第二处理器451可以执行存储在例如第二存储器452这样的非暂态计算机可读介质中的指令453。在一些实施例中，计算平台450还可以是采用分布式方式控制车辆400的个体组件或子系统的多个计算设备。

第二处理器451可以是任何常规的处理器，诸如商业可获得的CPU。可替换地，第二处理器451还可以包括诸如图像处理器（Graphic Process Unit，GPU），现场可编程门阵列（Field Programmable Gate Array，FPGA）、片上系统（System on Chip，SOC）、专用集成芯片（Application Specific Integrated Circuit，ASIC）或它们的组合。尽管图4功能性地图示了处理器、存储器、和在相同块中的计算机的其它元件，但是本领域的普通技术人员应该理解该处理器、计算机、或存储器实际上可以包括可以或者可以不存储在相同的物理外壳内的多个处理器、计算机、或存储器。例如，存储器可以是硬盘驱动器或位于不同于计算机的外壳内的其它存储介质。因此，对处理器或计算机的引用将被理解为包括对可以或者可以不并行操作的处理器或计算机或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤，诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器，处理器只执行与特定于组件的功能相关的计算。

在本公开实施方式中，第二处理器451可以执行上述的障碍物检测方法。

在此处所描述的各个方面中，第二处理器451可以位于远离该车辆并且与该车辆进行无线通信。在其它方面中，此处所描述的过程中的一些在布置于车辆内的处理器上执行而其它则由远程处理器执行，包括采取执行单一操纵的必要步骤。

在一些实施例中，第二存储器452可包含指令453（例如，程序逻辑），指令453可被第二处理器451执行来执行车辆400的各种功能。第二存储器452也可包含额外的指令，包括向信息娱乐系统410、感知系统420、决策控制系统430、驱动系统440中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。

除了指令453以外，第二存储器452还可存储数据，例如道路地图、路线信息，车辆的位置、方向、速度以及其它这样的车辆数据，以及其他信息。这种信息可在车辆400在自主、半自主和/或手动模式中操作期间被车辆400和计算平台450使用。

计算平台450可基于从各种子系统（例如，驱动系统440、感知系统420和决策控制系统430）接收的输入来控制车辆400的功能。例如，计算平台450可利用来自决策控制系统430的输入以便控制转向系统433来避免由感知系统420检测到的障碍物。在一些实施例中，计算平台450可操作来对车辆400及其子系统的许多方面提供控制。

可选地，上述这些组件中的一个或多个可与车辆400分开安装或关联。例如，第二存储器452可以部分或完全地与车辆400分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。

可选地，上述组件只是一个示例，实际应用中，上述各个模块中的组件有可能根据实际需要增添或者删除，图4不应理解为对本公开实施例的限制。

在道路行进的自动驾驶汽车，如上面的车辆400，可以识别其周围环境内的物体以确定对当前速度的调整。物体可以是其它车辆、交通控制设备、或者其它类型的物体。在一些示例中，可以独立地考虑每个识别的物体，并且基于物体的各自的特性，诸如它的当前速度、加速度、与车辆的间距等，可以用来确定自动驾驶汽车所要调整的速度。

可选地，车辆400或者与车辆400相关联的感知和计算设备（例如计算系统431、计算平台450）可以基于所识别的物体的特性和周围环境的状态（例如，交通、雨、道路上的冰、等等）来预测识别的物体的行为。可选地，每一个所识别的物体都依赖于彼此的行为，因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。车辆400能够基于预测的识别的物体的行为来调整它的速度。换句话说，自动驾驶汽车能够基于所预测的物体的行为来确定车辆将需要调整到（例如，加速、减速、或者停止）何种稳定状态。在这个过程中，也可以考虑其它因素来确定车辆400的速度，诸如，车辆400在行驶的道路中的横向位置、道路的曲率、静态和动态物体的接近度等等。

除了提供调整自动驾驶汽车的速度的指令之外，计算设备还可以提供修改车辆400的转向角的指令，以使得自动驾驶汽车遵循给定的轨迹和/或维持与自动驾驶汽车附近的物体（例如，道路上的相邻车道中的车辆）的安全横向和纵向距离。

上述车辆400可以为各种类型的行驶工具，例如，轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、娱乐车、火车等等，本公开实施例不做特别的限定。

本领域技术人员在考虑说明书及实践本公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种障碍物检测方法，其特征在于，包括：

获取本车在行驶过程中采集的路采图像；

2.根据权利要求1所述的方法，其特征在于，所述头部网络包括不同类型的头部子网络、且头部子网络成线性连接；

3.根据权利要求2所述的方法，其特征在于，所述第一样本图像包括2D子样本图像、深度子样本图像和3D子样本图像；

4.根据权利要求3所述的方法，其特征在于，所述第一样本图像是通过如下方式得到的：

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述第二样本图像的确定，包括：

获取本车的图像采集装置采集的路采图像；

对所述光影路采图像进行标注，生成所述第二样本图像。

6.根据权利要求1-4中任一项所述的方法，其特征在于，所述根据第二样本图像对修改损失函数后的障碍物检测模型的主干网络进行模型微调，包括：

7.一种障碍物检测装置，其特征在于，包括：

8.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取本车在行驶过程中采集的路采图像；

9.一种计算机可读存储介质，其上存储有计算机程序指令，其特征在于，该程序指令被处理器执行时实现权利要求1-6中任一项所述方法的步骤。

10.一种芯片，其特征在于，包括处理器和接口；所述处理器用于读取指令以执行权利要求1-6中任一项所述的方法。

11.一种车辆，其特征在于，包括权利要求8所述的电子设备，或者，权利要求10所述的芯片。