CN112883871B

CN112883871B - 一种模型训练以及确定无人车运动策略方法及装置

Info

Publication number: CN112883871B
Application number: CN202110191748.4A
Authority: CN
Inventors: 刘朋浩
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-02-19
Filing date: 2021-02-19
Publication date: 2022-06-10
Anticipated expiration: 2041-02-19
Also published as: CN112883871A

Abstract

本说明书公开了一种模型训练以及确定无人车运动策略方法及装置，通过在历史上采集到的各连续帧图像中确定若干组连续两帧图像作为各训练样本，并针对每个训练样本，确定第二图像的包围框作为标注，然后通过预处理模型，确定预处理结果，进而通过检测模型，确定该训练样本的第一图像的预测结果以及后处理结果，通过分类层确定检测结果，并以检测结果和标注之间差异最小为优化目标，对该待训练的检测模型的进行训练。本方法通过对各训练样本中的第一图像的各障碍物实例进行预测，进而更新第二图像的各障碍物实例的至少部分待选包围框，最后通过分类层确定第二图像的各障碍物实例的包围框，作为检测结果，不需要人工调整参数，准确率较高。

Description

一种模型训练以及确定无人车运动策略方法及装置

技术领域

本说明书涉及无人驾驶技术领域，尤其涉及一种模型训练以及确定无人车运动策略方法及装置。

背景技术

目前，为了保证无人车的行驶安全，在无人车的行驶过程中，通常会检测无人车周围的障碍物实例，并根据该无人车周围的障碍物实例的位置，确定无人车的运动策略以避障。

一般的，无人车上可设置有采集图像的传感器，在需要确定运动策略时，首先可将最近一段时间各时刻采集的图像进行图像检测，并将各时刻的检测结果进行关联，以实现对各图像中的障碍物实例的检测与追踪，基于各时刻的检测结果以及各图像中相同障碍物实例的关联关系，后续可确定该无人车的运动策略。

现有技术中，常见的对各图像中的障碍物实例进行检测与追踪的方法是基于卡尔曼滤波算法和匈牙利匹配算法构建的模型实现的。

具体的，首先将当前图像进行图像检测，得到当前图像的检测结果，之后将该检测结果输入到基于卡尔曼滤波算法和匈牙利匹配算法构建的模型中，预测当前图像的下一帧图像的检测结果。并将当前图像的下一帧图像进行图像检测得到的下一帧图像的检测结果，与根据当前图像预测出的检测结果进行相似度匹配，确定各图像中相同障碍物实例的关联关系，后续则可基于该关联关系与检测结果确定无人车的运动策略。

但是，现有技术在实现对障碍物实例的检测与追踪的过程中，对于卡尔曼滤波算法的参数的调整，以及在相似度匹配时特征的选择，需要根据人为经验进行设置，导致准确率较低。

发明内容

本说明书提供一种模型训练以及确定无人车运动策略方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种检测模型的训练方法，包括：

根据历史上采集到的各连续帧图像，确定若干组连续两帧图像，将每组图像，作为训练样本，所述训练样本中的前一帧作为第一图像，后一帧作为第二图像；

针对每个训练样本，将该训练样本包含的第二图像中，预先标注的各障碍物实例的包围框，作为该训练样本的标注；

将该训练样本输入训练完成的预处理模型，通过所述预处理模型，确定所述第一图像中各障碍物实例的包围框，以及确定所述第二图像中的各障碍物实例的各待选包围框，作为预处理结果；

将该训练样本的预处理结果，输入待训练的检测模型，确定所述第一图像中各障碍物实例的包围框的预测结果，并根据所述预测结果，更新所述第二图像中的各障碍物实例的至少部分待选包围框，作为后处理结果；

将该训练样本的后处理结果，输入所述预处理模型的分类层，得到该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果；

以该训练样本的检测结果以及该训练样本的标注之间差异最小为优化目标，调整所述待训练的检测模型的模型参数，所述预处理模型以及所述检测模型用于在确定无人车运动策略时，确定所述无人车环境图像中的各障碍物实例。

可选地，所述预处理模型包括卷积层和分类层；

将该训练样本输入训练完成的预处理模型，通过所述预处理模型，确定所述第一图像中各障碍物实例的包围框，以及确定所述第二图像中的各障碍物实例的各待选包围框，作为预处理结果，具体包括：

将该训练样本包含的所述第一图像与所述第二图像作为输入，输入到所述预处理模型的卷积层，确定所述第一图像与第二图像中各障碍物实例的各待选包围框；

将所述第一图像的各障碍物实例的各待选包围框输入到所述预处理模型的分类层，确定所述第一图像中各障碍物实例的包围框，其中，所述分类层用于针对每个障碍物实例，从该障碍物实例的各待选包围框中确定该障碍物实例的包围框；

将所述第一图像中各障碍物实例的包围框与所述第二图像中各障碍物实例的各待选包围框，作为预处理结果。

可选地，所述检测模型包括预测层和匹配层；

将该训练样本的预处理结果，输入待训练的检测模型，确定所述第一图像中各障碍物实例的包围框的预测结果，并根据所述预测结果，更新所述第二图像中的各障碍物实例的至少部分待选包围框，具体包括：

将所述预处理结果包含的所述第一图像中各障碍物实例的包围框输入待训练的检测模型的预测层，得到所述第一图像中各障碍物实例的包围框的预测结果，所述预测结果表征预测得到的各障碍物实例的在采集所述第一图像的下一时刻的位置；

将各障碍物实例的包围框的预测结果与所述预处理结果包含的第二图像中的各障碍物实例的各待选包围框作为输入，输入到所述检测模块的匹配层，得到匹配结果；

根据所述匹配结果以及所述预测结果包含的包围框，更新所述第二图像中的各障碍物实例的至少部分待选包围框。

可选地，根据所述匹配结果以及所述预测结果包含的包围框，更新所述第二图像中的各障碍物实例的至少部分待选包围框，具体包括：

根据所述匹配结果以及所述预测结果包含的包围框，确定所述预测结果包含的包围框和所述第二图像的包围框的匹配部分和不匹配部分；

根据所述预测结果包含的包围框的匹配部分，对所述第二图像的包围框的匹配部分进行替换；

将所述预测结果包含的包围框的不匹配部分，加入所述第二图像的包围框。

可选地，将该训练样本的后处理结果，输入所述预处理模型的分类层，得到该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果，具体包括：

将该训练样本的后处理结果，输入所述预处理模型的分类层，针对每个障碍物实例，从该障碍物实例的各待选包围框中，确定该障碍物实例的包围框；

将该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果。

可选地，所述方法还包括：

获取历史多次行驶过程中采集到的若干图像，作为各训练样本，将各训练样本中预先标注的障碍物实例的包围框，作为训练标签；

将各训练样本输入待训练的预处理模型的卷积层，得到各训练样本中的各障碍物实例的各待选包围框；

将各训练样本中的各障碍物实例的各待选包围框输入所述预处理模型的分类层，得到各训练样本中的各障碍物实例的包围框，作为各训练样本的预处理结果；

以最小化各训练样本的预处理结果与样本标签之间的偏差为优化目标，对所述预处理模型进行训练。

本说明书还提供一种确定无人车运动策略的方法，包括：

获取无人车当前时刻采集的图像，作为当前图像；

将所述当前图像输入到预先训练好的预处理模型，以得到所述当前图像中的各障碍物实例的各待选包围框，作为所述当前图像预处理结果；

将所述当前图像预处理结果与上一时刻的图像的检测结果作为输入，输入预先训练好的检测模型，得到所述当前图像的后处理结果；

将所述当前图像的后处理结果输入所述预处理模型的分类层，得到所述当前图像的检测结果；

基于所述当前图像的检测结果，确定无人车下一时刻的运动策略。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述模型训练以及确定无人车运动策略方法。

本说明书提供了一种无人车，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述模型训练以及确定无人车运动策略方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的检测模型的训练方法中，通过在历史上采集到的各连续帧图像中确定若干组连续两帧图像作为各训练样本，并针对每个训练样本，将该训练样本中的第二图像预先标注的包围框作为标注，然后将该训练样本输入预处理模型，确定预处理结果，进而将该预处理结果输入到待训练的检测模型，确定该训练样本的第一图像的预测结果以及该训练样本的后处理结果，对后处理结果进行分类，确定检测结果，最后以该训练样本的检测结果以及标注之间差异最小为优化目标，对该待训练的检测模型的模型参数进行调整。

从上述方法中可以看出，本方法通过对各训练样本中的预处理结果中的第一图像的各障碍物实例进行预测，并根据该预测结果更新第二图像的各障碍物实例的至少部分待选包围框，最后通过分类层从更新后的第二图像的包围框中确定第二图像的各障碍物实例的包围框，作为检测结果，并根据检测结果以及标注对检测模型进行训练，不需要人工调整参数，准确率较高。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书中提供的检测模型的训练的方法的流程示意图；

图2为本说明书提供的确定样本标注的示意图；

图3为本说明书提供的预处理模型与检测模型组合的结构示意图；

图4为本说明书提供的预处理模型的卷积层的示意图；

图5为本说明书提供的预处理模型的分类层的示意图；

图6为本说明书提供的检测模型的结构示意图；

图7为本说明书提供的确定无人车运动策略的方法的流程示意图；

图8为本说明书提供的检测模型的训练装置；

图9为本说明书提供的确定无人车运动策略的装置；

图10为本说明书提供的对应于图1或7的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书中提供的检测模型的训练的方法的流程示意图，具体包括以下步骤：

S100：根据历史上采集到的各连续帧图像，确定若干组连续两帧图像，将每组图像，作为训练样本，所述训练样本中的前一帧作为第一图像，后一帧作为第二图像。

一般地，在无人驾驶技术领域，可通过检测模型对无人车周围的环境图像进行检测，确定障碍物实例，以根据确定出的障碍物实例，确定无人车的运动策略。通常，检测模型是由用于训练模型的服务器，基于训练样本预先训练得到的。而本说明书提供了一种训练检测模型的方法，同样的，可由用于训练模型的服务器执行该训练检测模型的过程。

训练模型可以分为样本生成阶段以及训练模型阶段，在样本生成阶段可根据模型需要以及训练需要，确定用于训练模型的样本。在本说明书中，该服务器首先可确定用于训练检测模型的训练样本，并且由于通常检测模型是基于无人车采集的环境图像，检测障碍物的，因此该服务器可先确定若干历史上采集到的各连续帧图像，以确定训练样本。

具体的，在训练检测模型时，若训练样本仅为单帧图像，则很可能因为各训练样本中的信息量过少，导致训练完成的检测模型在实际使用时得到的结果不够准确，而训练样本若为连续两帧图像，则不仅可获取的信息量变多，还可将前一帧图像的包围框的预测结果，用于辅助后一帧图像包围框的确定，因此，该服务器可基于连续两帧图像训练该检测模型。

基于此，该服务器可获取无人车历史上采集到的各连续帧图像，该服务器需要通过这些连续帧图像中的若干连续两帧图像对预处理模型和检测模型进行训练，并在该预处理模型和该检测模型训练完成后，在确定无人车运动策略时，通过该预处理模型与检测模型确定该无人车环境图像中的各障碍物实例。

具体的，该服务器需获取历史上无人车采集到的各连续帧图像，并根据获取到的各连续帧图像，确定若干组连续两帧图像，作为各训练样本。针对每个训练样本，对该样本中包括的两帧图像需要进行不同处理，因此，为了方便说明，将该训练样本中的前一帧作为第一图像，后一帧作为第二图像。

S102：针对每个训练样本，将该训练样本包含的第二图像中，预先标注的各障碍物实例的包围框，作为该训练样本的标注。

在本说明书提供的一个或多个实施例中，该服务器在确定出训练样本后，还可针对每个训练样本，将该训练样本包含的第二图像中，预先标注的各障碍物实例的包围框，作为该训练样本的标注。

具体的，针对每个训练样本，可预先确定该训练样本包含的第二图像中的各障碍物实例的包围框，并将该第二图像中的障碍物实例的包围框作为该训练样本的标注，如图2所示。

图2为本说明书提供的确定样本标注的示意图，图中左侧为训练样本，包括第一图像与第二图像，其中，障碍物实例有三个：车、人、球。于是，该服务器可将第二图像中预先标注的各障碍物实例的包围框，作为该训练样本的标注。

另外，确定各障碍物实例的包围框可采用人工进行标注的方法，也可采用其他模型对各障碍物实例的包围框进行标注，具体的确定各障碍物实例的包围框的方式可根据需要进行设置，本说明书对此不做限制。

S104：将该训练样本输入训练完成的预处理模型，通过所述预处理模型，确定所述第一图像中各障碍物实例的包围框，以及确定所述第二图像中的各障碍物实例的各待选包围框，作为预处理结果。

在本说明书提供的一个或多个实施例中，在训练检测模型时，首先需将各训练样本进行预处理，并基于各训练样本的预处理结果，对该检测模型进行训练。于是，针对每个训练样本，该服务器可将该训练样本输入训练完成的预处理模型，通过该预处理模型，确定该训练样本包含的第一图像中各障碍物实例的包围框，以及确定该训练样本中包含的第二图像中的各障碍物实例的各待选包围框，作为该训练样本的预处理结果。

具体的，在本说明书中，该预处理模型与检测模型组合的结构可如图3所示，图3为本说明书提供的预处理模型与检测模型组合的结构示意图，可见，虚线部分表示不同的模型，图中包括有预处理模型和检测模型，该预处理模型包括卷积层和分类层，检测模型包括预测层和匹配层，该服务器可先将训练样本输入该预处理模型的卷积层，得到第一图像和第二图像的各障碍物实例的各待选包围框，再将第一图像的各障碍物实例的各待选包围框的输入预处理模型的分类层，得到第一图像的各障碍物实例的包围框，接着，通过检测模型的预测层，确定第一图像的各障碍物实例的包围框的预测结果，并将该第一图像的各障碍物实例的包围框的预测结果，与确定出的第二图像的各障碍物实例的各待选包围框输入匹配层，确定该训练样本的后处理结果，并将该训练样本的后处理结果输入预处理模型的分类层，确定该训练样本的检测结果。后续基于该检测结果对该模型进行训练。

进一步地，预处理模型包括卷积层和分类层，该卷积层用于确定图像中各障碍物实例的各待选包围框，该分类层用于针对每个障碍物实例，从该障碍物实例的各待选包围框中，确定该障碍物实例的包围框。

首先，针对每个训练样本，该服务器可将该训练样本包含的第一图像和第二图像作为输入，输入到该预处理模型的卷积层，确定该第一图像与第二图像中的各障碍物实例的各待选包围框，如图4所示。

图4为本说明书提供的预处理模型的卷积层的示意图，包括输入图像、卷积层、输出结果三部分、输入图像中的障碍物实例为车和人，右侧图像的各虚线框为车与人的各待选包围框，则输出结果为针对各障碍物实例的各待选包围框。

其次，该服务器可将该第一图像中的各障碍物实例的各待选包围框输入该预处理模型的分类层，得到该第一图像中的各障碍物实例的包围框。其中，该分类层输出的包围框，为从该障碍物对应的各待选包围框中，确定出的与该障碍物匹配的待选包围框，图5所示。

图5为本说明书提供的预处理模型的分类层的示意图，与图4类似，虚线框表示障碍物实例的各待选包围框，实现部分为各障碍物实例的包围框，可知，输入部分为图像中的各障碍物实例的各待选包围框，输出结果为图像中各障碍物实例的包围框。

最后，将确定出的第一图像中的各障碍物实例的包围框和第二图像中的各障碍物实例的各待选包围框，作为预处理结果，该服务器即可根据各训练样本的预处理结果对检测模型进行训练。

S106：将该训练样本的预处理结果，输入待训练的检测模型，确定所述第一图像中各障碍物实例的包围框的预测结果，并根据所述预测结果，更新所述第二图像中的各障碍物实例的至少部分待选包围框，作为后处理结果。

在本说明书提供的一个或多个实施例中，该服务器在训练检测模型时，可针对每个训练样本，将该训练样本的预处理结果，输入待训练的检测模型，确定该第一图像中各障碍物实例的包围框的预测结果，并根据该预测结果，对第二图像中的各障碍物实例的至少部分待选包围框进行更新，以及，将更新后的结果，作为训练样本的后处理结果。

具体的，该检测模型的结构可如图6所示，图6为本说明书提供的检测模型的结构示意图，将第一图像的各障碍物实例的包围框输入该检测模型可得到该第一图像的各障碍物实例的包围框的预测结果，将该第一图像的各包围框实例的包围框的预测结果与该第二图像的各障碍物实例的各待选包围框输入该检测模型的匹配层，可确定该训练样本的后处理结果。

首先，该服务器将该预处理结果中包含的第一图像中的各障碍物实例的包围框作为输入，输入该待训练的检测模型的预测层，得到该第一图像的各障碍物实例的包围框的预测结果，其中，预测结果表征预测得到的各障碍物实例的在采集该第一图像的下一时刻的位置，且检测模型的预测层输出的预测结果中，原始图像不变，仅变化各障碍物实例的包围框的位置。

其次，该服务器可将该第一图像中的各障碍物实例的包围框的预测结果，与预处理结果中的第二图像的各障碍物实例的各待选包围框，输入该检测模型的匹配层，得到该第一图像中的各障碍物实例的包围框的预测结果与第二图像的各障碍物实例的各待选包围框的匹配结果。

最后，根据该匹配结果、该第一图像的预测结果包含的包围框，以及第二图像的包围框，确定该第一图像的预测结果与第二图像中的包围框的匹配部分和不匹配部分。再根据预测结果中包含的包围框的匹配部分，对第二图像的包围框的匹配部分进行替换。并将该预测结果包含的包围框的不匹配部分，加入该第二图像的包围框中，实现对第二图像中的各障碍物实例的至少部分包围框的更新。

需要说明的是，后处理结果，即，更新后的第二图像中的各包围框，至少包括第一图像的各障碍物实例的包围框的预测结果中的包围框，于是，本方法中的训练样本的检测结果至少包括了前一帧图像的特征，信息量多且更准确。

S108：将该训练样本的后处理结果，输入所述预处理模型的分类层，得到该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果。

在本说明书提供的一个或多个实施例中，确定出后处理结果后，该服务器还需将该训练样本的后处理结果，输入预处理模型的分类层，以得到该训练样本包含的第二图像中的各障碍物实例的包围框，并将其作为检测结果。

具体的，针对每个训练样本，该服务器可将该训练样本的后处理结果，即，该训练样本中的第二图像更新后的各障碍物实例的各待选包围框作为输入，输入预处理模型的分类层，从更新后的第二图像的各障碍物实例的各待选包围框中，确定该第二图像的各障碍物实例的包围框。与对训练样本进行预处理时，从第一图像中的各障碍物实例的各待选包围框中确定出第一图像的各障碍物实例的包围框类似，经分类层后，该第二图像中的每个障碍物实例，有且仅有一个包围框。

S110：以该训练样本的检测结果以及该训练样本的标注之间差异最小为优化目标，调整所述待训练的检测模型的模型参数，所述预处理模型以及所述检测模型用于在确定无人车运动策略时，确定所述无人车环境图像中的各障碍物实例。

在本说明书提供的一个或多个实施例中，针对每个训练样本，确定出该训练样本的检测结果后，可根据该训练样本的标注和该检测结果对该模型进行训练。

具体的，在训练该检测模型时，针对每个训练样本，该服务器可基于步骤S100～步骤S108确定出的该训练样本的检测结果，以该训练样本的检测结果以及该训练样本之间的标注之间差异为优化目标，调整该待训练的检测模型的训练参数，以完成对该检测模型的训练。

在本说明书提供的一个或多个实施例中，在训练好该检测模型后，可将该检测模型与预处理模型进行组合，并将该预处理模型与检测模型应用于确定无人车运动策略时，具体用于确定无人车环境图像中的各障碍物实例的场景中，以使无人车能够基于确定出的各障碍物实例当前位置，在确定下一时刻该无人车的运动策略时，采取相应的避障策略，以使下一时刻无人车正常行驶而不发生交通事故。具体的根据障碍物实例的当前位置确定无人车策略的方法已经是现有较为成熟的技术，本说明书对此不再赘述。

基于图1的检测模型的训练方法，通过在历史上采集到的各连续帧图像中确定若干组连续两帧图像作为各训练样本，并针对每个训练样本，将该训练样本中的第二图像预先标注的包围框作为标注，然后将该训练样本输入预处理模型，确定预处理结果，进而将该预处理结果输入到待训练的检测模型，确定该训练样本的第一图像的预测结果以及该训练样本的后处理结果，对后处理结果进行分类，确定检测结果，最后以该训练样本的检测结果以及标注之间差异最小为优化目标，对该待训练的检测模型的模型参数进行调整。本方法通过对各训练样本中的预处理结果中的第一图像的各障碍物实例进行预测，并根据该预测结果更新第二图像的各障碍物实例的至少部分待选包围框，最后通过分类层从更新后的第二图像的包围框中确定第二图像的各障碍物实例的包围框，作为检测结果，并根据检测结果以及标注对检测模型进行训练，不需要人工调整参数，准确率较高。

另外，在本说明书中，该预处理模型包括卷积层和分类层，在训练预处理模型时，训练模型的服务器可获取历史多次形式过程中采集到的若干图像，作为各训练样本，并对各训练样本中的各障碍物实例进行预先标注，将各训练样本中的各障碍物实例的包围框作为训练标签。然后，该服务器可将各训练样本输入待训练的预处理模型的卷积层，得到各训练样本中的各障碍物实例的各待选包围框，接着将各训练样本的各障碍物实例的各待选包围框输入该预处理模型，得到各训练样本的预处理结果，以最小化各训练样本的预处理结果与样本标签之间的偏差为优化目标，对预处理模型进行训练。

需要说明的是，该训练该预处理模型的服务器与训练检测模型的服务器可以相同，也可以不同，具体可以根据需要进行设置，且训练检测模型时，各训练样本的预处理结果可以为在训练模型的服务器上运行预处理模型得到的，也可以是该训练模型的服务器将各训练样本发送至其他服务器，其他服务器根据各训练样本，确定各训练样本的预处理结果，并将预处理结果返回至训练模型的服务器，之后由训练模型的服务器基于各训练样本的预处理结果对该检测模型进行训练。

基于图1所示的检测模型的训练方法，本说明书还提供一种确定无人车运动策略的方法，如图7所示。

图7为本说明书提供的确定无人车运动策略的方法的流程示意图，包括：

S200：获取无人车当前时刻采集的图像，作为当前图像。

在本说明书提供的一个或多个实施例中，能够基于无人车当前时刻的环境图像，确定该无人车下一时刻的运动策略，于是，可获取该无人车当前时刻采集的图像，作为当前图像。

需要说明的是，本说明书中的确定无人车运动策略的方法，可由配置有训练好的预处理模型和检测模型的无人车执行，也可由无人车将采集到的图像等发送至服务器，由服务器基于该采集到的图像等确定出无人车的运动策略后，将运动策略发送至无人车。为了方便描述，后续以无人车执行该确定无人车运动策略的方法为例进行说明。

另外，本说明书中提到的无人车可以是指无人车、机器人、自动配送设备等能够实现自动驾驶的设备。基于此，应用本说明书提供的确定无人车运动策略的方法的无人车可以用于执行配送领域的配送任务，如，使用无人驾驶设备进行快递、物流、外卖等配送的业务场景。

S202：将所述当前图像输入到预先训练好的预处理模型，以得到所述当前图像中的各障碍物实例的各待选包围框，作为所述当前图像预处理结果。

在本说明书提供的一个或多个实施例中，该无人车可将当前图像输入到预先训练好的预处理模型，以得到当前图像的各障碍物实例的各待选包围框，作为当前图像的预处理结果。

具体的，在本说明书中，该预处理模型的卷积层可分为第一卷积层和第二卷积层，该无人车可首先将接收到的无人车采集的当前时刻的图像输入该预处理模型的第一卷积层，分别得到图像维度和深度不同的特征图，确定当前时刻的图像特征向量，并根据当前时刻的图像特征向量，确定当前时刻的图像特征金字塔，将当前时刻的图像特征金字塔输入第二卷积层，可得到当前图像中的各障碍物实例的各待选包围框。

S204：将所述当前图像的预处理结果与上一时刻的图像的检测结果作为输入，输入预先训练好的检测模型，得到所述当前图像的后处理结果。

在本说明书提供的一个或多个实施例中，在确定了当前图像的预处理结果后，该无人车还可获取上一时刻的图像的检测结果，冰晶当前时刻的预处理结果与上一时刻的图像的检测结果作为输入，输入到检测模型中，得到当前图像的后处理结果。

另外，若某一障碍物实例的包围框在连续几帧图像之间都没有匹配的包围框，可认为该障碍物实例丢失，于是，该障碍物实例的包围框可被删去，具体的确定该障碍物实例是否丢失的方法可根据需要进行设置，本说明书对此不作限制。

S206：将所述当前图像的后处理结果输入所述预处理模型的分类层，得到所述当前图像的检测结果。

在本说明书提供的一个或多个实施例中，可从当前图像的后处理结果中，确定当前图像的检测结果，于是，该无人车可将当前图像的后处理结果输入到预处理模型的分类层，得到当前图像的检测结果。

具体的分类层可采用非极大值抑制(Non-Maximum Suppression，NMS)算法进行构造。

S208：基于所述当前图像的检测结果，确定无人车下一时刻的运动策略。

在本说明书提供的一个或多个实施例中，在确定出当前时刻各障碍物实例的位置后，可基于确定出的各障碍物实例的当前位置，预测下一时刻各障碍物实例的位置，并在确定下一时刻无人车的运动策略时，采取相应的避障策略，以使下一时刻人无人车正常行驶而不发生意外事故。具体的根据障碍物实例的当前位置确定无人车策略的方法已经是现有较为成熟的技术，本说明书对此不再赘述。

以上为本说明书的一个或多个实施例提供的检测模型的训练方法和确定无人车运动策略的方法，基于同样的思路，本说明书还提供了相应的检测模型的训练装置，如图8或9所示。

图8为本说明书提供的检测模型的训练装置，包括：

样本确定模块300，用于根据历史上采集到的各连续帧图像，确定若干组连续两帧图像，将每组图像，作为训练样本，所述训练样本中的前一帧作为第一图像，后一帧作为第二图像。

标注确定模块302，用于针对每个训练样本，将该训练样本包含的第二图像中，预先标注的障碍物实例的包围框，作为该训练样本的标注。

预处理模块304，用于将该训练样本输入训练完成的预处理模型，通过所述预处理模型，确定所述第一图像中各障碍物实例的包围框，以及确定所述第二图像中的各障碍物实例的各待选包围框，作为预处理结果。

后处理模块306，用于将该训练样本的预处理结果，输入待训练的检测模型，确定所述第一图像中各障碍物实例的包围框的预测结果，并根据所述预测结果，更新所述第二图像中的各障碍物实例的至少部分待选包围框，作为后处理结果。

分类模块308，用于将该训练样本的后处理结果，输入所述预处理模型的分类层，得到该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果。

训练模块310，用于以该训练样本的检测结果以及该训练样本的标注之间差异最小为优化目标，调整所述待训练的检测模型的模型参数，所述预处理模型以及所述检测模型用于在确定无人车运动策略时，确定所述无人车环境图像中的各障碍物实例。

可选地，所述预处理模型包括卷积层和分类层，所述预处理模块304，用于将该训练样本包含的所述第一图像与所述第二图像作为输入，输入到所述预处理模型的卷积层，确定所述第一图像与第二图像中各障碍物实例的各待选包围框，将所述第一图像的各障碍物实例的各待选包围框输入到所述预处理模型的分类层，确定所述第一图像中各障碍物实例的包围框，其中，所述分类层用于针对每个障碍物实例，从该障碍物实例的各待选包围框中确定该障碍物实例的包围框，将所述第一图像中各障碍物实例的包围框与所述第二图像中各障碍物实例的各待选包围框，作为预处理结果。

可选地，后处理模块306，用于将所述预处理结果包含的所述第一图像中各障碍物实例的包围框输入待训练的检测模型的预测层，得到所述第一图像中各障碍物实例的包围框的预测结果，所述预测结果表征预测得到的各障碍物实例的在采集所述第一图像的下一时刻的位置，将各障碍物实例的包围框的预测结果与所述预处理结果包含的第二图像中的各障碍物实例的各待选包围框作为输入，输入到所述检测模块的匹配层，得到匹配结果，根据所述匹配结果以及所述预测结果包含的包围框，更新所述第二图像中的各障碍物实例的至少部分待选包围框。

可选地，所述后处理模块306，用于根据所述匹配结果以及所述预测结果包含的包围框，确定所述预测结果包含的包围框和所述第二图像的包围框的匹配部分和不匹配部分，根据所述预测结果包含的包围框的匹配部分，对所述第二图像的包围框的匹配部分进行替换吗，将所述预测结果包含的包围框的不匹配部分，加入所述第二图像的包围框。

可选地，所述分类模块308，用于将该训练样本的后处理结果，输入所述预处理模型的分类层，针对每个障碍物实例，从该障碍物实例的各待选包围框中，确定该障碍物实例的包围框，将该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果。

可选地，所述训练模块310，还用于获取历史多次行驶过程中采集到的若干图像，作为各训练样本，将各训练样本中预先标注的障碍物实例的包围框，作为训练标签，将各训练样本输入待训练的预处理模型的卷积层，得到各训练样本中的各障碍物实例的各待选包围框，将各训练样本中的各障碍物实例的各待选包围框输入所述预处理模型的分类层，得到各训练样本中的各障碍物实例的包围框，作为各训练样本的预处理结果，以最小化各训练样本的预处理结果与样本标签之间的偏差为优化目标，对所述预处理模型进行训练。

图9为本说明书提供的确定无人车运动策略的装置，所述装置包括：

获取模块400，用于获取无人车当前时刻采集的图像，作为当前图像。

预处理模块402，用于将所述当前图像输入到预先训练好的预处理模型，以得到所述当前图像中的各障碍物实例的各待选包围框，作为所述当前图像预处理结果。

后处理模块404，用于将所述当前图像预处理结果与上一时刻的图像的检测结果作为输入，输入预先训练好的检测模型，得到所述当前图像的后处理结果。

检测模块406，用于将所述当前图像的后处理结果输入所述预处理模型的分类层，得到所述当前图像的检测结果。

确定模块408，用于基于所述当前图像的检测结果，确定无人车下一时刻的运动策略。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的检测模型的训练方法或图7提供的确定无人车运动策略的方法。

本说明书还提供了图10所示的电子设备的示意结构图。如图10所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的检测模型的方法或图7提供的确定无人车运动策略的方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种检测模型的训练方法，其特征在于，所述方法包括：

将该训练样本输入训练完成的预处理模型，通过所述预处理模型的卷积层和分类层，确定所述第一图像中各障碍物实例的包围框，以及通过所述预处理模型的卷积层，确定所述第二图像中的各障碍物实例的各待选包围框，并将所述第一图像中各障碍物实例的包围框和所述第二图像中的各障碍物实例的各待选包围框作为预处理结果；

2.如权利要求1所述的方法，其特征在于，所述预处理模型包括卷积层和分类层；

将该训练样本输入训练完成的预处理模型，通过所述预处理模型的卷积层和分类层，确定所述第一图像中各障碍物实例的包围框，以及通过所述预处理模型的卷积层，确定所述第二图像中的各障碍物实例的各待选包围框，并将所述第一图像中各障碍物实例的包围框和所述第二图像中的各障碍物实例的各待选包围框作为预处理结果，具体包括：

3.如权利要求1所述的方法，其特征在于，所述检测模型包括预测层和匹配层；

将各障碍物实例的包围框的预测结果与所述预处理结果包含的第二图像中的各障碍物实例的各待选包围框作为输入，输入到所述检测模型的匹配层，得到匹配结果；

4.如权利要求3所述的方法，其特征在于，根据所述匹配结果以及所述预测结果包含的包围框，更新所述第二图像中的各障碍物实例的至少部分待选包围框，具体包括：

5.如权利要求2所述的方法，其特征在于，将该训练样本的后处理结果，输入所述预处理模型的分类层，得到该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果，具体包括：

6.如权利要求1所述的方法，其特征在于，所述方法还包括：

7.一种确定无人车运动策略的方法，其特征在于，无人车行驶过程中持续采集图像，所述方法包括：

获取无人车当前时刻采集的图像，作为当前图像；

8.一种检测模型的训练装置，其特征在于，所述装置包括：

样本确定模块，用于根据历史上采集到的各连续帧图像，确定若干组连续两帧图像，将每组图像，作为训练样本，所述训练样本中的前一帧作为第一图像，后一帧作为第二图像；

标注确定模块，用于针对每个训练样本，将该训练样本包含的第二图像中，预先标注的障碍物实例的包围框，作为该训练样本的标注；

预处理模块，用于将该训练样本输入训练完成的预处理模型，通过所述预处理模型的卷积层和分类层，确定所述第一图像中各障碍物实例的包围框，以及通过所述预处理模型的卷积层，确定所述第二图像中的各障碍物实例的各待选包围框，并将所述第一图像中各障碍物实例的包围框和所述第二图像中的各障碍物实例的各待选包围框作为预处理结果；

后处理模块，用于将该训练样本的预处理结果，输入待训练的检测模型，确定所述第一图像中各障碍物实例的包围框的预测结果，并根据所述预测结果，更新所述第二图像中的各障碍物实例的至少部分待选包围框，作为后处理结果；

分类模块，用于将该训练样本的后处理结果，输入所述预处理模型的分类层，得到该训练样本包含的第二图像中各障碍物实例的包围框，作为检测结果；

训练模块，用于以该训练样本的检测结果以及该训练样本的标注之间差异最小为优化目标，调整所述待训练的检测模型的模型参数，所述预处理模型以及所述检测模型用于在确定无人车运动策略时，确定所述无人车环境图像中的各障碍物实例。

9.一种检测模型的训练装置，其特征在于，所述装置在无人车行驶过程中持续采集图像，所述装置包括：

获取模块，用于获取无人车当前时刻采集的图像，作为当前图像；

预处理模块，用于将所述当前图像输入到预先训练好的预处理模型，以得到所述当前图像中的各障碍物实例的各待选包围框，作为所述当前图像预处理结果；

后处理模块，用于将所述当前图像预处理结果与上一时刻的图像的检测结果作为输入，输入预先训练好的检测模型，得到所述当前图像的后处理结果；

检测模块，用于将所述当前图像的后处理结果输入所述预处理模型的分类层，得到所述当前图像的检测结果；

确定模块，用于基于所述当前图像的检测结果，确定无人车下一时刻的运动策略。

10.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～6任一项或权利要求7所述的方法。

11.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1～6任一项或权利要求7所述的方法。