WO2023010827A1

WO2023010827A1 - 基于迁移场景的轨迹预测模型的训练方法及装置

Info

Publication number: WO2023010827A1
Application number: PCT/CN2022/076624
Authority: WO
Inventors: 樊明宇; 黄佳雯; 任冬淳; 夏华夏; 徐一
Original assignee: 北京三快在线科技有限公司
Priority date: 2021-08-02
Filing date: 2022-02-17
Publication date: 2023-02-09
Also published as: CN113325855A; EP4383037A1; CN113325855B

Abstract

一种基于迁移场景的轨迹预测模型的训练方法，包括：(101)获取第一轨迹预测模型以及多个候选训练样本，第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型；(102)针对任一候选训练样本，根据候选训练样本对应的轨迹特征，和/或第一轨迹预测模型对候选训练样本的预测结果，确定候选训练样本对应的参考值；(103)根据多个候选训练样本对应的参考值，从多个候选训练样本中选取目标训练样本；(104)根据目标训练样本，对第一轨迹预测模型进行训练，得到第二轨迹预测模型，第二轨迹预测模型用于预测迁移场景中各障碍物的行驶轨迹。

Description

基于迁移场景的轨迹预测模型的训练方法及装置

本申请要求于2021年8月2日提交的申请号为202110878026.6、发明名称为“基于迁移场景用于预测障碍物轨迹的模型训练方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及无人驾驶领域，尤其涉及一种基于迁移场景的轨迹预测模型的训练方法及装置。

背景技术

随着信息技术的不断发展，无人驾驶已初步进入人们的生活，而在实际应用中，保证无人驾驶设备的安全行驶，则是通过无人驾驶设备执行各项任务的前提条件。为了无人驾驶设备的安全行驶，需要使无人驾驶设备对周围的障碍物未来的轨迹进行预测，从而无人驾驶设备可以提前制定行驶策略，达到安全行驶的目的。

在相关技术中，可以通过历史上获取到大量障碍物的轨迹数据，并通过这些轨迹数据预先训练出可以预测障碍物轨迹的模型。

发明内容

本申请提供一种基于迁移场景的轨迹预测模型的训练方法及装置，技术方案如下：

提供了一种基于迁移场景的轨迹预测模型的训练方法，包括：

获取第一轨迹预测模型以及多个候选训练样本，所述第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，所述多个候选训练样本为迁移场景下的训练样本，所述迁移场景所在的地理区域与所述预设地理场景不同，所述候选训练样本包括目标设备周围障碍物的历史行驶轨迹；

针对任一所述候选训练样本，根据所述候选训练样本对应的轨迹特征，和/或所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的参考值，所述候选训练样本对应的参考值用于表征所述候选训练样本包括的历史行驶轨迹的行驶特点与所述预设地理场景对应的行驶特点之间的区别程度；

根据所述多个候选训练样本对应的参考值，从所述多个候选训练样本中选取目标训练样本；

根据所述目标训练样本，对所述第一轨迹预测模型进行训练，得到第二轨迹预测模型，所述第二轨迹预测模型用于预测所述迁移场景中各障碍物的行驶轨迹。

提供了一种基于迁移场景的轨迹预测模型的训练装置，包括：

获取模块，用于获取第一轨迹预测模型以及多个候选训练样本，所述第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，所述多个候选训练样本为迁移场景下的训练样本，所述迁移场景所在的地理区域与所述预设地理场景不同，所述候选训练样本包括目标设备周围障碍物的历史行驶轨迹；

确定模块，用于针对任一所述候选训练样本，根据所述候选训练样本对应的轨迹特征，和/或所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的参考值，所述候选训练样本对应的参考值用于表征所述候选训练样本包括的历史行驶轨迹的行驶特点与所述预设地理场景对应的行驶特点之间的区别程度；

选取模块，用于根据所述多个候选训练样本对应的参考值，从所述多个候选训练样本中选取目标训练样本；

训练模块，用于根据所述目标训练样本，对所述第一轨迹预测模型进行训练，得到第二轨迹预测模型，所述第二轨迹预测模型用于预测所述迁移场景中各障碍物的行驶轨迹。

提供了一种无人驾驶设备的控制方法，包括：

获取无人驾驶设备周围障碍物的行驶轨迹，所述无人驾驶设备在迁移场景中行驶；

将所述行驶轨迹输入到预先训练的第二轨迹预测模型，通过所述第二轨迹模型输出障碍物轨迹，所述第二轨迹预测模型通过上述基于迁移场景的轨迹预测模型的训练方法进行训练得到；

根据所述障碍物轨迹，对所述无人驾驶设备进行控制。

提供了一种无人驾驶设备的控制装置，包括：

获取模块，用于获取无人驾驶设备周围障碍物的行驶轨迹，所述无人驾驶设备在迁移场景中行驶；

输入模块，用于将所述行驶轨迹输入到预先训练的第二轨迹预测模型，通过所述第二轨迹模型输出障碍物轨迹，所述第二轨迹预测模型通过上述基于迁移场景的轨迹预测模型的训练方法进行训练得到；

控制模块，用于根据所述预测出的障碍物轨迹，对所述无人驾驶设备进行控制。

提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现下述步骤：

根据所述障碍物轨迹，对所述无人驾驶设备进行控制。

提供了一种无人驾驶设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现下述步骤：

根据所述障碍物轨迹，对所述无人驾驶设备进行控制。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分。

图1为本申请实施例提供的一种基于迁移场景的轨迹预测模型的训练方法的流程示意图；

图2为本申请实施例提供的一种对轨迹预测模型进行迭代训练的示意图；

图3为本申请实施例提供的一种无人驾驶设备的控制方法的流程示意图；

图4为本申请实施例提供的一种基于迁移场景的轨迹预测模型的训练装置的示意图；

图5为本申请实施例提供的无人驾驶设备的控制装置的示意图；

图6为本申请实施例提供的一种对应于图1或图3的无人驾驶设备的示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请的具体实施例及相应的附图对本申请提供的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

相关技术中的方式，往往对无人驾驶设备在不同地理场景行驶时存在不同的效果，例如，可以通过大量的A地的轨迹数据训练出模型，而该模型若应用到无人驾驶设备在B地行驶时的轨迹预测，预测出的轨迹可能会不准确，因此，现有技术这种方式存在一定的不准确性，而若直接通过B地的全部轨迹数据重新训练轨迹预测模型，则所需的数据量较大效率较低。

所以，如何提高在不同地理场景下轨迹预测的准确性以及提高模型训练的效率，则是一个亟待解决的问题。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1为本申请中一种基于迁移场景的轨迹预测模型的训练方法的流程示意图，包括以下步骤：

101、业务平台获取第一轨迹预测模型以及多个候选训练样本，该第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，该多个候选训练样本为迁移场景下的训练样本，该迁移场景所在的地理区域与该预设地理场景不同，该候选训练样本包括目标设备周围障碍物的历史行驶轨迹。

在一些实施例中，业务平台若需要在一种地理场景内运营无人驾驶设备，往往需要通过这种地理场景内的各目标物(如车辆、行人等)的行驶轨迹来训练轨迹预测模型，通过该轨迹预测模型能够基于这种地理场景内的各目标物的行驶轨迹来预测各目标物的障碍物轨迹，该无人驾驶设备能够基于该障碍物轨迹来规避该地理场景内的各目标物。在业务平台之后想要在另一种地理场景内运营无人驾驶设备的情况下，之前训练的轨迹预测模型通常无法直接适应于在另一种地理场景内的轨迹预测，这样一来，就需要训练出在另一种地理场景内进行轨迹预测的轨迹预测模型。在上述说明中，目标物也即是障碍物。

基于此，业务平台能够获取预先通过预设地理场景下的训练样本进行训练的第一轨迹预测模型。在一些实施例中，该第一轨迹预测模型是该业务平台基于预设地理场景下的训练样本训练得到的轨迹预测模型，或者是其他业务平台于预设地理场景下的训练样本训练得到的轨迹预测模型，本申请实施例对此不做限定。业务平台获取迁移场景下的多个训练样本，将该多个训练样本作为多个候选训练样本，其中，迁移场景的地理区域与预设地理场景不同，每个候选训练样本包括目标设备周围障碍物的历史行驶轨迹。

在一些实施例中，迁移场景与预设地理场景的地理区域不同的情况可以有多种，例如，迁移场景和预设地理场景为不同城市，比如迁移场景是指A市，预设地理场景是指B市。再例如，预设地理场景是指城市，迁移场景是指乡村，迁移场景中障碍物(如车辆、行人等)的行驶习惯可以与预设地理场景不同，上述提到的目标设备可以是指无人驾驶设备，比如是指无人驾驶车辆，也可以是指普通车辆等，在一些实施例中，该目标设备也被称为指定设备。

在一些实施例中，业务平台获取到的迁移场景下的多个训练样本，是为上述第一轨迹预测模型进行进一步地训练准备的。由于该第一轨迹预测模型是通过预设地理场景下的训练样本进行训练得到，因此，该第一轨迹预测模型在迁移场景中进行轨迹预测的效果可能较差，所以，需要通过迁移场景下的训练样本对该轨迹预测模型进行进一步地训练。

在本申请实施例中，训练轨迹预测模型的执行主体可以是指业务平台中的服务器、无人驾驶设备自身包含的服务器等，为了便于描述，下面均以业务平台为执行主体，对模型训练中的每个步骤进行说明。

102、针对任一候选训练样本，业务平台根据该候选训练样本对应的轨迹特征，和/或该第一轨迹预测模型对该候选训练样本的预测结果，确定该候选训练样本对应的参考值，该候选训练样本对应的参考值用于表征该候选训练样本包括的历史行驶轨迹的行驶特点与该预设地理场景对应的行驶特点之间的区别程度。

在一些实施例中，业务平台获取到多个候选训练样本后，可以针对每个候选训练样本进行训练，比如，业务平台根据该候选训练样本包括的历史行驶轨迹对应的轨迹特征和/或该轨迹预测模型对该候选训练样本的预测结果，确定出该候选训练样本对应的参考值，该候选训练样本对应的参考值用于表征该候选训练样本包括的历史行驶轨迹的行驶特点与预设地理场景对应的行驶特点之间的区别程度。

其中，业务平台可以仅通过多个候选训练样本对应的轨迹特征，也可以仅通过该轨迹预测模型对各候选训练样本的预测结果，或结合两者来确定参考值，后续能够基于参考值来挑选出目标训练样本。业务平台确定参考值的方式可以有多种，在一些实施例中，针对任一候选训练样本，业务平台根据该第一轨迹预测模型对该候选训练样本的预测结果，确定出该候选训练样本对应的第一参考值，该第一参考值用于表征该轨迹预测模型基于该候选训练样本进行轨迹预测的不确定程度。在仅通过该轨迹预测模型对各候选训练样本的预测结果确定该候选训练样本对应的参考值的情况下，该第一参考值也即是该候选训练样本对应的参考值。

在一些实施例中，对于一个候选训练样本，业务平台确定该第一轨迹预测模型对该候选训练样本的预测结果与该候选训练样本对应的标注结果之间的差异程度。业务平台根据该差异程度，确定出该候选训练样本对应的第一参考值。或者，业务平台也可以确定出该第一轨迹预测模型对该候选训练样本的预测结果的置信度，并将该置信度作为该第一参考值。

在一些实施例中，针对任一候选训练样本，业务平台根据该候选训练样本对应的轨迹特征，确定该候选训练样本对应的第二参考值，第二参考值表征该候选训练样本在用于训练轨迹预测模型的训练样本中的多样性，在一些实施例中，确定第二参考值的目的是希望选取出的用于训练该轨迹预测模型的训练样本能够具有多样性，使得选取出的训练样本包括的行驶轨迹可以是多种的，这样一来，也可以保证从候选训练样本中选取出与预设地理场景的行驶特点不同的训练样本。在仅通过候选训练样本对应的轨迹特征确定该候选训练样本对应的参考值的情况下，该第二参考值也即是该候选训练样本对应的参考值。

在一些实施例中，在确定第二参考值时，业务平台可以针对每个候选训练样本，确定出该候选训练样本包括的历史行驶轨迹对应的轨迹特征与预设地理场景下的训练样本对应的轨迹特征之间的差异程度，并将该差异程度作为该候选训练样本对应的第二参考值。其中，这里提到的轨迹特征可以是指训练样本包括的历史行驶轨迹对应的特征向量。

业务平台通过上述方式确定出上述第一参考值和/或第二参考值后，可以通过各候选训练样本的第一参考值和/或各候选训练样本的第二参考值，确定出各候选训练样本对应的参考值，即，可以综合上述第一参考值以及第二参考值得到参考值，也可以仅通过第一参考值或第二参考值来确定参考值，并且，若综合第一参考值以及第二参考值来计算上述参考值，可以针对第一参考值以及第二参考值设置不同的权重，从而确定出参考值。

103、业务平台根据多个候选训练样本对应的参考值，从所述多个候选训练样本中选取目标训练样本。

通过步骤103，在迁移场景下的全部训练样本中，业务平台可以挑选出对第一轨迹预测模型有价值的训练样本作为目标训练样本，并通过目标训练样本对该轨迹预测模型进行训练，从而提高第一轨迹预测模型的泛化能力，以扩大第一轨迹预测模型的适用范围。因此，可以选取出行驶特点与预设地理场景对应的行驶特点具有一定区别的候选训练样本作为目标训练样本，这些目标训练样本能够表示出迁移场景独特的行驶特点，从而使得该第一轨迹预测模型能够针对迁移场景所具备的目标训练样本进行学习，以提升该轨迹预测模型对迁移场景轨迹预测的准确性。或者说，目标训练样本能够反映迁移场景和预设地理场景之间的差异。

在一些实施例中，在业务平台基于该第一轨迹预测模型对该候选训练样本的预测结果的置信度，确定第一参考值的情况下，基于该第一参考值确定目标训练样本也即是该第一轨迹预测模型在进行轨迹预测时存在一定不确定性的候选训练样本。通过这些目标训练样本来训练轨迹预测模型则可以提升该轨迹预测模型的准确性，并且这些目标训练样本很可能与预设地理场景对应的行驶特点存在区别，对该轨迹预测模型的训练具有价值。

但是，若仅通过第一参考值来选取目标训练样本，则可能选出的目标训练样本中存在异常的训练样本，例如，可能选取出的目标训练样本包括的历史行驶轨迹中存在一定的噪声，即，可能由于采集行驶轨迹时的信号不稳定等问题导致采集到了错误的轨迹，再例如，可能选取出的目标训练样本中的行驶轨迹较为特殊，如，急停、超速等，所以，除了上述第一参考值的方式，业务平台还可以结合其他类型的参考值来选取目标训练样本。比如，业务平台能够通过该候选训练样本的第二参考值来确定目标训练样本，或者通过第一参考值和第二参考值得到的参考值来确定目标训练样本，本申请实施例对此不做限定。

104、业务平台根据该目标训练样本，对该第一轨迹预测模型进行训练，得到第二轨迹预测模型，该第二轨迹预测模型用于预测迁移场景中各障碍物的行驶轨迹。

在一些实施例中，业务平台确定出各候选训练样本对应的参考值后，可以从各候选训练样本中选取目标训练样本，并根据目标训练样本对该第一轨迹预测模型进行训练。也就是说，业务平台可以选取参考值较高的候选训练样本作为选取出的目标训练样本，并基于目标训练样本进行模型训练。在一些实施例中，业务平台可以预先设置选取出的目标训练样本占候选训练样本的比例，并按照该比例进行选取。或者，业务平台可以根据参考值从大到小的顺序对各候选训练样本进行排序，并将排在设定排位前的候选训练样本选取为目标训练样本。

需要说明的是，业务平台在选取目标训练样本时，可以按照参考值一次性选取出所需的全部目标训练样本，也可以在迭代训练中，每次选取出一些目标训练样本，通过这些目标训练样本对第一轨迹预测模型进行一轮训练后，再进行目标训练样本的选取，并通过选取出的目标训练样本进行下一轮训练，直到将第一轨迹预测模型训练到收敛为止。

在一些实施例中，在通过第N-1轮训练中选取出的目标训练样本，对该第一轨迹预测模型进行训练后，业务平台确定该多个候选训练样本中的多个剩余训练样本，该多个剩余训练样本为该多个候选训练样本中除在前N-1轮被选为目标训练样本之外的候选训练样本，N为正整数；业务平台重新确定该多个剩余训练样本对应的参考值；业务平台根据重新确定出的该多个剩余训练样本对应的参考值，从该多个剩余训练样本中选取第N轮训练所需的目标训练样本；业务平台根据该第N轮训练所需的目标训练样本，对该第一轨迹预测模型进行第N轮训练，直到该第一轨迹预测模型符合预设的训练目标，得到该第二轨迹预测模型。

上述训练过程参见图2，图2为本申请提供的一种对轨迹预测模型进行迭代训练的示意图。

从图2中可以看出，业务平台每次可以从候选训练样本中选取出一定数量的目标训练样本，并通过这些目标训练样本对该第一轨迹预测模型进行一个阶段的训练，而后，在下次选取目标训练样本时，重新确定剩余训练样本(即，候选训练样本中还未被选为目标训练样本的候选训练样本)的参考值，再通过剩余训练样本的参考值，来选取出这一次剩余训练样本中的目标训练样本，以此类推，直到将该第一轨迹预测模型训练到能够在迁移场景下进行准确的轨迹预测。

在一些实施例中，在每次迭代训练过程中，业务平台将该目标训练样本输入该第一轨迹预测模型，通过该第一轨迹预测模型基于该目标训练样本进行预测，输出预测障碍物轨迹。业务平台基于该目标训练样本对应的标注障碍物轨迹与该预测障碍物轨迹之间的差异虚拟性，对该第一轨迹预测模型进行训练。其中，对该第一轨迹预测模型进行训练的过程，也即是对该第一轨迹预测模型的模型参数进行更新的过程。

在一些实施例中，若在确定各候选训练样本初始的参考值时，既采用了第一参考值，也采用了第二参考值，则在每次重新确定剩余训练样本对应的参考值时，可以将第一参考值以及第二参考值均重新确定出来，当然，若只采用了一种参考值，则可以只重新确定这种参考值。

其中，在每次重新确定第一参考值时，由于该第一轨迹预测模型在之前进行了一轮的迭代训练，那么该第一轨迹预测模型的准确性有了一定的提升，因此，可以通过此时的第一轨迹预测模型对该剩余训练样本重新进行轨迹预测，得到预测结果。业务平台根据该预测结果，重新确定第一参考值。

而在重新确定第二参考值时，则可以将确定第二参考值的方式做以下调整，即，业务平台针对每个剩余训练样本，确定该剩余训练样本对应的轨迹特征与已选取出的目标训练样本对应的轨迹特征之间的差异程度。业务平台将该差异程度确定为该剩余训练样本对应的重新确定的第二参考值，并根据该重新确定的第二参考值，得到该剩余训练样本对应的参考值。

也就是说，业务平台可以将上述候选训练样本包括的历史行驶轨迹对应的轨迹特征，与预设地理场景下的训练样本对应的轨迹特征之间的差异程度，作为第二参考值的初始化的值。从第二轮选取目标训练样本开始，使用剩余训练样本对应的轨迹特征与已选取出的目标训练样本对应的轨迹特征之间的差异程度，来确定出目标训练样本的第二参考值，当然，初始化该第二参考值的方式还可以有多种，如，将该第二参考值设为固定值，之所以这样来确定第二参考值，是希望使得选取出的目标训练样本本身具有多样性。

上述均是以对该轨迹预测模型进行训练的角度，对本申请提供的基于迁移场景的轨迹预测模型的训练方法进行说明，而该轨迹预测模型需要应用于无人驾驶设备行驶在迁移场景中的轨迹预测中，也就是说，通过上述方式将对第一轨迹预测模型进行了训练后，则可以将训练完毕的第二轨迹预测模型配置在无人驾驶设备上，用于在迁移场景下的无人驾驶设备的轨迹预测。因此，无人驾驶设备可以获取周围障碍物的行驶轨迹，并将周围障碍物的行驶轨迹输入到训练完成后的第二轨迹预测模型中，得到的预测出的障碍物轨迹，并根据预测出的障碍物轨迹，对该无人驾驶设备进行控制。在一些实施例中，该无人驾驶设备至少在迁移场景中行驶，也就是说，该无人驾驶设备不仅可以在迁移场景中行驶，也可以在其他地理场景中行驶，而该无人驾驶设备在迁移场景中行驶时，可以通过上述训练后的第二轨迹预测模型来进行轨迹预测。

因此，下面以无人驾驶设备的角度进行说明，如图3所示。

图3为本申请提供的一种无人驾驶设备的控制方法的流程示意图。

301、业务平台获取无人驾驶设备周围障碍物的行驶轨迹，该无人驾驶设备在迁移场景中行驶。

302、业务平台将该行驶轨迹输入到预先训练的第二轨迹预测模型，通过该第二轨迹预测模型输出障碍物轨迹，该第二轨迹预测模型通过基于迁移场景的轨迹预测模型的训练方法进行训练得到。

也即是，该第二轨迹模型是通过上述步骤101-104训练得到的。

303、业务平台根据该障碍物轨迹，对该无人驾驶设备进行控制。

上述提到的无人驾驶设备可以是指无人车、无人机、自动配送设备等能够实现自动驾驶的设备。基于此，通过本申请提供的基于迁移场景的轨迹预测模型的训练方法以及无人驾驶设备的控制方法可以用于无人驾驶设备在迁移场景中进行轨迹预测，该无人驾驶设备具体可应用于通过无人驾驶设备进行配送的领域，如，使用无人驾驶设备进行快递、物流、外卖等配送的业务场景。

从上述方法中可以看出，业务平台可以对预先通过预设地理场景下的训练样本进行过训练的第一轨迹预测模型，采用迁移场景下的训练样本对该第一轨迹预测模型进行进一步地训练。在训练过程中，可以在迁移场景下的训练样本选取出适合的训练样本，作为目标训练样本，采用目标训练样本对该第一轨迹预测模型进行训练。在一些实施例中，业务平台选取的策略可以依据第一参考值，即，轨迹预测模型对候选训练样本进行轨迹预测的不准确性，使得轨迹预测模型能够针对迁移场景进行准确预测，以及通过第二参考值可以选取出具备多样性的各目标训练样本，从而降低了用于训练该第二轨迹预测模型的训练样本包括的异常样本的比例，进而进一步地提高了第二轨迹预测模型进行轨迹预测的准确性。

以上为本申请的一个或多个实施例提供的基于迁移场景的轨迹预测模型的训练方法以及无人驾驶设备的控制方法，基于同样的思路，本申请实施例还提供了相应的模型训练的装置以及无人驾驶设备的控制装置，如图4、5所示。

图4为本申请实施例提供的一种基于迁移场景的轨迹预测模型的训练装置的示意图，包括：

获取模块401，用于获取第一轨迹预测模型以及多个候选训练样本，该第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，该多个候选训练样本为迁移场景下的训练样本，该迁移场景所在的地理区域与该预设地理场景不同，该候选训练样本包括目标设备周围障碍物的历史行驶轨迹。

确定模块402，用于针对任一该候选训练样本，根据该候选训练样本对应的轨迹特征，和/或该第一轨迹预测模型对该候选训练样本的预测结果，确定该候选训练样本对应的参考值，该候选训练样本对应的参考值用于表征该候选训练样本包括的历史行驶轨迹的行驶特点与该预设地理场景对应的行驶特点之间的区别程度。

选取模块403，用于根据该多个候选训练样本对应的参考值，从该多个候选训练样本中选取目标训练样本。

训练模块404，用于根据该目标训练样本，对该第一轨迹预测模型进行训练，得到第二轨迹预测模型，该第二轨迹预测模型用于预测该迁移场景中各障碍物的行驶轨迹。

在一些实施例中，该确定模块402用于，根据该第一轨迹预测模型对该候选训练样本的预测结果，确定该候选训练样本对应的第一参考值，该第一参考值用于表征该第一轨迹预测模型基于该候选训练样本进行轨迹预测的不确定程度。根据该候选训练样本对应的轨迹特征，确定该候选训练样本对应的第二参考值，该第二参考值用于表征该候选训练样本在用于训练该第一轨迹预测模型的训练样本中的多样性。根据该候选训练样本对应的第一参考值和/或该候选训练样本对应的第二参考值，确定该候选训练样本对应的参考值。

在一些实施例中，该确定模块402用于，确定该第一轨迹预测模型对该候选训练样本的预测结果与该候选训练样本对应的标注结果之间的差异程度。根据该差异程度，确定该候选训练样本对应的第一参考值。

在一些实施例中，该确定模块402用于，将该候选训练样本对应的轨迹特征与该预设地理场景下的训练样本对应的轨迹特征之间的差异程度，确定为该候选训练样本对应的第二参考值。

在一些实施例中，该训练模块404用于，在通过第N-1轮训练中选取出的目标训练样本，对该第一轨迹预测模型进行训练后，确定该多个候选训练样本中的多个剩余训练样本，该多个剩余训练样本为该多个候选训练样本中除在前N-1轮被选为目标训练样本之外的候选训练样本，N为正整数。重新确定该多个剩余训练样本对应的参考值。根据重新确定出的该多个剩余训练样本对应的参考值，从该多个剩余训练样本中选取第N轮训练所需的目标训练样本。根据该第N轮训练所需的目标训练样本，对该第一轨迹预测模型进行第N轮训练，直到该第一轨迹预测模型符合预设的训练目标，得到该第二轨迹预测模型。

在一些实施例中，该确定模块402用于，针对任一该剩余训练样本，确定该剩余训练样本对应的第二参考值，该第二参考值为该剩余训练样本对应的轨迹特征与已选取出的目标训练样本对应的轨迹特征之间的差异程度，该第二参考值用于表征该剩余训练样本在用于训练该第一轨迹预测模型的训练样本中的多样性。根据该剩余训练样本对应的第二参考值，确定该剩余训练样本对应的参考值。

图5为本申请实施例提供的一种无人驾驶设备的控制装置的示意图，包括：

获取模块501，用于获取无人驾驶设备周围障碍物的行驶轨迹，所述无人驾驶设备在迁移场景中行驶；

输入模块502，用于将所述行驶轨迹输入到预先训练的第二轨迹预测模型，通过所述第二轨迹模型输出障碍物轨迹，所述第二轨迹预测模型通过上述基于迁移场景的轨迹预测模型的训练方法进行训练得到；

控制模块503，用于根据该障碍物轨迹，对该无人驾驶设备进行控制。

本申请实施例还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1或图3提供的一种基于迁移场景的轨迹预测模型的训练方法和无人驾驶设备的控制方法。

本申请实施例还提供了图6所示的一种对应于图1或图3的无人驾驶设备600的示意结构图。如图6所述，在硬件层面，该无人驾驶设备包括处理器601、内部总线602、网络接口603、内存604以及非易失性存储器605，当然还可能包括其他业务所需要的硬件。处理器601从非易失性存储器605中读取对应的计算机程序到内存中然后运行，以实现上述图1或图3所述的基于迁移场景的轨迹预测模型的训练方法和无人驾驶设备的控制方法。当然，除了软件实现方式之外，本申请并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

上述实施例阐明的系统、装置、模块或单元，可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。在一些实施例中，计算机例如可以为车载终端、个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本申请实施例可提供为方法、装置或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于迁移场景的轨迹预测模型的训练方法和无人驾驶设备的控制方法。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

一种基于迁移场景的轨迹预测模型的训练方法，包括：

获取第一轨迹预测模型以及多个候选训练样本，所述第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，所述多个候选训练样本为迁移场景下的训练样本，所述迁移场景所在的地理区域与所述预设地理场景不同，所述候选训练样本包括目标设备周围障碍物的历史行驶轨迹；

针对任一所述候选训练样本，根据所述候选训练样本对应的轨迹特征，和/或所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的参考值，所述候选训练样本对应的参考值用于表征所述候选训练样本包括的历史行驶轨迹的行驶特点与所述预设地理场景对应的行驶特点之间的区别程度；

根据所述多个候选训练样本对应的参考值，从所述多个候选训练样本中选取目标训练样本；

根据所述目标训练样本，对所述第一轨迹预测模型进行训练，得到第二轨迹预测模型，所述第二轨迹预测模型用于预测所述迁移场景中各障碍物的行驶轨迹。
如权利要求1所述的方法，其中，所述根据所述候选训练样本对应的轨迹特征，和/或所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的参考值包括：

根据所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的第一参考值，所述第一参考值用于表征所述第一轨迹预测模型基于所述候选训练样本进行轨迹预测的不确定程度；

根据所述候选训练样本对应的轨迹特征，确定所述候选训练样本对应的第二参考值，所述第二参考值用于表征所述候选训练样本在用于训练所述第一轨迹预测模型的训练样本中的多样性；

根据所述候选训练样本对应的第一参考值和/或所述候选训练样本对应的第二参考值，确定所述候选训练样本对应的参考值。
如权利要求2所述的方法，其中，所述根据所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的第一参考值包括：

确定所述第一轨迹预测模型对所述候选训练样本的预测结果与所述候选训练样本对应的标注结果之间的差异程度；

根据所述差异程度，确定所述候选训练样本对应的第一参考值。
如权利要求2所述的方法，其中，所述根据所述候选训练样本对应的轨迹特征，确定所述候选训练样本对应的第二参考值包括：

将所述候选训练样本对应的轨迹特征与所述预设地理场景下的训练样本对应的轨迹特征之间的差异程度，确定为所述候选训练样本对应的第二参考值。
如权利要求1～4任一项所述的方法，其中，所述根据所述目标训练样本，对所述第一轨迹预测模型进行训练，得到第二轨迹预测模型包括：

在通过第N-1轮训练中选取出的目标训练样本，对所述第一轨迹预测模型进行训练后，确定所述多个候选训练样本中的多个剩余训练样本，所述多个剩余训练样本为所述多个候选训练样本中除在前N-1轮被选为目标训练样本之外的候选训练样本，N为正整数；

重新确定所述多个剩余训练样本对应的参考值；

根据重新确定出的所述多个剩余训练样本对应的参考值，从所述多个剩余训练样本中选取第N轮训练所需的目标训练样本；

根据所述第N轮训练所需的目标训练样本，对所述第一轨迹预测模型进行第N轮训练，直到所述第一轨迹预测模型符合预设的训练目标，得到所述第二轨迹预测模型。
如权利要求5所述的方法，其中，重新确定所述多个剩余训练样本对应的参考值包括：

针对任一所述剩余训练样本，确定所述剩余训练样本对应的第二参考值，所述第二参考值为所述剩余训练样本对应的轨迹特征与已选取出的目标训练样本对应的轨迹特征之间的差异程度，所述第二参考值用于表征所述剩余训练样本在用于训练所述第一轨迹预测模型的训练样本中的多样性；

根据所述剩余训练样本对应的第二参考值，确定所述剩余训练样本对应的参考值。
一种无人驾驶设备的控制方法，包括：

获取无人驾驶设备周围障碍物的行驶轨迹，所述无人驾驶设备在迁移场景中行驶；

将所述行驶轨迹输入到预先训练的第二轨迹预测模型，通过所述第二轨迹模型输出障碍物轨迹，所述第二轨迹预测模型通过权利要求1～6任一项所述的方法进行训练得到；

根据所述障碍物轨迹，对所述无人驾驶设备进行控制。
一种基于迁移场景的轨迹预测模型的训练装置，包括：

获取模块，用于获取第一轨迹预测模型以及多个候选训练样本，所述第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，所述多个候选训练样本为迁移场景下的训练样本，所述迁移场景所在的地理区域与所述预设地理场景不同，所述候选训练样本包括目标设备周围障碍物的历史行驶轨迹；

确定模块，用于针对任一所述候选训练样本，根据所述候选训练样本对应的轨迹特征，和/或所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的参考值，所述候选训练样本对应的参考值用于表征所述候选训练样本包括的历史行驶轨迹的行驶特点与所述预设地理场景对应的行驶特点之间的区别程度；

选取模块，用于根据所述多个候选训练样本对应的参考值，从所述多个候选训练样本中选取目标训练样本；

训练模块，用于根据所述目标训练样本，对所述第一轨迹预测模型进行训练，得到第二轨迹预测模型，所述第二轨迹预测模型用于预测所述迁移场景中各障碍物的行驶轨迹。
一种无人驾驶设备的控制装置，包括：

获取模块，用于获取无人驾驶设备周围障碍物的行驶轨迹，所述无人驾驶设备在迁移场景中行驶；

输入模块，用于将所述行驶轨迹输入到预先训练的第二轨迹预测模型，通过所述第二轨迹模型输出障碍物轨迹，所述第二轨迹预测模型通过权利要求1～6任一项所述的方法进行训练得到；

控制模块，用于根据所述预测出的障碍物轨迹，对所述无人驾驶设备进行控制。
一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现下述步骤：

获取第一轨迹预测模型以及多个候选训练样本，所述第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，所述多个候选训练样本为迁移场景下的训练样本，所述迁移场景所在的地理区域与所述预设地理场景不同，所述候选训练样本包括目标设备周围障碍物的历史行驶轨迹；

针对任一所述候选训练样本，根据所述候选训练样本对应的轨迹特征，和/或所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的参考值，所述候选训练样本对应的参考值用于表征所述候选训练样本包括的历史行驶轨迹的行驶特点与所述预设地理场景对应的行驶特点之间的区别程度；

根据所述多个候选训练样本对应的参考值，从所述多个候选训练样本中，选取目标训练样本；

根据所述目标训练样本，对所述第一轨迹预测模型进行训练，得到第二轨迹预测模型，所述第二轨迹预测模型用于预测所述迁移场景中各障碍物的行驶轨迹。
一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现下述步骤：

获取无人驾驶设备周围障碍物的行驶轨迹，所述无人驾驶设备在迁移场景中行驶；

将所述行驶轨迹输入到预先训练的第二轨迹预测模型，通过所述第二轨迹模型输出障碍物轨迹，所述第二轨迹预测模型通过权利要求1～6任一项所述的方法进行训练得到；

根据所述障碍物轨迹，对所述无人驾驶设备进行控制。
一种无人驾驶设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现下述步骤：

获取第一轨迹预测模型以及多个候选训练样本，所述第一轨迹预测模型是通过预设地理场景下的训练样本训练得到的轨迹预测模型，所述多个候选训练样本为迁移场景下的训练样本，所述迁移场景所在的地理区域与所述预设地理场景不同，所述候选训练样本包括目标设备周围障碍物的历史行驶轨迹；

针对任一所述候选训练样本，根据所述候选训练样本对应的轨迹特征，和/或所述第一轨迹预测模型对所述候选训练样本的预测结果，确定所述候选训练样本对应的参考值，所述候选训练样本对应的参考值用于表征所述候选训练样本包括的历史行驶轨迹的行驶特点与所述预设地理场景对应的行驶特点之间的区别程度；

根据所述多个候选训练样本对应的参考值，从所述多个候选训练样本中，选取目标训练样本；

根据所述目标训练样本，对所述第一轨迹预测模型进行训练，得到第二轨迹预测模型，所述第二轨迹预测模型用于预测所述迁移场景中各障碍物的行驶轨迹。
一种无人驾驶设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现下述步骤：

获取无人驾驶设备周围障碍物的行驶轨迹，所述无人驾驶设备在迁移场景中行驶；

将所述行驶轨迹输入到预先训练的第二轨迹预测模型，通过所述第二轨迹模型输出障碍物轨迹，所述第二轨迹预测模型通过权利要求1～6任一项所述的方法进行训练得到；

根据所述障碍物轨迹，对所述无人驾驶设备进行控制。