CN116187475A

CN116187475A - 轨迹预测模型生成方法及装置、模型训练方法及装置

Info

Publication number: CN116187475A
Application number: CN202310271329.0A
Authority: CN
Inventors: 李伟; 张亮亮
Original assignee: Beijing Jingdong Qianshi Technology Co Ltd
Current assignee: Beijing Jingdong Qianshi Technology Co Ltd
Priority date: 2023-03-16
Filing date: 2023-03-16
Publication date: 2023-05-30

Abstract

本公开提供了一种轨迹预测模型生成方法及装置、模型训练方法及装置，可以应用于智能驾驶技术领域。该轨迹预测模型生成方法包括：根据与第一驾驶场景关联的第一场景信息，确定与第一驾驶场景对应的目标任务类别；在确定模型库中预存的多个轨迹预测模型中不包含与目标任务类别对应的目标轨迹预测模型情况下，从模型库中调用调参模型，以及从多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型；基于第一场景信息对调参模型的参数进行更新，得到目标调参模型；利用目标调参模型对基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型。

Description

轨迹预测模型生成方法及装置、模型训练方法及装置

技术领域

本公开涉及智能驾驶技术领域，具体地涉及一种轨迹预测模型生成方法及装置、模型训练方法及装置、设备、介质和程序产品。

背景技术

自动驾驶中，轨迹预测位于感知模块的下游，规划控制的上游，在整个自动驾驶算法模块中起着承上启下的作用。自动驾驶车辆在行驶过程中，需要综合考虑车道信息、环境信息、高精地图、其他车辆行人(障碍物)轨迹意图、路径规划等重要信息，以确保自身行车安全。

在实现本公开构思的过程中，发明人发现相关技术中至少存在如下问题：目前用于轨迹预测的预测模型都是针对特殊场景或者特定障碍物设计的轨迹预测模型，但在实际运用当中，当场景切换之后，此类模型难以很好的适用，模型泛化性较低，无法适用于其他场景。

发明内容

鉴于上述问题，本公开提供了一种轨迹预测模型生成方法及装置、模型训练方法及装置、设备、介质和程序产品。

本公开的一个方面，提供了一种轨迹预测模型生成方法，包括：

根据与第一驾驶场景关联的第一场景信息，确定与第一驾驶场景对应的目标任务类别；

在确定模型库中预存的多个轨迹预测模型中不包含与目标任务类别对应的目标轨迹预测模型情况下，从模型库中调用调参模型，以及从多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型；

基于第一场景信息对调参模型的参数进行更新，得到目标调参模型；

利用目标调参模型对基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型。

根据本公开的实施例，上述方法还包括：

将生成的目标轨迹预测模型新增存储至模型库中；

接收与第二驾驶场景关联的第二场景信息，第二场景信息包括：在第二驾驶场景下，第二主障碍物的第二运动特性信息、第二主障碍物所在车道的第二交通指示信息、第二环境障碍物的第二相对运动信息，其中，第二驾驶场景对应目标任务类别；

从多个轨迹预测模型中调用与目标任务类别对应的目标轨迹预测模型；

将第二场景信息输入目标轨迹预测模型，通过目标轨迹预测模型输出：在第二驾驶场景下第二主障碍物的预测轨迹信息。

根据本公开的实施例，其中，基于第一场景信息对调参模型的参数进行更新，得到目标调参模型包括：

将第一场景信息输入基础轨迹预测模型，输出第一主障碍物的参考轨迹信息；

获取第一主障碍物的采样轨迹信息；

根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息，计算得到目标任务类别对应的损失值；

基于目标任务类别对应的损失值，对调参模型的参数进行更新，得到目标调参模型。

根据本公开的实施例，其中，根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息，计算得到目标任务类别对应的损失值包括：

根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息，计算得到第一主障碍物的平均位移误差和终点位移误差；

根据第一驾驶场景对应的驾驶场景类别，确定平均位移误差对应的第一权重，以及确定终点位移误差对应的第二权重；

根据平均位移误差、终点位移误差、第一权重、第二权重，计算得到目标任务类别对应的损失值。

根据本公开的实施例，其中：

第一场景信息包括：在第一驾驶场景下，第一主障碍物的第一运动特性信息、第一主障碍物所在车道的第一交通指示信息、第一环境障碍物的第一相对运动信息；

第一主障碍物的第一运动特性信息包括：第一主障碍物的类别，以及第一主障碍物在目标时间节点之前的参考速度信息和参考位置信息；

第一主障碍物所在车道的第一交通指示信息包括：第一主障碍物所在车道的车道线指向信息，以及第一主障碍物所在车道的交通信号灯状态信息；

第一环境障碍物的第一相对运动信息包括：第一环境障碍物与第一主障碍物的之间的相对距离，以及第一环境障碍物相对于第一主障碍物的相对速度。

本公开的另一个方面提供了一种模型训练方法模型训练，包括：

获取与多个任务类别对应的多个任务样本集，其中，各任务样本集包括与多个历史驾驶场景关联的多组历史样本信息；

基于元学习算法，利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新，得到训练得到的调参模型和多个轨迹预测模型，其中，多个轨迹预测模型与多个任务类别一一对应，其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

根据本公开的实施例，其中，各任务样本集中的多组历史样本信息被分类为训练样本组和测试样本组，利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新包括：

基于第n个任务样本集中的训练样本组，以及第n-1次更新后的待训练调参模型，对待训练轨迹预测模型的参数进行更新，得到与第n个任务类别对应的第n个轨迹预测模型；

基于第n个任务样本集中测试样本组和第n个轨迹预测模型，确定第n个任务类别对应的损失值；

基于第n个任务类别对应的损失值，对待训练调参模型的参数进行第n次更新；

迭代执行：基于第n+1个任务样本集中的训练样本组，以及第n次更新后的待训练调参模型，对待训练轨迹预测模型的参数进行更新得到第n+1个轨迹预测模型、基于第n+1个任务样本集中测试样本组和第n+1个轨迹预测模型确定第n+1个任务类别对应的损失值、基于第n+1个任务类别对应的损失值对待训练调参模型的参数进行第n+1次更新的操作，直至多个任务类别对应的损失值之和小于预设阈值，得到训练得到的调参模型和多个轨迹预测模型。。

根据本公开的实施例，其中：

各组历史样本信息包括在各自历史驾驶场景下，主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、主障碍物历史轨迹信息、环境障碍物历史相对运动信息；

多个历史驾驶场景分类为历史训练驾驶场景和历史测试驾驶场景，历史训练驾驶场景和训练样本组关联，历史测试驾驶场景和测试样本组关联；

基于第n个任务样本集中测试样本组和第n个轨迹预测模型，确定第n个任务类别对应的损失值包括：

将第n个任务样本集中测试样本组的主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、环境障碍物历史相对运动信息，输入第n个轨迹预测模型，输出第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，其中第n组历史测试驾驶场景为：与第n个任务样本集中测试样本组关联的多个历史训练驾驶场景；

根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息，计算得到第n个任务类别对应的损失值。

根据本公开的实施例，其中，根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息，计算得到第n个任务类别对应的损失值包括：

根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息，计算得到与第n个任务类别关联的样本平均位移误差和样本终点位移误差；

根据第n组历史测试驾驶场景对应的驾驶场景类别，确定样本平均位移误差对应的样本第一权重，以及确定样本终点位移误差对应的样本第二权重；

根据与第n个任务类别关联的样本平均位移误差、样本终点位移误差、样本第一权重、样本第二权重，计算得到第n个任务类别对应的损失值。

本公开的另一个方面提供了一种轨迹预测模型生成装置，包括：

确定模块，用于根据与第一驾驶场景关联的第一场景信息，确定与第一驾驶场景对应的目标任务类别；

第一调用模块，用于在确定模型库中预存的多个轨迹预测模型中不包含与目标任务类别对应的目标轨迹预测模型情况下，从模型库中调用调参模型，以及从多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型；

第一调参模块，用于基于第一场景信息对调参模型的参数进行更新，得到目标调参模型；

第二调参模块，用于利用目标调参模型对基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型。

本公开的另一个方面提供了一种模型训练装置，包括：

获取模块，用于获取与多个任务类别对应的多个任务样本集，其中，各任务样本集包括与多个历史驾驶场景关联的多组历史样本信息；

训练模块，用于基于元学习算法，利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新，得到训练得到的调参模型和多个轨迹预测模型，其中，多个轨迹预测模型与多个任务类别一一对应，其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

本公开的另一个方面提供了一种电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得一个或多个处理器执行上述轨迹预测模型生成方法或模型训练方法。

本公开的另一个方面还提供了一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行上述轨迹预测模型生成方法或模型训练方法。

本公开的另一个方面还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述轨迹预测模型生成方法或模型训练方法。

根据本公开的实施例，针对相关技术中的轨迹预测模型场景局限性比较大的缺陷，本公开实施例的方法，通过预训练好调参模型以及多个轨迹预测模型存储在模型库中，同一个轨迹预测模型可针对同一种任务类别下的多种场景中的障碍物的轨迹进行预测，调参模型用于根据不同的场景对轨迹预测模型进行调参，以适应不同的任务场景下的轨迹预测。因此，在确定与当前驾驶场景对应的任务类别，并以此确定当前模型库中不存在适用于当前驾驶场景的预测模型后，通过利用调参模型根据新的场景信息对轨迹预测模型进行调参，可以适应新任务场景下的轨迹预测。如此，可解决相关技术中轨迹预测模型场景局限性比较大的缺陷，可快速适用不同场景下的轨迹预测，使得轨迹预测不受场景的限制，不受障碍物类型的限制，具有较强的场景泛化能力。

进一步地，本公开实施例中，利用调参模型根据新的场景信息对轨迹预测模型进行调参的过程不同于传统的深度学习，调参模型的参数经过预训练，在面对新的任务场景时，无需从头开始调参，也无需大量标签数据重新进行训练，只需要新场景下的少量数据对模型参数自动微调即可，无需如相关技术中针对每一个驾驶场景都从头开始进行调参，然后耗费大量的时间去训练并测试效果，较大程度上缩短了模型训练的周期，提高了模型调整的效率。

附图说明

通过以下参照附图对本公开实施例的描述，本公开的上述内容以及其他目的、特征和优点将更为清楚，在附图中：

图1示意性示出了根据本公开实施例的轨迹预测模型生成方法、装置、设备、介质和程序产品的应用场景图；

图2示意性示出了根据本公开实施例的轨迹预测模型生成方法的流程图；

图3示意性示出了根据本公开实施例的利用轨迹预测模型进行轨迹预测的原理图；

图4示意性示出了根据本公开实施例的模型训练方法的流程图；

图5示意性示出了根据本公开实施例的模型训练方法的原理图；

图6示意性示出了根据本公开实施例的轨迹预测模型生成装置的结构框图；

图7示意性示出了根据本公开实施例的模型训练装置的结构框图；

图8示意性示出了根据本公开实施例的适于实现轨迹预测模型生成方法或模型训练方法的电子设备的方框图。

具体实施方式

以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

在本公开的实施例中，所涉及的数据(例如，包括但不限于用户个人信息)的收集、更新、分析、处理、使用、传输、提供、公开、存储等方面，均符合相关法律法规的规定，被用于合法的用途，且不违背公序良俗。特别地，对用户个人信息采取了必要措施，防止对用户个人信息数据的非法访问，维护用户个人信息安全、网络安全和国家安全。

在本公开的实施例中，在获取或采集用户个人信息之前，均获取了用户的授权或同意。

相关技术中，轨迹预测模型都是针对特殊场景或者特定障碍物设计的轨迹预测模型，但在实际运用当中，当场景切换之后，此类模型难以很好的适用。例如，相关技术中进行障碍物轨迹预测的方法主要有以下几类：基于障碍物运动学模型的轨迹预测、基于车道的轨迹预测方法、基于deep learning(深度学习)的轨迹预测方法(例如基于transformer的轨迹预测，基于VectorNet的轨迹预测方法，基于TNT以及相关改进版本的轨迹预测方法)。

例如，基于障碍物运动学的轨迹预测模型，主要适用于高速和城市道路的汽车的轨迹预测，对于城市辅路和乡村道路的汽车的预测结果不稳定，且不适应与自行车、电动车及行人的轨迹预测，障碍物本身的意图就难以确定。基于障碍物运动学模型的方法在感知结果的基础上，推导障碍物未来的行进轨迹，该方法更符合车辆的实际运动轨迹，目前，为了避免感知造成的误差，通过传统和深度学习的方法对感知结果进行滤波，能够实现跨环境使用，不需要训练数据。但该类方法无法很好地捕捉现实世界的复杂性，转移(推导)方程在空间与时间上缺乏全局信息，导致可能获得是局部最优解，并且无法完全消除感知误差，预测轨迹的效果与感知所传输的输入信息息息相关。

例如，基于车道的轨迹预测方法受限于地图所提供的车道线，当自动驾驶车到达地图未标记的区域时，对其他障碍物的轨迹预测模型难以很好的适应。

例如，基于深度学习的轨迹预测方法，都局限于障碍物类型和主车所在场景，即汽车在高速或规则的城市道路上能够表现稳定，但当进入其他场景中，该轨迹预测方法不能够很好的适用，这主要是因为现实场景中的数据与模型的训练数据的分布出现了偏移。

相关技术中的上述几类轨迹预测模型都是针对特殊场景或者特定障碍物，如针对路口场景所设计的轨迹算法模型，亦或针对行人所设计的轨迹预测模型，因此，训练过程中采用的样本数据也是针对特定场景下的数据，因此，训练得到的模型在场景切换之后，模型难以很好的适应。

有鉴于此，本公开的实施例提供了一种轨迹预测方法，包括：

在目标时间节点之前，按照第一预定时间间隔连续采集得到与目标车辆有关的多帧参考驾驶场景图；对多帧参考驾驶场景图进行第一预处理后得到多组状态信息，其中，状态信息用于表征参考驾驶场景图所展示的交通指示信息以及障碍物信息；将多组状态信息输入轨迹预测模型，通过轨迹预测模型输出：在目标时间节点之后目标车辆的多个预测位置信息，其中，多个预测位置信息按照第二预定时间间隔连续分布。

图1示意性示出了根据本公开实施例的轨迹预测模型生成方法、装置、设备、介质和程序产品的应用场景图。

如图1所示，根据该实施例的应用场景100可以包括车辆101、轨迹预测模块102。车辆101和轨迹预测模块102之间可通过网络进行通信，网络可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

车辆101中安装有自动驾驶模块，用于引导车辆实现自动驾驶。自动驾驶模块中安装有图像采集设备，例如摄像头，用于采集车辆101行驶过程中的周围环境图像，也可安装源头雷达，用于采集车辆101周围环境点云数据。

轨迹预测模块102位于感知模块的下游，规划控制的上游，在整个自动驾驶算法模块中起着承上启下的作用。自动驾驶车辆在行驶过程中，需要综合考虑车道信息、环境信息、高精地图、其他车辆行人(障碍物)轨迹意图、路径规划等重要信息，以确保自身行车安全。

在本公开实施例的应用场景下，车辆101在行驶过程中，需要得知周围障碍物的预测轨迹，以便提前做出避障措施。车辆101中安装的数据采集设备采集到周围环境图像和周围环境点云数据等，转化为周围环境的场景信息，如主障碍物的运动特性信息、主障碍物所在车道的交通指示信息、环境障碍物的相对运动信息等，并将这些场景信息发送至轨迹预测模块102，轨迹预测模块102可根据与驾驶场景关联的场景信息，确定对应的目标任务类别，从多个轨迹预测模型中调用与目标任务类别对应的目标轨迹预测模型，通过目标轨迹预测模型输出主障碍物的预测轨迹信息，向车辆101返回，告诉车辆101障碍物的行驶意图，使车辆101做出相应的决策，避免碰撞事故的发生。

以下将基于图1描述的场景，通过图2～图8对公开实施例的轨迹预测模型生成方法和模型训练方法进行详细描述。

图2示意性示出了根据本公开实施例的轨迹预测模型生成方法的流程图。图3示意性示出了根据本公开实施例的利用轨迹预测模型进行轨迹预测的原理图。以下结合图2、图3对本公开实施例的轨迹预测模型生成方法进行说明。

如图2所示，该实施例的轨迹预测模型生成方法包括操作S201～操作S204。

在操作S201，根据与第一驾驶场景关联的第一场景信息，确定与第一驾驶场景对应的目标任务类别，其中，第一场景信息包括：在第一驾驶场景下，第一主障碍物的第一运动特性信息、第一主障碍物所在车道的第一交通指示信息、第一环境障碍物的第一相对运动信息。

在操作S202，在确定模型库中预存的多个轨迹预测模型中不包含与目标任务类别对应的目标轨迹预测模型情况下，从模型库中调用调参模型，以及从多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型。

在操作S203，基于第一场景信息对调参模型的参数进行更新，得到目标调参模型。

在操作S204，利用目标调参模型对基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型。

根据本公开的实施例，上述方法可应用于对不同驾驶场景下障碍区轨迹预测的场景。其中，不同驾驶场景指不同类型障碍物与不同类型道路随机组合形成的驾驶场景。障碍物类型例如包括：家庭汽车、中型货车、大型货车、挂车、电动车、摩托车、自行车、行人、轮椅、公共汽车、狗、猫、城市作业车、特种专用车(警车、消防车、救护车等)等。道路类型例如包括：无红绿灯路口城市道路、红绿灯路口城市道路、非路口城市道路、城市道路辅路、无红绿灯路口乡镇道路等等。驾驶场景例如是：公共汽车在无红绿灯路口城市道路中行驶为一个驾驶场景、电动车在无红绿灯路口城市道路中行驶为一个驾驶场景、自行车在非路口城市道路中行驶为一个驾驶场景等等。

根据本公开的实施例，多个相似的驾驶场景属于同一任务类别，例如，关联同一种道路类型的驾驶场景可属于同一任务类别。如，公共汽车在无红绿灯路口城市道路中行驶的驾驶场景、电动车在无红绿灯路口城市道路中行驶的驾驶场景、行人在无红绿灯路口城市道路中行驶的驾驶场景属于第一任务类别；公共汽车在红绿灯路口城市道路中行驶的驾驶场景、电动车在红绿灯路口城市道路中行驶的驾驶场景、行人在红绿灯路口城市道路中行驶的驾驶场景属于第二任务类别……。

根据本公开的实施例，针对多个不同任务类别可通过元学习策略提前训练好多个轨迹预测模型，并存储在模型库中。其中，一种任务类型对应与一个轨迹预测模型，同一个轨迹预测模型可针对同一种任务类别下的多种场景中的障碍物的轨迹进行预测。

传统深度学习方法在基于机器学习的轨迹预测算法中，工作量最大也是最耗时的流程就是调参，通常针对每一个驾驶场景都需要从头开始进行调参，然后耗费大量的时间去训练并测试效果，并且不能够保证算法模型能够很好的适应不同驾驶场景。

与此不同的是，元学习的主旨在于：“学会如何学习”。因此，通过采用元学习策略训练模型，可达到让机器自己学会调参的目的，在遇到相似任务时能够触类旁通、举一反三，当进入不同场景或针对不同类型障碍物时无需从头开始调参，也无需大量标签数据重新进行训练。

根据本公开的实施例，通过元学习策略基于多种不同驾驶场景的样本数据完成模型训练后，可得到训练好的调参模型以及针对多个不同任务类别的多个轨迹预测模型。轨迹预测模型能够输出不同类型障碍物在不同道路场景的预测轨迹，告诉主车(自动驾驶车辆)其他障碍物的意图，使主车做出相应的决策，避免碰撞事故的发生，提升主车通行效率。

如图3所示，基于元学习策略得到的调参模型Fφ可让轨迹预测模型自动学习超参数fθ，而不是人为根据场景和障碍物类型进行手动调参。这类超参数包括初始化参数，学习率以及网络架构等。本公开实施例的发明目的主要初始化参数展开，当模型学到针对同一任务类别的初始化参数后，便可针对该任务类别下所有驾驶场景的轨迹进行预测。

训练好的调参模型F(φ)可对轨迹预测模型的超参数fθ进行微调，在切换任务类型，对新任务类型下场景下障碍物轨迹预测前，只需要一小部分数据对模型参数自动微调即可。

如图3所示，针对行人在十字路口中行进的场景，通过调参模型F(φ)生成轨迹预测模型的超参数为fθ₁，用于预测行人在十字路口的轨迹。当任务类型切换为行人在直行路中行进的场景后，通过调参模型F(φ)对模型参数进行微调，生成轨迹预测模型的超参数为fθ₂，用于预测行人在直行路中的轨迹。

基于此，在接收到第一驾驶场景关联的第一场景信息后，首先通过操作S201确定与第一驾驶场景对应的目标任务类别。其中，第一场景信息中包含的第一主障碍物的第一运动特性信息，例如可包括第一主障碍物的类别、第一主障碍物的位置信息、第一主障碍物所在的道路类别等，基于第一主障碍物的类别、第一主障碍物所在的道路类别可确定第一驾驶场景对应的目标任务类别。

基于针对多个不同任务类别提前训练好多个轨迹预测模型存储在模型库中，在确定目标任务类别后，可进一步通过操作S202确定模型库中预存的多个轨迹预测模型中是否包含与目标任务类别对应的目标轨迹预测模型。

同一个轨迹预测模型可针对同一种任务类别下的多种场景中的障碍物的轨迹进行预测，在模型库包含与目标任务类别对应的目标轨迹预测模型时，可直接将场景信息输入目标轨迹预测模型，输出主障碍物的预测轨迹信息。

训练好的调参模型F(φ)可对轨迹预测模型的超参数fθ进行微调，在切换任务类型对新任务类型下场景下障碍物轨迹预测前，只需要一小部分数据对模型参数自动微调即可。因此，在模型库不包含与目标任务类别对应的目标轨迹预测模型时，可通过执行操作S203、操作S204，利用调参模型F(φ)对已有的基础轨迹预测模型超参数fθ进行微调即可，调参后的新模型可适用于该目标任务类别场景下的轨迹预测。

根据本公开的实施例，本公开实施例的方法可应用与线上车端实时预测的场景，在面对已有任务类型时，可直接应用模型库中预训练好的轨迹预测模型输出预测结果，在面对新的任务类型时，因模型库中暂时没有可适用的模型，为了保证时效性，可先利用其它可行的方法得到粗略的轨迹预测结果作为保底反馈给主车。例如可利用通用轨迹预测模型输出轨迹预测结果，主车可基于预测结果作出动作反馈。同时，在障碍物轨迹实际发生后，搜集障碍物的实际轨迹数据作为样本数据，以便基于样本数据，利用调参模型F(φ)对已有的基础轨迹预测模型超参数fθ进行微调得到新的轨迹预测模型。后续，再接收到同种任务场景的预测任务时，便可直接应用调参后的新模型进行在线实时预测。

根据本公开的实施例，在操作S203和操作S204，利用调参模型F(φ)对已有的基础轨迹预测模型超参数fθ进行更新，具体可以是首先基于第一场景信息(可以是预定数量的多组第一场景信息)对调参模型的参数进行更新，得到目标调参模型，之后利用目标调参模型对基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型，例如可以是将目标调参模型的调整后的超参数赋值给基础轨迹预测模型。此处，模型参数调整的过程不同于传统的深度学习，调参模型的参数经过预训练，在面对新的任务场景时，只需要新场景下的少量数据进行参数更新即可，无需大量长时间的训练过程。

根据本公开的实施例，在接收到预测任务后，轨迹预测模型需要根据场景信息进行计算，输出主障碍物的预测轨迹。其中，场景信息包括：在相应的驾驶场景下，主障碍物的运动特性信息、主障碍物所在车道的交通指示信息、环境障碍物(主障碍物周围的其他障碍物)的相对运动信息。

其中，主障碍物的运动特性信息可包括但不限于：主障碍物的类别(行人、三轮车、大型货车、挂车……)、主障碍物在目标时间节点(当前时刻)之前的参考速度信息(例如可以是绝对速度)和参考位置信息(例如可以是位置坐标)、主障碍物所在的道路类别(无红绿灯路口城市道路、红绿灯路口城市道路、非路口城市道路、城市道路辅路……)等。主障碍物所在车道的交通指示信息包括主障碍物所在车道的车道线指向信息(左拐、右拐、直行……)，以及主障碍物所在车道的交通信号灯状态信息(红、黄、绿)。环境障碍物的相对运动信息包括环境障碍物与主障碍物的之间的相对距离，以及环境障碍物相对于主障碍物的相对速度。

场景信息与驾驶场景一一对应，一个驾驶场景下对应一组场景信息，第一场景信息与第一驾驶场景关联，第二场景信息与第二驾驶场景关联。

根据本公开的实施例，在生成与目标任务类别对应的目标轨迹预测模型后，将生成的目标轨迹预测模型新增存储至模型库中，如此，后续再接收到相同场景任务时，可直接利用新增的轨迹预测模型进行在线实时轨迹预测。

例如：接收到第二驾驶场景关联的第二场景信息后，通过判别确定第二驾驶场景对应目标任务类别，则可以直接从多个轨迹预测模型中调用新增的与目标任务类别对应的目标轨迹预测模型；将第二场景信息输入目标轨迹预测模型，通过目标轨迹预测模型输出：在第二驾驶场景下第二主障碍物的预测轨迹信息。

根据本公开的实施例，虽然第一驾驶场景和第二驾驶场景可能是不同的驾驶场景，例如第一驾驶场景为公共汽车在无红绿灯路口城市道路中行驶的场景，第二驾驶场景为电动车在无红绿灯路口城市道路中行驶的场景。但是第一驾驶场景和第二驾驶场景为相似的驾驶场景，关联同一种道路类型，属于同一个任务类别。

根据本公开的实施例，轨迹预测模型是基于元学习算法训练得到的，通过该算法训练得到的模型则具有较强的泛化能力，具备探索场景的能力，可适用于多种场景。因此，可通过同一个轨迹预测模型进行预测输出这两种驾驶场景中障碍物的预测轨迹。

根据本公开的实施例，轨迹预测模型可基于目标时间节点(当前时刻)之前的场景信息，输出目标时间节点之后(当前时刻之后，即未来)障碍物的多个预测位置信息(如坐标值)。例如，根据采集得到的场景信息，包括主障碍物在当前时刻之前的至少一个位置坐标、当前时刻之前至少一个运动速度值、主障碍物所在车道的车道线指向信息、主障碍物所在车道的交通信号灯状态信息、环境障碍物与主障碍物的之间的至少一个相对距离、以及环境障碍物相对于主障碍物的至少一个相对速度，将上述场景信息输入轨迹预测模型后，输出未来多个(数量可自由设置)轨迹点对应的预测位置信息，多个轨迹点可以是按照预定时间间隔(如0.5秒)连续分布。

根据本公开的实施例，通过本公开实施例的方法，在面对已有任务类型时，可直接利用模型库中预训练好的轨迹预测模型输出预测结果，在面对新的任务类型时，可通过调参建立新模型以适应新的任务场景。如此，可同时兼容新老任务场景下的轨迹预测，使得轨迹预测不受场景的限制，不受障碍物类型的限制，保证轨迹预测的时效性，同时保证了模型库的不断迭代更新，模型种类得以实时更新，具有更好的场景适应性。

根据本公开的实施例，具体地，基于第一场景信息对调参模型的参数进行更新，得到目标调参模型包括以下操作。

操作11，将第一场景信息(可以是预定数量的多组第一场景信息)输入基础轨迹预测模型，输出第一主障碍物在目标时间节点之后的参考轨迹信息，即通过模型输出初始的轨迹预测值，因基础轨迹预测模型不是针对该场景任务类别建立的，此时的预测值准确度较低。

操作12，获取第一主障碍物的采样轨迹信息(可以是预定数量的多组采样轨迹信息)，例如，通过采样获得主障碍物在目标时间节点之后的多组真实轨迹信息。

操作13，根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息，计算得到目标任务类别对应的损失值。损失值可以表征主障碍物的预测轨迹(参考轨迹信息)和真实轨迹(采样轨迹信息)之间的误差。

操作14，基于目标任务类别对应的损失值，对调参模型的参数进行更新，得到目标调参模型，参数调整以促使损失值减小的方向进行调整。

其中，计算损失值的方法具体可以是：

首先，根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息，计算得到第一主障碍物的平均位移误差ADE(Average displacement error)和终点位移误差FDE(Final displacement error)。平均位移误差ADE可以是主障碍物的多个预测轨迹点与多个真实轨迹点之间位置误差的均值；终点位移误差FDE可以是主障碍物的最后一个预测轨迹点与最后一个真实轨迹点之间的位置误差。

之后，根据第一驾驶场景对应的驾驶场景类别，确定平均位移误差对应的第一权重，以及确定终点位移误差对应的第二权重。第一权重和第二权重的取值根据驾驶场景的不同而不同，例如，针对行人在直行道路中行进的场景，权重参数设计时，可以是终点位移误差对应的第二权重值要大于平均位移误差对应的第一权重；针对卡车在直行道路中行进的场景，权重参数设计时，可以是终点位移误差对应的第二权重值要小于平均位移误差对应的第一权重。

然后，根据平均位移误差、终点位移误差、第一权重、第二权重，计算得到目标任务类别对应的损失值lⁱ的计算方法可以是如下式(1)所示。

lⁱ＝w₁*ADE+w₂*FDE (1)

式(1)中，各参数含义如下：

ADE----平均位移误差；

FDE----终点位移误差；

w₁----平均位移误差对应的第一权重；

w₂----终点位移误差对应的第二权重。

根据本公开的实施例，在对模型调参的过程中，通过计算主障碍物的预测轨迹和真实轨迹之间的误差作为模型调参的损失值，且参数调整以促使损失值减小的方向进行调整，如此，调整好参数的调参模型可以对新任务场景下的轨迹预测模型进行适应性调参，可使得轨迹预测模型对新任务场景具有比较准确的预测能力。

根据本公开的实施例，通过根据驾驶场景类别确定平均位移误差对应的第一权重以及确定终点位移误差对应的第二权重，充分考虑到不同场景下轨迹误差的偏向性，进一步，增强了调参模型对新任务场景的适应性，也进一步通过对轨迹预测模型的调参，提高了轨迹预测模型的预测准确度。

本公开的另一个方面提供了一种模型训练方法，图4示意性示出了根据本公开实施例的模型训练方法的流程图。

如图4所示，该实施例的模型训练方法包括操作S401～操作S402。

在操作S401，获取与多个任务类别对应的多个任务样本集，其中，各任务样本集包括与多个历史驾驶场景关联的多组历史样本信息，各组历史样本信息包括在各自历史驾驶场景下，主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、主障碍物历史轨迹信息、环境障碍物历史相对运动信息。

在模型训练之前，需预先收集多种任务类型下的场景数据作为训练数据，即收集与多个任务类别对应的多个任务样本集，其中，一个任务样本集对应一种任务类别。其中，多个相似的驾驶场景属于同一任务类别，关联同一种道路类型的驾驶场景可属于同一任务类别。基于此，多个任务类别例如可包括但不限于：障碍物在无红绿灯路口城市道路的轨迹预测、障碍物在红绿灯路口城市道路的轨迹预测、障碍物在非路口城市道路的轨迹预测、障碍物在城市道路辅路的轨迹预测、障碍物在无红绿灯路口乡镇道路的轨迹预测、障碍物在红绿灯路口乡镇道路的轨迹预测、障碍物在非路口的乡镇道路的轨迹预测、障碍物在高速道路的轨迹预测、障碍物在乡村道路的轨迹预测等。

同一个任务样本集中包括该任务类别下的多组历史样本信息，多组历史样本信息分别对应多个相似的驾驶场景。例如，第一任务样本集中多组历史样本信息包括：公共汽车在城市道路行驶场景下的场景信息、电动车在城市道路行驶场景下的场景信息、行人在城市道路行驶场景下的场景信息等；第二任务样本集中多组历史样本信息包括：摩托车在乡镇道路行驶场景下的场景信息、电动车摩托车在乡镇道路行驶场景下的场景信息、行人摩托车在乡镇道路行驶场景下的场景信息等。任一组场景信息具体包括上述的主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、主障碍物历史轨迹信息、环境障碍物历史相对运动信息等。

在操作S402，基于元学习算法，利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新，得到训练得到的调参模型和多个轨迹预测模型，其中，多个轨迹预测模型与多个任务类别一一对应，其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

相关技术中有关轨迹预测模型多是针对特殊场景或者特定障碍物，如针对路口场景所设计的轨迹算法模型，亦或针对行人所设计的轨迹预测模型，因此，训练过程中采用的样本数据也是针对特定场景下的数据，因此，训练得到的模型在场景切换之后，模型难以很好的适应。

根据本公开的实施例，因训练模型采用的多个任务样本集对应多个不同的任务类别，通过将数据集分解为不同的任务，可学习任务类别变化的情况下模型的泛化能力，因此，训练得到的模型能够适应多种不同的任务场景下障碍物的轨迹预测。另外，本公开的实施例基于元学习算法进行模型训练，训练完成后不仅可得到多个轨迹预测模型，最重要的是可训练得到调参模型，基于元学习策略得到的调参模型可让轨迹预测模型自动学习超参数，而不是人为根据场景和障碍物类型进行手动调参。通过训练好的调参模型对轨迹预测模型的超参数进行微调，可得到适用于任意新任务场景的轨迹预测模型，面对全新的场景，只需要通过一步或少数几步调参，就可以适配新场景的预测任务，较大程度上缩短模型的训练周期，提高了轨迹预测的时效性。

根据本公开的实施例，进一步地，各任务样本集中的多组历史样本信息被分类为训练样本组和测试样本组。例如，公共汽车在无红绿灯路口城市道路的轨迹预测看作一个训练样本；如果再拿一个新的样本：自行车在无红绿灯路口城市道路的轨迹预测来测试通过训练找到的超参的效果，那么这个任务就称为测试任务。测试样本可以曾经出现在训练样本中，也可以在训练任务中未出现过。采用训练样本中未出现过的样本作为测试样本，可提高模型的泛化能力。

图5示意性示出了根据本公开实施例的模型训练方法的原理图。以下结合图5对该模型训练方法进行说明。

根据本公开的实施例，如若图5所示，每个任务类别对应的自己的损失值li，基于元学习的训练策略不是要针对某一特定任务类别，而是要为这些所有的任务类别找到一个好的超参数，这样在遇到相似任务的时候，学到的超参数就可以直接用上，不需要人为调参。

其中，总损失函数定义为：

其中N为任务类别的数量。

本公开实施例的方法为：首先利用任务集中的训练样本训练得到轨迹预测模型，然后再利用该任务集中的测试样本测试通过训练找到的超参的效果，即利用任务集中的测试样本测试训练的得到的轨迹预测模型的预测效果，以此来训练调参模型的参数。

具体地，如图5所示，对于训练任务1，在基于调参函数F(φ)的超参数φ的基础上(例如将超参数φ直接赋值给轨迹预测模型f)，利用训练样本对轨迹预测模型f进行训练，得到参数θ₁，然后利用测试样本对训练后的模型fθ₁进行测试，测试得到的损失值为l¹；同理，对于训练任务2，在基于调参函数F(φ)的超参数φ的基础上(例如将超参数φ直接赋值给轨迹预测模型f)，利用训练样本对轨迹预测模型f进行训练，得到参数θ₂，然后利用测试样本对训练后的模型fθ₂进行测试，测试得到的损失值为l²；基于元学习的轨迹预测算法的目标便是使得总损失L(φ)最小。

具体地，利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新包括以下操作。

操作21，基于第n个任务样本集中的所述训练样本组，以及第n-1次更新后的待训练调参模型，对所述待训练轨迹预测模型的参数进行更新，得到与第n个任务类别对应的第n个轨迹预测模型。

例如，采样一个训练任务，将训练中调参函数F(φ)的超参数φ₀直接赋值给轨迹预测模型f，得到初始参数θ₀，利用任务样本集中的训练样本组，基于任务的学习率，对参数θ₀，进行优化，得到更新后的参数θ₁，得到初始轨迹预测模型fθ₁。

操作22，基于第n个任务样本集中测试样本组和第n个轨迹预测模型，确定第n个任务类别对应的损失值。

例如，基于优化后的参数θ₁，使用测试样本组计算任务的损失值1¹。

操作23，基于第n个任务类别对应的损失值，对待训练调参模型的参数进行第n次更新。

此处，可基于梯度下降的方法，对模型参数进行更新。例如，计算梯度损失函数的梯度

利用该梯度乘以调参函数网络的学习率，更新调参函数F(φ)的超参数φ₀得到φ₁。

操作24，迭代执行上述操作21-操作23，即：基于第n+1个任务样本集中的所述训练样本组，以及第n次更新后的待训练调参模型，对所述待训练轨迹预测模型的参数进行更新得到第n+1个轨迹预测模型、基于第n+1个任务样本集中所述测试样本组和所述第n+1个轨迹预测模型确定第n+1个任务类别对应的损失值、基于第n+1个任务类别对应的损失值对所述待训练调参模型的参数进行第n+1次更新的操作，直至所述多个任务类别对应的损失值之和小于预设阈值，得到训练得到的调参模型和多个轨迹预测模型。

例如，采样另一个训练任务，将训练中调参函数F(φ)的超参数φ₁直接赋值给轨迹预测模型f，得到初始参数θ₁，利用任务样本集中的训练样本组，基于任务的学习率，对参数θ₁，进行优化，得到更新后的参数θ₂，得到初始轨迹预测模型fθ₂。基于优化后的参数θ₂，使用测试样本组计算任务的损失值l²。计算梯度损失函数的梯度

利用该梯度乘以调参函数网络的学习率，更新调参函数F(φ)的超参数φ₁得到φ₂……所述多个任务类别对应的损失值之和L(φ)小于预设阈值，得到训练得到的调参模型和多个轨迹预测模型。

根据本公开的实施例，多个历史驾驶场景分类为历史训练驾驶场景和历史测试驾驶场景，历史训练驾驶场景和训练样本组关联，历史测试驾驶场景和测试样本组关联。

在利用任务集中的训练样本训练得到轨迹预测模型后，需要利用任务集中的测试样本测试训练的得到的轨迹预测模型的预测效果，以此来训练调参模型的参数，调参的过程中基于任务损失值来进行调参，其中计算任务损失值的方法如下。

具体地，基于第n个任务样本集中测试样本组和第n个轨迹预测模型，确定第n个任务类别对应的损失值包括：

首先，将第n个任务样本集中测试样本组的主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、环境障碍物历史相对运动信息，输入第n个轨迹预测模型，输出第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息。其中第n组历史测试驾驶场景为：与第n个任务样本集中测试样本组关联的多个历史训练驾驶场景。即，将该任务类别场景下测试样本数据中的场景信息输入调参后的轨迹预测模型(利用该任务类别场景下训练样本数据训练得到的模型)，输出预测结果。

之后，根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息，计算得到第n个任务类别对应的损失值。其中，损失值可以表征预测轨迹(主障碍物预测轨迹样本信息)和真实轨迹(主障碍物历史轨迹信息)之间的误差。

进一步地，根据预测轨迹和真实轨迹计算损失值的具体方法为：

首先，根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息，计算得到与第n个任务类别关联的样本平均位移误差和样本终点位移误差；

之后，根据第n组历史测试驾驶场景对应的驾驶场景类别，确定样本平均位移误差对应的样本第一权重，以及确定样本终点位移误差对应的样本第二权重；

然后，根据与第n个任务类别关联的样本平均位移误差、样本终点位移误差、样本第一权重、样本第二权重，计算得到第n个任务类别对应的损失值。

关于上述损失值计算的具体操作，可参考前述实施例轨迹预测模型生成方法的实施例中，有关根据主障碍物的参考轨迹信息以及主障碍物的采样轨迹信息计算得到目标任务类别对应的损失值的描述，在此不再赘述。

基于上述轨迹预测模型生成方法，本公开还提供了一种轨迹预测模型生成装置。以下将结合图8对该装置进行详细描述。

图6示意性示出了根据本公开实施例的轨迹预测模型生成装置的结构框图。

如图6所示，该实施例的预测轨迹的模型生成装置600包括确定模块601、第一调用模块602、第一调参模块603、第二调参模块604。

其中，确定模块601，用于根据与第一驾驶场景关联的第一场景信息，确定与第一驾驶场景对应的目标任务类别，其中，第一场景信息包括：在第一驾驶场景下，第一主障碍物的第一运动特性信息、第一主障碍物所在车道的第一交通指示信息、第一环境障碍物的第一相对运动信息。

第一调用模块602，用于在确定模型库中预存的多个轨迹预测模型中不包含与目标任务类别对应的目标轨迹预测模型情况下，从模型库中调用调参模型，以及从多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型。

第一调参模块603，用于基于第一场景信息对调参模型的参数进行更新，得到目标调参模型。

第二调参模块604，用于利用目标调参模型对基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型。

根据本公开的实施例，针对相关技术中的轨迹预测模型场景局限性比较大的缺陷，本公开实施例的装置，通过确定模块601确定与当前驾驶场景对应的任务类别，并以此确定当前模型库中不存在适用于当前驾驶场景的预测模型后，通过第一调用模块602利用调参模型，并通过第一调参模块603、第二调参模块604利用调参模型根据新的场景信息对轨迹预测模型进行调参，可以适应新任务场景下的轨迹预测。因同一个轨迹预测模型可针对同一种任务类别下的多种场景中的障碍物的轨迹进行预测，调参模型用于根据不同的场景对轨迹预测模型进行调参，以适应不同的任务场景下的轨迹预测。如此，可解决相关技术中轨迹预测模型场景局限性比较大的缺陷，可快速适用不同场景下的轨迹预测，使得轨迹预测不受场景的限制，不受障碍物类型的限制，具有较强的场景泛化能力。

根据本公开的实施例，上述装置还包括存储模块、接收模块、第二调用模块、预测模块。

其中，存储模块，用于将生成的目标轨迹预测模型新增存储至模型库中；接收模块，用于接收与第二驾驶场景关联的第二场景信息，第二场景信息包括：在第二驾驶场景下，第二主障碍物的第二运动特性信息、第二主障碍物所在车道的第二交通指示信息、第二环境障碍物的第二相对运动信息，其中，第二驾驶场景对应目标任务类别；第二调用模块，用于从多个轨迹预测模型中调用与目标任务类别对应的目标轨迹预测模型；预测模块，用于将第二场景信息输入目标轨迹预测模型，通过目标轨迹预测模型输出：在第二驾驶场景下第二主障碍物的预测轨迹信息。

根据本公开的实施例，其中，第一调参模块603包括第一输入输出单元、获取单元、第一计算单元、调参单元。

其中，第一输入输出单元，用于将第一场景信息输入基础轨迹预测模型，输出第一主障碍物的参考轨迹信息；获取单元，用于获取第一主障碍物的采样轨迹信息；第一计算单元，用于根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息，计算得到目标任务类别对应的损失值；调参单元，用于基于目标任务类别对应的损失值，对调参模型的参数进行更新，得到目标调参模型。

根据本公开的实施例，其中，第一计算单元包括第一计算子单元、第一确定子单元、第二计算子单元。

其中，第一计算子单元，用于根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息，计算得到第一主障碍物的平均位移误差和终点位移误差；第一确定子单元，用于根据第一驾驶场景对应的驾驶场景类别，确定平均位移误差对应的第一权重，以及确定终点位移误差对应的第二权重；第二计算子单元，用于根据平均位移误差、终点位移误差、第一权重、第二权重，计算得到目标任务类别对应的损失值。

根据本公开的实施例，其中：第一主障碍物的第一运动特性信息包括：第一主障碍物的类别，以及第一主障碍物在目标时间节点之前的参考速度信息和参考位置信息。第一主障碍物所在车道的第一交通指示信息包括：第一主障碍物所在车道的车道线指向信息，以及第一主障碍物所在车道的交通信号灯状态信息。第一环境障碍物的第一相对运动信息包括：第一环境障碍物与第一主障碍物的之间的相对距离，以及第一环境障碍物相对于第一主障碍物的相对速度。

基于上述模型训练方法，本公开还提供了一种模型训练装置。以下将结合图7对该装置进行详细描述。

图7示意性示出了根据本公开实施例的模型训练装置的结构框图。

如图7所示，该实施例的模型训练装置700包括获取模块701、训练模块702。

其中，获取模块701，用于获取与多个任务类别对应的多个任务样本集，其中，各任务样本集包括与多个历史驾驶场景关联的多组历史样本信息，各组历史样本信息包括在各自历史驾驶场景下，主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、主障碍物历史轨迹信息、环境障碍物历史相对运动信息.

训练模块702，用于基于元学习算法，利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新，得到训练得到的调参模型和多个轨迹预测模型，其中，多个轨迹预测模型与多个任务类别一一对应，其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

根据本公开的实施例，通过获取模块701获取到的多个任务样本集对应多个不同的任务类别，通过将数据集分解为不同的任务，可学习任务类别变化的情况下模型的泛化能力，因此，通过训练模块702训练得到的模型能够适应多种不同的任务场景下障碍物的轨迹预测。另外，通过训练模块702基于元学习算法进行模型训练，训练完成后不仅可得到多个轨迹预测模型，最重要的是可训练得到调参模型，基于元学习策略得到的调参模型可让轨迹预测模型自动学习超参数，而不是人为根据场景和障碍物类型进行手动调参。通过训练好的调参模型对轨迹预测模型的超参数进行微调，可得到适用于任意新任务场景的轨迹预测模型，面对全新的场景，只需要通过一步或少数几步调参，就可以适配新场景的预测任务，较大程度上缩短模型的训练周期，提高了轨迹预测的时效性。

根据本公开的实施例，其中，各任务样本集中的多组历史样本信息被分类为训练样本组和测试样本组，训练模块702包括第一更新子模块、确定子模块、第二更新子模块、迭代子模块。

其中，第一更新子模块，用于基于第n个任务样本集中的训练样本组，以及第n-1次更新后的待训练调参模型，对待训练轨迹预测模型的参数进行更新，得到与第n个任务类别对应的第n个轨迹预测模型；确定子模块，用于基于第n个任务样本集中测试样本组和第n个轨迹预测模型，确定第n个任务类别对应的损失值；第二更新子模块，用于基于第n个任务类别对应的损失值，对待训练调参模型的参数进行第n次更新。

迭代子模块，用于迭代执行：基于第n+1个任务样本集中的训练样本组，以及第n次更新后的待训练调参模型，对待训练轨迹预测模型的参数进行更新得到第n+1个轨迹预测模型、基于第n+1个任务样本集中测试样本组和第n+1个轨迹预测模型确定第n+1个任务类别对应的损失值、基于第n+1个任务类别对应的损失值对待训练调参模型的参数进行第n+1次更新的操作，直至多个任务类别对应的损失值之和小于预设阈值，得到训练得到的调参模型和多个轨迹预测模型。

根据本公开的实施例，其中，多个历史驾驶场景分类为历史训练驾驶场景和历史测试驾驶场景，历史训练驾驶场景和训练样本组关联，历史测试驾驶场景和测试样本组关联。

确定子模块包括第二输入输出单元、第二计算单元。

其中，第二输入输出单元，用于将第n个任务样本集中测试样本组的主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、环境障碍物历史相对运动信息，输入第n个轨迹预测模型，输出第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，其中第n组历史测试驾驶场景为：与第n个任务样本集中测试样本组关联的多个历史训练驾驶场景；第二计算单元，用于根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息，计算得到第n个任务类别对应的损失值。

根据本公开的实施例，其中，第二计算单元包括第三计算子单元、第二确定子单元、第四计算子单元。

其中，第三计算子单元，用于根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息，计算得到与第n个任务类别关联的样本平均位移误差和样本终点位移误差；第二确定子单元，根据第n组历史测试驾驶场景对应的驾驶场景类别，确定样本平均位移误差对应的样本第一权重，以及确定样本终点位移误差对应的样本第二权重；第四计算子单元，用于根据与第n个任务类别关联的样本平均位移误差、样本终点位移误差、样本第一权重、样本第二权重，计算得到第n个任务类别对应的损失值。

根据本公开的实施例，确定模块601、第一调用模块602、第一调参模块603和第二调参模块604，或者获取模块701和训练模块702中的任意多个模块可以合并在一个模块中实现，或者其中的任意一个模块可以被拆分成多个模块。或者，这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合，并在一个模块中实现。根据本公开的实施例，确定模块601、第一调用模块602、第一调参模块603和第二调参模块604，或者获取模块701和训练模块702中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，确定模块601、第一调用模块602、第一调参模块603和第二调参模块604，或者获取模块701和训练模块702中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

如图8所示，根据本公开实施例的电子设备800包括处理器801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM803中，存储有电子设备800操作所需的各种程序和数据。处理器801、ROM802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例，电子设备800还可以包括输入/输出(I/O)接口805，输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至I/O接口805的以下部件中的一项或多项：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

根据本公开的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质，例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如，根据本公开的实施例，计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。

本公开的实施例还包括一种计算机程序产品，其包括计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时，该程序代码用于使计算机系统实现本公开实施例所提供的轨迹预测模型生成方法或模型训练方法。

在该计算机程序被处理器801执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例，上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。

在一种实施例中，该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中，该计算机程序也可以在网络介质上以信号的形式进行传输、分发，并通过通信部分809被下载和安装，和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时，执行本公开实施例的系统中限定的上述功能。根据本公开的实施例，上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

根据本公开的实施例，可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码，具体地，可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java，C++，python，“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

以上对本公开的实施例进行了描述。但是，这些实施例仅仅是为了说明的目的，而并非为了限制本公开的范围。尽管在以上分别描述了各实施例，但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围，本领域技术人员可以做出多种替代和修改，这些替代和修改都应落在本公开的范围之内。

Claims

1.一种轨迹预测模型生成方法，包括：

根据与第一驾驶场景关联的第一场景信息，确定与所述第一驾驶场景对应的目标任务类别；

在确定模型库中预存的多个轨迹预测模型中不包含与所述目标任务类别对应的目标轨迹预测模型情况下，从所述模型库中调用调参模型，以及从所述多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型；

基于所述第一场景信息对所述调参模型的参数进行更新，得到目标调参模型；

利用所述目标调参模型对所述基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型。

2.根据权利要求1所述的方法，还包括：

将生成的所述目标轨迹预测模型新增存储至所述模型库中；

接收与第二驾驶场景关联的第二场景信息，所述第二场景信息包括：在第二驾驶场景下，第二主障碍物的第二运动特性信息、第二主障碍物所在车道的第二交通指示信息、第二环境障碍物的第二相对运动信息，其中，所述第二驾驶场景对应所述目标任务类别；

从所述多个轨迹预测模型中调用与所述目标任务类别对应的所述目标轨迹预测模型；

将所述第二场景信息输入所述目标轨迹预测模型，通过所述目标轨迹预测模型输出：在所述第二驾驶场景下所述第二主障碍物的预测轨迹信息。

3.根据权利要求1所述的方法，其中，基于所述第一场景信息对所述调参模型的参数进行更新，得到目标调参模型包括：

将所述第一场景信息输入所述基础轨迹预测模型，输出所述第一主障碍物的参考轨迹信息；

获取所述第一主障碍物的采样轨迹信息；

根据所述第一主障碍物的参考轨迹信息以及所述第一主障碍物的采样轨迹信息，计算得到所述目标任务类别对应的损失值；

基于所述目标任务类别对应的损失值，对所述调参模型的参数进行更新，得到目标调参模型。

4.根据权利要求3所述的方法，其中，根据所述第一主障碍物的参考轨迹信息以及所述第一主障碍物的采样轨迹信息，计算得到所述目标任务类别对应的损失值包括：

根据所述第一主障碍物的参考轨迹信息以及所述第一主障碍物的采样轨迹信息，计算得到所述第一主障碍物的平均位移误差和终点位移误差；

根据所述第一驾驶场景对应的驾驶场景类别，确定所述平均位移误差对应的第一权重，以及确定所述终点位移误差对应的第二权重；

根据所述平均位移误差、所述终点位移误差、所述第一权重、所述第二权重，计算得到所述目标任务类别对应的损失值。

5.根据权利要求1-4任一项所述的方法，其中：

其中，所述第一场景信息包括：在第一驾驶场景下，第一主障碍物的第一运动特性信息、第一主障碍物所在车道的第一交通指示信息、第一环境障碍物的第一相对运动信息；

所述第一主障碍物的第一运动特性信息包括：所述第一主障碍物的类别，以及所述第一主障碍物在目标时间节点之前的参考速度信息和参考位置信息；

所述第一主障碍物所在车道的第一交通指示信息包括：所述第一主障碍物所在车道的车道线指向信息，以及所述第一主障碍物所在车道的交通信号灯状态信息；

所述第一环境障碍物的第一相对运动信息包括：所述第一环境障碍物与所述第一主障碍物的之间的相对距离，以及所述第一环境障碍物相对于所述第一主障碍物的相对速度。

6.一种模型训练方法，包括：

获取与多个任务类别对应的多个任务样本集，其中，各所述任务样本集包括与多个历史驾驶场景关联的多组历史样本信息；

基于元学习算法，利用所述多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新，得到训练得到的调参模型和多个轨迹预测模型，其中，所述多个轨迹预测模型与所述多个任务类别一一对应，其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

7.根据权利要求6所述的方法，其中，各所述任务样本集中的多组历史样本信息被分类为训练样本组和测试样本组，利用所述多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新包括：

基于第n个任务样本集中的所述训练样本组，以及第n-1次更新后的待训练调参模型，对所述待训练轨迹预测模型的参数进行更新，得到与第n个任务类别对应的第n个轨迹预测模型；

基于第n个任务样本集中所述测试样本组和所述第n个轨迹预测模型，确定第n个任务类别对应的损失值；

基于第n个任务类别对应的损失值，对所述待训练调参模型的参数进行第n次更新；

迭代执行：基于第n+1个任务样本集中的所述训练样本组，以及第n次更新后的待训练调参模型，对所述待训练轨迹预测模型的参数进行更新得到第n+1个轨迹预测模型、基于第n+1个任务样本集中所述测试样本组和所述第n+1个轨迹预测模型确定第n+1个任务类别对应的损失值、基于第n+1个任务类别对应的损失值对所述待训练调参模型的参数进行第n+1次更新的操作，直至所述多个任务类别对应的损失值之和小于预设阈值，得到训练得到的调参模型和多个轨迹预测模型。

8.根据权利要求7所述的方法，其中：

各组所述历史样本信息包括在各自历史驾驶场景下，主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、主障碍物历史轨迹信息、环境障碍物历史相对运动信息；

所述多个历史驾驶场景分类为历史训练驾驶场景和历史测试驾驶场景，所述历史训练驾驶场景和所述训练样本组关联，所述历史测试驾驶场景和所述测试样本组关联；

基于第n个任务样本集中所述测试样本组和所述第n个轨迹预测模型，确定第n个任务类别对应的损失值包括：

将所述第n个任务样本集中所述测试样本组的所述主障碍物历史运动特性信息、所述主障碍物所在车道的历史交通指示信息、所述环境障碍物历史相对运动信息，输入所述第n个轨迹预测模型，输出第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，其中所述第n组历史测试驾驶场景为：与所述第n个任务样本集中所述测试样本组关联的多个历史训练驾驶场景；

根据所述第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与所述第n组历史测试驾驶场景下的所述主障碍物历史轨迹信息，计算得到第n个任务类别对应的损失值。

9.根据权利要求8所述的方法，其中，根据所述第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与所述第n组历史测试驾驶场景下的所述主障碍物历史轨迹信息，计算得到第n个任务类别对应的损失值包括：

根据所述第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息，以及与所述第n组历史测试驾驶场景下的所述主障碍物历史轨迹信息，计算得到与所述第n个任务类别关联的样本平均位移误差和样本终点位移误差；

根据所述第n组历史测试驾驶场景对应的驾驶场景类别，确定所述样本平均位移误差对应的样本第一权重，以及确定所述样本终点位移误差对应的样本第二权重；

根据与所述第n个任务类别关联的所述样本平均位移误差、所述样本终点位移误差、所述样本第一权重、所述样本第二权重，计算得到第n个任务类别对应的损失值。

10.一种轨迹预测模型生成装置，包括：

确定模块，用于根据与第一驾驶场景关联的第一场景信息，确定与所述第一驾驶场景对应的目标任务类别；

第一调用模块，用于在确定模型库中预存的多个轨迹预测模型中不包含与所述目标任务类别对应的目标轨迹预测模型情况下，从所述模型库中调用调参模型，以及从所述多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型；

第一调参模块，用于基于所述第一场景信息对所述调参模型的参数进行更新，得到目标调参模型；

第二调参模块，用于利用所述目标调参模型对所述基础轨迹预测模型的参数进行调整，生成目标轨迹预测模型。

11.一种模型训练装置，包括：

获取模块，用于获取与多个任务类别对应的多个任务样本集，其中，各所述任务样本集包括与多个历史驾驶场景关联的多组历史样本信息；

训练模块，用于基于元学习算法，利用所述多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新，得到训练得到的调参模型和多个轨迹预测模型，其中，所述多个轨迹预测模型与所述多个任务类别一一对应，其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

12.一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行根据权利要求1～5或者6-9中任一项所述的方法。

13.一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行根据权利要求1～5或者6-9中任一项所述的方法。

14.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据权利要求1～5或者6-9中任一项所述的方法。