CN114996659A

CN114996659A - 一种具有持续学习能力的车辆轨迹预测方法及系统

Info

Publication number: CN114996659A
Application number: CN202210880748.XA
Authority: CN
Inventors: 龚建伟; 林云龙; 李子睿; 龚乘; 臧政; 齐建永; 何刚; 吕超
Original assignee: Huidong Planet Beijing Technology Co ltd; Beijing Institute of Technology BIT
Current assignee: Huidong Planet Beijing Technology Co ltd; Beijing Institute of Technology BIT
Priority date: 2022-07-26
Filing date: 2022-07-26
Publication date: 2022-09-02
Anticipated expiration: 2042-07-26
Also published as: CN114996659B

Abstract

本发明涉及一种具有持续学习能力的车辆轨迹预测方法及系统，先采集当前场景的交通数据并进行数据预处理，得到包含当前场景中各车辆的位置坐标、车辆ID以及时间戳信息的轨迹数据；保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，基于条件Kullback‑Leibler散度对记忆模块中所存储的各交通场景数据进行场景差异性分析；根据分析结果，获取各历史场景可用的记忆数据量；根据记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型；在连续交通场景下，利用训练好的模型对周围车辆的未来轨迹进行预测。本发明使车辆轨迹预测模型在连续场景下具备持续学习轨迹预测任务的能力，有效缓解轨迹预测模型的灾难性遗忘。

Description

一种具有持续学习能力的车辆轨迹预测方法及系统

技术领域

本发明涉及车辆自动驾驶领域，尤其涉及一种具有连续交通场景下持续学习能力的车辆轨迹预测方法及系统。

背景技术

目前，随着交通参与者数目的不断增加，路况信息日趋复杂。在复杂和动态交通环境中，对周边车辆的未来轨迹进行预测，对智能车辆的行为决策以及运动规划有着关键作用，可以认为，对周围车辆进行轨迹预测是发展智能车辆的一项重要技术。

现有的基于深度学习的轨迹预测方法为提高预测精度和模型表现，多选择增加、丰富训练数据集中场景数量与覆盖范围。此类方法对于模型复杂度、模型训练和收敛时间要求较高，在新的、连续变化的场景中难以利用历史场景和数据训练所得到的知识和经验进行高效的场景理解与知识表征。同时，由于深度学习模型是通过更新人工神经网络权重，以期获得当前训练数据下最小的训练损失，这样的训练机制将导致用当前数据训练出的模型在先前已学习过的、但不包含于当前训练数据的场景中往往表现出较低的预测精度，这一现象属于深度学习领域中“灾难性遗忘”问题。考虑智能车辆在多个交通场景中连续驾驶的实际应用背景，现有的轨迹预测方法存在较大局限性，实用性不强。

发明内容

本发明的目的是提供一种具有持续学习能力的车辆轨迹预测方法及系统，用于解决现有的轨迹预测方法在连续的交通场景中执行轨迹预测任务时，预测精度低，实用性不强的问题。

为实现上述目的，本发明提供了如下方案：

一种具有持续学习能力的车辆轨迹预测方法，所述方法包括：

S1.采集连续交通场景下的当前场景的交通数据并进行数据预处理，得到包含当前场景中各车辆的位置坐标、车辆ID以及时间戳信息的轨迹数据；所述车辆ID是用于区别所采集的数据中不同车辆的标签，所述时间戳信息指用于采集数据的传感器设备采集每一帧数据时所对应的时间，所述连续交通场景指车辆行驶经过的大于或等于两个不同的交通场景，所述交通场景包括高速公路场景、城市十字路口场景以及城市环岛场景；

S2.保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析，得到差异性分析结果；

S3.根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量；根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型；

S4.在连续交通场景下，利用训练好的车辆轨迹预测模型对周围车辆的未来轨迹进行预测。

进一步地，步骤S2中所述保存部分当前场景的轨迹数据至记忆模块并标注数据的场景来源，具体包括：假设在连续场景中车辆已行驶过

个场景，当前场景为第T个场景。首先设置记忆模块可存储的样本数量上限

，在连续场景中驾驶车辆，每当车辆进入新的交通场景后，将从该场景的训练数据中随机选取

（“

”表示向下取整）份轨迹数据样本存储于记忆模块，同时，为避免记忆模块中的数据溢出，记忆模块将随机删除部分记忆模块中已有的历史场景数据，使得在每一次存储结束后，记忆模块中保存自各场景的轨迹数据样本数目均为

；为区别记忆模块中来自不同交通场景的轨迹数据，在每次存储结束后，用当场景在连续场景中出现的顺序序号对当前场景数据进行标注。

基于上述记忆模块中轨迹数据的存储与标注，步骤S2中所述的基于条件Kullback-Leibler散度（Conditional Kullback-Leibler Divergence, CKLD）对记忆模块中所存储的各交通场景数据进行场景差异性分析，具体包括：设每一轨迹数据样本记录了时长为t的车辆轨迹信息，其中

表示目标车辆及其周边车辆用于模型观测的历史信息时间范围，t _f表示待模型预测的轨迹所对应的时间范围。设Y表示目标车辆在t _f时间内的未来轨迹，X表示样本中所有车辆在t _n时间范围内的历史轨迹，车辆轨迹间的时空依赖可用条件概率密度函数

来描述；本方法假设一个场景的轨迹数据样本是独立同分布的，均来自于一个未知分布，并使用高斯混合模型估计轨迹数据的条件概率密度函数，高斯混合模型可用如下公式描述：

上述公式中m为高斯混合模型中高斯分布的数量，

为混合系数，

为数学期望，

为方差，

的表达式为：

上述表达式中的混合系数、数学期望以及方差通过训练混合密度网络进行估计。所述混合密度网络由一个多层感知机（Multilayer Perceptron，MLP）与三组全连接层组成，其中多层感知机用于对轨迹数据样本进行特征编码，全连接层用于输出估计的参数。具体地，在对多层感知机输入样本X后，由多层感知机对样本进行编码，编码后得到特征Z。接着，将特征Z输入至三组全连接层（全连接层用符号“FC”表示），三组全连接层分别输出估计的高斯混合模型的混合系数、数学期望以及方差。需要指出的是，一种柔性最大值传输函数（Softmax Function）被用于保证高斯混合模型的混合系数加和为1，具体公式如下：

其中下标i与j表示向量组成。此外，还需保证方差为正，令：

用于训练混合密度网络的损失函数为：

。

使用上述方法得到各场景轨迹数据的条件概率分布后，通过蒙特卡洛采样计算出两两场景间的Kullback-Leibler散度（Kullback-Leibler Divergence, KLD），进一步基于KLD进行CKLD的计算。具体地，假设待分析的两个场景所对应的条件概率密度函数分别为

与

，并设

中共有

个样本，则对于每一个

上的样本条件

而言，

与

间的KLD计算公式如下：

其中

是通过蒙特卡洛采样方法从

中采样得到的轨迹数据样本，

表示蒙特卡洛采样的样本总数。进一步地，CKLD由如下公式计算得到：

得到记忆模块中各场景两两间的CKLD后，进一步基于CKLD结果进行场景差异性分析。

进一步地，所述场景差异性分析，具体内容包括：由于CKLD可度量两个数据分布间的差异性，两个数据分布间的CKLD越大，则表明两个数据分布的差异越大。基于上述原理，对不同场景进行差异性大小的分析——两场景间的CKLD结果数值越大则表明两个场景间差异越大，反之，CKLD越小，则表示两个相同场景的差异性越小。在本发明所设计的动态梯度场景记忆方法中，场景差异性分析将用于动态调整记忆模块中各历史场景轨迹数据在模型训练中的使用量，以提高模型训练效率、优化在连续场景下执行轨迹预测任务的效果。

进一步地，所述步骤S3中基于场景差异性分析，动态分配各历史场景可用的记忆数据量，具体内容包括：假设车辆已经过连续交通场景中的T个场景，当前场景为第T个场景，首先，设置历史场景轨迹数据总使用量上限为

，并用

表示当前场景T对第k个历史场景的CKLD。设各个历史场景可用的记忆数据量分别为

，

计算方式如下：

进一步地，所述基于各历史场景可用记忆数据，通过本发明所提出的动态梯度场景记忆方法训练车辆轨迹预测模型，具体内容包括：

本发明所提出的动态梯度场景记忆方法适用于使用“随机梯度下降法”更新模型参数的深度学习轨迹预测模型，模型的网络结构可为——基于卷积神经网络、图卷积神经网络、长短时记忆（Long Short-Term Memory, LSTM）神经网络，或基于上述三种神经网络类型进行综合设计的神经网络模型。第一步，基于历史场景可用记忆数据，定义各个历史场景的历史场景损失函数，具体地，设轨迹预测模型为

（下标

表示轨迹预测模型中的网络权重，下述简称为模型参数），其中的

和

分别表示

与

时间内的轨迹信息；定义第

个历史场景的损失函数为：

其中，l表示损失函数；

第二步，使用当前场景的训练数据对轨迹预测模型进行训练，设当前场景训练数据样本为（x,T,y），并定义模型参数更新的约束条件:

其中，minimize表示求最小值，subject to表示服从于，

表示的是参数更新后的模型，

为参数更新前的模型，上述公式表示——在使用当前场景训练数据寻找能使当前场景损失函数最小化的模型参数同时，需要满足“所有的历史场景损失函数在模型参数更新后不增大”的约束条件。设置足够小的随机梯度下降步长，使得损失函数可视作局部线性，从梯度下降法的角度考虑，需要解决的问题可等价转换为：

其中，g表示使用当前场景数据计算的损失函数梯度；g _k表示使用第k个历史场景数据计算出的历史损失函数梯度，

表示求向量g与g _k的内积，for all k<T表示对于所有小于T的k都需要满足

即分别求出当前场景数据的损失函数梯度与历史场景损失函数的梯度，并将二者做内积运算，对于所有历史场景损失函数而言，若能够满足内积结果非负，即可满足上述约束条件。

若满足约束条件，则直接使用随机梯度下降法进行参数更新。具体地，设随机梯度下降法的学习率为

，更新前后的参数分别为

，则有：

若不满足约束条件，则使用二次规划的方法给出建议的梯度

定义为将当前场景数据损失函数梯度投影到满足约束条件且以L2范数平方作为度量的最近梯度上所得的向量：

具体地，本方法使用二次规划给出建议的梯度

——首先，给出满足约束条件的模型参数更新方向对应的二次规划原始问题：

其中，z为待最小化的目标函数，上标T表示转置（下同），矩阵G的元素为所有历史场景损失函数的梯度，即

；进一步，给出上述二次规划问题的对偶问题：

求解出上述对偶问题的解

，即得到所建议的梯度

。最后，使用

取代随机下降法中所计算的梯度g，进行模型参数的更新：

本发明还提供一种具有持续学习能力的车辆轨迹预测系统，包括：

轨迹数据采集模块，用于采集连续交通场景下的当前场景的交通数据并进行数据预处理，得到包含当前场景中各车辆的位置坐标、车辆ID以及时间戳信息的轨迹数据；所述车辆ID是用于区别所采集的数据中不同车辆的标签，所述时间戳信息指用于采集数据的传感器设备采集每一帧数据时所对应的时间，所述连续交通场景指车辆行驶经过的大于或等于两个不同的交通场景，所述交通场景包括高速公路场景、城市十字路口场景以及城市环岛场景；

差异性分析模块，用于保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析，得到差异性分析结果；

模型训练模块，用于根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量；根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型；

轨迹预测模块，用于在连续交通场景下，利用训练好的车辆轨迹预测模型对周围车辆的未来轨迹进行预测。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明提供的车辆轨迹预测方法及系统，首先采集当前场景的交通数据并进行数据预处理，得到包含当前场景中各车辆的位置坐标、车辆ID以及时间戳信息的轨迹数据；然后保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析；根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量；根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型；最后，在连续交通场景下，利用训练好的车辆轨迹预测模型对周围车辆的未来轨迹进行预测。本发明上述方法使得车辆轨迹预测模型在连续场景下具备持续学习轨迹预测任务的能力，有效缓解轨迹预测模型的灾难性遗忘。发明所考虑的“连续场景下的轨迹预测任务”更加符合真实驾驶情况，所提出的可持续学习轨迹预测模型更符合实际应用需求，具有很高的实用性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1提供的车辆轨迹预测方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的目的是提供一种具有持续学习能力的车辆轨迹预测方法，使得车辆轨迹预测模型在连续场景下具备持续学习轨迹预测任务的能力，有效缓解轨迹预测模型的灾难性遗忘。

在连续场景下执行车辆轨迹预测任务时出现的灾难性遗忘”指的是使用当前交通场景数据对轨迹预测模型进行训练后，轨迹预测模型在先前已学习过的历史场景数据中测试时，预测精度大幅度下降的现象。此现象将导致的问题包括但不限于——当车辆重新驶入历史场景时，为获得足够高的轨迹预测精度，需要使用历史场景数据对模型重新训练，不利于模型在连续场景下的高效应用。本发明使得车辆轨迹预测模型在连续场景下具备持续学习轨迹预测任务的能力，有效缓解轨迹预测模型的灾难性遗忘；发明所考虑的“连续场景下的轨迹预测任务”更加符合真实驾驶情况，所提出的可持续学习轨迹预测模型更符合实际应用需求，具有很高的实用性。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

本实施例提供一种具有持续学习能力的车辆轨迹预测方法，请参阅图1，所述方法包括：

S1、采集连续交通场景下的当前场景的交通数据并进行数据预处理，得到包含当前场景中各车辆的位置坐标、车辆ID以及时间戳信息的轨迹数据；

需要首先进行说明的有：本发明考虑的实际应用背景为——应用本发明所提出的轨迹预测方法的自动驾驶车辆在多个交通场景中驾驶的情况。步骤S1中，所述车辆ID是用于区别所采集的数据中不同车辆的标签，所述时间戳信息指用于采集数据的传感器设备采集每一帧数据时所对应的时间，所述连续交通场景指车辆行驶经过的大于或等于两个不同的交通场景，包括高速公路场景、城市十字路口场景以及城市环岛场景等。本实施例中，将车辆目前所处的交通场景称为“当前场景”，其余交通场景称为“历史场景”。不同场景的“不同”即场景间的差异程度，可由本发明下述步骤S2中所述场景差异性分析方法进行定量评价，具体方法将在说明书下面的部分中进行详细阐述。

上述步骤S1具体包括：使用无人机或路侧单元传感器采集交通场景的俯拍数据。在俯拍视角的场景中选定一个坐标原点O，建立x-O-y平面直角坐标系，所述各车辆的位置坐标包含本车在内的所有车辆中心位置在x-O-y直角坐标系下的坐标点(x,y)，单位为米，精确到小数点后三位；车辆ID用于区分场景中不同车辆，可使用阿拉伯数字对不同车辆进行标注，不同的车辆所使用的车辆ID数字不同；所述时间戳信息指传感器采集每一帧数据信息所对应的时间，以开始采集数据的时刻为计时原点，用毫秒作为单位；所述轨迹数据，针对每一车辆而言，由上述不同时间戳信息下所采集到的车辆位置坐标点组成的具有时序意义的坐标点集表示，车辆ID同时用于区分来自于不同车辆的轨迹数据。

S2、保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析，得到差异性分析结果。

作为一个具体的实施例，所述保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，具体包括：假设在连续场景中车辆已行驶过5个场景，车辆当前所处的场景为第5个场景，即定义连续场景中（按照车辆驾驶所经过的次序）前4个场景为“历史场景”，第5个场景为“当前场景”。首先设置记忆模块可存储的样本数量上限为3500，即记忆模块中最多可存储1000份轨迹数据样本；在连续场景中驾驶车辆，每当车辆进入新的交通场景后，将从该场景的训练数据中随机选取

（“

”表示向下取整）即700份轨迹数据样本存储于记忆模块，同时，为避免记忆模块中的数据溢出，记忆模块将随机删除部分记忆模块中已有的历史场景数据，使得在每一次存储结束后，记忆模块中保存自各场景的轨迹数据样本数目均为700。为区别记忆模块中来自不同交通场景的轨迹数据，在每次存储结束后，用当场景在连续场景中出现的顺序序号对当前场景数据进行标注，即对来自于4个历史场景的轨迹数据分别添加“1、2、3、4”的标注，对当前场景标注数字“5”。

作为一个具体的实施例，所述基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析，得到差异性分析结果，具体包括：

设每一轨迹数据样本记录了时长为t的车辆轨迹信息，其中

表示目标车辆及其周边车辆用于模型观测的历史信息时间范围，

表示待模型预测的轨迹所对应的时间范围。具体地，取总时间跨度t为6秒，

为2秒，

为4秒；即模型将观察所有车辆2秒的历史轨迹数据，预测目标车未来4秒内的轨迹。设Y表示目标车辆在4秒（

）时间内的未来轨迹，X表示样本中所有车辆在2秒（

）时间范围内的历史轨迹，车辆轨迹间的时空依赖可用条件概率密度函数

来描述；本发明假设一个场景的轨迹数据样本是独立同分布的，均来自于一个未知分布，并使用高斯混合模型估计轨迹数据的条件概率密度函数，高斯混合模型可用如下公式描述：

上述公式中m为高斯混合模型中高斯分布的数量，例如设m为20；

为混合系数，

为数学期望，

为方差，

的表达式为：

用于训练混合密度网络的损失函数为：

。

与

，并设

中共有

个样本，则对于每一个

上的样本条件

而言，

与

间的KLD计算公式如下：

其中

是通过蒙特卡洛采样方法从

中采样得到的轨迹数据样本，

作为本发明的一种具体实施方式，所述场景差异性分析，具体内容包括：由于CKLD可度量两个数据分布间的差异性，两个数据分布间的CKLD越大，则表明两个数据分布的差异越大。基于上述原理，对不同场景进行差异性大小的分析——两场景间的CKLD结果数值越大则表明两个场景间差异越大，反之，CKLD越小，则表示两个相同场景的差异性越小。例如，表1展示了实施例中所计算的当前场景数据相对于连续场景中各场景的CKLD值，粗体显示的结果表示最大的CKLD：

表1.场景5（当前场景）相对于连续场景中各场景的CKLD

对比场景	场景1	场景2	场景3	场景4	场景5
						CKLD	15.85	18.92	214.89	84.71	0

由表1的结果，进行场景差异性分析：与当前场景差异最大的历史场景为“场景3”，当前场景相对于“场景1”与“场景2”CKLD数值较小，即表示当前场景与“场景1”、“场景2”相似性较高，差异较小，由于场景5即为当前场景，计算出的CKLD为0，CKLD为0即表示两个场景间无差异。在本发明所设计的动态梯度场景记忆方法中，场景差异性分析将用于动态调整记忆模块中各历史场景轨迹数据在模型训练中的使用量，以提高模型训练效率、优化在连续场景下执行轨迹预测任务的效果。

S3、根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量；根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型。

作为本发明的一种具体实施方式，所述步骤S3中根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量，具体包括：首先，设置历史场景轨迹数据总使用量上限为

，取

，并用

表示当前场景T对第k个历史场景的CKLD，依据上述假设及表1，其中T为5且

。设各个历史场景可用的记忆数据量分别为

，

计算方式如下：

则代入数据，计算结果分别为

。

作为本发明的一种具体实施方式，所述步骤S3中根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型，具体包括：

本发明所提出的动态梯度场景记忆方法适用于使用“随机梯度下降法”更新模型参数的深度学习轨迹预测模型，在本实施例中，选用基于图卷积神经网络的轨迹预测模型对车辆未来轨迹进行预测。第一步，基于历史场景可用记忆数据，定义各个历史场景的历史场景损失函数，具体地，轨迹预测模型用

（下标

表示轨迹预测模型中的网络权重，下述简称为模型参数）表示，

和

分别表示

（2秒）与

（4秒）时间内的轨迹信息；定义第k(k=1,2,…,4)个历史场景的损失函数为：

。

第二步，使用当前场景的训练数据对轨迹预测模型进行训练，设当前场景训练数据样本为

，并定义模型参数更新的约束条件：

其中

表示的是参数更新后的模型，

，更新前后的参数分别为

与

，则有：

若不满足约束条件，则使用二次规划的方法给出建议的梯度

，

具体地，本发明使用二次规划给出建议的梯度

；进一步，给出上述二次规划问题的对偶问题：

求解出上述对偶问题的解

，即得到所建议的梯度

。最后，使用

取代随机下降法中所计算的梯度g，进行模型参数的更新：

S4、在连续交通场景下，利用训练好的车辆轨迹预测模型对周围车辆的未来轨迹进行预测。

步骤S4中所述在连续交通场景下，使用S3中所训练的车辆轨迹预测模型对周围车辆的未来轨迹进行预测，具体内容包括：假设在连续场景中驾驶，对于轨迹预测模型，仅当前场景的完整训练数据以及本发明所述记忆模块中的数据是可获得的；轨迹预测模型仅在进入新的场景时使用上述方法进行模型训练学习。而对于已学习过的场景，当再次驶入时，无需对模型进行重新训练，可直接使用当前的模型对周边车辆未来轨迹进行预测。

本技术方案的有益效果如下：首先，基于本发明方法所设计的记忆模块及记忆模块中所存储的数据，定义了训练约束条件，并给出了训练过程中轨迹预测模型参数更新的方式。这样的训练方式使得模型具备了在连续的交通场景中应用时，能够具备持续学习车辆轨迹预测任务的能力——即在训练过程中，即便所使用的训练集仅包含当前场景的轨迹数据，模型在所有历史场景中也将有较高的预测精度；而现有的基于深度学习的车辆轨迹预测方法，由于模型参数的更新机制在于最小化当前场景训练数据上的损失函数，往往出现在与当前场景差异较大的历史场景中预测精度大幅度下降的问题，即机器学习领域中的“灾难性遗忘”；较之现有的轨迹预测方法，本发明所公开的方法具有更好的实用性。

其次，本发明所公开的方法可应用于多类以随机梯度下降法更新参数的深度学习轨迹预测模型，而不严格限制轨迹预测模型所用的模型网络结构，因此，本发明所公开的方法具有很好的推广性与很高的应用价值。

最后，本发明所公开的方法中，包含一个基于条件Kullback-Leibler散度的场景差异性定量分析方法。同时，由于调用不同数量的历史场景轨迹数据进行损失函数的计算，与计算时间开销相关，合理地调用历史场景数据进行损失函数的计算将减小计算成本，优化预测表现；因此，本发明基于所述的场景差异性定量分析方法，依据当前场景与各历史场景的差异性大小，对记忆模块中的历史场景数据进行了训练过程可使用数据量的动态分配，提高了方法的执行效率、优化了方法的预测表现。

实施例2

本实施例提供一种具有持续学习能力的车辆轨迹预测系统，包括：

轨迹数据采集模块M1，用于采集连续交通场景下的当前场景的交通数据并进行数据预处理，得到包含当前场景中各车辆的位置坐标、车辆ID以及时间戳信息的轨迹数据；所述车辆ID是用于区别所采集的数据中不同车辆的标签，所述时间戳信息指用于采集数据的传感器设备采集每一帧数据时所对应的时间，所述连续交通场景指车辆行驶经过的大于或等于两个不同的交通场景，所述交通场景包括高速公路场景、城市十字路口场景以及城市环岛场景；

差异性分析模块M2，用于保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析，得到差异性分析结果；

模型训练模块M3，用于根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量；根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型；

轨迹预测模块M4，用于在连续交通场景下，利用训练好的车辆轨迹预测模型对周围车辆的未来轨迹进行预测。

对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种具有持续学习能力的车辆轨迹预测方法，其特征在于，包括：

采集连续交通场景下的当前场景的交通数据并进行数据预处理，得到包含当前场景中各车辆的位置坐标、车辆ID以及时间戳信息的轨迹数据；所述车辆ID是用于区别所采集的数据中不同车辆的标签，所述时间戳信息指用于采集数据的传感器设备采集每一帧数据时所对应的时间，所述连续交通场景指车辆行驶经过的大于或等于两个不同的交通场景，所述交通场景包括高速公路场景、城市十字路口场景以及城市环岛场景；

保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析，得到差异性分析结果；

根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量；根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型；

在连续交通场景下，利用训练好的车辆轨迹预测模型对周围车辆的未来轨迹进行预测。

2.根据权利要求1所述的方法，其特征在于，所述保存部分当前场景轨迹数据至记忆模块并标注数据的场景来源，具体包括：

假设在所述连续交通场景中车辆已行驶过T个场景，当前场景为第T个场景，其中

指正整数；

设置所述记忆模块可存储的样本数量最大为M，

；

当所述车辆进入新的交通场景后，从所述新的交通场景的数据中随机选取

份轨迹数据存储于所述记忆模块，并从所述记忆模块中随机删除

份已有的历史场景数据，得到新的记忆模块数据；

按照各场景在所述连续交通场景中出现的顺序对各所述场景进行编号，并利用各场景的编号对各所述场景内采集的场景数据进行标注。

3.根据权利要求1所述的方法，其特征在于，所述基于条件Kullback-Leibler散度对所述记忆模块中所存储的各交通场景数据进行场景差异性分析，得到差异性分析结果，具体包括：

利用高斯混合模型估计各所述轨迹数据的条件概率密度函数；所述高斯混合模型中的混合系数、数学期望和方差通过混合密度网络进行估计；所述混合密度网络由一个多层感知机与三组全连接层组成；所述多层感知机用于对轨迹数据样本进行特征编码，所述全连接层用于输出估计的参数；

根据各所述轨迹数据的条件概率密度函数，通过蒙特卡洛采样计算出两两交通场景间的Kullback-Leibler散度，并基于所述两两交通场景间的Kullback-Leibler散度计算所述两两交通场景间的条件Kullback-Leibler散度；

根据所述两两交通场景间的条件Kullback-Leibler散度进行两两交通场景间差异性分析，得到差异性分析结果；其中所述两两交通场景之间的条件Kullback-Leibler散度的数据越大，表明所述两两交通场景之间的差异越大；

其中，利用所述混合密度网络对所述混合系数、所述数学期望和所述方差进行估计包括：

在对多层感知机输入样本X后，由多层感知机对样本进行编码，编码后得到特征Z；将所述特征Z输入至三组所述全连接层，三组所述全连接层分别输出估计的高斯混合模型的混合系数、数学期望以及方差。

4.根据权利要求3所述的方法，其特征在于，所述根据各所述轨迹数据的条件概率密度函数，通过蒙特卡洛采样计算出两两交通场景间的Kullback-Leibler散度，并基于所述两两交通场景间的Kullback-Leibler散度计算所述两两交通场景间的条件Kullback-Leibler散度，具体包括：

假设两两所述交通场景各自的条件概率密度函数分别

与

，并设

中共有

个样本，则针对每一个

上的样本条件

，

与

之间的Kullback-Leibler散度计算公式为：

其中，KLD表示Kullback-Leibler散度，

是通过蒙特卡洛采样方法从

中采样得到的轨迹数据样本，n_mc表示蒙特卡洛采样的样本总数；

与

之间的条件Kullback-Leibler散度计算公式为：

其中，CKLD表示条件Kullback-Leibler散度。

5.根据权利要求1所述的方法，其特征在于，所述根据所述差异性分析结果，动态分配各历史场景可用的记忆数据量，具体包括：

假设车辆已经过所述连续交通场景中的T个场景，当前场景为第T个场景；设置历史场景轨迹数据总使用量最大为M _ub，并用C _T,k表示当前场景T对第k个历史场景的条件Kullback-Leibler散度，则各个历史场景可用的记忆数据量M _k的计算公式为：

其中，k=1,2,...，T-1。

6.根据权利要求1所述的方法，其特征在于，所述根据所述可用的记忆数据量，通过动态梯度场景记忆方法训练车辆轨迹预测模型，具体包括：

基于所述历史场景可用的记忆数据量，定义第k个历史场景的损失函数

；其中，

表示所述车辆轨迹预测模型，

表示轨迹预测模型中的网络权重；l表示损失函数，

和

分别表示

与

时间内的轨迹信息；

表示目标车辆及周围车辆用于模型观测的历史信息时间范围，

表示待模型预测的轨迹所对应的时间范围，

表示每一轨迹数据样本记录了时长为t的车辆轨迹信息；

使用当前场景的训练数据对所述车辆轨迹预测模型进行训练，设当前场景训练数据样本为

，并定义模型参数更新的约束条件为：

其中，minimize表示求最小值，subject to表示服从于，

表示的是参数更新后的模型，

为参数更新前的模型，所述约束条件表示：在使用当前场景训练数据寻找能使当前场景损失函数最小化的模型参数同时，需要满足“所有的历史场景损失函数在模型参数更新后不增大”的约束条件；

将所述约束条件转化为

，并记为转化约束；所述转化约束表示：对于所有历史场景损失函数，若满足当前场景轨迹数据的损失函数梯度与历史场景轨迹数据的损失函数梯度进行内积运算的运算结果非负，则满足所述约束条件；g表示使用当前场景数据计算的损失函数梯度；

表示使用第k个历史场景数据计算出的历史损失函数梯度，

表示求向量g与

的内积，for all k<T表示对于所有小于T的k都需要满足；

判断是否满足所述约束条件，得到判断结果，并根据所述判断结果进行模型参数更新；

所述根据所述判断结果进行模型参数更新，具体包括：

若所述判断结果为是，则使用随机梯度下降法进行参数更新：设随机梯度下降法的学习率为

，更新前后的参数分别为

与

，则有：

若所述判断结果为否，则使用二次规划的方法给出建议的梯度

，

所述使用二次规划的方法给出建议的梯度

，具体包括：

给定满足所述约束条件的模型参数更新方向对应的二次规划原始问题：

其中，z为待最小化的目标函数，上标

表示转置，矩阵G的元素为所有历史场景损失函数的梯度，

；

给定所述二次规划原始问题的对偶问题：

其中，v为所述对偶空间的待求向量；

求解所述对偶问题的解，从而得到所述建议的梯度

，使用所述建议的梯度

替代随机下降法中计算的梯度g，进行模型参数的更新：

。

7.一种具有持续学习能力的车辆轨迹预测系统，其特征在于，包括：