CN112949597A

CN112949597A - 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法

Info

Publication number: CN112949597A
Application number: CN202110364544.6A
Authority: CN
Inventors: 胡宏宇; 王�琦; 杜来刚; 鲁子洋
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2021-04-06
Filing date: 2021-04-06
Publication date: 2021-06-11
Anticipated expiration: 2041-04-06
Also published as: CN112949597B

Abstract

本发明公开了一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法，包括：步骤1、提取目标车辆与目标车辆周围智能体的输入特征；步骤2、通过编码器对所述输入特征进行编码，分别通过时间模式注意力与感兴趣智能体加权对目标车辆与目标车辆周围智能体进行隐藏模式的提取；步骤3、通过解码器对目标车辆的驾驶操纵类别进行识别，对目标车未来的行驶轨迹进行预测。通过提取目标车辆与目标车辆周围智能体的输入特征，并通过编码器将输入特征进行编码，分别通过时间模式注意力与感兴趣智能体加权对目标车辆的架势操纵类别进行识别，实现对目标车辆将来的行驶轨迹进行预测，提高驾驶操纵分类的准确率。

Description

一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法

技术领域

本发明涉及一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法，属于机器学习领域。

背景技术

为了做出安全且舒适的路径规划与车辆控制，自动驾驶汽车需要对周围环境与智能体进行良好的感知。随后，根据学习到的行驶上下文知识，自动驾驶汽车需要推断周围智能体的意图，并且对其轨迹做出高精确度的估计。通常来说，轨迹预测可以帮助自动驾驶汽车更好的了解周围的行驶上下文，并且帮助自动驾驶汽车做出下一步的驾驶操纵。然而，驾驶行为的多模态性与行驶上下文的复杂性使得轨迹预测面临着巨大的挑战。

实际上，驾驶意图在特定的驾驶场景下对多模态的驾驶行为有着巨大的影响。驾驶意图是由驾驶员通过短暂的决定以实现某个特定目标的一系列动作所反映。也就是说，驾驶员需要对周围的驾驶场景进行感知，并且做出合理且舒适的驾驶操纵。因此，从目标车辆的运动学参数、目标车辆与周围智能体的交互参数中提取驾驶员的驾驶意图与驾驶操纵模式可以对车辆的长期轨迹预测有着更好的帮助。

车辆轨迹预测任务也是多变量时间序列预测任务。目前，循环神经网络(recurrent neural networks(RNNs))常用于该任务中。然而，在序列分析中使用 RNNs的一个缺点是其在管理长期依赖方面的弱点，这不利于车辆轨迹的预测。原因是，驾驶员通常在驾驶意图出现时不会立即执行，而是在驾驶员做好车辆控制的准备后才会执行。根据相关文献可知，这个延迟大约在1～4秒左右。为了解决RNNs在跨时间步上能力的缺陷，采用时间模式注意力，该方法可以跨越多个时间步，十分适合轨迹预测过程中驾驶意图与操纵模式的提取，以提高预测的准确率与驾驶操纵分类精度。

现有技术中，专利CN201910876478.3公开了一种基于长短记忆网络的多重车辆的轨迹预测方法，将主车和其邻车的历史轨迹等特征作为输入，充分考虑到车辆之间的位置以及驾驶行为的相互影响，经过网络的编码解码之后，将输出的邻近车辆的未来轨迹进一步输入混合密度网络，估计出车辆位置的概率分布；专利CN201910832754.6公开了一种基于双向内核岭回归的车辆轨迹预测方法，采用滑动窗口从中获取有关行驶姿态信息的前向训练数据和后向训练数据，利用前向训练数据和后向训练数据，分别训练两个核岭回归模型，得到轨迹前向预测模型和轨迹后向预测模型；专利CN201911284048.9 公开了一种车辆轨迹预测方法及装置，该方法首先获取历史轨迹数据对应的时空图序列，时空图序列包括预设时段内按时间先后顺序排列的每个时刻对应的时空图，将时空图序列输入已训练的预测模型进行处理，得到车辆各自对应的预测行驶轨迹，预测模型基于同一时段内多个样本车辆的样本轨迹数据对应的样本时空图及样本车辆各自对应的样本行驶轨迹对长短期记忆网络 LSTM训练得到。但是以上方法都没有考虑跨越时间步的驾驶意图与操纵模式提取，从而影响到识别的准确率与驾驶操纵的识别精确度。

发明内容

本发明设计开发了一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法，通过提取目标车辆与目标车辆周围智能体的输入特征，并通过编码器将输入特征进行编码，分别通过时间模式注意力与感兴趣车辆加权对目标哦车辆的架势操纵类别进行识别，实现对目标车辆将来的行驶轨迹进行预测，提高驾驶操纵分类的准确率。

本发明提供的技术方案为：

一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法，包括：

步骤1，提取目标车辆与目标车辆周围智能体的输入特征；

步骤2，通过编码器对所述输入特征进行编码，分别通过时间模式注意力与感兴趣智能体加权对目标车辆与目标智能体周围车辆进行隐藏模式的提取；

步骤3，通过解码器对目标车辆的驾驶操纵类别进行识别，对目标车辆未来的行驶轨迹进行预测。

优选的是，所述步骤1包括：

对目标车辆与目标车辆周围智能体的行驶历史数据进行处理，记录所述目标车辆与目标车辆周围智能体的历史行驶轨迹；

所述目标车辆与目标车辆周围智能体的行驶轨迹数据记为：

式中，

周围智能体集合，a_c为周围智能体特征向量，c为周围智能体编号，N_c＝8，N_c为特征维数；

对于每个智能体的历史轨迹，定义为

a为每个智能体的历史轨迹集合向量，wh为历史轨迹向量长度，其中，

其中，

为车智能体车辆行驶横向与纵向加速度，x和y分别为Op坐标系的横轴与纵轴方向，class为智能体类别，若对应位置无智能体，则a＝0。

优选的是，所述目标车辆周围智能体包括：目标车辆的前、后、左旁、左后、右前、右旁、右后智能体中的与目标车辆的欧氏距离不超过150m的车辆。

优选的是，所述步骤2包括：

将a_T与

分别输入至数据编码器，a_T与

之间共享参数权重；

式中，a_T为自车输入特征，具体特征信息与诸位智能体相同，N_c为特征维数；

输入尺寸中的特征维度为7，即

将原始数据输入至嵌入层，输出尺寸中的特征维度为64；

激活函数选择为泄露线性整流单元，激活函数为：

式中，α＝0.1；

对嵌入层进行更新，得到：

e_c＝φ(FC(e_c；W_emb))，

式中，e_c为周围第c个智能体的嵌入向量，φ为所述泄露型整流单元，W_emb为全连接层权重；

将经过嵌入层得到的输出张量输入至单层长短时记忆网络，将最后一个 LSTM单元的输出h_t输入至线性单元，通过泄露线性整流单元函数进行激活；

其中，e_c经过激活函数激活后的编码张量为：

其中，t为LSTM隐藏单元个数，为128个，

为第c辆目标车辆周围感兴趣车辆经过LSTM与LeakyReLU激活后的编码张量，W_emb为嵌入向量权重，W_enc为LSTM权重，W_lin为线性层权重，经过编码器对原始输入数据编码，得到

与

为LSTM隐藏层最后一个单元的h^t。

优选的是，所述步骤2还包括：

将a_T输入至嵌入层，将嵌入层e^T输出至单层LSTM中，可以从单层LSTM 的输出中获得H_op＝[op¹,op²,…,op^t]与h^t，如下式所示：

其中，op为每一个LSTM单元的隐藏层输出，W_TPA为LSTM的权重，其中h^t作为注意力机制中查询序列(Query)，

为目标车辆第t-1个隐藏单元的输出；

得到的H_op与m个卷积核

进行1维卷积(Conv1D)，m＝32，令k＝ t^hst，卷积操作如下所示：

其中i＝1,2,…,m,j＝1,2,…,k,

为卷积操作符，得到张量{H_m,k}，记作H，首先作为键(K,Key)，与查询序列h^t通过权重矩阵W_sf得到得分函数

并且通过Sigmoid激活函数激活，即：

α＝ψ(H^TW_sfh_t)

式中，

为中间权重矩阵，查询序列h_t，随后，将得分函数映射广播到值(V，Value)上，隐变量v_t被加权得到，即：

最终，将v_t与隐藏变量h_t通过中间权重W_h与W_v相结合，即：

h′_t＝W_hh_t+W_vv_t

其中，

优选的是，所述步骤2还包括：

当编码器对智能体运动进行编码时，根据空间位置对周围智能体的编码张量进行堆叠，对叠加张量进行卷积运算：

其中，C^1×1为1×1卷积核，Conv为卷积操作，stack为向量堆叠操作，h_ct为第c辆目标车辆周围感兴趣智能体经过激活函数激活后的编码张量；

采用3×3卷积核进行卷积，增加通道数，

其中，squeeze()为将3维张量压缩至1维张量，φ为leskyReLU，C^3×3为一个3×3的卷积核。

优选的是，所述步骤3包括：

将所述解码器将编码张量h_T、注意张量h′_t、感兴趣智能体加权张量h_A进行串联，得到：

h_dec＝concat(h_T,h′_t,h_A)；

式中，h_dec为因变量串联后待解码张量；

利用一个分支预测驾驶操纵的分布，另一个分支重复重张量t^fut次，对应于每个LSTM单元中，输出激活层后，每个单元的输出代表未来某个时刻的目标车辆坐标值，包括：

式中

为输出激活，其中，

为各驾驶操纵的预测概率分布，a^pred 为在坐标系O_p为预测的车辆轨迹。

优选的是，还包括：

对车辆轨迹预测值使用均方差作为回归任务的损失函数，如下所示：

其中，N为训练集中样本数，

为轨迹预测值，

为真实轨迹坐标；

当分类不平衡或学习难度不同时，使用焦点损失进行补偿，如下所示：

式中，η＝1，β＝2，ε为防止对数函数溢出；总损失为：

本发明所述的有益效果：

1)该方法创新性的采用时间模式注意力机制，跨越多个时间步提取驾驶员驾驶意图-驾驶操纵隐藏模式，该模式可以突破传统循环神经网络在管理长期依赖性上的缺陷，提高了轨迹预测的准确率；

2)该方法提出感兴趣车辆加权，简化并有效的提取了自车与周围智能体的交互特征，保留了各车在目标车辆行驶上下文中的空间位置信息；

3)该方法针对于不同的驾驶操纵，通过设置焦点损失函数，降低了实例较少的驾驶操纵类别的学习难度与减小了类别不均衡所带来的问题，提高了目标车辆驾驶操纵的识别精确度。

附图说明

图1为本发明所述的编码器的结构示意图。

图2为本发明所述的时间模式注意力机制示意图。

图3为本发明所述的感兴趣车辆注意力加权示意图。

图4为本发明所述的解码器的结构示意图。

图5为本发明所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法的流程图。

具体实施方式

下面结合附图对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

如图1～5所示，本发明提供一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法，通过简单提取目标车辆(待识别与预测车辆)与目标车辆周围智能体的简单输入特征，再通过其对所述输入特征进行编码，并分别通过时间模式注意力与感兴趣车辆加权对目标车辆与目标车辆周围智能体进行隐藏模式的提取，最后通过解码器对目标车辆的架势操纵类别进行识别，对目标车辆将来的行驶轨迹进行预测，本方法可以通过这两个模块分别提取架势意图-架势操纵隐藏模式、自车与周围智能体交互模式，从而减小了轨迹预测的误差，提高了架势操纵分类的准确率，包括：

提取目标车辆与目标车辆周围智能体的输入特征；

通过编码器对所述输入特征进行编码，分别通过时间模式注意力与感兴趣车辆加权对目标车辆与目标车辆周围智能体进行隐藏模式的提取；

通过解码器对目标车辆的驾驶操纵类别进行识别，对目标车未来的行驶轨迹进行预测。

具体包括：

步骤1：对目标车辆与目标车辆周围智能体的行驶历史数据进行简单处理。记目标车辆T在t_hst(t_hst＝-w_h,…,-2,-1,0)时刻内的历史数据为a_T。预测坐标系O_p定义为当前时刻(0时刻)的目标车辆中心坐标，目标车辆的沿车道行驶纵向方向定义为x轴方向，目标车辆的沿车道行驶横向方向定义为y 轴方向。选择感兴趣车辆作为目标车辆周围智能体的选择方法，即选择目标车辆的前车、后车、左前车、左旁车、左后车、右前车、右旁车、右后车。上述车辆的历史轨迹数据记为

其中，为周围智能体集合，a_c为周围智能体特征向量，c为周围智能体编号，N_c＝8。对于每个智能体的历史轨迹，定义为

其中，

本方法预测目标车辆T在未来t_fut(t_fut＝1,2,…,w_f)的轨迹

其中，

与预测坐标系O_p对齐。此外，为了识别当前驾驶操纵，输入还包括当前的驾驶操纵类别M_lon与M_lat。其中，纵向驾驶操纵类别M_lon包括正常驾驶、急刹车、急加速；横向驾驶操纵类别M_lat包括道路跟随、左换道、右换道、左转向、右转向等。

步骤2：将原始数据输入至编码器。如图1所示，输入为a_T与

随后，分别将输入数据输入编码器，

之间共享参数权重，但是这些参数权重不与a_T的参数权重共享，输入大小为7，即

原始数据输入至嵌入层(Embedding)，输出大小为64，激活函数选择为泄露线性整流单元(LeakyReLU)，如下式所示：

将上述结果输入至单层长短时记忆网络(Long-Short Term Memory， LSTM)中，并且将最后一个LSTM单元的输出h_t输入至线性单元(即全连接层，Fully Connectedlayers，FC)，并且通过LeakyReLU进行激活。上述操作如下式所示(以目标车辆周围感兴趣车辆为例)：

其中，t为LSTM隐藏单元个数，为128个，

为第c辆目标车辆周围感兴趣车辆经过LSTM与LeakyReLU激活后的编码张量e_c为周围第c个智能体的嵌入向量，φ为所述泄露型整流单元，Wemb为嵌入向量权重，Wenc为LSTM 权重，W_lin为线性层权重，经过编码器对原始输入数据编码，得到

与

为LSTM隐藏层最后一个单元的h^t。

步骤3：将目标车辆的原始数据输入至时间模式注意力单元，如图2所示。首先将a_T输入至嵌入层，随后将嵌入层e^T输出至单层LSTM中。可以从单层LSTM的输出中获得H_op＝[op¹,op²,…,op^t]与h^t，如下式所示：

其中，op为每一个LSTM单元的隐藏层输出，由于运用了单层LSTM， op^t＝h^t。W_TPA为LSTM的权重。其中h^t作为注意力集中的Q，即查询序列 (Query)，

为LSTM隐藏层最后一个单元的h^t。

得到的H_op与m个卷积核

进行1维卷积(Conv1D)，m＝32。令k＝ t^hst，卷积操作如下所示：

其中i＝1,2,…,m,j＝1,2,…,k,

并且通过Sigmoid激活函数激活，如下式所示：

α＝ψ(H^TW_sfh_t)

其中

α＝(α₁,α₂,…,α_k)。得到的α称为注意力映射。随后张量{H_m,k} 再作为值(V，Value)，通过广播机制得到隐藏权重张量v_t：

最终，将v_t与隐藏变量h_t通过中间权重W_h与W_v相结合，即

h′_t＝W_hh_t+W_vv_t

其中，

步骤4：将步骤2得到的

进行感兴趣车辆加权，如图3所示。当编码器对车辆运动进行编码时，很难捕捉到驾驶环境的空间和位置模式。然而，目标车辆对周围智能体的依赖性不同。如果直接将周围智能体的编码张量作为解码器的输入，则会丢失位置信息。为了保持车辆的空间信息，根据空间位置对周围智能体的编码张量进行堆叠(Stack byPosition)。特别是，不需要考虑周围智能体的不同位置引起的问题，因为基于目标车辆的坐标系在输入

中提供。对于目标车辆，用零张量代替。

1×1卷积核用于在不增加通道数的情况下对叠加张量进行卷积运算：

其中，C^1×1为1×1卷积核。此操作相当于在每个位置对车辆进行加权，并选择当前驾驶环境下目标车辆周围智能体的重要性。然后采用3×3卷积核进行卷积，增加通道数，提取更多的模式：

其中，squeeze()为将3维张量压缩至1维张量。

步骤5：解码器将步骤2中目标车辆编码张量h_T、步骤3中时间模式注意张量h′_t和步骤4中感兴趣车辆加权张量

串联(Concatenate，concat())起来：

式中，h_dec为因变量串联后待解码张量，然后，利用一个分支预测驾驶机动的分布。需要注意的是，在训练过程中提供了一个横向和纵向驾驶机动的 one-hot编码，车辆横向和纵向机动的概率通过FC层和Softmax层输出：

另一个分支重复(repeat())张量t^fut次，对应于每个LSTM单元中。输出激活层后，每个单元的输出代表未来某个时刻的目标车辆坐标值。以上操作如下：

式中

是输出激活，其中，

为各驾驶操纵的预测概率分布，a^pred为在坐标系O_p预测的车辆轨迹，解码器结构如图4所示：

步骤6：对于车辆轨迹预测值，使用均方误差作为回归任务的损失函数，如下所示：

式中，N为训练集中样本数，

为轨迹预测值，

为真实轨迹坐标。需要注意的是，换道、转向、急加减速等驾驶操纵相对与沿车道正常行驶较少，有时横向变道会同时出现急加减速，这使得不同类别之间的学习难度存在较大差距。通常，对于多类分类问题，多类交叉熵是一个常见的损失函数。然而，当分类不平衡或学习难度不同时，这种方法的准确性会在一定程度上降低。因此，我们用焦点损失(Focal Loss)进行补偿，如下式(以纵向驾驶操纵为例)：

式中，η＝1，β＝2，ε为防止对数函数溢出；最后总损失为：

步骤7：对上述神经网络进行训练。整个神经网络的训练与测试环境为 Ubuntu16.04LTS，Python 3.7。所采用的深度学习框架为Pytorch，对于LSTM 编码器、解码器，隐层单元数取128，时间模式注意卷积核数取32。经过卷积后，利用Dropout方法防止过拟合，其比率为0.3，最终时间模式注意力输出维度为64，选择学习率为10^-4的Adam优化器，mini-batch的大小是128。此外，为了更精细的训练，采用学习率计划表，即连续“patient”次数后损失没有减少时，学习率降低，一般patient选择为10个回合，选择学习率衰减系数为0.8，学习率为10^-7后，学习率不降低。最终，得到训练好的模型，可以用来进行目标车辆的轨迹预测与驾驶操纵的分类。

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节和这里示出与描述的图例。