CN112949597A - 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法 - Google Patents

一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法 Download PDF

Info

Publication number
CN112949597A
CN112949597A CN202110364544.6A CN202110364544A CN112949597A CN 112949597 A CN112949597 A CN 112949597A CN 202110364544 A CN202110364544 A CN 202110364544A CN 112949597 A CN112949597 A CN 112949597A
Authority
CN
China
Prior art keywords
target vehicle
vehicle
driving
agent
tensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110364544.6A
Other languages
English (en)
Other versions
CN112949597B (zh
Inventor
胡宏宇
王�琦
杜来刚
鲁子洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202110364544.6A priority Critical patent/CN112949597B/zh
Publication of CN112949597A publication Critical patent/CN112949597A/zh
Application granted granted Critical
Publication of CN112949597B publication Critical patent/CN112949597B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Abstract

本发明公开了一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,包括:步骤1、提取目标车辆与目标车辆周围智能体的输入特征;步骤2、通过编码器对所述输入特征进行编码,分别通过时间模式注意力与感兴趣智能体加权对目标车辆与目标车辆周围智能体进行隐藏模式的提取;步骤3、通过解码器对目标车辆的驾驶操纵类别进行识别,对目标车未来的行驶轨迹进行预测。通过提取目标车辆与目标车辆周围智能体的输入特征,并通过编码器将输入特征进行编码,分别通过时间模式注意力与感兴趣智能体加权对目标车辆的架势操纵类别进行识别,实现对目标车辆将来的行驶轨迹进行预测,提高驾驶操纵分类的准确率。

Description

一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识 别方法
技术领域
本发明涉及一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识 别方法,属于机器学习领域。
背景技术
为了做出安全且舒适的路径规划与车辆控制,自动驾驶汽车需要对周围 环境与智能体进行良好的感知。随后,根据学习到的行驶上下文知识,自动 驾驶汽车需要推断周围智能体的意图,并且对其轨迹做出高精确度的估计。 通常来说,轨迹预测可以帮助自动驾驶汽车更好的了解周围的行驶上下文, 并且帮助自动驾驶汽车做出下一步的驾驶操纵。然而,驾驶行为的多模态性 与行驶上下文的复杂性使得轨迹预测面临着巨大的挑战。
实际上,驾驶意图在特定的驾驶场景下对多模态的驾驶行为有着巨大的 影响。驾驶意图是由驾驶员通过短暂的决定以实现某个特定目标的一系列动 作所反映。也就是说,驾驶员需要对周围的驾驶场景进行感知,并且做出合 理且舒适的驾驶操纵。因此,从目标车辆的运动学参数、目标车辆与周围智 能体的交互参数中提取驾驶员的驾驶意图与驾驶操纵模式可以对车辆的长期 轨迹预测有着更好的帮助。
车辆轨迹预测任务也是多变量时间序列预测任务。目前,循环神经网络(recurrent neural networks(RNNs))常用于该任务中。然而,在序列分析中使用 RNNs的一个缺点是其在管理长期依赖方面的弱点,这不利于车辆轨迹的预 测。原因是,驾驶员通常在驾驶意图出现时不会立即执行,而是在驾驶员做 好车辆控制的准备后才会执行。根据相关文献可知,这个延迟大约在1~4秒 左右。为了解决RNNs在跨时间步上能力的缺陷,采用时间模式注意力,该 方法可以跨越多个时间步,十分适合轨迹预测过程中驾驶意图与操纵模式的 提取,以提高预测的准确率与驾驶操纵分类精度。
现有技术中,专利CN201910876478.3公开了一种基于长短记忆网络的多 重车辆的轨迹预测方法,将主车和其邻车的历史轨迹等特征作为输入,充分 考虑到车辆之间的位置以及驾驶行为的相互影响,经过网络的编码解码之后, 将输出的邻近车辆的未来轨迹进一步输入混合密度网络,估计出车辆位置的 概率分布;专利CN201910832754.6公开了一种基于双向内核岭回归的车辆轨 迹预测方法,采用滑动窗口从中获取有关行驶姿态信息的前向训练数据和后 向训练数据,利用前向训练数据和后向训练数据,分别训练两个核岭回归模 型,得到轨迹前向预测模型和轨迹后向预测模型;专利CN201911284048.9 公开了一种车辆轨迹预测方法及装置,该方法首先获取历史轨迹数据对应的 时空图序列,时空图序列包括预设时段内按时间先后顺序排列的每个时刻对 应的时空图,将时空图序列输入已训练的预测模型进行处理,得到车辆各自 对应的预测行驶轨迹,预测模型基于同一时段内多个样本车辆的样本轨迹数 据对应的样本时空图及样本车辆各自对应的样本行驶轨迹对长短期记忆网络 LSTM训练得到。但是以上方法都没有考虑跨越时间步的驾驶意图与操纵模 式提取,从而影响到识别的准确率与驾驶操纵的识别精确度。
发明内容
本发明设计开发了一种基于时间模式注意力机制的车辆轨迹预测与驾驶 操纵识别方法,通过提取目标车辆与目标车辆周围智能体的输入特征,并通 过编码器将输入特征进行编码,分别通过时间模式注意力与感兴趣车辆加权 对目标哦车辆的架势操纵类别进行识别,实现对目标车辆将来的行驶轨迹进 行预测,提高驾驶操纵分类的准确率。
本发明提供的技术方案为:
一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,包 括:
步骤1,提取目标车辆与目标车辆周围智能体的输入特征;
步骤2,通过编码器对所述输入特征进行编码,分别通过时间模式注意 力与感兴趣智能体加权对目标车辆与目标智能体周围车辆进行隐藏模式的提 取;
步骤3,通过解码器对目标车辆的驾驶操纵类别进行识别,对目标车辆 未来的行驶轨迹进行预测。
优选的是,所述步骤1包括:
对目标车辆与目标车辆周围智能体的行驶历史数据进行处理,记录所述 目标车辆与目标车辆周围智能体的历史行驶轨迹;
所述目标车辆与目标车辆周围智能体的行驶轨迹数据记为:
Figure BDA0003006885790000031
式中,
Figure BDA0003006885790000032
周围智能体集合,ac为周围智能体特征向量,c为周围智能体编 号,Nc=8,Nc为特征维数;
对于每个智能体的历史轨迹,定义为
Figure BDA0003006885790000033
a为每 个智能体的历史轨迹集合向量,wh为历史轨迹向量长度,其中,
Figure BDA0003006885790000034
其中,
Figure BDA0003006885790000035
为车智能体车辆行驶横向 与纵向加速度,x和y分别为Op坐标系的横轴与纵轴方向,class为智能体类 别,若对应位置无智能体,则a=0。
优选的是,所述目标车辆周围智能体包括:目标车辆的前、后、左旁、 左后、右前、右旁、右后智能体中的与目标车辆的欧氏距离不超过150m的 车辆。
优选的是,所述步骤2包括:
将aT
Figure BDA0003006885790000036
分别输入至数据编码器,aT
Figure BDA0003006885790000037
之 间共享参数权重;
式中,aT为自车输入特征,具体特征信息与诸位智能体相同,Nc为特 征维数;
输入尺寸中的特征维度为7,即
Figure BDA0003006885790000038
将原始数据输入至嵌入层,输出尺寸中的特征维度为64;
激活函数选择为泄露线性整流单元,激活函数为:
Figure BDA0003006885790000039
式中,α=0.1;
对嵌入层进行更新,得到:
ec=φ(FC(ec;Wemb)),
式中,ec为周围第c个智能体的嵌入向量,φ为所述泄露型整流单元,Wemb为全连接层权重;
将经过嵌入层得到的输出张量输入至单层长短时记忆网络,将最后一个 LSTM单元的输出ht输入至线性单元,通过泄露线性整流单元函数进行激活;
其中,ec经过激活函数激活后的编码张量为:
Figure BDA0003006885790000041
其中,t为LSTM隐藏单元个数,为128个,
Figure BDA0003006885790000042
为第c辆目标车辆周围感 兴趣车辆经过LSTM与LeakyReLU激活后的编码张量,Wemb为嵌入向量权 重,Wenc为LSTM权重,Wlin为线性层权重,经过编码器对原始输入数据编 码,得到
Figure BDA0003006885790000043
Figure BDA0003006885790000044
为LSTM隐藏层最后一个单元的ht
优选的是,所述步骤2还包括:
将aT输入至嵌入层,将嵌入层eT输出至单层LSTM中,可以从单层LSTM 的输出中获得Hop=[op1,op2,…,opt]与ht,如下式所示:
Figure BDA0003006885790000045
其中,op为每一个LSTM单元的隐藏层输出,WTPA为LSTM的权重,其 中ht作为注意力机制中查询序列(Query),
Figure BDA0003006885790000046
为目标车辆第t-1个隐藏单元 的输出;
得到的Hop与m个卷积核
Figure BDA0003006885790000047
进行1维卷积(Conv1D),m=32,令k= thst,卷积操作如下所示:
Figure BDA0003006885790000051
其中i=1,2,…,m,j=1,2,…,k,
Figure BDA0003006885790000052
为卷积操作符,得到张量{Hm,k},记作H, 首先作为键(K,Key),与查询序列ht通过权重矩阵Wsf得到得分函数
Figure BDA0003006885790000053
并且通过Sigmoid激活函数激活,即:
α=ψ(HTWsfht)
式中,
Figure BDA0003006885790000054
为中间权重矩阵,查询序列ht,随后,将得分函数映射广播到 值(V,Value)上,隐变量vt被加权得到,即:
Figure BDA0003006885790000055
最终,将vt与隐藏变量ht通过中间权重Wh与Wv相结合,即:
h′t=Whht+Wvvt
其中,
Figure BDA0003006885790000056
优选的是,所述步骤2还包括:
当编码器对智能体运动进行编码时,根据空间位置对周围智能体的编码 张量进行堆叠,对叠加张量进行卷积运算:
Figure BDA0003006885790000057
其中,C1×1为1×1卷积核,Conv为卷积操作,stack为向量堆叠操作,hct为 第c辆目标车辆周围感兴趣智能体经过激活函数激活后的编码张量;
采用3×3卷积核进行卷积,增加通道数,
Figure BDA0003006885790000058
其中,squeeze()为将3维张量压缩至1维张量,φ为leskyReLU,C3×3为 一个3×3的卷积核。
优选的是,所述步骤3包括:
将所述解码器将编码张量hT、注意张量h′t、感兴趣智能体加权张量hA进 行串联,得到:
hdec=concat(hT,h′t,hA);
式中,hdec为因变量串联后待解码张量;
利用一个分支预测驾驶操纵的分布,另一个分支重复重张量tfut次,对应 于每个LSTM单元中,输出激活层后,每个单元的输出代表未来某个时刻的 目标车辆坐标值,包括:
Figure BDA0003006885790000061
Figure BDA0003006885790000062
Figure BDA0003006885790000063
式中
Figure BDA0003006885790000064
为输出激活,其中,
Figure BDA0003006885790000065
为各驾驶操纵的预测概率分布,apred 为在坐标系Op为预测的车辆轨迹。
优选的是,还包括:
对车辆轨迹预测值使用均方差作为回归任务的损失函数,如下所示:
Figure BDA0003006885790000066
其中,N为训练集中样本数,
Figure BDA0003006885790000067
为轨迹预测值,
Figure BDA0003006885790000068
为真实轨迹坐标;
当分类不平衡或学习难度不同时,使用焦点损失进行补偿,如下所示:
Figure BDA0003006885790000069
式中,η=1,β=2,ε为防止对数函数溢出;总损失为:
Figure BDA00030068857900000610
本发明所述的有益效果:
1)该方法创新性的采用时间模式注意力机制,跨越多个时间步提取驾驶 员驾驶意图-驾驶操纵隐藏模式,该模式可以突破传统循环神经网络在管理长 期依赖性上的缺陷,提高了轨迹预测的准确率;
2)该方法提出感兴趣车辆加权,简化并有效的提取了自车与周围智能体 的交互特征,保留了各车在目标车辆行驶上下文中的空间位置信息;
3)该方法针对于不同的驾驶操纵,通过设置焦点损失函数,降低了实例 较少的驾驶操纵类别的学习难度与减小了类别不均衡所带来的问题,提高了 目标车辆驾驶操纵的识别精确度。
附图说明
图1为本发明所述的编码器的结构示意图。
图2为本发明所述的时间模式注意力机制示意图。
图3为本发明所述的感兴趣车辆注意力加权示意图。
图4为本发明所述的解码器的结构示意图。
图5为本发明所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操 纵识别方法的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照 说明书文字能够据以实施。
如图1~5所示,本发明提供一种基于时间模式注意力机制的车辆轨迹预 测与驾驶操纵识别方法,通过简单提取目标车辆(待识别与预测车辆)与目 标车辆周围智能体的简单输入特征,再通过其对所述输入特征进行编码,并 分别通过时间模式注意力与感兴趣车辆加权对目标车辆与目标车辆周围智能 体进行隐藏模式的提取,最后通过解码器对目标车辆的架势操纵类别进行识 别,对目标车辆将来的行驶轨迹进行预测,本方法可以通过这两个模块分别 提取架势意图-架势操纵隐藏模式、自车与周围智能体交互模式,从而减小了 轨迹预测的误差,提高了架势操纵分类的准确率,包括:
提取目标车辆与目标车辆周围智能体的输入特征;
通过编码器对所述输入特征进行编码,分别通过时间模式注意力与感兴 趣车辆加权对目标车辆与目标车辆周围智能体进行隐藏模式的提取;
通过解码器对目标车辆的驾驶操纵类别进行识别,对目标车未来的行驶 轨迹进行预测。
具体包括:
步骤1:对目标车辆与目标车辆周围智能体的行驶历史数据进行简单处 理。记目标车辆T在thst(thst=-wh,…,-2,-1,0)时刻内的历史数据为aT。预测 坐标系Op定义为当前时刻(0时刻)的目标车辆中心坐标,目标车辆的沿车 道行驶纵向方向定义为x轴方向,目标车辆的沿车道行驶横向方向定义为y 轴方向。选择感兴趣车辆作为目标车辆周围智能体的选择方法,即选择目标 车辆的前车、后车、左前车、左旁车、左后车、右前车、右旁车、右后车。 上述车辆的历史轨迹数据记为
Figure RE-GDA0003054303770000081
其中,为周围智能体集 合,ac为周围智能体特征向量,c为周围智能体编号,Nc=8。对于每个智能体 的历史轨迹,定义为
Figure RE-GDA0003054303770000082
a为每个智能体的历史轨迹 集合向量,wh为历史轨迹向量长度,其中,
Figure RE-GDA0003054303770000083
其中,
Figure RE-GDA0003054303770000084
为车 智能体车辆行驶横向与纵向加速度,x和y分别为Op坐标系的横轴与纵轴方向,class为智能体类别,若对应位置无智能体,则a=0。
本方法预测目标车辆T在未来tfut(tfut=1,2,…,wf)的轨迹
Figure BDA0003006885790000085
其 中,
Figure BDA0003006885790000086
与预测坐标系Op对齐。此外,为了识别当前驾驶操纵,输入还包 括当前的驾驶操纵类别Mlon与Mlat。其中,纵向驾驶操纵类别Mlon包括正常 驾驶、急刹车、急加速;横向驾驶操纵类别Mlat包括道路跟随、左换道、右 换道、左转向、右转向等。
步骤2:将原始数据输入至编码器。如图1所示,输入为aT
Figure BDA0003006885790000091
随后,分别将输入数据输入编码器,
Figure BDA0003006885790000092
之间共享 参数权重,但是这些参数权重不与aT的参数权重共享,输入大小为7,即
Figure BDA0003006885790000093
原始数据输入至嵌入层(Embedding),输出大小为64,激活函数选择为泄露 线性整流单元(LeakyReLU),如下式所示:
Figure BDA0003006885790000094
将上述结果输入至单层长短时记忆网络(Long-Short Term Memory, LSTM)中,并且将最后一个LSTM单元的输出ht输入至线性单元(即全连 接层,Fully Connectedlayers,FC),并且通过LeakyReLU进行激活。上述操 作如下式所示(以目标车辆周围感兴趣车辆为例):
Figure BDA0003006885790000095
Figure BDA0003006885790000096
其中,t为LSTM隐藏单元个数,为128个,
Figure BDA00030068857900000914
为第c辆目标车辆周围感 兴趣车辆经过LSTM与LeakyReLU激活后的编码张量ec为周围第c个智能体 的嵌入向量,φ为所述泄露型整流单元,Wemb为嵌入向量权重,Wenc为LSTM 权重,Wlin为线性层权重,经过编码器对原始输入数据编码,得到
Figure BDA0003006885790000097
Figure BDA0003006885790000098
Figure BDA0003006885790000099
为LSTM隐藏层最后一个单元的ht
步骤3:将目标车辆的原始数据输入至时间模式注意力单元,如图2所 示。首先将aT输入至嵌入层,随后将嵌入层eT输出至单层LSTM中。可以从 单层LSTM的输出中获得Hop=[op1,op2,…,opt]与ht,如下式所示:
Figure BDA00030068857900000910
其中,op为每一个LSTM单元的隐藏层输出,由于运用了单层LSTM, opt=ht。WTPA为LSTM的权重。其中ht作为注意力集中的Q,即查询序列 (Query),
Figure BDA00030068857900000911
为LSTM隐藏层最后一个单元的ht
得到的Hop与m个卷积核
Figure BDA00030068857900000912
进行1维卷积(Conv1D),m=32。令k= thst,卷积操作如下所示:
Figure BDA00030068857900000913
其中i=1,2,…,m,j=1,2,…,k,
Figure BDA0003006885790000101
为卷积操作符,得到张量{Hm,k},记作H, 首先作为键(K,Key),与查询序列ht通过权重矩阵Wsf得到得分函数
Figure BDA0003006885790000102
并且通过Sigmoid激活函数激活,如下式所示:
Figure BDA0003006885790000103
α=ψ(HTWsfht)
其中
Figure BDA0003006885790000104
α=(α12,…,αk)。得到的α称为注意力映射。随后张量{Hm,k} 再作为值(V,Value),通过广播机制得到隐藏权重张量vt
Figure BDA0003006885790000105
最终,将vt与隐藏变量ht通过中间权重Wh与Wv相结合,即
h′t=Whht+Wvvt
其中,
Figure BDA0003006885790000106
步骤4:将步骤2得到的
Figure BDA0003006885790000107
进行感兴趣车辆加权,如图3所示。当编码 器对车辆运动进行编码时,很难捕捉到驾驶环境的空间和位置模式。然而, 目标车辆对周围智能体的依赖性不同。如果直接将周围智能体的编码张量作 为解码器的输入,则会丢失位置信息。为了保持车辆的空间信息,根据空间 位置对周围智能体的编码张量进行堆叠(Stack byPosition)。特别是,不需要 考虑周围智能体的不同位置引起的问题,因为基于目标车辆的坐标系在输入
Figure BDA0003006885790000108
中提供。对于目标车辆,用零张量代替。
1×1卷积核用于在不增加通道数的情况下对叠加张量进行卷积运算:
Figure BDA0003006885790000109
其中,C1×1为1×1卷积核。此操作相当于在每个位置对车辆进行加权, 并选择当前驾驶环境下目标车辆周围智能体的重要性。然后采用3×3卷积核 进行卷积,增加通道数,提取更多的模式:
Figure BDA00030068857900001010
其中,squeeze()为将3维张量压缩至1维张量。
步骤5:解码器将步骤2中目标车辆编码张量hT、步骤3中时间模式注 意张量h′t和步骤4中感兴趣车辆加权张量
Figure BDA0003006885790000111
串联(Concatenate,concat())起 来:
Figure BDA0003006885790000112
式中,hdec为因变量串联后待解码张量,然后,利用一个分支预测驾驶机 动的分布。需要注意的是,在训练过程中提供了一个横向和纵向驾驶机动的 one-hot编码,车辆横向和纵向机动的概率通过FC层和Softmax层输出:
Figure BDA0003006885790000113
另一个分支重复(repeat())张量tfut次,对应于每个LSTM单元中。输出 激活层后,每个单元的输出代表未来某个时刻的目标车辆坐标值。以上操作 如下:
Figure BDA0003006885790000114
Figure BDA0003006885790000115
Figure BDA0003006885790000116
式中
Figure BDA0003006885790000117
是输出激活,其中,
Figure BDA0003006885790000118
为各驾驶操纵的预测概率分布,apred为 在坐标系Op预测的车辆轨迹,解码器结构如图4所示:
步骤6:对于车辆轨迹预测值,使用均方误差作为回归任务的损失函数, 如下所示:
Figure BDA0003006885790000119
式中,N为训练集中样本数,
Figure BDA00030068857900001110
为轨迹预测值,
Figure BDA00030068857900001111
为真实轨迹坐标。 需要注意的是,换道、转向、急加减速等驾驶操纵相对与沿车道正常行驶较 少,有时横向变道会同时出现急加减速,这使得不同类别之间的学习难度存 在较大差距。通常,对于多类分类问题,多类交叉熵是一个常见的损失函数。 然而,当分类不平衡或学习难度不同时,这种方法的准确性会在一定程度上 降低。因此,我们用焦点损失(Focal Loss)进行补偿,如下式(以纵向驾驶 操纵为例):
Figure BDA00030068857900001112
式中,η=1,β=2,ε为防止对数函数溢出;最后总损失为:
Figure BDA0003006885790000121
步骤7:对上述神经网络进行训练。整个神经网络的训练与测试环境为 Ubuntu16.04LTS,Python 3.7。所采用的深度学习框架为Pytorch,对于LSTM 编码器、解码器,隐层单元数取128,时间模式注意卷积核数取32。经过卷 积后,利用Dropout方法防止过拟合,其比率为0.3,最终时间模式注意力输 出维度为64,选择学习率为10-4的Adam优化器,mini-batch的大小是128。 此外,为了更精细的训练,采用学习率计划表,即连续“patient”次数后损 失没有减少时,学习率降低,一般patient选择为10个回合,选择学习率衰 减系数为0.8,学习率为10-7后,学习率不降低。最终,得到训练好的模型, 可以用来进行目标车辆的轨迹预测与驾驶操纵的分类。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方 式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领 域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范 围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图 例。

Claims (8)

1.一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,包括:
步骤1,提取目标车辆与目标车辆周围智能体的输入特征;
步骤2,通过编码器对所述输入特征进行编码,分别通过时间模式注意力与感兴趣智能体加权对目标车辆与目标智能体周围车辆进行隐藏模式的提取;
步骤3,通过解码器对目标车辆的驾驶操纵类别进行识别,对目标车辆未来的行驶轨迹进行预测。
2.根据权利要求1所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,所述步骤1包括:
对目标车辆与目标车辆周围智能体的行驶历史数据进行处理,记录所述目标车辆与目标车辆周围智能体的历史行驶轨迹;
所述目标车辆与目标车辆周围智能体的行驶轨迹数据记为:
Figure FDA0003006885780000011
式中,
Figure FDA0003006885780000012
为周围智能体集合,ac为周围智能体特征向量,c为周围智能体编号,Nc=8,Nc为特征维数;
对于每个智能体的历史轨迹,定义为
Figure FDA0003006885780000013
a为每个智能体的历史轨迹集合向量,wh为历史轨迹向量长度,其中,
Figure FDA0003006885780000014
其中,
Figure FDA0003006885780000015
为车智能体车辆行驶横向与纵向加速度,x和y分别为Op坐标系的横轴与纵轴方向,class为智能体类别,若对应位置无智能体,则a=0。
3.根据权利要求2所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,所述目标车辆周围智能体包括:目标车辆的前、后、左旁、左后、右前、右旁、右后智能体中的与目标车辆的欧氏距离不超过150m的车辆。
4.根据权利要求3所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,所述步骤2包括:
将aT
Figure FDA0003006885780000021
分别输入至数据编码器,aT
Figure FDA0003006885780000022
之间共享参数权重;
式中,aT为自车输入特征,具体特征信息与诸位智能体相同,Nc为特征维数;
输入尺寸中的特征维度为7,即
Figure FDA0003006885780000023
将原始数据输入至嵌入层,输出尺寸中的特征维度为64;
激活函数选择为泄露线性整流单元,激活函数为:
Figure FDA0003006885780000024
式中,α=0.1;
对嵌入层进行更新,得到:
ec=φ(FC(ec;Wemb)),
式中,ec为周围第c个智能体的嵌入向量,φ为所述泄露型整流单元,Wemb为全连接层权重;
将经过嵌入层得到的输出张量输入至单层长短时记忆网络,将最后一个LSTM单元的输出ht输入至线性单元,通过泄露线性整流单元函数进行激活;
其中,ec经过激活函数激活后的编码张量为:
Figure FDA0003006885780000025
其中,t为LSTM隐藏单元个数,为128个,
Figure FDA0003006885780000026
为第c辆目标车辆周围感兴趣车辆经过LSTM与LeakyReLU激活后的编码张量,Wemb为嵌入向量权重,Wenc为LSTM权重,Wlin为线性层权重,经过编码器对原始输入数据编码,得到
Figure FDA0003006885780000027
Figure FDA0003006885780000028
Figure FDA0003006885780000029
为LSTM隐藏层最后一个单元的ht
5.根据权利要求4所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,所述步骤2还包括:
将aT输入至嵌入层,将嵌入层eT输出至单层LSTM中,可以从单层LSTM的输出中获得Hop=[op1,op2,…,opt]与ht,如下式所示:
Figure FDA0003006885780000031
其中,op为每一个LSTM单元的隐藏层输出,WTPA为LSTM的权重,其中ht作为注意力机制中查询序列(Query),
Figure FDA0003006885780000032
为目标车辆第t-1个隐藏单元的输出;
得到的Hop与m个卷积核
Figure FDA0003006885780000033
进行1维卷积(Conv1D),m=32,令k=thst,卷积操作如下所示:
Figure FDA0003006885780000034
其中i=1,2,…,m,j=1,2,…,k,
Figure FDA0003006885780000035
为卷积操作符,得到张量{Hm,k},记作H,首先作为键(K,Key),与查询序列ht通过权重矩阵Wsf得到得分函数
Figure FDA0003006885780000036
并且通过Sigmoid激活函数激活,即:
α=ψ(HTWsfht)
式中,
Figure FDA0003006885780000037
为中间权重矩阵,查询序列ht,随后,将得分函数映射广播到值(V,Value)上,隐变量vt被加权得到,即:
Figure FDA0003006885780000038
最终,将vt与隐藏变量ht通过中间权重Wh与Wv相结合,即:
h't=Whht+Wvvt
其中,
Figure FDA0003006885780000039
6.根据权利要求5所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,所述步骤2还包括:
当编码器对智能体运动进行编码时,根据空间位置对周围智能体的编码张量进行堆叠,对叠加张量进行卷积运算:
Figure FDA0003006885780000041
其中,C1×1为1×1卷积核,Conv为卷积操作,stack为向量堆叠操作,
Figure FDA0003006885780000042
为第c辆目标车辆周围感兴趣智能体经过激活函数激活后的编码张量;
采用3×3卷积核进行卷积,增加通道数,
Figure FDA0003006885780000043
其中,squeeze()为将3维张量压缩至1维张量,φ为leskyReLU,C3×3为一个3×3的卷积核。
7.根据权利要求6所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,所述步骤3包括:
将所述解码器将编码张量hT、注意张量h't、感兴趣智能体加权张量hA进行串联,得到:
Figure FDA0003006885780000044
式中,hdec为因变量串联后待解码张量;
利用一个分支预测驾驶操纵的分布,另一个分支重复重张量tfut次,对应于每个LSTM单元中,输出激活层后,每个单元的输出代表未来某个时刻的目标车辆坐标值,包括:
Figure FDA0003006885780000045
Figure FDA0003006885780000046
Figure FDA0003006885780000047
式中
Figure FDA0003006885780000048
为输出激活,其中,
Figure FDA0003006885780000049
为各驾驶操纵的预测概率分布,apred为在坐标系Op为预测的车辆轨迹。
8.根据权利要求7所述的基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法,其特征在于,还包括:
对车辆轨迹预测值使用均方差作为回归任务的损失函数,如下所示:
Figure FDA0003006885780000051
其中,N为训练集中样本数,
Figure FDA0003006885780000052
为轨迹预测值,
Figure FDA0003006885780000053
为真实轨迹坐标;
当分类不平衡或学习难度不同时,使用焦点损失进行补偿,如下所示:
Figure FDA0003006885780000054
式中,η=1,β=2,ε为防止对数函数溢出;总损失为:
Figure FDA0003006885780000055
CN202110364544.6A 2021-04-06 2021-04-06 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法 Active CN112949597B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110364544.6A CN112949597B (zh) 2021-04-06 2021-04-06 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110364544.6A CN112949597B (zh) 2021-04-06 2021-04-06 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法

Publications (2)

Publication Number Publication Date
CN112949597A true CN112949597A (zh) 2021-06-11
CN112949597B CN112949597B (zh) 2022-11-04

Family

ID=76230579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110364544.6A Active CN112949597B (zh) 2021-04-06 2021-04-06 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法

Country Status (1)

Country Link
CN (1) CN112949597B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435356A (zh) * 2021-06-30 2021-09-24 吉林大学 一种克服观察噪声与感知不确定性的轨迹预测方法
CN113780665A (zh) * 2021-09-15 2021-12-10 湖南大学 一种基于增强循环神经网络的私家车停留位置预测方法和系统
CN113837297A (zh) * 2021-09-28 2021-12-24 中国科学技术大学先进技术研究院 一种基于ai的智能驾驶车辆周车的行为预测方法和系统
CN113954863A (zh) * 2021-09-07 2022-01-21 江苏大学 基于双注意力机制和改进Social Gan的车辆轨迹预测方法
CN114387313A (zh) * 2022-01-07 2022-04-22 武汉东信同邦信息技术有限公司 一种运动轨迹预测方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163439A (zh) * 2019-05-24 2019-08-23 长安大学 一种基于注意力机制的城市规模出租车轨迹预测方法
US20190287402A1 (en) * 2018-03-19 2019-09-19 Derq Inc. Early warning and collision avoidance
CN111046919A (zh) * 2019-11-21 2020-04-21 南京航空航天大学 一种融合行为意图的周围动态车辆轨迹预测系统及方法
CN111597961A (zh) * 2020-05-13 2020-08-28 中国科学院自动化研究所 面向智能驾驶的移动目标轨迹预测方法、系统、装置
US20200283017A1 (en) * 2019-03-05 2020-09-10 Bayerische Motoren Werke Aktiengesellschaft Training a Generator Unit and a Discriminator Unit for Collision-Aware Trajectory Prediction
CN111931905A (zh) * 2020-07-13 2020-11-13 江苏大学 一种图卷积神经网络模型、及利用该模型的车辆轨迹预测方法
CN112257850A (zh) * 2020-10-26 2021-01-22 河南大学 一种基于生成对抗网络的车辆轨迹预测方法
CN112465273A (zh) * 2020-12-25 2021-03-09 湖北汽车工业学院 一种基于局部注意力机制的无人车轨迹预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190287402A1 (en) * 2018-03-19 2019-09-19 Derq Inc. Early warning and collision avoidance
US20200283017A1 (en) * 2019-03-05 2020-09-10 Bayerische Motoren Werke Aktiengesellschaft Training a Generator Unit and a Discriminator Unit for Collision-Aware Trajectory Prediction
CN110163439A (zh) * 2019-05-24 2019-08-23 长安大学 一种基于注意力机制的城市规模出租车轨迹预测方法
CN111046919A (zh) * 2019-11-21 2020-04-21 南京航空航天大学 一种融合行为意图的周围动态车辆轨迹预测系统及方法
CN111597961A (zh) * 2020-05-13 2020-08-28 中国科学院自动化研究所 面向智能驾驶的移动目标轨迹预测方法、系统、装置
CN111931905A (zh) * 2020-07-13 2020-11-13 江苏大学 一种图卷积神经网络模型、及利用该模型的车辆轨迹预测方法
CN112257850A (zh) * 2020-10-26 2021-01-22 河南大学 一种基于生成对抗网络的车辆轨迹预测方法
CN112465273A (zh) * 2020-12-25 2021-03-09 湖北汽车工业学院 一种基于局部注意力机制的无人车轨迹预测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
KAOUTHER MESSAOUD 等: "Attention Based Vehicle Trajectory Prediction", 《IEEE TRANSACTIONS ON INTELLIGENT VEHICLES》 *
KAOUTHER MESSAOUD 等: "Non-local Social Pooling for Vehicle Trajectory Prediction", 《2019 IEEE INTELLIGENT VEHICLES SYMPOSIUM (IV)》 *
安鹏进: "注意力机制与图卷积方法融合的行程时间预测算法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
胡宏宇: "基于视频处理的交通事件识别方法研究", 《中国博士学位论文全文数据库 信息科技辑》 *
蔡英凤 等: "基于注意力机制的车辆行为预测", 《江苏大学学报(自然科学版)》 *
高铭: "基于深度学习的复杂交通环境下目标跟踪与轨迹预测研究", 《中国博士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435356A (zh) * 2021-06-30 2021-09-24 吉林大学 一种克服观察噪声与感知不确定性的轨迹预测方法
CN113435356B (zh) * 2021-06-30 2023-02-28 吉林大学 一种克服观察噪声与感知不确定性的轨迹预测方法
CN113954863A (zh) * 2021-09-07 2022-01-21 江苏大学 基于双注意力机制和改进Social Gan的车辆轨迹预测方法
CN113780665A (zh) * 2021-09-15 2021-12-10 湖南大学 一种基于增强循环神经网络的私家车停留位置预测方法和系统
CN113780665B (zh) * 2021-09-15 2023-09-29 湖南大学 一种基于增强循环神经网络的私家车停留位置预测方法和系统
CN113837297A (zh) * 2021-09-28 2021-12-24 中国科学技术大学先进技术研究院 一种基于ai的智能驾驶车辆周车的行为预测方法和系统
CN114387313A (zh) * 2022-01-07 2022-04-22 武汉东信同邦信息技术有限公司 一种运动轨迹预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112949597B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN112949597B (zh) 一种基于时间模式注意力机制的车辆轨迹预测与驾驶操纵识别方法
Zhao et al. Multi-agent tensor fusion for contextual trajectory prediction
Bhattacharyya et al. Modeling human driving behavior through generative adversarial imitation learning
Eiffert et al. Probabilistic crowd GAN: Multimodal pedestrian trajectory prediction using a graph vehicle-pedestrian attention network
CN111339867B (zh) 一种基于生成对抗网络的行人轨迹预测方法
CN111930110A (zh) 一种结合社会生成对抗网络的意图轨迹预测方法
CN112257850B (zh) 一种基于生成对抗网络的车辆轨迹预测方法
Grigorescu et al. Neurotrajectory: A neuroevolutionary approach to local state trajectory learning for autonomous vehicles
CN112734808B (zh) 一种车辆行驶环境下易受伤害道路使用者的轨迹预测方法
US11816901B2 (en) Multi-agent trajectory prediction
Gao et al. Dual transformer based prediction for lane change intentions and trajectories in mixed traffic environment
Huang et al. Gameformer: Game-theoretic modeling and learning of transformer-based interactive prediction and planning for autonomous driving
CN114399743A (zh) 一种障碍物未来轨迹的生成方法
Mukherjee et al. Interacting vehicle trajectory prediction with convolutional recurrent neural networks
CN114820708A (zh) 一种基于单目视觉运动估计的周边多目标轨迹预测方法、模型训练方法及装置
Nadarajan et al. Machine learning architectures for the estimation of predicted occupancy grids in road traffic
CN116503446A (zh) 目标驱动和分布热力图输出的多模态车辆轨迹预测方法
CN117141517A (zh) 数据驱动与知识引导相结合的车辆轨迹预测模型构建方法
CN114179830B (zh) 一种自动驾驶车辆的自主超车方法和系统
Sharma et al. Kernelized convolutional transformer network based driver behavior estimation for conflict resolution at unsignalized roundabout
Khanum et al. End-to-end deep learning model for steering angle control of autonomous vehicles
CN113435356B (zh) 一种克服观察噪声与感知不确定性的轨迹预测方法
Mirus et al. The importance of balanced data sets: Analyzing a vehicle trajectory prediction model based on neural networks and distributed representations
CN112435466B (zh) 混合交通流环境下cacc车辆退变为传统车的接管时间预测方法及系统
Kargar et al. Increasing the efficiency of policy learning for autonomous vehicles by multi-task representation learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant