CN116080681A

CN116080681A - 基于循环卷积神经网络的周车行为识别与轨迹预测方法

Info

Publication number: CN116080681A
Application number: CN202211705303.4A
Authority: CN
Inventors: 高洪波; 何希; 朱菊萍; 沈达; 苏慧萍; 谢岳松; 姚卯青
Original assignee: University of Science and Technology of China USTC; Weilai Automobile Technology Anhui Co Ltd
Current assignee: University of Science and Technology of China USTC; Weilai Automobile Technology Anhui Co Ltd
Priority date: 2022-12-29
Filing date: 2022-12-29
Publication date: 2023-05-09

Abstract

本发明公开了一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，属于智能驾驶领域。包括以下步骤：步骤1：针对自动驾驶车辆行驶环境，采集车辆相关数据；步骤2：基于采集的数据集，对车辆行为、道路环境、行人/骑行人行为建模，构建基于矢量表示的人‑车‑路耦合关系模型；步骤3：基于人‑车‑路耦合关系模型，利用长短期记忆网络对目标车辆进行行为模式识别；步骤4：结合人‑车‑路耦合关系模型和车辆行为识别结果，基于卷积神经网络，实现目标车辆的轨迹预测。与现有技术相比，本发明的积极效果是：本发明有效地提高了自动驾驶车辆对周围车辆行为识别与轨迹预测的准确性，增强了自动驾驶车辆行驶的高效性与安全性。

Description

基于循环卷积神经网络的周车行为识别与轨迹预测方法

技术领域

本发明涉及智能驾驶领域，尤其涉及一种基于循环卷积神经网络的周车行为识别与轨迹预测方法。

背景技术

对于自动驾驶车辆而言，安全问题摆在首位。为了提早发现道路上存在的危险，需要能够对车辆周围道路环境的未来变化具有一定的认知能力，即对周围环境具有较强的预测能力，因此车辆轨迹预测是一个十分值得研究的技术挑战。特别地，自动驾驶车辆对周围车辆的行为进行提前预测，对于自动驾驶车辆的行驶安全和效率有着十分重要的影响。如何准确、可靠地预测周车未来轨迹，成为了自动驾驶车辆研究的关键问题之一。

例如，当他车突然插入到自动驾驶车辆前方时，自动驾驶车辆只能通过紧急制动来避免或减小危害，否则发生碰撞的风险非常大。若自动驾驶车辆能够预测到周围车辆的未来行驶轨迹，就可以提前进行平滑的减速，避免碰撞，同时保证了车内人员的驾乘舒适性，因此对周围车辆的未来轨迹进行预测可以提升自动驾驶车辆行驶的安全性。

发明内容

本发明的目的在于克服现有技术存在的不足或缺陷，以便于在城市拥堵工况下，针对道路、车流约束的实际情况，设计基于循环卷积神经网络的周车行为识别与轨迹预测方法，从而提高自动驾驶车辆行驶的安全性与高效性。

为实现上述目的，本发明提供了一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，包括如下步骤：

步骤1：针对自动驾驶车辆行驶环境，采集车辆相关数据；

步骤2：基于采集的数据集，对车辆行为、道路环境、行人/骑行人行为建模，构建基于矢量表示的人-车-路耦合关系模型；

步骤3：基于人-车-路耦合关系模型，利用长短期记忆网络对目标车辆进行行为模式识别；

步骤4：结合人-车-路耦合关系模型和车辆行为识别结果，基于卷积神经网络，实现目标车辆的轨迹预测。

优选地，所述步骤2包括：

车辆行为包括车辆的轨迹信息，道路环境包括车道线位置、斑马线位置等信息，行人/骑行人行为包括行人/骑行人的轨迹信息。

采用矢量表示方法，将车辆行为、道路环境、行人/骑行人行为按不同类别分别建立不同矢量节点，基于图神经网络，为每种类别建立其内部的节点子图，进而建立不同类别之间的全局交互图，获取车-路、车-人、车-车等之间的交互矢量化关系，构建基于矢量表示的人-车-路耦合关系模型。

优选地，所述步骤3包括：

车辆行为模式包括直行、左转弯、右转弯、左换道与右换道。

基于目标车辆状态信息，结合人-车-路耦合关系模型的全局交互特征信息，采用多层长短期记忆网络结构，只将最后一个节点作为分类结果输出，即5种行为模式识别结果。

优选地，所述步骤4包括：

采用卷积神经网络和多层感知器对目标车辆进行长时域多模态轨迹预测，列出所有可能的预测轨迹并选择出可能性最大的预测轨迹。

本发明以自动驾驶车辆为研究对象，考虑城市工况拥堵和道路、车流约束的实际情况，基于对城市道路环境的理解，对自动驾驶车辆周围(目标)车辆进行长时域多模态轨迹预测。

综上所述，本发明提出一种融合多个现有模型的新方案，能提高自动驾驶车辆对周围车辆行为识别与轨迹预测的准确性。具体来说，对于车辆行为模式识别，在现有方法采用LSTM模型进行识别的基础上，融合人-车-路耦合关系模型(此模型的公式也是现有技术)，因此能更好地对车辆行为进行识别，即精准识别出直行、左右换道、左右转弯5种行为模式；对于车辆轨迹预测，首先是基于车辆行为模式识别结果，然后是再融合人-车-路耦合关系模型的结果，最后采用CNN模型+多层感知器(现有方法采用CNN模型进行轨迹预测)对目标车辆进行长时域多模态轨迹预测，并能提高轨迹预测的精度。

与现有技术相比，本发明存在以下技术效果：

1)本发明提出了一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，有效地提高了自动驾驶车辆对周围车辆行为识别与轨迹预测的准确性，增强了自动驾驶车辆行驶的安全性与高效性。

2)本发明搭建了基于长短期记忆网络的车辆行为模式识别模型，基于人-车-路耦合关系模型，采用长短期记忆网络对目标车辆进行行为模式识别，包括直行、左右换道、左右转弯5种行为模式，提高了行为模式识别的准确率。

3)本发明搭建了基于卷积神经网络与多层感知器的车辆轨迹预测模型，基于人-车-路耦合关系模型，结合行为模式识别结果，利用卷积神经网络与多层感知器对目标车辆进行长时域多模态轨迹预测，减小了车辆轨迹预测的偏移误差，提高了预测精度。

附图说明

下面结合附图，对本发明的具体实施方式进行详细描述：

图1是一种基于循环卷积神经网络的周车行为识别与轨迹预测方法的流程示意图；

图2是基于矢量表示的人-车-路耦合关系模型示意图；

图3是基于长短期记忆网络的车辆行为模式识别模型示意图；

图4是基于卷积神经网络与多层感知器的车辆轨迹预测模型示意图；

具体实施方式

为了更进一步说明本发明的特征，请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用，并非用来对本发明的保护范围加以限制。

如图1所示，本实施例公开了一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，包括如下步骤S1～S4：

S1、针对自动驾驶车辆行驶环境，采集车辆相关数据；

S2、基于采集的数据集，对车辆行为、道路环境、行人/骑行人行为建模，构建基于矢量表示的人-车-路耦合关系模型；

S3、基于人-车-路耦合关系模型，利用长短期记忆网络对目标车辆进行行为模式识别；

S4、结合人-车-路耦合关系模型和车辆行为识别结果，基于卷积神经网络，实现目标车辆的轨迹预测。

优选地，所述步骤S1，包括：

利用多种车载传感器，比如摄像头，激光雷达等，采集自动驾驶车辆所处环境的地图数据以及所有周边车辆/行人/骑行人的位置与运动数据，进而建立数据集。但由于实际因素限制，可以采用智能驾驶领域的相关开源数据集，如Waymo数据集、KITTI数据集、NuScenes数据集等。

需要说明的是，本说明采用Waymo运动数据集，含574小时的数据，103,354个带地图数据片段，有汽车、行人、自行车三类标签，每个对象都带有2D框标注，挖掘用于行为预测研究的行为和场景，包括转弯、并道、变道和交汇，地点包括：旧金山、凤凰城、山景城、洛杉矶、底特律和西雅图等。

优选地，所述步骤S2，如图2所示，包括：

采用矢量表示方法，将车辆行为、道路环境、行人/骑行人行为按不同类别分别建立不同矢量节点，为每种类别建立其内部互相联系的节点子图，即建立包含不同数量矢量节点的不同折线子图，然后基于图神经网络使用注意力机制来捕捉车道和代理之间的交互，并对折线子图之间的交互进行建模，即构建不同类别之间的全局交互图，获取车-路、车-人、车-车等之间的交互矢量化关系，构建基于矢量表示的人-车-路耦合关系模型。

需要说明的是，输入信息为经过栅格化、矢量化的地图信息，具体为Waymo运动数据集中的车辆、行人、骑行人轨迹特征、车道特征、交通灯特征等矢量信息，其最终表示为矢量节点特征信息，输出信息为全局交互特征信息。

需要进一步说明的是，栅格化、矢量化的地图信息是指对自动驾驶车辆所处的行驶环境进行栅格化后再进行矢量化，得出最终的矢量化地图信息。栅格地图是彩色地图通过扫描形成地图图像后，经过数字变换和图像处理形成的地图图像数据，基本构图单元是栅格(像素)，数据由点阵组成。矢量地图是依据相应的规范和标准对地图上的所有内容进行编码和属性的定义，确定地图要素的类别、等级和特征，并加上相应的坐标位置来表示，数据形式由点，线组成。

需要进一步说明的是，矢量节点i的特征信息

包括矢量的起点坐标

终点坐标

对应的属性特征a_i，如对象类型、轨迹的时间戳、道路特征类型或车道的速度限制等，以及对应不同类别j的整数ID，同一类别的所有矢量节点通过拼接操作(直接连接)组成P_j，因此V_i∈P_j。其中，i，j＝{1，2，…，P}，P表示同一类别的最大矢量节点数。

多个同类别的不同节点特征信息通过聚合、拼接等关系操作建立多个内部关系节点子图(折线子图)，其公式如下：

其中，

表示第l层节点子图的节点特征信息，l＝{0，1，…，P}，

是输入特征信息V_i，

是聚合节点i连接的所有邻居节点信息，选择最大池化操作，

则表示节点i与其邻居节点j之间的关系，选择拼接操作即可，

表示第l+1层节点子图的节点特征信息。

多个不同类别的节点子图经过池化得出多个不同节点子图特征信息，其公式如下：

其中，

表示矢量节点V_i总共P层的特征信息集合，P_j为不同类别的节点子图特征信息。

进而，基于图神经网络建立全局交互图，其公式如下：

其中，

表示不同类别的节点子图特征信息集合，GNN(·)是对应的一层图神经网络，

表示不同类别的全局交互图特征信息集合。

更具体地，该全局交互图采用自注意力机制，其公式如下：

其中，P表示节点特征矩阵，P_Q,P_K,P_V是其对应的线性投影。

所述步骤S3，如图3所示，包括：

需要说明的是，输入信息为全局交互特征信息与车辆状态信息，输出信息为直行、左转弯、右转弯、左换道与右换道的车辆行为模式识别结果。

需要进一步说明的是，车辆状态信息包括车辆ID，车辆横、纵坐标，车辆速度，车辆加速度以及车辆航向角等信息。

需要说明的是，长短期记忆网络(LSTM，Long Short-Term Memory)是一种时间循环神经网络，适合于处理和预测时间序列中间隔和延迟非常长的重要事件。LSTM主要通过遗忘门、输入门与输出门实现信息的选择性遗忘和记忆，并且轨道(被称为细胞状态)上只有简单的线性运算(即乘法和加法)，从而实现长期记忆，有效抑制长期记忆的梯度耗散问题。具体公式如下：

f_t＝σ(W_f·[h_t-1，x_t]+b_f)

i_t＝σ(W_i·[h_t-1，x_t]+b_i)

0_t＝σ(W_o·[h_t-1，x_t]+b_o)

h_t＝o_t*tanh(C_t)

其中，f_t是指遗忘门的输出值，σ(·)是Sigmoid函数，W_f是遗忘门的权重矩阵，h_t-₁和x_t分别是上一时刻LSTM的输出值和当前时刻网络的输入值，[h_t-1，x_t]表示将两个向量连接成一个更长的向量，b_f是遗忘门的偏置项，i_t是指输入门的输出值，W_i是遗忘门的权矩阵，b_i是遗忘门的偏置项，

指的是当前内存，tanh(-)是tanh函数，W_C是当前内存的权矩阵，C_t是指当前时刻的细胞状态，C_t-1是指长时记忆，o_t是指输出门的输出值，W_o是输出门的权矩阵，b_o是输出门的偏置项，h_t是当前时间LSTM的输出值。

本说明采用2层LSTM结构，输入层是全局交互特征信息与车辆状态信息，经过2个LSTM层之后，再经过一个全连接层，并只将最后一个节点输出作为分类结果，即5种行为模式识别结果，更为具体地说，输出结果是目标车辆预测时间内最有可能处于5种行为模式之一。其中，预测时间可选择3秒，5秒或者8秒。此外，损失函数可采用交叉熵损失函数。

需要说明的是，输入层的数据格式为(批处理大小，特征长度，嵌入)。其中批处理大小可设为100，输入数据的特征数量(LSTM单元的数量)可设为25，输入LSTM单元的对应矢量长度(嵌入)为1。2个LSTM层的数据格式为(隐藏层节点数)，则隐藏层节点的数量可选择为256。全连接层的数据格式为(输入大小，输出大小)，全连接层的输入大小与隐藏层节点数是一样为256，输出大小为5。输出层的数据格式为(批处理大小，特征长度，输出大小)。其中批处理大小可设为100，输入数据的特征数量(LSTM单元的数量)为25，输出大小为5。

所述步骤S4，如图4所示，包括：

需要说明的是，输入信息为全局交互特征信息，行为模式识别结果以及栅格化、矢量化的地图信息，利用卷积神经网络模型与多层感知器一起训练车辆轨迹预测模型，输出信息为目标车辆预测时间内的K条预测轨迹及相应置信度。

需要进一步说明的是，卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络，其公式如下：

其中，

表示第l层第i个神经元的卷积输出，

为第l+1层第j个神经元对第i个神经元的权重，

为第l+1层第j个神经元的偏差量,f(·)为激活函数，

表示第l+1层第j个神经元的卷积输出。

经典卷积神经网络模型有Inception、Xception、SeNet、ResNext等。本说明的卷积神经网络模型可以选择Inception/Xception等模型。

需要进一步说明的是，多层感知器(MLP，Multilayer Perceptron)是一种前馈人工神经网络模型，其公式如下：

其中，l层共有m个神经元，

为第l层的第k个神经元的卷积输出，

为第l层第k个神经元对l+1层第j个神经元的权重，f(·)为激活函数，

为第l+1层的第j个神经元的卷积输出。

本说明的多层感知器结构包括规范化层，全连接层以及非线性激活函数层。层规范化是指在训练时和测试时对数据同时进行处理，通过对输入同一层的数据进行汇总，计算平均值和方差，来对每一层的输入数据做规范化处理，进而加快网络的收敛速度。非线性激活函数可以选择ReLU函数。

需要进一步说明的是，K条预测轨迹及相应置信度中K＝6，即需要对预测时间内对目标车辆的6条未来轨迹进行预测，并给出每条轨迹对应的置信度C_i＝ⁱ/∑_Ke^K，i＝{1,2,…,}，e为自然常数(欧拉数)，

选择其中置信度最大(可能性最大)的那条未来轨迹作为预测结果。其中，预测时间可选择3秒，5秒或者8秒。

综上所述，本发明提出一种融合多个现有模型的新方案，能提高自动驾驶车辆对周围车辆行为识别与轨迹预测的准确性。

具体来说，对于车辆行为模式识别，在现有方法采用LSTM模型进行识别的基础上，融合人-车-路耦合关系模型(此模型的公式也是现有技术)，因此能更好地对车辆行为进行识别，即精准识别出直行、左右换道、左右转弯5种行为模式；对于车辆轨迹预测，首先是基于车辆行为模式识别结果，然后是再融合人-车-路耦合关系模型的结果，最后采用CNN模型+多层感知器(现有方法采用CNN模型进行轨迹预测)对目标车辆进行长时域多模态轨迹预测，并能提高轨迹预测的精度。

总得来说，本发明以自动驾驶车辆为平台，提出了一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，基于人-车-路耦合关系模型，结合基于长短期记忆网络的5种车辆行为模式识别模型，利用基于卷积神经网络与多层感知器的车辆轨迹预测模型，对目标车辆进行长时域多模态轨迹预测，研究长时域内面向周围车辆的端到端行为预测算法，有效地提高了自动驾驶车辆对周围车辆行为识别与轨迹预测的准确性，增强了自动驾驶车辆行驶的安全性与高效性。

又一方面，本发明还公开一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如上述任一方法的步骤。

再一方面，本发明还公开一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如上述任一方法的步骤。

在本申请提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一方法的步骤。

可理解的是，本发明实施例提供的系统与本发明实施例提供的方法相对应，相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，其特征在于，包括以下步骤：

步骤1：针对自动驾驶车辆行驶环境，采集车辆相关数据；

2.根据权利要求1所述的一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，其特征在于，所述步骤2包括：

车辆行为包括车辆的轨迹信息，道路环境包括车道线位置、斑马线位置等信息，行人/骑行人行为包括行人/骑行人的轨迹信息；

3.根据权利要求2所述的一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，其特征在于，所述步骤2具体包括：

包括矢量节点i的特征信息

包括矢量的起点坐标

终点坐标

对应的属性特征a_i，包括对象类型、轨迹的时间戳、道路特征类型或车道的速度限制，以及对应不同类别j的整数ID，同一类别的所有矢量节点通过拼接操作组成P_j，V_i∈P_j；其中，i,j＝{1,2,…,}，P表示同一类别的最大矢量节点数；

多个同类别的不同节点特征信息通过聚合、拼接关系操作建立多个内部关系节点子图，其公式如下：

其中，

表示第l层节点子图的节点特征信息，l＝{0,1,…,P}，

是输入特征信息V_i，

是聚合节点i连接的所有邻居节点信息，选择最大池化操作，

表示第l+1层节点子图的节点特征信息；

其中，

表示矢量节点V_i总共P层的特征信息集合，P_j为不同类别的节点子图特征信息；

进而，通过图神经网络建立全局交互图，其公式如下：

其中，

表示不同类别的全局交互图特征信息集合。

4.根据权利要求1所述的一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，其特征在于，所述步骤3包括：

车辆行为模式包括直行、左转弯、右转弯、左换道与右换道；

基于目标车辆状态信息，结合人-车-路耦合关系模型的全局交互特征信息，采用多层长短期记忆网络结构，只将最后一个节点作为分类结果输出，即上述5中行为模式识别结果。

5.根据权利要求4所述的一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，其特征在于，

所述步骤3采用2层LSTM结构，输入层是全局交互特征信息与车辆状态信息，经过2个LSTM层之后，再经过一个全连接层，并只将最后一个节点输出作为分类结果，即5种行为模式识别结果，更为具体地说，输出结果是目标车辆预测时间内最有可能处于5种行为模式之一。

6.根据权利要求5所述的一种基于循环卷积神经网络的周车行为识别与轨迹预测方法，其特征在于：

所述LSTM结构通过遗忘门、输入门与输出门实现信息的选择性遗忘和记忆，具体公式如下：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

o_t＝σ(W_o·[h_t-1,x_t]+b_o)

h_t＝o_t*tanh(C_t)

其中，f_t是指遗忘门的输出值，σ(·)是Sigmoid函数，W_f是遗忘门的权重矩阵，h_t-1和x_t分别是上一时刻LSTM的输出值和当前时刻网络的输入值，[h_t-1,x_t]表示将两个向量连接成一个更长的向量，b_f是遗忘门的偏置项，i_t是指输入门的输出值，W_i是遗忘门的权矩阵，b_i是遗忘门的偏置项，

指的是当前内存，tanh(·)是tanh函数，-_C是当前内存的权矩阵，C_t是指当前时刻的细胞状态，C_t-1是指长时记忆，o_t是指输出门的输出值，W_o是输出门的权矩阵，b_o是输出门的偏置项，h_t是当前时间LSTM的输出值。

7.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。