CN116495007A - 一种考虑物理约束的车辆轨迹深度学习预测方法 - Google Patents
一种考虑物理约束的车辆轨迹深度学习预测方法 Download PDFInfo
- Publication number
- CN116495007A CN116495007A CN202310272329.2A CN202310272329A CN116495007A CN 116495007 A CN116495007 A CN 116495007A CN 202310272329 A CN202310272329 A CN 202310272329A CN 116495007 A CN116495007 A CN 116495007A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- long
- time
- track
- memory network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000013135 deep learning Methods 0.000 title claims abstract description 31
- 230000015654 memory Effects 0.000 claims abstract description 74
- 230000008859 change Effects 0.000 claims abstract description 39
- 230000001133 acceleration Effects 0.000 claims abstract description 30
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000004088 simulation Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000006073 displacement reaction Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 208000000044 Amnesia Diseases 0.000 claims description 3
- 208000031091 Amnestic disease Diseases 0.000 claims description 3
- 230000006986 amnesia Effects 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims description 3
- 238000010835 comparative analysis Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 230000007774 longterm Effects 0.000 abstract description 6
- 238000013499 data model Methods 0.000 abstract description 4
- 239000010410 layer Substances 0.000 description 17
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000004880 explosion Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005293 physical law Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/10—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
- B60W60/0027—Planning or execution of driving tasks using trajectory prediction for other traffic participants
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
- B60W60/0027—Planning or execution of driving tasks using trajectory prediction for other traffic participants
- B60W60/00272—Planning or execution of driving tasks using trajectory prediction for other traffic participants relying on extrapolation of current movement
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/40—Dynamic objects, e.g. animals, windblown objects
- B60W2554/404—Characteristics
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/40—Dynamic objects, e.g. animals, windblown objects
- B60W2554/404—Characteristics
- B60W2554/4042—Longitudinal speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/40—Dynamic objects, e.g. animals, windblown objects
- B60W2554/404—Characteristics
- B60W2554/4043—Lateral speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/40—Dynamic objects, e.g. animals, windblown objects
- B60W2554/404—Characteristics
- B60W2554/4044—Direction of movement, e.g. backwards
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Transportation (AREA)
- Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明适用于车辆的轨迹预测技术领域,提供了一种考虑物理约束的车辆轨迹深度学习预测方法,在经典恒转向速度和加速度模型的基础上,考虑换道场景下的车辆的汽车运动学特点,建立了恒横摆角速度、变加速度汽车运动学模型。同时,选取长短时记忆网络作为基础的数据模型。将恒横摆角速度、变加速度汽车运动学模型作为物理约束嵌入长短时记忆网络中,搭建物理约束长短时记忆网络。仿真结果表明,本发明提出的轨迹预测方法适用于车辆轨迹的长期预测,相较于传统基于深度学习的轨迹预测方法,在保证预测准确性的前提下,增强了预测过程的可解释性和预测结果的可靠性。
Description
技术领域
本发明属于车辆的轨迹预测技术领域,尤其涉及一种考虑物理约束的车辆轨迹深度学习预测方法。
背景技术
当前自动驾驶已经成为汽车工业领域和学术界的关注焦点。作为自动驾驶的关键核心技术,自动车需要能够准确预测交通场景中周围车辆等障碍物的运动轨迹,这是做出合理决策规划的前提。因此,对车辆轨迹预测方法进行研究具有重大理论和工程意义,是提高汽车自动驾驶水平的关键。
轨迹预测问题可以描述为:使用给定场景中交通参与者的过去状态来估计他们的未来状态,其本质是对一系列时间序列的处理。目前车辆轨迹方法主要有基于物理的方法、基于传统机器学习的方法、基于强化学习的方法和基于深度学习的方法。基于物理的方法适用性强、计算时间短且无需训练,但长期预测(>3s)的精度很差;基于传统机器学习的方法相较于物理方法精度更高,但计算成本也更高,泛化能力差;基于深度学习的方法可以通过学习不断进化,长期预测的准确率高,但训练时间过长,计算成本极高,更多用于决策、规划和控制过程中。相较于前三种轨迹预测方法,基于深度学习的方法在预测时域、预测精度、计算成本、泛化能力等性能指标下取得了更好的平衡,所以应用更加广泛,是目前车辆轨迹预测的主流研究方向。尤其是基于长短时记忆网络的方法,由于其擅长处理时间序列,且能避免预测步长较大时的梯度消失和梯度爆炸问题,已成为本领域的研究热点。因此,本发明采用长短时记忆网络作为基础数据模型。
但基于深度学习的方法作为一种数据驱动的“黑箱”模型,不可避免地有可解释性差、可靠性低的缺点。而物理信息神经网络(Physics-informed Neutral Network,PINN)是一类用于解决有监督学习任务的神经网络,它不仅遵循训练数据样本的分布规律,而且遵守由微分方程描述的物理定律。与纯数据驱动的神经网络学习相比,PINN在训练过程中施加了物理信息约束,可以通过内嵌物理约束的学习得到更具可解释性的模型。因此,本发明在经典恒转向速度和加速度模型的基础上,建立了恒横摆角速度、变加速度汽车运动学模型作为基础的物理模型。
为了解决基于深度学习的车辆轨迹预测方法可解释性弱、可靠性差的问题,本发明提出了一种考虑物理约束的车辆轨迹深度学习预测方法。在经典恒转向速度和加速度模型的基础上,考虑换道场景下的车辆的汽车运动学特点,建立了恒横摆角速度、变加速度汽车运动学模型。同时,考虑到轨迹预测问题的本质是对时间序列的处理,且应尽量规避长期预测时深度网络的梯度消失和梯度爆炸问题,选取长短时记忆网络作为基础的数据模型。将恒横摆角速度、变加速度汽车运动学模型作为物理约束嵌入长短时记忆网络中,搭建物理约束长短时记忆网络。仿真结果表明,本发明提出的轨迹预测方法适用于车辆轨迹的长期预测,相较于传统基于深度学习的轨迹预测方法,在保证预测准确性的前提下,增强了预测过程的可解释性和预测结果的可靠性。
发明内容
为了解决基于深度学习的轨迹预测方法可解释性差、可靠性低的问题,本发明提出了一种考虑物理约束的车辆轨迹深度学习预测方法。建立恒横摆角速度、变加速度汽车运动学模型,搭建物理约束长短时记忆网络,为自动驾驶的决策、规控过程提供了一种较高可解释性和可靠性的轨迹参考。具体来讲,该方法考虑换道场景下车辆的汽车运动学特点,建立了恒横摆角速度、变加速度汽车运动学模型。同时,选取长短时记忆网络作为基础的数据模型。将恒横摆角速度、变加速度汽车运动学模型为物理约束嵌入长短时记忆网络中,通过最小化包含微分方程均方误差项的损失函数,使得预测得到的轨迹自动满足汽车运动学约束。
本发明实施例是这样实现的,一种考虑物理约束的车辆轨迹深度学习预测方法,所述考虑物理约束的车辆轨迹深度学习预测方法包括如下步骤:
步骤1、建立汽车运动学模型;
步骤2、搭建长短时记忆网络;
步骤3、搭建物理约束长短时记忆网络,并选取网络参数,对该记忆网络进行训练;
步骤4、仿真结果和对比分析。
作为本发明更进一步的方案,步骤1中所述的建立汽车运动学模型,具体包括:
在传统恒转向速度和加速度模型的基础上,考虑换道场景下的车辆的汽车运动学特点,建立恒横摆角速度、变加速度汽车运动学模型;
车辆的速度以及横摆角满足以下关系式:
v(t)=v0+a0t
其中,v0和分别是初始速度和初始横摆角,a0和ω0分别是当车辆当前加速度和横摆角速度;
因此在笛卡尔全局坐标系下,t时刻车辆速度分别向X,Y轴进行分解,得到:
获得纵向速度后,将其对时间积分可得横纵向位移为:
其中Mx和My是相关常数项,具体表达式为:
其中x0和y0为车辆初始横纵向位置,当ω0=0时上式不成立,此时车辆做匀加速直线运动,可以得到车辆运动方程为:
在高速公路换道场景下,汽车的实际运动可分解为横向、纵向的变加速直线运动,此外物理信息网络也适用于常微分方程的求解问题,可将式(5)改写为:
其中,vx0和vy0分别为初始时刻车辆的横向和纵向速度;
若忽略车辆的质心侧偏角,则t时刻车辆的横向、纵向速度可由下式计算:
其中,q(t)为t时刻的车辆航向角;
式(6)即为恒横摆角速度、变加速度汽车运动学模型。
作为本发明更进一步的方案,步骤2所述的搭建长短时记忆网络,具体包括:
S1、建立CTRVA汽车运动学模型后,对数据集进行预处理;
S2、基于Python语言搭建长短时记忆网络。
作为本发明更进一步的方案,所述的建立CTRVA汽车运动学模型后,对数据集进行预处理,具体包括:
S1、采用一阶Savitzky Golay算法对数据集中的速度数据进行平滑处理,并从数据集中提取车道变换数据样本;
S2、分别按照Vehicle_ID和Global_Time对车辆数据进行排序,将数据按车辆分块,且单个车辆数据按时间升序排列;
S3、排除进出匝道的车辆,并查找剩余数据中Lane_ID发生变化,即有换道行为的车辆,Lane_ID变化的点即为换道点;
S4、从换道点分别向前和向后提取3.5s的数据,并保证在换道点前车辆始终处于原车道,换道后始终处于目标车道,以剔除连续换道的车辆;
S5、按照公式(7)计算车辆在每个采样点的横向和纵向速度,得到车辆换道数据样本;
S6、根据预测时域设置指定的序列长度,采用滑动窗口算法对车辆轨迹进行划分。
作为本发明更进一步的方案,所述的基于Python语言搭建长短时记忆网络,具体包括:
将当前时间步的输入特征和前一个时间步的隐状态作为本记忆元的输入,将当前时间步的隐状态作为本记忆元的输出,亦即下一记忆元的输入;
假设LSTM层有h个隐藏单元,批量大小为n,输入特征数为k,则有输入为前一时间步的隐状态为/>当前时间步的输入门为/>遗忘门为/>输出门为/>候选记忆元为Ct∈Rn×h,隐状态为/>它们间的计算公式为:
It=σ(XtWxi+Ht-1Whi+bi)
Ft=σ(XtWxf+Ht-1Whf+bf)
Ot=σ(XtWxo+Ht-1Who+bo)
Ct=tanh(XtWxc+Ht-1Whc+bc)
Ct=Ft Ct-1+It Ct
Ht=Ot tanh(Ct) (8)
其中Wxi,Wxf,Wxo,Wxc∈Rd×h和Whi,Whf,Who,Whc∈Rh×h为权重参数,bi,BF,bo,为偏置参数;
假设LSTM层有h个隐藏单元,批量大小为n,则第一个全连接层输的输入为
假设第二个全连接层有j个线性单元,深度长短时记忆网络的整体输出特征数为l,则其输入为Yt∈Rn×j,输出为Zt∈Rn×l,计算公示为
Yt=σ(HtWd1+bd1)
Zt=σ(YtWd2+bd2) (9)
其中Wd1∈Rh×j,Wd2∈Rj×l为权重参数,为偏置参数。
作为本发明更进一步的方案,步骤3所述的搭建物理约束长短时记忆网络,具体包括:
在CTRVA汽车运动学模型和LSTM网络的基础上,搭建物理约束长短时记忆网络,由公式(6)可得:
则物理约束长短时记忆网络的损失函数可表示为
L=ω1L1+ω2L2+ω3L3 (11)
其中:
L1、L2、L3分别为预测轨迹的损失函数、满足汽车运动学约束的预测横向位移损失函数和预测纵向速度损失函数;
T=(x,vy)和分别为实际和预测的轨迹向量,N1、N2分别为损失函数L1和L2、L3对应的轨迹点数,ω1、ω2和ω3分别为各损失函数的权重,x0、vx0和vy0分别为由输入向量中随机采样得到的历史轨迹点对应的横向位移、横向速度和纵向速度,Δt为随机采样的历史轨迹点到对应预测轨迹点的时间间隔。
作为本发明更进一步的方案,步骤3所述的选取网络参数,对该记忆网络进行训练,具体包括:
所述的物理约束长短时记忆网络,在一次典型的迭代中,其训练流程为:
S1、正向传播:
依据搭建好的物理约束长短时记忆网络构建计算图;
将向量X(t,x,y,vx,vy)输入模型,得到输出向量并计算损失函数L,由公式(11)可得:
其中,
又由公式(8)和(9)可得:
其中:
X=(t,x,y,vx,vy,a)
W=(Wxi,Wxf,Wxo,Wxc,Whi,Whf,Who,Whc,Wd1,Wd2)
b=(bi,bf,bo,bc,bd1,bd2)
其中,X、W、b分别为深度网络的输入、权重参数和偏置参数;
S2、反向传播:
计算损失函数对模型参数的导数,即
根据得出的导数,利用梯度下降法等方法不断更新模型参数W和b,让损失函数L取得最小值;
权重参数W和偏置参数b的更新公式为
其中,h为学习率。
本发明实施例提供的一种考虑物理约束的车辆轨迹深度学习预测方法,具有以下有益效果:
与传统基于物理的“白箱”方法和基于深度学习的“黑箱”方法不同,考虑物理约束的车辆轨迹深度学习预测方法是一种“灰箱”方法,由于其内嵌了汽车运动学模型,因此该方法不仅遵循训练样本的分布规律,而且遵守由微分方程描述的物理定律,能切实增强轨迹预测过程的可解释性与结果的可靠性;
基于深度学习网络在时间序列预测领域的优势,在长预测时域时,考虑物理约束的深度学习方法仍然保持较高的预测准确性,克服了传统基于物理模型方法的缺点,扩展了其长时域轨迹预测的应用场景,具有较大的理论和实践意义。
附图说明
图1为考虑物理约束的车辆轨迹深度学习预测方法示意图;
图2为US101数据集采集区域示意图;
图3为LSTM网络记忆元结构图;
图4为CTRA、LSTM和PC-LSTM预测横向位移与实际横向位移对比图;
图5为CTRA、LSTM和PC-LSTM预测纵向速度与实际纵向速度对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述。
如图1所示,在本发明实施例中,所述考虑物理约束的车辆轨迹深度学习预测方法包括如下步骤:
步骤1、建立汽车运动学模型;
步骤2、搭建长短时记忆网络;
步骤3、搭建物理约束长短时记忆网络,并选取网络参数,对该记忆网络进行训练;
步骤4、仿真结果和对比分析。
在本发明实施例中,步骤1中所述的建立汽车运动学模型,具体包括:
在传统恒转向速度和加速度模型的基础上,考虑换道场景下的车辆的汽车运动学特点,建立恒横摆角速度、变加速度汽车运动学模型;
CTRA模型运动模型假定车辆在运动过程中保持恒定的加速度和横摆角速度,从而实现了轨迹预测问题的简化。
车辆的速度以及横摆角满足以下关系式:
v(t)=v0+a0t
其中,v0和分别是初始速度和初始横摆角,a0和ω0分别是当车辆当前加速度和横摆角速度;
因此在笛卡尔全局坐标系下,t时刻车辆速度分别向X,Y轴进行分解,得到:
获得纵向速度后,将其对时间积分可得横纵向位移为:
其中Mx和My是相关常数项,具体表达式为:
其中x0和y0为车辆初始横纵向位置,当ω0=0时上式不成立,此时车辆做匀加速直线运动,可以得到车辆运动方程为:
在高速公路换道场景下,汽车的实际运动可分解为横向、纵向的变加速直线运动,此外物理信息网络也适用于常微分方程的求解问题,可将式(5)改写为:
其中,vx0和vy0分别为初始时刻车辆的横向和纵向速度;
若忽略车辆的质心侧偏角,则t时刻车辆的横向、纵向速度可由下式计算:
其中,q(t)为t时刻的车辆航向角;
式(6)即为恒横摆角速度、变加速度汽车运动学模型。
在本发明实施例中,步骤2所述的搭建长短时记忆网络,具体包括:
S1、建立CTRVA汽车运动学模型后,对数据集进行预处理;
S2、基于Python语言搭建长短时记忆网络。
建立CTRVA汽车运动学模型后,对数据集进行预处理。NGSIM是目前自动驾驶领域最全面、最常用的公开数据集。本发明选取了NGSIM数据集中US101数据段(以下称US101数据集)作为深度网络的数据集。
US101数据集采自一段长约640米的高速公路路段,它包括5条主干道,1条辅助车道,1条入口匝道和1条出口匝道,如图2所示。数字摄像机以0.1s的间隔记录车辆的准确位置信息,并经视频转换为车辆轨迹数据。数据总时长为45分钟,划分为3个时间段:7:50-8:05、8:05-8:20和8:20-8:35。US101数据集包括类型、长度、宽度等车辆信息以及横向位置、纵向位置、速度、加速度等轨迹信息,如表1所示。
表1:US101数据集参数
在本发明实施例中,所述的建立CTRVA汽车运动学模型后,对数据集进行预处理,具体包括:
S1、采用一阶Savitzky Golay算法对数据集中的速度数据进行平滑处理,并从数据集中提取车道变换数据样本;
S2、分别按照Vehicle_ID和Global_Time对车辆数据进行排序,将数据按车辆分块,且单个车辆数据按时间升序排列;
S3、筛去Lane_ID等于7或8的样本,排除进出匝道的车辆,并查找剩余数据中Lane_ID发生变化,即有换道行为的车辆,Lane_ID变化的点即为换道点;
S4、从换道点分别向前和向后提取3.5s的数据,并保证在换道点前车辆始终处于原车道,换道后始终处于目标车道,以剔除连续换道的车辆;
S5、按照公式(7)计算车辆在每个采样点的横向和纵向速度,得到车辆换道数据样本;
S6、最后,为提高预测结果的准确性,在开始训练模型之前,根据预测时域设置指定的序列长度,采用滑动窗口算法对车辆轨迹进行划分。
本发明中,设置采样窗口分别为10、20、30、40、50;采样频率与原始US101数据集一致,为10MHz,即1s内可以采集10个数据点;时间步长为0.1s,即相邻两个轨迹序列中分别有9、19、29、39、49个采样点重合。
在本发明实施例中,所述的基于Python语言搭建长短时记忆网络,具体包括:
本发明的长短时记忆(Long Short-Term Memory,LSTM)网络基于Python语言搭建,由一个包含128个隐藏层节点的单层LSTM循环体,一个包含128个节点的全连接层和一个包含64个节点的全连接层组成。LSTM层为预测层,用以实现轨迹预测,两个全连接层为输出层,用以将预测轨迹以向量的形式输出。
LSTM网络是一种时间循环神经网络,它解决了一般循环神经网络(RecurrentNeural Network,RNN)存在的长期信息保存和短期输入缺失的问题,适合处理时间序列,且能避免预测步长较大时的梯度消失和梯度爆炸。典型长短时记忆网络的结构如图3所示。LSTM网络引入了记忆元(memory cell)用于记录附加信息,其中,候选记忆元(candidatememory cell)用于存储当前时间步的信息;同时分别设计了输出门(output gate)用于从记忆元中输出条目,输入门(input gate)用于决定何时将数据读入记忆元,遗忘门(forgetgate)用于重置记忆元中的内容。
将当前时间步的输入特征和前一个时间步的隐状态作为本记忆元的输入,将当前时间步的隐状态作为本记忆元的输出,亦即下一记忆元的输入;
假设LSTM层有h个隐藏单元,批量大小为n,输入特征数为k,则有输入为前一时间步的隐状态为/>当前时间步的输入门为/>遗忘门为/>输出门为/>候选记忆元为Ct∈Rn×h,隐状态为/>它们间的计算公式为:
It=σ(XtWxi+Ht-1Whi+bi)
Ft=σ(XtWxf+Ht-1Whf+bf)
Ot=σ(XtWxo+Ht-1Who+bo)
Ct=tanh(XtWxc+Ht-1Whc+bc)
Ct=Ft Ct-1+It Ct
Ht=Ot tanh(Ct) (8)
其中Wxi,Wxf,Wxo,Wxc∈Rd×h和Whi,Whf,Who,Whc∈Rh×h为权重参数,bi,bf,bo,为偏置参数;
线性神经网络单元是神经网络中最基础的结构,深度学习中常用若干个线性神经网络单元构成的全连接层作为深度网络的输出层。
假设LSTM层有h个隐藏单元,批量大小为n,则第一个全连接层输的输入为
假设第二个全连接层有j个线性单元,深度长短时记忆网络的整体输出特征数为l,则其输入为Yt∈Rn×j,输出为Zt∈Rn×l,计算公示为
Yt=σ(HtWd1+bd1)
Zt=σ(YtWd2+bd2) (9)
其中Wd1∈Rh×j,Wd2∈Rj×l为权重参数,为偏置参数。
由于US101数据集观测区域的横向跨度只有20m,而纵向跨度超过600m,为保证预测的准确性,将时间t、车辆历史横向坐标x、纵向坐标y、横向速度vx、纵向速度vy,加速度a构成的向量X作为输入对象,将预测得到的车辆横向坐标和纵向速度vy构成的向量T作为输出对象。
在本发明实施例中,步骤3所述的搭建物理约束长短时记忆网络,具体包括:
在CTRVA汽车运动学模型和LSTM网络的基础上,搭建物理约束长短时记忆网络。后者的主体结构和输入输出形式与前者相同,不同的是,本发明的提出的物理约束网络对损失函数进行了改进。
在CTRVA汽车运动学模型和LSTM网络的基础上,搭建物理约束长短时记忆网络,由公式(6)可得:
则物理约束长短时记忆网络的损失函数可表示为
L=ω1L1+ω2L2+ω3L3 (11)
其中:
L1、L2、L3分别为预测轨迹的损失函数、满足汽车运动学约束的预测横向位移损失函数和预测纵向速度损失函数;
T=(x,vy)和分别为实际和预测的轨迹向量,N1、N2分别为损失函数L1和L2、L3对应的轨迹点数,ω1、ω2和ω3分别为各损失函数的权重,x0、vx0和vy0分别为由输入向量中随机采样得到的历史轨迹点对应的横向位移、横向速度和纵向速度,Δt为随机采样的历史轨迹点到对应预测轨迹点的时间间隔。
在本发明实施例中,步骤3所述的选取网络参数,对该记忆网络进行训练,具体包括:
深度网络的训练是一个不断迭代的过程,每一次迭代都包括正向传播和反向传播两个环节。对于本发明提出的物理约束深度网络模型,在一次典型的迭代中,其训练流程如下:
S1、正向传播:
依据搭建好的物理约束长短时记忆网络构建计算图;
将向量X(t,x,y,vx,vy)输入模型,得到输出向量并计算损失函数L,由公式(11)可得:
其中,
又由公式(8)和(9)可得:
其中:
X=(t,x,y,vx,vy,a)
W=(Wxi,Wxf,Wxo,Wxc,Whi,Whf,Who,Whc,Wd1,Wd2)
b=(bi,bf,bo,bc,bd1,bd2)
其中,X、W、b分别为深度网络的输入、权重参数和偏置参数;
S2、反向传播:
计算损失函数对模型参数的导数,即
根据得出的导数,利用梯度下降法等方法不断更新模型参数W和b,让损失函数L取得最小值;
权重参数W和偏置参数b的更新公式为
其中,h为学习率。
当迭代次数足够大时,损失函数L的最小值将趋近于零,而按照公式(11),当L→0时有Li→0(i=1,2,3),即预测轨迹近似满足公式(10)中的汽车运动学方程。
本发明中共提取了1200条轨迹数据,训练集与测试集比例为8:2。采用随机梯度下降法对物理约束长短时记忆网络模型进行训练,学习率取0.005,batch-size取32,epoch取50,损失函数权重分别取ω1=0.8、ω2=0.1和ω3=0.1,迭代完成并保存最优网络的相关参数。读取最优模型参数,输入测试集数据得到预测结果。
仿真结果分析
在1s、2s、3s、4s、5s预测时域下,对第1001个样本的恒横摆角速度、变加速度(CTRA)、长短时记忆(LSTM)网络和物理约束长短时记忆(PC-LSTM)网络模型的预测结果进行可视化输出,如图4和图5所示。计算三种模型在不同预测时域下对应的预测均方根误差平均值,如表2和表3所示。
表2:CTRA、LSTM和PC-LSTM模型预测的横向位移均方根误差平均值
表3:CTRA、LSTM和PC-LSTM模型预测的纵向速度均方根误差平均值
由仿真结果可知,基于CTRA汽车运动学模型的方法在短时域预测时有较高的准确性,其表现优于基于深度学习的方法。但随着预测时域的增加,LSTM和PC-LSTM网络模型逐渐体现出自身的优势,且总体来看,纵向速度的预测误差低于横向位移的预测误差。特别是PC-LSTM模型,在预测精度高于LSTM模型的前提下,满足汽车运动学的物理约束,提高了预测过程的可解释性和预测结果的可靠性。这说明本发明提出的基于PC-LSTM网络的车辆轨迹预测方法具有较强的理论创新性和较高的实际应用价值。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种考虑物理约束的车辆轨迹深度学习预测方法,其特征在于,所述考虑物理约束的车辆轨迹深度学习预测方法包括如下步骤:
步骤1、建立汽车运动学模型;
步骤2、搭建长短时记忆网络;
步骤3、搭建物理约束长短时记忆网络,并选取网络参数,对该记忆网络进行训练;
步骤4、仿真结果和对比分析。
2.根据权利要求1所述的考虑物理约束的车辆轨迹深度学习预测方法,其特征在于,步骤1中所述的建立汽车运动学模型,具体包括:
在传统恒转向速度和加速度模型的基础上,考虑换道场景下的车辆的汽车运动学特点,建立恒横摆角速度、变加速度汽车运动学模型;
车辆的速度以及横摆角满足以下关系式:
v(t)=v0+a0t
其中,v0和分别是初始速度和初始横摆角,a0和ω0分别是当车辆当前加速度和横摆角速度;
因此在笛卡尔全局坐标系下,t时刻车辆速度分别向X,Y轴进行分解,得到:
获得纵向速度后,将其对时间积分可得横纵向位移为:
其中Mx和My是相关常数项,具体表达式为:
其中x0和y0为车辆初始横纵向位置,当ω0=0时上式不成立,此时车辆做匀加速直线运动,可以得到车辆运动方程为:
在高速公路换道场景下,汽车的实际运动可分解为横向、纵向的变加速直线运动,此外物理信息网络也适用于常微分方程的求解问题,可将式(5)改写为:
其中,vx0和vy0分别为初始时刻车辆的横向和纵向速度;
若忽略车辆的质心侧偏角,则t时刻车辆的横向、纵向速度可由下式计算:
其中,q(t)为t时刻的车辆航向角;
式(6)即为恒横摆角速度、变加速度汽车运动学模型。
3.根据权利要求2所述的考虑物理约束的车辆轨迹深度学习预测方法,其特征在于,步骤2所述的搭建长短时记忆网络,具体包括:
S1、建立CTRVA汽车运动学模型后,对数据集进行预处理;
S2、基于Python语言搭建长短时记忆网络。
4.根据权利要求3所述的考虑物理约束的车辆轨迹深度学习预测方法,其特征在于,所述的建立CTRVA汽车运动学模型后,对数据集进行预处理,具体包括:
S1、采用一阶Savitzky Golay算法对数据集中的速度数据进行平滑处理,并从数据集中提取车道变换数据样本;
S2、分别按照Vehicle_ID和Global_Time对车辆数据进行排序,将数据按车辆分块,且单个车辆数据按时间升序排列;
S3、排除进出匝道的车辆,并查找剩余数据中Lane_ID发生变化,即有换道行为的车辆,Lane_ID变化的点即为换道点;
S4、从换道点分别向前和向后提取3.5s的数据,并保证在换道点前车辆始终处于原车道,换道后始终处于目标车道,以剔除连续换道的车辆;
S5、按照公式(7)计算车辆在每个采样点的横向和纵向速度,得到车辆换道数据样本;
S6、根据预测时域设置指定的序列长度,采用滑动窗口算法对车辆轨迹进行划分。
5.根据权利要求3所述的考虑物理约束的车辆轨迹深度学习预测方法,其特征在于,所述的基于Python语言搭建长短时记忆网络,具体包括:
将当前时间步的输入特征和前一个时间步的隐状态作为本记忆元的输入,将当前时间步的隐状态作为本记忆元的输出,亦即下一记忆元的输入;
假设LSTM层有h个隐藏单元,批量大小为n,输入特征数为k,则有输入为前一时间步的隐状态为/>当前时间步的输入门为/>遗忘门为/>输出门为/>候选记忆元为Ct∈Rn×h,隐状态为/>它们间的计算公式为:
It=σ(XtWxi+Ht-1Whi+bi)
Ft=σ(XtWxf+Ht-1Whf+bf)
Ot=σ(XtWxo+Ht-1Who+bo)
Ct=tanh(XtWxc+Ht-1Whc+bc)
Ct=Ft Ct-1+It Ct
Ht=Ot tanh(Ct) (8)
其中Wxi,Wxf,Wxo,Wxc∈Rd×h和Whi,Whf,Who,Whc∈Rh×h为权重参数,bi,bf,bo,为偏置参数;
假设LSTM层有h个隐藏单元,批量大小为n,则第一个全连接层输的输入为
假设第二个全连接层有j个线性单元,深度长短时记忆网络的整体输出特征数为l,则其输入为Yt∈Rn×j,输出为Zt∈Rn×l,计算公示为
Yt=σ(HtWd1+bd1)
Zt=σ(YtWd2+bd2) (9)
其中Wd1∈Rh×j,Wd2∈Rj×l为权重参数,为偏置参数。
6.根据权利要求1所述的考虑物理约束的车辆轨迹深度学习预测方法,其特征在于,步骤3所述的搭建物理约束长短时记忆网络,具体包括:
在CTRVA汽车运动学模型和LSTM网络的基础上,搭建物理约束长短时记忆网络,由公式(6)可得:
则物理约束长短时记忆网络的损失函数可表示为
L=ω1L1+ω2L2+ω3L3 (11)
其中:
L1、L2、L3分别为预测轨迹的损失函数、满足汽车运动学约束的预测横向位移损失函数和预测纵向速度损失函数;
T=(x,vy)和分别为实际和预测的轨迹向量,N1、N2分别为损失函数L1和L2、L3对应的轨迹点数,ω1、ω2和ω3分别为各损失函数的权重,x0、vx0和vy0分别为由输入向量中随机采样得到的历史轨迹点对应的横向位移、横向速度和纵向速度,Δt为随机采样的历史轨迹点到对应预测轨迹点的时间间隔。
7.根据权利要求1所述的考虑物理约束的车辆轨迹深度学习预测方法,其特征在于,步骤3所述的选取网络参数,对该记忆网络进行训练,具体包括:
所述的物理约束长短时记忆网络,在一次典型的迭代中,其训练流程为:
S1、正向传播:
依据搭建好的物理约束长短时记忆网络构建计算图;
将向量X(t,x,y,vx,vy)输入模型,得到输出向量并计算损失函数L,由公式(11)可得:
其中,
又由公式(8)和(9)可得:
其中:
X=(t,x,y,vx,vy,a)
W=(Wxi,Wxf,Wxo,Wxc,Whi,Whf,Who,Whc,Wd1,Wd2)
b=(bi,bf,bo,bc,bd1,bd2)
其中,X、W、b分别为深度网络的输入、权重参数和偏置参数;
S2、反向传播:
计算损失函数对模型参数的导数,即
根据得出的导数,利用梯度下降法等方法不断更新模型参数W和b,让损失函数L取得最小值;
权重参数W和偏置参数b的更新公式为
其中,h为学习率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310272329.2A CN116495007A (zh) | 2023-03-21 | 2023-03-21 | 一种考虑物理约束的车辆轨迹深度学习预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310272329.2A CN116495007A (zh) | 2023-03-21 | 2023-03-21 | 一种考虑物理约束的车辆轨迹深度学习预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116495007A true CN116495007A (zh) | 2023-07-28 |
Family
ID=87317360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310272329.2A Pending CN116495007A (zh) | 2023-03-21 | 2023-03-21 | 一种考虑物理约束的车辆轨迹深度学习预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116495007A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390968A (zh) * | 2023-11-30 | 2024-01-12 | 中国水利水电科学研究院 | 一种基于物理信息神经网络的土壤水运动模型构建方法及系统 |
CN117910367A (zh) * | 2024-03-20 | 2024-04-19 | 浙江大学 | 一种基于物理信息神经网络的电力系统受扰轨迹预测方法 |
-
2023
- 2023-03-21 CN CN202310272329.2A patent/CN116495007A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390968A (zh) * | 2023-11-30 | 2024-01-12 | 中国水利水电科学研究院 | 一种基于物理信息神经网络的土壤水运动模型构建方法及系统 |
CN117390968B (zh) * | 2023-11-30 | 2024-04-16 | 中国水利水电科学研究院 | 一种基于物理信息神经网络的土壤水运动模型构建方法及系统 |
CN117910367A (zh) * | 2024-03-20 | 2024-04-19 | 浙江大学 | 一种基于物理信息神经网络的电力系统受扰轨迹预测方法 |
CN117910367B (zh) * | 2024-03-20 | 2024-05-28 | 浙江大学 | 一种基于物理信息神经网络的电力系统受扰轨迹预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112099496B (zh) | 一种自动驾驶训练方法、装置、设备及介质 | |
JP6869562B2 (ja) | トラッキングネットワークを含むcnnを使用して物体をトラッキングする方法、及びそれを利用した装置{method for tracking object by using convolutional neural network including tracking network and computing device using the same} | |
CN116495007A (zh) | 一种考虑物理约束的车辆轨迹深度学习预测方法 | |
CN112356830A (zh) | 一种基于模型强化学习的智能泊车方法 | |
CN112785077A (zh) | 基于时空数据的出行需求预测方法及系统 | |
Xiao et al. | Vehicle trajectory interpolation based on ensemble transfer regression | |
CN111695737A (zh) | 一种基于lstm神经网络的群目标行进趋势预测方法 | |
CN115848398B (zh) | 一种基于学习及考虑驾驶员行为特征的车道偏离预警系统评估方法 | |
CN114881339A (zh) | 车辆轨迹预测方法、系统、计算机设备及存储介质 | |
Neogi et al. | Context based pedestrian intention prediction using factored latent dynamic conditional random fields | |
CN118247947A (zh) | 基于积水风险预测等级的路段速度多步预测方法 | |
CN113639757B (zh) | 基于双向评分模型和回溯校正机制的地图匹配方法及系统 | |
Wang et al. | Lane-Change Intention Prediction of Surrounding Vehicles Using BiLSTM-CRF Models with Rule Embedding | |
CN116448134B (zh) | 基于风险场与不确定分析的车辆路径规划方法及装置 | |
CN112098869A (zh) | 一种基于大数据的自适应电动汽车soc估计方法 | |
CN114889608A (zh) | 一种基于注意力机制的车辆换道预测方法 | |
CN114004406A (zh) | 车辆轨迹预测方法、装置、存储介质及电子设备 | |
CN110489671B (zh) | 一种基于encoder-decoder模型的道路充电桩推荐方法 | |
CN112132360A (zh) | 基于lstm和gmm的风速短时置信区间的预测方法及系统 | |
Pavelko et al. | Modification and Experimental Validation of a Logistic Regression Vehicle-Pedestrian Model | |
Zhang et al. | Vehicle acceleration prediction based on nonlinear auto regressive models with exogenous inputs | |
Kamrani et al. | MarioDAgger: A time and space efficient autonomous driver | |
CN114357872B (zh) | 一种基于stacking模型融合的船舶运动黑箱辨识建模与运动预测方法 | |
Liu et al. | PnP: Integrated Prediction and Planning for Interactive Lane Change in Dense Traffic | |
Sun et al. | Vehicle behavior recognition and prediction method for intelligent driving in highway scene |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |