CN116560223A - 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器 - Google Patents
一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器 Download PDFInfo
- Publication number
- CN116560223A CN116560223A CN202310272398.3A CN202310272398A CN116560223A CN 116560223 A CN116560223 A CN 116560223A CN 202310272398 A CN202310272398 A CN 202310272398A CN 116560223 A CN116560223 A CN 116560223A
- Authority
- CN
- China
- Prior art keywords
- state
- control
- model
- vehicle
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 51
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 28
- 230000006870 function Effects 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 11
- 230000033001 locomotion Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000013461 design Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 238000012897 Levenberg–Marquardt algorithm Methods 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005293 physical law Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于物理信息神经网络的智能车辆动力学模型、ILQR控制算法及轨迹跟踪控制器。将神经网络与物理模型无缝结合,建立基于PINN的动力学模型,以赋予神经网络可用的先验知识。在基于PINN的动力学模型中,本发明采用全连接神经网络作为模型主干,将Pacejka魔术公式轮胎模型和自行车模型作为物理信息嵌入到PINN的损失函数中。基于所建立的PINN动力学模型设计ILQR控制算法,并将所设计的ILQR控制算法用于轨迹跟踪控制器,通过最小化目标函数求得最优控制指令,实现参考轨迹的准确跟踪。引入Levenberg‑Marquardt算法与线性搜索来改善ILQR控制算法的收敛效果。
Description
技术领域
本发明属于智能车辆动力学与控制领域,更具体地说,是涉及一种基于物理信息神经网络的智能车辆动力学模型、ILQR控制算法及轨迹跟踪控制器。
背景技术
近年来,人们对机动性、效率和安全性的要求日益提高,极大地促进了智能交通系统的发展。随着自动驾驶时代的到来,智能汽车可以部分或完全取代人类的驾驶任务,这对提高道路交通安全,保护人类生命财产具有深远意义。现有的智能汽车驾驶系统包括环境感知和定位、决策规划以及车辆控制。控制器的性能直接取决于车辆模型的精度,一个高保真的车辆动力学模型可以充分描述车辆系统的复杂物理特性。基于动力学模型的轨迹跟踪控制可以实现车辆从当前位置稳定、快速地到达目标位置,是无人驾驶技术中尤为重要的一环。
车辆动力学建模可采用物理模型和数据驱动模型。物理模型是基于车辆系统的物理规律建立的。它具有良好的力学背景和物理意义,其可解释性比较高。但其建模简单,在建模时对模型进行理想化假设会导致模型精度降低,难以平衡复杂问题下模型精度与计算速度间的矛盾。另外,在极限工况下无法精确反应系统的时变非线性和复杂动力学特性。另一方面,数据驱动模型在车辆动力学建模方面取得了比物理模型更好的性能,即数据驱动模型的计算效率与建模精度均有所提高,但其高度依赖于数据规模和质量,模型训练时由于过拟合使得泛化能力不能保证。数据驱动模型忽略了物理先验知识,往往不能确保物理上的可解释性。因此,在保证模型可解释性同时建立准确的智能车辆动力学模型,并根据所建立的模型设计轨迹跟踪控制算法,成为当前亟需解决的重要问题。
发明内容
为了解决现有技术中的不足,本发明提出了一种基于物理信息神经网络(Physics-Informed Neural Network,PINN)的智能车辆动力学模型、ILQR控制算法及轨迹跟踪控制器。本发明将神经网络与物理模型无缝地结合在一起,建立了基于PINN的动力学模型,以赋予神经网络可用的先验知识。将该动力学模型用于迭代线性二次型(IterativeLinear Quadratic Regulator,ILQR)控制算法的设计并推导出控制律,以实现智能车辆的轨迹跟踪控制任务。本发明的主要内容可以分为三个部分:基于PINN的车辆动力学模型,ILQR控制算法的设计,轨迹跟踪控制器的建立与性能评估。
在基于PINN的动力学模型中,本发明采用全连接神经网络作为模型主干,将Pacejka魔术公式轮胎模型和自行车模型作为物理信息嵌入到PINN的损失函数中。将所采集到的数据集按7:3的比例划分为训练集和测试集。使用整流线性单元(ReLU)作为激活函数。以均方误差(MSE)损失作为损失函数,用Adam优化器对目标函数进行优化。
基于所建立的PINN动力学模型来设计ILQR控制算法,并将所设计的ILQR控制算法用于轨迹跟踪控制器,通过最小化目标函数求得最优控制指令,以实现对参考轨迹的准确跟踪。引入Levenberg-Marquardt算法与线性搜索来改善ILQR控制算法的收敛效果。
本发明的有益效果:
1.在本发明中,创新性地将模型学习问题与车辆动力学物理先验知识相结合,提出了基于物理信息神经网络来建模车辆动力学特性的方法。依此方法而建立的模型充分利用了数据驱动模型在精度方面的优势,并融入了物理定律,因此可解释性更强。与普通数据驱动模型相比,该模型具有更快的学习速度、更高的精度和更好的泛化性能。
2.本发明基于所建立的物理信息神经网络车辆动力学模型来设计迭代线性二次型轨迹跟踪控制算法。与非线性模型预测控制(NMPC)相比,迭代线性二次型控制算法除了有较准确的控制效果外,还有更快的求解速度,可以在不同的路况及行驶工况下实现对参考轨迹的跟踪控制,在保证跟踪精度的同时,兼顾了横向与纵向稳定性。所引入的Levenberg-Marquardt算法与线性搜索也改善了迭代线性二次型控制算法的收敛效果。
附图说明
图1为基于PINN动力学模型的智能车辆轨迹跟踪控制的流程示意图;
图2为自行车模型的示意图;
图3为轮胎侧偏角与轮胎侧向力的关系曲线图;
图4为车辆动力学数据采集流程图;
图5为PINN求解智能车辆动力学模型的流程图;
图6为PINN与基线神经网络的测试误差曲线对比图;
图7为车辆的自行车模型和参考轨迹的误差状态图;
图8为用于评估轨迹跟踪性能的椭圆形参考轨迹;
图9为用于评估轨迹跟踪性能的赛道轨迹。
具体实施方式
下面结合附图对本发明作进一步说明。
图1为基于PINN动力学模型的智能车辆轨迹跟踪控制的流程示意图,包括模型设计和训练以及基于模型的轨迹跟踪控制,具体如下:
模型设计和训练:通过仿真平台Matlab-CarSim和真实世界智能驾驶平台奇瑞艾瑞泽获取车辆动力学状态数据构建数据集。建立基于PINN的车辆动力学模型,并利用所构建的数据集对模型进行训练。
基于模型的轨迹跟踪控制:提取所训练的基于PINN的车辆动力学模型的权重参数,并设计ILQR控制算法,通过最小化目标函数求得最优控制,以达到对参考轨迹的准确跟踪。
具体实施过程如下:
第一部分:基于PINN的车辆动力学模型
本发明将车辆物理模型的先验知识嵌入到神经网络中。先验知识能够约束可接受解的空间,并将网络引导到正确的解。
为了对高速行驶的车辆运动进行建模,通常使用动态自行车模型,因为它为实时实现提供了模型精度和复杂度之间的良好折衷,通过分析车辆横向、横摆动力学特性可以得到相关的数学映射关系。
图2所示为自行车模型。其运动微分方程可表示为:
式中,m为整车质量,Iz为横摆方向转动惯量;a和b分别为质心到前、后轴的距离;vy为车辆横向速度,vx为车辆纵向速度,r为横摆角速度;Fx,f、Fy,f分别为前轮纵向、横向受力,Fy,r为后轮横向力;δ为前轮转角。
假设纵向速度恒定,可以得到:
Fx,f=0 (0.2)
在目前大多数自动换档车辆中,随着换挡车辆动态特性会发生很大变化,因此油门作为一种动作变得不可取,故本发明将vdes作为输入,并附加一个低级的比例积分(PI)速度控制器来管理油门和制动动作。
轮胎侧偏角可由下式获得:
其中,αf和αr相应地表示车辆的前轮侧偏角与后轮侧偏角。
由于Pacejka魔术公式轮胎模型拟合精度高且建模简单,故本发明选取魔术公式对轮胎进行建模。因此,轮胎-路面动力学可以由Pacejka魔术公式轮胎模型表示为下列的非线性方程:
Fy=Dsin(Carctan(Bx-E(Bx-arctan(Bx))))+Sv (0.4)
式中,Fy为轮胎的侧向力,x=α+Sh,x为输入变量,其可以是轮胎的滑移率或轮胎的侧偏角,α为轮胎侧偏角,Sh为水平偏移量,Sv为垂直偏移量。模型参数B为刚度因子,C为形状因子,D为峰值因子,E为曲率因子。其中各参数计算公式如下所示:
其中,A0+A13为无物理意义的无量纲拟合参数,γ为侧倾角,Fz为轮胎垂向载荷。由三角函数组合而成的魔术公式可以实现对轮胎力的高精度拟合,但其复杂的结构会导致较大的数学运算量,本发明考虑对其进行适当简化。首先,由于无人车辆的垂向运动对轨迹跟踪过程的影响较小,故在控制器设计时可以忽略垂向运动,在横向力计算时为纯侧偏,所以此处设定侧倾角γ=0;其次,Bx一般而言为一较小值,即:
Bx-arctan(Bx)≈0 (0.6)
另外,原本的魔术公式只说明了轮胎侧偏角与轮胎横向力的绝对值关系,但在车辆坐标系下,二者符号相反,Fy的计算应加入负号。基于以上讨论,对轮胎横向力的计算简化为:
式中,A0~A13的参数取值一般是通过轮胎的实验数据拟合确定,表1为各个参数的取值情况。
表1 魔术公式轮胎模型各参数值
符号 | 取值 | 符号 | 取值 | 符号 | 取值 |
A0 | 1.65 | A1 | -34 | A2 | 1250 |
A3 | 3036 | A4 | 12.8 | A9 | 0.013 |
A10 | 0.004 | A12 | 1.214 | A13 | 6.262 |
图3为基于式(1.7)绘制出的轮胎侧偏角与轮胎侧向力的关系曲线图。由图3可知在不同垂向载荷的作用下,当轮胎侧偏角α∈[-4,4]时,轮胎侧向力与侧偏角成线性关系变化且可以表达为如下等式:
其中,Cf和Cr分别为前轮与后轮的侧偏刚度,一般取负值。
动态状态变量x=(vy,r)T由横向速度vy和横摆角速度r组成。全局坐标系中的运动学状态变量由位置(x,y)T和航向角θ组成。系统的控制输入u=(δ,vdes)T包括前轮转向角δ和期望车速vdes。
将式(1.8)与式(1.2)带入到式(1.1)中,并假定侧偏角相对较小,通过进一步整理,可以将二自由度动力学模型写成状态空间形式:
最后,可以使用状态微分获得时间步长Δt上的状态变化:
图4为车辆动力学数据采集流程图。本发明从仿真和实际环境中采集车辆动力学状态数据构建数据集。首先,在CarSim中设置不同的驾驶场景、道路环境并提供动力学模型,搭建Matlab-CarSim智能驾驶仿真平台,利用Logitech G290转向踏板系统采集车辆的状态数据。然后,利用搭载有惯性测量单元(IMU)及方向盘传感器等车载设备的实车采集了不同条件下由人类驾驶员驾驶70分钟的数据,数据率为30Hz。该数据集包含四种不同类型的驾驶行为:1)低速之字形驾驶,2)高速驾驶,3)尽可能地滑动,以及4)随机运动。1)和2)在有六个尖角的赛道上收集。3)和4)由平地采集而来。最高车速vmax设置为40km/h。这些驾驶数据在七个不同摩擦系数的路面上采集,其中,μ∈{0.4,0.5,...1.0}。使用一辆奇瑞艾瑞泽作为控制车辆。
由于输入数据的各个维度之间的范围很大,因此使用归一化技术来保证准确的预测结果。本发明选择最小-最大归一化,使得标准化后的数值处于[0,1]之间,可表示为:
其中,x与x′分别为原始数据与归一化的数据,xmax与xmin分别为数据所在列的最大值与最小值。
图5为PINN求解智能车辆动力学模型的流程图。本发明利用当前与历史的状态-控制变量对H作为输入:
Ht=[xt,ut,xt-1,ut-1,…,xt-3,ut-3] (0.12)
式中,t表示离散化的时间变量。输入与输出之间的各层和各层中的神经元构成全连接神经网络F,该网络由4个隐含层构成,每层10个神经元。每个激活的输入用z□表示,输出用o□表示,激活函数用act(z□)表示。W□和b□分别是网络的权重和偏置项,其中□表示层编号且□∈{1,2,3,4}。PINN中的全连接神经网络F可以用以下形式表达:
然后,可以利用全连接神经网络F来预测Δt时间步长上状态的离散变化:
xt+1-xt=F(H t) (0.14)
在使用小离散时间间隔时,估计状态残差的想法是有效的。
自主车辆(AVs)的动力学模型应转化为通用的非线性偏微分方程形式。设函数u=u(t,x)满足如下形式的偏微分方程:
ut+N(u;λ)=0,x∈Ω,t∈[0,T] (0.15)
其中,N(u;λ)表示由λ参数化的关于u的非线性算子,x为空间变量,t为时间变量,Ω为欧氏空间的子集,T为终止时刻。PINN考虑建立一个神经网络来逼近偏微分方程的解,即u=u(t,x)。在输入时间和空间数据后,首先通过全连接神经网络来逼近函数,再采用自动微分技术计算基于物理的损失函数,通过梯度下降法来最小化损失函数从而计算最终所需的神经网络连接权重参数和偏微分方程的物理参数,此外,中间框中的I为单位算子,而/>表示微分运算符/激活运算符。轮胎模型和自行车模型被嵌入到损失函数中,并且确定了所有的系数。
本发明将数据集按7:3的比例划分为训练集与测试集。使用整流线性单元(ReLU)作为激活函数。为了减小损失函数的误差,利用Adam优化器对目标函数进行优化。Adam优化器可以根据学习过程中的情况变化来自适应调整学习率。“Xavier”方法用于确定初始权重和偏差,以保证神经网络更快地收敛。在FC-NN中加入残差神经网络,以避免梯度爆炸或梯度消失。在训练过程中,学习率取为0.001。在测试集上应用了提前停止。
在PINN中,基于控制问题的物理方程,使用网络的输出及其微分值来定义残差或损失函数。与大多数神经网络方法中只有一个损失项的损失函数不同,PINN的损失函数由两个以上的损失项组成。具体地,对本发明来说,PINN的总损失函数LN由神经网络的残余损失LData、物理条件的损失项(和Lr)以及初始条件损失项(/>和Lr0)的总和组成,即:
本发明选择均方误差(MSE)来构造与神经网络预测值和真实值之间残差有关的损失函数LData,并且该损失函数表示如下:
其中,n是训练集的大小,xi与分别是i时刻车辆的真实状态与神经网络的预测状态,即
与式(1.9)有关的物理条件损失项以均方误差的形式表示为:
其中,n是配置点的总数,xi为i时刻车辆的状态,且xi∈x。
初始条件表示为:
其中,vy0是车辆的初始横向速度,r0是初始的横摆角速度。与初始条件相关的损失项被定义为:
然后采用自动微分技术计算基于物理的损失函数,通过最小化损失函数来计算最终所需的神经网络连接权重参数和偏微分方程的物理参数。
本发明将PINN方法与基线神经网络进行了比较。选择相同结构(全连接4层,每层10个神经元)的神经网络作为基线神经网络,并利用相同的训练数据来训练该网络。除了物理嵌入,两个模型都应用了相同的设置。然后,基线模型采用以下形式:
利用均方根误差(RMSE)和最大误差(Emax)对PINN和基线神经网络的性能进行了测试。
图6为PINN与基线神经网络的测试误差曲线对比图。可以看出,本发明所提出的PINN方法的收敛速度远快于基线神经网络,也收敛到比基线神经网络更好的解,这是因为物理先验知识指导了学习问题。
本发明还采集了验证数据,以证明PINN方法在泛化性方面的优越性。这些数据是在具有六个尖角的同一赛道上采集的,但对摩擦系数进行了调整。将下列数值分配给上述赛道的每个尖角,即[0.45,0.55,0.65,0.75,0.85,0.95],其他区域设置为μ=1.0。此外,这些摩擦数值在训练集中不存在。
PINN模型仍然输出状态的残差,与基线神经网络相同。此外,Pacejka轮胎模型(式(1.4))和车辆动力学模型(式(1.9))是完全可微的。这使得可以通过最小化基线网络中使用的相同目标来以端到端的方式训练PINN,使得||xt+1-xt-F(H t)||2。本发明公开的方法是一个通用的解决方案,可以用于其它类型的模型结构,包括循环神经网络(RNN)。此外,它还可以表示为随机模型或集成模型。
第二部分:设计ILQR控制算法
车辆动力学模型的状态转移函数及其初始状态为:
式中,i=0,1,...,N-1,和/>分别表示i时刻的状态变量和控制变量,f为动态方程。系统总成本J0是运行成本l(xi,ui)(即在状态xi下执行控制ui的成本)与终端时刻的成本lf(xN)的总和,从状态x0开始,应用控制序列U≡{u0,u1,...,uN-1},直到控制时域N:
最优控制问题是确定特定于x的控制序列U*(x)使代价函数J0为最小值,即:
令Ui≡{ui,ui+1,...,uN-1},并定义分段成本Ji为从i到N的成本和:
定义在第i时刻给定最小控制序列的性能指标值函数Vi(x)为:
根据动态规划贝尔曼最优性原理,将整个控制序列的最小化简化为单个控制步长的最小化,并在时间上向后传递:
除了状态值函数Vi外,本发明还引入了动作值函数,记为Q:
Q(xi,ui)=l(xi,ui)+Vi+1(f(xi,ui)) (0.29)
接下来,将状态和输入的变化量分别表示为δxi和δui,则式(2.7)在i时刻施加一个扰动后所得的最小值为:
对上式进行二阶泰勒展开,可得:
其中,Qx与Qu分别为Q(δxi,δui)对状态x与控制输入u的一阶偏导,Qxx与Quu分别为Q(δxi,δui)对状态x与控制输入u的二阶偏导,Qxu与Qux为Q(δxi,δui)对状态x与控制输入u的二阶混合偏导,各展开系数表示如下:
其中,lx与lu分别为系统的运行成本对状态与控制输入的一阶偏导;fx与fu分别为系统线性化后的状态与控制输入;(V.)x与(V.)xx分别为系统的性能指标值函数对状态的一阶偏导与二阶偏导;lxx与luu分别为系统的运行成本对状态与控制输入的二阶偏导;lux为系统的运行成本对状态和控制输入的二阶偏导。
ILQR利用高斯牛顿法通过泰勒展开式一阶项近似原函数,因此式(2.10)中最后三个子方程中的二阶项被省略。通过求取系统的动作值函数Q(δx,δu)的最小值,得到系统增量的最优控制律δu*为:
其中,开环项反馈增益项/>第i时刻最优控制的状态值函数的差值由下式给出:
对于状态值函数,其梯度和海森矩阵由下式给出:
通过反向传播(Backward Pass)来递归地计算局部性能指标值V(i)并更新第i时刻的控制增益[K(i),k(i)],可以得到名义控制序列U0={u01,u02,...,u0N}。再通过前向传播(Forward Pass)计算得到新的状态和控制序列,表示为:
ILQR算法的每一次迭代都在轨迹{xi,ui}附近寻找控制序列然后根据非线性动力学模型找到新的状态轨迹/>反复迭代直至收敛。
在牛顿法中,当Hessian矩阵不是正定的或者二阶近似不准确时,可能会导致迭收敛困难的问题。梯度下降法能够解决以上问题,但在最低点附近时收敛速度较慢,于是本发明提出列文伯格-马夸尔特(Levenberg-Marquardt,LM)算法,它通过灵活调节LM参数λ的大小来动态调节迭代时的步长,使得算法在局部寻优过程中能够充分结合两者的优势。即在局部控制成本Q的Hessian矩阵部分添加一个对角项作为正则化项,以保证Hessian矩阵正定。
其中,Im为单位矩阵,λ∈[0,+∞)。λ接近0时为牛顿迭代法,λ取较大值时为梯度下降法。因此,本发明对Hessian矩阵Quu及Qux做如下改写:
此时,系统增量的最优控制律为:
其中,这种正则化相当于在当前控制序列周围增加了二次成本,使步骤更加保守。此外,也使得新轨迹更加接近旧轨迹,从而显著提高该算法的鲁棒性。
基于以上正则化改进的最优控制性能函数值为:
对于一般的非线性系统,在牛顿法迭代寻找函数极值过程中会出现跨过真正极值的情况,二阶近似的结果与实际系统可能偏差太大,目标函数可能不会收敛。本发明引入线性搜索(line search),在更新量前面添加回溯线性搜索参数α,调整原函数搜索范围使之在更小的范围内搜索极小值。
其中,0<α≤1。α取值不能太小,以免梯度下降不充分。当α接近0时,控制律将不更新,轨迹将保持不变。但对于中间值,由于反馈的存在,所得到的控制步长不是完整步长的简单缩放。
第三部分:建立轨迹跟踪控制器并对其性能进行评估
这一部分首先介绍了轨迹跟踪控制器的设计。设si={xi,yi,θi,vy,i,ri}表示轴距为L的车辆在离散时刻i的状态,其中,xi和yi分别表示世界坐标系下车辆的纵向位置和横向位置,θi为i时刻的航向角,vy,i为i时刻的横向车速,ri为i时刻的横摆角速度。控制命令由ui={δi,vdes,i}给出,其中,δi为i时刻的前轮转向角,vdes,i为i时刻的期望车速。用π表示状态转移函数f:
si+1=π(si,ui) (1.1)
根据车辆在状态si下的自行车模型,车辆的动态方程π(即状态转移函数f)可由以下公式定义:
给出一组具有速度的M个有序姿态{xi,yi,θi},i∈[1,M],对它们进行三次样条插值,得到参考轨迹。
图7为车辆在状态si下的自行车模型和参考轨迹的误差状态图。对于状态si,将相对于参考轨迹的误差状态ψi定义为一个元组,如下所示:
其中,为在状态si下车辆与参考轨迹的垂向距离,/>为车辆相对于参考轨迹的航向误差,/>为对应于参考轨迹上最近点的速度误差(/>这里vp是参考轨迹上最近点的速度),vy,i和ri来自于状态si。本发明将误差状态ψi作为ILQR轨迹跟踪控制器的状态,从而对参考轨迹的所有误差进行编码。给定在离散时刻i的误差状态ψi和控制ui,用γ表示状态转移函数f,则i+1时刻的误差状态ψi+1表示如下:
ψi+1=γ(ψi,ui) (1.3)
γ可以由以下公式定义:
在误差状态ψi下执行控制ui的成本l(ψi,ui)如下:
其中,A和B为对角权重矩阵,A的最后3个对角线元素为零,因为本发明只关注使式(3.4)中的误差项趋近于零。误差状态ψi的最终成本lf(ψN)如下所示:
因此,可以将具有给定参考轨迹的智能车辆轨迹跟踪控制问题定义为:寻找到时域为N的最优控制序列U*={u0,u1,...,uN-1},从而最小化以下目标函数:
加上如下的约束:
式(3.7)和式(3.8)便可以将轨迹跟踪问题转化为步骤2中所定义的ILQR问题。
本发明以横向位置与航向角的均方根误差、算法耗时以及速度跟踪误差作为评价指标,来验证所建立的PINN模型应用于轨迹跟踪控制中的建模效果。
本发明在一个椭圆形轨迹(如图8所示)和一条赛道上(如图9所示)计算了上述指标。椭圆形轨迹和赛道均在模拟器中被建造,将轨迹的中心线设置为目标轨迹。其中,赛道长约790米,由两种路面组成,一种摩擦系数为1.0,另一种摩擦系数为0.4。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技术所创的等效方式或变更均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于物理信息神经网络的智能车辆动力学模型,其特征在于,采用全连接神经网络作为模型主干,将Pacejka魔术公式轮胎模型和自行车模型作为物理信息嵌入到模型的损失函数中。
2.根据权利要求1所述的一种基于物理信息神经网络的智能车辆动力学模型,其特征在于,所述自行车模型,其运动微分方程表示为:
式中,m为整车质量,Iz为横摆方向转动惯量;a和b分别为质心到前、后轴的距离;vy为车辆横向速度,vx为车辆纵向速度,r为横摆角速度;Fx,f、Fy,f分别为前轮纵向、横向受力,Fy,r为后轮横向力;δ为前轮转角;
假设纵向速度恒定,可以得到:
Fx,f=0 (0.2)。
3.根据权利要求2所述的一种基于物理信息神经网络的智能车辆动力学模型,其特征在于,Pacejka魔术公式轮胎模型包括轮胎侧偏角模型,由下式获得:
其中,αf和αr相应地表示车辆的前轮侧偏角与后轮侧偏角;
轮胎-路面动力学由Pacejka魔术公式轮胎模型表示为下列的非线性方程:
Fy=Dsin(Carctan(Bx-E(Bx-arctan(Bx))))+Sv (0.4)
式中,Fy为轮胎的侧向力,x=α+Sh,x为输入变量,其可以是轮胎的滑移率或轮胎的侧偏角,α为轮胎侧偏角,Sh为水平偏移量,Sv为垂直偏移量。模型参数B为刚度因子,C为形状因子,D为峰值因子,E为曲率因子;其中各参数计算公式如下所示:
C=A0
E=A6 Fz+A7
Sv=A11 Fzγ+A12 Fz+A13
Sh=A9 Fz+A10+A8γ
其中,A0~A13为无物理意义的无量纲拟合参数,γ为侧倾角,Fz为轮胎垂向载荷。
4.根据权利要求3所述的一种基于物理信息神经网络的智能车辆动力学模型,其特征在于,对轮胎模型进行简化:首先,由于无人车辆的垂向运动对轨迹跟踪过程的影响较小,故在控制器设计时可以忽略垂向运动,在横向力计算时为纯侧偏,所以此处设定侧倾角γ=0;其次,Bx一般而言为一较小值,即:
Bx-arctan(Bx)≈0 (0.6)
对轮胎横向力的计算简化为:
Fy=-Dsin(Carctan(Bx))+Sv
D=A1Fz 2+A2Fz
C=A0
Sv=A12Fz+A13
Sh=A9Fz+A10
式中,A0~A13的参数取值一般通过轮胎的实验数据拟合确定。
5.根据权利要求3所述的一种基于物理信息神经网络的智能车辆动力学模型,其特征在于,当轮胎侧偏角α∈[-4,4]时,轮胎侧向力与侧偏角成线性关系变化且表达为如下等式:
其中,Cf和Cr分别为前轮与后轮的侧偏刚度,一般取负值;
动态状态变量x=(vy,r)T由横向速度vy和横摆角速度r组成,全局坐标系中的运动学状态变量由位置(x,y)T和航向角θ组成,系统的控制输入u=(δ,vdes)T包括前轮转向角δ和期望车速vdes;
将式(1.8)与式(1.2)带入到式(1.1)中,并假定侧偏角相对较小,将二自由度动力学模型写成状态空间形式:
最后,可以使用状态微分获得时间步长Δt上的状态变化:
6.根据权利要求1所述的一种基于物理信息神经网络的智能车辆动力学模型,其特征在于,所述全连接神经网络包含4个隐含层,每层10个神经元,每个激活的输入用z□表示,输出用o□表示,激活函数用act(z□)表示,W□和b□分别是网络的权重和偏置项,其中□表示层编号且□∈{1,2,3,4},全连接神经网络F用以下形式表达:
7.根据权利要求1所述的一种基于物理信息神经网络的智能车辆动力学模型,其特征在于,总损失函数LN由神经网络的残余损失LData、物理条件的损失项(和Lr)以及初始条件损失项(/>和Lr0)的总和组成,即:
采用均方误差(MSE)来构造与神经网络预测值和真实值之间残差有关的损失函数LData,并且该损失函数表示如下:
其中,n是训练集的大小,xi与分别是i时刻车辆的真实状态与神经网络的预测状态,即
与式(1.9)有关的物理条件损失项以均方误差的形式表示为:
其中,n是配置点的总数,xi为i时刻车辆的状态,且xi∈x;
初始条件表示为:
其中,vy0是车辆的初始横向速度,r0是初始的横摆角速度;
与初始条件相关的损失项定义为:
8.一种智能车辆的ILQR控制算法,其特征在于,该ILQR控制算法基于权利要求1-7任一项所述的车辆动力学模型,包括如下:
设车辆动力学模型的状态转移函数及初始状态为:
式中,i=0,1,...,N-1,和/>分别表示i时刻的状态变量和控制变量,f为动态方程,系统总成本J0是运行成本l(xi,ui)(即在状态xi下执行控制ui的成本)与终端时刻的成本lf(xN)的总和,从状态x0开始,应用控制序列U≡{u0,u1,...,uN-1},直到控制时域N:
最优控制问题是确定特定x的控制序列U*(x)使代价函数J0为最小值,即:
令Ui≡{ui,ui+1,...,uN-1},并定义分段成本Ji为从i到N的成本和:
定义在第i时刻给定最小控制序列的性能指标值函数Vi(x)为:
将整个控制序列的最小化简化为单个控制步长的最小化,并在时间上向后传递:
除了状态值函数Vi外,引入动作值函数,记为Q:
Q(xi,ui)=l(xi,ui)+Vi+1(f(xi,ui)) (0.24)
接下来,将状态和输入的变化量分别表示为δxi和δui,则式(2.7)在i时刻施加一个扰动后所得的最小值为:
对上式进行二阶泰勒展开,可得:
其中,Qx与Qu分别为Q(δxi,δui)对状态x与控制输入u的一阶偏导,Qxx与Quu分别为Q(δxi,δui)对状态x与控制输入u的二阶偏导,Qxu与Qux为Q(δxi,δui)对状态x与控制输入u的二阶混合偏导,各展开系数表示如下:
其中,lx与lu分别为系统的运行成本对状态与控制输入的一阶偏导;fx与fu分别为系统线性化后的状态与控制输入;(V.)x与(V.)xx分别为系统的性能指标值函数对状态的一阶偏导与二阶偏导;lxx与luu分别为系统的运行成本对状态与控制输入的二阶偏导;lux为系统的运行成本对状态和控制输入的二阶偏导;
通过求取系统的动作值函数Q(δx,δu)的最小值,得到系统增量的最优控制律δu*为:
其中,开环项反馈增益项/>第i时刻最优控制的状态值函数的差值由下式给出:
对于状态值函数,其梯度和海森矩阵由下式给出:
通过反向传播来递归地计算局部性能指标值V(i)并更新第i时刻的控制增益[K(i),k(i)],得到名义控制序列U0={u01,u02,...,u0N},再通过前向传播计算得到新的状态和控制序列,表示为:
每一次迭代都在轨迹{xi,ui}附近寻找控制序列然后根据非线性车辆动力学模型找到新的状态轨迹/>反复迭代直至收敛;
在局部控制成本Q的Hessian矩阵部分添加一个对角项作为正则化项,以使得Hessian矩阵正定,
其中,Im为单位矩阵,λ∈[0,+∞),λ接近0时为牛顿迭代法,λ取较大值时为梯度下降法,因此,对Hessian矩阵Quu及Qux做如下改写:
此时,系统增量的最优控制律为:
其中,这种正则化相当于在当前控制序列周围增加了二次成本,使步骤更加保守,也使得新轨迹更加接近旧轨迹,提高鲁棒性;
基于以上正则化改进的最优控制性能函数值为:
在更新量前面添加回溯线性搜索参数α,调整原函数搜索范围使之在更小的范围内搜索极小值,
其中,0<α≤1,当α接近0时,控制律将不更新,轨迹将保持不变,但对于中间值,由于反馈的存在,所得到的控制步长不是完整步长的简单缩放。
9.一种智能车辆的轨迹跟踪控制器,其特征在于,其通过如下设计得到:
设si={xi,yi,θi,vy,i,ri}表示轴距为L的车辆在离散时刻i的状态,其中,xi和yi分别表示世界坐标系下车辆的纵向位置和横向位置,θi为i时刻的航向角,vy,i为i时刻的横向车速,ri为i时刻的横摆角速度,控制命令由ui={δi,vdes,i}给出,其中,δi为i时刻的前轮转向角,vdes,i为i时刻的期望车速,用π表示状态转移函数f:
si+1=π(si,ui) (0.38)
根据车辆在状态si下的自行车模型,车辆的动态方程π(即状态转移函数f)可由以下公式定义:
给出一组具有速度的M个有序姿态{xi,yi,θi},i∈[1,M],对它们进行三次样条插值,得到参考轨迹;
对于状态si,将相对于参考轨迹的误差状态ψi定义为一个元组,如下所示:
其中,为在状态si下车辆与参考轨迹的垂向距离,/>为车辆相对于参考轨迹的航向误差,/>为对应于参考轨迹上最近点的速度误差,/>这里vp是参考轨迹上最近点的速度,vy,i和ri来自于状态si;将误差状态ψi作为ILQR轨迹跟踪控制器的状态,对参考轨迹的所有误差进行编码;给定在离散时刻i的误差状态ψi和控制ui,用γ表示状态转移函数f,则i+1时刻的误差状态ψi+1表示如下:
ψi+1=γ(ψi,ui) (0.40)
γ由以下公式定义:
在误差状态ψi下执行控制ui的成本l(ψi,ui)如下:
其中,A和B为对角权重矩阵,A的最后3个对角线元素为零,误差状态ψi的最终成本lf(ψN)如下所示:
将具有给定参考轨迹的智能车辆轨迹跟踪控制问题定义为:寻找到时域为N的最优控制序列U*={u0,u1,...,uN-1},从而最小化以下目标函数:
加上如下的约束:
10.根据权利要求9所述的一种智能车辆的轨迹跟踪控制器,其特征在于,将式(3.7)和式(3.8)轨迹跟踪问题转化为利用权利要求8中的ILQR算法求解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310272398.3A CN116560223A (zh) | 2023-03-20 | 2023-03-20 | 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310272398.3A CN116560223A (zh) | 2023-03-20 | 2023-03-20 | 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116560223A true CN116560223A (zh) | 2023-08-08 |
Family
ID=87490523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310272398.3A Pending CN116560223A (zh) | 2023-03-20 | 2023-03-20 | 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116560223A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116824923A (zh) * | 2023-08-30 | 2023-09-29 | 四川九洲空管科技有限责任公司 | 一种动态优化ads-b航迹质量的方法 |
CN117806175A (zh) * | 2024-03-01 | 2024-04-02 | 北京理工大学 | 分布式驱动车辆模型误差自学习轨迹跟踪控制方法及系统 |
-
2023
- 2023-03-20 CN CN202310272398.3A patent/CN116560223A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116824923A (zh) * | 2023-08-30 | 2023-09-29 | 四川九洲空管科技有限责任公司 | 一种动态优化ads-b航迹质量的方法 |
CN117806175A (zh) * | 2024-03-01 | 2024-04-02 | 北京理工大学 | 分布式驱动车辆模型误差自学习轨迹跟踪控制方法及系统 |
CN117806175B (zh) * | 2024-03-01 | 2024-04-30 | 北京理工大学 | 分布式驱动车辆模型误差自学习轨迹跟踪控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109885883B (zh) | 一种基于gk聚类算法模型预测的无人车横向运动的控制方法 | |
CN109866752B (zh) | 基于预测控制的双模式并行车辆轨迹跟踪行驶系统的方法 | |
CN112356830B (zh) | 一种基于模型强化学习的智能泊车方法 | |
CN116560223A (zh) | 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器 | |
Papadimitrakis et al. | Active vehicle suspension control using road preview model predictive control and radial basis function networks | |
CN109597308A (zh) | 基于动力学模型的无人驾驶汽车模型预测控制器设计方法 | |
CN112758097B (zh) | 一种用于无人驾驶车辆的状态预测与估计方法 | |
CN107831761A (zh) | 一种智能车的路径跟踪控制方法 | |
CN113386781A (zh) | 一种基于数据驱动车辆动力学模型的智能车辆轨迹跟踪控制方法 | |
CN111258218B (zh) | 基于最大相关熵准则的智能车辆路径跟踪方法 | |
CN108958246A (zh) | 无人车在U-Turn场景的轨迹跟踪控制方法 | |
CN116382071B (zh) | 深度学习网络修正补偿的气动参数智能辨识方法 | |
CN111257853B (zh) | 一种基于imu预积分的自动驾驶系统激光雷达在线标定方法 | |
Liu et al. | Vehicle state estimation based on unscented Kalman filtering and a genetic-particle swarm algorithm | |
CN113442906A (zh) | 一种分布式驱动电动汽车横向稳定性分层控制系统及方法 | |
Liu et al. | Vehicle State estimation based on adaptive fading unscented Kalman filter | |
CN115817509A (zh) | 一种基于ampc的多轴分布式驱动车辆转向辅助轨迹跟踪方法 | |
CN115343950A (zh) | 一种适应复杂路面的车辆路径跟踪控制方法及控制系统 | |
CN114779641A (zh) | 基于新航向误差定义的环境自适应mpc路径追踪控制方法 | |
Chen et al. | Path tracking controller design of automated parking systems via NMPC with an instructible solution | |
CN113835343B (zh) | 一种无人车的有限时间跟踪复合控制方法 | |
CN114379583B (zh) | 一种基于神经网络动力学模型的自动驾驶车辆轨迹跟踪系统及方法 | |
CN117521241A (zh) | 基于混合动力学模型的汽车运动状态预测系统及方法 | |
CN114379583A (zh) | 一种基于神经网络动力学模型的自动驾驶车辆轨迹跟踪系统及方法 | |
Meng et al. | Automatic control method of automobile steering-by-wire based on fuzzy PID |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |