CN116560223A

CN116560223A - 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器

Info

Publication number: CN116560223A
Application number: CN202310272398.3A
Authority: CN
Inventors: 曹秀辰; 李祎承; 蔡英凤; 廉玉波; 钟益林; 孙晓强; 陈龙; 何友国
Original assignee: Jiangsu University
Current assignee: Jiangsu University
Priority date: 2023-03-20
Filing date: 2023-03-20
Publication date: 2023-08-08

Abstract

本发明公开了一种基于物理信息神经网络的智能车辆动力学模型、ILQR控制算法及轨迹跟踪控制器。将神经网络与物理模型无缝结合，建立基于PINN的动力学模型，以赋予神经网络可用的先验知识。在基于PINN的动力学模型中，本发明采用全连接神经网络作为模型主干，将Pacejka魔术公式轮胎模型和自行车模型作为物理信息嵌入到PINN的损失函数中。基于所建立的PINN动力学模型设计ILQR控制算法，并将所设计的ILQR控制算法用于轨迹跟踪控制器，通过最小化目标函数求得最优控制指令，实现参考轨迹的准确跟踪。引入Levenberg‑Marquardt算法与线性搜索来改善ILQR控制算法的收敛效果。

Description

一种基于物理信息神经网络的智能车辆动力学模型、ILQR控制算法及轨迹跟踪控制器

技术领域

本发明属于智能车辆动力学与控制领域，更具体地说，是涉及一种基于物理信息神经网络的智能车辆动力学模型、ILQR控制算法及轨迹跟踪控制器。

背景技术

近年来，人们对机动性、效率和安全性的要求日益提高，极大地促进了智能交通系统的发展。随着自动驾驶时代的到来，智能汽车可以部分或完全取代人类的驾驶任务，这对提高道路交通安全，保护人类生命财产具有深远意义。现有的智能汽车驾驶系统包括环境感知和定位、决策规划以及车辆控制。控制器的性能直接取决于车辆模型的精度，一个高保真的车辆动力学模型可以充分描述车辆系统的复杂物理特性。基于动力学模型的轨迹跟踪控制可以实现车辆从当前位置稳定、快速地到达目标位置，是无人驾驶技术中尤为重要的一环。

车辆动力学建模可采用物理模型和数据驱动模型。物理模型是基于车辆系统的物理规律建立的。它具有良好的力学背景和物理意义，其可解释性比较高。但其建模简单，在建模时对模型进行理想化假设会导致模型精度降低，难以平衡复杂问题下模型精度与计算速度间的矛盾。另外，在极限工况下无法精确反应系统的时变非线性和复杂动力学特性。另一方面，数据驱动模型在车辆动力学建模方面取得了比物理模型更好的性能，即数据驱动模型的计算效率与建模精度均有所提高，但其高度依赖于数据规模和质量，模型训练时由于过拟合使得泛化能力不能保证。数据驱动模型忽略了物理先验知识，往往不能确保物理上的可解释性。因此，在保证模型可解释性同时建立准确的智能车辆动力学模型，并根据所建立的模型设计轨迹跟踪控制算法，成为当前亟需解决的重要问题。

发明内容

为了解决现有技术中的不足，本发明提出了一种基于物理信息神经网络(Physics-Informed Neural Network，PINN)的智能车辆动力学模型、ILQR控制算法及轨迹跟踪控制器。本发明将神经网络与物理模型无缝地结合在一起，建立了基于PINN的动力学模型，以赋予神经网络可用的先验知识。将该动力学模型用于迭代线性二次型(IterativeLinear Quadratic Regulator,ILQR)控制算法的设计并推导出控制律，以实现智能车辆的轨迹跟踪控制任务。本发明的主要内容可以分为三个部分：基于PINN的车辆动力学模型，ILQR控制算法的设计，轨迹跟踪控制器的建立与性能评估。

在基于PINN的动力学模型中，本发明采用全连接神经网络作为模型主干，将Pacejka魔术公式轮胎模型和自行车模型作为物理信息嵌入到PINN的损失函数中。将所采集到的数据集按7：3的比例划分为训练集和测试集。使用整流线性单元(ReLU)作为激活函数。以均方误差(MSE)损失作为损失函数，用Adam优化器对目标函数进行优化。

基于所建立的PINN动力学模型来设计ILQR控制算法，并将所设计的ILQR控制算法用于轨迹跟踪控制器，通过最小化目标函数求得最优控制指令，以实现对参考轨迹的准确跟踪。引入Levenberg-Marquardt算法与线性搜索来改善ILQR控制算法的收敛效果。

本发明的有益效果：

1.在本发明中，创新性地将模型学习问题与车辆动力学物理先验知识相结合，提出了基于物理信息神经网络来建模车辆动力学特性的方法。依此方法而建立的模型充分利用了数据驱动模型在精度方面的优势，并融入了物理定律，因此可解释性更强。与普通数据驱动模型相比，该模型具有更快的学习速度、更高的精度和更好的泛化性能。

2.本发明基于所建立的物理信息神经网络车辆动力学模型来设计迭代线性二次型轨迹跟踪控制算法。与非线性模型预测控制(NMPC)相比，迭代线性二次型控制算法除了有较准确的控制效果外，还有更快的求解速度，可以在不同的路况及行驶工况下实现对参考轨迹的跟踪控制，在保证跟踪精度的同时，兼顾了横向与纵向稳定性。所引入的Levenberg-Marquardt算法与线性搜索也改善了迭代线性二次型控制算法的收敛效果。

附图说明

图1为基于PINN动力学模型的智能车辆轨迹跟踪控制的流程示意图；

图2为自行车模型的示意图；

图3为轮胎侧偏角与轮胎侧向力的关系曲线图；

图4为车辆动力学数据采集流程图；

图5为PINN求解智能车辆动力学模型的流程图；

图6为PINN与基线神经网络的测试误差曲线对比图；

图7为车辆的自行车模型和参考轨迹的误差状态图；

图8为用于评估轨迹跟踪性能的椭圆形参考轨迹；

图9为用于评估轨迹跟踪性能的赛道轨迹。

具体实施方式

下面结合附图对本发明作进一步说明。

图1为基于PINN动力学模型的智能车辆轨迹跟踪控制的流程示意图，包括模型设计和训练以及基于模型的轨迹跟踪控制，具体如下：

模型设计和训练：通过仿真平台Matlab-CarSim和真实世界智能驾驶平台奇瑞艾瑞泽获取车辆动力学状态数据构建数据集。建立基于PINN的车辆动力学模型，并利用所构建的数据集对模型进行训练。

基于模型的轨迹跟踪控制：提取所训练的基于PINN的车辆动力学模型的权重参数，并设计ILQR控制算法，通过最小化目标函数求得最优控制，以达到对参考轨迹的准确跟踪。

具体实施过程如下：

第一部分：基于PINN的车辆动力学模型

本发明将车辆物理模型的先验知识嵌入到神经网络中。先验知识能够约束可接受解的空间，并将网络引导到正确的解。

为了对高速行驶的车辆运动进行建模，通常使用动态自行车模型，因为它为实时实现提供了模型精度和复杂度之间的良好折衷，通过分析车辆横向、横摆动力学特性可以得到相关的数学映射关系。

图2所示为自行车模型。其运动微分方程可表示为：

式中，m为整车质量，I_z为横摆方向转动惯量；a和b分别为质心到前、后轴的距离；v_y为车辆横向速度，v_x为车辆纵向速度，r为横摆角速度；F_x,f、F_y,f分别为前轮纵向、横向受力，F_y,r为后轮横向力；δ为前轮转角。

假设纵向速度恒定，可以得到：

F_x,f＝0 (0.2)

在目前大多数自动换档车辆中，随着换挡车辆动态特性会发生很大变化，因此油门作为一种动作变得不可取，故本发明将v_des作为输入，并附加一个低级的比例积分(PI)速度控制器来管理油门和制动动作。

轮胎侧偏角可由下式获得：

其中，α_f和α_r相应地表示车辆的前轮侧偏角与后轮侧偏角。

由于Pacejka魔术公式轮胎模型拟合精度高且建模简单，故本发明选取魔术公式对轮胎进行建模。因此，轮胎-路面动力学可以由Pacejka魔术公式轮胎模型表示为下列的非线性方程：

F_y＝Dsin(Carctan(Bx-E(Bx-arctan(Bx))))+S_v (0.4)

式中，F_y为轮胎的侧向力，x＝α+S_h，x为输入变量，其可以是轮胎的滑移率或轮胎的侧偏角，α为轮胎侧偏角，S_h为水平偏移量，S_v为垂直偏移量。模型参数B为刚度因子，C为形状因子，D为峰值因子，E为曲率因子。其中各参数计算公式如下所示：

其中，A₀+A₁₃为无物理意义的无量纲拟合参数，γ为侧倾角，F_z为轮胎垂向载荷。由三角函数组合而成的魔术公式可以实现对轮胎力的高精度拟合，但其复杂的结构会导致较大的数学运算量，本发明考虑对其进行适当简化。首先，由于无人车辆的垂向运动对轨迹跟踪过程的影响较小，故在控制器设计时可以忽略垂向运动，在横向力计算时为纯侧偏，所以此处设定侧倾角γ＝0；其次，Bx一般而言为一较小值，即：

Bx-arctan(Bx)≈0 (0.6)

另外，原本的魔术公式只说明了轮胎侧偏角与轮胎横向力的绝对值关系，但在车辆坐标系下，二者符号相反，F_y的计算应加入负号。基于以上讨论，对轮胎横向力的计算简化为：

式中，A₀～A₁₃的参数取值一般是通过轮胎的实验数据拟合确定，表1为各个参数的取值情况。

表1 魔术公式轮胎模型各参数值

符号	取值	符号	取值	符号	取值
						A₀	1.65	A₁	-34	A₂	1250
A₃	3036	A₄	12.8	A₉	0.013
						A₁₀	0.004	A₁₂	1.214	A₁₃	6.262

图3为基于式(1.7)绘制出的轮胎侧偏角与轮胎侧向力的关系曲线图。由图3可知在不同垂向载荷的作用下，当轮胎侧偏角α∈[-4,4]时，轮胎侧向力与侧偏角成线性关系变化且可以表达为如下等式：

其中，C_f和C_r分别为前轮与后轮的侧偏刚度，一般取负值。

动态状态变量x＝(v_y,r)^T由横向速度v_y和横摆角速度r组成。全局坐标系中的运动学状态变量由位置(x,y)^T和航向角θ组成。系统的控制输入u＝(δ,v_des)^T包括前轮转向角δ和期望车速v_des。

将式(1.8)与式(1.2)带入到式(1.1)中，并假定侧偏角相对较小，通过进一步整理，可以将二自由度动力学模型写成状态空间形式：

最后，可以使用状态微分获得时间步长Δt上的状态变化：

图4为车辆动力学数据采集流程图。本发明从仿真和实际环境中采集车辆动力学状态数据构建数据集。首先，在CarSim中设置不同的驾驶场景、道路环境并提供动力学模型，搭建Matlab-CarSim智能驾驶仿真平台，利用Logitech G290转向踏板系统采集车辆的状态数据。然后，利用搭载有惯性测量单元(IMU)及方向盘传感器等车载设备的实车采集了不同条件下由人类驾驶员驾驶70分钟的数据，数据率为30Hz。该数据集包含四种不同类型的驾驶行为：1)低速之字形驾驶，2)高速驾驶，3)尽可能地滑动，以及4)随机运动。1)和2)在有六个尖角的赛道上收集。3)和4)由平地采集而来。最高车速v_max设置为40km/h。这些驾驶数据在七个不同摩擦系数的路面上采集，其中，μ∈{0.4,0.5,...1.0}。使用一辆奇瑞艾瑞泽作为控制车辆。

由于输入数据的各个维度之间的范围很大，因此使用归一化技术来保证准确的预测结果。本发明选择最小-最大归一化，使得标准化后的数值处于[0,1]之间，可表示为：

其中，x与x′分别为原始数据与归一化的数据，x_max与x_min分别为数据所在列的最大值与最小值。

图5为PINN求解智能车辆动力学模型的流程图。本发明利用当前与历史的状态-控制变量对H作为输入：

H_t＝[x_t,u_t,x_t-1,u_t-1,…,x_t-3,u_t-3] (0.12)

式中，t表示离散化的时间变量。输入与输出之间的各层和各层中的神经元构成全连接神经网络F，该网络由4个隐含层构成，每层10个神经元。每个激活的输入用z_□表示，输出用o_□表示，激活函数用act(z_□)表示。W_□和b_□分别是网络的权重和偏置项，其中□表示层编号且□∈{1,2,3,4}。PINN中的全连接神经网络F可以用以下形式表达：

然后，可以利用全连接神经网络F来预测Δt时间步长上状态的离散变化：

x_t+1-x_t＝F(H _t) (0.14)

在使用小离散时间间隔时，估计状态残差的想法是有效的。

自主车辆(AVs)的动力学模型应转化为通用的非线性偏微分方程形式。设函数u＝u(t,x)满足如下形式的偏微分方程：

u_t+N(u；λ)＝0，x∈Ω，t∈[0,T] (0.15)

其中，N(u；λ)表示由λ参数化的关于u的非线性算子，x为空间变量，t为时间变量，Ω为欧氏空间的子集，T为终止时刻。PINN考虑建立一个神经网络来逼近偏微分方程的解，即u＝u(t,x)。在输入时间和空间数据后，首先通过全连接神经网络来逼近函数，再采用自动微分技术计算基于物理的损失函数，通过梯度下降法来最小化损失函数从而计算最终所需的神经网络连接权重参数和偏微分方程的物理参数,此外，中间框中的I为单位算子，而/>表示微分运算符/激活运算符。轮胎模型和自行车模型被嵌入到损失函数中，并且确定了所有的系数。

本发明将数据集按7:3的比例划分为训练集与测试集。使用整流线性单元(ReLU)作为激活函数。为了减小损失函数的误差，利用Adam优化器对目标函数进行优化。Adam优化器可以根据学习过程中的情况变化来自适应调整学习率。“Xavier”方法用于确定初始权重和偏差，以保证神经网络更快地收敛。在FC-NN中加入残差神经网络，以避免梯度爆炸或梯度消失。在训练过程中，学习率取为0.001。在测试集上应用了提前停止。

在PINN中，基于控制问题的物理方程，使用网络的输出及其微分值来定义残差或损失函数。与大多数神经网络方法中只有一个损失项的损失函数不同，PINN的损失函数由两个以上的损失项组成。具体地，对本发明来说，PINN的总损失函数L_N由神经网络的残余损失L_Data、物理条件的损失项(和L_r)以及初始条件损失项(/>和L_r0)的总和组成，即：

本发明选择均方误差(MSE)来构造与神经网络预测值和真实值之间残差有关的损失函数L_Data，并且该损失函数表示如下：

其中，n是训练集的大小，x_i与分别是i时刻车辆的真实状态与神经网络的预测状态，即

与式(1.9)有关的物理条件损失项以均方误差的形式表示为：

其中，n是配置点的总数，x_i为i时刻车辆的状态，且x_i∈x。

初始条件表示为：

其中，v_y0是车辆的初始横向速度，r₀是初始的横摆角速度。与初始条件相关的损失项被定义为：

然后采用自动微分技术计算基于物理的损失函数，通过最小化损失函数来计算最终所需的神经网络连接权重参数和偏微分方程的物理参数。

本发明将PINN方法与基线神经网络进行了比较。选择相同结构(全连接4层，每层10个神经元)的神经网络作为基线神经网络，并利用相同的训练数据来训练该网络。除了物理嵌入，两个模型都应用了相同的设置。然后，基线模型采用以下形式：

利用均方根误差(RMSE)和最大误差(E_max)对PINN和基线神经网络的性能进行了测试。

图6为PINN与基线神经网络的测试误差曲线对比图。可以看出，本发明所提出的PINN方法的收敛速度远快于基线神经网络，也收敛到比基线神经网络更好的解，这是因为物理先验知识指导了学习问题。

本发明还采集了验证数据，以证明PINN方法在泛化性方面的优越性。这些数据是在具有六个尖角的同一赛道上采集的，但对摩擦系数进行了调整。将下列数值分配给上述赛道的每个尖角，即[0.45,0.55,0.65,0.75,0.85,0.95]，其他区域设置为μ＝1.0。此外，这些摩擦数值在训练集中不存在。

PINN模型仍然输出状态的残差，与基线神经网络相同。此外，Pacejka轮胎模型(式(1.4))和车辆动力学模型(式(1.9))是完全可微的。这使得可以通过最小化基线网络中使用的相同目标来以端到端的方式训练PINN，使得||x_t+1-x_t-F(H _t)||²。本发明公开的方法是一个通用的解决方案，可以用于其它类型的模型结构，包括循环神经网络(RNN)。此外，它还可以表示为随机模型或集成模型。

第二部分：设计ILQR控制算法

车辆动力学模型的状态转移函数及其初始状态为：

式中，i＝0,1,...,N-1，和/>分别表示i时刻的状态变量和控制变量，f为动态方程。系统总成本J₀是运行成本l(x_i,u_i)(即在状态x_i下执行控制u_i的成本)与终端时刻的成本l_f(x_N)的总和，从状态x₀开始，应用控制序列U≡{u₀,u₁,...,u_N-1}，直到控制时域N：

最优控制问题是确定特定于x的控制序列U^*(x)使代价函数J₀为最小值，即：

令U_i≡{u_i,u_i+1,...,u_N-1}，并定义分段成本J_i为从i到N的成本和：

定义在第i时刻给定最小控制序列的性能指标值函数V_i(x)为：

根据动态规划贝尔曼最优性原理，将整个控制序列的最小化简化为单个控制步长的最小化，并在时间上向后传递：

除了状态值函数V_i外，本发明还引入了动作值函数，记为Q：

Q(x_i,u_i)＝l(x_i,u_i)+V_i+1(f(x_i,u_i)) (0.29)

接下来，将状态和输入的变化量分别表示为δx_i和δu_i，则式(2.7)在i时刻施加一个扰动后所得的最小值为：

对上式进行二阶泰勒展开，可得：

其中，Q_x与Q_u分别为Q(δx_i,δu_i)对状态x与控制输入u的一阶偏导，Q_xx与Q_uu分别为Q(δx_i,δu_i)对状态x与控制输入u的二阶偏导，Q_xu与Q_ux为Q(δx_i,δu_i)对状态x与控制输入u的二阶混合偏导，各展开系数表示如下：

其中，l_x与l_u分别为系统的运行成本对状态与控制输入的一阶偏导；f_x与f_u分别为系统线性化后的状态与控制输入；(V_.)_x与(V_.)_xx分别为系统的性能指标值函数对状态的一阶偏导与二阶偏导；l_xx与l_uu分别为系统的运行成本对状态与控制输入的二阶偏导；l_ux为系统的运行成本对状态和控制输入的二阶偏导。

ILQR利用高斯牛顿法通过泰勒展开式一阶项近似原函数，因此式(2.10)中最后三个子方程中的二阶项被省略。通过求取系统的动作值函数Q(δx,δu)的最小值，得到系统增量的最优控制律δu^*为：

其中，开环项反馈增益项/>第i时刻最优控制的状态值函数的差值由下式给出：

对于状态值函数，其梯度和海森矩阵由下式给出：

通过反向传播(Backward Pass)来递归地计算局部性能指标值V(i)并更新第i时刻的控制增益[K(i),k(i)]，可以得到名义控制序列U₀＝{u₀₁,u₀₂,...,u_0N}。再通过前向传播(Forward Pass)计算得到新的状态和控制序列，表示为：

ILQR算法的每一次迭代都在轨迹{x_i,u_i}附近寻找控制序列然后根据非线性动力学模型找到新的状态轨迹/>反复迭代直至收敛。

在牛顿法中，当Hessian矩阵不是正定的或者二阶近似不准确时，可能会导致迭收敛困难的问题。梯度下降法能够解决以上问题，但在最低点附近时收敛速度较慢，于是本发明提出列文伯格-马夸尔特(Levenberg-Marquardt，LM)算法，它通过灵活调节LM参数λ的大小来动态调节迭代时的步长，使得算法在局部寻优过程中能够充分结合两者的优势。即在局部控制成本Q的Hessian矩阵部分添加一个对角项作为正则化项，以保证Hessian矩阵正定。

其中，I_m为单位矩阵，λ∈[0,+∞)。λ接近0时为牛顿迭代法，λ取较大值时为梯度下降法。因此，本发明对Hessian矩阵Q_uu及Q_ux做如下改写：

此时，系统增量的最优控制律为：

其中，这种正则化相当于在当前控制序列周围增加了二次成本，使步骤更加保守。此外，也使得新轨迹更加接近旧轨迹，从而显著提高该算法的鲁棒性。

基于以上正则化改进的最优控制性能函数值为：

对于一般的非线性系统，在牛顿法迭代寻找函数极值过程中会出现跨过真正极值的情况，二阶近似的结果与实际系统可能偏差太大，目标函数可能不会收敛。本发明引入线性搜索(line search)，在更新量前面添加回溯线性搜索参数α，调整原函数搜索范围使之在更小的范围内搜索极小值。

其中，0＜α≤1。α取值不能太小，以免梯度下降不充分。当α接近0时，控制律将不更新，轨迹将保持不变。但对于中间值，由于反馈的存在，所得到的控制步长不是完整步长的简单缩放。

第三部分：建立轨迹跟踪控制器并对其性能进行评估

这一部分首先介绍了轨迹跟踪控制器的设计。设s_i＝{x_i,y_i,θ_i,v_y,i,r_i}表示轴距为L的车辆在离散时刻i的状态，其中，x_i和y_i分别表示世界坐标系下车辆的纵向位置和横向位置，θ_i为i时刻的航向角，v_y,i为i时刻的横向车速，r_i为i时刻的横摆角速度。控制命令由u_i＝{δ_i,v_des,i}给出，其中，δ_i为i时刻的前轮转向角，v_des,i为i时刻的期望车速。用π表示状态转移函数f：

s_i+1＝π(s_i,u_i) (1.1)

根据车辆在状态s_i下的自行车模型，车辆的动态方程π(即状态转移函数f)可由以下公式定义：

给出一组具有速度的M个有序姿态{x_i,y_i,θ_i},i∈[1,M]，对它们进行三次样条插值，得到参考轨迹。

图7为车辆在状态s_i下的自行车模型和参考轨迹的误差状态图。对于状态s_i，将相对于参考轨迹的误差状态ψ_i定义为一个元组，如下所示：

其中，为在状态s_i下车辆与参考轨迹的垂向距离，/>为车辆相对于参考轨迹的航向误差，/>为对应于参考轨迹上最近点的速度误差(/>这里v_p是参考轨迹上最近点的速度)，v_y,i和r_i来自于状态s_i。本发明将误差状态ψ_i作为ILQR轨迹跟踪控制器的状态，从而对参考轨迹的所有误差进行编码。给定在离散时刻i的误差状态ψ_i和控制u_i，用γ表示状态转移函数f，则i+1时刻的误差状态ψ_i+1表示如下：

ψ_i+1＝γ(ψ_i,u_i) (1.3)

γ可以由以下公式定义：

在误差状态ψ_i下执行控制u_i的成本l(ψ_i,u_i)如下：

其中，A和B为对角权重矩阵，A的最后3个对角线元素为零，因为本发明只关注使式(3.4)中的误差项趋近于零。误差状态ψ_i的最终成本l_f(ψ_N)如下所示：

因此，可以将具有给定参考轨迹的智能车辆轨迹跟踪控制问题定义为：寻找到时域为N的最优控制序列U^*＝{u₀,u₁,...,u_N-1}，从而最小化以下目标函数：

加上如下的约束：

式(3.7)和式(3.8)便可以将轨迹跟踪问题转化为步骤2中所定义的ILQR问题。

本发明以横向位置与航向角的均方根误差、算法耗时以及速度跟踪误差作为评价指标，来验证所建立的PINN模型应用于轨迹跟踪控制中的建模效果。

本发明在一个椭圆形轨迹(如图8所示)和一条赛道上(如图9所示)计算了上述指标。椭圆形轨迹和赛道均在模拟器中被建造，将轨迹的中心线设置为目标轨迹。其中，赛道长约790米，由两种路面组成，一种摩擦系数为1.0，另一种摩擦系数为0.4。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明，它们并非用以限制本发明的保护范围，凡未脱离本发明技术所创的等效方式或变更均应包含在本发明的保护范围之内。

Claims

1.一种基于物理信息神经网络的智能车辆动力学模型，其特征在于，采用全连接神经网络作为模型主干，将Pacejka魔术公式轮胎模型和自行车模型作为物理信息嵌入到模型的损失函数中。

2.根据权利要求1所述的一种基于物理信息神经网络的智能车辆动力学模型，其特征在于，所述自行车模型，其运动微分方程表示为：

式中，m为整车质量，I_z为横摆方向转动惯量；a和b分别为质心到前、后轴的距离；v_y为车辆横向速度，v_x为车辆纵向速度，r为横摆角速度；F_x,f、F_y,f分别为前轮纵向、横向受力，F_y,r为后轮横向力；δ为前轮转角；

假设纵向速度恒定，可以得到：

F_x,f＝0 (0.2)。

3.根据权利要求2所述的一种基于物理信息神经网络的智能车辆动力学模型，其特征在于，Pacejka魔术公式轮胎模型包括轮胎侧偏角模型，由下式获得：

其中，α_f和α_r相应地表示车辆的前轮侧偏角与后轮侧偏角；

轮胎-路面动力学由Pacejka魔术公式轮胎模型表示为下列的非线性方程：

F_y＝Dsin(Carctan(Bx-E(Bx-arctan(Bx))))+S_v (0.4)

式中，F_y为轮胎的侧向力，x＝α+S_h，x为输入变量，其可以是轮胎的滑移率或轮胎的侧偏角，α为轮胎侧偏角，S_h为水平偏移量，S_v为垂直偏移量。模型参数B为刚度因子，C为形状因子，D为峰值因子，E为曲率因子；其中各参数计算公式如下所示：

C＝A₀

E＝A₆ F_z+A₇

S_v＝A₁₁ F_zγ+A₁₂ F_z+A₁₃

S_h＝A₉ F_z+A₁₀+A₈γ

其中，A₀～A₁₃为无物理意义的无量纲拟合参数，γ为侧倾角，F_z为轮胎垂向载荷。

4.根据权利要求3所述的一种基于物理信息神经网络的智能车辆动力学模型，其特征在于，对轮胎模型进行简化：首先，由于无人车辆的垂向运动对轨迹跟踪过程的影响较小，故在控制器设计时可以忽略垂向运动，在横向力计算时为纯侧偏，所以此处设定侧倾角γ＝0；其次，Bx一般而言为一较小值，即：

Bx-arctan(Bx)≈0 (0.6)

对轮胎横向力的计算简化为：

F_y＝-Dsin(Carctan(Bx))+S_v

D＝A₁F_z ²+A₂F_z

C＝A₀

S_v＝A₁₂F_z+A₁₃

S_h＝A₉F_z+A₁₀

式中，A₀～A₁₃的参数取值一般通过轮胎的实验数据拟合确定。

5.根据权利要求3所述的一种基于物理信息神经网络的智能车辆动力学模型，其特征在于，当轮胎侧偏角α∈[-4,4]时，轮胎侧向力与侧偏角成线性关系变化且表达为如下等式：

其中，C_f和C_r分别为前轮与后轮的侧偏刚度，一般取负值；

动态状态变量x＝(v_y,r)^T由横向速度v_y和横摆角速度r组成，全局坐标系中的运动学状态变量由位置(x,y)^T和航向角θ组成，系统的控制输入u＝(δ,v_des)^T包括前轮转向角δ和期望车速v_des；

将式(1.8)与式(1.2)带入到式(1.1)中，并假定侧偏角相对较小，将二自由度动力学模型写成状态空间形式：

最后，可以使用状态微分获得时间步长Δt上的状态变化：

6.根据权利要求1所述的一种基于物理信息神经网络的智能车辆动力学模型，其特征在于，所述全连接神经网络包含4个隐含层，每层10个神经元，每个激活的输入用z_□表示，输出用o_□表示，激活函数用act(z_□)表示，W_□和b_□分别是网络的权重和偏置项，其中□表示层编号且□∈{1,2,3,4}，全连接神经网络F用以下形式表达：

7.根据权利要求1所述的一种基于物理信息神经网络的智能车辆动力学模型，其特征在于，总损失函数L_N由神经网络的残余损失L_Data、物理条件的损失项(和L_r)以及初始条件损失项(/>和L_r0)的总和组成，即：

采用均方误差(MSE)来构造与神经网络预测值和真实值之间残差有关的损失函数L_Data，并且该损失函数表示如下：

与式(1.9)有关的物理条件损失项以均方误差的形式表示为：

其中，n是配置点的总数，x_i为i时刻车辆的状态，且x_i∈x；

初始条件表示为：

其中，v_y0是车辆的初始横向速度，r₀是初始的横摆角速度；

与初始条件相关的损失项定义为：

8.一种智能车辆的ILQR控制算法，其特征在于，该ILQR控制算法基于权利要求1-7任一项所述的车辆动力学模型，包括如下：

设车辆动力学模型的状态转移函数及初始状态为：

式中，i＝0,1,...,N-1，和/>分别表示i时刻的状态变量和控制变量，f为动态方程，系统总成本J₀是运行成本l(x_i,u_i)(即在状态x_i下执行控制u_i的成本)与终端时刻的成本l_f(x_N)的总和，从状态x₀开始，应用控制序列U≡{u₀,u₁,...,u_N-1}，直到控制时域N：

最优控制问题是确定特定x的控制序列U^*(x)使代价函数J₀为最小值，即：

定义在第i时刻给定最小控制序列的性能指标值函数V_i(x)为：

将整个控制序列的最小化简化为单个控制步长的最小化，并在时间上向后传递：

除了状态值函数V_i外，引入动作值函数，记为Q：

Q(x_i,u_i)＝l(x_i,u_i)+V_i+1(f(x_i,u_i)) (0.24)

对上式进行二阶泰勒展开，可得：

其中，l_x与l_u分别为系统的运行成本对状态与控制输入的一阶偏导；f_x与f_u分别为系统线性化后的状态与控制输入；(V_.)_x与(V_.)_xx分别为系统的性能指标值函数对状态的一阶偏导与二阶偏导；l_xx与l_uu分别为系统的运行成本对状态与控制输入的二阶偏导；l_ux为系统的运行成本对状态和控制输入的二阶偏导；

通过求取系统的动作值函数Q(δx,δu)的最小值，得到系统增量的最优控制律δu^*为：

对于状态值函数，其梯度和海森矩阵由下式给出：

通过反向传播来递归地计算局部性能指标值V(i)并更新第i时刻的控制增益[K(i),k(i)]，得到名义控制序列U₀＝{u₀₁,u₀₂,...,u_0N}，再通过前向传播计算得到新的状态和控制序列，表示为：

每一次迭代都在轨迹{x_i,u_i}附近寻找控制序列然后根据非线性车辆动力学模型找到新的状态轨迹/>反复迭代直至收敛；

在局部控制成本Q的Hessian矩阵部分添加一个对角项作为正则化项，以使得Hessian矩阵正定，

其中，I_m为单位矩阵，λ∈[0,+∞)，λ接近0时为牛顿迭代法，λ取较大值时为梯度下降法，因此，对Hessian矩阵Q_uu及Q_ux做如下改写：

此时，系统增量的最优控制律为：

其中，这种正则化相当于在当前控制序列周围增加了二次成本，使步骤更加保守，也使得新轨迹更加接近旧轨迹，提高鲁棒性；

基于以上正则化改进的最优控制性能函数值为：

在更新量前面添加回溯线性搜索参数α，调整原函数搜索范围使之在更小的范围内搜索极小值，

其中，0＜α≤1，当α接近0时，控制律将不更新，轨迹将保持不变，但对于中间值，由于反馈的存在，所得到的控制步长不是完整步长的简单缩放。

9.一种智能车辆的轨迹跟踪控制器，其特征在于，其通过如下设计得到：

设s_i＝{x_i,y_i,θ_i,v_y,i,r_i}表示轴距为L的车辆在离散时刻i的状态，其中，x_i和y_i分别表示世界坐标系下车辆的纵向位置和横向位置，θ_i为i时刻的航向角，v_y,i为i时刻的横向车速，r_i为i时刻的横摆角速度，控制命令由u_i＝{δ_i,v_des,i}给出，其中，δ_i为i时刻的前轮转向角，v_des,i为i时刻的期望车速，用π表示状态转移函数f：

s_i+1＝π(s_i,u_i) (0.38)

给出一组具有速度的M个有序姿态{x_i,y_i,θ_i},i∈[1,M]，对它们进行三次样条插值，得到参考轨迹；

对于状态s_i，将相对于参考轨迹的误差状态ψ_i定义为一个元组，如下所示：

其中，为在状态s_i下车辆与参考轨迹的垂向距离，/>为车辆相对于参考轨迹的航向误差，/>为对应于参考轨迹上最近点的速度误差，/>这里v_p是参考轨迹上最近点的速度，v_y,i和r_i来自于状态s_i；将误差状态ψ_i作为ILQR轨迹跟踪控制器的状态，对参考轨迹的所有误差进行编码；给定在离散时刻i的误差状态ψ_i和控制u_i，用γ表示状态转移函数f，则i+1时刻的误差状态ψ_i+1表示如下：

ψ_i+1＝γ(ψ_i,u_i) (0.40)

γ由以下公式定义：

在误差状态ψ_i下执行控制u_i的成本l(ψ_i,u_i)如下：

其中，A和B为对角权重矩阵，A的最后3个对角线元素为零，误差状态ψ_i的最终成本l_f(ψ_N)如下所示：

将具有给定参考轨迹的智能车辆轨迹跟踪控制问题定义为：寻找到时域为N的最优控制序列U^*＝{u₀,u₁,...,u_N-1}，从而最小化以下目标函数：

加上如下的约束：

10.根据权利要求9所述的一种智能车辆的轨迹跟踪控制器，其特征在于，将式(3.7)和式(3.8)轨迹跟踪问题转化为利用权利要求8中的ILQR算法求解。