CN114995426A - 一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备 - Google Patents
一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备 Download PDFInfo
- Publication number
- CN114995426A CN114995426A CN202210627864.0A CN202210627864A CN114995426A CN 114995426 A CN114995426 A CN 114995426A CN 202210627864 A CN202210627864 A CN 202210627864A CN 114995426 A CN114995426 A CN 114995426A
- Authority
- CN
- China
- Prior art keywords
- state
- vehicle
- neural network
- control
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 20
- 210000002569 neuron Anatomy 0.000 claims abstract description 7
- 230000004913 activation Effects 0.000 claims abstract description 5
- 238000003062 neural network model Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 89
- 238000012546 transfer Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 230000036544 posture Effects 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000005312 nonlinear dynamic Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000013459 approach Methods 0.000 claims description 2
- 238000005183 dynamical system Methods 0.000 claims description 2
- 230000002087 whitening effect Effects 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims 1
- 238000012795 verification Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 33
- 238000005192 partition Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- WYTGDNHDOZPMIW-RCBQFDQVSA-N alstonine Natural products C1=CC2=C3C=CC=CC3=NC2=C2N1C[C@H]1[C@H](C)OC=C(C(=O)OC)[C@H]1C2 WYTGDNHDOZPMIW-RCBQFDQVSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0219—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory ensuring the processing of the whole working surface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开了一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备,在基于神经网络的动力学模型中,使用全连接前馈神经网络设计了神经网络模型,模型有两层隐藏层,每层有64个神经元,使用ReLU激活函数,模型的输入为当前时刻的车辆状态与控制指令,输出为下一时刻的车辆状态,该神经网络通过最小化预测的输出状态和观测的输出状态之间的均方误差来学习动态方程。基于神经网络动力学模型设计的ILQR控制器内包含迭代线性二次型调节器的控制算法,通过最小化成本函数求得最优控制指令,实现对参考轨迹的跟踪。本发明相比于端到端的控制,所提出的方案可解释性更强,在保证轨迹跟踪精度的同时,兼顾了横向和纵向稳定性。
Description
技术领域
本发明涉及无人驾驶车辆控制技术领域,更具体地说,是涉及一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备。
背景技术
无人驾驶技术可以显著提升交通效率、降低交通事故发生率并提高能源使用效率,已成为近年来汽车行业的研究热点。随着无人驾驶技术的快速发展,其在众多领域的应用场景变得越来越广泛。无人小巴车、无人公交车、无人运输卡车等基本实现了特定场景的试运行,且在特定道路和园区等场景实现了初步的商业化落地。无人驾驶技术主要包括感知、决策、控制三个部分,而轨迹跟踪控制可以实现车辆从当前位置稳定、快速地到达目标位置,是无人驾驶技术中尤为重要的一环。
当前,无人驾驶车辆轨迹跟踪控制方法可以分为基于模型的控制方法和无模型的控制方法。基于模型的控制方法被成功地用于控制复杂动态系统。在无模型控制方法中,代理必须从大量样本中为每个任务学习新的策略。传统无人驾驶车辆轨迹跟踪控制器的设计依赖于使用系统的动态模型来计算当前任务的控制律。与无模型的控制方法相比,由于模型的不精确性及外界干扰的不确定性,基于模型的控制方法通常在渐近性能上略有不足。在高度动态的环境中运行的真实车辆上采集样本可能是极其危险的,并且对这类动态系统来说,使用无模型的控制方法所产生的效果通常无法达到预期。在实际的动态系统上,基于模型的控制方法需要具备一定的专业知识,以及无人驾驶车辆中执行器、轮胎力、侧滑等复杂动力学的建模。这些约束在一定程度上限制了基于模型的控制方法在真实车辆系统上的应用。
发明内容
为了解决现有技术中的不足,本发明提出了一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法及系统。本发明利用多层神经网络来学习无人驾驶车辆的动力学模型,将该模型用于迭代线性二次型调节器控制算法的设计并推导出控制律,实现无人驾驶车辆的轨迹跟踪控制任务。本发明主要包括基于神经网络的动力学模型的建立,迭代线性二次型调节器的控制算法的设计,轨迹跟踪控制器的建立和性能评估三个部分。
在基于神经网络的动力学模型的建立中,使用全连接前馈神经网络设计了神经网络模型,模型有两层隐藏层,每层有64个神经元,选择使用ReLU激活函数,模型的输入为当前时刻的车辆状态与控制指令,输出为下一时刻的车辆状态,该神经网络通过最小化预测的输出状态和观测的输出状态之间的均方误差来学习动态方程。本发明通过车载设备来收集驾驶行为的数据,即利用搭载有惯性测量单元(IMU)等车载设备的实车在公路和非公路环境中人工驾驶一小时,以完成数据的采集。
基于所训练的神经网络动力学模型设计ILQR控制器,所述ILQR控制器内包含了迭代线性二次型调节器的控制算法,通过最小化迭代线性二次型调节器控制算法中的成本函数求得最优控制指令,以实现对参考轨迹的跟踪。
进一步,所述神经网络动力学模型具体如下:
xt+1=f(xt,ut) (1)
进一步,所述迭代线性二次型调节器的控制算法具体如下:
针对设计的神经网络动力学模型这一非线性离散动态系统:
xt+1=f(xt,ut) (3)
将非线性环境和成本函数通过泰勒展开局部线性化,之后通过LQR的向后传递过程解出在线性化环境和成本下的最优解,ILQR算法分为线性化、LQR的反向传递和前向传递三部分;
在线性化部分,将ILQR中非线性动态展开成一阶,成本展开成二阶,
将上式(4)进行重排列:
其中, 二次部分的系数矩阵(其中,代表平均划分矩阵Ct的左上角部分,代表矩阵Ct的右上角部分,代表矩阵Ct的左下角部分,代表矩阵Ct的右下角部分),线性部分的系数矩阵(其中,代表平均划分矩阵ct的上半部分,代表矩阵ct的下半部分)。这样就将ILQR问题转化为常规的LQR问题;
在LQR的反向传递中,本发明通过最小化成本函数Q(δxt,δut)求得最优控制。在时刻t时,通过计算成本函数Q(δxt,δut)的一阶导数为零时的δut来得到在此时刻的最优控制。即令
可得到时刻t的最优控制
将式(8)展开并用矩阵Kt及kt来表示,于是可以得到:
δut=Ktδxt+kt (10)
将式(10)带入式(6)的成本函数Q(δxt,δut)中,将新得到的成本函数记为V(δxt):
将式(11)展开可以得到:
在时刻t-1时,有式(14)成立:
则从时刻t到时刻t-1所产生的成本函数为:
则成本函数Q(δxt-1,δut-1)表示为:
其中,t-1时刻二次部分的系数矩阵(其中,代表矩阵Qt-1的左上角部分,代表矩阵Qt-1的右上角部分,代表矩阵Qt-1的左下角部分,代表矩阵Qt-1的右下角部分),线性部分的系数矩阵(其中,代表矩阵qt-1的上半部分,代表矩阵qt-1的下半部分)。在时刻t-1时,通过计算成本函数Q(δxt-1,δut-1)的一阶导数为零时的δut-1来得到在此时刻的最优控制。即令
可以得到时刻t-1的最优控制:
δut-1=Kt-1δxt-1+kt-1 (19)
将式(20)带入式(17)中,对展开式进行简化处理可以得到:
在LQR的前向传递中,该过程要和真实的非线性系统进行交互,得到新的真实轨迹;
进一步,所述轨迹跟踪控制器具体如下:
设表示轴距为L的车辆在离散时刻i的状态,其中{xi,yi,θi}是姿态,xi和yi分别表示世界坐标系下车辆的纵向和横向坐标,θi是车辆的航向角,φi是转向角,vi是速度,是离散时刻i的转向角变化率,控制命令由给出,其中pi是油门踏板输入,bi是制动输入,是离散时刻i的指令转向角变化率,用π表示状态转移函数f:
si+1=π(si,ui) (23)
由车辆在典型状态si下的自行车模型,车辆的动态方程π(即状态转移函数f)可由以下公式定义:
xi+1=xi+vi cos(θi)Δt
yi+1=yi+vi sin(θi)Δt
给出一组具有速度的M个有序姿态,对它们进行三次样条插值,得到参考轨迹,对于每个状态si,将相对于该参考轨迹的误差状态ψi定义为一个9元元组是在状态si的车辆与参考轨迹的垂向距离,是车辆相对于参考轨迹的航向误差,是对应于参考轨迹上最近点的速度误差(这里vp是参考轨迹上最近点的速度),vi,和φi来自于状态si,将误差状态ψi用于迭代线性二次型调节器的状态,从而对参考轨迹的所有误差进行编码,给定在离散时刻i 的误差状态ψi和控制ui,用γ表示状态转移函数f,下一时刻的误差状态ψi+1如下式:
ψi+1=γ(ψi,ui) (25)
γ可以由以下公式定义:
在误差状态ψi下执行ui的成本l(ψi,ui)如下:
其中,A和B是对角权重矩阵,A的最后3个对角线元素为零,使(14)中的误差项趋近于零,对于状态ψ,其最终成本lf(ψ)如下所示:
lf(ψ)=ψTAψ (28)
将具有给定参考轨迹的车辆轨迹跟踪问题定义为去找到范围为N的最优控制序列{u0,u1,…,uN-2},从而最小化以下成本:
加上如下的约束:
上述控制系统可集成在车载控制设备内,实现无人驾驶车辆的实时轨迹跟踪。
本发明的有益效果:
1、本发明提出了通过车载设备来收集驾驶行为数据的方法,即利用搭载有惯性测量单元(IMU)等车载设备的实车在公路和非公路环境中人工驾驶一小时,来完成数据的采集。所得数据作为车辆动力学模型的输入。由于数据直接来自于人类驾驶的实车数据,相较于驾驶模拟器所得的数据精度更高,种类更多,而且将驾驶员的驾驶风格也考虑在内。
2、本发明提出基于全连接前馈神经网络来设计车辆的神经网络动力学模型,模型有两层隐藏层,与深度神经网络相比不仅提高了计算效率,而且可以准确识别车辆运行过程中各种复杂的动力学行为,并可以学习未建模的车辆动态响应。
3、本发明通过将所设计的神经网络动力学模型与迭代线性二次型调节器控制算法相结合,相比于端到端的控制算法,所提出的算法可解释性更强,并且在不同的路况及行驶工况下可以实现参考轨迹的跟踪控制,在保证轨迹跟踪精度的同时,兼顾了横向和纵向稳定性,为无人驾驶车辆开发高性能的运动控制器奠定良好的基础。
附图说明
图1为本发明实施例基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法的流程图;
图2为车辆动力学数据采集模块;
图3为车辆的自行车模型和参考轨迹的误差状态图;
图4为用于评估轨迹跟踪性能的圆形参考轨迹;
图5为用于评估轨迹跟踪性能的椭圆形参考轨迹;
图6为用于评估轨迹跟踪性能的蛇形参考轨迹;
图7为用于评估轨迹跟踪性能的“8”形参考轨迹;
图8为用于评估轨迹跟踪性能的混合参考轨迹。
具体实施方式
下面结合附图对本发明作进一步说明。
需要说明的是,本发明所有涉及的分割或划分,如矩阵的分割/划分等,都是平均分割或划分。
图1为基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法的流程图,包括模型训练学习和利用基于神经网络动力学模型的ILQR控制器实现轨迹跟踪,总体过程如下:
模型训练学习:通过利用搭载有惯性测量单元(IMU)等车载设备的实车在公路和非公路环境中人工驾驶一小时的方式收集车辆的数据。基于全连接前馈神经网络设计车辆动力学模型,并利用所建立的模型和车辆数据对模型进行训练。
利用基于神经网络动力学模型的ILQR控制器实现轨迹跟踪:通过训练神经网络来学习车辆的动力学方程,并设计ILQR控制器,通过最小化成本函数求得最优控制,以达到对参考轨迹的跟踪。
具体实施过程如下:
步骤1:建立基于神经网络的动力学模型
xt+1=f(xt,ut) (31)
图2为车辆动力学数据采集模块。本发明通过利用搭载有惯性测量单元(IMU)等车载设备的实车在公路和非公路环境中人工驾驶一小时的方式来收集车辆的数据 (xt+1,xt,ut)。通过观察训练过程中的训练损失和验证损失,利用试验和误差来确定驾驶时间。根据车辆的硬件规格确定数据采样频率为30Hz。
xt,ut被用作神经网络的输入,xt+1被用作神经网络的输出,该神经网络通过最小化预测的输出状态和观测的输出状态xt+1之间的均方误差来学习动态方程f。在将数据提供给神经网络的输入层之前,先对数据进行白化处理,以降低输入数据特征之间的冗余性。本发明的模型架构采用具有两个隐藏层的全连接神经网络。其中,每个隐藏层有64个神经元,每个神经元均使用了ReLU激活函数。
步骤2:设计迭代线性二次型调节器(ILQR)的控制算法
考虑一个非线性离散动态系统:
xt+1=f(xt,ut) (33)
迭代线性二次型调节器(ILQR)控制算法可以处理非线性环境和成本,即ILQR 控制算法将非线性环境和成本函数通过泰勒展开局部线性化,之后通过LQR的向后传递过程解出在线性化环境和成本下的最优解。ILQR算法可以分为线性化、LQR的反向传递和前向传递三部分。
在线性化部分,将ILQR中非线性动态展开成一阶,成本展开成二阶。
将式(34)进行简单的重排列:
其中, 二次部分的系数矩阵(其中,代表平均划分矩阵Ct的左上角部分,代表矩阵Ct的右上角部分,代表矩阵Ct的左下角部分,代表矩阵Ct的右下角部分),线性部分的系数矩阵(其中,代表平均划分矩阵ct的上半部分,代表矩阵ct的下半部分)。这样就将ILQR问题转化为常规的LQR问题了。
在LQR的反向传递中,本发明通过最小化成本函数Q(δxt,δut)求得最优控制。在时刻t时,通过计算成本函数Q(δxt,δut)的一阶导数为零时的δut来得到在此时刻的最优控制。即令
可得到时刻t的最优控制
将式(38)展开并用矩阵Kt及参数kt来表示,于是可以得到:
δut=Ktδxt+kt (40)
将式(40)带入式(36)的成本函数Q(δxt,δut)中,将新得到的成本函数记为V(δxt):
将式(41)展开可以得到:
在时刻t-1时,有式(44)成立:
则从时刻t到时刻t-1所产生的成本函数为:
则成本函数Q(δxt-1,δut-1)表示为:
其中,t-1时刻二次部分的系数矩阵(其中,代表矩阵Qt-1的左上角部分,代表矩阵Qt-1的右上角部分,代表矩阵Qt-1的左下角部分,代表矩阵Qt-1的右下角部分),线性部分的系数矩阵(其中,代表矩阵qt-1的上半部分,代表矩阵qt-1的下半部分)。在时刻t-1时,通过计算成本函数Q(δxt-1,δut-1)的一阶导数为零时的δut-1来得到在此时刻的最优控制。即令
可以得到时刻t-1的最优控制:
δut-1=Kt-1δxt-1+kt-1 (49)
将式(50)代入式(47)中,对展开式进行简化处理可以得到:
在LQR的前向传递中,要注意该过程要和真实的非线性系统进行交互,得到新的真实轨迹。
将时刻N的状态与相结合从而得到新的轨迹。其中,利用CLIP函数限制一个向量的上下界,即给定一个范围[min,max],如果向量中的值不在这个范围内时,会被设定为这个范围的边界。umin为所有控制输入的下边界,umax为所有控制输入的上边界。
步骤3:建立轨迹跟踪控制器并对其性能进行评估
这一部分首先介绍了轨迹跟踪控制器的开发。设表示轴距为L 的车辆在离散时刻i的状态,其中{xi,yi,θi}是姿态,xi和yi分别表示世界坐标系下车辆的纵向和横向坐标,θi是车辆的航向角,φi是转向角,vi是速度,是离散时刻i的转向角变化率。控制命令由给出,其中pi是油门踏板输入,bi是制动输入,是离散时刻i的指令转向角变化率。用π表示状态转移函数f:
si+1=π(si,ui) (53)
由车辆在典型状态si下的自行车模型,车辆的动态方程π(即状态转移函数f)可由以下公式定义:
xi+1=xi+vi cos(θi)Δt
yi+1=yi+vi sin(θi)Δt
给出一组具有速度的M个有序姿态,对它们进行三次样条插值,得到参考轨迹。
图3为车辆在典型状态si下的自行车模型和参考轨迹的误差状态图。对于每个状态si,将相对于该参考轨迹的误差状态ψi定义为一个9元元组如图3所示,是在状态si的车辆与参考轨迹的垂向距离,是车辆相对于参考轨迹的航向误差,是对应于参考轨迹上最近点的速度误差 (这里vp是参考轨迹上最近点的速度),vi,和φi来自于状态si。本发明将误差状态ψi用于迭代线性二次型调节器(ILQR)状态,从而对参考轨迹的所有误差进行编码。给定在离散时刻i的误差状态ψi和控制ui,用γ表示状态转移函数f,下一时刻的误差状态ψi+1如下式:
ψi+1=γ(ψi,ui) (55)
γ可以由以下公式定义:
在误差状态ψi下执行ui的成本l(ψi,ui)如下:
其中,A和B是对角权重矩阵,A的最后3个对角线元素为零,因为本发明只关注使(56)中的误差项趋近于零。对于状态ψi,其最终成本lf(ψi)如下所示:
现在可以将具有给定参考轨迹的车辆轨迹跟踪问题定义为去找到范围为N的最优控制序列{u0,u1,…,uN-2},从而最小化以下成本:
加上如下的约束:
公式(59)和(60)便可以将轨迹跟踪问题变换为步骤2中定义的常规ILQR问题。
本发明通过利用平均交叉跟踪误差、最大交叉跟踪误差、平均速度误差和最大速度四个指标对轨迹跟踪算法的性能进行了评估。本发明在五种类型的参考轨迹上计算了上述指标,即圆形轨迹(如图4所示)、椭圆形轨迹(如图5所示)、蛇形轨迹(如图6 所示)、“8”形轨迹(如图7所示)和组合轨迹(如图8所示)。
表1列出了在各种参考轨迹上的误差结果。考虑到车载设备的精度,在各个参考轨迹上的平均交叉跟踪误差及最大交叉跟踪误差都是可以接受的。最大速度较高的原因是在起始时车辆速度为零,而参考轨迹中的初始点的速度为1m/s-2m/s。
表1:各种参考轨迹的误差结果
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技术所创的等效方式或变更均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备,其特征在于,包括:
S1、建立基于神经网络的动力学模型;使用全连接前馈网络设计神经网络模型,模型有两层隐藏层,每层有64个神经元,每个神经元使用ReLU激活函数,模型的输入为当前时刻的车辆状态与控制指令,输出为下一时刻的车辆状态,该神经网络通过最小化预测的输出状态和观测的输出状态之间的均方误差来学习动态方程;
S2、设计迭代线性二次型调节器的控制算法;
S3、根据S2的控制算法建立轨迹跟踪控制器。
3.根据权利要求1所述一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法,其特征在于,所述神经网络模型的训练方法:通过利用搭载惯性测量单元(IMU)的实车在公路和非公路环境中人工驾驶一小时的方式收集车辆的数据,通过观察训练过程中的训练损失和验证损失,利用试验和误差来确定驾驶时间;
其中,在将数据提供给神经网络的输入层之前,先对数据进行白化处理,以降低输入数据特征之间的冗余性。
4.根据权利要求2所述一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法,其特征在于,所述S2的具体实现包括:
针对非线性离散动态系统:
xt+1=f(xt,ut) (3)
迭代线性二次型调节器(ILQR)控制算法分为线性化、LQR的反向传递和前向传递三部分:
在线性化部分,将ILQR中非线性动态展开成一阶,成本展开成二阶,
将上式(4)进行重排列:
其中, 二次部分的系数矩阵其中,代表矩阵Ct的左上角部分,代表矩阵Ct的右上角部分,代表矩阵Ct的左下角部分,代表矩阵Ct的右下角部分,线性部分的系数矩阵其中,代表矩阵ct的上半部分,代表矩阵ct的下半部分;
在LQR的反向传递部分,通过最小化成本函数Q(δxt,δut)求得最优控制,在时刻t时,通过计算成本函数Q(δxt,δut)的一阶导数为零时的δut来得到在此时刻的最优控制;即令
可得到时刻t的最优控制
将式(8)展开并用矩阵Kt及kt来表示,于是可以得到:
δut=Ktδxt+kt (10)
将式(10)带入式(6)的成本函数Q(δxt,δut)中,将新得到的成本函数记为V(δxt):
将式(11)展开可以得到:
在时刻t-1时,有式(14)成立:
则从时刻t到时刻t-1所产生的成本函数为:
则成本函数Q(δxt-1,δut-1)表示为:
其中,t-1时刻二次部分的系数矩阵其中,代表矩阵Qt-1的左上角部分,代表矩阵Qt-1的右上角部分,代表矩阵Qt-1的左下角部分,代表矩阵Qt-1的右下角部分,线性部分的系数矩阵(其中,代表矩阵qt-1的上半部分,代表矩阵qt-1的下半部分),在时刻t-1时,通过计算成本函数Q(δxt-1,δut-1)的一阶导数为零时的δut-1来得到在此时刻的最优控制,即令
可以得到时刻t-1的最优控制:
δut-1=Kt-1δxt-1+kt-1 (19)
将式(20)带入式(17)中,对展开式进行简化处理可以得到:
在LQR的前向传递部分,该过程要和真实的非线性系统进行交互,得到新的真实轨迹,
5.根据权利要求4所述一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法,其特征在于,所述S3的具体实现包括:
设表示轴距为L的车辆在离散时刻i的状态,其中{xi,yi,θi}是姿态,xi和yi分别表示世界坐标系下车辆的纵向和横向坐标,θi是车辆的航向角,φi是转向角,vi是速度,是离散时刻i的转向角变化率,控制命令由给出,其中pi是油门踏板输入,bi是制动输入,是离散时刻i的指令转向角变化率,用π表示状态转移函数f:
si+1=π(si,ui) (23)
由车辆在典型状态si下的自行车模型,车辆的动态方程π(即状态转移函数f)可由以下公式定义:
xi+1=xi+vicos(θi)Δt
yi+1=yi+visin(θi)Δt
假设一组具有速度的M个有序姿态,对它们进行三次样条插值,得到参考轨迹;
对于每个状态si,将相对于该参考轨迹的误差状态ψi定义为一个9元元组 是在状态si的车辆与参考轨迹的垂向距离,是车辆相对于参考轨迹的航向误差,是对应于参考轨迹上最近点的速度误差(这里vp是参考轨迹上最近点的速度),vi,和φi来自于状态si,将误差状态ψi用于迭代线性二次型调节器(ILQR)的状态,从而对参考轨迹的所有误差进行编码,给定在离散时刻i的误差状态ψi和控制ui,用γ表示状态转移函数f,下一时刻的误差状态ψi+1如下式:
ψi+1=γ(ψi,ui) (25)
γ可以由以下公式定义:
在误差状态ψi下执行ui的成本l(ψi,ui)如下:
其中,A和B是对角权重矩阵,A的最后3个对角线元素为零,使式(26)中的误差项趋近于零,对于状态ψi,其最终成本lf(ψi)如下所示:
将具有给定参考轨迹的车辆轨迹跟踪问题定义为找到范围为N的最优控制序列{u0,u1,…,uN-2},从而最小化以下成本:
设计如下的约束:
6.一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制系统,其特征在于,包括:神经网络动力学模型部分、迭代线性二次型调节器部分以及轨迹跟踪控制器部分;
所述神经网络动力学模型部分,使用全连接前馈神经网络设计神经网络动力学模型,模型有两层隐藏层,每层有64个神经元,每个神经元使用ReLU激活函数,模型的输入为当前时刻的车辆状态与控制指令,输出为下一时刻的车辆状态,该神经网络通过最小化预测的输出状态和观测的输出状态之间的均方误差来学习动态方程;
基于神经网络动力学模型设计迭代线性二次型调节器以及轨迹跟踪控制器,由轨迹跟踪控制器最小化迭代线性二次型调节器的成本函数求得最优控制指令,实现对参考轨迹的跟踪。
8.根据权利要求7所述的一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制系统,其特征在于,所述迭代线性二次型调节器的控制算法具体如下:
针对设计的神经网络动力学模型这一非线性离散动态系统:
xt+1=f(xt,ut) (33)
将非线性环境和成本函数通过泰勒展开局部线性化,之后通过LQR的向后传递过程解出在线性化环境和成本下的最优解,ILQR算法分为线性化、LQR的反向传递和前向传递三部分;
在线性化部分,将ILQR中非线性动态展开成一阶,成本展开成二阶,
将式(34)进行重排列:
其中, 二次部分的系数矩阵(其中,代表矩阵Ct的左上角部分,代表矩阵Ct的右上角部分,代表矩阵Ct的左下角部分,代表矩阵Ct的右下角部分),线性部分的系数矩阵其中,代表矩阵ct的上半部分,代表矩阵ct的下半部分,这样就将ILQR问题转化为常规的LQR问题;
在LQR的反向传递中,通过最小化成本函数Q(δxt,δut)求得最优控制,在时刻t时,通过计算成本函数Q(δxt,δut)的一阶导数为零时的δut来得到在此时刻的最优控制,即令:
可得到时刻t的最优控制
将式(38)展开并用矩阵Kt及kt来表示,于是可以得到:
δut=Ktδxt+kt (40)
将式(40)带入式(36)的成本函数Q(δxt,δut)中,将新得到的成本函数记为V(δxt):
将式(41)展开可以得到:
在时刻t-1时,有式(44)成立:
则从时刻t到时刻t-1所产生的成本函数为:
则成本函数Q(δxt-1,δut-1)表示为:
其中,t-1时刻二次部分的系数矩阵其中,代表矩阵Qt-1的左上角部分,代表矩阵Qt-1的右上角部分,代表矩阵Qt-1的左下角部分,代表矩阵Qt-1的右下角部分,线性部分的系数矩阵其中,代表矩阵qt-1的上半部分,代表矩阵qt-1的下半部分,在时刻t-1时,通过计算成本函数Q(γxt-1,δut-1)的一阶导数为零时的δut-1来得到在此时刻的最优控制,即令
可以得到时刻t-1的最优控制:
δut-1=Kt-1δxt-1+kt-1 (49)
将式(50)代入式(47)中,对展开式进行简化处理可以得到:
在LQR的前向传递中,该过程要和真实的非线性系统进行交互,得到新的真实轨迹;
9.根据权利要求8所述的一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制系统,其特征在于,所述轨迹跟踪控制器的建立具体如下:
设表示轴距为L的车辆在离散时刻i的状态,其中{xi,yi,θi}是姿态,xi和yi分别表示世界坐标系下车辆的纵向和横向坐标,θi是车辆的航向角,φi是转向角,vi是速度,是离散时刻i的转向角变化率,控制命令由给出,其中pi是油门踏板输入,bi是制动输入,是离散时刻i的指令转向角变化率,用π表示状态转移函数f:
si+1=π(si,ui) (53)
由车辆在典型状态si下的自行车模型,车辆的动态方程π(即状态转移函数f)可由以下公式定义:
xi+1=xi+vicos(θi)Δt
yi+1=yi+visin(θi)Δt
给出一组具有速度的M个有序姿态,对它们进行三次样条插值,得到参考轨迹,对于每个状态si,将相对于该参考轨迹的误差状态ψi定义为一个9元元组 是在状态si的车辆与参考轨迹的垂向距离,是车辆相对于参考轨迹的航向误差,是对应于参考轨迹上最近点的速度误差(这里vp是参考轨迹上最近点的速度),vi,和φi来自于状态si,将误差状态ψi用于迭代线性二次型调节器的状态,从而对参考轨迹的所有误差进行编码,给定在离散时刻i的误差状态ψi和控制ui,用γ表示状态转移函数f,下一时刻的误差状态ψi+1如下式:
ψi+1=γ(ψi,ui) (55)
γ可以由以下公式定义:
在误差状态ψi下执行ui的成本l(ψi,ui)如下:
其中,A和B是对角权重矩阵,A的最后3个对角线元素为零,使(56)中的误差项趋近于零,对于状态ψi,其最终成本lf(ψi)如下所示:
将具有给定参考轨迹的车辆轨迹跟踪问题定义为去找到范围为N的最优控制序列{u0,u1,…,uN-2},从而最小化以下成本:
加上如下的约束:
10.一种车载控制设备,其特征在于,所述车载控制设备内包含权利要求6-9任一项所述的基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210627864.0A CN114995426A (zh) | 2022-06-06 | 2022-06-06 | 一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210627864.0A CN114995426A (zh) | 2022-06-06 | 2022-06-06 | 一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114995426A true CN114995426A (zh) | 2022-09-02 |
Family
ID=83031702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210627864.0A Pending CN114995426A (zh) | 2022-06-06 | 2022-06-06 | 一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114995426A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115657689A (zh) * | 2022-12-26 | 2023-01-31 | 安徽大学 | 一种基于轨迹预测的自主水下航行器目标跟踪控制方法 |
-
2022
- 2022-06-06 CN CN202210627864.0A patent/CN114995426A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115657689A (zh) * | 2022-12-26 | 2023-01-31 | 安徽大学 | 一种基于轨迹预测的自主水下航行器目标跟踪控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111845774B (zh) | 一种基于横纵向协调的自动驾驶汽车动态轨迹规划及跟踪方法 | |
CN111258323B (zh) | 一种智能车辆轨迹规划与跟踪的联合控制方法 | |
Gao et al. | Robust lateral trajectory following control of unmanned vehicle based on model predictive control | |
CN110568760A (zh) | 适用于换道及车道保持的参数化学习决策控制系统及方法 | |
CN114379583B (zh) | 一种基于神经网络动力学模型的自动驾驶车辆轨迹跟踪系统及方法 | |
CN108717268A (zh) | 基于最优控制与安全距离的自动驾驶最速操纵控制系统及其控制方法 | |
Huang et al. | Human-machine cooperative trajectory planning and tracking for safe automated driving | |
CN113467470B (zh) | 一种无人自主小车的轨迹跟踪控制方法 | |
Na et al. | Experimental evaluation of a game-theoretic human driver steering control model | |
CN114942642A (zh) | 一种无人驾驶汽车轨迹规划方法 | |
Farag | Complex-track following in real-time using model-based predictive control | |
CN115303289A (zh) | 一种基于深度高斯车辆动力学模型、训练方法、智能汽车轨迹跟踪控制方法及终端设备 | |
Khalifa et al. | Vehicles platooning in urban environment: Consensus-based longitudinal control with limited communications capabilities | |
CN114995426A (zh) | 一种基于神经网络动力学模型的无人驾驶车辆轨迹跟踪控制方法、系统及车载控制设备 | |
Filip | Trajectory tracking for autonomous vehicles | |
CN113184040B (zh) | 一种基于驾驶人转向意图的无人车线控转向控制方法及系统 | |
CN114779641A (zh) | 基于新航向误差定义的环境自适应mpc路径追踪控制方法 | |
Pagot et al. | Fast Planning and Tracking of Complex Autonomous Parking Maneuvers With Optimal Control and Pseudo-Neural Networks | |
Fehér et al. | Proving ground test of a ddpg-based vehicle trajectory planner | |
CN111857112B (zh) | 一种汽车局部路径规划方法及电子设备 | |
Kovacs et al. | Integrated path planning and lateral-longitudinal control for autonomous electric vehicles | |
Huang et al. | A data-based lane-keeping steering control for autonomous vehicles: A human-in-the-loop approach | |
CN112596516B (zh) | 基于Dubins曲线的多车队形切换方法 | |
CN114291112A (zh) | 一种应用于自动驾驶汽车的决策规划协同增强方法 | |
Baumgart et al. | Hybrid Optimal Traffic Control: Combining Model-Based and Data-Driven Approaches. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |