CN114779641A - 基于新航向误差定义的环境自适应mpc路径追踪控制方法 - Google Patents
基于新航向误差定义的环境自适应mpc路径追踪控制方法 Download PDFInfo
- Publication number
- CN114779641A CN114779641A CN202210455014.7A CN202210455014A CN114779641A CN 114779641 A CN114779641 A CN 114779641A CN 202210455014 A CN202210455014 A CN 202210455014A CN 114779641 A CN114779641 A CN 114779641A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- control
- time domain
- path tracking
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Abstract
本发明提供了一种基于新航向误差定义的环境自适应MPC路径追踪控制方法,该方法基于新的航向误差定义建立车辆状态空间模型并构建模型预测控制MPC路径追踪控制策略,并利用强化学习算法DQN优化模型预测控制MPC的预测时域和控制时域;实现减小追踪误差,提升路径追踪精度。
Description
技术领域
本发明涉及智能驾驶路径追踪控制技术领域,特别是一种基于新航向误差定义的环境自适应MPC路径追踪控制方法。
背景技术
随着定位系统,识别系统和控制系统的发展,智能汽车以及成为了未来汽车发展的主要趋势。轨迹追踪作为智能汽车的核心技术之一,其目标是保证在不同的行驶环境下车辆能够稳定准确地沿着目标路径行驶。
MPC因在处理多输入多输出系统和非线性系统方面具有独特优势,是被广泛使用的一种路径追踪控制方法。它通过预测未来一段时间内的车辆状态来求解出前轮转角,以实现在预测时间内的追踪误差最小。车辆的航向控制实际上应该是控制车辆的实际车速方向与目标路径点的切向方向保持一致,但传统的MPC路径追踪方法的航向误差定义是控制车辆的纵轴方向与目标路径点的切向方向保持一致,这将导致MPC算法在求解前轮转角时难以保证横向误差和航向误差同时收敛到一个较小值。
发明内容
有鉴于此,本发明的目的在于提供一种基于新航向误差定义的环境自适应MPC路径追踪控制方法,实现减小追踪误差,提升路径追踪精度。
为实现上述目的,本发明采用如下技术方案:基于新航向误差定义的环境自适应MPC路径追踪控制方法,该方法基于新的航向误差定义建立车辆状态空间模型并构建模型预测控制MPC路径追踪控制策略,并利用强化学习算法DQN优化模型预测控制MPC的预测时域和控制时域;
包括以下步骤:
步骤1:建立基于模型预测控制MPC算法的路径追踪控制策略,具体包括以下几个子步骤;
步骤2:利用强化学习优化得到预测时域和控制时域与曲率半径和车速的映射关系;
步骤3:训练的智能体根据不同的状态值选择相应的动作输出,然后利用步骤1中路径追踪控制策略计算出前轮转角作用于车轮,控制车辆运动。
在一较佳的实施例中,步骤1.1:基于新航向误差定义建立车辆状态空间模型:
x为车辆的状态矩阵,u是控制量,即前轮转角δ,y是输出矩阵;A,B,C是系数矩阵;cf和cr是车辆前后轮的侧偏刚度,lf和lr分别是前轴和后轴到质心的距离,vx和vy分别是车辆纵向和横向的速度,θ是车辆的航向角且满足 是车辆横摆角,β是车辆的质心侧偏角,是车辆横摆角速度,Y是大地坐标系下的车辆横向位置,m是车辆质量,Iz是车辆转动惯量;
步骤1.2:利用前向欧拉法将公式(1.1)的连续状态空间模型离散化:
式中Ak=Im+TA,Bk=TB,Ck=[C 0p×q],q=m+n,m为控制量个数,n是状态量个数,p是输出量个数,T是采样时间;
步骤1.3:将公式(1.2)中的离散状态空间改写成:
步骤1.4:设置系统的预测时域为Np,控制时域为Nc,预测时域内的状态序列由以下形式表示:
ξn(k+1)=Anξn(k)+BnΔu(k)
步骤1.5、预测时域内的输出序列表示为:
步骤1.6:结合上述的状态序列和输出序列,得到一组新的状态空间矩阵:
式中ξ0(k)=ξn(k),ΔU0(k)=[Δu(k) Δu(k+1)···Δu(k+Nc-1)]T
步骤1.7:建立目标函数:
目标函数的第一项由两个量组成,全局坐标系下的横向位置误差和航向角误差;第二项则是控制量的增量,即汽车前轮转角的增量;QQ,RR是权重矩阵;对系统的状态量、控制量以及质心侧偏角进行约束:
ymin≤y(k)≤ymax,θmin≤θ(k)≤θmax,Δumin≤Δu(k)≤Δumax,|β(k)|<0.02μg
式中μ是路面附着系数,g是重力加速度;
步骤1.8:将价值函数(1.7)改写成一个标准的二次规划问题:
步骤1.9:在每一个优化周期内,优化目标为minJ,得到控制时域内的控制变量的增量:
ΔU(k)=[Δu(k),Δu(k+1),...Δu(k+Nc-1)] (1.9)
步骤1.10:选取控制序列(1.9)的第一个元素作为实际的控制变量作用于车辆;最终的目标转角u(k)为:
u(k)=u(k-1)+Δu(k) (1.10)。
在一较佳的实施例中,所述步骤2具体包括以下几个子步骤:
步骤2.1:基于步骤1所述的路径追踪控制策略建立Simulink仿真模型;
步骤2.2:构建不同曲率半径和车速驾驶场景作为Simulink仿真模型的参考输入,参考路径的数学模型表达为以下形式:
其中X是全局坐标系下的横坐标,L是设置的直线路径长度;
步骤2.3:回报函数定义为某一时间步长ΔT内横向位置误差与航向位置误差加权平方和的负数,表示为:
式中a、b是权重系数,e1(t)是横向位置误差,e2(t)是航向误差;
步骤2.4:以纵向车速vx和道路曲率半径R为状态值,reward为回报函数,预测时域Np和控制时域Nc作为动作输出,训练DQN智能体来优化Np和Nc。
在一较佳的实施例中,所述步骤3具体包括以下几个子步骤:
步骤3.1:获取车辆状态信息和上层路径规划信息;
步骤3.2:根据预瞄距离计算出预瞄点的位置信息;其中预瞄距离是一个与车速相关的变量,满足关系Ld=kvx+d;
式中Ld是预瞄距离,k是预瞄距离系数,vx是纵向车速,d是初始预瞄距离;
步骤3.3:计算出预瞄距离内规划路径的最小曲率半径Rmin;
步骤3.4:强化学习智能体根据状态值选择相应的动作输出;
步骤3.5:将步骤3.1中获得的车辆状态信息、规划路径信息和步骤3.4中获得的Np和Nc代入路径追踪控制策略,求解出前轮转向角,控制车辆运动。
与现有技术相比,本发明具有以下有益效果:
解决了传统航向误差定义下横向位置误差和航向误差难以同时收敛到一个较小值的问题,提升了路径追踪精度。此外,该方法还能够根据道路情况和车速信息实时调整模型预测控制算法的预测时域和控制时域,进而提升智能车辆对不同驾驶场景的环境自适应性。相较于传统航向误差定义下的MPC路径追踪控制方法,该方法在转向过程中具有更高的路径追踪精度;相较于固定预测时域和控制时域的路径追踪控制方法。
附图说明
图1为本发明优选实施例使用的简化的车辆模型示意图;
图2为统航向角与实际航向角的示意图;
图3为本发明优选实施例的优化预测时域和控制时域的流程图;
图4为本发明优选实施例的智能驾驶路径追踪控制方法流程图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式;如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
基于新航向误差定义的环境自适应MPC路径追踪控制方法,该方法基于新的航向误差定义建立车辆状态空间模型并构建模型预测控制MPC路径追踪控制策略,并利用强化学习算法DQN优化模型预测控制MPC的预测时域和控制时域;参考图1至4,包括以下步骤:
步骤1:建立基于模型预测控制MPC算法的路径追踪控制策略,步骤包括:
x为车辆的状态矩阵,u是控制量,即前轮转角δ,y是输出矩阵。A,B,C是系数矩阵。cf和cr是车辆前后轮的侧偏刚度,lf和lr分别是前轴和后轴到质心的距离,vx和vy分别是车辆纵向和横向的速度,θ是车辆的航向角且满足 是车辆横摆角,β是车辆的质心侧偏角,是车辆横摆角速度,Y是大地坐标系下的车辆横向位置,m是车辆质量,Iz是车辆转动惯量。
步骤1.2:使用前向欧拉离散法将连续状态空间模型离散化:
其中Ak=Im+TA,Bk=TB,Ck=[C 0p×q],q=m+n,m为控制量个数,n是状态量个数,p是输出量个数,T是采样时间。
步骤1.3:将步骤1.2中的状态空间模型改写成:
步骤1.4:设置系统的预测时域为Np,控制时域为Nc,那么预测时域内的状态序列可由以下形式表示:
ξn(k+1)=Anξn(k)+BnΔu(k)
步骤1.5:预测时域内的输出序列可以表示为:
步骤1.6:结合步骤1.5中的状态序列和输出序列,得到一组新的状态空间矩阵:
其中ξ0(k)=ξn(k)ΔU0(k)=[Δu(k)Δu(k+1)···Δu(k+Nc-1)]T
步骤1.7:建立目标函数:
步骤1.8:目标函数的第一项由两个量组成,大地坐标系下的横向位置和横摆角,这一项主要反映汽车轨迹追踪的精度问题;第二项则是控制量的增量,即汽车前轮转角的增量,该项反映了车辆路径追踪时的平稳性。QQ,RR是权重矩阵。同时,考虑实际车辆特性,还需要对系统的状态量和控制量进行一定的约束:
ymin≤y(k)≤ymax,θmin≤θ(k)≤θmax,Δumin≤Δu(k)≤Δumax,|β(k)|<0.02μg
其中μ是路面附着系数,g是重力加速度。
步骤1.9:将价值函数改写成一个标准的二次规划问题:
步骤1.10:在每一个优化周期内,优化目标为minJ,得到控制时域内的控制变量的增量序列:
ΔU=[Δu(k),Δu(k+1),…,Δu(k+Nc-1)]
步骤1.11:取步骤1.10中增量序列的第一个元素作为实际的控制变量作用于车辆。最终的目标转角u(k)为:u(k)=u(k-1)+Δu(k)。
步骤2:利用强化学习建立预测时域和控制时域与车速和道路曲率半径之间的映射关系,以实现预测时域和控制时域的自适应调整,具体步骤包括:
步骤2.1:基于步骤1所述的路径追踪控制策略建立Simulink模型。另外,为了保证仿真结果的可靠性,路径追踪控制策略的对象采用具有高精度的Carsim车辆模型;
步骤2.2:根据国家公路设计规范JTG D20-2017,构建不同曲率半径和车速驾驶场景(见表1)作为Simulink仿真模型的参考输入。参考路径的数学模型可表达为以下形式:
其中X是全局坐标系下的横坐标,L是设置的直线路径长度;
回报函数定义为某一时间步长ΔT内横向位置误差与航向位置误差加权平方和的负数,表示为:
其中a、b是权重系数,e1(t)是横向位置误差,e2(t)是航向误差;
骤2.3:以实际纵向车速Vx和道路曲率半径R为状态值,预测时域和控制时域作为动作输出,训练DQN智能体来优化预测时域和控制时域。
步骤3:智能体根据不同的状态值(Vx,R)选择相应的动作输出(Np,Nc),然后利用步骤1中所述的路径追踪控制策略计算出前轮转角作用于车轮,控制车辆运动。步骤包括:
步骤3.1:获取车辆状态信息和上层路径规划信息;
步骤3.2:根据预瞄距离计算出预瞄点的位置信息。其中预瞄距离是一个与车速相关的变量,满足关系Ld=kv+d;
步骤3.3:计算出预瞄距离内规划路径的最小曲率半径Rmin;
步骤3.4:强化学习智能体根据状态量(vx,Rmin)选择相应的动作输出(Np,Nc);
步骤3.5:将车辆状态信息、规划路径信息和步骤3.4中获得的Np和Nc代入路径追踪控制策略,求解出前轮转向角,控制车辆运动。
表1国家公路设计规范JTG D20-2017圆曲线最小半径
Claims (4)
1.基于新航向误差定义的环境自适应MPC路径追踪控制方法,其特征在于,该方法基于新的航向误差定义建立车辆状态空间模型并构建模型预测控制MPC路径追踪控制策略,并利用强化学习算法DQN优化模型预测控制MPC的预测时域和控制时域;
包括以下步骤:
步骤1:建立基于模型预测控制MPC算法的路径追踪控制策略,具体包括以下几个子步骤;
步骤2:利用强化学习优化得到预测时域和控制时域与曲率半径和车速的映射关系;
步骤3:训练的智能体根据不同的状态值选择相应的动作输出,然后利用步骤1中路径追踪控制策略计算出前轮转角作用于车轮,控制车辆运动。
2.根据权利要求1所述的基于新航向误差定义的环境自适应MPC路径追踪控制方法,其特征在于,
步骤1.1:基于新航向误差定义建立车辆状态空间模型:
x为车辆的状态矩阵,u是控制量,即前轮转角δ,y是输出矩阵;A,B,C是系数矩阵;cf和cr是车辆前后轮的侧偏刚度,lf和lr分别是前轴和后轴到质心的距离,vx和vy分别是车辆纵向和横向的速度,θ是车辆的航向角且满足 是车辆横摆角,β是车辆的质心侧偏角,是车辆横摆角速度,Y是大地坐标系下的车辆横向位置,m是车辆质量,Iz是车辆转动惯量;
步骤1.2:利用前向欧拉法将公式(1.1)的连续状态空间模型离散化:
式中Ak=Im+TA,Bk=TB,Ck=[C 0p×q],q=m+n,m为控制量个数,n是状态量个数,p是输出量个数,T是采样时间;
步骤1.3:将公式(1.2)中的离散状态空间改写成:
步骤1.4:设置系统的预测时域为Np,控制时域为Nc,预测时域内的状态序列由以下形式表示:
步骤1.5、预测时域内的输出序列表示为:
步骤1.6:结合上述的状态序列和输出序列,得到一组新的状态空间矩阵:
式中ξ0(k)=ξn(k),ΔU0(k)=[Δu(k) Δu(k+1) ··· Δu(k+Nc-1)]T
步骤1.7:建立目标函数:
目标函数的第一项由两个量组成,全局坐标系下的横向位置误差和航向角误差;第二项则是控制量的增量,即汽车前轮转角的增量;QQ,RR是权重矩阵;对系统的状态量、控制量以及质心侧偏角进行约束:
ymin≤y(k)≤ymax,θmin≤θ(k)≤θmax,Δumin≤Δu(k)≤Δumax,|β(k)|<0.02μg
式中μ是路面附着系数,g是重力加速度;
步骤1.8:将价值函数(1.7)改写成一个标准的二次规划问题:
步骤1.9:在每一个优化周期内,优化目标为minJ,得到控制时域内的控制变量的增量:
ΔU(k)=[Δu(k),Δu(k+1),...Δu(k+Nc-1)] (1.9)
步骤1.10:选取控制序列(1.9)的第一个元素作为实际的控制变量作用于车辆;最终的目标转角u(k)为:
u(k)=u(k-1)+Δu(k) (1.10)。
3.根据权利要求1所述的基于新航向误差定义的环境自适应MPC路径追踪控制方法,其特征在于,所述步骤2具体包括以下几个子步骤:
步骤2.1:基于步骤1所述的路径追踪控制策略建立Simulink仿真模型;
步骤2.2:构建不同曲率半径和车速驾驶场景作为Simulink仿真模型的参考输入,参考路径的数学模型表达为以下形式:
其中X是全局坐标系下的横坐标,L是设置的直线路径长度;
步骤2.3:回报函数定义为某一时间步长ΔT内横向位置误差与航向位置误差加权平方和的负数,表示为:
式中a、b是权重系数,e1(t)是横向位置误差,e2(t)是航向误差;
步骤2.4:以纵向车速vx和道路曲率半径R为状态值,reward为回报函数,预测时域Np和控制时域Nc作为动作输出,训练DQN智能体来优化Np和Nc。
4.根据权利要求1所述的基于新航向误差定义的环境自适应MPC路径追踪控制方法,其特征在于,所述步骤3具体包括以下几个子步骤:
步骤3.1:获取车辆状态信息和上层路径规划信息;
步骤3.2:根据预瞄距离计算出预瞄点的位置信息;其中预瞄距离是一个与车速相关的变量,满足关系Ld=kvx+d;
式中Ld是预瞄距离,k是预瞄距离系数,vx是纵向车速,d是初始预瞄距离;
步骤3.3:计算出预瞄距离内规划路径的最小曲率半径Rmin;
步骤3.4:强化学习智能体根据状态值选择相应的动作输出;
步骤3.5:将步骤3.1中获得的车辆状态信息、规划路径信息和步骤3.4中获得的Np和Nc代入路径追踪控制策略,求解出前轮转向角,控制车辆运动。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210455014.7A CN114779641A (zh) | 2022-04-27 | 2022-04-27 | 基于新航向误差定义的环境自适应mpc路径追踪控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210455014.7A CN114779641A (zh) | 2022-04-27 | 2022-04-27 | 基于新航向误差定义的环境自适应mpc路径追踪控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114779641A true CN114779641A (zh) | 2022-07-22 |
Family
ID=82433639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210455014.7A Pending CN114779641A (zh) | 2022-04-27 | 2022-04-27 | 基于新航向误差定义的环境自适应mpc路径追踪控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114779641A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116118751A (zh) * | 2023-04-19 | 2023-05-16 | 深圳佑驾创新科技有限公司 | 车辆的控制方法、装置、车辆和存储介质 |
-
2022
- 2022-04-27 CN CN202210455014.7A patent/CN114779641A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116118751A (zh) * | 2023-04-19 | 2023-05-16 | 深圳佑驾创新科技有限公司 | 车辆的控制方法、装置、车辆和存储介质 |
CN116118751B (zh) * | 2023-04-19 | 2023-08-29 | 深圳佑驾创新科技有限公司 | 车辆的控制方法、装置、车辆和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110568760B (zh) | 适用于换道及车道保持的参数化学习决策控制系统及方法 | |
Lin et al. | Trajectory tracking of autonomous vehicle with the fusion of DYC and longitudinal–lateral control | |
CN112622903B (zh) | 一种车辆跟随驾驶环境下自主车辆的纵向和横向控制方法 | |
CN111845774A (zh) | 一种基于横纵向协调的自动驾驶汽车动态轨迹规划及跟踪方法 | |
CN111538328B (zh) | 一种用于自主驾驶车辆避障轨迹规划与跟踪控制的优先级分层预测控制方法 | |
Ge et al. | Numerically stable dynamic bicycle model for discrete-time control | |
CN108791290B (zh) | 基于在线增量式dhp的双车协同自适应巡航控制方法 | |
CN114945885A (zh) | 自主或半自主车辆的自适应控制 | |
CN111930015B (zh) | 一种无人车控制方法及装置 | |
CN109808707A (zh) | 一种基于随机模型预测的汽车转向控制方法及控制器 | |
CN114379583A (zh) | 一种基于神经网络动力学模型的自动驾驶车辆轨迹跟踪系统及方法 | |
CN114967676A (zh) | 基于强化学习的模型预测控制轨迹跟踪控制系统及方法方法 | |
CN113009829B (zh) | 一种智能网联车队纵横向耦合控制方法 | |
CN110217227A (zh) | 一种适用于冰雪道路工况的转向制动联合避撞控制方法 | |
Zhu et al. | An adaptive path tracking method for autonomous land vehicle based on neural dynamic programming | |
CN113465625B (zh) | 局部路径规划方法和装置 | |
CN114779641A (zh) | 基于新航向误差定义的环境自适应mpc路径追踪控制方法 | |
Fu et al. | Nmpc-based path tracking control strategy for autonomous vehicles with stable limit handling | |
CN114684199A (zh) | 一种机理分析-数据驱动的车辆动力学串联混合模型、智能汽车轨迹跟踪控制方法及控制器 | |
CN114442630A (zh) | 一种基于强化学习和模型预测的智能车规划控制方法 | |
CN116560223A (zh) | 一种基于物理信息神经网络的智能车辆动力学模型、ilqr控制算法及轨迹跟踪控制器 | |
CN115447615A (zh) | 基于车辆运动学模型预测控制的轨迹优化方法 | |
CN115598983A (zh) | 一种考虑时变时延的无人车横纵向协同控制方法及装置 | |
CN113635900B (zh) | 一种预测巡航过程中基于能量管理的换道决策控制方法 | |
Fehér et al. | Proving ground test of a ddpg-based vehicle trajectory planner |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |