CN113253605A - 基于ddpg参数优化的自抗扰无人驾驶横向控制方法 - Google Patents

基于ddpg参数优化的自抗扰无人驾驶横向控制方法 Download PDF

Info

Publication number
CN113253605A
CN113253605A CN202110549393.1A CN202110549393A CN113253605A CN 113253605 A CN113253605 A CN 113253605A CN 202110549393 A CN202110549393 A CN 202110549393A CN 113253605 A CN113253605 A CN 113253605A
Authority
CN
China
Prior art keywords
disturbance rejection
active disturbance
vehicle
front wheel
unmanned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110549393.1A
Other languages
English (en)
Inventor
陈章勇
朱鑫彤
陈勇
冯晨晨
陈根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110549393.1A priority Critical patent/CN113253605A/zh
Publication of CN113253605A publication Critical patent/CN113253605A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B11/00Automatic controllers
    • G05B11/01Automatic controllers electric
    • G05B11/36Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
    • G05B11/42Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Steering Control In Accordance With Driving Conditions (AREA)

Abstract

本发明公开了一种基于DDPG参数优化的自抗扰无人驾驶横向控制方法,其包括以下步骤:S1、构建车辆动力学模型,获取前轮转角和横摆角速度的微分方程;S2、获取串联积分型形式下的前轮转角和横摆角速度的微分方程;S3、获取自抗扰控制器输出的前轮转角;S4、采用深度确定性策略梯度算法优化自抗扰控制器在非线性状态误差反馈率环节中的参数,完成自抗扰无人驾驶横向控制。本发明设计自抗扰控制器来实现对无人驾驶汽车的横向控制,并通过DDPG对自抗扰控制器中的参数进行优化,可以提高无人驾驶的跟踪控制效果,对模型的依赖性小,扰动抑制效果好,对系统运行环境的不确定性有很强的适应性。

Description

基于DDPG参数优化的自抗扰无人驾驶横向控制方法
技术领域
本发明涉及汽车无人驾驶领域,具体涉及一种基于DDPG参数优化的自抗扰无人驾驶横向控制方法。
背景技术
随着现代科技和人工智能技术的发展,无人驾驶技术得到了越来越快的发展,对交通运输行业产生了深远的影响。
无人驾驶控制系统模拟人类的驾驶方式,由传感器、控制器、执行器组成,与感知、决策和执行的三个功能模块相对应。无人驾驶控制技术是在环境感知技术的基础之上,根据决策规划得到目标轨迹,通过纵向和横向两个方向的控制系统配合使无人驾驶汽车能够按照目标轨迹准确稳定地行驶。无人驾驶控制技术的核心是车辆的纵向控制和横向控制。纵向控制,是在车辆运行方向上的控制,也即车辆的驱动与制动,对应于驱动电机、发动机、传动和制动系统的控制;横向控制,是在垂直于车辆运动方向上的控制,也即车辆的转向,对应于方向盘角度的调整以及轮胎力的控制。实现了纵向和横向自动控制,就可以按照给定目标轨迹和约束自动控制汽车运行。
对于纵向和横向控制,目前在无人驾驶领域所用到的控制方法主要包括传统的PID控制、线性控制方法,包括线性二次调节器控制(Linear Quadratic Regulator,LQR)等,非线性控制方法,包括模型预测控制(Model Predictive Control,MPC)、滑模控制和自适应控制等。传统的PID控制方法虽然简单,但依赖于实时误差测量,无法处理复杂的系统。其他的控制方法虽然也有不错的控制效果,但大多数都需要建立非常精确的数学模型,或者需要非常大的实时计算量,然而对于无人驾驶领域,车辆本身的建模非常复杂,存在高度的非线性,同时行驶环境也存在着很强的不确定性,因而在工程运用上有一定的难度和挑战。
自抗扰控制(Active disturbance rejection control,ADRC)旨在解决经典PID控制的缺陷,引入现代控制理论中的状态观测器的思想,核心思想在于将系统模型的未知性、参数的不确定性所造成的“内扰”和系统外部运行环境的所造成的“外扰”统称为“总扰动”,通过扩张观测器(Extended State Observe,ESO)进行观测并通过控制律予以消除。自抗扰控制的优势在于对模型的依赖性小,对外界不确定性有很强的适应性,具有优良的控制跟踪特性,已经得到了广泛的应用。但同时,自抗扰控制也面临着参数较多、配置复杂的问题,因此,自抗扰控制器的参数优化仍然是其应用所需要解决的关键问题之一,对于其控制性能的改善和应用的推广有着至关重要的作用和意义。
发明内容
针对现有技术中的上述不足,本发明提供的基于DDPG参数优化的自抗扰无人驾驶横向控制方法解决了现有自抗扰横向控制效果差的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于DDPG参数优化的自抗扰无人驾驶横向控制方法,其包括以下步骤:
S1、构建车辆动力学模型,获取前轮转角和横摆角速度的微分方程;
S2、获取串联积分型形式下的前轮转角和横摆角速度的微分方程;
S3、构建自抗扰控制器,基于串联积分型形式下的前轮转角和横摆角速度的微分方程,将期望横摆角速度作为自抗扰控制器的输入,获取自抗扰控制器输出的前轮转角;
S4、将自抗扰控制器输出的前轮转角作为车辆横向控制系统的输入,并采用深度确定性策略梯度算法优化自抗扰控制器在非线性状态误差反馈率环节中的参数,完成自抗扰无人驾驶横向控制。
进一步地,步骤S1的具体方法为:
根据公式:
Figure BDA0003074795710000031
构建车辆动力学模型的微分方程;其中δF为前轮转角;ω为横摆角速度;
Figure BDA0003074795710000032
为横摆角速度ω的一阶导数;lF为前轴中心到车辆质心的距离;CF为前轮胎的侧偏刚度;lR为后轴中心到车辆质心的距离;CR为后轮胎的侧偏刚度;IZ为车辆绕z轴的转动惯量;Vx为车辆纵向速度;β为车辆的侧偏角;
Figure BDA0003074795710000033
为β的一阶导数;M为车身的质量;
根据公式:
Figure BDA0003074795710000034
Figure BDA0003074795710000035
获取前轮转角与横摆角速度的微分方程;其中a1、a2、b1和b2均为中间参数;
Figure BDA0003074795710000036
为δF的一阶导数;
Figure BDA0003074795710000037
Figure BDA0003074795710000038
的一阶导数,即ω的二阶导数;L为前轴到后轴的距离。
进一步地,步骤S2的具体方法为:
根据公式:
Figure BDA0003074795710000041
将前轮转角和横摆角速度的微分方程转化为串联积分型数据;其中:
Figure BDA0003074795710000042
x1和x2均为车辆横向控制系统的状态变量,x1为横摆角速度,x2为横摆角速度的一阶导数,x3和F(·)均表示车辆横向控制系统总扰动,包括已经建模、未建模部分以及外部扰动的总和;f(·)为F(·)的导数;y为车辆横向控制系统的输出,即横摆角速度;车辆横向控制系统的输入为前轮转角。
进一步地,步骤S3的具体方法包括以下子步骤:
S3-1、根据公式:
Figure BDA0003074795710000043
构建非线性最速综合函数fst(·);其中m、n、r和h0均为非线性最速综合函数fst(·)的输入变量;r为速度因子,决定跟踪速度;h0为滤波因子;d、d0、y1、a0、a和fst均为非线性最速综合函数fst(·)的中间运算值;fh1为非线性最速综合函数fst(·)的输出值;sgn(·)为sgn函数;
S3-2、根据公式:
Figure BDA0003074795710000051
建立跟踪微分器,获取期望横摆角速度为v0时的跟踪信号v1和微分信号v2;其中v0(k)表示k时刻的期望横摆角速度;v1(k)表示k时刻的跟踪信号;v2(k)表示k时刻的微分信号;v2(k+1)表示k+1时刻的微分信号;v1(k+1)表示k+1时刻的跟踪信号;h为积分步长;
S3-3、根据公式:
Figure BDA0003074795710000052
构建非线性函数fal(·);其中α、δ和e均为非线性函数fal(·)的输入;
S3-4、根据公式:
Figure BDA0003074795710000053
构建扩张观测器,分别采用z1、z2和z3来估计车辆横向控制系统的第一状态变量x1、第二状态变量x2和作用于车辆横向控制系统的总扰动x3;其中ε1为中间参数;z1(k)为k时刻的第一状态变量;y(k)为自抗扰控制器在k时刻的输出;z1(k+1)为k+1时刻的第一状态变量;z2(k)为k时刻的第二状态变量;β01为常数;z2(k+1)为k+1时刻的第二状态变量;z3(k)为k时刻的总扰动;β02为常数;b0为常数;z3(k+1)为k+1时刻的总扰动;β03为常数;
S3-5、根据公式:
Figure BDA0003074795710000061
采用非线性状态误差反馈率获取误差控制量u0;其中e1为中间参数;ζ1、ζ2、α1和α2均为非线性状态误差反馈率环节中的参数,即常数;
S3-6、根据公式:
Figure BDA0003074795710000062
获取自抗扰控制器输出的前轮转角
Figure BDA0003074795710000063
进一步地,步骤S4中采用深度确定性策略梯度算法优化自抗扰控制器在非线性状态误差反馈率环节中的参数的具体方法包括以下子步骤:
S4-1、建立当前状态st,初始化深度确定性策略梯度算法中的Critic网络、Actor网络、目标Critic网络和目标Actor网络;初始化经验缓存R;
S4-2、初始化随机噪声Nt,并通过Actor网络产生引入随机噪声Nt的动作at
S4-3、根据公式:
Figure BDA0003074795710000064
对自抗扰控制器在非线性状态误差反馈率环节中的参数ζ1和ζ2进行更新;其中ζ01和ζ02分别为参数ζ1和ζ2的当前值,
Figure BDA0003074795710000065
Figure BDA0003074795710000066
为对ζ01和ζ02更新后得到的值;d1和d2为常数;
S4-4、获取并根据参数
Figure BDA0003074795710000067
Figure BDA0003074795710000068
对自抗扰控制器性能的影响,得到对应的奖励rt和下一个状态st+1
S4-5、将状态动作组合(st,at,rt,st+1)存储到经验缓存R中;
S4-6、对经验缓存R进行随机采样,得到N个状态动作组合,并计算每个动作期望回报;
S4-7、采用最小化损失函数对Critic网络参数进行更新;采用策略梯度对Actor网络参数进行更新;更新目标Critic网络参数和目标Actor网络参数;
S4-8、判断是否终止自抗扰无人驾驶横向控制,若是则结束;否则基于当前的Critic网络、Actor网络、目标Critic网络和目标Actor网络并返回步骤S4-2。
本发明的有益效果为:本方法设计自抗扰控制器来实现对无人驾驶汽车的横向控制,并通过DDPG对自抗扰控制器中的参数进行优化,可以提高无人驾驶的跟踪控制效果,对模型的依赖性小,扰动抑制效果好,对系统运行环境的不确定性有很强的适应性。
附图说明
图1为本方法的流程示意图;
图2为车辆动力学模型;
图3为车辆横向控制系统框图;
图4为自抗扰控制器的结构示意图;
图5为DDPG算法和系统框图;
图6为跟踪正弦参考输入,传统ADRC与本发明的仿真结果对比。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该基于DDPG参数优化的自抗扰无人驾驶横向控制方法包括以下步骤:
S1、构建车辆动力学模型,获取前轮转角和横摆角速度的微分方程;
S2、获取串联积分型形式下的前轮转角和横摆角速度的微分方程;
S3、构建自抗扰控制器,基于串联积分型形式下的前轮转角和横摆角速度的微分方程,将期望横摆角速度作为自抗扰控制器的输入,获取自抗扰控制器输出的前轮转角;
S4、将自抗扰控制器输出的前轮转角作为车辆横向控制系统的输入,并采用深度确定性策略梯度算法优化自抗扰控制器在非线性状态误差反馈率环节中的参数,完成自抗扰无人驾驶横向控制。
步骤S1的具体方法为:汽车的动力学模型旨在研究汽车在各种力的作用下的动态响应特性。然而,在实际应用中,如果对汽车所有的受力进行分析,将会大大增加模型的复杂度,增加控制算法的运行负担,因而无法保证控制的实时性。因此,需要在保证其动力学特性的前提下,尽可能的简化车辆模型的复杂程度。在简化的车辆模型中,将两个前轮和两个后轮组合成单个前轮和后轮,简化成二自由度车辆模型,如图2所示,并做出如下假设:忽略转向系统和悬架的影响;保持车辆的纵向速度恒定,只需考虑车辆沿y轴的横向运动及绕z轴的横摆运动;忽略横向和纵向的空气动力学带来的影响;在分析轮胎受力情况时,仅仅考虑轮胎的侧偏特性XOY坐标系是固定静止的大地坐标系。xoy为车身坐标系,车身坐标系随着车身的运动而变化。对模型进行y轴和z轴受力分析:
Figure BDA0003074795710000091
M为车身的质量,ay为基于车身坐标系下的车辆沿y轴方向加速度,FCF和FCR分别为车辆的前轮和后轮所受到的横向轮胎力,δF为前轮转角,ω为横摆角速度,IZ为车辆绕z轴的转动惯量,lF为前轴中心到车辆质心的距离,lR为后轴中心到车辆质心的距离,Vx为车辆纵向速度。
当前轮转角δF和侧偏角β较小情况下,轮胎侧偏特性处于线性范围,即
Figure BDA0003074795710000092
其中CF和CR分别表示前、后轮胎的侧偏刚度,由于前轮和后轮各有两个,所以作用力为单个轮胎所受力的2倍。αF和αR分别为前、后轮胎的侧滑角,在小角度下,两个角的大小可近似表示为:
Figure BDA0003074795710000093
综合以上各式,可得车辆动力学模型的微分方程:
Figure BDA0003074795710000094
在车辆实际运动过程中,车辆的横摆角速度是衡量车辆横向运动稳定性的重要参数,因此,本发明将车辆的实际横摆角速度ω作为控制目标,通过设计自抗扰控制器,跟踪期望横摆角速度ωdes,根据车辆的动力学特性,通过控制车辆的前轮转角δF实现横摆角速度ω的跟踪控制,车辆横向控制系统框图如图3所示。
其中,期望横摆角速度ωdes可通过下式计算得到
ωdes=vdeskdes
vdes是期望车速,kdes是期望道路曲率,二者由上层的路径规划模块设置,若路径规划期望曲线为y=f(x),则期望道路曲率kdes可表示为
Figure BDA0003074795710000101
对于被控车辆而言,横向控制的输入为前轮转角δF;输出为横摆角速度ω,根据车辆动力学模型,可得到系统输出ω和输入δF之间的方程:
Figure BDA0003074795710000102
其中,
Figure BDA0003074795710000103
其中δF为前轮转角;ω为横摆角速度;
Figure BDA0003074795710000104
为横摆角速度ω的一阶导数;lF为前轴中心到车辆质心的距离;CF为前轮胎的侧偏刚度;lR为后轴中心到车辆质心的距离;CR为后轮胎的侧偏刚度;Vx为车辆纵向速度;β为车辆的侧偏角;
Figure BDA0003074795710000105
为β的一阶导数;M为车身的质量;
根据公式:
Figure BDA0003074795710000106
Figure BDA0003074795710000111
获取前轮转角与横摆角速度的微分方程;其中a1、a2、b1和b2均为中间参数;
Figure BDA0003074795710000112
为δF的一阶导数;
Figure BDA0003074795710000113
Figure BDA0003074795710000114
的一阶导数,即ω的二阶导数;L为前轴到后轴的距离。
步骤S2的具体方法为:根据公式:
Figure BDA0003074795710000115
将前轮转角和横摆角速度的微分方程转化为串联积分型数据;其中:
Figure BDA0003074795710000116
x1和x2均为车辆横向控制系统的状态变量,x1为横摆角速度,x2为横摆角速度的一阶导数,x3和F(·)均表示车辆横向控制系统总扰动,包括已经建模、未建模部分以及外部扰动的总和;f(·)为F(·)的导数;y为车辆横向控制系统的输出,即横摆角速度;车辆横向控制系统的输入为前轮转角。
步骤S3中所构建的自抗扰控制器的结构如图4所示,获取自抗扰控制器输出的前轮转角的具体方法包括以下子步骤:
S3-1、根据公式:
Figure BDA0003074795710000121
构建非线性最速综合函数fst(·);其中m、n、r和h0均为非线性最速综合函数fst(·)的输入变量;r为速度因子,决定跟踪速度;h0为滤波因子;d、d0、y1、a0、a和fst均为非线性最速综合函数fst(·)的中间运算值;fh1为非线性最速综合函数fst(·)的输出值;sgn(·)为sgn函数;
S3-2、根据公式:
Figure BDA0003074795710000122
建立跟踪微分器,获取期望横摆角速度为v0时的跟踪信号v1和微分信号v2;其中v0(k)表示k时刻的期望横摆角速度;v1(k)表示k时刻的跟踪信号;v2(k)表示k时刻的微分信号;v2(k+1)表示k+1时刻的微分信号;v1(k+1)表示k+1时刻的跟踪信号;h为积分步长;
S3-3、根据公式:
Figure BDA0003074795710000131
构建非线性函数fal(·);其中α、δ和e均为非线性函数fal(·)的输入;
S3-4、根据公式:
Figure BDA0003074795710000132
构建扩张观测器,分别采用z1、z2和z3来估计车辆横向控制系统的第一状态变量x1、第二状态变量x2和作用于车辆横向控制系统的总扰动x3;其中ε1为中间参数;z1(k)为k时刻的第一状态变量;y(k)为自抗扰控制器在k时刻的输出;z1(k+1)为k+1时刻的第一状态变量;z2(k)为k时刻的第二状态变量;β01为常数;z2(k+1)为k+1时刻的第二状态变量;z3(k)为k时刻的总扰动;β02为常数;b0为常数;z3(k+1)为k+1时刻的总扰动;β03为常数;
S3-5、根据公式:
Figure BDA0003074795710000133
采用非线性状态误差反馈率获取误差控制量u0;其中e1为中间参数;ζ1、ζ2、α1和α2均为非线性状态误差反馈率环节中的参数,即常数;
S3-6、根据公式:
Figure BDA0003074795710000134
获取自抗扰控制器输出的前轮转角
Figure BDA0003074795710000135
DDPG算法和系统框图如图5所示,步骤S4中采用深度确定性策略梯度算法优化自抗扰控制器在非线性状态误差反馈率环节中的参数的具体方法包括以下子步骤:
S4-1、建立当前状态st,初始化深度确定性策略梯度算法中的Critic网络Q(s,a|θQ)、Actor网络μ(s,a|θμ)、目标Critic网络Q'(s,a|θQ')和目标Actor网络μ'(s,a|θμ');初始化经验缓存R;
S4-2、初始化随机噪声Nt,并通过Actor网络产生引入随机噪声Nt的动作at,at=μ(stμ)+Nt
S4-3、根据公式:
Figure BDA0003074795710000141
对自抗扰控制器在非线性状态误差反馈率环节中的参数ζ1和ζ2进行更新;其中ζ01和ζ02分别为参数ζ1和ζ2的当前值,
Figure BDA0003074795710000142
Figure BDA0003074795710000143
为对ζ01和ζ02更新后得到的值;d1和d2为常数;
S4-4、获取并根据参数
Figure BDA0003074795710000144
Figure BDA0003074795710000145
对自抗扰控制器性能的影响,得到对应的奖励rt和下一个状态st+1
S4-5、将状态动作组合(st,at,rt,st+1)存储到经验缓存R中;
S4-6、对经验缓存R进行随机采样,得到N个状态动作组合,并计算每个动作期望回报yi=ri+γQ'(si+1μ')|θQ');
S4-7、采用最小化损失函数对Critic网络参数进行更新:
Figure BDA0003074795710000146
采用策略梯度对Actor网络参数进行更新:
Figure BDA0003074795710000147
更新目标Critic网络参数和目标Actor网络参数:
Figure BDA0003074795710000151
S4-8、判断是否终止自抗扰无人驾驶横向控制,若是则结束;否则基于当前的Critic网络、Actor网络、目标Critic网络和目标Actor网络并返回步骤S4-2。
在具体实施过程中,图6为跟踪输入信号,传统ADRC自抗扰控制器与本发明的仿真结果对比,输入参考信号为正弦信号和阶跃信号的叠加,可以得出本发明提出的方法比传统ADRC自抗扰控制器对参考信号的跟踪效果好。
综上所述,本发明设计自抗扰控制器来实现对无人驾驶汽车的横向控制,并通过DDPG对自抗扰控制器中的参数进行优化,可以提高无人驾驶的跟踪控制效果,对模型的依赖性小,扰动抑制效果好,对系统运行环境的不确定性有很强的适应性。

Claims (5)

1.一种基于DDPG参数优化的自抗扰无人驾驶横向控制方法,其特征在于,包括以下步骤:
S1、构建车辆动力学模型,获取前轮转角和横摆角速度的微分方程;
S2、获取串联积分型形式下的前轮转角和横摆角速度的微分方程;
S3、构建自抗扰控制器,基于串联积分型形式下的前轮转角和横摆角速度的微分方程,将期望横摆角速度作为自抗扰控制器的输入,获取自抗扰控制器输出的前轮转角;
S4、将自抗扰控制器输出的前轮转角作为车辆横向控制系统的输入,并采用深度确定性策略梯度算法优化自抗扰控制器在非线性状态误差反馈率环节中的参数,完成自抗扰无人驾驶横向控制。
2.根据权利要求1所述的基于DDPG参数优化的自抗扰无人驾驶横向控制方法,其特征在于,步骤S1的具体方法为:
根据公式:
Figure FDA0003074795700000011
构建车辆动力学模型的微分方程;其中δF为前轮转角;ω为横摆角速度;
Figure FDA0003074795700000012
为横摆角速度ω的一阶导数;lF为前轴中心到车辆质心的距离;CF为前轮胎的侧偏刚度;lR为后轴中心到车辆质心的距离;CR为后轮胎的侧偏刚度;IZ为车辆绕z轴的转动惯量;Vx为车辆纵向速度;β为车辆的侧偏角;
Figure FDA0003074795700000013
为β的一阶导数;M为车身的质量;
根据公式:
Figure FDA0003074795700000014
Figure FDA0003074795700000021
获取前轮转角与横摆角速度的微分方程;其中a1、a2、b1和b2均为中间参数;
Figure FDA0003074795700000022
为δF的一阶导数;
Figure FDA0003074795700000023
Figure FDA0003074795700000024
的一阶导数,即ω的二阶导数;L为前轴到后轴的距离。
3.根据权利要求2所述的基于DDPG参数优化的自抗扰无人驾驶横向控制方法,其特征在于,步骤S2的具体方法为:
根据公式:
Figure FDA0003074795700000025
将前轮转角和横摆角速度的微分方程转化为串联积分型数据;其中:
Figure FDA0003074795700000026
x1和x2均为车辆横向控制系统的状态变量,x1为横摆角速度,x2为横摆角速度的一阶导数,x3和F(·)均表示车辆横向控制系统总扰动,包括已经建模、未建模部分以及外部扰动的总和;f(·)为F(·)的导数;y为车辆横向控制系统的输出,即横摆角速度;车辆横向控制系统的输入为前轮转角。
4.根据权利要求3所述的基于DDPG参数优化的自抗扰无人驾驶横向控制方法,其特征在于,步骤S3的具体方法包括以下子步骤:
S3-1、根据公式:
Figure FDA0003074795700000031
构建非线性最速综合函数fst(·);其中m、n、r和h0均为非线性最速综合函数fst(·)的输入变量;r为速度因子,决定跟踪速度;h0为滤波因子;d、d0、y1、a0、a和fst均为非线性最速综合函数fst(·)的中间运算值;fh1为非线性最速综合函数fst(·)的输出值;sgn(·)为sgn函数;
S3-2、根据公式:
Figure FDA0003074795700000032
建立跟踪微分器,获取期望横摆角速度为v0时的跟踪信号v1和微分信号v2;其中v0(k)表示k时刻的期望横摆角速度;v1(k)表示k时刻的跟踪信号;v2(k)表示k时刻的微分信号;v2(k+1)表示k+1时刻的微分信号;v1(k+1)表示k+1时刻的跟踪信号;h为积分步长;
S3-3、根据公式:
Figure FDA0003074795700000041
构建非线性函数fal(·);其中α、δ和e均为非线性函数fal(·)的输入;
S3-4、根据公式:
Figure FDA0003074795700000042
构建扩张观测器,分别采用z1、z2和z3来估计车辆横向控制系统的第一状态变量x1、第二状态变量x2和作用于车辆横向控制系统的总扰动x3;其中ε1为中间参数;z1(k)为k时刻的第一状态变量;y(k)为自抗扰控制器在k时刻的输出;z1(k+1)为k+1时刻的第一状态变量;z2(k)为k时刻的第二状态变量;β01为常数;z2(k+1)为k+1时刻的第二状态变量;z3(k)为k时刻的总扰动;β02为常数;b0为常数;z3(k+1)为k+1时刻的总扰动;β03为常数;
S3-5、根据公式:
Figure FDA0003074795700000043
采用非线性状态误差反馈率获取误差控制量u0;其中e1为中间参数;ζ1、ζ2、α1和α2均为非线性状态误差反馈率环节中的参数,即常数;
S3-6、根据公式:
Figure FDA0003074795700000044
获取自抗扰控制器输出的前轮转角
Figure FDA0003074795700000045
5.根据权利要求4所述的基于DDPG参数优化的自抗扰无人驾驶横向控制方法,其特征在于,步骤S4中采用深度确定性策略梯度算法优化自抗扰控制器在非线性状态误差反馈率环节中的参数的具体方法包括以下子步骤:
S4-1、建立当前状态st,初始化深度确定性策略梯度算法中的Critic网络、Actor网络、目标Critic网络和目标Actor网络;初始化经验缓存R;
S4-2、初始化随机噪声Nt,并通过Actor网络产生引入随机噪声Nt的动作at
S4-3、根据公式:
Figure FDA0003074795700000051
对自抗扰控制器在非线性状态误差反馈率环节中的参数ζ1和ζ2进行更新;其中ζ01和ζ02分别为参数ζ1和ζ2的当前值,
Figure FDA0003074795700000052
Figure FDA0003074795700000053
为对ζ01和ζ02更新后得到的值;d1和d2为常数;
S4-4、获取并根据参数
Figure FDA0003074795700000054
Figure FDA0003074795700000055
对自抗扰控制器性能的影响,得到对应的奖励rt和下一个状态st+1
S4-5、将状态动作组合(st,at,rt,st+1)存储到经验缓存R中;
S4-6、对经验缓存R进行随机采样,得到N个状态动作组合,并计算每个动作期望回报;
S4-7、采用最小化损失函数对Critic网络参数进行更新;采用策略梯度对Actor网络参数进行更新;更新目标Critic网络参数和目标Actor网络参数;
S4-8、判断是否终止自抗扰无人驾驶横向控制,若是则结束;否则基于当前的Critic网络、Actor网络、目标Critic网络和目标Actor网络并返回步骤S4-2。
CN202110549393.1A 2021-05-20 2021-05-20 基于ddpg参数优化的自抗扰无人驾驶横向控制方法 Pending CN113253605A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110549393.1A CN113253605A (zh) 2021-05-20 2021-05-20 基于ddpg参数优化的自抗扰无人驾驶横向控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110549393.1A CN113253605A (zh) 2021-05-20 2021-05-20 基于ddpg参数优化的自抗扰无人驾驶横向控制方法

Publications (1)

Publication Number Publication Date
CN113253605A true CN113253605A (zh) 2021-08-13

Family

ID=77182907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110549393.1A Pending CN113253605A (zh) 2021-05-20 2021-05-20 基于ddpg参数优化的自抗扰无人驾驶横向控制方法

Country Status (1)

Country Link
CN (1) CN113253605A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113671962A (zh) * 2021-08-20 2021-11-19 湘潭大学 一种无人驾驶铰接式清扫车的横向控制方法
CN113741172A (zh) * 2021-08-31 2021-12-03 江苏大学 一种基于带宽参数整定的滑移率自抗扰控制方法及控制器
CN113911103A (zh) * 2021-12-14 2022-01-11 北京理工大学 一种混合动力履带车辆速度与能量协同优化方法及系统
CN115675637A (zh) * 2022-12-28 2023-02-03 禾多科技(北京)有限公司 车辆控制方法、装置、电子设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103970137A (zh) * 2014-05-08 2014-08-06 北京理工大学 基于自抗扰的alv横向位移跟踪系统控制方法
CN109683471A (zh) * 2018-08-28 2019-04-26 杭州电子科技大学 自抗扰控制方法、装置和系统
CN112052456A (zh) * 2020-08-31 2020-12-08 浙江工业大学 基于多智能体的深度强化学习策略优化防御方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103970137A (zh) * 2014-05-08 2014-08-06 北京理工大学 基于自抗扰的alv横向位移跟踪系统控制方法
CN109683471A (zh) * 2018-08-28 2019-04-26 杭州电子科技大学 自抗扰控制方法、装置和系统
CN112052456A (zh) * 2020-08-31 2020-12-08 浙江工业大学 基于多智能体的深度强化学习策略优化防御方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LEI LIU 等: "Active Disturbance Rejection Course Control for USV Based on RBF Neural Network", 《IEEE》 *
MEYSAM GHEISARNEJAD 等: "IoT-Based DC/DC Deep Learning Power Converter Control: Real-Time Implementation", 《IEEE》 *
张斌等: "改进DDPG算法在自动驾驶中的应用", 《计算机工程与应用》 *
王烽 等: "基于自抗扰技术的智能车横向控制", 《农业装备与车辆工程》 *
闫振争 等: "自抗扰算法在无人车路径跟踪控制中的应用", 《重庆理工大学学报(自然科学)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113671962A (zh) * 2021-08-20 2021-11-19 湘潭大学 一种无人驾驶铰接式清扫车的横向控制方法
CN113671962B (zh) * 2021-08-20 2023-11-21 湘潭大学 一种无人驾驶铰接式清扫车的横向控制方法
CN113741172A (zh) * 2021-08-31 2021-12-03 江苏大学 一种基于带宽参数整定的滑移率自抗扰控制方法及控制器
CN113741172B (zh) * 2021-08-31 2024-03-19 江苏大学 一种基于带宽参数整定的滑移率自抗扰控制方法及控制器
CN113911103A (zh) * 2021-12-14 2022-01-11 北京理工大学 一种混合动力履带车辆速度与能量协同优化方法及系统
CN115675637A (zh) * 2022-12-28 2023-02-03 禾多科技(北京)有限公司 车辆控制方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN113253605A (zh) 基于ddpg参数优化的自抗扰无人驾驶横向控制方法
Nguyen et al. Fuzzy static output feedback control for path following of autonomous vehicles with transient performance improvements
Cerone et al. Combined automatic lane-keeping and driver's steering through a 2-DOF control strategy
Arogeti et al. Path following of autonomous vehicles in the presence of sliding effects
CN114379583B (zh) 一种基于神经网络动力学模型的自动驾驶车辆轨迹跟踪系统及方法
CN114510063B (zh) 一种无人履带车辆及其轨迹跟踪控制方法和系统
Saccon et al. A virtual rider for motorcycles: Maneuver regulation of a multi-body vehicle model
CN113671962B (zh) 一种无人驾驶铰接式清扫车的横向控制方法
Kebbati et al. Lateral control for autonomous wheeled vehicles: A technical review
CN113064424A (zh) 一种改进ddpg算法的无人车路径规划方法
CN116027669A (zh) 一种高速列车自适应滑模控制方法、系统及电子设备
CN110609473B (zh) 一种不确定模型机器人的控制方法
CN114228690B (zh) 一种基于ddpg和迭代控制的自动驾驶车辆侧倾控制方法
CN113391553A (zh) 具有执行器饱和的异构cacc系统的自适应最优控制方法
Vörös et al. Lane keeping control using finite spectrum assignment with modeling errors
Thommyppillai et al. Advances in the development of a virtual car driver
Li et al. Path tracking control based on the prediction of tire state stiffness using the optimized steering sequence
CN113759701A (zh) 一种高速列车速度控制方法及系统
Németh et al. Robust H∞ design of an automotive cruise control system
Lu et al. Event-Triggered Parallel Control Using Deep Reinforcement Learning With Application to Comfortable Autonomous Driving
Xiong et al. Terrain-Adaptive Longitudinal Control for Autonomous Trucks
Amertet et al. Optimizing the performance of a wheeled mobile robots for use in agriculture using a linear-quadratic regulator
Hong et al. A Driving Assist System for Path Tracking via Active Rear-wheel Steering
Lu et al. Path Preview Tracking for Autonomous Vehicles Based on Model Predictive Control
He et al. A Model Predictive Control for Steady-state Drifting and Tracking of Electronic-Two-Rear-Wheel Drive Automobiles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210813

RJ01 Rejection of invention patent application after publication