CN113391553B - 具有执行器饱和的异构cacc系统的自适应最优控制方法 - Google Patents

具有执行器饱和的异构cacc系统的自适应最优控制方法 Download PDF

Info

Publication number
CN113391553B
CN113391553B CN202110658769.2A CN202110658769A CN113391553B CN 113391553 B CN113391553 B CN 113391553B CN 202110658769 A CN202110658769 A CN 202110658769A CN 113391553 B CN113391553 B CN 113391553B
Authority
CN
China
Prior art keywords
vehicle
time
gamma
control
iteration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110658769.2A
Other languages
English (en)
Other versions
CN113391553A (zh
Inventor
高振宇
安会爽
郭戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University Qinhuangdao Branch
Original Assignee
Northeastern University Qinhuangdao Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University Qinhuangdao Branch filed Critical Northeastern University Qinhuangdao Branch
Priority to CN202110658769.2A priority Critical patent/CN113391553B/zh
Publication of CN113391553A publication Critical patent/CN113391553A/zh
Application granted granted Critical
Publication of CN113391553B publication Critical patent/CN113391553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Abstract

本发明提供一种具有执行器饱和的异构CACC系统的自适应最优控制方法,首先建立领队车的纵向动力学模型和每辆跟随车的纵向动力学模型,建立整个车队的控制模型,建立控制器模型并求解开工至增益的最优解,通过最优控制器控制整个车队的运行,可以防止车辆过大加速、减速造成车辆碰撞现象,基于低增益自适应动态规划算法设计自适应巡航控制系统的最优控制器,确保控制器的控制信号控制在约束范围以内,解决了执行器延迟、外部干扰以及执行器饱和同时存在下的车队稳定性问题,不仅能够保证每辆车的稳定性,同时也能确保车队的串稳定性。

Description

具有执行器饱和的异构CACC系统的自适应最优控制方法
技术领域
本发明涉及车队的协同自适应巡航系统的控制领域,具体涉及一种具有执行器饱和的异构CACC系统的自适应最优控制方法。
背景技术
实际生活中,车辆过大的加速与减速会降低乘客乘坐时的舒适度以及执行器的加速和减速器具有一定的范围,因此需要在控制器设计时考虑到执行器饱和的问题,避免给出过大的加速、减速信号,以免造成车队系统的不稳定和损耗执行器的情况,基于执行器约束问题的车队协同自适应巡航控制系统的研究具有重要的实际意义。
对于车队的协同自适应巡航控制(cooperative adaptive cruise control,CACC)系统的研究目前尚处于起步阶段。Shladover等在文献Longitudinal control ofautomotive vehicles in close-formation platoons中提出了基于PID的车队系统控制器设计方法,PID控制器控制效果依赖于车辆模型建立的准确性,并且PID参数的选择需要大量的数据进行测算,不符合实际情况的使用。由于PID控制参数的选择需要大量的数据,并且现实环境中存在的不确定性(如模型误差)和外在干扰。为了改善以上问题,Guo和Yue等在文献Hierarchical platoon control with heterogeneous information feedback中为车队的纵向运动建立了一种新颖的混合模型,该模型首次综合考虑了来自领头车辆加速度、外界风速和参数不确定性的干扰(如时间延迟,量化和数据包丢失);采用上、下层控制框架,其中下层的H控制器对车队系统的延时具有良好的鲁棒性。针对具有不确定动态特性和一致通信延时的异质车队,Gao等在文献Robust control of heterogeneousvehicular platoon with uncertain dynamics and communication delay中提出了H控制方法,在随机参数和外部扰动下仍具有很好的控制性能。Zheng等人在文献Platooningof connected vehicles with undirected topologies:robustness analysis anddistributed H-infinity controller synthesis中针对动态拓扑等问题提出分布式控制器,并证明了控制器的鲁棒性。Mc Mahon等在文献Longitudinal vehicle controllerdesign for IVHS:theory and experiment中利用改进的滑模控制方法开发了车队控制系统的控制算法,补偿了车辆本身固有的非线性特性,可以实现令人满意的跟踪效果,但是没有考虑到车辆执行器饱和的问题,与实际情况存在差异。Liu和Goldsmith等在文献Effectsof communication delay on string stability in vehicle platoons中研究了纵向滑模控制器对通信延迟的鲁棒性。上述研究提出的控制策略主要依赖于精确地车辆模型建立或依赖于已知的模型结构,而现实情况下车队中的车辆具有不同的动力学模型,因此在异质车队中使用存在难度。同时,滑模控制方法未考虑到执行器约束的问题,与现实情况存在差异。
发明内容
针对现有技术的不足,本发明提出一种具有执行器饱和的异构CACC系统的自适应最优控制方法,包括:
步骤1:根据车辆的动态性能,构造固定时间间距策略,采用单向通信结构建立车队中每辆车的纵向动力学模型,整个车队由1辆领队车和n辆跟随车组成,分别建立领队车的纵向动力学模型和每辆跟随车的纵向动力学模型;
步骤2:建立整个车队的控制模型;
步骤3:求解控制器
Figure BDA0003114296370000021
的具体表达式;
步骤4:求解控制器中控制增益K*(γ)的最优解;
步骤5:令
Figure BDA0003114296370000022
中Kj(γ)取值为K*(γ),得到最优控制器,
Figure BDA0003114296370000023
是所有车辆t时刻状态的集合,通过最优控制器控制整个车队的运行,可以防止车辆过大加速、减速造成车辆碰撞现象。
步骤1中所述领队车的纵向动力学模型为:
Figure BDA0003114296370000024
式中,δ0(t)=v*(t)t-p*(t)-p0(t),v*(t)是领队车在t时刻的期望速度,M0是赫尔维兹矩阵,p*(t)是领队车的期望位置,p0(t)是领队车的实际位置,
Figure BDA0003114296370000025
是δ0(t)的一阶导函数,
Figure BDA0003114296370000026
是δ0(t)的二阶导函数,
Figure BDA0003114296370000027
是a0(t)的一阶导函数,δ0(t)、a0(t)分别是领队车在t时刻的位置误差、加速度;
所述跟随车的纵向动力学模型构建过程如下:
步骤1.1:建立第i辆跟随车的车间距误差为δi(t):
δi(t)=pi-1(t)-pi(t)-ds-L,i=1,2,...,n (2)
其中,ds为期望车间距离,ds=hivi(t)+ri,hi是恒定车头时距,vi(t)是第i辆跟随车在t时刻的速度,ri是跟随车之间的固定车间距,pi(t)是第i辆跟随车在t时刻的位置,L是车辆长度;
步骤1.2:建立第i辆跟随车的动力学模型的非线性微分方程:
Figure BDA0003114296370000031
其中,ai(t)是第i辆跟随车在t时刻的加速度,ci(t)是反馈线性化控制律,fi(vi,ai)是车辆的非线性动态模型,gi是常量,
Figure BDA0003114296370000032
τi是机械时间常数,mi是第i辆车的质量,
Figure BDA0003114296370000033
是vi(t)的一阶导函数,
Figure BDA0003114296370000034
是ai(t)的一阶导函数,
Figure BDA0003114296370000035
是δi(t)的一阶导函数,其中fi(vi,ai)表示为:
Figure BDA0003114296370000036
其中,σ是空气质量,Ai、cdi、dmi和mi分别是第i辆跟随车的横截面积、阻力系数、机械阻力和质量;
步骤1.3:为了将非线性化微分方程线性化,建立反馈线性化控制率ci(t)为:
Figure BDA0003114296370000037
其中,ui(t)为附加控制输入信号,τi为机械时间常数,μi(t)是带有饱和约束的执行器输入信号,umaxi、umini分别为执行器的上下界值,i=1,2,...,n;
将反馈线性化控制律带入公式(3),得到每辆跟随车的纵向动力学模型的线性化模型:
Figure BDA0003114296370000038
其中,
Figure BDA0003114296370000039
是δi(t)的二阶导函数;
步骤1.4:根据执行器的约束条件,建立跟随车的纵向动力学模型的约束线性化模型为:
Figure BDA0003114296370000041
所述步骤2包括:
步骤2.1:将公式(7)重写为闭环控制系统的状态空间方程为:
Figure BDA0003114296370000042
其中,
Figure BDA0003114296370000043
是x(t)的一阶导函数,
Figure BDA0003114296370000044
Col为列向量的符号表示,
Figure BDA0003114296370000045
Figure BDA0003114296370000046
Figure BDA0003114296370000047
δi(t)是第i辆车在t时刻与目标位置的位置误差,Ki(γ)=[ki1(γ) ki2(γ) ki3(γ)],其中ki1(γ)、ki2(γ)、ki3(γ)分别是第i辆跟随车的位置、速度、加速度的反馈控制律,
Figure BDA0003114296370000048
δ0(t)是领队车在t时刻与目标位置的位置误差,a0(t)是领队车在t时刻的加速度;
步骤2.2:建立整个车队的控制模型为:
Figure BDA0003114296370000049
其中,
Figure BDA00031142963700000410
为参数矩阵,
Figure BDA00031142963700000411
γ为低增益参数,Kj(γ)是第j次迭代得到的反馈控制律,
Figure BDA00031142963700000412
是控制器。
所述步骤3包括:
步骤3.1:根据
Figure BDA00031142963700000413
取最小值的控制目标选取损失函数J为:
Figure BDA00031142963700000414
其中,Q=blockdiag(Q0,Q1,…,Qn),
Figure BDA00031142963700000415
R=blockdiag(R0,R1,…,Rn),
Figure BDA00031142963700000416
Figure BDA0003114296370000051
blockdiag表示生成斜矩阵,dt是单位时间长度,Ri是控制输入的权重矩阵,Qi是状态变量的权重矩阵,
Figure BDA0003114296370000052
是所有车辆t时刻状态的集合,x(t)表示所有跟随车辆t时刻状态的集合,所有车辆的控制增益为K*(γ)=R-1BTP*(γ),其中,P*(γ)由公式(11)表示的代数黎卡提方程解得:
Figure BDA0003114296370000053
其中,Kj(γ)是第j次迭代时的反馈增益值,
Figure BDA0003114296370000054
Pj-1(γ)是第j-1次迭代时的中间值,j=1,2,...,j是迭代次数,γ是小于1的非负数;
步骤3.2:计算时刻[t,t+δt]之间的差值作为最小损失函数:
Figure BDA0003114296370000055
其中,δ是信号采样间隔时间;
根据克罗内克积以及公式(13)
Figure BDA0003114296370000056
其中,dτ表示单位时间长度,vecv(·)表示一种运算,
Figure BDA0003114296370000057
Figure BDA0003114296370000058
表示ts时刻生成的结果矩阵,ts表示时间戳,
Figure BDA0003114296370000059
表示τ时刻的车辆状态,
Figure BDA00031142963700000510
表示τ时刻的控制输入,
Figure BDA00031142963700000511
表示克罗内克积;
将公式(12)化简得到:
Figure BDA0003114296370000061
其中,vec(·)表示一种运算,
Figure BDA0003114296370000062
vecs(·)表示一种运算,
Figure BDA0003114296370000063
为第j次迭代时的过程矩阵且满足列满秩,
Figure BDA0003114296370000064
为第j次迭代时的过程矩阵,
Figure BDA0003114296370000065
为第j次迭代时
Figure BDA0003114296370000066
的结果矩阵,
Figure BDA0003114296370000067
为第j次迭代时
Figure BDA0003114296370000068
的结果矩阵,
Figure BDA0003114296370000069
为第j次迭代时
Figure BDA00031142963700000610
的结果矩阵,I3n+3为单位矩阵。
所述步骤4包括:
步骤4.1:为车队选择初始控制器增益K0(γ)和期望阈值ε>0,初始化低增益参数γ0和低增益的更新系数α<1;
步骤4.2:更新低增益参数γ,即γ←αγ;
步骤4.3:初始的控制器输入包含有干扰信息,令
Figure BDA00031142963700000611
时间间隔为[tj,0,tj,l],其中K0表示初始控制增益,e(t)表示激励信号,tj,0表示第j次迭代的初始时间,tj,s表示第j次迭代的第s次采样时间;
步骤4.4:根据车辆控制系统在车辆运行时采集到的数据,利用公式(13)定义的计算方法计算过程变量
Figure BDA00031142963700000612
并且令j=0;
步骤4.5:利用公式(14)对Pj(γ)、Kj+1(γ)进行求解;
步骤4.6:迭代次数加1,即j←j+1,直到|Pj(γ)-Pj-1(γ)|<ε,其中ε表示期望阈值;
步骤4.7:直到
Figure BDA00031142963700000613
得到γ的最优解γ*
步骤4.8:得到最优控制增益
Figure BDA00031142963700000614
本发明的有益效果是:
本发明提出了一种具有执行器饱和的异构CACC系统的自适应最优控制方法,基于低增益自适应动态规划方法设计自适应巡航控制系统的最优控制器,确保控制器的控制信号控制在约束范围以内,解决了执行器延迟、外部干扰以及执行器饱和同时存在下的车队稳定性问题,不仅能够保证每辆车的稳定性,同时也能确保车队的串稳定性。
附图说明
图1为本发明中的具有执行器饱和的异构CACC系统的自适应最优控制方法流程图。
图2为本发明中构建的包含通讯拓扑结构的车队模型示意图;
图3为本发明中领队车的期望加速度示意图;
图4为本发明实施例优化迭代过程图,其中(a)为第一辆跟随车反馈增益Kj(γ)的优化迭代过程图(b)为第二辆跟随车的Kj(γ)优化迭代过程图,(c)为第三辆跟随车的Kj(γ)优化迭代过程图,(d)为第四辆跟随车的Kj(γ)优化迭代过程图,(e)为第一辆跟随车Pj(γ)的优化迭代过程图,(f)为第二辆跟随车Pj(γ)的优化迭代过程图,(g)为第三辆跟随车的Pj(γ)的优化迭代过程图,(h)为第四辆跟随车Pj(γ)的优化迭代过程图;
图5为本发明实施例考虑执行器约束时直线车道车队中每辆车的行驶情况,(a)为直线车道车辆行驶时每辆车的行驶距离过程图,(b)为直线车道车辆行驶时每辆车的速度变化过程图,(c)为直线车道车辆行驶时跟随车的加速度变化过程图,(d)为车队中跟随车与前车的误差过程图;
图6为本发明实施例无执行器约束时直线车道车队中每辆车的行驶情况;(a)为直线车道车辆行驶时每辆车的行驶距离过程图,(b)为直线车道车辆行驶时每辆车的速度变化过程图,(c)为直线车道车辆行驶时跟随车的加速度变化过程图,(d)为车队中跟随车与前车的误差过程图。
具体实施方式
下面结合附图和具体实施实例对发明做进一步说明。
如图1~2所示,一种具有执行器饱和的异构CACC系统的自适应最优控制方法,包括:
步骤1:根据车辆的动态性能,构造固定时间间距策略,采用单向通信结构建立车队中每辆车的纵向动力学模型,整个车队由1辆领队车和n辆跟随车组成,分别建立领队车的纵向动力学模型和每辆跟随车的纵向动力学模型,所述领队车的纵向动力学模型为:
Figure BDA0003114296370000081
式中,δ0(t)=v*(t)t-p*(t)-p0(t),v*(t)是领队车在t时刻的期望速度,M0是赫尔维兹矩阵,p*(t)是领队车的期望位置,p0(t)是领队车的实际位置,
Figure BDA0003114296370000082
是δ0(t)的一阶导函数,
Figure BDA0003114296370000083
是δ0(t)的二阶导函数,
Figure BDA0003114296370000084
是a0(t)的一阶导函数,
Figure BDA0003114296370000085
δ0(t)、a0(t)分别是领队车在t时刻的位置误差、加速度;
所述跟随车的纵向动力学模型构建过程如下:
步骤1.1:建立第i辆跟随车的车间距误差为δi(t):
δi(t)=pi-1(t)-pi(t)-ds-L,i=1,2,...,n (2)
其中,ds为期望车间距离,ds=hivi(t)+ri,hi是恒定车头时距,vi(t)是第i辆跟随车在t时刻的速度,ri是跟随车之间的固定车间距,pi(t)是第i辆跟随车在t时刻的位置,L是车辆长度;
步骤1.2:建立第i辆跟随车的动力学模型的非线性微分方程:
Figure BDA0003114296370000086
其中,ai(t)是第i辆跟随车在t时刻的加速度,ci(t)是反馈线性化控制律,fi(vi,ai)是车辆的非线性动态模型,gi是常量,
Figure BDA0003114296370000087
τi是机械时间常数,mi是第i辆车的质量,
Figure BDA0003114296370000088
是vi(t)的一阶导函数,
Figure BDA0003114296370000089
是ai(t)的一阶导函数,
Figure BDA00031142963700000810
是δi(t)的一阶导函数,其中fi(vi,ai)表示为:
Figure BDA00031142963700000811
其中,σ是空气质量,Ai、cdi、dmi和mi分别是第i辆跟随车的横截面积、阻力系数、机械阻力和质量;
步骤1.3:为了将非线性化微分方程线性化,建立反馈线性化控制率ci(t),由于车辆自身性能的原因,执行器存在约束范围,为此定义了ui(t),
Figure BDA0003114296370000091
其中,ui(t)为附加控制输入信号,也就是被控车辆的期望加速度,τi为机械时间常数,μi(t)是带有饱和约束的执行器输入信号,umaxi、umini分别为执行器的上下界参数值,i=1,2,...,n;
将反馈线性化控制律带入公式(3),得到每辆跟随车的纵向动力学模型的线性化模型:
Figure BDA0003114296370000092
其中,
Figure BDA0003114296370000093
是δi(t)的二阶导函数;
步骤1.4:根据执行器的约束条件,建立跟随车的纵向动力学模型的约束线性化模型为:
Figure BDA0003114296370000094
步骤2:建立整个车队的控制模型,包括:
步骤2.1:跟随车的纵向动力学模型的约束线性化模型公式(7)重写为闭环控制系统的状态空间方程为:
Figure BDA0003114296370000095
其中,
Figure BDA0003114296370000096
是x(t)的一阶导函数,
Figure BDA0003114296370000097
Col为列向量的符号表示,
Figure BDA0003114296370000101
Figure BDA0003114296370000102
Figure BDA0003114296370000103
δi(t)是第i辆车在t时刻与目标位置的位置误差,Ki(γ)=[ki1(γ) ki2(γ) ki3(γ)],其中ki1(γ)、ki2(γ)、ki3(γ)分别是第i辆跟随车的位置、速度、加速度的反馈控制律,
Figure BDA0003114296370000104
δ0(t)是领队车在t时刻与目标位置的位置误差,a0(t)是领队车在t时刻的加速度;
步骤2.2:建立整个车队的控制模型为:
由以上公式得到车队的整体模型:
Figure BDA0003114296370000105
其中,
Figure BDA0003114296370000106
由于涉及未知参数的系统矩阵是未知的,因此无法直接在线使用,我们的目标是通过在线数据迭代求解满足代数黎卡提方程的对称正定矩阵,并获得更新的反馈增益矩阵。为此,将整体模型重写为
Figure BDA0003114296370000107
其中,
Figure BDA0003114296370000108
为参数矩阵,
Figure BDA0003114296370000109
γ为低增益参数,Kj(γ)是第j次迭代得到的反馈控制律,
Figure BDA00031142963700001010
是控制器。
步骤3:求解控制器
Figure BDA00031142963700001011
的具体表达式,包括:
步骤3.1:根据
Figure BDA00031142963700001012
取最小值的控制目标选取损失函数J为:
Figure BDA00031142963700001013
其中,Q=blockdiag(Q0,Q1,…,Qn),
Figure BDA00031142963700001014
R=blockdiag(R0,R1,…,Rn),
Figure BDA00031142963700001015
Figure BDA00031142963700001016
blockdiag表示生成斜矩阵,dt是单位时间长度,Ri是控制输入的权重矩阵,Qi是状态变量的权重矩阵,
Figure BDA0003114296370000111
是所有车辆t时刻状态的集合,x(t)表示所有跟随车辆t时刻状态的集合,所有车辆的控制增益为K*(γ)=R-1BTP*(γ),其中,P*(γ)由公式(11)表示的代数黎卡提方程解得:
Figure BDA0003114296370000112
其中,Kj(γ)是第j次迭代时的反馈增益值,
Figure BDA0003114296370000113
Pj-1(γ)是第j-1次迭代时的中间值,j=1,2,...,j是迭代次数,γ是小于1的非负数;
步骤3.2:由于没有办法预估车队中车辆的参数矩阵
Figure BDA0003114296370000114
Figure BDA0003114296370000115
时,用以下方程求解,计算时刻[t,t+δt]之间的差值作为最小损失函数:
Figure BDA0003114296370000116
其中,δ是信号采样间隔时间;
根据克罗内克积以及公式(13)
Figure BDA0003114296370000117
其中,dτ表示单位时间长度,vecv(·)表示一种运算,
Figure BDA0003114296370000118
Figure BDA0003114296370000119
表示ts时刻生成的结果矩阵,ts表示时间戳,
Figure BDA00031142963700001110
表示τ时刻的车辆状态,
Figure BDA00031142963700001111
表示τ时刻的控制输入,即控制器的输入信号,
Figure BDA00031142963700001112
表示克罗内克积;
将公式(12)化简得到:
Figure BDA0003114296370000121
其中,vec(·)表示一种运算,
Figure BDA0003114296370000122
表示第n辆车第j次迭代时的反馈增益值,vecs(·)表示一种运算,
Figure BDA0003114296370000123
表示第n辆车在第j次迭代时的中间值,
Figure BDA0003114296370000124
为第j次迭代时的过程矩阵且满足列满秩,
Figure BDA0003114296370000125
为第j次迭代时的过程矩阵,
Figure BDA0003114296370000126
为第j次迭代时
Figure BDA0003114296370000127
的结果矩阵,
Figure BDA0003114296370000128
为第j次迭代时
Figure BDA0003114296370000129
的结果矩阵,
Figure BDA00031142963700001210
为第j次迭代时
Figure BDA00031142963700001211
的结果矩阵,I3n+3为单位矩阵。
根据基于数据驱动的低增益控制器优化算法,得到数据驱动的CACC低增益控制方法:
步骤4:求解控制器中控制增益K*(γ)的最优解,包括:
步骤4.1:为车队选择初始控制器增益K0(γ)和期望阈值ε>0,初始化低增益参数γ0和低增益的更新系数α<1;
步骤4.2:更新低增益参数γ,即γ←αγ;
步骤4.3:初始的控制器输入包含有干扰信息,令
Figure BDA00031142963700001212
时间间隔为[tj,0,tj,l],其中K0表示系统的初始反馈控制增益,e(t)表示激励信号,tj,0表示第j次迭代的初始时间,tj,s表示第j次迭代的第s次采样时间;
步骤4.4:根据车辆控制系统在车辆运行时采集到的车辆运行时位置、速度、加速度数据,利用公式(13)定义的计算方法计算过程变量
Figure BDA00031142963700001213
并且令j=0;
步骤4.5:利用公式(14)对Pj(γ)、Kj+1(γ)进行求解;
步骤4.6:迭代次数加1,即j←j+1,直到|Pj(γ)-Pj-1(γ)|<ε,其中ε表示期望阈值;
步骤4.7:直到
Figure BDA00031142963700001214
得到γ的最优解γ*,返回控制器
Figure BDA00031142963700001215
更新结果;
Figure BDA0003114296370000131
时,算法收敛,也就是
Figure BDA0003114296370000132
Figure BDA0003114296370000133
分别收敛到最优的中间值P*和最优反馈控制增益K*(γ);
步骤4.8:得到最优控制增益
Figure BDA0003114296370000134
步骤5:令
Figure BDA0003114296370000135
中Kj(γ)取值为K*(γ),得到最优控制器,
Figure BDA0003114296370000136
是所有车辆t时刻状态的集合,通过最优控制器控制整个车队的运行,可以防止车辆过大加速、减速造成车辆碰撞现象。
下面根据车辆动态性能,构建跟随车微分方程,证明控制器的稳定性:
1)首先构建跟随车车辆动力学方程:
Figure BDA0003114296370000137
根据步骤4.1-步骤4.7得到车辆的估计最优控制器
Figure BDA0003114296370000138
2)构建李雅普诺夫方程
Figure BDA0003114296370000139
给定初始状态
Figure BDA00031142963700001310
总是存在有界集合Ω,使得
Figure BDA00031142963700001311
其中c>0。
3)定义一个集合LV(c)={xi∈Rn|V(xi)≤c},并且已知γ∈(0,γ*]和
Figure BDA00031142963700001312
Figure BDA00031142963700001313
其中|umin,i|=|umax,i|=um,我们可以得到
Figure BDA00031142963700001314
4)由以上不等式化简李雅普诺夫方程得到:
Figure BDA00031142963700001315
因此,闭环系统的全局渐进稳定性证明完毕。
5)在频域下,分析车队的队列稳定性并给出限制条件;
根据车队队列稳定性条件,‖Gi(jω)‖≤1,也就是对于任意ω>0,Gi(s)=ai(s)/ai-1(s)。由车队闭环系统进行拉普拉斯变化可以得到:
sai(s)=-ai(s)/τi+(kpiδi(s)+kvii(s)+kaiai(s))/τi
is+1-kai)ai(s)=(kpi+kvis)δi(s)
δi(s)=s-2(ai-1(s)-ai(s))+his-1ai(s)
进一步化简可以得到:
Figure BDA0003114296370000141
令s=jω,根据||ai(jω)/ai-1(jω)||≤1可以推导得到
Figure BDA0003114296370000142
Figure BDA0003114296370000143
最终可以得到车队队列稳定性条件:
Figure BDA0003114296370000144
本发明提出了一种考虑执行器约束的CACC系统的低增益自适应动态规划方法,构建模型并提出的基于数据驱动的低增益ADP(Adaptive dynamic programming,自适应动态规划)车队协同控制算法,解决了执行器延迟、外部干扰以及执行器饱和同时存在下的车队稳定性问题,并且本方法可以使车队快速达到稳定状态。在车辆稳定性分析上,通过分析在控制器更新后的代价函数大小,来证明车辆的稳定性。通过分析得到,代价函数有界,并且小于极小值,可以证明车辆的状态以及控制输入达到了稳定状态。
本实施例中假设有一辆领队车和4辆跟随车在车道上直线行驶,为了研究分析执行器饱和对于性能的影响,考虑了两种情况:执行器无约束,执行器有约束,两种情况中领队车的速度是不断变化的。采样间隔其中设置成0.2s。初始位置设置为[50 36 20 5]m,初始速度为[7.5 5 8 5.5]m/s。
执行器输出具体可以分为以下两种形式:
情况1:无执行器输出约束
情况2:考虑执行器约束-3m/s2≤μ(t)≤3m/s2
采用Matlab软件仿真,在仿真中,车队动力学参数设置如下:发动机时间常数τi=[0.26 0.24 0.18 0.31],时间常数hi=[0.8 0.8 0.75 0.91],初始反馈控制增益设置为K0=[-0.5,-0.5,0]。在仿真中,车辆的长度被忽略。
基于上述参数,对本发明提出的基于数据驱动的低增益ADP控制理论的车队协同制动控制方法进行仿真验证如3-6所示。其中,图3给出了领队车的期望加速度轨迹,图4显示了在提出的控制器下的Kj(γ),Pj(γ)迭代过程。从图4可以看出,中间值Pj(γ)和反馈控制增益Kj(γ)都达到了稳定。图5显示了车队的位置信息,速度信息、加速度的变化情况以及间距误差;从图5可以看出车队中的各车辆在领队车加速度为零时,位置误差可以慢慢地顺滑地收敛到零。这个过程用时大概在13s左右。可以明显看到误差在跟随车中没有被逐渐放大,车队能够保持稳定状态。图6显示了车队中头车执行器约束时车队的位置信息、速度信息、加速度的变化情况以及间距误差。从图6可以看出在无执行器约束的情况下,车辆之间的距离始终保持合理的安全间距,从而避免了追尾事故的发生。此外,加速度存在逐级放大的情况。这表明本发明提出的车队基于数据驱动的低增益ADP协同制动控制器不仅能够保证每辆车的稳定性,同时也能确保车队的串稳定性。
本发明提出了一种考虑执行器约束的的CACC系统的低增益自适应动态规划方法,构建模型并提出了基于数据驱动的低增益ADP车队协同控制方法,设计出了协同控制器,能使得车队在整个制动过程中实现各车辆的收敛性,并且实现了整个车队的队列稳定性,解决了执行器延迟、外部干扰以及执行器饱和同时存在下的车队稳定性问题,并且本方法可以使车队快速达到稳定状态。在车辆稳定性分析上,通过分析在控制器更新后的代价函数大小,来证明车辆的稳定性。通过分析得到,代价函数有界,并且小于极小值,可以证明车辆的状态以及控制输入达到了稳定状态。
传统互联车辆的协同制动控制采用的都为二阶的车队模型,本发明在此基础上建立了三阶线性化车队动力学模型。相比于二阶车队模型,三阶模型可以更好地捕捉到车辆内部的动态特征。针对异构车队系统环境下存在扰动的情况,分别设计了领队车的控制器和跟随车的协同控制器,并设计了基于数据驱动的ADP自适应协同控制方法,解决了多种扰动同时存在下的车队稳定性问题。本发明提出一种基于数据驱动的车队协同制动控制方法,使用代价函数对车辆的收敛性进行评估。仿真结果验证了所提方法的有效性。

Claims (2)

1.一种具有执行器饱和的异构CACC系统的自适应最优控制方法,其特征在于,包括:
步骤1:根据车辆的动态性能,构造固定时间间距策略,采用单向通信结构建立车队中每辆车的纵向动力学模型,整个车队由1辆领队车和n辆跟随车组成,分别建立领队车的纵向动力学模型和每辆跟随车的纵向动力学模型;
所述领队车的纵向动力学模型为:
Figure FDA0003487280570000011
式中,δ0(t)=v*(t)t-p*(t)-p0(t),v*(t)是领队车在t时刻的期望速度,M0是赫尔维兹矩阵,p*(t)是领队车的期望位置,p0(t)是领队车的实际位置,
Figure FDA0003487280570000012
是δ0(t)的一阶导函数,
Figure FDA0003487280570000013
是δ0(t)的二阶导函数,
Figure FDA0003487280570000014
是a0(t)的一阶导函数,δ0(t)、a0(t)分别是领队车在t时刻的位置误差、加速度;
所述跟随车的纵向动力学模型构建过程如下:
步骤1.1:建立第i辆跟随车的车间距误差为δi(t):
δi(t)=pi-1(t)-pi(t)-ds-L,i=1,2,...,n (2)
其中,ds为期望车间距离,ds=hivi(t)+ri,hi是恒定车头时距,vi(t)是第i辆跟随车在t时刻的速度,ri是跟随车之间的固定车间距,pi(t)是第i辆跟随车在t时刻的位置,L是车辆长度;
步骤1.2:建立第i辆跟随车的动力学模型的非线性微分方程:
Figure FDA0003487280570000015
其中,ai(t)是第i辆跟随车在t时刻的加速度,ci(t)是反馈线性化控制律,fi(vi,ai)是车辆的非线性动态模型,gi是常量,
Figure FDA0003487280570000016
τi是机械时间常数,mi是第i辆车的质量,
Figure FDA0003487280570000017
是vi(t)的一阶导函数,
Figure FDA0003487280570000018
是ai(t)的一阶导函数,
Figure FDA0003487280570000019
是δi(t)的一阶导函数,其中fi(vi,ai)表示为:
Figure FDA0003487280570000021
其中,σ是空气质量,Ai、cdi、dmi和mi分别是第i辆跟随车的横截面积、阻力系数、机械阻力和质量;
步骤1.3:为了将非线性化微分方程线性化,建立反馈线性化控制率ci(t)为:
Figure FDA0003487280570000022
其中,ui(t)为附加控制输入信号,τi为机械时间常数,μi(t)是带有饱和约束的执行器输入信号,umaxi、umini分别为执行器的上下界值,i=1,2,…,n;
将反馈线性化控制律带入公式(3),得到每辆跟随车的纵向动力学模型的线性化模型:
Figure FDA0003487280570000023
其中,
Figure FDA0003487280570000024
是δi(t)的二阶导函数;
步骤1.4:根据执行器的约束条件,建立跟随车的纵向动力学模型的约束线性化模型为:
Figure FDA0003487280570000025
步骤2:建立整个车队的控制模型;包括:
步骤2.1:将公式(7)重写为闭环控制系统的状态空间方程为:
Figure FDA0003487280570000026
其中,
Figure FDA0003487280570000027
是x(t)的一阶导函数,
Figure FDA0003487280570000028
Col为列向量的符号表示,
Figure FDA0003487280570000031
Figure FDA0003487280570000032
Figure FDA0003487280570000033
δi(t)是第i辆车在t时刻与目标位置的位置误差,Ki(γ)=[ki1(γ) ki2(γ) ki3(γ)],其中ki1(γ)、ki2(γ)、ki3(γ)分别是第i辆跟随车的位置、速度、加速度的反馈控制律,
Figure FDA0003487280570000034
δ0(t)是领队车在t时刻与目标位置的位置误差,a0(t)是领队车在t时刻的加速度;
步骤2.2:建立整个车队的控制模型为:
Figure FDA0003487280570000035
其中,
Figure FDA0003487280570000036
Figure FDA0003487280570000037
为参数矩阵,
Figure FDA0003487280570000038
γ为低增益参数,Kj(γ)是第j次迭代得到的反馈控制律,
Figure FDA0003487280570000039
是控制器;
步骤3:求解控制器
Figure FDA00034872805700000310
的具体表达式;包括:
步骤3.1:根据
Figure FDA00034872805700000311
取最小值的控制目标选取损失函数J为:
Figure FDA00034872805700000312
其中,
Figure FDA00034872805700000313
Figure FDA00034872805700000314
blockdiag表示生成斜矩阵,dt是单位时间长度,Ri是控制输入的权重矩阵,Qi是状态变量的权重矩阵,
Figure FDA00034872805700000315
Figure FDA00034872805700000316
是所有车辆t时刻状态的集合,x(t)表示所有跟随车辆t时刻状态的集合,所有车辆的控制增益为K*(γ)=R-1BTP*(γ),其中,P*(γ)由公式(11)表示的代数黎卡提方程解得:
Figure FDA00034872805700000317
其中,Kj(γ)是第j次迭代时的反馈增益值,
Figure FDA00034872805700000318
Pj-1(γ)是第j-1次迭代时的中间值,j=1,2,…,j是迭代次数,γ是小于1的非负数;
步骤3.2:计算时刻[t,t+δt]之间的差值作为最小损失函数:
Figure FDA0003487280570000041
其中,δ是信号采样间隔时间;
根据克罗内克积以及公式(13)
Figure FDA0003487280570000042
其中,dτ表示单位时间长度,vecv(·)表示一种运算,
Figure FDA0003487280570000043
Figure FDA0003487280570000044
Figure FDA0003487280570000045
表示ts时刻生成的结果矩阵,ts表示时间戳,
Figure FDA0003487280570000046
表示τ时刻的车辆状态,
Figure FDA0003487280570000047
表示τ时刻的控制输入,
Figure FDA0003487280570000048
表示克罗内克积;
将公式(12)化简得到:
Figure FDA0003487280570000049
其中,vec(·)表示一种运算,
Figure FDA00034872805700000410
Figure FDA00034872805700000411
表示第n辆车第j次迭代时的反馈增益值,vecs(·)表示一种运算,
Figure FDA00034872805700000412
Figure FDA00034872805700000413
表示第n辆车在第j次迭代时的中间值,
Figure FDA00034872805700000414
为第j次迭代时的过程矩阵且满足列满秩,
Figure FDA00034872805700000415
为第j次迭代时的过程矩阵,
Figure FDA0003487280570000051
为第j次迭代时
Figure FDA0003487280570000052
的结果矩阵,
Figure FDA0003487280570000053
为第j次迭代时
Figure FDA0003487280570000054
的结果矩阵,
Figure FDA0003487280570000055
为第j次迭代时
Figure FDA0003487280570000056
的结果矩阵,I3n+3为单位矩阵;
步骤4:求解控制器中控制增益K*(γ)的最优解;
步骤5:令
Figure FDA0003487280570000057
中Kj(γ)取值为K*(γ),得到最优控制器,
Figure FDA0003487280570000058
是所有车辆t时刻状态的集合,通过最优控制器控制整个车队的运行,可以防止车辆过大加速、减速造成车辆碰撞现象。
2.根据权利要求1所述的一种具有执行器饱和的异构CACC系统的自适应最优控制方法,其特征在于,所述步骤4包括:
步骤4.1:为车队选择初始控制器增益K0(γ)和期望阈值ε>0,初始化低增益参数γ0和低增益的更新系数α<1;
步骤4.2:更新低增益参数γ,即γ←αγ;
步骤4.3:初始的控制器输入包含有干扰信息,令
Figure FDA0003487280570000059
时间间隔为[tj,0,tj,l],其中K0表示初始控制增益,e(t)表示激励信号,tj,0表示第j次迭代的初始时间,tj,s表示第j次迭代的第s次采样时间;
步骤4.4:根据车辆控制系统在车辆运行时采集到的数据,利用公式(13)定义的计算方法计算过程变量
Figure FDA00034872805700000510
并且令j=0;
步骤4.5:利用公式(14)对Pj(γ)、Kj+1(γ)进行求解;
步骤4.6:迭代次数加1,即j←j+1,直到|Pj(γ)-Pj-1(γ)|<ε,其中ε表示期望阈值;
步骤4.7:直到
Figure FDA00034872805700000511
得到γ的最优解γ*
步骤4.8:得到最优控制增益
Figure FDA00034872805700000512
CN202110658769.2A 2021-06-15 2021-06-15 具有执行器饱和的异构cacc系统的自适应最优控制方法 Active CN113391553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110658769.2A CN113391553B (zh) 2021-06-15 2021-06-15 具有执行器饱和的异构cacc系统的自适应最优控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110658769.2A CN113391553B (zh) 2021-06-15 2021-06-15 具有执行器饱和的异构cacc系统的自适应最优控制方法

Publications (2)

Publication Number Publication Date
CN113391553A CN113391553A (zh) 2021-09-14
CN113391553B true CN113391553B (zh) 2022-04-01

Family

ID=77620827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110658769.2A Active CN113391553B (zh) 2021-06-15 2021-06-15 具有执行器饱和的异构cacc系统的自适应最优控制方法

Country Status (1)

Country Link
CN (1) CN113391553B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115981166B (zh) * 2023-03-20 2023-07-07 青岛大学 车队安全运行控制方法、系统、计算机设备以及存储介质
CN116118822B (zh) * 2023-04-13 2023-07-28 江西科骏实业有限公司 一种列车编组运行时的主动避碰控制方法、系统及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0828071A2 (en) * 1996-09-05 1998-03-11 Toyota Jidosha Kabushiki Kaisha Acceleration control apparatus for a diesel engine provided with supercharger
CN108791290A (zh) * 2018-08-20 2018-11-13 中国人民解放军国防科技大学 基于在线增量式dhp的双车协同自适应巡航控制方法
CN110333728A (zh) * 2019-08-02 2019-10-15 大连海事大学 一种基于变时间间距策略的异构车队容错控制方法
CN112034859A (zh) * 2020-09-14 2020-12-04 东北大学秦皇岛分校 抗干扰的cacc系统的自适应动态规划方法
CN112660124A (zh) * 2020-11-30 2021-04-16 吉林大学 一种用于换道场景的协同自适应巡航控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0828071A2 (en) * 1996-09-05 1998-03-11 Toyota Jidosha Kabushiki Kaisha Acceleration control apparatus for a diesel engine provided with supercharger
CN108791290A (zh) * 2018-08-20 2018-11-13 中国人民解放军国防科技大学 基于在线增量式dhp的双车协同自适应巡航控制方法
CN110333728A (zh) * 2019-08-02 2019-10-15 大连海事大学 一种基于变时间间距策略的异构车队容错控制方法
CN112034859A (zh) * 2020-09-14 2020-12-04 东北大学秦皇岛分校 抗干扰的cacc系统的自适应动态规划方法
CN112660124A (zh) * 2020-11-30 2021-04-16 吉林大学 一种用于换道场景的协同自适应巡航控制方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Cooperative Adaptive Cruise Control with Communication Constraints;Ligang Wu,等;《Proceedings of the 34th Chinese Control Conference》;20150730;第8015-8020页 *
Optimal control based CACC: problem formulation, solution, and stability analysis;Yu Bai,等;《2019 IEEE Intelligent Vehicles Symposium》;20190612 *
Rolling horizon stochastic optimal control strategy for ACC and CACC under uncertainty;Yang Zhou,等;《Transportation Research Part C》;20171231;第61-76页 *
基于扰动观测器的AUVs固定时间编队控制;高振宇,郭戈;《自动化学报》;20190630;第45卷(第6期);第1094-1102页 *
车辆协同巡航控制系统设计改进与试验评价;华雪东,等;《交通运输系统工程与信息》;20191231;第19卷(第6期);第52-60页 *
车队控制中的一种通用可变时距策略;于晓海,郭戈;《自动化学报》;20190731;第45卷(第7期);第1335-1343页 *

Also Published As

Publication number Publication date
CN113391553A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN108944930B (zh) 一种基于lstm的模拟驾驶员特性的自动跟车方法及系统
CN107808027B (zh) 基于改进模型预测控制的自适应跟车方法
CN113391553B (zh) 具有执行器饱和的异构cacc系统的自适应最优控制方法
CN112162555A (zh) 混合车队中基于强化学习控制策略的车辆控制方法
Novi et al. Real-time control for at-limit handling driving on a predefined path
CN112034859B (zh) 抗干扰的cacc系统的自适应动态规划方法
CN103324085A (zh) 基于监督式强化学习的最优控制方法
CN110861651B (zh) 一种前车纵侧向运动状态估计方法
Zhang et al. Data-driven based cruise control of connected and automated vehicles under cyber-physical system framework
CN113220021B (zh) 基于虚拟领导者的飞行编队协同自适应跟踪控制方法
Yang et al. Longitudinal tracking control of vehicle platooning using DDPG-based PID
CN114253274B (zh) 基于数据驱动的网联混合车辆编队滚动优化控制方法
Li et al. Combining local trajectory planning and tracking control for autonomous ground vehicles navigating along a reference path
CN113791615A (zh) 一种混合车辆队列分布式模型预测控制方法
CN113655794A (zh) 基于鲁棒模型预测控制的多车协同控制方法
Wang et al. Design and implementation of an adaptive cruise control system based on supervised actor-critic learning
Abdullahi et al. Adaptive cruise control: A model reference adaptive control approach
CN110103960B (zh) 车辆自适应巡航控制方法、系统及车辆
CN112937551B (zh) 一种考虑驾驶员输入特征的车辆控制方法及系统
Zhu et al. Reinforcement learning based throttle and brake control for autonomous vehicle following
CN114987511A (zh) 模拟人类驾驶行为以训练基于神经网络的运动控制器的方法
US20230001940A1 (en) Method and Device for Optimum Parameterization of a Driving Dynamics Control System for Vehicles
CN116176654A (zh) 一种场景自适应的轨道交通ato控制系统
CN115826583A (zh) 一种基于点云地图的自动驾驶车辆编队方法
Tiganasu et al. Comparative analysis of advanced cooperative adaptive cruise control algorithms for vehicular cyber physical systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant