CN115016264A - 动态跟驰车距调整的主从协同控制方法、装置及存储介质 - Google Patents

动态跟驰车距调整的主从协同控制方法、装置及存储介质 Download PDF

Info

Publication number
CN115016264A
CN115016264A CN202210589355.3A CN202210589355A CN115016264A CN 115016264 A CN115016264 A CN 115016264A CN 202210589355 A CN202210589355 A CN 202210589355A CN 115016264 A CN115016264 A CN 115016264A
Authority
CN
China
Prior art keywords
following
vehicle
control
sampling period
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210589355.3A
Other languages
English (en)
Inventor
潘登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202210589355.3A priority Critical patent/CN115016264A/zh
Publication of CN115016264A publication Critical patent/CN115016264A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/80Technologies aiming to reduce greenhouse gasses emissions common to all road transportation technologies
    • Y02T10/84Data processing systems or methods, management, administration

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)

Abstract

本发明涉及一种动态跟驰车距调整的主从协同控制方法,包括以下步骤:步骤1)建立基于模型预测的同步控制模型;步骤2)建立基于卡尔曼滤波的最优状态估计模型;步骤3)确定Pareto优化目标,求解最优控制律;步骤4)建立GRU深度神经网络模型计算最优控制律;步骤5)前车和后车根据模型分别得到第一和第二控制律;步骤6)后车将第二控制律发送给前车,前车若判断满足运行需求,则允许后车按第二控制律控制间隔,否则前车将第一控制律发送给后车,后车按第一控制律进行控制;步骤7)判断跟驰过程是否结束,若未结束,重新执行步骤5)‑步骤7)。与现有技术相比,本发明显著增强了车辆跟驰系统的主动安全能力,具有计算精确、实时性强等优点。

Description

动态跟驰车距调整的主从协同控制方法、装置及存储介质
技术领域
本发明涉及载运工具跟驰控制领域,尤其是涉及一种动态跟驰车距调整的主从协同控制方法、装置及存储介质。
背景技术
动态跟驰车距控制,需要通过车辆跟驰行为调整来实现。现有技术大部分集中在前车行为变化条件下后车的跟驰行为调整及其对动态跟驰车距的影响上,后车通过自身行为的调整,具有避免与前车发生“追尾”冲突的主动安全能力。在这种情况下,后车行为虽受前车位置、运行状态和控制策略的约束,但不受前车的直接控制,且前车先于后车获取前方路况信息,却未能发挥其积极作用,因而不具有主动防范后车追尾的能力,因此导致了整个跟驰系统在技术上自主智能水平不高、主动安全能力不强,以至于车辆跟驰行为与动态跟驰车距的控制水平与控制质量受到很大的限制。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种动态跟驰车距调整的主从协同控制方法、装置及存储介质,实现实时、精确的车辆跟驰行为控制与动态跟驰车距调整。
本发明的目的可以通过以下技术方案来实现:
一种动态跟驰车距调整的主从协同控制方法,包括以下步骤:
步骤1)建立基于模型预测的车辆跟驰行为与动态跟驰车距实时连续调整的车辆跟驰系统的同步控制模型;
步骤2)建立基于卡尔曼滤波的最优状态估计模型优化所述同步控制模型,基于卡尔曼滤波算法得到状态变量的最优估计;
步骤3)确定Pareto优化目标,求解车辆跟驰行为与动态跟驰车距的最优控制律;
步骤4)构建车辆跟驰行为控制的GRU深度神经网络模型,经训练建立控制律与车辆跟驰系统状态及最优行为调整过程的非线性映射关系;
步骤5)前车和后车分别将采集到的或以通信方式获取的基础数据输入各自的GRU深度神经网络模型,根据映射关系分别得到第一控制律和第二控制律;
步骤6)后车将第二控制律发送给前车,前车将第二控制律和第一控制律进行对比分析,若满足安全性、高效性、平稳性和节能运行需求,则允许后车按第二控制律进行自身行为的控制,否则前车将第一控制律发送给后车,后车按第一控制律进行自身行为的控制;
步骤7)判断跟驰过程是否已结束,若跟驰过程未结束,重新执行步骤5)-步骤7)。
所述步骤1)同步控制模型建立过程包括:
步骤1-1)建立车辆跟驰系统的连续时间数学模型:
假定P1(t)、v1(t)和a1(t)分别表示前车在时刻t的位置、速度和加速度,P2(t)、v2(t)和a2(t)分别表示后车在时刻t的位置、速度和加速度。令
Figure BDA0003664452230000021
u(t)=a1(t)-a2(t)、y(t)=dActual(t)=P1(t)-P2(t),可以建立车辆跟驰系统的连续时间数学模型:
Figure BDA0003664452230000022
其中,
Figure BDA0003664452230000023
C=[0 1];
步骤1-2)对连续时间数学模型进行离散化处理,建立车辆跟驰系统的离散模型:
令在第k个采样周期状态向量
Figure BDA0003664452230000024
控制向量u(k)=a1(k)-a2(k)和输出y(k)=dActual(k),车辆跟驰系统的离散状态空间模型为:
Figure BDA0003664452230000025
其中,状态向量x(k)反映了前、后车辆的实时行为与实际跟驰车距,v1(k)、v2(k)分别为前、后车辆在第k个采样周期的速度,P1(k)、P2(k)分别为前、后车辆在第k个采样周期的位置,a1(k)、a2(k)分别为前、后车辆在第k个采样周期的加速度,dActual(k)为前、后车辆在第k个采样周期的实际车距,状态转移矩阵
Figure BDA0003664452230000026
控制矩阵
Figure BDA0003664452230000027
输出矩阵C=[01],T为采样周期;
步骤1-3)令r(k)=dSafe(k)、e(k)=r(k)-y(k),构建系统状态预报观测器:
Figure BDA0003664452230000031
其中,
Figure BDA0003664452230000032
为系统状态估计,dSafe(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,K为状态估计的误差补偿矩阵,控制向量u(k)为
Figure BDA0003664452230000033
其中,L为预报观测状态反馈矩阵,M为控制向量的误差补偿矩阵。
所述步骤2)建立基于卡尔曼滤波的最优状态估计模型包括:
建立车辆跟驰系统状态预报观测器:
Figure BDA0003664452230000034
其中,
Figure BDA0003664452230000035
为系统状态估计,u(k)为控制向量,e(k)=r(k)-y(k),r(k)=dSafe(k),dSafe(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,y(k)为第k个采样周期的输出,w(k)为第k个采样周期的噪声,符合高斯分布,状态转移矩阵
Figure BDA0003664452230000036
控制矩阵
Figure BDA0003664452230000037
K为状态估计的误差补偿矩阵;
建立车辆跟驰系统最优状态的估计模型:
Figure BDA0003664452230000038
其中,
Figure BDA0003664452230000039
为第k+1个采样周期的状态估计,P-(k+1)为在第k+1个采样周期协方差矩阵的估计值,
Figure BDA00036644522300000310
和P-(k+1)与其各自带有噪声w(k)的真实值存在不确定性误差,P(k)表示在第k个采样周期状态估计的协方差矩阵,Q(k)为第k个采样周期的状态转移协方差矩阵;
建立最优状态估计的校正模型;
令z(k+1)=Fx(k)+v(k),其中z(k+1)为第k+1个采样周期通过测量仪器或传感器获得的系统状态向量的观测值矩阵,F=I(I为单位矩阵),v(k)为第k个采样周期由外部环境带来的观测噪声,最优状态估计的校正模型为:
Figure BDA00036644522300000311
其中,
Figure BDA00036644522300000312
为第k+1个采样周期卡尔曼系数矩阵,R(k)为第k个采样周期观测噪声v(k)的协方差矩阵,
Figure BDA00036644522300000313
为第k+1个采样周期校正后的系统状态估计,P(k+1)为第k+1个采样周期更新后的状态估计协方差矩阵。
所述步骤2)的卡尔曼滤波算法包括以下步骤:
步骤2-1)初始化参数,所述参数包括:k=1,G、H、
Figure BDA0003664452230000041
u(k)、K、R(k)、F;
步骤2-2)确定协方差矩阵P(k)和状态转移协方差矩阵Q(k);
步骤2-3)根据公式
Figure BDA0003664452230000042
计算
Figure BDA0003664452230000043
和P-(k+1);
步骤2-4)根据公式
Figure BDA0003664452230000044
计算
Figure BDA0003664452230000045
Figure BDA0003664452230000046
和P(k+1);
步骤2-5)判断跟驰过程是否结束,若跟驰过程结束,停止滤波计算;若跟驰过程未结束,令k=k+1,更新u(k)、R(k),重新执行步骤2-3)-步骤2-5)。
所述步骤3)Pareto优化目标为:
Figure BDA0003664452230000047
其中,E(k)为跟驰系统在第k个采样周期的能耗,S为安全、高效跟驰稳态,S0为跟驰系统的初始状态,σ为后车跟驰行为的控制序列,Time(S0[σ>S)为车辆跟驰系统从初始状态S0经后车控制序列σ进入到安全、高效跟驰稳态S的时间求解函数,优化目标J和控制序列σ均以控制律K、L、M为决策变量,ξ为微小正数,用于限定动态跟驰车距的调整范围,F1_traction(k)、f1_braking(k)、v1(k)和a1(k)分别表示前车在第k个采样周期的牵引力、制动力、速度和加速度,F2_traction(k)、f2_braking(k)、v2(k)和a2(k)分别表示后车在第k个采样周期的牵引力、制动力、速度和加速度,F1_traction_max、f1_braking_max、v1_max、a1_max和a1_min分别表示前车的最大牵引力、最大制动力、最大的允许运行速度、最大加速度和最小加速度,F2_traction_max、f2_braking_max和v2_max分别表示后车的最大牵引力、最大制动力和最大运行速度,vLine_max表示线路允许的车辆最大运行速度,J1(k)=|(a1(k+1)-a1(k))/T|和J2(k)=|(a2(k+1)-a2(k))/T分别为在第k个采样周期前、后车辆加速度时间变化率的绝对值,J1_min和J1_max分别为前车加速度时间变化率的最小值和最大值,aComfort和JComfort分别为车辆行为调整满足平稳性的两个上边界;所述车辆跟驰系统处于安全、高效跟驰稳态S时满足以下条件:
Figure BDA0003664452230000051
其中,
Figure BDA0003664452230000052
dActual(k)为前、后车辆在第k个采样周期的实际车距,dSafe(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,v1(k)、v2(k)分别为前、后车辆在第k个采样周期的速度,a1(k)、a2(k)分别为前、后车辆在第k个采样周期的加速度。
所述步骤3)求解最优控制律过程包括:
控制律(K,L,M)的Pareto最优解集表示为:
Figure BDA0003664452230000055
其中,Ω是控制律(K,L,M)的解空间,J0为车辆跟驰系统的优化目标初始值,
Figure BDA0003664452230000056
表示J优于J0,即J在每一个指标上均不大于J0、且至少在一个指标上小于J0
如果
Figure BDA0003664452230000057
则Pareto优化得到的控制律(K,L,M)可以接受,并令J0=J;否则,保持J0不变;继续进行Pareto优化,直至优化结果满意时结束,最后得到的控制律(K,L,M)即为所求最优控制律。
所述步骤4)包括以下步骤:
将实际测量的时间序列数据和经卡尔曼滤波校正后的时间序列数据作为样本数据,对GRU深度神经网络模型进行训练,所述时间序列数据包括前车速度、后车速度、实际跟驰车距和动态安全车距;
若GRU深度神经网络的优化目标
Figure BDA0003664452230000058
均能达到Pareto最优,即
Figure BDA0003664452230000053
与minJ满足一致性要求,并且GRU深度神经网络得到的控制律
Figure BDA0003664452230000054
与满足Pareto最优的控制律(K,L,M)相比较也满足一致性要求,则GRU深度神经网络训练成功,建立控制律(K,L,M)与车辆跟驰系统状态及最优行为调整过程的非线性映射关系;否则,继续进行GRU深度神经网络训练。
所述步骤6)中后车根据控制律进行自身行为的控制包括以下步骤:
求解车辆跟驰行为和动态列车间隔的控制策略:
a2(k)=a1(k)-u(k)
其中,u(k)为控制律;
根据车辆质量和受力情况,利用a2(k)计算车辆跟驰行为与动态跟驰车距同步控制所需的牵引力或制动力,实现车辆跟驰行为与动态跟驰车距的实时同步控制。
一种动态跟驰车距调整的主从协同控制装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
一种存储介质,其上存储有车辆跟驰行为和动态跟驰车距控制程序,所述程序被执行时实现如上述所述的方法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明将模型预测与Pareto优化结合起来,实现了跟驰行为调整与动态跟驰车距的同步控制优化。
(2)本发明采用卡尔曼滤波,降低了噪声的负面影响,提高了车辆跟驰系统状态估计的精度。
(3)本发明采用GRU深度神经网络,经训练后,提高了控制律计算的实时性,可以达到动态跟驰车距实时控制的目的。
(4)现有车辆跟驰控制技术后车具有防范与前车追尾的能力,但前车对后车跟驰行为缺乏控制手段,不具备主动防范后车与自身追尾的能力。针对现有车辆跟驰控制技术这一缺陷,本发明采用主从协同控制策略进行克服,有效增强了跟驰运行过程中整个跟驰系统的主动安全能力。
附图说明
图1为本发明流程图;
图2为基于模型预测的车辆跟驰行为与动态跟驰车距同步控制的离散模型;
图3为车辆跟驰行为控制的GRU深度神经网络模型;
图4为本发明与现有列控技术的兼容性示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了本发明技术方案在轨道交通领域用于动态列车间隔(即动态跟驰车距)调整主从协同控制的详细实施方式和具体操作过程,但本发明的保护范围不限于下述的实施例。
本发明涉及一种动态列车间隔调整的主从协同控制方法,在技术上与现有列车控技术兼容,见图4所示。dSafe(t)、dActual(t)分别为前、后车在时刻t的动态安全车距和实际车距,P1(t)、P2(t)分别为前、后车在时刻t的位置,v1(t)、v2(t)分别为前、后车在时刻t的速度,ve1(P1(t))和ve2(P2(t))分别为前、后车在时刻t根据期望速度曲线自动生成的期望速度,a1(t)、a2(t)分别为前、后车在时刻t的加速度,P1(t0)、P2(t0)分别为前、后车在初始时刻t0的线路位置,v1(t0)、v2(t0)分别为前、后车在初始时刻t0的速度,m1(t)、m2(t)分别为t时刻前、后车的质量,列车解体、编组作业或旅客乘、降作业会造成列车质量的变化,F1(t)、F2(t)分别为前、后车在t时刻的牵引力(F1(t)>0、F2(t)>0)或制动力(F1(t)<0、F2(t)<0),f1(t)、f2(t)分别为t时刻前、后车的运行阻力(>0,指列车在运行过程中受摩擦、冲击、振动以及线路的平面和断面等外界条件的影响所产生的与列车运行方向相反且非列车为减速主动施加的作用力),∫表示对时间积分。
当列车自主智能和主动安全能力较低的情况下,可采取“基于期望速度曲线跟踪的列车站间行为控制”与“列车时刻表”相结合的方式,实现列车在区间线路的跟驰运行,但动态列车间隔的调整精度和实时性受到较大限制,往往只能在停车站通过调整列车间隔时间来完成对跟驰车距的“粗放式”主动控制;“目标距离速度曲线”,主要用于列车跟驰运行过程中的安全防护,一旦实际列车间隔等于或小于目标距离速度曲线所规定的安全车距,后车必须采取常用制动或紧急制动方式减速运行,令动态列车间隔增大,以提高跟驰运行的安全性;“移动授权”则针对列车跟驰行为的实时连续调整给出了约束条件,后车必须在移动授权允许的范围内进行自身行为的调整,才能保证自身在跟驰运行过程中的行车安全。
一种动态列车间隔调整的主从协同控制方法,包括以下步骤:
步骤1)建立基于模型预测的列车跟驰行为与动态列车间隔实时连续调整的列车跟驰系统的同步控制模型。
步骤1-1)建立列车跟驰系统的连续时间数学模型:
假定P1(t)、v1(t)和a1(t)分别表示前车在时刻t的位置、速度和加速度,P2(t)、v2(t)和a2(t)分别表示后车在时刻t的位置、速度和加速度。令
Figure BDA0003664452230000071
u(t)=a1(t)-a2(t)、y(t)=dActual(t)=P1(t)-P2(t),可以建立列车跟驰系统的连续时间数学模型:
Figure BDA0003664452230000081
其中,
Figure BDA0003664452230000082
C=[0 1];
步骤1-2)对连续时间数学模型进行离散化处理,建立列车跟驰系统的离散模型:
令在第k个采样周期状态向量
Figure BDA0003664452230000083
控制向量u(k)=a1(k)-a2(k)和输出y(k)=dActual(k),列车跟驰运行的离散状态空间模型为:
Figure BDA0003664452230000084
其中,状态向量x(k)反映了前、后列车的实时行为与实际跟驰车距,v1(k)、v2(k)分别为前、后列车在第k个采样周期的速度,P1(k)、P2(k)分别为前、后列车在第k个采样周期的位置,a1(k)、a2(k)分别为前、后列车在第k个采样周期的加速度,dActual(k)为前、后列车在第k个采样周期的实际车距,状态转移矩阵
Figure BDA0003664452230000085
控制矩阵
Figure BDA0003664452230000086
输出矩阵C=[0 1],T为采样周期;
步骤1-3)令r(k)=dSafe(k)、e(k)=r(k)-y(k),构建系统状态预报观测器:
Figure BDA0003664452230000087
其中,
Figure BDA0003664452230000088
为系统状态估计,dSafe(k)为第k个采样周期列车跟驰系统应保持的动态安全车距,K为状态估计的误差补偿矩阵,控制向量u(k)为
Figure BDA0003664452230000089
其中,L为预报观测状态反馈矩阵,M为控制向量的误差补偿矩阵。
基于模型预测的列车跟驰行为与动态列车间隔同步控制的离散模型,见图2所示,将动态安全车距作为跟踪目标,同时把实际车距和速差作为跟驰系统的状态变量,从而为列车跟驰行为与动态列车间隔的同步控制与优化创造了有利条件。
步骤2)建立基于卡尔曼滤波的最优状态估计模型优化所述同步控制模型,基于卡尔曼滤波算法得到状态变量的最优估计。
首先,考虑噪声的影响,建立符合实际运行环境的列车跟驰系统状态预报观测器:
Figure BDA00036644522300000810
其中,
Figure BDA00036644522300000811
为系统状态估计,u(k)为控制向量,e(k)=r(k)-y(k),r(k)=dSafe(k),dSafe(k)为第k个采样周期列车跟驰系统应保持的动态安全车距,y(k)为第k个采样周期的输出,w(k)为第k个采样周期的噪声,符合高斯分布,状态转移矩阵
Figure BDA0003664452230000091
控制矩阵
Figure BDA0003664452230000092
K为状态估计的误差补偿矩阵;
然后,建立列车跟驰系统最优状态状态估计模型:
Figure BDA0003664452230000093
其中,
Figure BDA0003664452230000094
为第k+1个采样周期的状态估计,P-(k+1)为在第k+1个采样周期协方差矩阵的估计值,
Figure BDA0003664452230000095
和P-(k+1)与其各自带有噪声w(k)的真实值存在不确定性误差,P(k)表示在第k个采样周期状态估计的协方差矩阵,Q(k)为第k个采样周期的状态转移协方差矩阵;
最后,建立最优状态估计的校正模型;
令z(k+1)=Fx(k)+v(k),其中z(k+1)为第k+1个采样周期通过测量仪器或传感器获得的系统状态向量的观测值矩阵,F=I(I为单位矩阵),v(k)为第k个采样周期由外部环境带来的观测噪声,最优状态估计的校正模型为:
Figure BDA0003664452230000096
其中,
Figure BDA0003664452230000097
为第k+1个采样周期卡尔曼系数矩阵,R(k)为第k个采样周期观测噪声v(k)的协方差矩阵,
Figure BDA0003664452230000098
为第k+1个采样周期校正后的系统状态估计,P(k+1)为第k+1个采样周期更新后的状态估计协方差矩阵。
根据上述用于列车跟驰系统最优状态估计的卡尔曼滤波模型,建立实现状态变量最优估计的卡尔曼滤波算法,具体包括以下步骤:
步骤2-1)初始化参数,所述参数包括:k=1,G、H、
Figure BDA00036644522300000914
u(k)、K、R(k)、F;
步骤2-2)确定协方差矩阵P(k)和状态转移协方差矩阵Q(k);
步骤2-3)根据公式
Figure BDA0003664452230000099
计算
Figure BDA00036644522300000910
和P-(k+1);
步骤2-4)根据公式
Figure BDA00036644522300000911
计算
Figure BDA00036644522300000912
Figure BDA00036644522300000913
和P(k+1);
步骤2-5)判断跟驰过程是否结束,若跟驰过程结束,停止滤波计算;若跟驰过程未结束,令k=k+1,更新u(k)、R(k),重新执行步骤2-3)-步骤2-5)。
步骤3)确定Pareto优化目标,求解列车跟驰行为与动态列车间隔的最优控制律。
Pareto优化目标为:
Figure BDA0003664452230000101
其中,E(k)为跟驰系统在第k个采样周期的能耗,S为安全、高效跟驰稳态,S0为跟驰系统的初始状态,σ为后车跟驰行为的控制序列,Time(S0[σ>S)为列车跟驰系统从初始状态S0经后车控制序列σ进入到安全、高效跟驰稳态S的时间求解函数,优化目标J和控制序列σ均以控制律K、L、M为决策变量,ξ为微小正数,用于合理限定动态列车间隔的调整范围,F1_traction(k)、f1_braking(k)、v1(k)和a1(k)分别表示前车在第k个采样周期的牵引力、制动力、速度和加速度,F2_traction(k)、f2_braking(k)、v2(k)和a2(k)分别表示后车在第k个采样周期的牵引力、制动力、速度和加速度,(列车的牵引力与制动力不同时呈现),F1_traction_max、f1_braking_max、v1_max、a1_max和a1_min分别表示前车的最大牵引力、最大制动力、最大的允许运行速度、最大加速度和最小加速度,F2_traction_max、f2_braking_max和v2_max分别表示后车的最大牵引力、最大制动力和最大运行速度,vLine_max表示线路允许的列车最大运行速度,J1(k)=|(a1(k+1)-a1(k))/T|和J2(k)=|(a2(k+1)-a2(k))/T|分别为在第k个采样周期前、后列车加速度时间变化率的绝对值,J1_min和J1_max分别为前车加速度时间变化率的最小值和最大值,aComfort和JComfort分别为列车行为调整满足平稳性的两个上边界。
列车跟驰行为调整的目的是建立一个安全、高效跟驰稳态,而不是处在无休止的行为调整过程中。当列车跟驰系统处于安全、高效跟驰稳态时,满足以下条件:
Figure BDA0003664452230000102
其中,
Figure BDA0003664452230000103
dActual(k)为前、后列车在第k个采样周期的实际车距,dSafe(k)为第k个采样周期列车跟驰系统应保持的动态安全车距,v1(k)、v2(k)分别为前、后列车在第k个采样周期的速度,a1(k)、a2(k)分别为前、后列车在第k个采样周期的加速度。
在动态列车间隔调整过程中dActual(k)-dSafe(k)允许调整的范围较大,一旦安全、高效跟驰稳态建立,dActual(k)-dSafe(k)的值较小,略大于0,以满足列车跟驰运行的安全性和高效性。当v1(k)=v2(k)=0时,前、后车列车将处在停车状态,此时所描述的状态可视为一种特殊的安全、高效跟驰稳态。
控制律(K,L,M)的Pareto最优解集表示为:
Figure BDA0003664452230000114
其中,Ω是控制律(K,L,M)的解空间,J0为列车跟驰系统的优化目标初始值,
Figure BDA0003664452230000115
表示J优于J0,即J在每一个指标上均不大于J0、且至少在一个指标上小于J0
求解最优控制律的过程包括:
如果
Figure BDA0003664452230000116
则Pareto优化得到的控制律(K,L,M)可以接受,并令J0=J;否则,保持J0不变;继续进行Pareto优化,直至优化结果满意时结束,最后得到的控制律(K,L,M)即为所求最优控制律。
步骤4)构建车辆跟驰行为控制的GRU深度神经网络模型,经训练建立控制律与车辆跟驰系统状态及最优行为调整过程的非线性映射关系。
通过Pareto优化求解控制律(K,L,M),如果时间比较长,将无法满足列车跟驰行为与动态列车间隔连续调整的实时性控制需求。可采取GRU等深度神经网络求解列车跟驰行为与动态列车间隔实时连续调整满足Pareto最优的控制律(K,L,M)。所建GRU深度神经网络模型见图3所示,其中N为正整数,前车速度、后车速度、实际跟驰车距和动态安全车距均为以时间序列形式存在的变量,所形成的输入数据应当能覆盖列车跟驰系统的全部状态及其变迁过程。
将实际测量的时间序列数据和经卡尔曼滤波校正后的时间序列数据作为样本数据,对GRU深度神经网络模型进行训练,所述时间序列数据包括前车速度、后车速度、实际跟驰车距和动态安全车距;
若GRU深度神经网络的优化目标
Figure BDA0003664452230000111
均能达到Pareto最优,即
Figure BDA0003664452230000112
与minJ满足一致性要求,并且GRU深度神经网络得到的控制律
Figure BDA0003664452230000113
与满足Pareto最优的控制律(K,L,M)相比较也满足一致性要求,则GRU深度神经网络训练成功,建立控制律(K,L,M)与列车跟驰系统各种状态及最优行为调整过程的非线性映射关系;否则,继续进行GRU深度神经网络训练。
模型训练完成后,可以利用GRU深度神经网络实时求解控制律(K,L,M),进而实现动态列车间隔实时、精确调整的主从协同控制。
步骤5)前车和后车分别将采集到的或以通信方式获取的基础数据输入各自的GRU深度神经网络模型,根据映射关系分别得到第一控制律和第二控制律。
步骤6)后车将第二控制律发送给前车,前车将第二控制律和第一控制律进行对比分析,若满足安全性、高效性、平稳性和节能运行需求,则允许后车按第二控制律进行自身行为的控制,否则前车将第一控制律发送给后车,后车按第一控制律进行自身行为的控制。
最优控制律用于列车跟驰行为与动态列车间隔的实时控制,包括以下步骤:
首先,求解列车跟驰行为和动态列车间隔的控制策略,其计算公式为:
a2(k)=a1(k)-u(k)
然后,根据列车质量和受力情况,利用上式计算列车跟驰行为与动态列车间隔同步控制所需的牵引力或制动力,实现列车跟驰行为与动态列车间隔的实时同步控制。
步骤7)判断跟驰过程是否已结束,若跟驰过程未结束,重新执行步骤5)-步骤7)。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种动态跟驰车距调整的主从协同控制方法,其特征在于,包括以下步骤:
步骤1)建立基于模型预测的车辆跟驰行为与动态跟驰车距实时连续调整的车辆跟驰系统的同步控制模型;
步骤2)建立基于卡尔曼滤波的最优状态估计模型优化所述同步控制模型,基于卡尔曼滤波算法得到状态变量的最优估计;
步骤3)确定Pareto优化目标,求解车辆跟驰行为与动态跟驰车距的最优控制律;
步骤4)构建车辆跟驰行为控制的GRU深度神经网络模型,经训练建立控制律与车辆跟驰系统状态及最优行为调整过程的非线性映射关系;
步骤5)前车和后车分别将采集到的或以通信方式获取的基础数据输入各自的GRU深度神经网络模型,根据映射关系分别得到第一控制律和第二控制律;
步骤6)后车将第二控制律发送给前车,前车将第二控制律和第一控制律进行对比分析,若满足安全性、高效性、平稳性和节能运行需求,则允许后车按第二控制律进行自身行为的控制,否则前车将第一控制律发送给后车,后车按第一控制律进行自身行为的控制;
步骤7)判断跟驰过程是否已结束,若跟驰过程未结束,重新执行步骤5)-步骤7)。
2.根据权利要求1所述的一种动态跟驰车距调整的主从协同控制方法,其特征在于,所述步骤1)同步控制模型建立过程包括:
步骤1-1)建立车辆跟驰系统的连续时间数学模型:
假定P1(t)、v1(t)和a1(t)分别表示前车在时刻t的位置、速度和加速度,P2(t)、v2(t)和a2(t)分别表示后车在时刻t的位置、速度和加速度。令
Figure FDA0003664452220000011
u(t)=a1(t)-a2(t)、y(t)=dActual(t)=P1(t)-P2(t),可以建立车辆跟驰系统的连续时间数学模型:
Figure FDA0003664452220000012
其中,
Figure FDA0003664452220000013
步骤1-2)对连续时间数学模型进行离散化处理,建立车辆跟驰系统的离散模型:
令在第k个采样周期状态向量
Figure FDA0003664452220000021
控制向量u(k)=a1(k)-a2(k)和输出y(k)=dActual(k),车辆跟驰系统的离散状态空间模型为:
Figure FDA0003664452220000022
其中,状态向量x(k)反映了前、后车辆的实时行为与实际跟驰车距,v1(k)、v2(k)分别为前、后车辆在第k个采样周期的速度,P1(k)、P2(k)分别为前、后车辆在第k个采样周期的位置,a1(k)、a2(k)分别为前、后车辆在第k个采样周期的加速度,dActual(k)为前、后车辆在第k个采样周期的实际车距,状态转移矩阵
Figure FDA0003664452220000023
控制矩阵
Figure FDA0003664452220000024
输出矩阵C=[01],T为采样周期;
步骤1-3)令r(k)=dSafe(k)、e(k)=r(k)-y(k),构建系统状态预报观测器:
Figure FDA0003664452220000025
其中,
Figure FDA0003664452220000026
为系统状态估计,dSafe(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,K为状态估计的误差补偿矩阵,控制向量u(k)为
Figure FDA0003664452220000027
其中,L为预报观测状态反馈矩阵,M为控制向量的误差补偿矩阵。
3.根据权利要求1所述的一种动态跟驰车距调整的主从协同控制方法,其特征在于,所述步骤2)建立基于卡尔曼滤波的最优状态估计模型包括:
建立车辆跟驰系统状态预报观测器:
Figure FDA0003664452220000028
其中,
Figure FDA0003664452220000029
为系统状态估计,u(k)为控制向量,e(k)=r(k)-y(k),r(k)=dSafe(k),dSafe(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,y(k)为第k个采样周期的输出,w(k)为第k个采样周期的噪声,符合高斯分布,状态转移矩阵
Figure FDA00036644522200000210
控制矩阵
Figure FDA00036644522200000211
K为状态估计的误差补偿矩阵;
建立车辆跟驰系统最优状态的估计模型:
Figure FDA00036644522200000212
其中,
Figure FDA00036644522200000213
为第k+1个采样周期的状态估计,P-(k+1)为在第k+1个采样周期协方差矩阵的估计值,
Figure FDA00036644522200000214
和P-(k+1)与其各自带有噪声w(k)的真实值存在不确定性误差,P(k)表示在第k个采样周期状态估计的协方差矩阵,Q(k)为第k个采样周期的状态转移协方差矩阵;
建立最优状态估计的校正模型;
令z(k+1)=Fx(k)+v(k),其中z(k+1)为第k+1个采样周期通过测量仪器或传感器获得的系统状态向量的观测值矩阵,F=I(I为单位矩阵),v(k)为第k个采样周期由外部环境带来的观测噪声,最优状态估计的校正模型为:
Figure FDA0003664452220000031
其中,
Figure FDA0003664452220000032
为第k+1个采样周期卡尔曼系数矩阵,R(k)为第k个采样周期观测噪声v(k)的协方差矩阵,
Figure FDA0003664452220000033
为第k+1个采样周期校正后的系统状态估计,P(k+1)为第k+1个采样周期更新后的状态估计协方差矩阵。
4.根据权利要求1或3所述的一种动态跟驰车距调整的主从协同控制方法,其特征在于,所述步骤2)的卡尔曼滤波算法包括以下步骤:
步骤2-1)初始化参数,所述参数包括:k=1,G、H、
Figure FDA0003664452220000034
u(k)、K、R(k)、F;
步骤2-2)确定协方差矩阵P(k)和状态转移协方差矩阵Q(k);
步骤2-3)根据公式
Figure FDA0003664452220000035
计算
Figure FDA0003664452220000036
和P-(k+1);
步骤2-4)根据公式
Figure FDA0003664452220000037
计算
Figure FDA0003664452220000038
Figure FDA0003664452220000039
和P(k+1);
步骤2-5)判断跟驰过程是否结束,若跟驰过程结束,停止滤波计算;若跟驰过程未结束,令k=k+1,更新u(k)、R(k),重新执行步骤2-3)-步骤2-5)。
5.根据权利要求1所述的一种动态跟驰车距调整的主从协同控制方法,其特征在于,所述步骤3)Pareto优化目标为:
Figure FDA00036644522200000310
Figure FDA0003664452220000041
其中,E(k)为跟驰系统在第k个采样周期的能耗,S为安全、高效跟驰稳态,S0为跟驰系统的初始状态,σ为后车跟驰行为的控制序列,Time(S0[σ>S)为车辆跟驰系统从初始状态S0经后车控制序列σ进入到安全、高效跟驰稳态S的时间求解函数,优化目标J和控制序列σ均以控制律K、L、M为决策变量,ξ为微小正数,用于限定动态跟驰车距的调整范围,F1_traction(k)、f1_braking(k)、v1(k)和a1(k)分别表示前车在第k个采样周期的牵引力、制动力、速度和加速度,F2_traction(k)、f2_braking(k)、v2(k)和a2(k)分别表示后车在第k个采样周期的牵引力、制动力、速度和加速度,F1_traction_max、f1_braking_max、v1_max、a1_max和a1_min分别表示前车的最大牵引力、最大制动力、最大的允许运行速度、最大加速度和最小加速度,F2_traction_max、f2_braking_max和v2_max分别表示后车的最大牵引力、最大制动力和最大运行速度,vLine_max表示线路允许的车辆最大运行速度,J1(k)=|(a1(k+1)-a1(k))/T|和J2(k)=|(a2(k+1)-a2(k))/T|分别为在第k个采样周期前、后车辆加速度时间变化率的绝对值,J1_min和J1_max分别为前车加速度时间变化率的最小值和最大值,aComfort和JComfort分别为车辆行为调整满足平稳性的两个上边界;所述车辆跟驰系统处于安全、高效跟驰稳态S时满足以下条件:
Figure FDA0003664452220000042
其中,
Figure FDA0003664452220000043
dActual(k)为前、后车辆在第k个采样周期的实际车距,dSafe(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,v1(k)、v2(k)分别为前、后车辆在第k个采样周期的速度,a1(k)、a2(k)分别为前、后车辆在第k个采样周期的加速度。
6.根据权利要求1所述的一种动态跟驰车距调整的主从协同控制方法,其特征在于,所述步骤3)求解最优控制律过程包括:
控制律(K,L,M)的Pareto最优解集表示为:
Figure FDA0003664452220000044
其中,Ω是控制律(K,L,M)的解空间,J0为车辆跟驰系统的优化目标初始值,
Figure FDA0003664452220000051
表示J优于J0,即J在每一个指标上均不大于J0、且至少在一个指标上小于J0
如果
Figure FDA0003664452220000052
则Pareto优化得到的控制律(K,L,M)可以接受,并令J0=J;否则,保持J0不变;继续进行Pareto优化,直至优化结果满意时结束,最后得到的控制律(K,L,M)即为所求最优控制律。
7.根据权利要求1所述的一种动态跟驰车距调整的主从协同控制方法,其特征在于,所述步骤4)包括以下步骤:
将实际测量的时间序列数据和经卡尔曼滤波校正后的时间序列数据作为样本数据,对GRU深度神经网络模型进行训练,所述时间序列数据包括前车速度、后车速度、实际跟驰车距和动态安全车距;
若GRU深度神经网络的优化目标
Figure FDA0003664452220000053
均能达到Pareto最优,即
Figure FDA0003664452220000055
与minJ满足一致性要求,并且GRU深度神经网络得到的控制律
Figure FDA0003664452220000054
与满足Pareto最优的控制律(K,L,M)相比较也满足一致性要求,则GRU深度神经网络训练成功,建立控制律(K,L,M)与车辆跟驰系统状态及最优行为调整过程的非线性映射关系;否则,继续进行GRU深度神经网络训练。
8.根据权利要求1或2所述的一种动态跟驰车距调整的主从协同控制方法,其特征在于,所述步骤6)中后车根据控制律进行自身行为的控制包括以下步骤:
求解车辆跟驰行为和动态列车间隔的控制策略:
a2(k)=a1(k)-u(k)
其中,u(k)为控制律;
根据车辆质量和受力情况,利用a2(k)计算车辆跟驰行为与动态跟驰车距同步控制所需的牵引力或制动力,实现车辆跟驰行为与动态跟驰车距的实时同步控制。
9.一种动态跟驰车距调整的主从协同控制装置,包括存储器、处理器,以及存储于所述存储器中的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的方法。
10.一种存储介质,其上存储有车辆跟驰行为和动态跟驰车距控制程序,其特征在于,所述程序被执行时实现如权利要求1-8中任一所述的方法。
CN202210589355.3A 2022-05-26 2022-05-26 动态跟驰车距调整的主从协同控制方法、装置及存储介质 Pending CN115016264A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210589355.3A CN115016264A (zh) 2022-05-26 2022-05-26 动态跟驰车距调整的主从协同控制方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210589355.3A CN115016264A (zh) 2022-05-26 2022-05-26 动态跟驰车距调整的主从协同控制方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115016264A true CN115016264A (zh) 2022-09-06

Family

ID=83070871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210589355.3A Pending CN115016264A (zh) 2022-05-26 2022-05-26 动态跟驰车距调整的主从协同控制方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115016264A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115649240A (zh) * 2022-12-29 2023-01-31 中南大学 一种在线实时优化多列车协同巡航控制方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115649240A (zh) * 2022-12-29 2023-01-31 中南大学 一种在线实时优化多列车协同巡航控制方法及系统
CN115649240B (zh) * 2022-12-29 2023-03-17 中南大学 一种在线实时优化多列车协同巡航控制方法及系统

Similar Documents

Publication Publication Date Title
CN101054092B (zh) 基于驾驶员工作负荷的车辆稳定性增强控制
CN110286681B (zh) 一种变曲率弯道的动态自动驾驶换道轨迹规划方法
CN110827535B (zh) 非线性车辆队列协同自适应抗扰纵向控制方法
CN104134378A (zh) 一种基于驾驶经验和在线学习的城轨列车智能控制方法
CN110615003B (zh) 基于策略梯度在线学习算法的巡航控制系统及设计方法
CN110450794A (zh) 一种基于最优蠕滑速度搜寻与跟踪的优化粘着控制方法
CN111619624A (zh) 一种基于深度强化学习的有轨电车运行控制方法和系统
CN112389436A (zh) 基于改进lstm神经网络的安全性自动驾驶换道轨迹规划方法
CN109693688A (zh) 预设性能的列车自动驾驶控制系统及控制方法
CN114074680B (zh) 基于深度强化学习的车辆换道行为决策方法及系统
CN114379583A (zh) 一种基于神经网络动力学模型的自动驾驶车辆轨迹跟踪系统及方法
CN115016264A (zh) 动态跟驰车距调整的主从协同控制方法、装置及存储介质
CN115303289A (zh) 一种基于深度高斯车辆动力学模型、训练方法、智能汽车轨迹跟踪控制方法及终端设备
CN115520188A (zh) 节能型车辆速度规划方法、系统、电子设备、存储介质
CN115257789A (zh) 城市低速环境下的营运车辆侧向防撞驾驶决策方法
Villagrá et al. Model-free control techniques for Stop & Go systems
CN110103960B (zh) 车辆自适应巡航控制方法、系统及车辆
CN112782978B (zh) 一种基于自触发机制的高速列车巡航运行控制方法
CN117170228A (zh) 面向虚拟编组高速列车间隔控制的自适应滑模控制方法
CN116027669A (zh) 一种高速列车自适应滑模控制方法、系统及电子设备
CN114148349B (zh) 一种基于生成对抗模仿学习的车辆个性化跟驰控制方法
CN115042770A (zh) 一种基于分布式鲁棒模型预测的车辆队列横向控制方法
CN113428195A (zh) 列车自动控制方法及装置
CN113033902A (zh) 一种基于改进深度学习的自动驾驶换道轨迹规划方法
Pauca et al. Automated computing and tracking of the maximum velocity on a certain road sector

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination