CN113815679B - 一种高速列车自主驾驶控制的实现方法 - Google Patents
一种高速列车自主驾驶控制的实现方法 Download PDFInfo
- Publication number
- CN113815679B CN113815679B CN202110995259.4A CN202110995259A CN113815679B CN 113815679 B CN113815679 B CN 113815679B CN 202110995259 A CN202110995259 A CN 202110995259A CN 113815679 B CN113815679 B CN 113815679B
- Authority
- CN
- China
- Prior art keywords
- train
- speed
- network
- time
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L23/00—Control, warning, or like safety means along the route or between vehicles or vehicle trains
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Abstract
本发明属于列车控制技术领域,涉及一种高速列车自主驾驶控制的实现方法,包括:构建LNMAD模型,作为参考速度曲线生成器;利用训练数据集对参考速度曲线生成器训练;测量列车瞬时速度和位置;输入训练好的参考速度曲线生成器,获取参考速度曲线;速度跟踪控制器以参考速度曲线为跟踪目标,保证相邻列车距离稳定到允许范围内。本发明考虑多属性实际驾驶数据,提出结合LSTM网络和全连接网络处理时间和非时间相关特征,使得参考速度曲线生成器输出相对真实的参考速度曲线。本发明的速度跟踪控制器以参考速度曲线为跟踪目标,实现:高速列车跟踪参考速度曲线;两相邻列车之间的距离保持在适当范围内;相邻列车车头间距收敛到稳定值。
Description
技术领域
本发明属于列车控制技术领域,涉及一种高速列车自主驾驶控制的实现方法。
背景技术
在人工智能(AI)和先进控制技术发展的推动下,自主驾驶系统的发展在过去几十年中受到越来越多的关注。如今,自主驾驶技术已广泛应用于各种交通工具,例如:无人驾驶汽车、移动机器人、船舶和矿山地下车辆等。与其他交通运输系统相比,高铁线路绵延数千公里,而且高铁的运行环境非常复杂。高速列车的自主驾驶控制系统还需要满足更高的安全水平,对突发交通需求的快速适应和更精确地调整到站时间等附加约束,这些都增加了设计高效高速列车自主驾驶系统的难度。
高速列车自主驾驶控制系统能够适应复杂的运行环境,并根据动态条件做出适当的决策。因此,决策能力是高速列车自主驾驶控制最重要和最具挑战性的部分之一,其核心任务包括:参考速度曲线动态生成和跟踪控制。传统上,在车载设备上会预先存储一系列参考速度曲线,这些参考速度曲线对应于不同的运行场景。运行过程中,驾驶员根据实际运行情况选择相应的速度曲线。而自主驾驶系统通过与外部环境交互,对自身的运行状态进行自主感知和分析,并且基于实时更新的状态信息计算参考速度曲线。基于此,列车控制器实现对下一步动作的快速决策,使得列车加速或制动,从而实现对于参考速度曲线的精确追踪。
本发明将深度学习技术与反步控制理论相结合,提出了一种高速列车自主驾驶控制的实现方法。该实现方法由参考速度曲线生成器和速度跟踪控制器两部分组成。参考速度曲线生成器根据列车的实时状态信息来动态计算参考速度曲线。本发明采用深度学习方法,利用实际行车数据对参考速度曲线生成器进行离线训练,训练完成后,该生成器可以根据列车实时运行状态计算列车速度参考曲线。在此基础上,基于障碍李雅普诺夫函数(BarrierLyapunovFunction,BLF)设计了速度跟踪控制器。速度跟踪控制器将参考速度曲线生成器计算的参考速度曲线作为跟踪目标,在满足安全约束和通信限制条件下,保证相邻列车之间的距离稳定到给定值的允许范围内,从而实现列车群的编队运行。
发明内容
本发明提出了一种新的高速列车自主驾驶控制的实现方法。所提出的方法由两部分组成,包括:参考速度曲线生成器和基于反步法的速度跟踪控制器。参考速度曲线生成器负责计算动态参考速度曲线。考虑到实际列车驾驶数据的多种属性,本发明提出了一种结合LSTM神经网络(Long Short Term Mermory network,LSTM)和全连接神经网络(FullyConnected,FC)的混合学习模型来处理时间相关序列和非时间相关序列,使得参考速度曲线生成器根据实时更新的驾驶情况输出参考速度曲线。基于反步控制技术,设计的基于BLF的速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。本发明具体采用以下技术方案。
一种高速列车自主驾驶控制的实现方法,包括以下步骤:
S1、构建面向多属性数据的混合学习模型(LNMAD模型),作为参考速度曲线生成器;
所述状态变量包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离;
将ξi作为训练面向多属性数据的混合学习模型的输入数据;
所述参考运行曲线包括:列车的参考速度和参考位置信息;
S3、根据步骤S2中获得的数据Dtrain,对参考速度曲线生成器进行训练;
S4、设置终端时间Te或终端距离Le,对于每列列车,执行以下步骤:
S4.1、在每个采样阶段t,测量每列列车i的瞬时列车速度vi(t)和位置xi(t)信息;
S4.2、将状态变量输入训练好的参考速度曲线生成器,获取参考速度曲线;
S4.3、设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器;
S4.4、所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。
利用所述历史驾驶数据对参考速度曲线生成器进行训练,训练面向多属性数据的混合学习模型的参数;
当测试的面向多属性数据的混合学习模型满足性能要求时,则将训练好的面向多属性数据的混合学习模型用作参考速度曲线生成器。
在上述技术方案的基础上,在所述步骤S4.3中,针对多列高速列车的速度跟踪控制过程,考虑以下运营要求:
①期望运行间隔要求如式(1)所示,
limt→∞||xi-1(t)-xi(t)||=Hi-1,i (1)
其中,Hi-1,i是列车i-1与列车i之间的期望运行间隔,xi(t)表示:列车i在t时刻的位移,xi-1(t)表示:列车i-1在t时刻的位移;
②安全约束为:列车i与其前行列车的安全车头距离,如式(2)所示,
||xi-1(t)-xi(t)||≥Hs (2)
其中,Hs表示要求的最小安全距离;
③通信范围限制表示为式(3),
||xi-1(t)-xi(t)||≤Hc (3)
其中,Hc表示最小通信范围。
在上述技术方案的基础上,所述障碍李雅普诺夫函数用于:同步不同列车之间的速度,如式(4)所示,
其中,zi,j=xi-xj表示:列车i和j之间的实际距离;Hi,j表示:列车i和j之间的预期距离;xi表示:列车i的实际位置;xj表示:列车j的实际位置;||zi,j||2表示:计算zi,j范数的二次方;
在上述技术方案的基础上,所述步骤S4.4的具体步骤如下:
S4.4.3、根据新的测量,计算下一步j+1的状态偏差,设置迭代变量j=j+1,直到到达终端时间范围Te或列车到达终点站。
给列车i施加的总控制力ui(t)利用式(9)计算,
在上述技术方案的基础上,所述面向多属性数据的混合学习模型基于LSTM网络和FC网络;
所述LSTM网络用于:处理数据中与时间相关的特征,所述FC网络用于:处理数据中的非时间相关特征;
所述面向多属性数据的混合学习模型包括:编码器层、解码器层、全连接层和输出层;
所述编码器层与解码器层连接,所述解码器层与全连接层连接,所述全连接层与输出层连接;
所述编码器层用于:输入时间相关序列和非时间相关序列;
所述时间相关序列包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离;
所述非时间相关序列包括:列车操作模式、控制等级和下一个限制速度的变化值;
所述编码器层与解码器层连接;
所述解码器层包括:若干LSTM网络和若干FC网络;
编码器层的时间相关序列传送给若干LSTM网络处理,编码器层的非时间相关序列传送给若干FC网络处理;
所述全连接层包括:连接网络和FC网络;
所述连接网络与全连接层中的FC网络连接;
解码器层处理的结果传送给连接网络,连接网络再将数据传送给全连接层中的FC网络;
所述输出层输出N个列车前面时刻的时间步长为T的运行状态数据序列;
所述运行状态包括:参考位置和参考速度。
在上述技术方案的基础上,在所述解码器层,LSTM网络的记忆单元状态从最后时刻状态ct-1转移到当前时刻状态ct,隐藏状态从最后时刻状态ht-1转移到当前时刻状态ht;
然后,LSTM网络的记忆单元状态ct和隐藏状态ht在下一时刻作为初始单元状态和隐藏状态,再传输到下一个LSTM网络的记忆单元;
同时,FC网络的权重参数在完成前向传播后,通过反向传播进行更新,并将更新后的权重参数作为下一时刻解码器层的初始状态。
在上述技术方案的基础上,将所述面向多属性数据的混合学习模型输出的均方根误差作为损失函数,如式(10)所示,
输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化,假设输出采用x表示,则激活函数ReLU如式(11)所示。
在上述技术方案的基础上,采用时间反向传播方法和自适应矩估计方法训练面向多属性数据的混合学习模型,具体步骤如下:
S3.3、选择损失函数L(θ)作为目标函数,初始化时间步长t和机器学习率α;
S3.4、分别采用时间反向传播方法和自适应矩估计方法训练LSTM网络和FC网络;
S3.5、采用如式(12)和式(13)的方式对LSTM网络的权重参数和FC网络的权重参数进行更新,
其中,为t时刻,LSTM网络的权重参数;为t-1时刻,LSTM网络的权重参数;为t时刻,FC网络的权重参数;为t-1时刻,FC网络的权重参数;表示:利用式(10)求解的损失函数,表示:求解的梯度;表示:利用式(10)求解的损失函数,表示:求解的梯度;α表示:机器学习率;
本发明的有益技术效果如下:
本发明将深度学习技术与反步控制理论相结合,提出了一种高速列车自主驾驶控制的实现方法。本发明设计的参考速度曲线生成器和速度跟踪控制策略的效益主要体现在以下几个方面。
第一方面:本发明考虑到多属性的实际驾驶数据,提出了一种结合LSTM循环神经网络和全连接神经网络的混合学习网络来处理数据中的时间相关特征和非时间相关特征,使得参考速度曲线生成器能够输出相对真实的参考速度曲线。
第二方面:本发明设计的基于BLF的反步控制器(即速度跟踪控制器)以参考速度曲线生成器中的参考速度曲线作为跟踪目标,实现以下功能:(1)高速列车跟踪参考速度曲线;(2)两列相邻列车之间的距离保持在(Hs,Hc)的适当范围内;(3)相邻列车i-1和i的车头间距收敛到一个稳定值Hi-1,i。
附图说明
本发明有如下附图:
图1为发明所述高速列车自主驾驶控制的实现方法的总体框架示意图;
图2为参考速度曲线生成器的设计流程示意图;
图3为面向多属性数据的混合学习模型的网络结构示意图;
图4为LNMAD网络中的数据流和模型架构示意图;
图5为训练LNMAD模型的模型损失变化曲线示意图;
图6为LNMAD模型的性能预测曲线示意图;
图7中(a)图为基于BLF的速度控制器下1号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(b)图为基于BLF的速度控制器下2号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(c)图为基于BLF的速度控制器下3号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(d)图为基于BLF的速度控制器下4号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(e)图为基于BLF的速度控制器下5号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(f)图为基于BLF的速度控制器下6号列车的实际速度与目标速度的变化曲线比较示意图;
图8为相邻列车之间的距离变化曲线示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实例和附图对本发明做进一步的说明。本领域技术人员应当理解,下面所具体描述的内容是说明性的,而非限制性的,不应以此限制本发明的保护范围。
本发明提出了一种新的高速列车自主驾驶控制的实现方法。所提出的方法由两部分组成,包括:参考速度曲线生成器和基于反步法的速度跟踪控制器。参考速度曲线生成器负责计算动态参考速度曲线。考虑到实际列车驾驶数据的多种属性,本发明提出了一种结合LSTM神经网络(Long Short Term Memory network,LSTM)和全连接神经网络(FullyConnected,FC)的面向多属性数据的混合学习模型来处理时间相关序列和非时间相关序列,使得参考速度曲线生成器根据实时更新的驾驶情况(即由感知定位模块获得的车载数据库的线路数据和由传感器传送的实时状态),输出参考速度曲线(即图1中的参考曲线)。基于反步控制技术,设计的基于BLF的速度跟踪控制器(即图1中的反步跟踪控制器)以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。本发明所述高速列车自主驾驶控制的实现方法的总体框架示意图如图1所示。
首先,设计参考速度曲线生成器
参考速度曲线生成器的设计可以分为离线训练过程(即图2中的模型训练(离线))和在线预测过程(即图2中的预测和控制(在线))两个步骤,如图2所示。在训练过程中,训练预测算法学习模型的(即面向多属性数据的混合学习模型,图2中的学习算法)参数。一旦测试的预测算法学习模型满足性能要求,它就可以用作参考速度曲线生成器,根据实时驾驶情况提供参考曲线。
所述状态变量包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离等,N表示采样点个数。
考虑到高速列车实际运行数据的特征,本文基于LSTM网络和FC网络,提出了面向多属性数据的混合学习模型(Learning Network for Multiple Attribute Data,LNMAD)来分别处理具有不同属性的数据;其中,LSTM网络用于处理数据中与时间相关的特征(即图3中的时间相关序列),而FC网络则处理数据中的非时间相关特征(即图3中的非时间相关序列)。LNMAD模型的架构如图3所示,由编码器层、解码器层、全连接层和输出层组成。在所提出的架构中,LNMAD将得到N个列车前面时刻的时间步长为T的运行状态数据序列,编码器层负责分析驾驶情况不同因素之间的相关性,并产生先前时间和空间序列的表示。
在解码器层,LSTM网络的记忆单元状态从最后时刻状态ct-1转移到当前时刻状态ct,隐藏状态从最后时刻状态ht-1转移到当前时刻状态ht。然后,来自解码器层的存储单元状态ct和隐藏状态ht在下一时刻作为初始单元状态和隐藏状态,再传输到解码器层的下一个LSTM网络的记忆单元。
同时,FC网络的权重参数在完成前向传播后,通过反向传播进行更新,并将更新后的权重参数作为下一时刻解码器层的初始状态。
由本文使用预测范围内面向多属性数据的混合学习模型输出的均方根误差(RMSE)作为损失函数,如式(10)所示,
另外,为了增强面向多属性数据的混合学习模型网络的学习能力,面向多属性数据的混合学习模型输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化,假设输出采用x表示,则激活函数ReLU如式(11)所示。
根据实际列车运行数据建立训练样本。然后,采用时间反向传播方法(BPTT)和自适应矩估计方法(Adam)训练基于LSTM的编码器-解码器模型(即面向多属性数据的混合学习模型)。模型训练的步骤如下:
S3.3:选择损失函数L(θ)作为目标函数,初始化时间步长t和机器学习率α;
S3.4:分别采用BPTT和Adam算法训练LSTM网络和FC网络;
其中,为t时刻,LSTM网络的权重参数;为t-1时刻,LSTM网络的权重参数;为t时刻,FC网络的权重参数;为t-1时刻,FC网络的权重参数;表示:利用式(10)求解的损失函数,表示:求解的梯度;表示:利用式(10)求解的损失函数,表示:求解的梯度;α表示:机器学习率;
然后,设计速度跟踪控制器
针对多列高速列车的速度跟踪控制过程,考虑以下运营要求:
(1)期望运行间隔:对于稳定状态,相邻列车之间的间隔应稳定在适当的距离,如式(1)所示,
limt→∞||xi-1(t)-xi(t)||=Hi-1,i (1)
其中,Hi-1,i是列车i-1与列车i之间的期望运行间隔,xi(t)表示:列车i在t时刻的位移,xi-1(t)表示:列车i-1在t时刻的位移。
(2)安全约束:要实现多列列车的安全运行,应考虑相邻两列列车之间的安全车距。列车i与其前行列车的安全车头距离由式(2)给出,
||xi-1(t)-xi(t)||≥Hs (2)
其中,Hs表示要求的最小安全距离。
(3)通信范围限制:由于车车(Train-to-Train,T2T)通信的限制,一列列车只能在一个限制区域内接收其他列车的信息,表示为式(3),
||xi-1(t)-xi(t)||≤Hc (3)
其中,Hc表示最小通信范围。
定义vi(t)表示:列车i在t时刻的速度,和分别表示:列车i在t时刻的参考速度和位移。表示:实际列车位置(即列车i在t时刻的位移)与参考位置(列车i在t时刻的参考位移)的偏差,表示:实际列车速度与参考速度之间的偏差。
为了满足以上运营要求,引入BLF函数来同步不同列车之间的速度,即在不违反约束的情况下实现速度跟踪控制。构建的BLF函数如式(4)所示,
其中,zi,j=xi-xj和Hi,j分别是列车i和j之间的实际距离和预期距离,xi和xj表示列车i和j的实际位置,||zi,j||2表示:计算zi,j范数的二次方。从式(4)中容易注意到,随着相邻列车之间的实际距离接近最大通信距离Hc,Wi,j的值会增加到无穷大。随着‖zi,j‖的值减小,并接近Hs,即相邻列车趋向于发生碰撞,Wi,j也趋于无穷大,对于任意Hs<‖zi,j‖<Hc,满足Wi,j≥0,当且仅当zi,j=Hi,j时Wi,j=0。
假设所有相邻列车之间的初始车距保持在(Hs,Hc)区间内,且速度初始偏差满足 表示:在初始时刻实际列车速度与标称值参考速度之间的偏差,δi表示:列车i的初始速度跟踪误差的阈值。即高速列车的初始状态保持在集合内,其中
按照式(5)和(6)设计跟踪控制律和虚拟控制输入,
给列车i施加的总控制力ui(t)利用式(9)计算,
其中,ui(t)表示:给列车i施加的总控制力,表示:列车处于平衡点时的控制力,用以抵消列车内力、基本阻力和附加阻力。mi为列车质量。高速列车能够实现对于参考速度曲线的精确跟踪;在运行过程中,相邻列车i-1和i的车头距离稳定在一个稳定值Hi-1,i,同时,安全约束和通信范围约束形式得到保证。
结合参考速度生成器和跟踪控制器的设计,实现高速列车自主驾驶控制的主要步骤总结如下:
S1:构建LNMAD模型,作为参考速度曲线生成器;
所述状态变量包括:列车的位置、速度、加速度、列车之间的间距、列车相对于前面列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离;
将ξi作为训练面向多属性数据的混合学习模型的输入数据;
所述参考运行曲线包括:列车的参考速度和参考位置信息;
S3:根据步骤S1中获得的数据Dtrain,对参考速度曲线生成器进行训练;
S4:设置终端时间Te或终端距离Le。对于每列列车,并执行以下步骤:
S4.1:在每个采样阶段t,测量每列列车i的瞬时列车速度vi(t)和位置xi(t)信息;
S4.2:将状态变量输入参考速度曲线生成器,获取参考速度曲线;
S4.3:设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器;
S4.4:所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内,具体步骤如下:
S4.4.3:根据新的测量,计算下一步j+1的状态偏差,设置迭代变量j=j+1,直到到达终端时间范围Te或列车到达终点站。
为了验证本发明所述方法的实施效果,利用京沪(B-S)高速铁路的实际运行数据对提出的参考速度曲线生成器进行训练。现场数据集由2019年4月1日至2019年4月15日收集的113条实际列车运行记录组成。每个样本中的时间相关信息包括:瞬时列车位置(即列车的位置)、速度、相邻列车之间的车距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离。与时间无关的信息包括:列车操作模式、控制手柄级别(即控制等级)和下一个限制速度的变化值。
为了获得更准确的参考速度曲线预测模型(即面向多属性数据的混合学习模型),通过实验来确定模型架构和参数,包括:网络深度、每层神经元数量和数据样本的步长。不同神经元的结果如表1所示。当每层神经元数量较少时,数据拟合不足,验证损失随着LNMAD网络每层神经元的增加而减少。当神经元数量达到128时,模型容易出现过拟合。根据表1中的实验结果,我们选择第一层128个神经元和第二层64个神经元。
表1第一层(N1)和第二层(N2)中不同数量的神经元的仿真结果对比表
数据样本的步长可根据实际情况选择。一般来说,输入数据的步长越长,神经网络从前一次得到的信息就越多。我们最初选择步长为20,每次将值减少2,直到等于4。迭代次数设置为100,结果如表2所示。从实验结果我们注意到验证损失函数的值与数据样本的步长有关。相比之下,步长为14时,验证损失的性能更好。LNMAD网络中的数据流和模型构架示意如图4所示,其中LSTM网络的输入表示为(M,14,1),FC网络的输入表示为(M,14),M是训练或测试数据的数量。
表2不同步长的仿真结果比较表
将得到的网络结构,处理后的样本送入LNMAD模型进行800次迭代训练,训练过程中的损失函数(即纵坐标的模型损失)的值如图5所示,很容易发现:在50次迭代内,损失函数值急剧下降。随着迭代次数的增加,损失在大约150次迭代后保持稳定,这表明训练过程的收敛。
为了验证拟合性能,我们将北京南站和天津南站之间高铁G123的实际运行状态作为LNMAD模型的输入,预测的参考速度曲线如图6所示。
为了验证所提出的速度跟踪控制器的性能,我们选择北京南站和天津站之间的高速铁路线作为研究案例,总长度约为122.3km。假设有6列列车在这个区段运行。参数Hs、Hc分别设置为2km和7km,相邻列车之间的参考车距为6km。初始速度和位置设置如表3。在初始状态下,每列列车根据实时状态,动态计算目标速度曲线,并根据上述给出的控制律计算控制力。基于BLF的控制器下1-6号列车的实际速度-距离曲线如图7所示。在图7中,实线表示实际列车速度,点划线表示参考速度。
表3不同列车的初始速度和位置数值设置表
从图7可以看出,使用基于BLF的速度跟踪控制器,所有六列列车都快速跟踪参考速度曲线,这证明了所提出的跟踪控制方法的有效性。在运行过程中,外界干扰使列车的实际状态偏离了参考曲线,这可能会降低高速列车的准点率。尽管如此,在所提出的控制策略下,实际速度曲线快速收敛到标称速度曲线,这表明所提出的方法处理扰动的鲁棒性。
为了证明在确保安全车距方面的性能,所提出的控制策略下的列车之间的车距变化曲线示意如图8所示。任意两列相邻列车之间的车距随着两列相邻列车之间的速度偏差而动态变化,最终稳定为标称行车间距。从图8可以看出,所有列车始终保持安全车距,直到每列列车到达车站。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所做的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引申出的显而易见的变化或变动仍处于本发明的保护范围之列。
本说明书中未做详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (10)
1.一种高速列车自主驾驶控制的实现方法,其特征在于,包括以下步骤:
S1、构建面向多属性数据的混合学习模型,作为参考速度曲线生成器;所述面向多属性数据的混合学习模型基于LSTM网络和FC网络;所述LSTM网络用于:处理数据中与时间相关的特征,所述FC网络用于:处理数据中的非时间相关特征;
所述状态变量包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离;
将ξi作为训练面向多属性数据的混合学习模型的输入数据;
所述参考运行曲线包括:列车的参考速度和参考位置信息;
S3、根据步骤S2中获得的数据Dtrain,对参考速度曲线生成器进行训练;
S4、设置终端时间Te或终端距离Le,对于每列列车,执行以下步骤:
S4.1、在每个采样阶段t,测量每列列车i的瞬时列车速度vi(t)和位置xi(t)信息;
S4.2、将状态变量输入训练好的参考速度曲线生成器,获取参考速度曲线;
S4.3、设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器;
S4.4、所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。
3.如权利要求1所述的高速列车自主驾驶控制的实现方法,其特征在于:在所述步骤S4.3中,针对多列高速列车的速度跟踪控制过程,考虑以下运营要求:
①期望运行间隔要求如式(1)所示,
limt→∞||xi-1(t)-xi(t)||=Hi-1,i (1)
其中,Hi-1,i是列车i-1与列车i之间的期望运行间隔,xi(t)表示:列车i在t时刻的位移,xi-1(t)表示:列车i-1在t时刻的位移;
②安全约束为:列车i与其前行列车的安全车头距离,如式(2)所示,
||xi-1(t)-xi(t)||≥Hs (2)
其中,Hs表示要求的最小安全距离;
③通信范围限制表示为式(3),
||xi-1(t)-xi(t)||≤Hc (3)
其中,Hc表示最小通信范围。
7.如权利要求6所述的高速列车自主驾驶控制的实现方法,其特征在于:
所述面向多属性数据的混合学习模型包括:编码器层、解码器层、全连接层和输出层;
所述编码器层与解码器层连接,所述解码器层与全连接层连接,所述全连接层与输出层连接;
所述编码器层用于:输入时间相关序列和非时间相关序列;
所述时间相关序列包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离;
所述非时间相关序列包括:列车操作模式、控制等级和下一个限制速度的变化值;
所述编码器层与解码器层连接;
所述解码器层包括:若干LSTM网络和若干FC网络;
编码器层的时间相关序列传送给若干LSTM网络处理,编码器层的非时间相关序列传送给若干FC网络处理;
所述全连接层包括:连接网络和FC网络;
所述连接网络与全连接层中的FC网络连接;
解码器层处理的结果传送给连接网络,连接网络再将数据传送给全连接层中的FC网络;
所述输出层输出N个列车前面时刻的时间步长为T的运行状态数据序列;
所述运行状态包括:参考位置和参考速度。
8.如权利要求7所述的高速列车自主驾驶控制的实现方法,其特征在于:在所述解码器层,LSTM网络的记忆单元状态从最后时刻状态ct-1转移到当前时刻状态ct,隐藏状态从最后时刻状态ht-1转移到当前时刻状态ht;
然后,LSTM网络的记忆单元状态ct和隐藏状态ht在下一时刻作为初始单元状态和隐藏状态,再传输到下一个LSTM网络的记忆单元;
同时,FC网络的权重参数在完成前向传播后,通过反向传播进行更新,并将更新后的权重参数作为下一时刻解码器层的初始状态。
10.如权利要求9所述的高速列车自主驾驶控制的实现方法,其特征在于:采用时间反向传播方法和自适应矩估计方法训练面向多属性数据的混合学习模型,具体步骤如下:
S3.3、选择损失函数L(θ)作为目标函数,初始化时间步长t和机器学习率α;
S3.4、分别采用时间反向传播方法和自适应矩估计方法训练LSTM网络和FC网络;
S3.5、采用如式(12)和式(13)的方式对LSTM网络的权重参数和FC网络的权重参数进行更新,
其中,为t时刻,LSTM网络的权重参数;为t-1时刻,LSTM网络的权重参数;为t时刻,FC网络的权重参数;为t-1时刻,FC网络的权重参数;表示:利用式(10)求解的损失函数,表示:求解的梯度;表示:利用式(10)求解的损失函数,表示:求解的梯度;α表示:机器学习率;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110995259.4A CN113815679B (zh) | 2021-08-27 | 2021-08-27 | 一种高速列车自主驾驶控制的实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110995259.4A CN113815679B (zh) | 2021-08-27 | 2021-08-27 | 一种高速列车自主驾驶控制的实现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113815679A CN113815679A (zh) | 2021-12-21 |
CN113815679B true CN113815679B (zh) | 2023-01-13 |
Family
ID=78913732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110995259.4A Active CN113815679B (zh) | 2021-08-27 | 2021-08-27 | 一种高速列车自主驾驶控制的实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113815679B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115195821B (zh) * | 2022-06-14 | 2023-09-26 | 同济大学 | 一种后车跟驰行为控制方法、装置及存储介质 |
CN116245255B (zh) * | 2023-03-30 | 2023-07-11 | 湖南大学 | 一种在线时空交通流预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107862331A (zh) * | 2017-10-31 | 2018-03-30 | 华中科技大学 | 一种基于时间序列及cnn的不安全行为识别方法及系统 |
CA2953953A1 (en) * | 2017-01-06 | 2018-07-06 | Applied Brain Research Inc. | Methods and systems for extracting auditory features with neural networks |
CN109635246A (zh) * | 2018-12-06 | 2019-04-16 | 西南交通大学 | 一种基于深度学习的多属性数据建模方法 |
WO2020244134A1 (zh) * | 2019-06-05 | 2020-12-10 | 华南理工大学 | 一种基于多任务特征共享神经网络的智能故障诊断方法 |
CN112633597A (zh) * | 2020-12-30 | 2021-04-09 | 南京理工大学 | 基于rbf神经网络的地铁列车ato速度曲线预测方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9989964B2 (en) * | 2016-11-03 | 2018-06-05 | Mitsubishi Electric Research Laboratories, Inc. | System and method for controlling vehicle using neural network |
CN108873691A (zh) * | 2017-11-13 | 2018-11-23 | 华东交通大学 | 高速列车广义预测调优控制方法 |
CN108334889B (zh) * | 2017-11-30 | 2020-04-03 | 腾讯科技(深圳)有限公司 | 摘要描述生成方法和装置、摘要描述模型训练方法和装置 |
CN109901572B (zh) * | 2018-12-13 | 2022-06-28 | 华为技术有限公司 | 自动驾驶方法、训练方法及相关装置 |
CN109820525A (zh) * | 2019-01-23 | 2019-05-31 | 五邑大学 | 一种基于cnn-lstm深度学习模型的驾驶疲劳识别方法 |
EP3800521B1 (en) * | 2019-10-01 | 2023-07-26 | Elektrobit Automotive GmbH | Deep learning based motion control of a vehicle |
-
2021
- 2021-08-27 CN CN202110995259.4A patent/CN113815679B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2953953A1 (en) * | 2017-01-06 | 2018-07-06 | Applied Brain Research Inc. | Methods and systems for extracting auditory features with neural networks |
CN107862331A (zh) * | 2017-10-31 | 2018-03-30 | 华中科技大学 | 一种基于时间序列及cnn的不安全行为识别方法及系统 |
CN109635246A (zh) * | 2018-12-06 | 2019-04-16 | 西南交通大学 | 一种基于深度学习的多属性数据建模方法 |
WO2020244134A1 (zh) * | 2019-06-05 | 2020-12-10 | 华南理工大学 | 一种基于多任务特征共享神经网络的智能故障诊断方法 |
CN112633597A (zh) * | 2020-12-30 | 2021-04-09 | 南京理工大学 | 基于rbf神经网络的地铁列车ato速度曲线预测方法 |
Non-Patent Citations (2)
Title |
---|
Wang, X (Wang, Xi)1,3 ; Li, SK (Li, Shukai)2 ; Tang, T (Tang, Tao)2 ; .Intelligent operation of heavy haul train with data imbalance: A machine learning method.《Knowledge-Based Systems》.2019,第163卷 * |
王悉.基于机器学习的重载列车智能驾驶方法研究.《中国优秀博硕士学位论文全文数据库(博士)》.2018, * |
Also Published As
Publication number | Publication date |
---|---|
CN113815679A (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113815679B (zh) | 一种高速列车自主驾驶控制的实现方法 | |
CN112193280B (zh) | 一种重载列车强化学习控制方法及系统 | |
CN110969848B (zh) | 一种对向双车道下基于强化学习的自动驾驶超车决策方法 | |
CN111098852B (zh) | 一种基于强化学习的泊车路径规划方法 | |
CN112084636A (zh) | 一种多列车协同控制方法和装置 | |
CN102298326B (zh) | 欠驱动auv自适应轨迹跟踪控制装置及控制方法 | |
Valasek et al. | Improved adaptive–reinforcement learning control for morphing unmanned air vehicles | |
CN111145552B (zh) | 基于5g网络的车辆动态换道轨迹的规划方法 | |
CN109765887A (zh) | 一种自动驾驶控制方法 | |
CN103324085A (zh) | 基于监督式强化学习的最优控制方法 | |
WO2014003151A2 (en) | Method for determining an optimal run-curve for a vehicle | |
CN106056238B (zh) | 列车区间运行轨迹的规划方法 | |
CN114199248B (zh) | 一种基于混合元启发算法优化anfis的auv协同定位方法 | |
CN112965476A (zh) | 一种基于多窗口抽样的高速无人车轨迹规划系统及方法 | |
CN115392111B (zh) | 一种列车追踪控制方法、设备、存储介质 | |
Li et al. | A deep reinforcement learning based approach for autonomous overtaking | |
CN113901718A (zh) | 一种跟驰状态下基于深度强化学习的驾驶避撞优化方法 | |
Wang et al. | A generative adversarial network based learning approach to the autonomous decision making of high-speed trains | |
CN115320596A (zh) | 一种智能网联车队插入式协同换道控制方法 | |
CN115273450A (zh) | 一种网联自动驾驶环境下车辆进入编队的换道方法 | |
Wang et al. | Stochastic speed prediction for connected vehicles using improved bayesian networks with back propagation | |
CN114074680B (zh) | 基于深度强化学习的车辆换道行为决策方法及系统 | |
CN117104310A (zh) | 基于数据驱动预测控制的虚拟编组控制方法及系统 | |
Chen et al. | Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control | |
Malikopoulos et al. | A State-Space Representation Model and Learning Algorithm for Real-Time Decision-Making Under Uncertainty |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |