CN113815679B - 一种高速列车自主驾驶控制的实现方法 - Google Patents

一种高速列车自主驾驶控制的实现方法 Download PDF

Info

Publication number
CN113815679B
CN113815679B CN202110995259.4A CN202110995259A CN113815679B CN 113815679 B CN113815679 B CN 113815679B CN 202110995259 A CN202110995259 A CN 202110995259A CN 113815679 B CN113815679 B CN 113815679B
Authority
CN
China
Prior art keywords
train
speed
network
time
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110995259.4A
Other languages
English (en)
Other versions
CN113815679A (zh
Inventor
王悉
李树凯
杨立兴
辛天鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202110995259.4A priority Critical patent/CN113815679B/zh
Publication of CN113815679A publication Critical patent/CN113815679A/zh
Application granted granted Critical
Publication of CN113815679B publication Critical patent/CN113815679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B61RAILWAYS
    • B61LGUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
    • B61L23/00Control, warning, or like safety means along the route or between vehicles or vehicle trains
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明属于列车控制技术领域,涉及一种高速列车自主驾驶控制的实现方法,包括:构建LNMAD模型,作为参考速度曲线生成器;利用训练数据集对参考速度曲线生成器训练;测量列车瞬时速度和位置;输入训练好的参考速度曲线生成器,获取参考速度曲线;速度跟踪控制器以参考速度曲线为跟踪目标,保证相邻列车距离稳定到允许范围内。本发明考虑多属性实际驾驶数据,提出结合LSTM网络和全连接网络处理时间和非时间相关特征,使得参考速度曲线生成器输出相对真实的参考速度曲线。本发明的速度跟踪控制器以参考速度曲线为跟踪目标,实现:高速列车跟踪参考速度曲线;两相邻列车之间的距离保持在适当范围内;相邻列车车头间距收敛到稳定值。

Description

一种高速列车自主驾驶控制的实现方法
技术领域
本发明属于列车控制技术领域,涉及一种高速列车自主驾驶控制的实现方法。
背景技术
在人工智能(AI)和先进控制技术发展的推动下,自主驾驶系统的发展在过去几十年中受到越来越多的关注。如今,自主驾驶技术已广泛应用于各种交通工具,例如:无人驾驶汽车、移动机器人、船舶和矿山地下车辆等。与其他交通运输系统相比,高铁线路绵延数千公里,而且高铁的运行环境非常复杂。高速列车的自主驾驶控制系统还需要满足更高的安全水平,对突发交通需求的快速适应和更精确地调整到站时间等附加约束,这些都增加了设计高效高速列车自主驾驶系统的难度。
高速列车自主驾驶控制系统能够适应复杂的运行环境,并根据动态条件做出适当的决策。因此,决策能力是高速列车自主驾驶控制最重要和最具挑战性的部分之一,其核心任务包括:参考速度曲线动态生成和跟踪控制。传统上,在车载设备上会预先存储一系列参考速度曲线,这些参考速度曲线对应于不同的运行场景。运行过程中,驾驶员根据实际运行情况选择相应的速度曲线。而自主驾驶系统通过与外部环境交互,对自身的运行状态进行自主感知和分析,并且基于实时更新的状态信息计算参考速度曲线。基于此,列车控制器实现对下一步动作的快速决策,使得列车加速或制动,从而实现对于参考速度曲线的精确追踪。
本发明将深度学习技术与反步控制理论相结合,提出了一种高速列车自主驾驶控制的实现方法。该实现方法由参考速度曲线生成器和速度跟踪控制器两部分组成。参考速度曲线生成器根据列车的实时状态信息来动态计算参考速度曲线。本发明采用深度学习方法,利用实际行车数据对参考速度曲线生成器进行离线训练,训练完成后,该生成器可以根据列车实时运行状态计算列车速度参考曲线。在此基础上,基于障碍李雅普诺夫函数(BarrierLyapunovFunction,BLF)设计了速度跟踪控制器。速度跟踪控制器将参考速度曲线生成器计算的参考速度曲线作为跟踪目标,在满足安全约束和通信限制条件下,保证相邻列车之间的距离稳定到给定值的允许范围内,从而实现列车群的编队运行。
发明内容
本发明提出了一种新的高速列车自主驾驶控制的实现方法。所提出的方法由两部分组成,包括:参考速度曲线生成器和基于反步法的速度跟踪控制器。参考速度曲线生成器负责计算动态参考速度曲线。考虑到实际列车驾驶数据的多种属性,本发明提出了一种结合LSTM神经网络(Long Short Term Mermory network,LSTM)和全连接神经网络(FullyConnected,FC)的混合学习模型来处理时间相关序列和非时间相关序列,使得参考速度曲线生成器根据实时更新的驾驶情况输出参考速度曲线。基于反步控制技术,设计的基于BLF的速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。本发明具体采用以下技术方案。
一种高速列车自主驾驶控制的实现方法,包括以下步骤:
S1、构建面向多属性数据的混合学习模型(LNMAD模型),作为参考速度曲线生成器;
S2、从观测值
Figure GDA0003874406310000021
中获得最近N个时间步长的输入状态序列,并获得训练数据集为:
Figure GDA0003874406310000022
其中,
Figure GDA0003874406310000023
表示:具有列车历史运行状态的序列;M是样本总数;
Figure GDA0003874406310000024
表示:列车i在t时刻的状态变量,
Figure GDA0003874406310000025
表示:列车i在t时刻前,第p个采样点的状态变量;p=1,2,…,N-1;N表示采样点个数;
所述状态变量包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离;
将ξi作为训练面向多属性数据的混合学习模型的输入数据;
Figure GDA0003874406310000031
表示:列车i在预测范围T中的参考运行曲线;
Figure GDA0003874406310000032
表示:列车i在第t+q时刻的参考运行曲线,q=1,2,…,T;
所述参考运行曲线包括:列车的参考速度和参考位置信息;
Figure GDA0003874406310000033
作为训练面向多属性数据的混合学习模型的输出数据;
S3、根据步骤S2中获得的数据Dtrain,对参考速度曲线生成器进行训练;
S4、设置终端时间Te或终端距离Le,对于每列列车,执行以下步骤:
S4.1、在每个采样阶段t,测量每列列车i的瞬时列车速度vi(t)和位置xi(t)信息;
S4.2、将状态变量输入训练好的参考速度曲线生成器,获取参考速度曲线;
S4.3、设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器;
S4.4、所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。
在上述技术方案的基础上,所述训练数据集为:
Figure GDA0003874406310000034
为历史驾驶数据;
利用所述历史驾驶数据对参考速度曲线生成器进行训练,训练面向多属性数据的混合学习模型的参数;
当测试的面向多属性数据的混合学习模型满足性能要求时,则将训练好的面向多属性数据的混合学习模型用作参考速度曲线生成器。
在上述技术方案的基础上,在所述步骤S4.3中,针对多列高速列车的速度跟踪控制过程,考虑以下运营要求:
①期望运行间隔要求如式(1)所示,
limt→∞||xi-1(t)-xi(t)||=Hi-1,i (1)
其中,Hi-1,i是列车i-1与列车i之间的期望运行间隔,xi(t)表示:列车i在t时刻的位移,xi-1(t)表示:列车i-1在t时刻的位移;
②安全约束为:列车i与其前行列车的安全车头距离,如式(2)所示,
||xi-1(t)-xi(t)||≥Hs (2)
其中,Hs表示要求的最小安全距离;
③通信范围限制表示为式(3),
||xi-1(t)-xi(t)||≤Hc (3)
其中,Hc表示最小通信范围。
在上述技术方案的基础上,所述障碍李雅普诺夫函数用于:同步不同列车之间的速度,如式(4)所示,
Figure GDA0003874406310000041
其中,zi,j=xi-xj表示:列车i和j之间的实际距离;Hi,j表示:列车i和j之间的预期距离;xi表示:列车i的实际位置;xj表示:列车j的实际位置;||zi,j||2表示:计算zi,j范数的二次方;
假设所有相邻列车之间的初始车距保持在(Hs,Hc)区间内,且速度初始偏差满足
Figure GDA0003874406310000042
Figure GDA0003874406310000043
表示:在初始时刻实际列车速度与标称值参考速度之间的偏差,δi表示:列车i的初始速度跟踪误差的阈值。
在上述技术方案的基础上,所述步骤S4.4的具体步骤如下:
S4.4.1、基于步骤S4.2获得的参考速度曲线,计算位置偏差
Figure GDA0003874406310000051
和速度偏差
Figure GDA0003874406310000052
并将其状态传递给相邻列车;
S4.4.2、得到控制输入
Figure GDA0003874406310000053
进而得到给列车i施加的总控制力ui(t),并将得到的总控制力ui(t)施加到列车系统;
S4.4.3、根据新的测量,计算下一步j+1的状态偏差,设置迭代变量j=j+1,直到到达终端时间范围Te或列车到达终点站。
在上述技术方案的基础上,所述控制输入
Figure GDA0003874406310000054
按照式(5)计算,
Figure GDA0003874406310000055
其中,αi按照式(6)计算;
Figure GDA0003874406310000056
表示:αi的导数,c1和c2为基本风阻系数;δi表示:列车i的初始速度跟踪误差的阈值;Gi按照式(7)计算;βi按照式(8)计算;
Figure GDA0003874406310000057
其中,Wi,j为:Wi,j(zi,j),η表示:关于变量
Figure GDA0003874406310000058
的函数;
Figure GDA0003874406310000059
表示:求解Wi,j中关于xi的梯度;
Figure GDA00038744063100000510
Figure GDA00038744063100000511
其中,
Figure GDA00038744063100000512
表示:实际列车速度与参考速度之间的偏差;
Figure GDA00038744063100000513
表示:实际列车位置与参考位置的偏差;
给列车i施加的总控制力ui(t)利用式(9)计算,
Figure GDA0003874406310000061
其中,mi为列车质量,
Figure GDA0003874406310000062
表示:列车处于平衡点时的控制力,用以抵消列车内力、基本阻力和附加阻力。
在上述技术方案的基础上,所述面向多属性数据的混合学习模型基于LSTM网络和FC网络;
所述LSTM网络用于:处理数据中与时间相关的特征,所述FC网络用于:处理数据中的非时间相关特征;
所述面向多属性数据的混合学习模型包括:编码器层、解码器层、全连接层和输出层;
所述编码器层与解码器层连接,所述解码器层与全连接层连接,所述全连接层与输出层连接;
所述编码器层用于:输入时间相关序列和非时间相关序列;
所述时间相关序列包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离;
所述非时间相关序列包括:列车操作模式、控制等级和下一个限制速度的变化值;
所述编码器层与解码器层连接;
所述解码器层包括:若干LSTM网络和若干FC网络;
编码器层的时间相关序列传送给若干LSTM网络处理,编码器层的非时间相关序列传送给若干FC网络处理;
所述全连接层包括:连接网络和FC网络;
所述连接网络与全连接层中的FC网络连接;
解码器层处理的结果传送给连接网络,连接网络再将数据传送给全连接层中的FC网络;
所述输出层输出N个列车前面时刻的时间步长为T的运行状态数据序列;
所述运行状态包括:参考位置和参考速度。
在上述技术方案的基础上,在所述解码器层,LSTM网络的记忆单元状态从最后时刻状态ct-1转移到当前时刻状态ct,隐藏状态从最后时刻状态ht-1转移到当前时刻状态ht
然后,LSTM网络的记忆单元状态ct和隐藏状态ht在下一时刻作为初始单元状态和隐藏状态,再传输到下一个LSTM网络的记忆单元;
同时,FC网络的权重参数在完成前向传播后,通过反向传播进行更新,并将更新后的权重参数作为下一时刻解码器层的初始状态。
在上述技术方案的基础上,将所述面向多属性数据的混合学习模型输出的均方根误差作为损失函数,如式(10)所示,
Figure GDA0003874406310000071
其中,
Figure GDA0003874406310000072
表示:列车i在第t时刻的实际运行曲线;
输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化,假设输出采用x表示,则激活函数ReLU如式(11)所示。
Figure GDA0003874406310000073
在上述技术方案的基础上,采用时间反向传播方法和自适应矩估计方法训练面向多属性数据的混合学习模型,具体步骤如下:
S3.1、获得训练数据集:
Figure GDA0003874406310000074
S3.2、初始化LSTM网络的权重参数
Figure GDA0003874406310000075
和FC网络的权重参数
Figure GDA0003874406310000076
S3.3、选择损失函数L(θ)作为目标函数,初始化时间步长t和机器学习率α;
S3.4、分别采用时间反向传播方法和自适应矩估计方法训练LSTM网络和FC网络;
S3.5、采用如式(12)和式(13)的方式对LSTM网络的权重参数和FC网络的权重参数进行更新,
Figure GDA0003874406310000077
Figure GDA0003874406310000081
其中,
Figure GDA0003874406310000082
为t时刻,LSTM网络的权重参数;
Figure GDA0003874406310000083
为t-1时刻,LSTM网络的权重参数;
Figure GDA0003874406310000084
为t时刻,FC网络的权重参数;
Figure GDA0003874406310000085
为t-1时刻,FC网络的权重参数;
Figure GDA0003874406310000086
表示:利用式(10)求解
Figure GDA0003874406310000087
的损失函数,
Figure GDA0003874406310000088
表示:求解
Figure GDA0003874406310000089
的梯度;
Figure GDA00038744063100000810
表示:利用式(10)求解
Figure GDA00038744063100000811
的损失函数,
Figure GDA00038744063100000812
表示:求解
Figure GDA00038744063100000813
的梯度;α表示:机器学习率;
S3.6:判断
Figure GDA00038744063100000814
Figure GDA00038744063100000815
之间的差,以及
Figure GDA00038744063100000816
Figure GDA00038744063100000817
之间的差是否满足阈值,当两者均满足阈值时,保存权重参数
Figure GDA00038744063100000818
Figure GDA00038744063100000819
否则,返回步骤S3.4。
本发明的有益技术效果如下:
本发明将深度学习技术与反步控制理论相结合,提出了一种高速列车自主驾驶控制的实现方法。本发明设计的参考速度曲线生成器和速度跟踪控制策略的效益主要体现在以下几个方面。
第一方面:本发明考虑到多属性的实际驾驶数据,提出了一种结合LSTM循环神经网络和全连接神经网络的混合学习网络来处理数据中的时间相关特征和非时间相关特征,使得参考速度曲线生成器能够输出相对真实的参考速度曲线。
第二方面:本发明设计的基于BLF的反步控制器(即速度跟踪控制器)以参考速度曲线生成器中的参考速度曲线作为跟踪目标,实现以下功能:(1)高速列车跟踪参考速度曲线;(2)两列相邻列车之间的距离保持在(Hs,Hc)的适当范围内;(3)相邻列车i-1和i的车头间距收敛到一个稳定值Hi-1,i
附图说明
本发明有如下附图:
图1为发明所述高速列车自主驾驶控制的实现方法的总体框架示意图;
图2为参考速度曲线生成器的设计流程示意图;
图3为面向多属性数据的混合学习模型的网络结构示意图;
图4为LNMAD网络中的数据流和模型架构示意图;
图5为训练LNMAD模型的模型损失变化曲线示意图;
图6为LNMAD模型的性能预测曲线示意图;
图7中(a)图为基于BLF的速度控制器下1号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(b)图为基于BLF的速度控制器下2号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(c)图为基于BLF的速度控制器下3号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(d)图为基于BLF的速度控制器下4号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(e)图为基于BLF的速度控制器下5号列车的实际速度与目标速度的变化曲线比较示意图;
图7中(f)图为基于BLF的速度控制器下6号列车的实际速度与目标速度的变化曲线比较示意图;
图8为相邻列车之间的距离变化曲线示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实例和附图对本发明做进一步的说明。本领域技术人员应当理解,下面所具体描述的内容是说明性的,而非限制性的,不应以此限制本发明的保护范围。
本发明提出了一种新的高速列车自主驾驶控制的实现方法。所提出的方法由两部分组成,包括:参考速度曲线生成器和基于反步法的速度跟踪控制器。参考速度曲线生成器负责计算动态参考速度曲线。考虑到实际列车驾驶数据的多种属性,本发明提出了一种结合LSTM神经网络(Long Short Term Memory network,LSTM)和全连接神经网络(FullyConnected,FC)的面向多属性数据的混合学习模型来处理时间相关序列和非时间相关序列,使得参考速度曲线生成器根据实时更新的驾驶情况(即由感知定位模块获得的车载数据库的线路数据和由传感器传送的实时状态),输出参考速度曲线(即图1中的参考曲线)。基于反步控制技术,设计的基于BLF的速度跟踪控制器(即图1中的反步跟踪控制器)以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。本发明所述高速列车自主驾驶控制的实现方法的总体框架示意图如图1所示。
首先,设计参考速度曲线生成器
参考速度曲线生成器的设计可以分为离线训练过程(即图2中的模型训练(离线))和在线预测过程(即图2中的预测和控制(在线))两个步骤,如图2所示。在训练过程中,训练预测算法学习模型的(即面向多属性数据的混合学习模型,图2中的学习算法)参数。一旦测试的预测算法学习模型满足性能要求,它就可以用作参考速度曲线生成器,根据实时驾驶情况提供参考曲线。
将具有列车历史运行状态的序列作为输入数据,用向量
Figure GDA0003874406310000101
表示,其中,
Figure GDA0003874406310000102
表示:列车i在t时刻的状态变量,
Figure GDA0003874406310000103
表示:列车i在t时刻前,第p个采样点的状态变量,其中,p=1,2,…,N-1。
所述状态变量包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离等,N表示采样点个数。
将列车i在预测范围T中的参考运行曲线
Figure GDA0003874406310000104
表示为向量
Figure GDA0003874406310000105
其中,
Figure GDA0003874406310000106
表示:列车i在第t+q时刻的参考运行曲线,其中,q=1,2,…,T;所述参考运行曲线包括:列车的参考速度和参考位置信息。
在离线训练阶段,使用列车历史运行数据ξi作为参考速度曲线生成器的输入,将
Figure GDA0003874406310000112
作为输出,基于高速列车实际运行数据来对参考速度曲线生成器进行训练。
考虑到高速列车实际运行数据的特征,本文基于LSTM网络和FC网络,提出了面向多属性数据的混合学习模型(Learning Network for Multiple Attribute Data,LNMAD)来分别处理具有不同属性的数据;其中,LSTM网络用于处理数据中与时间相关的特征(即图3中的时间相关序列),而FC网络则处理数据中的非时间相关特征(即图3中的非时间相关序列)。LNMAD模型的架构如图3所示,由编码器层、解码器层、全连接层和输出层组成。在所提出的架构中,LNMAD将得到N个列车前面时刻的时间步长为T的运行状态数据序列,编码器层负责分析驾驶情况不同因素之间的相关性,并产生先前时间和空间序列的表示。
在解码器层,LSTM网络的记忆单元状态从最后时刻状态ct-1转移到当前时刻状态ct,隐藏状态从最后时刻状态ht-1转移到当前时刻状态ht。然后,来自解码器层的存储单元状态ct和隐藏状态ht在下一时刻作为初始单元状态和隐藏状态,再传输到解码器层的下一个LSTM网络的记忆单元。
同时,FC网络的权重参数在完成前向传播后,通过反向传播进行更新,并将更新后的权重参数作为下一时刻解码器层的初始状态。
最后,全连接层通过将神经元连接起来,输出未来时刻列车的理想位置和速度(即图3中输出层的参考位置和参考速度),重复T次训练过程,最终生成输出序列
Figure GDA0003874406310000111
由本文使用预测范围内面向多属性数据的混合学习模型输出的均方根误差(RMSE)作为损失函数,如式(10)所示,
Figure GDA0003874406310000121
在训练过程中,
Figure GDA0003874406310000122
表示:列车i在t时刻的实际运行曲线,可以列车历史运行数据的训练集中获得,
Figure GDA0003874406310000123
作为
Figure GDA0003874406310000124
的预测值。
另外,为了增强面向多属性数据的混合学习模型网络的学习能力,面向多属性数据的混合学习模型输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化,假设输出采用x表示,则激活函数ReLU如式(11)所示。
Figure GDA0003874406310000125
根据实际列车运行数据建立训练样本。然后,采用时间反向传播方法(BPTT)和自适应矩估计方法(Adam)训练基于LSTM的编码器-解码器模型(即面向多属性数据的混合学习模型)。模型训练的步骤如下:
S3.1:从可用观测值
Figure GDA0003874406310000126
中获得最近N个时间步长的输入状态序列,并获得训练数据集为:
Figure GDA0003874406310000127
其中,M是样本总数;
S3.2:初始化LSTM网络的权重参数
Figure GDA0003874406310000128
和FC网络的权重参数
Figure GDA0003874406310000129
S3.3:选择损失函数L(θ)作为目标函数,初始化时间步长t和机器学习率α;
S3.4:分别采用BPTT和Adam算法训练LSTM网络和FC网络;
S3.5:采用如下方式对LSTM网络的权重参数
Figure GDA00038744063100001210
和FC网络的权重参数
Figure GDA00038744063100001211
进行更新,
Figure GDA00038744063100001212
Figure GDA00038744063100001213
其中,
Figure GDA00038744063100001214
为t时刻,LSTM网络的权重参数;
Figure GDA00038744063100001215
为t-1时刻,LSTM网络的权重参数;
Figure GDA0003874406310000131
为t时刻,FC网络的权重参数;
Figure GDA0003874406310000132
为t-1时刻,FC网络的权重参数;
Figure GDA0003874406310000133
表示:利用式(10)求解
Figure GDA0003874406310000134
的损失函数,
Figure GDA0003874406310000135
表示:求解
Figure GDA0003874406310000136
的梯度;
Figure GDA0003874406310000137
表示:利用式(10)求解
Figure GDA0003874406310000138
的损失函数,
Figure GDA0003874406310000139
表示:求解
Figure GDA00038744063100001310
的梯度;α表示:机器学习率;
S3.6:判断
Figure GDA00038744063100001311
Figure GDA00038744063100001312
之间的差,以及
Figure GDA00038744063100001313
Figure GDA00038744063100001314
之间的差是否满足阈值,当两者均满足阈值时,保存权重参数
Figure GDA00038744063100001315
Figure GDA00038744063100001316
否则,返回步骤S3.4。
然后,设计速度跟踪控制器
针对多列高速列车的速度跟踪控制过程,考虑以下运营要求:
(1)期望运行间隔:对于稳定状态,相邻列车之间的间隔应稳定在适当的距离,如式(1)所示,
limt→∞||xi-1(t)-xi(t)||=Hi-1,i (1)
其中,Hi-1,i是列车i-1与列车i之间的期望运行间隔,xi(t)表示:列车i在t时刻的位移,xi-1(t)表示:列车i-1在t时刻的位移。
(2)安全约束:要实现多列列车的安全运行,应考虑相邻两列列车之间的安全车距。列车i与其前行列车的安全车头距离由式(2)给出,
||xi-1(t)-xi(t)||≥Hs (2)
其中,Hs表示要求的最小安全距离。
(3)通信范围限制:由于车车(Train-to-Train,T2T)通信的限制,一列列车只能在一个限制区域内接收其他列车的信息,表示为式(3),
||xi-1(t)-xi(t)||≤Hc (3)
其中,Hc表示最小通信范围。
定义vi(t)表示:列车i在t时刻的速度,
Figure GDA00038744063100001317
Figure GDA00038744063100001318
分别表示:列车i在t时刻的参考速度和位移。
Figure GDA0003874406310000141
表示:实际列车位置(即列车i在t时刻的位移)与参考位置(列车i在t时刻的参考位移)的偏差,
Figure GDA0003874406310000142
表示:实际列车速度与参考速度之间的偏差。
为了满足以上运营要求,引入BLF函数来同步不同列车之间的速度,即在不违反约束的情况下实现速度跟踪控制。构建的BLF函数如式(4)所示,
Figure GDA0003874406310000143
其中,zi,j=xi-xj和Hi,j分别是列车i和j之间的实际距离和预期距离,xi和xj表示列车i和j的实际位置,||zi,j||2表示:计算zi,j范数的二次方。从式(4)中容易注意到,随着相邻列车之间的实际距离接近最大通信距离Hc,Wi,j的值会增加到无穷大。随着‖zi,j‖的值减小,并接近Hs,即相邻列车趋向于发生碰撞,Wi,j也趋于无穷大,对于任意Hs<‖zi,j‖<Hc,满足Wi,j≥0,当且仅当zi,j=Hi,j时Wi,j=0。
假设所有相邻列车之间的初始车距保持在(Hs,Hc)区间内,且速度初始偏差满足
Figure GDA0003874406310000144
Figure GDA0003874406310000145
表示:在初始时刻实际列车速度与标称值参考速度之间的偏差,δi表示:列车i的初始速度跟踪误差的阈值。即高速列车的初始状态保持在集合
Figure GDA0003874406310000146
内,其中
Figure GDA0003874406310000147
Figure GDA0003874406310000148
按照式(5)和(6)设计跟踪控制律和虚拟控制输入,
Figure GDA0003874406310000149
Figure GDA0003874406310000151
其中,
Figure GDA0003874406310000152
表示:αi的导数,η表示:关于变量
Figure GDA0003874406310000153
的函数,
Figure GDA0003874406310000154
表示:求解Wi,j中关于xi的梯度;Gi按照式(7)计算;βi按照式(8)计算,c1和c2为基本风阻系数;
Figure GDA0003874406310000155
Figure GDA0003874406310000156
其中,
Figure GDA0003874406310000157
给列车i施加的总控制力ui(t)利用式(9)计算,
Figure GDA0003874406310000158
其中,ui(t)表示:给列车i施加的总控制力,
Figure GDA0003874406310000159
表示:列车处于平衡点时的控制力,用以抵消列车内力、基本阻力和附加阻力。mi为列车质量。高速列车能够实现对于参考速度曲线的精确跟踪;在运行过程中,相邻列车i-1和i的车头距离稳定在一个稳定值Hi-1,i,同时,安全约束和通信范围约束形式得到保证。
结合参考速度生成器和跟踪控制器的设计,实现高速列车自主驾驶控制的主要步骤总结如下:
S1:构建LNMAD模型,作为参考速度曲线生成器;
S2:从观测值
Figure GDA00038744063100001510
中获得最近N个时间步长的输入状态序列,并获得训练数据集为:
Figure GDA00038744063100001511
其中,
Figure GDA00038744063100001512
表示:具有列车历史运行状态的序列;M是样本总数;
Figure GDA00038744063100001513
表示:列车i在t时刻的状态变量,
Figure GDA00038744063100001514
表示:列车i在t时刻前,第p个采样点的状态变量;p=1,2,…,N-1;N表示采样点个数;
所述状态变量包括:列车的位置、速度、加速度、列车之间的间距、列车相对于前面列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离;
将ξi作为训练面向多属性数据的混合学习模型的输入数据;
Figure GDA0003874406310000161
表示:列车i在预测范围T中的参考运行曲线;
Figure GDA0003874406310000162
表示:列车i在第t+q时刻的参考运行曲线,q=1,2,…,T;
所述参考运行曲线包括:列车的参考速度和参考位置信息;
Figure GDA0003874406310000163
作为训练面向多属性数据的混合学习模型的输出数据;
S3:根据步骤S1中获得的数据Dtrain,对参考速度曲线生成器进行训练;
S4:设置终端时间Te或终端距离Le。对于每列列车,并执行以下步骤:
S4.1:在每个采样阶段t,测量每列列车i的瞬时列车速度vi(t)和位置xi(t)信息;
S4.2:将状态变量输入参考速度曲线生成器,获取参考速度曲线;
S4.3:设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器;
S4.4:所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内,具体步骤如下:
S4.4.1:基于步骤S4.2获得的参考速度曲线,计算位置偏差
Figure GDA0003874406310000164
和速度偏差
Figure GDA0003874406310000165
并将位置偏差
Figure GDA0003874406310000166
和速度偏差
Figure GDA0003874406310000167
传递给相邻列车;
S4.4.2:得到控制输入
Figure GDA0003874406310000168
进而得到给列车i施加的总控制力ui(t),并将得到的总控制力ui(t)施加到列车系统;
S4.4.3:根据新的测量,计算下一步j+1的状态偏差,设置迭代变量j=j+1,直到到达终端时间范围Te或列车到达终点站。
为了验证本发明所述方法的实施效果,利用京沪(B-S)高速铁路的实际运行数据对提出的参考速度曲线生成器进行训练。现场数据集由2019年4月1日至2019年4月15日收集的113条实际列车运行记录组成。每个样本中的时间相关信息包括:瞬时列车位置(即列车的位置)、速度、相邻列车之间的车距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离。与时间无关的信息包括:列车操作模式、控制手柄级别(即控制等级)和下一个限制速度的变化值。
为了获得更准确的参考速度曲线预测模型(即面向多属性数据的混合学习模型),通过实验来确定模型架构和参数,包括:网络深度、每层神经元数量和数据样本的步长。不同神经元的结果如表1所示。当每层神经元数量较少时,数据拟合不足,验证损失随着LNMAD网络每层神经元的增加而减少。当神经元数量达到128时,模型容易出现过拟合。根据表1中的实验结果,我们选择第一层128个神经元和第二层64个神经元。
表1第一层(N1)和第二层(N2)中不同数量的神经元的仿真结果对比表
Figure GDA0003874406310000171
数据样本的步长可根据实际情况选择。一般来说,输入数据的步长越长,神经网络从前一次得到的信息就越多。我们最初选择步长为20,每次将值减少2,直到等于4。迭代次数设置为100,结果如表2所示。从实验结果我们注意到验证损失函数的值与数据样本的步长有关。相比之下,步长为14时,验证损失的性能更好。LNMAD网络中的数据流和模型构架示意如图4所示,其中LSTM网络的输入表示为(M,14,1),FC网络的输入表示为(M,14),M是训练或测试数据的数量。
表2不同步长的仿真结果比较表
Figure GDA0003874406310000181
将得到的网络结构,处理后的样本送入LNMAD模型进行800次迭代训练,训练过程中的损失函数(即纵坐标的模型损失)的值如图5所示,很容易发现:在50次迭代内,损失函数值急剧下降。随着迭代次数的增加,损失在大约150次迭代后保持稳定,这表明训练过程的收敛。
为了验证拟合性能,我们将北京南站和天津南站之间高铁G123的实际运行状态作为LNMAD模型的输入,预测的参考速度曲线如图6所示。
为了验证所提出的速度跟踪控制器的性能,我们选择北京南站和天津站之间的高速铁路线作为研究案例,总长度约为122.3km。假设有6列列车在这个区段运行。参数Hs、Hc分别设置为2km和7km,相邻列车之间的参考车距为6km。初始速度和位置设置如表3。在初始状态下,每列列车根据实时状态,动态计算目标速度曲线,并根据上述给出的控制律计算控制力。基于BLF的控制器下1-6号列车的实际速度-距离曲线如图7所示。在图7中,实线表示实际列车速度,点划线表示参考速度。
表3不同列车的初始速度和位置数值设置表
Figure GDA0003874406310000182
从图7可以看出,使用基于BLF的速度跟踪控制器,所有六列列车都快速跟踪参考速度曲线,这证明了所提出的跟踪控制方法的有效性。在运行过程中,外界干扰使列车的实际状态偏离了参考曲线,这可能会降低高速列车的准点率。尽管如此,在所提出的控制策略下,实际速度曲线快速收敛到标称速度曲线,这表明所提出的方法处理扰动的鲁棒性。
为了证明在确保安全车距方面的性能,所提出的控制策略下的列车之间的车距变化曲线示意如图8所示。任意两列相邻列车之间的车距随着两列相邻列车之间的速度偏差而动态变化,最终稳定为标称行车间距。从图8可以看出,所有列车始终保持安全车距,直到每列列车到达车站。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所做的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引申出的显而易见的变化或变动仍处于本发明的保护范围之列。
本说明书中未做详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (10)

1.一种高速列车自主驾驶控制的实现方法,其特征在于,包括以下步骤:
S1、构建面向多属性数据的混合学习模型,作为参考速度曲线生成器;所述面向多属性数据的混合学习模型基于LSTM网络和FC网络;所述LSTM网络用于:处理数据中与时间相关的特征,所述FC网络用于:处理数据中的非时间相关特征;
S2、从观测值
Figure FDA0003882810610000011
中获得最近N个时间步长的输入状态序列,并获得训练数据集为:
Figure FDA0003882810610000012
其中,
Figure FDA0003882810610000013
表示:具有列车历史运行状态的序列;M是样本总数;
Figure FDA0003882810610000014
表示:列车i在t时刻的状态变量,
Figure FDA0003882810610000015
表示:列车i在t-p时刻的状态变量;p=0,1,2,…,N-1;
所述状态变量包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离;
将ξi作为训练面向多属性数据的混合学习模型的输入数据;
Figure FDA0003882810610000016
表示:列车i在预测范围T中的参考运行曲线;
Figure FDA0003882810610000017
表示:列车i在第t+q时刻的参考运行曲线,q=1,2,…,T;
所述参考运行曲线包括:列车的参考速度和参考位置信息;
Figure FDA0003882810610000018
作为训练面向多属性数据的混合学习模型的输出数据;
S3、根据步骤S2中获得的数据Dtrain,对参考速度曲线生成器进行训练;
S4、设置终端时间Te或终端距离Le,对于每列列车,执行以下步骤:
S4.1、在每个采样阶段t,测量每列列车i的瞬时列车速度vi(t)和位置xi(t)信息;
S4.2、将状态变量输入训练好的参考速度曲线生成器,获取参考速度曲线;
S4.3、设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器;
S4.4、所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标,并保证相邻列车之间的距离稳定到给定值的允许范围内。
2.如权利要求1所述的高速列车自主驾驶控制的实现方法,其特征在于:所述训练数据集为:
Figure FDA0003882810610000021
为历史驾驶数据;
利用所述历史驾驶数据对参考速度曲线生成器进行训练,训练面向多属性数据的混合学习模型的参数;
当测试的面向多属性数据的混合学习模型满足性能要求时,则将训练好的面向多属性数据的混合学习模型用作参考速度曲线生成器。
3.如权利要求1所述的高速列车自主驾驶控制的实现方法,其特征在于:在所述步骤S4.3中,针对多列高速列车的速度跟踪控制过程,考虑以下运营要求:
①期望运行间隔要求如式(1)所示,
limt→∞||xi-1(t)-xi(t)||=Hi-1,i (1)
其中,Hi-1,i是列车i-1与列车i之间的期望运行间隔,xi(t)表示:列车i在t时刻的位移,xi-1(t)表示:列车i-1在t时刻的位移;
②安全约束为:列车i与其前行列车的安全车头距离,如式(2)所示,
||xi-1(t)-xi(t)||≥Hs (2)
其中,Hs表示要求的最小安全距离;
③通信范围限制表示为式(3),
||xi-1(t)-xi(t)||≤Hc (3)
其中,Hc表示最小通信范围。
4.如权利要求3所述的高速列车自主驾驶控制的实现方法,其特征在于:所述障碍李雅普诺夫函数用于:同步不同列车之间的速度,如式(4)所示,
Figure FDA0003882810610000031
其中,zi,j=xi-xj表示:列车i和j之间的实际距离;Hi,j表示:列车i和j之间的预期距离;xi表示:列车i的实际位置;xj表示:列车j的实际位置;||zi,j||2表示:计算zi,j范数的二次方;
假设所有相邻列车之间的初始车距保持在(Hs,Hc)区间内,且速度初始偏差满足
Figure FDA0003882810610000032
表示:在初始时刻实际列车速度与标称值参考速度之间的偏差,δi表示:列车i的初始速度跟踪误差的阈值。
5.如权利要求4所述的高速列车自主驾驶控制的实现方法,其特征在于:所述步骤S4.4的具体步骤如下:
S4.4.1、基于步骤S4.2获得的参考速度曲线,计算位置偏差
Figure FDA0003882810610000033
和速度偏差
Figure FDA0003882810610000034
并将其状态传递给相邻列车;
S4.4.2、得到控制输入
Figure FDA0003882810610000035
进而得到给列车i施加的总控制力ui(t),并将得到的总控制力ui(t)施加到列车系统;
S4.4.3、根据新的测量,计算下一步j+1的状态偏差,设置迭代变量j=j+1,直到到达终端时间范围Te或列车到达终点站。
6.如权利要求5所述的高速列车自主驾驶控制的实现方法,其特征在于:所述控制输入
Figure FDA0003882810610000036
按照式(5)计算,
Figure FDA0003882810610000037
其中,αi按照式(6)计算;
Figure FDA0003882810610000038
表示:αi的导数,c1和c2为基本风阻系数;δi表示:列车i的初始速度跟踪误差的阈值;Gi按照式(7)计算;βi按照式(8)计算;
Figure FDA0003882810610000041
其中,Wi,j为:Wi,j(zi,j),η表示:关于变量
Figure FDA0003882810610000042
的函数;
Figure FDA0003882810610000043
表示:求解Wi,j中关于xi的梯度;
Figure FDA0003882810610000044
Figure FDA0003882810610000045
其中,
Figure FDA0003882810610000046
表示:实际列车速度与参考速度之间的偏差;
Figure FDA0003882810610000047
表示:实际列车位置与参考位置的偏差;
给列车i施加的总控制力ui(t)利用式(9)计算,
Figure FDA0003882810610000048
其中,mi为列车质量,
Figure FDA0003882810610000049
表示:列车处于平衡点时的控制力,用以抵消列车内力、基本阻力和附加阻力。
7.如权利要求6所述的高速列车自主驾驶控制的实现方法,其特征在于:
所述面向多属性数据的混合学习模型包括:编码器层、解码器层、全连接层和输出层;
所述编码器层与解码器层连接,所述解码器层与全连接层连接,所述全连接层与输出层连接;
所述编码器层用于:输入时间相关序列和非时间相关序列;
所述时间相关序列包括:列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离;
所述非时间相关序列包括:列车操作模式、控制等级和下一个限制速度的变化值;
所述编码器层与解码器层连接;
所述解码器层包括:若干LSTM网络和若干FC网络;
编码器层的时间相关序列传送给若干LSTM网络处理,编码器层的非时间相关序列传送给若干FC网络处理;
所述全连接层包括:连接网络和FC网络;
所述连接网络与全连接层中的FC网络连接;
解码器层处理的结果传送给连接网络,连接网络再将数据传送给全连接层中的FC网络;
所述输出层输出N个列车前面时刻的时间步长为T的运行状态数据序列;
所述运行状态包括:参考位置和参考速度。
8.如权利要求7所述的高速列车自主驾驶控制的实现方法,其特征在于:在所述解码器层,LSTM网络的记忆单元状态从最后时刻状态ct-1转移到当前时刻状态ct,隐藏状态从最后时刻状态ht-1转移到当前时刻状态ht
然后,LSTM网络的记忆单元状态ct和隐藏状态ht在下一时刻作为初始单元状态和隐藏状态,再传输到下一个LSTM网络的记忆单元;
同时,FC网络的权重参数在完成前向传播后,通过反向传播进行更新,并将更新后的权重参数作为下一时刻解码器层的初始状态。
9.如权利要求7所述的高速列车自主驾驶控制的实现方法,其特征在于:将所述面向多属性数据的混合学习模型输出的均方根误差作为损失函数,如式(10)所示,
Figure FDA0003882810610000051
其中,
Figure FDA0003882810610000052
表示:列车i在第t时刻的实际运行曲线;
输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化,假设输出采用x表示,则激活函数ReLU如式(11)所示:
Figure FDA0003882810610000061
10.如权利要求9所述的高速列车自主驾驶控制的实现方法,其特征在于:采用时间反向传播方法和自适应矩估计方法训练面向多属性数据的混合学习模型,具体步骤如下:
S3.1、获得训练数据集:
Figure FDA0003882810610000062
S3.2、初始化LSTM网络的权重参数
Figure FDA0003882810610000063
和FC网络的权重参数
Figure FDA0003882810610000064
S3.3、选择损失函数L(θ)作为目标函数,初始化时间步长t和机器学习率α;
S3.4、分别采用时间反向传播方法和自适应矩估计方法训练LSTM网络和FC网络;
S3.5、采用如式(12)和式(13)的方式对LSTM网络的权重参数和FC网络的权重参数进行更新,
Figure FDA0003882810610000065
Figure FDA0003882810610000066
其中,
Figure FDA0003882810610000067
为t时刻,LSTM网络的权重参数;
Figure FDA0003882810610000068
为t-1时刻,LSTM网络的权重参数;
Figure FDA0003882810610000069
为t时刻,FC网络的权重参数;
Figure FDA00038828106100000610
为t-1时刻,FC网络的权重参数;
Figure FDA00038828106100000611
表示:利用式(10)求解
Figure FDA00038828106100000612
的损失函数,
Figure FDA00038828106100000613
表示:求解
Figure FDA00038828106100000614
的梯度;
Figure FDA00038828106100000615
表示:利用式(10)求解
Figure FDA00038828106100000616
的损失函数,
Figure FDA00038828106100000617
表示:求解
Figure FDA00038828106100000618
的梯度;α表示:机器学习率;
S3.6:判断
Figure FDA00038828106100000619
Figure FDA00038828106100000620
之间的差,以及
Figure FDA00038828106100000621
Figure FDA00038828106100000622
之间的差是否满足阈值,当两者均满足阈值时,保存权重参数
Figure FDA00038828106100000623
Figure FDA00038828106100000624
否则,返回步骤S3.4。
CN202110995259.4A 2021-08-27 2021-08-27 一种高速列车自主驾驶控制的实现方法 Active CN113815679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110995259.4A CN113815679B (zh) 2021-08-27 2021-08-27 一种高速列车自主驾驶控制的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110995259.4A CN113815679B (zh) 2021-08-27 2021-08-27 一种高速列车自主驾驶控制的实现方法

Publications (2)

Publication Number Publication Date
CN113815679A CN113815679A (zh) 2021-12-21
CN113815679B true CN113815679B (zh) 2023-01-13

Family

ID=78913732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110995259.4A Active CN113815679B (zh) 2021-08-27 2021-08-27 一种高速列车自主驾驶控制的实现方法

Country Status (1)

Country Link
CN (1) CN113815679B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115195821B (zh) * 2022-06-14 2023-09-26 同济大学 一种后车跟驰行为控制方法、装置及存储介质
CN116245255B (zh) * 2023-03-30 2023-07-11 湖南大学 一种在线时空交通流预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862331A (zh) * 2017-10-31 2018-03-30 华中科技大学 一种基于时间序列及cnn的不安全行为识别方法及系统
CA2953953A1 (en) * 2017-01-06 2018-07-06 Applied Brain Research Inc. Methods and systems for extracting auditory features with neural networks
CN109635246A (zh) * 2018-12-06 2019-04-16 西南交通大学 一种基于深度学习的多属性数据建模方法
WO2020244134A1 (zh) * 2019-06-05 2020-12-10 华南理工大学 一种基于多任务特征共享神经网络的智能故障诊断方法
CN112633597A (zh) * 2020-12-30 2021-04-09 南京理工大学 基于rbf神经网络的地铁列车ato速度曲线预测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9989964B2 (en) * 2016-11-03 2018-06-05 Mitsubishi Electric Research Laboratories, Inc. System and method for controlling vehicle using neural network
CN108873691A (zh) * 2017-11-13 2018-11-23 华东交通大学 高速列车广义预测调优控制方法
CN108334889B (zh) * 2017-11-30 2020-04-03 腾讯科技(深圳)有限公司 摘要描述生成方法和装置、摘要描述模型训练方法和装置
CN109901572B (zh) * 2018-12-13 2022-06-28 华为技术有限公司 自动驾驶方法、训练方法及相关装置
CN109820525A (zh) * 2019-01-23 2019-05-31 五邑大学 一种基于cnn-lstm深度学习模型的驾驶疲劳识别方法
EP3800521B1 (en) * 2019-10-01 2023-07-26 Elektrobit Automotive GmbH Deep learning based motion control of a vehicle

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2953953A1 (en) * 2017-01-06 2018-07-06 Applied Brain Research Inc. Methods and systems for extracting auditory features with neural networks
CN107862331A (zh) * 2017-10-31 2018-03-30 华中科技大学 一种基于时间序列及cnn的不安全行为识别方法及系统
CN109635246A (zh) * 2018-12-06 2019-04-16 西南交通大学 一种基于深度学习的多属性数据建模方法
WO2020244134A1 (zh) * 2019-06-05 2020-12-10 华南理工大学 一种基于多任务特征共享神经网络的智能故障诊断方法
CN112633597A (zh) * 2020-12-30 2021-04-09 南京理工大学 基于rbf神经网络的地铁列车ato速度曲线预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Wang, X (Wang, Xi)1,3 ; Li, SK (Li, Shukai)2 ; Tang, T (Tang, Tao)2 ; .Intelligent operation of heavy haul train with data imbalance: A machine learning method.《Knowledge-Based Systems》.2019,第163卷 *
王悉.基于机器学习的重载列车智能驾驶方法研究.《中国优秀博硕士学位论文全文数据库(博士)》.2018, *

Also Published As

Publication number Publication date
CN113815679A (zh) 2021-12-21

Similar Documents

Publication Publication Date Title
CN113815679B (zh) 一种高速列车自主驾驶控制的实现方法
CN112193280B (zh) 一种重载列车强化学习控制方法及系统
CN110969848B (zh) 一种对向双车道下基于强化学习的自动驾驶超车决策方法
CN111098852B (zh) 一种基于强化学习的泊车路径规划方法
CN112084636A (zh) 一种多列车协同控制方法和装置
CN102298326B (zh) 欠驱动auv自适应轨迹跟踪控制装置及控制方法
Valasek et al. Improved adaptive–reinforcement learning control for morphing unmanned air vehicles
CN111145552B (zh) 基于5g网络的车辆动态换道轨迹的规划方法
CN109765887A (zh) 一种自动驾驶控制方法
CN103324085A (zh) 基于监督式强化学习的最优控制方法
WO2014003151A2 (en) Method for determining an optimal run-curve for a vehicle
CN106056238B (zh) 列车区间运行轨迹的规划方法
CN114199248B (zh) 一种基于混合元启发算法优化anfis的auv协同定位方法
CN112965476A (zh) 一种基于多窗口抽样的高速无人车轨迹规划系统及方法
CN115392111B (zh) 一种列车追踪控制方法、设备、存储介质
Li et al. A deep reinforcement learning based approach for autonomous overtaking
CN113901718A (zh) 一种跟驰状态下基于深度强化学习的驾驶避撞优化方法
Wang et al. A generative adversarial network based learning approach to the autonomous decision making of high-speed trains
CN115320596A (zh) 一种智能网联车队插入式协同换道控制方法
CN115273450A (zh) 一种网联自动驾驶环境下车辆进入编队的换道方法
Wang et al. Stochastic speed prediction for connected vehicles using improved bayesian networks with back propagation
CN114074680B (zh) 基于深度强化学习的车辆换道行为决策方法及系统
CN117104310A (zh) 基于数据驱动预测控制的虚拟编组控制方法及系统
Chen et al. Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control
Malikopoulos et al. A State-Space Representation Model and Learning Algorithm for Real-Time Decision-Making Under Uncertainty

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant