CN113815679B

CN113815679B - 一种高速列车自主驾驶控制的实现方法

Info

Publication number: CN113815679B
Application number: CN202110995259.4A
Authority: CN
Inventors: 王悉; 李树凯; 杨立兴; 辛天鹏
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2023-01-13
Anticipated expiration: 2041-08-27
Also published as: CN113815679A

Abstract

本发明属于列车控制技术领域，涉及一种高速列车自主驾驶控制的实现方法，包括：构建LNMAD模型，作为参考速度曲线生成器；利用训练数据集对参考速度曲线生成器训练；测量列车瞬时速度和位置；输入训练好的参考速度曲线生成器，获取参考速度曲线；速度跟踪控制器以参考速度曲线为跟踪目标，保证相邻列车距离稳定到允许范围内。本发明考虑多属性实际驾驶数据，提出结合LSTM网络和全连接网络处理时间和非时间相关特征，使得参考速度曲线生成器输出相对真实的参考速度曲线。本发明的速度跟踪控制器以参考速度曲线为跟踪目标，实现：高速列车跟踪参考速度曲线；两相邻列车之间的距离保持在适当范围内；相邻列车车头间距收敛到稳定值。

Description

一种高速列车自主驾驶控制的实现方法

技术领域

本发明属于列车控制技术领域，涉及一种高速列车自主驾驶控制的实现方法。

背景技术

在人工智能(AI)和先进控制技术发展的推动下，自主驾驶系统的发展在过去几十年中受到越来越多的关注。如今，自主驾驶技术已广泛应用于各种交通工具，例如：无人驾驶汽车、移动机器人、船舶和矿山地下车辆等。与其他交通运输系统相比，高铁线路绵延数千公里，而且高铁的运行环境非常复杂。高速列车的自主驾驶控制系统还需要满足更高的安全水平，对突发交通需求的快速适应和更精确地调整到站时间等附加约束，这些都增加了设计高效高速列车自主驾驶系统的难度。

高速列车自主驾驶控制系统能够适应复杂的运行环境，并根据动态条件做出适当的决策。因此，决策能力是高速列车自主驾驶控制最重要和最具挑战性的部分之一，其核心任务包括：参考速度曲线动态生成和跟踪控制。传统上，在车载设备上会预先存储一系列参考速度曲线，这些参考速度曲线对应于不同的运行场景。运行过程中，驾驶员根据实际运行情况选择相应的速度曲线。而自主驾驶系统通过与外部环境交互，对自身的运行状态进行自主感知和分析，并且基于实时更新的状态信息计算参考速度曲线。基于此，列车控制器实现对下一步动作的快速决策，使得列车加速或制动，从而实现对于参考速度曲线的精确追踪。

本发明将深度学习技术与反步控制理论相结合，提出了一种高速列车自主驾驶控制的实现方法。该实现方法由参考速度曲线生成器和速度跟踪控制器两部分组成。参考速度曲线生成器根据列车的实时状态信息来动态计算参考速度曲线。本发明采用深度学习方法，利用实际行车数据对参考速度曲线生成器进行离线训练，训练完成后，该生成器可以根据列车实时运行状态计算列车速度参考曲线。在此基础上，基于障碍李雅普诺夫函数(BarrierLyapunovFunction,BLF)设计了速度跟踪控制器。速度跟踪控制器将参考速度曲线生成器计算的参考速度曲线作为跟踪目标，在满足安全约束和通信限制条件下，保证相邻列车之间的距离稳定到给定值的允许范围内，从而实现列车群的编队运行。

发明内容

本发明提出了一种新的高速列车自主驾驶控制的实现方法。所提出的方法由两部分组成，包括：参考速度曲线生成器和基于反步法的速度跟踪控制器。参考速度曲线生成器负责计算动态参考速度曲线。考虑到实际列车驾驶数据的多种属性，本发明提出了一种结合LSTM神经网络(Long Short Term Mermory network,LSTM)和全连接神经网络(FullyConnected,FC)的混合学习模型来处理时间相关序列和非时间相关序列，使得参考速度曲线生成器根据实时更新的驾驶情况输出参考速度曲线。基于反步控制技术，设计的基于BLF的速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标，并保证相邻列车之间的距离稳定到给定值的允许范围内。本发明具体采用以下技术方案。

一种高速列车自主驾驶控制的实现方法，包括以下步骤：

S1、构建面向多属性数据的混合学习模型(LNMAD模型)，作为参考速度曲线生成器；

S2、从观测值

中获得最近N个时间步长的输入状态序列，并获得训练数据集为：

其中，

表示：具有列车历史运行状态的序列；M是样本总数；

表示：列车i在t时刻的状态变量，

表示：列车i在t时刻前，第p个采样点的状态变量；p＝1,2,…,N-1；N表示采样点个数；

所述状态变量包括：列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离；

将ξ_i作为训练面向多属性数据的混合学习模型的输入数据；

表示：列车i在预测范围T中的参考运行曲线；

表示：列车i在第t+q时刻的参考运行曲线，q＝1,2,…,T；

所述参考运行曲线包括：列车的参考速度和参考位置信息；

将

作为训练面向多属性数据的混合学习模型的输出数据；

S3、根据步骤S2中获得的数据D_train，对参考速度曲线生成器进行训练；

S4、设置终端时间T_e或终端距离L_e，对于每列列车，执行以下步骤：

S4.1、在每个采样阶段t，测量每列列车i的瞬时列车速度v_i(t)和位置x_i(t)信息；

S4.2、将状态变量输入训练好的参考速度曲线生成器，获取参考速度曲线；

S4.3、设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器；

S4.4、所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标，并保证相邻列车之间的距离稳定到给定值的允许范围内。

在上述技术方案的基础上，所述训练数据集为：

为历史驾驶数据；

利用所述历史驾驶数据对参考速度曲线生成器进行训练，训练面向多属性数据的混合学习模型的参数；

当测试的面向多属性数据的混合学习模型满足性能要求时，则将训练好的面向多属性数据的混合学习模型用作参考速度曲线生成器。

在上述技术方案的基础上，在所述步骤S4.3中，针对多列高速列车的速度跟踪控制过程，考虑以下运营要求：

①期望运行间隔要求如式(1)所示，

lim_t→∞||x_i-1(t)-x_i(t)||＝H_i-1，i (1)

其中，H_i-1,i是列车i-1与列车i之间的期望运行间隔，x_i(t)表示：列车i在t时刻的位移，x_i-1(t)表示：列车i-1在t时刻的位移；

②安全约束为：列车i与其前行列车的安全车头距离，如式(2)所示，

||x_i-1(t)-x_i(t)||≥H_s (2)

其中，H_s表示要求的最小安全距离；

③通信范围限制表示为式(3)，

||x_i-1(t)-x_i(t)||≤H_c (3)

其中，H_c表示最小通信范围。

在上述技术方案的基础上，所述障碍李雅普诺夫函数用于：同步不同列车之间的速度，如式(4)所示，

其中，z_i,j＝x_i-x_j表示：列车i和j之间的实际距离；H_i,j表示：列车i和j之间的预期距离；x_i表示：列车i的实际位置；x_j表示：列车j的实际位置；||z_i，j||²表示：计算z_i,j范数的二次方；

假设所有相邻列车之间的初始车距保持在(H_s,H_c)区间内，且速度初始偏差满足

表示：在初始时刻实际列车速度与标称值参考速度之间的偏差，δ_i表示：列车i的初始速度跟踪误差的阈值。

在上述技术方案的基础上，所述步骤S4.4的具体步骤如下：

S4.4.1、基于步骤S4.2获得的参考速度曲线，计算位置偏差

和速度偏差

并将其状态传递给相邻列车；

S4.4.2、得到控制输入

进而得到给列车i施加的总控制力u_i(t),并将得到的总控制力u_i(t)施加到列车系统；

S4.4.3、根据新的测量，计算下一步j+1的状态偏差，设置迭代变量j＝j+1，直到到达终端时间范围T_e或列车到达终点站。

在上述技术方案的基础上，所述控制输入

按照式(5)计算，

其中，α_i按照式(6)计算；

表示：α_i的导数，c₁和c₂为基本风阻系数；δ_i表示：列车i的初始速度跟踪误差的阈值；G_i按照式(7)计算；β_i按照式(8)计算；

其中，W_i，j为：W_i，j(z_i，j)，η表示：关于变量

的函数；

表示：求解W_i,j中关于x_i的梯度；

其中，

表示：实际列车速度与参考速度之间的偏差；

表示：实际列车位置与参考位置的偏差；

给列车i施加的总控制力u_i(t)利用式(9)计算，

其中，m_i为列车质量，

表示：列车处于平衡点时的控制力，用以抵消列车内力、基本阻力和附加阻力。

在上述技术方案的基础上，所述面向多属性数据的混合学习模型基于LSTM网络和FC网络；

所述LSTM网络用于：处理数据中与时间相关的特征，所述FC网络用于：处理数据中的非时间相关特征；

所述面向多属性数据的混合学习模型包括：编码器层、解码器层、全连接层和输出层；

所述编码器层与解码器层连接，所述解码器层与全连接层连接，所述全连接层与输出层连接；

所述编码器层用于：输入时间相关序列和非时间相关序列；

所述时间相关序列包括：列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离；

所述非时间相关序列包括：列车操作模式、控制等级和下一个限制速度的变化值；

所述编码器层与解码器层连接；

所述解码器层包括：若干LSTM网络和若干FC网络；

编码器层的时间相关序列传送给若干LSTM网络处理，编码器层的非时间相关序列传送给若干FC网络处理；

所述全连接层包括：连接网络和FC网络；

所述连接网络与全连接层中的FC网络连接；

解码器层处理的结果传送给连接网络，连接网络再将数据传送给全连接层中的FC网络；

所述输出层输出N个列车前面时刻的时间步长为T的运行状态数据序列；

所述运行状态包括：参考位置和参考速度。

在上述技术方案的基础上，在所述解码器层，LSTM网络的记忆单元状态从最后时刻状态c_t-1转移到当前时刻状态c_t，隐藏状态从最后时刻状态h_t-1转移到当前时刻状态h_t；

然后，LSTM网络的记忆单元状态c_t和隐藏状态h_t在下一时刻作为初始单元状态和隐藏状态，再传输到下一个LSTM网络的记忆单元；

同时，FC网络的权重参数在完成前向传播后，通过反向传播进行更新，并将更新后的权重参数作为下一时刻解码器层的初始状态。

在上述技术方案的基础上，将所述面向多属性数据的混合学习模型输出的均方根误差作为损失函数，如式(10)所示，

其中，

表示：列车i在第t时刻的实际运行曲线；

输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化，假设输出采用x表示，则激活函数ReLU如式(11)所示。

在上述技术方案的基础上，采用时间反向传播方法和自适应矩估计方法训练面向多属性数据的混合学习模型，具体步骤如下：

S3.1、获得训练数据集：

S3.2、初始化LSTM网络的权重参数

和FC网络的权重参数

S3.3、选择损失函数L(θ)作为目标函数，初始化时间步长t和机器学习率α；

S3.4、分别采用时间反向传播方法和自适应矩估计方法训练LSTM网络和FC网络；

S3.5、采用如式(12)和式(13)的方式对LSTM网络的权重参数和FC网络的权重参数进行更新，

其中，

为t时刻，LSTM网络的权重参数；

为t-1时刻，LSTM网络的权重参数；

为t时刻，FC网络的权重参数；

为t-1时刻，FC网络的权重参数；

表示：利用式(10)求解

的损失函数，

表示：求解

的梯度；

表示：利用式(10)求解

的损失函数，

表示：求解

的梯度；α表示：机器学习率；

S3.6：判断

和

之间的差，以及

和

之间的差是否满足阈值，当两者均满足阈值时，保存权重参数

和

否则，返回步骤S3.4。

本发明的有益技术效果如下：

本发明将深度学习技术与反步控制理论相结合，提出了一种高速列车自主驾驶控制的实现方法。本发明设计的参考速度曲线生成器和速度跟踪控制策略的效益主要体现在以下几个方面。

第一方面：本发明考虑到多属性的实际驾驶数据，提出了一种结合LSTM循环神经网络和全连接神经网络的混合学习网络来处理数据中的时间相关特征和非时间相关特征，使得参考速度曲线生成器能够输出相对真实的参考速度曲线。

第二方面：本发明设计的基于BLF的反步控制器(即速度跟踪控制器)以参考速度曲线生成器中的参考速度曲线作为跟踪目标，实现以下功能：(1)高速列车跟踪参考速度曲线；(2)两列相邻列车之间的距离保持在(H_s,H_c)的适当范围内；(3)相邻列车i-1和i的车头间距收敛到一个稳定值H_i-1,i。

附图说明

本发明有如下附图：

图1为发明所述高速列车自主驾驶控制的实现方法的总体框架示意图；

图2为参考速度曲线生成器的设计流程示意图；

图3为面向多属性数据的混合学习模型的网络结构示意图；

图4为LNMAD网络中的数据流和模型架构示意图；

图5为训练LNMAD模型的模型损失变化曲线示意图；

图6为LNMAD模型的性能预测曲线示意图；

图7中(a)图为基于BLF的速度控制器下1号列车的实际速度与目标速度的变化曲线比较示意图；

图7中(b)图为基于BLF的速度控制器下2号列车的实际速度与目标速度的变化曲线比较示意图；

图7中(c)图为基于BLF的速度控制器下3号列车的实际速度与目标速度的变化曲线比较示意图；

图7中(d)图为基于BLF的速度控制器下4号列车的实际速度与目标速度的变化曲线比较示意图；

图7中(e)图为基于BLF的速度控制器下5号列车的实际速度与目标速度的变化曲线比较示意图；

图7中(f)图为基于BLF的速度控制器下6号列车的实际速度与目标速度的变化曲线比较示意图；

图8为相邻列车之间的距离变化曲线示意图。

具体实施方式

为了更清楚地说明本发明，下面结合优选实例和附图对本发明做进一步的说明。本领域技术人员应当理解，下面所具体描述的内容是说明性的，而非限制性的，不应以此限制本发明的保护范围。

本发明提出了一种新的高速列车自主驾驶控制的实现方法。所提出的方法由两部分组成，包括：参考速度曲线生成器和基于反步法的速度跟踪控制器。参考速度曲线生成器负责计算动态参考速度曲线。考虑到实际列车驾驶数据的多种属性，本发明提出了一种结合LSTM神经网络(Long Short Term Memory network,LSTM)和全连接神经网络(FullyConnected,FC)的面向多属性数据的混合学习模型来处理时间相关序列和非时间相关序列，使得参考速度曲线生成器根据实时更新的驾驶情况(即由感知定位模块获得的车载数据库的线路数据和由传感器传送的实时状态)，输出参考速度曲线(即图1中的参考曲线)。基于反步控制技术，设计的基于BLF的速度跟踪控制器(即图1中的反步跟踪控制器)以参考速度曲线生成器生成的参考速度曲线作为跟踪目标，并保证相邻列车之间的距离稳定到给定值的允许范围内。本发明所述高速列车自主驾驶控制的实现方法的总体框架示意图如图1所示。

首先，设计参考速度曲线生成器

参考速度曲线生成器的设计可以分为离线训练过程(即图2中的模型训练(离线))和在线预测过程(即图2中的预测和控制(在线))两个步骤，如图2所示。在训练过程中，训练预测算法学习模型的(即面向多属性数据的混合学习模型，图2中的学习算法)参数。一旦测试的预测算法学习模型满足性能要求，它就可以用作参考速度曲线生成器，根据实时驾驶情况提供参考曲线。

将具有列车历史运行状态的序列作为输入数据，用向量

表示，其中，

表示：列车i在t时刻的状态变量，

表示：列车i在t时刻前，第p个采样点的状态变量，其中，p＝1,2,…,N-1。

所述状态变量包括：列车的位置、速度、加速度、相邻列车之间的间距、列车相对于前列列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离等，N表示采样点个数。

将列车i在预测范围T中的参考运行曲线

表示为向量

其中，

表示：列车i在第t+q时刻的参考运行曲线，其中，q＝1,2,…,T；所述参考运行曲线包括：列车的参考速度和参考位置信息。

在离线训练阶段，使用列车历史运行数据ξ_i作为参考速度曲线生成器的输入，将

作为输出，基于高速列车实际运行数据来对参考速度曲线生成器进行训练。

考虑到高速列车实际运行数据的特征，本文基于LSTM网络和FC网络，提出了面向多属性数据的混合学习模型(Learning Network for Multiple Attribute Data,LNMAD)来分别处理具有不同属性的数据；其中，LSTM网络用于处理数据中与时间相关的特征(即图3中的时间相关序列)，而FC网络则处理数据中的非时间相关特征(即图3中的非时间相关序列)。LNMAD模型的架构如图3所示，由编码器层、解码器层、全连接层和输出层组成。在所提出的架构中，LNMAD将得到N个列车前面时刻的时间步长为T的运行状态数据序列，编码器层负责分析驾驶情况不同因素之间的相关性，并产生先前时间和空间序列的表示。

在解码器层，LSTM网络的记忆单元状态从最后时刻状态c_t-1转移到当前时刻状态c_t，隐藏状态从最后时刻状态h_t-1转移到当前时刻状态h_t。然后，来自解码器层的存储单元状态c_t和隐藏状态h_t在下一时刻作为初始单元状态和隐藏状态，再传输到解码器层的下一个LSTM网络的记忆单元。

最后，全连接层通过将神经元连接起来，输出未来时刻列车的理想位置和速度(即图3中输出层的参考位置和参考速度)，重复T次训练过程，最终生成输出序列

由本文使用预测范围内面向多属性数据的混合学习模型输出的均方根误差(RMSE)作为损失函数，如式(10)所示，

在训练过程中，

表示：列车i在t时刻的实际运行曲线，可以列车历史运行数据的训练集中获得，

作为

的预测值。

另外，为了增强面向多属性数据的混合学习模型网络的学习能力，面向多属性数据的混合学习模型输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化，假设输出采用x表示，则激活函数ReLU如式(11)所示。

根据实际列车运行数据建立训练样本。然后，采用时间反向传播方法(BPTT)和自适应矩估计方法(Adam)训练基于LSTM的编码器-解码器模型(即面向多属性数据的混合学习模型)。模型训练的步骤如下：

S3.1：从可用观测值

其中，M是样本总数；

S3.2：初始化LSTM网络的权重参数

和FC网络的权重参数

S3.3：选择损失函数L(θ)作为目标函数，初始化时间步长t和机器学习率α；

S3.4：分别采用BPTT和Adam算法训练LSTM网络和FC网络；

S3.5：采用如下方式对LSTM网络的权重参数

和FC网络的权重参数

进行更新，

其中，

为t时刻，LSTM网络的权重参数；

为t-1时刻，LSTM网络的权重参数；

为t时刻，FC网络的权重参数；

为t-1时刻，FC网络的权重参数；

表示：利用式(10)求解

的损失函数，

表示：求解

的梯度；

表示：利用式(10)求解

的损失函数，

表示：求解

的梯度；α表示：机器学习率；

S3.6：判断

和

之间的差，以及

和

和

否则，返回步骤S3.4。

然后，设计速度跟踪控制器

针对多列高速列车的速度跟踪控制过程，考虑以下运营要求：

(1)期望运行间隔：对于稳定状态，相邻列车之间的间隔应稳定在适当的距离，如式(1)所示，

lim_t→∞||x_i-1(t)-x_i(t)||＝H_i-1，i (1)

其中，H_i-1,i是列车i-1与列车i之间的期望运行间隔，x_i(t)表示：列车i在t时刻的位移，x_i-1(t)表示：列车i-1在t时刻的位移。

(2)安全约束：要实现多列列车的安全运行，应考虑相邻两列列车之间的安全车距。列车i与其前行列车的安全车头距离由式(2)给出，

||x_i-1(t)-x_i(t)||≥H_s (2)

其中，H_s表示要求的最小安全距离。

(3)通信范围限制：由于车车(Train-to-Train，T2T)通信的限制，一列列车只能在一个限制区域内接收其他列车的信息，表示为式(3)，

||x_i-1(t)-x_i(t)||≤H_c (3)

其中，H_c表示最小通信范围。

定义v_i(t)表示：列车i在t时刻的速度，

和

分别表示：列车i在t时刻的参考速度和位移。

表示：实际列车位置(即列车i在t时刻的位移)与参考位置(列车i在t时刻的参考位移)的偏差，

表示：实际列车速度与参考速度之间的偏差。

为了满足以上运营要求，引入BLF函数来同步不同列车之间的速度，即在不违反约束的情况下实现速度跟踪控制。构建的BLF函数如式(4)所示，

其中，z_i,j＝x_i-x_j和H_i,j分别是列车i和j之间的实际距离和预期距离，x_i和x_j表示列车i和j的实际位置，||z_i，j||²表示：计算z_i,j范数的二次方。从式(4)中容易注意到，随着相邻列车之间的实际距离接近最大通信距离H_c，W_i,j的值会增加到无穷大。随着‖z_i,j‖的值减小，并接近H_s，即相邻列车趋向于发生碰撞，W_i,j也趋于无穷大，对于任意H_s<‖z_i,j‖<H_c，满足W_i,j≥0，当且仅当z_i,j＝H_i,j时W_i,j＝0。

表示：在初始时刻实际列车速度与标称值参考速度之间的偏差，δ_i表示：列车i的初始速度跟踪误差的阈值。即高速列车的初始状态保持在集合

内，其中

按照式(5)和(6)设计跟踪控制律和虚拟控制输入，

其中，

表示：α_i的导数，η表示：关于变量

的函数，

表示：求解W_i,j中关于x_i的梯度；G_i按照式(7)计算；β_i按照式(8)计算，c₁和c₂为基本风阻系数；

其中，

给列车i施加的总控制力u_i(t)利用式(9)计算，

其中，u_i(t)表示：给列车i施加的总控制力，

表示：列车处于平衡点时的控制力，用以抵消列车内力、基本阻力和附加阻力。m_i为列车质量。高速列车能够实现对于参考速度曲线的精确跟踪；在运行过程中，相邻列车i-1和i的车头距离稳定在一个稳定值H_i-1,i，同时，安全约束和通信范围约束形式得到保证。

结合参考速度生成器和跟踪控制器的设计，实现高速列车自主驾驶控制的主要步骤总结如下：

S1：构建LNMAD模型，作为参考速度曲线生成器；

S2：从观测值

其中，

表示：具有列车历史运行状态的序列；M是样本总数；

表示：列车i在t时刻的状态变量，

所述状态变量包括：列车的位置、速度、加速度、列车之间的间距、列车相对于前面列车的相对速度、列车操作模式、控制等级、下一个限制速度的变化值和到下一个限速区域的剩余距离；

将ξ_i作为训练面向多属性数据的混合学习模型的输入数据；

表示：列车i在预测范围T中的参考运行曲线；

表示：列车i在第t+q时刻的参考运行曲线，q＝1,2,…,T；

所述参考运行曲线包括：列车的参考速度和参考位置信息；

将

作为训练面向多属性数据的混合学习模型的输出数据；

S3：根据步骤S1中获得的数据D_train，对参考速度曲线生成器进行训练；

S4：设置终端时间T_e或终端距离L_e。对于每列列车，并执行以下步骤：

S4.1：在每个采样阶段t，测量每列列车i的瞬时列车速度v_i(t)和位置x_i(t)信息；

S4.2：将状态变量输入参考速度曲线生成器，获取参考速度曲线；

S4.3：设计基于反步控制技术和障碍李雅普诺夫函数的速度跟踪控制器；

S4.4：所述速度跟踪控制器以参考速度曲线生成器生成的参考速度曲线作为跟踪目标，并保证相邻列车之间的距离稳定到给定值的允许范围内，具体步骤如下：

S4.4.1：基于步骤S4.2获得的参考速度曲线，计算位置偏差

和速度偏差

并将位置偏差

和速度偏差

传递给相邻列车；

S4.4.2：得到控制输入

S4.4.3：根据新的测量，计算下一步j+1的状态偏差，设置迭代变量j＝j+1，直到到达终端时间范围T_e或列车到达终点站。

为了验证本发明所述方法的实施效果，利用京沪(B-S)高速铁路的实际运行数据对提出的参考速度曲线生成器进行训练。现场数据集由2019年4月1日至2019年4月15日收集的113条实际列车运行记录组成。每个样本中的时间相关信息包括：瞬时列车位置(即列车的位置)、速度、相邻列车之间的车距、列车相对于前列列车的相对速度以及到下一个限速区域的剩余距离。与时间无关的信息包括：列车操作模式、控制手柄级别(即控制等级)和下一个限制速度的变化值。

为了获得更准确的参考速度曲线预测模型(即面向多属性数据的混合学习模型)，通过实验来确定模型架构和参数，包括：网络深度、每层神经元数量和数据样本的步长。不同神经元的结果如表1所示。当每层神经元数量较少时，数据拟合不足，验证损失随着LNMAD网络每层神经元的增加而减少。当神经元数量达到128时，模型容易出现过拟合。根据表1中的实验结果，我们选择第一层128个神经元和第二层64个神经元。

表1第一层(N₁)和第二层(N₂)中不同数量的神经元的仿真结果对比表

数据样本的步长可根据实际情况选择。一般来说，输入数据的步长越长，神经网络从前一次得到的信息就越多。我们最初选择步长为20，每次将值减少2，直到等于4。迭代次数设置为100，结果如表2所示。从实验结果我们注意到验证损失函数的值与数据样本的步长有关。相比之下，步长为14时，验证损失的性能更好。LNMAD网络中的数据流和模型构架示意如图4所示，其中LSTM网络的输入表示为(M,14,1)，FC网络的输入表示为(M,14)，M是训练或测试数据的数量。

表2不同步长的仿真结果比较表

将得到的网络结构，处理后的样本送入LNMAD模型进行800次迭代训练，训练过程中的损失函数(即纵坐标的模型损失)的值如图5所示，很容易发现：在50次迭代内，损失函数值急剧下降。随着迭代次数的增加，损失在大约150次迭代后保持稳定，这表明训练过程的收敛。

为了验证拟合性能，我们将北京南站和天津南站之间高铁G123的实际运行状态作为LNMAD模型的输入，预测的参考速度曲线如图6所示。

为了验证所提出的速度跟踪控制器的性能，我们选择北京南站和天津站之间的高速铁路线作为研究案例，总长度约为122.3km。假设有6列列车在这个区段运行。参数H_s、H_c分别设置为2km和7km，相邻列车之间的参考车距为6km。初始速度和位置设置如表3。在初始状态下，每列列车根据实时状态，动态计算目标速度曲线，并根据上述给出的控制律计算控制力。基于BLF的控制器下1-6号列车的实际速度-距离曲线如图7所示。在图7中，实线表示实际列车速度，点划线表示参考速度。

表3不同列车的初始速度和位置数值设置表

从图7可以看出，使用基于BLF的速度跟踪控制器，所有六列列车都快速跟踪参考速度曲线，这证明了所提出的跟踪控制方法的有效性。在运行过程中，外界干扰使列车的实际状态偏离了参考曲线，这可能会降低高速列车的准点率。尽管如此，在所提出的控制策略下，实际速度曲线快速收敛到标称速度曲线，这表明所提出的方法处理扰动的鲁棒性。

为了证明在确保安全车距方面的性能，所提出的控制策略下的列车之间的车距变化曲线示意如图8所示。任意两列相邻列车之间的车距随着两列相邻列车之间的速度偏差而动态变化，最终稳定为标称行车间距。从图8可以看出，所有列车始终保持安全车距，直到每列列车到达车站。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所做的举例，而并非是对本发明的实施方式的限定，对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引申出的显而易见的变化或变动仍处于本发明的保护范围之列。

本说明书中未做详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种高速列车自主驾驶控制的实现方法，其特征在于，包括以下步骤：

S1、构建面向多属性数据的混合学习模型，作为参考速度曲线生成器；所述面向多属性数据的混合学习模型基于LSTM网络和FC网络；所述LSTM网络用于：处理数据中与时间相关的特征，所述FC网络用于：处理数据中的非时间相关特征；

S2、从观测值

其中，

表示：具有列车历史运行状态的序列；M是样本总数；

表示：列车i在t时刻的状态变量，

表示：列车i在t-p时刻的状态变量；p＝0,1,2,…,N-1；

将ξ_i作为训练面向多属性数据的混合学习模型的输入数据；

表示：列车i在预测范围T中的参考运行曲线；

表示：列车i在第t+q时刻的参考运行曲线，q＝1,2,…,T；

所述参考运行曲线包括：列车的参考速度和参考位置信息；

将

作为训练面向多属性数据的混合学习模型的输出数据；

2.如权利要求1所述的高速列车自主驾驶控制的实现方法，其特征在于：所述训练数据集为：

为历史驾驶数据；

3.如权利要求1所述的高速列车自主驾驶控制的实现方法，其特征在于：在所述步骤S4.3中，针对多列高速列车的速度跟踪控制过程，考虑以下运营要求：

①期望运行间隔要求如式(1)所示，

lim_t→∞||x_i-1(t)-x_i(t)||＝H_i-1，i (1)

||x_i-1(t)-x_i(t)||≥H_s (2)

其中，H_s表示要求的最小安全距离；

③通信范围限制表示为式(3)，

||x_i-1(t)-x_i(t)||≤H_c (3)

其中，H_c表示最小通信范围。

4.如权利要求3所述的高速列车自主驾驶控制的实现方法，其特征在于：所述障碍李雅普诺夫函数用于：同步不同列车之间的速度，如式(4)所示，

5.如权利要求4所述的高速列车自主驾驶控制的实现方法，其特征在于：所述步骤S4.4的具体步骤如下：

S4.4.1、基于步骤S4.2获得的参考速度曲线，计算位置偏差

和速度偏差

并将其状态传递给相邻列车；

S4.4.2、得到控制输入

6.如权利要求5所述的高速列车自主驾驶控制的实现方法，其特征在于：所述控制输入

按照式(5)计算，

其中，α_i按照式(6)计算；

其中，W_i，j为：W_i，j(z_i，j)，η表示：关于变量

的函数；

表示：求解W_i,j中关于x_i的梯度；

其中，

表示：实际列车速度与参考速度之间的偏差；

表示：实际列车位置与参考位置的偏差；

给列车i施加的总控制力u_i(t)利用式(9)计算，

其中，m_i为列车质量，

7.如权利要求6所述的高速列车自主驾驶控制的实现方法，其特征在于：

所述编码器层用于：输入时间相关序列和非时间相关序列；

所述编码器层与解码器层连接；

所述解码器层包括：若干LSTM网络和若干FC网络；

所述全连接层包括：连接网络和FC网络；

所述连接网络与全连接层中的FC网络连接；

所述运行状态包括：参考位置和参考速度。

8.如权利要求7所述的高速列车自主驾驶控制的实现方法，其特征在于：在所述解码器层，LSTM网络的记忆单元状态从最后时刻状态c_t-1转移到当前时刻状态c_t，隐藏状态从最后时刻状态h_t-1转移到当前时刻状态h_t；

9.如权利要求7所述的高速列车自主驾驶控制的实现方法，其特征在于：将所述面向多属性数据的混合学习模型输出的均方根误差作为损失函数，如式(10)所示，

其中，

表示：列车i在第t时刻的实际运行曲线；

输出层输出的参考位置和参考速度都通过激活函数ReLU进行非线性化，假设输出采用x表示，则激活函数ReLU如式(11)所示：

10.如权利要求9所述的高速列车自主驾驶控制的实现方法，其特征在于：采用时间反向传播方法和自适应矩估计方法训练面向多属性数据的混合学习模型，具体步骤如下：

S3.1、获得训练数据集：

S3.2、初始化LSTM网络的权重参数

和FC网络的权重参数

其中，

为t时刻，LSTM网络的权重参数；

为t-1时刻，LSTM网络的权重参数；

为t时刻，FC网络的权重参数；

为t-1时刻，FC网络的权重参数；

表示：利用式(10)求解

的损失函数，

表示：求解

的梯度；

表示：利用式(10)求解

的损失函数，

表示：求解

的梯度；α表示：机器学习率；

S3.6：判断

和

之间的差，以及

和

和

否则，返回步骤S3.4。