CN112308336B

CN112308336B - 一种基于多步时序预测的高速铁路大风限速动态处置方法

Info

Publication number: CN112308336B
Application number: CN202011295709.0A
Authority: CN
Inventors: 陈积明; 刘晨; 贺诗波; 刘昊俣
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-11-18
Filing date: 2020-11-18
Publication date: 2023-12-19
Anticipated expiration: 2040-11-18
Also published as: CN112308336A

Abstract

本发明公开了一种基于多步时序预测的高速铁路大风限速动态处置方法，本发明在离线训练阶段采用基于自注意力的多步时序预测模型，预测精度更高；采用基于动态时间规整的训练策略训练预测模型，能够把握目标序列的形状特征；本发明提出的区段设置方法考虑了未来时刻的多点风速，增设了潜在大风区段，解决了大风区段设置不及时导致的安全问题和时间设置过长导致的低效问题；本发明方法考虑了大风持续时间，过滤掉不必要的限速指令下达，提高了列车运行效率和乘客满意度。

Description

一种基于多步时序预测的高速铁路大风限速动态处置方法

技术领域

本发明属于智慧交通领域，具体的，涉及一种基于多步时序预测的高速铁路大风限速动态处置方法。

背景技术

随着社会经济的不断发展，高速铁路已经成为一种重要的出行方式，如何保证列车运行稳定性和提高乘客满意度是一个重要目标。在实际运行环境中，沿线大风是发生频率较高的自然灾害之一，其规律性和可预测性较差。当大风超过一定风速阈值时，其所施加的横向力会直接威胁列车运行安全。因此，列车调度员需及时设置大风报警限速区段，下达减速或停车指令。

目前，报警限速区段设置和限速区段指令下达仍是基于实时风速。以京沪线为例，当某一站点风速持续10秒超过15米/秒时，针对该站点前后约10km区域设置为报警限速区段，当观测到该站点风速持续5分钟低于15米/秒时，取消该区段报警限速。在设置报警限速区段后，对即将驶入该区段的列车提前下达限速或停车指令。该处置方案存在两种问题，一是限速指令下达不及时，当某区段出现大风，已经驶入该区段的列车不能立刻采取制动措施，存在大风高速行车风险；二是报警区段设置时间过长，导致列车不必要的长时间低速行车，降低铁路运营效率和乘客满意度。

因此，基于时序预测技术预测未来一段时间内风速的趋势，进而设计大风预警限速处置方案，能够同时保证列车运行的安全与经济效益。

以深度学习为基础构建的新型时序预测方法，相比传统的统计学建模方法，具备以下四个优势：第一，摒弃了统计建模方法只能针对单一时间序列的劣势，能够把握多条时间序列的共同特征，大大降低建模成本；第二，深度学习模型能够融合更多的外部信息，提高建模及预测的精度；第三，本发明采用的自注意力模块能够发掘时间序列较长历史的时间依赖关系，提取显著规律；第四，本发明采用的深度学习训练策略能够提取时间序列的形状特征，把握大风突变点和持续时间等重要特性。

发明内容

考虑到基于实时风速设计大风限速处置方案的缺陷及利用深度学习模型进行时序数据多步预测的优势，本发明的目的在于设计一种在实现较为精准的多步风速预测基础上进行大风限速动态处置的方法。

本发明采用的技术方案为：一种基于多步时序预测的高速铁路大风限速动态处置方法，该方法包括以下步骤：

S1、数据收集阶段：收集局部站点风速信息、全局天气特征和时刻信息，构成数据集；

S2、离线训练阶段：包括数据预处理、模型构建和模型训练，具体为：

S2.1数据预处理：将历史局部风速信息和历史全局天气特征进行数据时间粒度统一；针对噪音大的局部风速数据特征进行基线提取；

S2.2构建多步时序预测模型，该模型包括依次连接的时序编码解码器、自注意力模块和前向神经网络；通过时序编码解码器统一历史输入和未来输入的数据维度，得到维度相同的表征，历史输入由历史时刻的局部站点风速值和全局天气特征拼接构成，未来输入由历史时刻的全局天气预报特征拼接构成；将该表征采用自注意力模块转换成融合时序特征的表征，之后采用前向神经网络基于融合时序特征的表征得到未来时刻的预测风速结果；

S2.3基于动态时间规整的训练策略训练预测模型；

S3、实时预测阶段：将当前时刻之前一段时期的局部站点风速信息和全局天气特征作为历史输入，将当前时刻的全局天气预报特征作为未来输入，分别进行数据预处理后，输入到步骤S2训练好的多步时序预测模型，输出未来一段时间内风速预测值，之后进行基线提取的逆过程，得到最终风速预测结果；

S4、动态调度阶段：在风速预测基础上，协助调度人员优化大风分区设置，提前下达限速或停车指令。

进一步地，所述步骤S2.1中，采用线性插值法对原始数据缺失值进行补全，采用极大极小标准化消除量纲影响，将粗粒度的全局天气特征信息视为细粒度上的静态变量，再依据时刻信息和细粒度的局部风速信息进行对齐。

进一步地，所述步骤S2.1中，采用滑动平均模型进行基线提取，选取长度为W的滑窗，处理原始数据X_1:T，处理后数据为X_W:T，公式为：

X_W:T＝X_1:T×T_W，

进一步地，所述步骤S2.2中，模型输入数据分为历史输入和未来输入部分；设置历史输入步长T和未来输入步长τ，历史输入数据由局部站点风速值和全局天气特征拼接构成，为X_1:T∈R^T×M，M为历史输入数据的维度，未来输入数据由全局天气特征拼接构成，为X_T+1:T+τ∈R^τ×(M-1)。

进一步地，所述步骤S2.2中，模型搭建过程包含以下分步骤：

S2.2.1、采用时序编码解码器将不同维度的历史输入和未来输入转化为同一维度d维的表征h_1:T+τ∈R^(T+τ)×d。

S2.2.2、采用自注意力模块将表征h_1:T+τ转换成融合时序特征的表征z_T:T+τ∈R^τ×d。

S2.2.3、采用前向神经网络将表征z_T:T+τ转换成未来τ步时刻的预测风速结果y_T:T+τ∈R^τ×1，完成模型搭建。

进一步地，所述步骤S2.2.1中，所述时序编码解码器采用门控循环单元；将历史输入X_1:T∈R^T×M输入编码器，对隐藏层状态进行初始化，输出全部的隐藏层状态h_1:T，过程如下：

在每一时刻t，门控循环单元依据上一时刻隐藏层状态h_t-1和当前时刻输入x_t，生成重置门控信号r和记忆门控信号z；

其中σ为激活函数，W^r、W^z为权重矩阵；

利用重置门控信号r生成t-1时刻重置隐状态h′_t-1；

h′_t-1＝r⊙h_t-1

使用记忆门控信号z生成t时刻隐状态h_t；

h_t＝(1-z)⊙h_t-1+z⊙h'

其中W为权重矩阵；

将T时刻隐状态h_T作为解码器隐藏层的初始状态，将未来t步数据X_T:T+τ∈R^τ×(M-1)作为解码器输入，经过上述步骤生成未来全部时刻隐藏层状态h_T:T+τ。

进一步地，所述步骤S2.2.2中，所述自注意力模块的实现步骤如下：

对于每一时刻表征h_t∈R^d，分别计算其对应的查询特征q_t∈R^q、键值特征k_t∈R^q和实值特征v_t∈R^v；

q_t＝h_t×W_q

k_t＝h_t×W_k

v_t＝h_t×W_v

其中W_q、W_k、W_v均为权重矩阵；

对于每一时刻表征h_t∈R^d，通过查询特征和键值特征计算它与其他状态的关系程度，记为score_t,1:T+τ。

对score_t,1:T+τ做归一化，作为每一时刻状态对t时刻状态的影响因子atten_t,1:T+τ，利用得到的影响因子对每一时刻实值特征做加权，得到经过自注意力机制处理后的表征c_t∈R^v；

atten_t,1:T+τ＝Softmax(score_t,1:T+τ)

c_t＝atten_t,1:T+τ×v_1:T+τ

其中Softmax(·)为归一化函数；

改变W_q,W_k,W_v，计算新的查询特征、键值特征和实值特征，重复上述步骤N次，确保模型能够提取到不同时间长度的时序特征，得到N个t时刻的表征

通过全连接层将t时刻的N个表征转化为一个维度为d的表征z_t∈R^d；

其中W_c为权重矩阵；

最终得到未来τ步时刻的d维表征z_T:T+τ∈R^τ×d。

进一步地，所述步骤S2.3中，采用可微化的动态时间规整指标作为预测模型的损失函数；预测结果为y_T:T+τ∈R^τ×1，标签为y'_T:T+τ∈R^τ×1，损失函数为：

其中γ为惩罚因子，A为对齐路径，A_k,k为序列对齐矩阵，Δ(y,y')为y和y'的动态对齐距离，DTW_γ(y,y')为y和y'的可微化的动态时间规整指标。

进一步地，所述步骤S2.3中，多步时序预测模型训练过程中，加入dropout神经元，避免模型训练过拟合；设置学习速率每隔固定学习轮数发生递减，加快模型收敛速度。

进一步地，所述步骤S4包括以下分步骤：

S4.1、基于未来多步风速预测结果设置大风区段和潜在大风区段，具体为：当某一站点无大风且预测未来一段时间t内大风持续时间低于阈值θ时，不设置大风区段，当某一站点当前时刻存在大风时，设置该站点两侧区域为大风区段，当某一站点无大风且预测未来一段时间t内大风持续时间超过阈值θ时，设置该站点两侧区域为潜在大风区段；

S4.2、列车调度员基于列车和大风设置区段位置关系，动态下达限速指令，具体为：当列车即将驶入大风区段或潜在大风区段时，由调度员观察该区段未来风速趋势预测图，结合列车与该区段位置关系及列车时速，判断是否下达限速或停车指令；若预判该列车驶入该区段后，大风存在，则下达限速或停车指令，否则，不下达限速或停车指令。

本发明与现有技术相比，其显著优点在于：

(1)现有基于深度学习的风速预测模型利用循环神经网络，难以把握长时间序列的历史特征，在进行长时间多步预测时，本发明提出的基于自注意力的风速预测模型精度更高。

(2)现有回归模型训练过程采用基于欧式距离的损失函数，在处理多步预测时，难以把握预测序列和目标序列的形状特征，本发明提出的训练方法能够把握目标序列的形状特征。

(3)现有高速铁路大风预警仅基于实时风速划分无大风区段和有大风区段，安全性和效率较低，本发明提出的区段设置方法考虑了未来时刻的多点风速，增设了潜在大风区段，解决了大风区段设置不及时导致的安全问题和时间设置过长导致的低效问题。

(4)现有调度员下达限速指令，仅仅依靠现有大风区段，忽略了大风的持续时间特性，本发明提出的方案考虑了大风持续时间，过滤掉不必要的限速指令下达，提高了列车运行效率和乘客满意度。

附图说明

图1是完整的基于多步时序预测的大风限速动态处置方法的结构框图。

图2是多步时序预测模型结构图。

图3是基于多步时序预测的大风限速动态处置流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明的具体实施方式做详细的说明。

如图1所示，本实施例以京沪线高速铁路应用场景为例，详细阐述本发明基于多步时序预测的高速铁路大风限速动态处置方法的实现过程，该方法包括以下步骤：

S1、数据收集阶段，收集局部站点风速信息、全局天气特征和时刻信息，共同构成本发明提出的多步时序预测模型的输入数据；

S2、离线训练阶段，包括数据预处理、模型构建和模型训练，具体为：

S2.3基于动态时间规整的训练策略训练预测模型；

S3、实时预测阶段，将当前时刻之前一段时期的局部站点风速信息和全局天气特征作为历史输入，将当前时刻的全局天气预报特征作为未来输入，分别进行数据预处理后，输入到步骤S2训练好的多步时序预测模型，输出未来一段时间内风速预测值，之后进行基线提取的逆过程，得到最终风速预测结果；

S4、动态调度阶段，在风速预测基础上，协助调度人员优化大风分区设置，提前下达限速或停车指令。

所述步骤S1中，局部站点风速信息由沿线风速传感器提供，全局天气特征由区域气象站提供。

在本实施例中，收集到2017年全年京沪线沿线K009-K302共30个站点风速传感器数据，每个站点间隔约10km，数据采集粒度为1秒。通过北京区域气象站获取全局天气特征，包括室外温度、湿度、露点温度、风向和天气状况等特征，数据采集粒度为180分钟。局部站点风速、全局天气特征和时刻信息，共同构成本发明提出的多步时序预测模型的输入数据。

所述步骤S2包括以下分步骤：

S2.1、数据预处理：获取历史局部风速信息、全局天气特征和时刻信息特征后，进行数据预处理，补全缺失值，消除量纲影响，统一数据时间粒度；针对噪音大的局部风速数据特征，进行基线提取，使其更加平滑；

S2.2、基于时序编码解码器、自注意力机制和前向神经网络针对已有数据搭建多步时序预测模型；

S2.3、基于动态时间规整的训练策略训练预测模型；

S2.4、将训练好的模型存储到云端服务器。

所述步骤S2.1中，采用线性插值法对原始数据缺失值进行补全，采用极大极小标准化消除量纲影响，将粗粒度的全局天气特征信息视为细粒度上的静态变量，再依据时刻信息和细粒度的局部风速信息进行对齐。

在本实施例中，对于原始风速数据，计算每分钟的平均风速，将风速数据降采样到每分钟。对于全局天气数据，将其中的类别变量风向和天气状况，分别进行标签编码，将其转化为数值变量，检查数据是否存在缺失值，采用线性插值法补全其中的缺失值。将粒度为180分钟的天气数据扩充成粒度为1分钟的静态变量。将时刻信息小时，分钟信息分别提取出来作为额外变量序列。最后将上述所有数据依照时刻进行对齐，将对齐后的变量进行最大最小标准化，消除量纲影响。

所述步骤S2.1中，采用滑动平均模型进行基线提取，选取长度为W的滑窗。

在本实施例中，选取长度为10分钟的滑窗，处理序列总长度为525600分钟的原始数据X_1:525600，处理后数据为X_11:525600，公式为：

X_11:525600＝X_1:525600×T₁₀，

所述步骤S2.2中，模型输入数据分为历史输入和未来输入部分。设置历史输入步长T和未来输入步长τ，历史输入数据由局部站点风速值和全局天气特征拼接构成，为X_1:T∈R^T×M，M为历史输入数据的维度，未来输入数据由全局天气特征拼接构成，为X_T+1:T+τ∈R^τ×(M-1)。其中，在训练模型时，未来输入为历史时刻的天气预测值，但是相对于当前时刻均为历史数据；在实时预测时，未来输入为当前时刻的天气预测值。

在本实例中，设置历史输入步长T为120分钟，未来输入步长τ为60分钟，历史输入数据由局部站点风速值、全局温度、湿度、露点温度、风向、天气状况、时刻信息(小时，分钟)拼接而成，为X_1:T∈R^T×8，未来输入数据由全局温度、湿度、露点温度、风向、天气状况、时刻信息拼接而成，为X_T+1:T+τ∈R^τ×7。

所述步骤S2.2模型搭建过程包含以下分步骤：

如图2所示，搭建多步时序预测模型。

所述时序编码解码器采用门控循环单元。将历史输入X_1:T∈R^T×8输入编码器，对隐藏层状态进行初始化，输出全部的隐藏层状态h_1:T，过程如下：

在每一时刻t，门控循环单元依据上一时刻隐藏层状态h_t-1和当前时刻输入x_t，生成重置门控信号r和记忆门控信号z。

其中σ为激活函数，W^r、W^z为权重矩阵；

利用重置门控信号r生成t-1时刻重置隐状态h′_t-1。

h′_t-1＝r⊙h_t-1

使用记忆门控信号z生成t时刻隐状态h_t。

h_t＝(1-z)⊙h_t-1+z⊙h'

其中W为权重矩阵；

将T时刻隐状态h_T作为解码器隐藏层的初始状态，将未来t步数据X_T:T+τ∈R^τ×7作为解码器输入，经过上述步骤生成未来全部时刻隐藏层状态h_T:T+τ。

所述自注意力模块细节如下：

对于每一时刻表征h_t∈R^d，分别计算其对应的查询特征q_t∈R^q、键值特征k_t∈R^q和实值特征v_t∈R^v。

q_t＝h_t×W_q

k_t＝h_t×W_k

v_t＝h_t×W_v

其中W_q、W_k、W_v均为权重矩阵；

atten_t,1:T+τ＝Softmax(score_t,1:T+τ)

c_t＝atten_t,1:T+τ×v_1:T+τ

其中Softmax(·)为归一化函数；

通过全连接层将t时刻的N个表征转化为一个维度为d的表征z_t∈R^d。

其中W_c为权重矩阵；

最终得到未来τ步时刻的d维表征z_T:T+τ∈R^τ×d。

将未来τ步时刻内每步d维表征z_t∈R^d输入前向神经网路，输出未来τ步时刻内每步预测值，公式如下：

y_t＝σ(W₂σ(W₁z_t+b₁)+b₂)

其中W₁,W₂为权重矩阵，b₁,b₂为偏置参数，σ为激活函数。

所述步骤S2.2多步时序预测模型搭建完成。

在本实施例中，编码解码器中间层表征维度d，自注意力模块查询及键值特征维度q，实值特征维度v，注意力头数N，前向神经网络维度f分别取64，96，96，4，128。

所述步骤S2.3中，采用可微化的动态时间规整指标作为预测模型的损失函数。具体的，预测结果为y_T:T+τ∈R^τ×1，标签为y'_T:T+τ∈R^τ×1，损失函数为：

所述步骤S2.3中，模型训练过程中，加入dropout神经元，避免模型训练过拟合。设置学习速率每隔固定学习轮数发生递减，加快模型收敛速度。

所述步骤S3包括以下分步骤：

S3.1、将当前时刻之前一段时期的局部站点风速信息和全局天气特征作为历史输入，将当前时刻的全局天气预报特征作为未来输入，分别进行数据预处理；针对噪音大的局部风速数据特征，进行基线提取，使其更加平滑；

S3.2、基于S2训练完成的多步时序预测模型，接收经过S3.1预处理后的数据，输出未来一段时间内风速预测值；

S3.3、针对预测结果进行基线提取的逆过程，还原出预测的最终结果。

所述步骤S3.1中的数据预处理及基线提取方法同步骤S2.1。

在本实施例中，获取历史信息长度为当前时刻前2小时，天气预报提供的未来全局天气跨度为1小时。

所述步骤S3.3中模型输出结果为y_T:T+τ∈R^τ×1，经过还原矩阵运算后，得到风速预测的最终结果/>

如图3所示，所述步骤S4包括以下分步骤：

S4.1、基于未来多步风速预测结果设置大风区段和潜在大风区段；

S4.2、列车调度员基于列车和风区的位置关系，动态下达限速或停车指令。

所述步骤S4.1中，当某一站点无大风且预测未来一段时间t内大风持续时间低于阈值θ时，不设置大风区段，当某一站点当前时刻存在大风时，设置该站点两侧区域为大风区段，当某一站点无大风且预测未来一段时间t内大风持续时间超过阈值θ时，设置该站点两侧区域为潜在大风区段。

所述步骤S4.2当列车即将驶入大风区段或潜在大风区段时，由调度员观察该区段未来风速趋势预测图，结合列车与该区段位置关系及列车时速，判断是否下达限速或停车指令。若预判该列车驶入该区段后，大风存在，则下达限速或停车指令，否则，不下达限速或停车指令。

如图3所示，在本实施例中，列车时速为300km/h，每个风区长度约为20km，大风预测长度为60分钟，风速超过15km/h定义为大风，大风持续时间低于1分钟判定为无大风。列车处于机控模式下，需要提前4.5km做出决策，预计列车通过该风区时间区间为1分钟到5分钟，需观测该时间区间内风速预测值；列车处于人控模式下，需要提前17.5km做出决策，预计列车通过该风区时间区间为3分钟到7分钟，需观测该时间区间内风速预测值。

本发明与现有技术相比，其显著优点在于：

(4)现有调度员下达限速指令，仅仅依靠当前有无大风特征，忽略了大风的持续时间特征，本发明提出的方案考虑了大风持续时间，过滤掉不必要的限速指令下达，提高了列车运行效率和乘客满意度。

本领域普通技术人员可以理解，以上所述仅为发明的优选实例而已，并不用于限制发明，尽管参照前述实例对发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实例记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内，所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims

1.一种基于多步时序预测的高速铁路大风限速动态处置方法，其特征在于，包括以下步骤：

S2.1数据预处理：将历史局部风速信息和历史全局天气特征进行数据时间粒度统一；针对噪音大的局部风速数据特征进行基线提取；具体地，采用滑动平均模型进行基线提取，选取长度为W的滑窗，处理原始数据X_1:T，处理后数据为X_W:T，公式为：

模型输入数据分为历史输入和未来输入部分；设置历史输入步长T和未来输入步长τ，历史输入数据由局部站点风速值和全局天气特征拼接构成，为X_1:T∈R^T×M，M为历史输入数据的维度，未来输入数据由全局天气特征拼接构成，为X_T+1:T+τ∈R^τ×(M-1)；

模型搭建过程包含以下分步骤：

S2.2.1、采用时序编码解码器将不同维度的历史输入和未来输入转化为同一维度d维的表征h_1:T+τ∈R^(T+τ)×d；所述时序编码解码器采用门控循环单元；将历史输入X_1:T∈R^T×M输入编码器，对隐藏层状态进行初始化，输出全部的隐藏层状态h_1:T，过程如下：

其中σ为激活函数，W^r、W^z为权重矩阵；

利用重置门控信号r生成t-1时刻重置隐状态h'_t-1；

h'_t-1＝r⊙h_t-1

使用记忆门控信号z生成t时刻隐状态h_t；

h_t＝(1-z)⊙h_t-1+z⊙h'

其中W为权重矩阵；

将T时刻隐状态h_T作为解码器隐藏层的初始状态，将未来t步数据X_T:T+τ∈R^τ×(M-1)作为解码器输入，经过上述步骤生成未来全部时刻隐藏层状态h_T:T+τ；

S2.2.2、采用自注意力模块将表征h_1:T+τ转换成融合时序特征的表征z_T:T+τ∈R^τ×d；所述自注意力模块的实现步骤如下：

q_t＝h_t×W_q

k_t＝h_t×W_k

v_t＝h_t×W_v

其中W_q、W_k、W_v均为权重矩阵；

对于每一时刻表征h_t∈R^d，通过查询特征和键值特征计算它与其他状态的关系程度，记为score_t,1:T+τ；

atten_t,1:T+τ＝Softmax(score_t,1:T+τ)

c_t＝atten_t,1:T+τ×v_1:T+τ

其中Softmax(·)为归一化函数；

其中W_c为权重矩阵；

最终得到未来τ步时刻的d维表征z_T:T+τ∈R^τ×d；

S2.2.3、采用前向神经网络将表征z_T:T+τ转换成未来τ步时刻的预测风速结果y_T:T+τ∈R^τ×1，完成模型搭建；

S2.3基于动态时间规整的训练策略训练预测模型；具体地，采用可微化的动态时间规整指标作为预测模型的损失函数；预测结果为y_T:T+τ∈R^τ×1，标签为y'_T:T+τ∈R^τ×1，损失函数为：

其中γ为惩罚因子，A为对齐路径，A_k,k为序列对齐矩阵，Δ(y,y')为y和y'的动态对齐距离，DTW_γ(y,y')为y和y'的可微化的动态时间规整指标；

2.根据权利要求1所述的基于多步时序预测的高速铁路大风限速动态处置方法，其特征在于，所述步骤S2.1中，采用线性插值法对原始数据缺失值进行补全，采用极大极小标准化消除量纲影响，将粗粒度的全局天气特征信息视为细粒度上的静态变量，再依据时刻信息和细粒度的局部风速信息进行对齐。

3.根据权利要求1所述的基于多步时序预测的高速铁路大风限速动态处置方法，其特征在于，所述步骤S2.3中，多步时序预测模型训练过程中，加入dropout神经元，避免模型训练过拟合；设置学习速率每隔固定学习轮数发生递减，加快模型收敛速度。

4.根据权利要求1所述的基于多步时序预测的高速铁路大风限速动态处置方法，其特征在于，所述步骤S4包括以下分步骤：