CN112308336B - 一种基于多步时序预测的高速铁路大风限速动态处置方法 - Google Patents
一种基于多步时序预测的高速铁路大风限速动态处置方法 Download PDFInfo
- Publication number
- CN112308336B CN112308336B CN202011295709.0A CN202011295709A CN112308336B CN 112308336 B CN112308336 B CN 112308336B CN 202011295709 A CN202011295709 A CN 202011295709A CN 112308336 B CN112308336 B CN 112308336B
- Authority
- CN
- China
- Prior art keywords
- time
- wind speed
- future
- strong wind
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 24
- 238000012512 characterization method Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000003068 static effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000002864 sequence alignment Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 2
- 230000008901 benefit Effects 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多步时序预测的高速铁路大风限速动态处置方法,本发明在离线训练阶段采用基于自注意力的多步时序预测模型,预测精度更高;采用基于动态时间规整的训练策略训练预测模型,能够把握目标序列的形状特征;本发明提出的区段设置方法考虑了未来时刻的多点风速,增设了潜在大风区段,解决了大风区段设置不及时导致的安全问题和时间设置过长导致的低效问题;本发明方法考虑了大风持续时间,过滤掉不必要的限速指令下达,提高了列车运行效率和乘客满意度。
Description
技术领域
本发明属于智慧交通领域,具体的,涉及一种基于多步时序预测的高速铁路大风限速动态处置方法。
背景技术
随着社会经济的不断发展,高速铁路已经成为一种重要的出行方式,如何保证列车运行稳定性和提高乘客满意度是一个重要目标。在实际运行环境中,沿线大风是发生频率较高的自然灾害之一,其规律性和可预测性较差。当大风超过一定风速阈值时,其所施加的横向力会直接威胁列车运行安全。因此,列车调度员需及时设置大风报警限速区段,下达减速或停车指令。
目前,报警限速区段设置和限速区段指令下达仍是基于实时风速。以京沪线为例,当某一站点风速持续10秒超过15米/秒时,针对该站点前后约10km区域设置为报警限速区段,当观测到该站点风速持续5分钟低于15米/秒时,取消该区段报警限速。在设置报警限速区段后,对即将驶入该区段的列车提前下达限速或停车指令。该处置方案存在两种问题,一是限速指令下达不及时,当某区段出现大风,已经驶入该区段的列车不能立刻采取制动措施,存在大风高速行车风险;二是报警区段设置时间过长,导致列车不必要的长时间低速行车,降低铁路运营效率和乘客满意度。
因此,基于时序预测技术预测未来一段时间内风速的趋势,进而设计大风预警限速处置方案,能够同时保证列车运行的安全与经济效益。
以深度学习为基础构建的新型时序预测方法,相比传统的统计学建模方法,具备以下四个优势:第一,摒弃了统计建模方法只能针对单一时间序列的劣势,能够把握多条时间序列的共同特征,大大降低建模成本;第二,深度学习模型能够融合更多的外部信息,提高建模及预测的精度;第三,本发明采用的自注意力模块能够发掘时间序列较长历史的时间依赖关系,提取显著规律;第四,本发明采用的深度学习训练策略能够提取时间序列的形状特征,把握大风突变点和持续时间等重要特性。
发明内容
考虑到基于实时风速设计大风限速处置方案的缺陷及利用深度学习模型进行时序数据多步预测的优势,本发明的目的在于设计一种在实现较为精准的多步风速预测基础上进行大风限速动态处置的方法。
本发明采用的技术方案为:一种基于多步时序预测的高速铁路大风限速动态处置方法,该方法包括以下步骤:
S1、数据收集阶段:收集局部站点风速信息、全局天气特征和时刻信息,构成数据集;
S2、离线训练阶段:包括数据预处理、模型构建和模型训练,具体为:
S2.1数据预处理:将历史局部风速信息和历史全局天气特征进行数据时间粒度统一;针对噪音大的局部风速数据特征进行基线提取;
S2.2构建多步时序预测模型,该模型包括依次连接的时序编码解码器、自注意力模块和前向神经网络;通过时序编码解码器统一历史输入和未来输入的数据维度,得到维度相同的表征,历史输入由历史时刻的局部站点风速值和全局天气特征拼接构成,未来输入由历史时刻的全局天气预报特征拼接构成;将该表征采用自注意力模块转换成融合时序特征的表征,之后采用前向神经网络基于融合时序特征的表征得到未来时刻的预测风速结果;
S2.3基于动态时间规整的训练策略训练预测模型;
S3、实时预测阶段:将当前时刻之前一段时期的局部站点风速信息和全局天气特征作为历史输入,将当前时刻的全局天气预报特征作为未来输入,分别进行数据预处理后,输入到步骤S2训练好的多步时序预测模型,输出未来一段时间内风速预测值,之后进行基线提取的逆过程,得到最终风速预测结果;
S4、动态调度阶段:在风速预测基础上,协助调度人员优化大风分区设置,提前下达限速或停车指令。
进一步地,所述步骤S2.1中,采用线性插值法对原始数据缺失值进行补全,采用极大极小标准化消除量纲影响,将粗粒度的全局天气特征信息视为细粒度上的静态变量,再依据时刻信息和细粒度的局部风速信息进行对齐。
进一步地,所述步骤S2.1中,采用滑动平均模型进行基线提取,选取长度为W的滑窗,处理原始数据X1:T,处理后数据为XW:T,公式为:
XW:T=X1:T×TW,
进一步地,所述步骤S2.2中,模型输入数据分为历史输入和未来输入部分;设置历史输入步长T和未来输入步长τ,历史输入数据由局部站点风速值和全局天气特征拼接构成,为X1:T∈RT×M,M为历史输入数据的维度,未来输入数据由全局天气特征拼接构成,为XT+1:T+τ∈Rτ×(M-1)。
进一步地,所述步骤S2.2中,模型搭建过程包含以下分步骤:
S2.2.1、采用时序编码解码器将不同维度的历史输入和未来输入转化为同一维度d维的表征h1:T+τ∈R(T+τ)×d。
S2.2.2、采用自注意力模块将表征h1:T+τ转换成融合时序特征的表征zT:T+τ∈Rτ×d。
S2.2.3、采用前向神经网络将表征zT:T+τ转换成未来τ步时刻的预测风速结果yT:T+τ∈Rτ×1,完成模型搭建。
进一步地,所述步骤S2.2.1中,所述时序编码解码器采用门控循环单元;将历史输入X1:T∈RT×M输入编码器,对隐藏层状态进行初始化,输出全部的隐藏层状态h1:T,过程如下:
在每一时刻t,门控循环单元依据上一时刻隐藏层状态ht-1和当前时刻输入xt,生成重置门控信号r和记忆门控信号z;
其中σ为激活函数,Wr、Wz为权重矩阵;
利用重置门控信号r生成t-1时刻重置隐状态h′t-1;
h′t-1=r⊙ht-1
使用记忆门控信号z生成t时刻隐状态ht;
ht=(1-z)⊙ht-1+z⊙h'
其中W为权重矩阵;
将T时刻隐状态hT作为解码器隐藏层的初始状态,将未来t步数据XT:T+τ∈Rτ×(M-1)作为解码器输入,经过上述步骤生成未来全部时刻隐藏层状态hT:T+τ。
进一步地,所述步骤S2.2.2中,所述自注意力模块的实现步骤如下:
对于每一时刻表征ht∈Rd,分别计算其对应的查询特征qt∈Rq、键值特征kt∈Rq和实值特征vt∈Rv;
qt=ht×Wq
kt=ht×Wk
vt=ht×Wv
其中Wq、Wk、Wv均为权重矩阵;
对于每一时刻表征ht∈Rd,通过查询特征和键值特征计算它与其他状态的关系程度,记为scoret,1:T+τ。
对scoret,1:T+τ做归一化,作为每一时刻状态对t时刻状态的影响因子attent,1:T+τ,利用得到的影响因子对每一时刻实值特征做加权,得到经过自注意力机制处理后的表征ct∈Rv;
attent,1:T+τ=Softmax(scoret,1:T+τ)
ct=attent,1:T+τ×v1:T+τ
其中Softmax(·)为归一化函数;
改变Wq,Wk,Wv,计算新的查询特征、键值特征和实值特征,重复上述步骤N次,确保模型能够提取到不同时间长度的时序特征,得到N个t时刻的表征
通过全连接层将t时刻的N个表征转化为一个维度为d的表征zt∈Rd;
其中Wc为权重矩阵;
最终得到未来τ步时刻的d维表征zT:T+τ∈Rτ×d。
进一步地,所述步骤S2.3中,采用可微化的动态时间规整指标作为预测模型的损失函数;预测结果为yT:T+τ∈Rτ×1,标签为y'T:T+τ∈Rτ×1,损失函数为:
其中γ为惩罚因子,A为对齐路径,Ak,k为序列对齐矩阵,Δ(y,y')为y和y'的动态对齐距离,DTWγ(y,y')为y和y'的可微化的动态时间规整指标。
进一步地,所述步骤S2.3中,多步时序预测模型训练过程中,加入dropout神经元,避免模型训练过拟合;设置学习速率每隔固定学习轮数发生递减,加快模型收敛速度。
进一步地,所述步骤S4包括以下分步骤:
S4.1、基于未来多步风速预测结果设置大风区段和潜在大风区段,具体为:当某一站点无大风且预测未来一段时间t内大风持续时间低于阈值θ时,不设置大风区段,当某一站点当前时刻存在大风时,设置该站点两侧区域为大风区段,当某一站点无大风且预测未来一段时间t内大风持续时间超过阈值θ时,设置该站点两侧区域为潜在大风区段;
S4.2、列车调度员基于列车和大风设置区段位置关系,动态下达限速指令,具体为:当列车即将驶入大风区段或潜在大风区段时,由调度员观察该区段未来风速趋势预测图,结合列车与该区段位置关系及列车时速,判断是否下达限速或停车指令;若预判该列车驶入该区段后,大风存在,则下达限速或停车指令,否则,不下达限速或停车指令。
本发明与现有技术相比,其显著优点在于:
(1)现有基于深度学习的风速预测模型利用循环神经网络,难以把握长时间序列的历史特征,在进行长时间多步预测时,本发明提出的基于自注意力的风速预测模型精度更高。
(2)现有回归模型训练过程采用基于欧式距离的损失函数,在处理多步预测时,难以把握预测序列和目标序列的形状特征,本发明提出的训练方法能够把握目标序列的形状特征。
(3)现有高速铁路大风预警仅基于实时风速划分无大风区段和有大风区段,安全性和效率较低,本发明提出的区段设置方法考虑了未来时刻的多点风速,增设了潜在大风区段,解决了大风区段设置不及时导致的安全问题和时间设置过长导致的低效问题。
(4)现有调度员下达限速指令,仅仅依靠现有大风区段,忽略了大风的持续时间特性,本发明提出的方案考虑了大风持续时间,过滤掉不必要的限速指令下达,提高了列车运行效率和乘客满意度。
附图说明
图1是完整的基于多步时序预测的大风限速动态处置方法的结构框图。
图2是多步时序预测模型结构图。
图3是基于多步时序预测的大风限速动态处置流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
如图1所示,本实施例以京沪线高速铁路应用场景为例,详细阐述本发明基于多步时序预测的高速铁路大风限速动态处置方法的实现过程,该方法包括以下步骤:
S1、数据收集阶段,收集局部站点风速信息、全局天气特征和时刻信息,共同构成本发明提出的多步时序预测模型的输入数据;
S2、离线训练阶段,包括数据预处理、模型构建和模型训练,具体为:
S2.1数据预处理:将历史局部风速信息和历史全局天气特征进行数据时间粒度统一;针对噪音大的局部风速数据特征进行基线提取;
S2.2构建多步时序预测模型,该模型包括依次连接的时序编码解码器、自注意力模块和前向神经网络;通过时序编码解码器统一历史输入和未来输入的数据维度,得到维度相同的表征,历史输入由历史时刻的局部站点风速值和全局天气特征拼接构成,未来输入由历史时刻的全局天气预报特征拼接构成;将该表征采用自注意力模块转换成融合时序特征的表征,之后采用前向神经网络基于融合时序特征的表征得到未来时刻的预测风速结果;
S2.3基于动态时间规整的训练策略训练预测模型;
S3、实时预测阶段,将当前时刻之前一段时期的局部站点风速信息和全局天气特征作为历史输入,将当前时刻的全局天气预报特征作为未来输入,分别进行数据预处理后,输入到步骤S2训练好的多步时序预测模型,输出未来一段时间内风速预测值,之后进行基线提取的逆过程,得到最终风速预测结果;
S4、动态调度阶段,在风速预测基础上,协助调度人员优化大风分区设置,提前下达限速或停车指令。
所述步骤S1中,局部站点风速信息由沿线风速传感器提供,全局天气特征由区域气象站提供。
在本实施例中,收集到2017年全年京沪线沿线K009-K302共30个站点风速传感器数据,每个站点间隔约10km,数据采集粒度为1秒。通过北京区域气象站获取全局天气特征,包括室外温度、湿度、露点温度、风向和天气状况等特征,数据采集粒度为180分钟。局部站点风速、全局天气特征和时刻信息,共同构成本发明提出的多步时序预测模型的输入数据。
所述步骤S2包括以下分步骤:
S2.1、数据预处理:获取历史局部风速信息、全局天气特征和时刻信息特征后,进行数据预处理,补全缺失值,消除量纲影响,统一数据时间粒度;针对噪音大的局部风速数据特征,进行基线提取,使其更加平滑;
S2.2、基于时序编码解码器、自注意力机制和前向神经网络针对已有数据搭建多步时序预测模型;
S2.3、基于动态时间规整的训练策略训练预测模型;
S2.4、将训练好的模型存储到云端服务器。
所述步骤S2.1中,采用线性插值法对原始数据缺失值进行补全,采用极大极小标准化消除量纲影响,将粗粒度的全局天气特征信息视为细粒度上的静态变量,再依据时刻信息和细粒度的局部风速信息进行对齐。
在本实施例中,对于原始风速数据,计算每分钟的平均风速,将风速数据降采样到每分钟。对于全局天气数据,将其中的类别变量风向和天气状况,分别进行标签编码,将其转化为数值变量,检查数据是否存在缺失值,采用线性插值法补全其中的缺失值。将粒度为180分钟的天气数据扩充成粒度为1分钟的静态变量。将时刻信息小时,分钟信息分别提取出来作为额外变量序列。最后将上述所有数据依照时刻进行对齐,将对齐后的变量进行最大最小标准化,消除量纲影响。
所述步骤S2.1中,采用滑动平均模型进行基线提取,选取长度为W的滑窗。
在本实施例中,选取长度为10分钟的滑窗,处理序列总长度为525600分钟的原始数据X1:525600,处理后数据为X11:525600,公式为:
X11:525600=X1:525600×T10,
所述步骤S2.2中,模型输入数据分为历史输入和未来输入部分。设置历史输入步长T和未来输入步长τ,历史输入数据由局部站点风速值和全局天气特征拼接构成,为X1:T∈RT×M,M为历史输入数据的维度,未来输入数据由全局天气特征拼接构成,为XT+1:T+τ∈Rτ×(M-1)。其中,在训练模型时,未来输入为历史时刻的天气预测值,但是相对于当前时刻均为历史数据;在实时预测时,未来输入为当前时刻的天气预测值。
在本实例中,设置历史输入步长T为120分钟,未来输入步长τ为60分钟,历史输入数据由局部站点风速值、全局温度、湿度、露点温度、风向、天气状况、时刻信息(小时,分钟)拼接而成,为X1:T∈RT×8,未来输入数据由全局温度、湿度、露点温度、风向、天气状况、时刻信息拼接而成,为XT+1:T+τ∈Rτ×7。
所述步骤S2.2模型搭建过程包含以下分步骤:
S2.2.1、采用时序编码解码器将不同维度的历史输入和未来输入转化为同一维度d维的表征h1:T+τ∈R(T+τ)×d。
S2.2.2、采用自注意力模块将表征h1:T+τ转换成融合时序特征的表征zT:T+τ∈Rτ×d。
S2.2.3、采用前向神经网络将表征zT:T+τ转换成未来τ步时刻的预测风速结果yT:T+τ∈Rτ×1,完成模型搭建。
如图2所示,搭建多步时序预测模型。
所述时序编码解码器采用门控循环单元。将历史输入X1:T∈RT×8输入编码器,对隐藏层状态进行初始化,输出全部的隐藏层状态h1:T,过程如下:
在每一时刻t,门控循环单元依据上一时刻隐藏层状态ht-1和当前时刻输入xt,生成重置门控信号r和记忆门控信号z。
其中σ为激活函数,Wr、Wz为权重矩阵;
利用重置门控信号r生成t-1时刻重置隐状态h′t-1。
h′t-1=r⊙ht-1
使用记忆门控信号z生成t时刻隐状态ht。
ht=(1-z)⊙ht-1+z⊙h'
其中W为权重矩阵;
将T时刻隐状态hT作为解码器隐藏层的初始状态,将未来t步数据XT:T+τ∈Rτ×7作为解码器输入,经过上述步骤生成未来全部时刻隐藏层状态hT:T+τ。
所述自注意力模块细节如下:
对于每一时刻表征ht∈Rd,分别计算其对应的查询特征qt∈Rq、键值特征kt∈Rq和实值特征vt∈Rv。
qt=ht×Wq
kt=ht×Wk
vt=ht×Wv
其中Wq、Wk、Wv均为权重矩阵;
对于每一时刻表征ht∈Rd,通过查询特征和键值特征计算它与其他状态的关系程度,记为scoret,1:T+τ。
对scoret,1:T+τ做归一化,作为每一时刻状态对t时刻状态的影响因子attent,1:T+τ,利用得到的影响因子对每一时刻实值特征做加权,得到经过自注意力机制处理后的表征ct∈Rv;
attent,1:T+τ=Softmax(scoret,1:T+τ)
ct=attent,1:T+τ×v1:T+τ
其中Softmax(·)为归一化函数;
改变Wq,Wk,Wv,计算新的查询特征、键值特征和实值特征,重复上述步骤N次,确保模型能够提取到不同时间长度的时序特征,得到N个t时刻的表征
通过全连接层将t时刻的N个表征转化为一个维度为d的表征zt∈Rd。
其中Wc为权重矩阵;
最终得到未来τ步时刻的d维表征zT:T+τ∈Rτ×d。
将未来τ步时刻内每步d维表征zt∈Rd输入前向神经网路,输出未来τ步时刻内每步预测值,公式如下:
yt=σ(W2σ(W1zt+b1)+b2)
其中W1,W2为权重矩阵,b1,b2为偏置参数,σ为激活函数。
所述步骤S2.2多步时序预测模型搭建完成。
在本实施例中,编码解码器中间层表征维度d,自注意力模块查询及键值特征维度q,实值特征维度v,注意力头数N,前向神经网络维度f分别取64,96,96,4,128。
所述步骤S2.3中,采用可微化的动态时间规整指标作为预测模型的损失函数。具体的,预测结果为yT:T+τ∈Rτ×1,标签为y'T:T+τ∈Rτ×1,损失函数为:
其中γ为惩罚因子,A为对齐路径,Ak,k为序列对齐矩阵,Δ(y,y')为y和y'的动态对齐距离,DTWγ(y,y')为y和y'的可微化的动态时间规整指标。
所述步骤S2.3中,模型训练过程中,加入dropout神经元,避免模型训练过拟合。设置学习速率每隔固定学习轮数发生递减,加快模型收敛速度。
所述步骤S3包括以下分步骤:
S3.1、将当前时刻之前一段时期的局部站点风速信息和全局天气特征作为历史输入,将当前时刻的全局天气预报特征作为未来输入,分别进行数据预处理;针对噪音大的局部风速数据特征,进行基线提取,使其更加平滑;
S3.2、基于S2训练完成的多步时序预测模型,接收经过S3.1预处理后的数据,输出未来一段时间内风速预测值;
S3.3、针对预测结果进行基线提取的逆过程,还原出预测的最终结果。
所述步骤S3.1中的数据预处理及基线提取方法同步骤S2.1。
在本实施例中,获取历史信息长度为当前时刻前2小时,天气预报提供的未来全局天气跨度为1小时。
所述步骤S3.3中模型输出结果为yT:T+τ∈Rτ×1,经过还原矩阵运算后,得到风速预测的最终结果/>
如图3所示,所述步骤S4包括以下分步骤:
S4.1、基于未来多步风速预测结果设置大风区段和潜在大风区段;
S4.2、列车调度员基于列车和风区的位置关系,动态下达限速或停车指令。
所述步骤S4.1中,当某一站点无大风且预测未来一段时间t内大风持续时间低于阈值θ时,不设置大风区段,当某一站点当前时刻存在大风时,设置该站点两侧区域为大风区段,当某一站点无大风且预测未来一段时间t内大风持续时间超过阈值θ时,设置该站点两侧区域为潜在大风区段。
所述步骤S4.2当列车即将驶入大风区段或潜在大风区段时,由调度员观察该区段未来风速趋势预测图,结合列车与该区段位置关系及列车时速,判断是否下达限速或停车指令。若预判该列车驶入该区段后,大风存在,则下达限速或停车指令,否则,不下达限速或停车指令。
如图3所示,在本实施例中,列车时速为300km/h,每个风区长度约为20km,大风预测长度为60分钟,风速超过15km/h定义为大风,大风持续时间低于1分钟判定为无大风。列车处于机控模式下,需要提前4.5km做出决策,预计列车通过该风区时间区间为1分钟到5分钟,需观测该时间区间内风速预测值;列车处于人控模式下,需要提前17.5km做出决策,预计列车通过该风区时间区间为3分钟到7分钟,需观测该时间区间内风速预测值。
本发明与现有技术相比,其显著优点在于:
(1)现有基于深度学习的风速预测模型利用循环神经网络,难以把握长时间序列的历史特征,在进行长时间多步预测时,本发明提出的基于自注意力的风速预测模型精度更高。
(2)现有回归模型训练过程采用基于欧式距离的损失函数,在处理多步预测时,难以把握预测序列和目标序列的形状特征,本发明提出的训练方法能够把握目标序列的形状特征。
(3)现有高速铁路大风预警仅基于实时风速划分无大风区段和有大风区段,安全性和效率较低,本发明提出的区段设置方法考虑了未来时刻的多点风速,增设了潜在大风区段,解决了大风区段设置不及时导致的安全问题和时间设置过长导致的低效问题。
(4)现有调度员下达限速指令,仅仅依靠当前有无大风特征,忽略了大风的持续时间特征,本发明提出的方案考虑了大风持续时间,过滤掉不必要的限速指令下达,提高了列车运行效率和乘客满意度。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。
Claims (4)
1.一种基于多步时序预测的高速铁路大风限速动态处置方法,其特征在于,包括以下步骤:
S1、数据收集阶段:收集局部站点风速信息、全局天气特征和时刻信息,构成数据集;
S2、离线训练阶段:包括数据预处理、模型构建和模型训练,具体为:
S2.1数据预处理:将历史局部风速信息和历史全局天气特征进行数据时间粒度统一;针对噪音大的局部风速数据特征进行基线提取;具体地,采用滑动平均模型进行基线提取,选取长度为W的滑窗,处理原始数据X1:T,处理后数据为XW:T,公式为:
S2.2构建多步时序预测模型,该模型包括依次连接的时序编码解码器、自注意力模块和前向神经网络;通过时序编码解码器统一历史输入和未来输入的数据维度,得到维度相同的表征,历史输入由历史时刻的局部站点风速值和全局天气特征拼接构成,未来输入由历史时刻的全局天气预报特征拼接构成;将该表征采用自注意力模块转换成融合时序特征的表征,之后采用前向神经网络基于融合时序特征的表征得到未来时刻的预测风速结果;
模型输入数据分为历史输入和未来输入部分;设置历史输入步长T和未来输入步长τ,历史输入数据由局部站点风速值和全局天气特征拼接构成,为X1:T∈RT×M,M为历史输入数据的维度,未来输入数据由全局天气特征拼接构成,为XT+1:T+τ∈Rτ×(M-1);
模型搭建过程包含以下分步骤:
S2.2.1、采用时序编码解码器将不同维度的历史输入和未来输入转化为同一维度d维的表征h1:T+τ∈R(T+τ)×d;所述时序编码解码器采用门控循环单元;将历史输入X1:T∈RT×M输入编码器,对隐藏层状态进行初始化,输出全部的隐藏层状态h1:T,过程如下:
在每一时刻t,门控循环单元依据上一时刻隐藏层状态ht-1和当前时刻输入xt,生成重置门控信号r和记忆门控信号z;
其中σ为激活函数,Wr、Wz为权重矩阵;
利用重置门控信号r生成t-1时刻重置隐状态h't-1;
h't-1=r⊙ht-1
使用记忆门控信号z生成t时刻隐状态ht;
ht=(1-z)⊙ht-1+z⊙h'
其中W为权重矩阵;
将T时刻隐状态hT作为解码器隐藏层的初始状态,将未来t步数据XT:T+τ∈Rτ×(M-1)作为解码器输入,经过上述步骤生成未来全部时刻隐藏层状态hT:T+τ;
S2.2.2、采用自注意力模块将表征h1:T+τ转换成融合时序特征的表征zT:T+τ∈Rτ×d;所述自注意力模块的实现步骤如下:
对于每一时刻表征ht∈Rd,分别计算其对应的查询特征qt∈Rq、键值特征kt∈Rq和实值特征vt∈Rv;
qt=ht×Wq
kt=ht×Wk
vt=ht×Wv
其中Wq、Wk、Wv均为权重矩阵;
对于每一时刻表征ht∈Rd,通过查询特征和键值特征计算它与其他状态的关系程度,记为scoret,1:T+τ;
对scoret,1:T+τ做归一化,作为每一时刻状态对t时刻状态的影响因子attent,1:T+τ,利用得到的影响因子对每一时刻实值特征做加权,得到经过自注意力机制处理后的表征ct∈Rv;
attent,1:T+τ=Softmax(scoret,1:T+τ)
ct=attent,1:T+τ×v1:T+τ
其中Softmax(·)为归一化函数;
改变Wq,Wk,Wv,计算新的查询特征、键值特征和实值特征,重复上述步骤N次,确保模型能够提取到不同时间长度的时序特征,得到N个t时刻的表征
通过全连接层将t时刻的N个表征转化为一个维度为d的表征zt∈Rd;
其中Wc为权重矩阵;
最终得到未来τ步时刻的d维表征zT:T+τ∈Rτ×d;
S2.2.3、采用前向神经网络将表征zT:T+τ转换成未来τ步时刻的预测风速结果yT:T+τ∈Rτ×1,完成模型搭建;
S2.3基于动态时间规整的训练策略训练预测模型;具体地,采用可微化的动态时间规整指标作为预测模型的损失函数;预测结果为yT:T+τ∈Rτ×1,标签为y'T:T+τ∈Rτ×1,损失函数为:
其中γ为惩罚因子,A为对齐路径,Ak,k为序列对齐矩阵,Δ(y,y')为y和y'的动态对齐距离,DTWγ(y,y')为y和y'的可微化的动态时间规整指标;
S3、实时预测阶段:将当前时刻之前一段时期的局部站点风速信息和全局天气特征作为历史输入,将当前时刻的全局天气预报特征作为未来输入,分别进行数据预处理后,输入到步骤S2训练好的多步时序预测模型,输出未来一段时间内风速预测值,之后进行基线提取的逆过程,得到最终风速预测结果;
S4、动态调度阶段:在风速预测基础上,协助调度人员优化大风分区设置,提前下达限速或停车指令。
2.根据权利要求1所述的基于多步时序预测的高速铁路大风限速动态处置方法,其特征在于,所述步骤S2.1中,采用线性插值法对原始数据缺失值进行补全,采用极大极小标准化消除量纲影响,将粗粒度的全局天气特征信息视为细粒度上的静态变量,再依据时刻信息和细粒度的局部风速信息进行对齐。
3.根据权利要求1所述的基于多步时序预测的高速铁路大风限速动态处置方法,其特征在于,所述步骤S2.3中,多步时序预测模型训练过程中,加入dropout神经元,避免模型训练过拟合;设置学习速率每隔固定学习轮数发生递减,加快模型收敛速度。
4.根据权利要求1所述的基于多步时序预测的高速铁路大风限速动态处置方法,其特征在于,所述步骤S4包括以下分步骤:
S4.1、基于未来多步风速预测结果设置大风区段和潜在大风区段,具体为:当某一站点无大风且预测未来一段时间t内大风持续时间低于阈值θ时,不设置大风区段,当某一站点当前时刻存在大风时,设置该站点两侧区域为大风区段,当某一站点无大风且预测未来一段时间t内大风持续时间超过阈值θ时,设置该站点两侧区域为潜在大风区段;
S4.2、列车调度员基于列车和大风设置区段位置关系,动态下达限速指令,具体为:当列车即将驶入大风区段或潜在大风区段时,由调度员观察该区段未来风速趋势预测图,结合列车与该区段位置关系及列车时速,判断是否下达限速或停车指令;若预判该列车驶入该区段后,大风存在,则下达限速或停车指令,否则,不下达限速或停车指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011295709.0A CN112308336B (zh) | 2020-11-18 | 2020-11-18 | 一种基于多步时序预测的高速铁路大风限速动态处置方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011295709.0A CN112308336B (zh) | 2020-11-18 | 2020-11-18 | 一种基于多步时序预测的高速铁路大风限速动态处置方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112308336A CN112308336A (zh) | 2021-02-02 |
CN112308336B true CN112308336B (zh) | 2023-12-19 |
Family
ID=74334786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011295709.0A Active CN112308336B (zh) | 2020-11-18 | 2020-11-18 | 一种基于多步时序预测的高速铁路大风限速动态处置方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112308336B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113689026A (zh) * | 2021-07-13 | 2021-11-23 | 上海眼控科技股份有限公司 | 一种气象数据预测方法、设备及存储介质 |
CN113562039B (zh) * | 2021-09-09 | 2022-04-29 | 中国铁道科学研究院集团有限公司通信信号研究所 | 一种面向多车协同的运行图自动调整方法及装置 |
CN115048992A (zh) * | 2022-06-06 | 2022-09-13 | 支付宝(杭州)信息技术有限公司 | 建立时间序列预测模型的方法、时间序列预测方法和装置 |
CN115795401B (zh) * | 2023-02-08 | 2023-04-21 | 青岛海洋地质研究所 | 海洋牧场全要素监测传感器多数据融合系统 |
CN117233869B (zh) * | 2023-11-15 | 2024-02-23 | 南京信息工程大学 | 一种基于GRU-BiTCN的站点短期风速预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018214060A1 (zh) * | 2017-05-24 | 2018-11-29 | 北京质享科技有限公司 | 一种城市小尺度空气质量指数预测方法与系统 |
CN110070224A (zh) * | 2019-04-20 | 2019-07-30 | 北京工业大学 | 一种基于多步骤递归预测的空气质量预测方法 |
CN110210646A (zh) * | 2019-04-25 | 2019-09-06 | 浙江大学 | 一种基于风速预测的高速铁路强风报警保持时间动态调整方法 |
CN111598325A (zh) * | 2020-05-11 | 2020-08-28 | 浙江工业大学 | 基于层次聚类和分层注意力机制的交通速度预测方法 |
CN111613054A (zh) * | 2020-05-07 | 2020-09-01 | 浙江大学 | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190188611A1 (en) * | 2017-12-14 | 2019-06-20 | Business Objects Software Limited | Multi-step time series forecasting with residual learning |
-
2020
- 2020-11-18 CN CN202011295709.0A patent/CN112308336B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018214060A1 (zh) * | 2017-05-24 | 2018-11-29 | 北京质享科技有限公司 | 一种城市小尺度空气质量指数预测方法与系统 |
CN110070224A (zh) * | 2019-04-20 | 2019-07-30 | 北京工业大学 | 一种基于多步骤递归预测的空气质量预测方法 |
CN110210646A (zh) * | 2019-04-25 | 2019-09-06 | 浙江大学 | 一种基于风速预测的高速铁路强风报警保持时间动态调整方法 |
CN111613054A (zh) * | 2020-05-07 | 2020-09-01 | 浙江大学 | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 |
CN111598325A (zh) * | 2020-05-11 | 2020-08-28 | 浙江工业大学 | 基于层次聚类和分层注意力机制的交通速度预测方法 |
Non-Patent Citations (1)
Title |
---|
数据驱动的高速铁路强风报警自适应解除策略;刘昊俣;贺诗波;陈积明;;自动化学报(12);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112308336A (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308336B (zh) | 一种基于多步时序预测的高速铁路大风限速动态处置方法 | |
CN112257850B (zh) | 一种基于生成对抗网络的车辆轨迹预测方法 | |
CN110322695B (zh) | 一种基于深度学习的短时交通流预测方法 | |
CN104091070B (zh) | 一种基于时间序列分析的轨道交通故障诊断方法和系统 | |
CN106448151B (zh) | 一种短时交通流预测方法 | |
Liu et al. | A novel deep learning-based encoder-decoder model for remaining useful life prediction | |
CN113487066A (zh) | 基于多属性增强图卷积-Informer模型的长时序货运量预测方法 | |
CN113762338B (zh) | 一种基于多重图注意力机制的交通流预测方法、设备及介质 | |
CN110348601A (zh) | 一种基于双向长短期记忆网络的地铁短期客流量预测方法 | |
CN109086926B (zh) | 一种基于组合神经网络结构的短时轨道交通客流预测方法 | |
CN115660161A (zh) | 一种基于时序融合Transformer模型的中期小时级负荷概率预测方法 | |
CN109886269A (zh) | 一种基于注意力机制的交通广告牌识别方法 | |
CN110837888A (zh) | 一种基于双向循环神经网络的交通缺失数据补全方法 | |
CN111352977A (zh) | 基于自注意力双向长短期记忆网络的时序数据监测方法 | |
CN114120637A (zh) | 一种基于连续监测器的智慧高速交通流量预测方法 | |
Jiao et al. | Multi-step traffic flow prediction method based on the Conv1D+ LSTM | |
Zhao et al. | Wavelet embedded attentive Bi-LSTM for short-term passenger flow forecasting | |
Miao et al. | A queue hybrid neural network with weather weighted factor for traffic flow prediction | |
CN114463978B (zh) | 一种基于轨道交通信息处理终端的数据监测方法 | |
Manokij et al. | Cascading Models of CNN and GRU with Autoencoder Loss for Precipitation Forecast in Thailand | |
Bao-yu et al. | Research on prediction of short-term passenger flow of urban rail transit based on deep neural network | |
CN109840613B (zh) | 一种融合编码解码和线性回归的短期风速预测方法 | |
CN113947904A (zh) | 基于s-g滤波和深信度网络的多尺度短时交通流预测方法 | |
Gu et al. | Daily OD Demand Prediction in Urban Metro Transit System: A Convolutional LSTM Neural Network with Multi-factor Fusion Channel-wise Attention | |
Duan et al. | An improved similarity matching bidirectional gated recurrent unit autoencoder scheme for remaining useful life prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |