CN110598955B - 一种用于高速列车的最大瞬时风速概率预测方法 - Google Patents

一种用于高速列车的最大瞬时风速概率预测方法 Download PDF

Info

Publication number
CN110598955B
CN110598955B CN201910909626.7A CN201910909626A CN110598955B CN 110598955 B CN110598955 B CN 110598955B CN 201910909626 A CN201910909626 A CN 201910909626A CN 110598955 B CN110598955 B CN 110598955B
Authority
CN
China
Prior art keywords
model
wind speed
speed
training data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910909626.7A
Other languages
English (en)
Other versions
CN110598955A (zh
Inventor
王浩
张一鸣
茅建校
郜辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201910909626.7A priority Critical patent/CN110598955B/zh
Publication of CN110598955A publication Critical patent/CN110598955A/zh
Application granted granted Critical
Publication of CN110598955B publication Critical patent/CN110598955B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于高速列车的最大瞬时风速概率预测方法。该方法包括:第一步,采集列车运行过程中的最大风速序列,并将其划分为训练数据、验证数据以及测试数据;第二步,输入训练数据至LSTM模型,同时将训练数据随机化成若干组输入至RF模型;第三步,以训练数据及验证数据的损失值均逐渐减小为原则,调整RF模型与LSTM模型的超参数以使模型性能达到最优,运行LSTM模型若干次得到多组不同的输出值;第四步,采用RF模型及LSTM模型的输出值作为GPR模型的输入,训练并确定GPR模型的最优核函数;第五步,将测试数据输入最优RF模型及LSTM模型,GPR模型的输出值即为最大瞬时风速的概率预测值,用以提前控制强风下的高速列车车速。

Description

一种用于高速列车的最大瞬时风速概率预测方法
技术领域:
本发明涉及铁路工程领域,通过集成不同的深度学习算法,对强风下高速列车的最大瞬时风速进行概率预测,具体涉及一种用于高速列车的最大瞬时风速概率预测方法。
背景技术:
近年来,世界范围内列车在强风作用下导致的脱轨事故时有发生,带来了严重的经济损失甚至人员伤亡。强风下列车的车速控制主要依赖于实测或预测的最大瞬时风速,因此精确的风速预测方法是减小列车在强风下运行时事故发生率的有效手段。
现有风速预测方法主要分为基于物理模型和数据驱动的两大类方法。基于物理模型的风速预测方法需要考虑如温度、湿度、大气压等气象信息,常借助流体动力学和热力学公式进行天气预测,而用于短期风速预测时精度较低。数据驱动的风速预测方法主要采用历史数据建立统计模型预测未来短期风速。ARIMA模型,即差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),也叫求和自回归移动平均模型,由于其数学表达式明确且计算效率较高的特点被广泛用于预测短期风速,但风速序列的非平稳和非线性较强时,其预测精度将会降低。一些处理非线性能力较强的预测方法包括人工神经网络(ANN)、支持向量机(SVM)及高斯过程模型(GPR)也得到了快速发展及应用。
为进一步提高风速预测的准确性,混合预测方法近年来得到了广泛关注。混合预测方法融合了多种预测方法针对风速序列中的不同成分进行建模。基于ARIMA的混合预测方法包括ARIMA-ANN、ARIMA-SVR等,该方法主要基于风速序列包括线性成分和非线性成分的假设。首先利用ARIMA可有效处理线性时间序列的特点对风速进行建模预测,其预测残差被认为主要包含非线性成分,因而采用ANN或SVR等处理非线性能力较强的方法进行建模,最后的预测值为两种模型输出值的叠加。然而,由于残差中可能包含线性成分,在一些情况下,这种假设可能会降低预测方法的准确性。另一种常用的混合预测方法主要利用如小波变换、经验模态分解等信号处理手段,将随机性较强的风速序列进行预处理,以提高预测性能。其主要做法是,利用信号分解方法,将原始风速分解为不同的子序列,然后对各个风速子序列分别建模预测,叠加各子序列的输出值即为风速预测值。
深度学习算法由于其精度高、鲁棒性强等优点被逐渐认为是预测时间序列的有效方法。在深度学习算法中,长短时记忆神经网络(LSTM)与随机森林(RF)常用于处理时间序列的非线性问题,但在最大风速的短时预测中应用较少。由于最大风速具有较高的随机性即不确定性,导致了较高的预测难度。概率预测方法除了进行单值预测外同时考虑了预测结果的不确定性,从而为决策者提供了更多有效的信息。然而,现有风速预测方法多面向风速均值的预测而非瞬时风速的最大值,且没有充分利用深度学习算法的特点。另外,现有方法多为风速单值预测,忽略了风速预测的不确定性。因此,亟需一种面向最大瞬时风速的精确概率预测方法,为列车在强风下运行时的车速控制提供有效依据。
发明内容
针对上述存在的问题,本发明提出一种用于高速列车的最大瞬时风速概率预测方法,采用多种深度学习算法,充分结合不同算法的特点,深度挖掘最大风速序列中的有效信息,从而根据历史数据进行准确预测。另外,在预测过程中考虑了风速的不确定性,可为强风下高速列车的速度控制提供更为全面有效的信息,本发明中所述的高速列车,一般是指时速在250km以上的列车。
上述的目的通过以下技术方案实现:
一种用于高速列车的最大瞬时风速概率预测方法,该方法包括如下步骤:
第一步,选取最大风速序列:采集列车运行过程中的风速数据,提取指定步长的最大风速,将其划分为训练数据、验证数据以及测试数据;
第二步,根据偏自相关函数确定模型输入变量的数量,输入第一步中得到的训练数据至LSTM模型,同时将第一步中得到的训练数据随机化成若干组输入至RF模型;
第三步,以训练数据及验证数据的损失值均逐渐减小为原则,调整RF模型与LSTM模型的超参数以使模型性能达到最优,运行最优LSTM模型若干次得到多组不同的输出值;
第四步,采用RF模型及LSTM模型的输出值作为GPR模型的输入,根据验证数据的均方根误差值最小原则,训练并确定GPR模型的最优核函数;
第五步,将测试数据输入第三步中得到的最优RF模型及LSTM模型,GPR模型的输出值即为最大瞬时风速的概率预测值,用以提前控制强风下的高速列车车速。
所述的用于高速列车的最大瞬时风速概率预测方法,第一步中所述指定步长为1-2分钟,划分为训练数据、验证数据以及测试数据的方法是将提取的指定步长中最大风速序列的数据集按8:1:1的比例划分为训练数据、验证数据以及测试数据。
所述的用于高速列车的最大瞬时风速概率预测方法,第二步中所述根据偏自相关函数确定模型输入变量的数量的方法是:假设最大瞬时风速时间序列为{x1,x2,…,xn},当阶数为k时对应的偏自相关函数值超过95%的置信区间时,即认为k为输入变量的数量。
所述的用于高速列车的最大瞬时风速概率预测方法,第二步中所述将第一步中得到的训练数据随机化的次数以及第三步中最优LSTM的运行次数不少于3次。
所述的用于高速列车的最大瞬时风速概率预测方法,第三步中所述以训练数据及验证数据的损失值均逐渐减小为原则,调整RF模型与LSTM模型的超参数以使模型性能达到最优的过程中,所述损失值减小采用损失函数表征,损失函数采用均方误差MSE或平均绝对误差MAE,如下式所示:
Figure BDA0002214332100000031
Figure BDA0002214332100000032
其中,yi
Figure BDA0002214332100000033
分别表示实际值和预测值,N为样本数量。
所述的用于高速列车的最大瞬时风速概率预测方法,所述GPR模型的核函数为平方指数核函数、指数核函数、Matern核函数或三种核函数的组合。
有益效果:
本发明基于深度学习算法预测性能高的特点,充分结合不同算法的优势,深度挖掘最大瞬时风速序列中的有效信息,从而根据历史数据进行准确预测。另外,相对于传统风速预测方法,本发明所述方法在预测过程中除了进行单值预测外同时考虑了预测结果的不确定性,为强风下高速列车的速度控制提供了更为全面有效的信息。
附图说明
图1为最大瞬时风速概率预测方法的流程图;
图2为长短时记忆神经网络预测的示意图;
图3为随机森林模型预测的示意图。
具体实施方式
本发明所述的一种用于高速列车的最大瞬时风速概率预测方法,主要通过以下步骤实现:
如图1所示,首先利用风速仪采集风速数据,提取指定步长的最大风速,将其划分为训练数据、验证数据以及测试数据。其中,所述指定步长一般为1-2分钟。由于风速序列具有较强的随机性,选取的训练数据数量应远大于验证及测试数据。因此,一般按照8:1:1的比例将最大风速序列划分为训练数据、验证数据以及测试数据,根据偏自相关函数图确定模型输入变量的数量,即假设最大瞬时风速时间序列为{x1,x2,…,xn},当阶数为k时对应的偏自相关函数值超过95%的置信区间时,即认为k为输入变量的数量。
输入训练数据至LSTM模型,将原始训练数据随机化成若干组并输入至RF模型,从而得到多个不同的RF模型。以训练数据及验证数据的损失值均逐渐减小为原则,其中损失函数可选择MSE或MAE:
如下式所示:
Figure BDA0002214332100000041
Figure BDA0002214332100000042
其中,yi
Figure BDA0002214332100000043
分别表示实际值和预测值,N为样本数量。
调整RF与LSTM模型的超参数使模型性能达到最优,运行最优LSTM模型若干次得到多组不同的输出值。根据以上步骤,可得到多组不同的输出值,且原始训练数据随机化的次数以及LSTM运行次数不少于3次,其原因是为了保证训练数据的多样性。
采用RF及LSTM模型的输出值作为GPR模型的输入值,由于GPR模型中的核函数直接影响到风速概率预测方法的准确性,通过比较平方指数核函数、指数核函数、Matern核函数或三种核函数的组合,并根据验证数据的均方根误差值最小原则,训练并确定GPR模型的最优核函数。将测试数据输入最优RF及LSTM模型,最优GPR模型的输出值即为最大瞬时风速的概率预测值,用以提前控制强风下的高速列车车速。
LSTM模型的调试过程如图2所示,根据偏自相关函数确定训练数据的输入变量个数,将原始训练数据分为两列待拟合数据输入至LSTM模型并对其进行训练,输入验证数据至LSTM模型中,不断改变LSTM的超参数,直到训练数据和验证数据的RMSE持续降低时,认为LSTM模型性能达到最优。
RF模型的调试过程如图3所示,将原始训练数据随机化成若干组新的训练数据输入至RF模型中,将每组随机化后的训练数据划分为两列待拟合数据对RF模型进行训练,输入验证数据至RF模型,调试RF超参数直到验证数据的RMSE达到最小时,认为RF模型性能达到最优。
以上所述的具体实施操作方法,对本发明的技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述为本发明具体实施方式,凡在本发明的精神和原则之内,所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种用于高速列车的最大瞬时风速概率预测方法,其特征在于,该方法包括如下步骤:
第一步,选取最大风速序列:采集列车运行过程中的风速数据,提取指定步长的最大风速,将其划分为训练数据、验证数据以及测试数据;
第二步,根据偏自相关函数确定模型输入变量的数量,输入第一步中得到的训练数据至LSTM模型,同时将第一步中得到的训练数据随机化成若干组输入至RF模型;
第三步,以训练数据及验证数据的损失值均逐渐减小为原则,调整RF模型与LSTM模型的超参数以使模型性能达到最优,运行最优LSTM模型若干次得到多组不同的输出值;
第四步,采用RF模型及LSTM模型的输出值作为GPR模型的输入,根据验证数据的均方根误差值最小原则,训练并确定GPR模型的最优核函数;
第五步,将测试数据输入第三步中得到的最优RF模型及LSTM模型,GPR模型的输出值即为最大瞬时风速的概率预测值,用以提前控制强风下的高速列车车速。
2.根据权利要求1所述的用于高速列车的最大瞬时风速概率预测方法,其特征在于:第一步中所述指定步长为1-2分钟,按8:1:1的比例将最大风速序列划分为训练数据、验证数据以及测试数据。
3.根据权利要求1所述的用于高速列车的最大瞬时风速概率预测方法,其特征在于,第二步中所述根据偏自相关函数确定模型输入变量的数量的方法是:假设最大瞬时风速时间序列为{x1,x2,…,xn},当阶数为k时对应的偏自相关函数值超过95%的置信区间时,即认为k为输入变量的数量。
4.根据权利要求1所述的用于高速列车的最大瞬时风速概率预测方法,其特征在于:第二步中所述的训练数据随机化的次数以及第三步中最优LSTM的运行次数均不少于3次。
5.根据权利要求1所述的用于高速列车的最大瞬时风速概率预测方法,其特征在于:第三步中所述以训练数据及验证数据的损失值均逐渐减小为原则,调整RF模型与LSTM模型的超参数以使模型性能达到最优的过程中,所述损失值减小采用损失函数表征,损失函数采用均方误差MSE或平均绝对误差MAE,如下式所示:
Figure FDA0002214332090000011
Figure FDA0002214332090000012
其中,yi
Figure FDA0002214332090000013
分别表示实际值和预测值,N为样本数量。
6.根据权利要求1所述的用于高速列车的最大瞬时风速概率预测方法,其特征在于:所述GPR模型的核函数为平方指数核函数、指数核函数、Matern核函数或三种核函数的组合。
CN201910909626.7A 2019-09-25 2019-09-25 一种用于高速列车的最大瞬时风速概率预测方法 Active CN110598955B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910909626.7A CN110598955B (zh) 2019-09-25 2019-09-25 一种用于高速列车的最大瞬时风速概率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910909626.7A CN110598955B (zh) 2019-09-25 2019-09-25 一种用于高速列车的最大瞬时风速概率预测方法

Publications (2)

Publication Number Publication Date
CN110598955A CN110598955A (zh) 2019-12-20
CN110598955B true CN110598955B (zh) 2022-12-20

Family

ID=68863135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910909626.7A Active CN110598955B (zh) 2019-09-25 2019-09-25 一种用于高速列车的最大瞬时风速概率预测方法

Country Status (1)

Country Link
CN (1) CN110598955B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914479A (zh) * 2020-07-03 2020-11-10 天津大学 一种用于大坝基岩的灌浆功率混合区间预测方法
CN112183866A (zh) * 2020-09-29 2021-01-05 中南大学 一种短时风速超越概率的预测方法及系统
CN112231979B (zh) * 2020-10-16 2022-06-24 中国船舶重工集团海装风电股份有限公司 基于计算流体力学和机器学习的山区瞬时风况预报方法
CN112684701A (zh) * 2020-12-01 2021-04-20 哈尔滨工程大学 一种基于长短时记忆网络和高斯过程回归的船舶运动预报方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126896A (zh) * 2016-06-20 2016-11-16 中国地质大学(武汉) 基于经验模态分解和深度学习的混合模型风速预测方法及系统
CN106875041A (zh) * 2017-01-16 2017-06-20 广东电网有限责任公司揭阳供电局 一种短期风速预测方法
CN107765347A (zh) * 2017-06-29 2018-03-06 河海大学 一种高斯过程回归和粒子滤波的短期风速预测方法
CN108520269A (zh) * 2018-03-10 2018-09-11 华北电力大学(保定) 一种风速预测方法及风速预测系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126896A (zh) * 2016-06-20 2016-11-16 中国地质大学(武汉) 基于经验模态分解和深度学习的混合模型风速预测方法及系统
CN106875041A (zh) * 2017-01-16 2017-06-20 广东电网有限责任公司揭阳供电局 一种短期风速预测方法
CN107765347A (zh) * 2017-06-29 2018-03-06 河海大学 一种高斯过程回归和粒子滤波的短期风速预测方法
CN108520269A (zh) * 2018-03-10 2018-09-11 华北电力大学(保定) 一种风速预测方法及风速预测系统

Also Published As

Publication number Publication date
CN110598955A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
CN110598955B (zh) 一种用于高速列车的最大瞬时风速概率预测方法
AU2018102176A4 (en) Method for short-term traffic flow prediction based on spatiotemporal correlation
CN103927412B (zh) 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN112149316A (zh) 基于改进的cnn模型的航空发动机剩余寿命预测方法
CN106951919A (zh) 一种基于对抗生成网络的流速监测实现方法
CN113344288B (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
Heng et al. Probabilistic and deterministic wind speed forecasting based on non-parametric approaches and wind characteristics information
CN104933489A (zh) 基于自适应神经模糊推理系统的风电功率实时高精度预测方法
Sun et al. Research on the classification and identification of driver’s driving style
Qiu et al. The early-warning model of equipment chain in gas pipeline based on DNN-HMM
CN115221930A (zh) 一种滚动轴承的故障诊断方法
CN106647650A (zh) 基于变量加权pca模型的分散式工业过程监测方法
CN110286668A (zh) 一种基于大数据的轨交信号系统vim板卡故障预测方法
CN114358389A (zh) 结合vmd分解和时间卷积网络的短期电力负荷预测方法
CN115542429A (zh) 一种基于XGBoost的臭氧质量预测方法及系统
CN105956708A (zh) 基于灰关联时间序列的短期风速预测方法
CN104111109B (zh) 一种基于不同阶次统计量及支持向量机的机械振动状态识别方法
CN117669834A (zh) 一种交通流预测方法、装置及存储介质
CN112948462A (zh) 一种基于改进的奇异谱分析和Bp神经网络的超短期风速预测方法
Qu et al. Short-term wind power forecasting based on numerical weather prediction adjustment
CN117154680A (zh) 一种基于非平稳Transformer模型的风电功率预测方法
CN115980885A (zh) 基于集合预报的降水预报偏差校正方法
CN114297795A (zh) 一种基于PR-Trans的机械设备剩余寿命预测方法
Lijie et al. Short-term wind power prediction with signal decomposition
Li et al. GA-SVR traffic flow prediction based on phase space reconstruction with improved KNN method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant