CN113255225B - 少样本元提升学习的列车运动状态估计方法 - Google Patents
少样本元提升学习的列车运动状态估计方法 Download PDFInfo
- Publication number
- CN113255225B CN113255225B CN202110617467.0A CN202110617467A CN113255225B CN 113255225 B CN113255225 B CN 113255225B CN 202110617467 A CN202110617467 A CN 202110617467A CN 113255225 B CN113255225 B CN 113255225B
- Authority
- CN
- China
- Prior art keywords
- model
- train
- meta
- motion state
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Train Traffic Observation, Control, And Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及少样本元提升学习的列车运动状态估计方法,属于计算机与信息科学技术领域。主要为解决现有的列车运动状态建模方法无论是物理模型或是机器学习模型,均存在高成本建模问题,难以针对特定列车实现模型在线持续自适应以精确仿真,存在系统性仿真误差,而且难以满足列车自动驾驶系统的实时仿真等应用需求问题。本发明首先基于元数据采用元梯度提升学习算法建立模型,然后面向新任务,基于少量数据采用任务梯度提升学习算法,完成任务模型学习,实现对新列车的快速低成本精确仿真。结果表明本发明能较为准确的估计的列车运动状态,既减少了模型的训练成本,又提高了列车运动状态估计的精确度。
Description
技术领域
本发明涉及少样本元提升学习的列车运动状态估计方法,属于计算机与信息科学技术领域。
背景技术
列车运动状态估计可面向行驶中的真实列车或是仿真环境下的模拟列车,基于特定控制指令序列,完成对其速度、位置等指标的估计或预测,是列车自动驾驶系统建立并运行的基础。运动状态估计一般为连续的时间序列估计,例如对位于起始点速度为零的列车进行模拟,逐周期传入控制指令,对其加速、巡航、减速等全过程进行仿真,直至该列车到达终点附近且速度为零。单周期内,估计模型的输入可包括位置、速度、控车级位,输出则一般为加速度,并由输出推算下一周期的输入位置与速度。而在计算过程中,根据建模方法的不同,可能需提供电子地图、速度与阻力对应表、级位与力对应表等辅助数据资源。
针对列车运动状态建模的方法大致可分为两种类型,其一是采用传统列车物理模型,基于运动学组成,在抽样时刻从力的合成角度计算列车加速度,由此推算速度变化、位置变化等;其二则是利用机器学习方法,基于列车运行数据,构建状态影响变量与状态之间的映射函数,由此估计状态变化。
1.采用传统列车物理模型
传统列车物理模型,在进行首辆列车动力学调试后,利用获取到的首车动力学数据,主要包括某一时刻的列车状态,例如位置、速度、坡度以及当前时刻的控制命令等,以单质点模型建模为主,结合经验阻力公式添加简化后的空气及轨道阻力,联合其它可分析的环境因素进行计算,从而推算得到列车在某一时刻的运动参数,例如测量或由推算得到的对应控车级位与速度的牵引力、制动力以及阻力,或是依据列车质量等数据换算后得到的加速度组成成分,在获取运动参数之后推算下一周期的速度及位置则可以对列车进行运动状态的估计,从而模拟列车运动过程。
2.数据驱动的机器学习方法
数据驱动的列车状态建模的原理是利用真实列车的运行数据,建立模式识别模型,通过大量的列车运行数据挖掘仿真模型。该仿真模型同样面向单周期的状态估计,其输入输出基本与物理模型相似,但是输入中由测量或推算得到的力将由模型进行联合学习,直接由控车级位与速度估计合成力或是加速度。由此可见,数据驱动方法的最大优势是跳过了人工对这些力值或参数的测量过程,具备了自动获取参数或模式的能力,克服了显示建模的复杂性,降低了各种近似假设产生的误差。
2.1线性回归方法(linear regression-based model,LRM)
线性回归方法基于最小二乘回归,利用真实运行数据,自函数集F(v,s,c)中选择最佳的映射函数f,拟合输入速度、位置及控制命令映射与输出间的线性关系。该映射模式在实际验证中具备一定效果,较为适用于城市轨道交通等列车速度较低且阻力与速度呈现近线性关系的环境中。
2.2非线性回归方法(nonlinear regression-based model,NRM)
该类方法是对LRM的扩展,具体而言,考虑了轨道阻力、空气摩擦、坡度等可能与速度呈现非线性关系的因素,通过加入非线性成分因子,提高模型的拟合能力,奖励映射误差,进一步提升运动状态建模的精确性。NRM中采用戴维斯方程引入轨道阻力、空气阻力等成分,而阻力合成比例由戴维斯参数决定。通过利用实际的列车运行数据,非线性映射函数中的自变量参数及戴维斯参数以最小化误差为目标进行优化选择,而考虑到优化问题中还有的多组约束,则可考虑将约束与目标函数合并构成无约束非线性优化问题,并采用梯度下降快速解决,得到面向有限数据的局部最优解。
2.3神经网络机器学习方法
真实的列车运行过程是复杂延时系统,且列车实际为质量分散的有长度对象,因此线性及非线性回归等模型无法精确描述车辆全过程运行模式,特别是面向其延时特性、起步牵引及电空转换过程等。而神经网络则可通过增加隐藏层数量及传递模式提高模型对数据的拟合能力,并构建更为深层次化的高级特征,从而对复杂模式进行表达,但由于列车状态仿真的输入具有其独特性,例如变量具有维度差异、输入具备时序关联且数据量相对较少的复杂过程却对全局仿真效果具备较强影响等,导致在神经网络的设计和训练上需要采用多种技巧。
综上所述,目前针对列车运动状态估计的两种类型建模方法均有一定的局限性。对于物理模型方法,它虽具有良好的物理学基础、通用性及稳定性,但因模型参数固定,无法适应车辆间不可忽略的性能差异,包括牵引力、制动力、控制延时、轨道阻力等因素,难以实现车车适应。且随着列车运行及老化,相同列车的性能也会发生时变,因此由人工逐车定期进行模型精确化整定成本巨大且难以完成。对于数据驱动的机器学习方法,在维持输入输出不变的基础上,根据数据量及效果选择最佳算法可有效提升状态建模的效率与性能,但这些方法均依赖于大量的运行数据且忽略了列车间的差异影响。即面向特定列车进行建模时,需采集该车大量的运行数据后,才可对其进行模式识别,而当变更仿真列车时,则需重新采集数据,或是采用原模型进行仿真,牺牲建模的精确性以降低数据成本。
发明内容
本发明的目的是为解决现有的列车运动状态建模方法无论是物理模型或是机器学习模型,均存在高成本建模问题,难以针对特定列车实现模型在线持续自适应以精确仿真,存在系统性仿真误差,而且难以满足列车自动驾驶系统的实时仿真等应用需求问题,提出一种列车运动状态元提升学习精确建模方法。
本发明的设计原理为:首先基于元数据采用元梯度提升学习算法建立模型,然后面向新任务,基于少量数据采用任务梯度提升学习算法,完成任务模型学习,实现对新列车的快速低成本精确仿真。具体来讲,首先基于足量运行记录的历史列车运行数据集,例如已开通并运营的列车日志,利用新任务引导梯度优化方向,采用弱学习器组合建立强元梯度提升模型。然后基于一辆待仿真的新列车数据,该数据仅包含1-2站运行日志,此步骤重现元模型面向新任务的适应化和指导优化过程预判过程,维持元训练预判循环过程中的超参数,例如任务学习步数、学习率,并采用相同的损失函数与弱学习器建立方法,维持相同的优化算法,快速对元模型进行微调,建立精确仿真模型。
本发明的技术方案是通过如下步骤实现的:
步骤1,处理列车运行初始数据,划分元数据集。
步骤1.1,数据预处理,将列车运行的日志型数据转化为表格型数据。
步骤1.2,数据集划分,确定用于训练和测试的元数据。
步骤2,基于元数据,采用元梯度提升学习(Meta Gradient Boosting,MGB)算法,提出伪残差思想,即每次迭代时弱学习器拟合的伪残差不是模型损失函数在当前任务上的误差值,而是未来新任务经过新任务学习后的误差值,即以“更具学习能力”为目标,建立元列车状态仿真集成模型。
步骤2.1,在预判阶段,建立预判学习器,即基于元训练数据,面向当前模型Fm计算伪残差,并建立一组弱学习器来拟合此伪残差,同时对模型Fm进行增量更新,建立预判模型G。
步骤2.2,在更新阶段,建立更新学习器,即基于元测试数据,面向预判模型G计算伪残差,并建立一组弱学习器来拟合此伪残差,同时对模型Fm进行增量更新,建立新的元模型Fm+1。
步骤2.3,训练过程将循环迭代步骤2.1和2.2的两个过程,直至满足终止条件。算法的输入除训练数据外,需要指定元学习及任务学习的超参数,输出则为训练完成的元模型。
步骤3,基于1-2站少量任务数据,采用任务梯度提升学习算法,重现元模型建立的预判循环过程,维持相同的超参数例如任务学习步数,采用相同的损失函数,快速对元模型进行微调,建立精确列车状态仿真集成模型。
步骤4,根据精确列车状态仿真集成模型结果,输出列车运行有关变量,例如下一时刻速度、加速度,估计列车运行状态。
有益效果
对比于现有传统列车物理模型和数据驱动的机器学习方法,本发明可低成本建立具有列车仿真任务学习能力的元集成模型,能够针对特定列车快速进行仿真微调,数据成本仅为1-2站运行数据,实现车车精确建模,有效提升对列车运动状态的估计及预测效果。
附图说明
图1为本发明少样本元提升学习的列车运动状态估计方法原理图。
图2为本发明元梯度提升学习算法原理图。
图3为本发明任务梯度提升学习算法原理图。
具体实施方式
为了更好的说明本发明的目的和优点,下面结合实例对本发明方法的实施方式做进一步详细说明。
实验采用国内真实列车运行数据,使用的硬件环境为MSI Prestige台式计算机,CPU型号为Intel Core i7 10700K,八核十六线程处理器,CPU主频3.8GHz,物理内存32G,内存频率2400MHz,显卡为GeForce RTX 2020SUPER,建模仿真平台的操作系统为window 10。
元梯度提升学习对比实验中,将基于有限训练数据,采用研究所提元学习方法及其它高性能回归模型训练方法,建立多组面向不同列车的运动状态估计模型,并对比各个模型在真实数据条件及场景下的性能表现,对比分析所提方法的建模效果。
由于列车运动状态估计核心是按照周期,闭环对下一时刻的列车速度、位置进行推算,而主要模型输出变量为加速度,模型主要对加速度估计精度进行评估。模型评价指标采用均方误差(Mean Squared Error,MSE),对应平方误差的期望,具体计算方法如公式1所示:
本次实验的具体流程为:
步骤1,处理列车运行数据,初始化元模型。
步骤1.1,进行数据预处理,将列车运行的日志数据转化为表格型数据,并对数据行、列名进行整定,将数据按列车存放,并逐车进行拆站,建立列车的运行站数据集。然后对数据进行完整性及噪声检查,删除存在缺失情况的运行站数据,并对完整站进行加速度计算。
步骤1.2,进行数据集划分,元数据集中,每辆列车具有充分的运行数据,测试任务数据集中,每辆列车仅有少量的运行数据,一般维持在1站左右,而实际的性能评估数据,则是在测试任务数据集中,每辆列车除用于训练的1站以外的数据资源,元训练与测试的列车数量按照7:3左右的比例划分。此外由于列车系统是典型延时系统,因此控车命令下达后,由于控制硬件、软件及列车动力学系统的延时特性,命令将影响未来某些周期下的列车运动状态改变,故模型应具备延时模式的学习能力,为此,将建立历史级位特征,为模型提供学习资源。
步骤2,基于元数据,采用元梯度提升学习(Meta Gradient Boosting,MGB)算法,建立元列车状态仿真集成模型,其元梯度提升学习的训练目标是从集成模型假设集中F(x)建立列车运动状态估计元模型以最小化损失:
步骤2.3,在隔离测试任务数据的条件下采用10次交叉验证的方法确定超参数,取验证中表现最好的参数组不断迭代2.1和2.2方法训练元模型。
步骤3,在元模型的基础上,使用模拟真实情景的测试任务数据集中的少量任务训练数据,针对每辆任务车辆建立任务模型,训练超参数与步骤2.1中确定的超参数保持一致,任务学习完成后,可得到针对特定车辆的任务模型。
步骤4,利用任务模型估计列车的运动状态。
测试结果:为了评判模型性能和预测效果,使用测试任务数据集中除用于少量任务训练的剩余测试数据,以加速度估计的MSE误差为依据,对多个算法在列车精确建模问题中的实际性能表现进行评估。对比算法使用支持向量回归(SVR),随机森林(RandomForest,RF),梯度提升决策树(GBDT),XGBoost。在步骤2.3中基于元数据训练的模型中SVR算法的MSE值为22.38、RF为30.11、GBDT为25.46、XGBoost为32.39,而在步骤3中基于真实情景的少量任务数据训练的模型中SVR算法的MSE值为53.11、RF为61.25、GBDT为51.13、XGBoost为73.50,而本发明提出的元梯度提升学习(MGB)MSE值仅为19.11,为最低均方根误差值。从而可以说明在仅有少量列车运行样本的前提下,本发明用以估计列车运动状态具有很好的效果。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.少样本元提升学习的列车运动状态估计方法,其特征在于所述方法包括如下步骤:
步骤1,处理列车运行初始数据,划分为元数据集;
步骤2,初始化一组由弱学习器构成的列车运动状态估计元模型Fm,采用元梯度提升学习算法,分两个阶段进行迭代更新;在预判阶段,基于元训练数据面向所述元模型Fm计算伪残差:建立一组弱学习器g拟合rsupport,并对所述元模型Fm进行增量更新,建立预判模型G,其中表示所述元模型Fm经过损失函数计算后的梯度,为所述元模型Fm使用元训练数据面向不同类型任务的目标损失函数;在更新阶段,基于元测试数据面向预判模型G计算伪残差: 建立一组弱学习器f拟合rquery,并对所述元模型Fm进行增量更新,建立新的元模型Fm+1,其中表示预判模型G经过损失函数计算后的梯度,为预判模型G使用元测试数据面向不同类型任务的目标损失函数;循环迭代两个阶段,更新所述元模型Fm;
步骤3,基于1或2站少量运行数据,在步骤2所得元模型Fm的基础上,采用任务梯度提升学习算法,保持与所述元模型Fm预判阶段相同的超参数,快速对所述元模型Fm进行微调,建立精确列车状态仿真集成模型;
步骤4,根据精确列车状态仿真集成模型结果,输出列车运行状态变量,估计列车运动状态。
2.根据权利要求1所述的少样本元提升学习的列车运动状态估计方法,其特征在于:步骤2中提出的元梯度提升学习算法使用了伪残差思想,即每次迭代时弱学习器拟合的伪残差不是模型损失函数在当前任务上的误差值,而是未来新任务经过新任务学习后的误差值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110617467.0A CN113255225B (zh) | 2021-05-28 | 2021-05-28 | 少样本元提升学习的列车运动状态估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110617467.0A CN113255225B (zh) | 2021-05-28 | 2021-05-28 | 少样本元提升学习的列车运动状态估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113255225A CN113255225A (zh) | 2021-08-13 |
CN113255225B true CN113255225B (zh) | 2022-09-20 |
Family
ID=77186313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110617467.0A Active CN113255225B (zh) | 2021-05-28 | 2021-05-28 | 少样本元提升学习的列车运动状态估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255225B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115056829B (zh) * | 2022-05-16 | 2024-09-20 | 北京理工大学 | 多车型连续学习的列车运动状态估计方法 |
CN114970341B (zh) * | 2022-05-18 | 2024-04-02 | 中国西安卫星测控中心 | 基于机器学习的低轨卫星轨道预报精度提升模型建立方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190244139A1 (en) * | 2018-02-02 | 2019-08-08 | Oracle International Corporation | Using meta-learning for automatic gradient-based hyperparameter optimization for machine learning and deep learning models |
CN110147835A (zh) * | 2019-05-10 | 2019-08-20 | 东南大学 | 基于梯度增强回归算法的梁柱节点抗剪强度预测方法 |
CN110707763B (zh) * | 2019-10-17 | 2022-09-06 | 南京理工大学 | 一种基于集成学习的交直流配电网负荷预测方法 |
CN112733448B (zh) * | 2021-01-07 | 2023-03-03 | 北京理工大学 | 列车自动驾驶系统参数自学习双q表联合代理建立方法 |
-
2021
- 2021-05-28 CN CN202110617467.0A patent/CN113255225B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113255225A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113255225B (zh) | 少样本元提升学习的列车运动状态估计方法 | |
Silvas et al. | Synthesis of realistic driving cycles with high accuracy and computational speed, including slope information | |
Barth et al. | Recent validation efforts for a comprehensive modal emissions model | |
CN103514369B (zh) | 一种基于主动学习的回归分析系统及方法 | |
CN112001422B (zh) | 一种基于深度贝叶斯学习的图像标记估计方法 | |
JP2022089806A (ja) | 車両の動作プロファイルのモデリング | |
CN111951430A (zh) | 一种车辆驾驶性评价方法及其系统 | |
CN111832839B (zh) | 基于充分增量学习的能耗预测方法 | |
CN109376331A (zh) | 一种基于梯度提升回归树的城市公交车排放率估计方法 | |
JP2020175885A (ja) | 走行曲線を決定するための方法 | |
JP2020177016A (ja) | 内燃機関を有する車両の駆動システムの排気ガス排出量を低減するための方法 | |
CN114278727B (zh) | 极限工况下的车辆自动换挡控制方法、系统、介质及设备 | |
CN117495126A (zh) | 高比例新能源配电网线损预测方法及装置 | |
CN117818706B (zh) | 一种中低速磁浮列车速度预测方法、系统、设备及介质 | |
CN115965177A (zh) | 基于注意力机制改进的自回归误差补偿风电功率预测方法 | |
CN113806857A (zh) | 一种基于变分图自编码器的高速列车节能制动方法 | |
CN106529075B (zh) | 一种考虑分时段的非线性模拟风速方法 | |
CN109212999A (zh) | 数字卫星仿真工况的智能生成方法及系统 | |
CN117057190A (zh) | 一种轨道车辆制动盘温升预测方法 | |
CN115056829B (zh) | 多车型连续学习的列车运动状态估计方法 | |
CN114655074B (zh) | 一种基于贝叶斯回归的电动汽车实际行驶能耗估计方法 | |
CN114722704A (zh) | 车轮磨损预测网络模型训练方法、装置 | |
Kan et al. | Development of a novel engine power model to estimate heavy-duty truck fuel consumption | |
CN113779864B (zh) | 面向自动驾驶汽车的运行设计区域构建方法和装置 | |
CN114722487A (zh) | 一种基于大数据的新能源汽车车型参数预测估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |