CN113822499B - 一种基于模型融合的列车备件损耗预测方法 - Google Patents

一种基于模型融合的列车备件损耗预测方法 Download PDF

Info

Publication number
CN113822499B
CN113822499B CN202111393234.3A CN202111393234A CN113822499B CN 113822499 B CN113822499 B CN 113822499B CN 202111393234 A CN202111393234 A CN 202111393234A CN 113822499 B CN113822499 B CN 113822499B
Authority
CN
China
Prior art keywords
data
model
training
train
svm model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111393234.3A
Other languages
English (en)
Other versions
CN113822499A (zh
Inventor
吴雷
袁志宏
康俊利
郑剑英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Maglev Co ltd
Original Assignee
Beijing Maglev Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Maglev Co ltd filed Critical Beijing Maglev Co ltd
Priority to CN202111393234.3A priority Critical patent/CN113822499B/zh
Publication of CN113822499A publication Critical patent/CN113822499A/zh
Application granted granted Critical
Publication of CN113822499B publication Critical patent/CN113822499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P80/00Climate change mitigation technologies for sector-wide applications
    • Y02P80/10Efficient use of energy, e.g. using compressed air or pressurized fluid as energy carrier

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Geometry (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Mathematics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Automation & Control Theory (AREA)

Abstract

本发明公开了一种基于模型融合的列车备件损耗预测方法,属于备件损耗预测技术领域。将影响列车备件损耗的特征向量进行灰度关联分析得到第一数据集并归一化处理,分成数据A和数据B;利用数据A分别训练BP神经网络、SVM模型和CART模型,将数据B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’;交换训练集和测试集,得到组合预测数据库A’;将A’、B、B’和A构成第二数据集,输入到SVM模型中进行训练得到优化后的SVM模型,将待预测数据输入训练后的BP神经网络、SVM模型和CART模型中得到三个数据,再将三个数据输入到最优的SVM模型中得到列车备件损耗预测数据。

Description

一种基于模型融合的列车备件损耗预测方法
技术领域
本发明属于备件损耗预测技术领域,具体涉及一种基于模型融合的列车备件损耗预测方法。
背景技术
在轨道交通日益发达的今天,我们国家的高铁铁路里程已经是世界第一。同时也应该看到如何保证后勤库存的有效供应。备件作为一种保障性物资,是不可或缺的物资,也是保证设备正常运行的关键性因素。企业在设备的运行过程中,如何在满足必要条件下,确定最低库存量,最好实现零库存是一个艰难的问题。库存数量过于充足能满足使用条件,但是也造成了大量的资金的消耗,不利于企业的扩张与前进;极少的库存,在遇到非常情况时,可能会造成重大的损失,不利于国计民生。
通常管理人员确定下一次的采购量一般是依据备件的ABC分类法来确定,也有使用灰色预测来确定,后来机器学习的兴起,逐渐有使用BP神经网络与SVM等常规的小样本数据处理模型。同时应该看到单个模型考虑的影响因素较少,以及模型的单一化造成的预测不准确缺点。备件的存储数量一直以来都是困扰库存管理人员的一大痛点。如何更好的预测下一季度的采购量是一个非常值得研究的问题。
发明内容
本发明的目的是为了准确的预测列车备件的采购量。
本发明提供了一种基于模型融合的列车备件损耗预测方法,包括以下步骤:
步骤1:将影响列车备件损耗的特征向量进行灰度关联分析进行排序,再根据预设规则得到关键影响因素作为第一数据集;
步骤2:将步骤1得到的第一数据集进行归一化处理;
步骤3:将归一化后的第一数据集分成数据A和数据B;
将数据A作为训练集,数据B作为测试集:利用训练集A分别训练BP神经网络、SVM模型和CART模型,然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到得到组合预测数据库B’;
将数据B作为训练集,数据A作为测试集:利用训练集B分别训练BP神经网络、SVM模型和CART模型,然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到得到组合预测数据库A’;
步骤4:将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集,将第二数据集输入到SVM模型中进行训练,得到最优的SVM模型;
步骤5:将待预测数据输入到步骤3中训练后的BP神经网络、SVM模型和CART模型中得到三个数据,再将三个数据输入到步骤4最优的SVM模型中得到列车备件损耗预测数据。
进一步地限定,步骤1所述的列车备件损耗的特征向量为:载客量比、备件故障率、当季湿度天数占比、当季度异常天气占比、当季度温度天数占比、列车的使用时长、维修手册数量、维护人员素质、维修人员数量和线路使用时长。
进一步地限定,步骤2所述的归一化处理的公式为:
Figure DEST_PATH_IMAGE001
,式中,
Figure DEST_PATH_IMAGE002
是归一化后的值,
Figure DEST_PATH_IMAGE003
是该列元素的值,
Figure DEST_PATH_IMAGE004
为该列中数值最小的元素值,
Figure DEST_PATH_IMAGE005
为该列中数值最大的元素值。
进一步地限定,步骤3所述第一数据集是按照1:1比例分成训练集和测试集的。
进一步地限定,步骤3所述的BP神经网络的隐藏神经元个数为
Figure DEST_PATH_IMAGE006
,其中
Figure DEST_PATH_IMAGE007
是输入特征的个数,输出神经元的个数是1。
进一步地限定,步骤3所述SVM模型的核函数的宽带为0.1,惩罚参数设置为10。
进一步地限定,步骤3所述CART模型的最大深度为2。
进一步地限定,步骤4所述SVM模型的惩罚参数设置为2。
本发明提供了一种基于模型融合的列车备件损耗预测装置,包括:
排序模块,用于将影响列车备件损耗的特征向量进行灰度关联分析进行排序,再根据预设规则得到关键影响因素作为第一数据集;
数据处理模块,用于将第一数据集进行归一化处理;
训练模块,用于将归一化后的第一数据集分成数据A和数据B;
将数据A作为训练集,数据B作为测试集:利用训练集A分别训练BP神经网络、SVM模型和CART模型,然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’;
将数据B作为训练集,数据A作为测试集:利用训练集B分别训练BP神经网络、SVM模型和CART模型,然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库A’;
预测模块,用于将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集,将第二数据集输入到SVM模型中得到列车备件损耗预测数据。
本发明提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述中任一所述的基于模型融合的列车备件损耗预测方法。
有益效果:1)提出基于BP神经网络、SVM模型、CART回归树模型预测和灰色预测相结合的模型可以很好的解决单个模型下数据预测不准确的缺点。通过引入灰色关联分析,可以很好的把握哪些影响因素是主要,哪些是次要,减少了非关键因素的影响。通过上述两者的结合方法可以很好的解决列车备件在实际需求中的备件消耗情况,更好的制定下一季度的采购量。在很大的程度上节约了资金,提升了企业的能效。
2)归一化的目的:消除量纲的影响。单个模型考虑的影响因素较少,以及模型的单一化造成的预测不准确缺点总体是:提升模型的精度;模型更加稳健。
3)将归一化后的数据集分成数据A和数据B,利用数据A进行三个训练模型进行训练后,进行数据集交叉训练后再混合数据集,弥补数据集少带来的训练欠拟合问题;常见模型结合的策略有平均法、投票法和学习法,而前两者过于简单且会引入主观因素,因此使用学习法。
4)SVM在小样本数据处理上具有良好的性质,因此使用其作为模型结合的策略。
附图说明
图1为本发明的训练流程图。
图2为三层神经网络模型。
图3为本发明的预测流程图。
具体实施方式
实施例1.
训练流程图如图1所示,预测流程图如图3所示,一种基于模型融合的列车备件损耗预测方法,获得影响变量的方法:列车在行驶的过程中,并不是都在全封闭的环境中运行。针对现实情况,以及专家意见考虑到影响列车备件的因素主要有:1)列车运行时长:列车运行越久,其各项性能都会有一定程度的下降。2)外界的环境:环境越恶劣,对列车本身的运行会带来较大的影响,相应的备件损坏的概率越大。3)备件自身的质量:越好的备件,那么其使用时长越久,相应的采购量也会有所下降。4)列车的维保情况:同样使用时长的列车,维护的越好,其性能下降也会相应降低。我们选取某型号的列车备件,探究影响其损耗的因素。根据现实分析与专家意见我们提出下表1所示的影响因素:
表1影响因素
Figure DEST_PATH_IMAGE008
其中备件的故障率可以通过备件供应企业查到,天气环境可以通过查看气象局网站历年的数据可以计算的来,备件的消耗量与维护人员素质及保障人员数量可以通过企业的出入库数据以及备件维修情况表单得到。
通过浏览相关企业备件仓库的出入库信息、备件的更换以及维修信息、维修人员出班信息表等表格以及从气象局网站获取到的环境信息组成一个初步的表格。我们对于其中的缺失值,如:维护人员素质和维修手册等缺失值,我们采用填充均值的方法来进行数据的补充。用箱型图分析其中的异常值,对其中的异常值将其视为缺失值处理。
步骤1:将影响列车备件损耗的特征向量进行灰度关联分析进行排序,通过计算备件的需求与各影响因素之间的灰色关联度来选出相应的关键因素(预设规则得到关键影响因素作为第一数据集,预设规则是本领域技术人员公认的一般规则),步骤如下:
灰色关联分析:灰色关联分析通过寻找变量之间随着时间或者别的因素演变过程中,彼此的变化趋势是否一致,从而来确定哪些因素是影响最终结果的关键性因素。其计算步骤为:
根据分析目的确定分析指标体系,收集分析数据;
对指标中的数据采用如下公式对原始数据进行无量纲处理;
Figure DEST_PATH_IMAGE009
其中,
Figure DEST_PATH_IMAGE010
是处理后的第
Figure DEST_PATH_IMAGE011
个季度的第
Figure DEST_PATH_IMAGE012
个影响因素
Figure 26013DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE013
为第
Figure 349678DEST_PATH_IMAGE011
个季度的第
Figure 926153DEST_PATH_IMAGE012
个影响因素,
Figure DEST_PATH_IMAGE014
表示数据集中有多少组数据,
Figure DEST_PATH_IMAGE015
表示有多少个影响因素。
确定参考数据列,对于此发明,选取每列中的最优值构造参考序列
Figure DEST_PATH_IMAGE016
,记为
Figure DEST_PATH_IMAGE017
计算每个被评价指标序列与参考序列对应元素的绝对值:
Figure DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE019
是被评价指标序列,
Figure DEST_PATH_IMAGE020
是参考序列;
使用下述公式计算相应的关联系数
Figure DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE022
其中,
Figure DEST_PATH_IMAGE023
是为分辨系数;
使用如下公式对所有比较序列分别计算每个指标与参考序列对应元素的关联系数的均值
Figure DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
7)对步骤6求得的所有值进行一个排序,根据需求删除相应的影响因素,得到的结果如表2所示:
表2 各影响因子计算
Figure DEST_PATH_IMAGE026
从表2中,我们可以看出维修手册数量X7,维修人员数量X9,线路使用时长X10排序靠后,因此我们选取:列车的使用时长X1、备件的故障率X2、载客量X3、当季度异常天气占比X4、当季度温度天数占比X5、当季度湿度天数占比X6、维护人员素质X8。作为模型的输入变量。通过筛选后的部分数据(第一数据集)如表3所示:
表3 筛选后部分数据集
Figure DEST_PATH_IMAGE027
步骤2:将步骤1得到的第一数据集进行归一化处理;使用下述公式对数据集进行归一化处理,
Figure DEST_PATH_IMAGE028
式中,
Figure DEST_PATH_IMAGE029
是归一化后的数据,
Figure DEST_PATH_IMAGE030
是该列中的数据值,
Figure DEST_PATH_IMAGE031
为该列中数值最小的元素值,
Figure DEST_PATH_IMAGE032
为该列中数值最大的元素值。
步骤3:将归一化后的第一数据集分成数据A和数据B;
将数据A作为训练集,数据B作为测试集:利用训练集A分别训练BP神经网络、SVM模型和CART模型,然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’;
将数据B作为训练集,数据A作为测试集:利用训练集B分别训练BP神经网络、SVM模型和CART模型,然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库A’;
将数据集按1:1划分成训练集和测试集,并对模型进行如下参数设置与操作:为了更好的适应性,对模型的选择,应选择不同类型的模型,选择的模型并不都是效果最精准的模型,也选择一个如:决策树模型,其预测的效果并不是最好,但是其可以增加模型的泛化能力,对此最后选择BP神经网络模型、SVM模型和决策树模型来构建第一层模型,对于第二层模型,选择SVM模型来进行数据的拟合。
步骤3.1:第一层中的BP神经网络:设置误差为:0.005,隐藏神经元个数为按
Figure 6848DEST_PATH_IMAGE006
进行计算,其中d是输入特征的个数,进行1000次迭代计算;我们的预测值为每个季度备件的消耗量,因此输出神经元的个数为1。
BP神经网络模型:BP神经网络是模拟仿造突出神经元的信号传播方式来构建。其由多个神经元组件而成。作为一种多层的前馈神经网络,信号是前向传播,误差是反向传播。本发明中使用图2所示的三层神经网络模型,包含输入层,隐藏层和输出层。
正向传播原理:
假定输入训练集
Figure DEST_PATH_IMAGE033
,权重系数
Figure DEST_PATH_IMAGE034
,则输出如下:
Figure DEST_PATH_IMAGE035
其中函数
Figure DEST_PATH_IMAGE036
是激活函数,
Figure 165428DEST_PATH_IMAGE014
是数据集大小,
Figure DEST_PATH_IMAGE037
是第k个样本的预测值,
Figure DEST_PATH_IMAGE038
是偏置值,
Figure DEST_PATH_IMAGE039
是第i个季度的输入数据。
在输出的结果中加入激活函数,是为了给模型加入非线性因素。如此,模型就可以较好的处理非线性问题,同时也可以保证迭代次数的有效性。常用的激活函数由ReLu、tanh、Maxout和Sigmoid。在本文中,我们使用Sigmoid函数作为激活函数
Figure DEST_PATH_IMAGE040
如下:
Figure DEST_PATH_IMAGE041
反向传播原理:
对于预测结果的误差
Figure DEST_PATH_IMAGE042
使用如下公式来计算:
Figure DEST_PATH_IMAGE043
在本文中
Figure DEST_PATH_IMAGE044
表示第几层,则总的误差值
Figure DEST_PATH_IMAGE045
计算如下:
Figure DEST_PATH_IMAGE046
计算模型的误差之后,通过反向传播算法对每个隐藏层依次计算误差。同时使用梯度下降法修正每个隐藏层的权重w和偏执b,直至小于设定的误差值为止,停止迭代。
求解步骤如下:
1)输入:数据集Data
Figure 332098DEST_PATH_IMAGE033
2)输出:预测值
Figure 333552DEST_PATH_IMAGE037
3)对所有的层
Figure DEST_PATH_IMAGE047
,设置其权重系数为
Figure DEST_PATH_IMAGE048
和偏执为
Figure DEST_PATH_IMAGE049
4)按照正向传播原理求解对应的预测值
Figure 735714DEST_PATH_IMAGE037
5)使用反向传播算法,计算各层神经元权重和偏置的梯度矩阵
Figure DEST_PATH_IMAGE050
和向量和
Figure DEST_PATH_IMAGE051
6)使用以下公式更新权重和偏置:
a)
Figure DEST_PATH_IMAGE052
b)
Figure DEST_PATH_IMAGE053
7)重复步骤4-6,直到最终误差小于设定误差。
步骤3.2:第一层中的SVM:采用高斯核函数来进行预测,其中的惩罚参数设置为10,设置为0.1。
SVM模型:支持向量积(SVM)是一种用于分类与回归的算法。对于回归类算法,我们得到的并不是如同传统的回归模型一样的误差,而是可以容忍预测值与真实值的差值在一个范围内。假定训练样本集为
Figure 79627DEST_PATH_IMAGE033
,定义
Figure DEST_PATH_IMAGE054
不敏感的损失函数度量如下:
Figure DEST_PATH_IMAGE055
假定w为权重系数,b是偏置项,
Figure DEST_PATH_IMAGE056
x映射后的特征向量,
Figure 276253DEST_PATH_IMAGE040
是通过样本训练得到的回归估计函数,则
Figure DEST_PATH_IMAGE057
为了更好的评估预测值的偏离程度引入松弛变量
Figure DEST_PATH_IMAGE058
Figure DEST_PATH_IMAGE059
。则相应最优化问题如下:
Figure DEST_PATH_IMAGE060
其中C是一个正则化常数,也称为惩罚参数,通过引入拉格朗日乘子
Figure DEST_PATH_IMAGE061
得到一个二次规划问题。根据最优化的充要条件可知,在最优点位置拉格朗日乘子与约束的乘积为0,最后得到一个对偶最优化问题,即:
Figure DEST_PATH_IMAGE062
其中
Figure DEST_PATH_IMAGE063
为核函数,本发明分别选用的核函数为线性核函数与高斯核函数。如下:
Figure DEST_PATH_IMAGE064
其中
Figure DEST_PATH_IMAGE065
是核函数的带宽。则回归估计函数
Figure DEST_PATH_IMAGE066
表示如下:
Figure DEST_PATH_IMAGE067
其中b的计算用如下公式:
Figure DEST_PATH_IMAGE068
最终b的取值是求所有满足条件
Figure DEST_PATH_IMAGE069
的样本求解均值。
步骤3.3:第一层中的决策树:最大深度max_depth设置成2:
CART回归树模型:分类回归树(classification and regression tree, CART)模型由Breiman等人在1984年提出,是应用广泛的决策树学习方法。假定训练样本集为
Figure 984577DEST_PATH_IMAGE033
。我们将CART模型表示如下:
1)我们将CART回归树的模型用如下公式表示:
Figure DEST_PATH_IMAGE070
其中,
Figure DEST_PATH_IMAGE071
是一个指示函数,
Figure DEST_PATH_IMAGE072
表示每个叶子结点的预测值。使用如下公式来衡量预测区域与真实区域的误差。
Figure DEST_PATH_IMAGE073
其中
Figure 393693DEST_PATH_IMAGE039
是输入变量的第
Figure 651499DEST_PATH_IMAGE011
个数据值,
Figure DEST_PATH_IMAGE074
是真实值。为此我们假设,选择第
Figure 750517DEST_PATH_IMAGE012
个输入变量
Figure DEST_PATH_IMAGE075
为切分变量是输入变量:载客量比、备件的故障率、当季度湿度天数占比、当季度异常天气占比、当季度温度天数占比、列车的使用时长、维护人员素质中的任意一个切分变量;因此以切分变量的取值
Figure DEST_PATH_IMAGE076
为切分点,得到如下两个区域:
Figure DEST_PATH_IMAGE077
选择最好的切分变量
Figure 257722DEST_PATH_IMAGE012
和切分点
Figure 204949DEST_PATH_IMAGE076
,求解如下公式:
Figure DEST_PATH_IMAGE078
其中
Figure DEST_PATH_IMAGE079
Figure DEST_PATH_IMAGE080
表示
Figure 114000DEST_PATH_IMAGE012
Figure 121270DEST_PATH_IMAGE076
固定时对应的两个区域。并且
Figure 584612DEST_PATH_IMAGE079
Figure 460164DEST_PATH_IMAGE080
表示的是区间上的平均值。
Figure DEST_PATH_IMAGE081
对应的算法流程如下步骤所示:
1)输入:训练集Data
Figure DEST_PATH_IMAGE082
2) 输出:CART模型
Figure DEST_PATH_IMAGE083
;
3)训练数据集中,递归的将每个区域划分为两个子区域并求的每个区域上的输出值,构建一个二叉决策树,其步骤如下:
a)选择最优的切分变量
Figure 302350DEST_PATH_IMAGE012
和切分点
Figure DEST_PATH_IMAGE084
,求解:
Figure DEST_PATH_IMAGE085
b)遍历变量
Figure 339576DEST_PATH_IMAGE012
,对固定的切分变量
Figure 696739DEST_PATH_IMAGE012
扫描切分点
Figure DEST_PATH_IMAGE086
,使的上式最小成立;
c)输出固定对
Figure DEST_PATH_IMAGE087
对应的输出值:
Figure DEST_PATH_IMAGE088
Figure DEST_PATH_IMAGE089
其中
Figure DEST_PATH_IMAGE090
是空间中的数据点总量;
d)对两个子区域继续调用步骤a)和b),直到满足停止条件;
e)将输入空间划分成
Figure DEST_PATH_IMAGE091
个区域
Figure DEST_PATH_IMAGE092
,生成决策树:
Figure DEST_PATH_IMAGE093
步骤3.4:将数据A作为训练集,数据B作为测试集:利用训练集A分别训练BP神经网络、SVM模型和CART模型,然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’;
步骤3.5:第二轮,我们将测试集与训练集进行对调,重复上述步骤,将数据B作为训练集,数据A作为测试集:利用训练集B分别训练BP神经网络、SVM模型和CART模型,然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库A’;
步骤4:将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集,将第二数据集输入到SVM模型中进行训练,得到最优的SVM模型。
对于所有模型中未提及的参数,一律设置为默认值。
步骤5:将待预测数据输入到步骤3中训练后的BP神经网络、SVM模型和CART模型中得到三个数据,再将三个数据输入到步骤4最优的SVM模型中得到列车备件损耗预测数据。
模型性能评价方式:
为了验证提出本文提出模型的有效性。采用均方误差
Figure DEST_PATH_IMAGE094
公式和平均绝对误差公式
Figure DEST_PATH_IMAGE095
,作为此次模型性能的评价方式。将得到列车备件损耗预测数据与真实数据进行比对,得到如表4所示的性能评价表。
采用以下公式:
Figure DEST_PATH_IMAGE096
其中
Figure DEST_PATH_IMAGE097
是样本数量,
Figure DEST_PATH_IMAGE098
是真实值,
Figure DEST_PATH_IMAGE099
为模型的预测值。
表4:预测性能比较
Figure DEST_PATH_IMAGE100

Claims (9)

1.一种基于模型融合的列车备件损耗预测方法,其特征在于,包括以下步骤:
步骤1:将影响列车备件损耗的特征向量进行灰度关联分析进行排序,再根据预设规则得到关键影响因素作为第一数据集;
步骤2:将步骤1得到的第一数据集进行归一化处理;
步骤3:将归一化后的第一数据集分成数据A和数据B;
将数据A作为训练集,数据B作为测试集:利用训练集A分别训练BP神经网络、SVM模型和CART模型,然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’;
将数据B作为训练集,数据A作为测试集:利用训练集B分别训练BP神经网络、SVM模型和CART模型,然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库A’;
步骤4:将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集,将第二数据集输入到SVM模型中进行训练,得到最优的SVM模型;
步骤5:将待预测数据输入到步骤3中训练后的BP神经网络、SVM模型和CART模型中得到三个数据,再将三个数据输入到步骤4最优的SVM模型中得到列车备件损耗预测数据;步骤1所述的列车备件损耗的特征向量为:载客量比、备件故障率、当季湿度天数占比、当季度异常天气占比、当季度温度天数占比、列车的使用时长、维修手册数量、维护人员素质、维修人员数量和线路使用时长。
2.根据权利要求1所述的列车备件损耗预测方法,其特征在于,步骤2所述的归一化处理的公式为:
Figure 67150DEST_PATH_IMAGE001
,式中,
Figure 881523DEST_PATH_IMAGE002
是归一化后的值,
Figure 766302DEST_PATH_IMAGE003
是列元素的值,
Figure 33335DEST_PATH_IMAGE004
为该列中数值最小的元素值,
Figure 810666DEST_PATH_IMAGE005
为该列中数值最大的元素值。
3.根据权利要求1所述的列车备件损耗预测方法,其特征在于,步骤3所述第一数据集是按照1:1比例分成数据A和数据B。
4.根据权利要求1所述的列车备件损耗预测方法,其特征在于,步骤3所述的BP神经网络的隐藏神经元个数为
Figure 479544DEST_PATH_IMAGE006
,其中
Figure 535225DEST_PATH_IMAGE007
是输入特征的个数,输出神经元的个数是1。
5.根据权利要求1所述的列车备件损耗预测方法,其特征在于,步骤3所述SVM模型的核函数的带宽为0.1,惩罚参数设置为10。
6.根据权利要求1所述的列车备件损耗预测方法,其特征在于,步骤3所述CART模型的最大深度为2。
7.根据权利要求1所述的列车备件损耗预测方法,其特征在于,步骤4所述SVM模型的惩罚参数设置为2。
8.一种基于模型融合的列车备件损耗预测装置,其特征在于,包括:
排序模块,用于将影响列车备件损耗的特征向量进行灰度关联分析进行排序,再根据预设规则得到关键影响因素作为第一数据集;所述列车备件损耗的特征向量为:载客量比、备件故障率、当季湿度天数占比、当季度异常天气占比、当季度温度天数占比、列车的使用时长、维修手册数量、维护人员素质、维修人员数量和线路使用时长;
数据处理模块,用于将第一数据集进行归一化处理;
训练模块,用于将归一化后的第一数据集分成数据A和数据B,
将数据A作为训练集,数据B作为测试集:利用训练集A分别训练BP神经网络、SVM模型和CART模型,然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’;
将数据B作为训练集,数据A作为测试集:利用训练集B分别训练BP神经网络、SVM模型和CART模型,然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库A’;
预测模块,用于将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集,将第二数据集输入到SVM模型中进行训练,得到最优的SVM模型,并利用该最优的SVM模型进行数据预测。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的基于模型融合的列车备件损耗预测方法。
CN202111393234.3A 2021-11-23 2021-11-23 一种基于模型融合的列车备件损耗预测方法 Active CN113822499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111393234.3A CN113822499B (zh) 2021-11-23 2021-11-23 一种基于模型融合的列车备件损耗预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111393234.3A CN113822499B (zh) 2021-11-23 2021-11-23 一种基于模型融合的列车备件损耗预测方法

Publications (2)

Publication Number Publication Date
CN113822499A CN113822499A (zh) 2021-12-21
CN113822499B true CN113822499B (zh) 2022-04-15

Family

ID=78919721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111393234.3A Active CN113822499B (zh) 2021-11-23 2021-11-23 一种基于模型融合的列车备件损耗预测方法

Country Status (1)

Country Link
CN (1) CN113822499B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114329788B (zh) * 2021-12-31 2024-04-12 武汉理工大学 一种基于田口法和熵权灰色关联分析的车门优化设计方法
CN115511136B (zh) * 2022-11-01 2023-06-30 北京磁浮有限公司 基于层次分析和故障树的设备故障辅助诊断方法及系统
CN116894527B (zh) * 2023-09-11 2023-11-24 中国船舶集团有限公司第七一九研究所 基于船舶行驶状态进行预测的器材储备系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520325A (zh) * 2018-04-16 2018-09-11 北京航空航天大学 一种基于多变环境下加速退化数据的集成寿命预测方法
CN113326960A (zh) * 2020-02-28 2021-08-31 南京理工大学 基于粒子群算法优化lstm的地铁牵引能耗预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10410135B2 (en) * 2015-05-21 2019-09-10 Software Ag Usa, Inc. Systems and/or methods for dynamic anomaly detection in machine sensor data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520325A (zh) * 2018-04-16 2018-09-11 北京航空航天大学 一种基于多变环境下加速退化数据的集成寿命预测方法
CN113326960A (zh) * 2020-02-28 2021-08-31 南京理工大学 基于粒子群算法优化lstm的地铁牵引能耗预测方法

Also Published As

Publication number Publication date
CN113822499A (zh) 2021-12-21

Similar Documents

Publication Publication Date Title
CN113822499B (zh) 一种基于模型融合的列车备件损耗预测方法
Azzeh et al. Fuzzy grey relational analysis for software effort estimation
Verbraken et al. Development and application of consumer credit scoring models using profit-based classification measures
Dejaeger et al. Data mining techniques for software effort estimation: a comparative study
CN109002686B (zh) 一种自动生成样本的多牌号化工过程软测量建模方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN108710905B (zh) 一种基于多模型联合的备件数量预测方法和系统
CN111626821B (zh) 基于集成特征选择实现客户分类的产品推荐方法及系统
CN105894125A (zh) 一种输变电工程造价预测方法
CN112668822B (zh) 科技成果转化平台共享系统、方法、存储介质、手机app
CN113408869A (zh) 一种配电网建设目标风险评估方法
CN111008870A (zh) 一种基于pca-bp神经网络模型的区域物流需求预测方法
CN115587666A (zh) 基于季节趋势分解和混合神经网络的负荷预测方法及系统
Scherger et al. The OWA distance operator and its application in business failure
CN114819777A (zh) 一种基于数字孪生技术的企业销售业务分析管理系统
KR101851367B1 (ko) 신용도를 평가하는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
Chaudhary et al. Comparative Analysis of Entropy Weight Method and C5 Classifier for Predicting Employee Churn
CN114298659A (zh) 评价对象指标的数据处理方法、装置、计算机设备
CN114363004B (zh) 风险评估方法、装置、计算机设备和存储介质
Zhang et al. A grey measurement of product complexity
CN116186507A (zh) 一种特征子集的选取方法、装置及存储介质
CN113393023B (zh) 模具质量评估方法、装置、设备及存储介质
Raza et al. Application of extreme learning machine algorithm for drought forecasting
CN115048290A (zh) 软件质量的评估方法、装置、存储介质及计算机设备
CN114595890A (zh) 基于bp-svr组合模型的船舶备件需求预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Wu Lei

Inventor after: Yuan Zhihong

Inventor after: Kang Junli

Inventor before: Wu Lei

Inventor before: Yuan Zhihong

Inventor before: Kang Junli

Inventor before: Zheng Jianying

CB03 Change of inventor or designer information