CN113822499B

CN113822499B - 一种基于模型融合的列车备件损耗预测方法

Info

Publication number: CN113822499B
Application number: CN202111393234.3A
Authority: CN
Inventors: 吴雷; 袁志宏; 康俊利; 郑剑英
Original assignee: Beijing Maglev Co ltd
Current assignee: Beijing Maglev Co ltd
Priority date: 2021-11-23
Filing date: 2021-11-23
Publication date: 2022-04-15
Anticipated expiration: 2041-11-23
Also published as: CN113822499A

Abstract

本发明公开了一种基于模型融合的列车备件损耗预测方法，属于备件损耗预测技术领域。将影响列车备件损耗的特征向量进行灰度关联分析得到第一数据集并归一化处理，分成数据A和数据B；利用数据A分别训练BP神经网络、SVM模型和CART模型，将数据B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’；交换训练集和测试集，得到组合预测数据库A’；将A’、B、B’和A构成第二数据集，输入到SVM模型中进行训练得到优化后的SVM模型，将待预测数据输入训练后的BP神经网络、SVM模型和CART模型中得到三个数据，再将三个数据输入到最优的SVM模型中得到列车备件损耗预测数据。

Description

一种基于模型融合的列车备件损耗预测方法

技术领域

本发明属于备件损耗预测技术领域，具体涉及一种基于模型融合的列车备件损耗预测方法。

背景技术

在轨道交通日益发达的今天，我们国家的高铁铁路里程已经是世界第一。同时也应该看到如何保证后勤库存的有效供应。备件作为一种保障性物资，是不可或缺的物资，也是保证设备正常运行的关键性因素。企业在设备的运行过程中，如何在满足必要条件下，确定最低库存量，最好实现零库存是一个艰难的问题。库存数量过于充足能满足使用条件，但是也造成了大量的资金的消耗，不利于企业的扩张与前进；极少的库存，在遇到非常情况时，可能会造成重大的损失，不利于国计民生。

通常管理人员确定下一次的采购量一般是依据备件的ABC分类法来确定，也有使用灰色预测来确定，后来机器学习的兴起，逐渐有使用BP神经网络与SVM等常规的小样本数据处理模型。同时应该看到单个模型考虑的影响因素较少，以及模型的单一化造成的预测不准确缺点。备件的存储数量一直以来都是困扰库存管理人员的一大痛点。如何更好的预测下一季度的采购量是一个非常值得研究的问题。

发明内容

本发明的目的是为了准确的预测列车备件的采购量。

本发明提供了一种基于模型融合的列车备件损耗预测方法，包括以下步骤：

步骤1：将影响列车备件损耗的特征向量进行灰度关联分析进行排序，再根据预设规则得到关键影响因素作为第一数据集；

步骤2：将步骤1得到的第一数据集进行归一化处理；

步骤3：将归一化后的第一数据集分成数据A和数据B；

将数据A作为训练集，数据B作为测试集：利用训练集A分别训练BP神经网络、SVM模型和CART模型，然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到得到组合预测数据库B’；

将数据B作为训练集，数据A作为测试集：利用训练集B分别训练BP神经网络、SVM模型和CART模型，然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到得到组合预测数据库A’；

步骤4：将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集，将第二数据集输入到SVM模型中进行训练，得到最优的SVM模型；

步骤5：将待预测数据输入到步骤3中训练后的BP神经网络、SVM模型和CART模型中得到三个数据，再将三个数据输入到步骤4最优的SVM模型中得到列车备件损耗预测数据。

进一步地限定，步骤1所述的列车备件损耗的特征向量为：载客量比、备件故障率、当季湿度天数占比、当季度异常天气占比、当季度温度天数占比、列车的使用时长、维修手册数量、维护人员素质、维修人员数量和线路使用时长。

进一步地限定，步骤2所述的归一化处理的公式为：

，式中，

是归一化后的值，

是该列元素的值，

为该列中数值最小的元素值，

为该列中数值最大的元素值。

进一步地限定，步骤3所述第一数据集是按照1:1比例分成训练集和测试集的。

进一步地限定，步骤3所述的BP神经网络的隐藏神经元个数为

，其中

是输入特征的个数，输出神经元的个数是1。

进一步地限定，步骤3所述SVM模型的核函数的宽带为0.1，惩罚参数设置为10。

进一步地限定，步骤3所述CART模型的最大深度为2。

进一步地限定，步骤4所述SVM模型的惩罚参数设置为2。

本发明提供了一种基于模型融合的列车备件损耗预测装置，包括：

排序模块，用于将影响列车备件损耗的特征向量进行灰度关联分析进行排序，再根据预设规则得到关键影响因素作为第一数据集；

数据处理模块，用于将第一数据集进行归一化处理；

训练模块，用于将归一化后的第一数据集分成数据A和数据B；

将数据A作为训练集，数据B作为测试集：利用训练集A分别训练BP神经网络、SVM模型和CART模型，然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’；

将数据B作为训练集，数据A作为测试集：利用训练集B分别训练BP神经网络、SVM模型和CART模型，然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库A’；

预测模块，用于将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集，将第二数据集输入到SVM模型中得到列车备件损耗预测数据。

本发明提供了一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如上述中任一所述的基于模型融合的列车备件损耗预测方法。

有益效果：1）提出基于BP神经网络、SVM模型、CART回归树模型预测和灰色预测相结合的模型可以很好的解决单个模型下数据预测不准确的缺点。通过引入灰色关联分析，可以很好的把握哪些影响因素是主要，哪些是次要，减少了非关键因素的影响。通过上述两者的结合方法可以很好的解决列车备件在实际需求中的备件消耗情况，更好的制定下一季度的采购量。在很大的程度上节约了资金，提升了企业的能效。

2）归一化的目的：消除量纲的影响。单个模型考虑的影响因素较少，以及模型的单一化造成的预测不准确缺点总体是：提升模型的精度；模型更加稳健。

3）将归一化后的数据集分成数据A和数据B，利用数据A进行三个训练模型进行训练后，进行数据集交叉训练后再混合数据集，弥补数据集少带来的训练欠拟合问题；常见模型结合的策略有平均法、投票法和学习法，而前两者过于简单且会引入主观因素，因此使用学习法。

4）SVM在小样本数据处理上具有良好的性质，因此使用其作为模型结合的策略。

附图说明

图1为本发明的训练流程图。

图2为三层神经网络模型。

图3为本发明的预测流程图。

具体实施方式

实施例1.

训练流程图如图1所示，预测流程图如图3所示，一种基于模型融合的列车备件损耗预测方法，获得影响变量的方法：列车在行驶的过程中，并不是都在全封闭的环境中运行。针对现实情况，以及专家意见考虑到影响列车备件的因素主要有：1）列车运行时长：列车运行越久，其各项性能都会有一定程度的下降。2）外界的环境：环境越恶劣，对列车本身的运行会带来较大的影响，相应的备件损坏的概率越大。3）备件自身的质量：越好的备件，那么其使用时长越久，相应的采购量也会有所下降。4）列车的维保情况：同样使用时长的列车，维护的越好，其性能下降也会相应降低。我们选取某型号的列车备件，探究影响其损耗的因素。根据现实分析与专家意见我们提出下表1所示的影响因素：

表1影响因素

其中备件的故障率可以通过备件供应企业查到，天气环境可以通过查看气象局网站历年的数据可以计算的来，备件的消耗量与维护人员素质及保障人员数量可以通过企业的出入库数据以及备件维修情况表单得到。

通过浏览相关企业备件仓库的出入库信息、备件的更换以及维修信息、维修人员出班信息表等表格以及从气象局网站获取到的环境信息组成一个初步的表格。我们对于其中的缺失值，如：维护人员素质和维修手册等缺失值，我们采用填充均值的方法来进行数据的补充。用箱型图分析其中的异常值，对其中的异常值将其视为缺失值处理。

步骤1：将影响列车备件损耗的特征向量进行灰度关联分析进行排序，通过计算备件的需求与各影响因素之间的灰色关联度来选出相应的关键因素（预设规则得到关键影响因素作为第一数据集，预设规则是本领域技术人员公认的一般规则），步骤如下：

灰色关联分析：灰色关联分析通过寻找变量之间随着时间或者别的因素演变过程中，彼此的变化趋势是否一致，从而来确定哪些因素是影响最终结果的关键性因素。其计算步骤为：

根据分析目的确定分析指标体系，收集分析数据；

对指标中的数据采用如下公式对原始数据进行无量纲处理；

其中，

是处理后的第

个季度的第

个影响因素

，

为第

个季度的第

个影响因素，

表示数据集中有多少组数据,

表示有多少个影响因素。

确定参考数据列，对于此发明，选取每列中的最优值构造参考序列

，记为

计算每个被评价指标序列与参考序列对应元素的绝对值：

其中，

是被评价指标序列，

是参考序列；

使用下述公式计算相应的关联系数

：

其中，

是为分辨系数；

使用如下公式对所有比较序列分别计算每个指标与参考序列对应元素的关联系数的均值

。

7）对步骤6求得的所有值进行一个排序，根据需求删除相应的影响因素，得到的结果如表2所示：

表2 各影响因子计算

从表2中，我们可以看出维修手册数量X7，维修人员数量X9,线路使用时长X10排序靠后，因此我们选取:列车的使用时长X1、备件的故障率X2、载客量X3、当季度异常天气占比X4、当季度温度天数占比X5、当季度湿度天数占比X6、维护人员素质X8。作为模型的输入变量。通过筛选后的部分数据（第一数据集）如表3所示：

表3 筛选后部分数据集

步骤2：将步骤1得到的第一数据集进行归一化处理；使用下述公式对数据集进行归一化处理，

式中，

是归一化后的数据，

是该列中的数据值，

为该列中数值最小的元素值，

为该列中数值最大的元素值。

步骤3：将归一化后的第一数据集分成数据A和数据B；

将数据集按1：1划分成训练集和测试集，并对模型进行如下参数设置与操作：为了更好的适应性，对模型的选择，应选择不同类型的模型，选择的模型并不都是效果最精准的模型，也选择一个如：决策树模型，其预测的效果并不是最好，但是其可以增加模型的泛化能力，对此最后选择BP神经网络模型、SVM模型和决策树模型来构建第一层模型，对于第二层模型，选择SVM模型来进行数据的拟合。

步骤3.1：第一层中的BP神经网络：设置误差为：0.005，隐藏神经元个数为按

进行计算，其中d是输入特征的个数，进行1000次迭代计算；我们的预测值为每个季度备件的消耗量，因此输出神经元的个数为1。

BP神经网络模型：BP神经网络是模拟仿造突出神经元的信号传播方式来构建。其由多个神经元组件而成。作为一种多层的前馈神经网络，信号是前向传播，误差是反向传播。本发明中使用图2所示的三层神经网络模型，包含输入层，隐藏层和输出层。

正向传播原理：

假定输入训练集

，权重系数

，则输出如下：

其中函数

是激活函数，

是数据集大小，

是第k个样本的预测值，

是偏置值，

是第i个季度的输入数据。

在输出的结果中加入激活函数，是为了给模型加入非线性因素。如此，模型就可以较好的处理非线性问题，同时也可以保证迭代次数的有效性。常用的激活函数由ReLu、tanh、Maxout和Sigmoid。在本文中，我们使用Sigmoid函数作为激活函数

如下：

反向传播原理：

对于预测结果的误差

使用如下公式来计算：

在本文中

表示第几层，则总的误差值

计算如下：

计算模型的误差之后，通过反向传播算法对每个隐藏层依次计算误差。同时使用梯度下降法修正每个隐藏层的权重w和偏执b，直至小于设定的误差值为止，停止迭代。

求解步骤如下：

1）输入：数据集Data

；

2）输出：预测值

；

3）对所有的层

，设置其权重系数为

和偏执为

；

4）按照正向传播原理求解对应的预测值

；

5）使用反向传播算法，计算各层神经元权重和偏置的梯度矩阵

和向量和

。

6）使用以下公式更新权重和偏置：

a)

b)

7）重复步骤4-6，直到最终误差小于设定误差。

步骤3.2：第一层中的SVM：采用高斯核函数来进行预测，其中的惩罚参数设置为10，设置为0.1。

SVM模型：支持向量积（SVM）是一种用于分类与回归的算法。对于回归类算法，我们得到的并不是如同传统的回归模型一样的误差，而是可以容忍预测值与真实值的差值在一个范围内。假定训练样本集为

，定义

不敏感的损失函数度量如下：

假定w为权重系数，b是偏置项,

是x映射后的特征向量，

是通过样本训练得到的回归估计函数，则

为了更好的评估预测值的偏离程度引入松弛变量

和

。则相应最优化问题如下：

其中C是一个正则化常数，也称为惩罚参数，通过引入拉格朗日乘子

得到一个二次规划问题。根据最优化的充要条件可知，在最优点位置拉格朗日乘子与约束的乘积为0，最后得到一个对偶最优化问题，即：

其中

为核函数，本发明分别选用的核函数为线性核函数与高斯核函数。如下:

其中

是核函数的带宽。则回归估计函数

表示如下：

其中b的计算用如下公式：

最终b的取值是求所有满足条件

的样本求解均值。

步骤3.3：第一层中的决策树：最大深度max_depth设置成2：

CART回归树模型:分类回归树（classification and regression tree, CART）模型由Breiman等人在1984年提出，是应用广泛的决策树学习方法。假定训练样本集为

。我们将CART模型表示如下：

1)我们将CART回归树的模型用如下公式表示：

其中，

是一个指示函数，

表示每个叶子结点的预测值。使用如下公式来衡量预测区域与真实区域的误差。

其中

是输入变量的第

个数据值，

是真实值。为此我们假设，选择第

个输入变量

为切分变量是输入变量：载客量比、备件的故障率、当季度湿度天数占比、当季度异常天气占比、当季度温度天数占比、列车的使用时长、维护人员素质中的任意一个切分变量；因此以切分变量的取值

为切分点，得到如下两个区域：

选择最好的切分变量

和切分点

，求解如下公式:

其中

，

表示

，

固定时对应的两个区域。并且

，

表示的是区间上的平均值。

对应的算法流程如下步骤所示：

1）输入：训练集Data

；

2）输出：CART模型

;

3）训练数据集中，递归的将每个区域划分为两个子区域并求的每个区域上的输出值，构建一个二叉决策树，其步骤如下：

a)选择最优的切分变量

和切分点

，求解：

b)遍历变量

，对固定的切分变量

扫描切分点

，使的上式最小成立；

c)输出固定对

对应的输出值：

其中

是空间中的数据点总量；

d)对两个子区域继续调用步骤a)和b)，直到满足停止条件；

e)将输入空间划分成

个区域

，生成决策树：

步骤3.4：将数据A作为训练集，数据B作为测试集：利用训练集A分别训练BP神经网络、SVM模型和CART模型，然后将测试集B分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库B’；

步骤3.5：第二轮，我们将测试集与训练集进行对调，重复上述步骤，将数据B作为训练集，数据A作为测试集：利用训练集B分别训练BP神经网络、SVM模型和CART模型，然后将测试集A分别输入到训练后的BP神经网络、SVM模型和CART模型中得到组合预测数据库A’；

步骤4：将组合预测数据库A’、数据B、组合预测数据库B’和数据A构成第二数据集，将第二数据集输入到SVM模型中进行训练，得到最优的SVM模型。

对于所有模型中未提及的参数，一律设置为默认值。

模型性能评价方式：

为了验证提出本文提出模型的有效性。采用均方误差

公式和平均绝对误差公式

，作为此次模型性能的评价方式。将得到列车备件损耗预测数据与真实数据进行比对，得到如表4所示的性能评价表。

采用以下公式：

其中

是样本数量，

是真实值，

为模型的预测值。

表4：预测性能比较

Claims

1.一种基于模型融合的列车备件损耗预测方法，其特征在于，包括以下步骤：

步骤2：将步骤1得到的第一数据集进行归一化处理；

步骤3：将归一化后的第一数据集分成数据A和数据B；

步骤5：将待预测数据输入到步骤3中训练后的BP神经网络、SVM模型和CART模型中得到三个数据，再将三个数据输入到步骤4最优的SVM模型中得到列车备件损耗预测数据；步骤1所述的列车备件损耗的特征向量为：载客量比、备件故障率、当季湿度天数占比、当季度异常天气占比、当季度温度天数占比、列车的使用时长、维修手册数量、维护人员素质、维修人员数量和线路使用时长。

2.根据权利要求1所述的列车备件损耗预测方法，其特征在于，步骤2所述的归一化处理的公式为：