CN108710905B - 一种基于多模型联合的备件数量预测方法和系统 - Google Patents
一种基于多模型联合的备件数量预测方法和系统 Download PDFInfo
- Publication number
- CN108710905B CN108710905B CN201810441771.2A CN201810441771A CN108710905B CN 108710905 B CN108710905 B CN 108710905B CN 201810441771 A CN201810441771 A CN 201810441771A CN 108710905 B CN108710905 B CN 108710905B
- Authority
- CN
- China
- Prior art keywords
- model
- training
- prediction
- sample
- time sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 118
- 230000000694 effects Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 101100134058 Caenorhabditis elegans nth-1 gene Proteins 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 17
- 238000009826 distribution Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000004378 air conditioning Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000009123 feedback regulation Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多模型联合的备件数量预测方法和系统,该方法包括:构建备件历史使用数量数据库,选择训练集,对每个训练样本构建时序特征,对训练集分别训练GPR模型、GMR模型、RBFN模型,根据样本预测偏差对训练样本进行最优模型标签标定,对标定后的数据集分别进行GMM模型训练,将待测样本的时序特征输入到不同GMM模型中,得到三个概率值,比较概率值选择最优模型标签,将待测样本的时序特征输入到对应的最优模型进行再训练,使用再训练的最优模型预测待测样本下个月的使用数量。本发明通过时序特征提高数据鲁棒性,并提出基于GMR模型、RBFN模型的备件预测方法,其实现简单,通过从多个模型中选出最优预测模型,能够有效的提高预测精度。
Description
技术领域
本发明属于人工智能领域,更具体地,涉及一种基于多模型联合的备件数量预测方法和系统。
背景技术
备件是设备备用的零件,缺少对备件的采购和储备数量进行合理的规划,可能会对企业业务及发展造成很大的困扰乃至损失。备件储备数量过多,将会占用企业的大量周转资金与储存仓库空间,不利于企业的长期发展;备件储备数量过少,将会造成维修或生产业务无法及时完成,造成企业经济损失。
现有的备件数量预测方法中主要包括两类,一类是基于ARMA等统计学模型,一类是基于SVM、GPR等机器学习模型。但这些预测方法存在一些缺陷:(1)不同备件之间使用规律不具有相似性,比如某种零件容易发生周期性故障而有些零件基本上不发生故障,因此选定的模型不适用于所有零件;(2)在预测模型选择上依赖于人工经验,而非备件样本本身反映出的规律;(3)备件生产过程中可能会对工艺进行调整,备件采购过程中可能会对来源进行调整,上述调整将导致备件前后不一样,旧的模型无法适用于新的备件。
发明内容
针对现有技术的上述缺陷,本发明提供了一种基于多模型联合的备件数量预测方法和系统,其目的在于,提供一种高鲁棒性、适应备件数量变换规律的预测方法。
为实现上述目的,一方面,本发明提供一种基于多模型联合的备件数量预测方法,该方法包括以下步骤:
(1)构建备件历史使用数量数据库,该数据库包括多种备件的历史使用数量,每种备件对应一个样本;
(2)按照备件种类从所述数据库中选择训练样本,构成训练集;
(3)对所述训练集中的每个训练样本,基于所述训练样本除最后一个月的所有历史使用数量构建时序特征,构成训练集的时序特征数据集;
(4)对训练集的时序特征数据集,分别训练预测模型高斯过程回归GPR 模型、混合高斯回归GMR模型、径向基神经网络回归RBFN模型;
(5)对所述训练集中的每个训练样本,用训练好的三个预测模型分别预测所述训练样本最后一个月的使用数量,并根据样本预测偏差对所述训练样本进行最优模型标签标定,得到三个标定后的数据集,其中,每个标定后的数据集中的样本的最优模标签相同;
(6)对标定后的三个数据集分别进行GMM模型训练,得到三个不同的 GMM模型;
(7)对待测样本,基于所述待测样本的所有历史使用数量构建时序特征,将该时序特征输入到三个不同的GMM模型中,得到三个概率值,其反映了所述待测样本使用该GMM对应的预测模型预测效果最佳的概率;
(8)比较三个概率值选择最优模型标签,将所述待测样本的时序特征输入到对应的最优模型进行再训练拟合,得到再训练的最优模型;
(9)使用再训练的最优模型预测所述待测样本下个月的使用数量。
优选地,步骤(2)还包括:选择完训练样本后,数据库中剩余的样本均为测试样本,构成测试集,测试样本用于优化预测模型,可使用希尔系数或均根方差进行预测效果的度量。
优选地,构建时序特征的过程如下:若待预测的是某备件第N年第M 月的备件数量,则24维时序特征的后12维依次取该备件第N-1年第M月到第N年第M月的前一个月的使用数量;根据该备件第N-1年第M月之前的历史使用数量计算每个月的月均值avr′1,avr′2,...,avr′12,24维时序特征的前12 维从avr′M开始依次循环取值avr′1,avr′2,...,avr′12,M=1,2,…,12。
优选地,月均值计算公式为
优选地,进行最优模型标签标定时,标定0标识针对当前样本高斯过程回归模型预测效果最佳,标定1标识混合高斯回归模型预测效果最佳,标定2标识径向基神经网络回归模型预测效果最佳;若存在多种模型样本预测偏差是最小,按照GPR>GMR>RBFN的优先级顺序进行标签标定。
另一方面,本发明提供一种基于多模型联合的备件数量预测系统,该系统包括:
备件历史使用数量数据库,该数据库包括多种备件的历史使用数量,每种备件对应一个样本;
预测模型训练模块,该模块按照备件种类从所述数据库中选择训练样本,构成训练集;对所述训练集中的每个训练样本,基于所述训练样本除最后一个月的所有历史使用数量构建时序特征,构成训练集的时序特征数据集;对训练集的时序特征数据集,分别训练预测模型高斯过程回归GPR 模型、混合高斯回归GMR模型、径向基神经网络回归RBFN模型;
标定模块,该模块对所述训练集中的每个训练样本,用训练好的三个预测模型分别预测所述训练样本最后一个月的使用数量,并根据样本预测偏差对所述训练样本进行最优模型标签标定,得到三个标定后的数据集,其中,每个标定后的数据集中的样本的最优模标签相同;
GMM模型训练模块,该模块对标定后的三个数据集分别进行GMM模型训练,得到三个不同的GMM模型;
预测模块,该模块对待测样本,基于所述待测样本的所有历史使用数量构建时序特征,将该时序特征输入到三个不同的GMM模型中,得到三个概率值,其反映了所述待测样本使用该GMM对应的预测模型预测效果最佳的概率;比较三个概率值选择最优模型标签,将所述待测样本的时序特征输入到对应的最优模型进行再训练拟合,得到再训练的最优模型;使用再训练的最优模型预测所述待测样本下个月的使用数量。
优选地,所述系统还包括预测模型的优化模块,该模块在预测模型训练模块选择完训练样本后,数据库中剩余的样本均为测试样本,构成测试集,测试样本用于优化预测模型,可使用希尔系数或均根方差进行预测效果的度量。
优选地,构建时序特征的过程如下:若待预测的是某备件第N年第M 月的备件数量,则24维时序特征的后12维依次取该备件第N-1年第M月到第N年第M月的前一个月的使用数量;根据该备件第N-1年第M月之前的历史使用数量计算每个月的月均值avr′1,avr′2,...,avr′12,24维时序特征的前12 维从avr′M开始依次循环取值avr′1,avr′2,...,avr′12,M=1,2,…,12。
优选地,月均值计算公式为
优选地,进行最优模型标签标定时,标定0标识针对当前样本高斯过程回归模型预测效果最佳,标定1标识混合高斯回归模型预测效果最佳,标定2标识径向基神经网络回归模型预测效果最佳;若存在多种模型样本预测偏差是最小,按照GPR>GMR>RBFN的优先级顺序进行标签标定。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
(1)本发明通过构建时序特征的数据集,提取反映备件数量变化的平均规律与近一年使用规律作为特征,有效解决了备件前后不一致造成的预测不准确的问题,提取的特征更加具有鲁棒性;
(2)本发明提出一种基于GMR模型的备件数量预测方法和一种RBFN 模型的备件数量预测方法,其具有能够处理小样本、非线性、参数自适应获取、实现过程简单的优势;
(3)本发明通过对待测样本进行多模型预测,从多个模型中选出最优预测模型,使用最优预测模型来预测未来使用量,能够有效的提高预测精度。
附图说明
图1为本发明实施例提供的一种基于多模型联合的备件数量预测方法流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的基本思路在于,提出一种基于多模型联合的备件数量预测方法。通过平均年+最近一年的预处理有效的提取历史数据中的表现特征,既保留了历史数据变化情况,又抓住最近一年的数据变化,使得特征更具有鲁棒性以及预测的稳定性。通过多个混合高斯(GMM)模型进行特征分类,选择更加适合的预测方法。对于测试样本使用最优预测方法进行预测,能够显著提高预测的精度与准确率。
图1为本发明实施例提供的一种基于多模型联合的备件数量预测方法流程示意图,如图1所示,该方法包括以下步骤:
(1)构建备件历史使用数量数据库,该数据库包括多种备件的历史使用数量,每种备件对应一个样本;
(2)按照备件种类从所述数据库中选择训练样本,构成训练集;
(3)对所述训练集中的每个训练样本,基于所述训练样本除最后一个月的所有历史使用数量构建时序特征,构成训练集的时序特征数据集;
(4)对训练集的时序特征数据集,分别训练预测模型高斯过程回归GPR 模型、混合高斯回归GMR模型、径向基神经网络回归RBFN模型;
(5)对所述训练集中的每个训练样本,用训练好的三个预测模型分别预测所述训练样本最后一个月的使用数量,并根据样本预测偏差对所述训练样本进行最优模型标签标定,得到三个标定后的数据集,其中,每个标定后的数据集中的样本的最优模标签相同;
(6)对标定后的三个数据集分别进行GMM模型训练,得到三个不同的 GMM模型;
(7)对待测样本,基于所述待测样本的所有历史使用数量构建时序特征,将该时序特征输入到三个不同的GMM模型中,得到三个概率值,其反映了所述待测样本使用该GMM对应的预测模型预测效果最佳的概率;
(8)比较三个概率值选择最优模型标签,将所述待测样本的时序特征输入到对应的最优模型进行再训练拟合,得到再训练的最优模型;
(9)使用再训练的最优模型预测所述待测样本下个月的使用数量。
以下以空调备件为例,阐述时序特征的构建过程。
按配件编码和销售公司对空调备件的历史使用量进行分类和合并,形成不同种类空调备件使用数量的样本记录。计算备件样本记录中不同年份、相同月份的备件使用数量的平均值,作为该备件使用数量各月平均值。如表1所示的某销售公司某备件的历史数据,统计历史月份平均值如表2所示;
表1历史数据
表2统计历史数据中各月平均值
对于备件样本记录中没有记录的月份,采用月均值填充。如表1所示,备件样本记录中缺少2012年10月的记录。如表2所示,10月均值为11.33,因此,备件样本记录应填充[2012,10,11.33]数据,表示2012年10月用了 11.33个该备件。
若待预测的是某备件第N年第M月的备件数量,则24维时序特征的后 12维依次取该备件第N-1年第M月到第N年第M月的前一个月的使用数量;根据该备件第N-1年第M月之前的历史使用数量计算每个月的月均值 avr′1,avr′2,...,avr′12,24维时序特征的前12维从avr′M开始依次循环取值 avr′1,avr′2,...,avr′12,M=1,2,…,12。
月均值计算公式为
待预测的是某备件2016年3月的使用量。如表3所示,对应的时序特征——时序特征后12维是2015.3的使用总量、2015.4的使用总量,……,2016.2的使用总量;时序特征前12维是2015.3前年月的3月数据平均值,2015.3前年月4月数据平均值,……,2015.3前年月的1月数据平均值;表4为2016年3月的实际使用数量。
表3预测2016年3月使用数量时时序特征
表4实际使用数量
例如,2015.03前年月的3月数据平均值计算的是2013.03、2014.03 的平均值,2015.03前年月的1月数据平均值计算的是2013.01、2014.01、 2015.01的平均值。
测试样本用于优化预测模型时,可使用希尔系数或均根方差等评价标准进行预测效果的度量。
步骤(4)具体地包括以下步骤:
(4.1)对步骤(3)得到的训练集的时序特征数据集,训练高斯过程回归模型(Gaussian Process Regression Model,简称GPR),并进行样本偏差计算,训练过程包括以下子步骤:
(4.1.1)处理输入格式为:X=[x1,x2,……,x24],输出结果为形式 Y=[y1,y2,……,y24];
(4.1.2)定义高斯过程模型核函数使用高斯核函数核,核函数形式为其中||x-x′||2=xTx+(x′)Tx′-2xTx′,δ代表步长;并假定样本中存在满足高斯分布N(0,σ2)的噪声,回归模型在训练时需要训练超参数即为δ(步长),σ2(噪声方差);
(4.1.3)计算协方差矩阵,使用最大似然估计法求解超参数;
对于表3中训练数据进行训练,可得参数训练结果如下所示:δ=2.4439,σ=-2.278。
将步骤4.1.3训练得到的参数带入模型后,对于表3预测数据进行预测,预测结果为18.72,按照四舍五入取整的方式,可得2016年3月的预测使用量为19,样本预测偏差为5。
(4.2)对步骤(3)得到的训练集的时序特征数据集,训练混合高斯回归模型(Gaussian Mixture Regression Model,简称GMR),并进行样本偏差计算,训练过程包括以下子步骤:
(4.2.1)定义X=[x1,x2,……,x24],Y=[y1,y2,……,y24],处理模型的输入为 [XT,YT];
(4.2.2)假定数据的输入和输出的联合概率密度函数满足GMM模型,
因此模型在训练阶段需要指定高斯分量的个数K,需要训练第i分量的权重系数ωi,均值矩阵μi,方差矩阵∑i;
(4.2.3)计算GMM模型的似然函数,使用EM算法对参数进行训练。
对于表3训练数据进行试训练,选定高斯分量个数为6,实际模型训练时根据样本特性可选择多个不同的个数进行评估,训练结果如下所示:
(4.2.4)预测时,在xN+1处的后验概率分布推导结果为:
将步骤4.2.3训练得到的参数带入模型后,对于表3预测数据进行预测,预测结果为12.75,按照四舍五入取整的方式,可得2016年3月的预测使用量为13,样本预测偏差为1。
(4.3)对步骤(3)得到的训练集的时序特征数据集,训练径向基神经网络回归模型(Radial Basis Function Network Regression Model,简称RBFN)并进行偏差计算,训练过程包括以下子步骤:
(4.3.1)处理输入格式为:X=[x1,x2,……,x24],输出结果为形式 Y=[y1,y2,……,y24];
(4.3.2)设定输出层神经元的输出为G(x|μi,βi)是高斯核函数,具体表达式为:G(x|μi,βi)=exp(βi||x-μi||2),其中ωi,μi分别代表到输出层权重、每个隐含层神经元的径向基核函数的中心,而βi等价于σi 2是高斯核函数的标准差,K表示隐含层神经元的个数;
(4.3.3)训练时,首先使用聚类方法确定中心μi,然后使用BP反馈调节方式训练ωi,βi。
对于表3训练数据进行试训练,选定隐含层个数为5,输入层输出层神经元个数均为1,实际模型训练时根据样本特性可选择多个不同的隐含层个数进行评估,训练结果如下所示:
(4.3.4)预测时,由步骤(4.3.2)模型带入即可,将步骤4.3.3训练得到的参数带入模型后,对于表3预测数据进行预测,预测结果为15.88,按照四舍五入取整的方式,可得2016年3月的预测使用量为16,样本预测偏差为2。
步骤(4)结束后,对所述训练集中的每个训练样本,用训练好的三个预测模型分别预测所述训练样本最后一个月的使用数量,并根据样本预测偏差对所述训练样本进行最优模型标签标定,得到三个标定后的数据集,其中,每个标定后的数据集中的样本的最优模标签相同。
进行最优模型标签标定时,标定0标识针对当前样本高斯过程回归模型预测效果最佳,标定1标识混合高斯回归模型预测效果最佳,标定2标识径向基神经网络回归模型预测效果最佳;若存在多种模型样本预测偏差是最小,那么考虑训练所需时间按照GPR>GMR>RBFN的优先级顺序进行标签标定。对于表3的预测情况,因GMR偏差为1,RBFN偏差为2,GPR偏差为 5,因此该样本的最优模型标签标定为1。
对标定后的三个数据集分别进行GMM模型训练,得到三个不同的GMM 模型;每个GMM的训练过程包括以下步骤:
(6.1)处理输入格式为时序特征X=[x1,x2,……,x24];
其中μi,∑i分别为其分布均值向量与协方差矩阵,n是输入向量维度,本实施例中n为24。
定义λi={ωi,μi,∑i},表明对于单个GMM模型,需要学习的参数是λi;
(6.3)计算GMM模型的似然函数;
(6.4)使用EM算法对参数进行训练,得到λi。
(6.5)按照此策略,分别对每一类样本训练其概率密度函数对应的GMM 模型,对于每类的GMM模型,设置高斯分量个数为16。
对待测样本,基于所述待测样本的所有历史使用数量构建时序特征,将该时序特征输入到三个不同的GMM模型中,得到三个概率值,其反映了所述待测样本使用该GMM对应的预测模型预测效果最佳的概率;
比较三个概率值选择最优模型标签,将所述待测样本的时序特征输入到对应的最优模型进行再训练拟合,得到再训练的最优模型;
使用再训练的最优模型预测所述待测样本下个月的使用数量。
以上,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种基于多模型联合的备件数量预测方法,其特征在于,该方法包括以下步骤:
(1)构建备件历史使用数量数据库,该数据库包括多种备件的历史使用数量,每种备件对应一个样本;
(2)按照备件种类从所述数据库中选择训练样本,构成训练集;
(3)对所述训练集中的每个训练样本,基于所述训练样本除最后一个月的所有历史使用数量构建时序特征,构成训练集的时序特征数据集;
(4)对训练集的时序特征数据集,分别训练预测模型高斯过程回归GPR模型、混合高斯回归GMR模型、径向基神经网络回归RBFN模型;
(5)对所述训练集中的每个训练样本,用训练好的三个预测模型分别预测所述训练样本最后一个月的使用数量,并根据样本预测偏差对所述训练样本进行最优模型标签标定,得到三个标定后的数据集,其中,每个标定后的数据集中的样本的最优模型标签相同;
(6)对标定后的三个数据集分别进行GMM模型训练,得到三个不同的GMM模型;
(7)对待测样本,基于所述待测样本的所有历史使用数量构建时序特征,将该时序特征输入到三个不同的GMM模型中,得到三个概率值,其反映了所述待测样本使用该GMM对应的预测模型预测效果最佳的概率;
(8)比较三个概率值选择最优模型标签,将所述待测样本的时序特征输入到对应的最优模型进行再训练拟合,得到再训练的最优模型;
(9)使用再训练的最优模型预测所述待测样本下个月的使用数量。
2.如权利要求1所述的备件数量预测方法,其特征在于,步骤(2)还包括:选择完训练样本后,数据库中剩余的样本均为测试样本,构成测试集,测试样本用于优化预测模型,使用希尔系数或均方差进行预测效果的度量。
3.如权利要求1所述的备件数量预测方法,其特征在于,构建时序特征的过程如下:若待预测的是某备件第N年第M月的备件数量,则24维时序特征的后12维依次取该备件第N-1年第M月到第N年第M月的前一个月的使用数量;根据该备件第N-1年第M月之前的历史使用数量计算每个月的月均值avr1′,avr′2,...,avr′12,24维时序特征的前12维从avr′M开始依次循环取值avr1′,avr′2,...,avr′12,M=1,2,…,12。
5.如权利要求1所述的备件数量预测方法,其特征在于,进行最优模型标签标定时,标定0标识针对当前样本高斯过程回归模型预测效果最佳,标定1标识混合高斯回归模型预测效果最佳,标定2标识径向基神经网络回归模型预测效果最佳;若存在多种模型样本预测偏差是最小,按照GPR>GMR>RBFN的优先级顺序进行标签标定。
6.一种基于多模型联合的备件数量预测系统,其特征在于,该系统包括:
备件历史使用数量数据库,该数据库包括多种备件的历史使用数量,每种备件对应一个样本;
预测模型训练模块,该模块按照备件种类从所述数据库中选择训练样本,构成训练集;对所述训练集中的每个训练样本,基于所述训练样本除最后一个月的所有历史使用数量构建时序特征,构成训练集的时序特征数据集;对训练集的时序特征数据集,分别训练预测模型高斯过程回归GPR模型、混合高斯回归GMR模型、径向基神经网络回归RBFN模型;
标定模块,该模块对所述训练集中的每个训练样本,用训练好的三个预测模型分别预测所述训练样本最后一个月的使用数量,并根据样本预测偏差对所述训练样本进行最优模型标签标定,得到三个标定后的数据集,其中,每个标定后的数据集中的样本的最优模型标签相同;
GMM模型训练模块,该模块对标定后的三个数据集分别进行GMM模型训练,得到三个不同的GMM模型;
预测模块,该模块对待测样本,基于所述待测样本的所有历史使用数量构建时序特征,将该时序特征输入到三个不同的GMM模型中,得到三个概率值,其反映了所述待测样本使用该GMM对应的预测模型预测效果最佳的概率;比较三个概率值选择最优模型标签,将所述待测样本的时序特征输入到对应的最优模型进行再训练拟合,得到再训练的最优模型;使用再训练的最优模型预测所述待测样本下个月的使用数量。
7.如权利要求6所述的备件数量预测系统,其特征在于,所述系统还包括预测模型的优化模块,该模块在预测模型训练模块选择完训练样本后,数据库中剩余的样本均为测试样本,构成测试集,测试样本用于优化预测模型,使用希尔系数或均方差进行预测效果的度量。
8.如权利要求6所述的备件数量预测系统,其特征在于,构建时序特征的过程如下:若待预测的是某备件第N年第M月的备件数量,则24维时序特征的后12维依次取该备件第N-1年第M月到第N年第M月的前一个月的使用数量;根据该备件第N-1年第M月之前的历史使用数量计算每个月的月均值avr1′,avr′2,...,avr′12,24维时序特征的前12维从avr′M开始依次循环取值avr1′,avr′2,...,avr′12,M=1,2,…,12。
10.如权利要求6所述的备件数量预测系统,其特征在于,进行最优模型标签标定时,标定0标识针对当前样本高斯过程回归模型预测效果最佳,标定1标识混合高斯回归模型预测效果最佳,标定2标识径向基神经网络回归模型预测效果最佳;若存在多种模型样本预测偏差是最小,按照GPR>GMR>RBFN的优先级顺序进行标签标定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810441771.2A CN108710905B (zh) | 2018-05-10 | 2018-05-10 | 一种基于多模型联合的备件数量预测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810441771.2A CN108710905B (zh) | 2018-05-10 | 2018-05-10 | 一种基于多模型联合的备件数量预测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108710905A CN108710905A (zh) | 2018-10-26 |
CN108710905B true CN108710905B (zh) | 2020-07-10 |
Family
ID=63868867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810441771.2A Expired - Fee Related CN108710905B (zh) | 2018-05-10 | 2018-05-10 | 一种基于多模型联合的备件数量预测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108710905B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569996B (zh) * | 2019-09-03 | 2023-10-10 | 国能铁路装备有限责任公司沧州机车车辆维修分公司 | 一种车辆检修数据处理方法及系统 |
CN111507507B (zh) * | 2020-03-24 | 2023-04-18 | 重庆森鑫炬科技有限公司 | 基于大数据的月用水量预测方法 |
CN111639798A (zh) * | 2020-05-26 | 2020-09-08 | 华青融天(北京)软件股份有限公司 | 智能的预测模型选择方法及装置 |
CN113822611A (zh) * | 2020-07-16 | 2021-12-21 | 北京京东乾石科技有限公司 | 备件管理方法及装置、计算机存储介质、电子设备 |
CN114493732B (zh) * | 2020-10-27 | 2024-05-28 | 华中科技大学 | 生鲜电商可复用容器租赁数量预测模型建立方法及其应用 |
CN112906992A (zh) * | 2021-04-12 | 2021-06-04 | 福州大学 | 基于集成学习的电子产品停产后的备件预测方法 |
CN114202123A (zh) * | 2021-12-14 | 2022-03-18 | 深圳壹账通智能科技有限公司 | 业务数据预测方法、装置、电子设备及存储介质 |
CN114118636B (zh) * | 2022-01-28 | 2022-06-17 | 中汽数据(天津)有限公司 | 一种基于多模型选优的汽车备件需求预测系统 |
CN115577834A (zh) * | 2022-09-26 | 2023-01-06 | 燕山大学 | 用于预测全品类备件需求的方法 |
CN117557071B (zh) * | 2024-01-11 | 2024-07-30 | 迈创企业管理服务股份有限公司 | 稀疏时间序列的预测方法、设备、存储介质及应用 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101086770A (zh) * | 2006-06-08 | 2007-12-12 | 上海凌鼎管理软件有限公司 | 零备件需求累积预测方法 |
CN101894185A (zh) * | 2010-06-29 | 2010-11-24 | 北京航空航天大学 | 一种基于动态双极mpnn的小样本数据对象的寿命预测方法 |
CN102385724A (zh) * | 2010-08-27 | 2012-03-21 | 上海财经大学 | 一种应用于库存管理的零配件组合需求预测信息处理方法 |
CN103440368A (zh) * | 2013-08-12 | 2013-12-11 | 上海交通大学 | 一种多模型动态软测量建模方法 |
CN105825045A (zh) * | 2016-03-11 | 2016-08-03 | 西北工业大学 | 多阶段任务系统可修备件需求预测方法 |
CN105976049A (zh) * | 2016-04-28 | 2016-09-28 | 武汉宝钢华中贸易有限公司 | 基于混沌神经网络的库存预测模型及其构造方法 |
CN106548257A (zh) * | 2016-12-09 | 2017-03-29 | 中国南方电网有限责任公司超高压输电公司昆明局 | 一种基于决策树模型的备品备件定额制定方法 |
CN107832908A (zh) * | 2017-09-29 | 2018-03-23 | 深圳供电局有限公司 | 一种基于缺陷数据的备品备件需求预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070244589A1 (en) * | 2006-04-18 | 2007-10-18 | Takenori Oku | Demand prediction method, demand prediction apparatus, and computer-readable recording medium |
-
2018
- 2018-05-10 CN CN201810441771.2A patent/CN108710905B/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101086770A (zh) * | 2006-06-08 | 2007-12-12 | 上海凌鼎管理软件有限公司 | 零备件需求累积预测方法 |
CN101894185A (zh) * | 2010-06-29 | 2010-11-24 | 北京航空航天大学 | 一种基于动态双极mpnn的小样本数据对象的寿命预测方法 |
CN102385724A (zh) * | 2010-08-27 | 2012-03-21 | 上海财经大学 | 一种应用于库存管理的零配件组合需求预测信息处理方法 |
CN103440368A (zh) * | 2013-08-12 | 2013-12-11 | 上海交通大学 | 一种多模型动态软测量建模方法 |
CN105825045A (zh) * | 2016-03-11 | 2016-08-03 | 西北工业大学 | 多阶段任务系统可修备件需求预测方法 |
CN105976049A (zh) * | 2016-04-28 | 2016-09-28 | 武汉宝钢华中贸易有限公司 | 基于混沌神经网络的库存预测模型及其构造方法 |
CN106548257A (zh) * | 2016-12-09 | 2017-03-29 | 中国南方电网有限责任公司超高压输电公司昆明局 | 一种基于决策树模型的备品备件定额制定方法 |
CN107832908A (zh) * | 2017-09-29 | 2018-03-23 | 深圳供电局有限公司 | 一种基于缺陷数据的备品备件需求预测方法 |
Non-Patent Citations (5)
Title |
---|
"A novel prediction model for aircraft spare part intermittent demand in aviation transportation logistics using multi-components accumulation and high resolution analysis";Zhixiong Li et al.;《Journal of AEROSPACE ENGINEERING》;20150417;第384-395页 * |
"基于BP神经网络的备件ABC分类模型";熊君星 等;《机械设计与制造》;20080229(第2期);第215-217页 * |
"基于实时学习的高斯过程回归多模型融合建模";张伟 等;《信息与控制》;20150430;第44卷(第4期);第487-492页 * |
"基于高斯混合模型与主元分析的多模型切换方法";庞强 等;《化工学报》;20130831;第64卷(第8期);第2938-2946页 * |
基于LSSVM和信息熵的航材备件组合预测方法;杨仕美 等;《火力与指挥控制》;20120930;第37卷(第9期);第154-157页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108710905A (zh) | 2018-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710905B (zh) | 一种基于多模型联合的备件数量预测方法和系统 | |
CN109784806B (zh) | 供应链控制方法、系统以及存储介质 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN113537600B (zh) | 一种全过程耦合机器学习的中长期降水预报建模方法 | |
CN114549046A (zh) | 基于融合模型的销售预测方法、系统、设备及存储介质 | |
CN107958297B (zh) | 一种产品需求预测方法及产品需求预测装置 | |
Chehade et al. | Conditional Gaussian mixture model for warranty claims forecasting | |
CN113822499B (zh) | 一种基于模型融合的列车备件损耗预测方法 | |
CN115907611A (zh) | 一种基于配件市场价值的配件库存管控方法 | |
Kumar et al. | Stock Price Prediction Using Machine Learning | |
Chen et al. | House price prediction based on machine learning and deep learning methods | |
CN115115416A (zh) | 一种商品销量预测方法 | |
CN112149884A (zh) | 一种面向大规模学员的学业预警监测方法 | |
CN113095484A (zh) | 基于lstm神经网络的股票价格预测方法 | |
WO2023134072A1 (zh) | 违约预测模型的生成方法、装置、设备及存储介质 | |
CN117196695B (zh) | 一种目标产品的销量数据的预测方法及装置 | |
CN108520380A (zh) | 一种基于改进的bp神经网络的库存预测方法 | |
CN115641153A (zh) | 一种基于深度神经网络的车辆价格评估方法 | |
Pfeifer et al. | A comparison of statistical and machine learning approaches for time series forecasting in a demand management scenario | |
Vaitkus et al. | Electrical spare parts demand forecasting | |
CN114784795A (zh) | 风电功率预测方法、装置、电子设备及存储介质 | |
Chen | Mobile Phone Price Prediction with Feature Reduction | |
CN114282657A (zh) | 一种市场数据长期预测模型训练方法、装置、设备及存储介质 | |
Jackson et al. | Machine learning for classification of economic recessions | |
Hoeronis | Netflix Stock Price Trend Prediction Using Recurrent Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200710 |