CN111340312A - 一种基于rnn网络预测物资采购需求量的方法 - Google Patents
一种基于rnn网络预测物资采购需求量的方法 Download PDFInfo
- Publication number
- CN111340312A CN111340312A CN202010213647.8A CN202010213647A CN111340312A CN 111340312 A CN111340312 A CN 111340312A CN 202010213647 A CN202010213647 A CN 202010213647A CN 111340312 A CN111340312 A CN 111340312A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- rnn
- training
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 239000000463 material Substances 0.000 title claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000003062 neural network model Methods 0.000 claims abstract description 14
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 4
- 230000000694 effects Effects 0.000 claims description 17
- 238000004140 cleaning Methods 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000000306 recurrent effect Effects 0.000 claims description 11
- 230000007547 defect Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000003491 array Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000012958 reprocessing Methods 0.000 claims description 2
- 238000005406 washing Methods 0.000 claims description 2
- 230000001502 supplementing effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000009826 distribution Methods 0.000 description 10
- 238000005457 optimization Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 239000004020 conductor Substances 0.000 description 5
- 238000013079 data visualisation Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000007711 solidification Methods 0.000 description 2
- 230000008023 solidification Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000000396 iron Nutrition 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于RNN网络预测物资采购需求量的方法,包括以下步骤:S1:采用预设方法对预先采集的数据进行数据处理;S2:通过预设方法对原预测模型和循环神经网络模型进行对比;S3:采用预设方法构建RNN模型,并将所述处理后的数据作为所述RNN模型的输入,获取预测值。有益效果:通过构建基于RNN网络的物资采购预测模型并进行训练,考虑历史采购量之间的时序关系,根据时间序列增加或减少水平,能够随着时间的推移不断重复模式,相比于传统的原预测模型,有效地提升了模型的预测精确度。
Description
技术领域
本发明涉及预测物资采购需求方法技术领域,具体来说,涉及一种基于RNN网络预测物资采购需求量的方法。
背景技术
当前,我国社会经济快速发展,各个职能部门,如电力部门,对于物资的需求越来越高,这促进了电网工程市场的繁荣,也对相关企业提出了更大的挑战,只有进一步优化企业管理和各种资源配置,提高资源利用率和工程设计开发效率,才能适应市场新情况,迎接各种挑战。
以电力部门、企业为例,如何准确预测变电站及配网工程的物资需求、在保障工程进度的前提下提高资金利用率,节约成本,具有重要意义,有助于提升这些部门、企业的竞争力。
在物资需求预测方面,现有技术中一般使用采购物资需求预测模型进行预测,该模型首先通过对近三年可研批复数据和综合计划数据以及项目物资历史采购订单的整理,得到项目实际计划采购金额、实际采购金额、电压等级以及相关小类采购情况等属性信息,然后通过项目的属性信息对项目进行聚类,并确认聚类结果所属的项目类型,接着以总投资金额和项目类型为出发点,同时考虑到年度增长率、项目批复影响因素、物资单价浮动、设备使用状态等要素,对小类采购量进行回归分析,剔除不显著的影响因素,得到多因素的回归系数,最后通过得到的多元回归模型以及未来一段时间内相关因素的取值预测各类物资采购需求量。
但是,现有的采购物资需求预测模型存在以下缺陷:1、数据冗余、离散,物品购买量波动大,没有对采购数据进行数据清洗,忽略了异常值对预测带来的影响;2、采购需求的影响因子太多,普通的线性回归模型并不能很好的拟合出预测函数;3、没有考虑历史采购量之间的时序关系,预测精确度较低。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了基于RNN网络预测物资采购需求量的方法,具备预测精度高,可实现采购优化及成本优化的目的,进而解决背景技术中的问题。
(二)技术方案
为实现上述具备预测精度高,可实现采购优化及成本优化的目的,本发明采用的具体技术方案如下:
一种基于RNN网络预测物资采购需求量的方法,包括以下步骤:
S1:采用预设方法对预先采集的数据进行数据处理;
S2:通过预设方法对原预测模型和循环神经网络模型进行对比;
S3:采用预设方法构建RNN模型,并将所述处理后的数据作为所述RNN模型的输入,获取预测值。
作为优选,所述步骤S1采用预设方法对预先采集的数据进行数据处理具体包括以下步骤:
S11:通过预备的数据库进行所需数据的采集,得到采集数据;
S12:通过预设方法对所述采集数据进行数据清洗,得到处理后的数据。通过上述处理,可以得到更加客观真实的购买量。
作为优选,所述步骤S12通过预设方法对所述采集数据进行数据清洗,得到处理后的数据具体包括以下步骤:
S121:对所述采集数据中的原始时序数据进行随机采样和估计得到多条估计数据,并对随机采样产生的空缺点补齐,获得多条补齐估计数据;
S122:按采样时间点对所有的所述补齐估计数据进行分类,获得多组时间分类数据,并对每组所述时间分类数据按照大小进行排序得到多组排序数组;
S123:对多组所述排序数组进行处理获得多个对应的平均值数据,并通过多个所述平均值数据构成均值序列;
S124:输出所述均值序列,即完成对购买量异常数据的清除,得到处理后的数据。通过上述处理,有效地去掉了异常过高过低购买量,使得数据离散性低,具有一定规律性。
作为优选,所述步骤S2通过预设方法对原预测模型和循环神经网络模型进行对比具体包括以下步骤:将原预测模型和循环神经网络模型从数据处理、函数关系、时间依赖性、趋势4个方面进行对比分析,针对原预测模型的缺陷找出更合适的预测模型。通过上述处理,可以针对原预测模型的缺陷找出更合适的预测模型。
作为优选,所述步骤S3采用预设方法构建RNN模型,并将所述处理后的数据作为所述RNN模型的输入,获取预测值具体包括以下步骤:
S31:假设当前的状态只与前面的几个状态相关,构建RNN模型,得到所述RNN模型的数学表达式:
St=f(U*xt+W*St-1+b),Ot=f(V*St+c);
其中,U,W,V,b,c为模型需要学习更新的参数,x为一个序列的输入,即为数据清洗后的数据,标记为{x1,x2,……xt……},xt代表时刻为t时刻的输入,s为隐含单元,标记为{S1,S2,……St……},St为t时刻的隐含层状态,作为下一层的输入,也就是模型每一层的输入有两个,一个是xt,一个是上一层的状态St-1,Ot代表时刻t的输出,f为非线性的激活函数tanh,其表达式为:其中ez表示指数函数,z为函数的输入;
S32:对所述RNN模型进行网络训练,并采用最小化损失函数来更新模型参数,损失函数的公式为:
其中N表示数据数目,xt代表时刻为t时刻的输入,Ot代表时刻t的输出;
S33:当所述RNN模型训练好以后,即损失函数足够小时,将处理后的t时刻数据输入训练好的所述RNN模型中,得到t+1时刻的数据,即为预测值。通过上述处理,可以得到RNN模型,并可以通过RNN模型获取预测值。
作为优选,所述步骤S32中对所述RNN模型进行网络训练还包括以下步骤:在训练所述RNN模型时,分别以1天、7天、8天、10天、12天为周期进行训练,然后选取效果最好的模型进行预测。通过上述处理,可以得到更好地训练结果。
作为优选,所述步骤S32中对所述RNN模型进行网络训练还包括以下步骤:
对于训练不足的情况,通过增加网络中的节点,或者增加网络的训练周期来达到训练效果;
对于过度拟合的情况,通多减少或控制训练周期,在数据出现拐点前,停止对网络的训练来达到训练效果。通过上述处理,保证了RNN模型的训练效果。
作为优选,所述步骤S33中将处理后的t时刻数据输入训练好的所述RNN模型中还包括以下步骤:采用归一化来对处理后t时刻的数据进行再处理,归一化公式为:x=(x-μ)/σ,其中,x表示原值,μ表示均值,σ表示方差。通过上述处理,可以得到更加合理的输入数据。
(三)有益效果
与现有技术相比,本发明提供了基于RNN网络预测物资采购需求量的方法,具备以下有益效果:
(1)、本发明通过数据清洗对数据进行处理,去掉了异常过高过低购买量,使得数据离散性低,具有一定规律性,从而有效地避免了异常值对预测带来的影响,提高了其预测精度。
(2)、本发明通过对比原预测模型和循环神经网络模型,构建RNN模型,通过非线性关系可以更好的拟合复杂的关节分布,良好的映射输入输出之间的关系,使预测模型能够灵活应用于负责的关节分布,保证其预测效果。
(3)、本发明通过构建基于RNN网络的物资采购预测模型并进行训练,考虑历史采购量之间的时序关系,根据时间序列增加或减少水平,能够随着时间的推移不断重复模式,提升了模型的预测精确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的基于RNN网络预测物资采购需求量的方法的流程图;
图2是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中10kv变压器清洗前后的数据可视化图;
图3是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中10kv电缆终端采购数据清洗前后的数据可视化图;
图4是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中RNN神经元结构示意图;
图5是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中10kv变压器的训练结果的示意图;
图6是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中10kv电缆终端的预测结果的示意图;
图7是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中低压开关柜的预测结果示意图;
图8是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中电力电缆的预测结果示意图;
图9是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中架空绝缘导线的预测结果示意图;
图10是根据本发明实施例的基于RNN网络预测物资采购需求量的方法中接地铁的预测结果示意图。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
根据本发明的实施例,提供了一种基于RNN网络预测物资采购需求量的方法。
现结合附图和具体实施方式对本发明进一步说明,如图1-10所示,根据本发明实施例的基于RNN网络预测物资采购需求量的方法,包括以下步骤:
S1:采用预设方法对预先采集的数据进行数据处理;
其中,所述S1具体包括以下步骤:
S11:通过预备的数据库进行所需数据的采集,得到采集数据;
具体的,本实施例中选用的都是采购量大,采购周期频繁的物品,包括6个种类,分别是10kv变压器、10kv电缆终端、低压开关柜、电力电缆、架空绝缘导线、接地铁。选择其中的10kv变压器、10kv电缆终端进行数据可视化展示,由于数据波动较大,离散性太高,对于采购预测模型的建立不够友好,所以需要进行数据清洗,将购买量异常过高和过低的数据删除,如图2所示为10kv变压器清洗前后的数据可视化图,如图3为10kv电缆终端采购数据清洗前后的数据可视化图。
本实施例中的数据来源于国网物资部2014-2019收获数据,根据国网上海市电力公司的一篇文章基于大数据分析的协议库存需求预测研究的项目聚类整体分布表选出占比前6的种类,并从2014-2019收获数据表中整理出6种种类的日期及其相应的购买量。
S12:通过预设方法对所述采集数据进行数据清洗,得到处理后的数据。
具体的,所述S12具体包括以下步骤:
S121:对所述采集数据中的原始时序数据进行随机采样和估计得到多条估计数据,并对随机采样产生的空缺点补齐,获得多条补齐估计数据;
S122:按采样时间点对所有的所述补齐估计数据进行分类,获得多组时间分类数据,并对每组所述时间分类数据按照大小进行排序得到多组排序数组;
S123:对多组所述排序数组进行处理获得多个对应的平均值数据,并通过多个所述平均值数据构成均值序列;
S124:输出所述均值序列,即完成对购买量异常数据的清除,得到处理后的数据。
S2:通过预设方法对原预测模型和循环神经网络模型进行对比;
其中,所述S2具体包括以下步骤:由于原预测模型不能友好的专注长时间的预测,因此,本实施例中通过将原预测模型和循环神经网络模型从数据处理、函数关系、时间依赖性、趋势4个方面进行对比分析,针对原预测模型的缺陷找出更合适的预测模型,如表1所示为原模型和循环神经网络模型对比。
表1原模型和循环神经网络模型对比
循环神经网络(Recurrent Neural Networks,RNN),也称递归神经网络,是近年来深度学习领域热点技术之一。在机器翻译、语音识别及图像识别领域都取得了巨大成功,在传统神经网络中,通常假设所有的输入层和输出层间是相互独立的,但对于许多任务来说,并不是一个好办法,以物资需求采购预测为例,未来物品采购态势是依赖于历史时刻的态势值。
RNN出现的目的是来处理序列数据的。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,也就是说隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。理论上,RNN能够对任何长度的序列数据进行处理。但是在实践中,为了降低复杂性往往假设当前的状态只与前面的几个状态相关,如图4便是一个典型的RNN神经元结构示意图,图中,x为一个序列的输入,即为数据清洗后的数据,标记为{x1,x2,……xt……},xt代表时刻为t时刻的输入,s为隐含单元,标记为{S1,S2,……St……},St通过上一时刻隐含层状态和当前时刻输入计算得到:St=f(U*xt+W*St-1+b),Ot=f(V*St+c),f一般使用非线性函数如tanh或者ReLU,第一个隐含层状态初始化为0,o为输入单元,标记为{o1,o2,……ot……},ot代表时刻t的输出。在RNN中,每输入一步,每一层各自都共享参数U,V,W。其反映着RNN中的每一步都在做相同的事,只是输入不同,因此大大地降低了网络中需要学习的参数,而且RNN的关键之处在于隐藏层,隐藏层能够捕捉序列的信息。
具体的,如S3所示为RNN模型的构建和模型的表达式。
S3:采用预设方法构建RNN模型,并将所述处理后的数据作为所述RNN模型的输入,获取预测值;
其中,所述S3具体包括以下步骤:
S31:假设当前的状态只与前面的几个状态相关,构建RNN模型,得到所述RNN模型的数学表达式:
St=f(U*xt+W*St-1+b),Ot=f(V*St+c);
其中,U,W,V,b,c为模型需要学习更新的参数,x为一个序列的输入,即为数据清洗后的数据,标记为{x1,x2,……xt……},xt代表时刻为t时刻的输入,s为隐含单元,标记为{S1,S2,……St……},St为t时刻的隐含层状态,作为下一层的输入,也就是模型每一层的输入有两个,一个是xt,一个是上一层的状态St-1,第一个隐含层状态初始化为0,Ot代表时刻t的输出,f为非线性的激活函数tanh,其表达式为:其中ez表示指数函数,z为函数的输入;
S32:对所述RNN模型进行网络训练,并采用最小化损失函数来更新模型参数,损失函数的公式为:
其中N表示数据数目,xt代表时刻为t时刻的输入,Ot代表时刻t的输出;
具体的,传统模型预测需要大量的数据作为支撑,但是对国网物资采购的预测由于数据量不够大,并不能很好的拟合出采购量的线性方程,为了使现有的数据量的利用率达到最大化,本实施例在训练模型时,分别以1天、7天、8天、10天、12为周期(比如以7天为周期,则将1号到7号数据相加作为一个数据,8号到14号数据相加作为一个数据,后面数据以此类推)进行训练,然后选取效果最好的模型进行预测;
由于各物品的数据分布参差不齐,而且在训练过程中常常因为训练数据较少或者是离散性太高而导致训练不足和过度拟合。过度拟合指的是由于训练数据过少,或者对训练集训练的次数过多,导致模型的结果不是找到所有数据的一般共有特性,而是仅对训练数据进行了特征提取。换句话说,这个模型已经记住了所有的训练数据,对训练数据的预测效果非常好,但对其他数据的预测效果非常差。
对于训练不足的情况来说,可以通过增加网络中的节点,或者增加网络的训练周期来达到训练效果;
对于过度拟合的情况来说,可以通多减少或控制训练周期,在数据出现拐点前,停止对网络的训练来达到训练效果。
S33:当所述RNN模型训练好以后,即损失函数足够小时,将处理后的t时刻数据输入训练好的所述RNN模型中,得到t+1时刻的数据,即为预测值。
具体的,在训练RNN模型时,可能需要缩放序列预测问题的数据。当输入数据序列分布并不标准,或者变化幅度(标准差)过大时,这会减慢网络的学习和收敛速度,也会阻碍网络的学习效率。由于物品采购数据集中存在异常值和较多噪音,故本实施例中采用归一化来对处理后t时刻的数据进行再处理,可以间接通过中心化避免异常值和极端值的影响,归一化公式为:x=(x-μ)/σ,其中,x表示原值,μ表示均值,σ表示方差。
为了更好地理解本技术方案,本实施中还包括误差评估和预测结果展示两个部分。
1)误差评估
为了评价对比在原有顺序时间序列之上,引入新特征组后的RNN神经网络模型的预测性能,选择平均绝对误差(MAE)、均方根误差(RMSE)和相对准确率来进行误差评估。因为在采购数量过少的时刻点,评估相对准确率时,误差会比采购数量相对较大的时刻点大得多,而且采购量太少也没有预测的必要,所以在算相对准确率时删除了与真实采购量均值相差过大的数据。
①平均绝对误差(MAE),是指所有预测值与真实值之间偏差绝对值的平均值,其表达式为:MAE能更好的反映预测值与真实值误差的实际情况,MAE值越大,表明预测值与真实值之间的差别越大,预测效果越差,反之越好。
②均方根误差(RMSE),是指所有预测值与真实值之差的平方的平均值,再开平方得到的值,其表达式为;RMSE对于一组预测的特小或特大误差非常敏感,可以很好反映预测的精密度,因此同MAE一样,RMSE越大,预测效果则越差。
以上表达式中fi表示i点的预测值,yi表示i点的真实值,N表示数据数目。
2)预测结果展示
依据物品采购需求建立采购预测体系,开展采购链全流程建模,推动电力物资全供应链的统一数据体系的构建,开发一套适用于电力物资未来采购需求预处理算法,并通过采购需求预测模型对传统采购需求收集进行验证、指导到最终的逐步替代及IT固化,使电信运营商采购需求管理工作科学、细化、高效,采购流程上释放人力、提高效率,采购需求上准确预测、精益管理,有计划地进行采购,有效降低突发采购成本、仓储成本和工程时间成本,实现采购优化及成本优化。
为了验证引入后模型对准确度的提升,本实施中选用采购频率较高的6种类别进行预测,他们分别是10kv变压器、10kv电缆终端、低压开关柜、电力电缆、架空绝缘导体、接地铁。本实施中对上面6个种类的数据输入到先前写好的预测模型中进行训练,表2各类别训练后的绝对平均误差、均方根误差和准确率的数据展示(以不同周期的数据作为输入,选取出训练结果做好的模型)。
表2各类别通过RNN模型训练后的数据
在进行物品采购预测训练的时候发现以1天、7天、8天、10天、12为周期进行训练出来的结果截然不同,是由于各个物品对于不通周期的数据分布不一样,离散性也不一致,所以本实施例针对不同物品采用不同的预测周期,以10kv变压器为例,展示采用不同时间周期进行训练的结果,看出针对不同时间周期的绝对平方差、均方根误差和准确率都有所不同,如表3为10kv变压器的数据输入到预测模型训练之后的结果。
表3 10kv变压器的训练结果
时间周期 | 1天 | 7天 | 8天 | 10天 | 12天 |
MAE | 13.12 | 11.94 | 12.86 | 18.53 | 12.59 |
RMSE | 14.03 | 21.06 | 22.43 | 27.74 | 28.83 |
准确率 | 0.55 | 0.61 | 0.69 | 0.79 | 0.66 |
耗时(s) | 1084.13871 | 984.77689 | 895.78874 | 890.77445 | 771.72706 |
其中,图5-10分别为RNN模型6个类别预测结果,在进行各类别训练过程中,分别尝试了以1天、7天、8天、10天、12天为周期进行训练,由于各物品的数据分布不同,而且离散程度也各不相同,训练过程中发现10kv变压器、接地铁2种类别的物品以10天为周期进行训练的结果比较好,能到达比较好的预测精度,10kv电缆终端、架空绝缘导线是以一周为周期进行训练,能到达很好的预测精度,低压开关柜是以8天为周期进行训练,电力电缆是以12天为周期进行训练,能够达到各自最优的预测精度。
具体的,如图5所示为10kv变压器的训练结果,实线为真实值,虚线为预测值,由于10kv变压器的数据量大,原始数据过于离散,经过数据处理之后还是存在过高过低的数据,导致最后的预测精度并不是很高,达到了0.79。
如图6所示为10kv电缆终端的预测结果,实线为真实值,虚线为预测值,10kv电缆终端预测周期为7天,电缆终端的预测精度不高,只有0.69。
如图7所示为低压开关柜的预测结果图,实线为真实值,虚线为预测值,低压开光柜的预测周期为8天,低压开关柜的预测精度较低,只有0.59。
如图8所示为电力电缆的预测结果,实线为真实值,虚线为预测值,电力电缆预测周期为12天,电力电缆的预测精度为0.61。
如图9为架空绝缘导线的预测结果,实线为真实值,虚线为预测值,架空绝缘导线的预测周期为7天,预测精度为0.68。
如图10为接地铁的预测结果,实线为真实值,虚线为预测值,接地铁的预测周期为10天,预测精度为0.74。
本方案的预测原理为:由于对物资采购量的影响因子很多,要找到这些影响因子就需要建立一个影响因子与采购量的模型,拟合出影响因子与采购量的函数关系。但是物资采购量的影响因子太多,普通的线性方程并不能完整的拟合出采购量和影响因子之间的关系,而且国网物资的采购与时间序列具有很大的关联性,而RNN网络模型提出的方法刚好可以拟合出一种非线性的函数关系,而且可以很好的利用(如何利用在模型中数据输入中有所体现)具有时间序列的数据,表现出时间序列数据的一些关系。
综上所述,借助于本发明的上述技术方案,通过数据清洗对数据进行处理,去掉了异常过高过低购买量,使得数据离散性低,具有一定规律性,从而有效地避免了异常值对预测带来的影响,提高了其预测精度。
此外,本发明通过对比原预测模型和循环神经网络模型,构建RNN模型,通过非线性关系可以更好的拟合复杂的关节分布,良好的映射输入输出之间的关系,使预测模型能够灵活应用于负责的关节分布,保证其预测效果。
此外,本发明通过构建基于RNN网络的物资采购预测模型并进行训练,考虑历史采购量之间的时序关系,根据时间序列增加或减少水平,能够随着时间的推移不断重复模式,提升了模型的预测精确度。
此外,本发明通过采购需求预测模型对传统采购需求收集进行验证、指导到最终的逐步替代及IT固化,使电信运营商采购需求管理工作科学、细化、高效,采购流程上释放人力、提高效率,采购需求上准确预测、精益管理,有计划地进行采购,有效降低突发采购成本、仓储成本和工程时间成本,实现采购优化及成本优化。
在本发明中,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于RNN网络预测物资采购需求量的方法,其特征在于,包括以下步骤:
S1:采用预设方法对预先采集的数据进行数据处理;
S2:通过预设方法对原预测模型和循环神经网络模型进行对比;
S3:采用预设方法构建RNN模型,并将所述处理后的数据作为所述RNN模型的输入,获取预测值。
2.根据权利要求1所述的一种基于RNN网络预测物资采购需求量的方法,其特征在于,所述步骤S1采用预设方法对预先采集的数据进行数据处理具体包括以下步骤:
S11:通过预备的数据库进行所需数据的采集,得到采集的数据;
S12:通过预设方法对所述采集数据进行数据清洗,得到处理后的数据。
3.根据权利要求2所述的一种基于RNN网络预测物资采购需求量的方法,其特征在于,所述步骤S12通过预设方法对所述采集数据进行数据清洗,得到处理后的数据具体包括以下步骤:
S121:对所述采集数据中的原始时序数据进行随机采样和得到多条估计数据,并对随机采样产生的空缺点补齐,获得多条补齐估计数据;
S122:按采样时间点对所有的所述补齐估计数据进行分类,获得多组时间分类数据,并对每组所述时间分类数据按照大小进行排序得到多组排序数组;
S123:对多组所述排序数组进行处理获得多个对应的平均值数据,并通过多个所述平均值数据构成均值序列;
S124:输出所述均值序列,即完成对购买量异常数据的清除,得到处理后的数据。
4.根据权利要求1所述的一种基于RNN网络预测物资采购需求量的方法,其特征在于,所述步骤S2通过预设方法对原预测模型和循环神经网络模型进行对比具体包括以下步骤:将原预测模型和循环神经网络模型从数据处理、函数关系、时间依赖性、趋势4个方面进行对比分析,针对原预测模型的缺陷找出更合适的预测模型。
5.根据权利要求1所述的一种基于RNN网络预测物资采购需求量的方法,其特征在于,所述步骤S3采用预设方法构建RNN模型,并将所述处理后的数据作为所述RNN模型的输入,获取预测值具体包括以下步骤:
S31:假设当前的状态只与前面的几个状态相关,构建RNN模型,得到所述RNN模型的数学表达式:
St=f(U*xt+W*St-1+b),Ot=f(V*St+c);
其中,U,W,V,b,c为模型需要学习更新的参数,x为一个序列的输入,即为数据清洗后的数据,标记为{x1,x2,……xt……},xt代表时刻为t时刻的输入,s为隐含单元,标记为{S1,S2,……St……},St为t时刻的隐含层状态,作为下一层的输入,也就是模型每一层的输入有两个,一个是xt,一个是上一层的状态St-1,Ot代表时刻t的输出,f为非线性的激活函数tanh,其表达式为:其中ez表示指数函数,z为函数的输入;
S32:对所述RNN模型进行网络训练,并采用最小化损失函数来更新模型参数,损失函数的公式为:
其中,N表示数据数目,xt代表时刻为t时刻的输入,Ot代表时刻t的输出;
S33:当所述RNN模型训练好以后,即损失函数足够小时,将处理后的t时刻数据输入训练好的所述RNN模型中,得到t+1时刻的数据,即为预测值。
6.根据权利要求5所述的一种基于RNN网络预测物资采购需求量的方法,其特征在于,所述步骤S32中对所述RNN模型进行网络训练还包括以下步骤:在训练所述RNN模型时,分别以1天、7天、8天、10天、12天为周期进行训练,然后选取训练效果最好的模型进行预测。
7.根据权利要求5所述的一种基于RNN网络预测物资采购需求量的方法,其特征在于,所述步骤S32中对所述RNN模型进行网络训练还包括以下步骤:
对于训练不足的情况,通过增加网络中的节点,或者增加网络的训练周期来达到训练效果;
对于过度拟合的情况,通多减少或控制训练周期,在数据出现拐点前,停止对网络的训练来达到训练效果。
8.根据权利要求5所述的一种基于RNN网络预测物资采购需求量的方法,其特征在于,所述步骤S33中将处理后的t时刻数据输入训练好的所述RNN模型中还包括以下步骤:采用归一化来对处理后t时刻的数据进行再处理,归一化公式为:x=(x-μ)/σ,其中,x表示原值,μ表示均值,σ表示方差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213647.8A CN111340312A (zh) | 2020-03-24 | 2020-03-24 | 一种基于rnn网络预测物资采购需求量的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213647.8A CN111340312A (zh) | 2020-03-24 | 2020-03-24 | 一种基于rnn网络预测物资采购需求量的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111340312A true CN111340312A (zh) | 2020-06-26 |
Family
ID=71186141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010213647.8A Pending CN111340312A (zh) | 2020-03-24 | 2020-03-24 | 一种基于rnn网络预测物资采购需求量的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111340312A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541720A (zh) * | 2020-12-09 | 2021-03-23 | 国网安徽省电力有限公司 | 一种电力物资仓储管理系统和方法 |
CN114581159A (zh) * | 2022-05-04 | 2022-06-03 | 爱迪森(北京)生物科技有限公司 | 基于大数据分析的仓储预测方法、系统和可读存储介质 |
CN118428862A (zh) * | 2024-07-05 | 2024-08-02 | 江西博微新技术有限公司 | 一种库存物资采购预测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104679834A (zh) * | 2015-02-06 | 2015-06-03 | 北京工商大学 | 一种时序数据清洗方法及系统 |
CN107784397A (zh) * | 2017-11-09 | 2018-03-09 | 贵州电网有限责任公司 | 一种电网物资需求预测系统及其预测方法 |
CN110647980A (zh) * | 2019-09-18 | 2020-01-03 | 成都理工大学 | 一种基于gru神经网络的时间序列预测方法 |
-
2020
- 2020-03-24 CN CN202010213647.8A patent/CN111340312A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104679834A (zh) * | 2015-02-06 | 2015-06-03 | 北京工商大学 | 一种时序数据清洗方法及系统 |
CN107784397A (zh) * | 2017-11-09 | 2018-03-09 | 贵州电网有限责任公司 | 一种电网物资需求预测系统及其预测方法 |
CN110647980A (zh) * | 2019-09-18 | 2020-01-03 | 成都理工大学 | 一种基于gru神经网络的时间序列预测方法 |
Non-Patent Citations (2)
Title |
---|
李宗熹: "基于深度循环神经网络的风电场功率短期预测研究" * |
柴龙凯: "基于数据(序列模式)挖掘的医院物资使用量预测模型研究" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541720A (zh) * | 2020-12-09 | 2021-03-23 | 国网安徽省电力有限公司 | 一种电力物资仓储管理系统和方法 |
CN114581159A (zh) * | 2022-05-04 | 2022-06-03 | 爱迪森(北京)生物科技有限公司 | 基于大数据分析的仓储预测方法、系统和可读存储介质 |
CN114581159B (zh) * | 2022-05-04 | 2022-08-12 | 爱迪森(北京)生物科技有限公司 | 基于大数据分析的仓储预测方法、系统和可读存储介质 |
CN118428862A (zh) * | 2024-07-05 | 2024-08-02 | 江西博微新技术有限公司 | 一种库存物资采购预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340312A (zh) | 一种基于rnn网络预测物资采购需求量的方法 | |
Saber et al. | Short term load forecasting using multiple linear regression for big data | |
CN106909933B (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
Das et al. | An optimal allocation and sizing strategy of distributed energy storage systems to improve performance of distribution networks | |
CN108197773A (zh) | 电力负荷预测方法、电力负荷预测装置及终端设备 | |
CN111401651A (zh) | 一种基于lstm网络预测物资采购需求量的方法 | |
CN107330445A (zh) | 用户属性的预测方法和装置 | |
Raptis et al. | Total power quality index for electrical networks using neural networks | |
CN104346698A (zh) | 基于云计算和数据挖掘的餐饮会员大数据分析和考核系统 | |
CN111445009A (zh) | 一种基于gru网络预测物资采购需求量的方法 | |
CN110212529A (zh) | 一种基于支持向量机的配电网低电压台区预警方法 | |
CN110910026A (zh) | 一种跨省输电线路线损智能管理与决策方法及系统 | |
CN110009045A (zh) | 物联网终端的识别方法和装置 | |
Guan et al. | Customer load forecasting method based on the industry electricity consumption behavior portrait | |
CN101206727B (zh) | 数据处理装置和数据处理方法 | |
Li et al. | Deep Learning for Power System Applications: Case Studies Linking Artificial Intelligence and Power Systems | |
CN117592615A (zh) | 一种基于iceemdan和集成lstm-tcn模型的短期电力负荷预测方法 | |
CN111864728B (zh) | 一种可重构配电网重要设备识别方法和系统 | |
Wu et al. | Applications of AI techniques to generation planning and investment | |
CN115719194A (zh) | 一种基于大数据预测物资采购方法和系统 | |
Liu et al. | An improved nondominated sorting genetic algorithm-ii for multi-objective flexible job-shop scheduling problem considering worker assignments | |
Jun et al. | A novel short-term residential load forecasting model combining machine learning method with empirical mode decomposition | |
Kuo et al. | A novel framework short-term load forecasting for micro-grid energy management system | |
Morquecho et al. | Comparison of an Improved Metaheuristic and Mathematical Optimization Based Methods to Solve the Static AC TNEP Problem | |
Lemos et al. | Temporal convolutional network applied for forecasting individual monthly electric energy consumption |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200626 |
|
RJ01 | Rejection of invention patent application after publication |