CN111445009A - 一种基于gru网络预测物资采购需求量的方法 - Google Patents
一种基于gru网络预测物资采购需求量的方法 Download PDFInfo
- Publication number
- CN111445009A CN111445009A CN202010217499.7A CN202010217499A CN111445009A CN 111445009 A CN111445009 A CN 111445009A CN 202010217499 A CN202010217499 A CN 202010217499A CN 111445009 A CN111445009 A CN 111445009A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- gru
- training
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 239000000463 material Substances 0.000 title claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 57
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000003062 neural network model Methods 0.000 claims abstract description 14
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 4
- 230000000694 effects Effects 0.000 claims description 13
- 230000007547 defect Effects 0.000 claims description 11
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000004140 cleaning Methods 0.000 claims description 10
- 230000000306 recurrent effect Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000003491 array Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000005406 washing Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims 1
- 238000009826 distribution Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000013079 data visualisation Methods 0.000 description 5
- 239000004020 conductor Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于GRU网络预测物资采购需求量的方法,包括以下步骤;S1:采用预设方法对预先采集的数据进行数据处理;S2:通过预设方法对原预测模型和循环神经网络模型进行对比;S3:采用预设方法构建GRU模型,并将所述处理后的数据作为所述GRU模型的输入,获取预测值。有益效果:通过建立GRU模型,从而减少了训练更新的参数,使GRU模型结构更加简单,大大减少了训练时间,进而优化了物品采购预测模型,提升预测精确度。
Description
技术领域
本发明涉及预测物资采购需求方法技术领域,具体来说,涉及一种基于GRU网络预测物资采购需求量的方法。
背景技术
随着我国社会经济快速发展,资源管理与资源的配置已深入人心,资源是公司成长的基础。没有充分的优势资源,企业是很难发展的。如果企业不清楚自己的资源构成,也就做不到知己知彼,根本不可能在竞争中取胜。相反,如果对自己的资源构成、竞争者的资源构成都非常清楚的话,就能够准确地对各种形势做出判断。因此,我们要合理的利用、配置好资源。
以电力部门、企业为例,如何准确预测变电站及配网工程的物资需求、在保障工程进度的前提下提高资金利用率,节约成本,具有重要意义,有助于提升这些部门、企业的竞争力。
在物资需求预测方面,现有技术中一般使用采购物资需求预测模型进行预测,该模型首先通过对近三年可研批复数据和综合计划数据以及项目物资历史采购订单的整理,得到项目实际计划采购金额、实际采购金额、电压等级以及相关小类采购情况等属性信息,然后通过项目的属性信息对项目进行聚类,并确认聚类结果所属的项目类型,接着以总投资金额和项目类型为出发点,同时考虑到年度增长率、项目批复影响因素、物资单价浮动、设备使用状态等要素,对小类采购量进行回归分析,剔除不显著的影响因素,得到多因素的回归系数,最后通过得到的多元回归模型以及未来一段时间内相关因素的取值预测各类物资采购需求量。
但是,现有的采购物资需求预测模型存在以下缺陷:1、数据冗余、离散,物品购买量波动大,没有对采购数据进行数据清洗,忽略了异常值对预测带来的影响;2、采购需求的影响因子太多,普通的线性回归模型并不能很好的拟合出预测函数;3、没有考虑历史采购量之间的时序关系,预测精确度较低。加之现有的预测模型训练时间长,训练所需参数量大,结构复杂。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了基于GRU网络预测物资采购需求量的方法,具备预测精度高,可实现采购优化及成本优化的目的,进而解决背景技术中的问题。
(二)技术方案
为实现上述预测精度高,可实现采购优化及成本优化的目的,本发明采用的具体技术方案如下:
一种基于GRU网络预测物资采购需求量的方法,包括以下步骤:
S1:采用预设方法对预先采集的数据进行数据处理;
S2:通过预设方法对原预测模型和循环神经网络模型进行对比;
S3:采用预设方法构建GRU模型,并将所述处理后的数据作为所述GRU模型的输入,获取预测值。
作为改进的,所述步骤S1采用预设方法对预先采集的数据进行数据处理具体包括以下步骤:
S11:通过预备的数据库进行所需数据的采集,得到采集数据,保证了得到数据可靠性与真实性;
S12:通过预设方法对所述采集数据进行数据清洗,得到处理后的数据,从而清洗冗余数据,去除异常过高过低购买量,使处理后的数据离散性低,具有一定规律性,进而减少了异常数据推预测值造成的影响,提高了该模型的预测精度。
作为改进的,所述步骤S12通过预设方法对所述采集数据进行数据清洗,得到处理后的数据具体包括以下步骤:
S121:对所述采集数据中的原始时序数据进行随机采样和估计得到多条估计数据,并对随机采样产生的空缺点补齐,获得多条补齐估计数据,以此保证采集的数据具有一定规律性;
S122:按采样时间点对所有的所述补齐估计数据进行分类,获得多组时间分类数据,并对每组所述时间分类数据按照大小进行排序得到多组排序数组,保证采集的数据更加合理,覆盖范围更广;
S123:对多组所述排序数组进行处理获得多个对应的平均值数据,并通过多个所述平均值数据构成均值序列;保证采集的数据更加平稳,避免离散性过大。
S124:输出所述均值序列,即完成对购买量异常数据的清除,得到处理后的数据。保证数据的有用性,更好的输入到预测模型中。
作为改进的,所述步骤S2通过预设方法对原预测模型和循环神经网络模型进行对比具体包括以下步骤:将原预测模型和循环神经网络模型从数据处理、函数关系、时间依赖性、趋势4个方面进行对比分析,针对原预测模型的缺陷找出更合适的预测模型,从而是该预测模型规避了原预测模型的线性关系导致不能更好的囊括复杂关节的分布的缺点,能够使预测模型更加灵活的应用于复杂关节的分布。
作为改进的,所述步骤S3采用预设方法构建GRU模型,并将所述处理后的数据作为所述GRU模型的输入,获取预测值具体包括以下步骤:
S31:假设当前的状态只与前面的几个状态相关,构建GRU模型,得到所述GRU模型的数学表达式:
yt=σ(woght)
其中,yt为当前层的输出,ht则为当前节点隐含层状态,σ为Sigmoid激活函数:
其中,e-x表示指数函数;
S32:将清洗后的数据序列标记为{x1,x2,……xt……},其中xt代表时刻为t时刻的输入,输入单品购买量的时间序列数据{x1,x2,……xt……},对GRU模型进行训练,从而减少了训练更新的参数,使GRU模型结构更加简单,大大减少了训练时间,进而优化了物品采购预测模型;
S33:当所述GRU模型训练好以后,将t时刻的单品购买量输入到模型中,得到yt+1即为t+1时刻的单品购买量,即为预测值。
作为改进的,所述S31中的ht的数学表达式为:
ht=(1-z)*ht-1+z*h′
所述z的数学表达式为:
z=σ(wzg[ht-1,xt])
所述h′的数学表达式为:
h′=tanh(wg[r*ht-1,xt])
所述r的数学表达式为:
r=σ(wrg[ht-1,xt])
其中,ht为当前节点隐含层状态,ht-1为上一节点隐含层状态,σ为Sigmoid激活函数,rt控制重置的门控,zt为控制更新的门控,xt代表时刻为t时刻的输入,yt为当前节点的输出,h‘表示“重置”后的数据。
作为改进的,所述步骤S32中对所述GRU模型进行网络训练还包括以下步骤:在训练所述GRU模型时,分别以1天、7天、8天、10天、12天为周期进行训练,然后选取效果最好的模型进行预测,从而进一步的提高了预测的精确度。
作为改进的,所述步骤S32中对所述GRU模型进行网络训练还包括以下步骤:保证拟合情况的出现,并且对于过拟合情况有效的进行更改。
对于训练不足的情况,通过增加网络中的节点,或者增加网络的训练周期来达到训练效果,使模型能够拟合出输入与输出的非线性关系。
对于过度拟合的情况,通多减少或控制训练周期,在数据出现拐点前,停止对网络的训练来达到训练效果,使模型能够拟合出输入与输出的非线性关系。
(三)有益效果
与现有技术相比,本发明提供了基于GRU网络预测物资采购需求量的方法,具备以下有益效果:
(1)、通过建立GRU模型,从而减少了训练更新的参数,使GRU模型结构更加简单,大大减少了训练时间,进而优化了物品采购预测模型,提升预测精确度。
(2)、通过数据处理,清洗冗余数据,去除异常过高过低购买量,从而使处理后的数据离散性低,具有一定规律性,进而减少了异常数据推预测值造成的影响,提高了该模型的预测精度。
(3)、通过对比原预测模型与待引入的模型及引入循环神经网络模型,从而规避了原预测模型的线性关系导致不能更好的囊括复杂关节的分布的缺点,能够使预测模型更加灵活的应用于复杂关节的分布。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的基于GRU网络预测物资采购需求量的方法的流程图;
图2是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中10kv变压器清洗前后的数据可视化图;
图3是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中10kv电缆终端采购数据清洗前后的数据可视化图;
图4是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中GRU模型的输入输出结构图;
图5是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中GRU模型的内部结构图;
图6是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中10kv变压器的训练结果的示意图;
图7是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中10kv电缆终端的预测结果的示意图;
图8是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中低压开关柜的预测结果示意图;
图9是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中电力电缆的预测结果示意图;
图10是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中架空绝缘导线的预测结果示意图;
图11是根据本发明实施例的基于GRU网络预测物资采购需求量的方法中接地铁的预测结果示意图。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
根据本发明的实施例,提供了一种基于GRU网络预测物资采购需求量的方法。
现结合附图和具体实施方式对本发明进一步说明,如图1-5所示,根据本发明实施例的基于GRU网络预测物资采购需求量的方法,包括以下步骤:
S1:采用预设方法对预先采集的数据进行数据处理;
其中,所述S1具体包括以下步骤:
S11:通过预备的数据库进行所需数据的采集,得到采集数据;
具体的,本实施例中选用的都是采购量大,采购周期频繁的物品,包括6个种类,分别是10kv变压器、10kv电缆终端、低压开关柜、电力电缆、架空绝缘导线、接地铁。选择其中的10kv变压器、10kv电缆终端进行数据可视化展示,由于数据波动较大,离散性太高,对于采购预测模型的建立不够友好,所以需要进行数据清洗,将购买量异常过高和过低的数据删除,如图2所示为10kv变压器清洗前后的数据可视化图,如图3为10kv电缆终端采购数据清洗前后的数据可视化图。
本实施例中的数据来源于国网物资部2014-2019收获数据,根据国网上海市电力公司的一篇文章基于大数据分析的协议库存需求预测研究的项目聚类整体分布表选出占比前6的种类,并从2014-2019收获数据表中整理出6种种类的日期及其相应的购买量。
S12:通过预设方法对所述采集数据进行数据清洗,得到处理后的数据。
具体的,所述S12具体包括以下步骤:
S121:对所述采集数据中的原始时序数据进行随机采样和估计得到多条估计数据,并对随机采样产生的空缺点补齐,获得多条补齐估计数据;
S122:按采样时间点对所有的所述补齐估计数据进行分类,获得多组时间分类数据,并对每组所述时间分类数据按照大小进行排序得到多组排序数组;
S123:对多组所述排序数组进行处理获得多个对应的平均值数据,并通过多个所述平均值数据构成均值序列;
S124:输出所述均值序列,即完成对购买量异常数据的清除,得到处理后的数据。
S2:通过预设方法对原预测模型和循环神经网络模型进行对比;
其中,所述S2具体包括以下步骤:由于原预测模型不能友好的专注长时间的预测,因此,本实施例中通过将原预测模型和循环神经网络模型从数据处理、函数关系、时间依赖性、趋势4个方面进行对比分析,针对原预测模型的缺陷找出更合适的预测模型,如表1所示为原模型和循环神经网络模型对比。
表1原模型和循环神经网络模型对比
S3:采用预设方法构建GRU模型,并将所述处理后的数据作为所述GRU模型的输入,获取预测值;
其中,所述S3具体包括以下步骤:
S31:假设当前的状态只与前面的几个状态相关,构建GRU模型,得到所述GRU模型的数学表达式:
yt=σ(woght)
其中,yt为当前层的输出,ht则为当前节点隐含层状态,σ为Sigmoid激活函数:
其中,e-x表示指数函数;
所述S31中的ht的数学表达式为:
ht=(1-z)*ht-1+z*h′
所述z的数学表达式为:
z=σ(wzg[ht-1,xt])
所述h′的数学表达式为:
h′=tanh(wg[r*ht-1,xt])
所述r的数学表达式为:
r=σ(wrg[ht-1,xt])
其中,ht为当前节点隐含层状态,rt控制重置的门控,zt为控制更新的门控,yt为当前节点的输出,ht则为当前节点隐含层状态。
S32:将清洗后的数据序列标记为{x1,x2,……xt……},其中xt代表时刻为t时刻的输入,输入单品购买量的时间序列数据{x1,x2,……xt……},对GRU模型进行训练;
具体的,在训练GRU模型时,可能需要缩放序列预测问题的数据。当输入数据序列分布并不标准,或者变化幅度(标准差)过大时,这会减慢网络的学习和收敛速度,也会阻碍网络的学习效率。由于物品采购数据集中存在异常值和较多噪音,故本实施例中采用归一化来对处理后t时刻的数据进行再处理,可以间接通过中心化避免异常值和极端值的影响,归一化公式为:x=(x-μ)/σ′,其中,x表示原值,μ表示均值,σ′表示方差;
具体的,传统模型预测需要大量的数据作为支撑,但是对国网物资采购的预测由于数据量不够大,并不能很好的拟合出采购量的线性方程,为了使现有的数据量的利用率达到最大化,本实施例在训练模型时,分别以1天、7天、8天、10天、12为周期(比如以7天为周期,则将1号到7号数据相加作为一个数据,8号到14号数据相加作为一个数据,后面数据以此类推)进行训练,然后选取效果最好的模型进行预测;
具体的,由于各物品的数据分布参差不齐,而且在训练过程中常常因为训练数据较少或者是离散性太高而导致训练不足和过度拟合。过度拟合指的是由于训练数据过少,或者对训练集训练的次数过多,导致模型的结果不是找到所有数据的一般共有特性,而是仅对训练数据进行了特征提取。换句话说,这个模型已经记住了所有的训练数据,对训练数据的预测效果非常好,但对其他数据的预测效果非常差。
对于训练不足的情况来说,可以通过增加网络中的节点,或者增加网络的训练周期来达到训练效果;
对于过度拟合的情况来说,可以通多减少或控制训练周期,在数据出现拐点前,停止对网络的训练来达到训练效果。
S33:当所述GRU模型训练好以后,将t时刻的单品购买量输入到模型中,得到yt+1即为t+1时刻的单品购买量,即为预测值。
为了更好地理解本技术方案,本实施中还包括误差评估和预测结果展示两个部分。
1)误差评估
为了评价对比在原有顺序时间序列之上,引入新特征组后的GRU神经网络模型的预测性能,选择平均绝对误差(MAE)、均方根误差(RMSE)和相对准确率来进行误差评估。因为在采购数量过少的时刻点,评估相对准确率时,误差会比采购数量相对较大的时刻点大得多,而且采购量太少也没有预测的必要,所以在算相对准确率时删除了与真实采购量均值相差过大的数据。
①平均绝对误差(MAE),是指所有预测值与真实值之间偏差绝对值的平均值,其表达式为:MAE能更好的反映预测值与真实值误差的实际情况,MAE值越大,表明预测值与真实值之间的差别越大,预测效果越差,反之越好。
②均方根误差(RMSE),是指所有预测值与真实值之差的平方的平均值,再开平方得到的值,其表达式为;RMSE对于一组预测的特小或特大误差非常敏感,可以很好反映预测的精密度,因此同MAE一样,RMSE越大,预测效果则越差。
以上表达式中fi表示i点的预测值,yi表示i点的真实值,N表示数据数目。
2)预测结果展示
依据物品采购需求建立采购预测体系,开展采购链全流程建模,推动电力物资全供应链的统一数据体系的构建,开发一套适用于电力物资未来采购需求预处理算法,并通过采购需求预测模型对传统采购需求收集进行验证、指导到最终的逐步替代及IT固化,使电信运营商采购需求管理工作科学、细化、高效,采购流程上释放人力、提高效率,采购需求上准确预测、精益管理,有计划地进行采购,有效降低突发采购成本、仓储成本和工程时间成本,实现采购优化及成本优化。
为了验证引入后模型对准确度的提升,本实施中选用采购频率较高的6种类别进行预测,他们分别是10kv变压器、10kv电缆终端、低压开关柜、电力电缆、架空绝缘导体、接地铁。本实施中对上面6个种类的数据输入到先前写好的预测模型中进行训练,表2各类别训练后的绝对平均误差、均方根误差和准确率的数据展示(以不同周期的数据作为输入,选取出训练结果做好的模型)。
表2各类别通过GRU模型训练后的数据
在进行物品采购预测训练的时候发现以1天、7天、8天、10天、12为周期进行训练出来的结果截然不同,是由于各个物品对于不同周期的数据分布不一样,离散性也不一致,所以本实施例针对不同物品采用不同的预测周期,以10kv变压器为例,展示采用不同时间周期进行训练的结果,看出针对不同时间周期的绝对平方差、均方根误差和准确率都有所不同,如表3为10kv变压器的数据输入到预测模型训练之后的结果。
表3 10kv变压器的训练结果
时间周期 | 1天 | 7天 | 8天 | 10天 | 12天 |
MAE | 11.43 | 9.55 | 11.56 | 10.22 | 12.26 |
RMSE | 14.77 | 18.01 | 20.72 | 16.96 | 21.67 |
准确率 | 0.58 | 0.65 | 0.70 | 0.85 | 0.72 |
耗时(s) | 532.63847 | 550.42019 | 492.40223 | 488.38247 | 427.38985 |
通过将预测结果与真实值进行比较以对GRU模型预测精度进行分析,在进行各类别训练过程中,分别尝试了以1天、7天、8天、10天、12天为周期进行训练,由于各物品的数据分布不同,而且离散程度也各不相同,训练过程中发现10kv变压器、接地铁2种类别的物品以10天为周期进行训练的结果比较好,能到达比较好的预测精度,10kv电缆终端、架空绝缘导线是以一周为周期进行训练,能到达很好的预测精度,低压开关柜是以8天为周期进行训练,电力电缆是以12天为周期进行训练,能够达到各自最优的预测精度。
本方法的预测原理:由于对物资采购量的影响因子很多,要找到这些影响因子就需要建立一个影响因子与采购量的模型,拟合出影响因子与采购量的函数关系。但是物资采购量的影响因子太多,普通的线性方程并不能完整的拟合出采购量和影响因子之间的关系,而且国网物资的采购与时间序列具有很大的关联性,而GRU网络模型提供的方法刚好可以拟合出一种非线性的函数关系,而且可以很好的利用(如何利用在模型中数据输入中有所体现)具有时间序列的数据,表现出时间序列数据的一些关系。
综上所述,借助于本发明的上述技术方案,通过数据处理,清洗冗余数据,去除异常过高过低购买量,从而使处理后的数据离散性低,具有一定规律性,进而减少了异常数据推预测值造成的影响,提高了该模型的预测精度。通过对比原预测模型与待引入的模型及引入循环神经网络模型,从而规避了原预测模型的线性关系导致不能更好的囊括复杂关节的分布的缺点,能够使预测模型更加灵活的应用于复杂关节的分布。通过建立GRU模型,从而减少了训练更新的参数,使GRU模型结构更加简单,大大减少了训练时间,进而优化了物品采购预测模型,提升预测精确度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于GRU网络预测物资采购需求量的方法,其特征在于,包括以下步骤:
S1:采用预设方法对预先采集的数据进行数据处理;
S2:通过预设方法对原预测模型和循环神经网络模型进行对比;
S3:采用预设方法构建GRU模型,并将所述处理后的数据作为所述GRU模型的输入,获取预测值。
2.根据权利要求1所述的一种基于GRU网络预测物资采购需求量的方法,其特征在于,所述步骤S1采用预设方法对预先采集的数据进行数据处理具体包括以下步骤:
S11:通过预备的数据库进行所需数据的采集,得到采集的数据;
S12:通过预设方法对所述采集数据进行数据清洗,得到处理后的数据。
3.根据权利要求2所述的一种基于GRU网络预测物资采购需求量的方法,其特征在于,所述步骤S12通过预设方法对所述采集数据进行数据清洗,得到处理后的数据具体包括以下步骤:
S121:对所述采集数据中的原始时序数据进行随机采样和得到多条估计数据,并对随机采样产生的空缺点补齐,获得多条补齐估计数据;
S122:按采样时间点对所有的所述补齐估计数据进行分类,获得多组时间分类数据,并对每组所述时间分类数据按照大小进行排序得到多组排序数组;
S123:对多组所述排序数组进行处理获得多个对应的平均值数据,并通过多个所述平均值数据构成均值序列;
S124:输出所述均值序列,即完成对购买量异常数据的清除,得到处理后的数据。
4.根据权利要求1所述的一种基于GRU网络预测物资采购需求量的方法,其特征在于,所述步骤S2通过预设方法对原预测模型和循环神经网络模型进行对比具体包括以下步骤:将原预测模型和循环神经网络模型从数据处理、函数关系、时间依赖性、趋势4个方面进行对比分析,针对原预测模型的缺陷找出更合适的预测模型。
5.根据权利要求1所述的一种基于GRU网络预测物资采购需求量的方法,其特征在于,所述步骤S3采用预设方法构建GRU模型,并将所述处理后的数据作为所述GRU模型的输入,获取预测值具体包括以下步骤:
S31:假设当前的状态只与前面的几个状态相关,构建GRU模型,得到所述GRU模型的数学表达式:
yt=σ(woght)
其中,yt为当前层的输出,ht则为当前节点隐含层状态,σ为Sigmoid激活函数:
其中,e-x表示指数函数;
S32:将清洗后的数据序列标记为{x1,x2,……xt……},其中xt代表时刻为t时刻的输入,输入单品购买量的时间序列数据{x1,x2,……xt……},对GRU模型进行训练;
S33:当所述GRU模型训练好以后,将t时刻的单品购买量输入到模型中,得到yt+1即为t+1时刻的单品购买量,即为预测值。
6.根据权利要求5所述的一种基于GRU网络预测物资采购需求量的方法,其特征在于,所述S31中的ht的数学表达式为:
ht=(1-z)*ht-1+z*h′
所述z的数学表达式为:
z=σ(wzg[ht-1,xt])
所述h′的数学表达式为:
h′=tanh(wg[r*ht-1,xt])
所述r的数学表达式为:
r=σ(wrg[ht-1,xt])
其中,ht为当前节点隐含层状态,rt控制重置的门控,zt为控制更新的门控,yt为当前节点的输出,ht则为当前节点隐含层状态。
7.根据权利要求6所述的一种基于GRU网络预测物资采购需求量的方法,其特征在于,所述步骤S32中对所述GRU模型进行网络训练还包括以下步骤:在训练所述GRU模型时,分别以1天、7天、8天、10天、12天为周期进行训练,然后选取训练效果最好的模型进行预测。
8.根据权利要求7所述的一种基于GRU网络预测物资采购需求量的方法,其特征在于,所述步骤S32中对所述GRU模型进行网络训练还包括以下步骤:
对于训练不足的情况,通过增加网络中的节点,或者增加网络的训练周期来达到训练效果;
对于过度拟合的情况,通多减少或控制训练周期,在数据出现拐点前,停止对网络的训练来达到训练效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010217499.7A CN111445009A (zh) | 2020-03-25 | 2020-03-25 | 一种基于gru网络预测物资采购需求量的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010217499.7A CN111445009A (zh) | 2020-03-25 | 2020-03-25 | 一种基于gru网络预测物资采购需求量的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111445009A true CN111445009A (zh) | 2020-07-24 |
Family
ID=71650985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010217499.7A Pending CN111445009A (zh) | 2020-03-25 | 2020-03-25 | 一种基于gru网络预测物资采购需求量的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111445009A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381350A (zh) * | 2020-10-14 | 2021-02-19 | 国网重庆市电力公司营销服务中心 | 一种电力物资交叉估算系统及其方法 |
CN112614011A (zh) * | 2020-12-07 | 2021-04-06 | 国网北京市电力公司 | 电力配网物资需求预测方法和装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104679834A (zh) * | 2015-02-06 | 2015-06-03 | 北京工商大学 | 一种时序数据清洗方法及系统 |
US20170091615A1 (en) * | 2015-09-28 | 2017-03-30 | Siemens Aktiengesellschaft | System and method for predicting power plant operational parameters utilizing artificial neural network deep learning methodologies |
CN107578124A (zh) * | 2017-08-28 | 2018-01-12 | 国网山东省电力公司电力科学研究院 | 基于多层改进gru神经网络的短期电力负荷预测方法 |
CN109376848A (zh) * | 2018-09-01 | 2019-02-22 | 哈尔滨工程大学 | 一种简化的门控单元神经网络 |
CN110647980A (zh) * | 2019-09-18 | 2020-01-03 | 成都理工大学 | 一种基于gru神经网络的时间序列预测方法 |
-
2020
- 2020-03-25 CN CN202010217499.7A patent/CN111445009A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104679834A (zh) * | 2015-02-06 | 2015-06-03 | 北京工商大学 | 一种时序数据清洗方法及系统 |
US20170091615A1 (en) * | 2015-09-28 | 2017-03-30 | Siemens Aktiengesellschaft | System and method for predicting power plant operational parameters utilizing artificial neural network deep learning methodologies |
CN107578124A (zh) * | 2017-08-28 | 2018-01-12 | 国网山东省电力公司电力科学研究院 | 基于多层改进gru神经网络的短期电力负荷预测方法 |
CN109376848A (zh) * | 2018-09-01 | 2019-02-22 | 哈尔滨工程大学 | 一种简化的门控单元神经网络 |
CN110647980A (zh) * | 2019-09-18 | 2020-01-03 | 成都理工大学 | 一种基于gru神经网络的时间序列预测方法 |
Non-Patent Citations (2)
Title |
---|
LUXIAONLP: "LSTM和GRU网络的介绍和区别", 《HTTPS://BLOG.CSDN.NET/SHAWROAD88/ARTICLE/DETAILS/89472668》 * |
柴龙凯: "基于数据(序列模式)挖掘的医院物资使用量预测模型研究", 《中国优秀硕士学位论文全文数据库医药卫生科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381350A (zh) * | 2020-10-14 | 2021-02-19 | 国网重庆市电力公司营销服务中心 | 一种电力物资交叉估算系统及其方法 |
CN112381350B (zh) * | 2020-10-14 | 2024-05-24 | 国网重庆市电力公司营销服务中心 | 一种电力物资交叉估算系统及其方法 |
CN112614011A (zh) * | 2020-12-07 | 2021-04-06 | 国网北京市电力公司 | 电力配网物资需求预测方法和装置、存储介质及电子设备 |
CN112614011B (zh) * | 2020-12-07 | 2024-03-15 | 国网北京市电力公司 | 电力配网物资需求预测方法和装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | A multi-objective differential evolution algorithm for parallel batch processing machine scheduling considering electricity consumption cost | |
CN111340312A (zh) | 一种基于rnn网络预测物资采购需求量的方法 | |
CN111401651A (zh) | 一种基于lstm网络预测物资采购需求量的方法 | |
CN112559963B (zh) | 一种配电网动态参数辨识方法及装置 | |
CN111445009A (zh) | 一种基于gru网络预测物资采购需求量的方法 | |
Ji et al. | Real-time autonomous dynamic reconfiguration based on deep learning algorithm for distribution network | |
CN111082419B (zh) | 基于大数据技术的智能配电网用户接入方案管理方法及系统 | |
Huang | A mean field capital accumulation game with HARA utility | |
LU500551B1 (en) | Virtual load dominant parameter identification method based on incremental learning | |
CN104346698A (zh) | 基于云计算和数据挖掘的餐饮会员大数据分析和考核系统 | |
CN113033617A (zh) | 一种基于大数据台区线损数据深度挖掘分析方法 | |
CN107679719A (zh) | 一种复杂电网电能质量知识云监测与评价系统和方法 | |
CN113689079A (zh) | 基于多元线性回归和聚类分析的台区线损预测方法及系统 | |
CN115330201A (zh) | 一种电网数字化项目帕累托优选方法及系统 | |
CN101206727B (zh) | 数据处理装置和数据处理方法 | |
CN112508254B (zh) | 变电站工程项目投资预测数据的确定方法 | |
CN111864728B (zh) | 一种可重构配电网重要设备识别方法和系统 | |
Wang et al. | A multi-objective cuckoo search algorithm based on the record matrix for a mixed-model assembly line car-sequencing problem | |
CN110689320A (zh) | 一种基于协同进化算法的大规模多目标项目调度方法 | |
Rezende et al. | Artificial immune system applied to the multi-stage transmission expansion planning | |
CN115719194A (zh) | 一种基于大数据预测物资采购方法和系统 | |
CN114169763A (zh) | 一种计量器具需求预测方法、系统、计算装置及存储介质 | |
CN113922369A (zh) | 用于输配电网可靠性评估的方法、终端及存储介质 | |
Vahid et al. | A new method to reduce losses in distribution networks using system reconfiguration with distributed generations using self-adaptive harmony search algorithm | |
CN113361746A (zh) | 一种配电网物资品类优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200724 |