CN114707712A - 一种发电机组备件需求的预测方法 - Google Patents
一种发电机组备件需求的预测方法 Download PDFInfo
- Publication number
- CN114707712A CN114707712A CN202210289457.3A CN202210289457A CN114707712A CN 114707712 A CN114707712 A CN 114707712A CN 202210289457 A CN202210289457 A CN 202210289457A CN 114707712 A CN114707712 A CN 114707712A
- Authority
- CN
- China
- Prior art keywords
- training
- representing
- value
- layer
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 110
- 239000011159 matrix material Substances 0.000 claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000010606 normalization Methods 0.000 claims abstract description 12
- 230000004913 activation Effects 0.000 claims description 14
- 210000004027 cell Anatomy 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 4
- 230000008034 disappearance Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 35
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000006386 memory function Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- YCKRFDGAMUMZLT-UHFFFAOYSA-N Fluorine atom Chemical compound [F] YCKRFDGAMUMZLT-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种发电机组备件需求的预测方法,包括,获取预设时间段内的多种柴油发电机组的运行数据;将获得的运行数据按预设的格式组成训练数据集,根据预设的预处理规则对训练数据集进行归一化预处理,得到训练矩阵;将所述训练矩阵作为输入量输入合预设的GRU与LSTM组合神经网络预测模型进行多维时间序列预测计算,输出柴油发电机组备件需求的预测结果。本发明建立基于GRU与LSTM组合神经网络的多维时间序列预测模型,因为考虑了多种影响因素数据且采用叠加的GRU与LSTM组合来处理序列数据信息,避免了梯度消失问题,预测效果好,精度高,适用性好。
Description
技术领域
本发明涉及核电应急柴油机备件需求预测技术领域,特别是涉及一种发电机组备件需求的预测方法。
背景技术
目前对于核电应急柴油机备件需求预测领域的研究,已经形成了多种预测方法,如指数平滑模型、灰色预测法、ARIMA模型、神经网络模型等。经调研,这些方法大多只使用备件需求量的历史数据对未来一段时间内的备件需求量进行预测,而备件需求量往往受其他运行因素的影响,如发电量一定的情况下带负载运行时长增加时继电器动作次数就相对减小,相应的继电器需求数量就相对减少。因此,将多种影响因素作为多个维度对备件需求量进行预测,其精确度相对较高。
随着深度学习技术的迅速发展,循环神经网络(RNN)已经在多个领域得到了广泛的应用,并取得了良好的效果。而在处理时间序列问题上循环神经网络是最常用的工具,因为它具有记忆功能,可以记住前几次的结果。但是它的记忆功能有限,不能够记住很久之前的结果,进而无法解决长距离依赖问题。
发明内容
本发明的目的在于,提出一种发电机组备件需求的预测方法,建立基于GRU与LSTM组合神经网络的多维时间序列预测模型,采用多种设备运行数据作为输入数据的多个维度变量,提升预测效果及预测精度。
一方面,提供一种发电机组备件需求的预测方法,包括:
获取预设时间段内的多种柴油发电机组的运行数据;
将获得的运行数据按预设的格式组成训练数据集,根据预设的预处理规则对训练数据集进行归一化预处理,得到训练矩阵;
将所述训练矩阵作为输入量输入合预设的GRU与LSTM组合神经网络预测模型进行多维时间序列预测计算,输出柴油发电机组备件需求的预测结果。
优选地,将获得的运行数据按以下预设的格式组成训练数据集:
其中,X表示训练数据集,x表示训练数据集内的变量,即运行数据,n表示训练数据集内行的序数,m表示训练数据集内列的序数。
优选地,所述根据预设的预处理规则对训练数据集进行归一化预处理具体包括:
确定训练数据集内每列变量的最小值、最大值及极差值,其中,所述极差值为每列变量的最大值与最小值之间的差值;
根据训练数据集内每列变量的最小值、最大值及极差值计算对应的训练变量,并将计算得到的对应训练变量组成训练矩阵。
优选地,根据以下公式计算对应的训练变量:
其中,表示训练矩阵内第i行第j列的训练变量,min1≤j≤mxkj表示训练数据集第j列变量的最小值,max1≤j≤mxkj为训练数据集第j列变量的最大值,max1≤j≤mxkj-min1≤j≤mxkj为训练数据集第j列变量的极差,xij表示训练数据集第i行第j列的变量。
优选地,所述将计算得到的对应训练变量组成以下格式的训练矩阵:
其中,XR表示训练矩阵。
优选地,所述合预设的GRU与LSTM组合神经网络预测模型具体包括:
依次连接的输入层、GRU层、第一Dropout层、第一Dense层、LSTM层、第二Dropout层、第二Dense层和输出层;
所述输入层,用以将所述训练矩阵作为输入量输出给所述GRU层;
所述GRU层,用以使用预设的GRU函数对输入量进行计算,第一运算值;
所述第一Dropout层,用以训练过程中识别是否出现模型过拟合,若出现则对参数更新时暂时随机断开指定数量的神经元;
所述第一Dense层,用以根据预设的运算函数对第一运算值进行运算,得到第二运算值;
所述LSTM层,用以使用预设的组合函数对第二运算值进行计算,得到第三运算值;
所述第二Dropout层,用以训练过程中识别是否出现模型过拟合,若出现则对参数更新时暂时随机断开指定数量的神经元;
所述第二Dense层,用以使用预设的运算函数对第三运算值进行计算,输出值;
所述输出层,用以输出值作为预测结果进行输出。
优选地,所述预设的GRU函数具体包括:
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
其中,zt表示时间t时刻更新门的输出,rt表示时间t时刻更新门的输出;xt表示t时刻的输入向量,ht表示t时刻的输出向量;Wz表示模块输入与更新门间的权重矩阵,Wr表示模块输入与重置门间的权重矩阵,W表示模块输入与间的权重矩阵。
优选地,所述预设的运算函数具体包括:
output=activation(dot(input,weight)+bias)
其中,activation表示激活函数,dot表示矩阵相乘运算函数,input表示第一运算值或第三运算值,weight表示权重矩阵,bias表示偏置值,output表示最后输出的预测结果。
优选地,所述激活函数具体包括:
其中,ReLU表示激活函数,即ReLU函数,x表示变量。
优选地,所述预设的组合函数具体包括:
ft=σ(St*[ht-1,xt]+b0)
it=σ(Si*[ht-1,xt]+bi)
ot=σ(Sk*[ht-1,xt]+bk)
ht=ot*tanh(Ct)其中,ft表示LSTM层内遗忘门,σ表示sigmoid函数,St表示遗忘门的权重矩阵,ht-1表示上一时刻的第三运算值,xt表示当前时刻的第二运算值,[ht-1,xt]表示将ht-1、xt在水平方向拼接为一个长向量,b0表示遗忘门的偏置值,it表示LSTM层内输入门,Si表示输入门的权重矩阵,bi表示输入门的偏置值,表示当前输入的单元状态,Sj表示当前输入的单元状态的权重矩阵,bj表示当前输入的单元状态的偏置值,Ct表示当前时刻的单元状态,ot表示LSTM层内输出门,Sk表示输出门的权重矩阵,bk表示输出门的偏置值,ht表示最终的输出。
综上,实施本发明的实施例,具有如下的有益效果:
本发明提供的发电机组备件需求的预测方法,采用多种影响因素的运行数据作为GRU与LSTM组合神经网络输入数据的多个维度变量,建立基于GRU与LSTM组合神经网络的多维时间序列预测模型,因为考虑了多种影响因素数据且采用叠加的GRU与LSTM组合来处理序列数据信息,避免了梯度消失问题,预测效果好,精度高,适用性好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例中一种发电机组备件需求的预测方法的主流程示意图。
图2为本发明实施例中GRU与LSTM组合神经网络预测模型的示意图。
图3为本发明实施例中GRU层的示意图。
图4为本发明实施例中LSTM层的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明提供的一种发电机组备件需求的预测方法的一个实施例的示意图。在该实施例中,所述方法包括以下步骤:
获取预设时间段内的多种柴油发电机组的运行数据;也就是,取过去特定时间段内的多种柴油发电机组运行数据。
进一步的,将获得的运行数据按预设的格式组成训练数据集,根据预设的预处理规则对训练数据集进行归一化预处理,得到训练矩阵;也就是,对输入数据进行预处理,多种柴油发电机组运行数据作为GRU与LSTM组合神经网络的训练集,对GRU与LSTM组合神经网络进行训练前,首先对训练集的数据进行归一化的预处理,设训练集为矩阵X。
具体实施例中,在具体实施中,通常得到的数据往往是不完整、含噪声、不一致、重复的,而在众多的深度学习算法中输入数据的质量又决定了训练过程中模型的好坏,因此在使用数据对模型进行训练前,需对数据进行预处理。数据预处理的过程通常不是固定的,它通常因任务和数据集属性的不同而不同。在深度学习领域,使用训练集对模型进行训练前,需要对数据进行归一化预处理操作,主要是为了将数据限制在[0,1]范围内,加快模型训练时的收敛速度,便于数据的处理,本实施例中,归一化处理采用将获得的运行数据按以下预设的格式组成训练数据集:
其中,X表示训练数据集,x表示训练数据集内的变量,即运行数据,n表示训练数据集内行的序数,m表示训练数据集内列的序数。
进行归一化预处理具体包括:确定训练数据集内每列变量的最小值、最大值及极差值,其中,所述极差值为每列变量的最大值与最小值之间的差值;根据训练数据集内每列变量的最小值、最大值及极差值计算对应的训练变量,并将计算得到的对应训练变量组成训练矩阵。具体地,根据以下公式计算对应的训练变量:
其中,表示训练矩阵内第i行第j列的训练变量,min1≤j≤mxkj表示训练数据集第j列变量的最小值,max1≤j≤mxkj为训练数据集第j列变量的最大值,max1≤j≤mxkj-min1≤j≤mxkj为训练数据集第j列变量的极差,xij表示训练数据集第i行第j列的变量。
经过变换后,所得影响因素数值均在0-1之间,完成了归一化处理,经过归一化处理之后变为训练矩阵:
其中,XR表示训练矩阵。
进一步的,将所述训练矩阵作为输入量输入合预设的GRU与LSTM组合神经网络预测模型进行多维时间序列预测计算,输出柴油发电机组备件需求的预测结果。也就是,选用堆叠的GRU网络对应急柴油机组备件需求数量进行预测,GRU与LSTM组合神经网络架构如图2所示,包括输入层、GRU与LSTM组合层、Dropout层、Dense层、GRU与LSTM组合层、Dropout层、Dense层和输出层,输入层输入经过预处理的数据,然后依次经过GRU与LSTM组合层、Dropout层、Dense层、GRU与LSTM组合层、Dropout层、Dense层的迭代运算,最后输出预测结果。
具体实施例中,本实施例中使用keras框架来实现深度学习的快速原型,因为keras提供了多种网络框架以供用户选择,用户可以以现有的框架为基础,根据自己的需求设计新的网络原型,构建各种网络时所需的代码比较少、设计速度快。通过keras框架来实现神经网络参数更新的过程,训练开始时初始化神经网络参数,通过随机数初始化权重矩阵,常数初始化偏置值。组织batch数据,如果训练数据量很大,可以分为多个batch进行训练。将训练数据带入,通过前向传播计算预测值,比较预测值和真实值之差,一般用loss函数(关于权重和偏置的函数,解决回归问题时一般选用均方差)进行表示。通过反向传播更新参数,具体是计算loss函数关于各个权重和偏置的梯度,沿着梯度下降最快的方向进行。重复以上过程直到达到训练次数或者loss函数达到要求范围。所述预设的GRU与LSTM组合神经网络预测模型具体包括:依次连接的输入层、GRU层、第一Dropout层、第一Dense层、LSTM层、第二Dropout层、第二Dense层和输出层;所述输入层,用以将所述训练矩阵作为输入量输出给所述GRU层;所述GRU层,用以使用预设的GRU函数对输入量进行计算,第一运算值;所述第一Dropout层,用以训练过程中识别是否出现模型过拟合,若出现则对参数更新时暂时随机断开指定数量的神经元;所述第一Dense层,用以根据预设的运算函数对第一运算值进行运算,得到第二运算值;所述LSTM层,用以使用预设的组合函数对第二运算值进行计算,得到第三运算值;所述第二Dropout层,用以训练过程中识别是否出现模型过拟合,若出现则对参数更新时暂时随机断开指定数量的神经元;所述第二Dense层,用以使用预设的运算函数对第三运算值进行计算,输出值;所述输出层,用以输出值作为预测结果进行输出。其中,使用GRU与LSTM组合函数对输入数据进行计算;Dropout层为了防止训练出来的模型过拟合,它在模型训练过程中更新参数时暂时随机断开指定数量的神经元;Dense层是全连接层。
具体地,如图3所示,GRU层采用累加的线性形式来处理序列数据信息,GRU层内部的计算过程为预设的GRU函数,具体包括:
zt=σ(Wz·[ht-1,xt])
rt=σ(Wr·[ht-1,xt])
其中,zt表示时间t时刻更新门的输出,rt表示时间t时刻更新门的输出;xt表示t时刻的输入向量,ht表示t时刻的输出向量;Wz表示模块输入与更新门间的权重矩阵,Wr表示模块输入与重置门间的权重矩阵,W表示模块输入与间的权重矩阵。GRU层的输入数据是形状为(batch,n_steps,n_input)的3D张量,batch表示样本数量,n_steps表示时间窗口的长度,n_input表示输入数据的维度(数据中的列)。
具体地,Dense层中预设的运算函数具体包括:
output=activation(dot(input,weight)+bias)
其中,activation表示激活函数,dot表示矩阵相乘运算函数,input表示第一运算值或第三运算值,weight表示权重矩阵,bias表示偏置值,output表示最后输出的预测结果。其中,所述激活函数具体包括:
其中,ReLU表示激活函数,即ReLU函数,x表示变量。Relu函数可以使网络训练更快,相比于sigmoid、tanh导数更加好求,反向传播就是不断的更新参数的过程,因为其导数不复杂且形式简单;增加网络的非线性,由于其本身为非线性函数,加入到神经网络中可以使网络拟合非线性映射;使网格具有稀疏性。
具体地,如图4所示,所述预设的组合函数具体包括:
ft=σ(St*[ht-1,xt]+b0)
it=σ(Si*[ht-1,xt]+bi)
ot=σ(Sk*[ht-1,xt]+bk)
ht=ot*tanh(Ct)
其中,ft表示LSTM层内遗忘门,σ表示sigmoid函数,St表示遗忘门的权重矩阵,ht-1表示上一时刻的第三运算值,xt表示当前时刻的第二运算值,[ht-1,xt]表示将ht-1、xt在水平方向拼接为一个长向量,b0表示遗忘门的偏置值,it表示LSTM层内输入门,Si表示输入门的权重矩阵,bi表示输入门的偏置值,表示当前输入的单元状态,Sj表示当前输入的单元状态的权重矩阵,bj表示当前输入的单元状态的偏置值,Ct表示当前时刻的单元状态,ot表示LSTM层内输出门,Sk表示输出门的权重矩阵,bk表示输出门的偏置值,ht表示最终的输出。其中,ht-1表示上一时刻的输出,xt表示当前时刻的输入数据;Ct表示当前时刻的单元状态,它是由遗忘门ft乘以上一时刻的单元状态Ct-1,再加上输入门it乘以当前输入的单元状态ot表示输出门;ht表示最终的输出,它由输出门ot乘以当前时刻单元状态Ct的tanh函数值。将归一化后训练数据代入GRU与LSTM组合网络中,输入向量对应指标,并按照相应训练步骤进行GRU与LSTM组合网络(GRU与LSTM组合神经网络预测模型)训练;最后进行网络的检验和预测,GRU与LSTM组合神经网络预测模型训练完成后再将几组输入向量递送至网络,运行后比较误差以对网络进行检验,检验合格后利用现有的待预测数据预测未来运行周期内备件的需求情况。
以控制柜中继电器为例进行需求预测。首先,将影响继电器使用寿命的各种原因分为内因和外因两大类,其中,内因是主要影响因素。以往也有研究人员针对应急柴油发电机组的备件进行需求预测,以达到优化库存的作用,基于威布尔分布的可靠性分布模型发挥了重要作用。设备的故障曲线,也就是“浴盆曲线”,能够清楚的反映某设备损坏个数与工作时间的关系,本实施例取某时刻的应急柴油发电机组继电器故障数来研究。
选定四个影响因素:连续6个月每月设备随时间变化而磨损的数量(X0)、发电量(X1)、带负载运行的时长(X2)、空载运行的时长(X3)。除了影响因素,还需要对目标量进行归一,也就是实际运行时半年内需要更换的继电器数量(Y),初始数据如表1所示。
将以上数据作为训练样本对神经网络进行训练,直到达到所有求的训练次数,得到训练好的预测模型。
模型训练完成后再将之后连续6个月的数据输入网络,运行后比较误差以对网络进行检验,检验合格即可利用现有数据预测未来运行周期内备件的需求情况。整理后可以得到如表2所示数据:
在现有技术中,BP神经网络是一种根据反向传播算法计算误差进行模型训练的网络。它主要是人类的大脑进行模拟,模型训练时只需给定输入数据和输出数据,不用描述变量的映射关系,它会自动存储和学习输入输出数据,具有很强的非线性系统模拟能力。本发明中采用包含一个输入层、一个隐含层、一个输出层的BP神经网络结构对继电器需求数量进行预测。实验中选取试验1中数据作为训练数据集和测试数据集,采用均方差(MSE)作为损失函数对模型进行性能度量。
表3:各项指标的预测数据
为了更直观的对两种方法进行比较,表4使用平均百分误差(MAPE)来计算两种方法的预测误差。平均百分误差如表4所示。
表4两种预测方法MAPE值对比
方法 | 平均百分比 |
基于GRU神经网络的多维时间序列预测 | 2.26% |
基于BP神经网络预测 | 3.96% |
上述结果表明,基于GRU神经网络的多维时间序列预测方法的平均百分误差远小于BP神经网络预测方法,达到了良好的预测效果。
综上,实施本发明的实施例,具有如下的有益效果:
本发明提供的发电机组备件需求的预测方法,采用多种影响因素的运行数据作为GRU与LSTM组合神经网络输入数据的多个维度变量,建立基于GRU与LSTM组合神经网络的多维时间序列预测模型,因为考虑了多种影响因素数据且采用叠加的GRU与LSTM组合来处理序列数据信息,避免了梯度消失问题,预测效果好,精度高,适用性好。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (10)
1.一种发电机组备件需求的预测方法,其特征在于,包括:
获取预设时间段内的多种柴油发电机组的运行数据;
将获得的运行数据按预设的格式组成训练数据集,根据预设的预处理规则对训练数据集进行归一化预处理,得到训练矩阵;
将所述训练矩阵作为输入量输入预设的GRU与LSTM组合神经网络预测模型进行多维时间序列预测计算,输出柴油发电机组备件需求的预测结果。
3.如权利要求2所述的方法,其特征在于,所述根据预设的预处理规则对训练数据集进行归一化预处理具体包括:
确定训练数据集内每列变量的最小值、最大值及极差值,其中,所述极差值为每列变量的最大值与最小值之间的差值;
根据训练数据集内每列变量的最小值、最大值及极差值计算对应的训练变量,并将计算得到的对应训练变量组成训练矩阵。
6.如权利要求1所述的方法,其特征在于,所述预设的GRU与LSTM组合神经网络预测模型具体包括:依次连接的输入层、GRU层、第一Dropout层、第一Dense层、LSTM层、第二Dropout层、第二Dense层和输出层;
所述输入层,用以将所述训练矩阵作为输入量输出给所述GRU层;
所述GRU层,用以使用预设的GRU函数对输入量进行计算,第一运算值;
所述第一Dropout层,用以训练过程中识别是否出现模型过拟合,若出现则对参数更新时暂时随机断开指定数量的神经元;
所述第一Dense层,用以根据预设的运算函数对第一运算值进行运算,得到第二运算值;
所述LSTM层,用以使用预设的组合函数对第二运算值进行计算,得到第三运算值;
所述第二Dropout层,用以训练过程中识别是否出现模型过拟合,若出现则对参数更新时暂时随机断开指定数量的神经元;
所述第二Dense层,用以使用预设的运算函数对第三运算值进行计算,输出值;
所述输出层,用以输出值作为预测结果进行输出。
8.如权利要求6所述的方法,其特征在于,所述预设的运算函数具体包括:
output=activation(dot(input,weight)+bias)
其中,activation表示激活函数,dot表示矩阵相乘运算函数,input表示第一运算值或第三运算值,weight表示权重矩阵,bias表示偏置值,output表示最后输出的预测结果。
10.如权利要求6所述的方法,其特征在于,所述预设的组合函数具体包括:
ft=σ(St*[ht-1,xt]+b0)
it=σ(Si*[ht-1,xt]+bi)
ot=σ(Sk*[ht-1,xt]+bk)
ht=ot*tanh(Ct)其中,ft表示LSTM层内遗忘门,σ表示sigmoid函数,St表示遗忘门的权重矩阵,ht-1表示上一时刻的第三运算值,xt表示当前时刻的第二运算值,[ht-1,xt]表示将ht-1、xt在水平方向拼接为一个长向量,b0表示遗忘门的偏置值,it表示LSTM层内输入门,Si表示输入门的权重矩阵,bi表示输入门的偏置值,表示当前输入的单元状态,Sj表示当前输入的单元状态的权重矩阵,bj表示当前输入的单元状态的偏置值,Ct表示当前时刻的单元状态,ot表示LSTM层内输出门,Sk表示输出门的权重矩阵,bk表示输出门的偏置值,ht表示最终的输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210289457.3A CN114707712A (zh) | 2022-03-23 | 2022-03-23 | 一种发电机组备件需求的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210289457.3A CN114707712A (zh) | 2022-03-23 | 2022-03-23 | 一种发电机组备件需求的预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114707712A true CN114707712A (zh) | 2022-07-05 |
Family
ID=82168982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210289457.3A Pending CN114707712A (zh) | 2022-03-23 | 2022-03-23 | 一种发电机组备件需求的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114707712A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050600A (zh) * | 2022-12-28 | 2023-05-02 | 中国电子科技集团公司第三十八研究所 | 基于cnn-ga-bp的组合模型备件需求预测方法和系统 |
CN116070791A (zh) * | 2023-03-27 | 2023-05-05 | 天津布尔科技有限公司 | 一种基于LSTM算法的柴油车NOx排放预测方法 |
CN116415929A (zh) * | 2023-03-07 | 2023-07-11 | 鞍钢集团工程技术有限公司 | 一种基于多层gru网络的鱼雷罐车预测性维护方法 |
CN116662766A (zh) * | 2023-08-01 | 2023-08-29 | 浙江大学 | 基于数据二维重构的风速预测方法及装置、电子设备 |
-
2022
- 2022-03-23 CN CN202210289457.3A patent/CN114707712A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050600A (zh) * | 2022-12-28 | 2023-05-02 | 中国电子科技集团公司第三十八研究所 | 基于cnn-ga-bp的组合模型备件需求预测方法和系统 |
CN116415929A (zh) * | 2023-03-07 | 2023-07-11 | 鞍钢集团工程技术有限公司 | 一种基于多层gru网络的鱼雷罐车预测性维护方法 |
CN116415929B (zh) * | 2023-03-07 | 2023-11-14 | 鞍钢集团工程技术有限公司 | 一种基于多层gru网络的鱼雷罐车预测性维护方法 |
CN116070791A (zh) * | 2023-03-27 | 2023-05-05 | 天津布尔科技有限公司 | 一种基于LSTM算法的柴油车NOx排放预测方法 |
CN116662766A (zh) * | 2023-08-01 | 2023-08-29 | 浙江大学 | 基于数据二维重构的风速预测方法及装置、电子设备 |
CN116662766B (zh) * | 2023-08-01 | 2023-10-03 | 浙江大学 | 基于数据二维重构的风速预测方法及装置、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109659933B (zh) | 一种基于深度学习模型的含分布式电源配电网电能质量预测方法 | |
CN114707712A (zh) | 一种发电机组备件需求的预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN108197432B (zh) | 一种基于基因表达数据的基因调控网络重构方法 | |
CN110119854A (zh) | 基于代价敏感lstm循环神经网络的稳压器水位预测方法 | |
CN109948833A (zh) | 一种基于长短期记忆网络的水电机组劣化趋势预测方法 | |
CN111784061B (zh) | 一种电网工程造价预测模型的训练方法、装置和设备 | |
CN112884236B (zh) | 一种基于vdm分解与lstm改进的短期负荷预测方法及系统 | |
CN114091615B (zh) | 一种基于生成对抗网络的电能计量数据补全方法和系统 | |
CN114692507A (zh) | 基于堆叠泊松自编码器网络的计数数据软测量建模方法 | |
CN113743016A (zh) | 基于改进的堆叠式稀疏自编码器和注意力回声状态网络的涡扇发动机剩余使用寿命预测方法 | |
CN112365033B (zh) | 一种风电功率区间预测方法、系统及存储介质 | |
CN115860212A (zh) | 一种配电网的风险预测方法与终端 | |
CN115982141A (zh) | 一种针对时序数据预测的特征优化方法 | |
CN114638421A (zh) | 一种发电机组备件需求的预测方法 | |
CN112685900B (zh) | 一种表征冲击负荷功率特性的电力负荷模拟方法 | |
CN113902206A (zh) | 一种基于VMD-BiGRU的短期负荷预测方法 | |
CN112232570A (zh) | 一种正向有功总电量预测方法、装置及可读存储介质 | |
CN117076887A (zh) | 一种泵站机组运行状态预测和健康评估方法及系统 | |
CN114298413B (zh) | 一种水电机组振摆趋势预测方法 | |
CN111061708A (zh) | 一种基于lstm神经网络的电能量预测与修复方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN115619563A (zh) | 一种基于神经网络的股票价格分析方法 | |
CN112581311B (zh) | 一种多风电场聚合后出力长期波动特性预测方法及系统 | |
CN113962431A (zh) | 一种两阶段特征处理的母线负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |