CN111950697A - 一种基于门控循环单元网络的水泥成品比表面积预测方法 - Google Patents

一种基于门控循环单元网络的水泥成品比表面积预测方法 Download PDF

Info

Publication number
CN111950697A
CN111950697A CN202010627073.9A CN202010627073A CN111950697A CN 111950697 A CN111950697 A CN 111950697A CN 202010627073 A CN202010627073 A CN 202010627073A CN 111950697 A CN111950697 A CN 111950697A
Authority
CN
China
Prior art keywords
gate
output
time
surface area
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010627073.9A
Other languages
English (en)
Inventor
孙超
张宇轩
李泽
郝晓辰
王君微
赵彦涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yanshan University
Original Assignee
Yanshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yanshan University filed Critical Yanshan University
Priority to CN202010627073.9A priority Critical patent/CN111950697A/zh
Publication of CN111950697A publication Critical patent/CN111950697A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于门控循环单元网络的水泥成品比表面积预测方法,属于水泥成品质量预测技术领域,包括以下步聚:(1)从水泥粉磨系统的数据库中选取与比表面积相关的8个输入变量,按照时间序列排列;(2)采用基于时间的反向传播技术求取神经网络各节点的误差项;(3)采用自适应矩估计算法进行神经网络权值的更新,反复训练得到最小误差,获取最优模型参数集;(4)计算得到比表面积的预测结果。本发明既解决了水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又解决了变量数据与水泥成品比表面积指标之间存在的时变实延问题,有利于指导水泥磨系统生产调度,将水泥成品比表面积控制在合适的范围内,提高水泥成品性能。

Description

一种基于门控循环单元网络的水泥成品比表面积预测方法
技术领域
本发明涉及水泥磨水泥成品质量指标-比表面积预测技术领域,尤其是一种基于门控循环单元网络的水泥成品比表面积预测方法,用于水泥磨研磨过程水泥成品比表面积在线预测。
背景技术
水泥工业是我国经济发展、生产建设和人民生活不可或缺的原材料工业,水泥的性能会直接影响到混凝土的性能,而水泥的性能又和水泥的比表面积密切相关。水泥的比表面积就是单位质量的水泥具有的表面积,比表面积可作为评价水泥细度的指标,水泥磨的细,比表面积越大,反之,比表面积越小。通常情况下,如果比表面积过大,将导致水泥的水化速度过快、放热快且集中、混凝土收缩显著提高,将会导致混凝土早期开裂等质量问题。而比表面积太小,水泥颗粒太粗,也会影响到混凝土的质量。因此,比表面积作为评价水泥品质的重要指标应保持在合适的范围内,而实现比表面积的在线预测对于提高混凝土质量具有重要意义。但在水泥成品的比表面积预测方面,由于水泥磨工业流程本身具有时滞和随机性等特点,难以用传统的线性模型来进行预测。
针对上述问题,王贵生等人采用一元线性回归法建立了45μm水泥细度和水泥比表面积的回归方程,水泥细度利用负压筛析仪进行检测,将水泥细度数据带入回归方程中即可求得相应的比表面积。但这种方法仅根据单一指标进行预测,说服力不强,而且没有考虑到水泥磨复杂工况下的变量耦合、时变时延等问题,该方法进行比表面积的预测会产生较大的误差。
发明内容
本发明需要解决的技术问题是提供一种基于门控循环单元网络的水泥成品比表面积预测方法,既能够解决水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又能够解决变量数据与水泥成品比表面积指标之间存在的时变时延问题。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于门控循环单元网络的水泥成品比表面积预测方法,包括以下步骤:
步骤1:分析水泥磨工艺流程选取与比表面积相关的8个输入变量,首先将选择的变量数据按照时间序列排列,其次将数据按照GRU的输入格式进行处理,再将数据进行归一化作为GRU的输入数据;
步骤2:将归一化后的训练数据输入到GRU模型中进行训练,输入数据进入到隐层,通过GRU网络结构中的更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,通过重置门来决定有多少之前时刻的信息需要进行遗忘,最后将单元状态和输出合并为一个最终状态,从而更新当前序列索引的预测输出,完成门控循环单元网络的前向传播;
步骤3:采用基于时间的反向传播算法计算每个神经元的误差项;从输入数据及权重开始,向着输出层传递,最后求出预测值并和目标值构成代价函数;在反向传播的过程中,以代价函数开始,从输入到输出,求各个节点的偏导数,然后利用自适应矩估计算法更新权重参数和偏置参数,重复反向传播过程,直到代价函数的误差满足要求或者到达指定的迭代次数为止;经过上述过程的反复训练,即可实现误差的最小化;
步骤4:将处理后的水泥磨研磨过程中的过程变量数据输入到步骤3中训练好的门控循环单元网络模型,实现水泥磨研磨过程水泥成品比表面积的在线预测。
本发明技术方案的进一步改进在于:步骤1中,与比表面积相关的8个输入变量为喂料量反馈、A磨主机电流、2402开度反馈、A磨循环风机变频反馈、A磨出磨斗提电流反馈、选粉机电流反馈、选粉机转速反馈、8406挡板反馈。
本发明技术方案的进一步改进在于:步骤1中,将输入数据按照GRU网络的输入格式进行重构,并将数据进行归一化;归一化使用Min-Max归一化,公式如下:
Figure BDA0002565202810000031
其中,x1,x2,...,xn为输入序列,y1,y2,...,yn为归一化后的输出序列。
本发明技术方案的进一步改进在于:步骤2中,门控循环单元网络的前向传播具体的计算过程如下:
GRU需要学习的参数共3组,分别是:更新门的权重矩阵Wz、重置门权重矩阵Wr以及计算单元状态的权重矩阵Wh;随机初始化这些权值并开始前向传播:
①更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,更新门的计算:
zt=σ(Wz·[ht-1,xt]+bz) (1)
上式中,Wz是更新门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
②重置门来决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,重置门的计算:
rt=σ(Wr·[ht-1,xt]+br) (2)
上式中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量;σ是sigmoid激活函数,br为重置门偏置项;
③当前输入的单元状态计算:
Figure BDA0002565202810000041
上式中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,Xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
④隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
Figure BDA0002565202810000051
上式中,h为当前时刻隐含层输出,zt为更新门的输出,ht-1为前一时刻隐含层状态,
Figure BDA0002565202810000052
为候选单元状态;
⑤更新索引序列预测输出:
Figure BDA0002565202810000053
上式中,
Figure BDA0002565202810000054
为当前时刻t的预测输出,σ是sigmoid激活函数,W为预测输出层权重矩阵,b为预测输出层偏置项;
式(1)到式(5)完成GRU模型的前向传播。
本发明技术方案的进一步改进在于:步骤3中,具体的计算过程如下:
采用基于时间的反向传播法,反向计算每个神经元的误差项,一方面,误差项沿时间反向传播,从当前时刻开始,计算之前每个时刻的误差项,另一方面是将误差项向上一层传播;根据相应的误差项,计算每个权重的梯度,更新权重;为了计算方便,将权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx
①误差项的传播分为两部分,a.沿时序反向传播;b.向上一层传播;定义损失函数:
Figure BDA0002565202810000055
上式中,
Figure BDA0002565202810000056
和yt分别为t时刻的预测输出和期望输出;
在t时刻,GRU隐含层输出为ht,定义t时刻的误差项δt为:
Figure BDA0002565202810000057
根据GRU的计算图和链式求导法则可知,候选状态信息
Figure BDA0002565202810000069
的梯度为:
Figure BDA0002565202810000061
上式中,L为损失函数,zt为更新门的输出;
更新门梯度为:
Figure BDA0002565202810000062
重置门梯度为:
Figure BDA0002565202810000063
上式中,rt是重置门的输出,ht-1为前一时刻隐含层状态;
a.则误差项沿时序反向传播的公式为:
Figure BDA0002565202810000064
b.误差项向上层传播:
设当前层为l层,定义l-1层的误差项是误差函数对l-1层加权输入的导数,则有
Figure BDA0002565202810000065
上式中,
Figure BDA0002565202810000066
为l-1层的误差项,L为误差函数,
Figure BDA0002565202810000067
为l-1层的加权输入;
本次GRU的输入xt由下面的公式得出:
Figure BDA0002565202810000068
Figure DA00025652028150502
上式中,fl-1表示第l-1层的激活函数;
由全导公式递推可知:
Figure BDA0002565202810000072
上式中,
Figure BDA0002565202810000073
为t时刻l-1层更新门、重置门、输出门的误差项;
②权重梯度的计算
由①可知Wrh、Wzh、Whh各时刻的权重梯度为:
Figure BDA0002565202810000074
Figure BDA0002565202810000075
Figure BDA0002565202810000076
Wrx、Wzx、Whx的权重梯度:
Figure BDA0002565202810000077
Figure BDA0002565202810000078
Figure BDA0002565202810000079
与权重对应的偏置br,bz,bh梯度为:
Figure BDA00025652028100000710
Figure BDA0002565202810000081
Figure BDA0002565202810000082
从①~②,我们求出了在t之前的所有时刻损失函数相对于各参数的梯度,下面进行权重的更新;
③权重的更新,η为模型的学习率,为了增加公式的适用性,对公式
进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
Figure BDA0002565202810000083
Figure BDA0002565202810000084
至此,完成一次前向和反向传播,循环迭代地更新各个部分,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,知道误差小于设定阈值或达到最大训练次数,退出循环,完成训练。
由于采用了上述技术方案,本发明取得的技术进步是:
1、本发明建立的水泥磨研磨过程水泥成品质量指标-比表面积预测模型,将各变量按照时间序列排列作为输入层,对应于某一时刻的水泥成品比表面积,构建门控循环单元网络模型,消除了变量的时变时延特性对比表面积预测的影响。
2、本发明建立的基于长短时记忆网络的水泥磨研磨过程水泥成品质量指标-比表面积预测模型,充分利用变量数据和预测指标的时序特性,不但具有循环神经网络(RNN)模型的记忆功能,并且能够克服RNN存在的梯度爆炸和梯度消失问题,能选择性的遗忘无效信息并更新记忆有效信息,能在一定程度上解决长期以来本领域存在的技术问题。
3、本发明在模型的反向传播中,采用自适应矩估计算法,通过误差项的反向传播求得权重梯度,从而更新权重和偏置,模型精度和训练效率都很高。
4、本发明既能够解决了水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又能够解决变量数据与水泥成品比表面积指标之间存在的时变实延问题,有利于指导水泥磨系统生产调度,将水泥成品比表面积控制在合适的范围内,提高水泥成品性能。
附图说明
图1是本发明在线预测模型流程图;
图2是本发明在线预测模型的结构图;
图3是门控循环单元网络隐含层结构图。
具体实施方式
本发明是针对水泥磨工业流程本身具有时滞性和随机性,难以用传统的线性模型来进行预测等特点,目前本技术领域现有的研究方法难以解决水泥磨复杂工况下的变量耦合、时变时延等问题而研发的一种基于门控循环单元网络的水泥成品比表面积预测方法。
“循环神经网络”英文为recurrent neural networks,缩写为CNN;
“门控循环单元网络”英文为Gated Recurrent Unit,缩写为GRU;
“反向传播算法”英文为back-propagation through time,缩写为BPTT;
“自适应矩估计算法”英文为Adaptive Moment Estimation,缩写为Adam。
下面结合附图对本发明做进一步详细说明:
如图1、2、3所示,一种基于门控循环单元网络的水泥成品比表面积预测方法,包括以下步骤:
步骤1:分析水泥磨工艺流程选取与比表面积相关的8个输入变量,首先将选择的变量数据按照时间序列排列,其次将数据按照GRU的输入格式进行处理,再将数据进行归一化作为GRU的输入数据;
首先分析整个水泥磨的生产工艺,结合现场工程师的经验知识以及水泥比表面积的测量工艺,选取了8种与水泥成品比表面积相关的过程参量作为GRU模型的输入变量,如图2中输入层所示,8输入变量分别为喂料量反馈P1、A磨主机电流P2、2402开度反馈P3、A磨循环风机变频反馈P4、A磨出磨斗提电流反馈P5、选粉机电流反馈P6、选粉机转速反馈P7、8406挡板反馈P8。充分考虑水泥生产过程的时延和时长,将一段时间的输入变量对应某一时刻的比表面积指标的输出,并从水泥磨研磨系统数据库中导出相关输入输出变量数据。由于所选取的变量有些波动较大,为了提高模型收敛速度以及减少数据特征的损失,对数据进行归一化处理。
将输入数据按照GRU网络的输入格式进行重构,并将数据进行归一化;归一化使用Min-Max归一化,公式如下:
Figure BDA0002565202810000111
其中,x1,x2,...,xn为输入序列,y1,y2,...,yn为归一化后的输出序列。
步骤2:将归一化后的训练数据输入到GRU模型中进行训练,输入数据进入到隐层,通过GRU网络结构中的更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,通过重置门来决定有多少之前时刻的信息需要进行遗忘,最后将单元状态和输出合并为一个最终状态,从而更新当前序列索引的预测输出,完成门控循环单元网络的前向传播;
归一化后的训练数据作为输入层输入到GRU神经网络,进行样本数据训练。
如图3所示,GRU需要学习的参数共3组,分别是:更新门的权重矩阵Wz、重置门权重矩阵Wr以及计算单元状态的权重矩阵Wh;随机初始化这些权值并开始前向传播:
①更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,更新门的计算:
zt=σ(Wz·[ht-1,xt]+bz) (1)
上式中,Wz是更新门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
②重置门来决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,重置门的计算:
rt=σ(Wr·[ht-1,xt]+br) (2)
上式中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量;σ是sigmoid激活函数,br为重置门偏置项;
③当前输入的单元状态计算:
Figure BDA0002565202810000121
上式中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,Xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
④隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
Figure BDA0002565202810000122
上式中,h为当前时刻隐含层输出,zt为更新门的输出,ht-1为前一时刻隐含层状态,
Figure BDA0002565202810000123
为候选单元状态;
⑤更新索引序列预测输出:
Figure BDA0002565202810000124
上式中,
Figure BDA0002565202810000125
为当前时刻t的预测输出,σ是sigmoid激活函数,W为预测输出层权重矩阵,b为预测输出层偏置项;
式(1)到式(5)完成GRU模型的前向传播。
步骤3:采用基于时间的反向传播算法计算每个神经元的误差项;从输入数据及权重开始,向着输出层传递,最后求出预测值并和目标值构成代价函数;在反向传播的过程中,以代价函数开始,从输入到输出,求各个节点的偏导数,然后利用自适应矩估计算法更新权重参数和偏置参数,重复反向传播过程,直到代价函数的误差满足要求或者到达指定的迭代次数为止;经过上述过程的反复训练,即可实现误差的最小化;
具体的计算过程如下:
采用基于时间的反向传播法,反向计算每个神经元的误差项,一方面,误差项沿时间反向传播,从当前时刻开始,计算之前每个时刻的误差项,另一方面是将误差项向上一层传播;根据相应的误差项,计算每个权重的梯度,更新权重;为了计算方便,将权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx
①误差项的传播分为两部分,a.沿时序反向传播;b.向上一层传播;定义损失函数:
Figure BDA0002565202810000131
上式中,
Figure BDA0002565202810000132
和yt分别为t时刻的预测输出和期望输出;
在t时刻,GRU隐含层输出为ht,定义t时刻的误差项δt为:
Figure BDA0002565202810000133
根据GRU的计算图和链式求导法则可知,候选状态信息
Figure BDA0002565202810000149
的梯度为:
Figure BDA0002565202810000141
上式中,L为损失函数,zt为更新门的输出;
更新门梯度为:
Figure BDA0002565202810000142
重置门梯度为:
Figure BDA0002565202810000143
上式中,rt是重置门的输出,ht-1为前一时刻隐含层状态;
a.则误差项沿时序反向传播的公式为:
Figure BDA0002565202810000144
b.误差项向上层传播:
设当前层为l层,定义l-1层的误差项是误差函数对l-1层加权输入的导数,则有
Figure BDA0002565202810000145
上式中,
Figure BDA0002565202810000146
为l-1层的误差项,L为误差函数,
Figure BDA0002565202810000147
为l-1层的加权输入;
本次GRU的输入xt由下面的公式得出:
Figure BDA0002565202810000148
Figure DA00025652028150536
上式中,fl-1表示第l-1层的激活函数;
由全导公式递推可知:
Figure BDA0002565202810000152
上式中,
Figure BDA0002565202810000153
为t时刻l-1层更新门、重置门、输出门的误差项;
②权重梯度的计算
由①可知Wrh、Wzh、Whh各时刻的权重梯度为:
Figure BDA0002565202810000154
Figure BDA0002565202810000155
Figure BDA0002565202810000156
Wrx、Wzx、Whx的权重梯度:
Figure BDA0002565202810000157
Figure BDA0002565202810000158
Figure BDA0002565202810000159
与权重对应的偏置br,bz,bh梯度为:
Figure BDA00025652028100001510
Figure BDA0002565202810000161
Figure BDA0002565202810000162
从①~②,我们求出了在t之前的所有时刻损失函数相对于各参数的梯度,下面进行权重的更新;
③权重的更新,η为模型的学习率,为了增加公式的适用性,对公式
进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
Figure BDA0002565202810000163
Figure BDA0002565202810000164
至此,完成一次前向和反向传播,循环迭代地更新各个部分,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,知道误差小于设定阈值或达到最大训练次数,退出循环,完成训练。
步骤4:将处理后的水泥磨研磨过程中的过程变量数据输入到步骤3中训练好的门控循环单元网络模型,实现水泥磨研磨过程水泥成品比表面积的在线预测。
在本方法中,从水泥企业生产数据库中提取3000组数据,并按所述方法进行数据处理和模型训练。选取其中2400组作为训练数据,其余600组作为预测数据以验证模型有效性。其中训练过程均方根误差为0.0684031,平均绝对误差为0.0481364,平均相对误差为0.135366;测试过程均方根误差0.0713091,平均绝对误差为0.0537601,平均相对误差为0.149327。
综上所述,本发明首先从水泥粉磨系统的数据库中选取与比表面积相关的8个输入变量,按照时间序列排列,采用基于时间的反向传播技术求取神经网络各节点的误差项,采用自适应矩估计算法进行神经网络权值的更新,反复训练得到最小误差,获取最优模型参数集;既能够解决水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又能够解决变量数据与水泥成品比表面积指标之间存在的时变时延问题。

Claims (5)

1.一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:包括以下步骤:
步骤1:分析水泥磨工艺流程选取与比表面积相关的8个输入变量,首先将选择的变量数据按照时间序列排列,其次将数据按照GRU的输入格式进行处理,再将数据进行归一化作为GRU的输入数据;
步骤2:将归一化后的训练数据输入到GRU模型中进行训练,输入数据进入到隐层,通过GRU网络结构中的更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,通过重置门来决定有多少之前时刻的信息需要进行遗忘,最后将单元状态和输出合并为一个最终状态,从而更新当前序列索引的预测输出,完成门控循环单元网络的前向传播;
步骤3:采用基于时间的反向传播算法计算每个神经元的误差项;从输入数据及权重开始,向着输出层传递,最后求出预测值并和目标值构成代价函数;在反向传播的过程中,以代价函数开始,从输入到输出,求各个节点的偏导数,然后利用自适应矩估计算法更新权重参数和偏置参数,重复反向传播过程,直到代价函数的误差满足要求或者到达指定的迭代次数为止;经过上述过程的反复训练,即可实现误差的最小化;
步骤4:将处理后的水泥磨研磨过程中的过程变量数据输入到步骤3中训练好的门控循环单元网络模型,实现水泥磨研磨过程水泥成品比表面积的在线预测。
2.根据权利要求1所述的一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:步骤1中,与比表面积相关的8个输入变量为喂料量反馈、A磨主机电流、2402开度反馈、A磨循环风机变频反馈、A磨出磨斗提电流反馈、选粉机电流反馈、选粉机转速反馈、8406挡板反馈。
3.根据权利要求1所述的一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:步骤1中,将输入数据按照GRU网络的输入格式进行重构,并将数据进行归一化;归一化使用Min-Max归一化,公式如下:
Figure FDA0002565202800000021
其中,x1,x2,...,xn为输入序列,y1,y2,...,yn为归一化后的输出序列。
4.根据权利要求1所述的一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:步骤2中,门控循环单元网络的前向传播具体的计算过程如下:
GRU需要学习的参数共3组,分别是:更新门的权重矩阵Wz、重置门权重矩阵Wr以及计算单元状态的权重矩阵Wh;随机初始化这些权值并开始前向传播:
①更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,更新门的计算:
zt=σ(Wz·[ht-1,xt]+bz) (1)
上式中,Wz是更新门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
②重置门来决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,重置门的计算:
rt=σ(Wr·[ht-1,xt]+br) (2)
上式中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量;σ是sigmoid激活函数,br为重置门偏置项;
③当前输入的单元状态计算:
Figure FDA0002565202800000031
上式中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,Xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
④隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
Figure FDA0002565202800000032
上式中,h为当前时刻隐含层输出,zt为更新门的输出,ht-1为前一时刻隐含层状态,
Figure FDA0002565202800000033
为候选单元状态;
⑤更新索引序列预测输出:
Figure FDA0002565202800000034
上式中,
Figure FDA0002565202800000035
为当前时刻t的预测输出,σ是sigmoid激活函数,W为预测输出层权重矩阵,b为预测输出层偏置项;
式(1)到式(5)完成GRU模型的前向传播。
5.根据权利要求1所述的一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:步骤3中,具体的计算过程如下:
采用基于时间的反向传播法,反向计算每个神经元的误差项,一方面,误差项沿时间反向传播,从当前时刻开始,计算之前每个时刻的误差项,另一方面是将误差项向上一层传播;根据相应的误差项,计算每个权重的梯度,更新权重;为了计算方便,将权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx
①误差项的传播分为两部分,a.沿时序反向传播;b.向上一层传播;定义损失函数:
Figure FDA0002565202800000041
上式中,
Figure FDA0002565202800000042
和yt分别为t时刻的预测输出和期望输出;
在t时刻,GRU隐含层输出为ht,定义t时刻的误差项δt为:
Figure FDA0002565202800000043
根据GRU的计算图和链式求导法则可知,候选状态信息
Figure FDA0002565202800000044
的梯度为:
Figure FDA0002565202800000045
上式中,L为损失函数,zt为更新门的输出;
更新门梯度为:
Figure FDA0002565202800000046
重置门梯度为:
Figure FDA0002565202800000047
上式中,rt是重置门的输出,ht-1为前一时刻隐含层状态;
a.则误差项沿时序反向传播的公式为:
Figure FDA0002565202800000048
b.误差项向上层传播:
设当前层为l层,定义l-1层的误差项是误差函数对l-1层加权输入的导数,则有
Figure FDA0002565202800000051
上式中,
Figure FDA0002565202800000052
为l-1层的误差项,L为误差函数,
Figure FDA0002565202800000053
为l-1层的加权输入;
本次GRU的输入xt由下面的公式得出:
Figure FDA0002565202800000054
上式中,fl-1表示第l-1层的激活函数;
由全导公式递推可知:
Figure FDA0002565202800000055
上式中,
Figure FDA0002565202800000056
为t时刻l-1层更新门、重置门、输出门的误差项;
②权重梯度的计算
由①可知Wrh、Wzh、Whh各时刻的权重梯度为:
Figure FDA0002565202800000057
Figure FDA0002565202800000058
Figure FDA0002565202800000059
Wrx、Wzx、Whx的权重梯度:
Figure FDA00025652028000000510
Figure FDA00025652028000000511
Figure FDA00025652028000000512
与权重对应的偏置br,bz,bh梯度为:
Figure FDA0002565202800000061
Figure FDA0002565202800000062
Figure FDA0002565202800000063
从①~②,我们求出了在t之前的所有时刻损失函数相对于各参数的梯度,下面进行权重的更新;
③权重的更新,η为模型的学习率,为了增加公式的适用性,对公式进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
Figure FDA0002565202800000064
Figure FDA0002565202800000065
至此,完成一次前向和反向传播,循环迭代地更新各个部分,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,知道误差小于设定阈值或达到最大训练次数,退出循环,完成训练。
CN202010627073.9A 2020-07-01 2020-07-01 一种基于门控循环单元网络的水泥成品比表面积预测方法 Pending CN111950697A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010627073.9A CN111950697A (zh) 2020-07-01 2020-07-01 一种基于门控循环单元网络的水泥成品比表面积预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010627073.9A CN111950697A (zh) 2020-07-01 2020-07-01 一种基于门控循环单元网络的水泥成品比表面积预测方法

Publications (1)

Publication Number Publication Date
CN111950697A true CN111950697A (zh) 2020-11-17

Family

ID=73336947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010627073.9A Pending CN111950697A (zh) 2020-07-01 2020-07-01 一种基于门控循环单元网络的水泥成品比表面积预测方法

Country Status (1)

Country Link
CN (1) CN111950697A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113591384A (zh) * 2021-08-02 2021-11-02 燕山大学 一种基于门控卷积网络的水泥成品比表面积预测方法
CN113591374A (zh) * 2021-07-14 2021-11-02 燕山大学 基于卷积简单循环单元网络的水泥成品比表面积预测方法
CN113609772A (zh) * 2021-08-06 2021-11-05 燕山大学 基于卷积准循环神经网络的水泥成品比表面积预测方法
CN113627658A (zh) * 2021-07-23 2021-11-09 西安理工大学 基于广义互相关熵门控循环单元的短期售电量预测方法
CN114091339A (zh) * 2021-11-24 2022-02-25 江苏科技大学 一种基于gru的耙吸挖泥船艏吹瞬时产量预测方法
CN114384218A (zh) * 2021-12-06 2022-04-22 哈尔滨工业大学(深圳) 一种重金属浓度预测方法及装置
CN115116212A (zh) * 2022-05-06 2022-09-27 浙江科技学院 一种道路网络的交通预测方法、计算机设备、存储介质和程序产品

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180247199A1 (en) * 2017-02-24 2018-08-30 Qualcomm Incorporated Method and apparatus for multi-dimensional sequence prediction
CN108846199A (zh) * 2018-06-12 2018-11-20 华能澜沧江水电股份有限公司 基于时空一体化的特高拱坝变形时空序列预测方法
CN109325624A (zh) * 2018-09-28 2019-02-12 国网福建省电力有限公司 一种基于深度学习的月度电力需求预测方法
CN109492814A (zh) * 2018-11-15 2019-03-19 中国科学院深圳先进技术研究院 一种城市交通流量预测方法、系统及电子设备
CN109799533A (zh) * 2018-12-28 2019-05-24 中国石油化工股份有限公司 一种基于双向循环神经网络的储层预测方法
CN109801621A (zh) * 2019-03-15 2019-05-24 三峡大学 一种基于残差门控循环单元的语音识别方法
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
CN110322014A (zh) * 2019-07-10 2019-10-11 燕山大学 一种基于bp神经网络的水泥成品比表面积预测方法
CN110400007A (zh) * 2019-07-05 2019-11-01 浙江大学 基于改进门控循环神经网络的铁水质量预报方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180247199A1 (en) * 2017-02-24 2018-08-30 Qualcomm Incorporated Method and apparatus for multi-dimensional sequence prediction
CN108846199A (zh) * 2018-06-12 2018-11-20 华能澜沧江水电股份有限公司 基于时空一体化的特高拱坝变形时空序列预测方法
CN109325624A (zh) * 2018-09-28 2019-02-12 国网福建省电力有限公司 一种基于深度学习的月度电力需求预测方法
CN109492814A (zh) * 2018-11-15 2019-03-19 中国科学院深圳先进技术研究院 一种城市交通流量预测方法、系统及电子设备
CN109799533A (zh) * 2018-12-28 2019-05-24 中国石油化工股份有限公司 一种基于双向循环神经网络的储层预测方法
CN109816095A (zh) * 2019-01-14 2019-05-28 湖南大学 基于改进门控循环神经网络的网络流量预测方法
CN109801621A (zh) * 2019-03-15 2019-05-24 三峡大学 一种基于残差门控循环单元的语音识别方法
CN110400007A (zh) * 2019-07-05 2019-11-01 浙江大学 基于改进门控循环神经网络的铁水质量预报方法
CN110322014A (zh) * 2019-07-10 2019-10-11 燕山大学 一种基于bp神经网络的水泥成品比表面积预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JICHANG TU,XUEQIN YANG,CHAOBO CHEN,ET AL.: "《Water Quality Prediction Model Based on GRU hybrid network》", 《2019 CHINESE AUTOMATION CONGRESS (CAC)》 *
刘树春,贺盼,马建奇著, 机械工业出版社 *
章盼: "《基于GRU的加密货币价格趋势预测》", 《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113591374A (zh) * 2021-07-14 2021-11-02 燕山大学 基于卷积简单循环单元网络的水泥成品比表面积预测方法
CN113591374B (zh) * 2021-07-14 2023-08-18 燕山大学 基于卷积简单循环单元网络的水泥成品比表面积预测方法
CN113627658A (zh) * 2021-07-23 2021-11-09 西安理工大学 基于广义互相关熵门控循环单元的短期售电量预测方法
CN113591384A (zh) * 2021-08-02 2021-11-02 燕山大学 一种基于门控卷积网络的水泥成品比表面积预测方法
CN113591384B (zh) * 2021-08-02 2023-08-18 燕山大学 一种基于门控卷积网络的水泥成品比表面积预测方法
CN113609772A (zh) * 2021-08-06 2021-11-05 燕山大学 基于卷积准循环神经网络的水泥成品比表面积预测方法
CN113609772B (zh) * 2021-08-06 2023-08-18 燕山大学 基于卷积准循环神经网络的水泥成品比表面积预测方法
CN114091339A (zh) * 2021-11-24 2022-02-25 江苏科技大学 一种基于gru的耙吸挖泥船艏吹瞬时产量预测方法
CN114384218A (zh) * 2021-12-06 2022-04-22 哈尔滨工业大学(深圳) 一种重金属浓度预测方法及装置
CN115116212A (zh) * 2022-05-06 2022-09-27 浙江科技学院 一种道路网络的交通预测方法、计算机设备、存储介质和程序产品

Similar Documents

Publication Publication Date Title
CN111950697A (zh) 一种基于门控循环单元网络的水泥成品比表面积预测方法
CN108621159B (zh) 一种基于深度学习的机器人动力学建模方法
CN108932567B (zh) 一种基于卷积神经网络的水泥烧成过程多能耗指标预测方法
CN109685252B (zh) 基于循环神经网络和多任务学习模型的建筑能耗预测方法
CN109147878B (zh) 一种水泥熟料游离钙软测量方法
CN109472397B (zh) 基于粘度变化的聚合工艺参数调节方法
CN113591374B (zh) 基于卷积简单循环单元网络的水泥成品比表面积预测方法
Li et al. Dynamic time features expanding and extracting method for prediction model of sintering process quality index
Stepniewski et al. Pruning backpropagation neural networks using modern stochastic optimisation techniques
CN112818595A (zh) 一种火电厂蒸发区的数字孪生模型数据的修正方法及系统
CN109616161B (zh) 一种基于孪生支持向量回归机的发酵过程软测量方法
CN117034767A (zh) 一种基于kpca-gwo-gru的陶瓷辊道窑温度预测方法
CN112270442A (zh) 一种基于ivmd-acmpso-cslstm组合电力负荷预测方法
CN113191092A (zh) 一种基于正交增量随机配置网络的工业过程产品质量软测量方法
CN117012315A (zh) 一种优化rbf神经网络的混凝土强度预测方法
CN113780420B (zh) 基于gru-gcn的变压器油中溶解气体浓度预测方法
CN112001115A (zh) 一种半监督动态软测量网络的软测量建模方法
CN113204918B (zh) 水泥窑生产能耗的建模方法
Ji et al. Application of the improved the ELM algorithm for prediction of blast furnace gas utilization rate
CN113627594A (zh) 基于wgan的一维时序数据增广方法
CN111950698A (zh) 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法
Prakash et al. Speculation of compressive strength of concrete in real-time
CN113033695A (zh) 一种电子器件故障的预测方法
CN113609772B (zh) 基于卷积准循环神经网络的水泥成品比表面积预测方法
Liao et al. Modeling of reheating-furnace dynamics using neural network based on improved sequential-learning algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201117

RJ01 Rejection of invention patent application after publication