CN111950697A - 一种基于门控循环单元网络的水泥成品比表面积预测方法 - Google Patents
一种基于门控循环单元网络的水泥成品比表面积预测方法 Download PDFInfo
- Publication number
- CN111950697A CN111950697A CN202010627073.9A CN202010627073A CN111950697A CN 111950697 A CN111950697 A CN 111950697A CN 202010627073 A CN202010627073 A CN 202010627073A CN 111950697 A CN111950697 A CN 111950697A
- Authority
- CN
- China
- Prior art keywords
- gate
- output
- time
- surface area
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000004568 cement Substances 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 39
- 230000008569 process Effects 0.000 claims description 32
- 239000011159 matrix material Substances 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 20
- 230000004913 activation Effects 0.000 claims description 15
- 125000004432 carbon atom Chemical group C* 0.000 claims description 13
- 210000004027 cell Anatomy 0.000 claims description 13
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000000843 powder Substances 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 abstract description 8
- 238000004519 manufacturing process Methods 0.000 abstract description 8
- 230000008878 coupling Effects 0.000 abstract description 5
- 238000010168 coupling process Methods 0.000 abstract description 5
- 238000005859 coupling reaction Methods 0.000 abstract description 5
- 230000007246 mechanism Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 230000000644 propagated effect Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于门控循环单元网络的水泥成品比表面积预测方法,属于水泥成品质量预测技术领域,包括以下步聚:(1)从水泥粉磨系统的数据库中选取与比表面积相关的8个输入变量,按照时间序列排列;(2)采用基于时间的反向传播技术求取神经网络各节点的误差项;(3)采用自适应矩估计算法进行神经网络权值的更新,反复训练得到最小误差,获取最优模型参数集;(4)计算得到比表面积的预测结果。本发明既解决了水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又解决了变量数据与水泥成品比表面积指标之间存在的时变实延问题,有利于指导水泥磨系统生产调度,将水泥成品比表面积控制在合适的范围内,提高水泥成品性能。
Description
技术领域
本发明涉及水泥磨水泥成品质量指标-比表面积预测技术领域,尤其是一种基于门控循环单元网络的水泥成品比表面积预测方法,用于水泥磨研磨过程水泥成品比表面积在线预测。
背景技术
水泥工业是我国经济发展、生产建设和人民生活不可或缺的原材料工业,水泥的性能会直接影响到混凝土的性能,而水泥的性能又和水泥的比表面积密切相关。水泥的比表面积就是单位质量的水泥具有的表面积,比表面积可作为评价水泥细度的指标,水泥磨的细,比表面积越大,反之,比表面积越小。通常情况下,如果比表面积过大,将导致水泥的水化速度过快、放热快且集中、混凝土收缩显著提高,将会导致混凝土早期开裂等质量问题。而比表面积太小,水泥颗粒太粗,也会影响到混凝土的质量。因此,比表面积作为评价水泥品质的重要指标应保持在合适的范围内,而实现比表面积的在线预测对于提高混凝土质量具有重要意义。但在水泥成品的比表面积预测方面,由于水泥磨工业流程本身具有时滞和随机性等特点,难以用传统的线性模型来进行预测。
针对上述问题,王贵生等人采用一元线性回归法建立了45μm水泥细度和水泥比表面积的回归方程,水泥细度利用负压筛析仪进行检测,将水泥细度数据带入回归方程中即可求得相应的比表面积。但这种方法仅根据单一指标进行预测,说服力不强,而且没有考虑到水泥磨复杂工况下的变量耦合、时变时延等问题,该方法进行比表面积的预测会产生较大的误差。
发明内容
本发明需要解决的技术问题是提供一种基于门控循环单元网络的水泥成品比表面积预测方法,既能够解决水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又能够解决变量数据与水泥成品比表面积指标之间存在的时变时延问题。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于门控循环单元网络的水泥成品比表面积预测方法,包括以下步骤:
步骤1:分析水泥磨工艺流程选取与比表面积相关的8个输入变量,首先将选择的变量数据按照时间序列排列,其次将数据按照GRU的输入格式进行处理,再将数据进行归一化作为GRU的输入数据;
步骤2:将归一化后的训练数据输入到GRU模型中进行训练,输入数据进入到隐层,通过GRU网络结构中的更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,通过重置门来决定有多少之前时刻的信息需要进行遗忘,最后将单元状态和输出合并为一个最终状态,从而更新当前序列索引的预测输出,完成门控循环单元网络的前向传播;
步骤3:采用基于时间的反向传播算法计算每个神经元的误差项;从输入数据及权重开始,向着输出层传递,最后求出预测值并和目标值构成代价函数;在反向传播的过程中,以代价函数开始,从输入到输出,求各个节点的偏导数,然后利用自适应矩估计算法更新权重参数和偏置参数,重复反向传播过程,直到代价函数的误差满足要求或者到达指定的迭代次数为止;经过上述过程的反复训练,即可实现误差的最小化;
步骤4:将处理后的水泥磨研磨过程中的过程变量数据输入到步骤3中训练好的门控循环单元网络模型,实现水泥磨研磨过程水泥成品比表面积的在线预测。
本发明技术方案的进一步改进在于:步骤1中,与比表面积相关的8个输入变量为喂料量反馈、A磨主机电流、2402开度反馈、A磨循环风机变频反馈、A磨出磨斗提电流反馈、选粉机电流反馈、选粉机转速反馈、8406挡板反馈。
本发明技术方案的进一步改进在于:步骤1中,将输入数据按照GRU网络的输入格式进行重构,并将数据进行归一化;归一化使用Min-Max归一化,公式如下:
其中,x1,x2,...,xn为输入序列,y1,y2,...,yn为归一化后的输出序列。
本发明技术方案的进一步改进在于:步骤2中,门控循环单元网络的前向传播具体的计算过程如下:
GRU需要学习的参数共3组,分别是:更新门的权重矩阵Wz、重置门权重矩阵Wr以及计算单元状态的权重矩阵Wh;随机初始化这些权值并开始前向传播:
①更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,更新门的计算:
zt=σ(Wz·[ht-1,xt]+bz) (1)
上式中,Wz是更新门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
②重置门来决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,重置门的计算:
rt=σ(Wr·[ht-1,xt]+br) (2)
上式中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量;σ是sigmoid激活函数,br为重置门偏置项;
③当前输入的单元状态计算:
上式中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,Xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
④隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
⑤更新索引序列预测输出:
式(1)到式(5)完成GRU模型的前向传播。
本发明技术方案的进一步改进在于:步骤3中,具体的计算过程如下:
采用基于时间的反向传播法,反向计算每个神经元的误差项,一方面,误差项沿时间反向传播,从当前时刻开始,计算之前每个时刻的误差项,另一方面是将误差项向上一层传播;根据相应的误差项,计算每个权重的梯度,更新权重;为了计算方便,将权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx;
①误差项的传播分为两部分,a.沿时序反向传播;b.向上一层传播;定义损失函数:
在t时刻,GRU隐含层输出为ht,定义t时刻的误差项δt为:
上式中,L为损失函数,zt为更新门的输出;
更新门梯度为:
重置门梯度为:
上式中,rt是重置门的输出,ht-1为前一时刻隐含层状态;
a.则误差项沿时序反向传播的公式为:
b.误差项向上层传播:
设当前层为l层,定义l-1层的误差项是误差函数对l-1层加权输入的导数,则有
本次GRU的输入xt由下面的公式得出:
上式中,fl-1表示第l-1层的激活函数;
由全导公式递推可知:
②权重梯度的计算
由①可知Wrh、Wzh、Whh各时刻的权重梯度为:
Wrx、Wzx、Whx的权重梯度:
与权重对应的偏置br,bz,bh梯度为:
从①~②,我们求出了在t之前的所有时刻损失函数相对于各参数的梯度,下面进行权重的更新;
③权重的更新,η为模型的学习率,为了增加公式的适用性,对公式
进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
至此,完成一次前向和反向传播,循环迭代地更新各个部分,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,知道误差小于设定阈值或达到最大训练次数,退出循环,完成训练。
由于采用了上述技术方案,本发明取得的技术进步是:
1、本发明建立的水泥磨研磨过程水泥成品质量指标-比表面积预测模型,将各变量按照时间序列排列作为输入层,对应于某一时刻的水泥成品比表面积,构建门控循环单元网络模型,消除了变量的时变时延特性对比表面积预测的影响。
2、本发明建立的基于长短时记忆网络的水泥磨研磨过程水泥成品质量指标-比表面积预测模型,充分利用变量数据和预测指标的时序特性,不但具有循环神经网络(RNN)模型的记忆功能,并且能够克服RNN存在的梯度爆炸和梯度消失问题,能选择性的遗忘无效信息并更新记忆有效信息,能在一定程度上解决长期以来本领域存在的技术问题。
3、本发明在模型的反向传播中,采用自适应矩估计算法,通过误差项的反向传播求得权重梯度,从而更新权重和偏置,模型精度和训练效率都很高。
4、本发明既能够解决了水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又能够解决变量数据与水泥成品比表面积指标之间存在的时变实延问题,有利于指导水泥磨系统生产调度,将水泥成品比表面积控制在合适的范围内,提高水泥成品性能。
附图说明
图1是本发明在线预测模型流程图;
图2是本发明在线预测模型的结构图;
图3是门控循环单元网络隐含层结构图。
具体实施方式
本发明是针对水泥磨工业流程本身具有时滞性和随机性,难以用传统的线性模型来进行预测等特点,目前本技术领域现有的研究方法难以解决水泥磨复杂工况下的变量耦合、时变时延等问题而研发的一种基于门控循环单元网络的水泥成品比表面积预测方法。
“循环神经网络”英文为recurrent neural networks,缩写为CNN;
“门控循环单元网络”英文为Gated Recurrent Unit,缩写为GRU;
“反向传播算法”英文为back-propagation through time,缩写为BPTT;
“自适应矩估计算法”英文为Adaptive Moment Estimation,缩写为Adam。
下面结合附图对本发明做进一步详细说明:
如图1、2、3所示,一种基于门控循环单元网络的水泥成品比表面积预测方法,包括以下步骤:
步骤1:分析水泥磨工艺流程选取与比表面积相关的8个输入变量,首先将选择的变量数据按照时间序列排列,其次将数据按照GRU的输入格式进行处理,再将数据进行归一化作为GRU的输入数据;
首先分析整个水泥磨的生产工艺,结合现场工程师的经验知识以及水泥比表面积的测量工艺,选取了8种与水泥成品比表面积相关的过程参量作为GRU模型的输入变量,如图2中输入层所示,8输入变量分别为喂料量反馈P1、A磨主机电流P2、2402开度反馈P3、A磨循环风机变频反馈P4、A磨出磨斗提电流反馈P5、选粉机电流反馈P6、选粉机转速反馈P7、8406挡板反馈P8。充分考虑水泥生产过程的时延和时长,将一段时间的输入变量对应某一时刻的比表面积指标的输出,并从水泥磨研磨系统数据库中导出相关输入输出变量数据。由于所选取的变量有些波动较大,为了提高模型收敛速度以及减少数据特征的损失,对数据进行归一化处理。
将输入数据按照GRU网络的输入格式进行重构,并将数据进行归一化;归一化使用Min-Max归一化,公式如下:
其中,x1,x2,...,xn为输入序列,y1,y2,...,yn为归一化后的输出序列。
步骤2:将归一化后的训练数据输入到GRU模型中进行训练,输入数据进入到隐层,通过GRU网络结构中的更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,通过重置门来决定有多少之前时刻的信息需要进行遗忘,最后将单元状态和输出合并为一个最终状态,从而更新当前序列索引的预测输出,完成门控循环单元网络的前向传播;
归一化后的训练数据作为输入层输入到GRU神经网络,进行样本数据训练。
如图3所示,GRU需要学习的参数共3组,分别是:更新门的权重矩阵Wz、重置门权重矩阵Wr以及计算单元状态的权重矩阵Wh;随机初始化这些权值并开始前向传播:
①更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,更新门的计算:
zt=σ(Wz·[ht-1,xt]+bz) (1)
上式中,Wz是更新门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
②重置门来决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,重置门的计算:
rt=σ(Wr·[ht-1,xt]+br) (2)
上式中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量;σ是sigmoid激活函数,br为重置门偏置项;
③当前输入的单元状态计算:
上式中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,Xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
④隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
⑤更新索引序列预测输出:
式(1)到式(5)完成GRU模型的前向传播。
步骤3:采用基于时间的反向传播算法计算每个神经元的误差项;从输入数据及权重开始,向着输出层传递,最后求出预测值并和目标值构成代价函数;在反向传播的过程中,以代价函数开始,从输入到输出,求各个节点的偏导数,然后利用自适应矩估计算法更新权重参数和偏置参数,重复反向传播过程,直到代价函数的误差满足要求或者到达指定的迭代次数为止;经过上述过程的反复训练,即可实现误差的最小化;
具体的计算过程如下:
采用基于时间的反向传播法,反向计算每个神经元的误差项,一方面,误差项沿时间反向传播,从当前时刻开始,计算之前每个时刻的误差项,另一方面是将误差项向上一层传播;根据相应的误差项,计算每个权重的梯度,更新权重;为了计算方便,将权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx;
①误差项的传播分为两部分,a.沿时序反向传播;b.向上一层传播;定义损失函数:
在t时刻,GRU隐含层输出为ht,定义t时刻的误差项δt为:
上式中,L为损失函数,zt为更新门的输出;
更新门梯度为:
重置门梯度为:
上式中,rt是重置门的输出,ht-1为前一时刻隐含层状态;
a.则误差项沿时序反向传播的公式为:
b.误差项向上层传播:
设当前层为l层,定义l-1层的误差项是误差函数对l-1层加权输入的导数,则有
本次GRU的输入xt由下面的公式得出:
上式中,fl-1表示第l-1层的激活函数;
由全导公式递推可知:
②权重梯度的计算
由①可知Wrh、Wzh、Whh各时刻的权重梯度为:
Wrx、Wzx、Whx的权重梯度:
与权重对应的偏置br,bz,bh梯度为:
从①~②,我们求出了在t之前的所有时刻损失函数相对于各参数的梯度,下面进行权重的更新;
③权重的更新,η为模型的学习率,为了增加公式的适用性,对公式
进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
至此,完成一次前向和反向传播,循环迭代地更新各个部分,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,知道误差小于设定阈值或达到最大训练次数,退出循环,完成训练。
步骤4:将处理后的水泥磨研磨过程中的过程变量数据输入到步骤3中训练好的门控循环单元网络模型,实现水泥磨研磨过程水泥成品比表面积的在线预测。
在本方法中,从水泥企业生产数据库中提取3000组数据,并按所述方法进行数据处理和模型训练。选取其中2400组作为训练数据,其余600组作为预测数据以验证模型有效性。其中训练过程均方根误差为0.0684031,平均绝对误差为0.0481364,平均相对误差为0.135366;测试过程均方根误差0.0713091,平均绝对误差为0.0537601,平均相对误差为0.149327。
综上所述,本发明首先从水泥粉磨系统的数据库中选取与比表面积相关的8个输入变量,按照时间序列排列,采用基于时间的反向传播技术求取神经网络各节点的误差项,采用自适应矩估计算法进行神经网络权值的更新,反复训练得到最小误差,获取最优模型参数集;既能够解决水泥磨复杂工况多变量、强耦合,难以建立机理模型的特点,又能够解决变量数据与水泥成品比表面积指标之间存在的时变时延问题。
Claims (5)
1.一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:包括以下步骤:
步骤1:分析水泥磨工艺流程选取与比表面积相关的8个输入变量,首先将选择的变量数据按照时间序列排列,其次将数据按照GRU的输入格式进行处理,再将数据进行归一化作为GRU的输入数据;
步骤2:将归一化后的训练数据输入到GRU模型中进行训练,输入数据进入到隐层,通过GRU网络结构中的更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,通过重置门来决定有多少之前时刻的信息需要进行遗忘,最后将单元状态和输出合并为一个最终状态,从而更新当前序列索引的预测输出,完成门控循环单元网络的前向传播;
步骤3:采用基于时间的反向传播算法计算每个神经元的误差项;从输入数据及权重开始,向着输出层传递,最后求出预测值并和目标值构成代价函数;在反向传播的过程中,以代价函数开始,从输入到输出,求各个节点的偏导数,然后利用自适应矩估计算法更新权重参数和偏置参数,重复反向传播过程,直到代价函数的误差满足要求或者到达指定的迭代次数为止;经过上述过程的反复训练,即可实现误差的最小化;
步骤4:将处理后的水泥磨研磨过程中的过程变量数据输入到步骤3中训练好的门控循环单元网络模型,实现水泥磨研磨过程水泥成品比表面积的在线预测。
2.根据权利要求1所述的一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:步骤1中,与比表面积相关的8个输入变量为喂料量反馈、A磨主机电流、2402开度反馈、A磨循环风机变频反馈、A磨出磨斗提电流反馈、选粉机电流反馈、选粉机转速反馈、8406挡板反馈。
4.根据权利要求1所述的一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:步骤2中,门控循环单元网络的前向传播具体的计算过程如下:
GRU需要学习的参数共3组,分别是:更新门的权重矩阵Wz、重置门权重矩阵Wr以及计算单元状态的权重矩阵Wh;随机初始化这些权值并开始前向传播:
①更新门来决定前一时刻和当前时间步的信息有多少需要继续进行传递,更新门的输出由前一时刻隐藏状态输出和当前时刻输入共同决定,更新门的计算:
zt=σ(Wz·[ht-1,xt]+bz) (1)
上式中,Wz是更新门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量,σ是sigmoid激活函数,bz为更新门偏置项;
②重置门来决定有多少之前时刻的信息需要进行遗忘,重置门的输出同样由前一时刻隐藏状态输出和当前时刻输入共同决定,重置门的计算:
rt=σ(Wr·[ht-1,xt]+br) (2)
上式中,Wr是重置门的权重矩阵,[ht-1,Xt]表示将前一时刻隐含层状态ht-1和当前时刻输入Xt连接成一个更长的向量;σ是sigmoid激活函数,br为重置门偏置项;
③当前输入的单元状态计算:
上式中,Wh是单元状态的权重矩阵,rt是重置门的输出,ht-1为前一时刻隐含层状态,Xt为当前时刻的输入,tanh是双曲正切激活函数,bh为单元状态偏置项;
④隐含层最终输出由上一时刻的单元状态、当前时刻候选单元状态和更新门输出共同决定:
⑤更新索引序列预测输出:
式(1)到式(5)完成GRU模型的前向传播。
5.根据权利要求1所述的一种基于门控循环单元网络的水泥成品比表面积预测方法,其特征在于:步骤3中,具体的计算过程如下:
采用基于时间的反向传播法,反向计算每个神经元的误差项,一方面,误差项沿时间反向传播,从当前时刻开始,计算之前每个时刻的误差项,另一方面是将误差项向上一层传播;根据相应的误差项,计算每个权重的梯度,更新权重;为了计算方便,将权重矩阵Wr、Wz、Wh拆分成Wrh、Wrx、Wzh、Wzx、Whh、Whx;
①误差项的传播分为两部分,a.沿时序反向传播;b.向上一层传播;定义损失函数:
在t时刻,GRU隐含层输出为ht,定义t时刻的误差项δt为:
上式中,L为损失函数,zt为更新门的输出;
更新门梯度为:
重置门梯度为:
上式中,rt是重置门的输出,ht-1为前一时刻隐含层状态;
a.则误差项沿时序反向传播的公式为:
b.误差项向上层传播:
设当前层为l层,定义l-1层的误差项是误差函数对l-1层加权输入的导数,则有
本次GRU的输入xt由下面的公式得出:
上式中,fl-1表示第l-1层的激活函数;
由全导公式递推可知:
②权重梯度的计算
由①可知Wrh、Wzh、Whh各时刻的权重梯度为:
Wrx、Wzx、Whx的权重梯度:
与权重对应的偏置br,bz,bh梯度为:
从①~②,我们求出了在t之前的所有时刻损失函数相对于各参数的梯度,下面进行权重的更新;
③权重的更新,η为模型的学习率,为了增加公式的适用性,对公式进行泛化,W表示网络中四个节点的权重,L代表四个节点的偏置项;
至此,完成一次前向和反向传播,循环迭代地更新各个部分,每经过一个时间步,求得误差项,若误差项小于阈值,则进行权重矩阵W和偏置项b的更新,知道误差小于设定阈值或达到最大训练次数,退出循环,完成训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010627073.9A CN111950697A (zh) | 2020-07-01 | 2020-07-01 | 一种基于门控循环单元网络的水泥成品比表面积预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010627073.9A CN111950697A (zh) | 2020-07-01 | 2020-07-01 | 一种基于门控循环单元网络的水泥成品比表面积预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111950697A true CN111950697A (zh) | 2020-11-17 |
Family
ID=73336947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010627073.9A Pending CN111950697A (zh) | 2020-07-01 | 2020-07-01 | 一种基于门控循环单元网络的水泥成品比表面积预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950697A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591384A (zh) * | 2021-08-02 | 2021-11-02 | 燕山大学 | 一种基于门控卷积网络的水泥成品比表面积预测方法 |
CN113591374A (zh) * | 2021-07-14 | 2021-11-02 | 燕山大学 | 基于卷积简单循环单元网络的水泥成品比表面积预测方法 |
CN113609772A (zh) * | 2021-08-06 | 2021-11-05 | 燕山大学 | 基于卷积准循环神经网络的水泥成品比表面积预测方法 |
CN113627658A (zh) * | 2021-07-23 | 2021-11-09 | 西安理工大学 | 基于广义互相关熵门控循环单元的短期售电量预测方法 |
CN114091339A (zh) * | 2021-11-24 | 2022-02-25 | 江苏科技大学 | 一种基于gru的耙吸挖泥船艏吹瞬时产量预测方法 |
CN114384218A (zh) * | 2021-12-06 | 2022-04-22 | 哈尔滨工业大学(深圳) | 一种重金属浓度预测方法及装置 |
CN115116212A (zh) * | 2022-05-06 | 2022-09-27 | 浙江科技学院 | 一种道路网络的交通预测方法、计算机设备、存储介质和程序产品 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180247199A1 (en) * | 2017-02-24 | 2018-08-30 | Qualcomm Incorporated | Method and apparatus for multi-dimensional sequence prediction |
CN108846199A (zh) * | 2018-06-12 | 2018-11-20 | 华能澜沧江水电股份有限公司 | 基于时空一体化的特高拱坝变形时空序列预测方法 |
CN109325624A (zh) * | 2018-09-28 | 2019-02-12 | 国网福建省电力有限公司 | 一种基于深度学习的月度电力需求预测方法 |
CN109492814A (zh) * | 2018-11-15 | 2019-03-19 | 中国科学院深圳先进技术研究院 | 一种城市交通流量预测方法、系统及电子设备 |
CN109799533A (zh) * | 2018-12-28 | 2019-05-24 | 中国石油化工股份有限公司 | 一种基于双向循环神经网络的储层预测方法 |
CN109801621A (zh) * | 2019-03-15 | 2019-05-24 | 三峡大学 | 一种基于残差门控循环单元的语音识别方法 |
CN109816095A (zh) * | 2019-01-14 | 2019-05-28 | 湖南大学 | 基于改进门控循环神经网络的网络流量预测方法 |
CN110322014A (zh) * | 2019-07-10 | 2019-10-11 | 燕山大学 | 一种基于bp神经网络的水泥成品比表面积预测方法 |
CN110400007A (zh) * | 2019-07-05 | 2019-11-01 | 浙江大学 | 基于改进门控循环神经网络的铁水质量预报方法 |
-
2020
- 2020-07-01 CN CN202010627073.9A patent/CN111950697A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180247199A1 (en) * | 2017-02-24 | 2018-08-30 | Qualcomm Incorporated | Method and apparatus for multi-dimensional sequence prediction |
CN108846199A (zh) * | 2018-06-12 | 2018-11-20 | 华能澜沧江水电股份有限公司 | 基于时空一体化的特高拱坝变形时空序列预测方法 |
CN109325624A (zh) * | 2018-09-28 | 2019-02-12 | 国网福建省电力有限公司 | 一种基于深度学习的月度电力需求预测方法 |
CN109492814A (zh) * | 2018-11-15 | 2019-03-19 | 中国科学院深圳先进技术研究院 | 一种城市交通流量预测方法、系统及电子设备 |
CN109799533A (zh) * | 2018-12-28 | 2019-05-24 | 中国石油化工股份有限公司 | 一种基于双向循环神经网络的储层预测方法 |
CN109816095A (zh) * | 2019-01-14 | 2019-05-28 | 湖南大学 | 基于改进门控循环神经网络的网络流量预测方法 |
CN109801621A (zh) * | 2019-03-15 | 2019-05-24 | 三峡大学 | 一种基于残差门控循环单元的语音识别方法 |
CN110400007A (zh) * | 2019-07-05 | 2019-11-01 | 浙江大学 | 基于改进门控循环神经网络的铁水质量预报方法 |
CN110322014A (zh) * | 2019-07-10 | 2019-10-11 | 燕山大学 | 一种基于bp神经网络的水泥成品比表面积预测方法 |
Non-Patent Citations (3)
Title |
---|
JICHANG TU,XUEQIN YANG,CHAOBO CHEN,ET AL.: "《Water Quality Prediction Model Based on GRU hybrid network》", 《2019 CHINESE AUTOMATION CONGRESS (CAC)》 * |
刘树春,贺盼,马建奇著, 机械工业出版社 * |
章盼: "《基于GRU的加密货币价格趋势预测》", 《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591374A (zh) * | 2021-07-14 | 2021-11-02 | 燕山大学 | 基于卷积简单循环单元网络的水泥成品比表面积预测方法 |
CN113591374B (zh) * | 2021-07-14 | 2023-08-18 | 燕山大学 | 基于卷积简单循环单元网络的水泥成品比表面积预测方法 |
CN113627658A (zh) * | 2021-07-23 | 2021-11-09 | 西安理工大学 | 基于广义互相关熵门控循环单元的短期售电量预测方法 |
CN113591384A (zh) * | 2021-08-02 | 2021-11-02 | 燕山大学 | 一种基于门控卷积网络的水泥成品比表面积预测方法 |
CN113591384B (zh) * | 2021-08-02 | 2023-08-18 | 燕山大学 | 一种基于门控卷积网络的水泥成品比表面积预测方法 |
CN113609772A (zh) * | 2021-08-06 | 2021-11-05 | 燕山大学 | 基于卷积准循环神经网络的水泥成品比表面积预测方法 |
CN113609772B (zh) * | 2021-08-06 | 2023-08-18 | 燕山大学 | 基于卷积准循环神经网络的水泥成品比表面积预测方法 |
CN114091339A (zh) * | 2021-11-24 | 2022-02-25 | 江苏科技大学 | 一种基于gru的耙吸挖泥船艏吹瞬时产量预测方法 |
CN114384218A (zh) * | 2021-12-06 | 2022-04-22 | 哈尔滨工业大学(深圳) | 一种重金属浓度预测方法及装置 |
CN115116212A (zh) * | 2022-05-06 | 2022-09-27 | 浙江科技学院 | 一种道路网络的交通预测方法、计算机设备、存储介质和程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950697A (zh) | 一种基于门控循环单元网络的水泥成品比表面积预测方法 | |
CN108621159B (zh) | 一种基于深度学习的机器人动力学建模方法 | |
CN108932567B (zh) | 一种基于卷积神经网络的水泥烧成过程多能耗指标预测方法 | |
CN109685252B (zh) | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 | |
CN109147878B (zh) | 一种水泥熟料游离钙软测量方法 | |
CN109472397B (zh) | 基于粘度变化的聚合工艺参数调节方法 | |
CN113591374B (zh) | 基于卷积简单循环单元网络的水泥成品比表面积预测方法 | |
Li et al. | Dynamic time features expanding and extracting method for prediction model of sintering process quality index | |
Stepniewski et al. | Pruning backpropagation neural networks using modern stochastic optimisation techniques | |
CN112818595A (zh) | 一种火电厂蒸发区的数字孪生模型数据的修正方法及系统 | |
CN109616161B (zh) | 一种基于孪生支持向量回归机的发酵过程软测量方法 | |
CN117034767A (zh) | 一种基于kpca-gwo-gru的陶瓷辊道窑温度预测方法 | |
CN112270442A (zh) | 一种基于ivmd-acmpso-cslstm组合电力负荷预测方法 | |
CN113191092A (zh) | 一种基于正交增量随机配置网络的工业过程产品质量软测量方法 | |
CN117012315A (zh) | 一种优化rbf神经网络的混凝土强度预测方法 | |
CN113780420B (zh) | 基于gru-gcn的变压器油中溶解气体浓度预测方法 | |
CN112001115A (zh) | 一种半监督动态软测量网络的软测量建模方法 | |
CN113204918B (zh) | 水泥窑生产能耗的建模方法 | |
Ji et al. | Application of the improved the ELM algorithm for prediction of blast furnace gas utilization rate | |
CN113627594A (zh) | 基于wgan的一维时序数据增广方法 | |
CN111950698A (zh) | 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法 | |
Prakash et al. | Speculation of compressive strength of concrete in real-time | |
CN113033695A (zh) | 一种电子器件故障的预测方法 | |
CN113609772B (zh) | 基于卷积准循环神经网络的水泥成品比表面积预测方法 | |
Liao et al. | Modeling of reheating-furnace dynamics using neural network based on improved sequential-learning algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201117 |
|
RJ01 | Rejection of invention patent application after publication |