背景技术
烧成系统是水泥生产过程中最为重要的工艺环节,在烧成系统中,水泥生料会发生复杂的反应,其过程直接影响水泥的生产质量以及能源利用率。由于窑内温度是按场分布的,因此燃料的燃烧、生料的运动复杂且无规律以及回转窑的特殊结构等均会给水泥窑的温度测量带来了不小的麻烦。
现阶段水泥煅烧温度主要通过硬件直接或间接进行测量。其中,直接测量采用红外比色高温计测量,但该设备的测量精度受到烟气大小的影响,只能检测较小范围的温度;间接测量则采用窑筒体扫描仪,通过对水泥窑外表面进行红外线扫描,以达到温度测量的目的,但该方法的测量精度不高,误差较大,若窑表面保护材料脱落,还会错误的判定窑内异常,让人工错误的调整窑内参数,有可能造成严重事故。因此,建立水泥窑温度预测模型对提高水泥的生产质量、设备安全的控制以及降低能耗均具有重要的意义。
针对建立工艺参数的预测模型实现对水泥回转窑的温度预测,目前具有以下建立方法:
(1)运用核主成分分析(KPCA)和最小二乘支持向量机(LSSVM)建立温度预测模型,利用和声搜索算法对LSSVM预测模型中的参数进行优化,来源于(田中大、张月、毛程程等,石灰回转窑煅烧带温度的软测量方法[J],电子测量与仪器学报,2018(1):8)。
(2)利用T-S模糊神经软测量模型实现对生料分解率预测,用支持向量回归(SVR)软测量模型对烧成带温度进行预测,来源于(申帅,水泥煅烧系统先进控制技术的应用研究[D],浙江工业大学,2018)。
(3)及时极限学习机(JRELM)的自适应软测量方法用于回转密烧结温度的在线预测,该方法能够在线更新,具有良好的自适应性,来源于(张雷,基于数据驱动的复杂工业过程软测量方法研究与应用[D],湖南大学,2019)。
此外,有研究分析了水泥回转窑烧成工艺以及机理过程,判断出了水泥窑温度影响参数,提出了果蝇算法优化极限学习机(FOA-ELM)的水泥窑温度预测模型,来源于(陈桂芳,回转窑烧成带温度预测方法研究[D],重庆邮电大学,2016)。
针对静态软测量模型无法真实反映水泥窑烧成带温度检测过程中的动态信息,提出了最小二乘支持向量机(LSSVM)和自回归滑动平均算法(ARMA)建立温度预测模型,来源于(Zheng T、Li Q,Soft Measurement Modeling Based on Temperature Prediction ofLSSVM and ARMA Rotary Kiln Burning Zone[C]//2019IEEE 3rd Advanced InformationManagement,Communicates,Electronic and Automation Control Conference(IMCEC),IEEE,2019)。
以上建模方法都是基于传统机器学习算法及其改进算法,在监测和预测燃烧温度方面取得了显著成绩。
然而,来源于(Xiaogang Z、Hu C,Jing Z,基于图像反馈的回转窑烧结温度智能预测控制[J],控制理论与应用,2007,24(6):995-99)的内容中记载了,随着水泥生产要求的逐年提升,工艺越来越复杂,传统的人工智能算法已经无法满足使用要求,逐渐暴露出了参数选取不合理,泛化能力差等缺点,且由于自身的局限性,其主要采用静态建模或者自回归统计预测,往往会出现预测效果不佳的情况。
近年来,深度学习在对具有非线性特征的数据提取层次的表达能力上以及各种识别和预测应用中取得了很大的成就,在图像处理、语音识别以及机器翻译等领域取得了长足发展,在工业应用上也取得了一定的成功。
目前,有一种名为深卷积神经网络(RNN)和门控递归单元网络(GRU)的混合深度神经网络,来源于(Xiaogang Z、Hu C、Jing Z,基于图像反馈的回转窑烧结温度智能预测控制[J],控制理论与应用,2007,24(6):995-998),用于提取多变量耦合和非线性动态特性,在预测回转窑烧结温度上表现良好。
针对传统门控单元(Gated recurrent unit,GRU)只学习单一方向信息的问题,目前提出了一种基于深度双向加权门控单元(DBWGRU)模型用于铝业回转窑烧结的温度预测,将双向递归神经网络中的正反向信息进行加权融合,并且加入全连接层来提升网络深度,增强模型的学习能力,来源于(张毛毛.基于深度双向加权GRU的回转窑烧结温度预测[D].湖南大学.2018.)。
然而循环神经网络RNN以及他的改进模型LSTM和GRU在小样本时都会出现预测值滞后的现象,进而导致预测精度降低,因此传统的深度学习模型的预测性能难以满足小样本水泥窑的温度预测需求。
发明内容
针对以上相关技术的不足,本发明提出了一种最大化利用工艺参数数据、提高预测精度、降低循环神经网络预测滞后的现象并满足小样本水泥窑的温度预测需求的水泥回转窑的温度预测方法。
为了解决上述技术问题,本发明提出了一种水泥回转窑的温度预测方法,其包括以下步骤:
S1、获取水泥回转窑中不同时间段的多组历史工艺参数数据、窑头温度真实值以及需要预测时的预设工艺参数数据;
S2、通过其中一部分组数的所述历史工艺参数数据、集成残差神经网络以及双向新型门控循环单元网络共同构建初始窑头温度预测模型;
S3、将剩余组数的所述历史工艺参数数据和所述窑头温度真实值输入所述初始窑头温度预测模型进行训练,得到成熟窑头温度预测模型;
S4、将所述预设工艺参数数据输入至所述成熟窑头温度预测模型进行预测,得到最终窑头温度预测值。
优选的,所述步骤S1中,历史工艺参数数据包括:一次风压力、三次风压力、一段篦速、二段篦速、主电机转速、主电机电流、窑尾高温风机的电机电流、窑尾高温风机的电机转速、2607风机电流、2608风机电流、窑头排风机的电机电流、窑头排风机的电机转速、生料A库的喂料流量、生料B库喂料的流量、尾煤仓流量以及头煤仓流量;所述预设工艺参数数据与所述历史工艺参数数据的工艺参数相同。
优选的,所述步骤S2中,通过其中一部分组数的所述历史工艺参数数据、集成残差神经网络以及双向新型门控循环单元网络共同构建初始窑头温度预测模型的子步骤为:
将其中一部分组数的所述历史工艺参数数据输入至所述集成残差神经网络进行特征提取,得到特征信息;
通过所述双向新型门控循环单元网络分别从正反两个方向获取所述特征信息并进行融合,得到所述初始窑头温度预测模型。
优选的,所述集成残差神经网络包括依次连接的两个CR模块、Flatten层以及Dropout层;所述CR模块包括依次连接的两个CBL层以及残差网络单元;所述CBL层包括依次连接的卷积池化层、批归一化层以及激活层。
优选的,所述激活层使用的是Leaky ReLU激活函数。
优选的,所述双向新型门控循环单元网络包括组成双向并联结构的两个NGRU模块。
优选的,所述步骤S2中,通过所述双向新型门控循环单元网络分别从正反两个方向获取所述特征信息并进行融合,得到所述初始窑头温度预测模型的步骤中:
所述双向新型门控循环单元网络从正向获取所述特征信息的公式如下:
所述双向新型门控循环单元网络从反向获取所述特征信息的公式如下:
所述双向新型门控循环单元网络融合正向和反向获取的所述特征信息的公式如下:
其中,
为正向计算方向下当前时刻保留下的信息,
为正向计算方向下上一时刻保留的信息,
为反向计算方向下当前时刻保留下的信息,
为反向计算方向下上一时刻保留的信息,x
t为输入数据,h
t为融合后的输出结果。
优选的,所述步骤S3中,将剩余组数的所述历史工艺参数数据和所述窑头温度真实值输入所述初始窑头温度预测模型进行训练,得到成熟窑头温度预测模型的子步骤为:
将剩余组数的所述历史工艺参数数据输入至所述初始窑头温度预测模型进行预测,得到初始窑头温度预测值;
通过损失函数计算所述初始窑头温度预测值与所述窑头温度真实值之间的损失数据,并根据所述损失数据更新所述初始窑头温度预测模型的权重参数;
将剩余组数的所述历史工艺参数数据和所述窑头温度真实值输入至更新后的所述初始窑头温度预测模型进行迭代训练,并保留损失数据最小的所述初始窑头温度预测模型的权重参数,从而得到所述成熟窑头温度预测模型。
与现有技术相比,本发明中水泥回转窑的温度预测方法通过工艺参数数据、窑头温度真实值、集成残差神经网络以及双向新型门控循环单元网络共同构建窑头温度预测模型,可以获得烧成系统回转窑工艺参数对回转窑窑头温度的影响规律,这有利于现场的稳定控制,减少回转窑及其他设备的故障发生,延长设备寿命,还为智能控制和能效管理提供了解决方案的基础,有利于企业进行智能化升级,为实时调整烧成系统的工艺参数提供参考,并为降低能耗及污染排放物提供了新途径;同时窑头温度预测模型可以通过集成残差神经网络进行特征提取,以降低循环神经网络预测滞后的现象,提高窑头温度预测模型的实用性和预测精度,窑头温度预测模型还可以通过双向新型门控循环单元网络最大化利用工艺参数数据,进一步提高预测精度,并降低训练时间,另外窑头温度预测模型还能满足小样本水泥窑的温度预测需求。
具体实施方式
下面结合附图详细说明本发明的具体实施方式。
在此记载的具体实施方式/实施例为本发明的特定的具体实施方式,用于说明本发明的构思,均是解释性和示例性的,不应解释为对本发明实施方式及本发明范围的限制。除在此记载的实施例外,本领域技术人员还能够基于本申请权利要求书和说明书所公开的内容采用显而易见的其它技术方案,这些技术方案包括采用对在此记载的实施例的做出任何显而易见的替换和修改的技术方案,都在本发明的保护范围之内。
本发明实施例提供了一种水泥回转窑的温度预测方法,如图1所示,其包括以下步骤:
S1、获取水泥回转窑中不同时间段的多组历史工艺参数数据、窑头温度真实值以及需要预测时的预设工艺参数数据。
其中,所述步骤S1中,历史工艺参数数据包括:一次风压力、三次风压力、一段篦速、二段篦速、主电机转速、主电机电流、窑尾高温风机的电机电流、窑尾高温风机的电机转速、2607风机电流、2608风机电流、窑头排风机的电机电流、窑头排风机的电机转速、生料A库的喂料流量、生料B库喂料的流量、尾煤仓流量以及头煤仓流量;所述预设工艺参数数据与所述历史工艺参数数据的工艺参数相同,即所述预设工艺参数数据也包含所述历史工艺参数数据对应的上述工艺参数。
S2、通过其中一部分组数的所述历史工艺参数数据、集成残差神经网络(ResidualNeural Networks,ResNet)以及双向新型门控循环单元网络(Bidirectional New GatedCirculation Unit,BiNGRU)共同构建初始窑头温度预测模型,如图2所示。
本实施例中,所述步骤S2的子步骤为:
将其中一部分组数的所述历史工艺参数数据输入至所述集成残差神经网络进行特征提取,得到特征信息;
通过所述双向新型门控循环单元网络分别从正反两个方向获取所述特征信息并进行融合,得到所述初始窑头温度预测模型。
结合图3所示,所述集成残差神经网络包括依次连接的两个CR模块、Flatten层以及Dropout层;所述CR模块包括依次连接的两个CBL层以及残差网络单元;所述CBL层包括依次连接的卷积池化层、批归一化层以及激活层;所述历史工艺参数数据输入至所述集成残差神经网络后,依次经过两个所述CR模块、所述Flatten层以及所述Dropout层得到输出数据。
所述激活层使用的是Leaky ReLU激活函数。
所述双向新型门控循环单元网络包括组成双向并联结构的两个NGRU模块,两个所述NGRU模块按照正反两个方向获取所述特征信息。
S3、将剩余组数的所述历史工艺参数数据和所述窑头温度真实值输入所述初始窑头温度预测模型进行训练,得到成熟窑头温度预测模型。
本实施例中,所述步骤S3的子步骤为:
将剩余组数的所述历史工艺参数数据输入至所述初始窑头温度预测模型进行预测,得到初始窑头温度预测值;
通过损失函数计算所述初始窑头温度预测值与所述窑头温度真实值之间的损失数据,并根据所述损失数据更新所述初始窑头温度预测模型的权重参数;
将剩余组数的所述历史工艺参数数据和所述窑头温度真实值输入至更新后的所述初始窑头温度预测模型进行迭代训练,并保留损失数据最小的所述初始窑头温度预测模型的权重参数,从而得到所述成熟窑头温度预测模型。
其中,所述双向新型门控循环单元网络从正向获取所述特征信息的公式如下:
所述双向新型门控循环单元网络从反向获取所述特征信息的公式如下:
所述双向新型门控循环单元网络融合正向和反向获取的所述特征信息的公式如下:
上述公式(1)、(2)、(3)中,
为正向计算方向下当前时刻保留下的信息,
为正向计算方向下上一时刻保留的信息,
为反向计算方向下当前时刻保留下的信息,
为反向计算方向下上一时刻保留的信息,x
t为输入数据,h
t为融合后的输出结果。
S4、将所述预设工艺参数数据输入至所述成熟窑头温度预测模型进行预测,得到最终窑头温度预测值。
其中,所述预设工艺参数数据输入至所述成熟窑头温度预测模型后,依次通过集成残差神经网络以及双向新型门控循环单元网络进行训练,得到所述最终窑头温度预测值。
与现有技术相比,本实施例中水泥回转窑的温度预测方法通过工艺参数数据、窑头温度真实值、集成残差神经网络以及双向新型门控循环单元网络共同构建窑头温度预测模型,可以获得烧成系统回转窑工艺参数对回转窑窑头温度的影响规律,这有利于现场的稳定控制,减少回转窑及其他设备的故障发生,延长设备寿命,还为智能控制和能效管理提供了解决方案的基础,有利于企业进行智能化升级,为实时调整烧成系统的工艺参数提供参考,并为降低能耗及污染排放物提供了新途径;同时窑头温度预测模型可以通过集成残差神经网络进行特征提取,以降低循环神经网络预测滞后的现象,提高窑头温度预测模型的实用性和预测精度,窑头温度预测模型还可以通过双向新型门控循环单元网络最大化利用工艺参数数据,进一步提高预测精度,并降低训练时间,另外窑头温度预测模型还能满足小样本水泥窑的温度预测需求。
另外,本实施例其中其它技术特征的详细描述如下:
BiNGRU算法包括GRU算法(GRU)、NGRU算法(NGRU或所述NGRU模块)以及2.3双向NGRU算法(双向NGRU)。
为了提高GRU学习的灵敏性,NGRU在传统的GRU模型的基础上引入了抗过饱和模块,NGRU引入了整个数据流信息ct-1至输入门计算过程中的前一时刻,如图4所示。
NGRU的遗忘门ft主要确定从前一时刻到当前时刻可以保留多少数据,其计算公式为:
ft=σ(Wfh·ht-1+Wfx·xt+bf) (4);
上述公式(4)中,xt是第t个时间步的输入向量,xt与权重矩阵W相乘以执行线性变换,ht-1存储上一时间的数据,ht-1通过与权重矩阵W相乘来执行线性变换,将这两部分数据信息相加,然后用sigmoid激活函数进行计算,得到的数值结果ft在0到1之间。
输入门主要决定当前时间可以保留多少数据,其计算公式为:
it=σ(Wih·ht-1+Wix·xt+ct-1+bi) (5);
与遗忘门相比,所述NGRU模块的输入门it引入了整个数据流信息ct-1直到上一次,因此输入门对当前时间数据的保留具有内存效应,所述NGRU模块中的输入门使用sigmoid激活功能,当x小于-3或大于3时,激活函数的值将落入过饱和区,因此,当输入数据进入过饱和区时不会发生显著变化,导致学习敏感性下降。
所以,所述NGRU模块加入反过饱和转换模块Tri,其计算公式为:
Tri=tanh(it) (6);
sigmoid激活功能在(0,1)范围内,当数据通过输入门时,转换模块生成的值Tri,因此该值更重要。
ct是从开始到当前时刻保留的数据信息,ct通过tanh函数控制当前时刻可以保留到下一时刻的数据信息量,计算公式为:
ct=ft·ct-1+Tri (7);
ht是当前时刻保留的数据信息,同时为所述NGRU模块的输出,其计算公式为:
ht=tanh(ct) (8);
所述NGRU模块由遗忘门和输入门组成,与LSTM相比,所述NGRU模块去掉了输出门,与GRU相比,模型结构更简单,与LSTM相比,W参数从8个减少到4个,b参数从4个减少到2个,与GRU相比,W参数从6个减少到4个,b参数从3个减少到2个;其中,LSTM、GRU和NGCU的参数如下表一所示。
表一、LSTM、GRU和NGCU结构参数对比表
本实施例还提供了温度预测模型的训练参数,具体为:本次共采集历史数据3820组,选取前2292组作为ResNet和BiNGRU模型的训练样本,再选取764组作为ResNet和BiNGRU模型的验证样本,剩下764组数据作为ResNet和BiNGRU模型的测试样本。通过训练样本训练ResNet和BiNGRU模型,完善模型的网络结构以及参数,建立水泥窑温度预测模型。其中ResNet模型共有16个输入变量,采用前8个时刻数据预测后一个时刻的温度,通过两组卷积池化模块计算后得到1024个输出变量,BiNGRU模型共有1024个输入变量,1个输出变量,采用3个隐藏层,每个隐藏层神经元个数为800。通过对ResNet和BiNGRU模型进行训练并验证,保留验证集损失最小时的网络结构参数,并将该组网络结构参数用于测试集,测试值与真实值对比结果如图5所示;
此外,本实施例中还将该方法与其他预测方法进行了比较,包括LSTM模型,GRU模型,BiLSTM模型,BiGRU模型,条件相同。下表显示了多个模型在训练时间、最快收敛epoch,测试集RMSE和平均温差的比较。如下表二可得:本实施例所提出的ResNet和BiNGRU温度预测模型有较好的预测性能,测试集RMSE,平均温差在五个模型中最低,分别为6.35℃、5.23℃,这是因为利用ResNet网络先进行有用信息特征提取,ResNet的特征提取能力提高NGRU的记忆容量,解决了预测滞后的问题,提高了模型的预测精度。同时本实施例所提出的ResNet和BiNGRU温度预测模型尽管增加了模型的复杂度,但相较于传统的LSTM、GRU模型收敛速度较快,仅需26个epoch就可得到最优模型,所有模型的训练时间是训练200轮所需的时间,因此理论上ResNet和BiNGRU模型在训练时间上也会更有优势。
表二、预测方法比较表
Model |
Training_Time |
Best_Epoch |
Test_RMSE |
Avg_Temp_Diff |
LSTM |
1m07s |
148 |
10.09 |
8.12℃ |
GRU |
0m56s |
52 |
13.88 |
11.81℃ |
BiLSTM |
2m27s |
134 |
7.51 |
6.04℃ |
BiGRU |
0m53s |
130 |
9.61 |
7.8℃ |
ResNetBiNGRU |
1m58s |
26 |
6.35 |
5.23℃ |
此外,还有一些其它的技术特征的具体描述,如下:
GRU算法:循环神经网络RNN是一种处理连续数据(如声音、时间序列数据或书面自然语言)的强大模型。RNN是借助循环核提取特征后,送入后续网络(如全连接层Dense)进行预测等操作。RNN结构如图3所示,其借助循环核从时间维度提取信息,循环核具有记忆力,通过不同时刻的参数共享,实现对时间序列的信息提取,循环核参数时间共享。循环核中的记忆体(如图6所示)存储着每个状态的信息ht,公式如下:
ht=tanh(xtwxh+ht-1whh+bh) (9);
其中,wxh,whh为权重参数,bh为偏置参数,xt为当前时刻的输入特征,ht-1为记忆体上一时刻存储的信息状态,tanh为激活函数,当前时刻循环核的输出特征的公式如下:
yt=softmax(htwhy+by) (10);
但是RNN面临的较大问题是无法解决长跨度依赖问题,即后面节点相对于跨度很大的前面时间节点的信息感知能力太弱。长跨度依赖的根本问题在于多阶段反向传播后会导致梯度消失或爆炸问题。针对上述问题,Hochreiter等人提出LSTM模型,通过门控单元很好的解决了RNN长期依赖的问题,LSTM使用门机制对信息的流通和损失进行控制。但LSTM由于自身结构的限制,存在参数过多的现象,因此研究人员提出一个LSTM的改进结构-门控循环单元GRU,GRU只有两个门,其将LSTM的输入门个遗忘门组合为一个,称为更新门,GRU的结构如图7所示。
更新门zt控制上一时刻的信息可以继续保留到当前时刻的数据量,如公式(11)所示。重置门rt控制应忘记多少过去的信息,如公式(12)所示。如式(13)所示,输入信息xt和上一个时间步长信息ht-1进行线性变换,不同的矩阵分别右乘,然后重置门rt和Whhht-1相乘。最后,新信息h′t通过tanh激活函数计算。
zt=σ(Wzh·ht-1+Wzx·xt+bz) (11);
rt=σ(Wrh·ht-1+Wrx·xt+br) (12);
h′t=tanh(Wxh·xt+rt·Whh·ht-1) (13);
如式(14)所示,zt和ht-1表示在上一时间步保留的最终数据信息。该结果加上从当前内存保留到最终内存信息等于最终选通环路单元输出的内容ht。
ht=zt·ht-1+(1-zt)h′t (14);
双向NGRU算法:循环神经网络RNN以及后续的各种改进模型都是单向结构,没有考虑从后向前的编码信息,因此为了提高模型的表达和学习能力,在NGRU的基础上,对网络按照正反两个方向提取的特征信息进行融合,计算公式如式(15)、(16)、(17)所示,具体网络结构如图3所示:
ResNet算法包括卷积神经网络和卷积神经网络。
卷积神经网络最早由LeCun提出,最初应用于图像识别,得益于CNN具有局部感受野、共享权重和空间子采样的特性,随着研究的深入,已成功应用于文档识别、语音识别、频谱识别、故障诊断、预测等多个领域。卷积神经网络通常由多个卷积层、池化层、全连接层组成,其中卷积层和池化层负责提取特征,降低数据维度,全连接层负责特征分类或者回归,一个经典的卷积神经网络结构如图8所示。
卷积层:在卷积层中,需要对输入或者上一层的特征进行卷积运算,从而产生新的特征输出到下一层。卷积运算是一种特别重要的线性运算,该运算在数据通道和相同的卷积层中使用相同的卷积核滤波器来提取输入数据的局部特征,卷积核滤波器相当于采样层和下一层之间的权重连接,称为权重共享。卷积运算后,用非线性激活函数对特征图进行处理,以提高表示能力。其卷积过程如公式(18)所示:
其中,cj为该层卷积所得到的第个j特征图,l代表层数,f为RELU激活函数,k是卷积核,Mj是输入特征,b为偏置。可以看出,卷积层的一个特征图可以是上一层的n(n≥1)个特征图卷积运算后求和得到。
池化层:池化层通常在卷积层之后,用于卷积层生成的特征映射。池化层可显著的降低卷积生成特征的维数、减少特征的计算量、防止过拟合、降低训练时间,同时由于经过卷积的上一节点的数据往往存在加多的重复,池化层可提取每个特征中最重要局部信息。池化层通常对卷积层获取的特征值执行下采样操作,减少网络参数,降低网络规模,对采集到的特征值做压缩。池化操作通常包括最大池化操作和平均池化操作,其中最大池化操作是使用最广泛的,对任意特征图c,将其分成不同的模块pk,k=1,2,3,…,r,定义子采样如公式(19):
全连接层:输入数据经过卷积层池化层特征提取后,通过全连接层平铺成一维特征,再进行分类或回归。全连接层一般包含一个或多个隐含层,一个分类或回归层。
随着卷积神经网络的发展,产生了大量优秀的预测模型,而这些模型逐渐趋于复杂化,采用多层的卷积堆叠,但随着网络结构的加深,会出现模型退化,过拟合等问题,为了解决该问题,2016年He等人在卷积神经网络的基础上设计了残差神经网络,残差神经网络引入了残差学习的概念,通过多个首尾相连的残差块来学习残差特征,残差块结构如图9所示。其中,x为残差神经网络的输入,H(x)为输出,F(x)为残差映射函数,H(x)=F(x,{Wi})+x为恒等映射函数,Wi为卷积层。残差神经网络在普通深度卷积网络的基础上增加跨层去拟合残差函数,只学习输出和输入的差别,同时在训练过程底层的误差能够快速传递到上一层,使得模型在训练过程除了使用目标函数梯度,还利用了残差梯度,因此残差网络有更强的特征学习能力。
水泥煅烧过程是复杂且连续的工艺过程,具有非线性和不确定性等特征。由上述可知,在烧成系统回转窑内,影响水泥窑温度高低的工艺参数众多。若使用传统的单一预测模型,会导致模型网络结构过于复杂,运行时间长且预测精度不高,同时水泥窑温度与前后时刻水泥窑内部工作状态有关,传统的机器学习模型很难考虑时间因素的影响,而循环神经网络已经被验证在处理连续数据上具有巨大的优势,水泥窑温度预测是一个典型的时序预测模型,因此选用循环神经网络作为基础模型,能够更有效的挖掘水泥窑预测温度前后时刻的有用信息。
然而,常用的循环神经网络模型如LSTM存在参数过多的现象,会大大增加模型的训练时间。NGRU避免了上述问题,在保证模型精度的同时,参数量大大降低,NGRU的参数为LSTM的50%,为GRU的67%,因此本文选取NGRU作为基础的水泥窑温度预测模型。
NGRU温度预测模型虽然具有了一定的精度,但其采用的单向结构,没有考虑从后向前的编码信息,而水泥窑的温度受到前后两个时刻的影响,为了进一步提升模型的表达和学习能力,加上NGRU本身模型复杂度不高,因此采用双向NGRU模型进行预测。
本实施例采集的数据量较少,特征量较少,在使用循环神经网络进行预测过程中存在因记忆模块能力的不足而造成预测结果相对滞后的问题,影响最终的预测效果。CNN网络具有降维和特征提取的能力,可以有效降低数据处理量,提高数据处理速度,因此本实施例采用ResNet网络改进NGRU网络,ResNet相对于CNN具有更好的预测性能,能够充分利用卷积前后的有用信息,采用较少的卷积即可提取相关信息,具有更强的特征学习能力且降低了模型复杂度。利用ResNet改进NGRU网络,既充分发挥了NGRU时序记忆优势,同时利用ResNet的特征提取能力提高NGRU的记忆容量,解决了预测滞后的问题,进一步提升了模型的预测性能以及实用性。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。