CN111950191B

CN111950191B - 基于混合深度神经网络的回转窑烧结温度预测方法

Info

Publication number: CN111950191B
Application number: CN202010648367.XA
Authority: CN
Inventors: 陈华; 张小刚; 雷艳莹
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2021-05-11
Anticipated expiration: 2040-07-07
Also published as: CN111950191A

Abstract

本发明公开了一种基于混合深度神经网络的回转窑烧结温度预测方法，从多个热工数据中选取出8个热工变量；对多维原始变量数据进行PCA分析，并从中选取出最优热工变量作为模型输入；对各变量数据标准化处理；通过采集到的样本数据选取相应时间间隔内变量数据得到样本数据集合，分成75％的训练数据集，20％的预测数据集，5％的验证数据集；利用训练数据集训练深度神经网络得到相应的权重与偏置，得到权重与偏置带入验证数据集，计算出验证数据集的预测误差，并保存使训练集预测误差最小的权重和偏置；将使训练集预测误差最小的权重和偏置带入预测集合中计算得到预测值。实现从多元热时间序列中自动提取耦合特征和动态时序特征。

Description

基于混合深度神经网络的回转窑烧结温度预测方法

技术领域

本发明属于回转窑工业控制技术领域，特别是涉及一种基于混合深度神经网络的回转窑烧结温度预测方法。

背景技术

工业回转窑是一种典型的高能耗热工设备，在冶金、水泥、等工业领域应用十分广泛，其能耗占生产总能耗60％。生产的关键环节是其窑内烧结温度的稳定控制，通过提前预知燃烧状态，调节被控变量，使窑内保持稳定的生产状态，这些手段对于提高生产率，减少废气和颗粒物排放至关重要。

回转窑烧结过程的工况检测与控制近年受到学者的广泛关注。目前常见的回转窑建模研究主要包括：机理建模和数据驱动建模。由于复杂的物理化学反应，热传递和多相流体流动同时发生，因此很难建立烧结过程的机理模型。随着信息技术的发展，已经使用软测量技术对回转窑中的燃烧进行了许多测量和检测。与机理建模相比，基于数据驱动建模在描述建模烧结过程的复杂行为方面显示出巨大的潜力。

回转窑的燃烧过程是一个复杂的非线性动力学系统，从过程传感器收集的热工数据是具有典型的强耦合和非线性动力学特征的多元时间序列。大多数现有的数据驱动模型都基于静态建模或自回归统计方法实现预测，仅仅考虑变量在空间或时间上分离的信息，并且将信息直接送入统计分类器或回归中，而并不挖掘数据之间的关系和动态依赖性。因此这些方法很难利用现场的热工数据来精确预测烧结温度。

发明内容

本发明实施例的目的在于提供一种基于混合深度神经网络的回转窑烧结温度预测方法，以实现从多元热时间序列中自动提取耦合特征和动态时序特征，从而更精确的预测烧结温度。

为解决上述技术问题，本发明所采用的技术方案是，基于混合深度神经网络的回转窑烧结温度预测方法，包括：

步骤S1，从多个热工数据中选取出8个热工变量，采集间隔为1分钟，并进行预处理；步骤S2，对预处理后的多维原始变量数据进行PCA分析，并从中选取出最优热工变量作为模型输入；

步骤S3，对各变量数据标准化处理；

步骤S4，通过采集到的多个样本数据选取相应时间间隔内变量数据得到样本数据集合，分成75％的训练数据集，20％的预测数据集，5％的验证数据集；

步骤S5，利用训练数据集训练深度神经网络得到相应的权重与偏置，将得到的权重与偏置带入验证数据集，然后计算出验证数据集的预测误差，并保存使训练集预测误差最小的权重和偏置；

步骤S6，将步骤S5中使训练集预测误差最小的权重和偏置带入预测数据集中，计算得到预测值。

进一步的，所述步骤S1，8个热工变量为：窑头温度x₁、窑尾温度x₂、主机负荷x₃、冷却机负荷x₄、鼓风流量x₅、窑体转速x₆、喂煤量x₇、烧结温度y。

进一步的，所述步骤S1，预处理过程为：查找采集到的8个热工变量数据的缺失值，删除缺失值并删除同一时刻采集到的其他变量数据。

进一步的，所述步骤S2为：

步骤S2.1，计算7个热工数据变量X的中心化矩阵X_c；

步骤S2.2，计算X_c的协方差矩阵W＝X_cX_c ^T，T是转置；

步骤S2.3，协方差矩阵W做特征值分解，计算特征值λ_i和特征向量p_i，i∈(1,2,...7)并按特征值大小降序排列；

步骤S2.4，计算各主成分贡献率

L为主成分的个数,L∈(1,2,...7)，计算累计贡献率

选取累计贡献率前90％对应的前L个主成分对应的L个特征向量组成因子载荷矩阵

是实数集；

步骤S2.5，选取L个主成分在因子载荷矩阵中数值最高所对应的热工变量作为最优变量，作为模型输入。

进一步的，所述步骤S3为：

选取的变量数据进行计算

其中x_min和x_min分别为每个变量样本中最小值和最

大值，x为采集到的原数据，x′为归一化后的变量数据。

进一步的，所述步骤S4为：

以时间间隔τ为样本选取间隔长度，以滑窗的方式选取集合，对预测烧结温度y(t+1)，输入数据为X(t),...,X(t-τ),y(t),...,y(t-τ)，其中

X是选取的最优的L个过程变量时间序列数据，即X＝{x₁,x₅,x₆,x₇}，y是烧结温度数据，N是采集数据样本个数，t是当前时刻，

指实数集合，将得到的样本集合分成75％的训练集，20％预测集，5％的验证集。

进一步的，所述步骤S5为：

步骤S5.1，确定神经网络反向传播的误差阈值ε并设置超参数；设置初始化迭代次数I＝0，最大迭代次数为IMAX；随机初始化各网络层权重矩阵w和偏差β；

步骤S5.2，对输入的二维矩阵Xy＝[[X(t),...,X(t-τ)],[y(t),...y(t-τ)]]进行二维卷积计算：

其中，

为二维卷积运算得到的时空耦合特征，*表示卷积运算，并且

是第N个过滤器的权重，大小为j×(n+1)，j为卷积核的长，n为PCA选取的变量个数，β^N是卷积层的偏差，ReLU函数是ReLU(x)＝max(0,x)，在忽略边界填充的情况下，二维CNN的输出大小为1×l，其中

为输出向量的长度，s为步长；

同时，历史烧结温度Y＝{y(t),...y(t-τ)}作为GRU层输入挖掘回转窑的非线性动态特征H^y，GRU单元在t时刻的最后隐藏状态计算为：

其中w_r、v_r是复位门r_t的权重矩阵，β_r是其偏差向量；w_z、v_z是更新门z_t的权重矩阵，β_z是其偏差向量；v_h和w_h是公式(4)的权重矩阵，β_h是其偏差向量；tanh是一个双曲正切函数，⊙是按元素乘法，σ(x)函数是

e是自然常数；

公式(2)和(3)为复位门r_t和更新门z_t的操作，在获得当前时刻的输出Y_t和前一时间步长

的隐藏状态之后，更新或重置的可能性由σ(x)函数确定；

公式(4)，同时步的当前数据Y_t和复位门r_t选择的部分过去的隐藏状态通过非线性变化确定新的存储内容

公式(5)，更新门z_t通过过滤新的存储器内容

和前一时间步长

的隐藏状态，形成当前的动态耦合信息

步骤S5.3，对提取到的耦合特征进一步一维卷积压缩：

K表示一维卷积层中滤波器的个数，w^K和β^K是一维卷积过程的权重矩阵和偏差向量，H^K为输出的深度时空耦合特征；

步骤S5.4，通过两层卷积层计算得到的耦合特征被进一步挖掘动态特征，在GRU单元被计算为：

H_t指当前时刻的深度时空耦合特征，

为上一时刻GRU单元的输出；

步骤S5.5，利用全连接层进一步挖掘经过GRU层计算得到的动态耦合特征H^Xy的非线性信息：

D^Xy＝f(w_XyH^Xy+β_Xy) (11)

其中w_Xy和β_Xy分别是权重矩阵和偏差；

步骤S5.6，利用全连接层加权融合动态耦合特征H^Xy和非线性动态特征H^y：

其中

表示模型的最终预测；w_D、w_y表示转换矩阵，β_Fc表示偏差值，f是非线性激活函数；

步骤S5.7，利用均方误差损失函数Loss用于模型训练中的优化，计算预测偏差：

其中F是训练样本长度；

步骤S5.8，使用Adam优化算法寻找网络误差对每个权重参数的反向传播梯度，并通过参数更新过程获得新的权重和偏置，增加迭代次数I＝I+1，将新的权重和偏置带入训练集，通过计算公式(1)-(12)得到训练集的预测偏差，保存使训练集预测误差最小的权重和偏置；

步骤S5.9，当Loss＞ε或I≤IMAX时，返回步骤S5.1。

本发明的有益效果：

1，利用PCA算法从各过程变量中选取几个关键相关变量作为建模的输入。根据烧结过程特征分析，影响烧结温度的过程变量太多，且很多变量之间存在很强的相关性。通过PCA技术降低了模型的复杂度，提高了模型的预测性。

2，针对大工业过程的多变量耦合和非线性动态特性，利用多维热工信号提出了一种基于深度学习的数据驱动模型来预测回转窑烧结温度,通过自动学习数据信息结合相关特征达到高精度预测。

3，与传统的数据驱动的建模方法来识别和预测燃烧不同，采用先分块提取特征后加权融合的建模方式，最大化利用回转窑数据信息，更加精确的建立回转窑烧结温度模型，获得更丰富的内在特征信息，进而提高预测精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的预测方法的流程框图；

图2是本发明中PCA选取最佳输入变量的流程图；

图3是DCGNet网络训练流程图；

图4是基于八种不同预测模型得到的测试数据误差概率分布曲线图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的思路是提出了一种深度卷积神经网络(CNN)和门控递归单元神经网络(GRU)相结合的混合深度神经网络模型(DCGNet)，以提取多元耦合和非线性动力学特征，并通过使用主成分分析(PCA)算法选择了最佳相关热工数据来预测烧结温度。首先为了降低模型复杂度，提高预测性能，引入主成分分析法来选择最优的模型输入变量数据。在第一个网络模块中，CNN与GRU相结合，用于捕获多变量的耦合特征和局部时间信息。在第二个网络模块中，并行GRU对历史烧结温度数据信息进行建模，获取烧结温度时间序列的非线性动态特性。最后，利用全连通网络层加权融合这两个模块，通过构建这三部分模块对烧结温度进行预测，获得更丰富的特征信息，进一步提高所构建的DCGNet的建模精度。

本发明实施例的步骤，如图1所示，包括：

步骤S1，从多个热工数据中选取出8个热工变量，采集间隔为1分钟；

步骤S2，对预处理后的多维原始变量数据进行PCA分析，并从中选取出最优热工变量作为模型输入；

步骤S3，对各变量数据标准化处理；

步骤S4，通过采集到的7000个样本数据选取相应时间间隔内变量数据得到样本数据集合，分成75％的训练数据集，20％的预测数据集，5％的验证数据集；

步骤S5，利用训练数据集训练深度神经网络得到相应的权重与偏置，得到权重与偏置带入验证数据集，根据公式(1)-公式(13)计算出验证数据集的预测误差，并保存使训练集预测误差最小的权重和偏置；

步骤S6，将步骤S5中使训练集预测误差最小的权重和偏置带入预测集合中，即通过把预测值带入公式1-公式12计算得到预测值。

具体来说，步骤S1中采集的8个热工变量如表1：

变量	热工变量描述	单位
			x<sub>1</sub>	窑头温度	℃
x<sub>2</sub>	窑尾温度	℃
			x<sub>3</sub>	主机负荷	A
x<sub>4</sub>	冷却机负荷	A
			x<sub>5</sub>	鼓风流量	m<sup>3</sup>/h
x<sub>6</sub>	窑体转速	Rad/min
			x<sub>7</sub>	喂煤量	Rad/min
y	烧结温度	℃

预处理过程为：查找采集到的8个热工变量数据的缺失值，删除缺失值并删除同一时刻采集到的其他变量数据。

步骤S2流程如图2所示，具体包括：

步骤S2.1，计算7个热工数据变量X的中心化矩阵X_c；

步骤S2.2，计算X_c的协方差矩阵W＝X_cX_c ^T；T是转置；

步骤S2.3，协方差矩阵W做特征值分解，计算特征值λ_i和特征向量p_i i∈(1,2,...7)并按特征值大小降序排列；

步骤S2.4，计算各主成分贡献率

L为主成分的个数,L∈(1,2,...7)，计算累计贡献率

是实数集；

步骤S3具体包括：

选取的变量数据进行计算

其中x_min和x_min分别为每个变量样本中最小值和最大值，x为采集到的原数据，x为归一化后的变量数据。

步骤S4具体包括：

以时间间隔τ为样本选取间隔长度，以滑窗的方式选取集合。即对预测烧结温度y(t+1)，输入数据为X(t),...,X(t-τ),y(t),...,y(t-τ)。其中

指实数集合。将得到的样本集合分成75％的训练集，20％预测集，5％的验证集。

步骤S5过程如图3所示，具体包括：

步骤S5.1，确定神经网络反向传播的误差阈值ε并设置超参数；设置初始化迭代次数I＝0，最大迭代次数为IMAX；随机初始化各网络层权重矩阵w和偏差β。

其中，

为二维卷积运算得到的时空耦合特征，*表示卷积运算，并且

是第N个过滤器的权重，大小为j×(n+1)，j为卷积核的长，n为PCA选取的变量个数，β^N是卷积层的偏差，ReLU函数是ReLU(x)＝max(0,x)。在忽略边界填充的情况下，二维CNN的输出大小为1×l，其中

为输出向量的长度，s为步长。

其中w_r、v_r是复位门r_t的权重矩阵，β_r是其偏差向量；w_z、v_z是更新门z_t的权重矩阵，β_z是其偏差向量；

v_h和w_h是公式(4)的权重矩阵，β_h是其偏差向量。tanh是一个双曲正切函数，⊙是按元素乘法。σ(x)函数是

e是自然常数。

公式(2)和(3)显示了复位门r_t和更新门z_t的操作。在获得当前时刻的输出Y_t和前一时间步长

的隐藏状态之后，更新或重置的可能性由σ(x)函数确定。在公式(4)，同时步的当前数据Y_t和复位门r_t选择的部分过去的隐藏状态通过非线性变化确定新的存储内容

在公式(5)，更新门zt通过过滤新的存储器内容

和前一时间步长

的隐藏状态，形成当前的动态耦合信息

步骤S5.3，对提取到的耦合特征进一步一维卷积压缩：

K表示一维卷积层中滤波器的个数，w^K和β^K是一维卷积过程的权重矩阵和偏差向量，H^K为输出的深度时空耦合特征。

公式(2)-(5)与公式(7)-(10)计算含义相同，H_t指当前时刻的深度时空耦合特征，

为上一时刻GRU单元的输出。

D^Xy＝f(w_XyH^Xy+β_Xy) (11)

其中w_Xy和β_Xy分别是权重矩阵和偏差。

其中

表示模型的最终预测；w_D、w_y表示转换矩阵，β_Fc表示偏差值，f是非线性激活函数。

其中F是训练样本长度。

步骤S5.8，使用Adam优化算法寻找网络误差对每个权重参数的反向传播梯度，并通过参数更新过程获得新的权重和偏置，增加迭代次数I＝I+1，将新的权重和偏置带入训练集，通过计算公式(1)-(12)得到训练集的预测偏差，保存使训练集预测误差最小的权重和偏置。

步骤S5.9，当Loss＞ε或I≤IMAX时，返回步骤S5.1。

本发明将手工变量选择与自动特征学习相结合的混合方法，应用于回转窑烧结温度预测。利用PCA技术分析出回转窑烧结温度建模中最优变量，解决了高维建模问题，有效的降低了模型复杂度，提高预测性能；同时根据回转窑烧结过程中的两大特性：强耦合和非线性，利用CNN与GRU神经网络结合有针对性的自动挖掘回转窑烧结过程中多元时间序列的强耦合特征和非线性动态特征；通过先分类提取特征后加权融合预测的方法构造三个模块共同应用于回转窑烧结温度预测，可以获得更多丰富的特性信息，并且可以进一步提高模型的建模精度。

选择深度去噪自编码网络(DAE)，多层感知器(MLP)，多层卷积神经网络(DCNN)，卷积神经网络与长短期记忆网络的混合网络(CNN-LSTM)，多层长短期记忆网络(DLSTM)，多层门控递归单元网络(DGRU)，多层双向门控递归单元网络(DBiGRU)共7种预测方法与本发明相比比较。工业数据训练样本、验证样本和测试样本按照70％、10％和20％比例。实验重复20次取平均值作为结果。下表2为实验对比结果，采用三个不同评价指标，粗体数据是最好的结果。

表2工业数据实验对比结果

方法	MAE	RMSE	CC
				DCGNet	2.0213	3.4359	0.99881
CNN-LSTM	3.8745	5.8152	0.99649
				DCNN	4.6112	6.0277	0.99643
MLP	7.1573	10.0170	0.98890
				DAE	7.4002	8.9617	0.99412
DLSTM	4.7459	6.8883	0.99538
				DGRU	4.5449	5.9534	0.99645
DBiGRU	4.2675	5.8681	0.99638

由表可以看出，本发明具有最佳的预测精度，其平均绝对误差(MAE)和均方根误差(RMSE)最小，相关系数(CC)最大表明实际值与预测值之间具有很强的相关性。进一步由图4看出，相对于其他算法，与其他模型相比，本发明的模型获得的预测烧结温度的误差分布更接近零，且变化较小，从而进一步表明了我们所提出方法的可靠性。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。