CN116484275A

CN116484275A - 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法

Info

Publication number: CN116484275A
Application number: CN202310405505.5A
Authority: CN
Inventors: 谢永芳; 谢世文; 陈曦; 陈晓方
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2023-04-17
Filing date: 2023-04-17
Publication date: 2023-07-25
Anticipated expiration: 2043-04-17
Also published as: CN116484275B

Abstract

本发明公开了一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，包括：对记阳极电流数据进行预处理；将多通道的阳极电流信号建模成以阳极通道为节点、节点间连接权重为边的图结构数据，得到阳极电流信号的初始邻接矩阵；构建时空图卷积神经网络，获取阳极电流数据的空间特征和时间特征；构建图结构损失函数和交叉熵损失函数以更新网络参数；利用Softmax分类器得到最终的分类结果。本发明的方法可以根据已有的阳极电流数据，在提前10分钟的情况下，充分考虑到阳极电流信号的时空分布特点，建立起阳极效应的预测模型，实现对阳极效应的提前预判，降低人力成本，为操作人员处理阳极效应提供依据，有助于提高铝电解过程的智能化水平。

Description

基于自适应时空图卷积神经网络的铝电解阳极效应监测方法

技术领域

本发明涉及冶炼领域，具体为一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法。

背景技术

铝电解的整个生产过程在铝电解槽中进行，其目的是获得高纯度的铝。在现代铝电解工业中，Hall-Heroult法由于其适用性广、操作简便，仍是主要方法，此法是由美国的Hall和法国的Heroult于1886年率先提出的。生产原料为氧化铝(Al₂O₃)粉末，其熔点为2054℃，沸点为2980℃；辅助原料氟化盐例如氟化铝和氟化钙等，氟盐的主要作用是在电解过程中降低冰晶石溶点，提高铝电解生产过程的经济效益。常用的电解质为熔融冰晶石，其主要成分为Na₃AlF₆。阳极材料为碳，在950℃至970℃的高温和直流电的作用下，槽内发生反应，在阴极产生铝液。阳极效应预测是现代铝电解工业生产中的研究热点之一，是铝电解生产过程中的一种特殊现象，如果一个或几个阳极发生阳极效应，这些阳极上的电压和阳极电流密度会在短时间内急剧上升，导致电流效率下降，铝电解槽寿命缩短。此外，阳极效应会产生两种全氟化碳气体CF₄和C₂F₆，具有强烈的温室效应，其使全球变暖的潜在值是CO₂的6630倍和11100倍。因此，及早检测阳极效应对减少其数量具有重要的理论价值和实际意义。

近年来，依据测试数据建模后进行系统辨识的阳极效应预测方法成果较多。测试数据，既包含反应铝电解过程长期累积槽况的特征参数，主要有出铝量、铝水平、电解质水平、电解温度、分子比、铁含量以及硅含量；也包含了能够反应短时生产操作影响以及效应发生前短时特征的统计参数，主要有槽电压均值、加料间隔指示量均值、以及系列电流均值；基于机器学习的方法模型输入特征参数较少，一定程度上造成了关键特征信息的损失；基于深度学习的方法均取得了良好的预测效果，但是基于数据驱动的方法往往只考虑了阳极电流信号的时序相关性而忽略了多维信号之间的空间依赖，并且现有的图卷积神经网络预测方法很大程度上依赖于预先设计好的的图结构来进行时间序列预测。因此本发明提出了一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，通过对阳极电流数据的预处理提取相应特征值，将多通道的阳极电流信号建模成以阳极通道为节点、节点间连接权重为边的图结构数据；利用自适应学习模块得到阳极电流信号的初始邻接矩阵，并在训练过程中更新；利用时空图卷积模块获取信号的时间和空间特征，特征参数迭代构建图结构损失函数和交叉熵损失函数以更新网络参数。总之，铝电解阳极效应是铝电解过程中不可避免的问题，对生产效率和环境造成了不良影响。通过对铝电解过程中阳极效应的深入研究，可以提出有效的控制方法，从而改善铝电解生产过程的效率和提高环境效益。本发明可以较好地弥补传统效应预测方法忽略数据间的时空相关性问题，并且从时间特征和空间特征两个角度提取阳极电流特征信息，具有较高的应用价值。

发明内容

本发明的目的在于提供一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，包括如下步骤：

S1：对铝电解槽的原始阳极电流数据序列进行预处理，得到预处理后的阳极电流数据序列形成数据集，以8:2的比例将数据集分为训练集和测试集；

S2：将训练集中的阳极电流数据序列经过1×1标准卷积得到初始特征矩阵X，利用多头加权余弦相似度构建阳极电流信号的初始邻接矩阵A，初始邻接矩阵A和初始特征矩阵X作为时空图卷积神经网络的输入；

S3：时空图卷积神经网络的训练：将训练集的初始邻接矩阵A和初始特征矩阵X输入时空图卷积神经网络，时空图卷积神经网络提取初始特征矩阵的时间特征和空间特征，经过第一层图卷积提取空间特征得到Z，经过一维卷积提取时间特征得到Z_1D-CNN，经过第二层图卷积得到最后的特征H；时空图卷积神经网络的第二层图卷积层的输出输入到两个全连接层，将铝电解阳极效应的预测问题定义为一个二分类问题，利用Softmax分类器得到最终的分类结果；然后利用基于图结构和交叉熵的损失函数更新网络特征参数迭代训练，直至基于图结构和交叉熵的损失函数收敛为最小值得到训练好的时空图卷积神经网络，保存网络参数；

S4：将实时得到的阳极电流数据序列进行步骤S1的预处理，再经过步骤S2得到实时的阳极电流数据序列的初始邻接矩阵A和初始特征矩阵X，将实时的阳极电流数据序列的初始邻接矩阵A和初始特征矩阵X输入训练好的时空图卷积神经网络得到阳极效应预测结果。

进一步的改进，所述步骤S1中，预处理步骤如下：

S11、采用指数平滑法对原始阳极电流数据序列的缺失值进行填补得到填补后的原始阳极电流数据序列；

式中：是某一时刻段的t时刻缺失的数据；x_t-1是t时刻之前时间段真实的测量值；α(0＜α＜1)是系数，α值般根据数据的波动性确定大小或者取不同的值进行试算得到；

S12、使用Z-score的方式对填补后的原始阳极电流数据序列进行归一化，具体实施步骤如下：

对于一组原始阳极电流数据序列X＝(x₁,x₂,...,x_i,...,x_n)，式中：σ是标准差；则是这组数的平均数；z是标准差为单位的离均差，N是序列里的采样点总数，x_i是序列中的采样的数值；数据经过标准化处理后，变量分布被缩放到均值为0，方差为1。

进一步的改进，所述初始邻接矩阵的获得方法如下：

首先将阳极电流拓扑网络表示为无向图G＝(V,E,A)，其中V表示节点集，E表示节点之间的连接关系，网络中的每个节点表示铝电解槽上的一个阳极；阳极电流通道网络的节点数为N；A表示阳极电流通道网络G的邻接矩阵；使用多头加权余弦相似度得到一个自适应邻接矩阵，计算方式如下：

式中表示哈达玛积，具体来说使用m个权重向量，独立计算m个余弦相似度矩阵，并将m个余弦相似度矩阵的平均值作为最终的相似度S_final；/>为两个输入向量E_i和E_j之间的余弦相似度，k是超参数，表示第k个视角，其中每个视角考虑向量中捕获的语义的一部分；E_i为每个样本的初始特征矩阵第i列向量，E_j为每个样本的初始特征矩阵第j列向量，A_ij表示邻接矩阵A的第i行第j列的元素，A的大小为n×n，ε是超参数，用于控制邻接矩阵的稀疏性，w_k是权重向量，在训练时更新，T表示矩阵转置。

进一步的改进，N＝24。

进一步的改进，所述时空图卷积神经网络提取阳极电流信号的时间特征和空间特征的方法如下：

(1)输入数据为表示为集合{X,A,L}；L＝D-A为归一化的拉普拉斯矩阵，D是A的度矩阵；第一层图卷积的计算过程如下：

式中，是归一化邻接矩阵，X是输入特征矩阵，Z是提取空间特征得到的特征矩阵，W₁为第一层图卷积的权重矩阵，在训练过程中需要更新，ReLU是整流线性单元激活函数，用于避免了正轴上的梯度消失，ReLU函数以实数值作为输入，并将限制在0和+∞之间；I_n表示单位矩阵，/>是/>的度矩阵，/>

(2)考虑一维卷积的输入为第一层图卷积的输出Z，一维卷积的输出Z_1D-CNN如下：

Z_1D-CNN＝Sigmoid(MaxPooling(Sigmoid(W₃X))+b₁)) (8)

Sigmoid表示Sigmoid函数，W₃表示一维卷积的权重参数，b₁表示一维卷积的偏置，，MaxPooling表示最大池化；

(3)一维卷积的输出Z_1D-CNN经过第二层图卷积之后的输出H如下：

W₂表示图卷积的权重参数，是归一化邻接矩阵。

进一步的改进，利用Softmax分类器得到最终的分类结果的方法如下：

(1)第二层图卷积层的输出H输入两个全连接层，两层全连接层负责对深度特征进行非线性变换，将特征空间变换到分类空间；

O⁰＝flat(H) (10)

O⁰表示对H的预处理，flat表示将多维数组H扁平化处理，O^p表示第p层全连接层的输出，O^p-1表示第p-1层全连接层的输出，表示第p层全连接层的权重，/>表示第p层全连接层的偏置；公式10是公式11的预处理操作；

使用Softmax分类器将分类结果归一化至各类别之和为1，从而得到各分类结果的概率从而对输入的时间序列数据进行分类：

式中，共有C个类别，为Softmax分类器第i类别的输入，这里为第二层全连接层的输出O²，/>表示类别的预测标签，p_i为第i类别的概率；e表示指数函数；

O²表示预测标签的集合，表示预测标签的集合，/>表示第C个类别的预测标签。

进一步的改进，基于图结构和交叉熵的损失函数构建方法如下：

得到图结构正则化损失式(14)所示，其中α、β都是非负超参数；tr表示矩阵的迹，L＝D-A是图的归一化矩阵，是度矩阵；||·||表示Frobenius范数，即矩阵中每项数的平方和的开方值，n表示邻接矩阵A的阶数，/>表示图结构的损失函数；

然后采用如式(15)所示的交叉熵损失函数作为损失函数：

表示预测损失，loss_c表示交叉熵损失函数，y表示真实标签，/>是预测标签；

基于图结构和交叉熵的损失函数如下所示：

与现有技术相比，本发明的有益效果是：

本发明提出一种准确有效的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，该方案通过对发生效应10min前的效应阳极电流数据和正常槽况10min前阳极电流数据为输入，充分考虑阳极电流信号的时空分布特点，能够实现对阳极效应的提前预测；针对阳极电流通道图结构未知的问题，提出一种自适应学习的邻接矩阵构建方法，将多通道的阳极电流信号建模成以阳极通道为节点、节点间连接权重为边的图结构数据；针对神经网络提取特征时忽略特征空间相关性的不足，提出使用两层图卷积层加一层一维卷积层同时提取时间和空间特征，得到它们对于影响阳极效应的细节信息；最后使用两层全连接层负责对深度特征进行复杂的非线性变换，将特征空间变换到分类空间，利用Softmax分类器得到最终的分类结果。

该方案只需要以短周期的阳极电流数据为输入，不需要采集长周期的生产数据，因为短周期数据具有更明显的趋势和周期性，更容易提取数据特征，从而更容易进行预测和分析。此外，长周期的生产数据一般为一天一个，有些甚至数天一个，数据量较少，且采集时间并不固定，不利于反映阳极效应发生时的实时特征。一方面比传统的阳极效应预测方法更多地考虑了效应发生时的实时性特征，另一方面更多考虑了阳极电流信号的时空信息，且预测精度更高，便于在工程实际中进一步推广，指导操作变量的调整，实现优化控制。用。

附图说明

图1是铝电解槽阳极分布图

图2是本发明的流程图

图3是本发明的自适应学习时空图卷积神经网络结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，为大型铝电解槽的阳极分布俯视图，进电端一侧为A面，非进电端一侧为B面，阳极编号由出铝端到烟道端从小到大排列。24组阳极在空间上具有明显图结构信息，故可以将图表示学习的方法应用到阳极电流信号的分析中来。

如图2所示，为本发明中一种自适应学习时空图卷积神经网络的铝电解阳极效应预测方法，该方法包括以下步骤：

S1：对原始阳极电流数据进行预处理

由于现场传感器可能存在着失灵、损坏等问题，会导致收集的阳极电流数据有缺失部分；并且建立的数据集上所有的样本均为大于0的数值，这对神经网络的训练会造成干扰，使得梯度的方向只固定在一定的方向上。同时为加快算法的训练速度，提高模型的预测精度并避免训练过程出现饱和，有必要进行数据预处理；详细步骤如下：

(1)采用指数平滑法对缺失值进行填补，填补缺失数据使得后期特征提取和预测任务更加准确。

(2)本文使用Z-score的方式对数据进行归一化。具体实施步骤如下：

式中：是某一时刻段的t时刻缺失的数据；x_t-1是t时刻之前时间段真实的测量值；α(0＜α＜1)是系数，α值一般根据数据的波动性确定大小或者取不同的值进行试算。

对于一组原始阳极电流数据序列X＝(x₁,x₂,...,x_i,...,x_n)，式中：σ是标准差；则是这组数的平均数；z是标准差为单位的离均差，N是序列里的采样点总数，x_i是序列中的采样的数值；数据经过标准化处理后，变量分布被缩放到均值为0，方差为1。Z-score方法将多组数据转换为没有单位的分值，将数据标准统一化，消除奇异样本数据对预测结果的影响。数据经过标准化处理后，变量分布被缩放到均值为0，方差为1。

S2：预处理之后的数据经过1×1标准卷积得到初始特征，利用多头加权余弦相似度构建信号的初始邻接矩阵，从而得到网络的输入为初始邻接矩阵和初始特征矩阵。阳极电流数据是典型的多维时间序列数据，多维时间序列中的变量可以看作是图中的节点，它们通过隐藏的空间依赖关系相互连接。因此，利用图卷积神经网络对多变量时间序列数据进行建模是一种很有前途的方法，可以在充分利用时间序列之间的相关性的同时，保留多维时间序列的时间轨迹。大多已有的图卷积神经网络算法都是基于静态图设计的，也即模型对图的建模和表示学习都假设图结构是不会改变的。然而，现实世界中提取的图都自然的是动态的。图中的节点和边都会随着时间而不断的有插入和删除，节点属性和边属性也会随时间而改变。因此构建阳极电流信号时空图时，需要实时考虑整个图结构的变化：具体步骤如下：

(1)时空图卷积网络的输入是初始邻接矩阵和初始特征矩阵，因此首先让预处理之后的数据经过1×1标准卷积得到初始特征X。

(2)首先将阳极电流通道网络被定义为无向图G＝(V,E,A)，其中V表示节点集，网络中的每个节点表示铝电解槽上的一个阳极；n是阳极电流通道网络的节点数(n＝24)；E表示边的集合，表示节点之间的连接；A表示阳极电流通道网络G的邻接矩阵。使用多头加权余弦相似度得到一个自适应邻接矩阵，计算方式如下：

式中表示哈达玛积，具体来说使用m个权重向量(每个权重向量与输入向量具有相同的维度并代表一个视角)独立计算m个余弦相似度矩阵，并将它们的平均值作为最终的相似度S_final；直观地说，/>计算两个输入向量E_i和E_j之间的余弦相似度，k是超参数，表示第k个视角，其中每个视角考虑向量中捕获的语义的一部分；E_i为每个样本的初始特征矩阵第i列向量，E_j为每个样本的初始特征矩阵第j列向量，A_ij表示邻接矩阵A的第i行第j列的元素，A的大小为n×n，ε是超参数，用于控制邻接矩阵的稀疏性，w_k是权重向量，在训练时更新，T表示矩阵转置。

S3：利用时空图卷积神经网络提取信号的时间和空间特征，其中图卷积层提取空间特征，一维卷积层提取时间特征

(1)输入数据为可表示为集合{X,A,L}；L＝D-A为归一化的拉普拉斯矩阵，D是A的度矩阵；第一层图卷积的计算过程如下：

式中，是归一化邻接矩阵，X是输入特征矩阵，Z是输出的特征矩阵，W₁为第一层图卷积的权重矩阵，这在训练过程中需要更新。ReLU(·)是整流线性单元激活函数，使用它是因为它避免了正轴上的梯度消失问题。ReLU函数以实数值作为输入，并将其限制在0和+∞之间。I_n表示单位矩阵，/>是/>的度矩阵，/>

Z_1D-CNN＝Sigmoid(MaxPooling(Sigmoid(W₃X))+b₁)) (8)

(3)可以得到经过第二层图卷积之后的输出如下：

S4：将第二层图卷积层的输出输入两个全连接层，将铝电解阳极效应的预测问题定义为一个二分类问题，利用Softmax分类器得到最终的分类结果。具体步骤如下：

(1)两层全连接层负责对深度特征进行复杂的非线性变换，将特征空间变换到分类空间；flat(·)是一个函数，它将矩阵展平成一行一阶的向量。Ο^p、和/>是第p个全连接层的输出、权重和偏置，p是全连接层的编号。计算过程如下：

O⁰＝flat(H) (10)

Softmax分类器负责将分类结果归一化至各类别之和为1，从而得到各分类结果的概率从而对输入的时间序列数据进行分类。计算过程如下：

S5：利用基于图结构和交叉熵的损失函数更新网络特征参数

6.如权利要求5所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，基于图结构和交叉熵的损失函数构建方法如下：

(1)得到图结构正则化损失式(14)所示，其中α、β都是非负超参数。tr表示矩阵的迹，L＝D-A是图的归一化矩阵，是度矩阵；||·||表示Frobenius范数，即矩阵中每项数的平方和的开方值，n表示邻接矩阵A的阶数，/>表示图结构的损失函数。

然后采用如式(15)所示的交叉熵损失函数作为损失函数：

基于图结构和交叉熵的损失函数如下所示：

(2)数据集包括该铝厂2020年全年4个槽的数据，每个样本包含20个采样点，每个采样点的时间间隔为2分钟，每个正常样本为槽况情况正常下的连续20点样本(槽况标签为0)，每个效应样本为效应发生10min(采样点为5点)前的20点样本(槽况标签为1)，正常样本共计502个，效应样本共计445个。照8:2的比例划分训练集和测试集，实验结果采用准确率(Accuracy)和F1分数作为评价指标，训练的测试集只用于更新这些参数并得到最优参数，测试集输入模型的时候这些参数不变。反向传播以更新模型参数w_k，W₁，W₂，W₃，/>b₁，b₂。

本发明提出一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，以发生效应10min前的效应阳极电流数据和正常槽况10min前阳极电流数据为输入，利用1×1标准卷积将输入投影到潜在空间中，利用多头加权余弦相似度构建信号的初始邻接矩阵，从而得到时空图卷积神经网络的初始输入；利用时空图卷积神经网络提取信号的时间和空间特征，其中图卷积层提取空间特征，一维卷积层提取时间特征；构建基于图结构和交叉熵的损失函数，随着网络迭代更新网络特征参数；将铝电解阳极效应的预测问题定义为一个二分类问题，两层全连接层将特征空间变换到分类空间，利用Softmax分类器得到最终的分类结果。从而在一定的提前时间之前，预测某个样本是否会发生阳极效应，提高分类和预测精度。通过全面综合考虑阳极电流数据反映发生效应时的时间和空间关联，效应预测准确率可进一步提高。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式。

最后应当说明的是，以上实施例仅用于说明本发明的技术方案而非对本发明保护范围的限制。

Claims

1.一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，包括如下步骤：

2.如权利要求1所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，所述步骤S1中，预处理步骤如下：

3.如权利要求1所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，所述初始邻接矩阵的获得方法如下：

式中⊙表示哈达玛积，具体来说使用m个权重向量，独立计算m个余弦相似度矩阵，并将m个余弦相似度矩阵的平均值作为最终的相似度S_final；为两个输入向量E_i和E_j之间的余弦相似度，k是超参数，表示第k个视角，其中每个视角考虑向量中捕获的语义的一部分；E_i为每个样本的初始特征矩阵第i列向量，E_j为每个样本的初始特征矩阵第j列向量，A_ij表示邻接矩阵A的第i行第j列的元素，A的大小为n×n，ε是超参数，用于控制邻接矩阵的稀疏性，w_k是权重向量，在训练时更新，T表示矩阵转置。

4.如权利要求3所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，N＝24。

5.如权利要求1所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，所述时空图卷积神经网络提取阳极电流信号的时间特征和空间特征的方法如下：

Z_1D-CNN＝Sigmoid(MaxPooling(Sigmoid(W₃X))+b₁)) (8)

W₂表示图卷积的权重参数，是归一化邻接矩阵。

6.如权利要求5所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，利用Softmax分类器得到最终的分类结果的方法如下：

O⁰＝flat(H) (10)

7.如权利要求6所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法，其特征在于，基于图结构和交叉熵的损失函数构建方法如下：

然后采用如式(15)所示的交叉熵损失函数作为损失函数：

基于图结构和交叉熵的损失函数如下所示：