CN116484275A - 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 - Google Patents
基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 Download PDFInfo
- Publication number
- CN116484275A CN116484275A CN202310405505.5A CN202310405505A CN116484275A CN 116484275 A CN116484275 A CN 116484275A CN 202310405505 A CN202310405505 A CN 202310405505A CN 116484275 A CN116484275 A CN 116484275A
- Authority
- CN
- China
- Prior art keywords
- matrix
- space
- anode
- representing
- anode current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000000694 effects Effects 0.000 title claims abstract description 54
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 title claims abstract description 48
- 229910052782 aluminium Inorganic materials 0.000 title claims abstract description 48
- 238000010586 diagram Methods 0.000 title claims abstract description 44
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 42
- 238000005868 electrolysis reaction Methods 0.000 title claims abstract description 42
- 238000012544 monitoring process Methods 0.000 title claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims abstract description 97
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000009826 distribution Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 230000008034 disappearance Effects 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims description 2
- 238000000547 structure data Methods 0.000 abstract description 3
- 230000002123 temporal effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 26
- 238000004519 manufacturing process Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229910001610 cryolite Inorganic materials 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 239000003792 electrolyte Substances 0.000 description 2
- 150000004673 fluoride salts Chemical class 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- IRPGOXJVTQTAAN-UHFFFAOYSA-N 2,2,3,3,3-pentafluoropropanal Chemical compound FC(F)(F)C(F)(F)C=O IRPGOXJVTQTAAN-UHFFFAOYSA-N 0.000 description 1
- KLZUFWVZNOTSEM-UHFFFAOYSA-K Aluminum fluoride Inorganic materials F[Al](F)F KLZUFWVZNOTSEM-UHFFFAOYSA-K 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 238000003723 Smelting Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000004411 aluminium Substances 0.000 description 1
- PNEYBMLMFCGWSK-UHFFFAOYSA-N aluminium oxide Inorganic materials [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 1
- 239000010405 anode material Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- WUKWITHWXAAZEY-UHFFFAOYSA-L calcium difluoride Chemical compound [F-].[F-].[Ca+2] WUKWITHWXAAZEY-UHFFFAOYSA-L 0.000 description 1
- 229910001634 calcium fluoride Inorganic materials 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- TXEYQDLBPFQVAA-UHFFFAOYSA-N tetrafluoromethane Chemical compound FC(F)(F)F TXEYQDLBPFQVAA-UHFFFAOYSA-N 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- C—CHEMISTRY; METALLURGY
- C25—ELECTROLYTIC OR ELECTROPHORETIC PROCESSES; APPARATUS THEREFOR
- C25C—PROCESSES FOR THE ELECTROLYTIC PRODUCTION, RECOVERY OR REFINING OF METALS; APPARATUS THEREFOR
- C25C3/00—Electrolytic production, recovery or refining of metals by electrolysis of melts
- C25C3/06—Electrolytic production, recovery or refining of metals by electrolysis of melts of aluminium
- C25C3/20—Automatic control or regulation of cells
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- Materials Engineering (AREA)
- Metallurgy (AREA)
- Organic Chemistry (AREA)
- Electrolytic Production Of Metals (AREA)
Abstract
本发明公开了一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,包括:对记阳极电流数据进行预处理;将多通道的阳极电流信号建模成以阳极通道为节点、节点间连接权重为边的图结构数据,得到阳极电流信号的初始邻接矩阵;构建时空图卷积神经网络,获取阳极电流数据的空间特征和时间特征;构建图结构损失函数和交叉熵损失函数以更新网络参数;利用Softmax分类器得到最终的分类结果。本发明的方法可以根据已有的阳极电流数据,在提前10分钟的情况下,充分考虑到阳极电流信号的时空分布特点,建立起阳极效应的预测模型,实现对阳极效应的提前预判,降低人力成本,为操作人员处理阳极效应提供依据,有助于提高铝电解过程的智能化水平。
Description
技术领域
本发明涉及冶炼领域,具体为一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法。
背景技术
铝电解的整个生产过程在铝电解槽中进行,其目的是获得高纯度的铝。在现代铝电解工业中,Hall-Heroult法由于其适用性广、操作简便,仍是主要方法,此法是由美国的Hall和法国的Heroult于1886年率先提出的。生产原料为氧化铝(Al2O3)粉末,其熔点为2054℃,沸点为2980℃;辅助原料氟化盐例如氟化铝和氟化钙等,氟盐的主要作用是在电解过程中降低冰晶石溶点,提高铝电解生产过程的经济效益。常用的电解质为熔融冰晶石,其主要成分为Na3AlF6。阳极材料为碳,在950℃至970℃的高温和直流电的作用下,槽内发生反应,在阴极产生铝液。阳极效应预测是现代铝电解工业生产中的研究热点之一,是铝电解生产过程中的一种特殊现象,如果一个或几个阳极发生阳极效应,这些阳极上的电压和阳极电流密度会在短时间内急剧上升,导致电流效率下降,铝电解槽寿命缩短。此外,阳极效应会产生两种全氟化碳气体CF4和C2F6,具有强烈的温室效应,其使全球变暖的潜在值是CO2的6630倍和11100倍。因此,及早检测阳极效应对减少其数量具有重要的理论价值和实际意义。
近年来,依据测试数据建模后进行系统辨识的阳极效应预测方法成果较多。测试数据,既包含反应铝电解过程长期累积槽况的特征参数,主要有出铝量、铝水平、电解质水平、电解温度、分子比、铁含量以及硅含量;也包含了能够反应短时生产操作影响以及效应发生前短时特征的统计参数,主要有槽电压均值、加料间隔指示量均值、以及系列电流均值;基于机器学习的方法模型输入特征参数较少,一定程度上造成了关键特征信息的损失;基于深度学习的方法均取得了良好的预测效果,但是基于数据驱动的方法往往只考虑了阳极电流信号的时序相关性而忽略了多维信号之间的空间依赖,并且现有的图卷积神经网络预测方法很大程度上依赖于预先设计好的的图结构来进行时间序列预测。因此本发明提出了一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,通过对阳极电流数据的预处理提取相应特征值,将多通道的阳极电流信号建模成以阳极通道为节点、节点间连接权重为边的图结构数据;利用自适应学习模块得到阳极电流信号的初始邻接矩阵,并在训练过程中更新;利用时空图卷积模块获取信号的时间和空间特征,特征参数迭代构建图结构损失函数和交叉熵损失函数以更新网络参数。总之,铝电解阳极效应是铝电解过程中不可避免的问题,对生产效率和环境造成了不良影响。通过对铝电解过程中阳极效应的深入研究,可以提出有效的控制方法,从而改善铝电解生产过程的效率和提高环境效益。本发明可以较好地弥补传统效应预测方法忽略数据间的时空相关性问题,并且从时间特征和空间特征两个角度提取阳极电流特征信息,具有较高的应用价值。
发明内容
本发明的目的在于提供一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,包括如下步骤:
S1:对铝电解槽的原始阳极电流数据序列进行预处理,得到预处理后的阳极电流数据序列形成数据集,以8:2的比例将数据集分为训练集和测试集;
S2:将训练集中的阳极电流数据序列经过1×1标准卷积得到初始特征矩阵X,利用多头加权余弦相似度构建阳极电流信号的初始邻接矩阵A,初始邻接矩阵A和初始特征矩阵X作为时空图卷积神经网络的输入;
S3:时空图卷积神经网络的训练:将训练集的初始邻接矩阵A和初始特征矩阵X输入时空图卷积神经网络,时空图卷积神经网络提取初始特征矩阵的时间特征和空间特征,经过第一层图卷积提取空间特征得到Z,经过一维卷积提取时间特征得到Z1D-CNN,经过第二层图卷积得到最后的特征H;时空图卷积神经网络的第二层图卷积层的输出输入到两个全连接层,将铝电解阳极效应的预测问题定义为一个二分类问题,利用Softmax分类器得到最终的分类结果;然后利用基于图结构和交叉熵的损失函数更新网络特征参数迭代训练,直至基于图结构和交叉熵的损失函数收敛为最小值得到训练好的时空图卷积神经网络,保存网络参数;
S4:将实时得到的阳极电流数据序列进行步骤S1的预处理,再经过步骤S2得到实时的阳极电流数据序列的初始邻接矩阵A和初始特征矩阵X,将实时的阳极电流数据序列的初始邻接矩阵A和初始特征矩阵X输入训练好的时空图卷积神经网络得到阳极效应预测结果。
进一步的改进,所述步骤S1中,预处理步骤如下:
S11、采用指数平滑法对原始阳极电流数据序列的缺失值进行填补得到填补后的原始阳极电流数据序列;
式中:是某一时刻段的t时刻缺失的数据;xt-1是t时刻之前时间段真实的测量值;α(0<α<1)是系数,α值般根据数据的波动性确定大小或者取不同的值进行试算得到;
S12、使用Z-score的方式对填补后的原始阳极电流数据序列进行归一化,具体实施步骤如下:
对于一组原始阳极电流数据序列X=(x1,x2,...,xi,...,xn),式中:σ是标准差;则是这组数的平均数;z是标准差为单位的离均差,N是序列里的采样点总数,xi是序列中的采样的数值;数据经过标准化处理后,变量分布被缩放到均值为0,方差为1。
进一步的改进,所述初始邻接矩阵的获得方法如下:
首先将阳极电流拓扑网络表示为无向图G=(V,E,A),其中V表示节点集,E表示节点之间的连接关系,网络中的每个节点表示铝电解槽上的一个阳极;阳极电流通道网络的节点数为N;A表示阳极电流通道网络G的邻接矩阵;使用多头加权余弦相似度得到一个自适应邻接矩阵,计算方式如下:
式中表示哈达玛积,具体来说使用m个权重向量,独立计算m个余弦相似度矩阵,并将m个余弦相似度矩阵的平均值作为最终的相似度Sfinal;/>为两个输入向量Ei和Ej之间的余弦相似度,k是超参数,表示第k个视角,其中每个视角考虑向量中捕获的语义的一部分;Ei为每个样本的初始特征矩阵第i列向量,Ej为每个样本的初始特征矩阵第j列向量,Aij表示邻接矩阵A的第i行第j列的元素,A的大小为n×n,ε是超参数,用于控制邻接矩阵的稀疏性,wk是权重向量,在训练时更新,T表示矩阵转置。
进一步的改进,N=24。
进一步的改进,所述时空图卷积神经网络提取阳极电流信号的时间特征和空间特征的方法如下:
(1)输入数据为表示为集合{X,A,L};L=D-A为归一化的拉普拉斯矩阵,D是A的度矩阵;第一层图卷积的计算过程如下:
式中,是归一化邻接矩阵,X是输入特征矩阵,Z是提取空间特征得到的特征矩阵,W1为第一层图卷积的权重矩阵,在训练过程中需要更新,ReLU是整流线性单元激活函数,用于避免了正轴上的梯度消失,ReLU函数以实数值作为输入,并将限制在0和+∞之间;In表示单位矩阵,/>是/>的度矩阵,/>
(2)考虑一维卷积的输入为第一层图卷积的输出Z,一维卷积的输出Z1D-CNN如下:
Z1D-CNN=Sigmoid(MaxPooling(Sigmoid(W3X))+b1)) (8)
Sigmoid表示Sigmoid函数,W3表示一维卷积的权重参数,b1表示一维卷积的偏置,,MaxPooling表示最大池化;
(3)一维卷积的输出Z1D-CNN经过第二层图卷积之后的输出H如下:
W2表示图卷积的权重参数,是归一化邻接矩阵。
进一步的改进,利用Softmax分类器得到最终的分类结果的方法如下:
(1)第二层图卷积层的输出H输入两个全连接层,两层全连接层负责对深度特征进行非线性变换,将特征空间变换到分类空间;
O0=flat(H) (10)
O0表示对H的预处理,flat表示将多维数组H扁平化处理,Op表示第p层全连接层的输出,Op-1表示第p-1层全连接层的输出,表示第p层全连接层的权重,/>表示第p层全连接层的偏置;公式10是公式11的预处理操作;
使用Softmax分类器将分类结果归一化至各类别之和为1,从而得到各分类结果的概率从而对输入的时间序列数据进行分类:
式中,共有C个类别,为Softmax分类器第i类别的输入,这里为第二层全连接层的输出O2,/>表示类别的预测标签,pi为第i类别的概率;e表示指数函数;
O2表示预测标签的集合,表示预测标签的集合,/>表示第C个类别的预测标签。
进一步的改进,基于图结构和交叉熵的损失函数构建方法如下:
得到图结构正则化损失式(14)所示,其中α、β都是非负超参数;tr表示矩阵的迹,L=D-A是图的归一化矩阵,是度矩阵;||·||表示Frobenius范数,即矩阵中每项数的平方和的开方值,n表示邻接矩阵A的阶数,/>表示图结构的损失函数;
然后采用如式(15)所示的交叉熵损失函数作为损失函数:
表示预测损失,lossc表示交叉熵损失函数,y表示真实标签,/>是预测标签;
基于图结构和交叉熵的损失函数如下所示:
与现有技术相比,本发明的有益效果是:
本发明提出一种准确有效的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,该方案通过对发生效应10min前的效应阳极电流数据和正常槽况10min前阳极电流数据为输入,充分考虑阳极电流信号的时空分布特点,能够实现对阳极效应的提前预测;针对阳极电流通道图结构未知的问题,提出一种自适应学习的邻接矩阵构建方法,将多通道的阳极电流信号建模成以阳极通道为节点、节点间连接权重为边的图结构数据;针对神经网络提取特征时忽略特征空间相关性的不足,提出使用两层图卷积层加一层一维卷积层同时提取时间和空间特征,得到它们对于影响阳极效应的细节信息;最后使用两层全连接层负责对深度特征进行复杂的非线性变换,将特征空间变换到分类空间,利用Softmax分类器得到最终的分类结果。
该方案只需要以短周期的阳极电流数据为输入,不需要采集长周期的生产数据,因为短周期数据具有更明显的趋势和周期性,更容易提取数据特征,从而更容易进行预测和分析。此外,长周期的生产数据一般为一天一个,有些甚至数天一个,数据量较少,且采集时间并不固定,不利于反映阳极效应发生时的实时特征。一方面比传统的阳极效应预测方法更多地考虑了效应发生时的实时性特征,另一方面更多考虑了阳极电流信号的时空信息,且预测精度更高,便于在工程实际中进一步推广,指导操作变量的调整,实现优化控制。用。
附图说明
图1是铝电解槽阳极分布图
图2是本发明的流程图
图3是本发明的自适应学习时空图卷积神经网络结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为大型铝电解槽的阳极分布俯视图,进电端一侧为A面,非进电端一侧为B面,阳极编号由出铝端到烟道端从小到大排列。24组阳极在空间上具有明显图结构信息,故可以将图表示学习的方法应用到阳极电流信号的分析中来。
如图2所示,为本发明中一种自适应学习时空图卷积神经网络的铝电解阳极效应预测方法,该方法包括以下步骤:
S1:对原始阳极电流数据进行预处理
由于现场传感器可能存在着失灵、损坏等问题,会导致收集的阳极电流数据有缺失部分;并且建立的数据集上所有的样本均为大于0的数值,这对神经网络的训练会造成干扰,使得梯度的方向只固定在一定的方向上。同时为加快算法的训练速度,提高模型的预测精度并避免训练过程出现饱和,有必要进行数据预处理;详细步骤如下:
(1)采用指数平滑法对缺失值进行填补,填补缺失数据使得后期特征提取和预测任务更加准确。
(2)本文使用Z-score的方式对数据进行归一化。具体实施步骤如下:
式中:是某一时刻段的t时刻缺失的数据;xt-1是t时刻之前时间段真实的测量值;α(0<α<1)是系数,α值一般根据数据的波动性确定大小或者取不同的值进行试算。
对于一组原始阳极电流数据序列X=(x1,x2,...,xi,...,xn),式中:σ是标准差;则是这组数的平均数;z是标准差为单位的离均差,N是序列里的采样点总数,xi是序列中的采样的数值;数据经过标准化处理后,变量分布被缩放到均值为0,方差为1。Z-score方法将多组数据转换为没有单位的分值,将数据标准统一化,消除奇异样本数据对预测结果的影响。数据经过标准化处理后,变量分布被缩放到均值为0,方差为1。
S2:预处理之后的数据经过1×1标准卷积得到初始特征,利用多头加权余弦相似度构建信号的初始邻接矩阵,从而得到网络的输入为初始邻接矩阵和初始特征矩阵。阳极电流数据是典型的多维时间序列数据,多维时间序列中的变量可以看作是图中的节点,它们通过隐藏的空间依赖关系相互连接。因此,利用图卷积神经网络对多变量时间序列数据进行建模是一种很有前途的方法,可以在充分利用时间序列之间的相关性的同时,保留多维时间序列的时间轨迹。大多已有的图卷积神经网络算法都是基于静态图设计的,也即模型对图的建模和表示学习都假设图结构是不会改变的。然而,现实世界中提取的图都自然的是动态的。图中的节点和边都会随着时间而不断的有插入和删除,节点属性和边属性也会随时间而改变。因此构建阳极电流信号时空图时,需要实时考虑整个图结构的变化:具体步骤如下:
(1)时空图卷积网络的输入是初始邻接矩阵和初始特征矩阵,因此首先让预处理之后的数据经过1×1标准卷积得到初始特征X。
(2)首先将阳极电流通道网络被定义为无向图G=(V,E,A),其中V表示节点集,网络中的每个节点表示铝电解槽上的一个阳极;n是阳极电流通道网络的节点数(n=24);E表示边的集合,表示节点之间的连接;A表示阳极电流通道网络G的邻接矩阵。使用多头加权余弦相似度得到一个自适应邻接矩阵,计算方式如下:
式中表示哈达玛积,具体来说使用m个权重向量(每个权重向量与输入向量具有相同的维度并代表一个视角)独立计算m个余弦相似度矩阵,并将它们的平均值作为最终的相似度Sfinal;直观地说,/>计算两个输入向量Ei和Ej之间的余弦相似度,k是超参数,表示第k个视角,其中每个视角考虑向量中捕获的语义的一部分;Ei为每个样本的初始特征矩阵第i列向量,Ej为每个样本的初始特征矩阵第j列向量,Aij表示邻接矩阵A的第i行第j列的元素,A的大小为n×n,ε是超参数,用于控制邻接矩阵的稀疏性,wk是权重向量,在训练时更新,T表示矩阵转置。
S3:利用时空图卷积神经网络提取信号的时间和空间特征,其中图卷积层提取空间特征,一维卷积层提取时间特征
(1)输入数据为可表示为集合{X,A,L};L=D-A为归一化的拉普拉斯矩阵,D是A的度矩阵;第一层图卷积的计算过程如下:
式中,是归一化邻接矩阵,X是输入特征矩阵,Z是输出的特征矩阵,W1为第一层图卷积的权重矩阵,这在训练过程中需要更新。ReLU(·)是整流线性单元激活函数,使用它是因为它避免了正轴上的梯度消失问题。ReLU函数以实数值作为输入,并将其限制在0和+∞之间。In表示单位矩阵,/>是/>的度矩阵,/>
(2)考虑一维卷积的输入为第一层图卷积的输出Z,一维卷积的输出Z1D-CNN如下:
Z1D-CNN=Sigmoid(MaxPooling(Sigmoid(W3X))+b1)) (8)
(3)可以得到经过第二层图卷积之后的输出如下:
S4:将第二层图卷积层的输出输入两个全连接层,将铝电解阳极效应的预测问题定义为一个二分类问题,利用Softmax分类器得到最终的分类结果。具体步骤如下:
(1)两层全连接层负责对深度特征进行复杂的非线性变换,将特征空间变换到分类空间;flat(·)是一个函数,它将矩阵展平成一行一阶的向量。Οp、和/>是第p个全连接层的输出、权重和偏置,p是全连接层的编号。计算过程如下:
O0=flat(H) (10)
Softmax分类器负责将分类结果归一化至各类别之和为1,从而得到各分类结果的概率从而对输入的时间序列数据进行分类。计算过程如下:
式中,共有C个类别,为Softmax分类器第i类别的输入,这里为第二层全连接层的输出O2,/>表示类别的预测标签,pi为第i类别的概率;e表示指数函数;
S5:利用基于图结构和交叉熵的损失函数更新网络特征参数
O2表示预测标签的集合,表示预测标签的集合,/>表示第C个类别的预测标签。
6.如权利要求5所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,基于图结构和交叉熵的损失函数构建方法如下:
(1)得到图结构正则化损失式(14)所示,其中α、β都是非负超参数。tr表示矩阵的迹,L=D-A是图的归一化矩阵,是度矩阵;||·||表示Frobenius范数,即矩阵中每项数的平方和的开方值,n表示邻接矩阵A的阶数,/>表示图结构的损失函数。
然后采用如式(15)所示的交叉熵损失函数作为损失函数:
表示预测损失,lossc表示交叉熵损失函数,y表示真实标签,/>是预测标签;
基于图结构和交叉熵的损失函数如下所示:
(2)数据集包括该铝厂2020年全年4个槽的数据,每个样本包含20个采样点,每个采样点的时间间隔为2分钟,每个正常样本为槽况情况正常下的连续20点样本(槽况标签为0),每个效应样本为效应发生10min(采样点为5点)前的20点样本(槽况标签为1),正常样本共计502个,效应样本共计445个。照8:2的比例划分训练集和测试集,实验结果采用准确率(Accuracy)和F1分数作为评价指标,训练的测试集只用于更新这些参数并得到最优参数,测试集输入模型的时候这些参数不变。反向传播以更新模型参数wk,W1,W2,W3,/>b1,b2。
本发明提出一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,以发生效应10min前的效应阳极电流数据和正常槽况10min前阳极电流数据为输入,利用1×1标准卷积将输入投影到潜在空间中,利用多头加权余弦相似度构建信号的初始邻接矩阵,从而得到时空图卷积神经网络的初始输入;利用时空图卷积神经网络提取信号的时间和空间特征,其中图卷积层提取空间特征,一维卷积层提取时间特征;构建基于图结构和交叉熵的损失函数,随着网络迭代更新网络特征参数;将铝电解阳极效应的预测问题定义为一个二分类问题,两层全连接层将特征空间变换到分类空间,利用Softmax分类器得到最终的分类结果。从而在一定的提前时间之前,预测某个样本是否会发生阳极效应,提高分类和预测精度。通过全面综合考虑阳极电流数据反映发生效应时的时间和空间关联,效应预测准确率可进一步提高。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式。
最后应当说明的是,以上实施例仅用于说明本发明的技术方案而非对本发明保护范围的限制。
Claims (7)
1.一种基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,包括如下步骤:
S1:对铝电解槽的原始阳极电流数据序列进行预处理,得到预处理后的阳极电流数据序列形成数据集,以8:2的比例将数据集分为训练集和测试集;
S2:将训练集中的阳极电流数据序列经过1×1标准卷积得到初始特征矩阵X,利用多头加权余弦相似度构建阳极电流信号的初始邻接矩阵A,初始邻接矩阵A和初始特征矩阵X作为时空图卷积神经网络的输入;
S3:时空图卷积神经网络的训练:将训练集的初始邻接矩阵A和初始特征矩阵X输入时空图卷积神经网络,时空图卷积神经网络提取初始特征矩阵的时间特征和空间特征,经过第一层图卷积提取空间特征得到Z,经过一维卷积提取时间特征得到Z1D-CNN,经过第二层图卷积得到最后的特征H;时空图卷积神经网络的第二层图卷积层的输出输入到两个全连接层,将铝电解阳极效应的预测问题定义为一个二分类问题,利用Softmax分类器得到最终的分类结果;然后利用基于图结构和交叉熵的损失函数更新网络特征参数迭代训练,直至基于图结构和交叉熵的损失函数收敛为最小值得到训练好的时空图卷积神经网络,保存网络参数;
S4:将实时得到的阳极电流数据序列进行步骤S1的预处理,再经过步骤S2得到实时的阳极电流数据序列的初始邻接矩阵A和初始特征矩阵X,将实时的阳极电流数据序列的初始邻接矩阵A和初始特征矩阵X输入训练好的时空图卷积神经网络得到阳极效应预测结果。
2.如权利要求1所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,所述步骤S1中,预处理步骤如下:
S11、采用指数平滑法对原始阳极电流数据序列的缺失值进行填补得到填补后的原始阳极电流数据序列;
式中:是某一时刻段的t时刻缺失的数据;xt-1是t时刻之前时间段真实的测量值;α(0<α<1)是系数,α值般根据数据的波动性确定大小或者取不同的值进行试算得到;
S12、使用Z-score的方式对填补后的原始阳极电流数据序列进行归一化,具体实施步骤如下:
对于一组原始阳极电流数据序列X=(x1,x2,...,xi,...,xn),式中:σ是标准差;则是这组数的平均数;z是标准差为单位的离均差,N是序列里的采样点总数,xi是序列中的采样的数值;数据经过标准化处理后,变量分布被缩放到均值为0,方差为1。
3.如权利要求1所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,所述初始邻接矩阵的获得方法如下:
首先将阳极电流拓扑网络表示为无向图G=(V,E,A),其中V表示节点集,E表示节点之间的连接关系,网络中的每个节点表示铝电解槽上的一个阳极;阳极电流通道网络的节点数为N;A表示阳极电流通道网络G的邻接矩阵;使用多头加权余弦相似度得到一个自适应邻接矩阵,计算方式如下:
式中⊙表示哈达玛积,具体来说使用m个权重向量,独立计算m个余弦相似度矩阵,并将m个余弦相似度矩阵的平均值作为最终的相似度Sfinal;为两个输入向量Ei和Ej之间的余弦相似度,k是超参数,表示第k个视角,其中每个视角考虑向量中捕获的语义的一部分;Ei为每个样本的初始特征矩阵第i列向量,Ej为每个样本的初始特征矩阵第j列向量,Aij表示邻接矩阵A的第i行第j列的元素,A的大小为n×n,ε是超参数,用于控制邻接矩阵的稀疏性,wk是权重向量,在训练时更新,T表示矩阵转置。
4.如权利要求3所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,N=24。
5.如权利要求1所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,所述时空图卷积神经网络提取阳极电流信号的时间特征和空间特征的方法如下:
(1)输入数据为表示为集合{X,A,L};L=D-A为归一化的拉普拉斯矩阵,D是A的度矩阵;第一层图卷积的计算过程如下:
式中,是归一化邻接矩阵,X是输入特征矩阵,Z是提取空间特征得到的特征矩阵,W1为第一层图卷积的权重矩阵,在训练过程中需要更新,ReLU是整流线性单元激活函数,用于避免了正轴上的梯度消失,ReLU函数以实数值作为输入,并将限制在0和+∞之间;In表示单位矩阵,/>是/>的度矩阵,/>
(2)考虑一维卷积的输入为第一层图卷积的输出Z,一维卷积的输出Z1D-CNN如下:
Z1D-CNN=Sigmoid(MaxPooling(Sigmoid(W3X))+b1)) (8)
Sigmoid表示Sigmoid函数,W3表示一维卷积的权重参数,b1表示一维卷积的偏置,,MaxPooling表示最大池化;
(3)一维卷积的输出Z1D-CNN经过第二层图卷积之后的输出H如下:
W2表示图卷积的权重参数,是归一化邻接矩阵。
6.如权利要求5所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,利用Softmax分类器得到最终的分类结果的方法如下:
(1)第二层图卷积层的输出H输入两个全连接层,两层全连接层负责对深度特征进行非线性变换,将特征空间变换到分类空间;
O0=flat(H) (10)
O0表示对H的预处理,flat表示将多维数组H扁平化处理,Op表示第p层全连接层的输出,Op-1表示第p-1层全连接层的输出,表示第p层全连接层的权重,/>表示第p层全连接层的偏置;公式10是公式11的预处理操作;
使用Softmax分类器将分类结果归一化至各类别之和为1,从而得到各分类结果的概率从而对输入的时间序列数据进行分类:
式中,共有C个类别,为Softmax分类器第i类别的输入,这里为第二层全连接层的输出O2,/>表示类别的预测标签,pi为第i类别的概率;e表示指数函数;
O2表示预测标签的集合,表示预测标签的集合,/>表示第C个类别的预测标签。
7.如权利要求6所述的基于自适应时空图卷积神经网络的铝电解阳极效应监测方法,其特征在于,基于图结构和交叉熵的损失函数构建方法如下:
得到图结构正则化损失式(14)所示,其中α、β都是非负超参数;tr表示矩阵的迹,L=D-A是图的归一化矩阵,是度矩阵;||·||表示Frobenius范数,即矩阵中每项数的平方和的开方值,n表示邻接矩阵A的阶数,/>表示图结构的损失函数;
然后采用如式(15)所示的交叉熵损失函数作为损失函数:
表示预测损失,lossc表示交叉熵损失函数,y表示真实标签,/>是预测标签;
基于图结构和交叉熵的损失函数如下所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310405505.5A CN116484275B (zh) | 2023-04-17 | 2023-04-17 | 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310405505.5A CN116484275B (zh) | 2023-04-17 | 2023-04-17 | 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116484275A true CN116484275A (zh) | 2023-07-25 |
CN116484275B CN116484275B (zh) | 2023-12-22 |
Family
ID=87211332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310405505.5A Active CN116484275B (zh) | 2023-04-17 | 2023-04-17 | 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484275B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117272244A (zh) * | 2023-11-21 | 2023-12-22 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647834A (zh) * | 2018-05-24 | 2018-10-12 | 浙江工业大学 | 一种基于卷积神经网络结构的交通流预测方法 |
CN115169724A (zh) * | 2022-07-27 | 2022-10-11 | 电子科技大学长三角研究院(湖州) | 一种基于时空图卷积神经网络的径流预测方法 |
-
2023
- 2023-04-17 CN CN202310405505.5A patent/CN116484275B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647834A (zh) * | 2018-05-24 | 2018-10-12 | 浙江工业大学 | 一种基于卷积神经网络结构的交通流预测方法 |
CN115169724A (zh) * | 2022-07-27 | 2022-10-11 | 电子科技大学长三角研究院(湖州) | 一种基于时空图卷积神经网络的径流预测方法 |
Non-Patent Citations (2)
Title |
---|
XIAOXUE WAN等: "A novel multiple temporal‑spatial convolution network for anode current signals classification", INTERNATIONAL JOURNAL OF MACHINE LEARNING AND CYBERNETICS, vol. 13, pages 3299 * |
XUXIANG TA等: "Adaptive Spatio-temporal Graph Neural Network for traffic forecasting", KNOWLEDGE-BASED SYSTEMS, vol. 242, pages 108199 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117272244A (zh) * | 2023-11-21 | 2023-12-22 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
CN117272244B (zh) * | 2023-11-21 | 2024-03-15 | 中国石油大学(华东) | 一种融合特征提取和自适应构图的软测量建模方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116484275B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109060001B (zh) | 一种基于特征迁移学习的多工况过程软测量建模方法 | |
CN111860612B (zh) | 无监督高光谱图像隐低秩投影学习特征提取方法 | |
CN110414788B (zh) | 一种基于相似日和改进lstm的电能质量预测方法 | |
CN114926746B (zh) | 基于多尺度差分特征注意力机制的sar图像变化检测方法 | |
CN112564098B (zh) | 基于时间卷积神经网络的高比例光伏配电网电压预测方法 | |
CN106778863A (zh) | 基于Fisher判别字典学习的仓库货品识别方法 | |
CN108052975B (zh) | 一种基于核主元和神经网络的车辆运行实时工况预测方法 | |
CN116484275B (zh) | 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法 | |
CN113537566B (zh) | 一种基于dccso优化深度学习模型的超短期风电功率预测方法 | |
CN112285376A (zh) | 一种基于cnn-lstm的风速预测方法 | |
CN114462718A (zh) | 基于时间滑动窗口的cnn-gru风电功率预测方法 | |
CN111008726A (zh) | 一种电力负荷预测中类图片转换方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN116821832A (zh) | 针对高压工商业用户用电负荷的异常数据辨识与修正方法 | |
CN113984989A (zh) | 一种基于拉普拉斯降维的水产养殖水质异常检测方法 | |
CN114326639B (zh) | 基于混合注意力卷积神经网络的工业过程性能评估方法 | |
CN113221614A (zh) | 一种基于混合神经网络的电网绝缘子破损图像识别方法 | |
CN116630748A (zh) | 一种基于熔盐图像特征的稀土电解槽状态多参数监测方法 | |
CN114879628A (zh) | 基于对抗局部最大均值差异的多模态工业过程故障诊断方法 | |
CN114596726B (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN113570161B (zh) | 基于宽度迁移学习的搅拌釜反应物浓度预测模型构建方法 | |
CN109324595B (zh) | 一种基于增量pca的工业监测数据分类方法 | |
CN117392450A (zh) | 一种基于进化多尺度特征学习的钢铁材料质量解析方法 | |
CN110163437B (zh) | 基于DPK-means的日前光伏发电功率预测方法 | |
CN109598283B (zh) | 一种基于半监督极限学习机的铝电解过热度识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |