CN114021654A - 铝电解槽过热度识别方法、系统、设备及介质 - Google Patents
铝电解槽过热度识别方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN114021654A CN114021654A CN202111304126.4A CN202111304126A CN114021654A CN 114021654 A CN114021654 A CN 114021654A CN 202111304126 A CN202111304126 A CN 202111304126A CN 114021654 A CN114021654 A CN 114021654A
- Authority
- CN
- China
- Prior art keywords
- training
- recognition model
- production
- sample data
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 229910052782 aluminium Inorganic materials 0.000 title claims abstract description 66
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 title claims abstract description 57
- 238000004519 manufacturing process Methods 0.000 claims abstract description 131
- 238000012549 training Methods 0.000 claims abstract description 79
- 238000012545 processing Methods 0.000 claims abstract description 33
- 238000012795 verification Methods 0.000 claims abstract description 29
- 230000007246 mechanism Effects 0.000 claims abstract description 19
- 238000005868 electrolysis reaction Methods 0.000 claims description 47
- 230000006870 function Effects 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 13
- 238000003556 assay Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000013145 classification model Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 23
- 238000004590 computer program Methods 0.000 description 13
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical compound [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 239000003792 electrolyte Substances 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 239000013078 crystal Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Electrolytic Production Of Metals (AREA)
Abstract
本公开实施例中提供了一种铝电解槽过热度识别方法、系统、设备及介质,属于数据处理技术领域,具体包括:选取多种类型的生产数据作为样本数据集;添加标签并进行同构化处理,得到训练集和验证集;构建基于自注意力机制的初始识别模型;利用编码‑解码方法和样本数据集对初始识别模型进行预训练,完成初始化;根据训练集和验证集的加权交叉熵损失训练初始化后的初始识别模型,得到目标识别模型;采集当前时段的生产数据进行同构化处理后输入目标识别模型,得到识别结果。通过本公开的方案,构建基于自注意力机制的初始识别模型,并进行无监督预训练以及使用加权交叉熵损失函数以降低分类模型的有偏性,提高了识别的适应性、识别效率和精准度。
Description
技术领域
本公开实施例涉及数据处理技术领域,尤其涉及一种铝电解槽过热度识别方法、系统、设备及介质。
背景技术
目前,在铝电解生产工艺过程中,过热度是反映铝电解槽当前生产效率与质量的关键指标之一,保持适当的过热度,可以提高电流效率,稳定生产过程,降低生产能耗。现有的过热度测量方法需要对电解质温度和初晶温度分别进行测量,电解质温度一般使用热电偶或者红外测温仪进行在线测量,而初晶温度的测量需要采用采样化验的方式离线进行,其测量过程较为复杂,测量费用高,无法进行实时测量。当前铝电解厂实际生产过程中,主要由工艺人员肉眼观察火眼视频对过热度的进行判断。但由于铝电解槽生产环境温度高,磁场大、腐蚀性强,会对人工判断造成很大的干扰。同时人工判断过热度的过程严重依赖于小部分经验丰富的工艺人员,判断过程存在主观因素,这两个因素导致电解状态不稳定,难以调节到最优的状态,导致电解效率不高,造成资源浪费。
近些年来,随着大数据分析技术的发展,出现了生产数据驱动的方法,基于生产过程数据训练模型来代替工艺人员进行过热度识别。这种处理方法简化了反映铝电解生产过程中不同时刻生产数据变化情况的时间序列信息,缺乏对生产数据动态变化的描述。同时,由于铝电解现场的传感器类别不同,获得的采样频率不一致,数据的表现形式也存在差异,同时由于生产中传感器偶发的故障以及传输过程中环境的干扰,生产数据存在少量缺失,两者均可对模型的识别性能造成干扰;由于实际生产过程中过热度由工艺人员进行决策判断,获得过热度标签代价较大,过热度标签相对生产数据较少,且标签类别数量不均衡,可能导致后继训练的模型判别存在偏差。
可见,现有的铝电解槽过热度识别方法存在适应性、识别效率和精准度较差的问题。
发明内容
有鉴于此,本公开实施例提供一种铝电解槽过热度识别方法、系统、设备及介质,至少部分解决现有技术中存在的适应性、识别效率和精准度较差的问题。
第一方面,本公开实施例提供了一种铝电解槽过热度识别方法,包括:
从铝电解生产数据集中选取多种类型的生产数据作为样本数据集;
对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集;
构建基于自注意力机制的初始识别模型;
利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化;
根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型;
采集当前时段的生产数据进行同构化处理后输入所述目标识别模型,得到识别结果。
根据本公开实施例的一种具体实现方式,所述样本数据集的类型包括生产过程中在线实时获得的监测属性值、生产过程中人工离线化验获得的化验属性值、生产过程中的生产操作至当前时刻的时间值和生产过程中生产状态的8Bit状态值。
根据本公开实施例的一种具体实现方式,所述对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集的步骤,包括:
对所述样本数据集添加标签,并将不同类型的生产数据转换为表现形式和采样频率相同的时间序列数据集合;
将所述时间序列数据集合划分为所述训练集和所述验证集。
根据本公开实施例的一种具体实现方式,所述构建基于自注意力机制的初始识别模型的步骤,包括:
采用卷积神经网络形成残差卷积层,以及,采用多头自注意力机制形成自注意力层;
将所述残差卷积层和所述自注意力层形成所述自注意力模型;
将多个堆叠的自注意力模块与一个softmax分类器形成所述初始识别模型。
根据本公开实施例的一种具体实现方式,所述利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化的步骤,包括:
将所述样本数据集中的多维时间序列转换为高维深度特征;
将所述高维深度特征进行解码并将解码后的特征转换为所述样本数据集对应的近似值;
计算所述样本数据集与其对应的近似值的均方误差损失函数;
根据所述均方误差损失函数初始化所述初始识别模型。
根据本公开实施例的一种具体实现方式,所述根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型的步骤,包括:
根据所述训练集和所述验证集得到加权交叉熵损失函数;
根据所述加权交叉熵损失函数的值训练初始化后的所述初始识别模型,得到所述目标识别模型。
第二方面,本公开实施例提供了一种铝电解槽过热度识别系统,包括:
选取模块,用于从铝电解生产数据集中选取多种类型的生产数据作为样本数据集;
同构化模块,用于对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集;
构建模块,用于构建基于自注意力机制的初始识别模型;
预训练模块,用于利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化;
训练模块,用于根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型;
识别模块,用于采集当前时段的生产数据进行同构化处理后输入所述目标识别模型,得到识别结果。
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的铝电解槽过热度识别方法。
第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的铝电解槽过热度识别方法。
第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的铝电解槽过热度识别方法。
本公开实施例中的铝电解槽过热度识别方案,包括:从铝电解生产数据集中选取多种类型的生产数据作为样本数据集;对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集;构建基于自注意力机制的初始识别模型;利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化;根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型;采集当前时段的生产数据进行同构化处理后输入所述目标识别模型,得到识别结果。
本公开实施例的有益效果为:通过本公开的方案,构造模型训练样本,并进行同构化处理,然后构建基于自注意力机制的初始识别模型,并进行无监督预训练以及使用加权交叉熵损失函数以降低分类模型的有偏性得到目标识别模型,提高了识别的适应性、识别效率和精准度。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本公开实施例提供的一种铝电解槽过热度识别方法的流程示意图;
图2为本公开实施例提供的一种铝电解槽过热度识别方法涉及的数据处理流程示意图;
图3为本公开实施例提供的一种铝电解槽过热度识别系统的结构示意图;
图4为本公开实施例提供的电子设备示意图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
铝电解槽电解质的过热度是指电解质温度与初晶温度的差值。过热度是反映铝电解槽当前生产效率与质量的关键指标之一,保持适当的过热度,可以提高电流效率,稳定生产过程,降低生产能耗。现有的过热度测量方法需要对电解质温度和初晶温度分别进行测量,电解质温度一般使用热电偶或者红外测温仪进行在线测量,而初晶温度的测量需要采用采样化验的方式离线进行,其测量过程较为复杂,测量费用高,无法进行实时测量。当前铝电解厂实际生产过程中,主要由工艺人员肉眼观察火眼视频对过热度的进行判断。但由于铝电解槽生产环境温度高,磁场大、腐蚀性强,会对人工判断造成很大的干扰。同时人工判断过热度的过程严重依赖于小部分经验丰富的工艺人员,判断过程存在主观因素,这两个因素导致电解状态不稳定,难以调节到最优的状态,导致电解效率不高,造成资源浪费。
近些年来,随着大数据分析技术的发展,出现了生产数据驱动的方法,基于生产过程数据训练模型来代替工艺人员进行过热度识别。基于生产过程数据的过热度识别算法主要是依据铝电解生产过程的监测值与对产出原铝的化学分析值,来对铝电解生产过程中的过热度进行识别。铝电解生产过程的监测值与对产出原铝的化学分析值反映了铝电解生产过程中生产过程总体概况以及生产质量,间接反映了过热度的情况。现阶段基于生产过程数据的过热度识别算法主要是采用传统的机器学习算法如规则书、随机森林、极限学习机等,对上述的特征进行建模,得到铝电解生产过程中的过热度。但这些方法属于静态建模方法,假设铝电解生产过程中属性变量波动不大,对于不同采样频率的时间序列数据采用取平均值、标准差与极值的方法来统一采样频率并构建样本集。这种处理方法简化了反映铝电解生产过程中不同时刻生产数据变化情况的时间序列信息,缺乏对生产数据动态变化的描述。
由于铝电解现场的传感器类别不同,获得的采样频率不一致,同时数据的表现形式也存在差异,同时由于生产中传感器偶发的故障以及传输过程中环境的干扰,生产数据存在少量缺失,两者均可对模型的识别性能造成干扰;由于实际生产过程中过热度由工艺人员进行决策判断,获得过热度标签代价较大,过热度标签相对生产数据较少,且标签类别数量不均衡,可能导致后继训练的模型判别存在偏差。
总的来说,当前的基于过程数据的铝电解过热度识别方法存在以下问题与难点:
从铝电解现场获得的数据采样频率不一致,同时存在少量的缺失;
从现场获得的过热度标签数据较少且分布不均匀,可能会对模型训练造成影响;
现有的过热度识别算法没有对生产数据的动态特征进行建模,仅仅考虑了铝电解生产数据的静态特征。
本公开实施例提供一种铝电解槽过热度识别方法,所述方法可以应用于工业生产场景的铝电解槽过热度识别过程。
参见图1,为本公开实施例提供的一种铝电解槽过热度识别方法的流程示意图。如图1所示,所述方法主要包括以下步骤:
S101,从铝电解生产数据集中选取多种类型的生产数据作为样本数据集;
例如,可以先收集铝电解槽在铝电解生产过程中的历史生产数据,考虑到所述生产数据集中包含多种类型的数据,有的数据对后续识别过程会造成干扰,可以根据实际需要从所述生产数据集中选取多种类型的生产数据作为所述样本数据集。
S102,对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集;
具体实施时,考虑到来源传感器的不同,生产数据不同属性的表现形式与采样频率不一定相同,则可以对所述样本数据集添加标签并进行同构化处理,统一数据的形式,然后将统一形式后的数据集划分得到所述训练集和所述验证集。
S103,构建基于自注意力机制的初始识别模型;
具体实施时,考虑到现有的方法都是简化了反映铝电解生产过程中不同时刻生产数据变化情况的时间序列信息,缺乏对生产数据动态变化的描述,则可以构建基于自注意力机制的初始识别模型,通过自注意力机制对所述样本数据集中的动态特征进行识别和提取。
S104,利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化;
具体实施时,考虑到电解生产过程获得的数据绝大部分为无标签数据,为了充分利用铝电解工业现场获得的生产数据,基于编码-解码(Encoder-decoder)思想,采集大量无标签数据对所述初始识别模型进行预训练,以无监督的方式学习到无标签数据中的共有特征。经过无监督训练得到的Encoder层作为模型的预训练模型,其权重作为过热度识别训练的初始化。
S105,根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型;
具体实施时,考虑到铝电解生产过程获得的数据标签分布不均匀,会导致模型的有偏性提高,则可以根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型,降低模型的有偏性,以使得识别结果更精准。
S106,采集当前时段的生产数据进行同构化处理后输入所述目标识别模型,得到识别结果。
例如,在得到所述目标识别模型后,可以采集当前5分钟内的生产数据,并将采集到的生产数据进行同构化处理后输入所述目标识别模型,得到对应的铝电解过热度识别结果。本公开实施例对应的处理流程如图2所示。
本实施例提供的铝电解槽过热度识别方法,通过构造模型训练样本,并进行同构化处理,然后构建基于自注意力机制的初始识别模型,并进行无监督预训练以及使用加权交叉熵损失函数以降低分类模型的有偏性得到目标识别模型,提高了识别的适应性、识别效率和精准度。
在上述实施例的基础上,所述样本数据集的类型包括生产过程中在线实时获得的监测属性值、生产过程中人工离线化验获得的化验属性值、生产过程中的生产操作至当前时刻的时间值和生产过程中生产状态的8Bit状态值。
进一步的,步骤S102所述的,对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集,包括:
对所述样本数据集添加标签,并将不同类型的生产数据转换为表现形式和采样频率相同的时间序列数据集合;
将所述时间序列数据集合划分为所述训练集和所述验证集。
例如,记X={X1,X2,X3,X4}为铝电解厂一天的生产数据,其中表示第i种类型的生产数据,Ti表示每天数据采样点数,Di表示属性数量即维度。生产数据共包含四种类型:数据类型X1表示生产过程中在线实时获得的监测属性值;数据类型X2表示生产过程中人工离线化验获得的化验属性值;数据类型X3表示生产过程中在线实时获得的表示某种操作至今的时间值;数据类型X4表示生产过程中在线实时获得的表示某些生产状态的8Bit状态值。则对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集的步骤可以包括:
X1_emb=X1*Wconv
其中(*)表示卷积操作。
其中Broadcast表示沿时间维的复制操作。
将所有属性维度的位置嵌入相加,得到:
对生产数据进行同构化处理得到相同表现形式,相同采样频率的时间序列生产数据集合。划分得到的生产数据集合,得到训练集样本、验证集样本。
在上述实施例的基础上,步骤S103所述的,构建基于自注意力机制的初始识别模型,包括:
采用卷积神经网络形成残差卷积层,以及,采用多头自注意力机制形成自注意力层;
将所述残差卷积层和所述自注意力层形成所述自注意力模型;
将多个堆叠的自注意力模块与一个softmax分类器形成所述初始识别模型。
例如,在具体识别过程中,设所述自注意力层的输入其中L为输入时间序列数据的时间采样点数,Dk为输入时间序列数据的属性数量即维度。首先采用三个不同的线性变换将输入X分别投影到三个不同的特征空间然后,分别对矩阵Q、矩阵K、矩阵V进行维度分块操作,将属性数量值维度分为h部分,得到其中h为多头注意力的通道数,表示并行计算h个自注意力输出,l∈[1,h]表示第l个自注意力输出。记分别表示矩阵的第i行,即矩阵第i个采样时间点的数据。第l个自注意力输出为计算每一个与所有键向量相似度得到的注意力分布与其相对应值向量的加权求和值。
基于上述公式计算所有自注意力输出并进行拼接,再经过线性变换得到多头注意力输出O为:
Y=LN(O+X)
所述残差卷积层由两层1D卷积层组成,输入Y经过两层卷积层得到其输出,卷积输出与原输入Y相加得到最终输出Z。
Z=Conv(ReLU(Conv(Y)))+Y
残差连接可将某一层的输入信息直接传输至输出,避免了通过卷积层导致的信息损失,保证了模型对复杂数据的表达能力。
在上述实施例的基础上,步骤S104所述的,利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化,包括:
将所述样本数据集中的多维时间序列转换为高维深度特征;
将所述高维深度特征进行解码并将解码后的特征转换为所述样本数据集对应的近似值;
计算所述样本数据集与其对应的近似值的均方误差损失函数;
根据所述均方误差损失函数初始化所述初始识别模型。
具体实施时,Encoder层为前文描述的铝电解初始识别模型一致的多个堆叠的自注意力模块构成,Encoder层负责将经过同构化处理的多维时间序列转换为高维深度特征;Decoder层分为特征解码部分与重建输出部分两个部分构成,特征解码部分为多个堆叠的自注意力模块构成,负责对高维深度特征进行逐步解码。重建输出部分负责将解码的特征转换为Encoder层原始输入生产数据的近似值。
无监督预训练使用原始输入生产数据与其对应的近似值的均方误差损失(MSELoss)作为损失函数:
完成无监督预训练后,取Encoder层的权重参数初始化所述初始识别模型。
进一步的,步骤S105所述的,根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型,包括:
根据所述训练集和所述验证集得到加权交叉熵损失函数;
根据所述加权交叉熵损失函数的值训练初始化后的所述初始识别模型,得到所述目标识别模型。
具体实施时,可以根据所述训练集和所述验证集得到加权交叉熵损失函数,例如,所述加权交叉熵损失函数如下:
其中,C=3为过热度类别的数量,wj为第j个类别损失的权重,wj满足wj∝1/Nj且∑wj=C,Nj为第j类别样本数量。然后根据所述加权交叉熵损失函数的值训练初始化后的所述初始识别模型,得到所述目标识别模型。
与上面的方法实施例相对应,参见图3,本公开实施例还提供了一种铝电解槽过热度识别系统30,包括:
选取模块301,用于从铝电解生产数据集中选取多种类型的生产数据作为样本数据集;
同构化模块302,用于对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集;
构建模块303,用于构建基于自注意力机制的初始识别模型;
预训练模块304,用于利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化;
训练模块305,用于根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型;
识别模块306,用于采集当前时段的生产数据进行同构化处理后输入所述目标识别模型,得到识别结果。
图3所示系统可以对应的执行上述方法实施例中的内容,本实施例未详细描述的部分,参照上述方法实施例中记载的内容,在此不再赘述。
参见图4,本公开实施例还提供了一种电子设备40,该电子设备包括:至少一个处理器以及与该至少一个处理器通信连接的存储器。其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的铝电解槽过热度识别方法。
本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实施例中的铝电解槽过热度识别方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述方法实施例中的铝电解槽过热度识别方法。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备40的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备40可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备40操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备40与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备40,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种铝电解槽过热度识别方法,其特征在于,包括:
从铝电解生产数据集中选取多种类型的生产数据作为样本数据集;
对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集;
构建基于自注意力机制的初始识别模型;
利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化;
根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型;
采集当前时段的生产数据进行同构化处理后输入所述目标识别模型,得到识别结果。
2.根据权利要求1所述的方法,其特征在于,所述样本数据集的类型包括生产过程中在线实时获得的监测属性值、生产过程中人工离线化验获得的化验属性值、生产过程中的生产操作至当前时刻的时间值和生产过程中生产状态的8Bit状态值。
3.根据权利要求2所述的方法,其特征在于,所述对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集的步骤,包括:
对所述样本数据集添加标签,并将不同类型的生产数据转换为表现形式和采样频率相同的时间序列数据集合;
将所述时间序列数据集合划分为所述训练集和所述验证集。
4.根据权利要求1所述的方法,其特征在于,所述构建基于自注意力机制的初始识别模型的步骤,包括:
采用卷积神经网络形成残差卷积层,以及,采用多头自注意力机制形成自注意力层;
将所述残差卷积层和所述自注意力层形成所述自注意力模型;
将多个堆叠的自注意力模块与一个softmax分类器形成所述初始识别模型。
5.根据权利要求3所述的方法,其特征在于,所述利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化的步骤,包括:
将所述样本数据集中的多维时间序列转换为高维深度特征;
将所述高维深度特征进行解码并将解码后的特征转换为所述样本数据集对应的近似值;
计算所述样本数据集与其对应的近似值的均方误差损失函数;
根据所述均方误差损失函数初始化所述初始识别模型。
6.根据权利要求1所述的方法,其特征在于,所述根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型的步骤,包括:
根据所述训练集和所述验证集得到加权交叉熵损失函数;
根据所述加权交叉熵损失函数的值训练初始化后的所述初始识别模型,得到所述目标识别模型。
7.一种铝电解槽过热度识别系统,其特征在于,包括:
选取模块,用于从铝电解生产数据集中选取多种类型的生产数据作为样本数据集;
同构化模块,用于对所述样本数据集添加标签并进行同构化处理,得到训练集和验证集;
构建模块,用于构建基于自注意力机制的初始识别模型;
预训练模块,用于利用编码-解码方法和所述样本数据集对所述初始识别模型进行预训练,完成初始化;
训练模块,用于根据所述训练集和所述验证集的加权交叉熵损失训练初始化后的所述初始识别模型,得到目标识别模型;
识别模块,用于采集当前时段的生产数据进行同构化处理后输入所述目标识别模型,得到识别结果。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述权利要求1-6中任一项所述的铝电解槽过热度识别方法。
9.一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述权利要求1-6中任一项所述的铝电解槽过热度识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111304126.4A CN114021654A (zh) | 2021-11-05 | 2021-11-05 | 铝电解槽过热度识别方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111304126.4A CN114021654A (zh) | 2021-11-05 | 2021-11-05 | 铝电解槽过热度识别方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114021654A true CN114021654A (zh) | 2022-02-08 |
Family
ID=80061145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111304126.4A Pending CN114021654A (zh) | 2021-11-05 | 2021-11-05 | 铝电解槽过热度识别方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114021654A (zh) |
-
2021
- 2021-11-05 CN CN202111304126.4A patent/CN114021654A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111382542B (zh) | 一种面向全寿命周期的公路机电设备寿命预测系统 | |
Fan et al. | A novel deep generative modeling-based data augmentation strategy for improving short-term building energy predictions | |
US20220011760A1 (en) | Model fidelity monitoring and regeneration for manufacturing process decision support | |
CN117458440A (zh) | 基于关联特征融合的生成式电力负荷预测方法及系统 | |
CN112990530A (zh) | 区域人口数量预测方法、装置、电子设备和存储介质 | |
Song et al. | Remaining Useful Life Prediction Method Based on the Spatiotemporal Graph and GCN Nested Parallel Route Model | |
CN115017970A (zh) | 一种基于迁移学习的用气行为异常检测方法及系统 | |
CN117435901B (zh) | 一种工业互联网数据获取方法、系统、终端及储存介质 | |
CN117236666B (zh) | 应急物资需求分析方法及系统 | |
CN118014530A (zh) | 基于gis+bim技术的输变电工程可视化管理方法及系统 | |
CN113723712B (zh) | 风电功率预测方法、系统、设备及介质 | |
CN116960962A (zh) | 一种跨区域数据融合的中长期区域负荷预测方法 | |
CN116894593A (zh) | 光伏发电功率预测方法、装置、电子设备及存储介质 | |
CN114757097B (zh) | 一种线路故障诊断方法及装置 | |
CN114021654A (zh) | 铝电解槽过热度识别方法、系统、设备及介质 | |
CN116894172A (zh) | 一种基于混合预测模型的风电短期功率预测方法 | |
CN116720946A (zh) | 基于循环神经网络的信贷风险预测方法、装置和存储介质 | |
CN113486980B (zh) | 基于自表示字典对的铝电解槽况识别方法、系统及设备 | |
Zhu et al. | A poverty index prediction model for students based on PSO-LightGBM | |
CN114841378A (zh) | 晶圆特征参数预测方法、装置、电子设备及可读存储介质 | |
US20230022253A1 (en) | Fast and accurate prediction methods and systems based on analytical models | |
CN113010687A (zh) | 一种习题标签预测方法、装置、存储介质以及计算机设备 | |
Yuan et al. | Optimized grey RBF prediction model based on genetic algorithm | |
CN116468528B (zh) | 房屋租赁管理方法、装置、电子设备及可读存储介质 | |
CN113191017B (zh) | 虚拟量测模型构建方法、虚拟量测方法、系统、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |