CN110739031B - 一种冶金烧结过程的有监督预测方法、装置及存储介质 - Google Patents

一种冶金烧结过程的有监督预测方法、装置及存储介质 Download PDF

Info

Publication number
CN110739031B
CN110739031B CN201911127970.7A CN201911127970A CN110739031B CN 110739031 B CN110739031 B CN 110739031B CN 201911127970 A CN201911127970 A CN 201911127970A CN 110739031 B CN110739031 B CN 110739031B
Authority
CN
China
Prior art keywords
supervised
quality
boltzmann machine
training
limited boltzmann
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911127970.7A
Other languages
English (en)
Other versions
CN110739031A (zh
Inventor
袁小锋
顾永杰
王雅琳
孙备
阳春华
桂卫华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201911127970.7A priority Critical patent/CN110739031B/zh
Publication of CN110739031A publication Critical patent/CN110739031A/zh
Application granted granted Critical
Publication of CN110739031B publication Critical patent/CN110739031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Abstract

本发明公开了一种冶金烧结过程的有监督预测方法,按照时间序列采集烧结过程中的相关过程变量,将过程变量与对应时刻的质量变量组合,构造训练样本;继续采样过程变量,将过程变量与对应前一采样时刻的质量变量组合,构造测试样本输入,并对训练样本以及测试样本进行数据预处理;构建有监督受限玻尔兹曼机,利用L个有监督受限玻尔兹曼机及一个全连接层共同组成有监督深度置信网络模型,利用极大化似然原理,通过CD‑K采样方法,预训练所提出的有监督受限玻尔兹曼机,利用反向传播微调多个有监督受限玻尔兹曼机堆叠组成的深度置信网络模型,获得模型参数;将测试样本输入到已经训练好的有监督深度置信网络模型中,获得对应的产品质量预测值。

Description

一种冶金烧结过程的有监督预测方法、装置及存储介质
技术领域
本发明涉及钢铁冶炼技术领域,尤其涉及一种冶金烧结过程的有监督预测方法、装置及存储介质。
背景技术
钢铁生产是典型的大型连续复杂生产工业流程之一,该过程涉及到复杂的化学、物理变化过程。完整的钢铁生产过程涉及到多个生产工序,原始矿料经过采矿、选矿、烧结、炼钢、轧钢等多个生产流程后获得不同规格的钢铁产品。我国钢铁冶金工业由于自动化程度不足,在实际生产过程中存在着污染大、能耗高、生产环境恶劣、生产关系复杂、产品质量波动大、生产环节时滞大等问题。其中烧结作为现代钢铁生产过程中为高炉炼钢提供人造富矿的重要环节,烧结矿的性能直接影响到生产的成本和钢铁产能。因此对烧结矿性能的实时在线监测对于指导烧结生产控制、改善烧结矿质量、降低高炉冶炼成本、提高高炉冶炼效率具有重要意义。烧结生产包括配料、混料、烧结、破碎、冷却等主要生产流程。具体为红土矿、石灰等原料经配料、混料,进入烧结台车,经烧结、破碎、冷却,最后送入高炉进行后续的炼钢流程。由于烧结现场恶劣的生产环境、高昂的测量成本、监测准确率等原因,导致生产过程所需实时监测的质量变量不能够直接实时获取。因此,必须利用软测量的方式,通过易于监测到的过程变量与难以在线监测的质量变量之间的关系,建立质量预测模型,对所需监测的质量变量进行实时预测。
随着现代钢铁冶金工业的自动化升级改造以及生产规模的扩大,越来越多的过程数据能够被实时监测,但由于传统的机理分析建模方法需要大量的先验知识和对生产对象的深刻理解,尤其是现代工业生产过程都向大型化、规模化、复杂化发展,这急剧地加大了机理建模的困难度。
深度置信网络作为深度学习模型的经典算法之一,凭借着多层神经网络对输入数据由低到高的进行逐层特征抽象提取,最大程度地利用监测到的海量生产数据中包含的生产过程信息及过程变量与质量变量间的复杂非线性关系,同时模型的不断学习和更新能够较好的适应现代工业生产中频繁的工况调整和优化,能够较好地预测相关的质量变量。但是由于目前的传统的深度置信网络仅仅关注于过程数据本身的特征提取,而忽略了输出质量变量中所包含的特征信息,从而使得网络模型的特征提取具有局限性,进而不能够获得满意的预测效果。
发明内容
因此,本发明提供一种能够缓解上述问题的基于质量信息融合的有监督深度置信网络预测烧结过程产品质量的方法,针对现有的深度置信网络模型仅仅关注于过程数据本身的特征提取,忽略了过程数据中与质量变量相关的特征信息以及质量变量本身所包含的特征信息,通过引入质量变量,指导网络模型对与质量变量相关的特征进行提取,大幅提高了预测的精度。
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明公开了一种
冶金烧结过程的有监督预测方法,包括以下步骤:
步骤a、按照时间序列采集烧结过程中的相关过程变量,将过程变量与对应时刻的质量变量组合,构造训练样本;继续采样过程变量,将过程变量与对应前一采样时刻的质量变量组合,构造测试样本,并对训练样本以及测试样本进行数据预处理;
步骤b、构建有监督受限玻尔兹曼机,利用L个有监督受限玻尔兹曼机及一个全连接层共同组成有监督深度置信网络模型,其中,L为大于等于3的自然数;
步骤c、利用极大化似然原理,通过CD-K采样方法,预训练所提出的有监督受限玻尔兹曼机,之后利用反向传播微调多个有监督受限玻尔兹曼机堆叠组成的深度置信网络模型,获得模型参数;
步骤d、将测试样本输入到已经训练好的有监督深度置信网络模型中,获得对应的产品质量预测值。
更进一步地,从烧结生产过程中采集到与生产相关的质量变量以及对应的过程变量,并将二者组合,构造训练样本,并在测试时以类似方式构造测试样本,所述过程包括以下步骤:
步骤a0、按一定时间间隔顺序采集系统指定时间序列内的t时刻的过程变量
Figure GDA0002307954310000021
Figure GDA0002307954310000022
及对应t时刻的质量变量
Figure GDA0002307954310000023
其中,
Figure GDA0002307954310000024
表示过程变量xt的第i(i=1,2…nx)个特征,t=1,2…T表示从1到T时刻的数据,T表示指定时间序列内所有样本的个数;
步骤a1、将过程变量与对应采样时刻的质量变量按照采样时刻进行匹配,然后将匹配成功的质量变量加入到对应过程变量的最后一个变量的后面,得到训练样本,也将该训练样本称为第一有监督受限玻尔兹曼机的输入样本,记该训练样本为:
Figure GDA0002307954310000031
其中,t是当前采样时刻,m是组合训练样本的第m维度,nv是组合训练样本的维度,nx的过程变量的维度,ny是质量变量的维度,在质量预测中ny为1;
步骤a2、再次采样烧结过程的相关过程变量,考虑到前后相邻两个时刻的生产质量具有密切的关联,将过程变量对应的前一采样时刻的质量变量进行组合,得到测试样本,记测试样本为:
Figure GDA0002307954310000032
其中,s表示第s个测试样本,S表示测试样本的总数量;
步骤a3、对训练样本与对应采样时刻的质量变量进行数据预处理:
Figure GDA0002307954310000033
Figure GDA0002307954310000034
其中,
Figure GDA0002307954310000035
表示训练样本的第m个变量,v(max)m和v(min)m分别表示训练样本中的第m个变量的最大值和最小值,y(max)和y(min)则分别表示对应采样时刻的质量变量的最大值和最小值;
步骤a4、对测试样本与对应前一采样时刻的质量变量以与所述步骤a3的方式相同的方法进行数据预处理。
更进一步地,构建的有监督深度置信网络模型的结构进一步包括:
所述有监督深度置信网络模型由L个(L≥3)有监督受限玻尔兹曼机模型及一个全连接层依次堆叠组成,有监督受限玻尔兹曼机模型是通过将受限玻尔兹曼机的显层输入进行扩展,引入与质量信息相关的有监督信息,进而指导网络模型的学习。
更进一步地,利用过程变量与质量变量组合而成的有监督输入样本受限对第一个受限玻尔兹曼机进行有监督训练,具体步骤包括:
步骤c1、基于有监督受限玻尔兹曼机能量函数,推导出第一有监督受限玻尔兹曼机的输入样本的概率分布,利用极大化似然原理,通过CD-K交替采样的方式更新网络参数,最大化这一概率分布,进而获得第一个有监督受限玻尔兹曼机的超参数并提取第一隐层特征数据;
步骤c2、将第一隐层特征数据与当前采样时刻的质量变量进行组合,构造第二有监督受限玻尔兹曼机的输入样本,利用该有监督输入样本推导出对应的概率分布,通过CD-K交替采样的方式最大化该有监督输入样本的概率分布,进而获得第二个有监督受限玻尔兹曼机的超参数并提取第二隐层特征数据;
步骤c3、重复所述步骤c2,用l=1,2…,L表示有监督受限玻尔兹曼机在序列中的位置,对于后续有监督受限玻尔兹曼机(即l≥2时)的训练,将第l-1隐层特征数据与当前采样时刻的质量变量进行组合,构造第l有监督受限玻尔兹曼机的有监督输入样本,利用第l有监督受限玻尔兹曼机推导出该有监督输入样本的概率分布,通过CD-K交替采样的方式最大化第l有监督受限玻尔兹曼机的输入样本的概率分布,进而获得第l个有监督受限玻尔兹曼机的超参数并提取第l隐层特征数据;
步骤c4、将预训练好的L个有监督受限玻尔兹曼机与全连接的输出层进行连接,构成有监督深度置信网络结构,在预训练获得的参数基础上,通过反向传播算法对网络参数进行微调,最终通过输出层,输出网络的预测结果。
更进一步地,通过在第l个有监督受限玻尔兹曼机的显层输入
Figure GDA0002307954310000041
和隐层输出
Figure GDA0002307954310000042
之间使用CD-K交替采样使得似然函数P(vt,[l])最大化,依据能量函数:
Figure GDA0002307954310000043
对于多个有监督受限玻尔兹曼机(L个)的训练,上述过程可表示为:
Figure GDA0002307954310000044
其中,vt,[l]
Figure GDA0002307954310000045
分别表示某个样本vt,[l]及其对应的似然函数P(vt,[l])关于θ[l]中各个参数的偏导数,θ[l]={wij,wlj,ai,cI,bjiIj}表示第l个有监督受限玻尔兹曼机显层vt,[l]到隐层ht,[l]的各变量之间的参数集合,包括显层x、y与隐层h间的权重wij、wlj,显层单元x、y及隐层单元h的偏差ai、cI、bj,和各自对应的高斯单元的方差σi、βI、γj,通过CD-K算法对以上偏导数进行计算,完成参数的更新,进而达到最大化似然函数的学习目的。
更进一步地,完成所述的L个有监督受限玻尔兹曼机的预训练后,还应通过以下步骤完成网络的微调训练过程:
基于第L个有监督受限玻尔兹曼机的隐层输出,利用全连接层获得质量变量的预测值
Figure GDA0002307954310000051
根据
Figure GDA0002307954310000052
构建深度置信网络的损失函数
Figure GDA0002307954310000053
其中,T为输入训练样本个数,yt是对应第t个训练样本对应采样时刻的质量变量真实值,
Figure GDA0002307954310000054
是对应第t个训练样本对应采样时刻的质量变量预测值;根据所述损失函数,利用反向传播算法对有监督深度置信网络进行参数的微调,直至网络收敛到目标范围。
更进一步地,在所述步骤d中,利用所建的有监督深度置信网络模型预测产品质量的具体方法包括:
将测试样本vT+s代入到训练好的的有监督深度置信网络模型中,通过前向传播算法,得到预测结果
Figure GDA0002307954310000055
本发明进一步提供了一种电子装置,包括:处理器;以及,存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任一项所述的有监督预测方法。
本发明进一步提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的有监督预测方法。
本发明提供了一种基于质量信息融合的有监督深度置信网络预测烧结过程产品质量的方法,通过所述的有监督受限玻尔兹曼机,由低层到高层逐层地对输入数据中与质量变量相关的特征进行提取,从而提高网络对质量变量的预测精度。本发明相对于现有技术,具有预测精度高,鲁棒性好等优点。
附图说明
从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在图中,在不同的视图中,相同的附图标记指定对应的部分。
图1为本发明所述的一种基于质量信息融合的有监督深度置信网络的模型结构示意图;
图2为本发明一个实施例的基于质量信息融合的有监督深度置信网络预测烧结过程产品质量的方法流程图。
具体实施方式
下面将结合附图和实施例对本发明的具体技术方案和实施流程进行详细、清晰地描述,显然,所描述的实施例仅是本发明一部分实施例,而非全部的实施例,所述实例并不限制本发明的范围。
如图1所示,图中展示了一种基于质量信息融合的有监督深度置信网络的模型结构。图2展示了一种基于质量信息融合的深度置信网络预测烧结过程产品质量的方法,包括以下步骤:
a、按照时间序列采集烧结过程中的相关过程变量,将过程变量与对应时刻的质量变量组合,构造训练样本;继续采样过程变量,将过程变量与对应前一采样时刻的质量变量组合,构造测试样本,并对训练样本以及测试样本进行数据预处理;
b、提出有监督受限玻尔兹曼机,利用L个(L≥3)有监督受限玻尔兹曼机及一个全连接层共同组成有监督深度置信网络模型;
c、利用极大化似然原理,通过CD-K采样方法,预训练所提出的有监督受限玻尔兹曼机,之后利用反向传播微调多个有监督受限玻尔兹曼机堆叠组成的深度置信网络模型,获得模型参数;
d、将测试样本输入到已经训练好的有监督深度置信网络模型中,获得对应的产品质量预测值。
具体地,本发明通过对烧结过程的机理分析,选取了烧结过程中与烧结矿质量具有较大相关性的过程变量作为相关过程变量。通过时间序列顺序采样以及质量信息的融合,构造出训练样本,即第一有监督受限玻尔兹曼机的输入样本。通过类似方式,构造出测试样本。利用训练样本对所述有监督深度置信网络进行训练。
所述深度置信网络模型的训练过程分为逐层预训练和反向微调两个步骤。首先逐层预训练每个有监督玻尔兹曼机,通过将显层的有监督输入样本输入到第一个有监督受限玻尔兹曼机中,利用CD-K采样方法最大化第一监督输入样本的概率分布,从而完成第一个有监督受限玻尔兹曼机的预训练并获得其隐层输出。将上一个有监督受限玻尔兹曼机的隐层输出与对应当前采样时刻质量信息融合,作为下一个有监督受限玻尔兹曼机的显层输入,利用CD-K采样方法最大化显层输入样本的概率分布,从而完成该有监督受限玻尔兹曼机的预训练并获得其隐层输出。以同样的方式,依次完成L个有监督受限玻尔兹曼机的预训练并获得其隐层输出。将第L个有监督受限玻尔兹曼机的隐层输出连接到一个全连接层,通过全连接层输出网络的预测值。
在反向微调步骤中,利用反向传播算法,通过构造模型的损失函数来微调有监督深度置信网络的参数,直至网络收敛到目标范围。
所述利用有监督深度置信网络进行产品质量预测的过程是将测试样本输入到训练好的有监督深度置信网络中,利用前向传播算法,获得其预测值。
基于上述实施例,作为一种可选的实施例,在步骤a中,从烧结过程中采集到与生产相关的质量变量以及对应的过程变量,并将二者组合,构造训练样本,并在测试时以类似方式构造测试样本,所述过程包括以下步骤:
按一定时间间隔顺序采集系统指定时间序列内的t时刻的过程变量
Figure GDA0002307954310000071
及对应t时刻的质量变量
Figure GDA0002307954310000072
其中,
Figure GDA0002307954310000073
表示过程变量xt的第i(i=1,2…nx)个特征。t=1,2…T表示从1到T时刻的数据,T表示指定时间序列内所有样本的个数。
a1、将过程变量与对应采样时刻的质量变量按照采样时刻进行匹配,然后将匹配成功的质量变量加入到对应过程变量的最后一个变量的后面,得到训练样本,也将该训练样本称为第一有监督受限玻尔兹曼机的输入样本,记该训练样本为:
Figure GDA0002307954310000074
上式中,t是当前采样时刻,m是组合训练样本的第m维度,nv是组合训练样本的维度,nx的过程变量的维度,ny是质量变量的维度,在质量预测中ny为1。
a2、再次采样烧结过程的相关过程变量,考虑到前后相邻两个时刻的生产质量具有密切的关联,将过程变量对应的前一采样时刻的质量变量进行组合,得到测试样本,记测试样本为:
Figure GDA0002307954310000075
上式中,s表示第s个测试样本,S表示测试样本的总数量。
a3、对训练样本与对应采样时刻的质量变量进行数据预处理:
Figure GDA0002307954310000076
Figure GDA0002307954310000081
上式中,vm t表示训练样本的第m个变量,v(max)m和v(min)m分别表示训练样本中的第m个变量的最大值和最小值。y(max)和y(min)则分别表示对应采样时刻的质量变量的最大值和最小值。
a4、同样,对测试样本与对应前一采样时刻的质量变量以类似a3的方式进行数据预处理:
基于上述实施例,作为一种可选的实施例,在步骤b中,所述的有监督深度置信网络模型结构包括:针对每一个受限玻尔兹曼机,都将其扩展成有监督形式,将L
(L≥3)个有监督受限玻尔兹曼机堆叠起来,在最后一个有监督受限玻尔兹曼机的隐层后连接一个全连接层。
具体地,通过L(L≥3)个有监督受限玻尔兹曼机的堆叠构建的深度置信网络模型的网络结构为nv→h[1]→…→h[l]→…→h[L]→output。其中nv是深度置信网络的输入层神经元数。h[l],l=1,…L表示第l个有监督受限玻尔兹曼机的隐层神经元数,根据具体的数据特征和模型要求选择神经元的单元类型。output为输出层神经元数。如前所述,第l个有监督受限玻尔兹曼机的各参数分别表示为
Figure GDA0002307954310000082
第l个有监督受限玻尔兹曼机的隐层激活函数为g[l],l=1…L。第L个有监督受限玻尔兹曼机与输出层之间的参数表示为{w[o],b[o]},激活函数为f。
基于上述实施例,作为一种可选的实施例,在步骤c中,利用有监督输入样本对第一有监督受限玻尔兹曼机进行训练,所述过程包括以下步骤:
c1、基于有监督受限玻尔兹曼机能量函数,推导出第一有监督受限玻尔兹曼机的输入样本的概率分布,利用极大化似然原理,通过CD-K交替采样的方式更新网络参数,最大化这一概率分布,进而获得第一个有监督受限玻尔兹曼机的超参数并提取第一隐层特征数据;
c2、将第一隐层特征数据与当前采样时刻的质量变量进行组合,构造第二有监督受限玻尔兹曼机的输入样本,利用该有监督输入样本推导出对应的概率分布,通过CD-K交替采样的方式最大化该有监督输入样本的概率分布,进而获得第二个有监督受限玻尔兹曼机的超参数并提取第二隐层特征数据;
c3、重复步骤c2,用l=1,2…,L表示有监督受限玻尔兹曼机在序列中的位置。因此,对于后续有监督受限玻尔兹曼机(即l≥2时)的训练,将第l-1隐层特征数据与当前采样时刻的质量变量进行组合,构造第l有监督受限玻尔兹曼机的有监督输入样本,利用第l有监督受限玻尔兹曼机推导出该有监督输入样本的概率分布,通过CD-K交替采样的方式最大化第l有监督受限玻尔兹曼机的输入样本的概率分布,进而获得第l个有监督受限玻尔兹曼机的超参数并提取第l隐层特征数据;
c4、将预训练好的L个有监督受限玻尔兹曼机与全连接的输出层进行连接,构成有监督深度置信网络结构,在预训练获得的参数基础上,通过反向传播算法对网络参数进行微调,最终通过输出层,输出网络的预测结果。
具体地,通过在第l个有监督受限玻尔兹曼机的显层输入
Figure GDA0002307954310000091
和隐层输出
Figure GDA0002307954310000092
之间使用CD-K交替采样使得似然函数P(vt,[l])最大化,依据如下能量函数:
Figure GDA0002307954310000093
对于多个有监督受限玻尔兹曼机(如L个)的训练,上述过程可表示为:
Figure GDA0002307954310000094
上式中,vt,[l]
Figure GDA0002307954310000095
分别表示某个样本vt,[l]及其对应的似然函数P(vt,[l])关于θ[l]中各个参数的偏导数,θ[l]={wij,wlj,ai,cI,bjiIj}表示第l个有监督受限玻尔兹曼机显层vt,[l]到隐层ht,[l]的各变量之间的参数集合,包括显层x、y与隐层h间的权重wij、wlj,显层单元x、y及隐层单元h的偏差ai、cI、bj,和各自对应的单元方差σi、βI、γj,通过CD-K算法对以上偏导数进行计算,完成参数的更新,进而达到最大化似然函数的学习目的。
在完成第L个有监督受限玻尔兹曼机的预训练之后,获得其隐层输出并在隐层之后添加全连接层,根据以下目标函数利用反向传播算法,对所述预训练获得的网络参数{w[l],a[l],c[l],b[l][l][l][l],w[o],b[o]}进行微调,直到满足精度要求。
Figure GDA0002307954310000101
其中,
Figure GDA0002307954310000102
是对应的t时刻的输入样本的质量变量的预测值。
基于上述实施例,作为一种可选的实施例,在步骤d中,利用所建的有监督深度置信网络模型预测产品质量的具体方法包括:将测试样本vT+s带入到训练好的有监督深度置信网络模型中,通过前向传播算法,得到预测结果
Figure GDA0002307954310000103
本发明通过构造输入样本,引入质量变量信息,利用多个有监督受限玻尔兹曼机依次堆叠而成的有监督深度置信网络,采用有监督方式的预训练方法,实现了由低层到高层逐层地对数据中与质量变量相关的特征的提取,弥补了传统深度置信网络不能充分利用输入输出关系的缺陷,提高网络对质量变量的预测精度。
基于上述实施例,作为一种优选的实施例,在本实施例中将本发明一种基于质量信息融合的有监督深度置信网络预测方法应用到烧结过程产品质量预测中,具体方法步骤包括:
根据实际生产需要,以烧结矿中的氧化亚铁含量作为所需预测的质量变量y,通过对获取到的状态参数、操作参数等过程变量进行机理分析,选取其中对烧结矿质量影响最大的18个过程变量作为深度置信网络的无监督输入变量,记为x1,x2,…,x18。从烧结生产过程中提取1414个数据样本作为构建深度置信网络的数据集,其中,前1000个数据样本作为训练集,后414个数据样本作为测试集,同时根据本发明所述有监督信息的引入方式,针对各个数据样本引入相应的质量变量信息,之后对全体样本数据的各个变量进行归一化处理。
本实施例中,在原始的18维输入变量的基础上引入监督信息,网络模型的结构为19—>73—>73—>72—>1,即输入维度为19,有监督受限玻尔兹曼机个数为3,全连接层维度为72。同时,在预训练过程中,由于各有监督受限玻尔兹曼机在输入层都引入了质量变量的监督信息,故在深度置信网络中,对应的隐层维度也增加1。最终,输入数据样本通过以上网络结构对质量变量进行预测。三个有监督受限玻尔兹曼机的显层到隐层的各参数分别为
Figure GDA0002307954310000104
Figure GDA0002307954310000111
Figure GDA0002307954310000112
有监督受限玻尔兹曼机神经元单元采用双高斯型,因此,各神经元分别服从标准差为σ,β,γ的高斯噪声分布,一般我们选σ,β,γ为1。三个有监督受限玻尔兹曼机的隐层激活函数分别为g[1],g[2],g[3]。第三个有监督受限玻尔兹曼机与输出层之间的参数表示为{w[o],b[o]},采用线性激活函数f。
在本实施例中,首先将原始过程变量组成的无监督输入变量xt(xt∈R18,i=1,2…18)与相应的质量变量yt进行组合,形成第一个有监督受限玻尔兹曼机的有监督输入样本数据vt=(xt,yt),通过在有监督受限玻尔兹曼机的显层输入vt(vt∈R19)和隐层输出ht(ht∈R72)之间使用CD-K交替采样使得似然函数P(vt)最大化。
在本实例中,第一个有监督受限玻尔兹曼机的训练以最大化似然函数P(vt,1)为目标,计算公式如下:
Figure GDA0002307954310000113
上式中,
Figure GDA0002307954310000114
表示第1个有监督受限玻尔兹曼机显层vt,[1]到隐层ht,[1]的各变量之间的参数集合,第一个有监督受限玻尔兹曼机的显层输入为vt,[1](vt,[1]∈R19,t=1,2,…,1000),第一隐层数据为ht,[1](ht,[1]∈R72,t=1,2,…,1000),通过对第一隐层数据ht,[1]采样并重构得到显层重构数据[vt,[1]](1),之后以[vt,[1]](1)为输入,经过前向计算与采样得到隐层重构数据[ht,[1]](1),如此循环,完成K次采样后,利用Vt,[1]及提取到的特征等更新网络参数,完成一次CD-K算法。CD-K算法计算过程可用公式表示为:
Figure GDA0002307954310000115
经过K次采样后,通过以下公式对各参数梯度进行计算:
Figure GDA0002307954310000116
Figure GDA0002307954310000117
Figure GDA0002307954310000118
Figure GDA0002307954310000121
Figure GDA0002307954310000122
Figure GDA0002307954310000123
Figure GDA0002307954310000124
Figure GDA0002307954310000125
通过以上公式可以对第一个有监督受限玻尔兹曼机进行参数更新,多次迭代后,固定学习到的参数
Figure GDA0002307954310000126
完成第一个有监督受限玻尔兹曼机的预训练。
在本实施例中,完成第一个有监督受限玻尔兹曼机的预训练后,获得第一隐层输出ht,[1]。将ht,[1]与质量变量yt组合得到第二个有监督受限玻尔兹曼机的第二显层输入vt ,[2](vt,[2]∈R73,t=1,2,…,1000)。采用前向计算和CD-K采样最大化似然函数P(vt,[2]),则目标函数的偏导计算公式为:
Figure GDA0002307954310000127
通过K次采样完成参数的更新,最后得到第二个有监督受限玻尔兹曼机的超参数
Figure GDA0002307954310000128
在本实例中,完成第二个有监督受限玻尔兹曼机的训练后,获得第二个有监督受限玻尔兹曼机的隐层输出ht,[2](ht,[2]∈R72,t=1,2,…,1000),之后将ht,[2]与质量变量yt组合得到第三个有监督受限玻尔兹曼机的第三显层输入vt,[3](vt,[3]∈R73,t=1,2,…,1000)。采用前向计算和CD-K采样最大化似然函数P(vt,[3]),则目标函数的偏导计算公式为:
Figure GDA0002307954310000131
通过K次采样完成参数的更新,最后得到第三个有监督受限玻尔兹曼机的超参数
Figure GDA0002307954310000132
及对应的隐层输出ht,[3](ht,[3]∈R72,t=1,2,…,1000)。
在本实施例中,完成第三有监督受限玻尔兹曼机的预训练之后,在第三有监督受限玻尔兹曼机的隐层之后添加输出层。根据以下损失函数利用反向传播算法,对所述三个有监督受限玻尔兹曼机堆叠而成的深度置信网络的网络参数{θ[1][2][3],w[o],b[o]}进行微调,直到满足精度要求。
Figure GDA0002307954310000133
其中,
Figure GDA0002307954310000134
是对应的t时刻的质量变量的预测值。
通过以上所述方法完成深度置信网络的训练,对测试样本按照所述数据处理方法将过程变量与对应前一时刻的质量变量进行组合,然后将组合样本数据代入上述训练好的深度置信网络中,得到各输入样本数据对应的质量预测输出值,通过有监督受限玻尔兹曼机堆叠构建的深度学习模型取得了十分理想的预测效果。
如表1所示,为堆栈自编码器(Stacked AutoEncoder,SAE)、深度置信网络(DeepBelief Network,DBN)以及本发明提出的有监督深度置信网络(Supervised Deep BeliefNetwork,SDBN)三种模型在训练集和测试集上的预测均方根误差(RMSE)。
表1三种模型在训练集和测试集上的RMSE
Figure GDA0002307954310000141
由表中可看出本发明所提出的SDBN的预测误差在训练集合和测试集合上最低,验证本发明所提出的方法的具有更高的精确性。并且,通过比较三种神经网络的训练误差可以看出,SDBN在误差大幅度降低的同时,收敛速度与SAE、DBN相差不大。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。因此,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (8)

1.一种冶金烧结过程的有监督预测方法,其特征在于,包括以下步骤:
步骤a、按照时间序列采集烧结过程中的相关过程变量,将过程变量与对应时刻的质量变量组合,构造训练样本;继续采样过程变量,将过程变量与对应前一采样时刻的质量变量组合,构造测试样本,并对训练样本以及测试样本进行数据预处理;
步骤b、构建有监督受限玻尔兹曼机,利用L个有监督受限玻尔兹曼机及一个全连接层共同组成有监督深度置信网络模型,其中,L为大于等于3的自然数;
步骤c、利用极大化似然原理,通过CD-K采样方法,预训练所提出的有监督受限玻尔兹曼机,之后利用反向传播微调多个有监督受限玻尔兹曼机堆叠组成的深度置信网络模型,获得模型参数;
步骤d、将测试样本输入到已经训练好的有监督深度置信网络模型中,获得对应的产品质量预测值;
从烧结生产过程中采集到与生产相关的质量变量以及对应的过程变量,并将二者组合,构造训练样本,并在测试时以类似方式构造测试样本,所述过程包括以下步骤:
步骤a0、按一定时间间隔顺序采集系统指定时间序列内的t时刻的过程变量
Figure FDA0003044252190000016
Figure FDA0003044252190000011
及对应t时刻的质量变量
Figure FDA0003044252190000012
其中,
Figure FDA0003044252190000013
表示过程变量xt的第i(i=1,2…nx)个特征,t=1,2…T表示从1到T时刻的数据,T表示指定时间序列内所有样本的个数;
步骤a1、将过程变量与对应采样时刻的质量变量按照采样时刻进行匹配,然后将匹配成功的质量变量加入到对应过程变量的最后一个变量的后面,得到训练样本,也将该训练样本称为第一有监督受限玻尔兹曼机的输入样本,记该训练样本为:
Figure FDA0003044252190000014
其中,t是当前采样时刻,m是组合训练样本的第m维度,nv是组合训练样本的维度,nx的过程变量的维度,ny是质量变量的维度,在质量预测中ny为1;
步骤a2、再次采样烧结过程的相关过程变量,考虑到前后相邻两个时刻的生产质量具有密切的关联,将过程变量对应的前一采样时刻的质量变量进行组合,得到测试样本,记测试样本为:
Figure FDA0003044252190000015
其中,s表示第s个测试样本,S表示测试样本的总数量;
步骤a3、对训练样本与对应采样时刻的质量变量进行数据预处理:
Figure FDA0003044252190000021
Figure FDA0003044252190000022
其中,
Figure FDA0003044252190000023
表示训练样本的第m个变量,v(max)m和v(min)m分别表示训练样本中的第m个变量的最大值和最小值,y(max)和y(min)则分别表示对应采样时刻的质量变量的最大值和最小值;
步骤a4、对测试样本与对应前一采样时刻的质量变量以与所述步骤a3的方式相同的方法进行数据预处理。
2.根据权利要求1所述的有监督预测方法,其特征在于,构建的有监督深度置信网络模型的结构进一步包括:
所述有监督深度置信网络模型由L个有监督受限玻尔兹曼机模型及一个全连接层依次堆叠组成,有监督受限玻尔兹曼机模型是通过将受限玻尔兹曼机的显层输入进行扩展,引入与质量信息相关的有监督信息,进而指导网络模型的学习。
3.根据权利要求2所述的有监督预测方法,其特征在于,利用过程变量与质量变量组合而成的有监督输入样本受限对第一个受限玻尔兹曼机进行有监督训练,具体步骤包括:
步骤c1、基于有监督受限玻尔兹曼机能量函数,推导出第一有监督受限玻尔兹曼机的输入样本的概率分布,利用极大化似然原理,通过CD-K交替采样的方式更新网络参数,最大化这一概率分布,进而获得第一个有监督受限玻尔兹曼机的超参数并提取第一隐层特征数据;
步骤c2、将第一隐层特征数据与当前采样时刻的质量变量进行组合,构造第二有监督受限玻尔兹曼机的输入样本,利用该有监督输入样本推导出对应的概率分布,通过CD-K交替采样的方式最大化该有监督输入样本的概率分布,进而获得第二个有监督受限玻尔兹曼机的超参数并提取第二隐层特征数据;
步骤c3、重复所述步骤c2,用l=1,2…,L表示有监督受限玻尔兹曼机在序列中的位置,对于后续有监督受限玻尔兹曼机L≥2时的训练,将第l-1隐层特征数据与当前采样时刻的质量变量进行组合,构造第L有监督受限玻尔兹曼机的有监督输入样本,利用第L有监督受限玻尔兹曼机推导出该有监督输入样本的概率分布,通过CD-K交替采样的方式最大化第L有监督受限玻尔兹曼机的输入样本的概率分布,进而获得第L个有监督受限玻尔兹曼机的超参数并提取第l隐层特征数据;
步骤c4、将预训练好的L个有监督受限玻尔兹曼机与全连接的输出层进行连接,构成有监督深度置信网络结构,在预训练获得的参数基础上,通过反向传播算法对网络参数进行微调,最终通过输出层,输出网络的预测结果。
4.根据权利要求3所述的有监督预测方法,其特征在于,通过在第L个有监督受限玻尔兹曼机的显层输入
Figure FDA0003044252190000031
和隐层输出
Figure FDA0003044252190000032
之间使用CD-K交替采样使得似然函数P(vt,[l])最大化,依据能量函数:
Figure FDA0003044252190000033
对于多个有监督受限玻尔兹曼机(L个)的训练,上述过程可表示为:
Figure FDA0003044252190000034
其中,vt,[l]
Figure FDA0003044252190000035
分别表示某个样本vt,[l]及其对应的似然函数P(vt,[l])关于θ[l]中各个参数的偏导数,θ[l]={wij,wlj,ai,cI,bjiIj}表示第L个有监督受限玻尔兹曼机显层vt,[l]到隐层ht,[l]的各变量之间的参数集合,包括显层x、y与隐层h间的权重wij、wlj,显层单元x、y及隐层单元h的偏差ai、cI、bj,和各自对应的高斯单元的方差σi、βI、γj,通过CD-K算法对以上偏导数进行计算,完成参数的更新,进而达到最大化似然函数的学习目的。
5.根据权利要求3所述的有监督预测方法,其特征在于,完成所述的L个有监督受限玻尔兹曼机的预训练后,还应通过以下步骤完成网络的微调训练过程:
基于第L个有监督受限玻尔兹曼机的隐层输出,利用全连接层获得质量变量的预测值
Figure FDA0003044252190000036
根据
Figure FDA0003044252190000037
构建深度置信网络的损失函数
Figure FDA0003044252190000041
其中,T为输入训练样本个数,yt是对应第t个训练样本对应采样时刻的质量变量真实值,
Figure FDA0003044252190000042
是对应第t个训练样本对应采样时刻的质量变量预测值;根据所述损失函数,利用反向传播算法对有监督深度置信网络进行参数的微调,直至网络收敛到目标范围。
6.根据权利要求1所述的有监督预测方法,其特征在于,在所述步骤d中,利用所建的有监督深度置信网络模型预测产品质量的具体方法包括:
将测试样本vT+s代入到训练好的有监督深度置信网络模型中,通过前向传播算法,得到预测结果
Figure FDA0003044252190000043
7.一种电子装置,其特征在于,包括:处理器;以及,存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-6任一项所述的有监督预测方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的有监督预测方法。
CN201911127970.7A 2019-11-18 2019-11-18 一种冶金烧结过程的有监督预测方法、装置及存储介质 Active CN110739031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911127970.7A CN110739031B (zh) 2019-11-18 2019-11-18 一种冶金烧结过程的有监督预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911127970.7A CN110739031B (zh) 2019-11-18 2019-11-18 一种冶金烧结过程的有监督预测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110739031A CN110739031A (zh) 2020-01-31
CN110739031B true CN110739031B (zh) 2021-07-23

Family

ID=69273126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911127970.7A Active CN110739031B (zh) 2019-11-18 2019-11-18 一种冶金烧结过程的有监督预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110739031B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111768000A (zh) * 2020-06-23 2020-10-13 中南大学 在线自适应微调深度学习的工业过程数据建模方法
CN112034793B (zh) * 2020-08-10 2024-04-26 华东理工大学 Pta工艺流程中氧化工段生产运行状态空间监测方法
CN112330085A (zh) * 2020-09-17 2021-02-05 上海微亿智造科技有限公司 Mim金属注射成型烧结产品质量控制方法及系统
CN112099460B (zh) * 2020-11-02 2021-02-19 常州微亿智造科技有限公司 适用于深度学习金属注射成型烧结产品质量特征处理方法
CN113239565B (zh) * 2021-05-27 2022-07-12 中南大学 一种沸腾焙烧炉产品质量软测量方法及装置
CN115994742B (zh) * 2023-03-22 2023-06-20 眉山市彭山区明羽鼎盛建材有限公司 湿拌砂浆塑化剂的全生命周期管理方法及装置
CN117312579B (zh) * 2023-11-28 2024-02-06 一铭寰宇科技(北京)有限公司 一种数据模型搜索分析文本的生成方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794534A (zh) * 2015-04-16 2015-07-22 国网山东省电力公司临沂供电公司 一种基于改进深度学习模型的电网安全态势预测方法
KR101561651B1 (ko) * 2014-05-23 2015-11-02 서강대학교산학협력단 딥 빌리프 네트워크를 이용한 음성기반 호불호 검출방법 및 장치, 그를 기록한 기록매체
CN105046268A (zh) * 2015-06-18 2015-11-11 西安电子科技大学 基于Wishart深度网络的极化SAR图像分类方法
CN105224985A (zh) * 2015-09-28 2016-01-06 南京航空航天大学 一种基于深度重构模型的功率放大器行为建模方法
CN107272644A (zh) * 2017-06-21 2017-10-20 哈尔滨理工大学 潜油往复抽油机的dbn网络故障诊断方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101561651B1 (ko) * 2014-05-23 2015-11-02 서강대학교산학협력단 딥 빌리프 네트워크를 이용한 음성기반 호불호 검출방법 및 장치, 그를 기록한 기록매체
CN104794534A (zh) * 2015-04-16 2015-07-22 国网山东省电力公司临沂供电公司 一种基于改进深度学习模型的电网安全态势预测方法
CN105046268A (zh) * 2015-06-18 2015-11-11 西安电子科技大学 基于Wishart深度网络的极化SAR图像分类方法
CN105224985A (zh) * 2015-09-28 2016-01-06 南京航空航天大学 一种基于深度重构模型的功率放大器行为建模方法
CN107272644A (zh) * 2017-06-21 2017-10-20 哈尔滨理工大学 潜油往复抽油机的dbn网络故障诊断方法

Also Published As

Publication number Publication date
CN110739031A (zh) 2020-01-31

Similar Documents

Publication Publication Date Title
CN110739031B (zh) 一种冶金烧结过程的有监督预测方法、装置及存储介质
CN109992921B (zh) 一种燃煤电厂锅炉热效率的在线软测量方法及系统
CN109472057B (zh) 基于跨工步隐式参数记忆的产品加工质量预测装置及方法
CN114015825B (zh) 基于注意力机制的高炉热负荷异常状态监测方法
Li et al. Dynamic time features expanding and extracting method for prediction model of sintering process quality index
CN113128124B (zh) 基于改进神经网络的多牌号C-Mn钢力学性能预测方法
CN113761787A (zh) 基于深度迁移网络的高炉铁水硅含量在线预测方法及系统
CN115673596B (zh) 一种基于Actor-Critic强化学习模型的焊接异常实时诊断方法
CN117312816B (zh) 一种特种钢材的冶炼效果评估方法及系统
CN114282443A (zh) 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法
CN110222825B (zh) 一种水泥成品比表面积预测方法及系统
CN109920489A (zh) 一种基于Lasso-CCF-CNN的加氢裂化模型及建立方法
Li et al. Deep learning for predictive mechanical properties of hot-rolled strip in complex manufacturing systems
CN116484745A (zh) 物理冶金指导工业大数据挖掘的热轧低合金钢设计方法
Yuan et al. FeO content prediction for an industrial sintering process based on supervised deep belief network
Dong et al. Just-in-time learning-based soft sensor for mechanical properties of strip steel via multi-block weighted semisupervised models
Li et al. Long short-term memory based on random forest-recursive feature eliminated for hot metal silcion content prediction of blast furnace
Ding et al. Dynamic prediction of the silicon content in the blast furnace using lstm-rnn-based models
CN115496124A (zh) 一种基于极小极大熵协同训练的高炉故障诊断方法
CN114798763A (zh) 一种加热炉出钢板坯粗轧出口温度的预测方法及系统
CN113065281A (zh) 一种基于传递熵与长短期记忆网络的te过程时序预测方法
CN111639821A (zh) 一种水泥炉窑生产能耗预测方法及系统
Qiang et al. The combination prediction of BTP in sintering process based on Bayesian framework and LS-SVM
Wang A new variable selection method for soft sensor based on deep learning
CN116756531B (zh) 一种面向模型交互联动的带钢热连轧过程监控方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant