CN113609766A - 一种基于深度概率潜隐模型的软测量方法 - Google Patents
一种基于深度概率潜隐模型的软测量方法 Download PDFInfo
- Publication number
- CN113609766A CN113609766A CN202110867967.XA CN202110867967A CN113609766A CN 113609766 A CN113609766 A CN 113609766A CN 202110867967 A CN202110867967 A CN 202110867967A CN 113609766 A CN113609766 A CN 113609766A
- Authority
- CN
- China
- Prior art keywords
- variable
- latent
- data
- samples
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000691 measurement method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 109
- 230000008569 process Effects 0.000 claims abstract description 97
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000004519 manufacturing process Methods 0.000 claims abstract description 22
- 238000005312 nonlinear dynamic Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 19
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 229910021529 ammonia Inorganic materials 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 6
- 238000012360 testing method Methods 0.000 description 33
- 238000005259 measurement Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000009826 distribution Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012628 principal component regression Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000002759 z-score normalization Methods 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Medical Informatics (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于深度概率潜隐模型的软测量方法,包括以下步骤:采集正常工况下工业过程的过程变量数据和质量变量数据组成训练样本;对训练样本进行预处理,并利用滑动窗口策略将预处理后的训练样本划分为T组过程变量样本和T组质量变量样本;利用过程变量样本构建变分自编码器网络,并获得融合后的潜隐变量;构建潜隐变量与质量变量样本的拟合网络,得到深度非线性动态潜隐变量模型;在线采集同一工况下的工业过程的过程变量数据,利用深度非线性动态潜隐变量模型,得到对应的质量变量预测数据。本发明的方法具有处理强动态性和非线性工业数据的能力,能对上万级大型数据进行处理,具有很强的泛化能力。
Description
技术领域
本发明属于关键变量预测技术领域,具体涉及一种基于深度概率潜隐模型的软测量方法。
背景技术
近年来,随着工业技术的飞速发展,工业生产规模越来越庞大。通过使用多传感器技术配合集散控制系统(DCS),可实现对温度、流量以及压力等过程及操作变量的信息提取以及存放,并已成功应用于大型工业过程。但是,在工业生产过程中,还存在一部分关键变量,它们是工业过程控制中的重要参数。受到技术或经济的限制,导致很多重要参数无法直接测量,部分关键信息的缺失不可避免。
因此为了解决“测量难、建模难、控制难”的问题以保证产品质量,软测量技术得到了人们的重视。该技术通过建立数学模型,可实现对隐藏特征的估计,从而有效地预测关键为工业过程监控提供了重要的实时信息。
与传统方法相比,软测量技术具有成本低、实时性好等优势。软测量技术通常分为两大类,分别为机理模型和数据驱动模型。机理模型受到复杂的工业过程噪声影响,难以发挥作用。而通过分析海量的测量数据,基于数据驱动的软测量技术得到了快速发展。这项技术能通过历史数据建立预测模型,成为解决估计系统关键参数的重要手段。且该控制技术有效提高了过程控制的效率,无需先验知识和操作经验,因此在复杂工业控制过程中得到了广泛的应用。
目前,许多多元统计方法和机器学习方法已被应用于基于数据驱动的软测量技术中。常用的方法有主成分回归(PCR)模型以及偏最小二乘回归(PLSR)模型。这两种方法通过提取主元信息进行数据降维,以达到对关键参数的估计以及变量信息的预测。受到静态建模的约束,它们并不能有效处理有强动态特性的工业数据。
针对这一问题,动态主成分回归(DPCR)通过利用滑动窗口建立增广矩阵,实现动态信息的提取。而动态概率潜隐变量回归模型(DPLVM)在概率框架下成功捕捉到了动态自相关特征。它们都有效改善了用于动态工业过程监控的软测量模型的精度。但是这些方法均未考虑到数据的非线性特性,并且存在泛化能力差的缺陷。
在复杂工业背景下,基于深度学习的软测量技术引起了学者们的重视。主流的深度学习方法有深度信赖网络(DBN)以及自动编码器(AE)等。实际上,这些基于深度学习的软测量模型都面临同一个难题:它们都属于黑箱模型,无法表示出确切的分布函数,缺乏对隐藏特征以及结果的可解释性。这导致在对工业领域关键决策的合理性做出判断的时候,黑箱模型难以得到广泛应用。此外,工业生产规模的扩大导致时序序列过长,长距离的信息在传递时被稀释甚至忽略。
目前,结合非线性以及动态特性进行软测量建模的研究还较少。因此,需要提出一种既具备可解释性,又能够捕捉全局信息特征,同时能够处理强动态性及强非线性的工业数据的深度学习软测量技术。
发明内容
为解决上述现有技术中存在的问题,本发明提供一种基于深度概率潜隐模型的软测量方法,其具有处理强动态性和强非线性的工业数据的能力,能够对上万级的大型数据进行处理,具有很强的泛化能力。
本发明考虑到工业过程数据的强动态特性以及其巨大的数据量,提供一种基于深度概率潜隐模型的关键变量预测方法,预测过程如下:
首先,通过传感器配合集散控制系统进行数据的采集以及存储,得到正常工况下的过程变量数据以及质量变量数据。
通过预处理和参数设定,将过程变量数据以及质量变量数据用滑动窗口策略分别划分成T组过程变量样本和T组质量变量样本。先将T组过程变量数据分别放入T个变分自编码器中进行编码、解码,完成对各组过程变量样本的潜隐变量信息的提取,得到变分自编码器网络,并将得到的潜隐变量经加权求和得到融合后的潜隐变量。
再通过有监督的全连接层拟合融合后的潜隐变量和其中一组质量变量样本,得到拟合网络,完成含有变分自编码器网络和拟合网络的深度非线性动态潜隐变量模型的训练。
之后在线采集同一工况下的工业过程的过程变量数据,将采集的过程变量数据作为测试样本放入预先训练好的神经网络模型(深度非线性动态潜隐变量模型)中,提取测试样本的潜隐变量,完成对关键质量变量数据的预测,从而实现对工业过程的软测量。
一种基于深度概率潜隐模型的软测量方法,包括以下步骤:
(1)采集工业过程在正常工况下的过程变量数据和质量变量数据,组成训练样本;
(2)对训练样本进行预处理,并利用滑动窗口策略将预处理后的训练样本进行划分,得到T组过程变量样本和T组质量变量样本;
(3)利用上述T组过程变量样本构建变分自编码器网络,并获得融合后的潜隐变量;
(4)构建融合后的潜隐变量与其中一组质量变量样本的拟合网络,最终得到由变分自编码器网络和拟合网络组成的有监督的深度非线性动态潜隐变量模型;
(5)在线采集同一工况下的工业过程的过程变量数据,利用所述深度非线性动态潜隐变量模型,得到对应的质量变量预测数据。
上述技术方案中:
作为优选,步骤(1)中,通过传感器配合集散控制系统进行数据的采集以及存储,得到正常工况下的过程变量数据以及质量变量数据。
步骤(1)中,设定采集后的过程变量数据和质量变量数据分别为X0、Y0,则组成的训练样本为:
X0={x0(1),x0(2),x0(3),…,x0(M)},X0∈RM×J
Y0={y0(1),y0(2),y0(3),…,y0(M)},Y0∈RM×K
其中,其中M为过程变量以及质量变量数据样本个数,J和K分别代表过程变量和质量变量的个数。以氨合成过程为例,过程变量包括温度、流量、压力等;质量变量包括氧含量等,过程变量和质量变量共同组成训练样本。
作为优选,步骤(2)中,采用z-score标准化处理对训练样本进行预处理,并得到均值为0,方差为1的去量纲数据。
步骤(2)中,采用滑动窗口策略对标准化后的训练样本进行划分时,设置合适的模型长度T,将预处理后的测试样本拆分为T个部分,得到T组过程变量样本和T组质量变量样本:
上述采用滑动窗口策略对预处理后的训练样本进行划分能保护过程变量数据的时序性,同时为下一步构建变分自编码器网络做好准备。
作为优选,T的取值范围为20~100。
上述步骤(3)中:
作为优选,利用T组过程变量样本构建变分自编码器网络时,采用自监督的方式,利用T个变分自编码器结构分别对T组过程变量样本提取动态潜隐变量z(t),其结构如下:
z(1)=μ(1)+σ(1)×ε,ε~N(0,I)
z(t)=P(t)z(t-1)+W(t)μ(t)+σ(t)×ε
其中,t∈[2,T],μ(1)、σ(1)和ε分别代表t=1时变分自编码器对应的均值、标准差以及高斯噪声,转移矩阵P(t)表示z(t)和z(t-1)之间的关系,W(t)代表μ(t)和z(t)的关系,{μ(t),σ(t),ε}分别代表变分自编码器生成的均值、标准差以及高斯噪声。
上述技术方案中,每个变分自编码器对应一组过程变量样本,并提取到T个动态潜隐变量。其中,第一个变分自编码器利用重采样的方式,由μ(1)、σ(1)和ε得到z(1)。同理得到z(2)至z(T)。在动态潜隐变量z(t)的结构中引入高斯噪声ε,使得得到的动态潜隐变量z(t)具有鲁棒性。
其中,动态潜隐变量之间的连接方式类似于信息传递链,由第一个动态潜隐变量信息加到第二个动态潜隐变量上,第二个动态潜隐变量信息加到第三个动态潜隐变量上,如此循环累加直到最后。构建动态潜隐变量信息传递通道有利于提取完整的动态潜隐变量,为后续的有监督拟合提供更加可靠的关键信息。
为了提取深层信息,采用变分自编码器结构生成具有相关性的标准正态分布的潜隐变量数据,通过编码解码方式表征数据重构过程。
根据变分自编码器结构,自编码器中的相关参数与过程变量数据存在非线性的关系,使用非线性编码形式构建这种联系,其关系式如下所示:
μ(t)=θt,1(X(t))+wt,1(t)
σ(t)=θt,2(X(t))+wt,2(t)
ε=θt,3(X(t))+wt,3(t)
其中,t∈[1,T],θt,1(*)、θt,2(*)和θt,3(*)分别代表对应的非线性变换函数,wt,1(t)、wt,2(t)和wt,3(t)代表高斯白噪声。
完成动态潜隐变量提取后,虽然在理论上该变分自编码器网络在训练完成后,通过传递链能较好地获取动态相关信息,但实际上工业过程数据动态特性很强,模型长度T不可能很小。而这种特性导致各个子编码器模块(变分自编码器)提取的动态潜隐变量信息随着传递过程逐渐损失,最后影响潜隐变量提取的效果以及软测量精度。
为了改善长时间序列带来的动态潜隐变量信息被弱化的缺陷,作为进一步优选,对得到的动态潜隐变量z(t)进行加权求和计算,得到所述融合后的潜隐变量,计算公式如下:
e(t)=z(t)×U(t)+b(t)
上述技术方案中,U(t)、b(t)、ηA是变分自编码器网络需要训练的参数;由z(t)、U(t)、b(t)生成的e(t)是z(t)经过线性变换的结果;ηA由训练变分自编码器网络得到;α(t)代表z(t)的权重。
采用上述加权求和的技术方案获得动态潜隐变量不仅捕获了和质量变量样本相关度大的潜隐信息,还能改善动态潜隐变量在传递过程中被稀释的问题。
作为进一步优选,步骤(3)中,利用T组过程变量样本构建变分自编码器网络时,以损失函数作为优化目标,并使用Adam优化器更新参数。当模型收敛时,代表变分自编码器网络训练完成。训练完成后,变分自编码器网络的相关参数将被保存并用于测试数据的重构以及潜隐变量的提取;
损失函数的计算公式如下:
其中:
上述技术方案中,z(1)|φ(1)表示在φ(1)条件下z(1)的分布,z(t)|z(t-1),φ(t)表示在z(t-1)和φ(t)条件下z(t)的分布,q(*)代表由变分自编码器拟合得到的概率分布,||N(0,I)表示第一个变分自编码器训练得到的z(1)需要近似地服从均值为0,方差为1的标准正态分布,||N(P(t)z(t-1),I)表示第t个变分自编码器训练得到的z(t)需要近似地服从均值为P(t)z(t-1),方差为1的正态分布。
由损失函数的计算公式可知,整个损失函数可以看作是划分后的过程变量样本与对融合后的潜隐变量解码后的过程变量样本的最小平方误差以及KL散度(DKL)两个部分。KL散度保证潜隐变量信息严格符合标准正态分布。
作为优选,得到融合后的潜隐变量后,对该融合后的潜隐变量作解码处理:
上述技术方案中,这种利用变分自编码器对过程变量样本进行编码和解码的非线性变换过程,不仅描述出了过程变量数据的非线性特征,还构建了工业噪声,有利于过程变量数据的非线性特征的提取,同时增加了变分自编码器网络的鲁棒性能,整个训练过程变得更加科学合理。
作为优选,步骤(4)中,采用全连接层对融合后的潜隐变量和其中一组质量变量样本进行有监督的拟合,得到所述拟合网络,结构如下:
其中,G(*)代表非线性变换函数,w2(t)为高斯白噪声。
作为优选,步骤(4)中,对融合后的潜隐变量和其中一组质量变量样本进行拟合时,采用双层全连接层,并对第一层全连接层设置激活函数为Relu。
作为优选,步骤(4)中,构建拟合网络时,拟合层搭建完毕后,利用Adam优化器进行模型训练以及参数更新。当划分后的第t组过程变量样本Y(t)与通过拟合网络重构后的过程变量样本之间的最小平方差值不再降低时,代表模型训练完成,此时保留更新训练后的网络参数,用于后续对质量变量的预测。
作为优选,步骤(4)中,融合后的潜隐变量与第T组质量变量样本进行有监督的拟合,得到所述拟合网络,其结构如下:
Y(T)=G(V)+w2(T),w2(T)~N(0,I)
采用上述技术方案,能使构建的拟合网络更具代表性。
作为优选,步骤(5)中,在线采集的过程变量的数量与构建变分自编码器网络时训练样本中过程变量的数量保持一致。
作为优选,步骤(5)中,在线采集的过程变量数据作为测试样本Xtest:
Xtest={xtest(1),xtest(2),xtest(3),…,xtest(N)},Xtest∈RN×J
其中,N代表样本数据量大小,J代表过程变量个数。
对测试样本进行z-score标准化处理之后,再利用滑动窗口策略将数据划分为T个。
作为优选,步骤(5)的具体过程为:
在线采集同一工况下的工业过程的过程变量数据,依次经z-score标准化处理和滑动窗口策略划分得到T组测试样本;随后通过深度非线性动态潜隐变量模型中的变分自编码器网络得到测试样本的融合后的潜隐变量;再利用该测试样本融合后的潜隐变量和深度非线性动态潜隐变量模型中的拟合网络,得到对应的利用所述深度非线性动态潜隐变量模型,得到对应的质量变量预测数据。
作为优选,所述工业过程为氨合成过程。本发明的工业过程软测量方法,利用滑动窗口策略将数据集划分为合适的个数,并由此建立与参数相适应的变分自编码器网络,这种方法能够用于处理动态数据。采用变分自编码器(VAE),将变分贝叶斯和神经网络结合起来,用神经网络学习由变分推导的参数,并且对变分自编码器添加约束,强迫潜隐变量服从单位高斯分布,具有很强的可解释性以及鲁棒性。将编码后生成的各个隐层信息传递给下一层隐层,代表着潜隐变量的信息传递方向以及其动态特性。为了防止时序序列长度过长影响动态潜隐变量信息传递的质量,在中间层即隐层中,根据隐层状态计算各个潜隐变量信息的权重。在求完权重后加入激活函数并进行加权求和操作。这种加权变换能获取潜隐变量局部和全局信息的联系,且不会受到序列长度的限制,因此能够有效改善长时间序列带来的信息缺失问题。经过训练后,可以得到降噪重构后的过程变量数据(样本)以及融合后的潜隐变量。将融合后的潜隐变量和其中一组质量变量数据(样本)通过全连接层进行有监督的拟合,利用全连接层的激活函数建立起非线性关系。相对于一般软测量模型,该模型能够对上万级的大型数据进行处理,具有很强的泛化能力。
与现有技术相比,本发明的有益效果为:
本发明的工业过程软测量方法,通过构建有监督的深度非线性动态潜隐变量模型,实现对工业构成的软测量。本发明的测量方法具有处理强动态性和强非线性的工业数据的能力,改善了长时间序列造成的潜隐变量信息被弱化的缺陷,能够对上万级的大型数据进行处理,具有很强的泛化能力。
附图说明
图1为基于深度动态非线性潜隐变量模型构建过程。
具体实施方式
以合成氨工艺过程为例,对本发明的技术方案做进一步说明:
一种基于深度概率潜隐模型的软测量方法,具体步骤如下:
第一步:获取训练样本。在正常工况下,通过集散控制系统采集氨合成过程的相关输入变量数据X0以及质量变量数据Y0,组成训练样本:
其中M为输入变量(过程变量)以及输出变量(质量变量)数据样本个数,J和K分别代表输入变量(过程变量)和输出变量(质量变量)的个数,本实施例中,输入变量J=13,包括各装置的温度、流量以及压力,质量变量K=1,包括氧含量,它们共同组成模型的样本训练集。
第二步:训练样本预处理。将数据X0,Y0进行z-score标准化处理,处理后可以得到均值为0,方差为1的去量纲数据,便于分析不同量级的指标。同时设置合适的模型长度T,将标准化后的数据X0,Y0根据滑动窗口策略分别拆分为T个部分:
这种数据划分的处理方法能保护过程数据的时序性,同时为下一步模型训练做好准备。
第三步:提取深度动态信息。采用自监督的方式,利用T个变分自编码器结构提取动态潜隐变量信息。如图1所示,为了提取深层信息,采用变分自编码器结构生成具有相关性的标准正态分布的潜隐变量数据,通过编码解码的方式表征数据重构过程。
根据变分自编码器结构,自编码器中的相关参数与过程变量数据(样本)存在非线性的关系,使用非线性编码形式构建这种联系,其关系式如下所示:
其中,t∈[1,T],θt,1(*)、θt,2(*)和θt,3(*)分别代表对应的非线性变换函数,wt,1(t)、wt,2(t)和wt,3(t)代表高斯白噪声。{μ(t),σ(t),ε}分别代表变分自编码器生成的均值、标准差以及高斯噪声。
根据之前设定的模型长度T,将划分后的输入变量数据X(1)至X(T),送入对应的各个变分自编码器模块中以生成动态潜隐变量z(t),其基本的结构如下:
其中,第一个变分自编码器(对应第一组输入变量数据X(1))利用重采样方式,由μ(1)、σ(1)和ε生成z(1)。同理可得z(2)至z(T)。其中,高斯噪声使得结果具有鲁棒性。转移矩阵P(t)被用于构建z(t)和z(t-1)之间的关系,完成信息交互。W(t)代表μ(t)和z(t)的关系。其中,动态潜隐变量之间的连接方式类似于信息传递链,由第一个动态潜隐变量信息加到第二个动态潜隐变量上,第二个动态潜隐变量信息加到第三个动态潜隐变量上,如此循环累加直到最后。构建信息传递通道有利于提取完整的隐层信息,为后续的有监督拟合提供更加可靠的关键信息。
由于整个模型是基于变分自编码器构建的,需要对参数进行变分推导,并将损失函数作为优化目标,并使用Adam优化器更新参数。当模型收敛时,代表模型训练完成。训练完成后,模型的参数将被保存并用于测试数据的重构以及特征提取。
其中,损失函数如下所示:
其中,t∈[2,T],φ(1)和φ(t)代表解码层的参数,表示划分后的过程变量样本X(t)与对融合后的潜隐变量解码后的过程变量样本的最小平方误差,整个损失函数可以看作该最小平方误差以及KL散度两个部分。KL散度(DKL)保证潜隐变量信息严格符合标准正态分布。推导完成后,KL散度可以被写为以下形式:
完成动态潜隐变量提取后,虽然在理论上该变分自编码器网络在训练完成后,通过传递链能较好地获取动态相关信息,但实际上氨合成的工业过程数据动态特性很强,模型长度T不可能很小。而这种特性导致各个子编码器模块(变分自编码器)提取的动态潜隐变量信息随着传递过程逐渐损失,最后影响潜隐变量提取的效果以及软测量精度。
为了改善长时间序列带来的动态潜隐变量信息被弱化的缺陷,对得到的动态潜隐变量z(t)进行加权求和计算,得到所述融合后的潜隐变量,计算公式如下:
其中,U(t)和b(t)分别是潜隐变量变换矩阵以及偏置矩阵,ηA表示模型系数,生成的e(t)是z(t)经过线性变换的结果。U(t)、b(t)以及ηA是变分自编码器网络需要训练的参数,代表内积。α(t)代表z(t)的权重。
经过对z(t)的加权求和计算后,可以获得融合后的潜隐变量V。这种加权求和方式不仅捕获了和关键质量变量相关度大的潜隐信息,还能改善动态潜隐变量在传递过程中被稀释的问题。
之后需要对融合后的潜隐变量V作解码处理:
其中,代表解码后的重构输入数据(解码后的过程变量样本),w1(t)代表高斯白噪声,F(*)代表非线性变换过程。这种非线性变换过程不仅可以描述出了数据的非线性特征,还构建了工业噪声,有利于非线性特征的提取,同时增加了模型的鲁棒性能,整个训练过程变得更加科学合理。
第四步:拟合融合后的潜隐变量V和第T组质量变量样本。采用双层全连接层对融合后的潜隐变量V和关键质量变量样本Y(T)进行有监督的拟合,第一层全连接层设置激活函数为Relu,得到拟合网络,其结构设计如下:
Y(T)=G(V)+w2(T),w2(T)~N(0,I) (10)
其中,G(*)代表非线性变换函数,w2(T)同样为高斯白噪声。拟合网络搭建完毕后,利用Adam优化器进行拟合网络模型训练以及参数更新。当划分后的第T组过程变量样本Y(T)与通过拟合网络重构后的过程变量样本之间的最小平方差值不再降低时,代表模型训练完成,此时保留更新训练后的网络参数,用于后续对质量变量的预测。
第五步:通过集散控制系统在线采集同一工况下的氨合成过程的过程变量数据,得到测试样本Xtest:
Xtest={xtest(1),xtest(2),xtest(3),…,xtest(N)},Xtest∈RN×J (11)
其中N代表测试样本数据量大小,J代表过程变量个数,和训练样本保持一致。对测试集进行z-score标准化处理之后,再利用滑动窗口策略将过程变量数据划分为T组。
第六步:将划分后的T组过程变量样本放入有监督的深度非线性动态潜隐变量模型中进行软测量,得到过程变量样本相对应的质量变量样本的预测值。
首先利用已训练完成的前端变分自编码器网络进行潜隐变量信息的提取,得到隐层融合后的潜隐变量Vtest:
其中,相关网络参数都与模型训练完成后的参数一致,ztest(t)表示测试样本通过变分自编码器得到的测试样本的动态潜隐变量。经过加权融合后,得到测试样本的融合后的潜隐变量Vtest。
前端网络完成潜隐变量提取后,将Vtest作为输入,放入后端训练好的拟合网络中来预测对应的质量变量数据:
Claims (10)
1.一种基于深度概率潜隐模型的软测量方法,其特征在于,包括以下步骤:
(1)采集工业过程在正常工况下的过程变量数据和质量变量数据,组成训练样本;
(2)对训练样本进行预处理,并利用滑动窗口策略将预处理后的训练样本进行划分,得到T组过程变量样本和T组质量变量样本;
(3)利用上述T组过程变量样本构建变分自编码器网络,并获得融合后的潜隐变量;
(4)构建融合后的潜隐变量与其中一组质量变量样本的拟合网络,最终得到由变分自编码器网络和拟合网络组成的有监督的深度非线性动态潜隐变量模型;
(5)在线采集同一工况下的工业过程的过程变量数据,利用所述深度非线性动态潜隐变量模型,得到对应的质量变量预测数据。
2.根据权利要求1所述的基于深度概率潜隐模型的软测量方法,其特征在于,T的取值范围为50~1000。
3.根据权利要求1所述的基于深度概率潜隐模型的软测量方法,其特征在于,步骤(3)中,利用T组过程变量样本构建变分自编码器网络时,采用自监督的方式,利用T个变分自编码器结构分别对T组过程变量样本提取动态潜隐变量z(t),其结构如下:
z(1)=μ(1)+σ(1)×ε,ε~N(0,I)
z(t)=P(t)z(t-1)+W(t)μ(t)+σ(t)×ε
其中,t∈[2,T],μ(1)、σ(1)和ε分别代表t=1时变分自编码器对应的均值、标准差以及高斯噪声,转移矩阵P(t)表示z(t)和z(t-1)之间的关系,W(t)代表μ(t)和z(t)的关系,μ(t),σ(t),ε分别代表变分自编码器生成的均值、标准差以及高斯噪声。
7.根据权利要求1所述的基于深度概率潜隐模型的软测量方法,其特征在于,步骤(4)中,对融合后的潜隐变量和其中一组质量变量样本进行拟合时,采用双层全连接层,并对第一层全连接层设置激活函数为Relu。
8.根据权利要求1所述的基于深度概率潜隐模型的软测量方法,其特征在于,步骤(4)中,融合后的潜隐变量与第T组质量变量样本进行有监督的拟合,得到所述拟合网络。
9.根据权利要求1所述的基于深度概率潜隐模型的软测量方法,其特征在于,步骤(5)中,在线采集的过程变量的数量与构建变分自编码器网络时训练样本中过程变量的数量保持一致。
10.根据权利要求1所述的基于深度概率潜隐模型的软测量方法,其特征在于,所述工业过程为氨合成过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110867967.XA CN113609766B (zh) | 2021-07-29 | 2021-07-29 | 一种基于深度概率潜隐模型的软测量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110867967.XA CN113609766B (zh) | 2021-07-29 | 2021-07-29 | 一种基于深度概率潜隐模型的软测量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113609766A true CN113609766A (zh) | 2021-11-05 |
CN113609766B CN113609766B (zh) | 2024-05-17 |
Family
ID=78306125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110867967.XA Active CN113609766B (zh) | 2021-07-29 | 2021-07-29 | 一种基于深度概率潜隐模型的软测量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113609766B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547976A (zh) * | 2022-02-17 | 2022-05-27 | 浙江大学 | 基于金字塔变分自编码器的多采样率数据软测量建模方法 |
CN114841000A (zh) * | 2022-05-09 | 2022-08-02 | 杭州师范大学 | 一种基于模态共有特征分离的软测量建模方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108549908A (zh) * | 2018-04-13 | 2018-09-18 | 浙江科技学院 | 基于多采样概率核主成分模型的化工过程故障检测方法 |
CN109085805A (zh) * | 2018-07-24 | 2018-12-25 | 浙江科技学院 | 一种基于多采样率因子分析模型的工业过程故障检测方法 |
CN111885213A (zh) * | 2020-06-09 | 2020-11-03 | 中国科学院信息工程研究所 | 一种基于门控卷积变分自编码器的IPv6地址发现方法和装置 |
CN112149355A (zh) * | 2020-09-27 | 2020-12-29 | 浙江科技学院 | 基于半监督动态反馈堆栈降噪自编码器模型的软测量方法 |
CN112989635A (zh) * | 2021-04-22 | 2021-06-18 | 昆明理工大学 | 基于自编码器多样性生成机制的集成学习软测量建模方法 |
-
2021
- 2021-07-29 CN CN202110867967.XA patent/CN113609766B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108549908A (zh) * | 2018-04-13 | 2018-09-18 | 浙江科技学院 | 基于多采样概率核主成分模型的化工过程故障检测方法 |
CN109085805A (zh) * | 2018-07-24 | 2018-12-25 | 浙江科技学院 | 一种基于多采样率因子分析模型的工业过程故障检测方法 |
CN111885213A (zh) * | 2020-06-09 | 2020-11-03 | 中国科学院信息工程研究所 | 一种基于门控卷积变分自编码器的IPv6地址发现方法和装置 |
CN112149355A (zh) * | 2020-09-27 | 2020-12-29 | 浙江科技学院 | 基于半监督动态反馈堆栈降噪自编码器模型的软测量方法 |
CN112989635A (zh) * | 2021-04-22 | 2021-06-18 | 昆明理工大学 | 基于自编码器多样性生成机制的集成学习软测量建模方法 |
Non-Patent Citations (2)
Title |
---|
刘贞文;徐玲杰;陈孝敬;: "深度自编码器的近红外光谱转移研究", 光谱学与光谱分析, no. 07, 10 July 2020 (2020-07-10) * |
张成;高宪文;徐涛;李元;逄玉俊;: "基于独立元的k近邻故障检测策略", 控制理论与应用, no. 06, 14 May 2018 (2018-05-14) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547976A (zh) * | 2022-02-17 | 2022-05-27 | 浙江大学 | 基于金字塔变分自编码器的多采样率数据软测量建模方法 |
CN114547976B (zh) * | 2022-02-17 | 2024-04-30 | 浙江大学 | 基于金字塔变分自编码器的多采样率数据软测量建模方法 |
CN114841000A (zh) * | 2022-05-09 | 2022-08-02 | 杭州师范大学 | 一种基于模态共有特征分离的软测量建模方法 |
CN114841000B (zh) * | 2022-05-09 | 2024-05-14 | 杭州师范大学 | 一种基于模态共有特征分离的软测量建模方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113609766B (zh) | 2024-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101480B (zh) | 一种多变量聚类与融合的时间序列组合预测方法 | |
CN108399248A (zh) | 一种时序数据预测方法、装置及设备 | |
CN108549908B (zh) | 基于多采样概率核主成分模型的化工过程故障检测方法 | |
CN113609766A (zh) | 一种基于深度概率潜隐模型的软测量方法 | |
CN112149355B (zh) | 基于半监督动态反馈堆栈降噪自编码器模型的软测量方法 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN117076936A (zh) | 一种基于多头注意力模型的时序数据异常检测方法 | |
CN115759461A (zh) | 一种面向物联网的多元时间序列预测方法及系统 | |
CN111103420B (zh) | 一种原料不确定下的酚醛树脂产品质量预测方法 | |
CN116975645A (zh) | 一种基于vae-mrcnn的工业过程软测量建模方法 | |
CN116703644A (zh) | 一种基于Attention-RNN的短期电力负荷预测方法 | |
CN113435321A (zh) | 一种主轴轴承状态评估方法、系统、设备及可读存储介质 | |
CN116364203A (zh) | 一种基于深度学习的水质预测方法、系统和装置 | |
CN109325065B (zh) | 基于动态隐变量模型的多采样率软测量方法 | |
CN115482877A (zh) | 一种基于时序图网络的发酵过程软测量建模方法 | |
CN117435901B (zh) | 一种工业互联网数据获取方法、系统、终端及储存介质 | |
CN117972585A (zh) | 一种基于pca-ddpm和cnn的小样本条件下故障增强诊断方法 | |
CN116483036B (zh) | 一种基于Transformer的自编码器软测量建模方法 | |
CN112949097A (zh) | 一种基于深度迁移学习的轴承剩余寿命预测模型和方法 | |
CN115883424B (zh) | 一种高速骨干网间流量数据预测方法及系统 | |
CN116739168A (zh) | 一种基于灰色理论与编解码器的径流量预测方法 | |
CN115963788A (zh) | 多采样率工业过程关键质量指标在线预测方法 | |
CN113537573A (zh) | 基于双重时空特征提取的风电功率运行趋势预测方法 | |
CN115859202B (zh) | 一种非平稳时序数据流场景下的异常检测方法及装置 | |
CN116451598B (zh) | 基于去噪扩散概率模型的太阳辐照度预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |