CN109085805B - 一种基于多采样率因子分析模型的工业过程故障检测方法 - Google Patents

一种基于多采样率因子分析模型的工业过程故障检测方法 Download PDF

Info

Publication number
CN109085805B
CN109085805B CN201810815760.6A CN201810815760A CN109085805B CN 109085805 B CN109085805 B CN 109085805B CN 201810815760 A CN201810815760 A CN 201810815760A CN 109085805 B CN109085805 B CN 109085805B
Authority
CN
China
Prior art keywords
model
sample set
factor analysis
sampling
sampling rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810815760.6A
Other languages
English (en)
Other versions
CN109085805A (zh
Inventor
周乐
王尧欣
侯北平
成忠
单胜道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lover Health Science and Technology Development Co Ltd
Original Assignee
Zhejiang Lover Health Science and Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lover Health Science and Technology Development Co Ltd filed Critical Zhejiang Lover Health Science and Technology Development Co Ltd
Priority to CN201810815760.6A priority Critical patent/CN109085805B/zh
Publication of CN109085805A publication Critical patent/CN109085805A/zh
Application granted granted Critical
Publication of CN109085805B publication Critical patent/CN109085805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41885Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于多采样率因子分析模型的工业过程故障检测方法,该方法首先收集正常工作状态下不同采样率的数据,建立多采样率因子分析分析模型;利用模型的潜隐变量和预测误差构建了两个检测统计量T2和SPE及其对应的统计限
Figure DDA0001740283370000011
和SPElim;然后对在线工业过程进行检测,获得测试样本,然后可利用已有的模型结构估计测试样本的潜隐变量及预测误差,并计算出相应的统计量,并得到最终的故障检测结果。该方法在实现多采样率信息处理的同时,既可以完整利用数据信息,又能充分考虑到数据噪声矩阵方差差异性,使降维后的少数潜隐变量实现对原有变量更好的解释与描述,从而在故障检测精度上实现提升。

Description

一种基于多采样率因子分析模型的工业过程故障检测方法
技术领域
本发明涉及化工过程检测技术领域,具体是涉及一种基于多采样率因子分析模型的工业过程故障检测方法。
背景技术
在现代工业过程中,随着集散控制系统(DCS)在工业领域的广泛应用,工业现场能够实现对流量、温度和液位等过程变量的高采样率采集和存储,但是与产品质量或过程处理结果有关的质量变量却由于受到化验成本等各方面的限制而较难实现高采样率获取,从而造成信息获取的多采样率特性,对于合理有效利用这些数据信息是一种挑战。
同时,随着基于多元统计分析的过程检测(MSPM)技术的不断进步,海量数据变量实现降维,重构及可视化,并在化工、制药和治污等领域得到广泛应用。其中,基于主成分分析(PCA)的过程检测技术通过对原有变量的取舍,能够实现对数据的降维,但无法实现完整数据信息的利用。基于偏最小二乘估计(PLS)的过程检测技术利用质量变量来引导过程变量样本空间的分解,所得到的投影空间只反映过程变量中与质量变量相关的变化,同样无法实现对海量数据信息的完整解释。而基于概率主成分分析(PPCA)的过程检测技术在模型构建时虽然考虑到了噪声的影响,但在噪声方差差异性的描述和处理上不够详细,影响了故障检测的精度。因此,需要提出一种既可以完整利用数据信息,又能充分考虑到数据噪声矩阵方差差异性的多采样率过程故障检测技术。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于多采样率因子分析模型的工业过程故障检测方法。
本发明的基于多采样率因子分析模型的工业过程故障检测方法,该方法针对工业过程的故障检测问题,首先利用集散控制系统收集正常工作状态下不同采样率的数据,建立多采样率因子分析分析模型。该模型结构由期望最大化算法估计得到。在此基础上,利用模型的潜隐变量和预测误差构建了两个检测统计量T2和SPE及其对应的统计限
Figure BDA0001740283360000021
和SPElim。对在线工业过程进行检测,获得测试样本,然后可利用已有的模型结构估计测试样本的潜隐变量及预测误差,并计算出相应的统计量,并得到最终的故障检测结果。
具体讲,一种基于多采样率因子分析模型的工业过程故障检测方法,包括以下步骤:
(1)采集工业过程中正常运行的不同采样率的数据,并组成数据建模用的训练样本集;
(2)对训练样本集进行预处理,预处理后的训练样本集与隐变量间存在线性相关关系;
(3)利用预处理后的训练样本集,利用期望最大化算法构建多采样率因子分析模型;
(4)根据建立的多采样率因子分析模型估计训练样本集的潜隐变量的期望值,潜隐变量的方差和模型预测误差,构建相应的T2和SPE统计量检测统计限;
(5)在线收集新的工业过程中与训练样本集过程变量对应的不同采样率样本数据,得到测试样本集,并对测试样本集进行预处理;
(6)采用得到多采样率因子分析模型对测试样本集进行检测,计算测试样本集的
Figure BDA0001740283360000022
和SPEtest统计量,并与步骤(4)得到的检测统计限对比,输出检测结果。
作为优选,所述工业过程为造纸废水处理过程。
步骤(1)中,可利用集散控制系统收集工业过程,比如造纸废水处理过程中正常运行的不同采样率的数据。
利用本发明可以对存在线性关系的工业过程进行处理。可以适用的过程比如造纸废水处理过程等。
步骤(1)中,步骤(1)中采集至少三种不同采样率的数据组成数据建模用的训练样本集。
假设采集到了三种采样率的正常样本,其样本数量分别为K,N,J,且J≤N≤K:
Figure BDA0001740283360000031
Figure BDA0001740283360000032
Figure BDA0001740283360000033
R表示实数集;M为第一种采样率过程变量数,H为第二种采样率过程变量数,U为第三种采样率过程变量数,将这些数据存入历史数据库。
步骤(2)和步骤(5)预处理一般为归一化处理,当然也可以包括其他现有的预处理过程,便于后续的建模,作为优选,步骤(2)和步骤(5)预处理后,使得各个过程变量的均值为零,方差为1。
步骤(2)归一化后,得到的数据集如下:
X1∈RM×K,X1={x1,1,x1,2,...,x1,J,...,x1,N,...,x1,K}
X2∈RH×N,X2={x2,1,x2,2,...,x2,J,...,x2,N}
X3∈RU×J,X3={x3,1,x3,2,...,x3,J}
该数据集与隐变量间存在线性相关关系。
作为优选,步骤(3)中模型如下:
步骤(3)中,多采样率因子分析模型如下:
X1=Wt+m
X2=Pt+f
X3=Qt+g
t∈RD×1为该模型的潜隐变量,D是潜隐变量的维度;
W∈RM×D,P∈RH×D,Q∈RU×D为模型负载矩阵;m,f,g分别为过程的测量噪声,它们服从高斯分布为:
m~N(0,Ω1),其中Ω1=diag{λi}1,2,…,M
f~N(0,Ω2),其中Ω2=diag{λi}1,2,…,H
g~N(0,Ω3),其中Ω3=diag{λi}1,2,…,U
其中,Ωi为噪声矩阵的方差,它是一个各项不同性的对角阵,λi为噪声矩阵对角线上的元素;
diag{}的作用是使非对角线上元素变为0;
W,P,Q,Ω123构成所述的模型参数。本步骤中,利用期望最大化(EM)算法来更新模型参数,在E步利用当前模型参数估计潜隐变量的后验概率;在M步中,则通过极大化似然函数的方式更新模型参数。最后,反复迭代E步和M步直至达到模型收敛条件。
进一步讲,步骤(3)构建多采样率因子分析模型的具体包括:
(3-1)初始化模型参数{W,P,Q,Ω123};
(3-2)在E步,根据当前的模型参数值,获取模型潜隐变量估计的更新值;
(3-3)在M步,根据E步的更新结果,获取模型参数的更新值;
(3-4)计算新模型参数所对应的极大似然值与其原模型参数对应的极大似然值之间的差值,判断是否收敛:如果是,则进入步骤(4);如果否,则更新模型参数,返回步骤(3-2)。
步骤(3)中在优化前,定义预处理后的训练样本集V由三部分组成,分别为V3,V2,V1,其中前J个样本涉及了所有的采样率,其维度为M+H+U,构成数据子集V3;第J+1个样本至第N个样本涉及两种较高采样率,其维度为M+H,构成数据子集V2;第N+1个样本至第K个样本只涉及最高的采样率,其维度为M,构成数据子集V1
因此,整个数据集被定义为:
V=V3∪V2∪V1
={(x1,k,x2,k,x3,k)|k=1,…,J}∪{(x1,k,x2,k)|k=J+1,…,N}∪{x1,k|k=N+1,…,K}
然后对模型参数{W,P,Q,Ω123}随机进行初始化;在模型参数估计的E步,根据当前的模型参数值,获取模型潜隐变量估计的更新值,具体公式为:
Figure BDA0001740283360000041
Figure BDA0001740283360000042
Figure BDA0001740283360000043
Figure BDA0001740283360000051
Figure BDA0001740283360000052
Figure BDA0001740283360000053
其中,
Figure BDA0001740283360000054
为潜隐变量的后验概率的期望值,
Figure BDA0001740283360000055
分别为潜隐变量的后验概率的二阶矩;
方差辅助变量Σ321定义如下:
Figure BDA0001740283360000056
Figure BDA0001740283360000057
Figure BDA0001740283360000058
在M步,根据E步的更新结果,获取模型参数{W,P,Q,Ω123}的更新值如下:
Figure BDA0001740283360000059
Figure BDA00017402833600000510
Figure BDA00017402833600000511
Figure BDA00017402833600000512
Figure BDA00017402833600000513
Figure BDA00017402833600000514
最终,利用新模型参数所对应的极大似然值Lnew与其原模型参数对应的极大似然值Lold的差异,如果||Lnew-Lold||2<ε,则进入到第(4)步,否则,返回第(3-2)步,其中,ε为模型收敛的阈值,模型完整对数极大似然估计计算如下:
Figure BDA0001740283360000061
其中,p()为因子的联合概率密度函数
步骤(4)中,根据建立的多采样率因子分析模型估计训练样本的潜隐变量的期望值t,潜隐变量的方差var-1(t|x)和模型预测误差
Figure BDA00017402833600000617
构建相应的T2和SPE统计量监测统计限;
模型收敛后,计算得到的{W,P,Q,Ω123}获得训练样本潜隐变量的期望值tk,normal,其对应关系为:
Figure BDA0001740283360000062
Figure BDA0001740283360000063
Figure BDA0001740283360000064
利用潜隐变量的期望值tk,normal,可构建T2统计量如下:
Figure BDA0001740283360000065
其中,k可取1,2,3;
T2统计量的控制限由F分布估计如下:
Figure BDA0001740283360000066
其中,D为潜隐变量的个数,α为F分布的自由度。
同时,基于模型的预测误差,还可构建SPE统计量以反映模型残差空间的变化:
Figure BDA0001740283360000067
Figure BDA0001740283360000068
Figure BDA0001740283360000069
其中,
Figure BDA00017402833600000610
为数据集x1,x2,x3的估计值:
Figure BDA00017402833600000611
Figure BDA00017402833600000612
Figure BDA00017402833600000613
Figure BDA00017402833600000614
Figure BDA00017402833600000615
Figure BDA00017402833600000616
SPE统计量的控制限估计方法为:
Figure BDA0001740283360000071
其中,
gh=mean(SPE)
2g2h=var(SPE)
其中mean()为求均值,var()为求方差,
Figure BDA0001740283360000072
代表卡方分布,g和h分别为卡方分布的系数和自由度;通过式(21)可以求得g和h,进而求得3个SPE统计量控制限
Figure BDA0001740283360000073
步骤(5)中,在线收集新的造纸废水处理过程中与训练样本集过程变量对应的不同采样率样本数据,采样时间间隔由采样率最高的过程变量的采样率确定(可以等于或者大于最高的采样率,当然也可以小于,本实施例中,选择等于),得到测试样本集Xtest,并进行归一化,其样本数量分别为K',N',J',且J'≤N'≤K';
X1,test∈RM×K',X1,test={x1,test1,x1,test2,...,x1,testK'}
X2,test∈RH×N',X2,test={x2,test1,x2,test2,...,x2,testN'}
X3,test∈RU×J',X3,test={x3,test1,x3,test2,...,x3,testJ'}
其中K',N',J'分别为在相同采样时间间隔的不同采样率情况下采集的样本数量;
步骤(6)中,采用多采样率因子分析模型对其进行检测,计算测试样本的
Figure BDA0001740283360000074
和SPEtest统计量,当测试样本xk,test被采集后,其潜隐变量的期望值为:
Figure BDA0001740283360000075
Figure BDA0001740283360000076
Figure BDA0001740283360000077
利用潜隐变量的期望值tk,test,可构建T2统计量如下:
Figure BDA0001740283360000078
其中var-1(ttest|xk,test)为潜隐变量的方差,k可取1,2,3。基于模型的预测误差,可构建SPEtest统计量如下:
Figure BDA0001740283360000081
Figure BDA0001740283360000082
Figure BDA0001740283360000083
其中,
Figure BDA0001740283360000084
为测试数据集x1,test,x2,test,x3,test的估计值
Figure BDA0001740283360000085
Figure BDA0001740283360000086
Figure BDA0001740283360000087
Figure BDA0001740283360000088
Figure BDA0001740283360000089
Figure BDA00017402833600000810
判断其是否超过步骤(4)得到的控制限,得出待检测工业过程的在线检测结果:如果超过所述的控制限,则判断为发生故障;否则则判断生产过程正常。
本发明提供的基于多采样率因子分析模型的工业过程故障检测方法,以工业过程中不同采样率的变量为建模样本,在充分考虑到噪声方差差异性的同时,提取出能够对不同采样率变量能够起解释作用的少数公共因子,而模型参数的估计通过期望最大化(EM)算法实现,并在此模型的基础上建立了故障检测方法,以实现造纸废水处理过程的过程监控。该方法在实现多采样率信息处理的同时,既可以完整利用数据信息,又能充分考虑到数据噪声矩阵方差差异性,使降维后的少数潜隐变量实现对原有变量更好的解释与描述,从而在故障检测精度上实现提升。
具体实施方式
以造纸废水处理过程为例,对本发明做进一步说明:
一种基于多采样率因子分析模型的造纸废水处理过程故障检测方法,该方法针对造纸废水处理过程的故障检测问题,首先利用集散控制系统收集正常工作状态下不同采样率的数据,建立多采样率因子分析模型。该模型结构由期望最大化算法估计得到。在此基础上,利用模型的潜隐变量和预测误差构建了两个检测统计量T2和SPE及其对应的统计限
Figure BDA00017402833600000811
和SPElim。对在线造纸废水处理过程进行检测,获得测试样本,然后可利用已有的模型结构估计测试样本的潜隐变量及预测误差,并计算出相应的统计量,并得到最终的故障检测结果。
本发明是一种基于多采样率因子分析模型的造纸废水处理过程故障检测方法,包括以下步骤:
第一步:利用集散控制系统收集造纸废水处理过程中正常运行的不同采样率的数据,并组成数据建模用的训练样本集,假设采集到了三种采样率的正常样本,其样本数量分别为K,N,J,且J≤N≤K:
Figure BDA0001740283360000091
R表示实数集;M为第一种采样率过程变量数,H为第二种采样率过程变量数,U为第三种采样率过程变量数,将这些数据存入历史数据库;
对于造纸废水处理过程这些过程变量包括但不限于进水量、循环量、进出水PH、进出水温度、化学需氧量、生化需氧量等。
第二步:对数据集
Figure BDA0001740283360000093
进行预处理和归一化得到X1,X2,X3,使得各个过程变量的均值为零,方差为1,且与隐变量间存在线性相关关系,构建多采样率因子分析模型,其关系式如下:
Figure BDA0001740283360000092
X1∈RM×K,X1={x1,1,x1,2,...,x1,J,...,x1,N,...,x1,K}
X2∈RH×N,X2={x2,1,x2,2,...,x2,J,...,x2,N}
X3∈RU×J,X3={x3,1,x3,2,...,x3,J}
其中X1∈RM×K,X2∈RH×N,X3∈RU×J,M,H,U分别为X1,X2,X3的维数;
t∈RD×1为该模型的潜隐变量,D是潜隐变量的维度;
W∈RM×D,P∈RH×D,Q∈RU×D为模型负载矩阵;m,f,g分别为过程的测量噪声,它们服从高斯分布为:
Figure BDA0001740283360000101
其中,Ωi为噪声矩阵的方差,它是一个各项不同性的对角阵,λi为噪声矩阵对角线上的元素;
第三步:利用期望最大化(EM)算法来更新模型参数,在E步利用当前模型参数估计潜隐变量的后验概率;
首先,定义模型的数据集V由三部分组成,前J个样本涉及了所有的采样率,其维度为M+H+U,构成数据子集V3;第J+1个样本至第N个样本涉及两种较高采样率,其维度为M+H,构成数据子集V2;第N+1个样本至第K个样本只涉及最高的采样率,其维度为M,构成数据子集V1。因此,整个数据集被定义为:
V=V3∪V2∪V1 (4)
={(x1,k,x2,k,x3,k)|k=1,…,J}∪{(x1,k,x2,k)|k=J+1,…,N}∪{x1,k|k=N+1,…,K}
然后对模型参数{W,P,Q,Ω123}随机进行初始化;在模型参数估计的E步,根据当前的模型参数的初始值,获取模型潜隐变量估计的更新值,具体公式为:
Figure BDA0001740283360000102
Figure BDA0001740283360000103
其中,
Figure BDA0001740283360000104
为潜隐变量的后验概率的期望值,
Figure BDA0001740283360000105
分别为潜隐变量的后验概率的二阶矩,
方差辅助变量定义如下:
Figure BDA0001740283360000106
其中:I为单位阵;
在M步,根据E步的更新结果,获取模型参数{W,P,Q,Ω123}的更新值如下:
Figure BDA0001740283360000111
Figure BDA0001740283360000112
Figure BDA0001740283360000113
Figure BDA0001740283360000114
Figure BDA0001740283360000115
Figure BDA0001740283360000116
其中:diag{}的作用是使非对角线上元素变为0。
Figure BDA0001740283360000117
为W的更新值,
Figure BDA0001740283360000118
为P的更新值;
Figure BDA0001740283360000119
为Q的更新值;
Figure BDA00017402833600001110
为Ω1的更新值;
Figure BDA00017402833600001111
为Ω2的更新值;
Figure BDA00017402833600001112
为Ω3的更新值。
第四步:利用新模型参数所对应的极大似然值Lnew与其原模型参数对应的极大似然值Lold的差异,如果||Lnew-Lold||2<ε,则进入到第五步,否则,更新模型参数,返回第三步,其中,ε为模型收敛的阈值,模型完整对数极大似然估计计算如下:
Figure BDA0001740283360000121
其中,p()为因子的联合概率密度函数;
最后,反复迭代E步和M步直至达到模型收敛条件。
第五步:根据建立的多采样率因子分析模型估计训练样本的潜隐变量的期望值tk,normal,潜隐变量的方差var-1(tk,normal|xk,normal)和模型预测误差
Figure BDA0001740283360000128
构建相应的T2和SPE统计量检测统计限;
模型收敛后,计算得到的{W,P,Q,Ω123}获得训练样本潜隐变量的期望值tk,normal,其对应关系为:
Figure BDA0001740283360000122
利用潜隐变量的期望值tk,normal,可构建T2统计量如下:
Figure BDA0001740283360000123
其中,k可取1,2,3;
T2统计量的控制限
Figure BDA0001740283360000129
由F分布估计如下:
Figure BDA0001740283360000124
其中,D为潜隐变量的个数,α为F分布的自由度。
同时,基于模型的预测误差,还可构建SPE统计量以反映模型残差空间的变化:
Figure BDA0001740283360000125
其中,
Figure BDA0001740283360000126
为数据集x1,x2,x3的估计值;x1,x2,x3分别为一个向量,他们代表X1,X2,X3中某采样时刻的一个样本;
Figure BDA0001740283360000127
Figure BDA0001740283360000131
SPE统计量的控制限SPElim估计方法为:
Figure BDA0001740283360000134
其中,
gh=mean(SPE)
2g2h=var(SPE) (21)
其中mean()为求均值,var()为求方差,
Figure BDA0001740283360000135
代表卡方分布,g和h分别为卡方分布的系数和自由度;通过式(21)可以求得g和h,进而求得3个SPE统计量控制限
Figure BDA0001740283360000136
第六步:在线收集新的造纸废水处理过程中与训练样本集过程变量对应的不同采样率样本数据,采样时间间隔由采样率最高的过程变量的采样率确定(可以等于或者大于最高的采样率,当然也可以小于,本实施例中,选择等于),得到测试样本集Xtest,并进行归一化,其样本数量分别为K',N',J',且J'≤N'≤K';
Figure BDA0001740283360000132
其中K',N',J'分别为在相同采样时间间隔的不同采样率情况下采集的样本数量;
第七步:采用训练得到的多采样率因子分析模型对其进行检测,计算测试样本的
Figure BDA0001740283360000137
和SPEtest统计量。当测试样本xk,test(k=1,2,3)被采集后,其潜隐变量的期望值为:
Figure BDA0001740283360000133
x1,test,x2,test,x3,test分别为一个向量,他们代表X1,test,X2,test,X3,test中某采样时刻的一个样本;
利用潜隐变量的期望值tk,test,可构建测试样本的T2统计量如下:
Figure BDA0001740283360000141
其中var-1(ttest|xk,test)为潜隐变量的方差,k可取1,2,3。基于模型的预测误差,可构建SPEtest统计量如下:
Figure BDA0001740283360000142
其中,
Figure BDA0001740283360000143
为测试数据集x1,test,x2,test,x3,test的估计值。
Figure BDA0001740283360000144
Figure BDA0001740283360000145
判断其是否超过步骤五得到的控制限,得出造纸废水处理过程的在线检测结果:如果超过所述的控制限,则判断为发生故障;否则,则判断生产过程正常。

Claims (3)

1.一种基于多采样率因子分析模型的工业过程故障检测方法,其特征在于,包括:
(1)采集工业过程中正常运行的不同采样率的数据,并组成数据建模用的训练样本集;
(2)对训练样本集进行预处理,预处理后的训练样本集与隐变量间存在线性相关关系;
(3)利用预处理后的训练样本集,利用期望最大化算法构建多采样率因子分析模型;
(4)根据建立的多采样率因子分析模型估计训练样本集的潜隐变量的期望值,潜隐变量的方差和模型预测误差,构建相应的T2和SPE统计量检测统计限;
(5)在线收集新的工业过程中与训练样本集过程变量对应的不同采样率样本数据,得到测试样本集,并对测试样本集进行预处理;
(6)采用得到的多采样率因子分析模型对测试样本集进行检测,计算测试样本集的
Figure FDA0002711730350000011
和SPEtest统计量,并与步骤(4)得到的检测统计限对比,输出检测结果;
步骤(1)中,采集三种不同采样率的数据组成数据建模用的训练样本集,对其预处理后得到X1,X2,X3
X1∈RM×K,X1={x1,1,x1,2,...,x1,J,...,x1,N,...,x1,K}
X2∈RH×N,X2={x2,1,x2,2,...,x2,J,...,x2,N}
X3∈RU×J,X3={x3,1,x3,2,...,x3,J}
K,N,J分别为三种采样率下的样本数量,且J≤N≤K;R表示实数集;M,H,U分别为三种采样率下的过程变量数;
步骤(3)构建多采样率因子分析模型具体包括:
(3-1)初始化模型参数;
(3-2)在E步,根据当前的模型参数的值,获取模型潜隐变量估计的更新值;
(3-3)在M步,根据E步的更新结果,获取模型参数的更新值;
(3-4)计算新模型参数所对应的极大似然值与其原模型参数对应的极大似然值之间的差值,判断是否收敛:如果是,则进入步骤(4);如果否,则更新模型参数,返回步骤(3-2);
步骤(3)中,多采样率因子分析模型如下:
X1=Wt+m
X2=Pt+f
X3=Qt+g
t∈RD×1为该模型的潜隐变量,D是潜隐变量的维度;W∈RM×D,P∈RH×D,Q∈RU×D为模型负载矩阵;m,f,g分别为过程的测量噪声,它们服从高斯分布为:
m~N(0,Ω1),其中Ω1=diag{λi}1,2,…,M
f~N(0,Ω2),其中Ω2=diag{λi}1,2,…,H
g~N(0,Ω3),其中Ω3=diag{λi}1,2,…,U
diag{}的作用是使非对角线上元素变为0;Ωi为噪声矩阵的方差;λi为噪声矩阵对角线上的元素;
W,P,Q,Ω123构成所述的模型参数;
步骤(3)中:
定义预处理后的训练样本集V由三部分组成,分别为V3,V2,V1,其中前J个样本涉及了所有的采样率,其维度为M+H+U,构成数据子集V3;第J+1个样本至第N个样本涉及两种较高采样率,其维度为M+H,构成数据子集V2;第N+1个样本至第K个样本只涉及最高的采样率,其维度为M,构成数据子集V1
在E步,根据当前的模型参数值,获取模型潜隐变量估计的更新值,具体公式为:
Figure FDA0002711730350000021
Figure FDA0002711730350000022
Figure FDA0002711730350000023
Figure FDA0002711730350000031
Figure FDA0002711730350000032
Figure FDA0002711730350000033
其中,
Figure FDA0002711730350000034
为潜隐变量的后验概率的期望值,
Figure FDA0002711730350000035
分别为潜隐变量的后验概率的二阶矩;
方差辅助变量Σ321定义如下:
Figure FDA0002711730350000036
Figure FDA0002711730350000037
Figure FDA0002711730350000038
在M步,根据E步的更新结果,获取模型参数{W,P,Q,Ω123}的更新值如下:
Figure FDA0002711730350000039
Figure FDA00027117303500000310
Figure FDA00027117303500000311
Figure FDA00027117303500000312
Figure FDA00027117303500000313
Figure FDA00027117303500000314
步骤(3)中,模型完整对数极大似然估计计算如下:
Figure FDA00027117303500000315
其中,p()为因子的联合概率密度函数;
步骤(4)中,根据最终的{W,P,Q,Ω123}获得训练样本潜隐变量的期望值tk,normal,其对应关系为:
Figure FDA0002711730350000041
2.根据权利要求1所述的基于多采样率因子分析模型的工业过程故障检测方法,其特征在于,所述工业过程为造纸废水处理过程。
3.根据权利要求1所述的基于多采样率因子分析模型的工业过程故障检测方法,其特征在于,步骤(2)和步骤(5)预处理后,使得各个过程变量的均值为零,方差为1。
CN201810815760.6A 2018-07-24 2018-07-24 一种基于多采样率因子分析模型的工业过程故障检测方法 Active CN109085805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810815760.6A CN109085805B (zh) 2018-07-24 2018-07-24 一种基于多采样率因子分析模型的工业过程故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810815760.6A CN109085805B (zh) 2018-07-24 2018-07-24 一种基于多采样率因子分析模型的工业过程故障检测方法

Publications (2)

Publication Number Publication Date
CN109085805A CN109085805A (zh) 2018-12-25
CN109085805B true CN109085805B (zh) 2020-12-04

Family

ID=64838151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810815760.6A Active CN109085805B (zh) 2018-07-24 2018-07-24 一种基于多采样率因子分析模型的工业过程故障检测方法

Country Status (1)

Country Link
CN (1) CN109085805B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488892A (zh) * 2019-01-25 2020-08-04 顺丰科技有限公司 样本数据生成方法及装置
CN109917777B (zh) * 2019-04-16 2020-08-25 浙江科技学院 基于混合多采样率概率主成分分析模型的故障检测方法
CN111340238B (zh) * 2020-03-12 2023-12-15 中南大学 一种工业系统的故障诊断方法、装置、设备及存储介质
CN111913446B (zh) * 2020-06-13 2022-03-18 宁波大学 一种适用于多采样率化工过程的故障检测方法
CN112286169B (zh) * 2020-10-20 2022-02-01 浙江钱江机器人有限公司 一种工业机器人故障检测方法
CN113609766B (zh) * 2021-07-29 2024-05-17 浙江科技学院 一种基于深度概率潜隐模型的软测量方法
CN116776921B (zh) * 2023-06-09 2024-04-19 淮阴工学院 一种基于改进patch-informer的太阳辐射预测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404280A (zh) * 2015-12-11 2016-03-16 浙江科技学院 基于自回归动态隐变量模型的工业过程故障检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404280A (zh) * 2015-12-11 2016-03-16 浙江科技学院 基于自回归动态隐变量模型的工业过程故障检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Multiple Fault Detection Using Multi-rate Probability Principal Component Analysis Models;Le Zhou等;《IFAC-PapersOnLine》;20170731;第50卷(第1期);第14752-14757页正文摘要、第2-4节及表1-2 *

Also Published As

Publication number Publication date
CN109085805A (zh) 2018-12-25

Similar Documents

Publication Publication Date Title
CN109085805B (zh) 一种基于多采样率因子分析模型的工业过程故障检测方法
CN109164343B (zh) 基于特征信息量化与加权knn的变压器故障诊断方法
CN111222290B (zh) 一种基于多参数特征融合的大型设备剩余使用寿命预测方法
CN112101480B (zh) 一种多变量聚类与融合的时间序列组合预测方法
CN106055918B (zh) 一种电力系统负荷数据的辨识及修正方法
CN108549908B (zh) 基于多采样概率核主成分模型的化工过程故障检测方法
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
Wang et al. High-dimensional process monitoring and fault isolation via variable selection
CN107357275B (zh) 非高斯工业过程故障检测方法及系统
CN109917777B (zh) 基于混合多采样率概率主成分分析模型的故障检测方法
CN109240274B (zh) 一种基于高阶相关性的工业过程故障诊断方法
CN109409425B (zh) 一种基于近邻成分分析的故障类型识别方法
CN109492265B (zh) 基于动态非线性pls软测量方法的废水出水指标预测方法
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN110942258B (zh) 一种性能驱动的工业过程异常监测方法
CN110852906B (zh) 一种基于高维随机矩阵进行窃电嫌疑识别的方法和系统
US11276300B2 (en) Method for learning latest data considering external influences in early warning system and system for same
CN110427019B (zh) 一种基于多变量判别分析的工业过程故障分类方法及控制装置
CN112766301A (zh) 一种采油机示功图相似性判断方法
CN110084301B (zh) 一种基于隐马尔可夫模型的多工况过程工况辨识方法
CN109325065B (zh) 基于动态隐变量模型的多采样率软测量方法
CN114611067A (zh) 一种基于典型变量相异性分析的化工过程缓变故障检测方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN111241629B (zh) 基于数据驱动的飞机液压泵性能变化趋势智能预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant