CN111324110A - 一种基于多块收缩自动编码器的发酵过程故障监测方法 - Google Patents

一种基于多块收缩自动编码器的发酵过程故障监测方法 Download PDF

Info

Publication number
CN111324110A
CN111324110A CN202010205127.2A CN202010205127A CN111324110A CN 111324110 A CN111324110 A CN 111324110A CN 202010205127 A CN202010205127 A CN 202010205127A CN 111324110 A CN111324110 A CN 111324110A
Authority
CN
China
Prior art keywords
data
spe
monitoring
sub
batch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010205127.2A
Other languages
English (en)
Inventor
刘腾飞
高学金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202010205127.2A priority Critical patent/CN111324110A/zh
Publication of CN111324110A publication Critical patent/CN111324110A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明公开了一种对青霉素发酵过程进行实时故障监测的新方法,包括“离线建模”和“在线监测”两个阶段。“离线建模”包括:首先将历史三维数据展开为二维数据矩阵,使用互信息(MI)对累积误差数据进行相关子块划分,在此基础上,利用收缩自编码器(CAE)对每个子空间进行建模和监测;“在线监测”包括:对新采集的数据按照模型进行处理,计算其统计量并与控制限进行比较判断发酵过程是否运行正常,最终构造综合统计量将不同子空间监测结果融合在一起,进行综合分析。本发明使用累积误差和互信息构造子块,有效降低了系统复杂度且提高了故障监测灵敏度;分块监测模型反映了过程更多的局部信息,故障更容易被监测到。

Description

一种基于多块收缩自动编码器的发酵过程故障监测方法
技术领域
本发明涉及基于数据驱动的故障诊断技术领域,特别是涉及一种针对间歇过程的故障诊断技术。本发明的基于数据驱动的方法即是在典型间歇过程——青霉素发酵过程故障监测方面的具体应用。
背景技术
近几十年来,间歇过程因其可以满足生产高附加值产品的需求而受到广泛关注。但其机理复杂、操作复杂度高、产品质量易受不确定性因素的影响。青霉素发酵过程作为典型的间歇过程,具有较强的非线性、动态性、混合高斯分布等特点,为了保证发酵过程操作系统的安全性和稳定性,建立一种有效的过程监控方案来及时地检测异常现象是十分有必要的。
目前,多元统计技术已经广泛应用到间歇过程(包括发酵过程)的过程监控。其中应用较多的方法有多向主成分分析(Multi-way Principal Component Analysis,MPCA)和多向偏最小二乘分析(Multi-way Partial Least Squares,MPLS),然而这些方法是线性统计方法,对于复杂的实际间歇过程,变量之间往往呈现出很强的非线性相关关系特性。核方法如多向核主成分分析MKPCA和多向核偏最小二乘分析MKPLS可解决非线性问题,但当过程变量众多且采样值数大,核矩阵K的运算将变得十分复杂,同时核主元的个数对整体的监控性能影响较大。自动编码器(Autoencoder,AE)可以看做PCA的非线性扩展,能够提取工业数据的非线性特征。但AE是基于数据全局结构的特征提取方法,隐层特征鲁棒性较差,容易受到噪声干扰。这些都极大限制了AE的故障监控性能。
发明内容
为了克服上述现有技术的不足,本发明提供了一种基于多块收缩自动编码器(Multi-block Contractive Auto-encoder,MCAE)的发酵过程故障监测方法。数据处理上构造发酵过程数据累积误差矩阵,并使用互信息(MI)对累积误差矩阵进行相关变量子块划分,在此基础上,利用收缩自编码器(CAE)对每个子空间分别进行建模和监测,最终将不同子空间监测结果融合在一起,进行综合分析。本文发明方法相比全局过程监测方法,其能有效降低系统复杂度和提高故障监测灵敏度。此外,通过收缩自编码器提取数据特征,提高了模型的鲁棒性,有效减少过程监测中误报、漏报的发生,提高故障监测的准确性。
本发明采用了如下的技术方案及实现步骤:
A.离线建模阶段:
1)采集发酵过程正常工况下的历史数据,由离线测试得到的同一发酵过程相同工艺下的I批次数据构成样本集X=(X1,X2,...,XI)T,其中Xi表示第i批次数据,每个批次包含K个采样时刻,每个采样时刻采集J个过程变量,即Xi=(Xi,1,Xi,2,...,Xi,K),其中Xi,k表示第i批次第k采样时刻采集的数据,Xi,k=(xi,k,1,xi,k,2,...,xi,k,J),其中xi,k,j表示第i批次中第k采样时刻的第j个过程变量的测量值;
2)对历史数据X进行数据预处理,处理方式如下:
首先计算历史数据X的所有时刻上所有过程变量的均值和标准方差,其中第k采样时刻的第j个过程变量的均值
Figure BDA0002420134280000035
的计算公式为,
Figure BDA0002420134280000031
xi,k,j表示第i批次中第k采样时刻的第j个过程变量的测量值,k=1,...,K,j=1,...,J;第k采样时刻的第j个过程变量的标准方差sk,j的计算公式为,
Figure BDA0002420134280000032
k=1,...,K,j=1,...,J;然后对历史数据X进行标准化,其中第i批次中第k采样时刻的第j个过程变量的标准化计算公式如下:
Figure BDA0002420134280000033
其中,i=1,...,I,j=1,...,J,k=1,...,K;
3)将步骤2)标准化后的数据重新构造成矩阵X′,该矩阵共有I个批次,即X′=(X′1,X′2,...,X′I)T,其中第i个批次数据X′i=(X′i,1,X′i,2,...,X′i,K),X′i,k=(x′i,k,1,x′i,k,2,...,x′i,k,J),其中x′i,k,j表示经过步骤2)标准化处理后的第i个批次中第k个采样时刻第j个过程变量的值,i=1,...,I,k=1,...,K,j=1,...,J;
4)计算步骤3)矩阵X′的累积误差矩阵X″,该矩阵共有I个批次,即X″=(X″1,X″2,...,X″I)T,其中第i个批次数据X″i=(X″i,1,X″i,2,...,X″i,K),X″i,k=(x″i,k,1,x″i,k,2,...,x″i,k,J),i=1,...,I,k=1,...,K,j=1,...,J。其中x″i,t,j表示第i个批次中第j个过程变量前t个采样时刻的累积误差值,计算公式为
Figure BDA0002420134280000034
t=1,...,K;
累积误差信息是累积一定时间段内观测值信息与设定的标准值的差而得到的信息。当过程变量发生微小的偏移或缓变故障时,提取累计误差信息可以将这种变化放大,从而使监测模型能够监测到这类故障,提高故障监测的灵敏性。标准化后正常工况过程变量数据集的均值作为计算误差的标准值,其中每个变量的均值为0,方差为1,因此计算累积误差时可以直接将样本值相加。
5)步骤4)矩阵X″有J个过程变量,可表示为X″=(X″1,X″2,...,X″J),其中第j个过程变量数据X″j=(X″j,1K,X″j,2K,...,X″j,IK)T,X″j,iK=(x″j,i,1,x″j,i,2,...,x″j,i,K)T,i=1,...,I,k=1,...,K,j=1,...,J。分别计算两两变量之间的互信息值,即Imn=I(X″m,X″n),m=1,...,J,n=1,...,J。其中互信息的计算直接采用MATLAB工具箱MIToolbox进行。然后,这些过程向量可以根据两个变量之间的互信息值分成若干个子块。那些相互之间具有较大互信息的向量应该被分到同一个块中,即如果Imn≥Ith,其中Ith是一个阈值,那么向量X″m就应该和向量X″n分到同一个子块中。对于某个确定的过程,阈值可以定义为一个经验参数值。这种分块方法不仅考虑了变量之间的线性相关性,还考虑了变量间的非线性或高阶相关性,分块结果相较于只考虑线性相关性更为合理。最终的划分结果为X″=[X″′ 1X″′2... X″′B],其中B是划分子块数量。其中,第b个子块记为X″′b=(X″p,...,X″q),b=1,...,B,表示第b个子块由第p、…、q个过程变量数据构成;
在过程变量个数众多的过程中,当对只影响个别变量的局部故障进行监测时将会有大量的冗余变量存在,会明显降低过程监测效果。因此本发明通过划分子块的方式将具有紧密相关关系的变量聚集到一起,将无关变量分散到不同的空间中,分为相关变量子块和冗余变量子块,以减少冗余变量对监测效果的影响。
6)建立多块收缩自动编码器模型用于特征提取,具体包括以下步骤:
(6.1)对B个子块分别建立收缩自动编码器网络模型用于特征提取,其中,每一个网络模型结构包括输入层、隐含层和输出层,其中,隐含层节点数少于输入层节点数和输出层节点数,为提取的发酵数据特征层;其中,第b个网络模型结构的输入为加入掩蔽噪声ε的第b个子块的发酵过程数据
Figure BDA0002420134280000051
第b个网络模型结构的输出为重构的子块发酵过程数据Rb,由输入层到隐含层为编码过程,具体形式为:
Figure BDA0002420134280000052
其中,
Figure BDA0002420134280000053
中的第i批次的数据,Hb,i
Figure BDA0002420134280000055
的隐含层编码,σ为隐含层激活函数,W和β分别为输入层到隐含层的连接权值和偏置向量;由隐含层到输出层为解码过程,具体形式为:
Rb,i=W′Hb,i+β′
其中,Rb,i为输入
Figure BDA0002420134280000056
后输出层重构的子块发酵过程数据,W′和β′分别为隐含层到输出层的连接权值和偏置向量;
(6.2)对网络参数η={W,W′,β,β′}进行随机初始化,采用小批量梯度下降算法迭代训练收缩自动编码器,每次迭代使用一个发酵批次样本
Figure BDA0002420134280000057
来对参数η进行更新;其中,收缩自动编码器损失函数为:
Figure BDA0002420134280000058
其中
Figure BDA0002420134280000061
为隐含层对于输入数据的雅克比矩阵,λ为收缩率,取值在0-1之间;
7)分别计算B个子块监测模型相对应的SPE统计量。其中第b个子块监测模型的SPE统计量计算如下,SPEb=(SPEb,1,...,SPEb,I),SPEb,i=(SPEb,i,1,...,SPEb,i,K),第i个批次中第k个采样时刻的SPE统计量定义为:
SPEb,i,k=(x″b,i,k-rb,i,k)T(x″b,i,k-rb,i,k)
x″b,i,k为第b个子块的第i个批次中第k个采样时刻的样本,rb,i,k为输入x″b,i,k到训练好的收缩自动编码器得到的实际输出;最后,利用核密度估计方法估计上述求得的SPE统计量在预设置信限时的估计值,并将其作为第b个子块SPEb统计量的控制限。其余B-1个子块监测模型的SPE统计量控制限的计算重复以上过程。将B个子块监测模型的SPE统计量控制限合成一个综合统计量的控制限SPEnew
Figure BDA0002420134280000062
收缩自动编码器是一种无监督特征提取神经网络,在普通自编码器上增加了一个惩罚项提高网络鲁棒性。传统监测方法如PCA、ICA是假设变量之间线性相关的,对于非线性过程监测存在问题。建立收缩自动编码器模型通过重构输入数据来提取其中的重要特征,提取数据中的非线性信息,同时克服一些噪声对监测的干扰。
B.在线监测阶段:
8)采集当前发酵过程第k采样时刻的J个过程变量的数据Xk,并根据步骤2)中得到的k时刻的均值和标准方差对其进行标准化得到
Figure BDA0002420134280000071
其中第k采样时刻的第j个过程变量
Figure BDA0002420134280000072
的标准化公式如下:
Figure BDA0002420134280000073
其中,xk,j为当前第k采样时刻所采集发酵数据中的第j个过程变量,
Figure BDA0002420134280000074
为步骤2)中得到的第k采样时刻的第j个过程变量的平均值,sk,j为步骤2)中得到的第k采样时刻的第j个过程变量的标准方差,j=1,...,J,k=1,...,K;
9)按照步骤5)将
Figure BDA0002420134280000075
进行子块划分,划分为B个输入向量
Figure BDA0002420134280000076
将这B个输入向量分别输入步骤6)中对应的收缩自动编码器网络模型中,其中,
Figure BDA0002420134280000077
输入步骤6)中的第b个收缩自动编码器,计算第b个收缩自动编码器对当前发酵过程第k时刻采集数据的监控统计量,计算公式如下:
Figure BDA0002420134280000078
其中,yk,b为将
Figure BDA0002420134280000079
输入离线建模阶段步骤6)中第b个收缩自动编码器模型得到的输出向量;
10)将步骤9)的B个收缩自动编码器对当前发酵过程第k时刻采集数据的监控统计量SPEk,b合为一个新的统计量
Figure BDA00024201342800000710
Figure BDA00024201342800000711
11)将步骤10)得到的监控统计量SPEk new与步骤7)确定的综合控制限SPEnew进行比较,如果超限则认为发生故障,进行报警;否则即为正常;
12)若发酵过程完毕,则终止监测;否则采集下一时刻的数据,返回步骤8),继续进行过程监测。
有益效果
1)本发明方法采用基于互信息分块策略构建子空间监测模型,相比全局过程监测方法,不需要精确的过程模型和对系统知识的认知,其能有效降低系统复杂程度和挖掘更多局部过程信息。
2)本发明结合累积误差和收缩自动编码器,增强了监控模型的鲁棒性,提高了故障监测的准确性。
附图说明
图1为本发明的方法流程图;
图2为三维发酵数据展开示意图;
图3为正常数据X40×10×400组成形式示意图;
图4为标准化后重新构造的三维矩阵X'组成形式示意图;
图5为本发明的自动编码器结构;
图6为现有AE方法对正常批次数据的SPE监测图;
图7为本发明方法对正常批次数据的SPE监测图;
图8为现有AE方法对阶跃故障批次数据的SPE监测图;
图9为本发明方法对阶跃故障批次数据的SPE监测图;
图10为现有AE方法对斜坡故障批次数据的SPE监测图;
图11为本发明方法对斜坡故障批次数据的SPE监测图。
其中,图1中的虚线表示“在线监测”与“离线建模”各步骤之间存在的联系。
具体实施方式
青霉素是一种高效、低毒、临床应用广泛的重要抗生素,其生产过程是一个典型的动态、非线性、多阶段的间歇生产过程。美国Illinois州立理工学院过程监控与技术小组开发的青霉素仿真平台PenSim2.0,为青霉素间歇生产过程的监测、故障诊断以及控制提供了一个标准平台。在此平台上可以实现青霉素发酵过程的一系列仿真,相关研究已表明该仿真平台的实用性与有效性。
本实验即以PenSim2.0为仿真研究对象,设置采样时间间隔为1h,选取10个过程变量监视过程运行状况,如表1所示。仿真了41批正常数据,2批故障数据,每个批次400小时。其中选择40批正常数据X40×10×400用于建立模型,另外1批正常数据和2批故障数据作为测试数据,用于验证方法的有效性。设置的2种故障类型、幅度、起止时间,见表2。
表1建立模型所用变量
Figure BDA0002420134280000091
表2故障设置情况
Figure BDA0002420134280000101
将本发明方法应用到上述发酵过程仿真对象包括离线建模和在线监测两个大步骤,具体陈述如下:
A.离线建模阶段:
步骤1:将上述40批正常数据X40×10×400沿批次方向展开,具体展开形式见图2,展开结果见图3。可以看到一共有400个矩形框(即400个时刻),每个矩形框都由40行10列构成(即40个批次,10个变量);
步骤2:对X40×10×400进行标准化处理。首先按公式
Figure BDA0002420134280000102
计算第k采样时刻的第j个过程变量在所有批次上的均值,其中xi,k,j为X40×10×400第i批次中第k采样时刻的第j个过程变量的测量值,k=1,...,400,j=1,...,10;第k采样时刻的第j个过程变量的标准方差sk,j的计算公式为,
Figure BDA0002420134280000103
k=1,...,400,j=1,...,10。
然后对X40×10×400进行标准化,其中第i批次中第k采样时刻的第j个过程变量的标准化计算公式如下:
Figure BDA0002420134280000104
其中,i=1,...,40,j=1,...,10,k=1,...,400;
步骤3:将步骤2标准化后的数据重新构造成三维矩阵X′,具体展开形式见图2,展开结果见图4,可以看到一共有40个矩形框(即40个批次),每个矩形框都由400行10列构成(即400个时刻,10个变量);
步骤4:计算步骤3矩阵X′的累积误差矩阵X″,X″=(X″1,X″2,...,X″40)T,其中第i个批次数据X″i=(X″i,1,X″i,2,...,X″i,K),X″i,k=(x″i,k,1,x″i,k,2,...,x″i,k,J),i=1,...,40,k=1,...,400,j=1,...,10。其中x″i,t,j表示第i个批次中第j个过程变量前t个采样时刻的累积误差值,计算公式为
Figure BDA0002420134280000111
t=1,...,400。
步骤5:累积误差矩阵X″可表示为X″=(X″1,X″2,...,X″10),分别计算10个变量之间的互信息值,根据变量互信息值对子块进行划分,X″被划分为两个子块,子块1:X″′1=(X″5,X″6,X″9,X″10)和子块2:X″′2=(X″1,X″2,X″3,X″4,X″7,X″8);
步骤6:对2个子块分别建立收缩自动编码器网络模型用于特征提取。其中每一个网络模型结构包括输入层、隐含层和输出层,具体模型结构见图5。由输入层到隐含层为编码过程,具体形式为:
Figure BDA0002420134280000112
其中,
Figure BDA0002420134280000113
为加入0.1比例掩蔽噪声的子块发酵数据
Figure BDA0002420134280000114
的第i批次的数据,Hb,i
Figure BDA0002420134280000115
的隐含层编码,σ为sigmoid函数,W和β分别为输入层到隐含层的连接权值和偏置向量;由隐含层到输出层为解码过程,具体形式为:
Rb,i=W′Hb,i+β′
其中,Rb,i为输入
Figure BDA0002420134280000116
后输出层重构的子块发酵过程数据,W′和β′分别为隐含层到输出层的连接权值和偏置向量;
然后在(-1,1)的范围内对参数η={W,W′,β,β′}进行随机初始化,采用小批量梯度下降算法迭代训练收缩自动编码器,每次迭代使用一个发酵批次样本
Figure BDA0002420134280000121
来对参数η进行更新;定义收缩自动编码器损失函数为:
Figure BDA0002420134280000122
其中
Figure BDA0002420134280000123
hj(x)表示隐含层,xi表示输入层,代表的是隐含层对输入数据的偏微分的平方和,即隐含层对于输入数据的雅克比矩阵。λ为收缩率,取值为0.5;
步骤7:分别计算2个子块监测模型相对应的SPE统计量。其中第1个子块监测模型的SPE统计量计算如下,SPE1=(SPE1,1,...,SPE1,I),SPE1,i=(SPE1,i,1,...,SPE1,i,400),第i个批次中第k个采样时刻的SPE统计量定义为:
SPE1,i,k=(x″1,i,k-r1,i,k)T(x″1,i,k-r1,i,k)
x″1,i,k为第1个子块的第i个批次中第k个采样时刻的样本,r1,i,k为输入x″b,i,k到训练好的收缩自动编码器得到的实际输出;最后,利用核密度估计方法估计SPE1统计量在预设置信限时的估计值,并将其作为第1个子块SPE1统计量的控制限。另一个子块监测模型的SPE统计量控制限的计算重复以上过程。将2个子块监测模型的SPE统计量控制限合成一个综合统计量的控制限SPEnew
Figure BDA0002420134280000124
B.在线监测阶段:
步骤8:采集当前发酵过程第k采样时刻的J个过程变量的数据Xk,并根据步骤2中得到的k时刻的均值和标准方差对其进行标准化得到
Figure BDA0002420134280000131
其中第k采样时刻的第j个过程变量
Figure BDA0002420134280000132
的标准化公式如下:
Figure BDA0002420134280000133
其中,xk,j为当前第k采样时刻所采集发酵数据中的第j个过程变量,
Figure BDA0002420134280000134
为步骤2中得到的第k采样时刻的第j个过程变量的平均值,sk,j为步骤2中得到的第k采样时刻的第j个过程变量的标准方差,j=1,...,10,k=1,...,400;
步骤9:将
Figure BDA0002420134280000135
按照步骤5子块划分结果划分为2个输入向量,Xk=(Xk,1,Xk,2),将这2个输入向量分别输入步骤6中对应的收缩自动编码器网络模型中,其中,
Figure BDA0002420134280000136
输入步骤6)中的第b个收缩自动编码器,b=1,2,计算第b个收缩自动编码器对当前发酵过程第k时刻采集数据的监控统计量,计算公式如下:
Figure BDA0002420134280000137
其中,yk,b为将
Figure BDA0002420134280000138
输入离线建模阶段步骤6中第b个收缩自动编码器模型得到的输出向量;
步骤10:将步骤9的2个收缩自动编码器对当前发酵过程第k时刻采集数据的监控统计量SPEk,b合为一个新的统计量SPEk new
Figure BDA0002420134280000139
步骤11:将步骤10得到的监控统计量SPEk new与步骤7确定的综合控制限SPEnew进行比较,如果超限则认为发生故障,进行报警;否则即为正常;
步骤12:若发酵过程完毕,则终止监测;否则采集下一时刻的数据,返回步骤8,继续进行过程监测。
上述步骤即为本发明方法在青霉素发酵仿真平台故障监测领域的具体应用。为了验证本方法的有效性,对3批测试数据分别进行了在线监测阶段的实验。得到的实验结果见图6至图11,每幅图分别包括与横坐标平行的虚线和曲线,其中与横坐标平行的虚线为通过核密度估计方法确定的控制限,曲线为实时的监测值。如果曲线的值大于控制限的值,说明在此时刻发酵过程发生了故障;否则说明发酵过程运行正常。
图6和图7分别为现有AE方法和本发明方法对正常批次数据的监测效果图。图6中与横坐标平行的虚线为控制限,曲线为实时的SPE监测值;图7中与横坐标平行的虚线为控制限,曲线为实时的SPE监测值。可以发现,图6中的SPE监测图在第91、93、201时刻发生了3次超限,为误报警;而本发明方法的SPE监测图没有发生任何误报警,监测效果较好。图8和图9分别为现有AE方法和本发明方法对阶跃故障批次数据的监测效果图。图8中与横坐标平行的虚线为控制限,曲线为实时的SPE监测值;图9中与横坐标平行的虚线为控制限,曲线为实时的SPE监测值。由于故障1为较大的阶跃型故障,两种监测方法均可有效的检测出故障的发生。但是现有方法依然存在较多的误报警,比如图8中的SPE统计量在第30、106、151、297、302时刻均发生了误报警,而本发明方法没有任何误报警,且检测到的故障阶跃幅值更大,显示出更好的监测效果。图10和图11分别为现有AE方法和本发明方法对斜坡故障批次数据的监测效果图。图10中的横线为控制限,曲线为实时的SPE监测值;图11中的横线为控制限,曲线为实时的SPE监测值。图10中的SPE统计量在第59、95、122、161、177时刻均发生了误报警,而本发明方法没有任何误报警。由于此故障为缓慢变化的斜坡故障,两种监测方法均不能及时检测出在第200时刻发生的故障,有一定的延时性。其中,图10中的SPE监测图在第206时刻开始检测到故障,但在之后的210、211、212、213、216、219时刻均出现了漏报警;图11中的SPE监测图在第205时刻开始检测到故障。相比之下,本发明方法在故障检测的及时性和鲁棒性方面优于现有AE方法。
为了更形象地对比现有方法与本发明方法应用于发酵过程故障监测的有效性,对上述三批测试数据的监测效果列表对比如下:
表3故障检测情况
Figure BDA0002420134280000151
注:1)未发生故障时不产生警报的样本数目加上故障发生后报警的样本数目总和与总的样本数目比值;2)未发生故障时产生报警的样本与正常样本数目比值;3)发生故障后未报警的样本与故障样本数目的比值.
从上表3不难发现,无论是在误报率、漏报率方面还是在准确率方面,本发明方法均比现有方法有所提升,提高了青霉素发酵过程故障监测效果。

Claims (1)

1.一种基于多块收缩自动编码器的发酵过程故障监测方法,其特征包括“离线建模”和“在线监测”两个阶段,具体步骤如下:
A.离线建模阶段:
1)采集发酵过程正常工况下的历史数据,由离线测试得到的同一发酵过程相同工艺下的I批次数据构成样本集X=(X1,X2,...,XI)T,其中Xi表示第i批次数据,每个批次包含K个采样时刻,每个采样时刻采集J个过程变量,即Xi=(Xi,1,Xi,2,...,Xi,K),其中Xi,k表示第i批次第k采样时刻采集的数据,Xi,k=(xi,k,1,xi,k,2,...,xi,k,J),其中xi,k,j表示第i批次中第k采样时刻的第j个过程变量的测量值;
2)对历史数据X进行数据预处理,处理方式如下:
首先计算历史数据X的所有时刻上所有过程变量的均值和标准方差,其中第k采样时刻的第j个过程变量的均值
Figure FDA0002420134270000011
的计算公式为,
Figure FDA0002420134270000012
xi,k,j表示第i批次中第k采样时刻的第j个过程变量的测量值,k=1,...,K,j=1,...,J;第k采样时刻的第j个过程变量的标准方差sk,j的计算公式为,
Figure FDA0002420134270000013
然后对历史数据X进行标准化,其中第i批次中第k采样时刻的第j个过程变量的标准化计算公式如下:
Figure FDA0002420134270000014
其中,i=1,...,I,j=1,...,J,k=1,...,K;
3)将步骤2)标准化后的数据重新构造成矩阵X′,该矩阵共有I个批次,即X′=(X′1,X′2,...,X′I)T,其中第i个批次数据X′i=(X′i,1,X′i,2,...,X′i,K),X′i,k=(x′i,k,1,x′i,k,2,...,x′i,k,J),其中x′i,k,j表示经过步骤2)标准化处理后的第i个批次中第k个采样时刻第j个过程变量的值,i=1,...,I,k=1,...,K,j=1,...,J;
4)计算步骤3)矩阵X′的累积误差矩阵X″,该矩阵共有I个批次,即X″=(X″1,X″2,...,X″I)T,其中第i个批次数据X″i=(X″i,1,X″i,2,...,X″i,K),X″i,k=(x″i,k,1,x″i,k,2,...,x″i,k,J),i=1,...,I,k=1,...,K,j=1,...,J,x″i,t,j表示第i个批次中第j个过程变量前t个采样时刻的累积误差值,计算公式为
Figure FDA0002420134270000021
5)步骤4)矩阵X″有J个过程变量,可表示为X″=(X″1,X″2,...,X″J),其中第j个过程变量数据X″j=(X″j,1K,X″j,2K,...,X″j,IK)T,X″j,iK=(x″j,i,1,x″j,i,2,...,x″j,i,K)T,i=1,...,I,k=1,...,K,j=1,...,J,分别计算两两变量之间的互信息值,即Imn=I(X″m,X″n),m=1,...,J,n=1,...,J,如果Imn≥Ith,其中Ith是一个阈值,那么第m个过程变量数据X″m和第n个过程变量数据X″n分到同一个子块中,最终划分为B个子块,其中,第b个子块记为X″′b=(X″p,...,X″q),b=1,...,B,表示第b个子块由第p、…、q个过程变量数据构成;
6)建立多块收缩自动编码器模型用于特征提取,具体包括以下步骤:
(6.1)对B个子块分别建立收缩自动编码器网络模型用于特征提取,其中,每一个网络模型结构包括输入层、隐含层和输出层,其中,隐含层节点数少于输入层节点数和输出层节点数,为提取的发酵数据特征层;其中,第b个网络模型结构的输入为加入掩蔽噪声ε的第b个子块的发酵过程数据
Figure FDA0002420134270000031
第b个网络模型结构的输出为重构的子块发酵过程数据Rb,由输入层到隐含层为编码过程,具体形式为:
Figure FDA0002420134270000032
其中,
Figure FDA0002420134270000033
Figure FDA0002420134270000034
中的第i批次的数据,Hb,i
Figure FDA0002420134270000035
的隐含层编码,σ为隐含层激活函数,W和β分别为输入层到隐含层的连接权值和偏置向量;由隐含层到输出层为解码过程,具体形式为:
Rb,i=W′Hb,i+β′
其中,Rb,i为输入
Figure FDA0002420134270000036
后输出层重构的子块发酵过程数据,W′和β′分别为隐含层到输出层的连接权值和偏置向量;
(6.2)对网络参数η={W,W′,β,β′}进行随机初始化,采用小批量梯度下降算法迭代训练收缩自动编码器,每次迭代使用一个发酵批次样本
Figure FDA0002420134270000037
来对参数η进行更新;其中,收缩自动编码器损失函数为:
Figure FDA0002420134270000038
其中
Figure FDA0002420134270000039
为隐含层对于输入数据的雅克比矩阵,λ为收缩率,取值在0-1之间;
7)分别计算B个子块监测模型相对应的SPE统计量,其中第b个子块监测模型的SPE统计量计算如下,SPEb=(SPEb,1,...,SPEb,I),SPEb,i=(SPEb,i,1,...,SPEb,i,K),第i个批次中第k个采样时刻的SPE统计量定义为:
SPEb,i,k=(x″b,i,k-rb,i,k)T(x″b,i,k-rb,i,k)
x″x,i,k为第b个子块的第i个批次中第k个采样时刻的样本,rb,i,k为输入x″b,i,k到训练好的收缩自动编码器得到的实际输出;最后,利用核密度估计方法估计上述求得的SPE统计量在预设置信限时的估计值,并将其作为第b个子块SPEb统计量的控制限;其余B-1个子块监测模型的SPE统计量控制限的计算重复以上过程;将B个子块监测模型的SPE统计量控制限合成一个综合统计量的控制限SPEnew
Figure FDA0002420134270000041
B.在线监测阶段:
8)采集当前发酵过程第k采样时刻的J个过程变量的数据Xk,并根据步骤2)中得到的k时刻的均值和标准方差对其进行标准化得到
Figure FDA0002420134270000042
其中第k采样时刻的第j个过程变量
Figure FDA0002420134270000043
的标准化公式如下:
Figure FDA0002420134270000044
其中,xk,j为当前第k采样时刻所采集发酵数据中的第j个过程变量,
Figure FDA0002420134270000045
为步骤2)中得到的第k采样时刻的第j个过程变量的平均值,sk,j为步骤2)中得到的第k采样时刻的第j个过程变量的标准方差,j=1,...,J,k=1,...,K;
9)按照步骤5)将
Figure FDA0002420134270000046
进行子块划分,划分为B个输入向量
Figure FDA0002420134270000047
将这B个输入向量分别输入步骤6)中对应的收缩自动编码器网络模型中,其中,
Figure FDA0002420134270000048
输入步骤6)中的第b个收缩自动编码器,计算第b个收缩自动编码器对当前发酵过程第k时刻采集数据的监控统计量,计算公式如下:
Figure FDA0002420134270000051
其中,yk,b为将
Figure FDA0002420134270000052
输入离线建模阶段步骤6)中第b个收缩自动编码器模型得到的输出向量;
10)将步骤9)的B个收缩自动编码器对当前发酵过程第k时刻采集数据的监控统计量SPEk,b合为一个新的统计量SPEk new
Figure FDA0002420134270000053
11)将步骤10)得到的监控统计量SPEk new与步骤7)确定的综合控制限SPEnew进行比较,如果超限则认为发生故障,进行报警;否则即为正常;
12)若发酵过程完毕,则终止监测;否则采集下一时刻的数据,返回步骤8),继续进行过程监测。
CN202010205127.2A 2020-03-20 2020-03-20 一种基于多块收缩自动编码器的发酵过程故障监测方法 Pending CN111324110A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010205127.2A CN111324110A (zh) 2020-03-20 2020-03-20 一种基于多块收缩自动编码器的发酵过程故障监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010205127.2A CN111324110A (zh) 2020-03-20 2020-03-20 一种基于多块收缩自动编码器的发酵过程故障监测方法

Publications (1)

Publication Number Publication Date
CN111324110A true CN111324110A (zh) 2020-06-23

Family

ID=71172185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010205127.2A Pending CN111324110A (zh) 2020-03-20 2020-03-20 一种基于多块收缩自动编码器的发酵过程故障监测方法

Country Status (1)

Country Link
CN (1) CN111324110A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112631255A (zh) * 2020-12-28 2021-04-09 北京工业大学 一种基于变分自编码器模型的污水处理过程故障监测方法
CN112819732A (zh) * 2021-04-19 2021-05-18 中南大学 一种探地雷达B-scan图像去噪方法
CN112904810A (zh) * 2021-01-13 2021-06-04 中南大学 基于有效特征选择的流程工业非线性过程监测方法
CN113642754A (zh) * 2021-04-23 2021-11-12 北京工业大学 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN114167729A (zh) * 2021-12-08 2022-03-11 北京工业大学 基于分布式二段自适应加权堆叠自动编码器的微小故障检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964021A (zh) * 2010-09-29 2011-02-02 东北大学 基于递归核主元分析的青霉素发酵过程故障监测方法
US20110312003A1 (en) * 2010-06-18 2011-12-22 Rockwell Automation Technologies, Inc. Determining performance characteristics of a fermenter batch of a biofuel production plant
WO2013011745A1 (ja) * 2011-07-15 2013-01-24 株式会社日立製作所 設備状態監視方法およびその装置
CN103970092A (zh) * 2014-04-13 2014-08-06 北京工业大学 一种基于自适应fcm的多阶段发酵过程故障监测方法
CN106709214A (zh) * 2017-02-20 2017-05-24 北京工业大学 一种基于mlle‑ocsvm的青霉素发酵过程故障监测方法
CN109740687A (zh) * 2019-01-09 2019-05-10 北京工业大学 一种基于dlae的发酵过程故障监测方法
CN110794797A (zh) * 2019-11-27 2020-02-14 江南大学 一种基于互信息和多块信息提取的pca故障监测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110312003A1 (en) * 2010-06-18 2011-12-22 Rockwell Automation Technologies, Inc. Determining performance characteristics of a fermenter batch of a biofuel production plant
CN101964021A (zh) * 2010-09-29 2011-02-02 东北大学 基于递归核主元分析的青霉素发酵过程故障监测方法
WO2013011745A1 (ja) * 2011-07-15 2013-01-24 株式会社日立製作所 設備状態監視方法およびその装置
CN103970092A (zh) * 2014-04-13 2014-08-06 北京工业大学 一种基于自适应fcm的多阶段发酵过程故障监测方法
CN106709214A (zh) * 2017-02-20 2017-05-24 北京工业大学 一种基于mlle‑ocsvm的青霉素发酵过程故障监测方法
CN109740687A (zh) * 2019-01-09 2019-05-10 北京工业大学 一种基于dlae的发酵过程故障监测方法
CN110794797A (zh) * 2019-11-27 2020-02-14 江南大学 一种基于互信息和多块信息提取的pca故障监测方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112631255A (zh) * 2020-12-28 2021-04-09 北京工业大学 一种基于变分自编码器模型的污水处理过程故障监测方法
CN112904810A (zh) * 2021-01-13 2021-06-04 中南大学 基于有效特征选择的流程工业非线性过程监测方法
CN112904810B (zh) * 2021-01-13 2022-07-01 中南大学 基于有效特征选择的流程工业非线性过程监测方法
CN112819732A (zh) * 2021-04-19 2021-05-18 中南大学 一种探地雷达B-scan图像去噪方法
CN112819732B (zh) * 2021-04-19 2021-07-09 中南大学 一种探地雷达B-scan图像去噪方法
CN113642754A (zh) * 2021-04-23 2021-11-12 北京工业大学 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN113642754B (zh) * 2021-04-23 2023-10-10 北京工业大学 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN114167729A (zh) * 2021-12-08 2022-03-11 北京工业大学 基于分布式二段自适应加权堆叠自动编码器的微小故障检测方法及系统
CN114167729B (zh) * 2021-12-08 2024-05-28 北京工业大学 基于分布式二段自适应加权堆叠自动编码器的微小故障检测方法及系统

Similar Documents

Publication Publication Date Title
CN111324110A (zh) 一种基于多块收缩自动编码器的发酵过程故障监测方法
CN109740687B (zh) 一种基于dlae的发酵过程故障监测方法
CN109146246B (zh) 一种基于自动编码器和贝叶斯网络的故障检测方法
CN109000930B (zh) 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法
CN111222549B (zh) 一种基于深度神经网络的无人机故障预测方法
CN107895224B (zh) 一种基于扩展核熵负载矩阵的mkeca发酵过程故障监测方法
CN108803520B (zh) 一种基于变量非线性自相关性剔除的动态过程监测方法
CN113642754B (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN109635318B (zh) 一种航空发动机传感器智能解析余度设计方法
CN105607631B (zh) 间歇过程弱故障模型控制限建立方法及弱故障监测方法
CN103970092A (zh) 一种基于自适应fcm的多阶段发酵过程故障监测方法
CN110245460B (zh) 一种基于多阶段oica的间歇过程故障监测方法
CN116611609B (zh) 基于监控参数的设备稳定性状态预测及评价方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN114363195B (zh) 面向时间和频谱残差卷积网络的网络流量预测预警方法
WO2021114320A1 (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN112000081B (zh) 基于多块信息提取和马氏距离的故障监测方法及系统
CN112214006A (zh) 考虑两维动态特性的间歇过程故障检测方法及系统
CN116226739A (zh) 一种基于时空融合的图卷积网络工业过程故障诊断方法
CN110119579B (zh) 一种基于oica的复杂工业过程故障监测方法
CN110554667A (zh) 基于卷积神经网络(cnn)的间歇工业过程故障诊断
CN116627116B (zh) 一种流程工业故障定位方法、系统及电子设备
CN111931420A (zh) 基于核再生希尔伯特空间的燃气轮机故障预测方法
CN116244596A (zh) 基于tcn和注意力机制的工业时序数据异常检测方法
CN111695581B (zh) 一种基于自回归极限学习机的非线性动态过程监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200623