CN112199829A - 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法 - Google Patents

基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法 Download PDF

Info

Publication number
CN112199829A
CN112199829A CN202011031988.XA CN202011031988A CN112199829A CN 112199829 A CN112199829 A CN 112199829A CN 202011031988 A CN202011031988 A CN 202011031988A CN 112199829 A CN112199829 A CN 112199829A
Authority
CN
China
Prior art keywords
sample
stage
batch process
variable
spe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011031988.XA
Other languages
English (en)
Other versions
CN112199829B (zh
Inventor
张新民
范赛特
魏驰航
宋执环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202011031988.XA priority Critical patent/CN112199829B/zh
Publication of CN112199829A publication Critical patent/CN112199829A/zh
Application granted granted Critical
Publication of CN112199829B publication Critical patent/CN112199829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,该方法结合密度峰值聚类和即时学习等算法,用来解决多模式多阶段的批次过程监测问题。为解决批次过程数据中批次间差异和非高斯分布的问题,首先使用密度峰值聚类对批次过程数据的工况和阶段进行分类和识别。由于相同工况和阶段下的质量变量轨迹存在多样性,采用即时学习提取相似轨迹,以获得具有相似质量变量轨迹的子数据集。因此,对于某个子工况中的每个子阶段的每条质量变量轨迹,都将建立一个子模型,以实现准确的建模和监控方案。最后,引入贝叶斯融合方法作为集成策略来确定故障的最终概率。相比其他现存方法,本发明的方法有良好的效果和适用性。

Description

基于密度峰值聚类和即时学习的多工况多阶段批次过程监测 方法
技术领域
本发明属于工业过程控制领域,尤其涉及一种基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法。
背景技术
近几年,工业生产中的过程监测技术作为过程系统工程的重要部分,越来越受到工业界和学术的关注。对于保障安全生产和提高产品质量,有着非常重要的作用,因此具有非常重大的研究价值。传统的工业工程监测一般基于过程机理,现在因为分布式计算机控制系统(DCS)技术的发展,搜集了大量过程数据,所以基于数据驱动的多元统计分析的方法逐渐受到关注。其中主元分析方法(PCA)和偏最小二乘法等使用广泛。实际工业过程监测中,工业状况多并且相对复杂,包含的问题有非线性、非高斯性、多阶段、多模态等,单一的监测方法存在一些局限性,很难找到普适的数据驱动模型。为了克服单一方法的劣势,需要针对不同问题提出不同的融合监测方法。并且现阶段过程监控策略通常仅限于单工况多阶段高斯批次过程,无法处理多工况多阶段非高斯的批次过程监测问题。
发明内容
本发明的目的在于提供一种基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其能在多工况多阶段非高斯的情况下,也能获得较好的批次过程监测结果。具体技术方案如下:
一种基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,包括以下步骤:
S1:离线建模
S1.1:收集c种工况的历史离线批次过程数据样本,其中每种工况包含b个批次的过程数据样本;
S1.2:按时间段将一个批次分为p个阶段,分别是时间顺序采样点1到t1,t1+1到t2,…,tp-1+1到tp
S1.3:将p个阶段的三维历史离线批次过程数据按可变方向展开成二维;
S1.4:对于每个工况中的每个阶段的过程数据样本,用密度峰值聚类为其生成对应的簇类,并用相应的簇类信息在离线建模中,标记每个样本的类别;
S1.5:针对不同质量变量轨迹,构造偏最小二乘子模型;
S2:在线建模
S2.1:获取在线样本;
S2.2:基于S1.4得到的密度峰值聚类得到的簇类信息,采用密度峰值分类方法,找到在线样本对应的工况和阶段;
S2.3:对于同一工况和同一阶段下不同的质量变量轨迹的问题,先求出该工况该阶段相似质量变量轨迹的均值;再使用即时学习来计算质量变量轨迹均值和当前在线样本的质量变量轨迹之间的相似性;
S2.4:利用S1.5构造的同一工况和同一阶段下的所有质量变量轨迹的偏最小二乘子模型,计算得到每个偏最小二乘子模型的T2和SPE的过程监测统计信息;
S2.5:利用S2.3得到的相似性作为贝叶斯融合策略中的参数,合并同一工况和同一阶段下的所有质量变量轨迹的偏最小二乘子模型的T2和SPE的过程监测统计信息,获得贝叶斯融合结果;若在线样本计算得到的贝叶斯融合结果超过设定的控制限,则判定为故障;否则为正常样本。
进一步地,其特征在于,所述S1.3中的可变维度具体为变量维度。
进一步地,其特征在于,所述S1.4中的密度峰值聚类具体为:
对于每个样本,计算两个统计量:局部密度ρi、样本与比其密度高的任何其他样本之间的最小距离δi
其中,样本的局部密度ρi的定义如下:
Figure BDA0002704043890000021
其中,dij是样本之间的距离,dc是截止距离,其需要预先指定;数据集
Figure BDA0002704043890000022
Is={1,2,...,N}是相应的指标集;
Figure BDA0002704043890000023
的下标是降序的,它满足
ρq1≥ρq2≥…≥ρqN
其中δi的定义如下:
Figure BDA0002704043890000024
进一步地,所述S1.5具体为:
(1)定义输入矩阵X∈Rn*m,质量变量Y∈Rn*1,n是样本数量,m是样本变量维度。用偏最小二乘算法将[X,Y]投影到隐变量空间T,得:
Figure BDA0002704043890000031
其中T=[t1,t2,...,to]为得分矩阵,o为隐变量个数,P=[p1,p2,...,po]和Q=[q1,q2,...,qo]分别X和Y的负载矩阵;E和F分别是X和Y的残差矩阵;
(2)构建求解偏最小二乘模型的最优化问题:
max wi TXi TYiqi
s.t.||wi||=||qi||=1
其中wi与qi分别是X和Y的权重向量,被用于计算隐变量ti=Xiwi,ui=Yiqi
令W=[w1,w2,...,wo],由于隐变量空间T不能由X计算得出的W表示,令权重矩阵R=[r1,r2,...,ro],且T=XR;定义
Figure BDA0002704043890000032
其中R和P的关系为PTR=RTP=Io,R=W(PTW)-1,Io为o维的单位矩阵;
(3)进行最小二乘的迭代:
将X和Y进行归一化;设i=1,H1=X;
①取u为Y矩阵的第一列;
②计算wi=Hi Tui/||Hi Tui||;
③算出得分向量ti=Hiwi
④计算qi=YTti/ti Tti,在T中把Y的各列进行回归;
⑤算出Y的新得分ui=Yqi,此时判断ti是否收敛,如果是,则进行第⑥步;否则,进行第②步;
⑥算出X的负载矩阵pi=Hi Tti/(ti Tti);
⑦算出残差矩阵Hi+1=Hi-tipi T
⑧取i=i+1,返回第①步,直到所有隐变量都被提取;迭代完成得到P和R;
(4)将偏最小二乘算法在原始变量的投影空间表达为:
Figure BDA0002704043890000033
然后计算SPE以及T2统计量来检测异常,计算公式如下:
Figure BDA0002704043890000041
其中
Figure BDA0002704043890000042
进一步地,所述S2.2具体为:
(1)计算每个在线样本的局部密度ρi及其与较高密度点的距离δi
(2)选择距离在线样本最近、且局部密度大于该在线样本的离线样本的类别作为该在线样本的分类类别。
进一步地,所述S2.3具体为:
(1)计算所有工况和所有阶段下的不同的质量变量轨迹的均值;
(2)采用如下公式计算质量变量轨迹均值和当前在线样本的质量变量轨迹之间的相似性si
Figure BDA0002704043890000043
Figure BDA0002704043890000044
Figure BDA0002704043890000045
Figure BDA0002704043890000046
其中,d(zq,zi)=||zq,zi||2,γ是权重参数,θi是zq与zi之间的夹角。γ和si的值在0到1之间。si如果接近1,则表示zq与zi非常相似,如果相应的数据为负,则该批次过程数据将被丢弃并且不会在子数据集中使用,其中,
Figure BDA0002704043890000047
为在线轨迹变化趋势,
Figure BDA0002704043890000048
为离线轨迹变化趋势。
进一步地,所述S2.4中的T2和SPE的过程监测统计信息的计算公式如下:
Figure BDA0002704043890000049
Figure BDA00027040438900000410
Figure BDA00027040438900000411
Figure BDA0002704043890000051
其中,
Figure BDA0002704043890000054
为在线样本的T2概率,pSPE(Xnew)为在线样本的SPE概率,Xnew为在线样本,N和F代表批次过程的正常和故障。
Figure BDA0002704043890000055
Figure BDA0002704043890000056
分别是正常和故障样本的T2先验概率;pSPE(N)和pSPE(F)分别是正常和故障样本的SPE先验概率;当显著性级别选择为α时,
Figure BDA0002704043890000057
pSPE(N)的值为1-α,
Figure BDA0002704043890000058
pSPE(F)的值为α。
进一步地,所述的S2.5具体如下:
按如下公式合并
Figure BDA0002704043890000059
和pSPE(F|Xnew),
Figure BDA0002704043890000052
Figure BDA0002704043890000053
如果为
Figure BDA00027040438900000510
pSPE(F|Xnew)<α,则批次过程样本正常。否则,样品被判定为故障。
本发明的有益效果如下:
本发明对于多工况多阶段批次间差异和非高斯分布的问题具有独特的效果,在批次间有差异且非高斯的数据上获得的聚类兰德指数更高,使得本发明相比其他聚类方法更加适合处理非高斯分布的数据。同时对于同工况同阶段批次过程中多轨迹的问题,本发明所采用的贝叶斯融合方法具有独特的故障检测能力,检测效果更好,误报率更低。
附图说明
图1为本发明的方法的流程图;
图2为多工况多阶段的批次过程数据的按变量展开说明的示意图;
图3为3种工况第1阶段数据进行多种模型聚类得到的结果示意图,其中,图3a为对3种工况第1阶段数据进行K均值聚类得到的结果图,图3b为对3种工况第1阶段数据进行高斯混合模型聚类得到的结果图,图3c对3种工况第1阶段数据进行密度峰值聚类得到的结果图;
图4为3种工况第1阶段数据进行多种模型聚类得到的结果示意图,其中,图3a为对3种工况第2阶段数据进行K均值聚类得到的结果图,图3b为对3种工况第2阶段数据进行高斯混合模型聚类得到的结果图,图3c对3种工况第2阶段数据进行密度峰值聚类得到的结果图;
图5为3种工况第1阶段数据进行多种模型聚类得到的结果示意图,其中,图3a为对3种工况第3阶段数据进行K均值聚类得到的结果图,图3b为对3种工况第3阶段数据进行高斯混合模型聚类得到的结果图,图3c对3种工况第3阶段数据进行密度峰值聚类得到的结果图;
图6为批次数据正常条件下监测结果图;
图7为第40–80时刻发生阶跃5%故障条件下的监测结果图;
图8为第40–80时刻发生阶跃10%故障条件下的监测结果图。
具体实施方式
因此在本发明中,针对多工况多阶段非高斯的数据分布问题,提出了一种新的基于数据驱动的批次过程监测方法。
本发明针对批次过程监测中的多工况多阶段非高斯的问题,首先划定离线和在线数据集,并用密度峰值聚类标记非高斯离线数据集的类别,结合簇类信息,用密度峰值分类把在线数据分类到对应簇类中,并用离线阶段训练好的多工况多阶段非高斯多质量变量轨迹的模型用于计算在线数据的统计量,用贝叶斯融合的方法计算后验概率,用控制限来判断是正常样本还是异常样本。
本发明的基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,如图1所示,包括以下步骤:
S1:离线建模
S1.1:收集c种工况的历史离线批次过程数据样本,其中每种工况包含b个批次的过程数据样本;
S1.2:按时间段将一个批次分为p个阶段,分别是时间顺序采样点1到t1,t1+1到t2,…,tp-1+1到tp
S1.3:将p个阶段的三维历史离线批次过程数据按可变方向展开成二维。本发明使用的方法是将批次过程数据按变量方向展开为二维,更加适合于数据驱动的建模。如图2所示。
S1.4:对于每个工况中的每个阶段的过程数据样本,用密度峰值聚类为其生成对应的簇类,并用相应的簇类信息在离线建模中,标记每个样本的类别;
对于每个样本,计算两个统计量:局部密度ρi、样本与比其密度高的任何其他样本之间的最小距离δi
其中,样本的局部密度ρi的定义如下:
Figure BDA0002704043890000071
其中,dij是样本之间的距离,dc是截止距离,其需要预先指定;数据集
Figure BDA0002704043890000072
Is={1,2,...,N}是相应的指标集;
Figure BDA0002704043890000073
的下标是降序的,它满足
ρq1≥ρq2≥…≥ρqN
其中,δi的定义如下:
Figure BDA0002704043890000074
同时,聚类中心被认为是ρi最大的点。换句话说,聚类中心具有比邻近点高的密度ρi和与比其密度更高样本的较大距离。
S1.5:针对不同质量变量轨迹,构造偏最小二乘子模型,以获得满意的过程监测结果。该步骤通过如下的子步骤来实现:
(1)定义输入矩阵X∈Rn*m,质量变量Y∈Rn*1,用偏最小二乘算法将[X,Y]投影到隐变量空间T,得:
Figure BDA0002704043890000075
其中T=[t1,t2,...,to]为得分矩阵,o为隐变量个数,P=[p1,p2,...,po]和Q=[q1,q2,...,qo]分别X和Y的负载矩阵;E和F分别是X和Y的残差矩阵;
(2)构建求解偏最小二乘模型的最优化问题:
max wi TXi TYiqi
s.t.||wi||=||qi||=1,
其中wi与qi分别是X和Y的权重向量,被用于计算隐变量ti=Xiwi,ui=Yiqi
令W=[w1,w2,...,wo],由于隐变量空间T不能由X计算得出的W表示,令权重矩阵R=[r1,r2,…,ro],且T=XR;定义
Figure BDA0002704043890000076
其中R和P的关系为PTR=RTP=Io,R=W(PTW)-1,Io为o维的单位矩阵;
(3)进行最小二乘的迭代:
将X和Y进行归一化;设i=1,H1=X;
①取u为Y矩阵的第一列;
②计算wi=Hi Tui/||Hi Tui||;
③算出得分向量ti=Hiwi
④计算qi=YTti/ti Tti,在T中把Y的各列进行回归;
⑤算出Y的新得分ui=Yqi,此时判断ti是否收敛,如果是,则进行第⑥步;否则,进行第②步;
⑥算出X的负载矩阵pi=Hi Tti/(ti Tti);
⑦算出残差矩阵Hi+1=Hi-tipi T
⑧取i=i+1,返回第①步,直到所有隐变量都被提取;迭代完成得到P和R;
(4)将偏最小二乘算法在原始变量的投影空间表达为:
Figure BDA0002704043890000081
偏最小二乘算法使用监测指标平方预测误差(Squared Prediction Error,SPE)也称为Q统计量以及Hotelling T2来检测异常,两者的计算公式如下:
Figure BDA0002704043890000082
其中
Figure BDA0002704043890000083
S2:在线建模
S2.1:获取在线样本;
S2.2:基于S1.4得到的密度峰值聚类得到的簇类信息,采用密度峰值分类方法,找到在线样本对应的工况和阶段,具体过程如下:
(1)计算每个在线样本的局部密度ρi及其与较高密度点的距离δi
(2)选择距离在线样本最近、且局部密度大于该在线样本的离线样本的类别作为该在线样本的分类类别。
S2.3:对于同一工况和同一阶段下不同的质量变量轨迹的问题,先求出所有工况和所有阶段下的不同的质量变量轨迹的均值;再使用即时学习来计算质量变量轨迹均值和当前在线样本的质量变量轨迹之间的相似性,相似性si的计算公式如下:
Figure BDA0002704043890000084
Figure BDA0002704043890000085
Figure BDA0002704043890000091
Figure BDA0002704043890000092
其中,d(zq,zi)=||zq,zi||2,γ是权重参数,θi是zq与zi之间的夹角。γ和si的值在0到1之间。si如果接近1,则表示zq与zi非常相似,如果相应的数据为负,则该批次过程数据将被丢弃并且不会在子数据集中使用,其中,
Figure BDA0002704043890000093
为在线轨迹变化趋势,
Figure BDA0002704043890000094
为离线轨迹变化趋势。
S2.4:利用S1.5构造的同一工况和同一阶段下的所有质量变量轨迹的偏最小二乘子模型,计算得到每个偏最小二乘子模型的T2和SPE的过程监测统计信息;其中,T2和SPE的过程监测统计信息的计算公式如下:
Figure BDA0002704043890000095
Figure BDA0002704043890000096
Figure BDA0002704043890000097
Figure BDA0002704043890000098
其中,
Figure BDA00027040438900000910
为在线样本的T2概率,pSPE(Xnew)为在线样本的SPE概率,Xnew为在线样本,N and F代表批次过程的正常和故障。
Figure BDA00027040438900000911
Figure BDA00027040438900000912
分别是正常和故障样本的T2先验概率;pSPE(N)和pSPE(F)分别是正常和故障样本的SPE先验概率;当显著性级别选择为α时,
Figure BDA00027040438900000913
pSPE(N)的值为1-α,
Figure BDA00027040438900000914
pSPE(F)的值为α;
S2.5:利用S2.3得到的相似性作为贝叶斯融合策略中的参数,合并同一工况和同一阶段下的所有质量变量轨迹的偏最小二乘子模型的T2和SPE的过程监测统计信息,获得贝叶斯融合结果,若在线样本计算得到的T2和SPE的过程监测统计信息超过设定的控制限,则判定为故障;否则为正常样本。具体为:
合并
Figure BDA00027040438900000915
和pSPE(F|Xnew),如果为
Figure BDA00027040438900000916
pSPE(F|Xnew)<α,则批次过程样本正常。否则,样品被判定为故障
Figure BDA0002704043890000099
Figure BDA0002704043890000101
以下结合一个具体的工业例子来说明本发明的有效性。青霉素补料分批发酵过程平台PenSim v2.0的仿真实验来验证数据驱动框架的有效性。将过程设置为1小时的采样间隔。表1给出了分批补料青霉素发酵的详细测量变量。
表1:批次进料青霉素发酵的测量变量
变量号. 变量描述
2 搅拌功率(W)
3 基质进给速度(L/h)
5 基质浓度(g/L)
6 溶解氧浓度(g/L)
7 生物量浓度(g/L)
10 二氧化碳浓度(g/L)
每批次的总运行时间为400小时,可以分为三种阶段。第一种阶段是大约1-40小时的生物质积累的进料阶段。第二阶段持续时间从第41小时到第200小时,这是持续生产青霉素的阶段。第三阶段持续时间从第201小时到第400小时,这是青霉素稳定生产的阶段。因此,训练样本分为三个阶段。然后,将训练样本以相同的方式进行聚类以标记样本。为了展示三种聚类算法在性能上的差异,从训练数据集中为每个子模型随机选择30个正常批次。
直观地,密度峰值聚类的性能如图3-5所示。同时,使用高斯混合模型和K均值聚类进行比较。聚类结果由二维相对位置显示,而不是实际位置。青霉素发酵的整个时期分为三个阶段,分别为阶段1(1h-40h),阶段2(41h-200h),阶段3(201h-400h),和建模数据划分相同。根据经验,可以选择用样本总数2%的临近点的距离作为dc
从图3-5可以看出,密度峰值聚类的效果要优于其他聚类方法。K-均值的效果次之。为了详细体现每种聚类算法的效果,使用了调整的兰德指数来评估聚类效果。经过统计计算,三种聚类算法的调整的兰德指数见表2。
表2:三种聚类算法的调整的兰德指数
Figure BDA0002704043890000102
Figure BDA0002704043890000111
本发明对于青霉素批次过程的多工况多阶段过程数据离线样本聚类的兰德指数更高,特别是青霉素批次过程的阶段1(1h-40h),阶段2(41h-200h)。阶段1,相对于K均值聚类提升126%,相对于高斯混合模型提升124%;阶段2,相对于K均值聚类提升93%,相对于高斯混合模型提升85%。准确的离线样本聚类得到的簇类信息才能进行在线样本的分类。
解决了不同工况青霉素数据的聚类问题后,离线数据的聚类结果可用于在线数据的分类。然后,考虑对相同工况和阶段下的各种质量变量轨迹进行过程监测。为了开发子模型,从训练数据集中为每个子模型随机选择30个正常批次。为了获得相同工况和阶段下的质量变量轨迹,关于质量变量与测量变量的关系如下:
Figure BDA0002704043890000112
Figure BDA0002704043890000113
其中t是时间;P青霉素浓度;X是生物质浓度;S是底物浓度;V是容量;另外,它还包含一些模型参数,例如青霉素水解速率相关常数K,青霉素生产速率相关常数μp,青霉素生产抑制相关常数Kp和KI
在获得每批次数据的轨迹之后,建立子模型以实现精确的建模和监测。对于在线样本,先用密度峰值分类将其划分到具体工况和阶段,再用贝叶斯融合作为整体策略来融合多质量变量轨迹的子模型,以确定故障或异常的最终概率。在所有子模型中,贝叶斯融合的置信极限确定为0.95。为了评估数据驱动框架的性能,设计了3种工况,每个工况在正常批次中包含3个阶段,每个阶段有3中质量变量轨迹,它们被构造为训练数据集。
正常批次的监测结果如图6所示,贝叶斯融合监测的结果优于全批次只用一个模型的监测。在生物质积累的进料阶段,由于剧烈反应,所监测的各种指标发生了剧烈变化,导致监测不力。全局监视中存在大量超过控制限的错误监测。但是,在贝叶斯融合监测中,监测的T2和SPE更稳定。
对于有故障的批次过程数据,监测结果如图7和图8所示。从图7和图8可以看出,对比的监测方法的效果虽然能检测出故障,但基于贝叶斯融合方法的多工况多阶段多轨迹的故障检测效果要好于全局未对多轨迹进行贝叶斯融合的方法,特别是阶段1检测效果最明显。
如上所述,本发明中所提的基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,具有令人满意的监测效果。

Claims (8)

1.一种基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,
包括以下步骤:
S1:离线建模
S1.1:收集c种工况的历史离线批次过程数据样本,其中每种工况包含b个批次的过程数据样本;
S1.2:按时间段将一个批次分为p个阶段,分别是时间顺序采样点1到t1,t1+1到t2,…,tp-1+1到tp
S1.3:将p个阶段的三维历史离线批次过程数据按可变方向展开成二维;
S1.4:对于每个工况中的每个阶段的过程数据样本,用密度峰值聚类为其生成对应的簇类,并用相应的簇类信息在离线建模中,标记每个样本的类别;
S1.5:针对不同质量变量轨迹,构造偏最小二乘子模型;
S2:在线建模
S2.1:获取在线样本;
S2.2:基于S1.4得到的密度峰值聚类得到的簇类信息,采用密度峰值分类方法,找到在线样本对应的工况和阶段;
S2.3:对于同一工况和同一阶段下不同的质量变量轨迹的问题,先求出该工况该阶段相似质量变量轨迹的均值;再使用即时学习来计算质量变量轨迹均值和当前在线样本的质量变量轨迹之间的相似性;
S2.4:利用S1.5构造的同一工况和同一阶段下的所有质量变量轨迹的偏最小二乘子模型,计算得到每个偏最小二乘子模型的T2和SPE的过程监测统计信息;
S2.5:利用S2.3得到的相似性作为贝叶斯融合策略中的参数,合并同一工况和同一阶段下的所有质量变量轨迹的偏最小二乘子模型的T2和SPE的过程监测统计信息,获得贝叶斯融合结果;若在线样本计算得到的贝叶斯融合结果超过设定的控制限,则判定为故障;否则为正常样本。
2.根据权利要求1所述基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,所述S1.3中的可变维度具体为变量维度。
3.根据权利要求1所述基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,所述S1.4中的密度峰值聚类具体为:
对于每个样本,计算两个统计量:局部密度ρi、样本与比其密度高的任何其他样本之间的最小距离δi
其中,样本的局部密度ρi的定义如下:
Figure FDA0002704043880000021
其中,dij是样本之间的距离,dc是截止距离,其需要预先指定;数据集
Figure FDA0002704043880000022
Is={1,2,...,N}是相应的指标集;
Figure FDA0002704043880000023
的下标是降序的,它满足
ρq1≥ρq2≥…≥ρqN
其中δi的定义如下:
Figure FDA0002704043880000024
4.根据权利要求1所述基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,所述S1.5具体为:
(1)定义输入矩阵X∈Rn*m,质量变量Y∈Rn*1。用偏最小二乘算法将[X,Y]投影到隐变量空间T,得:
Figure FDA0002704043880000025
其中T=[t1,t2,...,to]为得分矩阵,o为隐变量个数,P=[p1,p2,...,po]和Q=[q1,q2,...,qo]分别X和Y的负载矩阵;E和F分别是X和Y的残差矩阵;
(2)构建求解偏最小二乘模型的最优化问题:
max wi TXi TYiqi
s.t.||wi||=||qi||=1,
其中wi与qi分别是X和Y的权重向量,被用于计算隐变量ti=Xiwi,ui=Yiqi
令W=[w1,w2,...,wo],由于隐变量空间T不能由X计算得出的W表示,则令权重矩阵R=[r1,r2,…,ro],且T=XR;定义
Figure FDA0002704043880000026
其中R和P的关系为PTR=RTP=Io,R=W(PTW)-1,Io为o维的单位矩阵;
(3)进行最小二乘的迭代:
将X和Y进行归一化;设i=1,H1=X;
①取u为Y矩阵的第一列;
②计算wi=Hi Tui/||Hi Tui||;
③算出得分向量ti=Hiwi
④计算qi=YTti/ti Tti,在T中把Y的各列进行回归;
⑤算出Y的新得分ui=Yqi,此时判断ti是否收敛,如果是,则进行第⑥步;否则,进行第②步;
⑥算出X的负载矩阵pi=Hi Tti/(ti Tti);
⑦算出残差矩阵Hi+1=Hi-tipi T
⑧取i=i+1,返回第①步,直到所有隐变量都被提取;迭代完成得到P和R;
(4)将偏最小二乘算法在原始变量的投影空间表达为:
Figure FDA0002704043880000031
然后计算SPE以及T2统计量来检测异常,计算公式如下:
Figure FDA0002704043880000032
其中
Figure FDA0002704043880000033
5.根据权利要求1所述基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,所述S2.2具体为:
(1)计算每个在线样本的局部密度ρi及其与较高密度点的距离δi
(2)选择距离在线样本最近、且局部密度大于该在线样本的离线样本的类别作为该在线样本的分类类别。
6.根据权利要求1所述基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,所述S2.3具体为:
(1)计算所有工况和所有阶段下的不同的质量变量轨迹的均值;
(2)采用如下公式计算质量变量轨迹均值和当前在线样本的质量变量轨迹之间的相似性si
Figure FDA0002704043880000034
Figure FDA0002704043880000035
Figure FDA0002704043880000036
Figure FDA0002704043880000041
其中,d(zq,zi)=||zq,zi||2,γ是权重参数,θi是zq与zi之间的夹角。γ和si的值在0到1之间。si如果接近1,则表示zq与zi非常相似,如果相应的数据为负,则该批次过程数据将被丢弃并且不会在子数据集中使用,其中,
Figure FDA0002704043880000042
为在线轨迹变化趋势,
Figure FDA0002704043880000043
为离线轨迹变化趋势。
7.根据权利要求1所述基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,所述S2.4中的T2和SPE的过程监测统计信息的计算公式如下:
Figure FDA0002704043880000044
Figure FDA0002704043880000045
Figure FDA0002704043880000046
Figure FDA0002704043880000047
其中,
Figure FDA0002704043880000048
为在线样本的T2概率,pSPE(Xnew)为在线样本的SPE概率,Xnew为在线样本,N和F代表批次过程的正常和故障。
Figure FDA0002704043880000049
Figure FDA00027040438800000410
分别是正常和故障样本的T2先验概率;pSPE(N)和pSPE(F)分别是正常和故障样本的SPE先验概率;当显著性级别选择为α时,
Figure FDA00027040438800000411
pSPE(N)的值为1-α,
Figure FDA00027040438800000412
pSPE(F)的值为α。
8.根据权利要求1所述基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法,其特征在于,所述的S2.5具体如下:
按如下公式合并
Figure FDA00027040438800000413
和pSPE(F|Xnew),如果为
Figure FDA00027040438800000414
则批次过程样本正常。否则,样品被判定为故障
Figure FDA00027040438800000415
Figure FDA00027040438800000416
CN202011031988.XA 2020-09-27 2020-09-27 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法 Active CN112199829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011031988.XA CN112199829B (zh) 2020-09-27 2020-09-27 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011031988.XA CN112199829B (zh) 2020-09-27 2020-09-27 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法

Publications (2)

Publication Number Publication Date
CN112199829A true CN112199829A (zh) 2021-01-08
CN112199829B CN112199829B (zh) 2022-06-24

Family

ID=74007546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011031988.XA Active CN112199829B (zh) 2020-09-27 2020-09-27 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法

Country Status (1)

Country Link
CN (1) CN112199829B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733544A (zh) * 2021-04-02 2021-04-30 中国电子科技网络信息安全有限公司 目标人物活动轨迹信息提取方法、计算机设备及存储介质
CN113741263A (zh) * 2021-08-28 2021-12-03 北京工业大学 基于全局-局部信息聚类的多模态过程模态划分方法
CN115310561A (zh) * 2022-09-29 2022-11-08 中国空气动力研究与发展中心设备设计与测试技术研究所 一种基于集成即时学习的电磁阀故障监测方法
CN115393657A (zh) * 2022-10-26 2022-11-25 金成技术股份有限公司 基于图像处理的金属管材生产异常识别方法
CN116953488A (zh) * 2023-09-19 2023-10-27 深圳市东陆科技有限公司 一种用于集成光电芯片的监测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130332417A1 (en) * 2012-06-08 2013-12-12 In Koo Kim Hybrid Client-Server Data Proxy Controller For Software Application Interactions With Data Storage Areas And Method Of Using Same
CN105652845A (zh) * 2016-03-26 2016-06-08 北京工业大学 一种基于即时学习局部模型的发酵过程故障监测方法
CN106355030A (zh) * 2016-09-20 2017-01-25 浙江大学 一种基于层次分析法和加权投票决策融合的故障检测方法
CN109255186A (zh) * 2018-09-12 2019-01-22 浙江大学 一种基于输出约束ap-xgboost模型的工业过程软测量方法
CN109635465A (zh) * 2018-12-18 2019-04-16 江南大学 基于tpls模型的批次内操作轨迹调整方法
CN109933040A (zh) * 2017-12-18 2019-06-25 中国科学院沈阳自动化研究所 基于层次密度峰值聚类和最相似模态的故障监测方法
CN110348488A (zh) * 2019-06-19 2019-10-18 华中科技大学 一种基于局部密度峰值聚类的模态辨识方法
CN111352408A (zh) * 2020-03-11 2020-06-30 山东科技大学 一种基于证据k近邻的多工况流程工业过程故障检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130332417A1 (en) * 2012-06-08 2013-12-12 In Koo Kim Hybrid Client-Server Data Proxy Controller For Software Application Interactions With Data Storage Areas And Method Of Using Same
CN105652845A (zh) * 2016-03-26 2016-06-08 北京工业大学 一种基于即时学习局部模型的发酵过程故障监测方法
CN106355030A (zh) * 2016-09-20 2017-01-25 浙江大学 一种基于层次分析法和加权投票决策融合的故障检测方法
CN109933040A (zh) * 2017-12-18 2019-06-25 中国科学院沈阳自动化研究所 基于层次密度峰值聚类和最相似模态的故障监测方法
CN109255186A (zh) * 2018-09-12 2019-01-22 浙江大学 一种基于输出约束ap-xgboost模型的工业过程软测量方法
CN109635465A (zh) * 2018-12-18 2019-04-16 江南大学 基于tpls模型的批次内操作轨迹调整方法
CN110348488A (zh) * 2019-06-19 2019-10-18 华中科技大学 一种基于局部密度峰值聚类的模态辨识方法
CN111352408A (zh) * 2020-03-11 2020-06-30 山东科技大学 一种基于证据k近邻的多工况流程工业过程故障检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张子羿: "《一种基于聚类方法的多阶段间歇过程监控方法》", 《化工学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733544A (zh) * 2021-04-02 2021-04-30 中国电子科技网络信息安全有限公司 目标人物活动轨迹信息提取方法、计算机设备及存储介质
CN112733544B (zh) * 2021-04-02 2021-07-09 中国电子科技网络信息安全有限公司 目标人物活动轨迹信息提取方法、计算机设备及存储介质
CN113741263A (zh) * 2021-08-28 2021-12-03 北京工业大学 基于全局-局部信息聚类的多模态过程模态划分方法
CN115310561A (zh) * 2022-09-29 2022-11-08 中国空气动力研究与发展中心设备设计与测试技术研究所 一种基于集成即时学习的电磁阀故障监测方法
CN115393657A (zh) * 2022-10-26 2022-11-25 金成技术股份有限公司 基于图像处理的金属管材生产异常识别方法
CN115393657B (zh) * 2022-10-26 2023-01-31 金成技术股份有限公司 基于图像处理的金属管材生产异常识别方法
CN116953488A (zh) * 2023-09-19 2023-10-27 深圳市东陆科技有限公司 一种用于集成光电芯片的监测方法
CN116953488B (zh) * 2023-09-19 2023-12-12 深圳市东陆科技有限公司 一种用于集成光电芯片的监测方法

Also Published As

Publication number Publication date
CN112199829B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN112199829B (zh) 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法
Huang et al. Structure dictionary learning-based multimode process monitoring and its application to aluminum electrolysis process
Peng et al. Multimode process monitoring and fault detection: A sparse modeling and dictionary learning method
CN106371427B (zh) 基于层次分析法和模糊融合的工业过程故障分类方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
Shang et al. Extracting latent dynamics from process data for quality prediction and performance assessment via slow feature regression
CN110046377B (zh) 一种基于异构相似度的选择性集成即时学习软测量建模方法
Hong et al. Concurrent monitoring strategy for static and dynamic deviations based on selective ensemble learning using slow feature analysis
Xiang et al. Multimode process monitoring based on fuzzy C-means in locality preserving projection subspace
CN114077876B (zh) 一种带钢热连轧多模态过程监测方法及装置
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN108446358B (zh) 基于miv与关联规则的优化方法及石化设备的数据建模方法
Li et al. Multimode processes monitoring based on hierarchical mode division and subspace decomposition
CN116861224A (zh) 基于间歇过程软测量建模方法的间歇过程软测量建模系统
CN114527731B (zh) 基于监督概率慢特征分析的工业过程运行状态评价方法
Zheng et al. Between-class difference analysis based multidimensional RBC for multivariate fault isolation of industrial processes
CN114298220B (zh) 基于上下文注意力动态特征提取器的故障分类方法
CN109523195B (zh) 基于样本多模态分类的分层式非高斯算法的故障检测方法
Yang et al. A novel decentralized weighted ReliefF-PCA method for fault detection
Nakamura et al. A batch-incremental process fault detection and diagnosis using mixtures of probablistic PCA
Lv et al. A Spatial–Temporal Variational Graph Attention Autoencoder Using Interactive Information for Fault Detection in Complex Industrial Processes
CN111797574A (zh) 聚合物分子量分布的集成高斯过程回归模型方法
Yang et al. Multimode process monitoring based on geodesic distance
Wang et al. Multiblock ICA-PCA and Bayesian Inference based Distributed Process Monitoring
EP4063469A1 (en) Reverse design device for gasification process, and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant