CN108664009B - 基于相关分析的阶段划分和故障检测方法 - Google Patents

基于相关分析的阶段划分和故障检测方法 Download PDF

Info

Publication number
CN108664009B
CN108664009B CN201710683345.5A CN201710683345A CN108664009B CN 108664009 B CN108664009 B CN 108664009B CN 201710683345 A CN201710683345 A CN 201710683345A CN 108664009 B CN108664009 B CN 108664009B
Authority
CN
China
Prior art keywords
industrial process
time
stage
esti
time slice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710683345.5A
Other languages
English (en)
Other versions
CN108664009A (zh
Inventor
王培良
叶晓丰
杨泽宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou University
Original Assignee
Huzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou University filed Critical Huzhou University
Priority to CN201710683345.5A priority Critical patent/CN108664009B/zh
Publication of CN108664009A publication Critical patent/CN108664009A/zh
Application granted granted Critical
Publication of CN108664009B publication Critical patent/CN108664009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks

Abstract

本发明涉及一种基于相关分析的阶段划分和故障检测方法,所述方法利用工业过程的稳定阶段和过渡阶段的时间片矩阵中信息的变化程度等特点,对整个工业过程反应持续时间进行多个阶段的识别。该方法首先将历史批次数据按变量展开方式进行排列并标准化。其次,按批次方式进行展开,展开的时间片矩阵包含工业过程持续的时变特征,根据评估值的分布特征进行时间序阶段划分。当阶段划分后,在各时间持续阶段分别建立模型监测与质量相关的故障对工业过程变量进行残差信息子空间提取,监测工业过程与质量不相关的异常。将该方法应用到工业青霉素发酵工业过程中,表明了所提方法具有更好的监控性能和预报能力。

Description

基于相关分析的阶段划分和故障检测方法
技术领域
本发明属于自动化控制技术领域,具有涉及一种基于相关分析的阶段划分和故障检测方法。
背景技术
工业过程的性能监控一般从历史生产数据出发,通过统计信息处理的方法建立相应的性能监控与故障检测模型,并将该模型用于监视产品生产工业过程,及时发现并消除工业过程中产生的异常状况,使得生产工业过程能够高效、安全、稳定的运行。传统的基于解析模型的生产工业过程监控需要准确的数学和生产经验,从而限制了其实际应用。多向主元分析(Multi-way Principle Component Analysis,MPCA)和多向偏最小二乘(Multi-way partial Least Squares,MPLS)是工业过程监控中常用的统计工业过程控制方法(Multiple Statistical Process Control,MSPC)。并在质量监测的研究中,MacGregor首先提出将多向偏最小二乘方法(MPLS)应用到间歇工业过程的生产中,MPLS将全部历史工业过程数据作为输入,提取工业过程变量和质量变量相关的特征,来建立监测模型需要全局的处理数据之间存在的相关性,忽略了局部的反应工业过程对最终质量的影响。事实上,工业生产工业过程存在着多阶段、局部性等固有特征。文献研究并表明间歇工业过程的测量变量间的相关关系并非随时刻变化,而是跟工业过程的操作进行和工业过程机理的特征紧密相关。譬如注塑工业过程按照生产流程可分为三个部分,注射、保压和冷却。因此,测量变量在不同的操作状态和模式表现出变化的相关特征,而在同一模态内相关性较稳定。从统计学角度分析,即测量变量的均值、方差、相关关系等表现出阶段性质。因此更多潜在的局部信息可以通过将数据分为更有意义的数据块进行分析,多阶段方法被广泛地应用于在线和离线的质量相关的故障监测。Duchesne等提出了轨迹Mutl-block PLS方法,该方法利用中间工业过程质量信息提取多阶段和质量变量相关的特征,但是工业过程中中间质量信息很少,限制了该方法的应用。Lu等根据阶段内特征相似,阶段间差异较大等特点,提取了所有时刻的工业过程数据主成分特征来表示这种变化,并通过k_mean聚类算法进行阶段划分,取得了不错的阶段识别效果。Zhao等针对k_mean算法对样本的阶段所属时刻硬性划分等缺点,在此基础上提出了软划分和隶属度方法进行阶段识别。基于聚类的阶段识别方法基本思想是工业过程关系发生变化与多阶段的切换有关,这类方法不需要填充未知和丢失的数据便能有效地捕获动态工业过程的特性,但是这类方法仍存在一些不足,例如聚类算法进行多阶段划分不能考虑阶段的顺序时序,容易出现时序交叉等现象。另外,阶段划分算法忽视了过渡阶段的阶段转移特征,严格地将每个样本划分到一个特定的阶段,容易导致阶段代表性的模型精度降低,而且基于聚类的阶段划分方法常受限于参数的选择,例如初始中心,聚类的初始数目,最小的阶段持续时间长度。
发明内容
为了克服现有技术的不足,提出了一种基于相关分析的阶段划分和故障检测方法,该方法能自动地按时间序列对工业过程进行多阶段划分;同时,前后阶段间持续时间短和特征变化快速切换的过渡工业过程也能很好地表示出来。该方法首先将历史批次数据按变量展开方式进行排列并标准化,消除各变量量纲的影响。其次,按批次方式进行展开,展开的时间片矩阵包含工业过程持续的时变特征,并用PCA方法提取时间片矩阵的主成分信息。由于隐马尔科夫链模型(Hidden Markov Model,HMM)是一种有效的模式识别方法,其丰富的数学结构使其成为信号特征标注领域强大的建模工具,因此,利用HMM模型用于全局特征信息拟合。将各时间片矩阵负载矩阵用于训练HMM模型,并对各时间片矩阵的主成分进行相关性评估,根据评估值的分布特征进行时间序阶段划分。当阶段划分后,在各时间持续阶段分别建立PLS模型监测与质量相关的故障,并利用PCA方法对工业过程变量进行残差信息子空间提取,监测工业过程与质量不相关的异常。最后,将该方法应用到工业青霉素发酵工业过程中,表明了所提方法具有更好的监控性能和预报能力。
发明的技术方案为:基于相关分析的阶段划分和故障检测方法,所述方法基于工业过程具有多阶段、时变特性,不同的工业过程阶段呈现不同的数据分布,本方法利用工业过程变化的特征信息,计算工业过程中所处状态和状态之间的转移关系;
工业过程的三维历史数据X(I×J×K)可按批次和变量方式展开为二维矩阵,本方法最基本的分析单元是时间片矩阵Xi(I×J),并将PCA方法用于提取该时间片矩阵的主要变化信息,主要变化信息简称为主成分或主元成分,基本的阶段划分过程如下:
1)数据预处理
首先,将历史工业过程数据X(I×J×K)按变量展开方式进行标准化为均值为O,方差为1的数据阵
Figure GSB0000190266340000021
将数据阵
Figure GSB0000190266340000022
按批次展开方式展开为
Figure GSB0000190266340000023
时间片矩阵为
Figure GSB0000190266340000024
2)时间片矩阵主要信息提取
对所有K个时间片矩阵利用PCA进行主要变化信息提取,主要变化信息的个数由大于90%的方差累计率确定,记录K个时间片矩阵中最大的主元成分个数为c,为了保证各时间片矩阵信息变化的可比较性,由个数c统一K个时间片矩阵的成分信息保留程度;第k个时刻时间片矩阵
Figure GSB0000190266340000025
的主要变化信息提取如下。
Figure GSB0000190266340000026
Figure GSB0000190266340000027
其中,Tkc,Pkc为时间片矩阵
Figure GSB0000190266340000028
的得分和负载矩阵;
3)时间片矩阵主要变化信息相关性评估
对每个时间片矩阵进行主成分提取后,得到K个负载矩阵Pkc,该K个负载矩阵包含了工业过程持续进行的潜在特征,这些特征揭示了工业过程时变的性质和变化趋势;
a)利用K个负载矩阵Pkc对HMM模型进行训练。
b)将训练的HMM模型对K个负载矩阵Pkc利用第二步的式子进行相关性评估,得到评估指标Iesti。这种评估是建立在系统拟合的整体意义上的,对应任意i时刻之前之后的变化对当前i时刻的相关性综合评估;
4)工业过程稳定阶段和过渡工业过程划分
在这K个时刻的特征变化中,有些连续时间区间的特征变化平缓,反之,快速、短暂,分别对应于工业工程中较长持续时间的操作阶段和阶段之间切换的过渡时期,因此将时间区间中的特征变化程度作为阶段划分依据,能较合理地对工业过程进行多阶段识别,有助于提高监测模型的检测精度和灵敏性。划分方法如下。
a)计算所有K个时间片矩阵信息成分评估指标Iesti的均值和方差Iesti_mean、Iesti_std
b)记第i个时间片矩阵信息成分评估指标Iesti i
定义特征变化程度控制上下界:Iesti_h=Iesti_mean+αIesti_std,Iesti_h=Iesti_mean-αIesti_std.
第i个时间片矩阵所处的区域为
Figure GSB0000190266340000031
其中,α为控制界可调因子,α决定了阶段划分中稳定阶段和过渡阶段的划分结果,α选取过大,阶段划分结果可能较少;α选取过小,容易产生持续时间短、阶段划分过多等问题,因此,应结合实际的工业过程数据特点进行α的选取;
c)将连续不间隔的相同Pindex(i)值对应的时间点合并,得到长短不同的连续时间区间。通过设定最小的持续时间长度p确定持续时间较短的时间区间合并方向,串行定位得到异常和阶段持续时间短的时间区间Lmin j,利用下式确定时间区间Lmin j的合并方向;
Figure GSB0000190266340000032
其中,Iesti prev,Iesti next为前一连续时间区间和后一连续时间区间内的Iesti平均值,abs(*)、mean(*)分别表示求括弧内*的绝对值和均值操作,Iesti j∈Lmin j,j=1,2,..,h,h<K。
本发明有益效果
本发明能通过分析时间片矩阵内的主成分信息的变化进行多阶段划分。这种阶段划分是全局意义和综合系统而得出的结果,它主要体现在对各时间片矩阵中信息的综合评估跟随时间的变化。其次,利用工业过程的稳定阶段和过渡阶段的时间片矩阵中信息的变化程度等特点,对整个工业过程反应持续时间进行多个阶段的识别。
1)时间片矩阵主要信息提取
时间片矩阵是最基本的分析单元,各时间片矩阵中包含的信息不同,为了保证时间片矩阵间信息的可比性。应用PCA方法进行时间片矩阵信息提取的同时,主元成分个数由方差累计率(>90%)确定,并且将所有时间片矩阵中最大的主元个数作为统一的信息保留。一方面使得时间片矩阵内信息具有可比性,另一方面保证了HMM模型进行信息评估的一致性。
2)工业过程稳定阶段和过渡工业过程进行划分时,Pindex(i)示出了第i个时间片矩阵信息评估Iesti i相对控制界Iesti_h和Iesti_l的位置,这个Pindex(i)用于确定工业过程的稳定和过渡阶段。在稳定阶段具有较长而且相同Pindex值的时间区间。而过渡阶段中,特征切换快速等特点使Pindex(i)值表现出波动切换,相同Pindex(i)值具有很小的时间持续区间。因此,可以根据相同Pindex值持续时间长短进行较粗的阶段划分。将连续时刻且相同Pindex(i)值对应的时间点合并,得到长短不同的时间区间。这些区间中包含稳定的区间、过渡区间和突变的离散时间点。为了得到连续的阶段,将持续短时间区间与相邻的稳定阶段进行合并,通过设定最小的持续时间长度p确定持续时间较短的时间区间和离散突变时间点合并方向。由此,对工业过程的整个反应时间段自适应划分为稳定和过渡阶段。
说明书附图
图1三维矩阵批次和变量展开方法示意图;
图2基于HMM模型的时间片矩阵相关分析示意图;
图3上部表示HMM模型对各时间片矩阵的相关性评估结果(实线);点实线实线为根据评估结果分布得到的可调控制限,虚线虚线为平均评估水平;下部表示当控制界因子α=0.25时阶段划分方法对应的阶段划分结果。
图4选取不同的控制界因子α时阶段划分方法对应的阶段划分结果;
图5.(a)α=0.75时,多阶段PLS方法的对正常批次的检测结果。(b)传统的PLS方法对正常批次的检测结果。实线为对应的95%的检测限,点线为计算的统计量;
图6.(a)α=0.75时,多阶段PLS方法对故障1的检测结果。(b)传统的PLS方法对故障1的检测结果。实线为对应的95%的检测限,点线为计算的统计量;
图7.(a)不同α值时故障1的检测率;(b)不同α值时故障1的误检率;
图8.(a)不同α值时故障3的检测率;(b)不同α值时故障3的误检率。
具体实施方式
在本发明中,偏最小二乘(PLS)是多元统计分析中一个重要的方法,主要侧重于寻找多维矩阵X和Y之间的关系,提取最优的低维特征解释方向,这种最优是建立在从输入空间到输出空间的预测能力意义上的。多向偏最小二乘方法(MPLS)是PLS的一种推广,通过将多批次的历史工业过程数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)以变量或批次方式展开为二维矩阵X(IK×J)和Y(IK×M),并提取低维的潜在特征。上述展开方式既保留了变量之间的非线性时变轨迹,又保留了批次间的平均轨迹。其中,基于变量展开方式的监控方法,既不需要预测数据,也不要求批次等长;而基于批次展开方式,需要等长的轨迹,对未知的数据需要进行填充。MPLS形式如下:
Figure GSB0000190266340000041
Figure GSB0000190266340000042
式中,T,P为矩阵X的得分和负载矩阵。U和Q为矩阵Y得分和负载矩阵,k为保留的潜变量个数,E,F分别为X,Y残差。
PLS是预测意义上相关回归方法,引导工业过程变量数据向质量变量相关的子空间分解,但是传统的基于PLS方法的监控方法,只考虑到工业过程变量和质量变量的相关信息,而忽视了工业过程变量与质量变量非相关成分的故障信息工业过程变量数据残差矩阵E中可能存在变化较大的信息残留,为了保证监测的完整性,对残差E进行PCA信息提取,形式如下:
Figure GSB0000190266340000051
Tx=EPx
因此,相应的工业过程变量数据X可进一步分解为如下形式:
Figure GSB0000190266340000052
通过离线的训练数据计算相关统计量与相对应的控制限,如下表所示:
表1.相关统计量与相对应的控制限
Figure GSB0000190266340000053
Figure GSB0000190266340000054
其中,tij为第i个样本对应的PLS模型中第j个主元向量。σj为第j个主元的标准差,k为主元个数,K为模型训练样本数,Xi,j
Figure GSB0000190266340000055
为第i个样本对应的测量值和预测值,g=vk/2mk,h=2mk/vk,mk,vk分别表示第k个时刻平方预测误差的均值和方差,T2,Q为计算得到的控制限。
在线监控时,将采集到的新的批次数据Xnew(1×J)进行标准化处理,然后计算低维的主元得分向量tnew以及残差向量enew
tnew=Xneww/(pTw)
enew=Xnew-tnewpT
其中,w是PLS模型中矩阵X的权重系数,它反应了主元的变化对监控结果的影响,即主元的重要程度。
当在线监测工业过程运行时,当检测统计量Ti>Ta或Qi>Qa时,工业过程可能处于失控状态,表明可能有故障发生,具体情况需进一步分析验证。
阶段划分方法,工业过程具有多阶段、时变特性,不同的工业过程阶段呈现不同的数据分布,单一的监控模型进行在线监测时,表现出较差的监测性能,容易造成错误的生产指导。基于批次展开方法的时间片矩阵隐含了工业过程变化的特征信息,因此,有效的利用这部分变化信息,能增强工业过程的解释性。进一步了解工业过程中所处状态和状态之间的转移关系,有利于建立起精确、较符合实际系统的监测模型。
基于状态模型的时间片矩阵信息评估,PCA方法常用于提取时间片矩阵信息,它能根据时间片矩阵中数据分布寻找出解释性最大的正交基,提供了一种空间变换的特征提取方案。但是PCA方法缺少对时间片矩阵间的信息的比较能力,因此,相关的指示性指标被设计用于揭示和显著多阶段工业过程。隐马尔科夫链模型(HMM)是关于时序的概率模型,描述了由一个隐藏的马尔科夫链模型生成不可观测的状态随机序列,再由各个状态生成一个观测数据的工业过程。HMM通过学习所有时间片矩阵的信息,能在全局上尺度上对各时间片矩阵信息进行评估,而且所得到的时间片矩阵信息评估值可以揭示工业过程随时间的变化,跟随系统变化是在HMM对系统拟合的结果。
HMM模型可以用三元符号表示,即λ=(A,B,π)。状态概率矩阵A与初始状态概率向量∏确定了隐藏的马尔科夫链,生成不可观测的状态序列。观测概率矩阵B与状态序列综合确定了如何产生观测数据。HMM模型参数定义如下:
1)A是状态转移概率矩阵,A=[aij]N×N其中aij=p(ii,l=qi|ii=qj),i=1,2..,N;j=1,2,..,N是时刻t处于状态qi的条件下t+1时刻转移到qj的概率
2)B是观测概率矩阵,bj(k)=p(ot=vk|it=qj),k=1,2..,M;j=1,2,..,N
3)π是初始状态概率向量,其中,∏i=P(i1=q1),i=1,2,..,N,是时刻t=1时刻处于状态qi的概率
文献[27,28]提出了一种新的HMM模型参数训练方法。根据经验和交叉验证初始化状态数N、初始概率分布矢量∏、输出观测数M。状态转移概率矩阵A为离散分布,输出观测矩阵B为连续分布,由前向算法通过数据学习得到。其中观测矩阵B由各状态混合高斯概率分布生成,
Figure GSB0000190266340000061
1≤j≤M其中o为模型观测向量,cij,uij,σij分别为第i个状态的第j个高斯分量G的混合系数、均值向量和协方差矩阵。模型的状态数会影响系统的性能,利用本发明根据贝式信息准则[10]确定状态数为5,每个状态混合高斯概率分布的高斯数为5。
HMM模型生成观测序列的对数概率为:
Figure GSB0000190266340000062
其中,bj(k)=P(ot=vk|if=qj),k=1,2,.,M j=1,2,.,N
多阶段划分方法,工业过程的三维历史数据X(I×J×K)可按批次和变量方式展开为二维矩阵。批次方式保留了时间和批次之间的主要动态特性,变量方式则保留了变量之间的非线性时变轨迹,这两种展开方法的优点可以结合使用。所提方法考虑了局部相似平稳的特征和时间序的要求进行稳定操作阶段和过渡阶段的划分。工业过程潜在的特征随着时间的变化,因此,所提方法最基本的分析单元是时间片矩阵Xi(I×J),并将PCA方法用于提取该时间片矩阵的主要变化信息。当所有时间片矩阵的变化信息提取之后,HMM模型可以指示工业过程持续时间片矩阵中变化的潜在特征,并对相应的时间片矩阵作出整体意义上的相关性评估。最后,根据相关性评估分布结果对整个工业过程的持续时间进行稳定阶段和过渡阶段划分。这种阶段划分方法是依据工业过程信息变化和时间序的结果,较好地符合了工业过程的时变特性。基本的阶段划分过程如下:
1)数据预处理
首先,将历史工业过程数据X(I×J×K)按变量展开方式进行纲量标准化为均值为0,方差为1的数据阵
Figure GSB0000190266340000063
其次,将数据阵
Figure GSB0000190266340000064
按批次展开方式展开为
Figure GSB0000190266340000071
时间片矩阵为
Figure GSB0000190266340000072
2)时间片矩阵主要信息提取
对所有K个时间片矩阵利用PCA进行主成分信息提取,主元成分个数由方差累计率(>90%)确定,记录K个时间片矩阵中最大的主元成分个数为c。为了保证各时间片矩阵信息变化的可比较性,由个数c统一K个时间片矩阵的成分信息保留程度。第k个时刻时间片矩阵
Figure GSB0000190266340000073
的PCA主成分信息提取如下。
Figure GSB0000190266340000074
Figure GSB0000190266340000075
其中,Tkc,Pkc为时间片矩阵
Figure GSB0000190266340000076
的得分和负载矩阵;
3)时间片矩阵主成分相关性评估
运用PCA方法对每个时间片矩阵进行主成分提取后,得到K个负载矩阵Pkc,该K个负载矩阵包含了工业过程持续进行的潜在特征,这些特征揭示了工业过程时变的性质和变化趋势,有助于将整个工业过程划分为局部的多个阶段。因此,利用HMM模型强大的数据信息表示能力并结合相关性评估指标式(5)对各时间片矩阵进行定量估计,能在数值上表示这种变化工业过程。
a)利用K个负载矩阵Pkc对HMM模型进行训练。
b)将训练的HMM模型对K个负载矩阵Pkc利用式5进行相关性评估,得到评估指标Iesti。这种评估是建立在系统拟合的整体意义上的,对应任意i时刻之前之后的变化对当前i时刻的相关性综合评估。如图2。
4)工业过程稳定阶段和过渡工业过程划分
在这K个时刻的特征变化中,有些连续时间区间的特征变化平缓,反之,快速、短暂,分别对应于工业工程中较长持续时间的操作阶段和阶段之间切换的过渡时期,因此将时间区间中的特征变化程度作为阶段划分依据,能较合理地对工业过程进行多阶段识别,有助于提高监测模型的检测精度和灵敏性。划分方法如下。
a)计算所有K个时间片矩阵信息成分评估指标Iesti的均值和方差Iesti_mean、Iesti_std
b)记第i个时间片矩阵信息成分评估指标Iesti i
定义特征变化程度控制上下界:Iesti_h=Iesti_mean+αIesti_std,Iesti_h=Iesti_mean-αTesti_std.
第i个时间片矩阵所处的区域为
Figure GSB0000190266340000077
其中,α为控制界可调因子,α决定了阶段划分中稳定阶段和过渡阶段的划分结果,α选取过大,阶段划分结果可能较少;a选取过小,容易产生持续时间短、阶段划分过多等问题,因此,应结合实际的工业过程数据特点进行α的选取。
c)将连续不间隔的相同Pindex(i)值对应的时间点合并,得到长短不同的连续时间区间。通过设定最小的持续时间长度p确定持续时间较短的时间区间合并方向。串行定位得到异常和阶段持续时间短的时间区间Lmin j,利用下式确定时间区间Lmin j的合并方向。
Figure GSB0000190266340000081
其中,Iesti prev,Iesti next为前一连续时间区间和后一连续时间区间内的Iesti平均值,abs(*)、mean(*)分别表示求括弧内*的绝对值和均值操作,Iesti j∈Lmin j,j=1,2,..,h,h<K。
本发明如上所述的阶段划分方法能通过分析时间片矩阵内的主成分信息的变化进行多阶段划分。这种阶段划分是全局意义和综合系统而得出的结果,它主要体现在对各时间片矩阵中信息的综合评估跟随时间的变化。其次,利用工业过程的稳定阶段和过渡阶段的时间片矩阵中信息的变化程度等特点,对整个工业过程反应持续时间进行多个阶段的识别。
1)时间片矩阵主要信息提取
时间片矩阵是最基本的分析单元,各时间片矩阵中包含的信息不同,为了保证时间片矩阵间信息的可比性。应用PCA方法进行时间片矩阵信息提取的同时,主元成分个数由方差累计率(>90%)确定,并且将所有时间片矩阵中最大的主元个数作为统一的信息保留。一方面使得时间片矩阵内信息具有可比性,另一方面保证了HMM模型进行信息评估的一致性。
2)工业过程稳定阶段和过渡工业过程进行划分时,Pindex(i)示出了第i个时间片矩阵信息评估Iesti i相对控制界Iesti_h和Iesti_l的位置,这个Pindex(i)用于确定工业过程的稳定和过渡阶段。在稳定阶段具有较长而且相同Pindex值的时间区间。而过渡阶段中,特征切换快速等特点使Pindex(i)值表现出波动切换,相同Pindex(i)值具有很小的时间持续区间。因此,可以根据相同Pindex值持续时间长短进行较粗的阶段划分。将连续时刻且相同Pindex(i)值对应的时间点合并,得到长短不同的时间区间。这些区间中包含稳定的区间、过渡区间和突变的离散时间点。为了得到连续的阶段,将持续短时间区间与相邻的稳定阶段进行合并,通过设定最小的持续时间长度p确定持续时间较短的时间区间和离散突变时间点合并方向。由此,对工业过程的整个反应时间段自适应划分为稳定和过渡阶段。
在线监测数据分析,离线建模
1)选取I批正常历史数据,组成三维工业过程变量数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)作为建模的训练数据,按变量展开方式进行标准化处理为0均值方差为1的数据阵X(J×IK),Y(M×IK),并将所得的矩阵按批次展开方式为X(I×JK),Y(I×MK)。
2)以Xi(I×J)为阶段划分基本单元,根据上节的阶段划分方法对工业过程数据进行阶段识别,其中i=1,2,..,K。
3)n个子阶段划分后,在各子阶段中利用PLS方法建立质量相关的监测模型,分别对Ty,Tx建立T2统计量控制限,对残差矩阵
Figure GSB0000190266340000082
建立Q2统计量控制限。
在线监测
1)采集在线时刻得到工业过程变量数据Xnew(1×J),按上述5.1节进行标准化处理,得到xnew(1×J)。
2)计算xnew(1×J)对应子阶段模型下的主元得分向量和残差向量。
t=xnewP
Figure GSB0000190266340000091
Figure GSB0000190266340000092
Figure GSB0000190266340000093
3)根据表1建立T2和Q统计量,并与5.1节步骤2所建立的控制限进行比较。若任意一个监测指标超限,则工业过程不受控,有故障发生,反之,工业过程处于正常控制范围。
案例,青霉素发酵工业过程是补料分批发酵的工业过程,具有动态非线性和多阶段的特点。本发明选用美国Illinois州立理工学院工业过程与技术小组开发的青霉素仿真平台PenSim2.0作为研究对象,此平台为国内外间歇工业过程监测的研究人员提供的一个标准平台。实际的青霉素发酵工业过程大致为以下3个阶段:菌体生长期,发酵初始期和发酵平稳期。青霉素发酵每个批次的反应时间为400小时,采样时间为1小时,选取10个工业过程变量和2个质量变量进行监测,如表1所示。为了使训练数据可靠同时令训练样本数据足够多,本发明共生产了80批正常批次数据作为模型的参考数据库,其中60批为模型训练数据,20批为测试数据。
表2.青霉素监测的工业过程变量和质量变量
Figure GSB0000190266340000094
青霉素发酵工业过程的故障类型可通过设置Aeration rate,Agitator power,Substrate feed rate的故障幅度和故障发生时间引入,具体的引入形式如表3所示:
表3.青霉素发酵工业过程的故障类型
Figure GSB0000190266340000101
根据第4节阶段划分方法进行阶段识别,设定控制界因子α=0.25和最小阶段时间p=10。图3示出了HMM模型对各时间片矩阵的数值评估结果和控制界因子α=0.25时所提方法对应的阶段划分。由图3可知,当时间持续到时刻50左右,评估值曲线上升,不同评估指标Iesti穿越控制限下界,Pindex指标值与时刻50之前不同,且其后保持Pindex指标值的时间区间小于最小阶段时间p,应作为持续时间较短的区间作后续合并,以此决定该时间段所属的确定阶段,由图3的下部可知时刻50之后的较短持续时间区间确定为与时刻50之前的连续持续时间区间相同的阶段。图3的上部中时间区间[300,400]内Pindex值发生5次变化,根据最小持续时间和相邻时间区间内Iesti均值特点确定了3个阶段。
图4示出了选取不同的控制界因子α时阶段划分方法对应的阶段划分结果,由图可知,当α值较小时,划分出的阶段多,其中时间持续较长的阶段较少,反应出的工业过程阶段切换较为频繁。随着α值的增大,划分出的阶段数量减少,稳定且持续时间长的阶段数量增加。当α=1.3时阶段划分方法失去阶段划分能力。尤其,当α取值在0.75~0.9附近时,其阶段划分结果较符合满足实际的青霉素生产工业过程,而且稳定阶段之间的过渡工业过程也相应的示出,有利于完善监控工业过程。
为了表明监测的可行性,图5.(a)示出了当α=0.75时,多阶段PLS方法对正常批次的检测结果,对比图5.(b)可知,图(a)中的检测限根据阶段划分方法表现出阶段持续性等特点。当α=0.75时,工业过程被划分为6个特征阶段,其中包括3个持续时间长的稳定阶段,以及它们之间的较短的过渡阶段,这种阶段划分结果符合青霉素的生产工业过程。因为前几个阶段计算的统计限数值相同,因此,图5.(a)中T2等检测限没有表现出6个阶段的性质,而统计限QX2较为明显的变现了阶段划分结果。在正常批次的检测结果方面,多阶段PLS方法的检测结果较PLS方法有较大的优势,图5.(a)中,正常批次的统计量总体分布在统计限下方,而图5.(b)中Q2统计量的检测效果从工业过程开始就出现误判,而且这种现象持续了较长的工业过程时间,容易导致对工业过程的操作和产品安全产生错误引导。
故障1的产生原因由表2所示,故障1的发生时间为第100时刻,并持续到工业过程结束。图6.(a)示出了当α=0.75时,多阶段PLS方法对故障1的检测结果。图6.(a)中统计量T2在第100时刻检测出故障发生,检测出的故障一直持续到工业过程结束,表现出较好的故障检测能力。图6.(b)示出了PLS方法对故障3的检测结果,统计量T2第100时刻没有检测出故障,并且当故障发生时漏判和检测率都较低,不能完整的指示故障的发生时刻和持续时间。而Q2统计量从工业过程开始就出现错误的检测,降低了检测的可信度,当故障发生时,Q2统计量较故障未发生时存在明显的数值跳变,持续到工业过程结束。从检测结果可以看出,多阶段PLS方法具有更好的检测性能,因为多阶段PLS方法所建立的监测模型将需要处理数据间相关性的全局模型分解为阶段模型,克服了局部的反应工业过程对监测性能的影响。
针对α取值的检测效率和故障识别能力。图7示出了不同α值时,多阶段PLS方法对故障1的检测率和误检率的检测结果。故障1的产生原因为对应的工业过程变量x1在第100时刻,由斜坡的增长方式增加为5%的幅度产生。其中,定义检测率(Fault detect ratio,FDR)为故障发生的时间区间[100,400]中检测到故障的比例,误检率(Missing detectratio,MDR)为故障发生前将正常样本错误检测为故障的比例。由图7.(a)可知,当α取任意值时,多阶段PLS方法针对故障1的检测率都保持在0.92以上,表现出较好的检测效果,其中,T2统计限在α取值区间[0.7,0.9]时检测率最高,划分出的阶段结果可由图4所示。QX2的统计限的检测率在α取值区间[0.3,0.6]时达到最大,但小于T2统计限的检测率。图7.(b)TX2统计限的误检率最低,QX2统计限最大检测率的α区间相对T2统计限的α最优的取值,存在较大误判率。因此,控制界因子α取值应在数值区间[0.7,0.9]为宜。
图8示出了不同α值时对故障3的检测率和误检率的检测结果。图8.(a)中统计限Tx2和Qx2的检测率分布都在0.5以下,表现出较差的检测能力。统计限T2在α取值区间[0.8,1]时检测率增加,且保持在0.8以上。图8.(b)中,统计限Tx2的误检率最低,保持在0不变,统计限Qx2的α最小误检率区间为[0,0.5],而统计限T2最大检测率的α取值区间对应的误判率为0.14左右。统计限T2分布检测率相较Tx2等统计限有较大优势,如当α取值为0.9时,T2的检测率为0.85,而QX2,Tx2的最大检测率分别为0.3,0.25,虽然α取值对应的T2的误判率略大于上述两者。因此,当α取值在[0.85,1]之间时综合检测效果较为理想。
本发明针对工业过程存在多阶段、时变等特性,本发明提出一种基于时间片矩阵相关性分析的自适应工业过程阶段划分方法来提高工业过程检测精度和灵敏性。时间片矩阵中包含了工业过程进行中潜在的特征变化信息,以此作为工业过程阶段划分的依据,能有效地划分过程的稳定阶段和过渡工业过程。在阶段划分后,通过在对应阶段建立PLS模型进行工业过程多阶段监测。最后,将所提方法应用与工业青霉素发酵工业过程,从实验结果可以看出,该方法有效地实现了多阶段工业过程监测,提高了故障检测的精确性和灵敏度。

Claims (1)

1.基于相关分析的阶段划分和故障检测方法,其特征为,所述方法基于工业过程具有多阶段、时变特性,不同的工业过程阶段呈现不同的数据分布,本方法利用工业过程变化的特征信息,计算工业过程中所处状态和状态之间的转移关系;
工业过程的三维历史数据X(I×J×K)可按批次和变量方式展开为二维矩阵,本方法最基本的分析单元是时间片矩阵Xi(I×J),并将PCA方法用于提取该时间片矩阵的主要变化信息,主要变化信息简称为主成分或主元成分,基本的阶段划分过程如下:
1)数据预处理
首先,将历史工业过程数据X(I×J×K)按变量展开方式进行标准化为均值为0,方差为1的数据阵
Figure FSB0000189349010000011
将数据阵
Figure FSB0000189349010000012
按批次展开方式展开为
Figure FSB0000189349010000013
时间片矩阵为
Figure FSB0000189349010000014
2)时间片矩阵主要信息提取
对所有K个时间片矩阵利用PCA进行主要变化信息提取,主要变化信息的个数由大于90%的方差累计率确定,记录K个时间片矩阵中最大的主元成分个数为c,为了保证各时间片矩阵信息变化的可比较性,由个数c统一K个时间片矩阵的成分信息保留程度;第k个时刻时间片矩阵
Figure FSB0000189349010000015
的主要变化信息提取如下,
Figure FSB0000189349010000016
Figure FSB0000189349010000017
其中,Tkc,Pkc为时间片矩阵
Figure FSB0000189349010000018
的得分和负载矩阵;
3)时间片矩阵主要变化信息相关性评估
对每个时间片矩阵进行主成分提取后,得到K个负载矩阵Pkc,该K个负载矩阵包含了工业过程持续进行的潜在特征,这些特征揭示了工业过程时变的性质和变化趋势;
a)利用K个负载矩阵Pkc对HMM模型进行训练,
b)将训练的HMM模型对K个负载矩阵Pkc利用第二步的式子进行相关性评估,得到评估指标Iesti,这种评估是建立在系统拟合的整体意义上的,对应任意i时刻之前之后的变化对当前i时刻的相关性综合评估;
4)工业过程稳定阶段和过渡工业过程划分
在这K个时刻的特征变化中,有些连续时间区间的特征变化平缓,反之,快速、短暂,分别对应于工业工程中较长持续时间的操作阶段和阶段之间切换的过渡时期,因此将时间区间中的特征变化程度作为阶段划分依据,能较合理地对工业过程进行多阶段识别,有助于提高监测模型的检测精度和灵敏性,划分方法如下,
a)计算所有K个时间片矩阵信息成分评估指标Iesti的均值和方差Iesti_mean、Iesti_std
b)记第i个时间片矩阵信息成分评估指标Iesti i
定义特征变化程度控制上下界:Iesti_h=Iesti_mean+αIesti_std,Iesti_h=Iesti_mean-αIesti_std.
第i个时间片矩阵所处的区域为
Figure FSB0000189349010000021
其中,α为控制界可调因子,α决定了阶段划分中稳定阶段和过渡阶段的划分结果,α选取过大,阶段划分结果可能较少;α选取过小,容易产生持续时间短、阶段划分过多等问题,因此,应结合实际的工业过程数据特点进行α的选取;
c)将连续不间隔的相同Pindex(i)值对应的时间点合并,得到长短不同的连续时间区间,通过设定最小的持续时间长度p确定持续时间较短的时间区间合并方向,串行定位得到异常和阶段持续时间短的时间区间Lmin j,利用下式确定时间区间Lmin j的合并方向;
Figure FSB0000189349010000022
其中,Iesti prev,Iesti next为前一连续时间区间和后一连续时间区间内的Iesti平均值,abs(*)、mean(*)分别表示求括弧内*的绝对值和均值操作,Iesti j∈Lmin j,j=1,2,..,h,h<K。
CN201710683345.5A 2017-08-03 2017-08-03 基于相关分析的阶段划分和故障检测方法 Active CN108664009B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710683345.5A CN108664009B (zh) 2017-08-03 2017-08-03 基于相关分析的阶段划分和故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710683345.5A CN108664009B (zh) 2017-08-03 2017-08-03 基于相关分析的阶段划分和故障检测方法

Publications (2)

Publication Number Publication Date
CN108664009A CN108664009A (zh) 2018-10-16
CN108664009B true CN108664009B (zh) 2021-05-25

Family

ID=63785040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710683345.5A Active CN108664009B (zh) 2017-08-03 2017-08-03 基于相关分析的阶段划分和故障检测方法

Country Status (1)

Country Link
CN (1) CN108664009B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT526313A1 (de) * 2022-06-17 2024-01-15 Univ Hangzhou Dianzi Auf Korrelationsanalyse basierendes Fehlererkennungsverfahren für multivariaten Industrieprozess

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109116834B (zh) * 2018-09-04 2021-02-19 湖州师范学院 一种基于深度学习的间歇过程故障检测方法
CN109240276B (zh) * 2018-11-09 2020-06-05 江南大学 基于故障敏感主元选择的多块pca故障监测方法
CN112149309B (zh) * 2020-09-30 2023-07-21 贵州电网有限责任公司 一种考虑温度-负荷相关性的调温负荷曲线拟合方法
CN112214006A (zh) * 2020-10-13 2021-01-12 山东建筑大学 考虑两维动态特性的间歇过程故障检测方法及系统
CN112348358A (zh) * 2020-11-05 2021-02-09 麦哲伦科技有限公司 一种基于pls分析的流程工业故障检测与预测的方法
CN112925202B (zh) * 2021-01-19 2022-10-11 北京工业大学 基于动态特征提取的发酵过程阶段划分方法
CN114034332B (zh) * 2021-11-23 2023-09-22 中国人民解放军火箭军工程大学 一种用于武器装备系统的故障监测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102431136B (zh) * 2011-09-16 2014-11-05 广州市香港科大霍英东研究院 一种基于多向主元分析法的多阶段批次过程阶段划分方法
CN103116306B (zh) * 2013-02-05 2015-06-17 浙江大学 一种自动的步进式有序时段划分方法
CN103336507B (zh) * 2013-06-24 2015-08-19 浙江大学 基于多模态协同时段自动划分的统计建模与在线监测方法
CN104063542A (zh) * 2014-06-20 2014-09-24 东北大学 一种基于多阶段mpca的无缝钢管连轧生产过程的监测与故障识别方法
CN104378229B (zh) * 2014-10-30 2017-12-15 东南大学 一种机会网络的链路预测方法
CN106210559A (zh) * 2016-07-08 2016-12-07 北京邮电大学 一种多传感器视频融合与降噪的方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A Pairwise Covariance-Preserving Projection Method for Dimension Reduction;Xiaoming Liu; Zhaohui Wang; Zhilin Feng; Jinshan Tang;《Seventh IEEE International Conference on Data Mining (ICDM 2007)》;20080312;全文 *
MPCA based phase identification method and its application to process monitoring;Yuqing Chang; Shu Wang; Shuai Tan; Fuli Wang; Zhizhong Mao;《2012 IEEE 51st IEEE Conference on Decision and Control (CDC)》;20130204;全文 *
Preprocessing effects on group independent component analysis of fMRI data;Duygu Şahin; Adil Deniz Duru; Ahmet Ademoğlu;《2014 18th National Biomedical Engineering Meeting》;20150129;全文 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT526313A1 (de) * 2022-06-17 2024-01-15 Univ Hangzhou Dianzi Auf Korrelationsanalyse basierendes Fehlererkennungsverfahren für multivariaten Industrieprozess

Also Published As

Publication number Publication date
CN108664009A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
CN108664009B (zh) 基于相关分析的阶段划分和故障检测方法
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
CN109814527B (zh) 基于lstm循环神经网络工业设备故障预测方法及装置
Zhang et al. Stationarity test and Bayesian monitoring strategy for fault detection in nonlinear multimode processes
Zhou et al. A study of polynomial fit-based methods for qualitative trend analysis
CN110245460B (zh) 一种基于多阶段oica的间歇过程故障监测方法
KR20190072652A (ko) 정보 처리 장치 및 정보 처리 방법
CN108153267B (zh) 一种基于误差主元分析模型的工业过程监测方法
CN108549908A (zh) 基于多采样概率核主成分模型的化工过程故障检测方法
CN111949012A (zh) 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法
Maestri et al. A robust clustering method for detection of abnormal situations in a process with multiple steady-state operation modes
Peres et al. Fault detection in batch processes through variable selection integrated to multiway principal component analysis
CN103926919B (zh) 基于小波变换和Lasso函数的工业过程故障检测方法
CN115899964A (zh) 基于多维的空调智能监测方法与系统
Chen et al. A whole building fault detection using weather based pattern matching and feature based PCA method
CN111066003A (zh) 对流程行业中的设备进行状态监测的方法、装置及介质
CN105868164A (zh) 一种基于有监督的线性动态系统模型的软测量建模方法
CN110942258B (zh) 一种性能驱动的工业过程异常监测方法
CN109670549B (zh) 火电机组的数据筛选方法、装置以及计算机设备
CN108470699B (zh) 一种半导体制造设备和工艺的智能控制系统
CN112329191A (zh) 一种多模态过程中模态辨识方法和过渡模态故障检测方法
CN105910806A (zh) 加注泵早期健康状态监测方法
Tanatavikorn et al. Batch process monitoring based on fuzzy segmentation of multivariate time-series
Li et al. A similarity-based and model-based fusion prognostics framework for remaining useful life prediction
Liu et al. Performance similarity based method for enhanced prediction of manufacturing process performance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant