CN105182955B - 一种多变量工业过程故障识别方法 - Google Patents
一种多变量工业过程故障识别方法 Download PDFInfo
- Publication number
- CN105182955B CN105182955B CN201510249620.3A CN201510249620A CN105182955B CN 105182955 B CN105182955 B CN 105182955B CN 201510249620 A CN201510249620 A CN 201510249620A CN 105182955 B CN105182955 B CN 105182955B
- Authority
- CN
- China
- Prior art keywords
- fault
- formula
- data
- statistic
- lambda
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/024—Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Complex Calculations (AREA)
Abstract
本发明涉及一种多变量工业过程故障识别方法,含有以下步骤:(一)收集历史数据库的正常操作工况数据集X和K类已知的故障模式数据集,计算正常操作工况数据集的均值mean(X)和标准差std(X),对已知的故障模式数据集进行标准化处理获得新故障模式数据集。(二)在各个故障模式数据集下构造数据窗,计算六种统计量变量。(三)检测过程故障,收集实时故障数据S,进行标准化处理。(四)在步骤(三)的基础上执行统计量主元相异度分析,计算待识别故障数据集和已知故障模式数据集之间的故障识别指数FRI。(五)对故障识别指数FRI进行排序,获得故障识别结果。本发明基于统计量主元相异度分析,在相异度分析中,提取主元信息,摒弃次要数据信息,抑制噪声的影响,能够充分挖掘数据高阶统计信息。
Description
技术领域
本发明属于工业过程故障识别技术领域,具体地说,涉及一种基于统计量主元相异度分析的多变量工业过程故障识别方法。
背景技术
随着高集成、大规模化的现代工业系统日益形成,故障诊断技术成为确保现代工业系统安全稳定运行的一项关键技术,并且由于工业过程数据库中存储了丰富的运行数据,基于数据驱动的故障诊断技术已经引起了工业过程工程师和学术研究人员的广泛关注。研究人员提出了一系列基于数据驱动的故障诊断方法,包括主元分析(PCA)、独立元分析(ICA)、偏最小二乘(PLS)。目前的故障诊断方法研究多数集中在故障检测问题(即如何快速有效的发现过程故障),然而故障源诊断问题(即检测到故障后识别故障的类型和原因)的研究相对较少,后者是一种更具有挑战性的研究问题。
当工业过程数据库中存在一些已知的故障模式数据时,故障模式识别方法就成为故障源诊断的一种有效手段。对于复杂的故障模式识别问题,可以利用的方法有费舍尔判别子空间方法、支持向量机方法进行故障辨识。Kano等人首先提出相异度分析(参考文献:ManabuKano,ShinjiHasebe,IoriHashimoto,HiromuOhno,Statisticalprocessmonitoringbasedondissimilarityofprocessdata,AIChEJournal,48(2002)1231-1240)。近几年来,相异度分析(Dissimilarityanalysis)作为一种故障诊断和识别的有效技术,引起了广泛的研究关注。该方法通过比较未知故障数据和已知故障模式数据之间的相异度指数来判断故障模式。虽然该方法取得初步的成功应用,但是其缺陷在于:(1)在相异度指数计算过程中没有考虑噪声抑制问题,但是噪声信息会恶化识别效果;(2)相异度分析直接针对原始测量变量,无法充分利用数据的高阶统计信息。
发明内容
本发明针对现有技术存在的上述不足,提供一种简单、精确有效的多变量工业过程故障识别方法,该方法基于统计量主元相异度分析,在相异度分析中,提取主元信息,摒弃次要数据信息,抑制噪声的影响,能够充分挖掘数据高阶统计信息。
本发明的技术方案是:一种多变量工业过程故障识别方法,含有以下步骤:
(一)收集历史数据库的正常操作工况数据集X和K类已知的故障模式数据集{Ho1,Ho2,...,HoK},计算正常操作工况数据集的均值mean(X)和标准差std(X),对已知的故障模式数据集{Ho1,Ho2,...,HoK}进行标准化处理获得新故障模式数据集{H1,H2,...,HK}。
(二)在各个故障模式数据集下构造数据窗,计算低阶统计量的变量均值εi(t)、低阶统计量的方差vi(t)、高阶统计量的3阶中心距高阶统计量的4阶中心距高阶统计量的偏斜度γi(t)和高阶统计量的峰度κi(t)六种统计量变量。
(三)检测过程故障,收集实时故障数据S,进行标准化处理。
(四)在步骤(三)的基础上执行统计量主元相异度分析,计算待识别故障数据集和已知故障模式数据集之间的故障识别指数FRI。
(五)对故障识别指数FRI进行排序,获得故障识别结果。
进一步的,所述步骤(一)中,通过公式(1)对故障模式数据进行标准化处理,公式(1)的表达式如下:
Hi=(Hoi-mean(X))/std(X),(i=1,2,...,K)(1)
经上述公式(1)标准化处理后即可获得新故障模式数据集{H1,H2,...,HK}。
进一步的,所述步骤(二)中,构造数据窗的步骤为:对任意t时刻的数据窗记为:
式中,w为数据窗宽度。
进一步的,所述六种统计变量分别由计算公式(3)、(4)、(5)、(6)、(7)、(8)计算获得,公式(3)、(4)、(5)、(6)、(7)、(8)的表达式如下所示:
根据上面所述的六个公式(3)至(8)获得数据窗的6类变量,将其堆积为一个行向量[ε(t)v(t)c(3)(t)c(4)(t)γ(t)κ(t)],其中,ε(t)=[ε1(t)…εm(t)],v(t)=[v1(t)…vm(t)], γ(t)=[γ1(t)…γm(t)],κ(t)=[κ1(t)…κm(t)];
将各个故障模式数据集分割为一系列如公式(9)所示的数据窗Hit(w≤t≤n),公式(9)表达式如下:
针对各故障模式数据集的每一个数据窗Hit(w≤t≤n)计算其统计量,进而获得各个故障模式数据集的统计量矩阵,记为:
进一步的,所述步骤(四)中,执行统计量主元相异度分析的步骤为:首先构造实时数据S的窗宽为w的数据窗,根据公式(3)至(8)计算待识别故障数据集的统计量,记为:
对于已知故障模式数据集的统计量矩阵(i=1,2,...,K)和待识别故障数据统计量分别包含m个变量的ni(i=1,...,K)和ns个样本,其协方差阵计算公式为:
对第i个故障模式,构造总体统计量数据集的协方差矩阵,记为:
对其开展特征值分解,获得:
RP=PΛ(14)
式中,P是特征向量矩阵,Λ(λ1≥λ2≥...≥λm)是特征值矩阵;
保留L个特征值和对应的特征向量p1,p2,...,pL,对矩阵Xi和XS进行主元线性变换,得到Yi和Ys,记为:
式中,Pk=[p1,p2,...,pk],Λk为{λ1,λ2,...,λk}构成的对角矩阵;
Yi和Ys的协方差矩阵记为:
两个数据集的协方差矩阵满足下式:
对协方差矩阵应用特征值分解,得到
由于和CS的特征向量与Ci的特征向量相同,仅仅是次序相反,对相同大小的数据集Xi和XS,如果具有相似的数据分布和关联关系,则特征值λj和1-λj均接近0.5;相反的,如果数据集描述了不同的数据分布和数据关系,则特征值分别趋近1和0;
计算各故障模式的统计量变量与待识别故障数据统计量的故障识别指数FRI的步骤为:相异度指数D可以用来评价数据集之间的相似程度,定义为:
式中,λj是Ci或者Cs的特征值,如果两个数据集相似程度高,则特征值接近0.5,D接近0;
为了方便故障识别,定义故障识别指数FRI为SDA,其计算公式为:
当两个数据集相似程度高时,SDA接近1。
进一步的,所述步骤(三)中,过程检测到故障后,收集实时故障数据集So,使用公式S=(So-mean(X))/std(X)进行标准化,上式中,X为正常操作工况数据集。
进一步的,所述步骤(五)中,对故障识别指数进行排序,最大的故障识别指数为故障识别结果Ximax,其中,故障识别结果的序号为:
真实故障模式的序号为ireal,如果ireal=imax,则故障识别结果是正确的。
进一步的,所述步骤(五)中,获得故障识别结果后,为了评价不同方法的故障识别结果,通过识别误差指数REI和识别对比度RCD两个故障识别性能指标进行不同方法的故障识别效果对比。
进一步的,所述识别误差指数REI的计算公式为:
式中,rei是识别误差,其计算公式为:
式中,ρ是惩罚因子,错误的识别结果为1,正确的识别结果为0。
进一步的,所述识别对比度的计算公式为:
式中,SSPDA(imax)是最大的FRI,SSPDA(isubmax)是次大的FRI,γ是故障识别错误参数,对于错误的识别结果,γ是-1,否则是1。
本发明的有益效果是:(1)本发明基于统计量主元相异度分析,在传统相异度分析方法的基础上引入噪声抑制机制,在相异度分析中,提取主元信息,摒弃次要数据信息,抑制工业噪声对故障辨识结果的影响,防止噪声信息恶化识别结果。(2)本发明引入统计模式分析技术,首次计算原始测量变量的统计量变量,故障识别时构建原始测量变量的六个统计量变量,对统计量数据集进行主元相异度分析,能够充分挖掘数据高阶统计信息,改善故障识别结果。
附图说明
图1为本发明统计量主元相异度分析的故障识别流程图。
图2为本发明SPDA方框图。
图3为本发明故障D03T下的规范化FRI指数。
图4为本发明对CSTR系统各故障REI性能指标对比。
图5为本发明对CSTR系统各故障RCD性能指标对比。
图6为本发明TE化工过程的流程图。
具体实施方式
下面结合一个仿真实例并结合附图对本发明作出进一步说明。
实施例一:以CSTR系统为例,CSTR系统为一个化学反应器,物料A的溶液进入反应器,发生一阶不可逆化学方应,生成物料B,反应为放热反应,因此需要通过外面的夹套冷却剂取走反应热量,为保证过程正常运行,一般带有串级控制系统。
根据过程机理,建立CSTR系统的动态机理模型如下:
式中,A是反应器截面积,cA是反应器内物料A的浓度,cAF是物料A在进料中的浓度,Cp是反应物比热,CpC是冷却剂比热,E是活化能,h是反应器液位,k0是反应因子,QF进料流量,QC是冷却剂流量,R是气体常数,T是反应器内温度,TC是冷却剂出口温度,TCF是冷却剂入口温度,TF是反应器进料温度,U是换热系数,AC是总的换热面积,ΔH是反应热,ρ是反应物密度,是冷却剂密度。
根据动态机理模型,对CSTR系统进行仿真。在仿真过程中,采集反应器进料流量、反应器进料温度、进料中物料A浓度、反应器内温度、反应器液位、反应器出料流量、反应器出料中物料A浓度、冷却剂入口温度、冷却剂出口温度和冷却剂流量10个测量变量。
CSTR仿真过程包含了1个正常操作模态和8个故障操作模态,各包含500个数据样本。故障模态列表见表1。表1中包含两组故障参数,参数1用于产生历史故障模式数据D01H~D08H.参数2用于产生测试数据D01T~D08T.
表1
故障 | 描述 | 参数1 | 参数2 |
D01 | 冷却剂温度缓慢改变 | -0.1K/min | +0.1K/min |
D02 | 进料浓度缓慢改变 | +6.0×10-4(molL)min | +8.0×10-4(molL)min |
D03 | 进料温度缓慢改变 | +0.05K/min | +0.07K/min |
D04 | 冷却剂阀门粘滞 | 29.5% | 31.5% |
D05 | 催化剂失活 | +2K/min | +4K/min |
D06 | 换热器结垢 | -120(J/(min.K))/min | -100(J/(min.K))/min |
D07 | 冷却剂出口温度测量偏差 | +3K | -2K |
D08 | 反应器出口流量测量偏差 | +3L/min | +5L/min |
上述CSTR系统的多变量工业过程故障识别方法,含有以下步骤:
(一)收集CSTR系统历史数据库的正常操作工况数据集X和K类已知的故障模式数据集{Ho1,Ho2,...,HoK},计算正常操作工况数据集的均值mean(X)和标准差std(X),对已知的故障模式数据集{Ho1,Ho2,...,HoK}进行标准化处理获得新故障模式数据集{H1,H2,...,HK}。
通过公式(1)对故障模式数据进行标准化处理,公式(1)的表达式如下:
Hi=(Hoi-mean(X))/std(X),(i=1,2,...,K)(1)
经上述公式(1)标准化处理后即可获得新故障模式数据集{H1,H2,...,HK}。
(二)在各个故障模式数据集下构造数据窗,计算低阶统计量的变量均值εi(t)、低阶统计量的方差vi(t)、高阶统计量的3阶中心距高阶统计量的4阶中心距高阶统计量的偏斜度γi(t)和高阶统计量的峰度κi(t)六种统计量变量。
构造数据窗的步骤为:对任意t时刻的数据窗记为:
式中,w为数据窗宽度。
所述六种统计变量分别由计算公式(3)、(4)、(5)、(6)、(7)、(8)计算获得,公式(3)、(4)、(5)、(6)、(7)、(8)的表达式如下所示:
根据上面所述的六个公式(3)至(8)获得数据窗的6类变量,将其堆积为一个行向量[ε(t)v(t)c(3)(t)c(4)(t)γ(t)κ(t)],其中,ε(t)=[ε1(t)…εm(t)],v(t)=[v1(t)…vm(t)], γ(t)=[γ1(t)…γm(t)],κ(t)=[κ1(t)…κm(t)];
将各个故障模式数据集分割为一系列如公式(9)所示的数据窗Hit(w≤t≤n),公式(9)表达式如下:
针对各故障模式数据集的每一个数据窗Hit(w≤t≤n)计算其统计量,进而获得各个故障模式数据集的统计量矩阵,记为:
(三)检测过程故障,收集实时故障数据S,进行标准化处理。
过程检测到故障后,收集实时故障数据集So,使用公式S=(So-mean(X))/std(X)进行标准化,上式中,X为正常操作工况数据集。
(四)在步骤(三)的基础上执行统计量主元相异度分析,计算待识别故障数据集和已知故障模式数据集之间的故障识别指数FRI。
执行统计量主元相异度分析的步骤为:首先构造实时数据S的窗宽为w的数据窗,根据公式(3)至(8)计算待识别故障数据集的统计量,记为:
对于已知故障模式数据集的统计量矩阵(i=1,2,...,K)和待识别故障数据统计量分别包含m个变量的ni(i=1,...,K)和ns个样本,其协方差阵计算公式为:
对第i个故障模式,构造总体统计量数据集的协方差矩阵,记为:
对其开展特征值分解,获得:
RP=PΛ(14)
式中,P是特征向量矩阵,Λ(λ1≥λ2≥...≥λm)是特征值矩阵;
大的特征值意味着重要的数据变化,而小的特征值意味着微弱的数据波动。前者是故障识别的主要因素,而后者往往是数据噪声导致的偶然变化。因此,保留L个特征值和对应的特征向量p1,p2,...,pL,这前L个特征向量作为主元载荷向量,尽可能保留主要的数据变化,压制数据噪声。
对矩阵Xi和XS进行主元线性变换,得到Yi和Ys,记为:
式中,Pk=[p1,p2,...,pk],Λk为{λ1,λ2,...,λk}构成的对角矩阵;
Yi和Ys的协方差矩阵记为:
两个数据集的协方差矩阵满足下式:
对协方差矩阵应用特征值分解,得到
由于和CS的特征向量与Ci的特征向量相同,仅仅是次序相反,对相同大小的数据集Xi和XS,如果具有相似的数据分布和关联关系,则特征值λj和1-λj均接近0.5;相反的,如果数据集描述了不同的数据分布和数据关系,则特征值分别趋近1和0。
计算各故障模式的统计量变量与待识别故障数据统计量的故障识别指数FRI的步骤为:相异度指数D可以用来评价数据集之间的相似程度,定义为:
式中,λj是Ci或者Cs的特征值,如果两个数据集相似程度高,则特征值接近0.5,D接近0;
为了方便故障识别,定义故障识别指数FRI为SDA,其计算公式为:
当两个数据集相似程度高时,SDA接近1。
(五)对故障识别指数FRI进行排序,获得故障识别结果。
对故障识别指数进行排序,最大的故障识别指数为故障识别结果Ximax,其中,故障识别结果的序号为:
真实故障模式的序号为ireal,如果ireal=imax,则故障识别结果是正确。
最理想的识别结果是:第imax个FRI接近1,其他FRI均接近0。实际识别过程中,有可能会出现多个FRI都具有比较大的数值,这样就增加故障识别的难度,因为,即使ireal=imax,多个较大的FRI也会降低了故障识别结果的可信度。
获得故障识别结果后,为了评价不同方法的故障识别结果,通过识别误差指数REI和识别对比度RCD两个故障识别性能指标进行不同方法的故障识别效果对比。
所述识别误差指数REI的计算公式为:
式中,rei是识别误差,其计算公式为:
式中,ρ是惩罚因子,错误的识别结果为1,正确的识别结果为0。
所述识别对比度的计算公式为:
式中,SSPDA(imax)是最大的FRI,SSPDA(isubmax)是次大的FRI,γ是故障识别错误参数,对于错误的识别结果,γ是-1,否则是1。
很显然,大的RCD数值意味着清晰正确的识别结果,可信度高;小的RCD数值意味着识别结果不正确,可信度低。
本实施例中,采用相异度分析DA法和主元相异度分析PDA法两种方法与本发明基于统计量主元相异度分析SPDA的故障识别方法对CSTR系统进行故障模式识别。
统计量数据窗宽度选为30,综合对比上述三种方法,以故障D03为例说明故障识别效果。
故障测试数据集为D30T,为了比较不同方法,分别计算上述三种故障识别指数SDA,SPDA,SSPDA,结果如表2所示。
表2
模式号 | D01H | D02H | D03H | D04H | D05H | D06H | D07H | D08H |
SDA | 0.8000 | 0.8005 | 0.9790 | 0.8607 | 0.8164 | 0.8020 | 0.8077 | 0.8184 |
SPDA | 0.0471 | 0.0447 | 0.9747 | 0.7770 | 0.6447 | 0.0459 | 0.5400 | 0.7052 |
SSPDA | 0.0023 | 0.0015 | 0.9000 | 0.0433 | 0.0054 | 0.0023 | 0.0058 | 0.0050 |
为了便于比较,对数据进行规范化处理,将表2中的每行数据均除以其最大值,获得规范化故障识别指数SDA,SPDA,SSPDA,结果如表3所示,同时绘制于图3中。
表3
模式号 | D01H | D02H | D03H | D04H | D05H | D06H | D07H | D08H |
SDA | 0.8172 | 0.8177 | 1.0000 | 0.8792 | 0.8339 | 0.8192 | 0.8251 | 0.8360 |
SPDA | 0.0483 | 0.0459 | 1.0000 | 0.7972 | 0.6614 | 0.0471 | 0.5540 | 0.7235 |
SSPDA | 0.0025 | 0.0016 | 1.0000 | 0.0481 | 0.0060 | 0.0025 | 0.0065 | 0.0055 |
由图3可以看出,三种方法都可以正确识别故障数据集D03T。然而,DA方法结果中的第1、2、4、5、6、7、8故障识别指数都非常大,均在0.8以上,对比度不清晰。在应用PDA方法时,第4、5、7、8故障识别指数仍然比较大。应用SPDA方法时取得最好的故障识别效果,不但第3个故障识别指数最大,而且其他的识别结果都非常小,均小于0.1。从该故障案例的分析中可以看出,PDA方法可以改进DA方法,而SPDA方法能够进一步改进PDA方法。
为了有一个整体的衡量,计算测试数据集D03T识别过程中的性能指标REI和RCD,列于表4中。
表4
Methods | DA | PDA | SPDA |
REI | 0.7285 | 0.3597 | 0.0091 |
RCD | 0.1208 | 0.2028 | 0.9519 |
由表4可以看出,SPDA方法具有最小的REI结果,而且具有最大的RCD结果,这说明SPDA方法的故障识别误差最小,故障识别对比度最高,故障识别效果最佳。
计算全部8个测试故障数据集的REI和RCD指标,列于表5和表6中,其中,表5为对CSTR系统各故障REI性能指标的对比,表6为对CSTR系统各故障RCD性能指标的对比,为了有一个直观的表现可见图4和图5。
表5
表6
从上述表5、表6以及图4、图5中可以看出,PDA能够有效改善REI指标,SPDA则进一步减小REI指标;同时PDA的RCD指标大于DA方法,SPDA的RCD指标大于PDA方法。因此,PDA和SPDA具有更好的故障识别性能,以本发明SPDA的故障识别效果最佳。
实施例二:以一个著名的TE化工过程为例,TE化工过程已经广泛应用于故障诊断和过程控制方法研究中。TE化工过程由五个单元组成,共有52个过程变量,其包含11个操作变量,19个成分变量和22个连续测量变量,TE化工过程的流程图如图6所示。关于TE化工过程的其它细节详见参考文献(J.J.Downs,E.F.Vogel,Aplant-wideindustrialprocesscontrolproblem,Computers&ChemicalEngineering,17(1993)245-255)。
TE化工过程的仿真数据包可在网站http://web.mit.edu/braatzgroup/ index.html上下载。数据包中含有1个正常工况和21个故障工况数据IDV(1)~IDV(21)。正常工况数据有500个采样点52个变量。故障数据集分为两个类别,一类是故障模式数据集F01H~F21H,另一类是故障测试数据集F01T~F021T,各有480个采样点和52个变量值。
上述TE化工过程的多变量工业过程故障识别方法,含有以下步骤:
(一)收集TE化工过程历史数据库的正常操作工况数据集X和K类已知的故障模式数据集{Ho1,Ho2,...,HoK},计算正常操作工况数据集的均值mean(X)和标准差std(X),对已知的故障模式数据集{Ho1,Ho2,...,HoK}进行标准化处理获得新故障模式数据集{H1,H2,...,HK}。
通过公式(1)对故障模式数据进行标准化处理,公式(1)的表达式如下:
Hi=(Hoi-mean(X))/std(X),(i=1,2,...,K)(1)
经上述公式(1)标准化处理后即可获得新故障模式数据集{H1,H2,...,HK}。
(二)在各个故障模式数据集下构造数据窗,计算低阶统计量的变量均值εi(t)、低阶统计量的方差vi(t)、高阶统计量的3阶中心距高阶统计量的4阶中心距高阶统计量的偏斜度γi(t)和高阶统计量的峰度κi(t)六种统计量变量。
构造数据窗的步骤为:对任意t时刻的数据窗记为:
式中,w为数据窗宽度。
所述六种统计变量分别由计算公式(3)、(4)、(5)、(6)、(7)、(8)计算获得,公式(3)、(4)、(5)、(6)、(7)、(8)的表达式如下所示:
根据上面所述的六个公式(3)至(8)获得数据窗的6类变量,将其堆积为一个行向量[ε(t)v(t)c(3)(t)c(4)(t)γ(t)κ(t)],其中,ε(t)=[ε1(t)…εm(t)],v(t)=[v1(t)…vm(t)], γ(t)=[γ1(t)…γm(t)],
κ(t)=[κ1(t)…κm(t)];
将各个故障模式数据集分割为一系列如公式(9)所示的数据窗Hit(w≤t≤n),公式(9)表达式如下:
针对各故障模式数据集的每一个数据窗Hit(w≤t≤n)计算其统计量,进而获得各个故障模式数据集的统计量矩阵,记为:
(三)检测过程故障,收集实时故障数据S,进行标准化处理。
过程检测到故障后,收集实时故障数据集So,使用公式S=(So-mean(X))/std(X)进行标准化,上式中,X为正常操作工况数据集。
(四)在步骤(三)的基础上执行统计量主元相异度分析,计算待识别故障数据集和已知故障模式数据集之间的故障识别指数FRI。
执行统计量主元相异度分析的步骤为:首先构造实时数据S的窗宽为w的数据窗,根据公式(3)至(8)计算待识别故障数据集的统计量,记为:
对于已知故障模式数据集的统计量矩阵(i=1,2,...,K)和待识别故障数据统计量分别包含m个变量的ni(i=1,...,K)和ns个样本,其协方差阵计算公式为:
对第i个故障模式,构造总体统计量数据集的协方差矩阵,记为:
对其开展特征值分解,获得:
RP=PΛ(14)
式中,P是特征向量矩阵,Λ(λ1≥λ2≥...≥λm)是特征值矩阵。
大的特征值意味着重要的数据变化,而小的特征值意味着微弱的数据波动。前者是故障识别的主要因素,而后者往往是数据噪声导致的偶然变化。因此,保留L个特征值和对应的特征向量p1,p2,...,pL,这前L个特征向量作为主元载荷向量,尽可能保留主要的数据变化,压制数据噪声。
对矩阵Xi和XS进行主元线性变换,得到Yi和Ys,记为:
式中,Pk=[p1,p2,...,pk],Λk为{λ1,λ2,...,λk}构成的对角矩阵;
Yi和Ys的协方差矩阵记为:
两个数据集的协方差矩阵满足下式:
对协方差矩阵应用特征值分解,得到
由于和CS的特征向量与Ci的特征向量相同,仅仅是次序相反,对相同大小的数据集Xi和XS,如果具有相似的数据分布和关联关系,则特征值λj和1-λj均接近0.5;相反的,如果数据集描述了不同的数据分布和数据关系,则特征值分别趋近1和0。
计算各故障模式的统计量变量与待识别故障数据统计量的故障识别指数FRI的步骤为:相异度指数D可以用来评价数据集之间的相似程度,定义为:
式中,λj是Ci或者Cs的特征值,如果两个数据集相似程度高,则特征值接近0.5,D接近0;
为了方便故障识别,定义故障识别指数FRI为SDA,其计算公式为:
当两个数据集相似程度高时,SDA接近1。
(五)对故障识别指数FRI进行排序,获得故障识别结果。
对故障识别指数进行排序,最大的故障识别指数为故障识别结果Ximax,其中,故障识别结果的序号为:
真实故障模式的序号为ireal,如果ireal=imax,则故障识别结果是正确。
最理想的识别结果是:第imax个FRI接近1,其他FRI均接近0。实际识别过程中,有可能会出现多个FRI都具有比较大的数值,这样就增加故障识别的难度,因为,即使ireal=imax,多个较大的FRI也会降低了故障识别结果的可信度。
获得故障识别结果后,为了评价不同方法的故障识别结果,通过识别误差指数REI和识别对比度RCD两个故障识别性能指标进行不同方法的故障识别效果对比。
所述识别误差指数REI的计算公式为:
式中,rei是识别误差,其计算公式为:
式中,ρ是惩罚因子,错误的识别结果为1,正确的识别结果为0。
所述识别对比度的计算公式为:
式中,SSPDA(imax)是最大的FRI,SSPDA(isubmax)是次大的FRI,γ是故障识别错误参数,对于错误的识别结果,γ是-1,否则是1。
很显然,大的RCD数值意味着清晰正确的识别结果,可信度高;小的RCD数值意味着识别结果不正确,可信度低。
本实施例中,采用相异度分析DA法和主元相异度分析PDA法两种方法与本发明基于统计量主元相异度分析SPDA的故障识别方法分别对TE化工过程进行故障识别。
统计量数据窗宽度选为200,综合上述三种方法对全部21个故障测试数据集说明故障模式识别的效果。
上述三种方法的两个性能指标REI和RCD如表7和表8所示。
表7
表8
表7中列出的为REI指标的结果,表8中列出的为RCD指标的结果,在表中最好的识别结果用粗体字标出。从表7中可以看出,除了故障模式F15T和F16T,SPDA有最小的REI指标,而从表8中可以得出,除了故障模式F09T、F15T和F16T,SPDA有最大的RCD指标。通过全局分析可以看出,REI和RCD的均值进行对比得到PDA和SPDA的故障识别效果优于传统的DA方法。因此,得到结论是在TE化工过程中PDA和SPDA方法具有更加显著的故障识别效果,且SPDA方法的故障识别效果最佳。
因为识别一个故障得到一个非常小的RCD指标说服力不强,因此一个小RCD指标的故障识别可能被归为一个不清晰的故障识别结果。这里对一个0.1的阈值,也就是说,只有当RCD大于0.1,故障识别结果被认为是清晰的。否则,可以认为故障识别结果没有说服力。因此,定义显著故障识别率(CFRR)为RCD大于0.1的故障数据集数目占总的故障数据集数目的比例。分析表8中的RCD指标,对显著故障识别率(CFRR)进行对比如表9所示。
表9
DA | PDA | SPDA | |
CFRR | 4.76% | 47.62% | 85.71% |
由表9可以看出,SPDA有85.71%的CFRR指标,PDA有47.62%的CFRR指标,而DA的CFRR指标仅有4.76%。由此可见,采用本发明基于统计量主元相异度分析SPDA的故障识别方法进行故障识别的效果最好。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。
Claims (8)
1.一种多变量工业过程故障识别方法,其特征在于:含有以下步骤:
(一)收集历史数据库的正常操作工况数据集X和K类已知的故障模式数据集{Ho1,Ho2,...,HoK},计算正常操作工况数据集的均值mean(X)和标准差std(X),对已知的故障模式数据集{Ho1,Ho2,...,HoK}进行标准化处理获得新故障模式数据集{H1,H2,...,HK};
(二)在各个故障模式数据集下构造数据窗,计算低阶统计量的变量均值εi(t)、低阶统计量的方差vi(t)、高阶统计量的3阶中心距高阶统计量的4阶中心距高阶统计量的偏斜度γi(t)和高阶统计量的峰度ki(t)六种统计量变量;所述六种统计变量分别由计算公式(3)、(4)、(5)、(6)、(7)、(8)计算获得,公式(3)、(4)、(5)、(6)、(7)、(8)的表达式如下所示:
根据上面所述的六个公式(3)至(8)获得数据窗的6类变量,将其堆积为一个行向量
[ε(t)v(t)c(3)(t)c(4)(t)γ(t)κ(t)],其中,ε(t)=[ε1(t)…εm(t)],
v(t)=[v1(t)…vm(t)],
γ(t)=[γ1(t)…γm(t)],κ(t)=[κ1(t)…κm(t)];
将各个故障模式数据集分割为一系列如公式(9)所示的数据窗Hit(w≤t≤n),公式(9)表达式如下:
针对各故障模式数据集的每一个数据窗Hit(w≤t≤n)计算其统计量,进而获得各个故障模式数据集的统计量矩阵,记为:
(三)检测过程故障,收集实时故障数据S,进行标准化处理;
(四)在步骤(三)的基础上执行统计量主元相异度分析,计算待识别故障数据集和已知故障模式数据集之间的故障识别指数FRI;执行统计量主元相异度分析的步骤为:首先构造实时数据S的窗宽为w的数据窗,根据公式(3)至(8)计算待识别故障数据集的统计量,记为:
对于已知故障模式数据集的统计量矩阵和待识别故障数据统计量分别包含m个变量的ni(i=1,...,K)和ns个样本,其协方差阵计算公式为:
对第i个故障模式,构造总体统计量数据集的协方差矩阵,记为:
对其开展特征值分解,获得:
RP=PΛ(14)
式中,P是特征向量矩阵,Λ(λ1≥λ2≥...≥λm)是特征值矩阵;
保留L个特征值和对应的特征向量p1,p2,...,pL,对矩阵Xi和XS进行主元线性变换,得到Yi和Ys,记为:
式中,Pk=[p1,p2,...,pk],Λk为{λ1,λ2,...,λk}构成的对角矩阵;
Yi和Ys的协方差矩阵记为:
两个数据集的协方差矩阵满足下式:
对协方差矩阵应用特征值分解,得到
由于和CS的特征向量与Ci的特征向量相同,仅仅是次序相反,对相同大小的数据集Xi和XS,如果具有相似的数据分布和关联关系,则特征值λj和1-λj均接近0.5;相反的,如果数据集描述了不同的数据分布和数据关系,则特征值分别趋近1和0;
计算各故障模式的统计量变量与待识别故障数据统计量的故障识别指数FRI的步骤为:相异度指数D可以用来评价数据集之间的相似程度,定义为:
式中,λj是Ci或者Cs的特征值,如果两个数据集相似程度高,则特征值接近0.5,D接近0;
为了方便故障识别,定义故障识别指数FRI为SDA,其计算公式为:
当两个数据集相似程度高时,SDA接近1;
(五)对故障识别指数FRI进行排序,获得故障识别结果。
2.根据权利要求1所述的多变量工业过程故障识别方法,其特征在于:所述步骤(一)中,通过公式(1)对故障模式数据进行标准化处理,公式(1)的表达式如下:
Hi=(Hoi-mean(X))/std(X),(i=1,2,...,K)(1)
经上述公式(1)标准化处理后即可获得新故障模式数据集{H1,H2,...,HK}。
3.根据权利要求1所述的多变量工业过程故障识别方法,其特征在于:所述步骤(二)中,构造数据窗的步骤为:对任意t时刻的数据窗记为:
式中,w为数据窗宽度。
4.根据权利要求1所述的多变量工业过程故障识别方法,其特征在于:所述步骤(三)中,过程检测到故障后,收集实时故障数据集So,使用公式S=(So-mean(X))/std(X)进行标准化,上式中,X为正常操作工况数据集。
5.根据权利要求1所述的多变量工业过程故障识别方法,其特征在于:所述步骤(五)中,对故障识别指数进行排序,最大的故障识别指数为故障识别结果Ximax,其中,故障识别结果的序号为:
真实故障模式的序号为ireal,如果ireal=imax,则故障识别结果是正确的。
6.根据权利要求1所述的多变量工业过程故障识别方法,其特征在于:所述步骤(五)中,获得故障识别结果后,为了评价不同方法的故障识别结果,通过识别误差指数REI和识别对比度RCD两个故障识别性能指标进行不同方法的故障识别效果对比。
7.根据权利要求6所述的多变量工业过程故障识别方法,其特征在于:所述识别误差指数REI的计算公式为:
式中,rei是识别误差,其计算公式为:
式中,ρ是惩罚因子,错误的识别结果为1,正确的识别结果为0。
8.根据权利要求6所述的多变量工业过程故障识别方法,其特征在于:所述识别对比度RCD的计算公式为:
式中,SSPDA(imax)是最大的FRI,SSPDA(isubmax)是次大的FRI,γ是故障识别错误参数,对于错误的识别结果,γ是-1,否则是1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510249620.3A CN105182955B (zh) | 2015-05-15 | 2015-05-15 | 一种多变量工业过程故障识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510249620.3A CN105182955B (zh) | 2015-05-15 | 2015-05-15 | 一种多变量工业过程故障识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105182955A CN105182955A (zh) | 2015-12-23 |
CN105182955B true CN105182955B (zh) | 2016-06-22 |
Family
ID=54905096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510249620.3A Expired - Fee Related CN105182955B (zh) | 2015-05-15 | 2015-05-15 | 一种多变量工业过程故障识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105182955B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106742068A (zh) * | 2016-12-07 | 2017-05-31 | 中国人民解放军国防科学技术大学 | 一种诊断卫星姿态控制系统未知故障的方法 |
CN110244690A (zh) * | 2019-06-19 | 2019-09-17 | 山东建筑大学 | 一种多变量工业过程故障辨识方法及系统 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107065839B (zh) * | 2017-06-06 | 2019-09-27 | 苏州大学 | 一种基于相异性递归消除特征的故障诊断方法及装置 |
CN108958226B (zh) * | 2018-08-08 | 2021-03-19 | 太原理工大学 | 基于生存信息势—主成分分析算法的te过程故障检测方法 |
CN109164794B (zh) * | 2018-11-22 | 2019-11-29 | 中国石油大学(华东) | 基于偏f值selm的多变量工业过程故障分类方法 |
CN110362063B (zh) * | 2019-07-15 | 2020-07-03 | 山东建筑大学 | 基于全局保持无监督核极限学习机的故障检测方法及系统 |
CN110794814B (zh) * | 2019-11-27 | 2022-06-28 | 中国人民解放军火箭军工程大学 | 一种基于广义主成分的故障确定方法及系统 |
CN112631258B (zh) * | 2020-12-29 | 2021-11-09 | 南京富岛信息工程有限公司 | 一种工业过程关键指标的故障预警方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007115080A1 (en) * | 2006-03-31 | 2007-10-11 | Tokyo Electron Limited | Monitoring a single-wafer processing system |
CN102760208A (zh) * | 2012-07-03 | 2012-10-31 | 清华大学 | 基于模拟疫苗的动态人工免疫故障诊断方法 |
CN103488561A (zh) * | 2013-07-09 | 2014-01-01 | 沈阳化工大学 | 一种在线升级主样本模型的kNN故障检测方法 |
CN103760889A (zh) * | 2014-01-06 | 2014-04-30 | 上海交通大学 | 基于贝叶斯网的故障分离快速方法 |
CN103926919A (zh) * | 2014-04-29 | 2014-07-16 | 华东理工大学 | 基于小波变换和Lasso函数的工业过程故障检测方法 |
CN104182642A (zh) * | 2014-08-28 | 2014-12-03 | 清华大学 | 一种基于稀疏表示的故障检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7216061B2 (en) * | 2004-08-25 | 2007-05-08 | Siemens Corporate Research, Inc. | Apparatus and methods for detecting system faults using hidden process drivers |
-
2015
- 2015-05-15 CN CN201510249620.3A patent/CN105182955B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007115080A1 (en) * | 2006-03-31 | 2007-10-11 | Tokyo Electron Limited | Monitoring a single-wafer processing system |
CN102760208A (zh) * | 2012-07-03 | 2012-10-31 | 清华大学 | 基于模拟疫苗的动态人工免疫故障诊断方法 |
CN103488561A (zh) * | 2013-07-09 | 2014-01-01 | 沈阳化工大学 | 一种在线升级主样本模型的kNN故障检测方法 |
CN103760889A (zh) * | 2014-01-06 | 2014-04-30 | 上海交通大学 | 基于贝叶斯网的故障分离快速方法 |
CN103926919A (zh) * | 2014-04-29 | 2014-07-16 | 华东理工大学 | 基于小波变换和Lasso函数的工业过程故障检测方法 |
CN104182642A (zh) * | 2014-08-28 | 2014-12-03 | 清华大学 | 一种基于稀疏表示的故障检测方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106742068A (zh) * | 2016-12-07 | 2017-05-31 | 中国人民解放军国防科学技术大学 | 一种诊断卫星姿态控制系统未知故障的方法 |
CN106742068B (zh) * | 2016-12-07 | 2019-01-04 | 中国人民解放军国防科学技术大学 | 一种诊断卫星姿态控制系统未知故障的方法 |
CN110244690A (zh) * | 2019-06-19 | 2019-09-17 | 山东建筑大学 | 一种多变量工业过程故障辨识方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105182955A (zh) | 2015-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105182955B (zh) | 一种多变量工业过程故障识别方法 | |
CN103914064B (zh) | 基于多分类器和d-s证据融合的工业过程故障诊断方法 | |
CN106647718B (zh) | 基于贝叶斯核慢特征分析的非线性工业过程故障检测方法 | |
Yu | Localized Fisher discriminant analysis based complex chemical process monitoring | |
CN106355030B (zh) | 一种基于层次分析法和加权投票决策融合的故障检测方法 | |
Yu | A support vector clustering‐based probabilistic method for unsupervised fault detection and classification of complex chemical processes using unlabeled data | |
CN106649789B (zh) | 一种基于集成半监督费舍尔判别的工业过程故障分类方法 | |
CN110738274A (zh) | 一种基于数据驱动的核动力装置故障诊断方法 | |
Rad et al. | Designing supervised local neural network classifiers based on EM clustering for fault diagnosis of Tennessee Eastman process | |
CN106371427A (zh) | 基于层次分析法和模糊融合的工业过程故障分类方法 | |
Guo et al. | Fault detection based on robust characteristic dimensionality reduction | |
CN103901880A (zh) | 基于多分类器和d-s证据融合的工业过程故障检测方法 | |
CN104914850B (zh) | 基于切换线性动态系统模型的工业过程故障诊断方法 | |
CN106529079A (zh) | 一种基于故障相关主成分空间的化工过程故障检测方法 | |
CN105334823B (zh) | 基于有监督的线性动态系统模型的工业过程故障检测方法 | |
Zheng et al. | Multivariate/minor fault diagnosis with severity level based on Bayesian decision theory and multidimensional RBC | |
CN103926919B (zh) | 基于小波变换和Lasso函数的工业过程故障检测方法 | |
CN109298633A (zh) | 基于自适应分块非负矩阵分解的化工生产过程故障监测方法 | |
CN108764305A (zh) | 一种改进的群智能机器学习故障诊断系统 | |
CN108181893B (zh) | 一种基于pca-kdr的故障检测方法 | |
CN115047839B (zh) | 一种甲醇制烯烃工业过程的故障监测方法和系统 | |
CN106897542A (zh) | 基于显著故障变量提取的卷烟制叶丝段故障诊断方法 | |
CN114353261A (zh) | 空调机组故障分析方法、装置、终端设备及存储介质 | |
Wang et al. | Decentralized plant-wide monitoring based on mutual information-Louvain decomposition and support vector data description diagnosis | |
Wang et al. | Data-Driven fault detection and reasoning for industrial monitoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160622 Termination date: 20210515 |
|
CF01 | Termination of patent right due to non-payment of annual fee |