CN107544477B - 基于核主元分析的非线性工业过程故障检测方法 - Google Patents
基于核主元分析的非线性工业过程故障检测方法 Download PDFInfo
- Publication number
- CN107544477B CN107544477B CN201710991994.1A CN201710991994A CN107544477B CN 107544477 B CN107544477 B CN 107544477B CN 201710991994 A CN201710991994 A CN 201710991994A CN 107544477 B CN107544477 B CN 107544477B
- Authority
- CN
- China
- Prior art keywords
- formula
- core
- vector
- principle component
- follows
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 238000004458 analytical method Methods 0.000 title claims abstract description 35
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 29
- 238000012360 testing method Methods 0.000 claims abstract description 110
- 238000012549 training Methods 0.000 claims abstract description 98
- 238000000034 method Methods 0.000 claims abstract description 87
- 239000000203 mixture Substances 0.000 claims abstract description 59
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000005070 sampling Methods 0.000 claims description 69
- 238000010606 normalization Methods 0.000 claims description 33
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 claims description 26
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 claims description 26
- 210000000299 nuclear matrix Anatomy 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 14
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 239000004615 ingredient Substances 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 239000000498 cooling water Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000012263 liquid product Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010197 meta-analysis Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003134 recirculating effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Landscapes
- Monitoring And Testing Of Nuclear Reactors (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
本发明提出一种基于核主元分析的非线性工业过程故障检测方法,对训练数据进行归一化处理后,建立KPCA模型,从训练数据中提取非线性特征作为核成分,并为每个核成分确定正常阈值,依据核主成分的个数划分核主成分空间PCS和核残差空间RCS,利用局部离群分析算法计算对应的局部离群值统计量LOFPCS和LOFRCS,并确定控制限;采集测试数据,利用KPCA模型提取对应的核主成分向量和核残差向量,利用核成分的正常阈值对其进行加权,计算加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h),并用控制限进行监控。该方法将核成分加权技术和局部离群因子技术引入到KPCA方法中,能够精确地衡量工业过程数据中的非线性特征信息,提高故障检测率。
Description
技术领域
本发明属于工业过程故障检测技术领域,涉及非线性工业过程故障检测方法,具体地说,涉及一种基于核主元分析的非线性工业过程故障检测方法。
背景技术
现代工业过程日益趋于大型化、复杂化,故障检测与诊断技术已经成为保证工业过程安全性的重要技术。随着现代计算机测控系统的广泛应用,工业过程中采集并存储了丰富的过程运行数据。因此,基于数据驱动的故障检测与诊断技术逐渐成为研究热点。典型的基于数据驱动的故障检测与诊断方法包括主元分析(PCA)、独立元分析(ICA)、偏最小二乘(PLS)、Fisher判别分析(FDA)等。然而大多数的工业生产过程往往是非线性、非高斯的,上述提到的故障检测与诊断方法在适用场合上具有很大的局限性。因此,针对过程数据的非线性及非高斯特征,如何从测量数据中提取有用的特征信息以监控工业过程的运行状态是一种具有挑战性的研究课题。
近年来,核主元分析(KPCA)已成为非线性过程监控领域的代表性方法,该方法利用核函数映射处理非线性优化问题。Lee等首先提出了基于KPCA的非线性监控方法,其通过构造T2和SPE统计量进行故障检测。然而,在实际应用中,传统KPCA仍存在不足:一方面,上述T2和SPE两个统计量在计算过程中将各核成分等同看待,而实际上只有某些核成分能显著突出故障信息,因此,将各核成分等同看待无法有效地体现故障信息;另一方面,传统KPCA是基于核成分服从高斯分布的假设,然而实际工业过程数据分布复杂,无法保证核成分严格服从高斯分布,因此,传统的T2和SPE的控制限并不能满足实际过程监控的需求,进而影响故障检测的效果。
发明内容
本发明针对传统KPCA方法未考虑核成分权重信息且依赖于高斯分布假设的不足,提出一种基于核主元分析的非线性工业过程故障检测方法,该方法将核成分加权技术和局部离群因子技术引入到KPCA方法中,能够更加精确地衡量工业过程数据中的非线性特征信息,提高故障检测率,进而改善故障检测结果。
为了达到上述目的,本发明提供了一种基于核主元分析的非线性工业过程故障检测方法,包括以下步骤:
(一)收集历史数据库的正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X;
(二)选择高斯核G(β,γ)作为核函数,将所述训练数据X映射到高维特征空间得到KPCA模型,利用所述KPCA模型提取所述训练数据X的非线性特征作为核成分,并为每个所述核成分确定正常阈值;
(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;
(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,并基于给定的置信水平α确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim;
(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt;
(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量;
(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h);
(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据。
作为优选,所述步骤(一)中,利用所述均值mean(Xo)和标准差std(Xo)通过公式(1)对所述训练数据Xo进行归一化处理,公式(1)的表达式为:
X=(Xo-mean(Xo))/std(Xo) (1)。
作为优选,所述步骤(二)中,选取的高斯核G(β,γ)的表达式为:
公式(2)中,G(β,γ)为高斯核函数;c为高斯核参数。
作为优选,所述步骤(二)中,提取所述训练数据X的非线性特征的具体步骤为:
对于归一化后的训练数据X=[x1,x2,…,xn]T,首先计算所述KPCA模型中的核矩阵K,所述核矩阵K中的每个元素k(i,j)的计算公式如下:
公式(3)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(4)将所述核矩阵K归一化,公式(4)的表达式如下:
公式(4)中,为归一化后的核矩阵;K为核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;
对所述核矩阵K开展公式(5)中所示的特征值分解,公式(5)的表达式为:
求解公式(5)得到个非零特征值以及与之对应的特征向量
对于所述训练数据X中在第h个采样时刻的样本xh,通过公式(6)提取对应的非线性特征作为核成分,公式(6)的表达式为:
公式(6)中,ts(h)为训练数据X中第h个采样时刻的样本xh对应的第s个核成分;kx=[k(h,1),k(h,2),...,k(h,n)]T∈Rn,为核向量;αs为求解公式(5)获得的第s个特征向量;
通过公式(7)计算每个核成分ts(h)的正常阈值,公式(7)的表达式为:
公式(7)中,为训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;tmax1(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值最大的核成分;tmax2(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值第二大的核成分。
作为优选,所述步骤(三)中,所述训练数据X对应的核主成分向量和核残差向量分别表示为:
公式(8)-(9)中,t(h)为训练数据X中第h个采样时刻的样本xh对应的核主成分向量;为训练数据X中第h个采样时刻的样本xh对应的核残差向量;p为核主成分的个数。
作为优选,所述步骤(四)中,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS的具体步骤为:
在核主成分空间PCS中,依据欧式距离为所述核主成分向量t(h)寻找L个邻居,通过公式(10)计算所述核主成分向量t(h)与它的局部邻居tl(h)的欧式距离D(t(h),tl(h)),公式(10)的表达式为:
D(t(h),tl(h))=||t(h)-tl(h)||2,1≤l≤L (10)
为所述核主成分向量t(h)的局部邻居tl(h)寻找L个邻居,通过公式(11)计算所述局部邻居tl(h)与它的第L个邻居tl,L(h)的欧式距离D(tl(h),tl,L(h)),公式(11)的表达式为:
D(tl(h),tl,L(h))=||tl(h)-tl,L(h)||2,1≤l≤L (11)
通过公式(12)计算所述核主成分向量t(h)和它的局部邻居tl(h)间的局部可达距离Rd(t(h),tl(h)),公式(12)的表达式为:
Rd(t(h),tl(h))=max{D(t(h),tl(h)),D(tl(h),tl,L(h))},1≤l≤L (12)
通过公式(13)计算所述核主成分向量t(h)的局部可达密度LRD(t(h)),公式(13)的表达式为:
通过公式(14)计算所述核主成分向量t(h)的局部离群值统计量LOFPCS,公式(14)的表达式为:
公式(14)中,LRD(tl(h))为核主成分向量t(h)的局部邻居tl(h)的局部可达密度;
同理,在核残差空间RCS中,通过公式(15)计算所述核残差向量的局部离群值统计量LOFRCS,公式(15)的表达式为:
公式(15)中,为核残差向量的局部可达密度;为核残差向量的局部邻居的局部可达密度;
所述步骤(四)中,基于给定的置信水平α,通过核密度估计方法确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim。
作为优选,所述步骤(五)中,利用所述均值mean(Xo)和标准差std(Xo)通过公式(16)对所述测试数据xnew进行归一化处理,公式(16)的表达式为:
xt=(xnew-mean(X0))/std(X0) (16)。
作为优选,所述步骤(六)中,基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量tt和核残差向量的具体步骤为:
计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)的计算公式如下:
公式(17)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(18)将所述测试核向量kt归一化,公式(18)的表达式如下:
公式(18)中,为归一化后的测试核向量;K为所述训练数据X对应的核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;
对于所述测试数据xt中在第h个采样时刻的样本xt,h,通过公式(19)从归一化后的测试核向量中提取非线性特征,公式(19)的表达式如下:
公式(19)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为归一化后的测试核向量;αs为求解公式(5)获得的第s个特征向量;
所述测试数据xt对应的核主成分向量和核残差向量分别表示为:
公式(20)-(21)中,tt(h)为测试数据xt中第h个采样时刻的样本xt,h对应的核主成分向量;为测试数据xt中第h个采样时刻的样本xt,h对应的核残差向量;p为所述步骤(三)中确定的核主成分的个数。
作为优选,所述步骤(七)中,进行加权时,所述测试数据xt的核主成分向量tt(h)和核残差向量的权值分别为:
公式(22)-(23)中,W(h)为测试数据xt中第h个采样时刻的样本xt,h的核主成分向量tt(h)的权值;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值;p为所述步骤(三)中确定的核主成分的个数;为测试数据xt中第h个采样时刻的样本xt,h对应的每个非线性特征tt,s(h)的权值,采用公式(24)计算获得,公式(24)的表达式为:
公式(24)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为步骤(二)中计算得到的训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;
所述步骤(七)中,计算所述测试数据xt对应的核主成分向量和核残差向量的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)的具体步骤为:
在核主成分空间PCS中,依据欧式距离为所述测试数据xt的核主成分向量tt(h)寻找L个邻居,通过公式(25)计算所述核主成分向量tt(h)与它的局部邻居的加权欧式距离公式(25)的表达式为:
为所述核主成分向量tt(h)的局部邻居寻找L个邻居,通过公式(26)计算所述局部邻居与它的第L个邻居的欧式距离公式(26)的表达式为:
通过公式(27)计算所述核主成分向量tt(h)和它的局部邻居间的加权局部可达距离公式(27)的表达式为:
通过公式(28)计算所述核主成分向量tt(h)的加权局部可达密度LRD(tt(h)W(h)),公式(28)的表达式为:
通过公式(29)计算所述核主成分向量tt(h)的加权局部离群值统计量WLOFPCS(h),公式(29)的表达式为:
公式(29)中,为核主成分向量tt(h)的局部邻居的局部可达密度;
同理,在核残差空间RCS中,通过公式(30)计算所述核残差向量的加权局部离群值统计量WLOFRCS(h),公式(30)的表达式为:
公式(30)中,为核残差向量的加权局部可达密度;为核残差向量的局部邻居的局部可达密度;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值。
作为优选,所述步骤(八)中,当WLOFPCS(h)≤LOFPCS,lim或WLOFRCS(h)≤LOFRCS,lim时,认为过程处于正常工况状态;否则,认为过程中出现了故障。
与现有技术相比,本发明的优点和积极效果在于:
本发明提供的基于核主元分析的非线性工业过程故障检测方法,其采用的监控统计量基于局部离群因子LOF,能有效克服传统核主元分析方法仅适用于高斯分布的缺陷。进一步,本发明中,对能体现故障信息的核成分赋以较大权值,从而使得最终的加权局部离群值统计量WLOF能更为明显的反映过程中的故障信息,进而改善故障检测结果,提高故障检测率。
附图说明
图1为本发明实施例所提供的基于核主元分析的非线性工业过程故障检测方法的流程框图;
图2(a)-(c)为本发明实施例一所提供的对非线性数值系统的故障监控结果示意图,其中,图2(a)采用的是KPCA方法,图2(b)采用的是LOF-KPCA方法,图2(c)采用的是本发明提供的WLOF-KPCA方法;
图3为本发明实施例二所提供的田纳西-伊斯曼(TE)过程的结构图;
图4为本发明实施例二所提供的对田纳西-伊斯曼(TE)过程中故障5的监控结果示意图,其中,图4(a)采用的是KPCA方法,图4(b)采用的是LOF-KPCA方法,图4(c)采用的是本发明提供的WLOF-KPCA方法;
图5为本发明实施例二所提供的对田纳西-伊斯曼(TE)过程中故障10的监控结果示意图,其中,图5(a)采用的是KPCA方法,图5(b)采用的是LOF-KPCA方法,图5(c)采用的是本发明提供的WLOF-KPCA方法。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明实施例提供了一种基于核主元分析的非线性工业过程故障检测方法,包括以下步骤:
(一)收集历史数据库的正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X;
(二)选择高斯核G(β,γ)作为核函数,将所述训练数据X映射到高维特征空间得到KPCA模型,利用所述KPCA模型提取所述训练数据X的非线性特征作为核成分,并为每个所述核成分确定正常阈值;
(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;
(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,并基于给定的置信水平α确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim;
(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt;
(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量;
(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h);
(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据。
上述方法中,步骤(一)至(四)为离线建模阶段,步骤(五)至(八)为在线监控阶段。需要说明的是,本发明在线监控阶段依然采用离线建模阶段的正常数据训练集所求的控制限的依据为:在线监控阶段计算加权局部离群值统计量是在连续两个采样时刻某核成分超出其正常范围时实际实施的,而步骤(二)中为每个所述核成分确定的正常阈值相对来说较为宽泛,因此在工程意义下,在线监控时对于正常样本依然不会出现远超置信度范围的误报率。
实施例一:以非线性数值系统为例进行说明。仿真一个具有六个监控变量[x1,x2,x3,x4,x5,x6]的非线性数值系统,其数学描述如下:
x1=r1+e1 (31)
x2=r2+e2
x3=2r1+3r2+e3
x4=5r1-2r2+e4
x5=r1 2-3r2+e5
x6=-r1 3+3r2 2+e6
公式(31)中,e1,e2,e3,e4,e5,e6∈N(0,0.01)表示六个相互独立的高斯噪声变量,r1,r2∈[0,2]是独立的均匀分布随机变量,系统的输出[x1,x2,x3,x4,x5,x6]作为过程监控变量。在公式(31)所示的正常操作工况下仿真400个样本作为用于建模的训练数据。为了产生故障数据,在仿真过程的第201个时刻对变量x6添加幅值为8的正弦波动,并使故障一直持续到第400个时刻仿真结束为止。
对上述非线性数值系统的故障进行检测,含有以下步骤:
(一)收集正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)通过公式(1)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X,公式(1)的表达式为:
X=(Xo-mean(Xo))/std(Xo) (1)。
(二)对于归一化后的训练数据X=[x1,x2,…,xn]T,首先计算所述KPCA模型中的核矩阵K,所述核矩阵K中的每个元素k(i,j)的计算公式如下:
公式(3)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(4)将所述核矩阵K归一化,公式(4)的表达式如下:
公式(4)中,为归一化后的核矩阵;K为核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;
对所述核矩阵K开展公式(5)中所示的特征值分解,公式(5)的表达式为:
求解公式(5)得到个非零特征值以及与之对应的特征向量
对于所述训练数据X中在第h个采样时刻的样本xh,通过公式(6)提取对应的非线性特征作为核成分,公式(6)的表达式为:
公式(6)中,ts(h)为训练数据X中第h个采样时刻的样本xh对应的第s个核成分;kx=[k(h,1),k(h,2),...,k(h,n)]T∈Rn,为核向量;αs为求解公式(5)获得的第s个特征向量;
通过公式(7)计算每个核成分ts(h)的正常阈值,公式(7)的表达式为:
公式(7)中,为训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;tmax1(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值最大的核成分;tmax2(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值第二大的核成分。
(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;所述训练数据X对应的核主成分向量和核残差向量分别表示为:
公式(8)-(9)中,t(h)为训练数据X中第h个采样时刻的样本xh对应的核主成分向量;为训练数据X中第h个采样时刻的样本xh对应的核残差向量;p为核主成分的个数。
(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,具体步骤如下:
在核主成分空间PCS中,依据欧式距离为所述核主成分向量t(h)寻找L个邻居,通过公式(10)计算所述核主成分向量t(h)与它的局部邻居tl(h)的欧式距离D(t(h),tl(h)),公式(10)的表达式为:
D(t(h),tl(h))=||t(h)-tl(h)||2,1≤l≤L (10)
为所述核主成分向量t(h)的局部邻居tl(h)寻找L个邻居,通过公式(11)计算所述局部邻居tl(h)与它的第L个邻居tl,L(h)的欧式距离D(tl(h),tl,L(h)),公式(11)的表达式为:
D(tl(h),tl,L(h))=||tl(h)-tl,L(h)||2,1≤l≤L (11)
通过公式(12)计算所述核主成分向量t(h)和它的局部邻居tl(h)间的局部可达距离Rd(t(h),tl(h)),公式(12)的表达式为:
Rd(t(h),tl(h))=max{D(t(h),tl(h)),D(tl(h),tl,L(h))},1≤l≤L (12)
通过公式(13)计算所述核主成分向量t(h)的局部可达密度LRD(t(h)),公式(13)的表达式为:
通过公式(14)计算所述核主成分向量t(h)的局部离群值统计量LOFPCS,公式(14)的表达式为:
公式(14)中,LRD(tl(h))为核主成分向量t(h)的局部邻居tl(h)的局部可达密度;
同理,在核残差空间RCS中,通过公式(15)计算所述核残差向量的局部离群值统计量LOFRCS,公式(15)的表达式为:
公式(15)中,为核残差向量的局部可达密度;为核残差向量的局部邻居的局部可达密度;
基于给定的置信水平α,通过核密度估计方法确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim。
(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)通过公式(16)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt,公式(16)的表达式为:
xt=(xnew-mean(X0))/std(X0) (16)。
(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量,具体步骤为:
计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)的计算公式如下:
公式(17)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(18)将所述测试核向量kt归一化,公式(18)的表达式如下:
公式(18)中,为归一化后的测试核向量;K为所述训练数据X对应的核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;
对于所述测试数据xt中在第h个采样时刻的样本xt,h,通过公式(19)从归一化后的测试核向量中提取非线性特征,公式(19)的表达式如下:
公式(19)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为归一化后的测试核向量;αs为求解公式(5)获得的第s个特征向量;
所述测试数据xt对应的核主成分向量和核残差向量分别表示为:
公式(20)-(21)中,tt(h)为测试数据xt中第h个采样时刻的样本xt,h对应的核主成分向量;为测试数据xt中第h个采样时刻的样本xt,h对应的核残差向量;p为所述步骤(三)中确定的核主成分的个数。
(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,其中,进行加权时,所述测试数据xt的核主成分向量tt(h)和核残差向量的权值分别为:
公式(22)-(23)中,W(h)为测试数据xt中第h个采样时刻的样本xt,h的核主成分向量tt(h)的权值;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值;p为所述步骤(三)中确定的核主成分的个数;为测试数据xt中第h个采样时刻的样本xt,h对应的每个非线性特征tt,s(h)的权值,采用公式(24)计算获得,公式(24)的表达式为:
公式(24)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为步骤(二)中计算得到的训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值。
通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h),具体步骤为:
在核主成分空间PCS中,依据欧式距离为所述测试数据xt的核主成分向量tt(h)寻找L个邻居,通过公式(25)计算所述核主成分向量tt(h)与它的局部邻居的加权欧式距离公式(25)的表达式为:
为所述核主成分向量tt(h)的局部邻居寻找L个邻居,通过公式(26)计算所述局部邻居与它的第L个邻居的欧式距离公式(26)的表达式为:
通过公式(27)计算所述核主成分向量tt(h)和它的局部邻居间的加权局部可达距离公式(27)的表达式为:
通过公式(28)计算所述核主成分向量tt(h)的加权局部可达密度LRD(tt(h)W(h)),公式(28)的表达式为:
通过公式(29)计算所述核主成分向量tt(h)的加权局部离群值统计量WLOFPCS(h),公式(29)的表达式为:
公式(29)中,为核主成分向量tt(h)的局部邻居的局部可达密度;
同理,在核残差空间RCS中,通过公式(30)计算所述核残差向量的加权局部离群值统计量WLOFRCS(h),公式(30)的表达式为:
公式(30)中,为核残差向量的加权局部可达密度;为核残差向量的局部邻居的局部可达密度;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值。
(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据,具体判断标准为:当WLOFPCS(h)≤LOFPCS,lim或WLOFRCS(h)≤LOFRCS,lim时,认为过程处于正常工况状态;否则,认为过程中出现了故障。
检测到故障发生后,为了评价不同检测方法的故障检测效果,通过故障漏报率(MDR)指标进行不同方法的故障检测效果对比。故障漏报率(MDR)定义为未被检测出的故障数据与实际总的故障数据之比。很显然,MDR的数值越小,意味着过程监控方法的故障检测效果越好;反之,过程监控方法的故障检测效果越差。
在本实施例的非线性数值系统仿真中,本发明采用基于加权局部离群因子的核主元分析(WLOF-KPCA)方法,其中,步骤(二)中,高斯核G(β,γ)的高斯核参数c选为5m,其中m是变量个数;高维特征空间维数为特征值的累加和超过总体特征值和99.99%的个数,在本实施例中,高维特征空间维数具体为18。步骤(三)中,核主成分的个数p通过特征值的累加和贡献率和平均特征值方法求得,最终核主成分的个数p确定为两种方法结果的平均值,在本实施例中,核主成分的个数p具体为4。步骤(四)中,计算局部离群值统计量LOFPCS和LOFRCS中的邻域参数L确定为15,确定控制限LOFPCS,lim和LOFRCS,lim时的置信水平α为99%。
采用传统核主元分析法(KPCA)和基于局部离群因子的核主元分析法(LOF-KPCA)与本发明的方法进行对比,三种方法的故障漏报率(MDR)的比较结果参见表1。
表1 KPCA、LOF-KPCA和WLOF-KPCA三种方法的故障漏报率结果
图2(a)-(c)分别给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对故障的监控结果。从图2(a)中可以看出,传统KPCA方法的T2统计量很难检出故障而SPE统计量的监控结果也不理想,两者的故障漏报率分别为0.98和0.82。根据图2(b)、图2(c)以及表1,可以看出,与KPCA方法相比,基于LOF统计量的LOF-KPCA方法和WLOF-KPCA方法获得了更好的监控效果。具体来说,对于在核主成分空间PCS的监控结果,两个统计量LOFPCS和WLOFPCS拥有同样的故障检测结果,故障漏报率均为0.815。对于在核残差空间RCS的监控结果,由图2(b)可见,LOFRCS统计量能够在第252个时刻检出故障,故障漏报率降为0.395;然而,由图2(c)可见,通过加入对不同核成分的权值处理,WLOFRCS统计量能够在第205个时刻给出故障报警信号,其故障漏报率进一步降低为0.135。由此可见,本发明提供的WLOF-KPCA方法提供了最佳的故障检测性能。
实施实例二:田纳西-伊斯曼(TE)过程是由美国伊斯曼化学公司的Downs和Vogel根据一个实际的化工过程建立的实验平台,现被广泛用于验证控制算法和过程监控方法的优劣。TE过程主要由五个单元组成,包括反应器、产品冷凝器、气液分离器、循环压缩机和汽提塔组成,其结构图如图3所示。TE过程共53个变量,其中包括22个连续测量变量、19个成分变量和12个操作变量,本实施例采用TE过程中的33个变量,具体如表2所示。本实施例中采用的21个故障如表3所示,用来验证各方法的监控性能。
表2本实施例采用的TE过程的33个变量
变量标号 | 变量描述 | 变量标号 | 变量描述 |
1 | A进料(流1) | 18 | 汽提器温度 |
2 | D进料(流2) | 19 | 汽提器流量 |
3 | E进料(流3) | 20 | 压缩机功率 |
4 | A和C进料(流4) | 21 | 反应器冷却水出口温度 |
5 | 再循环流量(流8) | 22 | 分离器冷却水出口温度 |
6 | 反应器进料速度(流6) | 23 | D进料量(流2) |
7 | 反应器压力 | 24 | E进料量(流3) |
8 | 反应器等级 | 25 | A进料量(流1) |
9 | 反应器温度 | 26 | A和C料量(流4) |
10 | 放空速率 | 27 | 压缩机再循环阀 |
11 | 产品分离器温度 | 28 | 放空阀 |
12 | 产品分离器液位 | 29 | 分离器罐液流量(流10) |
13 | 产品分离器压力 | 30 | 汽提器液体产品流量(流11) |
14 | 产品分离器塔底流量(流10) | 31 | 汽提器水流阀 |
15 | 汽提器等级 | 32 | 反应器冷水流量 |
16 | 汽提器压力 | 33 | 冷凝器冷水流量 |
17 | 汽提器塔底流量(流11) |
表3本实施例采用的21个故障
针对上述TE过程的故障进行检索,含有以下步骤:
(一)收集正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)通过公式(1)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X,公式(1)的表达式为:
X=(Xo-mean(Xo))/std(Xo) (1)。
(二)对于归一化后的训练数据X=[x1,x2,…,xn]T,首先计算所述KPCA模型中的核矩阵K,所述核矩阵K中的每个元素k(i,j)的计算公式如下:
公式(3)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(4)将所述核矩阵K归一化,公式(4)的表达式如下:
公式(4)中,为归一化后的核矩阵;K为核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;
对所述核矩阵K开展公式(5)中所示的特征值分解,公式(5)的表达式为:
求解公式(5)得到个非零特征值以及与之对应的特征向量
对于所述训练数据X中在第h个采样时刻的样本xh,通过公式(6)提取对应的非线性特征作为核成分,公式(6)的表达式为:
公式(6)中,ts(h)为训练数据X中第h个采样时刻的样本xh对应的第s个核成分;kx=[k(h,1),k(h,2),...,k(h,n)]T∈Rn,为核向量;αs为求解公式(5)获得的第s个特征向量;
通过公式(7)计算每个核成分ts(h)的正常阈值,公式(7)的表达式为:
公式(7)中,为训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;tmax1(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值最大的核成分;tmax2(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值第二大的核成分。
(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;所述训练数据X对应的核主成分向量和核残差向量分别表示为:
公式(8)-(9)中,t(h)为训练数据X中第h个采样时刻的样本xh对应的核主成分向量;为训练数据X中第h个采样时刻的样本xh对应的核残差向量;p为核主成分的个数。
(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,具体步骤如下:
在核主成分空间PCS中,依据欧式距离为所述核主成分向量t(h)寻找L个邻居,通过公式(10)计算所述核主成分向量t(h)与它的局部邻居tl(h)的欧式距离D(t(h),tl(h)),公式(10)的表达式为:
D(t(h),tl(h))=||t(h)-tl(h)||2,1≤l≤L (10)
为所述核主成分向量t(h)的局部邻居tl(h)寻找L个邻居,通过公式(11)计算所述局部邻居tl(h)与它的第L个邻居tl,L(h)的欧式距离D(tl(h),tl,L(h)),公式(11)的表达式为:
D(tl(h),tl,L(h))=||tl(h)-tl,L(h)||2,1≤l≤L (11)
通过公式(12)计算所述核主成分向量t(h)和它的局部邻居tl(h)间的局部可达距离Rd(t(h),tl(h)),公式(12)的表达式为:
Rd(t(h),tl(h))=max{D(t(h),tl(h)),D(tl(h),tl,L(h))},1≤l≤L (12)
通过公式(13)计算所述核主成分向量t(h)的局部可达密度LRD(t(h)),公式(13)的表达式为:
通过公式(14)计算所述核主成分向量t(h)的局部离群值统计量LOFPCS,公式(14)的表达式为:
公式(14)中,LRD(tl(h))为核主成分向量t(h)的局部邻居tl(h)的局部可达密度;
同理,在核残差空间RCS中,通过公式(15)计算所述核残差向量的局部离群值统计量LOFRCS,公式(15)的表达式为:
公式(15)中,为核残差向量的局部可达密度;为核残差向量的局部邻居的局部可达密度;
基于给定的置信水平α,通过核密度估计方法确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim。
(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)通过公式(16)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt,公式(16)的表达式为:
xt=(xnew-mean(X0))/std(X0) (16)。
(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量,具体步骤为:
计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)的计算公式如下:
公式(17)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(18)将所述测试核向量kt归一化,公式(18)的表达式如下:
公式(18)中,为归一化后的测试核向量;K为所述训练数据X对应的核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;
对于所述测试数据xt中在第h个采样时刻的样本xt,h,通过公式(19)从归一化后的测试核向量中提取非线性特征,公式(19)的表达式如下:
公式(19)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为归一化后的测试核向量;αs为求解公式(5)获得的第s个特征向量;
所述测试数据xt对应的核主成分向量和核残差向量分别表示为:
公式(20)-(21)中,tt(h)为测试数据xt中第h个采样时刻的样本xt,h对应的核主成分向量;为测试数据xt中第h个采样时刻的样本xt,h对应的核残差向量;p为所述步骤(三)中确定的核主成分的个数。
(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,其中,进行加权时,所述测试数据xt的核主成分向量tt(h)和核残差向量的权值分别为:
公式(22)-(23)中,W(h)为测试数据xt中第h个采样时刻的样本xt,h的核主成分向量tt(h)的权值;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值;p为所述步骤(三)中确定的核主成分的个数;为测试数据xt中第h个采样时刻的样本xt,h对应的每个非线性特征tt,s(h)的权值,采用公式(24)计算获得,公式(24)的表达式为:
公式(24)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为步骤(二)中计算得到的训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值。
通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h),具体步骤为:
在核主成分空间PCS中,依据欧式距离为所述测试数据xt的核主成分向量tt(h)寻找L个邻居,通过公式(25)计算所述核主成分向量tt(h)与它的局部邻居的加权欧式距离公式(25)的表达式为:
为所述核主成分向量tt(h)的局部邻居寻找L个邻居,通过公式(26)计算所述局部邻居与它的第L个邻居的欧式距离公式(26)的表达式为:
通过公式(27)计算所述核主成分向量tt(h)和它的局部邻居间的加权局部可达距离公式(27)的表达式为:
通过公式(28)计算所述核主成分向量tt(h)的加权局部可达密度LRD(tt(h)W(h)),公式(28)的表达式为:
通过公式(29)计算所述核主成分向量tt(h)的加权局部离群值统计量WLOFPCS(h),公式(29)的表达式为:
公式(29)中,为核主成分向量tt(h)的局部邻居的局部可达密度;
同理,在核残差空间RCS中,通过公式(30)计算所述核残差向量的加权局部离群值统计量WLOFRCS(h),公式(30)的表达式为:
公式(30)中,为核残差向量的加权局部可达密度;为核残差向量的局部邻居的局部可达密度;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值。
(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据,具体判断标准为:当WLOFPCS(h)≤LOFPCS,lim或WLOFRCS(h)≤LOFRCS,lim时,认为过程处于正常工况状态;否则,认为过程中出现了故障。
在本实施例中,步骤(二)中,高斯核G(β,γ)的高斯核参数c选为500m,其中m是变量个数;其余步骤中的参数设置同实施例一。
采用传统核主元分析法(KPCA)和基于局部离群因子的核主元分析法(LOF-KPCA)与本发明的方法进行对比,以故障5和故障10为例说明故障检测效果。
故障5由冷凝器冷却水进料温度产生的阶跃变化引起。图4(a)-(c)分别给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对故障5的监控结果。根据图4(a)可以看出,传统KPCA方法的T2统计量和SPE统计量均在第161个时刻检出故障,然而两个统计量在第350个时刻后又处于控制限以下,这会给现场工程师提供错误的信号。与之相比,虽然图4(b)中LOFPCS统计量没有太明显的改善,但是LOFPCS统计量能够成功检出该故障并一直持续到末尾时刻。同样的,WLOF-KPCA方法的两个统计量亦能成功给出持续的故障信号,尤其是WLOFRCS统计量,报警信号非常明显。
故障10是由进料C的温度(流4)产生随机波动引起的。图5(a)-(c)分别给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对故障10的监控结果。根据图5(a)可以看出,传统KPCA方法的SPE统计量在第192个时刻检出故障,然而大量样本点被认为处于正常状态。两个统计量T2和SPE的故障漏报率分别为0.66和0.371,监控效果较差。作为对比,图5(b)中LOF-KPCA方法的LOFRCS统计量在第185个时刻检出故障,并且两个统计量LOFPCS和LOFRCS的故障漏报率分别降为0.619和0.169,监控性能有了明显提高。由图5(c)可见,通过对不同核成分进行加权,WLOF-KCPA方法获得了更优秀的监控效果,两个统计量WLOFPCS和WLOFRCS的故障漏报率进一步降低为0.56和0.135。因此,本发明所提的WLOF-KPCA能够改善对TE过程故障10的故障检测性能。
表4给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对于TE过程21种故障的故障漏报率。从表4可以看出,传统KPCA方法对于故障5、10、16、19、20和21不能给不满意的监控效果。通过结合LOF技术的LOF-KPCA方法对于这六种故障能获得明显的改善。本发明提供的基于核主元分析的非线性工业过程故障检测方法,在结合LOF技术的基础上,进一步地对不同核成分加权以突出故障信息,能进一步改善监控性能。综合以上分析,本发明提供这种基于加权局部离群因子的核主元分析(WLOF-KPCA)的非线性工业过程故障检测方法,其故障检测效果明显优于KPCA方法和LOF-KPCA方法。
表4 KPCA、LOF-KPCA和WLOF-KPCA对TE过程故障的故障漏报率
Claims (10)
1.基于核主元分析的非线性工业过程故障检测方法,其特征在于,包括以下步骤:
(一)收集历史数据库的正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X;
(二)选择高斯核G(β,γ)作为核函数,将所述训练数据X映射到高维特征空间得到KPCA模型,利用所述KPCA模型提取所述训练数据X的非线性特征作为核成分,并为每个所述核成分确定正常阈值;
(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;
(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,并基于给定的置信水平α确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim;
(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt;
(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量;
(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h);
(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据。
2.根据权利要求1所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:所述步骤(一)中,利用所述均值mean(Xo)和标准差std(Xo)通过公式(1)对所述训练数据Xo进行归一化处理,公式(1)的表达式为:
X=(Xo-mean(Xo))/std(Xo) (1)。
3.根据权利要求1所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:所述步骤(二)中,选取的高斯核G(β,γ)的表达式为:
公式(2)中,G(β,γ)为高斯核函数;c为高斯核参数。
4.根据权利要求3所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:所述步骤(二)中,提取所述训练数据X的非线性特征的具体步骤为:
对于归一化后的训练数据X=[x1,x2,…,xn]T,首先计算所述KPCA模型中的核矩阵K,所述核矩阵K中的每个元素k(i,j)的计算公式如下:
公式(3)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(4)将所述核矩阵K归一化,公式(4)的表达式如下:
公式(4)中,为归一化后的核矩阵;K为核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;
对所述核矩阵K开展公式(5)中所示的特征值分解,公式(5)的表达式为:
求解公式(5)得到个非零特征值以及与之对应的特征向量
对于所述训练数据X中在第h个采样时刻的样本xh,通过公式(6)提取对应的非线性特征作为核成分,公式(6)的表达式为:
公式(6)中,ts(h)为训练数据X中第h个采样时刻的样本xh对应的第s个核成分;kx=[k(h,1),k(h,2),...,k(h,n)]T∈Rn,为核向量;αs为求解公式(5)获得的第s个特征向量;
通过公式(7)计算每个核成分ts(h)的正常阈值,公式(7)的表达式为:
公式(7)中,为训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;tmax1(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值最大的核成分;tmax2(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值第二大的核成分。
5.根据权利要求4所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:所述步骤(三)中,所述训练数据X对应的核主成分向量和核残差向量分别表示为:
公式(8)-(9)中,t(h)为训练数据X中第h个采样时刻的样本xh对应的核主成分向量;为训练数据X中第h个采样时刻的样本xh对应的核残差向量;p为核主成分的个数。
6.根据权利要求5所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:
所述步骤(四)中,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS的具体步骤为:
在核主成分空间PCS中,依据欧式距离为所述核主成分向量t(h)寻找L个邻居,通过公式(10)计算所述核主成分向量t(h)与它的局部邻居tl(h)的欧式距离D(t(h),tl(h)),公式(10)的表达式为:
D(t(h),tl(h))=||t(h)-tl(h)||2,1≤l≤L (10)
为所述核主成分向量t(h)的局部邻居tl(h)寻找L个邻居,通过公式(11)计算所述局部邻居tl(h)与它的第L个邻居tl,L(h)的欧式距离D(tl(h),tl,L(h)),公式(11)的表达式为:
D(tl(h),tl,L(h))=||tl(h)-tl,L(h)||2,1≤l≤L (11)
通过公式(12)计算所述核主成分向量t(h)和它的局部邻居tl(h)间的局部可达距离Rd(t(h),tl(h)),公式(12)的表达式为:
Rd(t(h),tl(h))=max{D(t(h),tl(h)),D(tl(h),tl,L(h))},1≤l≤L (12)
通过公式(13)计算所述核主成分向量t(h)的局部可达密度LRD(t(h)),公式(13)的表达式为:
通过公式(14)计算所述核主成分向量t(h)的局部离群值统计量LOFPCS,公式(14)的表达式为:
公式(14)中,LRD(tl(h))为核主成分向量t(h)的局部邻居tl(h)的局部可达密度;
同理,在核残差空间RCS中,通过公式(15)计算所述核残差向量的局部离群值统计量LOFRCS,公式(15)的表达式为:
公式(15)中,为核残差向量的局部可达密度;为核残差向量的局部邻居的局部可达密度;
所述步骤(四)中,基于给定的置信水平α,通过核密度估计方法确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim。
7.根据权利要求1所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:所述步骤(五)中,利用所述均值mean(Xo)和标准差std(Xo)通过公式(16)对所述测试数据xnew进行归一化处理,公式(16)的表达式为:
xt=(xnew-mean(X0))/std(X0) (16)。
8.根据权利要求5所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于,所述步骤(六)中,基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量tt和核残差向量的具体步骤为:
计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)的计算公式如下:
公式(17)中,n为所述训练数据X的样本数;c为高斯核参数;
通过公式(18)将所述测试核向量kt归一化,公式(18)的表达式如下:
公式(18)中,为归一化后的测试核向量;K为所述训练数据X对应的核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;
对于所述测试数据xt中在第h个采样时刻的样本xt,h,通过公式(19)从归一化后的测试核向量中提取非线性特征,公式(19)的表达式如下:
公式(19)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为归一化后的测试核向量;αs为求解公式(5)获得的第s个特征向量;
所述测试数据xt对应的核主成分向量和核残差向量分别表示为:
公式(20)-(21)中,tt(h)为测试数据xt中第h个采样时刻的样本xt,h对应的核主成分向量;为测试数据xt中第h个采样时刻的样本xt,h对应的核残差向量;p为所述步骤(三)中确定的核主成分的个数。
9.根据权利要求8所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:
所述步骤(七)中,进行加权时,所述测试数据xt的核主成分向量tt(h)和核残差向量的权值分别为:
公式(22)-(23)中,W(h)为测试数据xt中第h个采样时刻的样本xt,h的核主成分向量tt(h)的权值;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值;p为所述步骤(三)中确定的核主成分的个数;为测试数据xt中第h个采样时刻的样本xt,h对应的每个非线性特征tt,s(h)的权值,采用公式(24)计算获得,公式(24)的表达式为:
公式(24)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为步骤(二)中计算得到的训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;
所述步骤(七)中,计算所述测试数据xt对应的核主成分向量和核残差向量的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)的具体步骤为:
在核主成分空间PCS中,依据欧式距离为所述测试数据xt的核主成分向量tt(h)寻找L个邻居,通过公式(25)计算所述核主成分向量tt(h)与它的局部邻居的加权欧式距离公式(25)的表达式为:
为所述核主成分向量tt(h)的局部邻居寻找L个邻居,通过公式(26)计算所述局部邻居与它的第L个邻居的欧式距离公式(26)的表达式为:
通过公式(27)计算所述核主成分向量tt(h)和它的局部邻居间的加权局部可达距离公式(27)的表达式为:
通过公式(28)计算所述核主成分向量tt(h)的加权局部可达密度LRD(tt(h)W(h)),公式(28)的表达式为:
通过公式(29)计算所述核主成分向量tt(h)的加权局部离群值统计量WLOFPCS(h),公式(29)的表达式为:
公式(29)中,为核主成分向量tt(h)的局部邻居的局部可达密度;
同理,在核残差空间RCS中,通过公式(30)计算所述核残差向量的加权局部离群值统计量WLOFRCS(h),公式(30)的表达式为:
公式(30)中,为核残差向量的加权局部可达密度;为核残差向量的局部邻居的局部可达密度;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值。
10.根据权利要求9所述的基于核主元分析的非线性工业过程故障检测方法,其特征在于:所述步骤(八)中,当WLOFPCS(h)≤LOFPCS,lim或WLOFRCS(h)≤LOFRCS,lim时,认为过程处于正常工况状态;否则,认为过程中出现了故障。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710991994.1A CN107544477B (zh) | 2017-10-23 | 2017-10-23 | 基于核主元分析的非线性工业过程故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710991994.1A CN107544477B (zh) | 2017-10-23 | 2017-10-23 | 基于核主元分析的非线性工业过程故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107544477A CN107544477A (zh) | 2018-01-05 |
CN107544477B true CN107544477B (zh) | 2019-05-31 |
Family
ID=60967327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710991994.1A Expired - Fee Related CN107544477B (zh) | 2017-10-23 | 2017-10-23 | 基于核主元分析的非线性工业过程故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107544477B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108490908B (zh) * | 2018-02-11 | 2019-10-15 | 浙江大学 | 一种面向百万千瓦超超临界机组变工况运行的动态分布式监测方法 |
CN108549908B (zh) * | 2018-04-13 | 2021-07-02 | 浙江科技学院 | 基于多采样概率核主成分模型的化工过程故障检测方法 |
CN108919755B (zh) * | 2018-06-11 | 2020-06-16 | 宁波大学 | 一种基于多块非线性交叉关系模型的分布式故障检测方法 |
CN108830006B (zh) * | 2018-06-27 | 2022-02-18 | 中国石油大学(华东) | 基于线性评价因子的线性-非线性工业过程故障检测方法 |
CN109214355B (zh) * | 2018-09-29 | 2020-05-15 | 西安交通大学 | 一种基于核估计lof的机械监测数据异常段检测方法 |
CN109901557B (zh) * | 2019-03-28 | 2021-06-22 | 山东科技大学 | 一种基于数据域描述的可变控制限故障检测方法 |
CN110298765B (zh) * | 2019-05-31 | 2024-02-02 | 国网上海市电力公司 | 一种基于客观关联因素的配电网用电功率异常检测方法 |
CN110130875B (zh) * | 2019-06-20 | 2022-07-12 | 中国石油大学(华东) | 抽油机异常工况监控方法 |
CN110687895B (zh) * | 2019-10-24 | 2022-11-18 | 上海工程技术大学 | 一种基于自适应核主成分分析的化工过程故障检测方法 |
CN111121943B (zh) * | 2019-12-13 | 2021-05-18 | 湖南师范大学 | 零点故障检测方法、装置、计算机设备和可读存储介质 |
CN111460392B (zh) * | 2020-06-11 | 2020-09-15 | 中国人民解放军国防科技大学 | 一种磁悬浮列车及其列车的悬浮系统故障检测方法和系统 |
CN111913447B (zh) * | 2020-06-13 | 2022-03-18 | 宁波大学 | 一种在线数据驱动的非线性化工过程监测方法 |
CN113359665B (zh) * | 2021-05-31 | 2022-11-18 | 上海工程技术大学 | 一种基于加权关键主元的工业过程故障检测方法及系统 |
CN115047853B (zh) * | 2022-06-27 | 2023-06-06 | 中国人民解放军海军航空大学 | 基于递推规范变量残差和核主元分析的微小故障检测方法 |
CN115221652A (zh) * | 2022-07-16 | 2022-10-21 | 天津布尔科技有限公司 | 一种发动机中冷器故障预测方法、装置及存储介质 |
CN117928918B (zh) * | 2024-01-24 | 2024-07-23 | 南通大学 | 一种基于局部异常核熵成分分析的冷水机组故障检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158873A (zh) * | 2007-09-26 | 2008-04-09 | 东北大学 | 一种非线性过程故障诊断方法 |
CN101169623A (zh) * | 2007-11-22 | 2008-04-30 | 东北大学 | 基于核主元分析贡献图的非线性过程故障辨识方法 |
CN103901880A (zh) * | 2014-04-01 | 2014-07-02 | 浙江大学 | 基于多分类器和d-s证据融合的工业过程故障检测方法 |
CN104532299A (zh) * | 2015-01-20 | 2015-04-22 | 重庆科技学院 | 基于相对核主元分析的铝电解槽况诊断方法 |
CN106338981A (zh) * | 2016-09-23 | 2017-01-18 | 沈阳化工大学 | 动态多向局部离群因子算法的间歇过程在线故障检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130197854A1 (en) * | 2012-01-30 | 2013-08-01 | Siemens Corporation | System and method for diagnosing machine tool component faults |
-
2017
- 2017-10-23 CN CN201710991994.1A patent/CN107544477B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158873A (zh) * | 2007-09-26 | 2008-04-09 | 东北大学 | 一种非线性过程故障诊断方法 |
CN101169623A (zh) * | 2007-11-22 | 2008-04-30 | 东北大学 | 基于核主元分析贡献图的非线性过程故障辨识方法 |
CN103901880A (zh) * | 2014-04-01 | 2014-07-02 | 浙江大学 | 基于多分类器和d-s证据融合的工业过程故障检测方法 |
CN104532299A (zh) * | 2015-01-20 | 2015-04-22 | 重庆科技学院 | 基于相对核主元分析的铝电解槽况诊断方法 |
CN106338981A (zh) * | 2016-09-23 | 2017-01-18 | 沈阳化工大学 | 动态多向局部离群因子算法的间歇过程在线故障检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107544477A (zh) | 2018-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107544477B (zh) | 基于核主元分析的非线性工业过程故障检测方法 | |
CN108803520B (zh) | 一种基于变量非线性自相关性剔除的动态过程监测方法 | |
CN101446831B (zh) | 一种分散的过程监测方法 | |
CN104699077B (zh) | 一种基于嵌套迭代费舍尔判别分析的故障变量隔离方法 | |
CN108508865B (zh) | 一种基于分散式osc-pls回归模型的故障检测方法 | |
CN108492000A (zh) | 一种面向百万千瓦超超临界机组非平稳故障特性的在线故障诊断方法 | |
CN106940808A (zh) | 一种基于改进型主元分析模型的故障检测方法 | |
CN110245460B (zh) | 一种基于多阶段oica的间歇过程故障监测方法 | |
WO2021114320A1 (zh) | 一种oica和rnn融合模型的污水处理过程故障监测方法 | |
CN110687895B (zh) | 一种基于自适应核主成分分析的化工过程故障检测方法 | |
CN110262450A (zh) | 面向汽轮机的多种故障特性协同分析的故障预测方法 | |
CN109298633A (zh) | 基于自适应分块非负矩阵分解的化工生产过程故障监测方法 | |
CN108388234A (zh) | 一种基于相关性划分多变量块pca模型的故障监测方法 | |
CN108830006B (zh) | 基于线性评价因子的线性-非线性工业过程故障检测方法 | |
CN108375965A (zh) | 一种基于多变量块交叉相关性剔除的非高斯过程监测方法 | |
CN109507972A (zh) | 基于分层式非高斯监测算法的工业生产过程故障监测方法 | |
CN108445867A (zh) | 一种基于分散式icr模型的非高斯过程监测方法 | |
CN108052954A (zh) | 基于多级高维特征的样本空间的故障诊断方法 | |
CN110119579B (zh) | 一种基于oica的复杂工业过程故障监测方法 | |
CN108181893B (zh) | 一种基于pca-kdr的故障检测方法 | |
Wang et al. | Joint-individual monitoring of large-scale chemical processes with multiple interconnected operation units incorporating multiset CCA | |
CN108572639A (zh) | 一种基于主成分自相关性剔除的动态过程监测方法 | |
CN114429173A (zh) | 一种基于支持向量数据描述的转子系统异常检测方法 | |
CN111983994B (zh) | 一种基于复杂工业化工过程的v-pca故障诊断方法 | |
CN105759787B (zh) | 一种基于切换有监督线性动态系统模型的故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190531 |