CN108830006B - 基于线性评价因子的线性-非线性工业过程故障检测方法 - Google Patents

基于线性评价因子的线性-非线性工业过程故障检测方法 Download PDF

Info

Publication number
CN108830006B
CN108830006B CN201810679472.2A CN201810679472A CN108830006B CN 108830006 B CN108830006 B CN 108830006B CN 201810679472 A CN201810679472 A CN 201810679472A CN 108830006 B CN108830006 B CN 108830006B
Authority
CN
China
Prior art keywords
linear
formula
block
spe
statistic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810679472.2A
Other languages
English (en)
Other versions
CN108830006A (zh
Inventor
邓晓刚
邓佳伟
王磊
曹玉苹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201810679472.2A priority Critical patent/CN108830006B/zh
Publication of CN108830006A publication Critical patent/CN108830006A/zh
Application granted granted Critical
Publication of CN108830006B publication Critical patent/CN108830006B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种基于线性评价因子的线性‑非线性工业过程故障检测方法。其步骤为:首先对训练数据和测试数据进行归一化处理;其次,定义线性评价因子LEF(xi,xj),通过线性评价因子LEF(xi,xj)衡量变量间不同的相关性,借助线性评价因子划分出工业过程中的线性块和非线性块,能够更细致地描述局部变量的相关性;在此基础上,在不同子块分别建立PCA模型、KPCA模型,并融合所有块的信息,通过融合后的统计量判断是否发生故障,进而改善故障检测结果,提高故障检测率。

Description

基于线性评价因子的线性-非线性工业过程故障检测方法
技术领域
本发明属于复杂工业过程故障检测技术领域,涉及一种基于线性评价因子(linear evaluating factor,简称LEF)的线性-非线性混合工业过程故障检测方法。
背景技术
由于现代工业系统日益大型化,工业过程的故障诊断已经成为保证现代工业系统安全稳定运行的关键技术。随着现代计算机控制技术的发展,工业过程中采集并存储了丰富的过程数据。因此,基于数据驱动的故障检测方法逐渐成为工业过程监控领域的研究热点。在线性工业过程监控,经典的方法是主元分析(PCA)方法。针对非线性工业系统的工业过程监控问题,研究人员进一步提出核主元分析(KPCA)方法。然而大多数的工业生产过程由于系统规模庞大,过程变量之间不仅存在显著的线性关系,且也存在明显的非线性关系,即呈现出线性与非线性两类关系并存的状态。一般的,PCA方法适合于线性过程的监控,但难以反映变量间的非线性关系;而KPCA能有效提取过程中的非线性关系,但是处理线性关系时却复杂繁琐,效率较低。所以,对所有过程变量建立单一的PCA或KPCA模型均不能深入挖掘过程信息,如何从复杂数据中同时提取线性和非线性特征信息成为数据驱动的故障诊断中的挑战性课题。
发明内容
本发明针对传统工业过程监控方法存在的无法准确描述复杂系统含有的线性-非线性过程信息的问题,提供一种基于线性评价因子的线性-非线性工业过程故障检测方法。该方法能够更加精确地衡量工业过程数据中的线性和非线性特征信息,提高故障检测率,进而改善故障检测结果。
为了达到上述目的,本发明提供了一种基于线性评价因子的线性-非线性工业过程故障检测方法,含有以下步骤:
(一)收集历史数据库的正常操作工况数据作为训练数据Xo,并使用均值
Figure BDA0001710590480000011
和标准差
Figure BDA0001710590480000012
对训练数据Xo进行归一化处理,得到归一化后的训练数据X。
(二)计算两变量间的线性评价因子LEF(xi,xj);其中,xi为第一变量,i=1;xj为第二变量,2≤j≤m;
(三)基于线性评价因子LEF(xi,xj)将训练数据X划分出线性块和非线性块;
(四)针对线性块建立PCA模型,计算线性块的统计量L_T2和统计量L_SPE;针对非线性块建立KPCA模型,计算非线性块统计量NL_T2和统计量NL_SPE;
(五)采用核密度估计法计算统计量L_T2、统计量L_SPE、统计量NL_T2和统计量 NL_SPE的置信限
Figure BDA0001710590480000029
L_SPEb,lim
Figure BDA00017105904800000210
和NL_SPElim,其中b代表第b个线性块;
(六)采集测试数据xnew,利用训练数据Xo的均值
Figure BDA0001710590480000021
和标准差
Figure BDA0001710590480000022
对测试数据xnew进行归一化处理,得到归一化后的测试数据xt
(七)将测试数据xt按步骤(三)划分出线性块和非线性块;
(八)将线性块在PCA子模型投影,并计算新的统计量L_Tt 2和统计量L_SPEt,将非线性块在KPCA子模型投影,并计算新的统计量NL_Tt 2和统计量NL_SPEt
(九)计算新的融合统计量Tt 2和融合统计量SPEt
(十)依据融合统计量Tt 2和融合统计量SPEt是否超出置信限判断测试数据xt是否发生故障。
进一步的,所述步骤(一)中,利用训练数据Xo的均值
Figure BDA0001710590480000023
和标准差
Figure BDA0001710590480000024
通过公式(1)对训练数据Xo进行归一化处理,公式(1)的表达式为:
Figure BDA0001710590480000025
训练数据Xo经上述公式(1)归一化处理后即可获得归一化后的训练数据X。
进一步的,所述步骤(二)中,计算两变量间的线性评价因子LEF(xi,xj)的具体步骤为:
首先通过公式(2)-(4)计算两变量的概率分布差异PD,公式(2)-(4)表示为:
Figure BDA0001710590480000026
Figure BDA0001710590480000027
Figure BDA0001710590480000028
式中,p(xi)和p(xj)为两变量的概率密度;H(p(xi),p(xj))为两变量间的Hellinger距离,用以衡量变量分布在欧式空间的差异性,其值越小说明两变量越相似;cos(p(xi),p(xj))为两变量概率密度在方向上的差异,其值越大说明两者越相近;
则两变量的线性评价因子定义为:
Figure BDA0001710590480000031
式中,ρ(xi,xj)为皮尔逊线性相关系数,PD(xi,xj)为两变量的概率分布差异。
进一步的,步骤(三)中,基于线性评价因子的线性块和非线性块划分方法为:
(1)选择第一个变量xi,i=1构成第一个变量块并初始化变量块数目L=1;
(2)按照变量顺序依次选择下一个变量xj,2≤j≤m,计算变量xj与L个块中变量的平均线性相关系数
Figure BDA0001710590480000032
式中,b,1≤b≤L表示第b个已存在的子块,nb表示在第b个子块中变量的个数;
(3)确定最大的
Figure BDA0001710590480000033
若其值超过阈值γ,则变量xj被归入子块b中;反之,xj构成一个新的子块,即L=L+1;
(4)重复步骤(2)和(3)直到遍历所有变量,获得L个变量块,则变量个数多于1 的块为线性块,而变量个数为1的块组合成一个非线性块;即历史建模数据分为
Figure BDA0001710590480000034
Figure BDA0001710590480000035
其中前面B个为线性块,最后一个为非线性块。
进一步的,步骤(四)中,针对线性块建立PCA模型、非线性块建立KPCA模型,并计算相应统计量的具体过程为:
对于第b,1≤b≤B个线性块
Figure BDA0001710590480000036
建立PCA模型,即通过求解公式(6)中的特征值分解问题获得线性块
Figure BDA0001710590480000037
的负载向量pb,i;公式(6)表示为:
Figure BDA0001710590480000038
式中,n为特征值的个数,λb,i为特征值;
按照85%的CPV准则确定主元个数后获得负载矩阵Pb和特征值对角阵∑b
对于第h采样时刻的样本
Figure BDA0001710590480000039
通过建立PCA模型计算统计量L_T2和统计量L_SPE,统计量的计算公式表示为:
Figure BDA0001710590480000041
Figure BDA0001710590480000042
式中,
Figure BDA0001710590480000043
为线性块统计量L_T2,L_SPEb(h)为线性块统计量L_SPE;
对于非线性块XNL=[xNL(1),xNL(2),…,xNL(n)]T,建立KPCA模型,即首先计算核矩阵K,核矩阵K中的每个元素k(i,j)的计算公式如下:
Figure BDA0001710590480000044
式中,c为高斯核参数;
通过公式(10)归一化核矩阵K,公式(10)的表达式为:
Figure BDA0001710590480000045
式中,
Figure BDA0001710590480000046
为归一化后的核矩阵,IK是n×n维的矩阵,它的每一个元素都为1/n;
求解公式(11)中的特征值分解问题:
Figure BDA0001710590480000047
式中,n为特征值的个数,λj为特征值;αj为特征向量;
通过公式(11)获得
Figure BDA0001710590480000048
个非零特征值
Figure BDA00017105904800000412
以及与之对应的特征向量
Figure BDA0001710590480000049
对于样本xNL(h),通过式(12)提取第j非线性成分tj(h),公式(12)表示为:
Figure BDA00017105904800000410
式中,kx=[k(xNL(h),xNL(1)),k(xNL(h),xNL(2)),…,k(xNL(h),xNL(n))]T∈Rn为核向量;
将公式(12)提取的非线性成分划分为核主成分t(h)=[t1(h),t2(h),…,tp(h)]和核残差成分
Figure BDA00017105904800000411
通过建立的KPCA模型计算统计量NL_T2和统计量NL_SPE,统计量的计算公式表示为:
NL_T2(h)=t(h)TΛ-1t(h) (13)
Figure BDA0001710590480000051
式中,Λ为KPCA模型中的特征值对角阵,NL_T2(h)为非线性块统计量NL_T2,NL_SPE(h) 为非线性块统计量NL_SPE。
进一步的,步骤(六)中,利用训练数据Xo的均值
Figure BDA0001710590480000052
和标准差
Figure BDA0001710590480000053
通过公式(15)对测试数据xnew进行归一化处理,公式(15)的表达式如下:
Figure BDA0001710590480000054
测试数据xnew经上述公式(15)归一化处理后即可获得归一化后的测试数据xt
进一步的,步骤(七)中,将测试数据xt按照步骤(三)划分出线性块和非线性块的方式划分到不同的子块中,即
Figure BDA0001710590480000055
其中前面B个为线性块,最后一个为非线性块。
进一步的,步骤(八)中,将步骤(七)中划分的不同子块分别在相应子模型投影并计算新的统计量的具体过程为:
在第b,1≤b≤B个线性块中,通过公式(16)和公式(17)计算统计量
Figure BDA00017105904800000513
和L_SPEt,b公式(16)和公式(17)表示为:
Figure BDA0001710590480000056
Figure BDA0001710590480000057
式中,
Figure BDA0001710590480000058
为线性块统计量
Figure BDA0001710590480000059
L_SPEt,b(h)为线性块统计量L_SPEt,b
在非线性块中,计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j) 根据下式计算:
Figure BDA00017105904800000510
归一化测试核向量kt
Figure BDA00017105904800000511
式中,
Figure BDA00017105904800000512
为归一化后的测试核向量,It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;
从归一化后的测试核向量
Figure BDA0001710590480000061
中提取非线性tt(h):
Figure BDA0001710590480000062
式中,
Figure BDA0001710590480000063
为投影向量;
将式(20)提取的非线性成分划分为核主成分tt(h)=[tt,1(h),tt,2(h),…,tt,p(h)]和核残差成分
Figure BDA0001710590480000064
通过公式(21)和公式(22)计算统计量
Figure BDA0001710590480000065
和 NL_SPEt,公式为:
Figure BDA0001710590480000066
Figure BDA0001710590480000067
式中,
Figure BDA0001710590480000068
为非线性块统计量
Figure BDA0001710590480000069
NL_SPEt,b(h)为非线性块统计量NL_SPEt,b
进一步的,步骤(九)中,通过公式(23)和公式(24)计算新的融合监控统计量,公式(23)和公式(24)表示为:
Figure BDA00017105904800000610
Figure BDA00017105904800000611
式中,
Figure BDA00017105904800000612
为融合统计量
Figure BDA00017105904800000613
SPEt(h)为非线性块统计量SPEt
进一步的,步骤(十)中,判断归一化后的测试数据xt是否是故障数据;当
Figure BDA00017105904800000614
或SPEt≤1 时,认为工业过程处于正常工况状态;否则,认为工业过程中出现了故障。
与现有技术相比,本发明的有益效果在于:
本发明提供的线性-非线性工业过程故障检测方法,把过程变量按照线性和非线性关系划分为多个部分,针对每一变量块分别建立对应的统计模型,即针对线性块建立PCA模型,针对非线性块建立KPCA模型,能够充分提取工业过程中的线性和非线性信息,使得建立的统计模型更为精确,并应用贝叶斯推理融合所有块的信息,通过融合后的统计量判断是否发生故障,进而改善故障检测结果,提高故障检测率。
附图说明
图1为本发明所述线性-非线性工业过程故障检测方法的流程图。
图2a为本发明实施例1采用现有PCA方法对线性-非线性数值系统故障的监测结果示意图。
图2b为本发明实施例1采用现有KPCA方法对线性-非线性数值系统故障的监测结果示意图。
图 2c为本发明实施例1采用本发明所述线性-非线性工业过程故障检测方法对线性-非线性数值系统故障的监控结果示意图。
图3为本发明实施例2所述田纳西-伊斯曼(TE)过程的结构图。
图4a为本发明实施例2采用现有PCA方法对TE过程故障5的监控结果示意图
图4b为本发明实施例2采用现有KPCA方法对TE过程故障5的监控结果示意图。
图4c为本发明实施例2采用本发明所述线性-非线性工业过程故障检测方法对TE过程故障5的监控结果示意图。
图5a为本发明实施例2采用现有PCA方法对TE过程故障10的监控结果示意图
图5b为本发明实施例2采用现有KPCA方法对TE过程故障10的监控结果示意图。
图5c为本发明实施例2采用本发明所述线性-非线性工业过程故障检测方法对TE过程故障10的监控结果示意图。
具体实施方式
下面,通过示例性的实施方式对本发明进行具体描述。然而应当理解,在没有进一步叙述的情况下,一个实施方式中的元件、结构和特征也可以有益地结合到其他实施方式中。
参见图1,本发明揭示了一种基于线性评价因子的线性-非线性工业过程故障检测方法,含有以下步骤:
(一)采集正常工况下的历史数据作为训练数据Xo,并计算其均值
Figure BDA0001710590480000071
和标准差
Figure BDA0001710590480000072
利用训练数据Xo的均值
Figure BDA0001710590480000073
和标准差
Figure BDA0001710590480000074
通过公式(1)对训练数据Xo进行归一化处理,获得归一化后的训练数据X。公式(1)的表达式为:
Figure BDA0001710590480000075
(二)计算每两个变量之间的线性评价因子LEF(xi,xj);其中,xi为第一变量,i=1;xj为第二变量,2≤j≤m。其具体步骤为:
首先通过公式(2)-(4)计算两变量的概率分布差异PD,公式(2)-(4)表示为:
Figure BDA0001710590480000081
Figure BDA0001710590480000082
Figure BDA0001710590480000083
式中,p(xi)和p(xj)为两变量的概率密度;H(p(xi),p(xj))为两变量间的Hellinger距离,用以衡量变量分布在欧式空间的差异性,其值越小说明两变量越相似;cos(p(xi),p(xj))为两变量概率密度在方向上的差异,其值越大说明两者越相近;
则两变量的线性评价因子定义为:
Figure BDA0001710590480000084
式中,ρ(xi,xj)为皮尔逊线性相关系数,PD(xi,xj)为两变量的概率分布差异。
若LEF(xi,xj)的值越接近于1,说明变量间存在明显的线性关系;反之,LEF(xi,xj)越接近于0,说明变量线性关系越弱。
(三)采用基于线性评价因子的方法划分出线性块和非线性块。其具体方法步骤为:
(1)选择第一个变量xi,i=1构成第一个变量块并初始化变量块数目L=1;
(2)按照变量顺序依次选择下一个变量xj,2≤j≤m,计算变量xj与L个块中变量的平均线性相关系数
Figure BDA0001710590480000085
式中,b,1≤b≤L表示第b个已存在的子块,nb表示在第b个子块中变量的个数;
(3)确定最大的
Figure BDA0001710590480000086
若其值超过阈值γ,则变量xj被归入子块b中;反之,xj构成一个新的子块,即L=L+1;
(4)重复步骤(2)和(3)直到遍历所有变量,获得L个变量块,则变量个数多于1的块为线性块,而变量个数为1的块组合成一个非线性块;即历史建模数据分为
Figure BDA0001710590480000087
Figure BDA0001710590480000088
其中前面B个为线性块,最后一个为非线性块。
(四)针对线性块建立PCA模型,计算线性块的统计量L_T2和统计量L_SPE;针对非线性块建立KPCA模型,计算非线性块统计量NL_T2和统计量NL_SPE。其具体过程为:
对于第b,1≤b≤B个线性块
Figure BDA0001710590480000091
建立PCA模型,即通过求解公式(6)中的特征值分解问题获得线性块
Figure BDA0001710590480000092
的负载向量pb,i;公式(6)表示为:
Figure BDA0001710590480000093
式中,n为特征值的个数,λb,i为特征值;
按照85%的CPV准则确定主元个数后获得负载矩阵Pb和特征值对角阵∑b
对于第h采样时刻的样本
Figure BDA0001710590480000094
通过建立的PCA模型计算统计量L_T2和统计量 L_SPE,统计量的计算公式表示为:
Figure BDA0001710590480000095
Figure BDA0001710590480000096
式中,
Figure BDA00017105904800000911
(h)为线性块统计量L_T2,L_SPEb(h)为线性块统计量L_SPE;
对于非线性块XNL=[xNL(1),xNL(2),…,xNL(n)]T,建立KPCA模型,即首先计算核矩阵K,核矩阵K中的每个元素k(i,j)的计算公式如下:
Figure BDA0001710590480000097
式中,c为高斯核参数;
通过公式(10)归一化核矩阵K,公式(10)的表达式为:
Figure BDA0001710590480000098
式中,
Figure BDA0001710590480000099
为归一化后的核矩阵,IK是n×n维的矩阵,它的每一个元素都为1/n;
求解公式(11)中的特征值分解问题:
Figure BDA00017105904800000910
式中,n为特征值的个数,λj为特征值;αj为特征向量;
通过公式(11)获得
Figure BDA0001710590480000101
个非零特征值
Figure BDA00017105904800001013
以及与之对应的特征向量
Figure BDA0001710590480000102
对于样本xNL(h),通过式(12)提取第j非线性成分tj(h),公式(12)表示为:
Figure BDA0001710590480000103
式中,kx=[k(xNL(h),xNL(1)),k(xNL(h),xNL(2)),…,k(xNL(h),xNL(n))]T∈Rn为核向量;
将公式(12)提取的非线性成分划分为核主成分t(h)=[t1(h),t2(h),…,tp(h)]和核残差成分
Figure BDA0001710590480000104
通过建立的KPCA模型计算统计量NL_T2和统计量NL_SPE,统计量的计算公式表示为:
NL_T2(h)=t(h)TΛ-1t(h) (13)
Figure BDA0001710590480000105
式中,Λ为KPCA模型中的特征值对角阵,NL_T2(h)为非线性块统计量NL_T2,NL_SPE(h) 为非线性块统计量NL_SPE。
(五)采用核密度估计法计算统计量L_T2、统计量L_SPE、统计量NL_T2和统计量 NL_SPE的置信限
Figure BDA00017105904800001015
L_SPEb,lim
Figure BDA00017105904800001014
和NL_SPElim,其中b代表第b个线性块。
(六)采集测试数据xnew,利用训练数据Xo的均值
Figure BDA0001710590480000106
和标准差
Figure BDA0001710590480000107
通过公式(15)对测试数据xnew进行归一化处理,得到归一化后的测试数据xt。公式(15)的表达式如下:
Figure BDA0001710590480000108
测试数据xnew经上述公式(15)归一化处理后即可获得归一化后的测试数据xt
(七)将测试数据xt按步骤(三)划分出线性块和非线性块。具体地说,将测试数据xt按照步骤(三)划分出线性块和非线性块的方式划分到不同的子块中,即
Figure BDA0001710590480000109
其中前面B个为线性块,最后一个为非线性块。
(八)将线性块在PCA模型投影,并计算新的统计量
Figure BDA00017105904800001010
和统计量L_SPEt,将非线性块在KPCA子模型投影,并计算新的统计量
Figure BDA00017105904800001011
和统计量NL_SPEt。其具体过程为:
在第b,1≤b≤B个线性块中,通过公式(16)和公式(17)计算统计量
Figure BDA00017105904800001012
和L_SPEt,b,公式(16)和公式(17)表示为:
Figure BDA0001710590480000111
Figure BDA0001710590480000112
式中,
Figure BDA0001710590480000113
为线性块统计量
Figure BDA0001710590480000114
L_SPEt,b(h)为线性块统计量L_SPEt,b
在非线性块中,计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j) 根据下式计算:
Figure BDA0001710590480000115
归一化测试核向量kt
Figure BDA0001710590480000116
式中,
Figure BDA0001710590480000117
为归一化后的测试核向量,It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;
从归一化后的测试核向量
Figure BDA0001710590480000118
中提取非线性tt(h):
Figure BDA0001710590480000119
式中,
Figure BDA00017105904800001110
为投影向量;
将式(20)提取的非线性成分划分为核主成分tt(h)=[tt,1(h),tt,2(h),…,tt,p(h)]和核残差成分
Figure BDA00017105904800001111
通过公式(21)和公式(22)计算统计量NL_Tt 2和 NL_SPEt,公式为:
NL_Tt 2(h)=tt(h)TΛ-1tt(h) (21)
Figure BDA00017105904800001112
式中,
Figure BDA00017105904800001113
为非线性块统计量
Figure BDA00017105904800001114
NL_SPEt,b(h)为非线性块统计量NL_SPEt,b
(九)计算新的融合统计量Tt 2和融合统计量SPEt。其具体方法为:
通过公式(23)和公式(24)计算新的融合监控统计量,公式(23)和公式(24)表示为:
Figure BDA0001710590480000121
Figure BDA0001710590480000122
式中,Tt 2(h)为融合统计量Tt 2,SPEt(h)为非线性块统计量SPEt
(十)依据融合统计量Tt 2和融合统计量SPEt是否超出置信限判断测试数据xt是否发生故障。当Tt 2≤1或SPEt≤1时,认为工业过程处于正常工况状态;否则,认为工业过程中出现了故障。
上述方法中,步骤(一)至(五)为离线建模阶段,步骤(六)至(十)为在线测试阶段。
本发明上述故障检测方法将把工业过程变量按照线性和非线性关系划分为多个部分,然后针对每一变量模块分别建立对应的统计模型。能够更加精确地衡量工业过程数据中的线性和非线性特征信息,提高故障检测率,进而改善故障检测结果。
为了能更清楚地说明本发明上述故障检测方法的有益效果,以下结合两个不同的实施例对本发明上述故障检测方法做出进一步说明。
实施例一:首先,设计含8变量的数值系统,其结构如下:
x1=u+e1
x2=-2x1+1+e2
x3=u2-3u+e3
Figure BDA0001710590480000124
x6=2x5+1+e6
x7=sin(8πu)+e7
Figure BDA0001710590480000123
其中,数据源信号u服从均匀分布U(0,2),e1~e8为8个零均值0.01方差的独立噪声。首先仿真500组正常数据作为训练集用于历史建模。另仿真两组含故障的数据作为测试集,每组数据均含500个样本。故障1:在第201个时刻给变量x5加入幅值为0.3的阶跃故障。
采用本发明上述故障检测方法(以下简称:LEF方法)对本实施例所述线性-非线性数值系统进行故障检测。检测到发生故障后,为评价不同故障检测方法的故障检测性能,通过故障检出率FDR指标对不同方法的故障检测结果对比。故障检出率FDR定义为检测出的故障数据与实际总的故障数据之比。很显然,FDR的数值越大,意味着工业过程故障检测方法的故障检测效果越好;反之,工业过程故障检测方法的故障检测效果越差。
在本实施例的线性-非线性数值系统仿真中,采用PCA方法和KPCA方法两种方法作为仿真对比。其中特征空间维数
Figure BDA0001710590480000133
确定为累计特征值和超过总体特征值和99.99%的个数。PCA 方法中根据85%的方差贡献率确定主元个数。在本例中,评价线性块的阈值γ设置为0.7。核参数选为5m,其中m是变量个数。99%置信度被用来计算各方法的置信限。表1给出的是本发明LEF方法划分的线性和非线性块。
表1
Figure BDA0001710590480000131
图2a-2c给出了PCA方法、KPCA方法和LEF方法对本实施例线性-非线性数值系统的故障监控结果。从图2a、2b中可以看出,PCA和KPCA方法均无法检出故障,故障漏报率几乎达到100%。虽然本发明LEF方法的T2统计量同样无法检出故障,但是SPE能够在第201 个时刻检测到故障,并且没有故障漏报。三种方法详细的故障检出率列于表2,由表2可以看出本发明的LEF方法提供了最佳的故障检测性能。
表2
Figure BDA0001710590480000132
由本例的监控结果知,分别提取过程中的局部线性和局部非线性特征有助于更为精确地反映过程信息。
实施例2:田纳西-伊斯曼(以下简称:TE)过程是由美国伊斯曼化学公司的Downs和Vogel根据一个实际的化工过程建立的实验平台,现被广泛用于验证控制算法和过程监控方法的优劣。参见图3,TE过程主要由五个单元组成,包括反应器、产品冷凝器、气液分离器、循环压缩机和汽提塔组成。TE过程共53个变量,其中包括22个连续测量变量、19个成分变量和12个操作变量。本实施例中,参见表3,选取TE过程中的33个变量;参见表4,共有21个故障。
表3
变量标号 变量描述 变量标号 变量描述
1 A进料(流1) 18 汽提器温度
2 D进料(流2) 19 汽提器流量
3 E进料(流3) 20 压缩机功率
4 A和C进料(流4) 21 反应器冷却水出口温度
5 再循环流量(流8) 22 分离器冷却水出口温度
6 反应器进料速度(流6) 23 D进料量(流2)
7 反应器压力 24 E进料量(流3)
8 反应器等级 25 A进料量(流1)
9 反应器温度 26 A和C料量(流4)
10 放空速率 27 压缩机再循环阀
11 产品分离器温度 28 放空阀
12 产品分离器液位 29 分离器罐液流量(流10)
13 产品分离器压力 30 汽提器液体产品流量(流11)
14 产品分离器塔底流量(流10) 31 汽提器水流阀
15 汽提器等级 32 反应器冷水流量
16 汽提器压力 33 冷凝器冷水流量
17 汽提器塔底流量(流11)
表4
Figure BDA0001710590480000141
Figure BDA0001710590480000151
在本实施中,采用PCA方法、KPCA方法和本发明LEF方法三种方法对上述TE过程监控。三种方法中参数设置原则同实施例1中的数值,其中核参数设置为500m。99%置信度被用来求各统计量置信限,表5给出的是本发明LEF方法划分的线性和非线性块。以故障5和故障10为例说明故障检测效果。
表5
Figure BDA0001710590480000152
故障5由冷凝器冷却水进料温度产生的阶跃变化引起。采用PCA方法、KPCA方法和本发明LEF方法对故障5的监控图参见图4a-4c。参见图4a,PCA方法的T2和SPE统计量在第161个样本检出故障,但是在400个时刻后统计量又回归置信限以下,两个统计量的故障检出率分别为0.241和0.266。同样的,参见图4b,KPCA方法的T2统计量在400个时刻后也处于置信限以下,故障检出率为0.25。虽然KPCA方法的SPE统计量监控效果有所改善,但是仍然在置信限附近波动,故障漏报率为0.493。与之相比,参见图4c,本文发明的LEF方法两个统计量均能在第161个时刻检出故障,虽然T2统计量的检出率为0.258,但SPE统计量的检出率达到0.999,能够持续报警到仿真结束。
故障10是由进料C的温度(流4)产生随机波动引起的。采用PCA方法、KPCA方法和本发明LEF方法对故障10的监控效果参见图5a-5c所示。参见图5a,PCA方法的T2统计量在第258个时刻检出故障,但是故障检出率只有0.296,PCA方法的SPE统计量在第209 个采样时刻检测该故障,故障检出率率为0.335,因此监控效果较差。作为对比,参见图5b, KPCA方法的SPE统计量在第192个采样时刻检出故障,比PCA方法有了改善,但是监控效果依然较差。KPCA方法的T2和SPE统计量的故障检出率分别达到了0.334和0.629。本发明 LEF方法的监控结果参见图5c,其中T2统计量在第184个采样时刻给出故障信号,故障检出率提到了0.384,而SPE统计量同样取得了较好的监控效果,故障检出率率为0.743。因此,本发明所提的LEF方法能够改善对TE过程故障10的故障检测性能。
表6给出了PCA方法、KPCA方法和LEF方法对于TE过程故障5、10、16和20的故障检出率。
表6
Figure BDA0001710590480000161
由表6可知,本发明提供的LEF方法总体上取得了最好的监控结果,具有最高的故障检出率。并且对于故障5、10、16和20这4个故障的监控效果改善尤为明显。综合以上分析,本发明提供的LEF方法的故障检测效果要优于PCA方法和KPCA方法。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。

Claims (9)

1.一种基于线性评价因子的线性-非线性工业过程故障检测方法,含有以下步骤:
(一)收集历史数据库的正常操作工况数据作为训练数据Xo,并使用均值
Figure FDA0003425184580000011
和标准差
Figure FDA0003425184580000012
对训练数据Xo进行归一化处理,得到归一化后的训练数据X;
(二)计算两变量间的线性评价因子LEF(xi,xj);其中,xi为第一变量,i=1;xj为第二变量,2≤j≤m;计算两变量间的线性评价因子LEF(xi,xj)的具体步骤为:
首先通过公式(2)-(4)计算两变量的概率分布差异PD,公式(2)-(4)表示为:
Figure FDA0003425184580000013
Figure FDA0003425184580000014
Figure FDA0003425184580000015
式中,p(xi)和p(xj)为两变量的概率密度;H(p(xi),p(xj))为两变量间的Hellinger距离,用以衡量变量分布在欧式空间的差异性,其值越小说明两变量越相似;cos(p(xi),p(xj))为两变量概率密度在方向上的差异,其值越大说明两者越相近;
则两变量的线性评价因子定义为:
Figure FDA0003425184580000016
式中,ρ(xi,xj)为皮尔逊线性相关系数,PD(xi,xj)为两变量的概率分布差异;
(三)基于线性评价因子LEF(xi,xj)将训练数据X划分出线性块和非线性块;
(四)针对线性块建立PCA模型,计算线性块的统计量L_T2和统计量L_SPE;针对非线性块建立KPCA模型,计算非线性块统计量NL_T2和统计量NL_SPE;
(五)采用核密度估计法计算统计量L_T2、统计量L_SPE、统计量NL_T2和统计量NL_SPE的置信限
Figure FDA0003425184580000017
L_SPEb,lim
Figure FDA0003425184580000018
和NL_SPElim,其中b代表第b个线性块;
(六)采集测试数据xnew,利用训练数据Xo的均值
Figure FDA0003425184580000019
和标准差
Figure FDA00034251845800000110
对测试数据xnew进行归一化处理,得到归一化后的测试数据xt
(七)将测试数据xt按步骤(三)划分出线性块和非线性块;
(八)将线性块在PCA子模型投影,并计算新的统计量L_Tt 2和统计量L_SPEt,将非线性块在KPCA子模型投影,并计算新的统计量NL_Tt 2和统计量NL_SPEt
(九)计算新的融合统计量Tt 2和融合统计量SPEt
(十)依据融合统计量Tt 2和融合统计量SPEt是否超出置信限判断测试数据xt是否发生故障。
2.如权利要求1所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,所述步骤(一)中,利用训练数据Xo的均值
Figure FDA0003425184580000021
和标准差
Figure FDA0003425184580000022
通过公式(1)对训练数据Xo进行归一化处理,公式(1)的表达式为:
Figure FDA0003425184580000023
训练数据Xo经上述公式(1)归一化处理后即可获得归一化后的训练数据X。
3.如权利要求1所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,步骤(三)中,基于线性评价因子的线性块和非线性块划分方法为:
(1)选择第一个变量xi,i=1构成第一个变量块并初始化变量块数目L=1;
(2)按照变量顺序依次选择下一个变量xj,2≤j≤m,计算变量xj与L个块中变量的平均线性相关系数
Figure FDA0003425184580000024
式中,b,1≤b≤L表示第b个已存在的子块,nb表示在第b个子块中变量的个数;
(3)确定最大的
Figure FDA0003425184580000025
若其值超过阈值γ,则变量xj被归入子块b中;反之,xj构成一个新的子块,即L=L+1;
(4)重复步骤(2)和(3)直到遍历所有变量,获得L个变量块,则变量个数多于1的块为线性块,而变量个数为1的块组合成一个非线性块;即历史建模数据分为
Figure FDA0003425184580000026
其中前面B个为线性块,最后一个为非线性块。
4.如权利要求1所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,步骤(四)中,针对线性块建立PCA模型、非线性块建立KPCA模型,并计算相应统计量的具体过程为:
对于第b,1≤b≤B个线性块
Figure FDA0003425184580000031
建立PCA模型,即通过求解公式(6)中的特征值分解问题获得线性块
Figure FDA0003425184580000032
的负载向量pb,i;公式(6)表示为:
Figure FDA0003425184580000033
式中,n为特征值的个数,λb,i为特征值;
按照85%的CPV准则确定主元个数后获得负载矩阵Pb和特征值对角阵Σb
对于第h采样时刻的样本
Figure FDA0003425184580000034
通过建立的PCA模型计算线性块统计量L_T2和统计量L_SPE,统计量的计算公式表示为:
Figure FDA0003425184580000035
Figure FDA0003425184580000036
式中,
Figure FDA0003425184580000037
为线性块统计量L_T2,L_SPEb(h)为线性块统计量L_SPE;
对于非线性块XNL=[xNL(1),xNL(2),…,xNL(n)]T,建立KPCA模型,即首先计算核矩阵K,核矩阵K中的每个元素k(i,j)的计算公式如下:
Figure FDA0003425184580000038
式中,c为高斯核参数;
通过公式(10)归一化核矩阵K,公式(10)的表达式为:
Figure FDA0003425184580000039
式中,
Figure FDA00034251845800000310
为归一化后的核矩阵,IK是n×n维的矩阵,它的每一个元素都为1/n;
求解公式(11)中的特征值分解问题:
Figure FDA0003425184580000041
式中,n为特征值的个数,λj为特征值;αj为特征向量;
通过公式(11)获得
Figure FDA0003425184580000042
个非零特征值
Figure FDA0003425184580000043
以及与之对应的特征向量
Figure FDA0003425184580000044
对于样本
Figure FDA0003425184580000045
通过式(12)提取第j非线性成分
Figure FDA0003425184580000046
公式(12)表示为:
Figure FDA0003425184580000047
式中,
Figure FDA0003425184580000048
为核向量;
将公式(12)提取的非线性成分划分为核主成分t(h)=[t1(h),t2(h),…,tp(h)]和核残差成分
Figure FDA0003425184580000049
通过建立的KPCA模型计算统计量NL_T2和统计量NL_SPE,统计量的计算公式表示为:
NL_T2(h)=t(h)TΛ-1t(h) (13)
Figure FDA00034251845800000410
式中,Λ为KPCA模型中的特征值对角阵,
Figure FDA00034251845800000411
为非线性块统计量NL_T2
Figure FDA00034251845800000412
为非线性块统计量NL_SPE。
5.如权利要求4所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,步骤(六)中,利用训练数据Xo的均值
Figure FDA00034251845800000413
和标准差
Figure FDA00034251845800000414
通过公式(15)对测试数据xnew进行归一化处理,公式(15)的表达式如下:
Figure FDA00034251845800000415
测试数据xnew经上述公式(15)归一化处理后即可获得归一化后的测试数据xt
6.如权利要求5所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,步骤(七)中,将测试数据xt按照步骤(三)划分出线性块和非线性块的方式划分到不同的子块中,即
Figure FDA0003425184580000051
其中前面B个为线性块,最后一个为非线性块。
7.如权利要求6所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,步骤(八)中,将步骤(七)中划分的不同子块分别在相应子模型投影并计算新的统计量的具体过程为:
在第b,1≤b≤B个线性块中,通过公式(16)和公式(17)计算统计量
Figure FDA0003425184580000052
和L_SPEt,b,公式(16)和公式(17)表示为:
Figure FDA0003425184580000053
Figure FDA0003425184580000054
式中,
Figure FDA0003425184580000055
为线性块统计量
Figure FDA0003425184580000056
L_SPEt,b(h)为线性块统计量L_SPEt,b
在非线性块中,计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)根据下式计算:
Figure FDA0003425184580000057
归一化测试核向量kt
Figure FDA0003425184580000058
式中,
Figure FDA0003425184580000059
为归一化后的测试核向量,It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;
从归一化后的测试核向量
Figure FDA00034251845800000510
中提取非线性tt(h):
Figure FDA00034251845800000511
式中,
Figure FDA00034251845800000513
为投影向量;
将式(20)提取的非线性成分划分为核主成分tt(h)=[tt,1(h),tt,2(h),…,tt,p(h)]和核残差成分
Figure FDA00034251845800000512
通过公式(21)和公式(22)计算统计量NL_Tt 2和NL_SPEt,公式为:
NL_Tt 2(h)=tt(h)TΛ-1tt(h) (21)
Figure FDA0003425184580000061
式中,
Figure FDA0003425184580000062
为非线性块统计量
Figure FDA0003425184580000063
NL_SPEt,b(h)为非线性块统计量NL_SPEt,b
8.如权利要求7所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,步骤(九)中,通过公式(23)和公式(24)计算新的融合监控统计量,公式(23)和公式(24)表示为:
Figure FDA0003425184580000064
Figure FDA0003425184580000065
式中,Tt 2(h)为融合统计量Tt 2,SPEt(h)为融合统计量SPEt
9.如权利要求1或8所述的基于线性评价因子的线性-非线性工业过程故障检测方法,其特征在于,步骤(十)中,判断归一化后的测试数据xt是否是故障数据;当Tt 2≤1或SPEt≤1时,认为工业过程处于正常工况状态;否则,认为工业过程中出现了故障。
CN201810679472.2A 2018-06-27 2018-06-27 基于线性评价因子的线性-非线性工业过程故障检测方法 Active CN108830006B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810679472.2A CN108830006B (zh) 2018-06-27 2018-06-27 基于线性评价因子的线性-非线性工业过程故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810679472.2A CN108830006B (zh) 2018-06-27 2018-06-27 基于线性评价因子的线性-非线性工业过程故障检测方法

Publications (2)

Publication Number Publication Date
CN108830006A CN108830006A (zh) 2018-11-16
CN108830006B true CN108830006B (zh) 2022-02-18

Family

ID=64138025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810679472.2A Active CN108830006B (zh) 2018-06-27 2018-06-27 基于线性评价因子的线性-非线性工业过程故障检测方法

Country Status (1)

Country Link
CN (1) CN108830006B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447187B (zh) * 2018-12-25 2021-06-15 中南大学 电机故障诊断方法及系统
CN110130875B (zh) * 2019-06-20 2022-07-12 中国石油大学(华东) 抽油机异常工况监控方法
CN111596317A (zh) * 2020-05-25 2020-08-28 北京航空航天大学 一种多维故障的检测和识别方法
CN111949003B (zh) * 2020-07-17 2021-09-03 浙江浙能技术研究院有限公司 一种基于SFA与Hellinger距离的闭环控制回路性能评价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106647718A (zh) * 2017-01-20 2017-05-10 中国石油大学(华东) 基于贝叶斯核慢特征分析的非线性工业过程故障检测方法
CN106940808A (zh) * 2017-04-28 2017-07-11 宁波大学 一种基于改进型主元分析模型的故障检测方法
CN107544477A (zh) * 2017-10-23 2018-01-05 中国石油大学(华东) 基于核主元分析的非线性工业过程故障检测方法
CN108182445A (zh) * 2017-12-13 2018-06-19 东北大学 基于大数据智能核独立元分析的过程故障识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9053291B2 (en) * 2010-09-29 2015-06-09 Northeastern University Continuous annealing process fault detection method based on recursive kernel principal component analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106647718A (zh) * 2017-01-20 2017-05-10 中国石油大学(华东) 基于贝叶斯核慢特征分析的非线性工业过程故障检测方法
CN106940808A (zh) * 2017-04-28 2017-07-11 宁波大学 一种基于改进型主元分析模型的故障检测方法
CN107544477A (zh) * 2017-10-23 2018-01-05 中国石油大学(华东) 基于核主元分析的非线性工业过程故障检测方法
CN108182445A (zh) * 2017-12-13 2018-06-19 东北大学 基于大数据智能核独立元分析的过程故障识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Linearity Evaluation and Variable Subset Partition Based Hierarchical Process Modeling and Monitoring;Wenqing Li et al.;《IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS》;20180331;第65卷(第3期);第2683-2692页 *
Wenqing Li et al..Linearity Evaluation and Variable Subset Partition Based Hierarchical Process Modeling and Monitoring.《IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS》.2018,第65卷(第3期),第2683-2692页. *
基于加权差分主元分析的化工过程故障检测;郭金玉等;《高校化学工程学报》;20180215;第32卷(第01期);第183-192页 *
基于多块MICA-PCA的全流程过程监控方法;王振雷等;《控制与决策》;20180228;第33卷(第02期);第269-274页 *

Also Published As

Publication number Publication date
CN108830006A (zh) 2018-11-16

Similar Documents

Publication Publication Date Title
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN103914064B (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN108803520B (zh) 一种基于变量非线性自相关性剔除的动态过程监测方法
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
CN104793606B (zh) 基于改进的kpca和隐马尔科夫模型的工业故障诊断方法
CN110244692B (zh) 化工过程微小故障检测方法
CN108345284B (zh) 一种基于两变量块的质量相关故障检测方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN108919755B (zh) 一种基于多块非线性交叉关系模型的分布式故障检测方法
CN103901880A (zh) 基于多分类器和d-s证据融合的工业过程故障检测方法
CN106092625A (zh) 基于修正型独立元分析和贝叶斯概率融合的工业过程故障检测方法
CN111160776A (zh) 利用分块主成分分析的污水处理过程异常工况检测方法
CN109507972A (zh) 基于分层式非高斯监测算法的工业生产过程故障监测方法
CN110009126B (zh) 基于pls模型与pca贡献度融合的在线报警分析方法
CN114611067A (zh) 一种基于典型变量相异性分析的化工过程缓变故障检测方法
CN114757269A (zh) 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法
CN108388234A (zh) 一种基于相关性划分多变量块pca模型的故障监测方法
CN105334823A (zh) 基于有监督的线性动态系统模型的工业过程故障检测方法
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN108181893B (zh) 一种基于pca-kdr的故障检测方法
CN115358297A (zh) 一种基于改进mkeca方法的注塑机异常检测方法及系统
CN106354125A (zh) 一种利用分块pca检测化工过程故障的方法
CN111639304A (zh) 基于Xgboost回归模型的CSTR故障定位方法
CN113159225B (zh) 多变量工业过程故障分类方法
CN103995985B (zh) 基于Daubechies小波变换和弹性网的故障检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant