CN106355030A - 一种基于层次分析法和加权投票决策融合的故障检测方法 - Google Patents
一种基于层次分析法和加权投票决策融合的故障检测方法 Download PDFInfo
- Publication number
- CN106355030A CN106355030A CN201610834407.3A CN201610834407A CN106355030A CN 106355030 A CN106355030 A CN 106355030A CN 201610834407 A CN201610834407 A CN 201610834407A CN 106355030 A CN106355030 A CN 106355030A
- Authority
- CN
- China
- Prior art keywords
- matrix
- spe
- overbar
- new
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于层次分析法和加权投票决策融合的故障检测方法,该方法首先选取多个分类器方法作为融合子分类器,通过训练数据集建立多个分类器模型,根据各分类器分类结果得到相应的评价指标,然后通过层次分析法对多个分类器方法进行打分排序,从而给各分类器赋予相应的权重。最后,通过加权投票融合方法将多个分类器决策结果集成,得到最终的故障检测结果。相比目前的其他方法,本发明不仅提高了工业过程的监测效果,增强了过程操作员对过程的掌握和操作信心,而且在很大程度上改善了单一故障检测方法的局限性,更加有利于工业过程的自动化实施。
Description
技术领域
本发明属于工业过程控制领域,特别涉及一种基于层次分析法和加权投票决策融合的工业过程故障检测方法。
背景技术
近年来,工业生产过程的监测问题越来越得到工业界和学术界的广泛重视。一方面,实际的工业过程因为其过程复杂,操作变量多,存在非线性、非高斯、动态性等阶段,在单一假设下,运用某一种方法,其监测效果有很大的局限。另一方面,如果不对过程进行很好的监测,并对可能发生的故障进行诊断,有可能会发生操作事故,轻者影响产品的质量,重者将会造成生命和财产的损失。因此,找到更好的过程监测方法、并进行及时正确地预报已经成为工业生产过程的研究热点和迫切需要解决的问题之一。
传统的工业过程监测方法除了基于机理模型的方法外,大多采用多元统计分析方法,比如主元分析方法(PCA)和偏最小二乘方法(PLS)等。在机理模型难以获取的情况下,基于数据驱动的多元统计分析方法已经成为工业过程监测的主流方法。但是,传统的多元统计分析方法都存在一些基本的假设条件,而实际工业过程却相对复杂,过程可能是一部分线性、一部分非线性或者一部分非高斯的结合,所以使用单一分类器方法存在一些局限性,很难找到合适的模型。而信息融合方法是将多种方法进行集成,可以克服单一方法的劣势,在处理复杂工业过程的监控和故障诊断方面有其自身的优势。本发明采用该方法替代原有的单一多元统计分析方法对过程进行监测。另外为了提高融合效果,采用层次分析法对单一模型进行评价,得到单一模型在融合中的权重,使得融合过程中能够最大化放大单一模型的优势,弥补单一模型的劣势。传统的监测方法假设过程运行在单一条件下,已经无法满足实际工业过程的监测要求。即使对过程的不同工作条件分别进行建模,也无法达到满意的监测效果。因为对新的过程数据进行监测时,需要结合过程知识对该数据的工作条件进行判断,并选取相应的监测模型,这就大大增强了监测方法对过程知识的依赖性,不利于工业过程的自动化实施。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于层次分析法和加权投票决策融合的工业过程故障检测方法。
本发明的目的是通过以下技术方案来实现的:一种基于层次分析法和加权投票决策融合的故障检测方法,包括以下步骤:
(1)利用系统收集过程正常工况的数据组成建模用的训练样本集:X=[x1;x2;…;xn]。其中X∈Rn×m,n为训练样本数,m为过程变量数,R为实数集,Rn×m表示X满足n×m的二维分布。将这些数据存入历史数据库。
(2)对数据集X进行预处理和归一化,使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为
(3)调用不同的分类器方法,选择分类器的个数为G,在新的数据矩阵集下建立不同的分类器模型,构造相应的T2和SPE统计量的检测统计限。
(4)将建模数据和各个模型参数存入历史数据库中备用。
(5)收集新的过程数据,并对其进行预处理和归一化。分别采用不同的分类器模型对其进行监测,即计算T2和SPE统计量,那么每一种分类方法对当前的监测数据样本都可以得到一个正常或者故障的决策。
(6)根据每一个分类器模型的检测结果构造层次结构模型,通过层次分析法对单一分类器性能进行评价,给出打分排序结果。
(7)结合加权投票决策融合方法,通过不同分类器对不同故障检测率的先验知识,计算当前监测数据在所有分类器方法下的综合检出率,做出最后决策。
本发明的有益效果是:本发明通过对每一个故障数据分别进行不同分类器方法下的分析和建模。然后,通过层次分析法对不同分类器的分类效果做出打分评价,最后结合加权投票融合方法将不同分类器方法下的检测结果进行集成融合,得到最终的检测结果。相比目前的其他过程监测方法,本发明不仅提高了工业过程的监测效果,增加了检测的准确性,使工业生产更加安全可靠,而且在很大程度上改善了单一故障检测方法的局限性,以及监测方法对过程知识的依赖性,增强了过程操作员对过程状态的掌握,更加有利于工业过程的自动化实施。
附图说明
图1是层次结构决策模型;
图2是PCA模型对故障1的检测结果图;
图3是KPCA模型对故障1的检测结果图;
图4是PPCA模型对故障1的检测结果图;
图5是PLS模型对故障1的检测结果图;
图6是FA模型对故障1的检测结果图;
图7是ICA模型对故障1的检测结果图。
具体实施方式
本发明针对工业过程的监测问题,首先利用集散控制系统收集正常工作状态下的数据作为训练数据集,然后分别调用不同的分类器方法,建立相应的分类器模型,构造两个监测统计量T2和SPE及其对应的统计限和SPElim。把所有的过程模型参数存入数据库中备用。对新的在线过程数据进行监测的时候,首先利用不同的分类器模型对其进行监测,得到相应的监测结果。然后根据不同分类器模型的监测结果,通过层次分析法对不同分类器模型进行打分评价,最后结合加权投票决策融合方法将不同分类器的监测结果集成融合得到最终的监测结果。
本发明采用的技术方案的主要步骤分别如下:
第一步利用集散控制系统收集工业过程正常状态下的数据组成建模用的训练样本集:X=[x1;x2;…;xn]。其中X∈Rn×m,n为样本总数,m为过程变量数。将这些数据存入历史数据库。
第二步对数据集X进行预处理和归一化,使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为
在历史数据库中对训练样本数据进行预处理,剔除野值点和明显的粗糙误差数据,使得训练样本数据的尺度不会影响到监测的结果,对不同过程变量数据分别进行归一化处理,即各个变量的均值为零,方差为1。这样,不同过程变量数据就处在相同的尺度之下,既而不会影响到后续的监控效果。
第三步调用不同的分类器方法,在新的数据矩阵集下建立不同的分类器模型,构造相应的T2和SPE统计量的检测统计限。
3.1、进行PCA建模,可以得到数据矩阵的协方差矩阵S∈Rm×m、酉矩阵U∈Rm×m、特征值构成的对角矩阵Λ∈Rm×m如下所示:
S=UΛUT
Λ=diag(λi),i=1,...,m
U=[u1,u2,...,um]
其中,表示新的数据矩阵集,S表示协方差矩阵,U表示酉矩阵,n表示训练样本数,m为变量数,Λ表示特征值λi构成的对角矩阵,且其对角元素是按照由大到小的顺序排列的diag(·)表示将括号中的量按对角线排列,um表示第m个构成U的列向量。
然后在其基础上得到负荷矩阵P∈Rm×k、残差负荷矩阵主元成分T∈Rn ×k、残差矩阵如下所示:
P=[u1,u2,...,uk]
其中k为提取的主元个数,主要是利用累计方差贡献率(>80%)计算得到的。然后构造T2统计量并利用F分布给出监测统计限对残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
3.2、进行KPCA建模,利用径向基核函数,通过非线性映射将原输入空间映射到高维特征空间,然后在高维特征空间内进行主元分析如上述PCA方法。在高维空间通过求取特征值、特征向量和得分并利用累计方差贡献率(>80%)计算得到主元个数d,得到相应的负荷矩阵、主元。
同样构造T2统计量并利用F分布给出监测统计限对残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
3.3、进行PPCA建模,建立模型如下:
其中P∈Rm×l为观测变量与隐变量之间的关系矩阵即负荷向量,t∈Rl为隐变量,e∈Rm为噪声,l为隐变量维度。通过EM算法进行参数估计,然后分别构造T2和SPE统计量。
3.4、进行PLS建模,建立如下模型,其中X∈Rn×q,Y∈Rn×p,n为样本数,q为输入变量数,p为输出变量数,对X和Y同时进行主成分分解。T和U分别为X和Y的主元得分矩阵,P和Q分别为X和Y的负荷矩阵,E和F为残差矩阵。
X=TPT+E
Y=UQT+F
然后建立X和Y的回归关系,最后构造T2统计量并利用F分布给出监测统计限对输入残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
3.5、进行FA建模,可以得到如下矩阵模型:
其中u∈Rm为均值向量,P∈Rm×l为负载矩阵,t∈Rl为因子,e∈Rm为噪声,l为因子个数。通过EM算法进行参数估计,然后在因子空间和残差空间分别构造T2和SPE统计量。
3.6、进行ICA建模,可以得到该数据矩阵的独立成分矩阵S∈Rr×n,混合矩阵A∈Rm ×r,分离矩阵W∈Rr×m以及残差矩阵如下:
其中r为选取的独立成分个数。然后,构造I2统计量并利用核密度估计方法给出其相应的监测统计限针对残差矩阵构造SPE统计量的监测统计限。
第四步将建模数据和各个模型参数存入历史数据库中备用。
第五步收集新的过程数据,并对其进行预处理和归一化。分别采用不同的分类器模型对其进行监测,即计算T2和SPE统计量,那么每一种分类方法对当前的监测数据样本都可以得到一个正常或者故障的决策。
首先对于新收集的过程数据进行预处理,剔除野值点和明显的粗糙误差数据,然后使用建模时的均值和方差等模型参数对其进行归一化处理。
然后采用不同的分类器模型,建立相应的监测统计量如下:
5.1、对于PCA分析
其中为归一化之后的新数据,tnew为新数据的主元,为残差矩阵,P为负荷矩阵,SPEnew为新数据的SPE统计量值,||·||表示2-范数,Tnew 2为新数据的T2统计量值,T为矩阵的转置。
5.2、对于KPCA分析,同上述的PCA过程。
5.3、对于PPCA分析
M=PTP+λI
Tnew 2=||M-1PTxnew||2
SPEnew=||λ-0.5(xnew-M-1PTxnew)||2
其中xnew为新数据,P为负荷向量,λ为噪声方差值,SPEnew为新数据的SPE统计量值,||·||表示2-范数,Tnew 2为新数据的T2统计量值,T为矩阵的转置。
5.4、对于PLS分析,同PCA过程。
5.5、对于FA分析,同上述PPCA过程。
5.6、对于ICA分析
其中为归一化之后的新数据,snew为基于新数据所提取的独立成分向量,为新数据的I2统计量,继续针对残差向量建立SPE统计量为SPEnew:
第六步根据每一个分类器模型的检测结果构造层次结构模型,通过层次分析法对单一分类器性能进行评价,给出打分排序结果。
6.1、首先调用不同分类器方法,计算每种分类器下不同评价指标的值,如下所示:
准确率(ACC):
真正率(TPR):
假正率(FPR):
真负率(TNR):
假负率(FNR):
Precision:
F值:
其中TP指的是实际为故障样本预测也为故障样本的个数,FP指的是实际为正常样本预测为故障样本的个数,FN指的是实际为故障样本预测为正常样本的个数,TN指的是实际为正常样本预测也为正常样本的个数。Recall召回率也是真正率TPR。
6.2、然后通过层次分析法对单个分类器模型进行打分排序,具体步骤如下:
6.2.1、建立层次结构模型
选取ACC、F值、TPR、FPR、TNR、FNR、Precision评价指标作为准则层指标。选取PCA、KPCA、PPCA、PLS、FA、ICA作为方案层备选方案,构造决策评价层次模型。
6.2.2、构造判断矩阵
设某层有n个因素,要比较它们对上一层某一准则(或目标)的影响程度,确定在该层中相对于某一准则所占的比重。(即把n个因素对上层某一目标的影响程度排序)
上述比较是两两因素之间进行的比较,比较时取1~9尺度。
用aij表示第i个因素相对于第j个因素的比较结果,则A称为成对比较矩阵。
6.2.3、层次单排序
对每个成对比较矩阵计算最大特征值λ及其对应的归一化特征向量。
6.2.4、一致性检验
利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验。
随机一致性指标RI数值
当CR<0.1时,通过一致性检验,否则重新构造成对比较矩阵
6.2.5、层次总排序
确定某层所有因素对于总目标相对重要性的排序权值过程,称为层次总排序。从最高层到最低层逐层进行。设:
A层m个因素A1,A2,…,Am对总目标Z的排序为a1,a2,…,am
B层n个因素对上层中A因素Aj的层次单排序为b1j,b2j,…,bnj(j=1,2,…,m)
B层的层次总排序为
B1:a1b11+a2b12+…amb1m
B2:a1b21+a2b22+…amb2m
…
Bn:a1bn1+a2bn2+…ambnm
即B层第i个因素对总目标的权值
第七步结合加权投票决策融合方法,通过不同分类器对不同故障检测率的先验知识,计算当前监测数据在所有分类器方法下的综合检出率,做出最后决策。
7.1、首先调用不同的分类器方法,得到相应的融合矩阵CMk。
其中G是选择分类器的个数,指的是第k个分类器方法将实际为第i类的样本判定为第j类的样本个数,M为类别数。
7.2、然后计算出相应的分类概率值,如下所示:
其中指的是第k个分类器方法的融合矩阵中的第i行第j列的元素,Vk(Ci)指的是当第k个分类器将样本分为第Cj类时,样本实际来自第Ci类的概率值。
7.3、然后根据上一步层次分析法得到的各分类器的权重,计算出加权分类概率值。
其中ωk为第k个分类器通过层次分析法进行模型评价后的得分,M为类别数。
7.4、对于融合后的加权分类概率值,通过比较正常和故障两种类别下,选择最大值作为最后的检测结果。
其中argmax{}表示括号内取最大值时对应的Ci输出值。
以下结合一个具体的工业过程的例子来说明本发明的有效性。该过程的数据来自美国TE(Tennessee Eastman——田纳西-伊斯曼)化工过程实验,原型是Eastman化学公司的一个实际工艺流程。目前,TE过程己经作为典型的化工过程故障检测与诊断对象被广泛研究。整个TE过程包括41个测量变量和12个操作变量(控制变量),其中41个测量变量包括22个连续测量变量和19个成分测量值,它们每3分钟被采样一次。其中包括21批故障数据。这些故障中,16个是己知的,5个是未知的。故障1~7与过程变量的阶跃变化有关,如冷却水的入口温度或者进料成分的变化。故障8~12与一些过程变量的可变性增大有关系。故障13是反应动力学中的缓慢漂移,故障14、15和21是与粘滞阀有关的。故障16~20是未知的。为了对该过程进行监测,一共选取了16个过程变量,如表1所示。接下来结合该具体过程对本发明的实施步骤进行详细地阐述:
1、采集正常过程数据作为训练样本数据,进行数据预处理和归一化
2、针对预处理和归一化后的训练样本数据,调用不同的分类器方法,分别建立不同的分类器模型并确定相应统计量的置信限
经过剔除野值点和粗糙误差点以及归一化后的数据集为对新的数据矩阵进行模型建立:
2.1、进行PCA分析和建模,选取9个主元成分,得到详细的PCA模型。然后构造T2统计量并用F分布确定其相应的监测统计限。同理,利用卡尔方分布确定SPE统计量的监测置信限。这里,我们选取两个统计量的置信度均为99%。
2.2、进行KPCA分析和建模,选取5个主元成分,得到详细的KPCA模型。然后构造T2统计量并用F分布确定其相应的监测统计限。同理,利用卡尔方分布可以确定SPE统计量的置信限。我们选取两个统计量的置信度均为99%。
2.3、进行PPCA分析和建模,选取隐变量维度为2,通过EM算法进行参数估计得到详细的PPCA模型。然后构造T2统计量及其相应的监测统计限以及SPE统计量及其相应统计限。
2.4、进行PLS分析和建模,选取22个输入变量,5个输出变量,得到详细的PLS模型。然后构造T2统计量及其相应的监测统计限以及SPE统计量及其相应统计限。
2.5、进行FA分析和建模,选取隐变量维度为2,通过EM算法进行参数估计得到详细的FA模型。然后构造T2统计量及其相应的监测统计限以及SPE统计量及其相应统计限。
2.6、进行ICA分析和建模,选取4个独立成分,得到详细的ICA模型参数信息,即独立成分信息S∈R4×960,混合矩阵A∈R16×4,分离矩阵W∈R4×16以及残差矩阵然后构造I2统计量并由核密度估计方法确定其相应的监测统计限。同理,可以确定SPE统计量的置信限。我们选取两个统计量的置信度均为99%。
3、获取当前监测数据信息,计算不同分类器的监测效果
为了测试新方法的有效性,分别对21个故障进行测试。首先对当前监测数据进行预处理和归一化,然后分别计算21种故障在6种不同分类器下的监测效果,计算出ACC、F值、TPR、FPR、TNR、FNR、Precision等指标。
4、通过层次分析法对各个分类器模型进行打分排序
选取ACC、F值、TPR、FPR、TNR、FNR、Precision评价指标作为准则层指标。选取PCA、KPCA、PPCA、PLS、FA、ICA作为方案层备选方案,构造如图1所示决策评价层次模型。针对每个故障得到6种不同分类器模型的打分,然后将每个分类器模型在21种故障下的打分求取平均,得到6种不同分类器模型的最终得分如表2所示,作为最终融合算法的权重。
5、在线过程监测
首先运用6种不同分类器模型对21个故障分别进行监测,以故障1为例6种分类器模型的监测结果如图2-图7所示,然后用新的融合方法将6种分类器模型的监测结果进行集成融合得到最终的决策结果,如表3所示。
从表3种可以看出,新的方法与单一分类器相比,故障检测准确率更高,特别是单一分类器检测效果不好的,通过新的方法可以对故障做出较好的检测。
表1:监控变量说明
序号 | 变量 | 序号 | 变量 |
1 | A进料(流1) | 9 | 产品分离器温度 |
2 | D进料(流2) | 10 | 产品分离器压力 |
3 | E进料(流3) | 11 | 产品分离器塔底低流量(流10) |
4 | 总进料(流4) | 12 | 汽提器压力 |
5 | 再循环流量(流8) | 13 | 汽提器温度 |
6 | 反应器进料速度(流6) | 14 | 汽提器流量 |
7 | 反应器温度 | 15 | 反应器冷却水出口温度 |
8 | 排放速度(流9) | 16 | 分离器冷却水出口温度 |
表2:不同分类器模型的得分结果
分类器模型 | PCA | KPCA | PPCA | PLS | FA | ICA |
分数 | 0.1572 | 0.1728 | 0.1677 | 0.1691 | 0.1683 | 0.1649 |
表3:本发明方法和单一分类器方法对TE过程故障检测结果
PCA | KPCA | PPCA | PLS | FA | ICA | Fusion | |
Fault1 | 0.9958 | 0.9948 | 0.9938 | 0.9938 | 0.9938 | 0.9927 | 0.9969 |
Fault2 | 0.9844 | 0.9833 | 0.9833 | 0.9844 | 0.9865 | 0.9833 | 0.9854 |
Fault3 | 0.1781 | 0.1917 | 0.1906 | 0.2052 | 0.1792 | 0.1875 | 0.2479 |
Fault4 | 0.176 | 0.1844 | 0.1729 | 0.1917 | 0.175 | 0.175 | 0.2083 |
Fault5 | 0.276 | 0.3708 | 0.374 | 0.3708 | 0.3448 | 0.376 | 0.425 |
Fault6 | 0.999 | 0.9979 | 0.999 | 0.9938 | 0.999 | 0.999 | 0.999 |
Fault7 | 0.3417 | 0.5125 | 0.4677 | 0.4438 | 0.4083 | 0.4667 | 0.5365 |
Fault8 | 0.9323 | 0.9792 | 0.9781 | 0.9729 | 0.9781 | 0.9729 | 0.9792 |
Fault9 | 0.1802 | 0.1927 | 0.1896 | 0.1938 | 0.1781 | 0.1802 | 0.7938 |
Fault10 | 0.3833 | 0.7615 | 0.5135 | 0.4531 | 0.7781 | 0.5781 | 0.9083 |
Fault11 | 0.5542 | 0.4969 | 0.4865 | 0.5188 | 0.4656 | 0.449 | 0.6188 |
Fault12 | 0.875 | 0.9854 | 0.9875 | 0.9781 | 0.9875 | 0.9823 | 0.9906 |
Fault13 | 0.9448 | 0.9635 | 0.9521 | 0.9542 | 0.9542 | 0.9552 | 0.9625 |
Fault14 | 0.9979 | 0.9969 | 0.9979 | 0.9938 | 0.9979 | 0.9958 | 0.9979 |
Fault15 | 0.1865 | 0.2302 | 0.1938 | 0.2 | 0.1854 | 0.1844 | 0.2563 |
Fault16 | 0.2271 | 0.4073 | 0.3656 | 0.3333 | 0.3177 | 0.2792 | 0.6198 |
Fault17 | 0.9604 | 0.9688 | 0.9531 | 0.9531 | 0.951 | 0.949 | 0.9677 |
Fault18 | 0.9177 | 0.9156 | 0.9115 | 0.9135 | 0.9156 | 0.9125 | 0.9219 |
Fault19 | 0.1969 | 0.2813 | 0.3583 | 0.4198 | 0.3469 | 0.3521 | 0.6583 |
Fault20 | 0.45 | 0.6292 | 0.4719 | 0.5365 | 0.6677 | 0.5948 | 0.7854 |
Fault21 | 0.4906 | 0.5594 | 0.5552 | 0.5927 | 0.5135 | 0.349 | 0.6396 |
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。
Claims (5)
1.一种基于层次分析法和加权投票决策融合的故障检测方法,其特征在于,包括以下步骤:
(1)利用系统收集过程正常工况的数据组成建模用的训练样本集:X=[x1;x2;…;xn]。其中X∈Rn×m,n为训练样本数,m为过程变量数,R为实数集,Rn×m表示X满足n×m的二维分布。将这些数据存入历史数据库。
(2)对数据集X进行预处理和归一化,使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为
(3)调用不同的分类器方法,选择分类器的个数为G,在新的数据矩阵集下建立不同的分类器模型,构造相应的T2和SPE统计量的检测统计限。
(4)将建模数据和各个模型参数存入历史数据库中备用。
(5)收集新的过程数据,并对其进行预处理和归一化。分别采用不同的分类器模型对其进行监测,即计算T2和SPE统计量,那么每一种分类方法对当前的监测数据样本都可以得到一个正常或者故障的决策。
(6)根据每一个分类器模型的检测结果构造层次结构模型,通过层次分析法对单一分类器性能进行评价,给出打分排序结果。
(7)结合加权投票决策融合方法,通过不同分类器对不同故障检测率的先验知识,计算当前监测数据在所有分类器方法下的综合检出率,做出最后决策。
2.根据权利要求1所述基于层次分析法和加权投票决策融合的工业过程故障检测方法,其特征在于,所述步骤(3)具体为:选择G为6种不同的多分类器方法,具体包括:主元分析(PCA)、核主元分析(KPCA)、概率主元分析(PPCA)、偏最小二乘分析(PLS)、因子分析(FA)、独立成分分析(ICA);以新的数据矩阵集作为训练样本,构造统计量以及统计限,建立相应的分类器模型。具体实现步骤如下所示:
(3.1)进行PCA建模,可以得到数据矩阵的协方差矩阵S∈Rm×m、酉矩阵U∈Rm×m、特征值构成的对角矩阵Λ∈Rm×m如下所示:
S=UΛUT
Λ=diag(λi),i=1,...,m
U=[u1,u2,...,um]
其中,表示新的数据矩阵集,S表示协方差矩阵,U表示酉矩阵,n表示训练样本数,m为变量数,Λ表示特征值λi构成的对角矩阵,且其对角元素是按照由大到小的顺序排列的diag(i)表示将括号中的量按对角线排列,um表示第m个构成U的列向量。
然后在其基础上得到负荷矩阵P∈Rm×k、残差负荷矩阵主元成分T∈Rn×k、残差矩阵如下所示:
P=[u1,u2,...,uk]
其中k为提取的主元个数,主要是利用累计方差贡献率(>80%)计算得到的。然后构造T2统计量并利用F分布给出监测统计限对残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
(3.2)进行KPCA建模,利用径向基核函数,通过非线性映射将原输入空间映射到高维特征空间,然后在高维特征空间内进行主元分析如上述PCA方法。在高维空间通过求取特征值、特征向量和得分并利用累计方差贡献率(>80%)计算得到主元个数d,得到相应的负荷矩阵、主元。
同样构造T2统计量并利用F分布给出监测统计限对残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
(3.3)进行PPCA建模,建立模型如下:
其中P∈Rm×l为观测变量与隐变量之间的关系矩阵即负荷向量,t∈Rl为隐变量,e∈Rm为噪声,l为隐变量维度。通过EM算法估计参数,然后分别构造T2和SPE统计量。
(3.4)进行PLS建模,建立如下模型,其中X∈Rn×q,Y∈Rn×p,n为样本数,q为输入变量数,p为输出变量数,对X和Y同时进行主成分分解。T和U分别为X和Y的主元得分矩阵,P和Q分别为X和Y的负荷矩阵,E和F为残差矩阵。
X=TPT+E
Y=UQT+F
然后建立X和Y的回归关系,最后构造T2统计量并利用F分布给出监测统计限对输入残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
(3.5)进行FA建模,可以得到如下矩阵模型:
其中u∈Rm为均值向量,P∈Rm×l为负载矩阵,t∈Rl为因子,e∈Rm为噪声,l为因子个数。通过EM算法进行参数估计,然后在因子空间和残差空间分别构造T2和SPE统计量。(3.6)进行ICA建模,可以得到该数据矩阵的独立成分矩阵S∈Rr×n,混合矩阵A∈Rm×r,分离矩阵W∈Rr ×m以及残差矩阵如下:
其中r为选取的独立成分个数。然后,构造I2统计量并利用核密度估计方法给出其相应的监测统计限对残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
3.根据权利要求1所述基于层次分析法和加权投票决策融合的工业过程故障检测方法,其特征在于,所述步骤(5)具体为:对于归一化之后的新数据分别采用不同的分类器模型对其进行监测,建立相应的监测统计量如下:
(5.1)对于PCA分析
其中为归一化之后的新数据,tnew为新数据的主元,为残差矩阵,P为负荷矩阵,SPEnew为新数据的SPE统计量值,||·||表示2-范数,Tnew 2为新数据的T2统计量值,T为矩阵的转置。
(5.2)对于KPCA分析,同上述的PCA过程。
(5.3)对于PPCA分析
M=PTP+λI
Tnew 2=||M-1PTxnew||2
SPEnew=||λ-0.5(xnew-M-1PTxnew)||2
其中xnew为新数据,P为负荷向量,λ为噪声方差值,SPEnew为新数据的SPE统计量值,||·||表示2-范数,Tnew 2为新数据的T2统计量值,T为矩阵的转置。
(5.4)对于PLS分析,同PCA过程。
(5.5)对于FA分析,同上述PPCA过程。
(5.6)对于ICA分析
其中为归一化之后的新数据,snew为基于新数据所提取的独立成分向量,为新数据的I2统计量,继续针对残差向量建立SPE统计量为SPEnew:
4.根据权利要求1所述基于层次分析法和加权投票决策融合的工业过程故障检测方法,其特征在于,所述步骤(6)具体为:
(6.1)首先调用不同分类器方法,计算每种分类器下不同评价指标的值,如下所示:
准确率(ACC):
真正率(TPR):
假正率(FPR):
真负率(TNR):
假负率(FNR):
Precision:
F值:
其中TP指的是实际为故障样本预测也为故障样本的个数,FP指的是实际为正常样本预测为故障样本的个数,FN指的是实际为故障样本预测为正常样本的个数,TN指的是实际为正常样本预测也为正常样本的个数。Recall召回率也是真正率TPR。
(6.2)然后通过层次分析法对单个分类器模型进行打分排序,具体步骤如下:
(6.2.1)建立层次结构模型
选取ACC、F值、TPR、FPR、TNR、FNR、Precision评价指标作为准则层指标。选取PCA、KPCA、PPCA、PLS、FA、ICA作为方案层备选方案,构造决策评价层次模型。
(6.2.2)构造判断矩阵
设某层有n个因素,要比较它们对上一层某一准则(或目标)的影响程度,确定在该层中相对于某一准则所占的比重。(即把n个因素对上层某一目标的影响程度排序)
上述比较是两两因素之间进行的比较,比较时取1~9尺度。
用aij表示第i个因素相对于第j个因素的比较结果,则A称为成对比较矩阵。
(6.2.3)层次单排序
对每个成对比较矩阵计算最大特征值λ及其对应的归一化特征向量。
(6.2.4)一致性检验
利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验。
随机一致性指标RI数值
当CR<0.1时,通过一致性检验,否则重新构造成对比较矩阵
(6.2.5)层次总排序
确定某层所有因素对于总目标相对重要性的排序权值过程,称为层次总排序。从最高层到最低层逐层进行。设:
A层m个因素A1,A2,…,Am对总目标Z的排序为a1,a2,…,am
B层n个因素对上层中A因素Aj的层次单排序为b1j,b2j,…,bnj(j=1,2,…,m)
B层的层次总排序为
B1:a1b11+a2b12+…amb1m
B2:a1b21+a2b22+…amb2m
…
Bn:a1bn1+a2bn2+…ambnm
即B层第i个因素对总目标的权值
5.根据权利要求1所述基于层次分析法和加权投票决策融合的工业过程故障检测方法,其特征在于,所述步骤(7)具体为:
(7.1)首先调用不同的分类器方法,得到相应的融合矩阵CMk。
其中G是选择分类器的个数,指的是第k个分类器方法将实际为第i类的样本判定为第j类的样本个数,M为类别数。
(7.2)然后计算出相应的分类概率值,如下所示:
其中指的是第k个分类器方法的融合矩阵中的第i行第j列的元素,Vk(Ci)指的是当第k个分类器将样本分为第Cj类时,样本实际来自第Ci类的概率值。
(7.3)然后根据上一步层次分析法得到的各分类器的权重,计算出加权分类概率值。
其中ωk为第k个分类器通过层次分析法进行模型评价后的得分,M为类别数。
(7.4)对于融合后的加权分类概率值,通过比较正常和故障两种类别下,选择最大值作为最后的检测结果。
其中argmax{}表示括号内取最大值时对应的Ci输出值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610834407.3A CN106355030B (zh) | 2016-09-20 | 2016-09-20 | 一种基于层次分析法和加权投票决策融合的故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610834407.3A CN106355030B (zh) | 2016-09-20 | 2016-09-20 | 一种基于层次分析法和加权投票决策融合的故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106355030A true CN106355030A (zh) | 2017-01-25 |
CN106355030B CN106355030B (zh) | 2019-01-25 |
Family
ID=57858286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610834407.3A Active CN106355030B (zh) | 2016-09-20 | 2016-09-20 | 一种基于层次分析法和加权投票决策融合的故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106355030B (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092827A (zh) * | 2017-03-30 | 2017-08-25 | 中国民航大学 | 一种基于改进森林算法的Android恶意软件检测方法 |
CN108052975A (zh) * | 2017-12-12 | 2018-05-18 | 浙江大学宁波理工学院 | 一种基于核主元和神经网络的车辆运行实时工况预测方法 |
CN108181893A (zh) * | 2017-12-15 | 2018-06-19 | 宁波大学 | 一种基于pca-kdr的故障检测方法 |
CN108572639A (zh) * | 2018-03-19 | 2018-09-25 | 宁波大学 | 一种基于主成分自相关性剔除的动态过程监测方法 |
CN108734192A (zh) * | 2018-01-31 | 2018-11-02 | 国家电网公司 | 一种基于投票机制的支持向量机机械故障诊断方法 |
CN108985380A (zh) * | 2018-07-25 | 2018-12-11 | 西南交通大学 | 一种基于聚类集成的转辙机故障识别方法 |
CN109146076A (zh) * | 2018-08-13 | 2019-01-04 | 东软集团股份有限公司 | 模型生成方法及装置、数据处理方法及装置 |
CN109325553A (zh) * | 2018-12-04 | 2019-02-12 | 山东建筑大学 | 一种风电齿轮箱故障检测方法、系统、设备及介质 |
CN109492710A (zh) * | 2018-12-07 | 2019-03-19 | 天津智行瑞祥汽车科技有限公司 | 一种新能源汽车故障检测辅助方法 |
CN109660418A (zh) * | 2018-07-19 | 2019-04-19 | 中国人民解放军32125部队 | 基于神经网络的机动通信台站通信保障能力评估方法、系统及电子设备 |
CN109936470A (zh) * | 2017-12-18 | 2019-06-25 | 中国电子科技集团公司第十五研究所 | 一种异常检测方法 |
CN110866530A (zh) * | 2019-11-13 | 2020-03-06 | 云南大学 | 一种字符图像识别方法、装置及电子设备 |
CN110879373A (zh) * | 2019-12-12 | 2020-03-13 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种神经网络和决策融合的油浸式变压器故障诊断方法 |
CN111209937A (zh) * | 2019-12-27 | 2020-05-29 | 深圳智链物联科技有限公司 | 一种充电曲线模型的分类方法、装置以及服务器 |
CN111412928A (zh) * | 2020-03-26 | 2020-07-14 | 北京控制工程研究所 | 一种深空着陆测速多波束故障检测与选取方法 |
CN111695780A (zh) * | 2020-05-18 | 2020-09-22 | 北京科技大学 | 一种工艺流程质量多故障自主检测方法及系统 |
CN112070535A (zh) * | 2020-09-03 | 2020-12-11 | 常州微亿智造科技有限公司 | 电动汽车价格预测方法和装置 |
CN112199829A (zh) * | 2020-09-27 | 2021-01-08 | 浙江大学 | 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法 |
CN113011530A (zh) * | 2021-04-29 | 2021-06-22 | 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) | 一种基于多分类器融合的智能电表故障预测方法 |
CN113052437A (zh) * | 2021-03-05 | 2021-06-29 | 北京中医药大学 | 一种智能制造多源信息融合方法在中药大蜜丸质量评价中的应用 |
CN113051530A (zh) * | 2021-04-02 | 2021-06-29 | 西安建筑科技大学 | 一种基于kde-fa的冷水机组故障特征刻画方法 |
CN113191459A (zh) * | 2021-05-27 | 2021-07-30 | 山东高速建设管理集团有限公司 | 一种基于路侧激光雷达的在途目标分类方法 |
CN114626449A (zh) * | 2022-03-03 | 2022-06-14 | 南京航空航天大学 | 一种基于最小二乘确权法的对抗环境下目标识别网络退化分析方法 |
CN114639005A (zh) * | 2022-05-20 | 2022-06-17 | 湖北省国土测绘院 | 多分类器融合的农作物自动分类方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040225587A1 (en) * | 2003-04-30 | 2004-11-11 | General Electric Company | Fusion classification for risk categorization in underwriting a financial risk instrument |
CN103901880A (zh) * | 2014-04-01 | 2014-07-02 | 浙江大学 | 基于多分类器和d-s证据融合的工业过程故障检测方法 |
CN103914064A (zh) * | 2014-04-01 | 2014-07-09 | 浙江大学 | 基于多分类器和d-s证据融合的工业过程故障诊断方法 |
CN104484678A (zh) * | 2015-01-07 | 2015-04-01 | 青岛理工大学 | 基于故障类型分类能力评价矩阵的多分类器融合故障诊断方法 |
-
2016
- 2016-09-20 CN CN201610834407.3A patent/CN106355030B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040225587A1 (en) * | 2003-04-30 | 2004-11-11 | General Electric Company | Fusion classification for risk categorization in underwriting a financial risk instrument |
CN103901880A (zh) * | 2014-04-01 | 2014-07-02 | 浙江大学 | 基于多分类器和d-s证据融合的工业过程故障检测方法 |
CN103914064A (zh) * | 2014-04-01 | 2014-07-09 | 浙江大学 | 基于多分类器和d-s证据融合的工业过程故障诊断方法 |
CN104484678A (zh) * | 2015-01-07 | 2015-04-01 | 青岛理工大学 | 基于故障类型分类能力评价矩阵的多分类器融合故障诊断方法 |
Non-Patent Citations (2)
Title |
---|
ZHIQIANG GE ET AL.: "Performance-driven ensemble learning ICA model for improved non-Gaussian process monitoring", 《CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS》 * |
兰远东 等: "动态加权投票的多分类器聚合", 《研究与开发》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092827A (zh) * | 2017-03-30 | 2017-08-25 | 中国民航大学 | 一种基于改进森林算法的Android恶意软件检测方法 |
CN108052975A (zh) * | 2017-12-12 | 2018-05-18 | 浙江大学宁波理工学院 | 一种基于核主元和神经网络的车辆运行实时工况预测方法 |
CN108181893A (zh) * | 2017-12-15 | 2018-06-19 | 宁波大学 | 一种基于pca-kdr的故障检测方法 |
CN108181893B (zh) * | 2017-12-15 | 2020-06-16 | 宁波大学 | 一种基于pca-kdr的故障检测方法 |
CN109936470A (zh) * | 2017-12-18 | 2019-06-25 | 中国电子科技集团公司第十五研究所 | 一种异常检测方法 |
CN108734192B (zh) * | 2018-01-31 | 2021-10-15 | 国家电网公司 | 一种基于投票机制的支持向量机机械故障诊断方法 |
CN108734192A (zh) * | 2018-01-31 | 2018-11-02 | 国家电网公司 | 一种基于投票机制的支持向量机机械故障诊断方法 |
CN108572639B (zh) * | 2018-03-19 | 2020-06-30 | 宁波大学 | 一种基于主成分自相关性剔除的动态过程监测方法 |
CN108572639A (zh) * | 2018-03-19 | 2018-09-25 | 宁波大学 | 一种基于主成分自相关性剔除的动态过程监测方法 |
CN109660418A (zh) * | 2018-07-19 | 2019-04-19 | 中国人民解放军32125部队 | 基于神经网络的机动通信台站通信保障能力评估方法、系统及电子设备 |
CN108985380B (zh) * | 2018-07-25 | 2021-08-03 | 西南交通大学 | 一种基于聚类集成的转辙机故障识别方法 |
CN108985380A (zh) * | 2018-07-25 | 2018-12-11 | 西南交通大学 | 一种基于聚类集成的转辙机故障识别方法 |
CN109146076A (zh) * | 2018-08-13 | 2019-01-04 | 东软集团股份有限公司 | 模型生成方法及装置、数据处理方法及装置 |
CN109325553A (zh) * | 2018-12-04 | 2019-02-12 | 山东建筑大学 | 一种风电齿轮箱故障检测方法、系统、设备及介质 |
CN109325553B (zh) * | 2018-12-04 | 2020-12-01 | 山东建筑大学 | 一种风电齿轮箱故障检测方法、系统、设备及介质 |
CN109492710A (zh) * | 2018-12-07 | 2019-03-19 | 天津智行瑞祥汽车科技有限公司 | 一种新能源汽车故障检测辅助方法 |
CN110866530A (zh) * | 2019-11-13 | 2020-03-06 | 云南大学 | 一种字符图像识别方法、装置及电子设备 |
CN110879373A (zh) * | 2019-12-12 | 2020-03-13 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种神经网络和决策融合的油浸式变压器故障诊断方法 |
CN111209937A (zh) * | 2019-12-27 | 2020-05-29 | 深圳智链物联科技有限公司 | 一种充电曲线模型的分类方法、装置以及服务器 |
CN111209937B (zh) * | 2019-12-27 | 2024-03-29 | 深圳智链物联科技有限公司 | 一种充电曲线模型的分类方法、装置以及服务器 |
CN111412928A (zh) * | 2020-03-26 | 2020-07-14 | 北京控制工程研究所 | 一种深空着陆测速多波束故障检测与选取方法 |
CN111412928B (zh) * | 2020-03-26 | 2021-08-10 | 北京控制工程研究所 | 一种深空着陆测速多波束故障检测与选取方法 |
CN111695780B (zh) * | 2020-05-18 | 2023-04-18 | 北京科技大学 | 一种工艺流程质量多故障自主检测方法及系统 |
CN111695780A (zh) * | 2020-05-18 | 2020-09-22 | 北京科技大学 | 一种工艺流程质量多故障自主检测方法及系统 |
CN112070535A (zh) * | 2020-09-03 | 2020-12-11 | 常州微亿智造科技有限公司 | 电动汽车价格预测方法和装置 |
CN112199829A (zh) * | 2020-09-27 | 2021-01-08 | 浙江大学 | 基于密度峰值聚类和即时学习的多工况多阶段批次过程监测方法 |
CN113052437A (zh) * | 2021-03-05 | 2021-06-29 | 北京中医药大学 | 一种智能制造多源信息融合方法在中药大蜜丸质量评价中的应用 |
CN113051530A (zh) * | 2021-04-02 | 2021-06-29 | 西安建筑科技大学 | 一种基于kde-fa的冷水机组故障特征刻画方法 |
CN113011530A (zh) * | 2021-04-29 | 2021-06-22 | 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) | 一种基于多分类器融合的智能电表故障预测方法 |
CN113191459A (zh) * | 2021-05-27 | 2021-07-30 | 山东高速建设管理集团有限公司 | 一种基于路侧激光雷达的在途目标分类方法 |
CN114626449A (zh) * | 2022-03-03 | 2022-06-14 | 南京航空航天大学 | 一种基于最小二乘确权法的对抗环境下目标识别网络退化分析方法 |
CN114639005A (zh) * | 2022-05-20 | 2022-06-17 | 湖北省国土测绘院 | 多分类器融合的农作物自动分类方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106355030B (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106355030B (zh) | 一种基于层次分析法和加权投票决策融合的故障检测方法 | |
CN106371427B (zh) | 基于层次分析法和模糊融合的工业过程故障分类方法 | |
CN103914064B (zh) | 基于多分类器和d-s证据融合的工业过程故障诊断方法 | |
CN106649789B (zh) | 一种基于集成半监督费舍尔判别的工业过程故障分类方法 | |
CN109685366A (zh) | 基于异变数据的装备健康状态评估方法 | |
CN102496069B (zh) | 基于模糊层次分析法的电缆多状态安全运行评估方法 | |
CN109857835A (zh) | 一种基于认知诊断理论的自适应网络安全知识测评方法 | |
CN106093612A (zh) | 一种电力变压器故障诊断方法 | |
CN109086793A (zh) | 一种风力发电机的异常识别方法 | |
CN106021771A (zh) | 一种故障诊断方法及装置 | |
CN107688825A (zh) | 一种改进型的集成加权极限学习机污水处理故障诊方法 | |
CN103488869A (zh) | 一种最小二乘支持向量机的风力发电短期负荷预测方法 | |
CN103489005A (zh) | 一种基于多分类器融合的高分辨率遥感影像分类方法 | |
CN103901880A (zh) | 基于多分类器和d-s证据融合的工业过程故障检测方法 | |
CN111680875B (zh) | 基于概率基线模型的无人机状态风险模糊综合评价方法 | |
CN112756759B (zh) | 点焊机器人工作站故障判定方法 | |
CN101404071A (zh) | 基于分组粒子群算法的电子电路故障诊断神经网络方法 | |
CN106482967A (zh) | 一种代价敏感支持向量机机车车轮检测系统及方法 | |
CN110135708A (zh) | 基于ahp和信息熵的球阀质量多级模糊综合评价方法 | |
CN106681305A (zh) | 一种Fast RVM污水处理在线故障诊断方法 | |
CN114707571B (zh) | 基于增强隔离森林的信用数据异常检测方法 | |
CN110223193A (zh) | 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统 | |
CN111767657B (zh) | 一种核动力系统故障诊断方法和系统 | |
CN106326915A (zh) | 一种基于改进核Fisher的化工过程故障诊断方法 | |
CN115419558A (zh) | 一种风电机组运行状态评估方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |