CN109407649B - 一种基于故障特征变量选择的故障类型匹配方法 - Google Patents
一种基于故障特征变量选择的故障类型匹配方法 Download PDFInfo
- Publication number
- CN109407649B CN109407649B CN201811213323.3A CN201811213323A CN109407649B CN 109407649 B CN109407649 B CN 109407649B CN 201811213323 A CN201811213323 A CN 201811213323A CN 109407649 B CN109407649 B CN 109407649B
- Authority
- CN
- China
- Prior art keywords
- fault
- matrix
- vector
- data
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
- G05B23/0245—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a qualitative model, e.g. rule based; if-then decisions
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开一种基于故障特征变量选择的故障类型匹配方法,旨在解决如何在各故障类型训练样本数据量有限的前提下,针对历史数据库中各故障类型实施故障特征变量选择,并利用该特征变量实施故障类型匹配的问题。具体来讲,本发明方法首先利用近邻成分分析逐个找出各故障类型可用数据对比正常工况数据之间出现异常变化的特征变量。然后,利用故障特征变量实施窗口矩阵之间的相似度计算。最后,通过最大相似度判别故障类型。本发明方法利用各故障的特征变量实施故障类型匹配不仅能消除非特征变量的干扰影响,而且还能直接降低变量维数,从而使样本数有限的问题不显得那么突出。因此,本发明方法是一种更为优选的故障诊断方法。
Description
技术领域
本发明涉及一种数据驱动的故障诊断方法,尤其涉及一种基于故障特征变量选择的故障类型匹配方法。
背景技术
一般而言,对生产过程运行状态实施监测的目的首先在于及时而准确地发现故障,其次在于识别出故障的根源或者故障类型。因此,故障检测与故障诊断两者缺一不可,它们对于保证安全生产与维持产品质量稳定是具有重要意义的。纵观近年来在过程监测领域的研究成果,针对故障检测的研究层出不穷,而针对故障诊断的研究成果却屈指可数。这种现象在数据驱动的故障诊断研究领域尤为突出,与可用的故障检测方法技术相比,现有科研文献与专利中少有故障诊断方面的成果。通常来讲,故障诊断发展至今大体有两种思路:其一是找出故障根源,主要依赖于正确地定位出异常测量变量;其二是通过匹配历史数据库中的已知故障类型,以识别出当前被检测出故障的类型。前者依赖于测量变量的贡献度,而后者则多借鉴于模式识别领域的分类方法。
然而,与传统模式识别问题不同的是,故障分类所能使用的数据皆采集自工况切换的过渡过程阶段。各故障类型的训练数据变化情况优化复杂,且各故障发生后会导致不同测量变量出现不同程度的异常变化。此外,在故障发生后,现场操作人员会在第一时间内将过程修复至正常运行状态,各种故障工况下采集到的数据量通常也是有限的。针对故障分类的研究若是直接采用模式识别领域常用的分类算法如判别分析、支持向量机、神经网络等建立多分类模型通常得不到满意的效果。此外,支持向量机与神经网络需要大量的数据实施训练才能保证模型精度,它们通常不适合用作故障分类诊断。
从不同故障类型的角度出发,各个故障类型会引起不同测量变量出现异常变化,为各个故障类型挑选出相对应的故障特征变量是实施故障类型识别首先需要考虑的问题。因为,特征变量的选择不仅可以降低测量变量的维数,使得样本数有限的问题不那么明显,而且还可以剔除非特征变量的干扰影响。可是,在有限的故障训练样本数据量下,如何甄别出这些特征变量同时给解决该问题提出了较大的挑战。最后,如何在甄别出的故障特征变量的基础上实施故障类型识别是最后一个需要考虑的问题。
发明内容
本发明所要解决的主要技术问题是:如何在各故障类型训练样本数据量有限的前提下,针对历史数据库中各故障类型实施故障特征变量选择,并利用该特征变量实施故障类型匹配。为此,本发明方法利用近邻成分分析(Neighborhood Component Analysis,NCA)这种依赖于单个样本之间近邻关系的算法,逐个找出各故障类型可用数据对比正常工况数据之间出现异常变化的特征变量。然后,利用故障特征变量实施窗口矩阵之间的相似度计算。最后,通过最大相似度判别故障类型。
本发明解决上述技术问题所采用的技术方案为:一种基于故障特征变量选择的故障类型匹配方法,包括以下步骤:
(1):从生产过程历史数据库中找到不同故障工况条件下的采样数据,组成各个参考故障的数据矩阵X1,X2,…,XC,其中Nc为第c种故障的可用样本数,下标号c=1,2,…,C,R为实数集,表示Nc×m维的实数矩阵,m为过程测量变量的总个数,C为参考故障的类别总数。
(5):利用近邻成分分析(NCA)算法优化求解出权重系数向量wc,NCA算法的原理与具体实施过程如下所示。
NCA算法是一种简单易操作的距离测度学习算法,它通过优化留一法的交叉验证结果来求得在分类问题中各变量的权重系数,从而提高样本分类的效果。
给定n个样本x1,x2,…,xn,各样本向量xi∈R1×m中对应有m个属性或变量的测量值,各个样本对应的类标号组成向量y∈Rn×1,在权重系数向量w∈R1×m的条件下可根据如下所示公式计算出各样本之间的距离Dw(xi,xj):
Dw(xi,xj)=||(xi-xj)diag(w)|| (2)
上式中,i=1,2,…,n,j=1,2,…,n,Dw(xi,xj)=||(xi-xj)diag(wc)||,diag(wc)表示将wc中的元素转变成对角矩阵,符号|| ||表示计算向量的长度。定义一个概率指标pij:样本点xi选择样本点xj作为其近邻同时继承xj对应的类标号的概率。pij的计算公式如下所示:
这样一来,将样本xi通过近邻样本正确分类的概率pi可按照如下所示公式计算:
上式中,当且仅当xi与xj归属同一类时,yij=1,其他情况yij=0。那么,NCA算法优化权重系数向量w的目标函数如下所示:
可通过梯度下降法求出最优化的权重系数向量w,在梯度法迭代过程中需计算其梯度Δf:
NCA算法优化权重系数向量的具体实施过程包括以下步骤:
①初始化梯度步长α=1、初始化目标函数值f0(w)=-106、以及初始化权重系数向量w=[1,1,…,1],即各变量的权重系数初始值统一设置为1。
②计算在当前权重系数向量w条件下的目标函数值f(w)。
③判断是否满足收敛条件|f(w)-f0(w)|<10-6?若是,则输出权重系数向量w;若否,则继续实施④。
④设置f0(w)=f(w)后根据上述公式(6)计算梯度值Δf,并根据公式w=w+αΔf更新权重系数向量。
⑤根据更新后的w计算目标函数值f(w),并判断是否满足条件f(w)>f0(w)?若是,则根据公式α=1.01α更新梯度步长α;若否,则根据公式α=0.4α更新梯度步长α。
⑥返回步骤③继续下一次迭代优化,直至满足收敛条件。
(6):将权重系数向量wc中大于0.01的元素所对应的变量编号记为集合φc,集合φc中记录的变量即为第c类故障的特征变量。
(8):判断是否满足条件c<C?若是,则置c=c+1后返回步骤(4);若否,则得到所有C类参考故障的特征变量集合φ1,φ2,…,φC及矩阵F1,Fc,…,FC。
上述步骤(1)至步骤(8)完成了对各个类型故障特征变量的选择,以下所示步骤(9)至步骤(14)为在线故障数据所属故障类型的匹配实施过程。
(9):设置数据窗口中最小的样本个数为L,当在线检测出的故障样本数累计至L后,开始实施在线故障类型匹配。
(12):利用集合φc中记录的特征变量,从Z中取出相应的列组成在线故障特征变量矩阵Zc。
(13):将第c类故障的特征变量参考数据矩阵Fc中的第1行至第L行的行向量单独作为一个矩阵Fc,L,并根据如下所示步骤计算矩阵Zc与Fc,L的相似度Dc,具体的实施过程如下所示:
①根据如下所示公式计算协方差矩阵Sc:
②对协方差矩阵Sc实施奇异值分解,得到Sc=VΛVT,其中Λ∈Rq×q为q个奇异值λ1,λ2,…,λq组成的对角矩阵,q为步骤(7)中选择的第c类参考故障特征变量的个数,V∈Rq×q是由q个相互正交的列向量组成。
③根据如下所示公式计算Zc与Fc,L的相似度Dc:
(14):判断是否满足条件:c<C?若是,则置c=c+1后,返回步骤(12);若否,则在线匹配的故障类型为D1,D2,…,DC中的最大值所对应的故障类型。
与传统方法相比,本发明方法的优势在于:
首先,本发明方法利用的是近邻成分分析算法逐个地为各故障类型甄别出特征变量。从NCA算法本身而言,其所涉及的计算都是针对一对一的样本点,不存在受样本个数有限问题的制约。其次,利用特征变量实施故障类型匹配不仅能消除非特征变量的干扰影响,而且还能直接降低变量维数,从而使样本数有限的问题不显得那么突出。总而言之,本发明方法是一种行之有效的数据驱动的故障类型识别方法。
附图说明
图1为本发明方法中故障特征变量选择的实施流程图。
图2为本发明方法中在线故障类型匹配的实施流程图。
具体实施方式
下面结合附图对本发明方法的具体实施方式进行详细的说明。
本发明公开一种基于故障特征变量选择的故障类型匹配方法,图1中展示了本发明方法离线建模阶段故障特征变量选择的实施流程图,具体的实施方式包括如下所示步骤(1)至步骤(8)。
步骤(1):从生产过程历史数据库中找到不同故障工况条件下的采样数据,组成C类参考故障数据矩阵X1,X2,…,XC,其中Nc为第c种故障的可用样本数,下标号c=1,2,…,C,R为实数集,表示Nc×m维的实数矩阵,m为过程测量变量的总个数。
步骤(5):利用近邻成分分析(NCA)算法优化求解出权重系数向量wc;
步骤(6):将权重系数向量wc中大于0.01的元素所对应的变量编号记为集合φc,集合φc中记录的变量即为第c类故障的特征变量。
步骤(8):判断是否满足条件c<C?若是,则置c=c+1后返回步骤(4);若否,则得到所有C类参考故障的特征变量集合φ1,φ2,…,φC。
上述步骤(1)至步骤(8)完成了对各个类型故障特征变量的选择,图2展示了在线故障数据所属故障类型的匹配实施流程,具体的实施方式包括以下所示步骤(9)至步骤(14)。
步骤(9):设置数据窗口中最小的样本个数为L,当在线检测出的故障样本数累计至L后,开始实施在线故障类型匹配;
步骤(12):利用集合φc中记录的特征变量,从Z中取出相应的列组成在线故障特征变量矩阵Zc;
步骤(13):将第c类故障的特征变量参考数据矩阵Fc中的第1行至第L行的行向量单独作为一个矩阵Fc,L,并根据如下所示步骤计算矩阵Zc与Fc,L的相似度Dc,具体的实施过程如下所示:
步骤(13.1):根据如下所示公式计算协方差矩阵Sc:
步骤(13.2):对协方差矩阵Sc实施奇异值分解,得到Sc=VΛVT,其中Λ∈Rq×q为q个奇异值λ1,λ2,…,λq组成的对角矩阵,q为步骤(7)中选择的第c类参考故障特征变量的个数,V∈Rq×q是由q个相互正交的列向量组成;
步骤(13.3):根据如下所示公式计算Zc与Fc,L的相似度Dc:
步骤(14):判断是否满足条件:c<C?若是,则置c=c+1后,返回步骤(12);若否,则在线匹配的故障类型为D1,D2,…,DC中的最大值所对应的故障类型。
Claims (1)
1.一种基于故障特征变量选择的故障类型匹配方法,其特征在于,包括以下步骤:
步骤(1):从生产过程历史数据库中找到不同故障工况条件下的采样数据,组成各个参考故障的数据矩阵X1,X2,…,XC,其中Nc为第c种故障的可用样本数,下标号c=1,2,…,C,R为实数集,表示Nc×m维的实数矩阵,m为过程测量变量的总个数,C为参考故障类别总数;
步骤(5):利用近邻成分分析算法优化求解出权重系数向量wc,具体的实施过程如下所示:
步骤(5.1):记矩阵Yc中各行向量为x1,x2,…,xn,其中xi∈R1×m,n=N0+Nc,i=1,2,…,n,并初始化梯度步长α=1、初始化目标函数值f0(wc)=-106、以及初始化权重系数向量wc=[1,1,…,1],即各变量的权重系数初始值统一设置为1;
步骤(5.2):根据如下所示公式计算在当前权重系数向量wc条件下的目标函数值f(wc):
上式中,当且仅当xi与xj归属同一类时,yij=1,其他情况yij=0,概率pij的计算方式如下所示:
上式(3)中,j=1,2,…,n,Dw(xi,xj)=||(xi-xj)diag(wc)||,diag(wc)表示将wc中的元素转变成对角矩阵,符号|| ||表示计算向量的长度;
步骤(5.3):判断是否满足收敛条件|f(wc)-f0(wc)|<10-6;若是,则输出权重系数向量wc;若否,则继续实施步骤(5.4);
步骤(5.4):设置f0(wc)=f(wc)后根据如下所示公式计算梯度值Δf,并根据公式wc=wc+αΔf更新权重系数向量:
上式中,将样本xi通过近邻样本正确分类的概率pi可按照如下所示公式计算:
上式中,当且仅当xi与xj归属同一类时,yij=1,其他情况yij=0;
步骤(5.5):根据更新后的wc计算目标函数值f(wc),并判断是否满足条件f(wc)>f0(wc);若是,则根据公式α=1.01α更新梯度步长α;若否,则根据公式α=0.4α更新梯度步长α;
步骤(5.6):返回步骤(5.3)继续下一次迭代优化,直至满足步骤(5.3)中的收敛条件;
步骤(6):将权重系数向量wc中大于0.01的元素所对应的变量编号记为集合φc,集合φc中记录的变量即为第c类故障的特征变量;
步骤(8):判断是否满足条件c<C;若是,则置c=c+1后返回步骤(4);若否,则得到所有C类参考故障的特征变量集合φ1,φ2,…,φC及矩阵F1,F2,…,FC;
步骤(9):设置数据窗口中最小的样本个数为L,当在线检测出的故障样本数累计至L后,开始实施在线故障类型匹配;
步骤(12):利用集合φc中记录的特征变量,从Z中取出相应的列组成在线故障特征变量矩阵Zc;
步骤(13):将第c类故障的特征变量参考数据矩阵Fc中的第1行至第L行的行向量单独作为一个矩阵Fc,L,并根据如下所示步骤计算矩阵Zc与Fc,L的相似度Dc,具体的实施过程如下所示:
步骤(13.1):根据如下所示公式计算协方差矩阵Sc:
步骤(13.2):对协方差矩阵Sc实施奇异值分解,得到Sc=VΛVT,其中Λ∈Rq×q为q个奇异值λ1,λ2,…,λq组成的对角矩阵,q为步骤(7)中选择的第c类参考故障特征变量的个数,V∈Rq×q是由q个相互正交的列向量组成;
步骤(13.3):根据如下所示公式计算Zc与Fc,L的相似度Dc:
步骤(14):判断是否满足条件:c<C;若是,则置c=c+1后,返回步骤(12);若否,则在线匹配的故障类型为D1,D2,…,DC中的最大值所对应的故障类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811213323.3A CN109407649B (zh) | 2018-10-09 | 2018-10-09 | 一种基于故障特征变量选择的故障类型匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811213323.3A CN109407649B (zh) | 2018-10-09 | 2018-10-09 | 一种基于故障特征变量选择的故障类型匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109407649A CN109407649A (zh) | 2019-03-01 |
CN109407649B true CN109407649B (zh) | 2021-01-05 |
Family
ID=65467539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811213323.3A Active CN109407649B (zh) | 2018-10-09 | 2018-10-09 | 一种基于故障特征变量选择的故障类型匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109407649B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107608333B (zh) * | 2017-09-05 | 2019-06-18 | 北京控制工程研究所 | 一种基于等效降阶的可诊断性评估方法 |
CN110718299B (zh) * | 2019-09-03 | 2023-05-05 | 重庆大学 | 一种患肝癌风险等级快速预测装置 |
CN110837898A (zh) * | 2019-10-25 | 2020-02-25 | 袁茂银 | 基于模型选择的地下电缆故障修复方法和装置 |
CN111059896B (zh) * | 2019-12-10 | 2021-08-24 | 广东工业大学 | 一种基于㶲模型的辊道窑系统异常检测方法 |
CN112085083B (zh) * | 2020-08-24 | 2022-07-29 | 宁波大学 | 一种基于相近度分析策略的变压器故障诊断方法 |
CN112067052A (zh) * | 2020-08-24 | 2020-12-11 | 宁波大学 | 一种基于特征选择的油侵式变压器故障诊断方法 |
CN114285730A (zh) * | 2020-09-18 | 2022-04-05 | 华为技术有限公司 | 确定故障根因的方法,装置以及相关设备 |
CN112857805B (zh) * | 2021-03-13 | 2022-05-31 | 宁波大学科学技术学院 | 一种基于图相似度特征提取的滚动轴承故障检测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7444251B2 (en) * | 2006-08-01 | 2008-10-28 | Mitsubishi Electric Research Laboratories, Inc. | Detecting and diagnosing faults in HVAC equipment |
CN106404441B (zh) * | 2016-09-22 | 2018-11-06 | 宁波大学 | 一种基于非线性相似度指标的故障分类诊断方法 |
CN108446735A (zh) * | 2018-03-06 | 2018-08-24 | 宁波大学 | 一种基于差分进化优化近邻成分分析的特征选择方法 |
CN108345284B (zh) * | 2018-03-06 | 2020-06-16 | 宁波大学 | 一种基于两变量块的质量相关故障检测方法 |
CN108459240A (zh) * | 2018-03-27 | 2018-08-28 | 国网江苏省电力有限公司苏州供电分公司 | 一种配电网线路故障区间定位方法 |
-
2018
- 2018-10-09 CN CN201811213323.3A patent/CN109407649B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109407649A (zh) | 2019-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109407649B (zh) | 一种基于故障特征变量选择的故障类型匹配方法 | |
CN109409425B (zh) | 一种基于近邻成分分析的故障类型识别方法 | |
CN111222290B (zh) | 一种基于多参数特征融合的大型设备剩余使用寿命预测方法 | |
CN111142501B (zh) | 基于半监督自回归动态隐变量模型的故障检测方法 | |
CN109376778B (zh) | 一种基于特征变量加权的故障分类诊断方法 | |
CN106404441B (zh) | 一种基于非线性相似度指标的故障分类诊断方法 | |
CN113569742B (zh) | 一种基于卷积神经网络的宽频带电磁干扰源识别方法 | |
CN108960329B (zh) | 一种包含缺失数据的化工过程故障检测方法 | |
CN111046961B (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN110579967B (zh) | 基于同时降维和字典学习的过程监控方法 | |
CN111768000A (zh) | 在线自适应微调深度学习的工业过程数据建模方法 | |
Fan et al. | AutoEncoder based high-dimensional data fault detection system | |
CN109240276B (zh) | 基于故障敏感主元选择的多块pca故障监测方法 | |
CN110175682A (zh) | 一种基于混沌粒子群的优化核主元分析故障监测方法 | |
Gu et al. | Identification of concurrent control chart patterns with singular spectrum analysis and learning vector quantization | |
CN116578870A (zh) | 一种基于波动互相关分析的配网电压异常数据填补方法 | |
CN111639304A (zh) | 基于Xgboost回归模型的CSTR故障定位方法 | |
CN110084301B (zh) | 一种基于隐马尔可夫模型的多工况过程工况辨识方法 | |
CN109389313B (zh) | 一种基于加权近邻决策的故障分类诊断方法 | |
CN113705645B (zh) | 一种针对脑电信号的自适应联合模型半监督学习分类方法 | |
CN113126489A (zh) | 一种基于cnn-gru-binn的重型燃气轮机控制系统智能bit设计方法 | |
CN117276600A (zh) | 基于pso-gwo-delm的质子交换膜燃料电池系统故障诊断方法 | |
CN108827905B (zh) | 一种基于局部加权Lasso的近红外模型在线更新方法 | |
Yu et al. | Using minimum quantization error chart for the monitoring of process states in multivariate manufacturing processes | |
CN111160464B (zh) | 基于多隐层加权动态模型的工业高阶动态过程软测量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |