CN109409425B - 一种基于近邻成分分析的故障类型识别方法 - Google Patents
一种基于近邻成分分析的故障类型识别方法 Download PDFInfo
- Publication number
- CN109409425B CN109409425B CN201811213325.2A CN201811213325A CN109409425B CN 109409425 B CN109409425 B CN 109409425B CN 201811213325 A CN201811213325 A CN 201811213325A CN 109409425 B CN109409425 B CN 109409425B
- Authority
- CN
- China
- Prior art keywords
- fault
- vector
- data
- matrix
- fault type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于近邻成分分析的故障类型识别方法,旨在为各故障类型甄别出相应的故障特征变量及其权重大小后,实施在线故障数据对应故障类型的识别。具体来讲,本发明方法首先利用近邻成分分析这种依赖于单个样本之间近邻关系的算法,逐个找出各故障类型可用数据对比正常工况数据之间出现异常变化的特征变量及其权重系数。其次,在经特征变量加权处理后逐个计算在线故障数据与各个故障类型数据点的之间的距离。最后,通过最小距离识别故障类型。与传统方法相比,本发明方法不仅利用了各故障的特征变量而且还能区分出特征变量之间的重要性程度差异,能充分保证故障类型识别的正确率。因此,本发明方法是一种更为优选的故障类型识别方法。
Description
技术领域
本发明涉及一种数据驱动的故障诊断方法,尤其涉及一种基于近邻成分分析的故障类型识别方法。
背景技术
通常意义上来讲,对生产过程运行状态实施监测的目的首先在于及时而准确地发现故障,其次在于识别出故障的根源或类型。因此,故障检测与故障类型识别两者缺一不可,它们对于保证安全生产与维持产品质量稳定是具有重要意义的。近十几年来,针对故障检测的研究层出不穷,涌现出了一大批故障检测新方法与新思路。相比之下,针对故障类型识别的研究却屈指可数。这种现象在数据驱动的故障诊断研究领域尤为突出,发展至今识别故障类型的数据驱动方法主要依赖于模式分类策略,借鉴模式识别领域的分类方法识别出故障类型。
然而,与传统分类问题不同的是,故障分类所能使用的数据皆采集自工况切换的过渡过程阶段。各故障类型的训练数据变化情况尤为复杂,且各故障发生后会导致不同测量变量出现不同程度的异常变化。此外,在故障发生后,现场操作人员会在第一时间内将过程修复至正常运行状态,各种故障工况下采集到的数据量通常也是有限的。针对故障分类的研究若是直接采用模式识别领域常用的分类算法如判别分析、支持向量机、神经网络等建立多分类模型通常得不到满意的效果。此外,支持向量机与神经网络需要大量的数据实施训练才能保证模型精度,它们通常不适合用作故障分类诊断。
从故障类型识别问题本身出发,各个故障类型会引起不同测量变量出现不同程度的异常变化,为各个故障类型甄别出相对应的故障特征变量是实施故障类型识别首先需要考虑的问题。其次,在有限的故障训练样本数据量下,如何甄别出这些特征变量同时给解决该问题提出了较大的挑战。最后,如何在甄别出的故障特征变量的基础上实施故障类型识别是最后一个需要考虑的问题。
发明内容
本发明所要解决的主要技术问题是:如何在各故障类型训练样本数据量有限的前提下,甄别出各故障类型的故障特征变量,并利用该特征变量实施故障类型识别。为此,本发明方法利用近邻成分分析(Neighborhood Component Analysis,NCA)这种依赖于单个样本之间近邻关系的算法,逐个找出各故障类型可用数据对比正常工况数据之间出现异常变化的特征变量。然后,在经特征变量加权处理后逐个计算在线故障数据与各个参考故障类型数据点之间的距离。最后,通过最小距离识别故障类型。
本发明解决上述技术问题所采用的技术方案为:一种基于近邻成分分析的故障类型识别方法,包括以下步骤:
(1)从生产过程历史数据库中找到不同故障工况条件下的采样数据,对应组成各参考故障数据矩阵X1,X2,…,XC,其中Nc为第c种故障的可用样本数,c=1,2,…,C,R为实数集,表示Nc×m维的实数矩阵,m为过程测量变量的个数,C为参考故障类别总数。
(5)利用近邻成分分析(NCA)算法优化求解出权重系数向量wc,NCA算法的原理与具体实施过程如下所示。
NCA算法是一种简单易操作的距离测度学习算法,它通过优化留一法的交叉验证结果来求得在分类问题中各变量的权重系数,从而提高样本分类的效果。
给定n个样本x1,x2,…,xn,各样本向量xi∈R1×m中对应有m个属性或变量的测量值,各个样本对应的类标号组成向量y∈Rn×1,在权重系数向量w∈R1×m的条件下可根据如下所示公式计算出各样本之间的距离Dw(xi,xj):
Dw(xi,xj)=||(xi-xj)diag(w)|| (1)
其中,i=1,2,…,n,j=1,2,…,n,符号|| ||表示计算向量的长度,diag(w)表示将向量w转变成对角矩阵。定义一个概率指标pij:样本点xi选择样本点xj作为其近邻同时继承xj对应的类标号的概率。pij的计算公式如下所示:
这样一来,将样本xi通过近邻样本正确分类的概率pi可按照如下所示公式计算:
上式中,当且仅当xi与xj归属同一类时,yij=1,其他情况yij=0。那么,NCA算法优化权重系数向量w的目标函数如下所示:
可通过梯度下降法求出最优化的权重系数向量w,在梯度法迭代过程中需计算其梯度Δf:
NCA算法优化权重系数向量的具体实施过程包括以下步骤:
①初始化梯度步长α=1、初始化目标函数值f0(w)=-106、以及初始化权重系数向量w=[1,1,…,1],即各变量的权重系数初始值统一设置为1。
②计算在当前权重系数向量w条件下的目标函数值f(w)。
③判断是否满足收敛条件|f(w)-f0(w)|<10-6?若是,则输出权重系数向量w;若否,则继续实施④。
④设置f0(w)=f(w)后根据上述公式(5)计算梯度值Δf,并根据公式w=w+αΔf更新权重系数向量。
⑤根据更新后的w计算目标函数值f(w),并判断是否满足条件f(w)>f0(w)?若是,则根据公式α=1.01α更新梯度步长α;若否,则根据公式α=0.4α更新梯度步长α。
⑥返回步骤③继续下一次迭代优化,直至满足③中的收敛条件。
上述步骤(1)至步骤(8)完成了对各个类型故障特征变量的甄别,以及相应特征变量权重系数大小的确定。以下所示步骤(9)至步骤(11)为在线识别故障类型的实施过程。
(11)计算向量g1,g2,…,gC与矩阵F1,F2,…,FC中各行向量的之间的距离,并找出最小距离样本所对应的故障类型,该故障类型即为识别出的故障类型。
与传统方法相比,本发明方法的优势在于:
首先,本发明方法利用的是近邻成分分析算法逐个地为各故障类型甄别出特征变量及其对应的权重系数。从NCA算法本身而言,其所涉及的计算都是针对单个样本点,不存在受样本个数有限问题的制约。其次,利用权重系数向量加权处理故障数据,不仅利用了各故障的特征变量而且还能区分出特征变量之间的重要性程度差异。这样一来,能保证故障类型识别的正确率。总而言之,本发明方法是一种行之有效的数据驱动的故障类型识别方法。
附图说明
图1为本发明方法甄别故障特征变量的实施流程图。
图2为本发明方法利用权重系数向量实施故障类型识别的流程图。
具体实施方式
下面结合附图对本发明方法的具体实施方式进行详细的说明。
本发明公开一种基于近邻成分分析的故障类型识别方法,图1中展示了为各个参考故障类型甄别故障特征变量的过程,具体包括以下实施步骤。
步骤(1)从生产过程历史数据库中找到不同故障工况条件下的采样数据,对应组成各参考故障的数据矩阵X1,X2,…,XC,其中Nc为第c种故障的可用样本数,c=1,2,…,C,R为实数集,表示Nc×m维的实数矩阵,m为过程测量变量的个数。
步骤(5)利用近邻成分分析(NCA)算法优化求解出权重系数向量wc。
在完成对各类型故障的特征变量甄别及其权重系数优化后,识别在线故障数据的故障类型的实施过程如图2所示,具体包括以下实施步骤。
步骤(11)计算向量g1,g2,…,gC与矩阵F1,F2,…,FC中各行向量的之间的距离,并找出最小距离样本所对应的故障类型,该故障类型即为识别出的故障类型。
Claims (1)
1.一种基于近邻成分分析的故障类型识别方法,其特征在于,包括以下步骤:
步骤(1)从生产过程历史数据库中找到不同故障工况条件下的采样数据,对应组成各参考故障的数据矩阵X1,X2,…,XC,其中Nc为第c种故障的可用样本数,c=1,2,…,C,R为实数集,表示Nc×m维的实数矩阵,m为过程测量变量的个数,C为参考故障类别总数;
步骤(5)利用近邻成分分析(NCA)算法优化求解出权重系数向量wc;
步骤(11)计算向量g1,g2,…,gC与矩阵F1,F2,…,FC中各行向量的之间的距离,并找出最小距离样本所对应的故障类型,该故障类型即为识别出的故障类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811213325.2A CN109409425B (zh) | 2018-10-09 | 2018-10-09 | 一种基于近邻成分分析的故障类型识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811213325.2A CN109409425B (zh) | 2018-10-09 | 2018-10-09 | 一种基于近邻成分分析的故障类型识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109409425A CN109409425A (zh) | 2019-03-01 |
CN109409425B true CN109409425B (zh) | 2021-06-15 |
Family
ID=65467461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811213325.2A Active CN109409425B (zh) | 2018-10-09 | 2018-10-09 | 一种基于近邻成分分析的故障类型识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409425B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110308713A (zh) * | 2019-06-03 | 2019-10-08 | 湖州师范学院 | 一种基于k近邻重构的工业过程故障变量识别方法 |
CN110689961B (zh) * | 2019-09-03 | 2022-12-09 | 重庆大学 | 一种基于大数据分析技术的胃癌疾病风险检测装置 |
CN110718299B (zh) * | 2019-09-03 | 2023-05-05 | 重庆大学 | 一种患肝癌风险等级快速预测装置 |
CN111273108B (zh) * | 2020-03-17 | 2022-06-21 | 深圳供电局有限公司 | 变压器空充跳闸原因的判断方法 |
CN112085083B (zh) * | 2020-08-24 | 2022-07-29 | 宁波大学 | 一种基于相近度分析策略的变压器故障诊断方法 |
CN112816195A (zh) * | 2021-01-04 | 2021-05-18 | 安徽容知日新科技股份有限公司 | 往复式机械设备故障诊断方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7243317B2 (en) * | 2003-05-30 | 2007-07-10 | Illinios Institute Of Technology | Parameter checking method for on-chip ESD protection circuit physical design layout verification |
US10424045B2 (en) * | 2017-06-21 | 2019-09-24 | International Business Machines Corporation | Machine learning model for automatic image registration quality assessment and correction |
CN108345284B (zh) * | 2018-03-06 | 2020-06-16 | 宁波大学 | 一种基于两变量块的质量相关故障检测方法 |
-
2018
- 2018-10-09 CN CN201811213325.2A patent/CN109409425B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109409425A (zh) | 2019-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409425B (zh) | 一种基于近邻成分分析的故障类型识别方法 | |
CN109407649B (zh) | 一种基于故障特征变量选择的故障类型匹配方法 | |
CN111222290B (zh) | 一种基于多参数特征融合的大型设备剩余使用寿命预测方法 | |
CN106355030B (zh) | 一种基于层次分析法和加权投票决策融合的故障检测方法 | |
CN109460574A (zh) | 一种航空发动机剩余寿命的预测方法 | |
CN109376778B (zh) | 一种基于特征变量加权的故障分类诊断方法 | |
CN109085805B (zh) | 一种基于多采样率因子分析模型的工业过程故障检测方法 | |
CN109389314B (zh) | 一种基于最优近邻成分分析的质量软测量与监测方法 | |
CN111768000A (zh) | 在线自适应微调深度学习的工业过程数据建模方法 | |
CN111046961B (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN112257530A (zh) | 基于盲信号分离和支持向量机的滚动轴承故障诊断方法 | |
CN109030790A (zh) | 一种电力变压器故障诊断方法和装置 | |
CN109240276B (zh) | 基于故障敏感主元选择的多块pca故障监测方法 | |
CN110782546A (zh) | 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 | |
CN108960329A (zh) | 一种包含缺失数据的化工过程故障检测方法 | |
CN115407753B (zh) | 一种多变量加权集成学习的工业故障诊断方法 | |
CN111639304B (zh) | 基于Xgboost回归模型的CSTR故障定位方法 | |
CN110175682A (zh) | 一种基于混沌粒子群的优化核主元分析故障监测方法 | |
CN110308713A (zh) | 一种基于k近邻重构的工业过程故障变量识别方法 | |
CN117171702A (zh) | 一种基于深度学习的多模态电网故障检测方法和系统 | |
CN116204825A (zh) | 一种基于数据驱动的生产线设备故障检测方法 | |
CN109389313B (zh) | 一种基于加权近邻决策的故障分类诊断方法 | |
CN109886314B (zh) | 一种基于pnn神经网络的餐厨废弃油检测方法及其装置 | |
CN111914471B (zh) | 一种基于快速核独立成分分析的精馏塔故障检测方法 | |
CN113126489A (zh) | 一种基于cnn-gru-binn的重型燃气轮机控制系统智能bit设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |