CN109409425B - 一种基于近邻成分分析的故障类型识别方法 - Google Patents

一种基于近邻成分分析的故障类型识别方法 Download PDF

Info

Publication number
CN109409425B
CN109409425B CN201811213325.2A CN201811213325A CN109409425B CN 109409425 B CN109409425 B CN 109409425B CN 201811213325 A CN201811213325 A CN 201811213325A CN 109409425 B CN109409425 B CN 109409425B
Authority
CN
China
Prior art keywords
fault
vector
data
matrix
fault type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811213325.2A
Other languages
English (en)
Other versions
CN109409425A (zh
Inventor
皇甫皓宁
童楚东
朱莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo University
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN201811213325.2A priority Critical patent/CN109409425B/zh
Publication of CN109409425A publication Critical patent/CN109409425A/zh
Application granted granted Critical
Publication of CN109409425B publication Critical patent/CN109409425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于近邻成分分析的故障类型识别方法,旨在为各故障类型甄别出相应的故障特征变量及其权重大小后,实施在线故障数据对应故障类型的识别。具体来讲,本发明方法首先利用近邻成分分析这种依赖于单个样本之间近邻关系的算法,逐个找出各故障类型可用数据对比正常工况数据之间出现异常变化的特征变量及其权重系数。其次,在经特征变量加权处理后逐个计算在线故障数据与各个故障类型数据点的之间的距离。最后,通过最小距离识别故障类型。与传统方法相比,本发明方法不仅利用了各故障的特征变量而且还能区分出特征变量之间的重要性程度差异,能充分保证故障类型识别的正确率。因此,本发明方法是一种更为优选的故障类型识别方法。

Description

一种基于近邻成分分析的故障类型识别方法
技术领域
本发明涉及一种数据驱动的故障诊断方法,尤其涉及一种基于近邻成分分析的故障类型识别方法。
背景技术
通常意义上来讲,对生产过程运行状态实施监测的目的首先在于及时而准确地发现故障,其次在于识别出故障的根源或类型。因此,故障检测与故障类型识别两者缺一不可,它们对于保证安全生产与维持产品质量稳定是具有重要意义的。近十几年来,针对故障检测的研究层出不穷,涌现出了一大批故障检测新方法与新思路。相比之下,针对故障类型识别的研究却屈指可数。这种现象在数据驱动的故障诊断研究领域尤为突出,发展至今识别故障类型的数据驱动方法主要依赖于模式分类策略,借鉴模式识别领域的分类方法识别出故障类型。
然而,与传统分类问题不同的是,故障分类所能使用的数据皆采集自工况切换的过渡过程阶段。各故障类型的训练数据变化情况尤为复杂,且各故障发生后会导致不同测量变量出现不同程度的异常变化。此外,在故障发生后,现场操作人员会在第一时间内将过程修复至正常运行状态,各种故障工况下采集到的数据量通常也是有限的。针对故障分类的研究若是直接采用模式识别领域常用的分类算法如判别分析、支持向量机、神经网络等建立多分类模型通常得不到满意的效果。此外,支持向量机与神经网络需要大量的数据实施训练才能保证模型精度,它们通常不适合用作故障分类诊断。
从故障类型识别问题本身出发,各个故障类型会引起不同测量变量出现不同程度的异常变化,为各个故障类型甄别出相对应的故障特征变量是实施故障类型识别首先需要考虑的问题。其次,在有限的故障训练样本数据量下,如何甄别出这些特征变量同时给解决该问题提出了较大的挑战。最后,如何在甄别出的故障特征变量的基础上实施故障类型识别是最后一个需要考虑的问题。
发明内容
本发明所要解决的主要技术问题是:如何在各故障类型训练样本数据量有限的前提下,甄别出各故障类型的故障特征变量,并利用该特征变量实施故障类型识别。为此,本发明方法利用近邻成分分析(Neighborhood Component Analysis,NCA)这种依赖于单个样本之间近邻关系的算法,逐个找出各故障类型可用数据对比正常工况数据之间出现异常变化的特征变量。然后,在经特征变量加权处理后逐个计算在线故障数据与各个参考故障类型数据点之间的距离。最后,通过最小距离识别故障类型。
本发明解决上述技术问题所采用的技术方案为:一种基于近邻成分分析的故障类型识别方法,包括以下步骤:
(1)从生产过程历史数据库中找到不同故障工况条件下的采样数据,对应组成各参考故障数据矩阵X1,X2,…,XC,其中
Figure BSA0000172239590000021
Nc为第c种故障的可用样本数,c=1,2,…,C,R为实数集,
Figure BSA0000172239590000022
表示Nc×m维的实数矩阵,m为过程测量变量的个数,C为参考故障类别总数。
(2)采集生产过程处于正常运行工况下的N0个样本数据,组成正常工况训练数据矩阵
Figure BSA0000172239590000023
并计算数据矩阵X0中各列向量的均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm
(3)利用均值μ1,μ2,…,μm与标准差δ1,δ1,…,δm分别标准化处理X0,X1,X2…,XC中对应的各列向量,得到标准化后的数据矩阵
Figure BSA0000172239590000024
并初始化c=1。
(4)将矩阵
Figure BSA0000172239590000025
Figure BSA0000172239590000026
合并一个矩阵
Figure BSA0000172239590000027
并构建类标号向量
Figure BSA0000172239590000028
其中上标号T为矩阵或向量的转置符号,向量yc中前N0个元素数值全部为0后Nc个元素数值全部等于1。
(5)利用近邻成分分析(NCA)算法优化求解出权重系数向量wc,NCA算法的原理与具体实施过程如下所示。
NCA算法是一种简单易操作的距离测度学习算法,它通过优化留一法的交叉验证结果来求得在分类问题中各变量的权重系数,从而提高样本分类的效果。
给定n个样本x1,x2,…,xn,各样本向量xi∈R1×m中对应有m个属性或变量的测量值,各个样本对应的类标号组成向量y∈Rn×1,在权重系数向量w∈R1×m的条件下可根据如下所示公式计算出各样本之间的距离Dw(xi,xj):
Dw(xi,xj)=||(xi-xj)diag(w)|| (1)
其中,i=1,2,…,n,j=1,2,…,n,符号|| ||表示计算向量的长度,diag(w)表示将向量w转变成对角矩阵。定义一个概率指标pij:样本点xi选择样本点xj作为其近邻同时继承xj对应的类标号的概率。pij的计算公式如下所示:
Figure BSA0000172239590000029
这样一来,将样本xi通过近邻样本正确分类的概率pi可按照如下所示公式计算:
Figure BSA00001722395900000210
上式中,当且仅当xi与xj归属同一类时,yij=1,其他情况yij=0。那么,NCA算法优化权重系数向量w的目标函数如下所示:
Figure BSA0000172239590000031
可通过梯度下降法求出最优化的权重系数向量w,在梯度法迭代过程中需计算其梯度Δf:
Figure BSA0000172239590000032
NCA算法优化权重系数向量的具体实施过程包括以下步骤:
①初始化梯度步长α=1、初始化目标函数值f0(w)=-106、以及初始化权重系数向量w=[1,1,…,1],即各变量的权重系数初始值统一设置为1。
②计算在当前权重系数向量w条件下的目标函数值f(w)。
③判断是否满足收敛条件|f(w)-f0(w)|<10-6?若是,则输出权重系数向量w;若否,则继续实施④。
④设置f0(w)=f(w)后根据上述公式(5)计算梯度值Δf,并根据公式w=w+αΔf更新权重系数向量。
⑤根据更新后的w计算目标函数值f(w),并判断是否满足条件f(w)>f0(w)?若是,则根据公式α=1.01α更新梯度步长α;若否,则根据公式α=0.4α更新梯度步长α。
⑥返回步骤③继续下一次迭代优化,直至满足③中的收敛条件。
(6)将权重系数向量wc中小于10-3的元素全部变成零,得到更新后的权重系数向量
Figure BSA00001722395900000311
那么向量
Figure BSA0000172239590000033
中不等于0的元素所对应的变量即为第c类参考故障的特征变量。
(7)根据公式
Figure BSA0000172239590000034
计算得到第c类参考故障数据经特征变量加权后的数据矩阵Fc,其中
Figure BSA0000172239590000035
表示将向量
Figure BSA0000172239590000036
中的各元素组成对角矩阵。
(8)判断是否满足条件c<C?若是,则置c=c+1后返回步骤(4);若否,则得到最终的权重系数向量
Figure BSA0000172239590000037
以及矩阵F1,F2,…,FC
上述步骤(1)至步骤(8)完成了对各个类型故障特征变量的甄别,以及相应特征变量权重系数大小的确定。以下所示步骤(9)至步骤(11)为在线识别故障类型的实施过程。
(9)当在线监测的数据样本x∈R1×m被已有的故障检测系统判别为故障数据后,根据步骤(2)中的均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm标准化处理向量x得到向量
Figure BSA00001722395900000312
(10)根据公式
Figure BSA0000172239590000038
将向量
Figure BSA0000172239590000039
分别经
Figure BSA00001722395900000310
加权处理,对应得到加权向量g1,g2,…,gC
(11)计算向量g1,g2,…,gC与矩阵F1,F2,…,FC中各行向量的之间的距离,并找出最小距离样本所对应的故障类型,该故障类型即为识别出的故障类型。
与传统方法相比,本发明方法的优势在于:
首先,本发明方法利用的是近邻成分分析算法逐个地为各故障类型甄别出特征变量及其对应的权重系数。从NCA算法本身而言,其所涉及的计算都是针对单个样本点,不存在受样本个数有限问题的制约。其次,利用权重系数向量加权处理故障数据,不仅利用了各故障的特征变量而且还能区分出特征变量之间的重要性程度差异。这样一来,能保证故障类型识别的正确率。总而言之,本发明方法是一种行之有效的数据驱动的故障类型识别方法。
附图说明
图1为本发明方法甄别故障特征变量的实施流程图。
图2为本发明方法利用权重系数向量实施故障类型识别的流程图。
具体实施方式
下面结合附图对本发明方法的具体实施方式进行详细的说明。
本发明公开一种基于近邻成分分析的故障类型识别方法,图1中展示了为各个参考故障类型甄别故障特征变量的过程,具体包括以下实施步骤。
步骤(1)从生产过程历史数据库中找到不同故障工况条件下的采样数据,对应组成各参考故障的数据矩阵X1,X2,…,XC,其中
Figure BSA0000172239590000041
Nc为第c种故障的可用样本数,c=1,2,…,C,R为实数集,
Figure BSA0000172239590000042
表示Nc×m维的实数矩阵,m为过程测量变量的个数。
步骤(2)采集生产过程处于正常运行工况下的N0个样本数据,组成正常工况训练数据矩阵
Figure BSA0000172239590000043
并计算数据矩阵X0中各列向量的均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm
步骤(3)利用均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm分别标准化处理X0,X1,X2…,XC中对应的各列向量,得到标准化后的数据矩阵
Figure BSA0000172239590000044
并初始化c=1。
步骤(4)将矩阵
Figure BSA0000172239590000045
Figure BSA0000172239590000046
合并一个矩阵
Figure BSA0000172239590000047
并构建类标号向量
Figure BSA0000172239590000048
其中上标号T为矩阵或向量的转置符号,向量yc中前N0个元素数值全部为0后Nc个元素数值全部等于1。
步骤(5)利用近邻成分分析(NCA)算法优化求解出权重系数向量wc
步骤(6)将权重系数向量wc中小于10-3的元素全部变成零,得到更新后的权重系数向量
Figure BSA0000172239590000049
那么向量
Figure BSA00001722395900000410
中不等于0的元素所对应的变量即为第c类参考故障的特征变量。
步骤(7)根据公式
Figure BSA00001722395900000411
计算得到第c类参考故障数据经特征变量加权后的数据矩阵Fc,其中
Figure BSA00001722395900000412
表示将向量
Figure BSA00001722395900000413
中的各元素组成对角矩阵。
步骤(8)判断是否满足条件c<C?若是,则置c=c+1后返回步骤(4);若否,则得到最终的权重系数向量
Figure BSA00001722395900000414
以及F1,F2,…,FC
在完成对各类型故障的特征变量甄别及其权重系数优化后,识别在线故障数据的故障类型的实施过程如图2所示,具体包括以下实施步骤。
步骤(9)当在线监测的数据样本x∈R1×m被已有的故障检测系统判别为故障数据后,根据步骤(2)中的均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm标准化处理向量x得到新的向量
Figure BSA0000172239590000051
步骤(10)根据公式
Figure BSA0000172239590000052
将向量
Figure BSA0000172239590000053
分别经
Figure BSA0000172239590000054
加权处理,对应得到加权向量g1,g2,…,gC
步骤(11)计算向量g1,g2,…,gC与矩阵F1,F2,…,FC中各行向量的之间的距离,并找出最小距离样本所对应的故障类型,该故障类型即为识别出的故障类型。

Claims (1)

1.一种基于近邻成分分析的故障类型识别方法,其特征在于,包括以下步骤:
步骤(1)从生产过程历史数据库中找到不同故障工况条件下的采样数据,对应组成各参考故障的数据矩阵X1,X2,…,XC,其中
Figure FSB0000190597360000011
Nc为第c种故障的可用样本数,c=1,2,…,C,R为实数集,
Figure FSB0000190597360000012
表示Nc×m维的实数矩阵,m为过程测量变量的个数,C为参考故障类别总数;
步骤(2)采集生产过程处于正常运行工况下的N0个样本数据,组成正常工况训练数据矩阵
Figure FSB0000190597360000013
并计算矩阵X0中各列向量的均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm
步骤(3)利用均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm分别标准化处理X0,X1,X2…,XC中对应的各列向量,得到标准化后的数据矩阵
Figure FSB0000190597360000014
并初始化c=1;
步骤(4)将矩阵
Figure FSB0000190597360000015
Figure FSB0000190597360000016
合并,从而得到矩阵
Figure FSB0000190597360000017
并构建类标号向量
Figure FSB0000190597360000018
其中上标号T为矩阵或向量的转置符号,向量yc中前N0个元素数值全部为0后Nc个元素数值全部等于1;
步骤(5)利用近邻成分分析(NCA)算法优化求解出权重系数向量wc
步骤(6)将权重系数向量wc中小于10-3的元素全部变成零,得到更新后的权重系数向量
Figure FSB0000190597360000019
那么向量
Figure FSB00001905973600000110
中不等于0的元素所对应的变量即为第c类参考故障的特征变量;
步骤(7)根据公式
Figure FSB00001905973600000111
计算得到第c类参考故障数据经特征变量加权后的数据矩阵Fc,其中
Figure FSB00001905973600000112
表示将向量
Figure FSB00001905973600000113
中的各元素组成对角矩阵的操作;
步骤(8)判断是否满足条件c<C;若是,则置c=c+1后返回步骤(4);若否,则得到最终的权重系数向量
Figure FSB00001905973600000114
以及矩阵F1,F2,…,FC
步骤(9)当在线监测的数据样本x∈R1×m被已有的故障检测系统判别为故障数据后,根据步骤(2)中的均值μ1,μ2,…,μm与标准差δ1,δ2,…,δm标准化处理向量x得到向量
Figure FSB00001905973600000115
步骤(10)根据公式
Figure FSB00001905973600000116
将向量
Figure FSB00001905973600000117
分别经
Figure FSB00001905973600000118
加权处理,对应得到加权向量g1,g2,…,gC
步骤(11)计算向量g1,g2,…,gC与矩阵F1,F2,…,FC中各行向量的之间的距离,并找出最小距离样本所对应的故障类型,该故障类型即为识别出的故障类型。
CN201811213325.2A 2018-10-09 2018-10-09 一种基于近邻成分分析的故障类型识别方法 Active CN109409425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811213325.2A CN109409425B (zh) 2018-10-09 2018-10-09 一种基于近邻成分分析的故障类型识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811213325.2A CN109409425B (zh) 2018-10-09 2018-10-09 一种基于近邻成分分析的故障类型识别方法

Publications (2)

Publication Number Publication Date
CN109409425A CN109409425A (zh) 2019-03-01
CN109409425B true CN109409425B (zh) 2021-06-15

Family

ID=65467461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811213325.2A Active CN109409425B (zh) 2018-10-09 2018-10-09 一种基于近邻成分分析的故障类型识别方法

Country Status (1)

Country Link
CN (1) CN109409425B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110308713A (zh) * 2019-06-03 2019-10-08 湖州师范学院 一种基于k近邻重构的工业过程故障变量识别方法
CN110689961B (zh) * 2019-09-03 2022-12-09 重庆大学 一种基于大数据分析技术的胃癌疾病风险检测装置
CN110718299B (zh) * 2019-09-03 2023-05-05 重庆大学 一种患肝癌风险等级快速预测装置
CN111273108B (zh) * 2020-03-17 2022-06-21 深圳供电局有限公司 变压器空充跳闸原因的判断方法
CN112085083B (zh) * 2020-08-24 2022-07-29 宁波大学 一种基于相近度分析策略的变压器故障诊断方法
CN112816195A (zh) * 2021-01-04 2021-05-18 安徽容知日新科技股份有限公司 往复式机械设备故障诊断方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243317B2 (en) * 2003-05-30 2007-07-10 Illinios Institute Of Technology Parameter checking method for on-chip ESD protection circuit physical design layout verification
US10424045B2 (en) * 2017-06-21 2019-09-24 International Business Machines Corporation Machine learning model for automatic image registration quality assessment and correction
CN108345284B (zh) * 2018-03-06 2020-06-16 宁波大学 一种基于两变量块的质量相关故障检测方法

Also Published As

Publication number Publication date
CN109409425A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN109409425B (zh) 一种基于近邻成分分析的故障类型识别方法
CN109407649B (zh) 一种基于故障特征变量选择的故障类型匹配方法
CN111222290B (zh) 一种基于多参数特征融合的大型设备剩余使用寿命预测方法
CN106355030B (zh) 一种基于层次分析法和加权投票决策融合的故障检测方法
CN109460574A (zh) 一种航空发动机剩余寿命的预测方法
CN109376778B (zh) 一种基于特征变量加权的故障分类诊断方法
CN109085805B (zh) 一种基于多采样率因子分析模型的工业过程故障检测方法
CN109389314B (zh) 一种基于最优近邻成分分析的质量软测量与监测方法
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN111046961B (zh) 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN112257530A (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN109030790A (zh) 一种电力变压器故障诊断方法和装置
CN109240276B (zh) 基于故障敏感主元选择的多块pca故障监测方法
CN110782546A (zh) 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法
CN108960329A (zh) 一种包含缺失数据的化工过程故障检测方法
CN115407753B (zh) 一种多变量加权集成学习的工业故障诊断方法
CN111639304B (zh) 基于Xgboost回归模型的CSTR故障定位方法
CN110175682A (zh) 一种基于混沌粒子群的优化核主元分析故障监测方法
CN110308713A (zh) 一种基于k近邻重构的工业过程故障变量识别方法
CN117171702A (zh) 一种基于深度学习的多模态电网故障检测方法和系统
CN116204825A (zh) 一种基于数据驱动的生产线设备故障检测方法
CN109389313B (zh) 一种基于加权近邻决策的故障分类诊断方法
CN109886314B (zh) 一种基于pnn神经网络的餐厨废弃油检测方法及其装置
CN111914471B (zh) 一种基于快速核独立成分分析的精馏塔故障检测方法
CN113126489A (zh) 一种基于cnn-gru-binn的重型燃气轮机控制系统智能bit设计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant