CN115618202A - 一种基于流形嵌入和关键特征选取的机械故障诊断方法 - Google Patents

一种基于流形嵌入和关键特征选取的机械故障诊断方法 Download PDF

Info

Publication number
CN115618202A
CN115618202A CN202211269321.2A CN202211269321A CN115618202A CN 115618202 A CN115618202 A CN 115618202A CN 202211269321 A CN202211269321 A CN 202211269321A CN 115618202 A CN115618202 A CN 115618202A
Authority
CN
China
Prior art keywords
domain
feature
data
matrix
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211269321.2A
Other languages
English (en)
Inventor
范旭辉
郭文
刘媛媛
崔楠
孙乐
叶浩然
李靖宇
刘世状
董飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuzhou XCMG Truck Mounted Crane Co Ltd
Original Assignee
Xuzhou XCMG Truck Mounted Crane Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuzhou XCMG Truck Mounted Crane Co Ltd filed Critical Xuzhou XCMG Truck Mounted Crane Co Ltd
Priority to CN202211269321.2A priority Critical patent/CN115618202A/zh
Publication of CN115618202A publication Critical patent/CN115618202A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提出了一种基于流形嵌入和关键特征选取的机械故障诊断方法,涉及故障诊断领域,具体如下:首先,采用最大重叠离散小波包变换对旋转机械振动信号进行处理并提取统计特征;其次,利用域间差异与Laplace分数分析特征关联度,提出一种适用于域自适应的关键特征选取方法,选取具有高故障判别能力与邻域不变特性的关键特征;然后,在考虑类别信息和邻域关系的基础上,提出了一种新的带有流形嵌入的监督域自适应方法,用于流形子空间的分布对齐,同时学习了一个新的域不变分类器;最后,采用新的分类器预测未标记的目标域;本发明所提出的方法可以明显提高跨域故障诊断准确度,在实际工业场景中具有更强的有效性、适应性和优越性。

Description

一种基于流形嵌入和关键特征选取的机械故障诊断方法
技术领域
本发明涉及故障诊断领域,尤其涉及一种基于流形嵌入和关键特征选取的机械故障诊断方法。
背景技术
近年来,随着现代化工业水平的快速提高,电机、轴承等旋转机械在交通运输、矿业、电力、制造业等工业领域发挥越来越大的作用。然而,高温、高速运行、过载、高扭矩等恶劣多变的工作环境极大降低了旋转机械的可靠性。旋转机械的意外故障可能会产生巨大的经济损失,甚至造成人员伤亡。因此,旋转机械故障诊断方法的研究对于保证机械系统正常工作、防止重大故障等具有重要现实意义。
随着信号处理、数据挖掘与基于人工智能的机器学习技术的发展,监测设备状态并利用监测数据的智能诊断方法已经在工业领域得到了广泛的研究与应用。现有的智能故障诊断方法一般可以分为三类:基于传统机器学习(Traditional Machine Learning,TML)的框架、基于深度学习(Deep Learning,DL)的框架和基于迁移学习(Transfer Learning,TL)的框架。基于TML的故障诊断框架已经得到了广泛的研究,典型的TML算法包括K近邻法、支持向量机和人工神经网络等,但此框架应用至不同的诊断对象与设备工作状态时,需要进行针对性的算法选取与框架制定,因此TML技术最关键的问题是严重依赖专家知识。由于深度学习算法具有从原始数据中自动挖掘隐藏特征的强大能力,基于DL的智能故障诊断框架受到越来越多的关注,但应用时依然存在多个局限性:1)缺乏可解释性。
基于DL的模型很大程度上依然是一个黑盒模型,难以解释;2)泛化能力不足。现有的故障诊断模型大多假设训练数据和测试数据具有相同的分布,但在工程实践中,旋转机械的真实振动信号往往不一致,导致数据分布不一致。3)诊断算法依赖带标签数据。旋转机械在实际运行时,带标签故障数据极少,且由于采集限制无法获取足够的带标签故障数据,因此基于DL的诊断框架无法满足变工况故障诊断需求。
为了解决上述两种算法的问题,提出了一种基于TL框架下的域自适应技术,学习基于带标签数据的源域分类器,应用于未带标签的目标域进行机械故障诊断。此技术运用于跨域故障诊断大致可分为跨域分布对齐、流行子空间学习与深度迁移学习三种方法,其中第一种方法在原始特征空间进行域分布对齐需克服特征畸变,第二种方法在进行子空间学习是难以降低分布发散度,而现有的深度迁移学习方法大多是典型的参数化算法,实现过程中超参数调整极其复杂且耗时。
考虑这三种域自适应方法的局限性,提出结合流行特征学习与跨域特征分布相结合的高效诊断方法,同时现有所提出方法有以下两个局限:1)域自适应时未利用源域的类信息与数据特征间的邻近关系;2)未考虑不同特征对域自适应的影响。
现有的大多数方法主要集中在跨域分布对齐或流形子空间学习上,这面临两个关键问题:1)在原始特征空间中对分布进行对齐时,难以克服特征畸变;2)子空间学习不足以降低分布散度。
发明内容
本发明所要解决的技术问题是针对背景技术的不足提供一种基于流形嵌入和关键特征选取的旋转机械故障诊断方法,为了提高旋转机械故障诊断方法在实际工业场景的适应性和稳定性,以面对复杂多变的机械工作条件,满足旋转机械故障诊断模型在较少训练数据条件下高诊断准确度的同时,还有优越的跨域诊断性能。
本发明为解决上述技术问题采用以下技术方案:
一种基于流形嵌入和关键特征选取的机械故障诊断方法,具体包含如下步骤:
步骤1,采用最大重叠离散小波包变换MODWPT对特定工况下旋转机械的原始振动信号进行信号处理,并计算统计参数构建原始统计特征集OSFS;
步骤2,对步骤1构建的原始统计特征集中的特征进行故障判别能力及域不变性研究,构建关键特征选择指标,选取出可表征旋转机械状态的域不变关键特征,构建样本的关键特征子集;
步骤3,将步骤2得到的源域的带标签关键特征子集作为训练数据集,得到的目标域的无标签关键特征子集作为测试数据集;
采用流行子空间学习MSL将原特征空间的训练集与测试集转换为流行子空间;
在考虑特征相邻关系的情况下,采用改进的分布适应法IDA对源域和目标域的边缘分布和条件分布进行匹配;
依据结构风险最小化SRM原理学习新的域不变分类器f;
步骤4,采用步骤3中得到的领域不变分类器f预测测试数据集的标签,并输出故障诊断结果。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,在步骤1中,
将来自于不同特定工况下的原始振动信号样本分为振动数据集1和振动数据集2;
其中,振动数据集1为工况1,振动数据集2为工况2;
其中,振动数据集1为源域,其数据集的样本有标签;
振动数据集2为目标域,其数据集的样本无标签,需运用来自源域的已知标签样本对诊断模型进行训练,并使用训练后的模型对目标域进行状态分类。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,对源域和目标域的每一个振动信号样本进行四层最大重叠离散小波包变换MODWPT分解,获取16个终端小波包节点,同时对底层节点系数进行单支小波包重构获得16个单支重构信号,并分别求得16个重构信号的希尔伯特包络谱HES,提取每个重构信号与每个希尔伯特包络谱HES的11个统计参数,共生成352个统计特征,构成时频混合域原始统计特征集OSFS。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,在步骤2中,利用来自源域原始统计特征集的带标签故障特征数据和目标域的正常状态特征数据,采用基于域间差异和Laplace分数的关键特征选取方法KSDL对原始统计特征集的特征进行评价,得到关键特征选择指标KFSI,采用降序排序后的KFSI序列选择原始统计特征集的关键特征构成关键特征子集。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,对于步骤1所得到的源域OSFS中的带标签故障特征数据,计算出每一种特征的Laplace分数,以评估特征的可区分性;
采用最大平均差异计算源域与目标域OSFS中正常状态特征的域间差异度,以度量源域和目标域之间的分布差异;
对于得到的每一特征的LS与MMD,构建关键特征选取指标KFSI;
对KFSI序列进行降序排序,KFSI值越高,表明特征的故障分辨能力与域不变性越高,越有利于领域自适应;
对于来自目标域原始特征集的无标签特征数据,直接用排序后的KFSI序列进行域不变特征选取。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,在步骤2中,所述关键特征选取方法KSDL方法,具体包含如下步骤:
步骤2.1,对于工况1源域的M个旋转机械振动信号样本,经过步骤1的信号处理与统计特征提取过程,每个振动信号样本可以获得包含N种统计特征,可构建原始统计特征集F=[f1,f2,…,fM]T
其中,fi={fi 1,fi 2,…fi N},i∈[1,M]表示第i个振动信号样本的N个统计特征的集合,其中,fi k为第i个样本的第k个统计特征,对于此特征首先计算其Laplace分数,计算步骤如下:
构建一个具有m个节点的最近邻图G,G中的节点p对应于第p个数据xp;在节点p和q之间,如果xp和xq是接近的,则xp是xq的j个最近邻之一或xq是xp的j个最近邻之一;计算邻近节点p和q的权矩阵WMpq,其定义如下:
Figure BDA0003894547260000031
式中,t是常数;如果节点p和q没有相连,则WMpq=0;
对于第k个特征,有以下定义:
Figure BDA0003894547260000032
D=diag(WM×I),I=[1,…,1]T (3)
L=D-WM (4)
式中,L表示拉普拉斯矩阵,D是一个m×m维的对角矩阵,I是一个m维的单位向量;可令:
Figure BDA0003894547260000033
则第k个特征的LS计算式如下:
Figure BDA0003894547260000034
在原始的高维特征集中,计算出每种特征的Laplace分数LS(k),得到N个特征的LS序列LS={LS(1),LS(2),…,LS(N)},特征的Laplace分数与特征的可区分性成反比;
步骤2.2,对于工况1源域与工况2目标域的正常状态特征数据,通过MMD评估同一特征的在不同域的分布差异,MMD的值作为特征域不变性的量化指标;
来自源域和目标域的正常状态特征数据分别定义为SF和TF,都包含M个样本,且每个样本经过步骤1的信号处理与统计特征提取后包含N种统计特征;SF和TF表达式如下:
Figure BDA0003894547260000041
Figure BDA0003894547260000042
其中,SF和TF的第k列元素分别表示来自源域和目标域的第k个特征的M个样本(j∈[1,2,…,N]),其表达式如下:
Figure BDA0003894547260000043
Figure BDA0003894547260000044
SFk和TFk之间分布的经验距离估计定义如下:
Figure BDA0003894547260000045
式中,||·||H表示RKHS范数,φ表示内核诱导的特征图;
计算N种统计特征的MMD序列MMD={MMD(1),MMD(2),…,MMD(N)};
步骤2.3,基于前两步所得每个特征的LS和MMD值,构建新的特征选取指标KFSI,用于从OSFS中选择关键特征;第k个特征的KFSI定义如下:
Figure BDA0003894547260000046
对于N种统计特征,可得到KFSI序列KFSI={KFSI(1),KFSI(2),…,KFSI(N)};对KFSI序列进行排序,选择KFSI较高的特征,并以降序排序的KFSI序列进行关键特征选择构建关键特征集。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,步骤3具体步骤如下:将步骤2中所选取的来自源域的带标签关键特征子集作为训练集,将来自目标域的未标记关键特征子集作为测试集,采用具有流形嵌入的监督域自适应法SDAME进行域适配,包括流形子空间学习、改进的分布适应性、学习分类器。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,所述具有流形嵌入的监督域自适应法SDAME具体包含如下步骤:
步骤3.1,输入源域数据XS和目标域数据XT,输入XS的真实标签yS、流形子空间维数d、正则化参数λ、α、η、μ及迭代次数I;
步骤3.2,学习Grassmann流形GM变换核G,采用测地线流核方法GFK将原始空间(XS,XT)转换至GM空间,获取高维特征空间的低维流形结构;
首先将原始特征数据嵌入G(d)中,
Figure BDA0003894547260000055
表示d维的正交线性子空间;对于分别来源于源域与目标域的关键特征数据XS和XT,采用主成分分析PCA算法对其进行处理,得到相应的正交子空间PS和PT,即
Figure BDA0003894547260000051
其次构建测地线流曲线Φ(t);令RS∈RD×(D-d)为PS的正交补,即
Figure BDA0003894547260000052
D为原始特征数据的维数,则测地线流参数化如下:
Φ:t∈[0,1]→Φ(t)∈G(d) (13)
式中,Φ(0)=PS,Φ(1)=PT;对于t∈(0,1),测地线流Φ(t)的表达式为:
Φ(t)=PSU1Γ(t)-RSU2∑(t) (14)
式中,U1∈Rd×d和U2∈R(D-d)×d为正交矩阵,由奇异值分解算法可得:
Figure BDA0003894547260000053
式中,Γ和∑为d×d维对角矩阵,对角元素分别为cosθi和sinθi,θi范围为:
Figure BDA0003894547260000054
则新的特征为Z=Φ(t)TX,变换后的特征zi和zj的内积可表示为:
Figure BDA0003894547260000061
式中,
Figure BDA0003894547260000062
式中,Λ1、Λ2和Λ3为对角矩阵,元素如下所示:
Figure BDA0003894547260000063
最终原始空间的特征数据集转换为带有
Figure BDA0003894547260000064
约束条件的G(d),获得新的源域ZS与目标域ZT
步骤3.3,采用一种改进的分布自适应方法IDA来减小源域和目标域之间的分布差异,具体实现如下:
1)首先对齐源域与目标域的边缘分布,对于上述步骤中源域和目标域特征在G(d)上的表示ZS和ZT,通过最小化它们之间的MMD对齐源域与目标域的边缘分布P(ZS)和P(ZT),MMD计算式如下:
Figure BDA0003894547260000065
式中,H为再现核Hilbert空间(RKHS),nS和nT分别为ZS和ZT的特征个数,tr(·)表示矩阵的迹,矩阵K的定义如下:
Figure BDA0003894547260000066
式中,KS,S、KS,T和KT,T分别为源域、跨域及目标域的核矩阵;矩阵L0定义如下:
Figure BDA0003894547260000067
矩阵K可以分解为经验核映射,通过使用矩阵
Figure BDA0003894547260000068
将经验核映射到低维空间;因此,得到核矩阵K的计算结果如下:
Figure BDA0003894547260000071
式中,
Figure BDA0003894547260000072
因此P(ZS)和P(ZT)之间的MMD可以进一步表示为:
Figure BDA0003894547260000073
式中,W是一个变换矩阵;边缘分布适应的优化目标是得到一个最优的变换矩阵,使P(ZS)与P(ZT)之间的MMD在变换后达到最小;
2)其次是对齐源域与目标域的条件分布QS(YS|ZS)和QT(YT|ZT),同时为克服目标域无标签的问题,采用带标签的源域数据训练基分类器,利用训练好的基分类器预测目标域数据的伪标签;
通过匹配源域与目标域的类条件分布,得到QS(ZS|YS=c)和QT(ZT|YT=c),其中c∈[1,2,…,C]为标签集的标签,C为特征类别数;因此QS(ZS|YS=c)和QT(ZT|YT=c)之间的MMD值计算为:
Figure BDA0003894547260000074
式中,
Figure BDA0003894547260000075
Figure BDA0003894547260000076
分别为源域数据和目标域数据中属于c类的样本集;
Figure BDA0003894547260000077
表示目标域数据zi的伪标签;
Figure BDA0003894547260000078
Figure BDA0003894547260000079
分别为源数据和目标数据中属于c类的样本个数;MMD矩阵Lc的计算公式如下:
Figure BDA00038945472600000710
通过最小化式(25),在新的表示形式
Figure BDA00038945472600000711
Figure BDA00038945472600000712
下,缩小了
Figure BDA00038945472600000713
Figure BDA00038945472600000714
之间的条件分布;
3)然后计算保留邻近关系的类内散点矩阵S(w),用于保持相同类数据之间的邻近关系;S(w)定义如下:
Figure BDA0003894547260000081
式中,
Figure BDA0003894547260000082
为亲和矩阵,表示同一类中样本对的权重值,
Figure BDA0003894547260000083
定义如下:
Figure BDA0003894547260000084
式中,Ai,j∈[0,1]为zi和zj之间的亲和力,Ai,j定义如下:
Figure BDA0003894547260000085
式中,σi表示zi周围数据样本的局部缩放,可表示为
Figure BDA0003894547260000086
其中
Figure BDA0003894547260000087
为zi的第K个最近邻,K一般取7;
4)最后基于上述三个方面,提出一种改进的分布对齐方法DH(ZS,ZT),定义如下:
Figure BDA0003894547260000088
根据式(23)和式(24),DH(ZS,ZT)可进一步表示为:
DH(ZS,ZT)=(1-α)tr(WTKLcKW)+αtr(WTKL0KW)+μtr(WTKS(w)KW) (31)
式中,α∈[0,1]是一个平衡因子,用于调整两个分布在分布对齐过程中的重要性;μ∈[0,1]也是一个调优参数;
步骤3.4,在上述MSL和IDA步骤的基础上,基于结构结构风险最小化(StructuralRiskMinimization,SRM),利用ZS和DH(ZS,ZT)得到新的域不变分类器f;
应用平方损失l2,分类器f可表示为:
Figure BDA0003894547260000089
式中,ΗK是RKHS;η和λ是正则化参数;
可对式(31)的每一项进行重新定义以进行高效学习,具体表示为:
基于表征者定理,分类器f可展开为:
Figure BDA0003894547260000091
式中,
Figure BDA0003894547260000092
因此,式(32)可以进一步表示为:
Figure BDA0003894547260000093
式中,||·||F为Frobenious范数,
Figure BDA0003894547260000094
为核矩阵,
Figure BDA0003894547260000095
为对角域指示矩阵,i∈ZS成立时Aii=1,不成立时Aii=0;
Figure BDA0003894547260000096
为ZS和ZT的类标签矩阵;由式(28)可得,矩阵L表示如下:
L=(1-α)Lc+αL0+μS(w) (35)
由式(32)和式(33),设定导数
Figure BDA0003894547260000097
可得到方程的解为:
W*=((A+λL)K+ηI)-1AYT (36)
采用学习到的分类器f,更新目标域的伪标签,采用上述步骤重新计算矩阵L,重复进行迭代,直到迭代次数为I;最终输出迭代完成后的学习分类器f。
作为本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法的进一步优选方案,在步骤4,构建基于KSDL和SDAME的跨域旋转机械故障诊断模型,具体步骤如下:以步骤2得到的来自于测试集的无标签关键特征子集作为输入,采用步骤3更新后的分类器f,输出跨域诊断结果,即得到目标域的标签信息。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明一种基于流形嵌入和关键特征选取的机械故障诊断方法,其在旋转机械故障诊断中,基于领域自适应迁移学习的框架因解决了特征分布不一致和标记故障特征数据不足的问题备受关注,面对复杂多变的机械工作条件,满足旋转机械故障诊断模型在较少训练数据条件下高诊断准确度的同时,还有优越的跨域诊断性能;
3、现有的大多数方法主要集中在跨域分布对齐或流形子空间学习上,这面临两个关键问题:1)在原始特征空间中对分布进行对齐时,难以克服特征畸变;2)子空间学习不足以降低分布散度,本发明针对这两个关键问题,基于流形特征学习与跨域分布对齐相结合的思想,本发明提出了基于类信息和邻近关系的流形子空间分布对齐算法,将原始空间中的特征转化为流形子空间后进行跨域特征分布比对,利用有益的几何特性有效实现分布比对;
4、本发明在进行域适配前,针对实际旋转机械的工况变化可能会导致区域漂移,且高维原始特征数据集可能会带来冗余和干扰导致跨域故障诊断的准确性下降等问题,本发明提出了一种基于域间差异与Laplace分数的关键特征选取方法,用于评价特征的故障判别能力和域不变特性,可从原始特征集中选择有利于域自适应的关键特征;提升诊断模型在旋转机械跨域故障诊断的泛化能力与诊断准确率。
附图说明
图1是本发明一种基于流形嵌入和关键特征选取的旋转机械故障诊断方法的原理图;
图2是深度迁移自编码器模型的结构框图;
图3是本发明用于电机跨域故障诊断的系统框架的结构图;
图4是SQI-MFS测试平台、电机故障数据采集设备和故障电机示意图;
图5是5种电机状态的示例原始振动样本信号图;
图5(a)是1200rpm下的正常状态原始信号;
图5(b)是1800rpm下的正常状态原始信号;
图5(c)是1200rpm下的转子断条故障状态原始信号;
图5(d)是1800rpm下的转子断条故障状态原始信号;
图6是正常电机振动信号分解得到的小波包节点重构信号图;
图6(a)是分解图5(a)得到的16个WPN的RS;
图6(b)是分解图5(b)得到的16个WPN的RS;
图6(c)是分解图5(c)得到的16个WPN的RS;
图6(d)是分解图5(d)得到的16个WPN的RS;
图7是源域总352个统计特征的Laplace分数结果图;
图8是源域中352个统计特征的MMD结果图;
图9是源域中352个统计特征的KFSI结果图;
图10是基于KFS-SDAME得到的电机故障诊断结果图;
图10(a)是任务1基于KFS-SDAME得到的电机故障诊断结果图;
图10(b)是任务2基于KFS-SDAME得到的电机故障诊断结果图;
图11是基于KFS-SDAME在任务1和2中的混淆矩阵;
图11(a)是对应于任务1的平均准确率为88%、nkf=88的混淆矩阵;
图11(b)是任务1对应于平均准确率64.67%、nkf=352混淆矩阵,即未使用KSDL;
图11(c)是任务2对应于平均准确率为89.33%、nkf=33的混淆矩阵;
图11(d)是任务2对应于平均准确率为58%、nkf=352的混淆矩阵,即未使用KSDL;
图12是一般故障诊断模型和KFS-SDAME获得的电机故障诊断结果的比较;
图13是任务1中KFS-SDAME和OFS-JDA/DBN/CNN/DAE模型在不同迭代次数下故障诊断准确率;
图14是任务2中KFS-SDAME和OFS-JDA/DBN/CNN/DAE模型在不同迭代次数下故障诊断准确率。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于流形嵌入和关键特征选取的旋转机械故障诊断方法,包括4个过程,具体包含如下4个步骤:
步骤1,采用最大重叠离散小波包变换(Maximal Overlap Discrete WaveletPacket Transform,MODWPT)对特定工况下旋转机械的原始振动信号进行信号处理,并计算统计参数构建原始统计特征集(Original Statistical Features Set,OSFS);
步骤2,对步骤1构建的原始统计特征集中的特征进行故障判别能力及域不变性研究,构建关键特征选择指标,选取出可表征旋转机械状态的域不变关键特征,构建样本的关键特征子集;
步骤3,将步骤2得到的源域的带标签关键特征子集作为训练数据集,得到的目标域的无标签关键特征子集作为测试数据集。采用流行子空间学习(Manifold SubspaceLearning,MSL)将原特征空间的训练集与测试集转换为流行子空间;在考虑特征相邻关系的情况下,采用改进的分布适应法(Improved DistributionAdaptation,IDA)对源域和目标域的边缘分布和条件分布进行匹配;最终依据结构风险最小化(Structural RiskMinimization,SRM)原理学习新的域不变分类器f;
步骤4,采用步骤3中得到的领域不变分类器f预测测试数据集的标签,并输出故障诊断结果。
优选的,步骤1具体步骤如下:将来自于不同特定工况下的原始振动信号样本分为振动数据集1(工况1)和振动数据集2(工况2),其中振动数据集1为源域,其数据集的样本有标签;振动数据集2为目标域,其数据集的样本无标签,需运用来自源域的已知标签样本对诊断模型进行训练,并使用训练后的模型对目标域进行状态分类。
具体实施例如下:
过程1.信号处理:
将不同转速下所采集的滚动轴承振动信号分别定为本发明所需要的源域与目标域,其中,源域为带标记的样本(即已知其电机状态),目标域采用未标记的样本。采用DTCWPT对每一样本进行信号处理,将其分解为不同的分组节点,通过计算极差、均值、标准差、峰度、能量、能量熵、偏度、波峰因数、脉冲因数、形状因数和纬度因数11种统计参数来获得表征电机运行状态的特征数据集。
对源域和目标域的每一个振动信号样本进行四层MODWPT分解,获取16个终端小波包节点,同时对底层节点系数进行单支小波包重构获得16个单支重构信号,并分别求得16个重构信号的希尔伯特包络谱(Hilbert Envelope Spectra,HES),提取每个重构信号与每个HES的11个统计参数,共生成352个统计特征,构成时频混合域原始统计特征集OSFS。
过程2.特征选取:
利用来自源域原始统计特征集的带标签故障特征数据和目标域的正常状态特征数据,采用基于域间差异和Laplace分数的关键特征选取方法KSDL对原始统计特征集的特征进行评价,得到关键特征选择指标KFSI,采用降序排序后的KFSI序列选择原始统计特征集的关键特征构成关键特征子集。
优选的,对于步骤1所得到的源域OSFS中的带标签故障特征数据,计算出每一种特征的Laplace分数(Laplacian score,LS),以评估特征的可区分性;采用最大平均差异(MaximumMean Discrepancy,MMD)计算源域与目标域OSFS中正常状态特征的域间差异度,以度量源域和目标域之间的分布差异。对于得到的每一特征的LS与MMD,构建关键特征选取指标KFSI。对KFSI序列进行降序排序,KFSI值越高,表明特征的故障分辨能力与域不变性越高,越有利于领域自适应。对于来自目标域原始特征集的无标签特征数据,直接用排序后的KFSI序列进行域不变特征选取。
优选的,具体KSDL方法的步骤如下:
步骤2.1对于工况1(源域)的M个旋转机械振动信号样本,经过步骤1的信号处理与统计特征提取过程,每个振动信号样本可以获得包含N种统计特征,可以构建原始统计特征集F=[f1,f2,…,fM]T,其中fi={fi 1,fi 2,…fi N},i∈[1,M]表示第i个振动信号样本的N个统计特征的集合,其中fi k为第i个样本的第k个统计特征,对于此特征首先计算其Laplace分数,计算步骤如下:
构建一个具有m个节点的最近邻图G,G中的节点p对应于第p个数据xp。在节点p和q之间,如果xp和xq是“接近的”,则xp是xq的j个最近邻之一或xq是xp的j个最近邻之一。计算邻近节点p和q的权矩阵WMpq,其定义如下:
Figure BDA0003894547260000121
式中,t是常数。如果节点p和q没有相连,则WMpq=0。
对于第k个特征,有以下定义:
Figure BDA0003894547260000122
D=diag(WM×I),I=[1,…,1]T (3)
L=D-WM (4)
式中,L表示拉普拉斯矩阵,D是一个m×m维的对角矩阵,I是一个m维的单位向量。可令:
Figure BDA0003894547260000123
则第k个特征的LS计算式如下:
Figure BDA0003894547260000124
在原始的高维特征集中,可以计算出每种特征的Laplace分数LS(k),得到N个特征的LS序列LS={LS(1),LS(2),…,LS(N)},特征的Laplace分数与特征的可区分性成反比。因此LS的值越低,特征的类别判别程度越高。
步骤2.2对于工况1(源域)与工况2(目标域)的正常状态特征数据,通过MMD评估同一特征的在不同域的分布差异,MMD的值作为特征域不变性的量化指标。来自源域和目标域的正常状态特征数据分别定义为SF和TF,都包含M个样本,且每个样本经过步骤1的信号处理与统计特征提取后包含N种统计特征。SF和TF表达式如下:
Figure BDA0003894547260000131
Figure BDA0003894547260000132
其中,SF和TF的第k列元素分别表示来自源域和目标域的第k个特征的M个样本((j∈[1,2,…,N])),其表达式如下:
Figure BDA0003894547260000133
Figure BDA0003894547260000134
SFk和TFk之间分布的经验距离估计定义如下:
Figure BDA0003894547260000135
式中,||·||H表示RKHS范数,φ表示内核诱导的特征图。进一步可以计算N种统计特征的MMD序列MMD={MMD(1),MMD(2),…,MMD(N)}。MMD的值越小,同一特征在不同域的分布散度越小,特征的域不变性越好。
步骤2.3基于前两步所得每个特征的LS和MMD值,构建新的特征选取指标KFSI,用于从OSFS中选择关键特征。第k个特征的KFSI定义如下:
Figure BDA0003894547260000136
对于N种统计特征,可得到KFSI序列KFSI={KFSI(1),KFSI(2),…,KFSI(N)}。对KFSI序列进行排序,选择KFSI较高的特征,并以降序排序的KFSI序列进行关键特征选择构建关键特征集。
过程3.深度迁移自编码器模型构建
将步骤2中所选取的来自源域的带标签关键特征子集作为训练集,将来自目标域的未标记关键特征子集作为测试集,采用具有流形嵌入的监督域自适应法(SupervisedDomain Adaptation with Manifold Embedding,SDAME)进行域适配,主要包括流形子空间学习(Manifold Subspace Learning,MSL)、改进的分布适应性(Improved DistributionAdaptation,IDA)、学习分类器等步骤。
优选的,具体SDAME的步骤如下:
步骤3.1输入源域数据XS和目标域数据XT,输入XS的真实标签yS、流形子空间维数d、正则化参数λ、α、η、μ及迭代次数I。
步骤3.2学习Grassmann流形(Grassmann manifold,GM)变换核G,采用测地线流核方法(Geodesic Flow Kernel,GFK)将原始空间(XS,XT)转换至GM空间,获取高维特征空间的低维流形结构。
首先将原始特征数据嵌入G(d)中,
Figure BDA0003894547260000145
表示d维的正交线性子空间。对于分别来源于源域与目标域的关键特征数据XS和XT,采用主成分分析(Principal ComponentAnalysis,PCA)算法对其进行处理,得到相应的正交子空间PS和PT,即
Figure BDA0003894547260000141
其次构建测地线流曲线Φ(t)。令RS∈RD×(D-d)为PS的正交补,即
Figure BDA0003894547260000142
D为原始特征数据的维数,则测地线流参数化如下:
Φ:t∈[0,1]→Φ(t)∈G(d) (13)
式中,Φ(0)=PS,Φ(1)=PT。对于t∈(0,1),测地线流Φ(t)的表达式为:
Φ(t)=PSU1Γ(t)-RSU2∑(t) (14)
式中,U1∈Rd×d和U2∈R(D-d)×d为正交矩阵,由奇异值分解算法可得:
Figure BDA0003894547260000143
式中,Γ和∑为d×d维对角矩阵,对角元素分别为cosθi和sinθi,θi范围为:
Figure BDA0003894547260000144
则新的特征为Z=Φ(t)TX,变换后的特征zi和zj的内积可表示为:
Figure BDA0003894547260000151
式中,
Figure BDA0003894547260000152
式中,Λ1、Λ2和Λ3为对角矩阵,元素如下所示:
Figure BDA0003894547260000153
最终原始空间的特征数据集转换为带有
Figure BDA0003894547260000154
约束条件的G(d),获得新的源域ZS与目标域ZT
步骤3.3采用一种改进的分布自适应方法(IDA)来减小源域和目标域之间的分布差异,此方法具体实现如下:
1)首先对齐源域与目标域的边缘分布,对于上述步骤中源域和目标域特征在G(d)上的表示ZS和ZT,通过最小化它们之间的MMD对齐源域与目标域的边缘分布P(ZS)和P(ZT),MMD计算式如下:
Figure BDA0003894547260000155
式中,H为再现核Hilbert空间(RKHS),nS和nT分别为ZS和ZT的特征个数,tr(·)表示矩阵的迹,矩阵K的定义如下:
Figure BDA0003894547260000156
式中,KS,S、KS,T和KT,T分别为源域、跨域及目标域的核矩阵。矩阵L0定义如下:
Figure BDA0003894547260000157
矩阵K可以分解为经验核映射,通过使用矩阵
Figure BDA0003894547260000158
将经验核映射到低维空间。因此,得到核矩阵K的计算结果如下:
Figure BDA0003894547260000161
式中,
Figure BDA0003894547260000162
因此P(ZS)和P(ZT)之间的MMD可以进一步表示为:
Figure BDA0003894547260000163
式中,W是一个变换矩阵。边缘分布适应的优化目标是得到一个最优的变换矩阵,使P(ZS)与P(ZT)之间的MMD在变换后达到最小。
2)其次是对齐源域与目标域的条件分布QS(YS|ZS)和QT(YT|ZT),同时为克服目标域无标签的问题,采用带标签的源域数据训练基分类器,利用训练好的基分类器预测目标域数据的伪标签。通过匹配源域与目标域的类条件分布,得到QS(ZS|YS=c)和QT(ZT|YT=c),其中c∈[1,2,…,C]为标签集的标签,C为特征类别数。因此QS(ZS|YS=c)和QT(ZT|YT=c)之间的MMD值计算为:
Figure BDA0003894547260000164
式中,
Figure BDA0003894547260000165
Figure BDA0003894547260000166
分别为源域数据和目标域数据中属于c类的样本集。
Figure BDA0003894547260000167
表示目标域数据zi的伪标签。
Figure BDA0003894547260000168
Figure BDA0003894547260000169
分别为源数据和目标数据中属于c类的样本个数。MMD矩阵Lc的计算公式如下:
Figure BDA00038945472600001610
通过最小化式(25),在新的表示形式
Figure BDA00038945472600001611
Figure BDA00038945472600001612
下,缩小了
Figure BDA00038945472600001613
Figure BDA00038945472600001614
之间的条件分布。
3)然后计算保留邻近关系的类内散点矩阵S(w),用于保持相同类数据之间的邻近关系。S(w)定义如下:
Figure BDA0003894547260000171
式中,
Figure BDA0003894547260000172
为亲和矩阵,表示同一类中样本对的权重值,
Figure BDA0003894547260000173
定义如下:
Figure BDA0003894547260000174
式中,Ai,j∈[0,1]为zi和zj之间的亲和力,Ai,j定义如下:
Figure BDA0003894547260000175
式中,σi表示zi周围数据样本的局部缩放,可表示为
Figure BDA0003894547260000176
其中
Figure BDA0003894547260000177
为zi的第K个最近邻,K一般取7。
4)最后基于上述三个方面,提出一种改进的分布对齐方法DH(ZS,ZT),定义如下:
Figure BDA0003894547260000178
根据式(23)和式(24),DH(ZS,ZT)可进一步表示为:
DH(ZS,ZT)=(1-α)tr(WTKLcKW)+αtr(WTKL0KW)+μtr(WTKS(w)KW) (31)
式中,α∈[0,1]是一个平衡因子,用于调整两个分布在分布对齐过程中的重要性。μ∈[0,1]也是一个调优参数。
步骤3.4在上述MSL和IDA步骤的基础上,基于结构结构风险最小化(StructuralRisk Minimization,SRM),利用ZS和DH(ZS,ZT)得到新的域不变分类器f。应用平方损失l2,分类器f可表示为:
Figure BDA0003894547260000179
式中,ΗK是RKHS。η和λ是正则化参数。因此可对式(31)的每一项进行重新定义以进行高效学习,具体表示为:
基于表征者定理,分类器f可展开为:
Figure BDA0003894547260000181
式中,
Figure BDA0003894547260000182
因此,式(32)可以进一步表示为:
Figure BDA0003894547260000183
式中,||·||F为Frobenious范数,
Figure BDA0003894547260000184
为核矩阵,
Figure BDA0003894547260000185
为对角域指示矩阵,i∈ZS成立时Aii=1,不成立时Aii=0。
Figure BDA0003894547260000186
为ZS和ZT的类标签矩阵。由式(28)可得,矩阵L表示如下:
L=(1-α)Lc+αL0+μS(w) (35)
由式(32)和式(33),设定导数
Figure BDA0003894547260000187
可得到方程的解为:
W*=((A+λL)K+ηI)-1AYT (36)
采用学习到的分类器f,更新目标域的伪标签,采用上述步骤重新计算矩阵L,重复进行迭代,直到迭代次数为I。最终输出迭代完成后的学习分类器f。
过程4.模式识别
以步骤2得到的来自于测试集的无标签关键特征子集作为输入,采用步骤3更新后的分类器f,输出跨域诊断结果,即得到目标域的标签信息。
1实验数据介绍
本发明通过电机故障诊断实验验证所提旋转机械故障诊断方法在跨域下的故障诊断能力,测试台为SQI-MFS测试台,如图3所示,SQI-MFS支持1200-1800转/分钟的电机转速,试验台的具体电机参数见表1。振动信号由安装在电机驱动端和风扇端的采集卡和加速度传感器采样,采样频率为16kHz。实验设备包含电机故障数据采集部分与多个可拆卸安装的故障电机。
表1
Figure BDA0003894547260000188
这里通过采集1200rmp、1800rmp两种转速电机的振动信号来实现跨域故障诊断工作,电机主要参数介绍如表1所示。实验台共有一台正常状态(NM)电机与四台故障电机,对应5种电机状态,电机状态类别标签设置为1-5,用于源域的样本标记与状态识别结果的匹配。故障电机分别设置转子断条故障(BRBF)、绕组故障(WF)、转子弯曲故障(RBF)和单相电压不平衡故障(SPVUF)。对于每个电机工况,从原始振动信号样本中选取90个随机样本,其中30个随机样本作为训练样本,60个随机样本作为测试样本,5000个连续的数据点组成一个样本。电机数据集的详细介绍如表2所示。根据上述振动数据,建立了2个跨域故障诊断任务,如表3所示,分别选择1200rmp和1800rmp转速下的振动样本作为任务1和任务2的源域;分别选择1800rmp和1200rmp转速下的振动样本作为任务1和任务2的目标域。两个任务的源域和目标域分别包含150和300个振动样本。
表2
Figure BDA0003894547260000191
表3
Figure BDA0003894547260000192
2实验步骤
2.1基于KSDL与SDAME的旋转机械故障诊断模型;
采用基于KFS-SDAME模型进行旋转机械故障诊断的步骤包括信号处理、特征选取、构建深度迁移自编码器和模式识别。
信号处理。首先,从原始电机振动信号中提取混合域统计特征集。通过MODWPT将信号分解为不同的小波包节点(WPN)。MODWPT的母小波是"dmey",分解级别设置为4,得到16个终端小波包节点。然后,可以生成相应的16个单分支重建信号(RS)。基于这16个RS及其希尔伯特包络谱(HES),通过计算表4所列的11个统计参数,每个HES和每个重建信号可以分别提取11个统计特征。因此,总共可以得到352个统计特征,这就构成了混合域统计特征集。NM和BRBF电机在1200rmp和1800rmp转速下的振动信号如图5所示,图5是5种电机状态的示例原始振动样本信号图;
图5(a)是1200rpm下的正常状态原始信号;图5(b)是1800rpm下的正常状态原始信号,图5(c)是1200rpm下的转子断条故障状态原始信号,图5(d)是1800rpm下的转子断条故障状态原始信号;
端子WPN的单支路RS如图6所示,图6是正常电机振动信号分解得到的小波包节点重构信号图;
其中,图6(a)是分解图5(a)得到的16个WPN的RS;图6(b)是分解图5(b)得到的16个WPN的RS;图6(c)是分解图5(c)得到的16个WPN的RS;图6(d)是分解图5(d)得到的16个WPN的RS。
表4
Figure BDA0003894547260000201
特征选择。利用来自源域原始统计特征集的带标签故障特征数据和目标域的正常状态特征数据,采用基于域间差异和Laplace分数的关键特征选取方法KSDL对原始统计特征集的特征进行评价,得到关键特征选择指标KFSI,采用降序排序后的KFSI序列选择原始统计特征集的关键特征构成关键特征子集。源域所有状态下的352个特征的Laplace分数、MMD以及KFSI分别如图7-9所示。图7描述了Laplace分数分布在0-1之间,Laplace分数值越高,特征的判别性能就越好。如图8所示,MMD值的范围为[0,1]。MMD值接近0,该特征具有较好的域不变性能;MMD的值接近1,该特征的域不变性能较差。图9是源域关键特征选择指标KFSI结果图,KFSI值范围分布在[0,70],KFSI值越高,特征的领域适应能力越好。
构建深度迁移自编码器。将根据KSDL方法选取的来自源域的带标签关键特征子集作为训练集,将来自目标域的未标记关键特征子集作为测试集,采用SDAME进行域适配,主要包括流形子空间学习、改进的分布适应性、学习分类器f等步骤。
模式识别。以KSDL方法得到的来自于测试集的无标签关键特征子集作为输入,采用迭代更新后的分类器f,输出跨域诊断结果,即得到目标域的标签信息。
2.2基于KSDL与SDAME的旋转机械故障诊断模型实验分析
在本节中,将基于KSDL与SDAME的旋转机械故障诊断模型用于SQI-MFS测试台电机故障诊断。
2.2.1KSDL有效性验证
为了验证电机振动信号通过KSDL方法选择的关键特征能够有效表征电机故障特征,选取不同的关键特征数量作为变量,在任务1和任务2上进行实验。关键特征数量为352时,表示没有进行关键特征选择。根据本发明内容中所示的KFS-SDAME方案的实施步骤,在SQI-MFS测试台得到的电机故障数据集上进行测试,实验结果如表5及图9所示。
表5
Figure BDA0003894547260000202
Figure BDA0003894547260000211
根据表5和图10所示的诊断准确率,很明显关键特征数量(nkf)对任务1和2的诊断准确率有一定的影响,在不使用KSDL的情况下,即直接使用全部352个特征对于域适应和故障识别,诊断结果并不理想。对于任务1,当流行子空间维数(msd)分别为5、10、20、30时,平均诊断准确率分别可以达到62.67%、63.33%、64.67%、70.33%。对于任务2,平均诊断准确率可分别达到58%、58%、59%和70%。当使用KSDL并选择合适的关键特征数量时,可以显着提高故障诊断的准确性。对于任务1,当nkf为88,msd为20时,最大平均诊断准确率可以达到86%。对于任务2,当nkf为33,msd为5时,最大平均诊断准确率可以达到89.33%。任务1和任务2的诊断结果均高于不使用KSDL的诊断结果,这可以验证所提出的KSDL在适当的nkf对提高故障诊断准确性方面的有效性。
图11(a)为对应于任务1的平均准确率为88%、nkf=88的混淆矩阵;图11(b)为任务1对应于平均准确率64.67%、nkf=352混淆矩阵,即未使用KSDL;图11(c)为任务2对应于平均准确率为89.33%、nkf=33的混淆矩阵;图11(d)为任务2对应于平均准确率为58%、nkf=352的混淆矩阵,即未使用KSDL。根据图11中的混淆矩阵,可以看出,与不使用KSDL的模型相比,KFS-SDAME模型的错误分类类型和数量都明显减少。SDAME中使用的正则化参数如下:λ=20,α=0.5,η=0.1,μ=5,迭代次数I=10。
2.2.2对比实验
为了进一步验证所提出的故障诊断方案KFS-SDAME的优越性,本实施例选择了一些经典的智能诊断方法和域自适应方法对SQI-MFS测试台收集的电机数据集进行测试,并统计在两种任务中的诊断准确率。经典的智能诊断方法包括SVM、KNN、DAE、DBN和CNN,域适应方法包括TCA、GFK和JDA。基于上述方法,构建了一些比较故障诊断模型,如表6所示。以OFS-SVM为例,它表示一种将所有原始特征用作分类器SVM的输入的故障诊断模型。OFS-KSDL-TCA表示一种使用KSDL和TCA的故障诊断模型,其中KSDL和TCA分别用于特征选择和域自适应,最后使用SVM进行故障分类。在本文中,KSDL的作用是选择一些有利于域适应的关键特征,因此,我们将KSDL与TCA,JDA和GFK结合起来构建了一些比较模型。
表6
Figure BDA0003894547260000221
任务1和任务2中进行的对比实验结果如表7和图12所示。从表7可以得出结论:KFS-SDAME明显优于其他模型。与经典的智能诊断方法相比,任务1中KFS-SDAME的平均准确率86%,分别比OFS-SVM、OFS-KNN、OFS-DAE、OFS-DBN和OFS-CNN高25.67%、38%、39.67%、49.67%和16.33%;任务2中KFS-SDAME的平均精度为89.33%,分别比OFS-SVM、OFS-KNN、OFS-DAE、OFS-DBN和OFS-CNN高17%、35%、22.67%、21.33%和21.67%。与域适应方法相比,KFS-SDAME取得了更高的平均准确率。
此外,根据任务1和任务2中的OFS-KSDL-TCA,OFS-KSDL-JDA和OFS-KSDL-GFK的结果,可以验证KSDL的有效性。结合KSDL和域自适应方法,该模型可以获得更好的诊断性能。例如,任务1和任务2中OFS-KSDL-GFK的平均诊断准确率分别为66.00%和69.67%,分别比OFS-GFK高16.33%和15%。因此,这表明所提出的KSDL可以帮助选择有利于提高域自适应性能和跨域诊断准确性的关键特征。
表7
Figure BDA0003894547260000222
Figure BDA0003894547260000231
SDAME的有效性:如表7所示,通过KFS-SDAME、OFS-KSDL-TCA、OFS-KSDL-JDA和OFS-KSDL-GFK的比较实验,表明本文提出的SDAME机制在域适应方面的优越性高于TCA、JDA和GFK。在域适应过程中,仅考虑流形子空间学习或分布对齐,减小域间分布差异,提高跨域诊断性能是不够的。因此,SDAME实现了在流形空间中进行跨域特征分布对齐,任务1和任务2的实验结果证明了SDAME的有效性。
为了深入分析KFS-SDAME在提高故障分类准确率方面的有效性和原因,我们还对训练模型的收敛性进行了比较分析。图13和图14分别表示,任务1和任务2中KFS-SDAME和OFS-JDA/DBN/CNN/DAE模型在不同迭代次数下故障诊断准确率。KFS-SDAME模型在迭代超过6次时可以达到稳定的精度,OFS-JDA模型在迭代超过20次时可以达到稳定的精度。然而,基于DL的模型(OFS-CNN、OFS-DAE和OFS-DBN)比KFS-SDAME和OFS-JDA需要更多的迭代,它们分别需要超过1100、950和1850次迭代。因此,很明显,KFS-SDAME和OFS-JDA模型的收敛速度比OFS-CNN、OFS-DAE和OFS-DBN模型快。
以上,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (9)

1.一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:具体包含如下步骤:
步骤1,采用最大重叠离散小波包变换MODWPT对特定工况下旋转机械的原始振动信号进行信号处理,并计算统计参数构建原始统计特征集OSFS;
步骤2,对步骤1构建的原始统计特征集中的特征进行故障判别能力及域不变性研究,构建关键特征选择指标,选取出可表征旋转机械状态的域不变关键特征,构建样本的关键特征子集;
步骤3,将步骤2得到的源域的带标签关键特征子集作为训练数据集,得到的目标域的无标签关键特征子集作为测试数据集;
采用流行子空间学习MSL将原特征空间的训练集与测试集转换为流行子空间;
在考虑特征相邻关系的情况下,采用改进的分布适应法IDA对源域和目标域的边缘分布和条件分布进行匹配;
依据结构风险最小化SRM原理学习新的域不变分类器f;
步骤4,采用步骤3中得到的领域不变分类器f预测测试数据集的标签,并输出故障诊断结果。
2.根据权利要求1所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:在步骤1中,
将来自于不同特定工况下的原始振动信号样本分为振动数据集1和振动数据集2;
其中,振动数据集1为工况1,振动数据集2为工况2;
其中,振动数据集1为源域,其数据集的样本有标签;
振动数据集2为目标域,其数据集的样本无标签,需运用来自源域的已知标签样本对诊断模型进行训练,并使用训练后的模型对目标域进行状态分类。
3.根据权利要求2所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:对源域和目标域的每一个振动信号样本进行四层最大重叠离散小波包变换MODWPT分解,获取16个终端小波包节点,同时对底层节点系数进行单支小波包重构获得16个单支重构信号,并分别求得16个重构信号的希尔伯特包络谱HES,提取每个重构信号与每个希尔伯特包络谱HES的11个统计参数,共生成352个统计特征,构成时频混合域原始统计特征集OSFS。
4.根据权利要求1所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:在步骤2中,利用来自源域原始统计特征集的带标签故障特征数据和目标域的正常状态特征数据,采用基于域间差异和Laplace分数的关键特征选取方法KSDL对原始统计特征集的特征进行评价,得到关键特征选择指标KFSI,采用降序排序后的KFSI序列选择原始统计特征集的关键特征构成关键特征子集。
5.根据权利要求1所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:对于步骤1所得到的源域OSFS中的带标签故障特征数据,计算出每一种特征的Laplace分数,以评估特征的可区分性;
采用最大平均差异计算源域与目标域OSFS中正常状态特征的域间差异度,以度量源域和目标域之间的分布差异;
对于得到的每一特征的LS与MMD,构建关键特征选取指标KFSI;
对KFSI序列进行降序排序,KFSI值越高,表明特征的故障分辨能力与域不变性越高,越有利于领域自适应;
对于来自目标域原始特征集的无标签特征数据,直接用排序后的KFSI序列进行域不变特征选取。
6.根据权利要求4所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:在步骤2中,所述关键特征选取方法KSDL方法,具体包含如下步骤:
步骤2.1,对于工况1源域的M个旋转机械振动信号样本,经过步骤1的信号处理与统计特征提取过程,每个振动信号样本可以获得包含N种统计特征,可构建原始统计特征集F=[f1,f2,…,fM]T
其中,fi={fi 1,fi 2,…fi N},i∈[1,M]表示第i个振动信号样本的N个统计特征的集合,其中,fi k为第i个样本的第k个统计特征,对于此特征首先计算其Laplace分数,计算步骤如下:
构建一个具有m个节点的最近邻图G,G中的节点p对应于第p个数据xp;在节点p和q之间,如果xp和xq是接近的,则xp是xq的j个最近邻之一或xq是xp的j个最近邻之一;计算邻近节点p和q的权矩阵WMpq,其定义如下:
Figure FDA0003894547250000021
式中,t是常数;如果节点p和q没有相连,则WMpq=0;
对于第k个特征,有以下定义:
Figure FDA0003894547250000031
D=diag(WM×I),I=[1,…,1]T (3)
L=D-WM (4)
式中,L表示拉普拉斯矩阵,D是一个m×m维的对角矩阵,I是一个m维的单位向量;可令:
Figure FDA0003894547250000032
则第k个特征的LS计算式如下:
Figure FDA0003894547250000033
在原始的高维特征集中,计算出每种特征的Laplace分数LS(k),得到N个特征的LS序列LS={LS(1),LS(2),…,LS(N)},特征的Laplace分数与特征的可区分性成反比;
步骤2.2,对于工况1源域与工况2目标域的正常状态特征数据,通过MMD评估同一特征的在不同域的分布差异,MMD的值作为特征域不变性的量化指标;
来自源域和目标域的正常状态特征数据分别定义为SF和TF,都包含M个样本,且每个样本经过步骤1的信号处理与统计特征提取后包含N种统计特征;SF和TF表达式如下:
Figure FDA0003894547250000034
Figure FDA0003894547250000035
其中,SF和TF的第k列元素分别表示来自源域和目标域的第k个特征的M个样本(j∈[1,2,…,N]),其表达式如下:
Figure FDA0003894547250000041
Figure FDA0003894547250000042
SFk和TFk之间分布的经验距离估计定义如下:
Figure FDA0003894547250000043
式中,||·||H表示RKHS范数,φ表示内核诱导的特征图;
计算N种统计特征的MMD序列MMD={MMD(1),MMD(2),…,MMD(N)};
步骤2.3,基于前两步所得每个特征的LS和MMD值,构建新的特征选取指标KFSI,用于从OSFS中选择关键特征;第k个特征的KFSI定义如下:
Figure FDA0003894547250000044
对于N种统计特征,可得到KFSI序列KFSI={KFSI(1),KFSI(2),…,KFSI(N)};对KFSI序列进行排序,选择KFSI较高的特征,并以降序排序的KFSI序列进行关键特征选择构建关键特征集。
7.根据权利要求1所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:步骤3具体步骤如下:将步骤2中所选取的来自源域的带标签关键特征子集作为训练集,将来自目标域的未标记关键特征子集作为测试集,采用具有流形嵌入的监督域自适应法SDAME进行域适配,包括流形子空间学习、改进的分布适应性、学习分类器。
8.根据权利要求7所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:所述具有流形嵌入的监督域自适应法SDAME具体包含如下步骤:
步骤3.1,输入源域数据XS和目标域数据XT,输入XS的真实标签yS、流形子空间维数d、正则化参数λ、α、η、μ及迭代次数I;
步骤3.2,学习Grassmann流形GM变换核G,采用测地线流核方法GFK将原始空间(XS,XT)转换至GM空间,获取高维特征空间的低维流形结构;
首先将原始特征数据嵌入G(d)中,
Figure FDA0003894547250000051
表示d维的正交线性子空间;对于分别来源于源域与目标域的关键特征数据XS和XT,采用主成分分析PCA算法对其进行处理,得到相应的正交子空间PS和PT,即
Figure FDA0003894547250000052
其次构建测地线流曲线Φ(t);令RS∈RD×(D-d)为PS的正交补,即
Figure FDA0003894547250000057
D为原始特征数据的维数,则测地线流参数化如下:
Φ:t∈[0,1]→Φ(t)∈G(d) (13)
式中,Φ(0)=PS,Φ(1)=PT;对于t∈(0,1),测地线流Φ(t)的表达式为:
Φ(t)=PSU1Γ(t)-RSU2∑(t) (14)
式中,U1∈Rd×d和U2∈R(D-d)×d为正交矩阵,由奇异值分解算法可得:
Figure FDA0003894547250000053
式中,Γ和∑为d×d维对角矩阵,对角元素分别为cosθi和sinθi,θi范围为:
Figure FDA0003894547250000054
则新的特征为Z=Φ(t)TX,变换后的特征zi和zj的内积可表示为:
Figure FDA0003894547250000055
式中,
Figure FDA0003894547250000056
式中,Λ1、Λ2和Λ3为对角矩阵,元素如下所示:
Figure FDA0003894547250000061
最终原始空间的特征数据集转换为带有
Figure FDA0003894547250000062
约束条件的G(d),获得新的源域ZS与目标域ZT
步骤3.3,采用一种改进的分布自适应方法IDA来减小源域和目标域之间的分布差异,具体实现如下:
1)首先对齐源域与目标域的边缘分布,对于上述步骤中源域和目标域特征在G(d)上的表示ZS和ZT,通过最小化它们之间的MMD对齐源域与目标域的边缘分布P(ZS)和P(ZT),MMD计算式如下:
Figure FDA0003894547250000063
式中,H为再现核Hilbert空间(RKHS),nS和nT分别为ZS和ZT的特征个数,tr(·)表示矩阵的迹,矩阵K的定义如下:
Figure FDA0003894547250000064
式中,KS,S、KS,T和KT,T分别为源域、跨域及目标域的核矩阵;矩阵L0定义如下:
Figure FDA0003894547250000065
矩阵K可以分解为经验核映射,通过使用矩阵
Figure FDA0003894547250000066
将经验核映射到低维空间;因此,得到核矩阵K的计算结果如下:
Figure FDA0003894547250000067
式中,
Figure FDA0003894547250000068
因此P(ZS)和P(ZT)之间的MMD可以进一步表示为:
Figure FDA0003894547250000069
式中,W是一个变换矩阵;边缘分布适应的优化目标是得到一个最优的变换矩阵,使P(ZS)与P(ZT)之间的MMD在变换后达到最小;
2)其次是对齐源域与目标域的条件分布QS(YS|ZS)和QT(YT|ZT),同时为克服目标域无标签的问题,采用带标签的源域数据训练基分类器,利用训练好的基分类器预测目标域数据的伪标签;
通过匹配源域与目标域的类条件分布,得到QS(ZS|YS=c)和QT(ZT|YT=c),其中c∈[1,2,…,C]为标签集的标签,C为特征类别数;因此QS(ZS|YS=c)和QT(ZT|YT=c)之间的MMD值计算为:
Figure FDA0003894547250000071
式中,
Figure FDA0003894547250000072
Figure FDA0003894547250000073
分别为源域数据和目标域数据中属于c类的样本集;
Figure FDA0003894547250000074
表示目标域数据zi的伪标签;
Figure FDA0003894547250000075
Figure FDA0003894547250000076
分别为源数据和目标数据中属于c类的样本个数;MMD矩阵Lc的计算公式如下:
Figure FDA0003894547250000077
通过最小化式(25),在新的表示形式
Figure FDA0003894547250000078
Figure FDA0003894547250000079
下,缩小了
Figure FDA00038945472500000710
Figure FDA00038945472500000711
之间的条件分布;
3)然后计算保留邻近关系的类内散点矩阵S(w),用于保持相同类数据之间的邻近关系;S(w)定义如下:
Figure FDA00038945472500000712
式中,
Figure FDA0003894547250000081
为亲和矩阵,表示同一类中样本对的权重值,
Figure FDA0003894547250000082
定义如下:
Figure FDA0003894547250000083
式中,Ai,j∈[0,1]为zi和zj之间的亲和力,Ai,j定义如下:
Figure FDA0003894547250000084
式中,σi表示zi周围数据样本的局部缩放,可表示为
Figure FDA0003894547250000085
其中
Figure FDA0003894547250000086
为zi的第K个最近邻,K一般取7;
4)最后基于上述三个方面,提出一种改进的分布对齐方法DH(ZS,ZT),定义如下:
Figure FDA0003894547250000087
根据式(23)和式(24),DH(ZS,ZT)可进一步表示为:
DH(ZS,ZT)=(1-α)tr(WTKLcKW)+αtr(WTKL0KW)+μtr(WTKS(w)KW) (31)
式中,α∈[0,1]是一个平衡因子,用于调整两个分布在分布对齐过程中的重要性;μ∈[0,1]也是一个调优参数;
步骤3.4,在上述MSL和IDA步骤的基础上,基于结构结构风险最小化(Structural RiskMinimization,SRM),利用ZS和DH(ZS,ZT)得到新的域不变分类器f;
应用平方损失l2,分类器f可表示为:
Figure FDA0003894547250000088
式中,ΗK是RKHS;η和λ是正则化参数;
可对式(31)的每一项进行重新定义以进行高效学习,具体表示为:
基于表征者定理,分类器f可展开为:
Figure FDA0003894547250000091
式中,
Figure FDA0003894547250000092
因此,式(32)可以进一步表示为:
Figure FDA0003894547250000093
式中,||·||F为Frobenious范数,
Figure FDA0003894547250000094
为核矩阵,
Figure FDA0003894547250000095
为对角域指示矩阵,i∈ZS成立时Aii=1,不成立时Aii=0;
Figure FDA0003894547250000096
为ZS和ZT的类标签矩阵;由式(28)可得,矩阵L表示如下:
L=(1-α)Lc+αL0+μS(w) (35)
由式(32)和式(33),设定导数
Figure FDA0003894547250000097
可得到方程的解为:
W*=((A+λL)K+ηI)-1AYT (36)
采用学习到的分类器f,更新目标域的伪标签,采用上述步骤重新计算矩阵L,重复进行迭代,直到迭代次数为I;最终输出迭代完成后的学习分类器f。
9.根据权利要求1所述的一种基于流形嵌入和关键特征选取的机械故障诊断方法,其特征在于:在步骤4,构建基于KSDL和SDAME的跨域旋转机械故障诊断模型,具体步骤如下:以步骤2得到的来自于测试集的无标签关键特征子集作为输入,采用步骤3更新后的分类器f,输出跨域诊断结果,即得到目标域的标签信息。
CN202211269321.2A 2022-10-17 2022-10-17 一种基于流形嵌入和关键特征选取的机械故障诊断方法 Pending CN115618202A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211269321.2A CN115618202A (zh) 2022-10-17 2022-10-17 一种基于流形嵌入和关键特征选取的机械故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211269321.2A CN115618202A (zh) 2022-10-17 2022-10-17 一种基于流形嵌入和关键特征选取的机械故障诊断方法

Publications (1)

Publication Number Publication Date
CN115618202A true CN115618202A (zh) 2023-01-17

Family

ID=84862454

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211269321.2A Pending CN115618202A (zh) 2022-10-17 2022-10-17 一种基于流形嵌入和关键特征选取的机械故障诊断方法

Country Status (1)

Country Link
CN (1) CN115618202A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116127357A (zh) * 2023-02-06 2023-05-16 徐州医科大学 一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144458A (zh) * 2019-12-13 2020-05-12 重庆交通大学 子空间嵌入特征分布对齐的不同工况下机械故障识别方法
CN111829782A (zh) * 2020-07-16 2020-10-27 苏州大学 一种基于自适应流形嵌入动态分布对齐的故障诊断方法
CN112036301A (zh) * 2020-08-31 2020-12-04 中国矿业大学 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法
CN112819059A (zh) * 2021-01-26 2021-05-18 中国矿业大学 一种基于流行保持迁移学习的滚动轴承故障诊断方法
AU2021105779A4 (en) * 2021-08-18 2021-10-21 Fuzhou University Planetary Gearbox Fault Diagnosis Method Using Parameter Optimized VMD and Multi-domain Manifold Learning
CN114444533A (zh) * 2021-10-27 2022-05-06 徐州工程学院 一种基于深度自编码器与特征优化的电机故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144458A (zh) * 2019-12-13 2020-05-12 重庆交通大学 子空间嵌入特征分布对齐的不同工况下机械故障识别方法
CN111829782A (zh) * 2020-07-16 2020-10-27 苏州大学 一种基于自适应流形嵌入动态分布对齐的故障诊断方法
CN112036301A (zh) * 2020-08-31 2020-12-04 中国矿业大学 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法
CN112819059A (zh) * 2021-01-26 2021-05-18 中国矿业大学 一种基于流行保持迁移学习的滚动轴承故障诊断方法
AU2021105779A4 (en) * 2021-08-18 2021-10-21 Fuzhou University Planetary Gearbox Fault Diagnosis Method Using Parameter Optimized VMD and Multi-domain Manifold Learning
CN114444533A (zh) * 2021-10-27 2022-05-06 徐州工程学院 一种基于深度自编码器与特征优化的电机故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吉哲;傅忠谦;: "基于VMD和拉普拉斯分值的柴油机故障诊断", 组合机床与自动化加工技术 *
吉哲等: "基于VMD和拉普拉斯分值的柴油机故障诊断", 《组合机床与自动化加工技术》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116127357A (zh) * 2023-02-06 2023-05-16 徐州医科大学 一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法

Similar Documents

Publication Publication Date Title
CN110070060B (zh) 一种轴承设备的故障诊断方法
CN112819059B (zh) 一种基于流行保持迁移学习的滚动轴承故障诊断方法
Contreras-Hernandez et al. Quaternion signal analysis algorithm for induction motor fault detection
CN111191740B (zh) 一种滚动轴承故障诊断方法
CN112036301A (zh) 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法
CN110726898B (zh) 一种配电网故障类型识别方法
CN110657984A (zh) 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
Ruan et al. A relation-based semisupervised method for gearbox fault diagnosis with limited labeled samples
CN112883994A (zh) 一种均衡分布适配的旋转机械变工况故障诊断方法
CN113705396B (zh) 一种电机故障诊断方法、系统及设备
CN113420837B (zh) 基于多源压缩感知的故障诊断方法
CN112381248A (zh) 一种基于深度特征聚类和lstm的配电网故障诊断方法
CN116451150A (zh) 一种基于半监督小样本的设备故障诊断方法
CN115618202A (zh) 一种基于流形嵌入和关键特征选取的机械故障诊断方法
CN114548190A (zh) 一种基于自适应残差神经网络的风力涡轮机故障诊断方法
CN115481657A (zh) 一种基于电信号的风力发电机组通信滑环故障诊断方法
CN115146718A (zh) 基于深度表示的风电机组异常检测方法
CN116754230A (zh) 基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法
CN117009916A (zh) 基于多传感器信息融合与迁移学习的促动器故障诊断方法
Ruan et al. An enhanced non-local weakly supervised fault diagnosis method for rotating machinery
CN113514743B (zh) 一种基于多维特征的gis局部放电模式识别系统构建方法
CN111031064A (zh) 一种检测电网假数据注入攻击的方法
CN114444533A (zh) 一种基于深度自编码器与特征优化的电机故障诊断方法
CN111061151B (zh) 一种基于多元卷积神经网络的分布式能源状态监测方法
CN116361640A (zh) 一种基于分层注意力网络的多变量时间序列异常检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination