CN114444533A - 一种基于深度自编码器与特征优化的电机故障诊断方法 - Google Patents

一种基于深度自编码器与特征优化的电机故障诊断方法 Download PDF

Info

Publication number
CN114444533A
CN114444533A CN202111256683.3A CN202111256683A CN114444533A CN 114444533 A CN114444533 A CN 114444533A CN 202111256683 A CN202111256683 A CN 202111256683A CN 114444533 A CN114444533 A CN 114444533A
Authority
CN
China
Prior art keywords
domain
feature
model
target
rim
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111256683.3A
Other languages
English (en)
Inventor
卑璐璐
俞啸
厉丹
陈磊
赵文婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuzhou University of Technology
Original Assignee
Xuzhou University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuzhou University of Technology filed Critical Xuzhou University of Technology
Priority to CN202111256683.3A priority Critical patent/CN114444533A/zh
Publication of CN114444533A publication Critical patent/CN114444533A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明提出了一种基于深度自编码器与域不变特征提取的可迁移电机故障诊断方法,首先,采用双树复小波包变换对电机振动信号进行信号处理与混合域特征提取。其次,提出一种基于重要性得分与域间差异度量的域不变特征选取方法,选取具有高故障分辨能力与域不变特性的特征。然后,采用选取的域不变特征对深度自动编码器(源模型)进行预训练以增强深度特征的故障表征能力。将源模型的参数迁移至结构相同的目标模型,并使用目标域的正常状态特征数据微调目标模型。最后,采用微调后的目标模型对目标域故障进行分类。本发明所提出的方法可以明显提高跨域故障诊断准确度,在实际工业场景中具有更强的可用性、稳定性和优势。

Description

一种基于深度自编码器与特征优化的电机故障诊断方法
技术领域
本发明涉及故障诊断领域,尤其涉及一种基于深度自编码器与特征优化的电机故障诊断方法。
背景技术
随着现代化工业的快速发展,电机等旋转机械朝着集成化和复杂化的趋势发展,同时工作条件也较为复杂恶劣,因此设备故障率较高,某个部件的故障通常会导致其他部件故障,甚至会造成巨大的人员与经济损失。因此,针对实际工业场景研究电机的智能故障诊断方法具有重要现实意义。
近年来,智能故障诊断领域的研究一般包括基于传统机器学习(TraditionalMachine Learning,TML)框架、基于深度学习(Deep Learning,DL)的框架和基于迁移学习(Transfer Learning,TL)的框架。基于TML的框架包括三个步骤:信号处理和特征提取、特征选取和降维、故障分类。目前电机智能故障诊断的分析信号大多来自于电机的振动信号,且一般使用时频分析方法进行信号处理和特征提取,此方法可以有效地帮助提取故障特征,但所得到的高维特征集往往包含干扰和冗余特征。因此,特征选取和降维是故障模式分类之前的关键步骤。基于TML的框架的主要局限性在于当诊断模型对不同的工况和机器进行故障诊断时,严重依赖于专家知识,因此基于DL的框架引入一种自动挖掘隐藏特征能力的深度学习算法,在智能故障诊断领域得到了广泛的研究。但大多数基于DL的框架存在局限性:训练集与测试集同分布的前提使得模型泛化能力不足;需要大量标记数据,标记数据不足时,诊断时将出现过拟合现象,导致诊断准确率下降。针对上述局限性,基于TL框架的领域自适应作为最近开发的新技术,已成为研究热点,其目标是使用标记的源域和未标记的目标域来进行跨域学习,以实现目标域的理想故障分类。目前深度迁移模型在旋转机械的跨域故障诊断中取得了许多成功的应用,但如何提高深层特征的故障表征能力以及诊断模型应用于不同工况下的稳定性仍然是一项具有挑战性的任务。针对这个问题,本文提出了一种变工况下基于深度自动编码器(Deep Auto-encoder,DAE)和域不变特征选择的可迁移电机故障诊断方法(TFDD)。旨在利用少量训练样本,对源模型进行训练并进行目标模型的迁移学习,以实现变工况下电机的智能故障诊断,并提高模型的泛化能力。
发明内容
为了提高电机故障诊断方法在实际工业场景的适应性和稳定性,以面对复杂多变的机械工作条件,本发明提供一种基于深度自编码器与特征优化的电机故障诊断方法,满足电机故障诊断模型在较少训练数据条件下高诊断准确度的同时,还有优越的跨域诊断性能。
本发明是以如下技术方案实现的:一种基于深度自编码器与特征优化的电机故障诊断方法,具体如下:
步骤1,采用双树复小波包变换对不同工况下的原始振动信号进行信号处理和统计特征提取,并构建初始统计特征集;
步骤2,对步骤1构建的初始统计特征集中的特征进行故障分辨能力及领域不变性评价,选取出可表征电机状态的域不变特征,构建样本的域不变特征子集,
步骤3,将步骤2得到的源域的域不变特征子集进行源DAE模型训练,获得模型参数,并将参数迁移到目标DAE模型,采用步骤2得到的目标域的正常状态域不变特征子集进行目标模型微调,完成深度迁移自动编码器模型DTAE构建;
步骤4,测试步骤3构建的深度迁移自动编码器模型DTAE,并输出故障诊断结果。
优选的,步骤1具体步骤如下:将来自于不同工况的原始振动信号样本分为振动数据集I和振动数据集Ⅱ,其中振动数据集I为源域,其数据集的样本有标签;振动数据集Ⅱ为目标域,其数据集的样本无标签,运用来自源域的已知标签样本对诊断模型进行训练,并使用训练后的模型对目标域进行状态分类。
优选的,步骤2中具体过程:利用来自源域初始统计特征集的带标签故障特征数据、源域与目标域的正常状态特征数据,采用基于重要性得分和域不变性的域不变特征选取方法对初始统计特征集的特征进行评价,得到域不变特征选择指数RIM,采用排序后的RIM序列选择来自目标域的初始统计特征集的域不变特征子集。
优选的,对于步骤1所得到的源域中的带标签故障特征数据,通过基于随机森林的特征重要度评价方法,计算出每一种特征的重要性得分IS,以评估特征的故障分辨能力;分析源域与目标域中单个特征的域间差异度,采用最大平均差异MMD估计同一特征在不同域间的分布差异度MMDS,对于得到的每一特征的IS与MMDS,计算IS与MMDS 的比值,构建域不变特征选取指标RIM,对RIM序列进行降序排序;对于来自目标域原始特征集的无标签特征数据,直接用排序后的RIM序列进行域不变特征选取。
优选的,基于随机森林的特征重要度评价方法具体步骤如下:
对于振动数据集I(源域)的N个电机振动信号样本,经过步骤1的信号处理与统计特征提取过程,每个振动信号样本可以获得包含Q种统计特征,可以构成初始统计特征集F=[f1,f2,…,fN]T,其中fi={fi 1,fi 2,…fi Q},i∈[1,N]表示第i个振动信号样本的Q个统计特征的集合。采用基于RF的特征选取方法,对原始特征集中的每一特征计算其重要性得分(IS)。RF主要思想是构建决策树(DT)。这里假设一个RF有nDT颗决策树构成。
利用Fj和它的标签Y构建集合
Figure RE-GDA0003571763720000031
Fj为振动数据集I的第j个统计特征集合,yi代表电机状态标签,C和N分别代表类别数和样本数。计算S构建的决策树DTn的每个节点的基尼指数GI,GI(t)表示DTn在节点 t处的GI值,用以量化节点t的不纯度,其定义如下:
Figure RE-GDA0003571763720000032
式中,节点t第k类样本的出现概率。特征Fj的重要性得分IS可由下列公式定义:
Figure RE-GDA0003571763720000033
式中,nDT可表示为RF中的DT数量,t∈DTn表示分裂节点的集合。
最后,在原始的高维特征集中,可以计算出每种特征的重要性得分IS(j),得到Q个特征的IS序列IS={IS(1),IS(2),…,IS(Q)},当IS的值越大时,特征的故障分辨能力越大。根据排序后的IS序列可以选择IS值高的特征构建特征子集,从而剔除很多IS小的特征,提高分类性能。
对于振动数据集I(源域)与振动数据集Ⅱ(目标域)的正常状态特征数据,通过MMD评估同一特征的在不同域的分布差异,MMD的值作为特征域不变性的量化指标。来自源域和目标域的正常状态特征数据分别定义为SF和TF,都包含N个样本,且每个样本经过步骤1的信号处理与统计特征提取后包含Q种统计特征。SF和TF表达式如下:
Figure RE-GDA0003571763720000041
Figure RE-GDA0003571763720000042
其中,SF和TF的第j列元素分别表示来自源域和目标域的第j个特征的N个样本((j∈[1,2,…,Q])),其表达式如下:
Figure RE-GDA0003571763720000046
Figure RE-GDA0003571763720000043
SFj和TFj之间分布的经验距离估计定义如下:
Figure RE-GDA0003571763720000044
式中,||·||H表示RKHS范数,φ表示内核诱导的特征图。进一步可以计算Q种统计特征的MMD序列MMD={MMD(1),MMD(2),…,MMD(Q)}。MMD的值越小,特征的域不变性越好。
基于前两步所得每个特征的IS和MMD值,构建新的特征选取指标RIM,用于从 RFS中选择域不变特征。第j个特征的RIM定义如下:
Figure RE-GDA0003571763720000045
对于Q种统计特征,可得到RIM序列RIM={RIM(1),RIM(2),…,RIM(Q)}。对RIM序列进行排序,选择RIM较高的特征,并以降序排序的RIM序列进行跨域故障诊断模型训练。
优选的,具体构建深度迁移自编码器模型DTAE的步骤如下:
步骤3.1构建源DAE模型,DAE是无监督的深度神经网络,由几个基本的自编码器AE堆叠而成,每个AE包括编码器和解码器两部分,包含输入层x={x1,x2,...,xm}、隐藏层h={h1,h2,...,hn}、输出层z={z1,z2,...,zm};
编码器通过激活函数
Figure RE-GDA0003571763720000051
将输入数据x映射到隐藏层h,映射过程如下式:
Figure RE-GDA0003571763720000052
式中,W与b分别为编码器的权重矩阵和偏置向量;
解码器通过激活函数
Figure RE-GDA0003571763720000053
将隐藏层h中的数据映射到输出数据z,映射过程如下式:
Figure RE-GDA0003571763720000054
式中,W′与b′分别为解码器的权重矩阵和偏置向量,隐藏层表示输入数据新的特征,输出数据为输入数据的重构;
AE模型的参数是通过最小化输入层和输出层之间的重构误差来学习,重构误差定义如下:
Figure RE-GDA0003571763720000055
式中,N为样本数,θ={W,b,W′,b′,},一个AE的隐藏层特征作为下一个AE模型的输入,通过堆叠多个AE来构建一个DAE;
步骤3.2构造与源模型具有相同结构的目标DAE模型:即1个输入层、3个隐藏层、 1个softmax层,同时将源模型训练过程中学习到的参数权重矩阵W(S)和偏置向量b(S)传递给目标模型,即W(S)=W(T)和b(S)=b(T)
步骤3.3利用来自目标域的正常状态特征数据对目标DAE模型进行微调,并利用微调后的目标模型对剩余的来自目标域的未标记域不变特征子集进行测试。
优选的,在步骤4中,以测试集的未标记域不变特征子集作为输入,训练所构建目标DAE模型的分类性能,最终输出跨域诊断结果,即得到目标域的标签信息。
与现有技术相比,本发明的技术方案具有以下有益技术效果:
针对原始振动信号样本经信号处理与统计特征提取后的原始特征集存在冗余特征的问题,本发明提出了基于故障分辨力和域不变性的域不变特征选择方法DISD,评估每个特征对于故障的判别能力,并估计同一特征在不同域内的分布差异,选择出同时具有高故障分辨力与域不变性的特征,以提高后续诊断算法的运行速度和准确度。
针对基于传统迁移学习方法的诊断模型在不同工况下的稳定性不足的问题,构建了一种深度迁移自动编码器(DATE),并使用DISD选择的域不变特征进行模型训练,不仅可提高深层特征的故障表征能力,同时可以提高诊断模型在跨域故障诊断的稳定性。
保证故障诊断高准确度的同时,提高了故障诊断模型在跨域故障诊断中的可用性与泛化能力。
附图说明
图1是深度迁移自编码器模型的结构框图;
图2是本发明用于电机跨域故障诊断的系统框架的结构图;
图3是5种电机状态的示例原始振动样本信号图;
图4是正常电机振动信号分解得到的小波包节点重构信号图;
图5是1730rmp和1750rmp下NM和BF振动信号所提取的352个统计特征图(特征数据已归一化);
图6是源域中352个统计特征的MMD图;
图7是源域中352个统计特征的IS图;
图8是源域中352个统计特征的RIM图;
图9是TFDD框架跨域故障诊断结果示意图;
图10是基于迁移学习的比较模型跨域故障诊断结果图;
图11是比较模型的故障诊断结果对比图。
具体实施方式
如图1和2所示,一种基于深度自编码器与特征优化的电机故障诊断方法,包括4个过程,具体如下:
过程1.信号处理
将不同转速下所采集的电机振动信号分别定为本发明所需要的源域与目标域,其中,源域为带标记的样本(即已知其电机状态),目标域采用未标记的样本。采用DTCWPT 对每一样本进行信号处理,将其分解为不同的分组节点,通过计算极差、均值、标准差、峰度、能量、能量熵、偏度、波峰因数、脉冲因数、形状因数和纬度因数11种统计参数来获得表征电机运行状态的特征数据集。对源域和目标域的每一个振动信号样本进行四层DTCWPT分解,获取16个终端小波包节点和相应的小波包系数,16个终端节点进行单支小波包重构,可获得16个单支重构信号,计算重构信号的11个统计参数,生成176个时域统计特征。再求得16个重构信号的希尔伯特包络谱HES,通过计算HES 的11个统计参数生成176个频域统计特征。将一个振动样本时域和频域特征组合,可以得到每一个振动信号样本的352个混合域统计参数,构成初始统计特征集。
过程2.特征选取
利用来自源域初始统计特征集的带标签故障特征数据、源域与目标域的正常状态特征数据,采用DISD方法对初始统计特征集的特征进行评价,得到域不变特征选择指数RIM,采用排序后的RIM序列选择来自目标域的初始统计特征集的域不变特征子集。
为了减少高维特征集(HRFS)中的冗余特征,选择域不变特征(能够识别故障但不受运行状态影响的特征),本发明通过计算量化单个特征对不同运行状态下电机故障的分辨能力,选择原始特征集中分辨能力强的,舍去分辨能力弱的。在选择域不变特征时,对特征的故障分辨力和域不变性进行量化分析,作为对过程1所得原始特征集进行特征选取的依据。
对于步骤1所得到的源域OSFS中的带标签故障特征数据,通过基于随机森林(Random Forest,RF)的特征重要度评价方法,计算出每一种特征的重要性得分(Importance Score,IS),以评估特征的故障分辨能力;分析源域与目标域OSFS中单个特征的域间差异度,采用最大平均差异(Maximum Mean Discrepancy,MMD)估计同一特征在不同域间的分布差异度MMDS,MMDS的大小代表特征的域不变性。对于得到的每一特征的IS与MMDS,计算IS与MMDS的比值,构建域不变特征选取指标RIM。对RIM序列进行降序排序,RIM值越高,表明特征的故障分辨能力与域不变性越高,越有利于跨域故障诊断。对于来自目标域原始特征集的无标签特征数据,直接用排序后的RIM序列进行域不变特征选取。
具体DISD方法的步骤如下:
步骤2.1对于振动数据集I(源域)的N个电机振动信号样本,经过步骤1的信号处理与统计特征提取过程,每个振动信号样本可以获得包含Q种统计特征,可以构成初始统计特征集F=[f1,f2,…,fN]T,其中fi={fi 1,fi 2,…fi Q},i∈[1,N]表示第i个振动信号样本的Q个统计特征的集合。采用基于RF的特征选取方法,对原始特征集中的每一特征计算其重要性得分(IS)。RF主要思想是构建决策树(DT)。这里假设一个RF有nDT颗决策树构成。
利用Fj和它的标签Y构建集合
Figure RE-GDA0003571763720000071
Fj为振动数据集I的第j个统计特征集合,yi代表电机状态标签,C和N分别代表类别数和样本数。计算S构建的决策树DTn的每个节点的基尼指数GI,GI(t)表示DTn在节点 t处的GI值,用以量化节点t的不纯度,其定义如下:
Figure RE-GDA0003571763720000081
式中,节点t第k类样本的出现概率。特征Fj的重要性得分IS可由下列公式定义:
Figure RE-GDA0003571763720000082
式中,nDT可表示为RF中的DT数量,t∈DTn表示分裂节点的集合。
最后,在原始的高维特征集中,可以计算出每种特征的重要性得分IS(j),得到Q个特征的IS序列IS={IS(1),IS(2),…,IS(Q)},当IS的值越大时,特征的故障分辨能力越大。根据排序后的IS序列可以选择IS值高的特征构建特征子集,从而剔除很多IS小的特征,提高分类性能。
步骤2.2对于振动数据集I(源域)与振动数据集Ⅱ(目标域)的正常状态特征数据,通过MMD评估同一特征的在不同域的分布差异,MMD的值作为特征域不变性的量化指标。来自源域和目标域的正常状态特征数据分别定义为SF和TF,都包含N个样本,且每个样本经过步骤1的信号处理与统计特征提取后包含Q种统计特征。SF和TF 表达式如下:
Figure RE-GDA0003571763720000083
Figure RE-GDA0003571763720000084
其中,SF和TF的第j列元素分别表示来自源域和目标域的第j个特征的N个样本((j∈[1,2,…,Q])),其表达式如下:
Figure RE-GDA0003571763720000085
Figure RE-GDA0003571763720000086
SFj和TFj之间分布的经验距离估计定义如下:
Figure RE-GDA0003571763720000091
式中,||·||H表示RKHS范数,φ表示内核诱导的特征图。进一步可以计算Q种统计特征的MMD序列MMD={MMD(1),MMD(2),…,MMD(Q)}。MMD的值越小,特征的域不变性越好。
步骤2.3基于前两步所得每个特征的IS和MMD值,构建新的特征选取指标RIM,用于从RFS中选择域不变特征。第j个特征的RIM定义如下:
Figure RE-GDA0003571763720000092
对于Q种统计特征,可得到RIM序列RIM={RIM(1),RIM(2),…,RIM(Q)}。对RIM序列进行排序,选择RIM较高的特征,并以降序排序的RIM序列进行跨域故障诊断模型训练。
过程3.深度迁移自编码器模型构建
将步骤2中所选取的来自源域的域不变特征子集作为训练集,将来自目标域的未标记域不变特征子集作为测试集,同时来自于目标域的正常状态特征数据用以微调模型。构建深度迁移自编码器模型(DTAE),包括构造源DAE模型,构造目标DAE模型,参数传递,目标模型微调等步骤。
具体构建DTAE的步骤如下:
步骤3.1构建源DAE模型。DAE是无监督的深度神经网络,由几个基本的自编码器(AE)堆叠而成。每个AE包括编码器和解码器两部分,包含输入层x={x1,x2,...,xm}、隐藏层h={h1,h2,...,hn}、输出层z={z1,z2,...,zm}。
编码器通过激活函数
Figure RE-GDA0003571763720000093
将输入数据x映射到隐藏层h,映射过程如下式:
Figure RE-GDA0003571763720000094
式中,W与b分别为编码器的权重矩阵和偏置向量。
解码器通过激活函数
Figure RE-GDA0003571763720000095
将隐藏层h中的数据映射到输出数据z,映射过程如下式:
Figure RE-GDA0003571763720000096
式中,W′与b′分别为解码器的权重矩阵和偏置向量。隐藏层表示输入数据新的特征,输出数据为输入数据的重构。
AE模型的参数是通过最小化输入层和输出层之间的重构误差来学习,重构误差定义如下:
Figure RE-GDA0003571763720000101
式中,N为样本数,θ={W,b,W′,b′,}。一个AE的隐藏层特征作为下一个AE模型的输入,可以通过堆叠多个AE来构建一个DAE。DAE可挖掘输入特征数据的深层特征,从而可以提高故障分类的准确性。
本发明设置包含1个输入层、3个隐藏层、1个softmax层。softmax层用于对深层特征进行分类表示。采用训练集对源DAE模型进行训练,并得到模型参数,包括权重矩阵W(S)与偏置向量b(S)
步骤3.2构造与源模型具有相同结构的目标DAE模型,即1个输入层、3个隐藏层、 1个softmax层。同时将源模型训练过程中学习到的参数权重矩阵W(S)和偏置向量b(S)传递给目标模型,即W(S)=W(T)和b(S)=b(T)
步骤3.3利用来自目标域的正常状态特征数据对目标DAE模型进行微调,并利用微调后的目标模型对剩余的来自目标域的未标记域不变特征子集进行测试。
过程4.模式识别
将目标域的域不变特征输入训练好的DTAE模型中,DTAE模型的softmax层可以实现对测试数据的故障分类。
1实验数据介绍
测试台为SQI-MFS测试台,SQI-MFS支持1200-1800转/分钟的电机转速。振动信号由安装在电机驱动端和风扇端的采集卡和加速度传感器采样,采样频率为16kHz。实验设备包含电机故障数据采集部分与多个可拆卸安装的故障电机。
这里通过采集1730rpm、1750rpm两种转速电机的振动信号来实现跨域故障诊断工作,电机主要参数介绍如表1所示。实验台共有一台正常状态(NM)电机与四台故障电机,对应5种电机状态如图3。故障电机分别设置转子断条故障(BF)、绕组故障(WF)、转子弯曲故障(RF)和单相电压不平衡故障(SF)。对于每种电机状态,分别随机选取 30个和60个振动数据样本作为训练样本和测试样本,每个样本包含5000个连续采样点。电机数据集的详细介绍如表2所示。其中电机状态类别标签设置为1-5,用于源域的样本标记与状态识别结果的匹配。基于1730rmp和1750rmp速度下的振动数据,我们设置了两个跨域故障诊断任务(任务1与任务2),如表3所示。分别选择1730rmp和1750rmp 转速下的振动样本作为任务1和任务2的源域;分别选择1750rmp和1730rmp转速下的振动样本作为任务1和任务2的目标域。两个任务的源域和目标域分别包含150和300 个振动样本。
表1:电机主要参数说明
Figure RE-GDA0003571763720000111
表2:电机振动数据集介绍
Figure RE-GDA0003571763720000112
表3:针对5种电机状态的跨域故障诊断任务介绍
Figure RE-GDA0003571763720000113
2实验步骤
2.1基于DISD与DAE的电机故障诊断模型
电机故障实验中的示例原始数据,包含1730rmp和1750rmp两种转速下,5种电机状态的采样振动信号。图中清晰显示不同转速的振动信号存在明显分布差异。原始振动信号经过DTCWPT处理,通过计算小波包节点单支重构信号的统计参数生成统计特征。
首先,对每一个原始振动信号样本进行四层DTCWPT处理,生成16个终端小波包节点(TWPN),对于相应重构信号(RS),计算发明过程1中所描述的11个统计参数,可生成共176个时域统计特征;同时对重构信号的16个希尔伯特包络谱(HES)分别计算这11个统计参数,生成共176个频域统计特征。最终对于每个振动样本,共生成 352个统计特征,构成原始特征集(RFS)。对于NM电机所采集的振动样本进行小波包分解,所得到的TWPN的相应RS如图4。图5为1730rmp和1750rmp两种转速下,从NM和BF两种电机所采集的振动信号中所提取的352个归一化统计特征。
采用本发明所提出的域不变特征选取方法DSID对RFS的352个统计特征的故障分辨能力与域不变性进行评估。对于来自源域的352个统计特征,计算其特征选取指标 RIM,所计算的IS、MMD和RIM分别如图6-8所示。对于所计算出的包含352个统计特征的RIM序列,对其进行降序排序,使用排序后的RIM序列选择域不变特征构建域不变特征子集;对于目标域,直接使用RIM序列进行域不变特征选取。
利用的域不变特征子集训练DATE模型。对于源域,选取域不变特征用于对源DAE进行训练,训练完成后将学习到的参数W(S)和b(S)迁移到与源模型结构相同的目标 DTAE模型中。采用来自于目标域的正常特征数据微调目标DTAE模型。最后,将测试数据(来自目标域的未标记特征数据)输入到DTAE模型中,采用DTAE模型的softmax 层对测试数据进行故障分类,本发明在DTAE模型训练中用到的一些参数如下:隐藏层层数为4,大小分别为400、100、50和50,迭代次数设置为200。。
所提出的TFDD电机诊断模型的实验结果分别在图9和表4中给出,表中dfn是DISD方法选取的域不变特征数量。从表4中可以看出,当域不变特征数量设置为352,即源域的352个统计特征全部用于训练DATE模型,任务1和任务2的诊断准确率分别只有 69.00%、66.67%。当在DTAE模型前执行所提出的域不变特征选择方法DISD时,即限制域不变特征数量,可以明显提高诊断准确率。当域不变特征数量设置为101时,任务1达到最大诊断准确率81.68%;当域不变特征数量设置为140时,任务2达到最大诊断准确率82.67%。图9显示选取域不变特征数量设置为40~352时,任务1与任务2的诊断准确率。可以得出,当设置了合适的域不变特征数量,所提出基于DISD的TFDD的诊断模型能提高跨域故障诊断的准确率。
表4:TFDD诊断模型的跨域故障诊断结果
Figure RE-GDA0003571763720000131
2.2基于DISD与DAE的电机故障诊断模型实验分析
为了验证本发明所提出的基于DISD与DAE的电机故障诊断模型在跨域故障诊断方面的优势,本实验基于跨域故障诊断常用的方法,构建相应的比较模型进行实验分析,表5给出了一系列故障诊断比较模型。这些比较模型大致分为两类:(1)引入迁移学习的模型,包含RFS-SVM、RFS-KNN、RFS-DAE、RFS-DBN与RFS-CNN模型,对源域的原始振动信号样本进行DTCWPT信号处理与特征提取,将包含352个统计特征的原始特征集(RFS)分别作为SVM(支持向量机)、KNN(K近邻分类)、DAE(深度自动编码器)、DBN(深度置信网络)、CNN(卷积神经网络)的输入,训练故障诊断模型,使用训练后的诊断模型对目标域的原始特征集(RFS)进行模式分类。(2)引入迁移学习的模型,包含RFS-TCA、RFS-JDA、RFS-DSID-TCA、RFS-DSID-JDA与TFDD模型。其中RFS-TCA、RFS-JDA是指将源域所得到的RFS、目标域所到的RFS同时输入到TCA、JDA中。迁移成分分析(TCA)是指将源域与目标域同时映射到高维再生核希尔伯特空间以最小化源域与目标域的距离;联合分布自适应(JCA)的目标域采用伪标签的策略,通过反复迭代以减少源域和目标域的边缘分布与条件分布。最后将迁移学习后的源域特征输入到SVM分类器以训练故障诊断模型,采用训练好的诊断模型对迁移学习后的目标域特征进行状态识别与分类。RFS-DSID-TCA与RFS-DSID-JDA是指对于 RFS首先采用所提出的DSID方法选择域不变特征,再进行后续的迁移学习与故障诊断。
表5:基于跨域故障诊断常用方法的比较模型
Figure RE-GDA0003571763720000141
上述比较模型的实验结果可知,其他对比模型的诊断准确率明显小于本文所提出方法TFDD的诊断准确率。基于迁移学习的模型RFS-TCA、RFS-JDA、RFS-DSID-TCA、 RFS-DSID-JDA对比未引入迁移学习的模型再跨域故障诊断上有更好的诊断性能。而对于采用DISD方法的迁移学习模型,其诊性能明显高于未采用DISD方法的迁移学习模型,以任务1示例,在选择最合适的域不变特征数量的前提下,采用RFS-DSID-TCA模型的诊断准确率为71.67%,比采用RFS-TCA模型高5.67%;采用RFS-DSID-JDA模型的诊断准确率为77.00%,比采用RFS-JDA模型高4.67%。对于任务2,采用DISD方法的迁移学习模型有更加明显的效果,在选择最合适的域不变特征数量的前提下,采用 RFS-DSID-TCA模型的诊断准确率为77%,比采用RFS-TCA模型高7.33%;采用 RFS-DSID-JDA模型的诊断准确率为78.00%,比采用RFS-JDA模型高8.00%。而采用本发明所提出的TFDD的模型比RFS-DSID-TCA和RFS-DSID-JDA诊断准确率更高。
综合上述实验分析结果,可以得出:
(1)对于任务1与任务2,提出的TFDD模型可以有效地对电机的5种工作状态进行分类,最大诊断准确度可以达到80%以上。所提出的域不变特征选择方法DSID可以有效选择具有高故障判别性和域不变性的特征,选择合适的域不变特征数量提高跨域诊断性能准确率。
(2)对比结果表明,TFDD的诊断性能明显优于表4所示的对比模型。此外,诊断模型结合迁移学习策略有助于提高跨领域的诊断准确性;本发明所提出的构建DTAE 模型相对于一般迁移方法与更加优越的跨域故障诊断效果。
采用SQI-MFS实验台进行多个比较试验,验证了所提出DISD与DTAE可以提升电机跨域故障诊断模型的识别准确率。以上内容是结合实际案例的具体实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只限于这些说明,在不脱离本发明构思的前提下,相关领域的技术人员对其做出若干简单推演或替换均应视为属于本发明的保护范围。

Claims (9)

1.一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:具体如下:
步骤1,采用双树复小波包变换对不同工况下的原始振动信号进行信号处理和统计特征提取,并构建初始统计特征集;
步骤2,对步骤1构建的初始统计特征集中的特征进行故障分辨能力及领域不变性评价,选取出可表征电机状态的域不变特征,构建样本的域不变特征子集,
步骤3,将步骤2得到的源域的域不变特征子集进行源DAE模型训练,获得模型参数,并将参数迁移到目标DAE模型,采用步骤2得到的目标域的正常状态域不变特征子集进行目标模型微调,完成深度迁移自动编码器模型DTAE构建;
步骤4,测试步骤3构建的深度迁移自动编码器模型DTAE,并输出故障诊断结果。
2.根据权利要求1所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:
步骤1具体步骤如下:将来自于不同工况的原始振动信号样本分为振动数据集Ι和振动数据集Ⅱ,其中振动数据集Ι为源域,其数据集的样本有标签;振动数据集Ⅱ为目标域,其数据集的样本无标签,运用来自源域的已知标签样本对诊断模型进行训练,并使用训练后的模型对目标域进行状态分类。
3.根据权利要求2所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:步骤2中具体过程:利用来自源域初始统计特征集的带标签故障特征数据、源域与目标域的正常状态特征数据,采用基于重要性得分和域不变性的域不变特征选取方法对初始统计特征集的特征进行评价,得到域不变特征选择指数RIM,采用排序后的RIM序列选择来自目标域的初始统计特征集的域不变特征子集。
4.根据权利要求3所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:对于步骤1所得到的源域中的带标签故障特征数据,通过基于随机森林的特征重要度评价方法,计算出每一种特征的重要性得分IS,以评估特征的故障分辨能力;分析源域与目标域中单个特征的域间差异度,采用最大平均差异MMD估计同一特征在不同域间的分布差异度MMDS,对于得到的每一特征的IS与MMDS,计算IS与MMDS的比值,构建域不变特征选取指标RIM,对RIM序列进行降序排序;对于来自目标域原始特征集的无标签特征数据,直接用排序后的RIM序列进行域不变特征选取。
5.根据权利要求4所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:基于随机森林的特征重要度评价方法具体步骤如下:
对于源域的N个电机振动信号样本,经过步骤1的信号处理与统计特征提取过程,每个振动信号样本可以获得包含Q种统计特征,可以构成初始统计特征集F=[f1,f2,…,fN]T,其中
Figure FDA0003324070890000021
表示第i个振动信号样本的Q个统计特征的集合。采用基于RF的特征选取方法,对原始特征集中的每一特征计算其重要性得分IS,RF主要思想是构建决策树DT,假设一个RF有nDT颗决策树构成;
利用Fj和它的标签Y构建集合
Figure FDA0003324070890000022
Fj为振动数据集Ι的第j个统计特征集合,yi代表电机状态标签,C和N分别代表类别数和样本数;计算S构建的决策树DTn的每个节点的基尼指数GI,GI(t)表示DTn在节点t处的GI值,用以量化节点t的不纯度,其定义如下:
Figure FDA0003324070890000023
式中,节点t第k类样本的出现概率。特征Fj的重要性得分IS可由下列公式定义:
Figure FDA0003324070890000024
式中,nDT可表示为RF中的DT数量,t∈DTn表示分裂节点的集合;
最后,在原始的高维特征集中,计算出每种特征的重要性得分IS(j),得到Q个特征的IS序列IS={IS(1),IS(2),…,IS(Q)},根据排序后的IS序列可以选择IS值高的特征构建特征子集。
6.根据权利要求4所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:
对于源域与目标域的正常状态特征数据,通过MMD评估同一特征在不同域的分布差异,MMD的值作为特征域不变性的量化指标,来自源域和目标域的正常状态特征数据分别定义为SF和TF,都包含N个样本,且每个样本经过步骤1的信号处理与统计特征提取后包含Q种统计特征,SF和TF表达式如下:
Figure FDA0003324070890000031
Figure FDA0003324070890000032
其中,SF和TF的第j列元素分别表示来自源域和目标域的第j个特征的N个样本((j∈[1,2,…,Q])),其表达式如下:
Figure FDA0003324070890000033
Figure FDA0003324070890000034
SFj和TFj之间分布的经验距离估计定义如下:
Figure FDA0003324070890000035
式中,||·||H表示RKHS范数,φ表示内核诱导的特征图,进一步可以计算Q种统计特征的MMD序列MMD={MMD(1),MMD(2),…,MMD(Q)}。
7.根据权利要求4所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:每个特征的IS和MMD值,构建新的特征选取指标RIM,用于从RFS中选择域不变特征,第j个特征的RIM定义如下:
Figure FDA0003324070890000036
对于q种统计特征,可得到RIM序列RIM={RIM(1),RIM(2),…,RIM(q)},对RIM序列进行排序,选择RIM较高的特征,并以降序排序的RIM序列进行跨域故障诊断模型训练。
8.根据权利要求2所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:具体构建深度迁移自编码器模型DTAE的步骤如下:
步骤3.1构建源DAE模型,DAE是无监督的深度神经网络,由几个基本的自编码器AE堆叠而成,每个AE包括编码器和解码器两部分,包含输入层x={x1,x2,...,xm}、隐藏层h={h1,h2,...,hn}、输出层z={z1,z2,...,zm};
编码器通过激活函数
Figure FDA0003324070890000041
将输入数据x映射到隐藏层h,映射过程如下式:
Figure DEST_PATH_GDA0003571763720000094
式中,W与b分别为编码器的权重矩阵和偏置向量;
解码器通过激活函数
Figure FDA0003324070890000043
将隐藏层h中的数据映射到输出数据z,映射过程如下式:
Figure DEST_PATH_GDA0003571763720000096
式中,W′与b′分别为解码器的权重矩阵和偏置向量,隐藏层表示输入数据新的特征,输出数据为输入数据的重构;
AE模型的参数是通过最小化输入层和输出层之间的重构误差来学习,重构误差定义如下:
Figure FDA0003324070890000045
式中,N为样本数,θ={W,b,W′,b′,},一个AE的隐藏层特征作为下一个AE模型的输入,通过堆叠多个AE来构建一个DAE;
步骤3.2构造与源模型具有相同结构的目标DAE模型:即1个输入层、3个隐藏层、1个softmax层,同时将源模型训练过程中学习到的参数权重矩阵W(S)和偏置向量b(S)传递给目标模型,即W(S)=W(T)和b(S)=b(T)
步骤3.3利用来自目标域的正常状态特征数据对目标DAE模型进行微调,并利用微调后的目标模型对剩余的来自目标域的未标记域不变特征子集进行测试。
9.根据权利要求1所述的一种基于深度自编码器与特征优化的电机故障诊断方法,其特征在于:在步骤4中,以测试集的未标记域不变特征子集作为输入,训练所构建目标DAE模型的分类性能,最终输出跨域诊断结果,即得到目标域的标签信息。
CN202111256683.3A 2021-10-27 2021-10-27 一种基于深度自编码器与特征优化的电机故障诊断方法 Pending CN114444533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111256683.3A CN114444533A (zh) 2021-10-27 2021-10-27 一种基于深度自编码器与特征优化的电机故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111256683.3A CN114444533A (zh) 2021-10-27 2021-10-27 一种基于深度自编码器与特征优化的电机故障诊断方法

Publications (1)

Publication Number Publication Date
CN114444533A true CN114444533A (zh) 2022-05-06

Family

ID=81362294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111256683.3A Pending CN114444533A (zh) 2021-10-27 2021-10-27 一种基于深度自编码器与特征优化的电机故障诊断方法

Country Status (1)

Country Link
CN (1) CN114444533A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618202A (zh) * 2022-10-17 2023-01-17 徐州徐工随车起重机有限公司 一种基于流形嵌入和关键特征选取的机械故障诊断方法
CN116127357A (zh) * 2023-02-06 2023-05-16 徐州医科大学 一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618202A (zh) * 2022-10-17 2023-01-17 徐州徐工随车起重机有限公司 一种基于流形嵌入和关键特征选取的机械故障诊断方法
CN116127357A (zh) * 2023-02-06 2023-05-16 徐州医科大学 一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法

Similar Documents

Publication Publication Date Title
CN108520780B (zh) 一种基于迁移学习的医学数据处理和系统
CN112036301B (zh) 一种基于类内特征迁移学习与多源信息融合的驱动电机故障诊断模型构建方法
CN114444533A (zh) 一种基于深度自编码器与特征优化的电机故障诊断方法
CN112819059B (zh) 一种基于流行保持迁移学习的滚动轴承故障诊断方法
CN111238807B (zh) 一种行星齿轮箱故障诊断方法
CN111191740B (zh) 一种滚动轴承故障诊断方法
CN110375987B (zh) 一种基于深度森林机械轴承故障检测方法
CN113567130A (zh) 基于设备多工况的轴承故障诊断方法
CN106371610A (zh) 一种基于脑电信号的驾驶疲劳的检测方法
CN108197647B (zh) 一种汽车起动机耐久测试数据的快速聚类方法
CN112883994A (zh) 一种均衡分布适配的旋转机械变工况故障诊断方法
CN112577743B (zh) 一种基于最大局部边界准则的滚动轴承故障诊断方法
CN112257530A (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN113505664B (zh) 一种风电机组行星齿轮箱故障诊断方法
CN112860183B (zh) 基于高阶矩匹配的多源蒸馏-迁移机械故障智能诊断方法
CN110659682A (zh) 一种基于MCWD-KSMOTE-AdaBoost-DenseNet算法的数据分类方法
CN116304836A (zh) 一种基于领域知识引导的少样本半监督轴承故障诊断方法
CN113505856B (zh) 一种高光谱影像无监督自适应分类方法
Saberi et al. Multi-sensor fault diagnosis of induction motors using random forests and support vector machine
CN117171544B (zh) 基于多通道融合卷积神经网络的电机振动故障诊断方法
CN112817954A (zh) 一种基于多种方法集成学习的缺失值插补方法
CN115618202A (zh) 一种基于流形嵌入和关键特征选取的机械故障诊断方法
CN113523904A (zh) 一种刀具磨损检测方法
CN114781551B (zh) 一种基于大数据的电池多故障智能分类识别方法
CN116127357A (zh) 一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination