CN116541771A - 一种基于多尺度特征融合的非平衡样本轴承故障诊断方法 - Google Patents

一种基于多尺度特征融合的非平衡样本轴承故障诊断方法 Download PDF

Info

Publication number
CN116541771A
CN116541771A CN202310355427.2A CN202310355427A CN116541771A CN 116541771 A CN116541771 A CN 116541771A CN 202310355427 A CN202310355427 A CN 202310355427A CN 116541771 A CN116541771 A CN 116541771A
Authority
CN
China
Prior art keywords
sample
network
fault
features
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310355427.2A
Other languages
English (en)
Inventor
季海鹏
梁佳杭
刘晶
吕华
夏淑媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei University of Technology
Original Assignee
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Technology filed Critical Hebei University of Technology
Priority to CN202310355427.2A priority Critical patent/CN116541771A/zh
Publication of CN116541771A publication Critical patent/CN116541771A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明提供了一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,涉及轴承故障诊断技术领域,减少了现有技术中存在的轴承诊断过程中样本数量不平衡的技术问题。包括利用加速度传感器采集故障的时序性振动信号,数据归一化后进行分割得到原始样本;将分割后原始样本进行连续小波变换,得到原始信号的时频域数据;构建VAE‑GAN样本生成模型,将原始样本经过连续小波变换后的时频域数据对应的时频图输入VAE‑GAN样本生成模型进行训练,利用训练好的模型生成对应类别的伪样本,将生成的伪样本混合到真实样本;设计多尺度特征提取模型实现故障特征的提取,并利用通道注意力机制实现特征的加权融合,进行轴承故障状态识别。

Description

一种基于多尺度特征融合的非平衡样本轴承故障诊断方法
技术领域
本发明涉及轴承故障诊断技术领域,尤其是涉及一种基于多尺度特征融合的非平衡样本轴承故障诊断方法。
背景技术
轴承作为一种支撑转动部件广泛应用于旋转机械中,其运行状态对整个旋转机械的性能有着重要影响。在旋转机械运行过程中,轴承可能会在运行过程中而受到局部的表面损坏导致机械故障。因此,判断轴承故障对保证机械安全运行至关重要。
现有的滚动轴承故障诊断方法大多通过人工手段提取故障特征,然后使用分类模型进行故障识别,其过于依赖专家经验和信号处理相关知识。传统的人工神经网络由于具有非线性、自学习、自适应性强等优点,被广泛应用于模式识别中。虽然取得了不错的效果,但存在收敛速度慢、预测精度不够等先天缺点。近年来,以大数据为背景的深度学习方法在目标检测、语义分割和图像分类等任务上取得了迅猛发展。在故障诊断领域,越来越多的学者也将深度学习方法应用于滚动轴承的状态监测,并且取得了不错的故障诊断效果。深度神经网络很好地解决了特征提取、学习等问题,而且深度神经网络泛化能力强、判别精度高。例如文章[庄雨璇等.基于LSTM的轴承故障诊断端到端方法[J].噪声与振动控制.]提出基于LSTM的轴承故障端到端的诊断方法,能够有效提取轴承振动信号的时间和空间特征,提高了轴承故障诊断的精度;文章[雷亚国等.基于深度学习理论的机械装备大数据健康监测方法[J].机械工程学报.]提出一种基于深度置信神经网络的轴承故障诊断算法,实现了变工况、多样本下齿轮传动系统的故障诊断。文章[Zhang W等.Anew deep learning modelfor fault diagnosis with good anti-noise and domain adaptation ability on rawvibration signals[J].Sensors.]提出利用一维卷积神经网络的一种端对端的滚动轴承故障诊断算法,能够有效诊断轴承在不同负载和不同噪声环境下的故障状态。
上述的深度学习方法相比于基于信号分析的诊断方法和基于浅层分类模型的诊断方法,已经极大的减少了对专家经验的依赖,并具有挖掘深层故障特征的能力,此类方法在具有充足且数量平衡的故障样本进行训练时,均可保持较高的诊断精度。但是由于轴承的工作状态、运行环境和承载任务不同,每类轴承故障状态收集的数据样本数量可能出现差异,所以会出现样本数量不平衡的情况。在训练样本数量不平衡的情况下,训练模型会导致模型失衡的问题,使模型诊断结果更偏向于多数样本类别,降低诊断模型的泛化性。因此需要改进模型训练过程,减少样本数量不平衡产生的影响。
发明内容
本发明的目的在于提供一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,减少了现有技术中存在的轴承诊断过程中样本数量不平衡的技术问题。
本发明提供的一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,包括:利用加速度传感器采集故障的时序性振动信号,数据归一化后进行分割得到原始样本;
将分割后原始样本进行连续小波变换,得到原始信号的时频域数据;
构建VAE-GAN样本生成模型,将原始样本经过连续小波变换后的时频域数据对应的时频图输入VAE-GAN样本生成模型进行训练,利用训练好的模型生成对应类别的伪样本,将生成的伪样本混合到真实样本;
设计多尺度特征提取模型实现故障特征的提取,并利用通道注意力机制实现特征的加权融合,进行轴承故障状态识别。
进一步的,一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,还包括:分类层利用Softmax分类器输出轴承故障的诊断结果。
进一步的,所述利用加速度传感器采集故障的时序性振动信号,数据归一化后进行分割得到原始样本的步骤,包括:
将原始时序振动信号按照统一步长进行分段切割;
截取每个时间点样本序列;
将样本序列原始数据进行连续小波变换。
进一步的,所述构建VAE-GAN样本生成模型,将原始样本经过连续小波变换后的时频域数据对应的时频图输入VAE-GAN样本生成模型进行训练,利用训练好的模型生成对应类别的伪样本,将生成的伪样本混合到真实样本的步骤,包括:构建编码网络、构建生成网络和构建判别网络;
所述构建编码网络,输入数据为故障原始振动信号经过连续小波变换后快后生成的小波时频图,编码网络由三组二维卷积神经网络层组成,按照公式(1)进行训练损失函数的计算;
其中,LE为编码网络损失值,μ和σ分别代表编码网络输出参数,N(0,1)为标准正态分布,KL(·)为KL散度;
所述构建生成网络,将输入的低维编码向量通过反卷积逐层进行特征重建,生成与真实样本尺寸相同的新样本;按照公式(2)和公式(3)进行训练损失函数的计算;
Z=μ1+e×σ1(2)
LG=log2(1-D(G(Z)))+||Dl(X)-Dl(G(Z))||2 (3)
其中,LG为生成网络损失值;Z代表编码向量;μ1和σ1分别为编码网络对原始样本进行编码之后映射的样本均值和标准差;e为高斯噪声,并为正态分布;G(Z)为生成的样本,D(G(Z))为判别网络将输入数据判断为真实样本的概率;Di(X)为判别网络第l层输出的特征向量,X为输入的真实样本;
所述构建判别网络,判别网络由3个卷积层和2个全连接层组成,每个卷积层后面加入了批标准化层,判别网络将输入的真实样本和生成网络生成的样本进行特征提取和降维,最后通过Sigmoid激活后输出真伪标签,按照公式(4)进行训练损失函数的计算;
LD=log2 D(X)+log2(1-D(G(Z1))) (4)
其中,LD为判别网络损失值,Z1为由μ1和σ1采样合成的隐变量;G(Z1)为生成的样本;D(G(Z1))为判别网络将输入数据判断为真实样本的概率。
进一步的,设计多尺度特征提取模型实现故障特征的提取,并利用通道注意力机制实现特征的加权融合,进行轴承故障状态识别步骤,包括:构建多尺度特征提取模型进行特征提取和构建基于通道注意力机制的特征加权模块;
所述构建多尺度特征提取模型进行特征提取,通过设置不同大小卷积核和不同深度的网络分支来对故障特征进行提取,得到多尺度特征,按照公式(5)进行特征提取与叠加:
F=f(W1×α+γ1)⊕f(W2×α+γ2)⊕f(w3×α+γ3)⊕f(W4×α+γ4)(5)
其中,α为输入的时序图,F为输出特征向量,W1、W2、W3、W4为不同尺度分支的卷积权重,γ1、γ2、γ3、γ4为不同尺度分支的偏置向量,实现特征的非线性变换提取,f(j)表示卷积计算的激活函数Relu,j代表公式(5)中的对应参数,⊕代表特征的叠加操作;
所述构建基于通道注意力机制的特征加权模块,引入通道注意力机制,对输入的多尺度特征数据进行全局平均池化得到一个权重向量,将原始通道输入的全部元素值与对应通道权重值逐一相乘,得到新的加权特征,将加权特征作为故障诊断的依据,输入到分类层进行故障分类。
进一步的,所述分类层利用Softmax分类器输出轴承故障的诊断结果的步骤,分类层由3个全连接网络层组成;
第一层全连接网络将加权之后的特征进行展平操作,将所有加权特征矢量首尾连接组成一维向量;
第二层全连接网络实现对融合之后的特征降维;
第三层全连接网络的输出个数与故障类别数目保持一致,利用Softmax分类器实现目标输出类别。
本发明提供的一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,该方法首先对原始故障信号进行连续小波变换,得到故障的时频域信息,然后建立VAE-GAN样本生成模型,利用该模型实现少样本故障类的样本生成,实现样本的平衡化扩充,分别对频域特征和时频域特征进行提取,得到原始故障的频域时频域特征,克服了训练样本数量不平衡导致诊断模型训练失衡的问题;最后提出多尺度特征融合故障诊断模型(Multi-scaleFeature Fusion Fault Diagnosis Model,MsFFDNet)进行轴承故障的特征提取和状态识别,克服了单一尺度卷积层对小波时频图中故障特征提取导致特征缺失的问题,并通过Softmax分类器实现对轴承故障的精确识别。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于多尺度特征融合的非平衡样本轴承故障诊断方法的框架结构图;
图2为本发明实施例提供的编码网络的结构图;
图3为本发明实施例提供的生成网络的结构图;
图4为本发明实施例提供的判别网络的结构图;
图5为本发明实施例提供的多尺度特征融合故障诊断模型结构图;
图6为本发明实施例提供的多尺度特征提取模型结构图;
图7为本发明实施例提供的于通道注意力机制的特征加权模块结构图;
图8为本发明实施例提供的凯斯西储大学数据集可视化示意图;
图9为本发明实施例提供的帕德博恩大学数据集故障振动信号可视化示意图;
图10为本发明实施例提供的凯斯西储大学数据集振动信号未添加生成样本示意图;
图11为本发明实施例提供的凯斯西储大学数据集振动信号添加生成样本示意图;
图12为本发明实施例提供的帕德博恩大学数据集振动信号未添加生成样本时频示意图;
图13为本发明实施例提供的帕德博恩大学数据集振动信号添加生成样本时频示意图;
图14为本发明实施例提供的凯斯西储大学数据特征降维可视化示意图;
图15为本发明实施例提供的帕德博恩大学数据特征降维可视化示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1至图15所示,本发明实施例提供一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,包括:
步骤S1:利用加速度传感器采集故障的时序性振动信号,数据归一化后进行分割得到原始样本。
步骤S2:将原始样本进行时频分析,分析方法为连续小波变换,得到原始信号的时频域数据。
步骤S3:构建VAE-GAN样本生成模型,将原始样本经过连续小波变换后的时频域数据对应的时频图输入VAE-GAN样本生成模型进行训练,利用训练好的模型生成对应类别的伪样本,将生成的伪样本混合到真实样本;
步骤S4:构建多尺度特征融合故障诊断模型,包括:多尺度特征提取模型、通道注意力机制和Softmax分类器。
步骤S4-1:设计多尺度特征提取模型实现故障特征的提取,利用通道注意力机制实现特征的加权融合,进行轴承故障状态识别。
步骤S4-2:分类层利用Softmax分类器输出轴承故障的诊断结果。
本发明涉及深度学习中样本生成模型构建、多尺度特征提取、特征融合及轴承故障诊断技术领域。该基于多尺度特征融合的非平衡样本轴承故障诊断方法,针对深度学习轴承故障诊断方法在面对故障样本数量非平衡的情况时,存在的模型训练失衡问题,构建VAE-GAN样本生成模型,利用该样本实现少样本故障类的样本生成,实现样本的平衡化扩充,构建多尺度特征融合故障诊断模型,充分提取小波时频图中的多尺度故障特征,实现特征的融合诊断,有效提高了轴承的故障诊断效率。
本发明实施例提供一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,包括:
步骤S1具体包括:利用加速度传感器采集故障的时序性振动信号,数据归一化后进行分割得到原始样本。
将原始时序振动信号按照统一步长进行分段切割,分段后的振动信号序列X可以表示为:
X=X1,X2,......,XR-1 XR
其中,β为样本数量;
截取每个时间点样本序列X(t),可以表示为:
其中,t为样本编号,t=1,2……;d为样本中的数据点数,为第t个样本中的第i个数据点,i=1,2……,d;
将样本序列原始数据进行连续小波变换,变换之后形成的时频图可以表示为:
其中,a,b,c分别代表时频图的三通道数据,m代表时频图的长度,n代表时频图的宽度。
步骤S2具体包括:将原始样本进行时频分析,分析方法为连续小波变换,得到原始信号的时频域数据,即小波时频图。
步骤S3具体包括:构建VAE-GAN样本生成模型,将原始样本经过连续小波变换后的时频域数据对应的时频图输入VAE-GAN样本生成模型进行训练,利用训练好的模型生成对应类别的伪样本,将生成的伪样本混合到真实样本中实现样本的平衡化扩充。
S3-1:构建编码网络,其结构如图2所示,输入数据为故障原始振动信号经过连续小波变换后快后生成的小波时频图,编码网络由三组二维卷积神经网络层组成,其作用是将输入的小波时频图真实样本编码为2个低维特征参数,分别为数据分布的均值和标准差。
输入数据为故障原始振动信号经过连续小波变换后快后生成的小波时频图,编码网络由三组二维卷积神经网络层组成,按照公式(1)进行训练损失函数的计算;
其中,LE为编码网络损失值,μ和σ分别代表编码网络输出参数,N(0,1)为标准正态分布,KL(·)为KL散度。
S3-2:构建生成网络,其结构如图3所示,将输入的低维编码向量通过反卷积逐层进行特征重建,最终生成与真实样本尺寸相同的新样本,其优化目标包含两部分,分别为生成尽可能逼真的样本使判别网络无法识别和最小化真实样本和生成样本之间的特征误差。
将输入的低维编码向量通过反卷积逐层进行特征重建,生成与真实样本尺寸相同的新样本;按照公式(2)和公式(3)进行训练损失函数的计算;
Z=μ1+e×σ1(2)
LG=log2(1-D(G(Z)))+||Dl(X)-Dl(G(Z))||2 (3)
其中,LG为生成网络损失值;Z代表编码向量;μ1和σ1分别为编码网络对原始样本进行编码之后映射的样本均值和标准差;e为高斯噪声,并为正态分布;G(Z)为生成的样本,D(G(Z))为判别网络将输入数据判断为真实样本的概率;Di(X)为判别网络第l层输出的特征向量,X为输入的真实样本。
S3-3:构建判别网络,其结构如图4所示,判别网络由3个卷积层和2个全连接层组成,每个卷积层后面加入了批标准化层,判别网络将输入的真实样本和生成网络生成的样本进行特征提取和降维,最后通过Sigmoid激活后输出真伪标签,其优化目标是尽可能地判断出输入的样本为真实样本还是生成样本。
判别网络由3个卷积层和2个全连接层组成,每个卷积层后面加入了批标准化层,判别网络将输入的真实样本和生成网络生成的样本进行特征提取和降维,最后通过Sigmoid激活后输出真伪标签,按照公式(4)进行训练损失函数的计算;
LD=log2 D(X)+log2(1-D(G(Z1))) (4)
其中,LD为判别网络损失值,Z1为由μ1和σ1采样合成的隐变量;G(Z1)为生成的样本;D(G(Z1))为判别网络将输入数据判断为真实样本的概率。
步骤S4具体包括:构建多尺度特征融合故障诊断模型。
具体地,设计多尺度特征提取模型实现故障特征的提取,设置不同的卷积分支,每个分支采用不同的卷积核大小来提取多尺度特征,并利用通道注意力机制实现特征的加权融合,进行轴承故障状态识别,其框架结构如图5所示。
S4-1:构建多尺度特征提取模型,其结构如图6所示,通过设置不同大小卷积核和不同深度的网络分支来对故障特征进行提取,得到多尺度特征,为特征加权模块提供特征输入。按照公式(5)进行特征提取与叠加:
F=f(W1×α+γ1)⊕f(W2×α+γ2)⊕f(w3×α+γ3)⊕f(W4×α+γ4)(5)
其中,α为输入的时序图,F为输出特征向量,W1、W2、W3、W4为不同尺度分支的卷积权重,γ1、γ2、γ3、γ4为不同尺度分支的偏置向量,实现特征的非线性变换提取,f(j)表示卷积计算的激活函数Relu,j代表公式(5)中的对应参数,⊕代表特征的叠加操作。
构建基于通道注意力机制的特征加权模块,其结构如图7所示,引入通道注意力机制,对输入的多尺度特征数据进行全局平均池化得到一个权重向量,将原始通道输入的全部元素值与对应通道权重值逐一相乘,得到新的加权特征,将加权特征作为故障诊断的依据,输入到分类层进行故障分类。
S4-2:分类层采用Softmax函数进行多种故障信号数据的分类,实现故障信号的精确诊断。
分类层由3个全连接网络层组成,其中,第一层全连接网络将加权之后的特征进行展平操作,即将所有加权特征矢量首尾连接组成一维向量;第二层全连接网络实现对融合之后的特征降维;第三层全连接网络的输出个数与故障类别数目保持一致,利用Softmax分类器实现目标输出类别。
基于上述步骤,本发明有效解决在面对故障样本数据不平衡条件时,深度学习轴承故障诊断方法模型训练失衡导致诊断准确率和泛化性低的问题。该发明由VAE-GAN样本生成模型和多尺度特征融合故障诊断模型组成。首先,针对训练样本数量不平衡导致诊断模型训练失衡的问题,构建VAE-GAN样本生成模型,利用该样本实现少样本故障类的样本生成,实现样本的平衡化扩充;其次,为充分利用小波时频图中的故障特征,设计多尺度特征融合故障诊断模型进行轴承故障的特征提取和状态识别。将两个模型结合,解决面对非平衡样本时,传统深度学习轴承故障诊断方法诊断精度受限,泛化性低的问题。
一种基于多尺度特征融合的非平衡样本轴承故障诊断方法的试验验证:
实施例一,
1.试验数据集与试验平台
试验数据集采用美国凯斯西储大学(Case Western Reserve University,CWRU)电气工程实验室的轴承故障数据集和德国帕德博恩大学(Paderborn University,简称PU)机械工程学院的轴承故障数据集进行实验。两个数据集随机选取1000个正常样本和每类故障200个样本作为训练集,正常类和故障类各随机选取200个样本作为测试集,同时保证训练集和测试集不存在重复样本。在训练集中,正常类作为多数类,其他各类故障样本作为少数类,来模拟不平衡数据集。具体的数据信息如表1和表2所示。
表1-CWRU轴承故障实验样本信息
表2-PU轴承故障实验样本信息
运行试验的计算机配置信息:CPU为Intel(R)Core(TM)i7-11800H,运行内存为DDR4 3200MHz 32G,显卡为NVIDIA GeForce RTX 3060,编程语言为python3.7,深度学习框架为Tensorflow 2.6.0。
2.数据划分与时频分析:
对数据集划分以及变换域数据生成方法进行介绍。首先对实验数据进行划分,将正常及各种故障类型的时间序列数据进行等间隔分割,每段数据样例长度为864。对CWRU轴承数据集中选取的10类故障和PU轴承数据集中选取的7类故障进行信号可视化,如图8和图9所示。
由图8和图9可知,两个数据集的故障类型不相同,轴承故障振动数据表现出的周期性特点和振动振幅特点也不相同,即每类故障振动数据都有自己的故障特征。在CWRU轴承数据集故障信号可视化中可以看出:内圈、外圈、滚动体三种不同故障位置、相同故障位置不同损伤直径的振动信号之间存在周期和振幅差异;在PU轴承数据集故障信号可视化中可以看出:单故障和多故障的振动信号之间、内圈和外圈故障的振动信号之间存在波形以及振幅的差异。
对数据集进行连续小波变换,获取轴承故障原始振动信号中的时频域特征。设置采样频率为,在每个样本数据中有864个数据点。以CWRU数据集中的正常(Normal)轴承的振动信号进行连续小波变换为例,获得二维时频图进行可视化,如图8,图9所示。将时频图按照故障类别打上标签之后,作为特征提取模块的输入数据用来进行训练和测试。
3.实验参数与模型结构:
实验需要对VAE-GAN样本生成模型和多尺度特征融合故障诊断模型两个模型进行训练。训练VAE-GAN样本生成模型时,Batch Size设置为64,采用Adam优化器,学习率为0.0001,迭代次数为1000次;训练多尺度特征融合故障诊断模型时,同样将Batch Size设置为64,采用Adam优化器,将学习率调整为0.001,迭代200次。
VAE-GAN样本生成模型和多尺度特征融合故障诊断模型的主要参数如表3和表4所示。其中,Conv2d代表二维卷积层,Dconv2d代表二维反卷积层,AvgPool代表平均池化层,BN代表批归一化层,Relu代表Relu激活函数层,LeakyRelu代表LeakyRelu激活函数层,Dense为全连接层。
表3-VAE-GAN样本生成模型主要参数
表4-多尺度特征融合故障诊断模型主要参数
4.特征加权融合对比实验
为验证VAE-GAN样本生成模型的效果,首先对生成样本和真实样本进行可视化对比,分析样本的相似度;其次通过量化指标计算样本相似度数值,通过具体的相似度指标来展示生成样本的质量,并通过数据降维方法来验证同类生成样本和原始样本的相似性。
4.1生成样本可视化
为验证VAE-GAN样本生成模型的效果,对生成样本与原始样本进行可视化对比,在CWRU数据集和PU数据集的训练样本中选取四类故障时频图,同时选取对应的生成模型生成的伪样本,将真实样本与伪样本进行对比展示,体现生成样本的相似性。生成样本与真实样本具有较高的相似度。虽然在某些类别上有细微的差别,但依然可以表明生成样本的特征与故障真实样本特征基本保持相同的分布。此外,此类细微差别同样可以表明VAE-GAN样本生成模型学习到了真实样本的特征分布,生成样本为真实分布中采样得到的,所以利用生成样本进行训练可以增强故障诊断模型的鲁棒性,提升分类模型的泛化能力。
4.2样本相似度对比:
为验证VAE-GAN样本生成模型的效果,分别构建VAE模型和GAN模型与其进行对比。VAE模型的编码器和解码器分别于VAE-GAN模型的编码器和生成器结构相同,GAN模型的生成器和判别器分别于VAE-GAN模型的生成器和判别器结构相同,实验采用的参数与VAE-GAN模型保持一致。实验采用的评价指标为生成的样本与真实样本之间的皮尔逊相关系数(Pearson Correlation Coefficient,PCC)和余弦相似度(Cosine Similarity,CS)。为避免偶然性影响,在计算样本相似度时重复10次实验并计算平均值。样本相似度结果如表5所示。两个评价指标均为数值越高,样本相似度越高。
表5-样本相似度对比
由表中数据可知,VAE-GAN模型生成的样本具有最高的样本相似度,相比于VAE模型和GAN模型,在CWRU数据集上PCC指标分别高出了0.0686和0.0307,CS指标分别高出了0.0515和0.0364;在PU数据集上PCC指标分别高出了0.0728和0.0391,CS指标分别高出了0.0720和0.0257。所以由此可知,当将VAE模型和GAN模型进行结合,可以有效的提升样本生成能力,解决VAE模型生成样本模糊的问题。
为进一步验证生成样本与真实样本的相似性,利用t-分布随机领域嵌入(t-distributed stochastic neighbor embedding,t-SNE)方法对数据进行降维,验证生成样本与真实样本的相似性。为了说明使用的生成模型生成的样本数据对故障分类有积极的影响,将从两个数据集中每类随机选择50个真实样本得到的数据集,和VAE-GAN样本生成模型生成的200个样本添加到该数据集中的得到的新数据集,分别进行可视化展示,数据分布结果可以发现未添加生成样本的类故障的数据的分布之间没有明显的边界,存在混叠现象,而添加了全部生成样本的故障数据之间存在明显的边界,由此可以说明,生成样本与真实样本有着很强的相似性,同时,生成的样本对故障分类有着积极的作用。
5.故障分类模型实验:
为验证本发明提出的BFD-MsFF方法在样本不平衡条件下对各类轴承故障的诊断效果,设置三组实验进行阶段性对比:第一组将原始样本数量分布不平衡的数据直接输入卷积神经网络分类模型(CNN)进行训练;第二组将原始样本数量分布不平衡的数据直接输入多尺度特征融合故障诊断模型(MsFFDNet)进行训练;第三组先通过VAE-GAN样本生成模型生成故障样本,然后将增广后数量分布平衡的数据集输入CNN进行训练;第四组采用本发明提出的BFD-MsFF方法进行训练和诊断,即VAE-GAN+MsFFDNet,先通过VAE-GAN样本生成模型生成故障样本,然后将增广后数量分布平衡的数据集输入MsFFDNet进行训练。最后使用测试集验证各组实验的诊断结果,对准确率(Accuracy,Acc)、召回率(Recall,Rec)和F1-score三个指标进行对比,在CWRU数据集上和PU数据集上的结果如表6所示。
表6-模型结果对比
从表6可以看出,当直接使用非平衡数据集训练CNN模型进行诊断,准确率、Recall值和F1-score值均比较低,在CWRU数据集上的三个评价指标的值分别为0.7425、0.7425和0.7475,在PU数据集上三个评价指标的值分别为0.7250、0.7326和0.7347;而对比第三组实验VAE-GAN+CNN,采用VAE-GAN样本生成模型进行样本平衡化扩充后,再利用扩充后的平衡数据集训练CNN模型进行诊断,其诊断结果有明显的提升,在CWRU数据集上三个评价指标值可以达到0.9375、0.9400和0.9387,在PU数据集上三个评价指标值可以达到0.9200、0.9236和0.9218,在CWRU数据集上和PU数据集上的准确率均提升了19.50%。由此可以说明,VAE-GAN样本生成模型进行样本平衡化扩充之后,诊断模型利用样本数量平衡的数据集进行训练,可以有效提升模型的诊断效果,证明VAE-GAN样本生成模型可以有效地生成伪样本,解决故障样本数量不平衡问题。
由CNN和MsFFDNet在非平衡数据集下进行训练诊断的结果可以知道,MsFFDNet相比于单一尺度的CNN在面对非平衡数据情况下均有更好的表现,在CWRU数据集和PU数据集上准确率分别提升了10.75%和9.59%;且由CNN和MsFFDNet在经过扩充之后的平衡数据集下进行训练诊断的结果可以知道,MsFFDNet相比于单一尺度的CNN在面对非平衡数据情况下也有更好的表现,在CWRU数据集和PU数据集上准确率分别提升了5.00%和3.50%。可以证明MsFFDNet有更好的特征提取效果。最后,可以看到本发明提出的方法BFD-MsFF,在面对非平衡训练数据时,可以首先通过VAE-GAN样本生成模型进行平衡化扩充,再利用MsFFDNet提取多尺度特征进行诊断,有最好的诊断结果,证明本发明提出方法的有效性。
为了更直观地展示MsFFDNet模型的特征提取能力,对模型中特征提取之后的全连接层进行t-SNE特征降维可视化,将经过MsFFDNet模型提取的高维特征降至二维进行可视化,如图14和图15所示。
由图14和图15可知,不同类别的故障样本特征可以明确的分隔开来,且相同类别的故障特征可以明确的聚为一簇,证明该模型可以有效的提取各个类别的故障特征,为故障分类提供了有效的特征依据。
以上实施例具有以下有益效果:
1.为保证在面对故障样本数据不平衡条件时,深度学习轴承故障诊断方法具有较高的诊断准确率和泛化性。
2.在CWRU和PU数据集上进行实验,实验结果表明该方法可以有效的生成高质量的伪样本,实现样本的平衡化扩充。
3.提取小波时频图中的多尺度特征,提升诊断精度。
4.该方法可以有效解决面对非平衡样本时,轴承故障诊断结果受限的问题。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
又例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,再例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (6)

1.一种基于多尺度特征融合的非平衡样本轴承故障诊断方法,其特征在于,包括:
利用加速度传感器采集故障的时序性振动信号,数据归一化后进行分割得到原始样本;
将分割后原始样本进行连续小波变换,得到原始信号的时频域数据;
构建VAE-GAN样本生成模型,将原始样本经过连续小波变换后的时频域数据对应的时频图输入VAE-GAN样本生成模型进行训练,利用训练好的模型生成对应类别的伪样本,将生成的伪样本混合到真实样本;
设计多尺度特征提取模型实现故障特征的提取,并利用通道注意力机制实现特征的加权融合,进行轴承故障状态识别。
2.根据权利要求1所述的方法,其特征在于,还包括:
分类层利用Softmax分类器输出轴承故障的诊断结果。
3.根据权利要求2所述的方法,其特征在于,所述利用加速度传感器采集故障的时序性振动信号,数据归一化后进行分割得到原始样本的步骤,包括:
将原始时序振动信号按照统一步长进行分段切割;
截取每个时间点样本序列;
将样本序列原始数据进行连续小波变换。
4.根据权利要求3所述的方法,其特征在于,所述构建VAE-GAN样本生成模型,将原始样本经过连续小波变换后的时频域数据对应的时频图输入VAE-GAN样本生成模型进行训练,利用训练好的模型生成对应类别的伪样本,将生成的伪样本混合到真实样本的步骤,包括:构建编码网络、构建生成网络和构建判别网络;
所述构建编码网络,输入数据为故障原始振动信号经过连续小波变换后快后生成的小波时频图,编码网络由三组二维卷积神经网络层组成,按照公式(1)进行训练损失函数的计算;
其中,LE为编码网络损失值,μ和σ分别代表编码网络输出参数,N(0,1)为标准正态分布,KL(·)为KL散度;
所述构建生成网络,将输入的低维编码向量通过反卷积逐层进行特征重建,生成与真实样本尺寸相同的新样本;按照公式(2)和公式(3)进行训练损失函数的计算;
Z=μ1+e×σ1 (2)
LG=log2(1-D(G(Z)))+||Dl(X)-Dl(G(Z))||2 (3)
其中,LG为生成网络损失值;Z代表编码向量;μ1和σ1分别为编码网络对原始样本进行编码之后映射的样本均值和标准差;e为高斯噪声,并为正态分布;G(Z)为生成的样本,D(G(Z))为判别网络将输入数据判断为真实样本的概率;Di(X)为判别网络第l层输出的特征向量,X为输入的真实样本;
所述构建判别网络,判别网络由3个卷积层和2个全连接层组成,每个卷积层后面加入了批标准化层,判别网络将输入的真实样本和生成网络生成的样本进行特征提取和降维,最后通过Sigmoid激活后输出真伪标签,按照公式(4)进行训练损失函数的计算;
LD=log2D(X)+log2(1-D(G(Z1))) (4)
其中,LD为判别网络损失值,Z1为由μ1和σ1采样合成的隐变量;G(Z1)为生成的样本;D(G(Z1))为判别网络将输入数据判断为真实样本的概率。
5.根据权利要求4所述的方法,其特征在于,设计多尺度特征提取模型实现故障特征的提取,并利用通道注意力机制实现特征的加权融合,进行轴承故障状态识别步骤,包括:构建多尺度特征提取模型进行特征提取和构建基于通道注意力机制的特征加权模块;
所述构建多尺度特征提取模型进行特征提取,通过设置不同大小卷积核和不同深度的网络分支来对故障特征进行提取,得到多尺度特征,按照公式(5)进行特征提取与叠加:
其中,α为输入的时序图,F为输出特征向量,W1、W2、W3、W4为不同尺度分支的卷积权重,γ1、γ2、γ3、γ4为不同尺度分支的偏置向量,实现特征的非线性变换提取,f(j)表示卷积计算的激活函数Relu,j代表公式(5)中的对应参数,代表特征的叠加操作;
所述构建基于通道注意力机制的特征加权模块,引入通道注意力机制,对输入的多尺度特征数据进行全局平均池化得到一个权重向量,将原始通道输入的全部元素值与对应通道权重值逐一相乘,得到新的加权特征,将加权特征作为故障诊断的依据,输入到分类层进行故障分类。
6.根据权利要求2所述的方法,其特征在于,所述分类层利用Softmax分类器输出轴承故障的诊断结果的步骤,分类层由3个全连接网络层组成;
第一层全连接网络将加权之后的特征进行展平操作,将所有加权特征矢量首尾连接组成一维向量;
第二层全连接网络实现对融合之后的特征降维;
第三层全连接网络的输出个数与故障类别数目保持一致,利用Softmax分类器实现目标输出类别。
CN202310355427.2A 2023-04-04 2023-04-04 一种基于多尺度特征融合的非平衡样本轴承故障诊断方法 Pending CN116541771A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310355427.2A CN116541771A (zh) 2023-04-04 2023-04-04 一种基于多尺度特征融合的非平衡样本轴承故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310355427.2A CN116541771A (zh) 2023-04-04 2023-04-04 一种基于多尺度特征融合的非平衡样本轴承故障诊断方法

Publications (1)

Publication Number Publication Date
CN116541771A true CN116541771A (zh) 2023-08-04

Family

ID=87447929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310355427.2A Pending CN116541771A (zh) 2023-04-04 2023-04-04 一种基于多尺度特征融合的非平衡样本轴承故障诊断方法

Country Status (1)

Country Link
CN (1) CN116541771A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117232577A (zh) * 2023-09-18 2023-12-15 杭州奥克光电设备有限公司 一种光缆交接箱承载内部监测方法、系统和光缆交接箱

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117232577A (zh) * 2023-09-18 2023-12-15 杭州奥克光电设备有限公司 一种光缆交接箱承载内部监测方法、系统和光缆交接箱
CN117232577B (zh) * 2023-09-18 2024-04-05 杭州奥克光电设备有限公司 一种光缆交接箱承载内部监测方法、系统和光缆交接箱

Similar Documents

Publication Publication Date Title
CN111914883B (zh) 一种基于深度融合网络的主轴轴承状态评估方法及装置
CN109858352B (zh) 一种基于压缩感知与改进多尺度网络的故障诊断方法
CN110657984B (zh) 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
CN110059601A (zh) 一种多特征提取与融合的智能故障诊断方法
CN110705525A (zh) 一种诊断滚动轴承故障的方法及装置
CN110795843B (zh) 一种识别滚动轴承故障的方法及装置
CN110298235B (zh) 基于流形约束自编码网络的高光谱异常检测方法及系统
CN111898644B (zh) 一种无故障样本下航天液体发动机健康状态智能识别方法
CN115114965B (zh) 风电机组齿轮箱故障诊断方法、装置、设备及存储介质
CN112364706A (zh) 一种基于类不平衡的小样本轴承故障诊断方法
Zhao et al. A novel deep fuzzy clustering neural network model and its application in rolling bearing fault recognition
CN117290771A (zh) 基于改进辅助分类生成对抗网络的旋转机械故障诊断方法
Liu et al. Multi-Scale Fusion Attention Convolutional Neural Network for Fault Diagnosis of Aero-Engine Rolling Bearing
CN116541771A (zh) 一种基于多尺度特征融合的非平衡样本轴承故障诊断方法
CN112541524A (zh) 基于注意力机制改进的BP-Adaboost多源信息电机故障诊断方法
CN113409213B (zh) 柱塞泵故障信号时频图降噪增强方法和系统
CN117877521A (zh) 基于数据增强的无监督机械声音异常识别方法及系统
CN117554000A (zh) 尾矿输送管道泄漏智能检测方法及系统
CN115356599B (zh) 一种多模态城市电网故障诊断方法及系统
CN117112991A (zh) 一种基于改进深度残差收缩网络的轴承故障诊断方法
CN116484258A (zh) 电梯曳引机轴承故障诊断方法
CN114383845B (zh) 一种基于嵌入式零样本学习模型的轴承复合故障诊断方法
CN112560674A (zh) 一种声音信号质量的检测方法及系统
CN117516925A (zh) 一种基于MSDC-Swin-T的齿轮箱故障诊断方法
CN116778218A (zh) 一种基于连续滑窗Transformer和DS证据理论的滚动轴承增强诊断方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination