CN116361723A - 一种基于多尺度特征和注意力的轴承故障诊断分类方法 - Google Patents

一种基于多尺度特征和注意力的轴承故障诊断分类方法 Download PDF

Info

Publication number
CN116361723A
CN116361723A CN202310121054.2A CN202310121054A CN116361723A CN 116361723 A CN116361723 A CN 116361723A CN 202310121054 A CN202310121054 A CN 202310121054A CN 116361723 A CN116361723 A CN 116361723A
Authority
CN
China
Prior art keywords
data
attention
layer
classification
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310121054.2A
Other languages
English (en)
Inventor
邹文豪
芦志强
毛磊
胡智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Goodtimes Automation Co ltd
University of Science and Technology of China USTC
Original Assignee
Hefei Goodtimes Automation Co ltd
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Goodtimes Automation Co ltd, University of Science and Technology of China USTC filed Critical Hefei Goodtimes Automation Co ltd
Priority to CN202310121054.2A priority Critical patent/CN116361723A/zh
Publication of CN116361723A publication Critical patent/CN116361723A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • Y04S10/52Outage or fault management, e.g. fault detection or location

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明涉及一种基于多尺度特征和注意力的轴承故障诊断分类方法,包括以下步骤:S1、通过加速度传感器实时采集轴承的时域信号数据;S2、通过预先构建的多尺度特征分类模块对所述预处理数据进行提取分析处理,获得第一数据;S3、将所述第一数据输入至Transformer注意力机制学习模块进行学习后,获得第二数据;S4、将所述第二数据输入至一个全连接层,输出轴承故障的诊断分类结果;本发明使用卷积神经网络结构构建一个深层多尺度特征提取模块,采用了不同大小卷积核的策略挖掘出浅层的故障特征信息,然后引入纯注意力机制深入过滤故障特征,保留不同工况中相同故障最具有代表性的特征,能够完成对不同工况下的轴承故障进行分类。

Description

一种基于多尺度特征和注意力的轴承故障诊断分类方法
技术领域
本发明属于轴承故障诊断分类与设备健康管理技术领域,具体涉及一种基于多尺度特征和注意力的轴承故障诊断分类方法。
背景技术
滚动轴承是旋转机械和设备中最重要的部件之一,但滚动轴承在工作过程中很容易受到工作环境的损坏,从而导致机械故障。根据统计,40%的电机故障是轴承故障。由于复杂的工作环境,滚动元件轴承不可避免地会发生故障,并且故障发生的环境是不可预测的。防止可能损坏的最常见方法是在旋转机构运行时实时监测振动。使用传感器收集的状态信号应用智能故障诊断方法来识别故障类型,传统的智能故障诊断法可分为两个步骤:特征提取和分类。在轴承智能故障诊断算法中,基于信号处理的特征提取是必要的环节,但该环节耗时严重且对专家先验经验要求很高,无法满足不同工况下的诊断性能要求,会对诊断系统的实时性以及通用性带来严重的负担,已经无法满足日益增长的机械大数据要求。
近年来,深度学习的相关研究越来越多地运用在智慧工厂、大数据故障诊断方面。这类技术的特点是可以自动从原始振动时域信号或时频域信息中提取最相关的特征,在不断地参数优化和学习过程中,能够捕捉到与轴承故障诊断最相关的特征,这取代了传统算法繁琐的特征工程。但一些深度学习的相关方法对于特征的过滤是单一的,且在网络训练过程中由于噪声的原因,导致一些关键信息缺失,从而往往只适用于特定工况下的一类轴承故障检测,存在很大的局限性,无法满足不同复杂工况下的需求。
发明内容
本发明在现有技术的基础上,提出了一种基于多尺度特征提取和注意力机制的多工况下轴承故障诊断分类方法,能够从大量不同工况数据中提取关键信息,实现多工况下的轴承故障诊断。
本发明通过以下技术方案来实现上述目的:
一种基于多尺度特征和注意力的轴承故障诊断分类方法,包括如下步骤:
S1、通过加速度传感器实时采集轴承的时域信号数据,进行预处理,获得预处理数据;
S2、通过预先构建的多尺度特征分类模块对所述预处理数据进行提取分析处理,获得第一数据,其中,预先构建的多尺度特征分类模块依次包括一个大卷积核的卷积层和三个相同小卷积核的卷积层;
S3、将所述第一数据输入至Transformer注意力机制学习模块进行学习后,获得第二数据;
S4、将所述第二数据输入至一个全连接层,得到最终的四维分类的结果向量,输出轴承故障的诊断分类结果。
作为本发明的进一步优化方案,所述S1的预处理包括以下步骤:
使用一个大小为1024的时间滑动窗口沿时间轴进行滑动,其滑动步长为窗口大小,每一次滑动产生一段时域信号输入X,X=[x1,x2,……,xn],其中n为1024;
对每段输入时域信号X进行[-1-1]正则化处理,正则化处理的公式如下:
Figure BDA0004079939690000031
获得时域特征集输入序列,作为预处理数据。
作为本发明的进一步优化方案,所述S2具体包括:
将所述预处理数据输入至所述多尺度特征提取模块中,依次经过卷积核大小为15的卷积层和连续三个卷积核大小为3的卷积层;
其中,经过第一个卷积层输出
Figure BDA0004079939690000032
经过第二个卷积层输出/>
Figure BDA0004079939690000033
经过第三个卷积层输出/>
Figure BDA0004079939690000034
经过第四个卷积层输出/>
Figure BDA0004079939690000035
作为第一数据;
一维正向传播从卷积层l-1到l层的神经元输入采用下式表达:
Figure BDA0004079939690000036
其中,
Figure BDA0004079939690000037
为第k个神经元的偏置标量;/>
Figure BDA0004079939690000038
为上一层第i个神经元的输出;从上一层的第i个神经元到该l层的第k个神经元/>
Figure BDA0004079939690000039
的核用于确定该层的输入/>
Figure BDA00040799396900000310
f(·)为ReLU激活函数。
作为本发明的进一步优化方案,所述S3具体为:
使用注意力机制识别所述第一数据为输入序列,并视作为令牌序列xp
将一个可训练且随机初始化的类令牌头x0添加到所述第一数据头部,即组成xclass=[x0,xp],添加位置编码信息Epos,获得xinput=xclass+Epos
xinput进入Transformer结构中的多头注意力机制模块,按照如下公式对其进行自注意力计算:
Figure BDA0004079939690000041
其中,Q、K和V为待学习的参数矩阵,
Figure BDA0004079939690000042
Z是一个向量,Zi、Zj是一个元素;
为了使不同子空间的向量信息得到共享,进一步采用并行注意力计算,即多头注意力,按照如下公式计算:
Figure BDA0004079939690000043
其中headj为Attention(Q,K,V)j,WA为参数矩阵;
经过Transformer结构后的输出特征向量xoutput,作为第二数据。
作为本发明的进一步优化方案,每个卷积层中均包含正则化层和ReLU激活函数,且每个卷积层均进行最大池化和自适应池化操作。
本发明的有益效果在于:
使用了卷积神经网络结构构建一个深层多尺度特征提取模型,旨在对不同工况下的输入时域信号进行数据预处理,采用了不同大小卷积核的策略挖掘出浅层的故障特征信息,然后引入纯注意力机制深入过滤故障特征,保留不同工况中相同故障最具有代表性的特征。结合了注意力机制的全局上下文捕获和卷积的局部依赖捕获,能够完成对不同工况下的轴承故障进行分类。
附图说明
图1为外圈故障时域特征示意图;
图2为内圈故障时域特征示意图;
图3为滚子故障时域特征示意图;
图4为本发明基于多尺度特征和注意力的轴承故障诊断分类方法流程示意图;
图5为使用滑动窗口进行时域信号划分示意图;
图6为深度学习网络模型结构图;
图7为标准Transformer结构;
图8为凯斯西储大学轴承故障数据采集平台现场图;
图9为12k驱动端轴承故障数据分类结果的混淆矩阵;
图10为12k风扇端轴承故障数据分类结果的混淆矩阵;
图11为48k驱动端轴承故障数据分类结果的混淆矩阵。
具体实施方式
下面结合附图对本申请作进一步详细描述,有必要在此指出的是,以下具体实施方式只用于对本申请进行进一步的说明,不能理解为对本申请保护范围的限制,该领域的技术人员可以根据上述申请内容对本申请作出一些非本质的改进和调整。
为了减少计算开销,将时间尺度上的时域信号作为模型输入,除了去除传感器偏差引起的直流分量外,不需要对数据进行太多的信号处理。其中,作为输入的时域信号是从机械设备轴承座上安装的加速度传感器采集到的振动原始信号,时域特征提取来自时域信号,即把时间当作独立的变量,反映信号幅值与时间变量之间的关系。时域特征随时间变化趋势明显,其中多层的卷积层设计能够自动提取不同的故障特征,无须额外的数据预处理以及统计特征提取等步骤。
一、时频信号蕴含故障特征的原理
滚动轴承在使用中出现故障时,对于同一类的故障类型,其振幅时域信号往往会出现某些相同的特性,而这些特性蕴含了有助于对故障类型进行分类判断的有效信息。轴承的三种故障模式在振动时域信号上会呈现出不同的故障特征,即外圈、内圈、滚子三种故障。其中,各种故障的冲击会导致振动时域信号呈现一个较为规律的周期变化,具有不同的振动特点。接下来将分别对外圈、内圈和滚子三种故障状态下的轴承振动时域信号进行对比分析。
1)外圈故障时域信号分析
滚动轴承工作时,其外圈位置相对变化程度不大,而只有当滚动体转动至外圈故障处才会引起冲击。此时,振动时域信号上具有明显的特征,在时域波形图上表现为周期性冲击响应特征,如图1所示。
2)内圈故障时域信号分析
内圈故障相对于外圈故障来说,主要的变化体现在其转动状态不同。由于内圈的规律旋转造成了系统脉冲激励力和故障位置承受的载荷压力产生了周期性变化。综上,因为旋转的这些特点,内圈距离振动传感器时远时近,所以在时域信号上造成一定影响,如图2所示。
3)滚子故障时域信号分析
滚子在内外圈之间的滚道上,在运行过程中承载着摩擦力和径向、轴向力,从而会产生周期性冲击。同时,滚子被保持架均匀隔开,实现自转,因此故障部位的载荷会出现周期性变化,而载荷分布的变化将会对时域信号一定特点的振幅波动,但由于滚子故障的复杂性,其故障时域特征的变化并不像内、外圈故障的信号变化明显,如图3所示。
二、基于多尺度特征和注意力的轴承故障诊断分类方法原理与步骤
本发明基于多尺度特征和注意力的轴承故障诊断分类方法,流程如图4所示,具体为:
第一部分:使用时间滑动窗口构造时域特征集输入
对传感器采集到时域信号进行预处理操作,构造时域特征集输入。首先,时域特征随时间变化趋势明显,常用来作为特征参数,使用一个大小为1024的时间滑动窗口沿时间轴进行滑动,其滑动步长为窗口大小,每一次滑动产生一段信号输入X。假设振动时域信号为X=[x1,x2,……,xn],其中n为1024。如图5所示,使用滑动窗口对时域信号进行划分,相邻不同颜色代表独立的特征输入样本。
为了方便训练网络,对每段输入信号X均做“[-1-1]”正则化处理,正则化处理的公式如下:
Figure BDA0004079939690000071
第二部分:使用CNN构造多尺度特征提取器与数据处理流程
首先,该多尺度特征提取模块由CNN网络组成,如图6最上部分所示,运用了卷积层(Conv)、池化层(MaxPooling、AdaptiveMaxPooling)、正则化层(BN)以及激活函数(ReLU),其输入数据为采集到的振动时域信号,使用时间滑动窗口沿时间序列滑动,将窗口内的数据正则化后输入到特征融合器中。其中,卷积层主要用来处理原始数据,负责特征的初步提取,池化层可以视作为一种特殊的卷积层,正则化层则是用来加速网络参数训练。
一维正向传播从卷积层l-1到l层的神经元输入可以用下式表达:
Figure BDA0004079939690000081
其中,
Figure BDA0004079939690000082
为第k个神经元的偏置标量;/>
Figure BDA0004079939690000083
为上一层第i个神经元的输出;从上一层的第i个神经元到该l层的第k个神经元/>
Figure BDA0004079939690000084
的核用于确定该层的输入/>
Figure BDA0004079939690000085
f(·)为ReLU激活函数。
输入序列X经过第一部分处理后,将要经过一系列的卷积池化操作。首先,第一个卷积层采用较大的卷积核,即宽核大小为15,用于快速整合输入序列的特征信息,以提高数据处理效率,并获得首次处理后的粗颗粒尺度的特征信息。与小卷积核相比,宽核能够更好地抑制高频噪声。经过第一次卷积层处理后,其输出
Figure BDA0004079939690000086
由向量1024×1扩展为1010×16。
随后,再连续进入三层同卷积核大小为3的卷积层,加深网络深度,多卷积层能够对粗颗粒尺度的特征数据进行筛选,可以更好地抑制高频噪声和过拟合现象,其输出
Figure BDA0004079939690000087
分别为504×32、504×64以及500×128。此外,较小的卷积核可以用于多层非线性映射,能够从更细颗粒尺度对不同时域数据进行关联计算。与此同时,在每层中采用了最大池化和自适应池化操作,增强故障特征的识别能力。经过深层卷积操作后提取出来的故障特征,更具有鲁棒性,能够提高最后神经网络的检测分类精度。
第三部分:使用Transformer注意力机制进行故障诊断分类
将Transformer结构引入到的分类器中来,使用注意力机制识别多尺度特征提取器处理后的深层特征序列作为输入,并视作为令牌序列xp。图7展示了一个标准的Transformer结构,其核心模块为负责特征提取的多头注意力机制模块。
然后,将一个可训练且随机初始化的类令牌头x0添加到序列头部,即组成xclass=[x0,xp]。
为了使模型利用序列的顺序,必须额外添加一些关于标记的相关或者绝对位置信息,即需要添加位置编码信息Epos,最终得到xinput=xclass+Epos
xinput进入Transformer结构中的多头注意力机制模块,对其进行自注意力计算,按照如下公式:
Figure BDA0004079939690000091
其中Q、K和V为待学习的参数矩阵。
Figure BDA0004079939690000092
Z是一个向量,Zi、Zj是一个元素。
为了是不同子空间的向量信息得到共享,进一步采用并行注意力计算,即多头注意力,按照如下公式计算:
Figure BDA0004079939690000093
其中headj为Attention(Q,K,V)j,WA为参数矩阵。
经过Transformer结构后的输出特征向量xoutput输入至一个全连接层,得到最终的四维分类的结果向量。
三、实施例
实验数据来自当前流行的凯斯西储大学滚动轴承故障数据集,图8展示了此数据集的实验平台。从中选取了不同频率下的四种工况轴承故障数据,即四种不同转速下的所有轴承故障数据。其中故障数据可以分成正常、滚子故障、内圈故障、外圈故障四类数据,每类轴承运行时会面临不同的故障类型及故障强度,详细数据集信息请见表1。这些数据选取其中的水平原始振动信号用于验证复杂工况下滚动轴承故障诊断的分类精度。
表1验证数据集详细情况
Figure BDA0004079939690000101
为了便于理解,下面将结合本对真实数据集进行分析和验证:
步骤1:采集不同工况下轴承的时域信号样本数据,对每一类数据集按照样本大小为1024进行8:2划分训练集和测试集,训练集的划分是随机的,因此训练集和测试集中都包含着不同工况下的正常、滚子故障、内圈故障和外圈故障的对应样本数据。
步骤2:对划分后的数据集进行预处理操作以构建时域特征集输入序列,对每一份样本均进行式1的正则化操作,获得算法模型输入
Figure BDA0004079939690000102
Figure BDA0004079939690000103
其中n为1024。
步骤3:设置网络训练参数,网络训练的过程是通过反向传播算法完成参数更新的。由于轴承故障诊断问题是一个分类问题,交叉熵损失函数被采用作为损失函数。网络输出的预测结果越精准,损失误差就越低:网络的训练过程其实是在不断追求损失函数最小化,本发明选用了“Adam”优化算法,它可以自适应地调整学习速率大小并能够迭代优化网络参数,同时将迭代次数设置为100和学习率大小为0.001,损失函数采用交叉熵函数,激活函数采用ReLU和Softmax函数。训练批量大小batch设置为64,即训练样本会被随机分成大小固定为64的长度1024的小批次,在每一次epoch中,共64个样本数据被送入网络中。
步骤4:建立深度学习网络,包括基于CNN的多尺度特征提取模块、Transformer注意力机制学习模块以及全连接分类层模型。
步骤5:将所有训练样本集输入到建立好的深度学习网络中进行训练,期间使用测试集评估每一次模型性能表现。采用反向传播的方式,利用交叉熵损失函数对算法参数进行优化求解,从而不断调整网络的所有参数,最终得到关于适用于某个采样频率下的离线模型,为轴承故障诊断分类模型。
步骤6:将训练好的离线模型,部署至线上平台,用于诊断不同工况下的多种旋转机械设备健康情况,并能够在发生故障时给出疑似最大可能性的故障类型。
表2为本发明在测试数据上的整体诊断表现。
表2该专利技术在测试数据集的表现结果
Figure BDA0004079939690000111
图9-11给出了测试结果的混淆矩阵,依次分别是12k驱动端轴承故障数据分类结果、12k风扇端轴承故障数据分类结果和48k驱动端轴承故障数据分类结果,待测试的样本总数分别为1186、1181、3226。从表中和图中可以看到,基于多尺度特征提取和注意力机制的多工况下轴承故障分类方法的分类精度能够达到90%以上,其中对于12k驱动端轴承故障数据能够完全将正常状态、内圈故障和滚子故障进行有效精准地分类,在对12k风扇端轴承故障数据进行故障检测分类时,1181个测试样本中,只有一个滚子故障的样本分类错误,其余预测全部正确;在48k驱动端轴承故障数据的分类性能上,诊断准确率也高达97.09%。本专利技术所提出的模型具有很强的可靠性,对于多工况的故障故障诊断也有着很高的准确性。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (5)

1.一种基于多尺度特征和注意力的轴承故障诊断分类方法,其特征在于,包括如下步骤:
S1、通过加速度传感器实时采集轴承的时域信号数据,进行预处理,获得预处理数据;
S2、通过预先构建的多尺度特征分类模块对所述预处理数据进行提取分析处理,获得第一数据,其中,预先构建的多尺度特征分类模块依次包括一个大卷积核的卷积层和三个相同小卷积核的卷积层;
S3、将所述第一数据输入至Transformer注意力机制学习模块进行学习后,获得第二数据;
S4、将所述第二数据输入至一个全连接层,得到最终的四维分类的结果向量,输出轴承故障的诊断分类结果。
2.根据权利要求1所述的一种基于多尺度特征和注意力的轴承故障诊断分类方法,其特征在于,所述S1的预处理包括以下步骤:
使用一个大小为1024的时间滑动窗口沿时间轴进行滑动,其滑动步长为窗口大小,每一次滑动产生一段时域信号输入X,X=[x1,x2,……,xn],其中n为1024;
对每段输入时域信号X进行[-1-1]正则化处理,正则化处理的公式如下:
Figure FDA0004079939680000011
获得时域特征集输入序列,作为预处理数据。
3.根据权利要求1所述的一种基于多尺度特征和注意力的轴承故障诊断分类方法,其特征在于,所述S2中具体为:
将所述预处理数据输入至所述多尺度特征提取模块中,依次经过卷积核大小为15的卷积层和连续三个卷积核大小为3的卷积层;
其中,经过第一个卷积层输出
Figure FDA0004079939680000021
经过第二个卷积层输出/>
Figure FDA0004079939680000022
经过第三个卷积层输出
Figure FDA0004079939680000023
经过第四个卷积层输出/>
Figure FDA0004079939680000024
作为第一数据;
一维正向传播从卷积层l-1到l层的神经元输入采用下式表达:
Figure FDA0004079939680000025
其中,
Figure FDA0004079939680000026
为第k个神经元的偏置标量;/>
Figure FDA0004079939680000027
为上一层第i个神经元的输出;从上一层的第i个神经元到该l层的第k个神经元/>
Figure FDA0004079939680000028
的核用于确定该层的输入/>
Figure FDA0004079939680000029
f(·)为ReLU激活函数。
4.根据权利要求3所述的一种基于多尺度特征和注意力的轴承故障诊断分类方法,其特征在于,所述S3具体为:
使用注意力机制识别所述第一数据为输入序列,并视作为令牌序列xp
将一个可训练且随机初始化的类令牌头x0添加到所述第一数据头部,即组成xclass=[x0,xp],添加位置编码信息Epos,获得xinput=xclass+Epos
xinput进入Transformer结构中的多头注意力机制模块,按照如下公式对其进行自注意力计算:
Figure FDA00040799396800000210
其中,Q、K和V为待学习的参数矩阵,
Figure FDA00040799396800000211
Z是一个向量,Zi、Zj是一个元素;
为了使不同子空间的向量信息得到共享,进一步采用并行注意力计算,即多头注意力,按照如下公式计算:
Figure FDA0004079939680000031
其中headj为Attention(Q,K,V)j,WA为参数矩阵;
经过Transformer结构后的输出特征向量xoutput,作为第二数据。
5.根据权利要求3所述的一种基于多尺度特征和注意力的轴承故障诊断分类方法,其特征在于,每个卷积层中均包含正则化层和ReLU激活函数,且每个卷积层均进行最大池化和自适应池化操作。
CN202310121054.2A 2023-02-16 2023-02-16 一种基于多尺度特征和注意力的轴承故障诊断分类方法 Pending CN116361723A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310121054.2A CN116361723A (zh) 2023-02-16 2023-02-16 一种基于多尺度特征和注意力的轴承故障诊断分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310121054.2A CN116361723A (zh) 2023-02-16 2023-02-16 一种基于多尺度特征和注意力的轴承故障诊断分类方法

Publications (1)

Publication Number Publication Date
CN116361723A true CN116361723A (zh) 2023-06-30

Family

ID=86930752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310121054.2A Pending CN116361723A (zh) 2023-02-16 2023-02-16 一种基于多尺度特征和注意力的轴承故障诊断分类方法

Country Status (1)

Country Link
CN (1) CN116361723A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648611A (zh) * 2024-01-30 2024-03-05 太原理工大学 机械装备的故障诊断方法
CN118533479A (zh) * 2024-07-19 2024-08-23 四川农业大学 一种航空发动机轴承的故障诊断方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648611A (zh) * 2024-01-30 2024-03-05 太原理工大学 机械装备的故障诊断方法
CN117648611B (zh) * 2024-01-30 2024-04-05 太原理工大学 机械装备的故障诊断方法
CN118533479A (zh) * 2024-07-19 2024-08-23 四川农业大学 一种航空发动机轴承的故障诊断方法及装置

Similar Documents

Publication Publication Date Title
Shao et al. Highly accurate machine fault diagnosis using deep transfer learning
Xia et al. Fault diagnosis for rotating machinery using multiple sensors and convolutional neural networks
Che et al. Hybrid multimodal fusion with deep learning for rolling bearing fault diagnosis
CN112257530B (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN116361723A (zh) 一种基于多尺度特征和注意力的轴承故障诊断分类方法
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN111523081B (zh) 一种基于增强门控循环神经网络的航空发动机故障诊断方法
CN110991424A (zh) 基于最小熵解卷积和堆叠稀疏自编码器的故障诊断方法
CN111368885A (zh) 一种基于深度学习和信息融合的航空发动机气路故障诊断方法
CN111753891B (zh) 一种无监督特征学习的滚动轴承故障诊断方法
CN114358124B (zh) 基于深度对抗卷积神经网络的旋转机械新故障诊断方法
Tang et al. A robust deep learning network for low-speed machinery fault diagnosis based on multikernel and RPCA
CN115017945A (zh) 基于增强型卷积神经网络的机械故障诊断方法和诊断系统
CN111751133A (zh) 一种基于非局部均值嵌入的深度卷积神经网络模型的智能故障诊断方法
CN112834221A (zh) 一种基于eemd-mse和多尺度一维卷积神经网络轴承故障诊断方法
CN114964778A (zh) 一种基于小波时频图与深度学习的轴承故障诊断方法
Zhao et al. A novel deep fuzzy clustering neural network model and its application in rolling bearing fault recognition
CN115290326A (zh) 一种滚动轴承故障智能诊断方法
CN114354194A (zh) 基于全卷积自编码器和优化支持向量机的滚动轴承故障诊断方法
CN116595465A (zh) 基于自编码器和数据增强的高维稀疏数据离群点检测方法及系统
Peng et al. Research on fault diagnosis method of rolling bearing based on 2DCNN
CN117421667A (zh) 基于改进灰狼算法优化的Attention-CNN-LSTM工业过程故障诊断方法
Kavianpour et al. An intelligent gearbox fault diagnosis under different operating conditions using adversarial domain adaptation
Du et al. Fault diagnosis of plunger pump in truck crane based on relevance vector machine with particle swarm optimization algorithm
CN117592543A (zh) 一种基于自监督学习的航空发动机滚动轴承故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination