CN114722952B

CN114722952B - 一种基于表示学习的轴承故障检测和分类的一体化方法

Info

Publication number: CN114722952B
Application number: CN202210416390.5A
Authority: CN
Inventors: 张九思; 李翔; 罗浩; 张可; 安翼尧; 田纪伦; 尹珅
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2022-04-20
Filing date: 2022-04-20
Publication date: 2023-05-26
Anticipated expiration: 2042-04-20
Also published as: CN114722952A

Abstract

一种基于表示学习的轴承故障检测和分类的一体化方法，本发明涉及轴承故障检测和分类的一体化方法。本发明的目的是为了解决现有采用数据驱动的方法进行轴承故障诊断过程中，获得大量的轴承故障样本是十分困难的，以及为不同的故障类型的数据设计准确的标签存在很大的限制的问题。过程为：1、提取轴承的振动数据；2、特征提取：从时域、频域2个角度提取数据的特征；3、搭建故障检测神经网络：故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器；4、训练故障检测神经网络；5、搭建故障分类神经网络；6、训练故障分类神经网络；7、在线故障检测与故障分类。本发明用于轴承故障诊断与人工智能相结合的学科交叉领域。

Description

一种基于表示学习的轴承故障检测和分类的一体化方法

技术领域

本发明属于轴承故障诊断与人工智能相结合的学科交叉领域，具体涉及基于表示学习的轴承故障检测和分类的一体化方法。

背景技术

作为精密机械设备中的重要部件，轴承的健康状态对于机器的正常运行具有至关重要的作用。如何及时诊断轴承故障，减少因其故障产生的损失，对于机械设备的安全性和可靠性具有关键性意义。

故障诊断主要包含故障的检测和分类这两个方面。目前针对轴承的故障诊断方法从总体上可以分为基于模型的方法、数据驱动的方法。基于模型的故障诊断方法需要依靠丰富的先验知识来构建轴承的故障模型。然而，考虑到轴承的工作情况多变，工作环境复杂，精确的故障建模存在着很大的困难，基于模型的故障诊断方法存在着一定的局限性。另一方面，数据驱动的方法无需事先了解轴承故障的先验知识，通过分析轴承工作过程中产生的振动信号便可以实现轴承的故障诊断。近年来，新兴的深度学习方法，例如卷积神经网络、循环神经网络及其变体长短时记忆网络被广泛地应用于轴承的故障诊断的研究中。作为学习类算法的一个重要分支，表示学习包含了自编码器、迁移学习以及流形学习等多种方式。值得注意的是，表示学习通过将原始特征转化为机器能够处理的方式，具备很强的可靠性与可解释性。近年来，表示学习以其在数据挖掘任务的优势，在智能系统的故障诊断和预测性维护领域中获得了越来越广泛的关注。

虽然数据驱动的方法在轴承故障诊断方面应用广泛，但是大多数据驱动的方法都需要充足的故障标签数据训练算法模型，并且要求神经网络的训练数据和测试数据之间遵循相同的分布假设。然而，大多数的精密机械设备都被要求在正常状态下工作，获得大量的轴承故障样本是十分困难的。如何在无监督的条件下，仅仅采用轴承健康状态下工作的数据进行故障检测存在着很大的挑战。与此同时，工作条件、负载情况以及轴承类型等多种变化因素都会影响着数据分布，为不同的故障类型的数据设计准确的标签存在很大的限制。因此，如何将在小样本故障数据的条件下，将正常数据下进行预训练所获得的源域模型迁移到故障样本所代表的目的域进行故障诊断需要深入的研究。

发明内容

本发明的目的是为了解决现有采用数据驱动的方法进行轴承故障诊断过程中，获得大量的轴承故障样本是十分困难的，以及为不同的故障类型的数据设计准确的标签存在很大的限制的问题，而提出一种基于表示学习的轴承故障检测和分类的一体化方法。

一种基于表示学习的轴承故障检测和分类的一体化方法具体过程为：

步骤1、提取轴承的振动数据：

通过在轴承座上的传感器设备，采集轴承在工作过程中的振动数据；

所述振动数据包括健康数据和故障数据；

步骤2、特征提取：

从时域、频域2个角度提取轴承在工作过程中的振动数据的特征；

所述振动数据的特征包括健康数据的特征和故障数据的特征；

步骤3、搭建故障检测神经网络：

故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器；

步骤4、训练故障检测神经网络：

将步骤2提取到的健康数据的特征输入到步骤3搭建的故障检测神经网络中，获得训练好的故障检测神经网络；

步骤5、搭建故障分类神经网络：

将步骤4训练好的故障检测神经网络中编码器、噪声引入和自注意力机制层部分作为预训练模型实现模型迁移，最后通过全连接层模块实现向故障标签的映射；

步骤6、训练故障分类神经网络：

将步骤2提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中，获得训练好的故障分类神经网络；

步骤7、在线故障检测与故障分类。

本发明的有益效果为：

本发明旨在解决轴承的故障检测和分类问题，而提出的一种基于表示学习的轴承故障检测和分类的一体化方法。在离线阶段，对于无监督条件下基于MDAE-SAMB的轴承故障检测，仅仅采用轴承在健康状态下的振动数据进行特征提取，训练MDAE-SAMB网络；对于基于模型迁移的轴承故障分类，则是将离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分进行模型迁移，仅采用少量的样本(10％)训练故障分类网络。接着，对于在线阶段，通过故障检测网络实现在线故障检测。如果检测到发生故障，则通过训练好的故障分类网络中，便可以实现在线故障分类。最后，采用准确率评估提出的基于表示学习的轴承故障检测和分类的一体化方法对于轴承在线工作过程中故障的检测和分类效果。本发明的工作流程图如图1所示。

本发明的目的是无需任何故障标签数据，便可以实现对于轴承故障检测，以及在小样本故障条件下，仅仅采用很少量的故障样本进行离线训练，实现轴承的故障分类，而提出一种基于表示学习的轴承故障检测和分类的一体化方法。

本发明提出了基于表示学习的轴承故障检测和分类的一体化方法，无需任何故障标签数据，能够实现在无监督的条件下故障的检测。与此同时，在小样本故障条件下，仅仅采用很少的故障样本进行离线训练，从而实现轴承的故障分类。

(1)无需任何故障标签数据，本发明提出了一种无监督条件下基于MDAE-SAMB的轴承故障检测表示学习方法。在瓶颈层神经元引入自注意力机制，能够为不同的瓶颈层神经元分配不同的权重，提升数据样本的重构效果，由此提高故障检测的准确率。

(2)在小样本故障条件下，本发明提出了一种基于模型的迁移学习的轴承故障分类方法。将经过正常数据预训练所获得的源域模型，迁移到故障样本所代表的目的域中，仅仅采用很少的故障样本进行离线训练，同样可以实现高准确率的故障在线分类。

(3)本发明将故障检测任务和故障分类任务结合起来，由此构建出一种基于表示学习的轴承故障检测和分类的一体化方法，从而实现轴承在线工作过程中故障的检测和分类，能够实现在无监督的条件下对于轴承故障的检测，以及小样本故障条件下轴承的故障分类。

附图说明

图1是本发明的工作流程图；

图2是本发明中针对故障检测任务的基于对瓶颈层神经元的自注意力机制修正去噪自编码器(Modified denoising auto-encoder with Self-attention mechanism forbottleneck layer，MDAE-SAMB)的神经网络结构图；

图3是本发明中针对故障分类任务的基于迁移学习的对瓶颈层神经元的自注意力机制修正去噪自编码器的神经网络结构图；

图4a是关于轴承内圈故障的在线检测结果图；J_Res,th表示残差故障阈值；J_Res表示单个样本的残差；

图4b是关于轴承滚动体故障的在线检测结果图；J_Res,th表示残差故障阈值；J_Res表示单个样本的残差；

图4c是关于轴承Centered外圈故障的在线检测结果图；J_Res,th表示残差故障阈值；J_Res表示单个样本的残差；

图4d是关于轴承Orthogonal外圈故障的在线检测结果图；J_Res,th表示残差故障阈值；J_Res表示单个样本的残差；

图4e是关于轴承Opposite外圈故障的在线检测结果图；J_Res,th表示残差故障阈值；J_Res表示单个样本的残差；

图5是本发明中在线故障分类的结果图。

具体实施方式

具体实施方式一：本实施方式一种基于表示学习的轴承故障检测和分类的一体化方法具体过程为：

本发明中表示学习方法用的是神经网络；

步骤1、提取轴承的振动数据：

通过在轴承座上的传感器设备，例如无线传感器等，采集轴承在工作过程中的振动数据，作为基于表示学习的轴承故障检测和分类的一体化方法的输入；

所述振动数据包括健康数据和故障数据(故障数据10％用于离线训练)；

步骤2、特征提取：

为了更好地反映轴承工作过程中的健康状态，考虑从时域、频域2个角度提取轴承在工作过程中的振动数据的特征，由此作为神经网络的输入；

步骤3、搭建故障检测神经网络：

为了减少噪声信号对于样本重构的影响，并为不同的瓶颈层神经元分配不同的权重，进而有效实现故障检测，本发明提出了一种基于对瓶颈层神经元的自注意力机制修正去噪自编码器(Modified denoising auto-encoder with Self-attention mechanismfor bottleneck layer，MDAE-SAMB)的神经网络。仅仅采用轴承在健康状态下的振动数据进行特征提取获得的特征，由此训练MDAE-SAMB网络。MDAE-SAMB结构主要由编码器、噪声引入、自注意力机制层以及解码器这四部分组成。

步骤4、训练故障检测神经网络：

将步骤2提取到的健康数据的特征输入到步骤3搭建的故障检测神经网络中，获得训练好的故障检测神经网络，构建输入的健康数据之间的耦合关系；

步骤5、搭建故障分类神经网络：

将轴承的健康数据作为源域，将轴承的故障数据作为目的域；

将第4步通过离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分，换句话说，将步骤4训练好的故障检测神经网络中编码器、噪声引入和自注意力机制层部分作为预训练模型实现模型迁移，最后通过全连接层模块实现向故障标签的映射；

步骤6、训练故障分类神经网络：

将步骤2提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中，获得训练好的故障分类神经网络，仅仅采用少量的故障样本(10％)进行训练，构建输入的故障数据和故障标签之间的映射关系；

步骤7、在线故障检测与故障分类。

评估神经网络的故障检测与分类的效果：

采用准确率(Accuracy)指标评估提出的基于表示学习的轴承故障检测和分类的一体化方法对于轴承在线工作过程中故障的检测和分类效果。准确率为检测任务或者分类任务正确的样本和所有样本之间的比值。

具体实施方式二：本实施方式与具体实施方式一不同的是，所述步骤2中特征提取：为了更好地反映轴承工作过程中的健康状态，考虑从时域、频域2个角度提取轴承在工作过程中的振动数据的特征，由此作为神经网络的输入；

具体过程为：

为了更好地反映轴承工作过程中的健康状态，本发明考虑从时域、频域和这两个角度，提取轴承在工作阶段中所产生振动数据的特征，由此作为神经网络的输入。作为常用的信号特征，时域特征目前已被广泛地应用于描述轴承的健康状态。时域特征包含无量纲统计参数(如偏度、峰度因子等)以及有量纲统计参数(如最大值、最小值、均方根值等)。考虑到无量纲统计参数的波动较为剧烈，其稳定性也较差，为此本发明采用对时域信号特征敏感的7种有量纲统计参数作为时域特征TF₁～TF₇；

时域特征表达式如公式(1)—(7)所示：

/>

TF₅＝|min{x_i|i＝1,2,...,L}| (5)

TF₆＝|max{x_i|i＝1,2,...,L}| (6)

TF₇＝TF₆-TF₅ (7)

其中L为轴承振动信号的长度，i是时间的编号，x_i为i时刻轴承振动信号幅度，max和min分别为最大值和最小值；TF₁为信号的绝对平均值，TF₂为信号的标准差，TF₃为信号的均方根值，TF₄为信号的均方根值和绝对平均值的比值，TF₅为信号的最小值，TF₆为信号的最大值，TF₇为信号的极差；

由于轴承在发生故障时，从频域的角度来看，某些故障对应频段的能量会发生明显的变化。因此，本发明考虑采用快速傅里叶变换(FastFourier Transform，FFT)的方式将轴承振动信号转化为频谱数据，进而提取其频域特征FF₁～FF₇；

频域特征表达式如公式(8)—(14)所示：

其中K是频谱总长度，j是频率的编号，s_j是振动信号FFT变换之后的频谱幅度，f_j为对应s_j的频率；FF₁为频率对于频谱总长度的均值，FF₂为频谱幅度标准差，FF₃为频率幅度的加权平均值，FF₄为频率幅度的加权标准差，FF₅为频率幅度的加权标准差与加权平均值的比值，FF₆为频谱幅度的均方根值，FF₇为描述功率谱收敛情况的统计量；

综上，对于轴承每一个方向(例如横向、纵向)上的振动信号，可以提取出时域、频域共计14种特征，用于描述轴承在工作过程中的健康状态。

其它步骤及参数与具体实施方式一相同。

具体实施方式三：本实施方式与具体实施方式一或二不同的是，所述步骤3中搭建故障检测神经网络：故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器；

具体过程为：

自动编码器是一种重要的无监督表示学习方法。自动编码器包含了编码层、瓶颈层以及解码层。为了减少噪声信号对于样本重构的影响，并为不同的瓶颈层神经元分配不同的权重，进而有效实现故障检测，本发明提出了一种基于对瓶颈层神经元的自注意力机制修正去噪自编码器的神经网络。仅仅采用轴承在健康状态下的振动数据进行特征提取，便可以训练MDAE-SAMB网络。MDAE-SAMB的灵感来自于去噪自编码器(Denoising auto-encoder，DAE)。作为深度学习中一种重要的无监督表示学习方法，传统DAE通过在输入层加入噪声以提高网络模型的鲁棒性。本发明提出的MDAE-SAMB相对于DAE存在2个方面的改进：(1)在瓶颈层加入噪声信号，在瓶颈层神经元的输入上叠加噪声，以增强网络鲁棒性；(2)对于瓶颈层神经元引入自注意力机制，为不同的瓶颈层神经元分配不同的权重，提升网络的重构效果。MDAE-SAMB的结构如图2所示。该网络结构主要由编码器、噪声引入、自注意力机制层以及解码器这四部分组成，分别描述如下：

(1)编码器：

编码器用于构建输入特征向量x_f和编码向量x_e之间的映射关系，表达成公式(15)所示的形式：

其中f(.)表示编码层映射函数，h(.)表示非线性激活函数，

和/>

分别表示第k个编码层的权重矩阵和偏置向量；W₁ ^e和/>

分别表示第1个编码层的权重矩阵和偏置向量；具体地，/>

m为特征向量的维数，/>

q为瓶颈层神经元的个数；

编码器包含了输入层、隐含层、瓶颈层。本发明在自编码器的基础上进行了改进，体现在对瓶颈层神经元运用了自注意力机制。

(2)噪声引入：

本发明在编码器的输出层，也就是瓶颈层上加入了噪声，可以获得输出

表达式如公式(16)所示：

其中，v为高斯噪声向量，服从分布

为均值为0，方差为/>

的正态分布；

(3)自注意力机制层：

通过自注意力机制层获得瓶颈层的各个神经元与各个神经元的重要性程度之间的映射关系，如表达式(17)所示：

其中，s表示瓶颈层神经元的重要性程度，s＝[s₁,…,s_a,…,s_q]^T，q为瓶颈层神经元个数，T为转置，W_s和b_s分别表示自注意力机制层的权重矩阵和偏置向量，φ为sigmoid激活函数，s_a表示第a个神经元的重要性程度；

在获得瓶颈层每一个神经元的重要性程度后，通过softmax函数获得归一化后的重要性程度，如表达式(18)所示：

其中α_a表示瓶颈层第a个神经元归一化后的重要性程度，将瓶颈层每个神经元的归一化重要性程度α₁,α₂,...,α_q同加入噪声后的瓶颈层各个神经元所代表的值

相乘后即可获得自注意力机制网络层的输出x_s，作为后续解码器的输入，表达式如式(19)所示：

其中

代表第1个加入噪声后的瓶颈层神经元所代表的值，/>

代表第2个加入噪声后的瓶颈层神经元所代表的值，/>

代表第q个加入噪声后的瓶颈层神经元所代表的值，

(4)解码器：

解码器用于构建自注意力机制层输出向量x_s和故障检测神经网络重构输出

之间的映射关系，表达成公式(20)所示的形式：

其中，g(.)表示解码层映射函数，h(.)表示非线性激活函数，

和/>

分别表示第k个解码隐含层的权重矩阵和偏置向量，W₁ ^d和/>

分别表示第1个解码隐含层的权重矩阵和偏置向量；

为了最小化输入向量和输出向量之间的差异，基于MDAE-SAMB的故障检测神经网络参数将由公式(21)所示的损失函数进行参数更新：

其中，

为损失函数，N为训练数据样本的数目，n为训练样本的编号，/>

为第n个输入特征向量，/>

为故障检测神经网络重构的第n个输出特征向量，W和b分别为故障检测神经网络中权重矩阵和偏置向量的集合/>

对于离线训练阶段，仅仅采用轴承在健康状态下的振动数据经过特征提取可以获得特征，训练MDAE-SAMB网络。由于在离线训练阶段网络所学习到的是正常数据之间的耦合关系。因此，一旦将发生故障的轴承数据输入到训练好的神经网络中，MDAE-SAMB产生的重构误差便会高于健康工作状态时的重构误差。具体地，重构误差

可以表示为公式(22)所示的形式：

其中，n为训练样本的编号，

为第n个样本的第1个特征的残差值，/>

为第n个样本的第m个特征的残差值，m为输入特征向量的维数；f(.)表示编码层映射函数，g(.)表示解码层映射函数，φ为sigmoid激活函数，⊙为点积运算表示符；

在此基础上，本发明将轴承故障的阈值J_Res,th设置为健康样本残差绝对值的均值

与3倍标准差/>

之和，可以表示为公式(23)所示的形式：

其中p为特征的编号，

为第n个样本的第p个特征的残差值；

在此基础上，一旦输入到故障检测神经网络的轴承在线数据所计算出的残差J_Res大于公式(23)中的阈值，则说明此时的轴承发生了故障；否则轴承便是健康的工作状态。

其它步骤及参数与具体实施方式一或二相同。

具体实施方式四：本实施方式与具体实施方式一至三之一不同的是，所述步骤4中训练故障检测神经网络：

具体过程为：

整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行，故障检测神经网络的优化算法为Adam优化算法，损失函数为公式(21)中所示的平方误差损失函数，故障检测神经网络的批量训练尺寸为256个样本，学习速率为0.001。

其它步骤及参数与具体实施方式一至三之一相同。

具体实施方式五：本实施方式与具体实施方式一至四之一不同的是，所述步骤5中搭建故障分类神经网络：

具体过程为：

作为一种重要的表示学习方法，迁移学习指的是将在相似源任务中学习到的模型迁移到目标任务中，从而达到提升实现目标任务的泛化能力。基于模型迁移的迁移学习方法是一种重要的迁移学习方法。具体而言，迁移学习的源任务和目标任务可能存在类似的特征表示，基于模型迁移的方法便是将在源任务上经过预训练获得的模型迁移到目标任务的模型中，实现模型参数的共享，进而提升模型的性能。基于此，本发明将轴承的健康数据作为源域，将轴承故障数据作为目的域。本发明将利用在离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分，换句话说，将编码器、噪声引入和自注意力机制层等部分作为预训练模型迁移到故障分类任务中。最后通过全连接层模块实现向故障标签的映射。

假设经过特征提取后的输入特征向量表示为

m为特征向量的维数，预训练模型的输出/>

可以表示成公式(24)所示的形式：

其中，n为样本的编号，φ为sigmoid激活函数，softmax为归一化函数，v为噪声信号，f(.)表示编码层映射函数；

考虑到轴承存在内圈、外圈以及滚动体等多种故障，本发明采用one-hot编码的形式将故障类型进行编码(假设有3种故障那么这3种故障的标签分别就是[1,0,0],[0,1,0],[0,0,1]，将标签表示成计算机能够处理的方式)；在此基础上，构建预训练模型的输出和故障分类结果

之间的映射关系，如公式(25)所示：

其中，ξ(.)表示故障分类神经网络的映射函数，h(.)表示非线性激活函数，

和

分别表示故障分类神经网络第k层的权重矩阵和偏置向量，W₁ ^f和/>

分别表示故障分类神经网络第1层的权重矩阵和偏置向量；

为了最小化真实分类标签y⁽ⁿ⁾和故障分类神经网络分类结果

之间的差异，故障分类神经网络将如公式(26)所示的交叉熵损失函数进行参数更新：

其中，

代表交叉熵损失函数，C和c分别代表故障类别总数和编号，/>

和/>

分别为故障分类神经网络的权重矩阵和偏置向量的集合，/>

值得注意的是，基于表示学习的迁移学习方法能够实现模型参数的共享，提升模型的训练效率。考虑到故障样本很难在实际工业设备中获得，为此，本发明仅采用少量的故障样本(10％)进行训练。

其它步骤及参数与具体实施方式一至四之一相同。

具体实施方式六：本实施方式与具体实施方式一至五之一不同的是，所述步骤6中训练故障分类神经网络：

具体过程为：

将步骤1中故障数据的10％进行步骤2的特征提取，提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中，获得训练好的故障分类神经网络，构建输入的故障数据和故障标签之间的映射关系；

对于第5步中搭建的故障分类神经网络，仅仅采用少量的故障样本(10％)进行训练，构建输入的故障数据和故障标签之间的映射关系。

整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行，故障检测神经网络的优化算法为Adam优化算法，损失函数为公式(26)所示的交叉熵损失函数，网络的批量训练尺寸为256个样本，学习速率为0.001。

其它步骤及参数与具体实施方式一至五之一相同。

具体实施方式七：本实施方式与具体实施方式一至六之一不同的是，所述步骤7中在线故障检测与故障分类；具体过程为：

步骤71、提取轴承在线振动数据(按照步骤1的过程)；

步骤72、从时域、频域2个角度提取轴承在线振动数据的特征(按照步骤2的过程)；

步骤73、将提取的轴承在线振动数据的特征输入到步骤4训练好的故障检测神经网络，便可以实现在线故障检测，如果未检测到发生故障，继续执行步骤71；如果检测到发生故障，执行步骤74；

步骤74、将故障对应的振动数据的特征输入到步骤6获得训练好的故障分类神经网络，实现在线故障分类。

其它步骤及参数与具体实施方式一至六之一相同。

采用以下实施例验证本发明的有益效果：

实施例一：

本发明采用了美国凯斯西储大学凯斯工程学院提供的实际滚动轴承振动数据验证本发明所提出的基于表示学习的轴承故障检测和分类的一体化方法。轴承实验台由电动机、电磁负载、联轴器以及基座组成。实验过程中采用加速度传感器采集轴承的振动数据，并详细记录了电动机的实际测试条件以及轴承故障类型。实验装置中的轴承是型号为6205-2RS JEM和6203-2RS JEM的深沟球滚动体轴承。值得一提的是，轴承采用电火花加工(EDM)的方式设置故障。根据位置的不同可以划分为：内圈故障、滚动体故障、Centered外圈故障、Orthogonal外圈故障以及Opposite外圈故障。本发明采用轴承在健康状态4种电机负载条件下工作产生的数据，以及4种电机负载条件在12k驱动端所施加的直径为0.007英寸的故障数据为案例来验证本发明所提出的方法，其具体步骤如下：

第1步：提取轴承的振动数据。由于轴承在健康状态下工作产生的数据有两个测量通道，因此能够获得轴承在两个方向上的振动信号。轴承实验台在轴承处于健康状态时产生了大量的数据，健康状态下的采样频率为12000HZ，将512个采样点设置为单个样本。在此基础上，每一种工况可以获得829个样本。因此，在健康状态下的4种负载条件下一共可以获得3316个健康样本。另一方面，对于每一种类型的故障，在4种电机负载条件下一共可以获得950个样本。

第2步：特征提取。为了更好地反映轴承工作过程中的健康状态，考虑从时域和频域这两个角度，提取轴承在工作阶段中所产生振动数据的特征，由此作为神经网络的输入。对于轴承在横向和纵向两个方向上产生的振动信号，经过特征处理对于每一个方向可以获得轴承工作过程中在时域和频域上共计14维特征。因此，通过横向和纵向两个方向一共可以获得28维特征。总结而言，通过对轴承健康状态下的振动数据经过特征处理可以获得维数为3316*28的特征矩阵。

第3步：搭建故障检测神经网络。为了减少噪声信号对于样本重构的影响，并为不同的瓶颈层神经元分配不同的权重，本发明搭建基于MDAE-SAMB的轴承故障检测网络。

第4步，训练故障检测神经网络。将步骤2中经过特征处理的健康数据输入到步骤3中搭建的故障检测神经网络中，构建输入的健康数据之间的耦合关系。其中，整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行，故障检测神经网络的优化算法为Adam优化算法，损失函数为公式(21)中的平方误差损失函数，网络的批量训练尺寸为256个样本，学习速率为0.001。为了确定最佳的网络超参数，本发明针对MDAE-SAMB中隐含层的层数以及瓶颈层神经元的个数对于网络重构误差的影响设计对比实验。考虑到输入样本的特征维数为28，因此瓶颈层神经元的个数应当小于输入特征维数28。通过输入向量x_f和

之间的重构均方根误差RMSE评估网络的性能。对比结果如表格1所示。从表格1可以看出，RMSE始终位于10^-4这一数量级，由此可知本发明提出的MDAE-SAMB网络有着很好的重构效果。当瓶颈层神经元数目为24、隐含层的数目为3时，网络的重构效果最好。

表1神经网络的超参数配置

第5步，搭建故障分类神经网络。将轴承的健康数据作为源域，将在线的工作数据作为目的域。将第4步通过离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分，换句话说，将编码器、噪声引入和自注意力机制层等部分作为预训练模型实现模型迁移。最后通过全连接层模块实现向故障标签的映射。

第6步，训练故障检测神经网络。对于第5步中搭建的故障分类神经网络，仅仅采用少量的故障样本(10％)进行训练，也就是95个样本进行训练，构建输入的故障数据和故障标签之间的映射关系。其中，整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行，故障检测神经网络的优化算法为Adam优化算法，损失函数为交叉熵损失函数，网络的批量训练尺寸为256个样本，学习速率为0.001。

第7步，在线故障检测与故障分类。对于在线阶段，通过第1步提取的轴承在线振动数据经过第2步特征提取后输入到第4步训练好的故障检测网络中，便可以实现在线故障检测。如果检测到发生故障，则再将特征输入到第5步训练好的故障分类网络中，便可以实现在线故障分类。图4a、4b、4c、4d、4e和图5分别展示了在线故障检测与故障分类的结果图。从图4a、4b、4c、4d、4e中可以看出，对于每一种故障，根据公式(22)计算获得的样本重构残差均位于由公式(23)计算获得的阈值以上，由此可知本发明所提出的MDAE-SAMB在无监督条件下对于轴承有着很好的故障检测效果。图5为故障分类结果的混淆矩阵，可以看出在仅仅采用少量的故障样本(10％)进行训练的条件下，本发明所提出的基于迁移学习的对瓶颈层神经元的自注意力机制修正去噪自编码器的神经网络对于每一种故障的分类准确率能够达到95％以上。

第8步，评估神经网络的故障检测与分类的效果。采用准确率(Accuracy)指标评估提出的基于表示学习的轴承故障检测和分类的一体化方法对于轴承在线工作过程中故障的检测和分类效果。其中，故障检测的准确率结果如表格2所示；故障分类的准确率结果如表格3所示。

表2故障检测的准确率结果

表3故障分类的准确率结果

本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，本领域技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。