CN114152442B

CN114152442B - 基于迁移卷积神经网络的滚动轴承跨工况故障检测方法

Info

Publication number: CN114152442B
Application number: CN202111599703.7A
Authority: CN
Inventors: 余士成; 林鹏; 韦吉祥; 曹九稳
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2021-12-24
Filing date: 2021-12-24
Publication date: 2024-05-24
Anticipated expiration: 2041-12-24
Also published as: CN114152442A

Abstract

本发明公开了一种基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。本发明首先利用滑动窗口技术进行数据切割，并对每个窗口的振动信号进行归一化处理。其次，搭建一维卷积神经网络模型与迁移卷积神经网络模型，一维卷积神经网络简单方便，训练参数少，能够满足故障检测领域实时性的需求；在源域训练数据训练一维卷积神经网络模型的基础上，使用MMD微调卷积网络特征提取模块，构造微调迁移卷积神经网络使得迁移卷积神经网络提取的特征具有域不变性，进而进行目标域数据的故障检测。本发明所使用的迁移卷积神经网络结构简单，训练速度快，且具有较高的跨工况准确率，为滚动轴承跨工况故障检测提供了一种新方法。

Description

基于迁移卷积神经网络的滚动轴承跨工况故障检测方法

技术领域

本发明涉及滚动轴承故障检测方法，具体涉及基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。

背景技术

滚动轴承作为旋转机械的核心部分，长时间暴露在恶劣的工作环境下，持续受到外界的冲击和干扰，极易在不同的位置出现不同程度的损伤。滚动轴承一旦出现损伤，随着时间的推移，就会出现一系列的连锁反应，轻则导致机械设备生产偏离指定指标，影响产品的质量，重则导致设备损坏，造成重大的经济损失，甚至严重的人员伤亡。因此，对旋转机械及其关键部件进行状态监测和故障诊断，对保障设备健康稳定运行、提升运转效率和避免重大事故发生具有重要的意义。

然而，在现实环境中，常常由于工作的需求，导致机械设备需要在不同的转速或负载工况条件下运行，也就导致了实际所采集的数据与历史数据概率分布不一致情况。当存在上述问题时，基于设备的历史故障数据建立而得的诊断模型就会出现预测准确率低的现象，这是因为该模型自动提取的特征并不具有域不变性，当出现未知的目标域振动信号样本时，该模型不能够预测出其所属类型。因此，在实际诊断任务中，一个关键的难题是如何对不同时期的数据进行有效挖掘和关联，实现知识的迁移和复用，从而提高模型的分类和泛化能力。

发明内容

针对上述问题，本发明的目的是提出一种基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。其可以在工况和转速发生改变时，仍旧获得较为理想的故障检测结果，而且大大减少了诊断时间。

本发明技术方案所需步骤如下：

基于迁移卷积神经网络的滚动轴承跨工况故障检测方法，其特征在于包含如下步骤：

步骤1、数据预处理；收集已有工况S下的滚动轴承原始振动信号，构建源域振动信号数据集；收集目标工况T下的滚动轴承原始振动信号，构建目标域振动信号数据集；利用滑动窗口技术对每一组原始振动信号进行分割，并对每个窗口的振动信号进行归一化处理，构建源域样本数据集和目标域样本数据集；

步骤2、模型搭建；构建一维卷积神经网络模型M和迁移卷积神经网络模型I；

步骤3、模型训练；训练一维卷积神经网络模型M和迁移卷积神经网络模型I；

步骤4、滚动轴承状态识别；

将步骤1处理后的滚动轴承目标域数据集输入到训练好的迁移卷积神经网络模型I中，预测数据集中滚动轴承的状态信息，验证模型表现；

步骤5、滚动轴承实时监测；

利用滑动窗口技术，对滚动轴承振动信号进行截取，并依次送入训练好的迁移卷积神经网络模型I；可根据迁移卷积神经网络模型I的输出值获取滚动轴承对应的状态信息。

具体的步骤1数据预处理实现如下：

1-1.数据截取：为了构建训练迁移卷积神经网络模型I所需要的数据集，需要使用滑动窗口方法对不同工况下的滚动轴承原始振动信号进行截取，构建源域数据集与目标域数据集。

所述的已有工况S下的滚动轴承原始振动信号，按照故障位置和故障程度分类为w个类型，每种故障类型下的原始振动信号为

所述的目标工况T下的滚动轴承原始振动信号，按照故障位置和故障程度分为w个类型，每种故障类型下的原始振动信号为

1-2.设定滑动窗口长度为L，滑动步长为S，生成样本数为t；样本d_i＝{x₀，…x_L},i＝1,2,3,…,t；得到源域样本数据集D^S＝{d₁,d₂,d₃...,d_t}和目标域样本数据集D^T＝{d₁,d₂,d₃,...,d_t}；

1-3.样本归一化：为了加快迁移卷积神经网络模型I的训练过程，需要对截取后的滚动轴承原始振动信号样本进行归一化处理。对源域样本数据集和目标域样本数据集的样本进行归一化处理，处理方法为zero-mean方法；

1-4.源域样本数据集与目标域样本数据集切分：将源域样本数据集D^S切分为和将目标域样本数据集D^T切分为/>和/>

步骤2、模型搭建

2-1.构建一维卷积神经网络模型M：

构建的一维卷积神经网络模型M的结构为输入层-卷积层-池化层-卷积层-池化层-卷积层-池化层-全连接层-全连接层-输出层；将输入一维卷积神经网络模型M进行训练，得到网络参数；

2-2.构建迁移卷积神经网络模型I：

构建的迁移卷积神经网络模型I的结构与一维卷积神经网络模型M相同；将训练好的一维卷积神经网络模型M的参数迁移至迁移卷积神经网络模型I；将源域样本数据集和目标域样本数据集/>输入迁移卷积神经网络模型I，冻结特征提取层，进行微调；

2-3.将目标域样本数据集输入迁移卷积神经网络模型I，验证模型表现。

步骤3、模型训练

3-1、训练一维卷积神经网络模型M：

将输入一维卷积神经网络模型M进行训练，得到网络参数；训练过程包括前向传播和误差反向传播。

3-2、训练迁移卷积神经网络模型I：

将训练好的一维卷积神经网络模型M参数迁移至迁移卷积神经网络模型I；将源域样本数据集和目标域样本数据集/>输入迁移卷积神经网络模型I进行训练，计算/>的分类误差；同时计算数据集/>和/>经过特征提取层之后的最大平均差异，进行微调；

步骤4、分类识别

4-1、滚动轴承状态识别：将步骤1处理后的滚动轴承目标域数据集输入到训练好的迁移卷积神经网络模型I中，预测数据集中滚动轴承的状态信息，验证模型表现。

步骤5、滚动轴承实时监测

利用滑动窗口技术，对滚动轴承振动信号进行截取，并依次送入训练好的迁移卷积神经网络模型I。可根据迁移卷积神经网络模型I的输出值获取滚动轴承对应的状态信息。

进一步的，步骤1所述的预处理方式是一种有效的深度学习数据集增强方法方法。采用滑动窗口截取滚动轴承原始振动信号能够扩大模型训练数据集的容量。

进一步的，步骤1所述的归一化处理方法为zero-mean方法，该方法是一种有效的加快神经网络训练过程的方法。

进一步的，步骤3所述的模型训练过程包括前向传播和误差反向传播两个过程。

前向传播过程如下：

①卷积层操作:公式表达为：其中，y^l(i,j)表示第l层的第i个卷积核与第j个输入的卷积输出值；/>表示第l层的第i个卷积核的权值向量；表示第l层中第j个被卷积区域；/>为第l层的第i个卷积核的第j′个权值，x^l(j+j′)为第l层中第j个至第j′个被卷积区域，W为卷积核宽度；

②激活层操作:公式表达为：a^l(i,j)＝σ(y^l(i,j))，其中，σ(·)是非线性激活函数，a^l ^(i,j)是卷积层输出y^l(i,j)的激活值。

③池化层操作:公式表达为：p^l(i,j)＝down(a^l(i,j))，式中down(·)表示下采样函数，p^l(i,j)是激活层输出a^l(i,j)的降采样值。

④全连接层:公式表达为：式中z^l+1(j)是第l+1层第j个神经元的logits值；/>是第l层第i个神经元与第l+1层第j个神经元之间的权值；a^l(i)是第l层第i个神经元的激活值；/>是第l层所有神经元对第l+1层第j个神经元的偏置值。

⑤目标函数:采用交叉熵损失函数，其公式表达分别为：

其中为第k个样本经过卷积神经网络Softmax层第j个类别的实际输出值，/>为第k个样本的真实目标分布，即当目标类别为j时，/>否则/>m为输入的小批量的大小。

误差反向传播过程如下：

①全连接层的梯度计算:首先计算目标函数L关于z^l+1(j)的导数，其公式表达式为：然后计算目标函数关于权值/>与偏置/>的导数，其公式表达式为：

②池化层的梯度计算：池化层没有权值，所以只需要计算目标函数L关于池化层输入神经元的导数。具体公式描述为：

③卷积层的梯度计算：首先需要计算目标函数L关于卷积层输出值的导数，其公式表达为：然后计算目标函数L关于卷积核的导数，其公式表达为：

进一步的，步骤3所述的最大平均差异是一种核学习方法，可用来度量两个分布在再生希尔伯特空间的距离。具体公式描述为：

其中，|X_S|表示源域数据集个数，|X_T|表示目标域数据集个数；x_s表示源域样本，x_t表示目标域样本；φ(·)表示映射函数。

本发明与现有技术相比，具有如下优点和有益效果：

1、本发明采用了深度学习的方法用于故障检测。相比于传统方法，基于深度学习的方法学习能力强，能够深层次挖掘出数据潜在的信息，具有更强的表征能力。基于深度学习的方法在面临海量的数据时，表现更加优异。

2、本发明使用了一维卷积神经网络方法。现有的大部分基于卷积神经网络方法的异常检测算法多是使用二维卷积神经网络。由于滚动轴承原始振动信号是一维信号，从而避免了转换操作带来的耗时，同时一维卷积神经网络相比于二维卷积神经网络参数更少，降低了系统的复杂度，更容易操作。

3、本发明使用了迁移学习方法，能够有效的解决滚动轴承因转速与负载发生变化而引起的训练集与测试集概率分布不一致的情况。使用迁移学习的方法一方面能够利用基于历史数据学习到的故障特征，另一方面大大减少了时间，避免了重新训练一个神经网络模型，有利于轴承状态的实时监测。

本发明测试了凯斯西储大学滚动轴承数据集，具有较强的跨工况故障检测能力。基于迁移卷积神经网络的故障诊断方法能够有效地解决源域数据集与目标域数据集分布不一致带来的模型表现退化问题。本发明一共测试了12个迁移故障诊断实验，经典的一维卷积神经网络方法在12个实验上的平均准确率为85％。相比之下，基于迁移卷积神经网络方法的平均准确率由85％提升至95％。

附图说明

图1是本发明实施例中滚动轴承跨工况故障检测方法的流程图。

图2是本发明实施例中一维卷积神经网络模型M结构示意图。

图3是本发明实施例中卷积神经网络具体参数配置。

图4是本发明实施例中神经网络全连接层的参数设置。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图和实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本实施例是一种基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。采集不同工况下的滚动轴承原始振动信号，并做预处理。根据轴承故障位置和故障程度，构建包含多种故障状态和正常状态的滚动轴承源域数据集和目标域数据集。将源域数据集分为两个部分，其中一部分将作为一维卷积神经网络模型M的输入，由卷积神经网络自动学习具有可分性的故障特征。然后使用迁移学习方法，将其参数迁移至迁移卷积神经网络模型I，并利用源域数据集的另一半与目标域数据集的一半进行微调，获得最终的迁移卷积神经网络模型I，实现滚动轴承跨工况故障检测。

如图1所示，为本发明实施例的滚动轴承跨工况故障检测方法的流程图，包括如下步骤：

步骤1、数据预处理

1-1、数据截取：为了构建训练一维卷积神经网络模型M所需要的数据集，需要使用滑动窗口技术对滚动轴承原始振动信号进行截取，设置滑动窗口窗长为包含1200个采样点，窗口步长设置为300个采样点。

1-2、归一化处理：为了加快模型训练过程，对截取后的滚动轴承信号样本进行归一化处理，所采用的方法是zero-mean normalization方法。其计算方法如下：

其中,x是滚动轴承信号样本，μ是样本数据的均值，σ是样本数据的标准差。

步骤2、模型搭建

2-1、构建卷积神经网络模型：卷积神经网络是一种特殊的前向传播神经网络，是仿造动物的视知觉机制构建而成的。如图2所示，卷积神经网络通常包括卷积层、池化层和全连接层。它们共同完成特征学习与分类的任务。在本实施例中，因为输入信号为一维信号，所以所使用的卷积神经网络为一维卷积神经网络模型M。

针对滚动轴承故障检测，卷积神经网络的输入为滚动轴承振动信号样本数据X。若第i层是卷积层，则其输出可以表示为a_i＝σ(a_i-1*W_i+b_i)；其中a_i-1是第i-1层卷积神经网络输出值，W_i是第i层的权值向量，*为一维卷积操作，b_i为第i层的偏置向量，σ(·)为激活函数。在本实施例中，激活函数设置为ReLU，其公式表达为：f(x)＝max(0,x)；若第i层是池化层，则其输出为：p^l(i,j)＝down(a^l(i,j))，其中down(·)表示下采样函数函数。在本实施例中，下采样函数设置为最大值采样，其公式表达为：

为了将所有提取的特征进行整合，将池化后的特征传输，作为全连接层的输入。最终输出C个元素向量，其中C是类别的数量。在此实施例中，类别数量设置为10。此外，在最终采用Softmax分类器来计算每个类的预测概率,其公式表达为：

上式中输出的q^j值是从0到1的正数，表示为目标类别的预测概率。

在本发明实施例中，构建的卷积神经网络包括3个卷积层和3个池化层以及3个全连接层，如图3所示，为实施例中卷积神经网络的具体参数设置，如图4所示，为实施例中全连接层的具体参数设置。

步骤3、模型训练

3-1、训练卷积神经网络：完成网络的搭建任务之后，便可以采用有监督学习的方式进行网络训练。该步骤的目的是能够让模型以极小的误差拟合滚动轴承数据，得到最优的网络参数，接着便可以利用优化完成后的模型进行迁移学习，并得到最终的迁移卷积神经网络模型I。

卷积神经网络的训练包括前向训练和反向优化两个步骤。前向训练的过程如下：

①卷积层操作:公式表达为：其中，/>为第l层的第i个卷积核的第j′个权值，x^l(j+j′)为第l层中第j个被卷积的局部区域，W为卷积核宽度；

⑤目标函数:采用交叉熵损失函数，其公式表达分别为：其中/>为第k个样本经过卷积神经网络Softmax层第j个类别的实际输出值，/>为第k个样本的真实目标分布，即当目标类别为j时，/>否则/>m为输入的小批量的大小。在本实施例中，选取交叉熵损失函数作为目标函数，其主要用于衡量两个概率分布的差异性。

反向优化是采用有监督的学习方式进行调优，通过调优之后使得卷积神经网络模型中的每一层隐层的网络权重和偏置都能够达到最优值。反向优化具体的计算过程如下：

①全连接层的梯度计算:首先计算目标函数L关于z^l+1(j)的导数，其公式表达式为：然后计算目标函数关于权值/>与偏置/>的导数，其公式表达式为：最后，计算目标函数L关于激活函数为ReLU的全连接隐藏层的激活值a^l(i)以及logits值z^l(j)的导数：

②池化层的梯度计算：池化层没有权值，所以只需要计算目标函数L关于池化层输入神经元的导数。对于最大值池化具体做法是：在

正向传播时记录下池化区域的最大值位置t_m,设当t＝t_m时，

在反向传播过程中，将导数值传递给第t_m个神经元，其他神经元不参与传递，即导数为0。具体公式描述为：

③卷积层的梯度计算：首先需要计算目标函数L关于卷积层输出值的导数，由于卷积层使用的激活函数是ReLU,其公式表达为：

然后计算目标函数L关于卷积核的导数，其公式表达为：

本发明实施例中所采用的反向传播算法为Adam(adaptive moments)算法。设θ为模型中可训练参数，如权重和偏置，那么Adam算法更新流程为：

①计算梯度：

②更新有偏一阶矩估计：m_t←β₁·m_t-1+(1-β₁)·g_t

③更新有偏二阶矩估计：

④修正一阶矩偏差：

⑤修正二阶矩偏差：

⑥更新参数：

其中，β₁和β₂为矩阵计指数衰减率，默认值分别为0.9和0.999，数值稳定常数ε＝10^-8，m,ν和t分别为一阶矩、二阶矩和训练次数，并且都初始化为0。在训练过程中，超参数(如学习率、小批量大小、训练次数)对训练效果都有一定的影响，需要反复试验来调整它们以达到最佳的实验效果。

3-2、训练迁移卷积神经网络模型I：为了完成滚动轴承跨工况故障检测，需要对迁移卷积神经网络模型I进行微调，微调过程是一种半监督学习方法，使用带标签源域数据集与不带标签目标域数据集/>作为模型的输入，对迁移卷积神经网络模型I进行训练。使用迁移卷积神经网络模型I的特征提取层对源域数据集/>与目标域数据集/>进行特征提取，并计算提取后特征的最大平均差异，然后将源域数据集/>的抽象特征作为全连接层的输入，计算带标签源域数据集/>的分类误差。最后执行反向优化过程，逐步最小化分类误差与最大平均差异。

步骤4、分类识别

4-1、分类识别：在完成迁移卷积神经网络模型I微调之后，需要使用目标域数据集验证模型的泛化能力，输出目标域各个故障类型的故障概率分布，其最大概率对应故障类别作为诊断结果。

步骤5、滚动轴承状态实时监测

5-1、检测流程：

经过步骤4验证之后的模型具有较强的预测能力，能够正确分类滚动轴承状态，因此可以使用该模型进行状态检测，具体做法为：利用滑动窗口技术，连续地将滚动轴承振动信号进行切割，并送入迁移卷积神经网络模型I，通过观察网络的输出值，得到最终的轴承状态。

通过实施例的实验结果可以看出，本发明能够有效实时地检测轴承状态信息，为提前采用防护措施提供了重要参考依据。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.基于迁移卷积神经网络的滚动轴承跨工况故障检测方法，其特征在于包含如下步骤：

步骤4、滚动轴承状态识别；

步骤5、滚动轴承实时监测；

利用滑动窗口技术，对滚动轴承振动信号进行截取，并依次送入训练好的迁移卷积神经网络模型I；可根据迁移卷积神经网络模型I的输出值获取滚动轴承对应的状态信息；

步骤1中原始振动信号进行分割实现如下：

设定滑动窗口长度为L，滑动步长为S，生成样本数为t；样本d_i＝{x₀，…，x_L},i＝1,2,3,…,t；得到源域样本数据集D^S＝{d₁,d₂,d₃...,d_t}和目标域样本数据集D^T＝{d₁,d₂,d₃,...,d_t}；然后对源域样本数据集与目标域样本数据集切分：将源域样本数据集D^S切分为和/>将目标域样本数据集D^T切分为/>和/>

步骤2具体实现如下：

2-1.构建一维卷积神经网络模型M：

构建的一维卷积神经网络模型M的结构为输入层-卷积层-池化层-卷积层-池化层-卷积层-池化层-全连接层-全连接层-输出层；将D_a ^S输入一维卷积神经网络模型M进行训练，得到网络参数；

2-2.构建迁移卷积神经网络模型I：

2.根据权利要求1所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法，其特征在于步骤1所述的已有工况S下的滚动轴承原始振动信号，按照故障位置和故障程度分类为w个类型，每种故障类型下的原始振动信号为步骤1所述的目标工况T下的滚动轴承原始振动信号，按照故障位置和故障程度分为w个类型，每种故障类型下的原始振动信号为/>

3.根据权利要求1所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法，其特征在于所述一维卷积神经网络模型M训练方法包括前向传播和反向传播两个过程。

4.根据权利要求3所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法，其特征在于所述的迁移卷积神经网络模型I微调属于半监督学习方法，将源域样本数据集和目标域样本数据集/>输入迁移卷积神经网络模型I，计算源域样本数据集/>的分类误差，同时计算源域样本数据集/>和目标域样本数据集/>经过特征提取后的最大平均差异。

5.根据权利要求4所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法，其特征在于所采用的最大平均差异可用来度量两个分布在再生希尔伯特空间的距离，其公式为：

6.根据权利要求4所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法，其特征在于滚动轴承故障实时监测实现如下：

将滚动轴承振动信号样本数据X输入迁移卷积神经网络模型I，若第i层是卷积层，则其输出表示为a_i＝σ(a_i-1*W_i+b_i)；其中a_i-1是第i-1层迁移卷积神经网络模型I的输出值，W_i是第i层的权值向量，*为一维卷积操作，b_i为第i层的偏置向量，σ(·)为激活函数；若第i层是池化层，则其输出为：p^l(i,j)＝down(a^l(i,j))，其中down(·)表示下采样函数函数；p^l(i,j)是输出a^l(i,j)的降采样值；下采样函数设置为最大值采样，其公式表达为：

为了将所有提取的特征进行整合，将池化后的特征作为全连接层的输入；最终输出C个元素向量，其中C是类别的数量；最终采用Softmax分类器来计算每个类的预测概率；其公式表达为：

上式中输出的q^j值是从0到1的正数，表示为目标类别的预测概率；式中z^l+1(j)是第l+1层第j个神经元的logits值，其中q^j为经过卷积神经网络Softmax层第j个类别的实际输出值。