CN115046765A - 基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法 - Google Patents
基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法 Download PDFInfo
- Publication number
- CN115046765A CN115046765A CN202210633772.3A CN202210633772A CN115046765A CN 115046765 A CN115046765 A CN 115046765A CN 202210633772 A CN202210633772 A CN 202210633772A CN 115046765 A CN115046765 A CN 115046765A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- gated
- neural network
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
Landscapes
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明提供一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法,属于机电设备的状态监测与故障诊断技术领域,用于解决现有方法在数据不平衡程度较大情况下诊断精度低的问题。包括S1:数据的采集和预处理;S2:搭建门控卷积神经网络模型;S3:初始化模型;S4:模型训练;S5:模型的测试与评估。本发明的技术要点包括:引入了门控卷积层以提高模型的特征提取能力,并使用批量归一化技术提升其泛化能力;利用了标签分布感知边界损失函数提高模型对少数类的敏感度,减小数据不平衡对模型的影响。本发明可在数据不平衡程度大的情况下达到很高的诊断准确率且具有很强的鲁棒性,提高了模型处理不平衡数据的性能。
Description
技术领域
本发明属于机电设备的状态监测与故障诊断技术领域,尤其涉及一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法。
背景技术
滚动轴承是旋转机械的关键部件,在恶劣的工作环境下极易出现故障。因此,有必要对滚动轴承开展故障诊断工作。如今,机械健康监测领域进入了“大数据”时代,同时也对传统的故障诊断方法带来了新的挑战,传统智能诊断已经无法满足现代工业的需求。随着科技的不断发展,基于深度学习的故障诊断已经取得了丰硕成果。然而,这些方法所取得的良好效果都是建立在平衡数据集的基础之上的,没有考虑数据不平衡对模型的影响。在实际情况中,机械设备长期处于正常运行状态,使得故障状态的数据非常少,导致正常数据与故障数据之间的不平衡,这将对模型性能产生严重的影响。
目前,现有的解决数据不平衡问题的方法主要分为两类,分别为基于数据扩充的方法和基于样本重加权的方法。基于数据扩充的方法是通过扩充训练样本的方式减小数据不平衡程度,从而将不平衡问题转换为平衡问题。通常使用数据过采样或基于生成对抗网络(Generative Adversarial Network,GAN)等模型的方法来提高样本量。虽然基于数据扩充的方法缓解了数据不平衡的影响,但并没有增加样本的信息,容易导致模型的过拟合,并且GAN生成样本的真实性存在质疑,也增加了模型的计算量。相比之下,基于样本重加权的方法主要通过对各类别重新加权来提高少数类的权重,使模型对少数类样本更加敏感。常使用成本敏感学习等方法。然而,这些方法的复杂度较高且计算量大,在参数的选择方面存在很大的难度,需要针对具体的数据进行处理,泛化能力较差。
综上所述,现有的方法存在较多的局限性,均不能有效解决数据不平衡问题。因此,如何提高滚动轴承故障诊断模型处理不平衡数据的性能仍是当前亟待解决的问题。
发明内容
本发明目的在于提供一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法,以解决现有的方法均不能有效处理不平衡数据的技术问题。本发明处理数据不平衡问题的核心在于增强模型的学习能力,使其在少数类样本中挖掘更多的信息,从而提高模型对少数类的敏感度。
为实现上述目的,本发明的一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法的原理如下:
卷积神经网络(Convolutional Neural Network,CNN)具有强大的特征提取能力,但在面临数据不平衡问题时,少数类的信息会提取不充分或过度提取,影响模型对少数类的识别精度。Dauphin等人将门控机制引入了CNN中,提出了门控卷积网络(GatedConvolutional Neural Network,GCNN),提高了网络对特征的利用。通过门控卷积层,网络可以控制各层之间的信息流动,使得干扰信息被过滤,提升了模型的专注度。因此,本发明引入了门控卷积层,并使用批量归一化技术对其进行了改进,以提高模型的特征提取和泛化能力。
标签分布感知边界(Label-Distribution-Aware Margin,LDAM)损失是由Cao等人提出的一种新的依赖于数据和标签的正则化方法。其核心思想是给与少数类更大的分类边界,提高模型对少数类的敏感度。该方法简单且易于实现,其参数取决于各类别样本的数目,降低了参数选取的难度,提高了模型在不平衡数据集中的分类性能。
综上所述,本发明提供了一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法,通过门控卷积层提高模型的特征提取能力,使用批量归一化技术提高其泛化能力;引入标签分布感知边界损失函数消除不平衡数据的影响,以提高模型处理不平衡数据的性能。
为解决数据不平衡对模型故障诊断能力的影响,本发明提供了一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法,包括以下步骤,且以下步骤顺次进行:
步骤S1:数据的采集和预处理,使用传感器和数据采集仪采集滚动轴承在不同健康状态下的振动信号并对各类信号设置相应的标签。通过滑动窗口的方式截取信号以获取样本并构造数据集。
步骤S2:搭建门控卷积神经网络模型,门控卷积神经网络模型采用“端到端”处理方式,轴承信号可直接输入到网络模型中。引入门控卷积层以提高模型的特征提取能力,并使用批量归一化技术提升其泛化能力;
步骤S3:初始化模型,设置模型的迭代次数,优化器和学习率。引入标签分布感知边界损失函数以提高模型处理不平衡数据的性能。
步骤S4:模型训练,将训练集输入模型进行训练,当达到最大迭代次数后训练停止,模型训练完毕。
步骤S5:模型的测试与评估,将测试集输入训练好的模型中进行测试,模型输出识别结果实现对当前数据的故障诊断。
进一步的,所述步骤S1中通过滑动窗口的方式截取信号以获取样本数量用公式(1)表示:
式中:N为信号的长度,n代表窗口长度,s为滑动步长。
进一步的,所述步骤S2中的门控卷积神经网络模型由特征提取器和分类器两部分构成;
特征提取器由4个门控卷积层和2个池化层交替组成,门控卷积层实现特征的提取,池化层的类型为最大池化层,实现特征的降维,本发明采用的门控卷积层由三部分组成,分别为卷积层,批量归一化层和门控线性单元,模型输入为一维序列,因此采用一维卷积层对特征进行提取;批量归一化层可以重新调整输入数据的分布;门控线性单元能够控制各层之间的信息流动,使得干扰信息被过滤,数据输入门控卷积层之后的得到的结果用公式(2)表示:
分类器由3层全连接层和softmax分类层组成,并加入了Dropout层以抑制过拟合问题的产生,最终通过softmax分类层输出轴承各类健康状况的概率分布来获取模型的诊断结果。
进一步的,所述步骤S3将迭代次数设置为100次,批量大小为64,选取Adam优化器对模型参数进行优化,初始学习率为0.001,学习率在训练过程中动态调整;标签分布感知边界(Label-Distribution-Aware Margin,LDAM)损失函数能够给予少数类更大的分类边界,使其实际边界向多数类偏移,提高模型对少数类的敏感度,从而缓解数据不平衡对模型的影响。因此引入标签分布感知边界损失函数以缓解数据不平衡对模型的影响,其计算结果用公式(3)表示:
式中,nj是对应类别j的数目,C为超参数,与数据集中各类别的数量有关。
本发明的一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法具有以下优点:
(1)针对数据不平衡问题设计了模型,使得模型能够解决数据不平衡的问题。
(2)利用批量归一化技术改进了原始的门控卷积层,提高了模型的特征提取能力和泛化能力,能够充分挖掘不平衡数据的信息。
(3)采用“端到端”的方式,不需要对数据做额外的处理,采集的数据可以直接输入。
(4)采用标签分布感知边界损失函数提高了模型对少数类数据的敏感度,相比其他方法具有计算简单,参数容易确定的优势。
(5)对于严重不平衡的数据集,本发明仍然能达到很高的准确率,并且具有很强的鲁棒性。
附图说明
图1为本发明的一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法的整体流程图。
图2为本发明的一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法搭建的改进门控卷积神经网络的结构图。
图3为本发明的一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法采用模型中的改进的门控卷积层的结构图。
图4为本发明的一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法及对比方法经过不同不平衡的训练集训练后,在测试集上的诊断结果对比图。
具体实施方式
为了更好地了解本发明的目的、结构及功能,下面结合附图,对本发明一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法做进一步详细的描述。
实施例1:
如图1所示,本发明提供的基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法,该诊断方法具体包含以下步骤,且以下步骤顺次进行:
步骤S1:使用传感器和数据采集仪等设备采集滚动轴承在不同健康状态下的振动信号并对各类信号设置相应的标签。通过滑动窗口的方式截取信号以获取样本。其中,滑动窗口截取信号获得的样本数量为:
式中:N为信号的长度,n代表窗口长度,s为滑动步长。
为了验证本发明在数据不平衡故障诊断中的有效性,采用具体实例对本发明的性能进行验证。实例中采用的数据为电动机轴承故障数据集。采集数据后,将所得的数据样本构造成训练集和测试集。其中,采集数据中包含正常状态和9种故障状态,共10种健康状态,分别对各个健康状态设置相应的标签。根据实际环境中正常样本多,故障样本少且各类故障发生的几率基本一致的情况设计了不平衡率R。不平衡率为正常样本数量和故障样本数量之比。实验中分别设置了4组不同程度的不平衡率,各数据集的样本数量如表1所示。
表1.滚动轴承实例数据集信息
步骤S2:搭建基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法。门控卷积神经网络模型模型采用“端到端”处理方式,轴承信号直接输入到IGCNN模型中,不需要额外的处理。引入门控卷积层以提高模型的特征提取能力,并使用批量归一化技术提升其泛化能力。IGCNN模型的主体由特征提取器和分类器两部分构成,其结构如图2所示。
特征提取器由4个改进的门控卷积层和2个池化层交替组成。改进门控卷积层实现特征的提取,池化层的类型为最大池化层,实现特征的降维。其中,本发明所采用的门控卷积层由三部分组成,分别为卷积层,批量归一化(Batch Normalization,BN)层和门控线性单元(Gate Linear Unit,GLU),其结构如图3所示。模型输入为一维序列,因此采用一维卷积层对特征进行提取;BN层可以重新调整输入数据的分布,通过归一化的方式将数据的分布调整为标准正态分布,降低了各批次之间的协方差和分布差异,提高了模型的收敛速度,缓解了过拟合现象,从而提高了模型的鲁棒性和泛化能力;GLU能够控制各层之间的信息流动,使得干扰信息被过滤,提高了模型对特征的利用,实现了非线性变换并有效避免了梯度消失。数据输入改进的门控卷积层之后的得到的结果为:
分类器由3层全连接层和softmax分类层组成。此外,由于一维特征向量和首层全连接层的神经元较多,对于少数类样本易产生冗余参数,造成过拟合问题。因此在两者之后分别加入了Dropout层,以抑制过拟合的产生。最终通过softmax分类层输出轴承各类健康状况的概率分布来获取模型的诊断结果。
步骤S3:设置模型的超参数。本发明将迭代次数设置为100次,批量大小为64,选取Adam优化器对模型参数进行优化,初始学习率为0.001,学习率在训练过程中动态调整。引入LDAM损失作为模型的损失函数,以缓解数据不平衡对模型的影响,其计算公式为:
式中,nj是对应类别j的数目,C为超参数,与数据集中各类别的数量有关。
步骤S4:将准备好的训练集输入模型进行训练,当达到最大迭代次数后训练停止,模型训练完毕。
为了验证本发明在不同数据不平衡程度中的性能,在具体实例的验证过程中,模型分别在表1中的4个不平衡数据集中训练,然后统一在测试集(即数据集D)中测试以评估该模型在不同的数据不平衡程度下的性能。
步骤S5:故障诊断。将测试集输入训练好的模型中进行测试,模型输出识别结果实现对当前数据的故障诊断。
在实例验证中,将测试集分别输入不同训练集训练后的模型中,输出诊断结果。同时,为了验证本发明的优越性,将本发明所用网络与原始的GCNN,常用的一维卷积神经网络(one-dimensional Convolutional Neural Network,1D-CNN),双向长短期记忆网络(bi-directional Long Short-Term memory network,Bi-LSTM)以及经典卷积神经网络模型AlexNet进行对比。其中,原始GCNN的采用了原始的门控卷积层,其余结构与本发明相同,以验证本发明对门控卷积层改进后的效果。此外,为了对两种进行区分,将本发明的网络模型标记为IGCNN。
图4展示了各模型的测试结果。从图中可得,经过四种不平衡数据集训练的IGCNN模型在测试集中均能取得很高的结果。随着数据不平衡程度的加剧,各对比方法的识别精度显著降低,而本模型仍能保持很高的识别精度,具有很强的鲁棒性,在数据不平衡率高达10:1时,仍然达到了95%以上的识别率。结果表明,本发明能够很好地解决数据不平衡问题,并且具有很强的鲁棒性,相比其他方法具有明显的优势。结果表明,本发明能够很好地解决数据不平衡问题,并且具有很强的鲁棒性,相比其他方法具有明显的优势。
可以理解,本发明是通过一些实施例进行描述的,本领域技术人员知悉的,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本申请的权利要求范围内的实施例都属于本发明所保护的范围内。
Claims (4)
1.一种基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法,其特征在于,包括以下步骤,且以下步骤顺次进行:
步骤S1:数据的采集和预处理,使用传感器和数据采集仪采集滚动轴承在不同健康状态下的振动信号并对各类信号设置相应的标签,通过滑动窗口的方式截取信号以获取样本并构造数据集;
步骤S2:搭建门控卷积神经网络模型,门控卷积神经网络模型采用“端到端”处理方式,轴承信号可直接输入到网络模型中;引入门控卷积层以提高模型的特征提取能力,并使用批量归一化技术提升其泛化能力;
步骤S3:初始化模型,设置模型的迭代次数、优化器和学习率,引入标签分布感知边界损失函数以提高模型处理不平衡数据的性能;
步骤S4:模型训练,将训练集输入模型进行训练,当达到最大迭代次数后训练停止,模型训练完毕;
步骤S5:模型的测试与评估,将测试集输入训练好的模型中进行测试,模型输出识别结果实现对当前数据的故障诊断。
3.根据权利要求1所述的基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法,其特征在于,所述步骤S2中的门控卷积神经网络模型由特征提取器和分类器两部分构成;
特征提取器由4个门控卷积层和2个池化层交替组成,门控卷积层实现特征的提取,池化层的类型为最大池化层,实现特征的降维;门控卷积层由三部分组成,分别为卷积层,批量归一化层和门控线性单元,模型输入为一维序列,因此采用一维卷积层对特征进行提取;批量归一化层可以重新调整输入数据的分布;门控线性单元能够控制各层之间的信息流动,使得干扰信息被过滤,数据输入门控卷积层之后的得到的结果用公式(2)表示:
分类器由3层全连接层和softmax分类层组成,并加入了Dropout层以抑制过拟合问题的产生,最终通过softmax分类层输出轴承各类健康状况的概率分布来获取模型的诊断结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210633772.3A CN115046765A (zh) | 2022-06-06 | 2022-06-06 | 基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210633772.3A CN115046765A (zh) | 2022-06-06 | 2022-06-06 | 基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115046765A true CN115046765A (zh) | 2022-09-13 |
Family
ID=83158666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210633772.3A Pending CN115046765A (zh) | 2022-06-06 | 2022-06-06 | 基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115046765A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118171180A (zh) * | 2024-05-15 | 2024-06-11 | 山东理工职业学院 | 基于人工智能的设备状态预测方法和装置 |
CN118533479A (zh) * | 2024-07-19 | 2024-08-23 | 四川农业大学 | 一种航空发动机轴承的故障诊断方法及装置 |
-
2022
- 2022-06-06 CN CN202210633772.3A patent/CN115046765A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118171180A (zh) * | 2024-05-15 | 2024-06-11 | 山东理工职业学院 | 基于人工智能的设备状态预测方法和装置 |
CN118533479A (zh) * | 2024-07-19 | 2024-08-23 | 四川农业大学 | 一种航空发动机轴承的故障诊断方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110361176B (zh) | 一种基于多任务特征共享神经网络的智能故障诊断方法 | |
CN111709448B (zh) | 一种基于迁移关系网络的机械故障诊断方法 | |
CN111914883B (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN115046765A (zh) | 基于门控卷积神经网络的滚动轴承类不平衡故障诊断方法 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN112257530B (zh) | 基于盲信号分离和支持向量机的滚动轴承故障诊断方法 | |
CN113887136B (zh) | 一种基于改进GAN和ResNet的电动汽车电机轴承故障诊断方法 | |
CN112924177B (zh) | 一种改进深度q网络的滚动轴承故障诊断方法 | |
CN112257767B (zh) | 针对类不均衡数据的产品关键零部件状态分类方法 | |
CN112633339A (zh) | 轴承故障智能诊断方法、诊断系统、计算机设备及介质 | |
CN110609524A (zh) | 一种工业设备剩余寿命预测模型及其构建方法和应用 | |
CN112147432A (zh) | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统 | |
CN112541524B (zh) | 基于注意力机制改进的BP-Adaboost多源信息电机故障诊断方法 | |
CN114755017B (zh) | 一种跨域数据驱动无监督领域共享网络的变转速轴承故障诊断方法 | |
CN113850161B (zh) | 基于lstm深度降噪自编码器的飞轮故障识别方法 | |
CN114429152A (zh) | 基于动态指数对抗性自适应的滚动轴承故障诊断方法 | |
CN109726770A (zh) | 一种模拟电路故障测试诊断方法 | |
Qin et al. | Cross-domain fault diagnosis of rolling bearing using similar features-based transfer approach | |
CN117290771A (zh) | 基于改进辅助分类生成对抗网络的旋转机械故障诊断方法 | |
Wei et al. | WSAFormer-DFFN: A model for rotating machinery fault diagnosis using 1D window-based multi-head self-attention and deep feature fusion network | |
Liu et al. | A rotor fault diagnosis method based on BP-Adaboost weighted by non-fuzzy solution coefficients | |
CN113884300A (zh) | 一种深度对抗迁移学习的滚动轴承故障诊断方法 | |
CN113435321A (zh) | 一种主轴轴承状态评估方法、系统、设备及可读存储介质 | |
CN114818811B (zh) | 一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法 | |
Sun et al. | Fault diagnosis of rotating machinery based on local centroid mean local Fisher discriminant analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |