CN117216522A - 一种基于机器学习的轴承故障类别诊断方法、装置及设备 - Google Patents
一种基于机器学习的轴承故障类别诊断方法、装置及设备 Download PDFInfo
- Publication number
- CN117216522A CN117216522A CN202311197694.8A CN202311197694A CN117216522A CN 117216522 A CN117216522 A CN 117216522A CN 202311197694 A CN202311197694 A CN 202311197694A CN 117216522 A CN117216522 A CN 117216522A
- Authority
- CN
- China
- Prior art keywords
- frequency domain
- bearing
- bearing fault
- machine learning
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 47
- 238000003745 diagnosis Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000009467 reduction Effects 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 28
- 230000009466 transformation Effects 0.000 claims abstract description 17
- 230000004913 activation Effects 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 230000015654 memory Effects 0.000 claims abstract description 13
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 238000011176 pooling Methods 0.000 claims abstract description 11
- 238000000746 purification Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 18
- 230000015556 catabolic process Effects 0.000 claims description 13
- 238000006731 degradation reaction Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 11
- 230000014509 gene expression Effects 0.000 claims description 7
- 238000002405 diagnostic procedure Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 13
- 238000013527 convolutional neural network Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 239000000306 component Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种基于机器学习的轴承故障类别诊断方法,包括将注意力机制引入双向长短期记忆网络中,构建改进CNN‑BILSTM模型;获取待检测轴承的振动信号,利用滑动窗口截取预设长度的样本信号,进行预处理,获取样本时频域特征;利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征;将预设维度的样本时频域特征输入预训练好的改进CNN‑BILSTM模型中,依次经过卷积层卷积、激活层非线性变换与池化层特征提纯,输出空间特征至BILSTM模块;所述空间特征分别经过BILSTM模块的第一LSTM单元与第二LSTM单元进行退化特征信息的提取,两个LSTM单元的输出拼接,作为输出特征;将所述输出特征送入Softmax分类器中,其包括全连接层与输出层,对所述输出特征进行分类,获取轴承故障类别。
Description
技术领域
本发明涉及轴承故障检测技术领域,尤其是指一种基于机器学习的轴承故障类别检测方法、装置及设备。
背景技术
滚动轴承作为机床运作的核心部件,易受工作环境噪声、不合理的工时安排、工件材料的好坏等影响因素造成故障多发的情况。因此在实际应用中,需要对滚动轴承进行早期故障诊断,以减少、避免损失发生。早期的故障诊断更多是依靠专家自身的经验与知识进行判断,这势必会产生一定的错误判断与遗漏故障的情况。同时,随着机械制造业的蓬勃发展,各类数据急速增长。使用人工手段对轴承的原始信号进行特征提取的效率十分低下。近年来,深度学习技术在计算机视觉、自然语言处理及语音识别等领域取得了跨越式的发展,一些深度学习方法也被使用到轴承故障诊断领域。
随着电子信息技术的发展,基于计算机智能的预测方法已逐渐成为该研究领域的热点之一。该方法以设备运行产生的实时数据作为研究对象,并利用各种智能算法来拟合仿真的演化和发展规律。人工神经网络(ANN)在并行计算、非线性映射、分布式存储等方面具有强大的优势,在模式识别、预测决策等领域具有广泛的应用价值;但该方法忽略了轴承较深的故障,预测精度也需要提高。且现有的轴承故障诊断方法,主要集中在预测模型的组合创新上,而没有关注更深层次的故障特征。且在进行特征识别时,会丢失部分特征信息,导致识别精度下降,检测准确性低。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中故障检测精度差的问题。
为解决上述技术问题,本发明提供了一种基于机器学习的轴承故障类别诊断方法,包括:
将注意力机制引入双向长短期记忆网络中,构建改进CNN-BILSTM模型;
获取待检测轴承的振动信号,利用滑动窗口截取预设长度的样本信号,进行预处理,获取样本时频域特征;
利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征;
将预设维度的样本时频域特征输入预训练好的改进CNN-BILSTM模型中,所述预训练好的改进CNN-BILSTM模型包括:
自注意力卷积模块,其包括沿正传播方向依次串联的:
卷积层,对所述预设维度的样本时频域特征进行卷积;
激活层,对卷积层的输出进行非线性变换;
池化层,对所述激活层的输出进行特征提纯,输出空间特征;
BILSTM模块,其包括:
第一LSTM单元,对所述空间特征进行正向传播,进行退化特征信息的提取;
第二LSTM单元,对所述空间特征进行反向传播,进行退化特征信息的提取,其输出与所述第一LSTM单元的输出拼接,作为输出特征;
Softmax分类器,其包括全连接层与输出层看,对所述输出特征进行分类,获取待检测轴承的轴承故障类别。
在本发明的一个实施例中,所述预训练好的改进CNN-BILSTM模型在卷积层后串联有批归一化层。
在本发明的一个实施例中,采集轴承不同工况下多种故障类型的振动信号,进行预处理,获取带有标签的轴承故障数据集,对所述改进CNN-BILSTM模型进行训练,获取预训练好的改进CNN-BILSTM模型。
在本发明的一个实施例中,所述获取预训练好的改进CNN-BILSTM模型,包括:
获取轴承在不同工况下多种故障类型的振动信号,进行预处理,获取带有标签的轴承故障数据集,按照预设比例,划分为训练数据集与测试数据集;
将训练数据集中的样本数据输入改进CNN-BILSTM模型中,获取故障类别,利用反向传播算法和随机优化算法对改进CNN-BILSTM模型进行训练,计算与真实标签类别的损失函数,直至损失函数收敛,获取预训练好的改进CNN-BILSTM模型。
在本发明的一个实施例中,所述获取带有标签的轴承故障数据集,包括:
利用经验模态分解对轴承在不同工况下多种故障类型的振动信号进行降噪处理;
提取振动信号时域特征,利用傅里叶变换进行时频域转换,获取振动信号频域特征,利用小波变换提取振动信号时频域特征;
剔除所述时频域特征中相关程度不大于预设相关程度的特征参数;
获取表征不同工况下多种故障类型的振动信号的时频域特征及其故障类型,构建带标签的轴承故障数据集。
在本发明的一个实施例中,所述利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征,包括:
将所述样本时频域特征用模式向量矩阵表示为X=[x1,x2,…,xN],且其中第l列为Xl=[x1l,x2l,…,xNl]T,那么设xl表示轴承状态,Rx表示其协方差矩阵,表达式为:
其中,n表示训练样本的数量;表示模式向量矩阵的均值;
获取协方差矩阵Rx的特征值和特征向量;
将特征值由大到小排序,提取大于预设特征值的特征值所对应的特征向量,组成预设维度的样本时频域特征。
在本发明的一个实施例中,所述利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征,预设维度为8维。
本发明实施例还提供了一种基于机器学习的轴承故障类别诊断装置,包括:
模型构建模块,用于将注意力机制引入双向长短期记忆网络中,构建改进CNN-BILSTM模型;
特征获取模块,用于获取待检测轴承的振动信号,利用滑动窗口截取预设长度的样本信号,进行预处理,获取样本时频域特征;
特征降维模块,用于利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征;
模型分类模块,用于将预设维度的样本时频域特征输入预训练好的改进CNN-BILSTM模型中,所述预训练好的改进CNN-BILSTM模型包括:
自注意力卷积模块,其包括沿正传播方向依次串联的:
卷积层,对所述预设维度的样本时频域特征进行卷积;
激活层,对卷积层的输出进行非线性变换;
池化层,对所述激活层的输出进行特征提纯,输出空间特征;
BILSTM模块,其包括:
第一LSTM单元,对所述空间特征进行正向传播,进行退化特征信息的提取;
第二LSTM单元,对所述空间特征进行反向传播,进行退化特征信息的提取,其输出与所述第一LSTM单元的输出拼接,作为输出特征;
Softmax分类器,其包括全连接层与输出层看,对所述输出特征进行分类,获取待检测轴承的轴承故障类别。
本发明实施例还提供了一种基于机器学习的轴承故障类别诊断设备,包括:
待检测轴承样品;
传感器,设置于所述待检测轴承样品上,用于获取所述待检测轴承样品振动信号;
如上述所述的基于机器学习的轴承故障类别诊断装置,与所述传感器通讯连接,用于根据所述振动信号执行如上述所述的基于机器学习的轴承故障类别诊断方法的步骤,输出待检测轴承的轴承故障类型;
显示器,与所述基于机器学习的轴承故障类别诊断装置通讯连接,用于显示所述轴承故障类型。
在本发明的一个实施例中,还包括:
A/D信号转换器,与所述传感器通讯连接,将所述待检测轴承样品振动信号转换为振动信号数字信号发送至基于机器学习的轴承故障类别诊断装置;
D/A信号转换器,与所述基于机器学习的轴承故障类别诊断装置通讯连接,用于将获取的轴承故障类型转换为模拟信号输出至显示器。
本发明的上述技术方案相比现有技术具有以下优点:
本发明所述的基于机器学习的轴承故障类别诊断方法,将自注意力机制引入双向长短期记忆网络中,有助于提高深层故障的分类和筛选,提高了预测精度;本发明利用PCA算法将原本复杂的多维数据转换为简单、直观、不相关的低维数据,有效地降低了数据分析的难度和复杂性;通过特征降维,去除了冗余信息,避免信息干扰,从而提高了分类器的性能,提高了预测速度和准确性。
本发明在卷积层之后增加了批归一化层,使输入特征进入敏感的非线性变换函数区域,以防止梯度消失,提高预测预测精度。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明所提供的基于机器学习的轴承故障类别诊断方法的步骤流程图;
图2是本发明所提供的自注意力卷积模块的结构示意图;
图3是本发明所提供的GILSTM模块的工作原理图;
图4是本发明所提供的改进CNN-BILSTM模型的参数示意图;
图5是本发明所提供的特征相关矩阵示意图;
图6是本发明所提供的PCA方法进行不同维度特征降维的结果示意图;
图7是本发明所提供的基于机器学习的轴承故障类别诊断装置的工作流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
参照图1所示,本发明的基于机器学习的轴承故障类别诊断方法的步骤流程图,具体步骤包括:
S1:将注意力机制引入双向长短期记忆网络中,构建改进CNN-BILSTM模型;
S2:获取待检测轴承的振动信号,利用滑动窗口截取预设长度的样本信号,进行预处理,获取样本时频域特征;
S3:利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征;
将所述样本时频域特征用模式向量矩阵表示为X=[x1,x2,…,xN],且其中第l列为Xl=[x1l,x2l,…,xNl]T,那么设xl表示轴承状态,Rx表示其协方差矩阵,表达式为:其中,n表示训练样本的数量;/>表示模式向量矩阵的均值;
获取协方差矩阵Rx的特征值和特征向量;将特征值由大到小排序,提取大于预设特征值的特征值所对应的特征向量,组成预设维度的样本时频域特征;
S4:将预设维度的样本时频域特征输入预训练好的改进CNN-BILSTM模型中,获取待检测轴承的轴承故障类型;
所述预训练好的改进CNN-BILSTM模型包括:
自注意力卷积模块,其包括沿正传播方向依次串联的:
卷积层,对所述预设维度的样本时频域特征进行卷积;
激活层,对卷积层的输出进行非线性变换;
池化层,对所述激活层的输出进行特征提纯,输出空间特征;
BILSTM模块,其包括:
第一LSTM单元,对所述空间特征进行正向传播,进行退化特征信息的提取;
第二LSTM单元,对所述空间特征进行反向传播,进行退化特征信息的提取,其输出与所述第一LSTM单元的输出拼接,作为输出特征;
Softmax分类器,其包括全连接层与输出层看,对所述输出特征进行分类,获取待检测轴承的轴承故障类别。
具体地,参照图2所示,为本发明的自注意力卷积模块的结构示意图;卷积神经网络(CNN)是一种具有卷积计算和深度结构的前馈神经网络,是深度学习的代表性算法之一。一个CNN的训练过程包括前向传播和反向传播。前向传播主要提取输入数据的不同特征,而反向传播主要优化前向传播的参数。CNN模型可分为特征提取器和分类器两个模块。特征提取器主要由输入层(Input)、卷积层(Conv)、池化层(Pool)与全连接层(FC)组成;分类器由全连接层层和输出层组成。
长短期记忆网络(LSTM)是递归神经网络结构的一种变体,可以解决递归神经网络中遇到的梯度爆炸和消失问题。标准的LSTM网络结构只有前向传播操作,前后缺乏逻辑一致性。双向长短期记忆网络(BiLSTM)基于LSTM,利用已知的时间序列和反向位置序列,通过正向和反向传播的双向操作,加深对原始序列的特征提取,提高模型输出结果的准确性。BiLSTM神经网络的最终输出是向前和向后传播LSTM输出结果。BiLSTM网络的结构如图3所示。
具体地,在本发明实施例中,在改进CNN-BILSTM模型的卷积层和全连接层之后增加了批归一化(BN),使输入数据进入敏感的非线性变换函数区域,以防止梯度消失。
在本发明实施例中,采集轴承不同工况下多种故障类型的振动信号,进行预处理,获取带有标签的轴承故障数据集,对所述改进CNN-BILSTM模型进行训练,获取预训练好的改进CNN-BILSTM模型。具体包括:
获取轴承在不同工况下多种故障类型的振动信号,进行预处理,获取带有标签的轴承故障数据集,按照预设比例,划分为训练数据集与测试数据集;
将训练数据集中的样本数据输入改进CNN-BILSTM模型中,获取故障类别,利用反向传播算法和随机优化算法对改进CNN-BILSTM模型进行训练,计算与真实标签类别的损失函数,直至损失函数收敛,获取预训练好的改进CNN-BILSTM模型。
其中,带有标签的轴承故障数据集的获取包括:
利用经验模态分解对轴承在不同工况下多种故障类型的振动信号进行降噪处理;
提取振动信号时域特征,利用傅里叶变换进行时频域转换,获取振动信号频域特征,利用小波变换提取振动信号时频域特征;
剔除所述时频域特征中相关程度不大于预设相关程度的特征参数;
获取表征不同工况下多种故障类型的振动信号的时频域特征及其故障类型,构建带标签的轴承故障数据集。
基于上述实施例,在本实施例中,为了有效进行数据的分析,根据轴承故障振动信号的时频域的特点,进行数据预处理。对于样本数据,用Ai,j表示该原始数据与预处理数据,且Ai为原始数据。设Ai,1表示从原始数据集获得的时域振动信号并作为第一类预处理数据;设Ai,2表示由时域信号经傅里叶变化得到的频域信号,作为第二类预处理数据。其中,N表示样本数量。
时域信号可以按照有无量纲分为有量纲特征值和无量纲特征值。其中,有量纲特征值包括:最大值、最小值、峰峰值、均值、方差、均方值、均方根值等。设Max,Min,XP,XPP分别表示最大值、最小值、峰值(Peak)、峰峰值。
最大值:Max=max(Ai,1);最小值:Min=min(Ai,1);峰值:峰峰值:XPP=Mac-Min;
其中,xpj表示用峰值计数法从信号中找出的m个峰值。
此外,均值、方差、均方值、均方根值之间有内在的联系,故设μi, 分别表示均值、方差、均方值、均方根,其表达式如下。
均值:方差:/>均方值:/>均方根:/>
然而,有量纲特征值的数值大小常因外界一些物理量的变化而变化,给工程应用带来一定困难,因而时常使用多种无量纲指标,包括峰值因子(Crest Factor)、峭度(Kurtosis)、峭度因子(Kurtosis Factor)、脉冲因子(Impulse Factor)、裕度因子(Clearance Factor)、和波形因子(Shape Fator)等。因此,设C,K,I,CL,SF,SK分别表示峰值因子(Crest Factor)、峭度(Kurtosis)、峭度因子(Kurtosis Factor)、脉冲因子(ImpulseFactor)、裕度因子(Clearance Factor)、波形因子(Shape Fator)和偏度(Skew),其表达式如下所示。
峰值因子:峭度:/>峭度因子:/>脉冲因子:裕度因子:/>波形因子:/>偏度:/>
而后,经傅里叶变换将时域信号Ai,1转化为频域信号Ai,2后,提取频域信号的相关特征量。因此,设S1,S2,S3,S4,S5,S6,S7,S8,S9,S10,S11,S12分别表示频域幅值平均值、重心频率、均方频率、频域方差、频域均方根、频域幅值方差、频域幅值偏度指标、频域幅值峭度指标、频域标准差、频域频率歪度、频域频率峭度、平方根比率。其中,S1反映振动能量的大小;S2-S4主要反映了主频带的位置;S5-S12则集中反映频谱的分散或集中程度。且式中fN表示第N条谱线的频率值。那么频域信号特征量的表达式如下:
频域幅值平均值:重心频率:/>均方频率:/>频域方差:/>频域均方根:/>频域幅值方差:/>频域幅值偏度指标:/>频域幅值峭度指标:/>频域标准差:频域频率歪度:/>频域频率峭度:/>平方根比率:/>
由于日常生活中处理的数据通常是多维的,导致了算法的计算时间延长,复杂度与维数成指数级增加。如果维数达上千万维,称为维数灾难,往往就需要我们进行降维处理。因此,利用获得的特征,求取特征与特征间,特征与分类标签之间的相关系数,有益于特征降维的顺利进行。特征相关度的公式为:
此外,特征降维不仅仅重构了有效的低纬度特征,同时也为数据展现提供了可能性,PCA作为一种最为经典和实用的特征降维技术。通过线性变换将问题从高维转化到低维,保留低阶主成分,删除高阶成分,达到降低数据集维数的目的。通过降维方法将原本复杂的多维数据转换成简单、直观且不相关的低维数据,有效降低数据分析的难度和复杂程度。其具体原理为:将机械振动信号用模式向量矩阵表示为X=[x1,x2,…,xN],且其中第l列为Xl=[x1l,x2l,…,xNl]T,那么设xl表示设备的某一状态,Rx表示其协方差矩阵,表达式为
式中,n表示训练样本的数量。表示样本模式向量的均值。
设λi(i=1,2,…,n)和υi(i=1,2,…,n)分别表示协方差矩阵Rx的特征值和特征向量。若样本xj投影到特征向量υi,所求特征向量构成n维正交空间,将样本投影到该空间即可得到对应的n维主成分量,故重构时特征向量的贡献率与其所对应的特征值大小成正比。则对应的主成分量表达式为
基于上述实施例,在本发明实施例中,利用本发明所提供的基于机器学习的轴承故障类别诊断方法进行轴承故障类型诊断,在本实施例中,改进CNN-BILSTM模型由两个卷积层和池化层、两个全连接层、一个隐层为12的BiLSTM网络层和一个Softmax层组成。采用反向传播算法和随机优化算法对网络进行训练。迭代次数为4000次,每轮迭代次数为4次,学习率为0.0001,激活函数为ReLU,池化类型为最大池化。实验采用MATLAB R2021b版本进行。各网络层的参数如图4所示。
根据轴承振动信号的振动频率,将轴承故障类型划分为10类,由于每种类型的故障的数据量都较大,将数据集合成到一个数据集,并根据样本大小分配训练和测试数据,彼此之间没有任何交集。从数据集中不同类型的数据中提取特征量,然后使用MATLAB软件进行相关性分析,得到特征相关矩阵,如图5所示。
如图5所示,相关系数代表了研究变量之间相关程度的指标。通过分析可知,特征相关系数的分布具有一定的规律。因此,在降低特征的维数时,选择与类别标签相关系数显著的特征。然后,在进一步使用成分分析方法进行降维时,去除分类标签中相关系数高的特征之间相关系数高的特征,保留部分特征,进一步降低特征的维数,避免过拟合。PCA作为一种分析和简化数据的技术,将原本复杂的多维数据转换为简单、直观、不相关的低维数据,有效地降低了数据分析的难度和复杂性。
参照图6所示,为利用PCA方法进行不同维度特征降维的结果示意图;为了将特征数量筛选到适当的大小,本实施例使用PCA方法将特征数量分别减少到8维、4维和2维;从图6可知,将特征维降为二维后,许多特征有高度的重叠,分类不明显,此时,使用分类器进行过拟合就更容易了。
为了有效地评价本发明改进CNN-BILSTM模型的准确性和预测结果的准确性,将准确性作为分类结果的评价标准。
准确性的计算方法表示为:
其中,真阳性TP代表模型预测为阳性的阳性样本,假阳性FP代表模型预测为阳性的阴性样本,假阴性FN代表模型预测为阴性的阳性样本,真阴性TN代表模型预测为阴性的阴性样本。
基于上述PCA算法,利用本发明所提供的基于机器学习的轴承故障类别诊断方法对轴承振动信号进行计算和分类,预测结果如表1所示:
表1测试结果
Model | No reduce | Down to 8D | Down to 4D | Down to 2D |
CNN | 96.01% | 98.11% | 89.31% | 74.91% |
LSTM | 97.48% | 96.84% | 85.53% | 75.98% |
CNN-BILSTM | 99.78% | 99.86% | 94.77% | 74.00% |
本发明 | 100% | 100% | 97.31% | 79.36% |
从表1可以看出,PCA主成分分析降维后的模型的精度降低了。在降维过程中,一些特征信息丢失,导致识别精度下降。特征维数减小得越低,识别精度的降低程度就越大。因此,在特征工程中,合理地提取特征并找出最能代表问题本质的特征是非常重要的。同时,通过特征降维,去除冗余信息,避免信息干扰,从而降低模式识别算法的计算复杂度,提高分类器的性能。由表1可知,与其他机器学习算法相比,本发明所提供的基于机器学习的轴承故障类别诊断方法的改进CNN-BILSTM模型具有良好的预测能力。
综上所述,本发明所提供的基于机器学习的轴承故障类别诊断方法对轴承振动数据进行分类和轴承生产缺陷检测的问题出发,构建了改进CNN-BILSTM模型。本发明引入自注意力机制有助于提高深层故障的分类和筛选,使预测精度比原来提高了0.22%。同时,由于降维过程中部分特征信息的丢失,特征维数越低,识别精度下降的趋势越大。本实施例将特征的数量减少到8维可以有效地保存特征信息。
基于上述实施例,本发明实施例还提供了一种基于机器学习的轴承故障类别诊断装置,包括:
模型构建模块,用于将注意力机制引入双向长短期记忆网络中,构建改进CNN-BILSTM模型;
特征获取模块,用于获取待检测轴承的振动信号,利用滑动窗口截取预设长度的样本信号,进行预处理,获取样本时频域特征;
特征降维模块,用于利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征;
模型分类模块,用于将预设维度的样本时频域特征输入预训练好的改进CNN-BILSTM模型中,所述预训练好的改进CNN-BILSTM模型包括:
自注意力卷积模块,其包括沿正传播方向依次串联的:
卷积层,对所述预设维度的样本时频域特征进行卷积;
激活层,对卷积层的输出进行非线性变换;
池化层,对所述激活层的输出进行特征提纯,输出空间特征;
BILSTM模块,其包括:
第一LSTM单元,对所述空间特征进行正向传播,进行退化特征信息的提取;
第二LSTM单元,对所述空间特征进行反向传播,进行退化特征信息的提取,其输出与所述第一LSTM单元的输出拼接,作为输出特征;
Softmax分类器,其包括全连接层与输出层看,对所述输出特征进行分类,获取轴承故障类别。
基于上述实施例,本发明实施例还提供了一种基于机器学习的轴承故障类别诊断设备,包括:
待检测轴承样品;
传感器,设置于所述待检测轴承样品上,用于获取所述待检测轴承样品振动信号;
基于机器学习的轴承故障类别诊断装置,与所述传感器通讯连接,用于根据所述振动信号执行基于机器学习的轴承故障类别诊断方法的步骤,输出轴承故障类型;
显示器,与所述基于机器学习的轴承故障类别诊断装置通讯连接,用于显示所述轴承故障类型。
具体地,在本实施例中,基于机器学习的轴承故障类别诊断设备,还包括:
A/D信号转换器,与所述传感器通讯连接,将所述待检测轴承样品振动信号转换为振动信号数字信号发送至基于机器学习的轴承故障类别诊断装置;
D/A信号转换器,与所述基于机器学习的轴承故障类别诊断装置通讯连接,用于将获取的轴承故障类型转换为模拟信号输出至显示器。
参照图7所示,在本实施例的基于机器学习的轴承故障类别诊断设备中,基于机器学习的轴承故障类别诊断装置的工作流程具体包括:
采集的振动信号通过滑动窗口算法进行截取,获得长度统一的样本后进行归一化处理,得到相应的数据集;
使用经验模态分解对振动数据进行降噪处理,并提取时域特征,接着采用傅里叶变换对数据集进行时频域的转换并提取频域特征,使用小波变换提取时频域特征;
在筛选特征参数集时,为剔除掉那些不具备重要意义的信息,使用单调性、趋势性、皮尔逊、斯皮尔曼等多种指标来综合衡量它们的相关程度;
将上述数据的特征进行筛选后划分测试集与训练集;
搭建训练模型,设置相关参数;
将训练集输入步骤搭建的训练模型中,通过卷积神经网络模型提取训练集中特征量,同时SE注意力机制对卷积神经网络进行加强,提取深层次的特征数据;
将集中特征量通过双向长短时记忆层捕捉特征数据的相关性;
利用Softmax分类器输出分类结果;
将训练集中的真实结果与结果作比较,以达到验证所建模型的训练效果,并根据训练集的验证结果微调卷积神经网络的参数;
判断所建模型的网络训练次数是否达到预先设定的迭代次数,如果是,进行下一步,否则重复将训练集输入步骤搭建的训练模型中,直至达到预先设定的迭代次数,获取预训练好的改进CNN-BILSTM模型。
本发明所述的基于机器学习的轴承故障类别诊断方法,将自注意力机制引入双向长短期记忆网络中,有助于提高深层故障的分类和筛选,提高了预测精度;本发明利用PCA算法将原本复杂的多维数据转换为简单、直观、不相关的低维数据,有效地降低了数据分析的难度和复杂性;通过特征降维,去除了冗余信息,避免信息干扰,从而提高了分类器的性能,提高了预测速度和准确性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种基于机器学习的轴承故障类别诊断方法,其特征在于,包括:
将注意力机制引入双向长短期记忆网络中,构建改进CNN-BILSTM模型;
获取待检测轴承的振动信号,利用滑动窗口截取预设长度的样本信号,进行预处理,获取样本时频域特征;
利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征;
将预设维度的样本时频域特征输入预训练好的改进CNN-BILSTM模型中,所述预训练好的改进CNN-BILSTM模型包括:
自注意力卷积模块,其包括沿正传播方向依次串联的:
卷积层,对所述预设维度的样本时频域特征进行卷积;
激活层,对卷积层的输出进行非线性变换;
池化层,对所述激活层的输出进行特征提纯,输出空间特征;
BILSTM模块,其包括:
第一LSTM单元,对所述空间特征进行正向传播,进行退化特征信息的提取;
第二LSTM单元,对所述空间特征进行反向传播,进行退化特征信息的提取,其输出与所述第一LSTM单元的输出拼接,作为输出特征;
Softmax分类器,其包括全连接层与输出层看,对所述输出特征进行分类,获取待检测轴承的轴承故障类别。
2.根据权利要求1所述的基于机器学习的轴承故障类别诊断方法,其特征在于,所述预训练好的改进CNN-BILSTM模型在卷积层后串联有批归一化层。
3.根据权利要求1所述的基于机器学习的轴承故障类别诊断方法,其特征在于,采集轴承不同工况下多种故障类型的振动信号,进行预处理,获取带有标签的轴承故障数据集,对所述改进CNN-BILSTM模型进行训练,获取预训练好的改进CNN-BILSTM模型。
4.根据权利要求3所述的基于机器学习的轴承故障类别诊断方法,其特征在于,所述获取预训练好的改进CNN-BILSTM模型,包括:
获取轴承在不同工况下多种故障类型的振动信号,进行预处理,获取带有标签的轴承故障数据集,按照预设比例,划分为训练数据集与测试数据集;
将训练数据集中的样本数据输入改进CNN-BILSTM模型中,获取故障类别,利用反向传播算法和随机优化算法对改进CNN-BILSTM模型进行训练,计算与真实标签类别的损失函数,直至损失函数收敛,获取预训练好的改进CNN-BILSTM模型。
5.根据权利要求4所述的基于机器学习的轴承故障类别诊断方法,其特征在于,所述获取带有标签的轴承故障数据集,包括:
利用经验模态分解对轴承在不同工况下多种故障类型的振动信号进行降噪处理;
提取振动信号时域特征,利用傅里叶变换进行时频域转换,获取振动信号频域特征,利用小波变换提取振动信号时频域特征;
剔除所述时频域特征中相关程度不大于预设相关程度的特征参数;
获取表征不同工况下多种故障类型的振动信号的时频域特征及其故障类型,构建带标签的轴承故障数据集。
6.根据权利要求1所述的基于机器学习的轴承故障类别诊断方法,其特征在于,所述利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征,包括:
将所述样本时频域特征用模式向量矩阵表示为X=[x1,x2,…,xN],且其中第l列为Xl=[x1l,x2l,…,xNl]T,那么设xl表示轴承状态,Rx表示其协方差矩阵,表达式为:
其中,n表示训练样本的数量;表示模式向量矩阵的均值;
获取协方差矩阵Rx的特征值和特征向量;
将特征值由大到小排序,提取大于预设特征值的特征值所对应的特征向量,组成预设维度的样本时频域特征。
7.根据权利要求1所述的基于机器学习的轴承故障类别诊断方法,其特征在于,所述利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征,预设维度为8维。
8.一种基于机器学习的轴承故障类别诊断装置,其特征在于,包括:
模型构建模块,用于将注意力机制引入双向长短期记忆网络中,构建改进CNN-BILSTM模型;
特征获取模块,用于获取待检测轴承的振动信号,利用滑动窗口截取预设长度的样本信号,进行预处理,获取样本时频域特征;
特征降维模块,用于利用PCA算法对所述样本时频域特征进行特征降维,输出预设维度的样本时频域特征;
模型分类模块,用于将预设维度的样本时频域特征输入预训练好的改进CNN-BILSTM模型中,所述预训练好的改进CNN-BILSTM模型包括:
自注意力卷积模块,其包括沿正传播方向依次串联的:
卷积层,对所述预设维度的样本时频域特征进行卷积;
激活层,对卷积层的输出进行非线性变换;
池化层,对所述激活层的输出进行特征提纯,输出空间特征;
BILSTM模块,其包括:
第一LSTM单元,对所述空间特征进行正向传播,进行退化特征信息的提取;
第二LSTM单元,对所述空间特征进行反向传播,进行退化特征信息的提取,其输出与所述第一LSTM单元的输出拼接,作为输出特征;
Softmax分类器,其包括全连接层与输出层看,对所述输出特征进行分类,获取待检测轴承的轴承故障类别。
9.一种基于机器学习的轴承故障类别诊断设备,其特征在于,包括:
待检测轴承样品;
传感器,设置于所述待检测轴承样品上,用于获取所述待检测轴承样品振动信号;
如权利要求8所述的基于机器学习的轴承故障类别诊断装置,与所述传感器通讯连接,用于根据所述振动信号执行如权利要求书1至7任一项所述的基于机器学习的轴承故障类别诊断方法的步骤,输出待检测轴承的轴承故障类型;
显示器,与所述基于机器学习的轴承故障类别诊断装置通讯连接,用于显示所述轴承故障类型。
10.根据权利要求9所述的基于机器学习的轴承故障类别诊断设备,其特征在于,还包括:
A/D信号转换器,与所述传感器通讯连接,将所述待检测轴承样品振动信号转换为振动信号数字信号发送至基于机器学习的轴承故障类别诊断装置;
D/A信号转换器,与所述基于机器学习的轴承故障类别诊断装置通讯连接,用于将获取的轴承故障类型转换为模拟信号输出至显示器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311197694.8A CN117216522A (zh) | 2023-09-15 | 2023-09-15 | 一种基于机器学习的轴承故障类别诊断方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311197694.8A CN117216522A (zh) | 2023-09-15 | 2023-09-15 | 一种基于机器学习的轴承故障类别诊断方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117216522A true CN117216522A (zh) | 2023-12-12 |
Family
ID=89034871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311197694.8A Pending CN117216522A (zh) | 2023-09-15 | 2023-09-15 | 一种基于机器学习的轴承故障类别诊断方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117216522A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117520950A (zh) * | 2024-01-04 | 2024-02-06 | 贵州大学 | 基于注意力知识共享网络的多目标uav故障诊断方法 |
-
2023
- 2023-09-15 CN CN202311197694.8A patent/CN117216522A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117520950A (zh) * | 2024-01-04 | 2024-02-06 | 贵州大学 | 基于注意力知识共享网络的多目标uav故障诊断方法 |
CN117520950B (zh) * | 2024-01-04 | 2024-03-19 | 贵州大学 | 基于注意力知识共享网络的多目标uav故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108231201B (zh) | 一种疾病数据分析处理模型的构建方法、系统及应用方法 | |
CN112084974B (zh) | 一种基于元学习的多标签滚动轴承故障诊断方法 | |
CN114970605B (zh) | 一种多模态特征融合神经网络的制冷设备故障诊断方法 | |
CN106895975B (zh) | 基于Stacked SAE深度神经网络的轴承故障诊断方法 | |
Harvey et al. | Automated feature design for numeric sequence classification by genetic programming | |
CN113865868B (zh) | 基于时频域表达的滚动轴承故障诊断方法 | |
CN109389171B (zh) | 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法 | |
CN113923104B (zh) | 基于小波神经网络的网络故障诊断方法、设备及存储介质 | |
CN108399434B (zh) | 基于特征提取的高维时间序列数据的分析预测方法 | |
CN117216522A (zh) | 一种基于机器学习的轴承故障类别诊断方法、装置及设备 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN113988357A (zh) | 基于深度学习的高层建筑风致响应预测方法及装置 | |
Wu et al. | Quality estimation method for gear hobbing based on attention and adversarial transfer learning | |
CN116702076A (zh) | 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质 | |
Wang et al. | A novel rolling bearing fault diagnosis method based on adaptive denoising convolutional neural network under noise background | |
CN114897138A (zh) | 基于注意力机制和深度残差网络的系统故障诊断方法 | |
CN115034254A (zh) | 基于hht频带能量特征和卷积神经网络的核素识别方法 | |
Best et al. | Deep audio embeddings for vocalisation clustering | |
Hamdaoui et al. | Improved signal processing for bearing fault diagnosis in noisy environments using signal denoising, time–frequency transform, and deep learning | |
CN114295967A (zh) | 一种基于迁移神经网络的模拟电路故障诊断方法 | |
Yu et al. | Fault feature of gearbox vibration signals based on morphological filter dynamic convolution autoencoder | |
CN116758922A (zh) | 一种用于变压器的声纹监测与诊断方法 | |
CN114764575B (zh) | 基于深度学习和时序注意力机制的多模态数据分类方法 | |
Li et al. | A robust fault diagnosis method for rolling bearings based on deep convolutional neural network | |
CN111798455A (zh) | 一种基于全卷积密集空洞网络的甲状腺结节实时分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |