CN116842379A - 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 - Google Patents
一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 Download PDFInfo
- Publication number
- CN116842379A CN116842379A CN202310671850.3A CN202310671850A CN116842379A CN 116842379 A CN116842379 A CN 116842379A CN 202310671850 A CN202310671850 A CN 202310671850A CN 116842379 A CN116842379 A CN 116842379A
- Authority
- CN
- China
- Prior art keywords
- layer
- bigru
- drsn
- mlp
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000036541 health Effects 0.000 claims abstract description 35
- 230000015556 catabolic process Effects 0.000 claims abstract description 29
- 238000006731 degradation reaction Methods 0.000 claims abstract description 29
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 28
- 238000010606 normalization Methods 0.000 claims description 18
- 210000002569 neuron Anatomy 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims 2
- 230000009466 transformation Effects 0.000 claims 1
- 230000000306 recurrent effect Effects 0.000 abstract description 15
- 238000013528 artificial neural network Methods 0.000 abstract description 4
- 230000003044 adaptive effect Effects 0.000 abstract description 3
- 238000004880 explosion Methods 0.000 abstract description 3
- 230000007246 mechanism Effects 0.000 abstract description 3
- 230000008034 disappearance Effects 0.000 abstract description 2
- 125000004122 cyclic group Chemical group 0.000 abstract 1
- 239000010410 layer Substances 0.000 description 140
- 238000010586 diagram Methods 0.000 description 24
- 238000005070 sampling Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 7
- 238000011176 pooling Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 5
- 238000005096 rolling process Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 2
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 1
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011089 mechanical engineering Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于DRSN‑CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,采用信号降噪和特征提取一体化方法,即深度残差收缩网络DRSN‑CS,进行自适应信号降噪和自动提取退化特征;使用双向门控循环单元BiGRU作为寿命预测网络,相比传统的循环神经网络,更好地解决梯度消失和梯度爆炸问题,模型结构更加简单,计算速度更快,能够在更短时间内学习到更长的时间序列信息,同时BiGRU模型中的门控机制可以有效地控制信息地流动,提高网络的泛化能力。本发明所述预测方法:首先对原始轴承振动信号进行归一化处理;然后利用DRSN‑CS模型学习并提取深层退化特征构建健康指标;最后将得到的健康指标输入到预测模型BiGRU+MLP中完成剩余使用寿命预测。
Description
技术领域
本发明涉及一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,属于利用计算机模型检测轴承的技术领域。
背景技术
在现代工业的发展过程中,大型机械设备如数控机床已呈现出复杂化、自动化以及集中化的发展趋势,常处于高负荷、变工况的连续运行状态。尽管数控机床技术能够很好地对批量加工工件的精度和质量进行准确控制,但在实际工作过程中,数控机床经常会因为各种因素出现故障,从而不能高效地运行。例如,数控机床关键工件的磨损会对加工工件的精度和质量产生直接影响,甚至可能引发安全事故导致机床停机和损坏。为确保数控机床的正常工作以及便利维修,必须加强设备初期的可靠性设计,并实施在线监测和健康管理。然而,数控机床设备结构复杂,子部件之间产生较强的耦合干涉,加之运行过程中内外非线性因素如阻尼、变刚度和时变外载荷等的影响,使得精确的物理模型难以建立并应用于监控和预测。在大数据背景下,各国都在促使基于数据驱动的健康评估框架搭建形成以及信息管理系统的开发,因此故障预测与健康状态管理(Prognostics and HealthManagement,PHM)应运而生。
在传统的剩余寿命预测领域,通常使用卷积神经网络或自编码器作为特征提取网络,用于提取退化特征,构建健康指标;使用循环神经网络进行寿命预测。对于卷积神经网络来说,其更适合处理图像等二维数据,而针对轴承的剩余寿命预测,往往处理的数据是一维时间序列振动信号数据。对于自编码器网络而言,其针对不同的轴承故障类型,需要设计不同的自编码器的结构,加大了工作量;同时,自编码器在提取故障特征时,容易出现特征损失的问题,导致提取的故障特征不准确;自编码器更容易出现过拟合问题。对于传统的循环神经网络来说,其存在梯度爆炸和梯度消失的问题,尤其在处理长时间序列数据时此类问题更为严重。
由于实际工况下采集的轴承历史运行状态数据存在大量的噪声干扰,如果直接输入到特征提取网络中,会极大地降低提取特征的有效性,但传统的卷积神经网络以及自编码器网络自身并不具备降噪的功能,往往需要在输入到特征网络之前,先进行振动信号数据降噪操作。而在数据降噪操作过程中,一旦故障信号被误过滤掉了,会导致后续算法的彻底失败,所以这种将信号降噪和特征提取分离开的思路存在问题。
发明内容
针对现有技术的不足,本发明提出一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法。
发明概述
针对以上技术问题,本发明采用信号降噪和特征提取一体化方法,即深度残差收缩网络DRSN-CS,进行自适应信号降噪和自动提取退化特征;使用双向门控循环单元BiGRU作为寿命预测网络,相比传统的循环神经网络,更好地解决梯度消失和梯度爆炸问题,模型结构更加简单,计算速度更快,能够在更短时间内学习到更长的时间序列信息,同时BiGRU模型中的门控机制可以有效地控制信息地流动,提高网络的泛化能力。
本发明所述预测方法:首先对原始轴承振动信号进行归一化处理;然后利用DRSN-CS模型学习并提取深层退化特征构建健康指标;最后将得到的健康指标输入到预测模型BiGRU+MLP中完成剩余使用寿命预测。
本发明详细的技术方案如下:
一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,其特征在于,包括:
S1:使用Min-Max标准化方法对原始轴承振动信号数据集进行归一化处理;
S2:搭建DRSN-CS模型,将归一化后的数据集输入到DRSN-CS模型中,得到一维轴承退化特征;
S3:对一维轴承退化特征进行平滑处理,得到健康指标;划分预测模型的训练集和测试集;
S4:搭建BiGRU+MLP预测模型,将所述健康指标输入所述BiGRU+MLP预测模型,以训练最优BiGRU+MLP预测模型。
由于原始振动信号数据值的范围差异较大,且常包含一些奇异样本数据,这些奇异样本数据的存在会导致网络训练时间增加,甚至引起网络无法收敛;为了避免此类问题的出现以及方便后续数据的处理,加快网络学习速度,本发明使用Min-Max方法对原始振动信号数据集进行归一化操作,将所有样本的输入信号其均值接近对0或与其均方差相比很小,有效去除振动信号中幅值影响,使得信号的频率、相位等特征更加清晰,能够更好地进行轴承故障特征提取;
本发明以XJTU-SY滚动轴承加速寿命试验数据集中的Bearing1_3文件下的数据为例,将归一化结果进行可视化展示。Bearing1_3数据集是3号轴承在工况1下,以25.6kHz的采样频率,每间隔1min采集一次,采样时间持续1.28s,每次采集的样本点为32768,并将获取的振动信号保存为到CSV文件中,依次为1.csv、2.csv……158.csv,每个csv文件中包含水平方向和垂直方向的振动信号。具体描述如表1所示下:
表1Bearing1_3数据集介绍
Bearing1_3数据集中1.csv文件中的原始振动信号数据如图4所示:
将原始振动信号数据集中的数据值映射到[0-1]区间内,转换函数如下:
在公式(1)中,X*为对当前数据点x归一化处理后的标准值;max为样本数据最大值;min为样本数据最小值;归一化后,如图5所示。
根据本发明优选的,所述S2具体包括:
S21:搭建DRSN-CS模型,
所述DRSN-CS模型为深度残差收缩网络,结构图如图6所示,其包括:一个输入层、一个卷积层、若干残差网络、一个批标准化、一个ReLU激活函数、一个全局均值池化和一个全连接输出层;
所述残差网络包括:3个批标准化层、3个ReLU激活层、2个卷积层、全局均值池化层、2个全连接层、Sigmoid函数层以及一个跨层恒等路径;其中C表示输入数据的通道数,W表示输入数据的宽度,1表示输入数据的高度,K表示卷积核个数,Conv表示卷积层,M表示全连接层中的神经元数量,α表示放缩系数;“/2”表示通过以2的步长移动卷积核来减少输入数据的宽度;当K=C时,输出数据的通道数为C;针对以上输入数据高度为1的表述,是因为在本发明中,以一维振动信号作为输入,所有使得输入数据和卷积核的高度始终置为1,具体结构图如图7a、图7b所示;
S22:利用DRSN-CS模型提取一维轴承退化特征
根据S1中的描述可知,获取的数据在三种工况下取得,数据的采样频率为25,6kHz,每个1min记录一次,每次采样时间为1.28s,即每个样本包含了32768个采样点,获取的数据包含了水平方向振动信号和垂直方向振动信号,为了避免垂直方向受到外力后,导致主轴变换,从而对轴承垂直方向的振幅产生影响,只考虑水平方向振动信号;本发明中,在对原始水平方向振动信号归一化的基础上,以32768个采样点为一组构建数据集,最终的数据集大小为(32768*1);
将S1归一化处理后的数据集输入所述DRSN-CS模型,最终输出一维退化特征,并平滑处理得到健康指标;
所述DRSN-CS模型参数具体如表2所示:
表2 DRSN-CS模型参数
表3中,出现的(3,2,64),第一个参数代表卷积核大小,第二个参数代表步长,第三个参数代表卷积核个数;
以工况1下Bearing1_3数据集为例,图8为利用DRSN-CS模型提取一维轴承退化特征。
根据本发明优选的,所述S3具体包括:采用简单移动平均算法对一维退化特征进行处理,使得数据更平滑,数据含噪声更少,过滤掉一些异常值;简单移动平均算法的计算公式如下所示:
在公式(2)中,Vt代表下一时刻的预测值,预测值代表经过简单移动平均方法平滑处理后的当前时刻的振动程度值,即是后续的健康指标;Vt-n代表前n时期的实际值,实际值代表原始的一维退化特征,也就是原始的振动程度值;平滑后得到的健康指标如图9所示。
根据本发明优选的,所述S4的具体方法,包括:
所述BiGRU+MLP预测模型包括:长短时记忆网络LSTM、门控循环单元GRU和多层感知机MLP,其中门控循环单元GRU组成了双向门控循环单元BiGRU;
如图11所示,双向门控循环单元BiGRU通过一个正向GRU传递信息和一个反向GRU传递信息,从不同方向对输入数据进行特征提取,不仅可以学习到前一时刻数据对后一时刻数据产生的影响,也可以学习到后一时刻数据与前一时刻数据的关联关系,能够捕捉到被单向GRU忽视掉的时序特征,从而提高了模型预测的准确度;
所述双向门控循环单元BiGRU包括:一个输入层、一个正向GRU层、一个反向GRU层、一个拼接层以及一个Dropout层;所述正向GRU层负责将输入数据从前向后的信息编码到隐藏状态向量中,正向GRU层的隐藏状态向量包含了当前时间步以前的输入信息;反向GRU负责将输入数据从后向前的信息编码到隐藏状态向量中,反向GRU层的隐藏状态向量包含了当前时间步之后的输入信息。之后经过拼接层将两个方向的输出在每个时间步上进行拼接,将正向和反向的信息结合起来,获得全局的输入信息;全连接层用于将拼接层输出的向量进行线性变换,以获得更高维度的特征表示;Dropout层用于避免过拟合问题,具体各层网络结构如图12所示:
所述多层感知机MLP,包括输入层、隐藏层和输出层,其中所述隐藏层被看作是输入层和输出层之间的虚拟一层,作为“二次输入”,层与层之间采用全连接的结构,跨层之间没有相连;通过隐藏层的加入,多层感知机弥补了单层线性回归的局限性,具体的网络结构图如图13所示;
为了提高预测结果的准确率以及更快收敛,将BiGRU网络的输出结果送入三层感知机中,将隐藏层与输出层进行全连接,即当前层的神经元连接前一层的所有神经元,BiGRU+MLP网络的具体结构如图14所示;
将DRSN-CS网络提取的健康指标作为BiGRU+MLP预测模型的输入,最终完成剩余使用寿命预测,基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法完整网络结构图如图15所示。
根据本发明优选的,所述预测方法,还包括:对所述BiGRU+MLP模型的准确度进行评价的方法,采用均绝对值误差和均方根误差进行评价:
平均绝对值误差,英文mean absolute error,英文简写MAE;均方根误差,英文Root Mean Square Error,英文简写RMSE,对模型的准确度进行评价,得到的损失值越小,说明预测值与真实值的误差越小,预测越准确,具体公式如下所示:
在公式(3)、(4)中,MAE表示预测值与真实值之间差值的绝对值的平均偏差;RMSE表示预测值和真实值之间差值的平方的平均偏差的平方根;n表示样本数量;表示第i个样本的预测标签值;yi表示第i个样本的真实标签值。
本发明的技术优点包括:
(1)考虑到实际的数据是在强噪声背景下采集的,采用一种面向强噪声数据的深度学习方法--深度残差收缩网络(DRSN-CS)作为特征提取网络,其将自适应信号降噪和特征提取集成到一个网络中,避免了传统的将二者分开处理时常出现的问题,即在信号降噪过程中误过滤掉一些有用的特征信息,导致后续的算法错误。
(2)结合输入数据为时间序列数据的特点,使用BiGRU网络,通过合并前向和后向信息流,更好地了解数据中的上下文和依赖关系,捕获和表示复杂特征,帮助模型做出更准确的预测。
(3)尽管在BiGRU在提取序列信息时,展现出强大的融合前后信息的能力,但在将输出结果映射到目标结果时,其收敛速度较慢,且预测波动较大,为此,将BiGRU的输出结果输入到三层感知机中,增强网络的非线性表达能力,加快收敛。
附图说明
图1是本发明机械轴承RUL预测方法流程示意图;
图2是工况1水平方向振动信号示意图;
图3是工况1垂直方向振动信号示意图;
图4是本发明中1.csv文件数据原始水平方向振动信号图;
图5a是本发明中1.csv文件数据原始水平方向振动信号图;
图5b是图5a归一化后的水平方向振动信号图;
图6是深度残差收缩网络结构图;
图7a是输入数据示意图;
图7b是本发明卷积核示意图;
图8是利用本发明所述Bearing1_3提取的一维退化特征示意图;
图9是Bearng1_3数据集健康指标;
图10是单个GRU网络结构图;
图11是BiGRU网络结构图;
图12是BiGRU各层网络结构图;
图13是多层感知机网络结构图;
图14是BiGRU+MLP预测模型结构图;
图15是DRSN-CS和BiGRU+MLP预测模型完整网络结构图;
图16是网络损失值示意图;
图17是BiGRU+MLP预测模型训练损失图;
图18是Bearing1_2数据集剩余寿命预测结果图。
具体实施方式
下面结合实施例和说明书附图对本发明做详细的说明,但不限于此。
实施例1、
如图1所示,一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,包括:
S1:使用Min-Max标准化方法对原始轴承振动信号数据集进行归一化处理;
S2:搭建DRSN-CS模型,将归一化后的数据集输入到DRSN-CS模型中,得到一维轴承退化特征;
S3:对一维轴承退化特征进行平滑处理,得到健康指标;划分预测模型的训练集和测试集;
S4:搭建BiGRU+MLP预测模型,将所述健康指标输入所述BiGRU+MLP预测模型,以训练最优BiGRU+MLP预测模型。
由于原始振动信号数据值的范围差异较大,且常包含一些奇异样本数据,这些奇异样本数据的存在会导致网络训练时间增加,甚至引起网络无法收敛;为了避免此类问题的出现以及方便后续数据的处理,加快网络学习速度,本发明使用Min-Max方法对原始振动信号数据集进行归一化操作,将所有样本的输入信号其均值接近对0或与其均方差相比很小,有效去除振动信号中幅值影响,使得信号的频率、相位等特征更加清晰,能够更好地进行轴承故障特征提取;
本发明以XJTU-SY滚动轴承加速寿命试验数据集中的Bearing1_3文件下的数据为例,将归一化结果进行可视化展示。Bearing1_3数据集是3号轴承在工况1下,以25.6kHz的采样频率,每间隔1min采集一次,采样时间持续1.28s,每次采集的样本点为32768,并将获取的振动信号保存为到CSV文件中,依次为1.csv、2.csv……158.csv,每个csv文件中包含水平方向和垂直方向的振动信号。具体描述如表1所示下:
表1 Bearing1_3数据集介绍
Bearing1_3数据集中1.csv文件中的原始振动信号数据如图4所示:
将原始振动信号数据集中的数据值映射到[0-1]区间内,转换函数如下:
在公式(1)中,X*为对当前数据点x归一化处理后的标准值;max为样本数据最大值;min为样本数据最小值;归一化后,如图5所示。
所述S2具体包括:
S21:搭建DRSN-CS模型,
所述DRSN-CS模型为深度残差收缩网络,结构图如图6所示,其包括:一个输入层、一个卷积层、若干残差网络、一个批标准化、一个ReLU激活函数、一个全局均值池化和一个全连接输出层;
所述残差网络包括:3个批标准化层、3个ReLU激活层、2个卷积层、全局均值池化层、2个全连接层、Sigmoid函数层以及一个跨层恒等路径;其中C表示输入数据的通道数,W表示输入数据的宽度,1表示输入数据的高度,K表示卷积核个数,Conv表示卷积层,M表示全连接层中的神经元数量,α表示放缩系数;“/2”表示通过以2的步长移动卷积核来减少输入数据的宽度;当K=C时,输出数据的通道数为C;针对以上输入数据高度为1的表述,是因为在本发明中,以一维振动信号作为输入,所有使得输入数据和卷积核的高度始终置为1,具体结构图如图7a、图7b所示;
S22:利用DRSN-CS模型提取一维轴承退化特征
根据S1中的描述可知,获取的数据在三种工况下取得,数据的采样频率为25,6kHz,每个1min记录一次,每次采样时间为1.28s,即每个样本包含了32768个采样点,获取的数据包含了水平方向振动信号和垂直方向振动信号,为了避免垂直方向受到外力后,导致主轴变换,从而对轴承垂直方向的振幅产生影响,只考虑水平方向振动信号;本发明中,在对原始水平方向振动信号归一化的基础上,以32768个采样点为一组构建数据集,最终的数据集大小为(32768*1);
将S1归一化处理后的数据集输入所述DRSN-CS模型,最终输出一维退化特征,并平滑处理得到健康指标;
所述DRSN-CS模型参数具体如表2所示:
表2 DRSN-CS模型参数
表3中,出现的(3,2,64),第一个参数代表卷积核大小,第二个参数代表步长,第三个参数代表卷积核个数;
以工况1下Bearing1_3数据集为例,图8为利用DRSN-CS模型提取一维轴承退化特征。
所述S3具体包括:采用简单移动平均算法对一维退化特征进行处理,使得数据更平滑,数据含噪声更少,过滤掉一些异常值;简单移动平均算法的计算公式如下所示:
在公式(2)中,Vt代表下一时刻的预测值,预测值代表经过简单移动平均方法平滑处理后的当前时刻的振动程度值,即是后续的健康指标;Vt-n代表前n时期的实际值,实际值代表原始的一维退化特征,也就是原始的振动程度值;平滑后得到的健康指标如图9所示。
所述S4的具体方法,包括:
所述BiGRU+MLP预测模型包括:长短时记忆网络LSTM、门控循环单元GRU和多层感知机MLP,其中门控循环单元GRU组成了双向门控循环单元BiGRU;
如图11所示,双向门控循环单元BiGRU通过一个正向GRU传递信息和一个反向GRU传递信息,从不同方向对输入数据进行特征提取,不仅可以学习到前一时刻数据对后一时刻数据产生的影响,也可以学习到后一时刻数据与前一时刻数据的关联关系,能够捕捉到被单向GRU忽视掉的时序特征,从而提高了模型预测的准确度;
所述双向门控循环单元BiGRU包括:一个输入层、一个正向GRU层、一个反向GRU层、一个拼接层以及一个Dropout层;所述正向GRU层负责将输入数据从前向后的信息编码到隐藏状态向量中,正向GRU层的隐藏状态向量包含了当前时间步以前的输入信息;反向GRU负责将输入数据从后向前的信息编码到隐藏状态向量中,反向GRU层的隐藏状态向量包含了当前时间步之后的输入信息。之后经过拼接层将两个方向的输出在每个时间步上进行拼接,将正向和反向的信息结合起来,获得全局的输入信息;全连接层用于将拼接层输出的向量进行线性变换,以获得更高维度的特征表示;Dropout层用于避免过拟合问题,具体各层网络结构如图12所示:
所述多层感知机MLP,包括输入层、隐藏层和输出层,其中所述隐藏层被看作是输入层和输出层之间的虚拟一层,作为“二次输入”,层与层之间采用全连接的结构,跨层之间没有相连;通过隐藏层的加入,多层感知机弥补了单层线性回归的局限性,具体的网络结构图如图13所示;
为了提高预测结果的准确率以及更快收敛,将BiGRU网络的输出结果送入三层感知机中,将隐藏层与输出层进行全连接,即当前层的神经元连接前一层的所有神经元,BiGRU+MLP网络的具体结构如图14所示;
将DRSN-CS网络提取的健康指标作为BiGRU+MLP预测模型的输入,最终完成剩余使用寿命预测,基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法完整网络结构图如图15所示。
实施例2、
如实施例1所述预测方法,还包括:对所述BiGRU+MLP模型的准确度进行评价的方法,采用均绝对值误差和均方根误差进行评价:
平均绝对值误差,英文mean absolute error,英文简写MAE;均方根误差,英文Root Mean Square Error,英文简写RMSE,对模型的准确度进行评价,得到的损失值越小,说明预测值与真实值的误差越小,预测越准确,具体公式如下所示:
在公式(3)、(4)中,MAE表示预测值与真实值之间差值的绝对值的平均偏差;RMSE表示预测值和真实值之间差值的平方的平均偏差的平方根;n表示样本数量;表示第i个样本的预测标签值;yi表示第i个样本的真实标签值。
结合上述实施例1、实施例2,对BiGRU+MLP预测模型训练及预测结果分析
训练BiGRU+MLP预测模型,将从DRSN-CS网络中获得的健康指标划分训练集train和验证集vaild,使用训练集训练出最佳预测模型,最终将测试集输入到最佳预测模型中进行剩余寿命预测。本发明选用工况1下的Bearing1_3数据提取的健康指标作为训练集,将工况1下的Bearing1_2数据提取的健康指标数据集作为测试集,用于剩余寿命预测。为方便训练标签的确定,根据实际健康指标长度,设置时间窗口的大小,由于本发明选用的健康指标长度较短,适当将时间窗口的大小调小,设置为5,即每连续取5个数据作为一个时间序列,即根据前5个时刻中的数据值预测下一时刻的数据值,移动步长为1。
训练标签以每个采样点间隔时间为单位,采用轴承剩余寿命占全寿命周期的百分比进行确定,根据轴承的已使用时间通过该标签可计算出轴承的使用寿命。该标签方法满足以下公式:
其中,Pt表示第t个时间序列的轴承使用寿命在全寿命周期的占比;T表示时间窗口的大小,本发明选择5;n表示全寿命周期,即采样点个数。
之后,将标记好的训练集输入到BiGRU+MLP预测模型中进行训练,根据上述描述可知,数据集进入到BiGRU+MLP预测模型中,依次经过输入层、正向GRU层、反向GRU层、连接层、Dropout层、感知机层1、感知机层2以及感知机层3,最终输出预测值。具体流程如下:
第一步:将上述得到的每个时间序列中的数据输入到输入层,输出序列output1,大小为(5*1)。
第二步:将第一步得到序列output1输入到正向GRU层,学习当前时间步之前的输入信息;本发明设置每层GRU的隐藏单元为128个,得到输出序列output2,大小为(5*128)。
第三步:将第一步得到的序列output1输入到反向GRU层中,学习当前时间步之后的输入信息;此层的隐藏单元依旧为128个,得到输出序列output3,大小为(5*128)。
第四步:将第二步正向GRU得到的输出output1和第三步反向GRU得到输出output2在同一时间步进行拼接,得到最终的BiGRU输出output4,大小为(5*256)。
第五步:将第四步得到的输出序列output4,输入到全连接层,将全连接层神经元与输出序列output4中的每个元素都连接,生成能够反映时间序列数据关键特征的新表示,达到降维和特征提取的作用;本发明中,设置全连接层的神经元个数为128,则得到输出序列output5,大小为(1*128)。
第六步:将第五步的输出序列outpu5输入到Dropout层进行正则化,避免在训练网络时出现过拟合问题,输出序列output6大小为(1*128)。
第七步:将第六步的输出序列output6,作为第一层感知机的输入,与该层中的隐藏层的神经元进行全连接;本发明设置第一层感知机中隐藏层的神经元个数为70,得到隐藏层输出output7,大小为(1*70)。
第八步:将第一层感知机中隐藏层的输出output7,作为第二层感知机的输入,与该层中的隐藏层的神经元进行全连接;本发明设置该层的隐藏层神经元个数为30,最后得到隐藏层的输出output8,大小为(1*30)。
第九步:将第二层感知机中隐藏层的输出output8,作为第三层感知机的输入,与该层中的隐藏层的神经元进行全连接,之后送入输出层进行输出;本发明设置该层的隐藏层神经元个数为1,最后得到输出即为剩余寿命预测值,大小为(1*1)。
BiGRU+MLP预测网络网络参数如下:
表3BiGRU+MLP预测网络参数
该网络的训练损失值如图16所示,可从图中看出,本发明使用的网络收敛效果较好,训练损失值较低。使用测试集进行相应轴承的剩余使用寿命预测,得到RMSE值为0.0149,MAE值为0.0138。下图为使用本发明中方法得到的预测值与真实值的对比示意图,如图17所示。
同时,使用本发明中方法得到的结果,在平均绝对值误差、均方根误差上均表现良好,证明了本发明提出方法对轴承剩余使用寿命预测的有效性,能够为滚动轴承剩余使用寿命预测研究提供参考,如图18所示。
具体应用场景:
选取XJTU-SY滚动轴承加速寿命试验数据集实施一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,具体包含以下步骤:
S1:获取轴承的全生命周期振动信号
获取轴承振动信号所用的轴承加速寿命测试平台由西安交通大学机械工程学院雷亚国教授团队联合实验室设计,由浙江长兴昇阳科技有限公司加工制造。为获取轴承的全寿命周期振动信号,分别通过安装在测试轴承的水平和垂直方向上的加速度传感器采集振动信号。试验设置的采样频率为25.6kHz,采样间隔为1min,每次采样时间为1.28s;且包含三种不同工况,如表4所示。原始信号的全寿命周期振动信号如图2和图3所示:
表4轴承加速寿命试验工况
S2:特征提取
由于原始振动信号数据值的范围差异较大,且常包含一些奇异样本数据,这些奇异样本数据的存在会导致网络无法收敛,甚至影响预测的准确率,所以采用Min-Max(最小最大)标准化方法对原始数据进行归一化处理,将值映射到[0-1]区间内,转换函数如下:
其中max为样本数据最大值,min为最小值,x为样本数据。
S3:搭建特征学习网络DRSN-CS
1、DRSN-CS基本网络结构
深度残差网络在卷积神经网络的基础上进行了改进,增加了一个残差学习结构,通过引入跨层恒等连接,降低了模型训练的难度,提高了特征学习能力。但在实际场景中,一些大型机器通常含有大量噪声,这导致残差网络的学习能力下降。为了减低噪声的干扰,深度残差收缩网络通过通道内共享阈值的方法对深度残差网络中的残差模块进行了改进。改进后的残差模块中,将一个软阈值函数作为非线性转换层,同时嵌入一个子网络,通过注意力机制自动设置软阈值化所需要的阈值。这种方式,通过之前的卷积层,将一些重要的特征转化成绝对值比较大的值,将不必要的特征转化成绝对值较小的值;之后通过子网络学习得到两者之间的界限;最终通过软阈值化将重要特征置为非零,不必要特征置为零进行输出。
完整的深度残差收缩网络结构图如图6所示。其包括了一个输入层、一个卷积层、若干残差模块、一个批标准化、一个ReLU激活函数、一个全局均值池化和一个全连接输出层。
其中残差模块包含了3个批标准化层、3个ReLU激活层、2个卷积层、全局均值池化层、2个全连接层、Sigmoid函数层以及一个跨层恒等路径。
其中C表示特征图的通道数,W表示特征图的宽度,K表示卷积核个数,Conv表示卷积层。当K=C时,输出的特征图的通道数为C。
2、搭建特征学习网络DRSN-CS,提取一维轴承退化特征
将步骤二中提取的特征数据集划分训练集和测试集,其中以32768个采样点为一组。本发明选用3*3的小卷积核,移动步长为2,卷积核个数为64,具体参数如表5所示。
表5DRSN网络结构参数
以工况下Bearing1_5数据集作为训练集,Bearing1_3数据集作为测试集,图16为DRSN-CS模型训练得到的损失值,图8为提取的一维退化特征;
3、退化特征平滑处理—健康指标
本发明采用简单移动平均算法对一维退化特征进行处理,使得数据更平滑,数据含噪声更少,过滤掉一些异常值。简单移动平均算法的计算公式如下所示:
其中,Vt代表下一时刻的预测值;Vt-n代表前n时期的实际值。
平滑后得到的健康指标如图9所示。
S4:搭建BiGRU+MLP预测模型,输出预测结果
1、BiGRU+MLP基本网络结构
2、BiGRU+MLP模型
3、性能评价指标
4、BiGRU+MLP模型训练及预测结果分析
本发明选用工况1下的Bearing1_5数据提取的健康指标作为训练集,选取[0,52]范围内的数据,设置对应的训练标签为[52:0];将工况1下的Bearing1_3数据提取的健康指标数据集作为验证集,用于验证模型训练的好坏,设置对应的标签为[158:0]。在训练过程中,选择Adam算法作为优化器,训练次数为100;在多次实验中优化参数,最终确定最佳批处理大小(batch_size)为64,过拟合率(dropout)为0.2,学习率(learn rate)为0.0004。具体如表6所示。
表6网络训练相关参数
根据以上内容可知,使用本发明中方法得到的结果,在平均绝对值误差、均方根误差上均表现良好,证明了本发明提出方法对轴承剩余使用寿命预测的有效性,能够为滚动轴承剩余使用寿命预测研究提供参考。
Claims (6)
1.一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,其特征在于,包括:
S1:使用Min-Max标准化方法对原始轴承振动信号数据集进行归一化处理;
S2:搭建DRSN-CS模型,将归一化后的数据集输入到DRSN-CS模型中,得到一维轴承退化特征;
S3:对一维轴承退化特征进行平滑处理,得到健康指标;划分预测模型的训练集和测试集;
S4:搭建BiGRU+MLP预测模型,将所述健康指标输入所述BiGRU+MLP预测模型,以训练最优BiGRU+MLP预测模型。
2.根据权利要求1所述一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,其特征在于,在S1中,对轴承的全生命周期振动信号进行Min-Max归一化处理,将数据集中的数据值映射到[0-1]区间内,转换函数如下:
在公式(1)中,X*为对当前数据点x归一化处理后的标准值;max为样本数据最大值;min为样本数据最小值。
3.根据权利要求1所述一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,其特征在于,所述S2具体包括:
S21:搭建DRSN-CS模型,
所述DRSN-CS模型为深度残差收缩网络,包括:一个输入层、一个卷积层、若干残差网络、一个批标准化、一个ReLU激活函数、一个全局均值池化和一个全连接输出层;
所述残差网络包括:3个批标准化层、3个ReLU激活层、2个卷积层、全局均值池化层、2个全连接层、Sigmoid函数层以及一个跨层恒等路径;
S22:利用DRSN-CS模型提取一维轴承退化特征
将S1归一化处理后的数据集输入所述DRSN-CS模型,最终输出一维退化特征,并平滑处理得到健康指标。
4.根据权利要求1所述一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,其特征在于,所述S3具体包括:采用简单移动平均算法对一维退化特征进行处理,简单移动平均算法的计算公式如下所示:
在公式(2)中,t代表下一时刻的预测值,预测值代表经过简单移动平均方法平滑处理后的当前时刻的振动程度值,即是后续的健康指标;Vt-n代表前n时期的实际值,实际值代表原始的一维退化特征,也就是原始的振动程度值。
5.根据权利要求1所述一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,其特征在于,所述S4的具体方法,包括:
所述BiGRU+MLP预测模型包括:长短时记忆网络LSTM、门控循环单元GRU和多层感知机MLP,其中门控循环单元GRU组成了双向门控循环单元BiGRU;
所述双向门控循环单元BiGRU包括:一个输入层、一个正向GRU层、一个反向GRU层、一个拼接层以及一个Dropout层;所述正向GRU层负责将输入数据从前向后的信息编码到隐藏状态向量中,正向GRU层的隐藏状态向量包含了当前时间步以前的输入信息;反向GRU负责将输入数据从后向前的信息编码到隐藏状态向量中,反向GRU层的隐藏状态向量包含了当前时间步之后的输入信息。之后经过拼接层将两个方向的输出在每个时间步上进行拼接,将正向和反向的信息结合起来,获得全局的输入信息;全连接层用于将拼接层输出的向量进行线性变换,以获得更高维度的特征表示;Dropout层用于避免过拟合问题:
所述多层感知机MLP,包括输入层、隐藏层和输出层,其中所述隐藏层被看作是输入层和输出层之间的虚拟一层,作为“二次输入”;
将BiGRU网络的输出结果送入三层感知机中,将隐藏层与输出层进行全连接,即当前层的神经元连接前一层的所有神经元;
将DRSN-CS网络提取的健康指标作为BiGRU+MLP预测模型的输入,最终完成剩余使用寿命预测。
6.根据权利要求1-5任意一项所述一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,其特征在于,所述预测方法,还包括:对所述BiGRU+MLP模型的准确度进行评价的方法,采用均绝对值误差和均方根误差进行评价:
平均绝对值误差,英文mean absolute error,英文简写MAE;均方根误差,英文RootMean Square Error,英文简写RMSE,具体公式如下所示:
在公式(3)、(4)中,MAE表示预测值与真实值之间差值的绝对值的平均偏差;RMSE表示预测值和真实值之间差值的平方的平均偏差的平方根;n表示样本数量;表示第i个样本的预测标签值;yi表示第i个样本的真实标签值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310671850.3A CN116842379A (zh) | 2023-06-06 | 2023-06-06 | 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310671850.3A CN116842379A (zh) | 2023-06-06 | 2023-06-06 | 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116842379A true CN116842379A (zh) | 2023-10-03 |
Family
ID=88159080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310671850.3A Pending CN116842379A (zh) | 2023-06-06 | 2023-06-06 | 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116842379A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077327A (zh) * | 2023-10-18 | 2023-11-17 | 国网山东省电力公司鱼台县供电公司 | 基于数字孪生的轴承寿命预测方法及系统 |
CN117390413A (zh) * | 2023-10-19 | 2024-01-12 | 东北电力大学 | 分布式电力光纤振动信号降噪与时序特征提取的识别方法 |
CN118519043A (zh) * | 2024-07-23 | 2024-08-20 | 杭州神驹科技有限公司 | 基于rnn循环神经网络的新能源矿卡的电池故障预测方法 |
CN118643294A (zh) * | 2024-06-17 | 2024-09-13 | 长春工程学院 | 一种基于深度学习混合模型的轴承寿命预测方法 |
CN118673284A (zh) * | 2024-05-20 | 2024-09-20 | 重庆邮电大学 | 一种基于大数据的工业轴承剩余使用寿命预测方法 |
CN119004118A (zh) * | 2024-10-24 | 2024-11-22 | 山东和光智慧能源科技有限公司 | 一种热力管道寿命预测方法 |
-
2023
- 2023-06-06 CN CN202310671850.3A patent/CN116842379A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077327A (zh) * | 2023-10-18 | 2023-11-17 | 国网山东省电力公司鱼台县供电公司 | 基于数字孪生的轴承寿命预测方法及系统 |
CN117390413A (zh) * | 2023-10-19 | 2024-01-12 | 东北电力大学 | 分布式电力光纤振动信号降噪与时序特征提取的识别方法 |
CN117390413B (zh) * | 2023-10-19 | 2024-06-14 | 东北电力大学 | 分布式电力光纤振动信号降噪与时序特征提取的识别方法 |
CN118673284A (zh) * | 2024-05-20 | 2024-09-20 | 重庆邮电大学 | 一种基于大数据的工业轴承剩余使用寿命预测方法 |
CN118673284B (zh) * | 2024-05-20 | 2025-06-17 | 重庆邮电大学 | 一种基于大数据的工业轴承剩余使用寿命预测方法 |
CN118643294A (zh) * | 2024-06-17 | 2024-09-13 | 长春工程学院 | 一种基于深度学习混合模型的轴承寿命预测方法 |
CN118519043A (zh) * | 2024-07-23 | 2024-08-20 | 杭州神驹科技有限公司 | 基于rnn循环神经网络的新能源矿卡的电池故障预测方法 |
CN119004118A (zh) * | 2024-10-24 | 2024-11-22 | 山东和光智慧能源科技有限公司 | 一种热力管道寿命预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A deep learning approach for anomaly detection based on SAE and LSTM in mechanical equipment | |
CN116842379A (zh) | 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 | |
CN113505655B (zh) | 面向数字孪生系统的轴承故障智能诊断方法 | |
CN108444708A (zh) | 基于卷积神经网络的滚动轴承智能诊断模型的建立方法 | |
CN116793682A (zh) | 基于iCORAL-MMD和对抗迁移学习的轴承故障诊断方法 | |
WO2019080367A1 (zh) | 一种机械设备健康状态评估方法 | |
CN111914883A (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
KR102416474B1 (ko) | 기계학습 기반 고장 진단 장치 및 방법 | |
CN111931625B (zh) | 基于非对称损失神经网络的产品关键零件剩余寿命预测方法 | |
Xu et al. | Hierarchical multiscale dense networks for intelligent fault diagnosis of electromechanical systems | |
Son et al. | Deep learning-based anomaly detection to classify inaccurate data and damaged condition of a cable-stayed bridge | |
Shajihan et al. | CNN based data anomaly detection using multi-channel imagery for structural health monitoring | |
CN112926644A (zh) | 一种滚动轴承剩余使用寿命预测方法及系统 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
KR102373827B1 (ko) | 표준 운용 수준 평가 기반 산업 설비 운용 제어 장치 및 그 동작 방법 | |
CN106271881A (zh) | 一种基于SAEs和K‑means的刀具破损监测方法 | |
Wang et al. | Fault detection and isolation of floating wind turbine pitch system based on Kalman filter and multi-attention 1DCNN | |
CN106656669A (zh) | 一种基于阈值自适应设置的设备参数异常检测系统及方法 | |
CN117909668A (zh) | 基于卷积神经网络的轴承故障诊断方法及系统 | |
Oh et al. | Fault detection for lubricant bearing with CNN | |
CN117171907A (zh) | 一种滚动轴承剩余寿命预测方法及系统 | |
Mohiuddin et al. | Performance analysis of bearing fault diagnosis using convolutional neural network | |
Qi et al. | Remaining useful life prediction combining advanced anomaly detection and graph isomorphic network | |
Ning et al. | An intelligent device fault diagnosis method in industrial internet of things | |
CN118971360A (zh) | 基于物联网的供电异常监测平台及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |