CN110737952A

CN110737952A - 一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法

Info

Publication number: CN110737952A
Application number: CN201910877113.2A
Authority: CN
Inventors: 丁华; 杨亮亮; 陈思红; 王义亮
Original assignee: Taiyuan University of Technology
Current assignee: Taiyuan University of Technology
Priority date: 2019-09-17
Filing date: 2019-09-17
Publication date: 2020-01-31

Abstract

本发明属于机械设备关键零部件使用寿命技术领域，公开了一种结合AE和bi‑LSTM的机械设备关键零部件剩余寿命预测方法，包括以下步骤：通过自编码机对输入数据进行特征提取；对特征提取后的数据进行划分，得到训练集和测试集；构建双向LSTM预测模型，所述双向LSTM预测模型中，LSTM网络隐藏层包括前向层和后向层，通过训练集数据和测试集数据进行训练，直至评价指标接近最优，保存双向LSTM预测模型及其参数；S5、将待预测数据输入双向LSTM预测模型中，输出预测寿命。本发明提高了预测结果，可以应用于机械零件寿命预测领域。

Description

一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法

技术领域

本发明属于机械设备关键零部件使用寿命技术领域，具体涉及一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法。

背景技术

双长短时记忆神经网络(bi-directionallong short-term memory,bi-LSTM)被广泛应用于自然语言识别，文本分析等方面，但是很少用于机械设备关键零部件剩余寿命预测中。现有的用于机械设备关键零部件的特征提取方法有待改善，其剩余寿命预测方法的准确性有待进一步提升。现有的关于机械设备剩余寿命预测方法通过对历史数据的单向学习(依据时间序列，按照时间递进关系进行剩余寿命预测模型训练)，仅依据历史监测数据进行特征学习并预测将来的剩余寿命，并未考虑将来数据中的特征，导致预测结果存在片面性，预测准确率有待进一步提升。而且，对于多特征的数据，直接输入预测模型导致预测模型结构复杂，参数冗余，模型进行调参困难，最终导致模型的运算速度降低，其预测准确率也有待提升。

发明内容

针对现有机械设备关键零部件剩余寿命预测准确率低，其特征提取困难等问题，本发明提供了一种基于自编码器(autoencoder,AE)和bi-LSTM的机械设备关键零部件剩余寿命预测方法，以提高机械设备关键零部件剩余寿命预测的精度。

为了解决上述技术问题，本发明采用的技术方案为：一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，包括以下步骤：

S1、通过自编码机对输入数据进行特征提取；

S2、对特征提取后的数据进行划分，得到训练集和测试集；

S3、构建双向LSTM预测模型，通过训练集数据对双向LSTM预测模型进行训练，实现模型参数优化，然后确定训练次数、模型层数、模型具体结构以及每一层神经元的数目，并保存训练好的模型；

S4、将测试集数据输入到训练好的模型中，计算评价指标并判断是否接近最优，若是，则训练结束，若否，则调整双向LSTM预测模型的参数，返回步骤S3重新训练，直至评价指标接近最优，保存双向LSTM预测模型及其参数；

S5、将待预测数据输入步骤S4得到的双向LSTM预测模型中，输出预测寿命；

所述双向LSTM预测模型中，LSTM网络隐藏层包括前向层和后向层，每一项训练序列分别参加前向层和后向层的训练，前向层和后向层分别输出当前时刻的预测结果，输出层将前向层和后向层的预测结果进行综合分析，输出网络的最后预测结果。

所述步骤S1中，所述自编码机包括编码结构和解码结构，所述编码结构用于对输入层的信息进行编码，编码之后的特征通过隐藏层输出，所述解码结构用于对隐藏层的输出的特征进行解码，解码之后的结果通过输出层输出，自编码机通过对比网络输入数据和输出数据，以各自对应的差值作为目标函数，通过BP网络进行反向调参，完成自编码网络的优化。

所述双向LSTM预测模型中，后向层中神经元的计算公式为：

其中，

表示后向层中遗忘门在t时刻的输出，

表示后向层中遗忘门的运算系数，表示后向层中t+1时刻单元模块的输出，

为后向层中遗忘门的偏置参数，

表示后向层中输入门的更新层的值，表示后向层的输入门中更新层的权重，

表示后向层的输入门中更新层的偏置参数，

表示后向层中的输入门的状态层的新的候选向量，表示后向层中的输入门的状态层的值；

表示后向层的输出门中更新层的值，表示后向层的输出门中状态层的值。

所述双向LSTM预测模型中，前向层中各神经元的运算公式为：

其中，

表示前向层中遗忘门在t时刻的输出，σ表示sigmoid激活函数,

表示前向层中遗忘门的运算系数，

表示前向层中t-1时刻单元模块的输出，x_t表示t时刻单元模块的输入，

表示前向层中遗忘门的偏置参数；

表示前向层中输入门的更新层的值，表示前向层的输入门中更新层的权重，

表示前向层的输入门中更新层的偏置参数，

表示前向层中的输入门的状态层的新的候选向量，表示前向层中的输入门的状态层的值；

表示前向层的输出门中更新层的值，

表示前向层的输出门中状态层的值。

前向层的输出

和后向层的输出

通过双向长短时记忆神经网络的回归层连接运算，得到输出

输出

的计算公式为：

所述步骤S3中的训练方法具体为：通过训练集数据对双向LSTM预测模型进行训练，判断预测模型的交叉熵值是否达到设定值，若是，则保存训练好的模型，若否，则采用随时间反向传播的算法进行反向调参，调整模型中前向层和后向层中的输入门、遗忘门和输出门的权重以及偏置，重复进行训练，直至交叉熵达到设定值，然后保存训练好的模型。

模型的交叉熵的计算公式为：

其中，N表示参加训练的数据量，y_pi表示对第i个输入的预测值，y_ti表示第i个输入对应的实际值。

所述步骤S4中，将测试集数据输入到训练好的模型中，若评价指标未接近最优，则通过调整双向LSTM预测模型的训练次数，隐藏层神经元数目以及隐藏层的深度，然后返回步骤S3重新训练，直至各个评价指标接近最优。

所述评价指标包括均方根误差RMSE、拟合优度检验R²、平均绝对百分误差MAPE和分值函数score。

本发明与现有技术相比具有以下有益效果：

1、本发明通过AE对输入数据进行特征提取，实现数据的降维和特征提取，避免特征过多导致预测模型冗余复杂的现象；

2、本发明构建bi-LSTM剩余寿命预测模型，通过历史数据进行模型训练，利用bi-LSTM模型的双向特征学习，提高模型特征学习能力和预测能力；

3、本发明将AE提取的特征输入bi-LSTM预测模型中进行剩余寿命预测，提高剩余寿命预测精度，提高预测手段智能化。

附图说明

图1为本发明实施例提供的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法的流程图；

图2为本发明实施例中应用的自编码器的机构示意图；

图3为LSTM模型的结构框架示意图；

图4为本发明实施例构建的bi-LSTM双向长短时记忆神经网络的结构示意图；

图5为结合AE自编码后，bi-LSTM与其他几种对比模型的对比实验的预测效果对比图；(a)RNN；(b)bi-RNN；(c)LSTM；(d)bi-LSTM。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，包括以下步骤：

S1、通过自编码机对输入数据进行特征提取；

首先，为了避免噪音对数据分析结果的影响，对原始数据进行去噪；然后，将去噪后的数据输入AE模型中提取特征。

本实施例中，特征提取基于自编码机(auto-encoder,AE)实现，AE是一种自监督学习模型，在神经网络进行学习中，输入数据的特征与输出数据的特征维度一样，网络的编码结构和解码结构关于隐藏层对称。自编码机通过编码(encoder)结构对输入层的信息进行编码，隐藏层输出编码之后的特征，然后解码(decoder)结构对隐藏层的特征进行解码，输出层输出解码之后的结果。分别对比网络输入数据和输出数据，以各自对应的差值作为目标函数进行网络的反向调参和优化，具体结构如图2所示。隐藏层的值为编码器编码之后的结果，也是AE提取的特征。也就是说，自编码机包括编码结构和解码结构，所述编码结构用于对输入层的信息进行编码，编码之后的特征通过隐藏层输出，所述解码结构用于对隐藏层的输出的特征进行解码，解码之后的结果通过输出层输出，自编码机通过对比网络输入数据和输出数据，以各自对应的差值作为目标函数，通过BP网络进行反向调参，完成自编码网络的优化。

自编码器的输入数据为X＝(X₁,X₂,···,X_n)，自编码器的编码输出结果为H＝(h₁,h₂,···,h_m),其解码输出为AE编码器运算为：

H＝f_e(W*X+b)； (1)

其中，W表示编码器的权重，f_e表示编码器的激活函数，b表示偏置。

解码层的输入为编码层的输出，即隐藏层的特征H，则AE解码器运算为：

其中，W′表示解码器的权重，f_d表示解码器的激活函数，b′表示偏置。

该网络的损失函数设置为编码器的输入数据和输出数据的差值，通过BP网络进行反向调参，实现输出数据和输入数据的无限接近，完成网络的优化。

S2、对特征提取后的数据进行划分，得到训练集和测试集。训练集用于模型训练，测试集进行模型预测性能的测试。

S3、构建双向LSTM预测模型，通过训练集数据对双向LSTM预测模型进行训练，实现模型对数据特征的双向学习，通过测试集验证模型的有效性。

首先介绍下LSTM模型。为了避免因循环神经网络(recurrent neural network，RNN)深度过大引起梯度爆炸或消失现象，对其结构进行改进得到LSTM。通常LSTM单元模块由遗忘门(forget gate)，输入门(input gate)，输出门(output gate)组成，通过三个门的协同控制完成信息的丢弃和记忆，实现对梯度爆炸或梯度消失现象的抑制。其结构如图3所示。

遗忘门通过激活函数σ控制对上一单元的输出h_t-1的遗忘程度，其中σ的变化范围为[0，1]。当σ＝0时表示彻底遗忘该信息，当σ＝1时表示完全保留该信息。遗忘门的计算公式为：

f_t＝σ(W_f·[h_t-1，x_t]+b_f)； (3)

其中，f_t表示遗忘门的输出，σ为sigmoid激活函数，W_f表示遗忘门的运算系数，h_t-1表示t-1时刻单元模块的输出，x_t表示t时刻单元模块的输入，b_f为对应的偏置参数。

输入门由sigmoid层和tanh层组成。sigmoid层为更新层，tanh层为状态层，更新层确定需要更新的值，由t-1时刻的输出h_t-1和t时刻的输入x_t决定，更新层的值i_t的计算公式为式(4)。tanh层产生新的候选向量其计算公式为式(5)所示。更新层在状态更新之后丢弃掉需要丢弃的信息，并将保留的信息与新产生的信息结合，更新细胞的状态，使细胞状态，即输入门的状态层的值，由t-1时刻的c_t-1更新为t时刻的c_t，如式(4)所示。

i_t＝σ(W_i·[h_t-1，x_t]+b_i)； (4)

式中，i_t表示输入门的更新层的值，W_i表示更新层的权重，b_i表示更新层的偏置，W_c表示产生新向量层的权重，b_t表示状态层的偏置，

表示t时刻输入门的状态层产生的新的候选向量。

输出门也包含sigmoid更新层和tanh状态层。sigmoid层确定细胞将要输出状态的部分，输出门中更新层的值o_t的计算公式式(7)所示。tanh状态层将细胞输出状态部分变为[-1，1]之间的值。两层运算结果相乘得到最后的输出结果，即输出门在t时刻的输出h_t的值，其计算如式(8)所示。

o_t＝σ(W_o·[h_t-1，x_t]+b_o)； (7)

h_t＝o_t*tanh(c_t)； (8)

σ表示sigmoid激活函数，W_o表示sigmoid层的权重，b_o表示输出门的偏置。

上述LSTM仅仅考虑单向的信息流动，即信息从上一时刻向下一时刻传输，未能考虑未来信息。为了使模型学习的特征更加完整，提高模型预测准确率，在神经网络进行特征学习时，实现信息双向流动，完成模型对前向信息和后向信息的学习，本申请采用了双向长短时记忆神经网络模型(双向LSTM模型，即bi-LSTM模型)。

双向LSTM模型为LSTM的一种变异，即在LSTM网络隐藏层中添加一类后向层，使信息由后向前流动，学习未来数据的特征。通过前向层和后向层达到信息双向流动，实现网络对信息的双向学习。双向LSTM网络的前向层和后向层训练过程与LSTM模型前向层训练一样，其展开结构如图4所示。每一项训练序列分别参加前向层和后向层的训练，前向层和后向层分别输出当前时刻的预测结果，输出层将两类预测结果进行综合分析，输出网络的最后预测结果。在此过程中，前向层负责顺序训练，学习历史数据中的特征。后向层进行倒序训练，学习未来数据中的特征。

前向层中神经元的运算如式(9)所示：

其中，

表示前向层中遗忘门在t时刻的输出，σ表示sigmoid激活函数，

表示前向层中遗忘门的运算系数，

表示前向层中遗忘门的偏置参数；

表示前向层中输入门的更新层的值，

表示前向层的输入门中更新层的权重，

表示前向层的输入门中更新层的偏置参数，

表示前向层中的输入门的状态层产生的新的候选向量，

表示前向层中输入门的状态层的偏置参数，表示前向层中的输入门的状态层的值；

表示前向层的输出门中更新层的值，表示前向层的输出门中更新层的偏置，

表示前向层的输出门的输出值。

后向层中神经元的运算如式(10)所示：

其中，

表示后向层中遗忘门在t时刻的输出，表示后向层中遗忘门的运算系数，

表示后向层中t+1时刻单元模块的输出，为后向层中遗忘门的偏置参数，表示后向层中输入门的更新层的值，表示后向层的输入门中更新层的权重，

表示后向层的输入门中更新层的偏置参数，

表示后向层中的输入门的状态层产生的新候选向量，

表示后向层中输入门的状态层的偏置参数，

表示后向层中的输入门的状态层的值；表示后向层的输出门中更新层的值，表示后向层的输出门中更新层的偏置，表示后向层的输出门的值。

最后，前向层的输出

和后向层的输出

通过双向长短时记忆神经网络的回归层连接运算，得到模型的输出

输出

的计算公式为：

步骤S3中，首先利用python语言实现bi-LSTM预测模型，然后用训练集进行双向LSTM模型的训练，使模型学习到不同阶段的特征，进行参数优化，调整模型的层数、模型的具体结构及神经元的数量，直至训练集中的预测值和实际值的均方误差达到最小，训练预测结果达到最优。确定训练次数、模型层数、模型具体结构以及每一层神经元的数目，保存模型。

步骤S3的训练方法具体为：通过训练集数据对双向LSTM预测模型进行训练，判断预测模型的交叉熵值是否达到设定值，若是，则保存训练好的模型，若否，则采用随时间反向传播的算法进行反向调参，调整模型中前向层和后向层中的输入门、遗忘门和输出门的权重以及偏置，重复进行训练，直至交叉熵达到设定值，然后保存训练好的模型。其中，交叉熵的计算公式为：

其中，N表示参加训练的数据量，y_pi表示第i个输入的预测值，y_ti表示第i个输入对应的实际值。

S4、将测试集数据输入到训练好的模型中，计算评价指标并判断是否接近最优，若是，则说明模型参数优化达到要求；若否，则调整双向LSTM预测模型的参数，包括训练次数、隐藏层神经元数目、隐藏层深度、然后返回S3中的步骤，调整输入门、输出门和遗忘门的权重和偏置，重新训练，至预测值和实际值的均方误差达到最小后，再判断评价指标是否接近最优，若否，重新调整双向LSTM预测模型的参数，不断循环，直至评价指标接近最优，保存双向LSTM预测模型及其参数。

其中，评价指标可以包括方根误差RMSE、拟合优度检验R²、平均绝对百分误差MAPE和分值函数score，方根误差RMSE的表达式为：

预测分析中，RMSE越接近0，代表预测结果越精确。拟合优度检验R²的表达式为：

其中，

表示预测的均值，R²值越接近1，代表预测结果越好。平均绝对百分误差(MAPE)不仅仅考虑预测值与真实值之间的误差，其表达式为：

其中，y_ti表示第i组输入数据的寿命实际值，y_pi表示第i组输入数据的寿命预测值。分值函数score的计算公式为：

其中，d_i＝y_pi-y_ti，Score值越接近0，代表预测结果越精确。

本发明提供了一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，基于辛辛那提大学轴承全寿命周期退化实验数据，进行了对比实验，通过对比实验发现，本发明可以提高预测结果的精度。

首先对比了AE自编码对预测效果的影响，几种对比实验的模型预测指标值如表1所示。

表1 AE对比实验模型预测指标值

表1中“Direct”表示将数据直接输入预测模型中，“AE”表示将数据经过AE模型进行编码，将得到的编码特征作为预测模型的输入，其中选取的对比模型有RNN，bi-RNN，LSTM模型，表中黑色字体代表效果最好的值。对比值可知AE不仅可以有效提高预测模型的精度，还可以减少模型运算时间，提高运算效率。

然后进行结合AE自编码后，bi-LSTM与其他几种对比模型的对比实验，其预测效果见图5所示，预测指标值见表2所示。

表2 bi-LSTM模型对比实验预测指标值

由图5和表2对比可知，当同时结合AE时，bi-LSTM模型的预测效果最好，其预测性能最好。图5中虚线代表实际剩余寿命，实线代表预测剩余寿命趋势，黄色区域代表95％置信区间，底部阴影区代表预测的剩余寿命预测实际的剩余寿命差值的绝对值。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，包括以下步骤：

S1、通过自编码机对输入数据进行特征提取；

S2、对特征提取后的数据进行划分，得到训练集和测试集；

2.根据权利要求1所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，所述步骤S1中，所述自编码机包括编码结构和解码结构，所述编码结构用于对输入层的信息进行编码，编码之后的特征通过隐藏层输出，所述解码结构用于对隐藏层的输出的特征进行解码，解码之后的结果通过输出层输出，自编码机通过对比网络输入数据和输出数据，以各自对应的差值作为目标函数，通过BP网络进行反向调参，完成自编码网络的优化。

3.根据权利要求1所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，所述双向LSTM预测模型中，后向层中神经元的计算公式为：

其中，表示后向层中遗忘门在t时刻的输出，表示后向层中遗忘门的运算系数，表示后向层中t+1时刻单元模块的输出，

为后向层中遗忘门的偏置参数，

表示后向层中输入门的更新层的值，

表示后向层的输入门中更新层的权重，

表示后向层的输入门中更新层的偏置参数，

表示后向层中的输入门的状态层的新的候选向量，

表示后向层中的输入门的状态层的值；

表示后向层的输出门中更新层的值，

表示后向层的输出门中状态层的值。

4.根据权利要求3所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，所述双向LSTM预测模型中，前向层中各神经元的运算公式为：

其中，

表示前向层中遗忘门在t时刻的输出，σ表示sigmoid激活函数,

表示前向层中遗忘门的运算系数，

表示前向层中t-1时刻单元模块的输出，x_t表示t时刻单元模块的输入，表示前向层中遗忘门的偏置参数；表示前向层中输入门的更新层的值，表示前向层的输入门中更新层的权重，

表示前向层的输入门中更新层的偏置参数，

表示前向层中的输入门的状态层的新的候选向量，

表示前向层中的输入门的状态层的值；

表示前向层的输出门中更新层的值，

表示前向层的输出门中状态层的值。

5.根据权利要求4所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，前向层的输出

和后向层的输出

通过双向长短时记忆神经网络的回归层连接运算，得到输出

输出

的计算公式为：

6.根据权利要求1所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，所述步骤S3中的训练方法具体为：通过训练集数据对双向LSTM预测模型进行训练，判断预测模型的交叉熵值是否达到设定值，若是，则保存训练好的模型，若否，则采用随时间反向传播的算法进行反向调参，调整模型中前向层和后向层中的输入门、遗忘门和输出门的权重以及偏置，重复进行训练，直至交叉熵达到设定值，然后保存训练好的模型。

7.根据权利要求6所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，模型的交叉熵MSE的计算公式为：

8.根据权利要求6所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，所述步骤S4中，将测试集数据输入到训练好的模型中，若评价指标未接近最优，则通过调整双向LSTM预测模型的训练次数，隐藏层神经元数目以及隐藏层的深度，然后返回步骤S3重新训练，直至各个评价指标接近最优。

9.根据权利要求8所述的一种结合AE和bi-LSTM的机械设备关键零部件剩余寿命预测方法，其特征在于，所述评价指标包括均方根误差RMSE、拟合优度检验R²、平均绝对百分误差MAPE和分值函数score。