CN114925809A

CN114925809A - 基于lstm的印刷机轴承故障诊断方法及装置

Info

Publication number: CN114925809A
Application number: CN202210399169.3A
Authority: CN
Inventors: 魏煦航; 杨树林; 李旸; 王佳; 杨彦红
Original assignee: Beijing Institute of Graphic Communication
Current assignee: Beijing Institute of Graphic Communication
Priority date: 2022-04-13
Filing date: 2022-04-13
Publication date: 2022-08-19
Anticipated expiration: 2042-04-13
Also published as: CN114925809B

Abstract

基于LSTM的印刷机轴承故障诊断方法及装置，能够解决印刷机轴承故障预警问题，减少非计划停机，提高轴承使用寿命，降低印刷设备故障率。方法包括：(1)建立作用在时域振动信号上的长短期记忆网络模型；(2)使用该模型对轴承的时域振动信号进行诊断；(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验，获取故障识别率。

Description

基于LSTM的印刷机轴承故障诊断方法及装置

技术领域

本发明涉及印刷装备运转监测的技术领域，尤其涉及一种基于LSTM的印刷机轴承故障诊断方法，以及基于LSTM的印刷机轴承故障诊断装置。

背景技术

印刷装备正朝着高速化、精密化、系统化和自动化的方向发展，印刷装备的健康检测系统日益完善，装备运转监测数据已经逐步迈入海量数据的“大数据”时代。利用先进的故障诊断方法对印刷装备进行有效的故障检测、诊断，是保证装备健康、稳定运行的关键。轴承作为印刷装备中最为重要的零件，分析其故障及损坏情况，可以帮助我们改进工作，提高轴承使用寿命，降低印刷设备故障率。

轴承故障诊断的核心方法在于信号特征的提取与模式分类两个部分。在轴承故障诊断领域，常见的特征提取算法有快速傅里叶变化，小波变换以及信号的统计学特征等，常见的模式分类算法有近邻分类器，BP神经网络(也称多层感知器)，卷积神经网络等。当下轴承故障诊断的研究热点可以归结为3类：寻找更好的特征表达；寻找最适合的特征表达以及分类器的组合；以及发明新的传感器。

发明内容

为克服现有技术的缺陷，本发明要解决的技术问题是提供了一种基于LSTM的印刷机轴承故障诊断方法，其能够解决印刷机轴承故障预警问题，减少非计划停机，提高轴承使用寿命，降低印刷设备故障率。

本发明的技术方案是：这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法，其包括以下步骤：

(1)建立作用在时域振动信号上的长短期记忆网络模型；

(2)使用该模型对轴承的时域振动信号进行诊断；

(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验，获取故障识别率；

所述步骤(1)中，长短期记忆网络模型包含四个神经网络层：

遗忘门层：由Sigmod层组成，决定什么信息应该被神经元遗忘；输入h_t-1和x_t，然后在C_t-1的每个神经元状态输出0～1之间的数字，1表示完全保留，0表示完全忘记

f_t＝σ(W_f·[h_t-1,x_t]+b_f) (1)

式中：σ为sigmoid激活函数；W_f为权重；b_f为偏置；x_t为当前样本输入，h_t-1为上一序列输出；

输入层：由Sigmod层组成，决定要更新的数值；

tanh层：生成一个新的候选数值

被增加到神经元状态中；

组合输入层和tanh层这两层生成一个更新状态值，决定神经元要保存什么信息

i_t＝σ(W_i·[h_t-1,x_t]+b_i) (2)

式中：i_t代表输入层对新信息的更新程度；

为当前新状态信息的候选向量；f_t*C_t-1表示需要忘记的信息；

表示需要保留的信息；C_t代表当前细胞状态；

输出层：建立在神经元状态的基础上，拥有一个滤波器；首先使用Sigmod层决定哪一部分的神经元状态需要被输出，然后让神经元状态经过tanh层并乘上Sigmod门限的输出

o_t＝σ(W_o·[h_t-1,x_t]+b_o) (5)

h_t＝o_t*tanh(C_t) (6)

式中：o_t表示输出层的信息输出；h_t为隐藏层的输出，同时也将输入到下一个LSTM单元。

在传统的循环神经网络中，训练算法一般采用反向传播，当数据为长时间序列时，返回的残差呈指数递减，导致模型权重更新逐渐缓慢，最终呈现出无变化趋势，因此需要一个存储单元来存储丢失的历史信息，本发明选择长短期记忆网络是因为它在处理时间序列数据上具有优势，然后使用该模型对轴承的时域振动信号进行诊断，最后选取凯斯西储大学轴承数据库的部分数据进行仿真实验，结果证实了该模型的可行性和有效性，能够解决印刷机轴承故障预警问题，减少非计划停机，提高轴承使用寿命，降低印刷设备故障率。

还提供了基于LSTM的印刷机轴承故障诊断装置，其包括：

建模模块，其配置来建立作用在时域振动信号上的长短期记忆网络模型；

诊断模块，其配置来使用该模型对轴承的时域振动信号进行诊断；

实验模块，其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验，获取故障识别率；

所述建模模块中，长短期记忆网络模型包含四个神经网络层：

f_t＝σ(W_f·[h_t-1,x_t]+b_f) (1)

式中：σ为sigmoid激活函数；W_f为权重；b_f为偏置；x_t为当前样本输入，h_t-1为上一序列输出。

输入层：由Sigmod层组成，决定要更新的数值；

tanh层：生成一个新的候选数值

被增加到神经元状态中；

i_t＝σ(W_i·[h_t-1,x_t]+b_i) (2)

式中：i_t代表输入层对新信息的更新程度；

表示需要保留的信息；C_t代表当前细胞状态；

o_t＝σ(W_o·[h_t-1,x_t]+b_o) (5)

h_t＝o_t*tanh(C_t) (6)

附图说明

图1示出了长短期记忆网络链式结构。

图2示出了长短期记忆网络神经元。

图3示出了Tensorflow环境下生成的长短期记忆网络模型。

图4示出了Softmax函数图像。

图5示出了softmax激活函数配合分类交叉熵的训练和验证准确率曲线图。

图6示出了softmax激活函数配合分类交叉熵的训练和验证loss曲线图。

图7示出了sigmoid激活函数配合二进制交叉熵的训练和验证准确率曲线图。

图8是根据本发明的基于LSTM的印刷机轴承故障诊断方法的流程图。

具体实施方式

长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN)，是为了解决循环神经网络的梯度消失问题而提出的。在传统的循环神经网络中，训练算法一般采用反向传播，当数据为长时间序列时，返回的残差呈指数递减，导致模型权重更新逐渐缓慢，最终呈现出无变化趋势。基于这一问题，需要一个存储单元来存储丢失的历史信息，于是就诞生了长短期记忆网络。

长短期记忆网络和传统的循环神经网络一样拥有链式结构，如图1所示。

如图1所示，这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法，其包括以下步骤：

(1)建立作用在时域振动信号上的长短期记忆网络模型；

(2)使用该模型对轴承的时域振动信号进行诊断；

所述步骤(1)中，与循环神经网络的单层神经网络结构不同，长短期记忆网络包含四个神经网络层，他们以一种特殊的形式交互，如图2所示。长短期记忆网络模型包含四个神经网络层：

f_t＝σ(W_f·[h_t-1,x_t]+b_f) (1)

输入层：由Sigmod层组成，决定要更新的数值；

tanh层：生成一个新的候选数值

被增加到神经元状态中；

i_t＝σ(W_i·[h_t-1,x_t]+b_i) (2)

式中：i_t代表输入层对新信息的更新程度；

表示需要保留的信息；C_t代表当前细胞状态；

o_t＝σ(W_o·[h_t-1,x_t]+b_o) (5)

h_t＝o_t*tanh(C_t) (6)

优选地，所述步骤(1)中，使用的深度学习框架为Google公司的Tensorflow，所用计算机的配置为CPU i7-7700，内存16GB，利用python在Tensorflow环境下搭建长短期记忆网络模型，模型的数据传递图如图3所示。该模型包含输入层、隐藏层、全连接层和输出层，输入层为400x1的二维数组，表示为400个时间步和一个特征；隐藏层包含20个单元，后接全连接层输出10种故障分类中每种分类的可能性，连接激活函数得到最终结果。训练数据经过模型后，计算出目标函数，再通过训练模块更新模型中的权值，最后在测试阶段用训练好的模型来对输入信号进行诊断。

优选地，所述步骤(1)中，网络选用非线性激活函数softmax，损失函数为分类交叉熵；Softmax函数为每一个输出分类的结果赋予一个概率值，表示属于每个分类的可能性；Softmax函数的定义公式如下：

其中，x_i为第i个节点的输出值，C为输出节点的个数，是分类的类别个数；通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。函数图像如图4所示。

优选地，所述步骤(1)中，当使用Softmax函数作为输出节点的激活函数时，使用交叉熵作为损失函数，交叉熵的公式为：

其中，n为batch size，C为输出的节点个数，y为真实分布，也就是样本标签分布，x为预测分布，也就是神经网络的预测得分。

Tensorflow在Keras中提供了两种交叉熵损失函数，二进制交叉熵和多分类交叉熵。分类问题是要softmax激活函数配合分类交叉熵函数使用，而二分类问题要使用sigmoid激活函数配合二进制交叉熵函数适用，但是如果在多分类问题中使用了二进制交叉熵函数最后的模型分类效果会虚高，即比模型本身真实的分类效果好。

本文的实验数据来自于凯斯西储大学(CWRU)滚动轴承数据中心。CWRU数据集是世界公认的轴承故障诊断标准数据集，引用文献较多。在基于深度学习的轴承故障诊断领域，目前被引用数最高的两篇文章的试验数据均来自CWRU轴承数据库。

CWRU滚动轴承中心数据采集系统为：测试台由2hp电机(左)、扭矩传感器(中)、测功机(右)和控制电机装置组成。

优选地，所述步骤(3)中，实验对象为驱动端轴承，被诊断的轴承型号为深沟球轴承SKF6205，轴承的损伤是使用电火花加工的单点损伤，系统采样频率为12kHz，电机转速为1797rpm；轴承故障设置3种缺陷位置，分别是滚动体损伤、内圈损伤和外圈损伤，损伤的直径大小分为0.007inch、0.014inch和0.021inch，共计9种故障类型；轴承转一圈采样400个点，从每一个故障时间序列数据选择120000个采样点，以400个数据点为一个样本，每一个故障数据构成300个样本；正常数据也为300个样本，数据集总共为3000个样本，样本之间无重叠；按照9∶1的比例拆分训练集和测试集，训练集为2700个样本，测试集为300个样本，如表1所示。

表1

损伤直径	损伤位置	标签	训练集	测试集
					0	无	0	270	30
0.007	滚动体	1	270	30
					0.007	内圈	2	270	30
0.007	外圈	3	270	30
					0.014	滚动体	4	270	30
0.014	内圈	5	270	30
					0.014	外圈	6	270	30
0.021	滚动体	7	270	30
					0.021	内圈	8	270	30
0.021	外圈	9	270	30

优选地，所述步骤(3)中，利用处理好的数据集对搭建的网络进行训练，训练时，优化器为Adam算法，学习率设置为0.001，批量大小batch_size为100，迭代2000次。训练后得到的准确率随迭代次数变化曲线图如图5所示，loss随迭代次数变化曲线图如图6所示，其中由黑色实线组成的曲线为训练数据，由黑色点组成的曲线为测试数据。

迭代后10次的准确率如表2所示。

表2

index	accuracy
		1	0.9466666579246521
2	0.9433333277702332
		3	0.9300000071525574
4	0.9366666674613953
		5	0.9366666674613953
6	0.9399999976158142
		7	0.95333331823349
8	0.9599999785423279
		9	0.9300000071525574
10	0.9433333277702332

之后，对测试集单独的错误类型数据分别进行了测试，得到了不同错误类型在该模型下的准确率，如表3所示。

表3

由表中所示数据可以看出，一方面，部分错误分类的测试数据可以达到一个很好的效果，如内环0.021inch损坏类型和外环0.007inch损坏类型可以达到准确率100％。另一方面，滚动体0.021inch损坏错误类型的训练效果相对较差，只达到了92％。

还测试了用sigmoid激活函数配合二进制交叉熵函数解决多分类问题。训练时，优化器、学习率，批量大小和迭代次数等参数设置相同。训练后得到的准确率随迭代次数变化曲线图如图7所示，其中由黑色实线组成的曲线为训练数据，由黑色点组成的曲线为测试数据。

综上所述，得到如下结论：

首先，本文首次提出作用在时域振动信号上的长短期记忆网络模型，对滚动轴承进行故障诊断。根据准确率随迭代次数变化的曲线图可以看出，长短期记忆网络做故障诊断的训练时，一开始很不稳定，但是经过一定次数的迭代后，在某次迭代后可以达到很好的效果，准确率可以达到95％以上。另外，该模型的训练结果在不同故障类型测试数据下表现的效果略有出入，最高可以达到100％，最低达到92％。最后，本文对两种激活函数和损失函数的组合进行了对比，分别是softmax激活函数配合分类交叉熵损失函数和sigmoid激活函数配合二进制交叉熵激活函数。实验表明，softmax激活函数配合分类交叉熵在解决多分类问题上效果更好，想要达到理想的效果所需要的迭代次数也更少。

本领域普通技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，包括上述实施例方法的各步骤，而所述的存储介质可以是：ROM/RAM、磁碟、光盘、存储卡等。因此，与本发明的方法相对应的，本发明还同时包括一种基于LSTM的印刷机轴承故障诊断装置，该装置通常以与方法各步骤相对应的功能模块的形式表示。该装置包括：

f_t＝σ(W_f·[h_t-1,x_t]+b_f) (2)

输入层：由Sigmod层组成，决定要更新的数值；

tanh层：生成一个新的候选数值

被增加到神经元状态中；

i_t＝σ(W_i·[h_t-1,x_t]+b_i) (2)

式中：i_t代表输入层对新信息的更新程度；

表示需要保留的信息；C_t代表当前细胞状态；

o_t＝σ(W_o·[h_t-1,x_t]+b_o) (5)

h_t＝o_t*tanh(C_t) (6)

优选地，所述建模模块中，使用的深度学习框架为Google公司的Tensorflow，所用计算机的配置为CPU i7-7700，内存16GB，利用python在Tensorflow环境下搭建长短期记忆网络模型。

优选地，所述建模模块中，网络选用非线性激活函数softmax，损失函数为分类交叉熵；Softmax函数为每一个输出分类的结果赋予一个概率值，表示属于每个分类的可能性；Softmax函数的定义公式如下：

其中，x_i为第i个节点的输出值，C为输出节点的个数，是分类的类别个数；通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。

优选地，所述建模模块中，当使用Softmax函数作为输出节点的激活函数时，使用交叉熵作为损失函数，交叉熵的公式为：

以上所述，仅是本发明的较佳实施例，并非对本发明作任何形式上的限制，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属本发明技术方案的保护范围。

Claims

1.基于LSTM的印刷机轴承故障诊断方法，其特征在于：其包括以下步骤：

(1)建立作用在时域振动信号上的长短期记忆网络模型；

(2)使用该模型对轴承的时域振动信号进行诊断；

所述步骤(1)中，长短期记忆网络模型包含四个神经网络层：

f_t＝σ(W_f·[h_t-1，x_t]+b_f) (1)

输入层：由Sigmod层组成，决定要更新的数值；

tanh层：生成一个新的候选数值

被增加到神经元状态中；

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (2)

式中：i_t代表输入层对新信息的更新程度；

表示需要保留的信息；C_t代表当前细胞状态；

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (5)

h_t＝o_t*tanh(C_t) (6)

2.根据权利要求1所述的基于LSTM的印刷机轴承故障诊断方法，其特征在于：所述步骤(1)中，使用的深度学习框架为Google公司的Tensorflow，所用计算机的配置为CPU i7-7700，内存16GB，利用python在Tensorflow环境下搭建长短期记忆网络模型；该模型包含输入层、隐藏层、全连接层和输出层，输入层为400x1的二维数组，表示为400个时间步和一个特征；隐藏层包含20个单元，后接全连接层输出10种故障分类中每种分类的可能性，连接激活函数得到最终结果。

3.根据权利要求2所述的基于LSTM的印刷机轴承故障诊断方法，其特征在于：所述步骤(1)中，网络选用非线性激活函数softmax，损失函数为分类交叉熵；Softmax函数为每一个输出分类的结果赋予一个概率值，表示属于每个分类的可能性；Softmax函数的定义公式如下：

其中，x_i为第i个节点的输出值，C为输出节点的个数，是分类的类别个数；通过Softmax函数将多分类的输出值转换为范围在[0，1]并且和为1的概率分布。

4.根据权利要求3所述的基于LSTM的印刷机轴承故障诊断方法，其特征在于：所述步骤(1)中，当使用Softmax函数作为输出节点的激活函数时，使用交叉熵作为损失函数，交叉熵的公式为：

5.根据权利要求4所述的基于LSTM的印刷机轴承故障诊断方法，其特征在于：所述步骤(3)中，实验对象为驱动端轴承，被诊断的轴承型号为深沟球轴承SKF6205，轴承的损伤是使用电火花加工的单点损伤，系统采样频率为12kHz，电机转速为1797rpm；轴承故障设置3种缺陷位置，分别是滚动体损伤、内圈损伤和外圈损伤，损伤的直径大小分为0.007inch、0.014inch和0.021inch，共计9种故障类型；轴承转一圈采样400个点，从每一个故障时间序列数据选择120000个采样点，以400个数据点为一个样本，每一个故障数据构成300个样本；正常数据也为300个样本，数据集总共为3000个样本，样本之间无重叠；按照9∶1的比例拆分训练集和测试集，训练集为2700个样本，测试集为300个样本。

6.根据权利要求5所述的基于LSTM的印刷机轴承故障诊断方法，其特征在于：所述步骤(3)中，利用处理好的数据集对搭建的网络进行训练，训练时，优化器为Adam算法，学习率设置为0.001，批量大小batch_size为100，迭代2000次。

7.基于LSTM的印刷机轴承故障诊断装置，其特征在于：其包括：

f_t＝σ(W_f·[h_t-1，x_t]+b_f) (1)

输入层：由Sigmod层组成，决定要更新的数值；

tanh层：生成一个新的候选数值

被增加到神经元状态中；

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (2)

式中：i_t代表输入层对新信息的更新程度；

表示需要保留的信息；C_t代表当前细胞状态；

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (5)

h_t＝o_t*tanh(C_t) (6)

8.根据权利要求7所述的基于LSTM的印刷机轴承故障诊断装置，其特征在于：所述建模模块中，使用的深度学习框架为Google公司的Tensorflow，所用计算机的配置为CPU i7-7700，内存16GB，利用python在Tensorflow环境下搭建长短期记忆网络模型。

9.根据权利要求8所述的基于LSTM的印刷机轴承故障诊断装置，其特征在于：所述建模模块中，网络选用非线性激活函数softmax，损失函数为分类交叉熵；Softmax函数为每一个输出分类的结果赋予一个概率值，表示属于每个分类的可能性；Softmax函数的定义公式如下：

10.根据权利要求9所述的基于LSTM的印刷机轴承故障诊断装置，其特征在于：所述建模模块中，当使用Softmax函数作为输出节点的激活函数时，使用交叉熵作为损失函数，交叉熵的公式为：