CN114925809A - 基于lstm的印刷机轴承故障诊断方法及装置 - Google Patents

基于lstm的印刷机轴承故障诊断方法及装置 Download PDF

Info

Publication number
CN114925809A
CN114925809A CN202210399169.3A CN202210399169A CN114925809A CN 114925809 A CN114925809 A CN 114925809A CN 202210399169 A CN202210399169 A CN 202210399169A CN 114925809 A CN114925809 A CN 114925809A
Authority
CN
China
Prior art keywords
layer
output
bearing
neuron
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210399169.3A
Other languages
English (en)
Other versions
CN114925809B (zh
Inventor
魏煦航
杨树林
李旸
王佳
杨彦红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Graphic Communication
Original Assignee
Beijing Institute of Graphic Communication
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Graphic Communication filed Critical Beijing Institute of Graphic Communication
Priority to CN202210399169.3A priority Critical patent/CN114925809B/zh
Publication of CN114925809A publication Critical patent/CN114925809A/zh
Application granted granted Critical
Publication of CN114925809B publication Critical patent/CN114925809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

基于LSTM的印刷机轴承故障诊断方法及装置,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。方法包括:(1)建立作用在时域振动信号上的长短期记忆网络模型;(2)使用该模型对轴承的时域振动信号进行诊断;(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率。

Description

基于LSTM的印刷机轴承故障诊断方法及装置
技术领域
本发明涉及印刷装备运转监测的技术领域,尤其涉及一种基于LSTM的印刷机轴承故障诊断方法,以及基于LSTM的印刷机轴承故障诊断装置。
背景技术
印刷装备正朝着高速化、精密化、系统化和自动化的方向发展,印刷装备的健康检测系统日益完善,装备运转监测数据已经逐步迈入海量数据的“大数据”时代。利用先进的故障诊断方法对印刷装备进行有效的故障检测、诊断,是保证装备健康、稳定运行的关键。轴承作为印刷装备中最为重要的零件,分析其故障及损坏情况,可以帮助我们改进工作,提高轴承使用寿命,降低印刷设备故障率。
轴承故障诊断的核心方法在于信号特征的提取与模式分类两个部分。在轴承故障诊断领域,常见的特征提取算法有快速傅里叶变化,小波变换以及信号的统计学特征等,常见的模式分类算法有近邻分类器,BP神经网络(也称多层感知器),卷积神经网络等。当下轴承故障诊断的研究热点可以归结为3类:寻找更好的特征表达;寻找最适合的特征表达以及分类器的组合;以及发明新的传感器。
发明内容
为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种基于LSTM的印刷机轴承故障诊断方法,其能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。
本发明的技术方案是:这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法,其包括以下步骤:
(1)建立作用在时域振动信号上的长短期记忆网络模型;
(2)使用该模型对轴承的时域振动信号进行诊断;
(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述步骤(1)中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
tanh层:生成一个新的候选数值
Figure BDA0003594676680000021
被增加到神经元状态中;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
Figure BDA0003594676680000022
Figure BDA0003594676680000023
式中:it代表输入层对新信息的更新程度;
Figure BDA0003594676680000024
为当前新状态信息的候选向量;ft*Ct-1表示需要忘记的信息;
Figure BDA0003594676680000025
表示需要保留的信息;Ct代表当前细胞状态;
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势,因此需要一个存储单元来存储丢失的历史信息,本发明选择长短期记忆网络是因为它在处理时间序列数据上具有优势,然后使用该模型对轴承的时域振动信号进行诊断,最后选取凯斯西储大学轴承数据库的部分数据进行仿真实验,结果证实了该模型的可行性和有效性,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。
还提供了基于LSTM的印刷机轴承故障诊断装置,其包括:
建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;
诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;
实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述建模模块中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出。
输入层:由Sigmod层组成,决定要更新的数值;
tanh层:生成一个新的候选数值
Figure BDA0003594676680000041
被增加到神经元状态中;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
Figure BDA0003594676680000042
Figure BDA0003594676680000043
式中:it代表输入层对新信息的更新程度;
Figure BDA0003594676680000044
为当前新状态信息的候选向量;ft*Ct-1表示需要忘记的信息;
Figure BDA0003594676680000045
表示需要保留的信息;Ct代表当前细胞状态;
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
附图说明
图1示出了长短期记忆网络链式结构。
图2示出了长短期记忆网络神经元。
图3示出了Tensorflow环境下生成的长短期记忆网络模型。
图4示出了Softmax函数图像。
图5示出了softmax激活函数配合分类交叉熵的训练和验证准确率曲线图。
图6示出了softmax激活函数配合分类交叉熵的训练和验证loss曲线图。
图7示出了sigmoid激活函数配合二进制交叉熵的训练和验证准确率曲线图。
图8是根据本发明的基于LSTM的印刷机轴承故障诊断方法的流程图。
具体实施方式
长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN),是为了解决循环神经网络的梯度消失问题而提出的。在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势。基于这一问题,需要一个存储单元来存储丢失的历史信息,于是就诞生了长短期记忆网络。
长短期记忆网络和传统的循环神经网络一样拥有链式结构,如图1所示。
如图1所示,这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法,其包括以下步骤:
(1)建立作用在时域振动信号上的长短期记忆网络模型;
(2)使用该模型对轴承的时域振动信号进行诊断;
(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述步骤(1)中,与循环神经网络的单层神经网络结构不同,长短期记忆网络包含四个神经网络层,他们以一种特殊的形式交互,如图2所示。长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
tanh层:生成一个新的候选数值
Figure BDA0003594676680000061
被增加到神经元状态中;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
Figure BDA0003594676680000062
Figure BDA0003594676680000063
式中:it代表输入层对新信息的更新程度;
Figure BDA0003594676680000064
为当前新状态信息的候选向量;ft*Ct-1表示需要忘记的信息;
Figure BDA0003594676680000065
表示需要保留的信息;Ct代表当前细胞状态;
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势,因此需要一个存储单元来存储丢失的历史信息,本发明选择长短期记忆网络是因为它在处理时间序列数据上具有优势,然后使用该模型对轴承的时域振动信号进行诊断,最后选取凯斯西储大学轴承数据库的部分数据进行仿真实验,结果证实了该模型的可行性和有效性,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。
优选地,所述步骤(1)中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型,模型的数据传递图如图3所示。该模型包含输入层、隐藏层、全连接层和输出层,输入层为400x1的二维数组,表示为400个时间步和一个特征;隐藏层包含20个单元,后接全连接层输出10种故障分类中每种分类的可能性,连接激活函数得到最终结果。训练数据经过模型后,计算出目标函数,再通过训练模块更新模型中的权值,最后在测试阶段用训练好的模型来对输入信号进行诊断。
优选地,所述步骤(1)中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:
Figure BDA0003594676680000071
其中,xi为第i个节点的输出值,C为输出节点的个数,是分类的类别个数;通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。函数图像如图4所示。
优选地,所述步骤(1)中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:
Figure BDA0003594676680000072
其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。
Tensorflow在Keras中提供了两种交叉熵损失函数,二进制交叉熵和多分类交叉熵。分类问题是要softmax激活函数配合分类交叉熵函数使用,而二分类问题要使用sigmoid激活函数配合二进制交叉熵函数适用,但是如果在多分类问题中使用了二进制交叉熵函数最后的模型分类效果会虚高,即比模型本身真实的分类效果好。
本文的实验数据来自于凯斯西储大学(CWRU)滚动轴承数据中心。CWRU数据集是世界公认的轴承故障诊断标准数据集,引用文献较多。在基于深度学习的轴承故障诊断领域,目前被引用数最高的两篇文章的试验数据均来自CWRU轴承数据库。
CWRU滚动轴承中心数据采集系统为:测试台由2hp电机(左)、扭矩传感器(中)、测功机(右)和控制电机装置组成。
优选地,所述步骤(3)中,实验对象为驱动端轴承,被诊断的轴承型号为深沟球轴承SKF6205,轴承的损伤是使用电火花加工的单点损伤,系统采样频率为12kHz,电机转速为1797rpm;轴承故障设置3种缺陷位置,分别是滚动体损伤、内圈损伤和外圈损伤,损伤的直径大小分为0.007inch、0.014inch和0.021inch,共计9种故障类型;轴承转一圈采样400个点,从每一个故障时间序列数据选择120000个采样点,以400个数据点为一个样本,每一个故障数据构成300个样本;正常数据也为300个样本,数据集总共为3000个样本,样本之间无重叠;按照9∶1的比例拆分训练集和测试集,训练集为2700个样本,测试集为300个样本,如表1所示。
表1
损伤直径 损伤位置 标签 训练集 测试集
0 0 270 30
0.007 滚动体 1 270 30
0.007 内圈 2 270 30
0.007 外圈 3 270 30
0.014 滚动体 4 270 30
0.014 内圈 5 270 30
0.014 外圈 6 270 30
0.021 滚动体 7 270 30
0.021 内圈 8 270 30
0.021 外圈 9 270 30
优选地,所述步骤(3)中,利用处理好的数据集对搭建的网络进行训练,训练时,优化器为Adam算法,学习率设置为0.001,批量大小batch_size为100,迭代2000次。训练后得到的准确率随迭代次数变化曲线图如图5所示,loss随迭代次数变化曲线图如图6所示,其中由黑色实线组成的曲线为训练数据,由黑色点组成的曲线为测试数据。
迭代后10次的准确率如表2所示。
表2
index accuracy
1 0.9466666579246521
2 0.9433333277702332
3 0.9300000071525574
4 0.9366666674613953
5 0.9366666674613953
6 0.9399999976158142
7 0.95333331823349
8 0.9599999785423279
9 0.9300000071525574
10 0.9433333277702332
之后,对测试集单独的错误类型数据分别进行了测试,得到了不同错误类型在该模型下的准确率,如表3所示。
表3
Figure BDA0003594676680000091
由表中所示数据可以看出,一方面,部分错误分类的测试数据可以达到一个很好的效果,如内环0.021inch损坏类型和外环0.007inch损坏类型可以达到准确率100%。另一方面,滚动体0.021inch损坏错误类型的训练效果相对较差,只达到了92%。
还测试了用sigmoid激活函数配合二进制交叉熵函数解决多分类问题。训练时,优化器、学习率,批量大小和迭代次数等参数设置相同。训练后得到的准确率随迭代次数变化曲线图如图7所示,其中由黑色实线组成的曲线为训练数据,由黑色点组成的曲线为测试数据。
综上所述,得到如下结论:
首先,本文首次提出作用在时域振动信号上的长短期记忆网络模型,对滚动轴承进行故障诊断。根据准确率随迭代次数变化的曲线图可以看出,长短期记忆网络做故障诊断的训练时,一开始很不稳定,但是经过一定次数的迭代后,在某次迭代后可以达到很好的效果,准确率可以达到95%以上。另外,该模型的训练结果在不同故障类型测试数据下表现的效果略有出入,最高可以达到100%,最低达到92%。最后,本文对两种激活函数和损失函数的组合进行了对比,分别是softmax激活函数配合分类交叉熵损失函数和sigmoid激活函数配合二进制交叉熵激活函数。实验表明,softmax激活函数配合分类交叉熵在解决多分类问题上效果更好,想要达到理想的效果所需要的迭代次数也更少。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而所述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。因此,与本发明的方法相对应的,本发明还同时包括一种基于LSTM的印刷机轴承故障诊断装置,该装置通常以与方法各步骤相对应的功能模块的形式表示。该装置包括:
建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;
诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;
实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述建模模块中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (2)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出。
输入层:由Sigmod层组成,决定要更新的数值;
tanh层:生成一个新的候选数值
Figure BDA0003594676680000111
被增加到神经元状态中;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
Figure BDA0003594676680000112
Figure BDA0003594676680000113
式中:it代表输入层对新信息的更新程度;
Figure BDA0003594676680000114
为当前新状态信息的候选向量;ft*Ct-1表示需要忘记的信息;
Figure BDA0003594676680000115
表示需要保留的信息;Ct代表当前细胞状态;
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
优选地,所述建模模块中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型。
优选地,所述建模模块中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:
Figure BDA0003594676680000121
其中,xi为第i个节点的输出值,C为输出节点的个数,是分类的类别个数;通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。
优选地,所述建模模块中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:
Figure BDA0003594676680000122
其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (10)

1.基于LSTM的印刷机轴承故障诊断方法,其特征在于:其包括以下步骤:
(1)建立作用在时域振动信号上的长短期记忆网络模型;
(2)使用该模型对轴承的时域振动信号进行诊断;
(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述步骤(1)中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
tanh层:生成一个新的候选数值
Figure FDA0003594676670000015
被增加到神经元状态中;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
Figure FDA0003594676670000011
Figure FDA0003594676670000012
式中:it代表输入层对新信息的更新程度;
Figure FDA0003594676670000013
为当前新状态信息的候选向量;ft*Ct-1表示需要忘记的信息;
Figure FDA0003594676670000014
表示需要保留的信息;Ct代表当前细胞状态;
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
2.根据权利要求1所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(1)中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型;该模型包含输入层、隐藏层、全连接层和输出层,输入层为400x1的二维数组,表示为400个时间步和一个特征;隐藏层包含20个单元,后接全连接层输出10种故障分类中每种分类的可能性,连接激活函数得到最终结果。
3.根据权利要求2所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(1)中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:
Figure FDA0003594676670000021
其中,xi为第i个节点的输出值,C为输出节点的个数,是分类的类别个数;通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。
4.根据权利要求3所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(1)中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:
Figure FDA0003594676670000031
其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。
5.根据权利要求4所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(3)中,实验对象为驱动端轴承,被诊断的轴承型号为深沟球轴承SKF6205,轴承的损伤是使用电火花加工的单点损伤,系统采样频率为12kHz,电机转速为1797rpm;轴承故障设置3种缺陷位置,分别是滚动体损伤、内圈损伤和外圈损伤,损伤的直径大小分为0.007inch、0.014inch和0.021inch,共计9种故障类型;轴承转一圈采样400个点,从每一个故障时间序列数据选择120000个采样点,以400个数据点为一个样本,每一个故障数据构成300个样本;正常数据也为300个样本,数据集总共为3000个样本,样本之间无重叠;按照9∶1的比例拆分训练集和测试集,训练集为2700个样本,测试集为300个样本。
6.根据权利要求5所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(3)中,利用处理好的数据集对搭建的网络进行训练,训练时,优化器为Adam算法,学习率设置为0.001,批量大小batch_size为100,迭代2000次。
7.基于LSTM的印刷机轴承故障诊断装置,其特征在于:其包括:
建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;
诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;
实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述建模模块中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
tanh层:生成一个新的候选数值
Figure FDA0003594676670000041
被增加到神经元状态中;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
Figure FDA0003594676670000042
Figure FDA0003594676670000043
式中:it代表输入层对新信息的更新程度;
Figure FDA0003594676670000044
为当前新状态信息的候选向量;ft*Ct-1表示需要忘记的信息;
Figure FDA0003594676670000045
表示需要保留的信息;Ct代表当前细胞状态;
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
8.根据权利要求7所述的基于LSTM的印刷机轴承故障诊断装置,其特征在于:所述建模模块中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型。
9.根据权利要求8所述的基于LSTM的印刷机轴承故障诊断装置,其特征在于:所述建模模块中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:
Figure FDA0003594676670000051
其中,xi为第i个节点的输出值,C为输出节点的个数,是分类的类别个数;通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。
10.根据权利要求9所述的基于LSTM的印刷机轴承故障诊断装置,其特征在于:所述建模模块中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:
Figure FDA0003594676670000052
其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。
CN202210399169.3A 2022-04-13 2022-04-13 基于lstm的印刷机轴承故障诊断方法及装置 Active CN114925809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210399169.3A CN114925809B (zh) 2022-04-13 2022-04-13 基于lstm的印刷机轴承故障诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210399169.3A CN114925809B (zh) 2022-04-13 2022-04-13 基于lstm的印刷机轴承故障诊断方法及装置

Publications (2)

Publication Number Publication Date
CN114925809A true CN114925809A (zh) 2022-08-19
CN114925809B CN114925809B (zh) 2024-05-24

Family

ID=82807638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210399169.3A Active CN114925809B (zh) 2022-04-13 2022-04-13 基于lstm的印刷机轴承故障诊断方法及装置

Country Status (1)

Country Link
CN (1) CN114925809B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115700416A (zh) * 2022-08-29 2023-02-07 桂林电子科技大学 一种汽车故障自动诊断方法、系统、设备及介质
CN117131457A (zh) * 2023-10-26 2023-11-28 杭州海兴泽科信息技术有限公司 基于ai模型的电力大数据采集处理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197648A (zh) * 2017-12-28 2018-06-22 华中科技大学 一种基于lstm深度学习模型的水电机组故障诊断方法与系统
CN109931678A (zh) * 2019-03-13 2019-06-25 中国计量大学 基于深度学习lstm的空调故障诊断方法
CN111307452A (zh) * 2020-03-05 2020-06-19 江苏天沃重工科技有限公司 一种时变转速下旋转机械智能故障诊断方法
WO2020244134A1 (zh) * 2019-06-05 2020-12-10 华南理工大学 一种基于多任务特征共享神经网络的智能故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197648A (zh) * 2017-12-28 2018-06-22 华中科技大学 一种基于lstm深度学习模型的水电机组故障诊断方法与系统
CN109931678A (zh) * 2019-03-13 2019-06-25 中国计量大学 基于深度学习lstm的空调故障诊断方法
WO2020244134A1 (zh) * 2019-06-05 2020-12-10 华南理工大学 一种基于多任务特征共享神经网络的智能故障诊断方法
CN111307452A (zh) * 2020-03-05 2020-06-19 江苏天沃重工科技有限公司 一种时变转速下旋转机械智能故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王太勇;王廷虎;王鹏;乔卉卉;徐明达;: "基于注意力机制BiLSTM的设备智能故障诊断方法", 天津大学学报(自然科学与工程技术版), no. 06, 27 April 2020 (2020-04-27), pages 55 - 62 *
陈伟;陈锦雄;江永全;宋冬利;张闻东;: "基于RS-LSTM的滚动轴承故障识别", 中国科技论文, no. 10, 23 May 2018 (2018-05-23), pages 51 - 58 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115700416A (zh) * 2022-08-29 2023-02-07 桂林电子科技大学 一种汽车故障自动诊断方法、系统、设备及介质
CN117131457A (zh) * 2023-10-26 2023-11-28 杭州海兴泽科信息技术有限公司 基于ai模型的电力大数据采集处理方法及系统
CN117131457B (zh) * 2023-10-26 2024-01-26 杭州海兴泽科信息技术有限公司 基于ai模型的电力大数据采集处理方法及系统

Also Published As

Publication number Publication date
CN114925809B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
CN107505133B (zh) 基于自适应mrvm的滚动轴承故障概率性智能诊断方法
CN114925809B (zh) 基于lstm的印刷机轴承故障诊断方法及装置
Xia et al. Multi-stage fault diagnosis framework for rolling bearing based on OHF Elman AdaBoost-Bagging algorithm
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN110617966A (zh) 一种基于半监督生成对抗网络的轴承故障诊断方法
CN113935406A (zh) 基于对抗流模型的机械设备无监督故障诊断方法
CN111275004B (zh) 基于lmd和脉冲神经网络的轴承故障诊断方法
CN113673346B (zh) 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法
CN106886660A (zh) EEMD‑Hilbert包络谱与DBN相结合的变负载下滚动轴承状态识别方法
CN113792758A (zh) 一种基于自监督学习和聚类的滚动轴承故障诊断方法
CN111914897A (zh) 一种基于孪生长短时间记忆网络的故障诊断方法
CN111353373A (zh) 一种相关对齐域适应故障诊断方法
CN110991471B (zh) 一种高速列车牵引系统故障诊断方法
CN112834221A (zh) 一种基于eemd-mse和多尺度一维卷积神经网络轴承故障诊断方法
CN115290326A (zh) 一种滚动轴承故障智能诊断方法
CN112488179A (zh) 一种基于gru的旋转机械故障诊断方法
CN114722952B (zh) 一种基于表示学习的轴承故障检测和分类的一体化方法
CN117290771A (zh) 基于改进辅助分类生成对抗网络的旋转机械故障诊断方法
CN112115922A (zh) 一种增强深度特征学习的旋转机械故障诊断方法
CN109726770A (zh) 一种模拟电路故障测试诊断方法
Huo et al. A class-level matching unsupervised transfer learning network for rolling bearing fault diagnosis under various working conditions
CN116702076A (zh) 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质
CN113409213B (zh) 柱塞泵故障信号时频图降噪增强方法和系统
Zhang et al. A novel fault diagnosis method based on semisupervised contrast learning
CN114861349A (zh) 一种基于模型迁移和维纳过程的滚动轴承rul预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Yang Yanhong

Inventor after: Wei Xiuhang

Inventor after: Yang Shulin

Inventor after: Li Yang

Inventor after: Wang Jia

Inventor before: Wei Xiuhang

Inventor before: Yang Shulin

Inventor before: Li Yang

Inventor before: Wang Jia

Inventor before: Yang Yanhong

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant