CN114925809A - 基于lstm的印刷机轴承故障诊断方法及装置 - Google Patents
基于lstm的印刷机轴承故障诊断方法及装置 Download PDFInfo
- Publication number
- CN114925809A CN114925809A CN202210399169.3A CN202210399169A CN114925809A CN 114925809 A CN114925809 A CN 114925809A CN 202210399169 A CN202210399169 A CN 202210399169A CN 114925809 A CN114925809 A CN 114925809A
- Authority
- CN
- China
- Prior art keywords
- layer
- output
- bearing
- neuron
- lstm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000015654 memory Effects 0.000 claims abstract description 16
- 238000004088 simulation Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 61
- 210000002569 neuron Anatomy 0.000 claims description 43
- 230000004913 activation Effects 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 23
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 230000006378 damage Effects 0.000 claims description 17
- 230000006403 short-term memory Effects 0.000 claims description 17
- 238000009826 distribution Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 13
- 230000007787 long-term memory Effects 0.000 claims description 12
- 230000014759 maintenance of location Effects 0.000 claims description 12
- 238000005096 rolling process Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 210000004027 cell Anatomy 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 5
- 238000002474 experimental method Methods 0.000 claims description 4
- 230000007547 defect Effects 0.000 claims description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 2
- 238000010892 electric spark Methods 0.000 claims description 2
- 230000007774 longterm Effects 0.000 claims description 2
- 238000003754 machining Methods 0.000 claims description 2
- 238000002405 diagnostic procedure Methods 0.000 claims 5
- 229910052731 fluorine Inorganic materials 0.000 claims 1
- 125000001153 fluoro group Chemical group F* 0.000 claims 1
- 239000010410 layer Substances 0.000 description 64
- 230000000694 effects Effects 0.000 description 11
- 230000000306 recurrent effect Effects 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
基于LSTM的印刷机轴承故障诊断方法及装置,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。方法包括:(1)建立作用在时域振动信号上的长短期记忆网络模型;(2)使用该模型对轴承的时域振动信号进行诊断;(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率。
Description
技术领域
本发明涉及印刷装备运转监测的技术领域,尤其涉及一种基于LSTM的印刷机轴承故障诊断方法,以及基于LSTM的印刷机轴承故障诊断装置。
背景技术
印刷装备正朝着高速化、精密化、系统化和自动化的方向发展,印刷装备的健康检测系统日益完善,装备运转监测数据已经逐步迈入海量数据的“大数据”时代。利用先进的故障诊断方法对印刷装备进行有效的故障检测、诊断,是保证装备健康、稳定运行的关键。轴承作为印刷装备中最为重要的零件,分析其故障及损坏情况,可以帮助我们改进工作,提高轴承使用寿命,降低印刷设备故障率。
轴承故障诊断的核心方法在于信号特征的提取与模式分类两个部分。在轴承故障诊断领域,常见的特征提取算法有快速傅里叶变化,小波变换以及信号的统计学特征等,常见的模式分类算法有近邻分类器,BP神经网络(也称多层感知器),卷积神经网络等。当下轴承故障诊断的研究热点可以归结为3类:寻找更好的特征表达;寻找最适合的特征表达以及分类器的组合;以及发明新的传感器。
发明内容
为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种基于LSTM的印刷机轴承故障诊断方法,其能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。
本发明的技术方案是:这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法,其包括以下步骤:
(1)建立作用在时域振动信号上的长短期记忆网络模型;
(2)使用该模型对轴承的时域振动信号进行诊断;
(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述步骤(1)中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势,因此需要一个存储单元来存储丢失的历史信息,本发明选择长短期记忆网络是因为它在处理时间序列数据上具有优势,然后使用该模型对轴承的时域振动信号进行诊断,最后选取凯斯西储大学轴承数据库的部分数据进行仿真实验,结果证实了该模型的可行性和有效性,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。
还提供了基于LSTM的印刷机轴承故障诊断装置,其包括:
建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;
诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;
实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述建模模块中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出。
输入层:由Sigmod层组成,决定要更新的数值;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
附图说明
图1示出了长短期记忆网络链式结构。
图2示出了长短期记忆网络神经元。
图3示出了Tensorflow环境下生成的长短期记忆网络模型。
图4示出了Softmax函数图像。
图5示出了softmax激活函数配合分类交叉熵的训练和验证准确率曲线图。
图6示出了softmax激活函数配合分类交叉熵的训练和验证loss曲线图。
图7示出了sigmoid激活函数配合二进制交叉熵的训练和验证准确率曲线图。
图8是根据本发明的基于LSTM的印刷机轴承故障诊断方法的流程图。
具体实施方式
长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN),是为了解决循环神经网络的梯度消失问题而提出的。在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势。基于这一问题,需要一个存储单元来存储丢失的历史信息,于是就诞生了长短期记忆网络。
长短期记忆网络和传统的循环神经网络一样拥有链式结构,如图1所示。
如图1所示,这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法,其包括以下步骤:
(1)建立作用在时域振动信号上的长短期记忆网络模型;
(2)使用该模型对轴承的时域振动信号进行诊断;
(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述步骤(1)中,与循环神经网络的单层神经网络结构不同,长短期记忆网络包含四个神经网络层,他们以一种特殊的形式交互,如图2所示。长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势,因此需要一个存储单元来存储丢失的历史信息,本发明选择长短期记忆网络是因为它在处理时间序列数据上具有优势,然后使用该模型对轴承的时域振动信号进行诊断,最后选取凯斯西储大学轴承数据库的部分数据进行仿真实验,结果证实了该模型的可行性和有效性,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。
优选地,所述步骤(1)中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型,模型的数据传递图如图3所示。该模型包含输入层、隐藏层、全连接层和输出层,输入层为400x1的二维数组,表示为400个时间步和一个特征;隐藏层包含20个单元,后接全连接层输出10种故障分类中每种分类的可能性,连接激活函数得到最终结果。训练数据经过模型后,计算出目标函数,再通过训练模块更新模型中的权值,最后在测试阶段用训练好的模型来对输入信号进行诊断。
优选地,所述步骤(1)中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:
其中,xi为第i个节点的输出值,C为输出节点的个数,是分类的类别个数;通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。函数图像如图4所示。
优选地,所述步骤(1)中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:
其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。
Tensorflow在Keras中提供了两种交叉熵损失函数,二进制交叉熵和多分类交叉熵。分类问题是要softmax激活函数配合分类交叉熵函数使用,而二分类问题要使用sigmoid激活函数配合二进制交叉熵函数适用,但是如果在多分类问题中使用了二进制交叉熵函数最后的模型分类效果会虚高,即比模型本身真实的分类效果好。
本文的实验数据来自于凯斯西储大学(CWRU)滚动轴承数据中心。CWRU数据集是世界公认的轴承故障诊断标准数据集,引用文献较多。在基于深度学习的轴承故障诊断领域,目前被引用数最高的两篇文章的试验数据均来自CWRU轴承数据库。
CWRU滚动轴承中心数据采集系统为:测试台由2hp电机(左)、扭矩传感器(中)、测功机(右)和控制电机装置组成。
优选地,所述步骤(3)中,实验对象为驱动端轴承,被诊断的轴承型号为深沟球轴承SKF6205,轴承的损伤是使用电火花加工的单点损伤,系统采样频率为12kHz,电机转速为1797rpm;轴承故障设置3种缺陷位置,分别是滚动体损伤、内圈损伤和外圈损伤,损伤的直径大小分为0.007inch、0.014inch和0.021inch,共计9种故障类型;轴承转一圈采样400个点,从每一个故障时间序列数据选择120000个采样点,以400个数据点为一个样本,每一个故障数据构成300个样本;正常数据也为300个样本,数据集总共为3000个样本,样本之间无重叠;按照9∶1的比例拆分训练集和测试集,训练集为2700个样本,测试集为300个样本,如表1所示。
表1
损伤直径 | 损伤位置 | 标签 | 训练集 | 测试集 |
0 | 无 | 0 | 270 | 30 |
0.007 | 滚动体 | 1 | 270 | 30 |
0.007 | 内圈 | 2 | 270 | 30 |
0.007 | 外圈 | 3 | 270 | 30 |
0.014 | 滚动体 | 4 | 270 | 30 |
0.014 | 内圈 | 5 | 270 | 30 |
0.014 | 外圈 | 6 | 270 | 30 |
0.021 | 滚动体 | 7 | 270 | 30 |
0.021 | 内圈 | 8 | 270 | 30 |
0.021 | 外圈 | 9 | 270 | 30 |
优选地,所述步骤(3)中,利用处理好的数据集对搭建的网络进行训练,训练时,优化器为Adam算法,学习率设置为0.001,批量大小batch_size为100,迭代2000次。训练后得到的准确率随迭代次数变化曲线图如图5所示,loss随迭代次数变化曲线图如图6所示,其中由黑色实线组成的曲线为训练数据,由黑色点组成的曲线为测试数据。
迭代后10次的准确率如表2所示。
表2
index | accuracy |
1 | 0.9466666579246521 |
2 | 0.9433333277702332 |
3 | 0.9300000071525574 |
4 | 0.9366666674613953 |
5 | 0.9366666674613953 |
6 | 0.9399999976158142 |
7 | 0.95333331823349 |
8 | 0.9599999785423279 |
9 | 0.9300000071525574 |
10 | 0.9433333277702332 |
之后,对测试集单独的错误类型数据分别进行了测试,得到了不同错误类型在该模型下的准确率,如表3所示。
表3
由表中所示数据可以看出,一方面,部分错误分类的测试数据可以达到一个很好的效果,如内环0.021inch损坏类型和外环0.007inch损坏类型可以达到准确率100%。另一方面,滚动体0.021inch损坏错误类型的训练效果相对较差,只达到了92%。
还测试了用sigmoid激活函数配合二进制交叉熵函数解决多分类问题。训练时,优化器、学习率,批量大小和迭代次数等参数设置相同。训练后得到的准确率随迭代次数变化曲线图如图7所示,其中由黑色实线组成的曲线为训练数据,由黑色点组成的曲线为测试数据。
综上所述,得到如下结论:
首先,本文首次提出作用在时域振动信号上的长短期记忆网络模型,对滚动轴承进行故障诊断。根据准确率随迭代次数变化的曲线图可以看出,长短期记忆网络做故障诊断的训练时,一开始很不稳定,但是经过一定次数的迭代后,在某次迭代后可以达到很好的效果,准确率可以达到95%以上。另外,该模型的训练结果在不同故障类型测试数据下表现的效果略有出入,最高可以达到100%,最低达到92%。最后,本文对两种激活函数和损失函数的组合进行了对比,分别是softmax激活函数配合分类交叉熵损失函数和sigmoid激活函数配合二进制交叉熵激活函数。实验表明,softmax激活函数配合分类交叉熵在解决多分类问题上效果更好,想要达到理想的效果所需要的迭代次数也更少。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而所述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。因此,与本发明的方法相对应的,本发明还同时包括一种基于LSTM的印刷机轴承故障诊断装置,该装置通常以与方法各步骤相对应的功能模块的形式表示。该装置包括:
建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;
诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;
实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述建模模块中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (2)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出。
输入层:由Sigmod层组成,决定要更新的数值;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
优选地,所述建模模块中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型。
优选地,所述建模模块中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:
其中,xi为第i个节点的输出值,C为输出节点的个数,是分类的类别个数;通过Softmax函数将多分类的输出值转换为范围在[0,1]并且和为1的概率分布。
优选地,所述建模模块中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:
其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。
Claims (10)
1.基于LSTM的印刷机轴承故障诊断方法,其特征在于:其包括以下步骤:
(1)建立作用在时域振动信号上的长短期记忆网络模型;
(2)使用该模型对轴承的时域振动信号进行诊断;
(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述步骤(1)中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
2.根据权利要求1所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(1)中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型;该模型包含输入层、隐藏层、全连接层和输出层,输入层为400x1的二维数组,表示为400个时间步和一个特征;隐藏层包含20个单元,后接全连接层输出10种故障分类中每种分类的可能性,连接激活函数得到最终结果。
5.根据权利要求4所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(3)中,实验对象为驱动端轴承,被诊断的轴承型号为深沟球轴承SKF6205,轴承的损伤是使用电火花加工的单点损伤,系统采样频率为12kHz,电机转速为1797rpm;轴承故障设置3种缺陷位置,分别是滚动体损伤、内圈损伤和外圈损伤,损伤的直径大小分为0.007inch、0.014inch和0.021inch,共计9种故障类型;轴承转一圈采样400个点,从每一个故障时间序列数据选择120000个采样点,以400个数据点为一个样本,每一个故障数据构成300个样本;正常数据也为300个样本,数据集总共为3000个样本,样本之间无重叠;按照9∶1的比例拆分训练集和测试集,训练集为2700个样本,测试集为300个样本。
6.根据权利要求5所述的基于LSTM的印刷机轴承故障诊断方法,其特征在于:所述步骤(3)中,利用处理好的数据集对搭建的网络进行训练,训练时,优化器为Adam算法,学习率设置为0.001,批量大小batch_size为100,迭代2000次。
7.基于LSTM的印刷机轴承故障诊断装置,其特征在于:其包括:
建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;
诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;
实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;
所述建模模块中,长短期记忆网络模型包含四个神经网络层:
遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入ht-1和xt,然后在Ct-1的每个神经元状态输出0~1之间的数字,1表示完全保留,0表示完全忘记
ft=σ(Wf·[ht-1,xt]+bf) (1)
式中:σ为sigmoid激活函数;Wf为权重;bf为偏置;xt为当前样本输入,ht-1为上一序列输出;
输入层:由Sigmod层组成,决定要更新的数值;
组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息
it=σ(Wi·[ht-1,xt]+bi) (2)
输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
式中:ot表示输出层的信息输出;ht为隐藏层的输出,同时也将输入到下一个LSTM单元。
8.根据权利要求7所述的基于LSTM的印刷机轴承故障诊断装置,其特征在于:所述建模模块中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210399169.3A CN114925809B (zh) | 2022-04-13 | 2022-04-13 | 基于lstm的印刷机轴承故障诊断方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210399169.3A CN114925809B (zh) | 2022-04-13 | 2022-04-13 | 基于lstm的印刷机轴承故障诊断方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114925809A true CN114925809A (zh) | 2022-08-19 |
CN114925809B CN114925809B (zh) | 2024-05-24 |
Family
ID=82807638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210399169.3A Active CN114925809B (zh) | 2022-04-13 | 2022-04-13 | 基于lstm的印刷机轴承故障诊断方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114925809B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115700416A (zh) * | 2022-08-29 | 2023-02-07 | 桂林电子科技大学 | 一种汽车故障自动诊断方法、系统、设备及介质 |
CN117131457A (zh) * | 2023-10-26 | 2023-11-28 | 杭州海兴泽科信息技术有限公司 | 基于ai模型的电力大数据采集处理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197648A (zh) * | 2017-12-28 | 2018-06-22 | 华中科技大学 | 一种基于lstm深度学习模型的水电机组故障诊断方法与系统 |
CN109931678A (zh) * | 2019-03-13 | 2019-06-25 | 中国计量大学 | 基于深度学习lstm的空调故障诊断方法 |
CN111307452A (zh) * | 2020-03-05 | 2020-06-19 | 江苏天沃重工科技有限公司 | 一种时变转速下旋转机械智能故障诊断方法 |
WO2020244134A1 (zh) * | 2019-06-05 | 2020-12-10 | 华南理工大学 | 一种基于多任务特征共享神经网络的智能故障诊断方法 |
-
2022
- 2022-04-13 CN CN202210399169.3A patent/CN114925809B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197648A (zh) * | 2017-12-28 | 2018-06-22 | 华中科技大学 | 一种基于lstm深度学习模型的水电机组故障诊断方法与系统 |
CN109931678A (zh) * | 2019-03-13 | 2019-06-25 | 中国计量大学 | 基于深度学习lstm的空调故障诊断方法 |
WO2020244134A1 (zh) * | 2019-06-05 | 2020-12-10 | 华南理工大学 | 一种基于多任务特征共享神经网络的智能故障诊断方法 |
CN111307452A (zh) * | 2020-03-05 | 2020-06-19 | 江苏天沃重工科技有限公司 | 一种时变转速下旋转机械智能故障诊断方法 |
Non-Patent Citations (2)
Title |
---|
王太勇;王廷虎;王鹏;乔卉卉;徐明达;: "基于注意力机制BiLSTM的设备智能故障诊断方法", 天津大学学报(自然科学与工程技术版), no. 06, 27 April 2020 (2020-04-27), pages 55 - 62 * |
陈伟;陈锦雄;江永全;宋冬利;张闻东;: "基于RS-LSTM的滚动轴承故障识别", 中国科技论文, no. 10, 23 May 2018 (2018-05-23), pages 51 - 58 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115700416A (zh) * | 2022-08-29 | 2023-02-07 | 桂林电子科技大学 | 一种汽车故障自动诊断方法、系统、设备及介质 |
CN117131457A (zh) * | 2023-10-26 | 2023-11-28 | 杭州海兴泽科信息技术有限公司 | 基于ai模型的电力大数据采集处理方法及系统 |
CN117131457B (zh) * | 2023-10-26 | 2024-01-26 | 杭州海兴泽科信息技术有限公司 | 基于ai模型的电力大数据采集处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114925809B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107505133B (zh) | 基于自适应mrvm的滚动轴承故障概率性智能诊断方法 | |
CN114925809B (zh) | 基于lstm的印刷机轴承故障诊断方法及装置 | |
Xia et al. | Multi-stage fault diagnosis framework for rolling bearing based on OHF Elman AdaBoost-Bagging algorithm | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN110617966A (zh) | 一种基于半监督生成对抗网络的轴承故障诊断方法 | |
CN113935406A (zh) | 基于对抗流模型的机械设备无监督故障诊断方法 | |
CN111275004B (zh) | 基于lmd和脉冲神经网络的轴承故障诊断方法 | |
CN113673346B (zh) | 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法 | |
CN106886660A (zh) | EEMD‑Hilbert包络谱与DBN相结合的变负载下滚动轴承状态识别方法 | |
CN113792758A (zh) | 一种基于自监督学习和聚类的滚动轴承故障诊断方法 | |
CN111914897A (zh) | 一种基于孪生长短时间记忆网络的故障诊断方法 | |
CN111353373A (zh) | 一种相关对齐域适应故障诊断方法 | |
CN110991471B (zh) | 一种高速列车牵引系统故障诊断方法 | |
CN112834221A (zh) | 一种基于eemd-mse和多尺度一维卷积神经网络轴承故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN112488179A (zh) | 一种基于gru的旋转机械故障诊断方法 | |
CN114722952B (zh) | 一种基于表示学习的轴承故障检测和分类的一体化方法 | |
CN117290771A (zh) | 基于改进辅助分类生成对抗网络的旋转机械故障诊断方法 | |
CN112115922A (zh) | 一种增强深度特征学习的旋转机械故障诊断方法 | |
CN109726770A (zh) | 一种模拟电路故障测试诊断方法 | |
Huo et al. | A class-level matching unsupervised transfer learning network for rolling bearing fault diagnosis under various working conditions | |
CN116702076A (zh) | 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质 | |
CN113409213B (zh) | 柱塞泵故障信号时频图降噪增强方法和系统 | |
Zhang et al. | A novel fault diagnosis method based on semisupervised contrast learning | |
CN114861349A (zh) | 一种基于模型迁移和维纳过程的滚动轴承rul预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Yang Yanhong Inventor after: Wei Xiuhang Inventor after: Yang Shulin Inventor after: Li Yang Inventor after: Wang Jia Inventor before: Wei Xiuhang Inventor before: Yang Shulin Inventor before: Li Yang Inventor before: Wang Jia Inventor before: Yang Yanhong |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |