CN113112000B - 一种多层次卷积神经网络模型的构建方法及应用 - Google Patents
一种多层次卷积神经网络模型的构建方法及应用 Download PDFInfo
- Publication number
- CN113112000B CN113112000B CN202110334326.8A CN202110334326A CN113112000B CN 113112000 B CN113112000 B CN 113112000B CN 202110334326 A CN202110334326 A CN 202110334326A CN 113112000 B CN113112000 B CN 113112000B
- Authority
- CN
- China
- Prior art keywords
- layer
- neural network
- convolutional neural
- link
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Discrete Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明提供了一种多层次卷积神经网络模型的构建方法及应用,该方法包括以下步骤:(1)获得带有不同健康状态标签的振动信号样本序列;(2)将每种健康状态的样本序列分成训练集,验证集以及测试集;(3)构建多层次卷积神经网络,以空间层和时序层形成两条链路,一条链路为浅层空间层,另一条链路为深层次的空间层和时序层,最后将两条链路的输出相结合送入分类器;(4)对多层次卷积神经网络进行训练和验证;将测试集输入到训练好的网络模型,得到诊断结果。本发明应用于滚动轴承、齿轮或电机转子的故障诊断。本发明将浅层特征与深层次特征相连接,解决了只考虑单一的深层次特征而忽略了浅层特征引起的数据特征丢失,影响诊断结果的问题。
Description
技术领域
本发明属于神经网络技术领域,具体涉及一种多层次卷积神经网络模型的构建方法及应用。
背景技术
旋转机械中包含滚动轴承,齿轮,电机转子等部件,在现代工业中得到广泛应用,任一部件故障会导致严重的安全性损失和巨大的维护成本。在过去的几十年里,人们进行了大量的研究来开发有效的故障诊断方法。振动信号通常用于故障诊断,这种信号是一种周期性变化的时间序列数据。传统的故障诊断技术使用信号处理方法,如快速傅立叶变换(FFT)、变分模式分解(VMD)和小波分解,通过确定信号的周期性影响分量来识别故障。虽然上述方法可以有效解决小样本的轴承故障诊断问题,但对于大样本和复杂干扰,仍然存在以下现象。(1)故障诊断方法分为三个独立的部分,即特征提取、降维和分类。这种方法破坏了部件之间的耦合关系,并导致故障信息的部分丢失。(2)人工特征提取需要一定的先验知识,在可变负载和噪声下表现出泛化能力,并且在处理大量数据时会遇到困难。
近年来,深度学习网络作为一种高效的模式识别算法出现,有望克服当前智能故障诊断中的障碍。深度学习的特点是深度架构,多层堆叠在网络中,从原始输入数据中完全捕获代表性信息。在深度学习算法中,CNN广泛应用于图像处理、语音识别、视频处理和故障识别。郭等人提出了一种分级学习率自适应深度卷积神经网络,用于轴承故障诊断和严重程度判定,三个卷积层和池化层堆叠在顶部全连接分类器下面的网络中。孙提出了一种用于感应电机故障诊断的判别特征学习方法,卷积池结构用于从原始振动数据中提取有区别的和不变的特征。卷积神经网络能够很好的提取空间特征,但不能提取时间序列特征,针对这一问题乔等人提出了一种基于卷积神经网络和长短期记忆神经网络(LSTM)的双输入模型,利用一维卷积和池化层提取空间特征并保留数据的序列特征,然后利用LSTM层提取序列特征,该模型能够充分提取数据的空间特征和时间序列特征。虽然CNN提高了故障诊断的准确率,但是上述的方法都是将多层卷积后的特征进行诊断分类,因此只考虑了单一的深层次特征问题,忽略了浅层特征,从而存在数据特征丢失的问题,最终影响诊断结果。
发明内容
针对现有技术中的不足,本发明一种多层次卷积神经网络模型的构建方法及应用,通过对卷积神经网络浅层卷积特征与深层卷积特征相结合,以解决单一的深层次特征导致数据特征丢失,影响诊断结果的问题;并在深层卷积层后加入长短时记忆神经网络,进一步提取时间序列特征;由浅层的空间层与深层的空间层和时序层相结合构建一种多层次卷积神经网络(MLCNN)的故障诊断模型,并将其应用在轴承、齿轮和电机转子故障诊断中。
为解决上述技术问题,本发明采用的技术方案为:
本发明的技术构思为:首先将原始振动信号进行快速傅里叶变化提取出频域系数,然后将频域系数输入到多层次的卷积神经网络的模型中,该多层次模型主要为空间层和时序层,将浅层的空间层特征与深层空间层及时序层特征相连接,最后通过SOFTMAX分类器进行故障识别分类。
一种多层次卷积神经网络模型的构建方法,包括以下步骤:
(1)采集机械设备转动部件不同工况下不同位置的振动信号,按照不同工况对振动信号标标记对应的健康或故障类别标签,构成带有不同健康状态标签的样本序列;
(2)将步骤(1)中的每种健康状态的样本序列分成训练集、验证集以及测试集;
(3)将原始的振动信号进行快速傅里叶变换,从而将时域信号转换成频域信号,并提取出频域系数;
(4)构建多层次卷积神经网络,以空间层和时序层形成两条链路,一条链路为浅层空间层,另一条链路为深层次的空间层和时序层,最后将两条链路的输出相结合,即将浅层空间层特征与深层次的空间层和时序层特征相连接送入分类器中。
具体是将一层卷积后的网络分成两条链路,一条链路加池化层和全连接层,另外一条链路加入卷积层,再加入长短时记忆网络层,接着再加池化和全连接,最后将两条链路的输出相结合,即将单层次特征与深层次特征结合。
(5)使用训练集对构建的多层次卷积神经网络模型进行训练,将步骤(3)中的频域系数输入到步骤(4)中的神经网络模型进行迭代训练;并使用验证集的频域系数对训练的多层次卷积神经网络模型进行验证。
(6)将测试集输入到训练好的多层次卷积神经网络模型,得到诊断结果。
进一步,所述步骤(1)中的机械设备转动部件为滚动轴承、齿轮或电机转子。
再进一步,所述步骤(1)中的振动信号为转动部件的位移、速度或加速度信号。
更进一步,所述步骤(1)中的带有不同健康状态标签的样本序列,其中的不同健康状态标签是指转动部件的不同故障类型和正常状态。
更进一步,所述步骤(4)的构建多层次卷积神经网络步骤如下:
(4.1)第一层卷积层,卷积核的个数为3、5或7,大小为5×1、3×1或64×1,步长为1或2,后面分成两条链路,一条链路后连接非线性激活层和池化层,其中激活层的激活函数为ReLU,池化层为最大池化层Max-pooling或平均池化层Mean-pooling,另一条链路连接第二层卷积层;
(4.2)第一条链路池化层后接入全连接层,全连接层为不小于32个神经元;
(4.3)第二条链路第二层卷积层的卷积核的个数为3、5或7,大小为5×1、3×1或64×1,步长为1或2,后面连非线性激活层和池化层,其中激活层的激活函数为ReLU,池化层为最池化层Max-pooling或平均池化层Mean-pooling;
(4.4)第二条链路的池化层后连接LSTM层,其中LSTM层的激活函数为tanh,神经元的个数不小于16;
(4.5)第二条链路的LSTM层后接入全连接层,全连接层为不小于32个神经元;
(4.6)将第一条链路后的全连接层输出与第二条链路后的全连接层输出相连接;
(4.7)将两条链路连接后的特征输入到SOFTMAX层,利用softmax函数实现分类。
一种基于多层次卷积神经网络的故障诊断模型,应用于旋转机械的故障诊断。
更进一步,所述步骤(5)的使用训练集对构建的模型进行训练,模型训练的优化方法采用自适应动量估计Amda或随机梯度下降SGD优化算法,批量大小不小于256,迭代次数为小于200,训练完后的CNN的模型参数不变。
所述的多层次卷积神经网络模型应用于转动部件的故障诊断。
进一步,所述转动部件为滚动轴承、齿轮或电机转子。
与现有技术相比,本发明具有如下有益效果:
1、本发明提出的多层次卷积神经网络的故障诊断模型,主要是将浅层特征与深层次特征相连接,解决了只考虑单一的深层次特征而忽略了浅层特征引起的数据特征丢失,影响诊断结果的问题。
2、本发明提出的多层次卷积神经网络的故障诊断模型与传统的卷积神经网络模型相比,本发明能够更好地提取转动部件的数据特征并且更充分地利用数据特征,具有更好的分类能力。
附图说明
图1是本发明多层次卷积神经网络结构图;
图2是本发明多层次卷积神经网络故障诊断基本流程图;
图3是实施例2凯斯西储数据集中CNN-LSTM混淆矩阵图;
图4是实施例2凯斯西储数据集中MLCNN混淆矩阵图;
图5是实施例2凯斯西储数据集中CNN-LSTM的ROC曲线图;
图6是实施例2凯斯西储数据集中MLCNN的ROC曲线图;
图7是实施例3东南大学齿轮箱数据集中CNN-LSTM混淆矩阵图;
图8是实施例3东南大学齿轮箱数据集中MLCNN混淆矩阵图;
图9是实施例3东南大学齿轮箱数据集中CNN-LSTM的ROC曲线图;
图10是实施例3东南大学齿轮箱数据集中MLCNN的ROC曲线图;
图11是实施例4渥太华大学up-down数据集中CNN-LSTM混淆矩阵图;
图12是实施例4渥太华大学up-down数据集中MLCNN混淆矩阵图;
图13是实施例4渥太华大学up-down数据集中CNN-LSTM的ROC曲线图;
图14是实施例4渥太华大学up-down数据集中MLCNN的ROC曲线图;
图15是实施例4渥太华大学down-up数据集中CNN-LSTM混淆矩阵图;
图16是实施例4渥太华大学down-up数据集中MLCNN混淆矩阵图;
图17是实施例4渥太华大学down-up数据集中CNN-LSTM的ROC曲线图;
图18是实施例4渥太华大学down-up数据集中MLCNN的ROC曲线图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的详细描述。
实施例1
如图1-2所示,一种基于多层次卷积神经网络的故障诊断模型,包括以下步骤:
(1)采集机械设备的某一转动部件不同工况下不同位置的振动信号,按照不同工况对振动信号标标记对应的健康或故障类别标签,构成带有不同健康状态标签的样本序列。
(2)将步骤(1)中的每种健康状态的样本序列分成训练集、验证集以及测试集。
(3)将原始的振动信号进行快速傅里叶变换,从而将时域信号转换成频域信号,并提取出频域系数。
(4)构建多层次卷积神经网络,将一层卷积后的网络分成两条链路,一条链路加池化层和全连接层,即提取浅层的空间层特征;另外一条链路加入卷积层,再加入长短时记忆网络层,接着再加池化和全连接,即提取深层次的空间层和时序层特征,最后将两条链路的输出相连接组合,即将浅层特征与深层特征结合。
其中构建多层次卷积神经网络的具体步骤如下:
(4.1)第一层卷积层,卷积核的个数为3,大小为5×1,步长为1,后面分成两条链路,一条链路后连接非线性激活层和池化层,其中激活层的激活函数为ReLU,池化层为Max-pooling,另一条链路连接第二层卷积层。
(4.2)第一条链路池化层后接入全连接层,全连接层为32个神经元。
(4.3)第二条链路第二层卷积层的卷积核的个数为3,大小为5×1,步长为1,后面连非线性激活层和池化层,其中激活层的激活函数为ReLU,池化层为Max-pooling。
(4.4)第二条链路的池化层后连接LSTM层,其中LSTM层的激活函数为tanh,神经元的个数为16。
(4.5)第二条链路的LSTM层后接入全连接层,全连接层为32个神经元。
(4.6)将第一条链路后的全连接层输出与第二条链路后的全连接层输出相连接。
(4.7)将两条链路连接后的特征输入到SOFTMAX层,利用softmax函数实现分类。
(5)使用训练集对构建的模型进行训练,将步骤(3)中的频域系数输入到步骤(4)中的模型进行迭代训练。该模型训练的优化方法采用的是Amda梯度优化算法,批量大小为256,迭代次数为200,训练完后的CNN的模型参数不变。
(6)使用验证集的频域系数对训练的模型进行验证,将多层次特征输入到SOFTMAX分类器中分类识别。
(7)将测试集输入到训练好的模型,得到诊断结果。
下列通过实施例2-4来验证一种多层次卷积神经网络模型在轴承故障诊断应用的有效性能,具体分析如下:
在实施例2、例3和例4的试验中,数据集分别应用美国凯斯西储大学、东南大学齿轮箱数据集以及渥太华大学轴承数据集对本发明多层次卷积神经网络模型(简称MLCNN模型)在旋转机械中的应用及进行验证,MLCNN试验代码通过python3.6和Tensorflow进行编写,并在PyCharm2020.1和Windows下运行。
实施例2
为了验证本发明提出的有效性,实施例2通过美国凯斯西储大学数据集对多层次卷积神经网络模型进行实验验证,MLCNN的方法流程图如图2所示。
1、数据集
试验数据来自凯斯西储大学的模拟轴承试验台,测试轴承是SKF6205电机轴承。利用电火花加工技术引入多点蚀直径的单点故障,通过加速度传感器采集驱动部分和风扇部分的故障诊断数据。振动信号是在四种不同的健康状态下从试验台的电机驱动端采集的:1)健康状态;2)外圈故障;3)球故障;4)内圈故障。这三种故障都是由故障直径分别为0.007英寸、0.014英寸和0.021英寸(1英寸=2.54厘米)的电火花加工产生的,因此该数据集包含10种轴承健康状况,每种健康状况包含200个样本,每个样本包含2048个数据点。
由于训练样本个数对识别效果的影响,样本个数影响的是整个网络信息量的大小。在理想情况下,训练样本个数越多,所训练得到的网络参数的泛化性越好。但在实际条件下,样本个数往往较少,研究模型在获得较高准确率下的最小样本数目对于模型应用具有重要意义。因此本次试验通过对不同训练样本和测试样本大小来验证整个网络的泛化性和稳定性。数据集描述如下表1所示。
表1凯斯西储大学滚动轴承数据
2、故障仿真结果
为了验证该方法的有效性,本次实验进行十次实验,每次实验迭代200次,并对十次实验结果求平均值,并且计算出十次实验的标准差来验证该方法的稳定性,将本次发明的故障诊断方法与传统的CNN与LSTM结合的方法进行对比,验证的实验结果如表2所示。
表2实施例2诊断平均准确率
由表2可知,随着训练样本数量的减少,测试的精度也逐渐降低,传统的CNN与LSTM结合的方法在训练样本远远小于测试样本时,测试精度低于90%。然而本发明所提出的方法,虽然测试精度也随着测试样本的减少而降低,但是降低的幅度要远远小于传统的方法,并且在训练样本远远大于测试样本的试验中,最优的测试结果已经达到了100%,平均准确率也达到了99.17%,测试结果要优于传统的方法,并且在训练样本远远小于测试样本时,测试的平均准确率为95.53%,要远远高于传统的方法。再由标准差可以看出,本发明所提出的方法的标准差在不同训练集大小中整体上要小于传统的方法,因此本发明所提出的方法波动性更小,稳定性更好。
为了进一步的验证本发明网络在滚动轴承故障分类中优于传统的网络,对两种方法的混淆矩阵和ROC曲线进行了比较,图3和图4分别为传统CNN-LSTM方法和本发明方法的混淆矩阵,由图3看出CNN-LSTM方法,有5%的BM类样本错分成了BS样本,而从图4本发明的混淆矩阵看出,每类故障类型的识别准确率都为100%,没有出现错分,与传统的方法相比能够更好的预测10种故障类型。图5和图6分别为CNN-LSTM方法和本发明方法的ROC曲线,ROC曲线反映了真实阳性率和假阳性率之间的关系,横坐标为假阳性率,纵坐标为真阳性率,ROC曲线下面积能够准确反映模型综合性能,值越大模型的性能就越好。通过图5和图6对两种方法的对比,可以看出本发明网络模型的整体性能更好。
实施例3
利用本发明的多层次卷积神经网络对齿轮故障数据进行诊断,从而验证本发明的MLCNN模型对齿轮故障诊断准确率,MLCNN模型基本流程图如图2所示。
1、数据集
试验数据集为东南大学齿轮箱数据集,该数据集是从动力传动系统动态模拟器(DDS)中收集的。在转速系统负载设置为20HZ-0V的情况下,采集齿轮箱的不同故障类型数据。数据集包含齿轮箱数据的五种状态类型,包含四种故障类型和一个健康状态,分别为齿根裂纹(chipped),缺齿(miss),齿轮裂纹(root),表面磨损(surface),正常状态(health)。每种状态类型包含了1000个样本,训练集,验证集以及测试集的所占样本数比例如表3所示。
表3东南大学齿轮箱数据
2、故障仿真结果
为了验证该方法的有效性,本次实验进行十次实验,每次实验迭代100次,并对十次实验结果求平均值,并且计算出十次实验的标准差来验证该方法的稳定性,将本次发明的故障诊断方法与传统的CNN与LSTM结合的方法进行对比,验证的实验结果如表4所示。
表4实施例3诊断平均准确率
由表4可以看出,针对齿轮箱的故障数据,本发明的网络模型的平均准确率优于传统的网络模型,并且标准差也小于传统的模型,而且十次诊断结果中,本发明最优测试结果达到了100%,而传统的网络模型最优结果为98.5%。因此可以得出,在该数据下本发明的网络模型故障诊断识别率更高,稳定性更好。
为了进一步的验证本发明网络在齿轮箱故障数据分类中优于传统的网络,对两种方法的混淆矩阵和ROC曲线进行了比较,图7和图8分别为传统CNN方法和本发明方法的混淆矩阵,横坐标为轴承各类状态类型的预测标签,纵坐标为轴承各类状态类型的真实标签,由图7看出传统CNN方法,有7%surface样本错分成了health样本,而从图8本发明的混淆矩阵看出,每类故障类型的识别准确率都为100%,没有出现错分,与传统的方法相比能够更好的预测10种故障类型。图9和图10分别为传统CNN方法和本发明方法的ROC曲线,ROC曲线反映了真实阳性率和假阳性率之间的关系,横坐标为假阳性率,纵坐标为真阳性率,ROC曲线下面积能够准确反映模型综合性能,值越大模型的性能就越好。通过图9和图10对两种方法的对比,可以看出本发明网络模型的整体性能更好。
实施例4
利用本发明的多层次卷积神经网络对时变速条件下采集的轴承数据进行诊断,从而验证本发明的MLCNN模型对不同时变速度条件下的故障诊断准确率,MLCNN模型基本流程图如图2所示。
1、数据集
试验数据集为加拿大渥太华大学数据,该数据集为时变转速条件下采集的轴承振动数据,包含从不同健康状况的轴承在不同时变速度条件下收集的振动数据集。轴承的健康状况包括健康、内圈故障和外圈故障。数据集的运行转速条件包括增加然后降低速度以及降低然后增加速度,数据均以200千赫兹采样,采样持续时间为10秒。先增加后降低速度数据集(up-down)和先降低后增加速度数据集(down-up)都包含了健康、内圈故障和外圈故障三种健康状态。每种故障类型包含1000个样本,每个样本有2048个点,每种状态随机抽取700个样本进行训练,100个样本进行验证,剩余200个样本进行测试,表5展示了本实施例所用数据集的信息。
表5渥太华大学滚动轴承数据
2、故障仿真结果
为了验证该方法的有效性,本次实验进行十次实验,每次实验迭代200次,并对十次实验结果求平均值,并且计算出十次实验的标准差来验证该方法的稳定性,将本次发明的故障诊断方法与传统的CNN与LSTM结合的方法进行对比,验证的实验结果如表6所示。
表6实施例3诊断平均准确率
由表6可以看出,无论是转速先增加后降低还是在转速先降低后增加,本发明的网络模型的平均准确率都优于传统的网络模型,并且标准差也小于传统的模型,因此在该数据下本发明的网络模型故障诊断识别率更高,稳定性更好。
为了进一步的验证本发明网络在变速滚动轴承故障数据分类中优于传统的网络,对两种方法的混淆矩阵和ROC曲线进行了比较,图11和图12为转速先增加后降低数据集的两种方法混淆矩阵图,由图11可以看出有4%的OUT类别错分成了N类别,而从图12本专利提出方法的混淆图可以看出,只有1%的OUT类别错分成了类别,图13和图14为转速先增加后降低数据集的两种方法ROC曲线图,由两幅图可以看出本发明网络模型的ROC曲线下面积值大于CNN-LSTM模型。图15和图16为转速先降低后增加的数据集中两种方法混淆矩阵图,由图15可以看出IN类别的诊断准确率为99%,而从图16本发明提出的方法可以看出,所有类别的诊断准确率均为100%,图17和图18为转速先降低后增加数据集的两种方法ROC曲线图,由两幅图可以看出本发明网络模型的ROC曲线下面积值大于CNN-LSTM模型。因此,由上述两个数据集在传统方法与本发明的网络模型的混淆矩阵和ROC曲线图对比可以得出,本发明的MLCNN模型的分类准确率和综合性能都要优于CNN-LSTM模型。
同理,电机转子运行中存在振动信号,如上述实施例采集电机转子不同工况下不同位置的振动信号,利用本发明的方法建立多层次卷积神经网络模型,应用于电机转子故障诊断。
综上所述,本发明所提出的多层次卷积神经网络在机械设备转动部件故障诊断中,通过对卷积神经网络单层卷积特征与双层卷积特征相结合,以解决单一的深层次特征的问题;并在深层卷积层后加入长短时记忆网络,进一步提取时间序列特征,该方法能够充分提取振动信号特征信息,能够避免特征丢失,具有很好的故障分类能力。分别采用凯斯西储大学轴承故障数据,东南大学齿轮箱故障数据以及渥太华大学轴承故障数据进行实验验证,所得的平均故障识别率分别能达到99.17%,99.15%和99.26%,并且最优都能达到100%,因此该模型能够更加有效且准确的诊断出机械设备转动部件的故障类别。
Claims (8)
1.一种多层次卷积神经网络模型的构建方法,其特征在于,包括以下步骤:
(1)采集机械设备某一转动部件不同工况下不同位置的振动信号,按照不同工况对振动信号标记对应的健康或故障类别标签,构成带有不同健康状态标签的样本序列;
(2)将步骤(1)中的每种健康状态的样本序列分成训练集、验证集以及测试集;
(3)将原始的振动信号进行快速傅里叶变换,从而将时域信号转换成频域信号,并提取出频域系数;
(4)构建多层次卷积神经网络,以空间层和时序层形成两条链路,一条链路为浅层空间层,另一条链路为深层次的空间层和时序层;具体为将一层卷积后的网络分成两条链路,一条链路加池化层和全连接层,即提取浅层的空间层特征;另外一条链路加入卷积层,再加入长短时记忆网络层,接着再加池化和全连接,即提取深层次的空间层和时序层特征,最后将两条链路的输出相连接组合,即将浅层特征与深层特征结合后送入分类器;
(5)使用训练集对构建的多层次卷积神经网络模型进行训练,将步骤(3)中的频域系数输入到步骤(4)中的神经网络模型进行迭代训练;并使用验证集的频域系数对训练的多层次卷积神经网络模型进行验证;
(6)将测试集输入到训练好的多层次卷积神经网络模型,得到诊断结果。
2.根据权利要求1所述的一种多层次卷积神经网络模型的构建方法,其特征在于:所述步骤(1)中的机械设备转动部件为滚动轴承、齿轮或电机转子。
3.根据权利要求1所述的一种多层次卷积神经网络模型的构建方法,其特征在于:所述步骤(1)中的振动信号为转动部件的位移、速度或加速度信号。
4.根据权利要求1所述的一种多层次卷积神经网络模型的构建方法,其特征在于:所述步骤(1)中的带有不同健康状态标签的样本序列,其中的不同健康状态标签是指转动部件的不同故障类型和正常状态。
5.根据权利要求1所述的一种多层次卷积神经网络模型的构建方法,其特征在于:所述步骤(4)中构建多层次卷积神经网络的步骤如下:
(4.1)第一层卷积层,卷积核的个数为3、5或7,大小为5×1、3×1或64×1,步长为1或2,后面分成两条链路,一条链路后连接非线性激活层和池化层,其中激活层的激活函数为ReLU,池化层为Max-pooling,另一条链路连接第二层卷积层;
(4.2)第一条链路池化层后接入全连接层,全连接层为不少于32个神经元;
(4.3)第二条链路第二层卷积层的卷积核的个数为3、5或7,大小为5×1、3×1或64×1,步长为1或2,后面连非线性激活层和池化层,其中激活层的激活函数为ReLU,池化层为最大池化层Max-pooling或平均池化层Mean-pooling;
(4.4)第二条链路的池化层后连接LSTM层,其中LSTM层的激活函数为tanh,神经元的个数为16;
(4.5)第二条链路的LSTM层后接入全连接层,全连接层为不小于32个神经元;
(4.6)将第一条链路后的全连接层输出与第二条链路后的全连接层输出相连接;
(4.7)将两条链路连接后的特征输入到SOFTMAX层,利用softmax函数实现分类。
6.根据权利要求1所述的一种多层次卷积神经网络模型的构建方法,其特征在于:所述步骤(5)的使用训练集对构建的模型进行训练,在模型训练中采用自适应动量估计Amda或随机梯度下降SGD优化算法进行优化,批量大小不小于256,迭代次数不小于200,训练完后的CNN的模型参数不变。
7.一种如权利要求1-6任一项所述的多层次卷积神经网络模型的应用,其特征在于:所述的多层次卷积神经网络模型应用于转动部件的故障诊断。
8.根据权利要求7所述的一种多层次卷积神经网络模型的应用,其特征在于:所述转动部件为滚动轴承、齿轮或电机转子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110334326.8A CN113112000B (zh) | 2021-03-29 | 2021-03-29 | 一种多层次卷积神经网络模型的构建方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110334326.8A CN113112000B (zh) | 2021-03-29 | 2021-03-29 | 一种多层次卷积神经网络模型的构建方法及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113112000A CN113112000A (zh) | 2021-07-13 |
CN113112000B true CN113112000B (zh) | 2022-11-25 |
Family
ID=76712903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110334326.8A Active CN113112000B (zh) | 2021-03-29 | 2021-03-29 | 一种多层次卷积神经网络模型的构建方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113112000B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705695A (zh) * | 2021-08-31 | 2021-11-26 | 重庆邮电大学 | 一种基于卷积神经网络的配电网故障数据辨识方法 |
CN114722965A (zh) * | 2022-04-27 | 2022-07-08 | 烟台杰瑞石油装备技术有限公司 | 一种机械设备故障的确定方法及装置 |
CN115500807B (zh) * | 2022-09-20 | 2024-10-15 | 山东大学 | 基于小型卷积神经网络的心律失常分类检测方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881627A (zh) * | 2020-08-05 | 2020-11-03 | 哈尔滨工程大学 | 一种核动力装置故障诊断方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11263490B2 (en) * | 2017-04-07 | 2022-03-01 | Intel Corporation | Methods and systems for budgeted and simplified training of deep neural networks |
-
2021
- 2021-03-29 CN CN202110334326.8A patent/CN113112000B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881627A (zh) * | 2020-08-05 | 2020-11-03 | 哈尔滨工程大学 | 一种核动力装置故障诊断方法和系统 |
Non-Patent Citations (3)
Title |
---|
代价敏感卷积神经网络:一种机械故障数据不平衡分类方法;董勋等;《仪器仪表学报》;20191215(第12期);全文 * |
基于卷积神经网络与长短期记忆神经网络的多特征融合人体行为识别算法;黄友文等;《激光与光电子学进展》;20190410(第07期);全文 * |
基于卷积神经网络的机械故障诊断方法综述;吴定海等;《机械强度》;20200930(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113112000A (zh) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113112000B (zh) | 一种多层次卷积神经网络模型的构建方法及应用 | |
CN111797567B (zh) | 一种基于深度学习网络的轴承故障分类方法及系统 | |
Wang et al. | Intelligent rolling bearing fault diagnosis via vision ConvNet | |
CN113505655B (zh) | 面向数字孪生系统的轴承故障智能诊断方法 | |
CN112257530B (zh) | 基于盲信号分离和支持向量机的滚动轴承故障诊断方法 | |
CN110132554B (zh) | 一种深度拉普拉斯自编码的旋转机械故障诊断方法 | |
CN109186973A (zh) | 一种无监督深度学习网络的机械故障诊断方法 | |
CN116358871B (zh) | 基于图卷积网络的滚动轴承微弱信号复合故障诊断方法 | |
CN112461543B (zh) | 一种基于多分类支持向量数据描述的旋转机械故障诊断方法 | |
CN114970628B (zh) | 样本不均衡下基于生成对抗网络的转动部件故障诊断方法 | |
CN112182912B (zh) | 基于概率描述与谱分析的制造装备主轴轴承健康评估方法 | |
CN115901249B (zh) | 结合特征优选与多策略优化svdd的滚动轴承性能退化评估方法 | |
CN113569990B (zh) | 面向强噪声干扰环境的演艺装备故障诊断模型构建方法 | |
Chen et al. | Fault identification method for planetary gear based on DT-CWT threshold denoising and LE | |
CN111707472B (zh) | 基于fft和全连接层-svm的滚动轴承故障诊断方法 | |
Han et al. | Deep residual joint transfer strategy for cross-condition fault diagnosis of rolling bearings | |
CN114459760B (zh) | 一种强噪声环境下的滚动轴承故障诊断方法及系统 | |
CN115905976A (zh) | 基于注意力机制的Highway Bi-LSTM轴承故障诊断方法、系统及设备 | |
CN116256174A (zh) | 基于可解释性多层小波驱动的噪声鲁棒轴承故障诊断方法 | |
CN115374811A (zh) | 一种滚动轴承故障状态诊断新方法 | |
Zhang et al. | Fault diagnosis based on optimized node entropy using lifting wavelet packet transform and genetic algorithms | |
CN114964782A (zh) | 基于压缩感知的滚动轴承故障诊断声发射信号处理方法、系统 | |
CN113887586A (zh) | 小样本下基于特征融合的ffcnn-svm迁移学习故障诊断方法 | |
CN114048787A (zh) | 一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统 | |
CN117892198A (zh) | 一种基于深度学习的滚动轴承故障诊断方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |