CN112632466B - 一种基于深度双向长短时记忆网络的轴承故障预测方法 - Google Patents

一种基于深度双向长短时记忆网络的轴承故障预测方法 Download PDF

Info

Publication number
CN112632466B
CN112632466B CN202011351795.2A CN202011351795A CN112632466B CN 112632466 B CN112632466 B CN 112632466B CN 202011351795 A CN202011351795 A CN 202011351795A CN 112632466 B CN112632466 B CN 112632466B
Authority
CN
China
Prior art keywords
memory network
time memory
samples
short
sample length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011351795.2A
Other languages
English (en)
Other versions
CN112632466A (zh
Inventor
张胜文
杨凌翮
程德俊
张辉
方喜峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University of Science and Technology
Original Assignee
Jiangsu University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University of Science and Technology filed Critical Jiangsu University of Science and Technology
Priority to CN202011351795.2A priority Critical patent/CN112632466B/zh
Publication of CN112632466A publication Critical patent/CN112632466A/zh
Application granted granted Critical
Publication of CN112632466B publication Critical patent/CN112632466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,包括如下步骤:获取轴承运行时的原始振动信号,分析选择出一个最优的样本长度;生成样本,使用主成分分析法对所有的样本进行降维;标准化降维后的新样本,定义故障类型,根据新样本划分训练集和验证集;构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练;利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测。

Description

一种基于深度双向长短时记忆网络的轴承故障预测方法
技术领域
本发明属于轴承故障诊断领域,具体涉及一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法。
背景技术
滚动轴承作为旋转机械必不可少的关键件,在各个领域中得到广泛的应用,它的工作状态与整个旋转机械的生命周期存在紧密的联系,滚动轴承是机械设备中极其常见且极其易损坏的零件之一,如果未能及时识别故障,不仅会给工厂带来巨大的经济损失,还会造成机器的损伤甚至是人员伤亡。因此,在实际的工作和生产中,为保证安全和降低成本,监测滚动轴承的工作状态具有现实的理论和实际意义。
滚动轴承在运行过程中会产生相应的振动信号,振动信号能够反映滚动轴承的健康状态。由于轴承在不同状态下所产生的振动信号有所不同,所以通过产生的振动信号可以对滚动轴承的状态进行诊断,有效降低故障造成的损失。对滚动轴承运行过程进行监测和记录,为后期分析故障提供相应的数据支持,从而避免重大故障的发生。
在工业智能化的进程中,随着测控技术的快速发展,设备的数据也随之增大。数据量从小批量数据转换为海量数据,维度从单维数据转变为多维数据,滚动轴承运行状态的监测也同样面临数据增大的问题。传统的轴承故障诊断对于工作人员的专业性知识要求较高,通常要求工作人员熟练掌握信号处理技术。在经过信号处理后,再对其进行故障诊断。传统的故障诊断技术主要使用浅层网络模型,当面对大量高维度振动信号时,无法挖掘出信号的深层次的特征,大大降低轴承故障诊断的效率和准确率。
机器学习具有强大的非线性数据处理能力,在机器视觉、语音识别、图像处理等领域应用广泛。其主要分为有监督学习和无监督学习两种形式。机器学习可以利用轴承振动信号的深层特征,自适应地识别轴承故障类型。机器学习和传统信号处理方法相比,避免人工特征提取的过程,直接从高维信号中学习数据的规律,其故障诊断准确率也得到相应的提高。
深度学习主要指深度神经网络,深度前馈神经网络无法处理带有序列的数据,有文献提出一种基于循环神经网络的方法处理时序数据。但循环神经网络存储能力有限,随着时间的推移,隐藏层的原有信息会被覆盖,从而导致之前的信息缺失,容易导致梯度消失的状况。有文献提出一种基于双向长短时记忆网络的预测方法,通过引入记忆单元,解决以上存在的梯度消失的问题。作为时间序列的代表,轴承的数据不仅具有非线性的特点,还具有动态特性,系统的输出不仅与当前的时刻的输入相关,还与之前时刻的相关,因此,双向长短时记忆网络适用于轴承的故障预测。
样本长度对双向长短时记忆网络的训练和预测都会产生一定的影响。目前,样本长度主要通过人为经验确定或人工实验确定,这样不仅误差较大,而且计算成本较高,效率低。
如果双向长短时记忆网络要解决一个高复杂度的问题,那么双向长短时记忆网络就需要增加或者减少隐藏层神经元数量。但是,隐藏层神经元的数量目前仍需要通过人工实验来确定,并且在训练过程中网络结构是固定不变的。这样不仅误差较大,而且计算成本较高,效率较低。
所以,需要一个新的技术方案来解决这个问题。
发明内容
发明目的:为了克服现有技术中存在的轴承故障诊断问题,考虑到高维度对轴承故障诊断的影响和原始振动信号的具有时序相关性的特点,提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,使双向长短时记忆网络在训练过程中可以根据当前训练情况动态调整隐藏层神经元,优化网络结构,使其更好的解决轴承故障预测的问题,提高轴承预测的精度。
技术方案:为实现上述目的,本发明提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,包括如下步骤:
S1:获取轴承运行时的原始振动信号(即时域信号),分析选择出一个最优的样本长度;
S2:生成样本,使用主成分分析法(PCA)对所有的样本进行降维;
S3:标准化降维后的新样本,定义故障类型,根据新样本划分训练集和验证集;
S4:构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练;
S5:保存较优样本长度和较优双向长短时记忆网络模型,利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测。
进一步地,所述步骤S1中较优样本长度的分析选择方法为:
A1:根据原始振动信号中一个周期信号的数据点数量NT和样本的个数NS,确定样本长度NSL范围,其中,采集的原始振动信号所有数据点的数量为N,NSL范围如下所示:
A2:根据样本长度NSL的范围大小确定不同的搜索策略,即在样本长度的范围内获取一个样本长度的值NsV
A3:重复步骤S2到步骤S4,通过评价准则,直到获取最优的样本长度NSV
进一步地,所述步骤A3中的评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则,分别如下:
针对样本长度范围小的评价准则:
Nsv=argmax(A(n),A(n-1))
其中,argmax(A(n),A(n-1))表示:在两次迭代完成后,保留模型中准确率高的网络,此时模型属于局部最优,保留此时的样本长度NSV;直到遍历结束后,得到全局最优的模型,并保留与之对用的样本长度NSV
针对样本长度范围大的评价准则:
使用随机搜索策略在样本长度范围内搜索,获得样本长度值,在样本长度值中遍历,如果满足停止条件,则停止搜索,获取模型,停止条件为:
A(Nsv)>θ
其中,A(Nsv)表示:当原始信号自动分割成长度为NSV的样本时,将验证样本集放进模型验证得到的准确率;θ表示:验证准确率的阈值,即模型的验证准确率高于给定的阈值时停止,保留此时的样本长度NSV
进一步地,所述步骤S2中对于所有的样本进行降维的具体过程为:
B1:给定轴承振动信号T∈Rk×n,其中,X为k行n列的样本矩阵,矩阵中k表示振动幅值的个数,n表示样本个数,即n=NS,计算所有样本的均值:
其中,i=1,2,...,k;j=1,2,...,n;
B2:计算样本的标准差:
其中,i=1,2,3,...,k;j=1,2,3,...,n;
B3:计算样本的标准化数据:
B4:根据样本的标准化数据计算协方差矩阵:
B5:根据协方差矩阵,利用奇异值分解计算出特征值和对应的特征向量:
[U,S,V]=SVD(ε)
其中,λ1,λ2,λ3,...,λn是计算出的特征值;
U=[u(1) u(2) u(3) … … u(n)]
其中,u(1),u(2),u(3),...,u(n)是λ1,λ2,λ3,...,λn所对应的特征向量,且λ1>λ2>λ3>...>λn
B6:计算贡献率:
如果α≥0.85,构造有对应特征向量u(i),i=1,..,n组成的矩阵E∈Rn×r,即E=(u(1),u(2),u(3),...,u(r))。
降维后的数据与原始数据相比,新的样本在保留主要信息的同时又降低了数据的维度。
进一步地,所述步骤S4中双向长短时记忆网络模型的构建和调整方法具体包括如下步骤:
C1:根据前人研究所提出的经验公式,确定双向长短时记忆网络中的隐藏层单元数量NH的范围:
0≤NH≤2Lmax
其中,Lmax为输入样本的序列最大长度;
C2:自动确定输出层神经元个数、全连接层的层数以及每层神经元的数量;
C3:获取到隐含层神经元数量的最大值2Lmax,将神经元进行编号H1,H2,…H2Lmax,形成序列形式;
C4:初始化双向长短时记忆网络的相关参数;
C5:利用过滤法过滤冗余的神经元,在隐藏层神经元数量的范围内,获取一个对应的隐藏层神经元数量,使得网络中冗余神经元得以去除,实现对双向长短时记忆网络结构的动态调整功能。
进一步地,所述步骤C5具体包括如下步骤:
D1:计算各个神经元对于所有样本的激活概率,然后比较某个神经元的激活概率对于平均值的离散程度;
双向长短时记忆网络的主要目的是提取输入样本的主要特征。其中,提取的主要特征通过隐藏层神经元的激活概率表示。判断提取特征的有效性主要通过观察某个神经元的激活概率对所有样本的离散程度。如果离散程度越高,表明该神经元提取特征的效果越好,则保留该神经元;如果离散程度越低,表明该神经元对提取特征的效果越差,则去除该神经元。某个神经元对于所有样本的离散程度主要使用方差进行衡量。如果方差越大,说明该神经元对于所有样本的离散程度高,则保留该神经元;如果方差越小,说明该神经元对于所有样本的离散程度低,则去除该神经元。
D2:利用过滤法中的方差选择法来筛除冗余的神经元,选择离散程度较小的神经元,即保留方差大于阈值的神经元,去除方差小于阈值的神经元。
进一步地,所述步骤D1中使用方差衡量某个神经元对于所有样本的离散程度,方差表达式如下:
其中,P(i,j)表示第j个神经元对第i个样本的激活概率,表示第j个神经元对所有样本的平均激活概率,NS代表样本的数量。
进一步地,所述步骤D2具体为:为实现提取特征的高效性,则需删除隐藏层中冗余神经元,删除冗余神经元需要制定相应的策略。在一次迭代过程中,计算每一个神经元对于所有样本的方差,如果方差小于给定的阈值,则在形成的序列中删除这些方差对应的神经元,然后进入下一次迭代,重复以上操作,直到序列中每个神经元对所有样本的方差都低于阈值后时停止。
停止条件如下所示:
S(j)2>u
进一步地,所述步骤S5具体为:将降维后的验证集输入到训练过的双向长短时记忆网络模型中,通过双向长短时记忆网络提取测试样本的主要特征,然后将这些主要特征输入到全连接层中,再输入到最后一层输出层中,输出的值代表轴承故障类型,即预测出滚动轴承的故障类型。
进一步地,所述步骤S4中采用训练集对双向长短时记忆网络模型进行训练的过程为:将划分的训练集(包括数据及标签)放进深度长短时记忆网络的输入端,利用双向长短时记忆网络对数据进行自适应的特征提取,在提取之后输入到全连接层,最终通过softmax函数从输出层输出预测的结果。
有益效果:本发明与现有技术相比,具备如下优点:
1、利用主成分分析和双向长短时记忆网络的特殊结构,有效规避了常规神经网络训练过程中的梯度消失和梯度爆炸问题,从而有效地利用历史时间序列信息,使时间序列的状态特征更加易于区分。该方法无需进行信号处理提取特征,减少了人为因素的影响,降低了样本数据的维度,提高了机器学习模型的训练效率;
2、本发明中的双向长短时记忆网络,处理轴承振动信号十分有效,适用于滚动轴承故障诊断。
3、本发明方法能够自动确定样本长度,获得较优的样本长度,提高网络模型的预测准确度和减少时间成本,除此之外,还包括自动分割采集的原始数据,并形成网络训练、验证以及预测所需的样本,取代手动分割原始数据,减少了重复性的操作,大大提高了样本生成的时间。
4、本发明方法能够动态调整网络模型,使得双向长短时记忆网络在训练的过程中可以根据当前的训练情况改变网络结构,主要涉及隐藏层中冗余神经元的筛除,优化了双向长短时记忆网络的结构,取代了人工实验,克服了网络结构设计的困难,提高了故障特征的提取能力和轴承故障预测的能力以及减少长短时记忆网络设计的时间。
附图说明
图1为本发明的整体流程示意图;
图2为本发明实施例中主成分分析(PCA)降维的流程示意图;
图3为本发明实施例中采用的双向长短时记忆网络模型图;
图4为本发明实施例中移除隐藏层冗余神经元的操作示意图;
图5为本发明实施例中移除隐藏层冗余神经元的流程示意图;
图6为本发明实施例中获取较优样本长度的流程示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,如图1所示,其包括如下步骤:
S1:获取轴承运行时的原始振动信号(即时域信号),分析选择出一个较优的样本长度。
对照图6,本实施例中较优样本长度的分析选择方法包括如下步骤A1~A3为:
A1:根据原始振动信号中一个周期信号的数据点数量NT和样本的个数NS,确定样本长度NSL范围,其中,采集的原始振动信号所有数据点的数量为N,NSL范围如下所示:
A2:根据样本长度NSL的范围大小确定不同的搜索策略,即在样本长度的范围内获取一个较优的样本长度值NSV
A3:重复步骤S2到步骤S4,通过评价准则,直到获取最优的样本长度NSV
评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则,分别为遍历法和随机搜索法,具体如下:
针对样本长度范围小的评价准则(遍历法):
Nsv=argmax(A(n),A(n-1))
其中,argmax(A(n),A(n-1))表示:在两次迭代完成后,保留模型中准确率高的网络,此时模型属于局部最优,保留此时的样本长度NSV;直到遍历结束后,得到全局最优的模型,并保留与之对用的样本长度NSV
针对样本长度范围大的评价准则(随机搜索法):
使用随机搜索策略在样本长度范围内搜索,获得样本长度值,在样本长度值中遍历,如果满足停止条件,则停止搜索,获取模型,停止条件为:
A(Nsv)>θ
其中,A(Nsv)表示:当原始信号自动分割成长度为NSV的样本时,将验证样本集放进模型验证得到的准确率;θ表示:验证准确率的阈值,即模型的验证准确率高于给定的阈值时停止,保留此时的样本长度NSV
S2:生成样本,使用主成分分析法(PCA)对所有的样本进行降维,如图2所示,具体包括如下步骤B1~B6:
B1:给定轴承振动信号T∈Rk×n,其中,X为k行n列的样本矩阵,矩阵中k表示振动幅值的个数,n表示样本个数,即n=NS,计算所有样本的均值:
其中,i=1,2,...,k;j=1,2,...,n;
B2:计算样本的标准差:
其中,i=1,2,3,...,k;j=1,2,3,...,n;
B3:计算样本的标准化数据:
B4:根据样本的标准化数据计算协方差矩阵:
B5:根据协方差矩阵,利用奇异值分解计算出特征值和对应的特征向量:
[U,S,V]=SVD(ε)
其中,λ1,λ2,λ3,...,λn是计算出的特征值;
U=[u(1) u(2) u(3) … … u(n)]
其中,u(1),u(2),u(3),...,u(n)是λ1,λ2,λ3,...,λn所对应的特征向量,且λ1>λ2>λ3>…>λn
B6:计算贡献率:
如果α≥0.85,构造有对应特征向量u(i),i=1,..,n组成的矩阵E∈Rn×r,即E=(u(1),u(2),u(3),…,u(r))。
降维后的数据与原始数据相比,新的样本在保留主要信息的同时又降低了数据的维度。
S3:标准化降维后的新样本,定义故障类型,故障类型包括正常数据、驱动端内圈故障和风扇端内圈故障,根据新样本划分训练集和验证集;
S4:构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练。
如图3展示了本实施例应用的双向长短时记忆网络模型,对照图4和图5,双向长短时记忆网络模型的构建和调整方法具体包括如下步骤C1~C5:
C1:根据前人研究所提出的经验公式,确定双向长短时记忆网络中的隐藏层单元数量NH的范围:
0≤NH≤2Lmax
其中,Lmax为输入样本的序列最大长度;
C2:自动确定输出层神经元个数、全连接层的层数以及每层神经元的数量;
C3:获取到隐含层神经元数量的最大值2Lmax,将神经元进行编号H1,H2,…H2Lmax,形成序列形式;
C4:初始化双向长短时记忆网络的相关参数;
C5:利用过滤法过滤冗余的神经元,在隐藏层神经元数量的范围内,获取一个对应的隐藏层神经元数量,使得网络中冗余神经元得以去除,实现对双向长短时记忆网络结构的动态调整功能。
步骤C5具体包括如下步骤D1和D2:
D1:计算各个神经元对于所有样本的激活概率,然后比较某个神经元的激活概率对于平均值的离散程度;
双向长短时记忆网络的主要目的是提取输入样本的主要特征。其中,提取的主要特征通过隐藏层神经元的激活概率表示。判断提取特征的有效性主要通过观察某个神经元的激活概率对所有样本的离散程度。如果离散程度越高,表明该神经元提取特征的效果越好,则保留该神经元;如果离散程度越低,表明该神经元对提取特征的效果越差,则去除该神经元。某个神经元对于所有样本的离散程度主要使用方差进行衡量。如果方差越大,说明该神经元对于所有样本的离散程度高,则保留该神经元;如果方差越小,说明该神经元对于所有样本的离散程度低,则去除该神经元。
使用方差衡量某个神经元对于所有样本的离散程度,方差表达式如下:
其中,P(i,j)表示第j个神经元对第i个样本的激活概率,表示第j个神经元对所有样本的平均激活概率,NS代表样本的数量。
D2:利用过滤法中的方差选择法来筛除冗余的神经元,选择离散程度较小的神经元,即保留方差大于阈值的神经元,去除方差小于阈值的神经元。
为实现提取特征的高效性,则需删除隐藏层中冗余神经元,删除冗余神经元需要制定相应的策略。在一次迭代过程中,计算每一个神经元对于所有样本的方差,如果方差小于给定的阈值,则在形成的序列中删除这些方差对应的神经元,然后进入下一次迭代,重复以上操作,直到序列中每个神经元对所有样本的方差都低于阈值后时停止。
停止条件如下所示:
S(j)2>u
本步骤中采用训练集对双向长短时记忆网络模型进行训练的过程为:将划分的训练集(包括数据及标签)放进深度长短时记忆网络的输入端,利用双向长短时记忆网络对数据进行自适应的特征提取,在提取之后输入到全连接层,最终通过softmax函数从输出层输出预测的结果。
S5:保存较优样本长度和较优双向长短时记忆网络模型,利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测。
具体为:将降维后的验证集输入到训练过的双向长短时记忆网络模型中,通过双向长短时记忆网络提取测试样本的主要特征,然后将这些主要特征输入到全连接层中,再输入到最后一层输出层中,输出的值代表轴承故障类型,即预测出滚动轴承的故障类型。
基于上述滚动轴承故障预测方法,本实施例对采集到的滚动轴承振动数据进行检测。该数据集包括450个样本,其中训练样本360个,测试样本90个。经过上述方法自动调整获得较优的样本长度为512,较优隐藏层神经元数量为100;输出结果为三种故障类型的一种,故障类型包括正常数据、驱动端内圈故障、风扇端内圈故障。检测结果表明基于动态双向长短时记忆网络的轴承故障预测方法比传统的人工控制方法节约了28%的处理时间,准确率也从92%提高到了98%。因此,本发明方法可以有效的预测轴承的故障,并且节约时间和成本,实现高效的故障预测。

Claims (8)

1.一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,包括如下步骤:
S1:获取轴承运行时的原始振动信号,分析选择出一个最优的样本长度;
S2:生成样本,使用主成分分析法对所有的样本进行降维;
S3:标准化降维后的新样本,定义故障类型,根据新样本划分训练集和验证集;
S4:构建并调整双向长短时记忆网络模型,采用训练集对双向长短时记忆网络模型进行训练;
S5:利用训练好的双向长短时记忆网络模型,根据验证集进行轴承的故障预测;
所述步骤S1中最优样本长度的分析选择方法为:
A1:根据原始振动信号中一个周期信号的数据点数量NT和样本的个数NS,确定样本长度NSL范围,其中,采集的原始振动信号所有数据点的数量为N,NSL范围如下所示:
A2:根据样本长度NSL的范围大小确定不同的搜索策略,即在样本长度的范围内获取一个样本长度的值NSV
A3:重复步骤S2到步骤S4,通过评价准则,直到获取最优的样本长度NSV
所述步骤A3中的评价准则包括针对样本长度范围小和样本长度范围大的两种评价准则,分别如下:
针对样本长度范围小的评价准则:
Nsv=arg max(A(n),A(n-1))
其中,arg max(A(n),A(n-1))表示:在两次迭代完成后,保留模型中准确率高的网络,此时模型属于局部最优,保留此时的样本长度NSV;直到遍历结束后,得到全局最优的模型,并保留与之对用的样本长度NSV
针对样本长度范围大的评价准则:
使用随机搜索策略在样本长度范围内搜索,获得样本长度值,在样本长度值中遍历,如果满足停止条件,则停止搜索,获取模型,停止条件为:
A(Nsv)>θ
其中,A(Nsv)表示:当原始信号自动分割成长度为NSV的样本时,将验证样本集放进模型验证得到的准确率;θ表示:验证准确率的阈值,即模型的验证准确率高于给定的阈值时停止,保留此时的样本长度NSV
2.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S2中对于所有的样本进行降维的具体过程为:
B1:给定轴承振动信号T∈Rk×n,其中,X为k行n列的样本矩阵,矩阵中k表示振动幅值的个数,n表示样本个数,即n=NS,计算所有样本的均值:
其中,i=1,2,…,k;j=1,2,…,n;
B2:计算样本的标准差:
其中,i=1,2,3,…,k;j=1,2,3,…,n;
B3:计算样本的标准化数据:
B4:根据样本的标准化数据计算协方差矩阵:
B5:根据协方差矩阵,利用奇异值分解计算出特征值和对应的特征向量:
[U,S,V]=SVD(ε)
其中,λ123,…,λn是计算出的特征值;
U=[u(1) u(2) u(3) … … u(n)]
其中,u(1),u(2),u(3),…,u(n)是λ123,…,λn所对应的特征向量,且λ123>…>λn
B6:计算贡献率:
如果α≥0.85,构造有对应特征向量u(i),i=1,..,n组成的矩阵E∈Rn×r,即E=(u(1),u(2),u(3),…,u(r))。
3.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S4中双向长短时记忆网络模型的构建和调整方法具体包括如下步骤:
C1:确定双向长短时记忆网络中的隐藏层单元数量NH的范围:
0≤NH≤2Lmax
其中,Lmax为输入样本的序列最大长度;
C2:自动确定输出层神经元个数、全连接层的层数以及每层神经元的数量;
C3:获取到隐含层神经元数量的最大值2Lmax,将神经元进行编号H1,H2,…H2Lmax,形成序列形式;
C4:初始化双向长短时记忆网络的相关参数;
C5:利用过滤法过滤冗余的神经元,在隐藏层神经元数量的范围内,获取一个对应的隐藏层神经元数量,使得网络中冗余神经元得以去除,实现对双向长短时记忆网络结构的动态调整功能。
4.根据权利要求3所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤C5具体包括如下步骤:
D1:计算各个神经元对于所有样本的激活概率,然后比较某个神经元的激活概率对于平均值的离散程度;
D2:利用过滤法中的方差选择法来筛除冗余的神经元,保留方差大于阈值的神经元,去除方差小于阈值的神经元。
5.根据权利要求4所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤D1中使用方差衡量某个神经元对于所有样本的离散程度,方差表达式如下:
其中,P(i,j)表示第j个神经元对第i个样本的激活概率,表示第j个神经元对所有样本的平均激活概率,NS代表样本的数量。
6.根据权利要求4所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤D2具体为:在一次迭代过程中,计算每一个神经元对于所有样本的方差,如果方差小于给定的阈值,则在形成的序列中删除这些方差对应的神经元,然后进入下一次迭代,重复以上操作,直到序列中每个神经元对所有样本的方差都低于阈值后时停止。
7.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S5具体为:将降维后的验证集输入到训练过的双向长短时记忆网络模型中,通过双向长短时记忆网络提取测试样本的主要特征,然后将这些主要特征输入到全连接层中,再输入到最后一层输出层中,输出的值代表轴承故障类型,即预测出滚动轴承的故障类型。
8.根据权利要求1所述的一种基于主成分分析和深度双向长短时记忆网络的轴承故障预测方法,其特征在于,所述步骤S4中采用训练集对双向长短时记忆网络模型进行训练的过程为:将划分的训练集放进深度长短时记忆网络的输入端,利用双向长短时记忆网络对数据进行自适应的特征提取,在提取之后输入到全连接层,最终通过softmax函数从输出层输出预测的结果。
CN202011351795.2A 2020-11-26 2020-11-26 一种基于深度双向长短时记忆网络的轴承故障预测方法 Active CN112632466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011351795.2A CN112632466B (zh) 2020-11-26 2020-11-26 一种基于深度双向长短时记忆网络的轴承故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011351795.2A CN112632466B (zh) 2020-11-26 2020-11-26 一种基于深度双向长短时记忆网络的轴承故障预测方法

Publications (2)

Publication Number Publication Date
CN112632466A CN112632466A (zh) 2021-04-09
CN112632466B true CN112632466B (zh) 2024-01-23

Family

ID=75304017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011351795.2A Active CN112632466B (zh) 2020-11-26 2020-11-26 一种基于深度双向长短时记忆网络的轴承故障预测方法

Country Status (1)

Country Link
CN (1) CN112632466B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116756881B (zh) * 2023-08-21 2024-01-05 人工智能与数字经济广东省实验室(广州) 一种轴承剩余使用寿命预测方法、装置及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430546B1 (en) * 2003-06-07 2008-09-30 Roland Erwin Suri Applications of an algorithm that mimics cortical processing
CN109344517A (zh) * 2018-10-14 2019-02-15 毛述春 一种新能源汽车的高压绝缘故障诊断方法
CN109883699A (zh) * 2018-12-20 2019-06-14 上海理工大学 一种基于长短时记忆网络的滚动轴承剩余寿命预测方法
CN109978080A (zh) * 2018-04-16 2019-07-05 北京工业大学 一种基于判别矩阵变量受限玻尔兹曼机的图像识别方法
CN110146293A (zh) * 2019-06-04 2019-08-20 昆明理工大学 一种基于pca与elm的滚动轴承故障诊断方法
CN110647911A (zh) * 2019-08-13 2020-01-03 南京航空航天大学 一种基于主成分分析和深度信念网络的轴承故障诊断方法
CN110689075A (zh) * 2019-09-26 2020-01-14 北京工业大学 基于多算法融合的制冷设备的自适应阈值的故障预测方法
CN111259717A (zh) * 2019-10-21 2020-06-09 杭州安脉盛智能技术有限公司 一种旋转设备状态异常判断方法及系统
CN111562108A (zh) * 2020-05-09 2020-08-21 浙江工业大学 一种基于cnn和fcmc的滚动轴承智能故障诊断方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430546B1 (en) * 2003-06-07 2008-09-30 Roland Erwin Suri Applications of an algorithm that mimics cortical processing
CN109978080A (zh) * 2018-04-16 2019-07-05 北京工业大学 一种基于判别矩阵变量受限玻尔兹曼机的图像识别方法
CN109344517A (zh) * 2018-10-14 2019-02-15 毛述春 一种新能源汽车的高压绝缘故障诊断方法
CN109883699A (zh) * 2018-12-20 2019-06-14 上海理工大学 一种基于长短时记忆网络的滚动轴承剩余寿命预测方法
CN110146293A (zh) * 2019-06-04 2019-08-20 昆明理工大学 一种基于pca与elm的滚动轴承故障诊断方法
CN110647911A (zh) * 2019-08-13 2020-01-03 南京航空航天大学 一种基于主成分分析和深度信念网络的轴承故障诊断方法
CN110689075A (zh) * 2019-09-26 2020-01-14 北京工业大学 基于多算法融合的制冷设备的自适应阈值的故障预测方法
CN111259717A (zh) * 2019-10-21 2020-06-09 杭州安脉盛智能技术有限公司 一种旋转设备状态异常判断方法及系统
CN111562108A (zh) * 2020-05-09 2020-08-21 浙江工业大学 一种基于cnn和fcmc的滚动轴承智能故障诊断方法

Also Published As

Publication number Publication date
CN112632466A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN110738360B (zh) 一种设备剩余寿命预测方法及系统
Ma et al. Discriminative deep belief networks with ant colony optimization for health status assessment of machine
She et al. Wear indicator construction of rolling bearings based on multi-channel deep convolutional neural network with exponentially decaying learning rate
CN111460728B (zh) 一种工业设备剩余寿命预测方法、装置、存储介质及设备
CN113255848B (zh) 基于大数据学习的水轮机空化声信号辨识方法
CN112257530B (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN108398268A (zh) 一种基于堆叠去噪自编码器和自组织映射的轴承性能退化评估方法
CN113486578B (zh) 一种工业过程中设备剩余寿命的预测方法
CN109000930A (zh) 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法
CN110647911A (zh) 一种基于主成分分析和深度信念网络的轴承故障诊断方法
CN110348468B (zh) 一种相关向量机优化强重构边缘降噪自动编码器的轴承亚健康识别方法
CN114297918A (zh) 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法
CN114091525A (zh) 一种滚动轴承退化趋势预测方法
Dong et al. Quality monitoring and root cause diagnosis for industrial processes based on Lasso-SAE-CCA
CN112632466B (zh) 一种基于深度双向长短时记忆网络的轴承故障预测方法
CN115290326A (zh) 一种滚动轴承故障智能诊断方法
CN113203914A (zh) 基于dae-cnn的地下电缆早期故障检测和识别方法
Sadoughi et al. A deep learning approach for failure prognostics of rolling element bearings
Deng et al. Remaining useful life prediction of machinery: A new multiscale temporal convolutional network framework
CN114861778A (zh) 一种改进宽度迁移学习的不同负载下滚动轴承状态快速分类方法
Ma et al. Multi-scale one-dimensional convolution tool wear monitoring based on multi-model fusion learning skills
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
Xiao et al. Support evidence statistics for operation reliability assessment using running state information and its application to rolling bearing
Li et al. Gated recurrent unit networks for remaining useful life prediction
CN114648076A (zh) 一种无监督学习的电池生产工艺异常波动检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant