CN110987436B - 基于激励机制的轴承故障诊断方法 - Google Patents

基于激励机制的轴承故障诊断方法 Download PDF

Info

Publication number
CN110987436B
CN110987436B CN202010145254.8A CN202010145254A CN110987436B CN 110987436 B CN110987436 B CN 110987436B CN 202010145254 A CN202010145254 A CN 202010145254A CN 110987436 B CN110987436 B CN 110987436B
Authority
CN
China
Prior art keywords
feature
value
similarity
data
existing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010145254.8A
Other languages
English (en)
Other versions
CN110987436A (zh
Inventor
赵宜斌
于兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Development Zone Jingnuo Hanhai Data Technology Co ltd
Original Assignee
Tianjin Development Zone Jingnuo Hanhai Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Development Zone Jingnuo Hanhai Data Technology Co ltd filed Critical Tianjin Development Zone Jingnuo Hanhai Data Technology Co ltd
Priority to CN202010145254.8A priority Critical patent/CN110987436B/zh
Publication of CN110987436A publication Critical patent/CN110987436A/zh
Application granted granted Critical
Publication of CN110987436B publication Critical patent/CN110987436B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于激励机制的轴承故障诊断方法,包括下述步骤:(1)对轴承采集不同故障状态以及正常样本的振动信号,采用极点对称经验模态分解方法提取振动信号特征;(2)对得到的故障数据采用加权核主成分分析法进行特征提取;(3)将特征提取后的数据进行划分;(4)在将增量训练集不断输入的过程中,计算其与初步训练数据集中数据的Wasserstein距离,进而计算相似度值;(5)根据相似度值的大小进行激励机制的训练,生成合并、新增及暂存三种情况,并动态调整阈值、样本数据及权重值;(6)将激励机制训练得到的数据输入到BP神经网络中进行可靠分类诊断。

Description

基于激励机制的轴承故障诊断方法
技术领域
本发明涉及轴承设备故障诊断技术领域,尤其涉及一种基于激励机制的轴承故障诊断方法。
背景技术
随着工业物联网的发展,对设备故障进行诊断和预测逐渐成为研究热点。目前,智能设备已应用于国防、工业、航空等很多重要领域,如果其中发生故障会造成严重的后果,因此如何进行可靠的故障诊断,并对故障进行准确的预测得到了越来越多的重视。
随着设备运行数据的增加,机器学习方法受到广泛关注,不断被应用于设备故障诊断领域,其中包括神经网络、随机森林和支持向量机等,都取得了较好的研究成果。文章[许磊等. 基于PSO神经网络的故障诊断方法研究[J].计算机工程与设计,2007,15: 3640-3641+3674.]提出了一种基于粒子群神经网络的方法进行故障诊断;文章[徐可等. 基于经验模态分解和支持向量机的滚动轴承故障诊断[J].控制理论与应用, 2019, 36(06):915-922.]提出了一种改进的经验模态分解和粒子群算法优化支持向量机的诊断方法在故障诊断中获得较高诊断准确率;文章[曹路等. 基于遗传算法的双子支持向量机的模型选择[J].现代电子技术, 2017(17): 113-116.]提出了一种基于遗传算法的双子支持向量机对轴承故障进行诊断。但在处理海量的高维数据带来的复杂问题时,模型效果无法满足要求,因此需要设计得到一个高效利用大量新增样本中包含的重要信息的模型训练方法。针对以上问题,首先可以采用特征提取方法减少数据的维度,然后采用增量学习的方法进行高效学习。其中针对特征提取方法,文章[赵建喆等. 质量预测及故障诊断建模过程中非线性特征提取[J].东北大学学报(自然科学版), 2012, 33(06): 793-796.]提出了一种基于核主成分分析法和粗糙集的特征提取方法,通过核主成分分析法进行特征提取后,再使用粗糙集对提取的特征进行约简,不仅为后续的分类减少了计算复杂度,同时提高了分类精度;文章[张伟等.基于一种自适应核学习的KECA子空间故障特征提取[J].北京理工大学学报,2017, 37(08): 863-868+874.]提出了一种基于自适应核函数优化学习的核熵成分分析特征提取方法,提高了分类精度;针对增量学习方法,文章[李世其等. 一种决策树增量学习算法在故障诊断中的应用[J].华中科技大学学报(自然科学版),2006(04):79-81.]提出了一种基于粗糙集的决策树增量式学习算法,大大地提高了学习效率。文章[李梦婷等. 基于增量贝叶斯学习模型的在线电路故障诊断[J].计算机应用与软件, 2018, 35(06): 70-75.]提出了一种基于贝叶斯增量学习的在线电路故障诊断方法,不仅减小了运算量和运算时间,同时满足了在线故障诊断的实时性要求。以上特征提取和增量学习模型在已有文献中都起到了减轻计算量、提高准确率、有效节约时间成本的作用。但在故障诊断领域,增量生成的数据流具有海量的特点,故障增量之间具有强关联性,且与原有数据具有强因果性,如不加以处理将会严重影响诊断效果。以上这些因素阻碍了传统增量学习方法在故障诊断领域的进一步应用。
发明内容
本发明的目的在于:
本发明提供一种基于激励机制的轴承故障诊断方法,使用加权核主成分分析法对样本进行有效特征提取,然后通过计算Wasserstein距离得到相似度,按照相似度的不同程度采用激励机制对初始数据样本和新增数据样本的权重进行动态调整,最后使用BP神经网络(Back Propagation Neural Network,BPNN)进行分类。该方法与传统方法相比,通过对数据的特征提取,最大限度的保留了有效信息并提高了实验的运行效率,通过使用激励机制进行增量学习,有效解决了故障数据之间强关联强因果等特性带来的问题,实现了对故障数据的动态调整,达到了高效利用数据信息的效果,最终实现了轴承故障的可靠分类。
本发明所采取的技术方案为:
一种基于激励机制的轴承故障诊断方法,包括下述步骤:
(1)对轴承采集不同故障状态以及正常样本的振动信号,采用极点对称经验模态分解方法(Extreme-point Symmetric Mode Decomposition method,ESMD)提取振动信号特征;
(2)对得到的故障数据采用加权核主成分分析法进行特征提取;
(3)将特征提取后的数据划分为训练数据和测试数据,并将训练数据划分为4组,1组作为初步训练数据集输入到步骤(4)并初始化权重,形成初始特征,剩余数据作为增量训练集;
(4)在将增量训练集不断输入的过程中,计算其与初步训练数据集中数据的Wasserstein距离,进而计算相似度值;
(5)根据相似度值的大小进行激励机制的训练,动态调整阈值、样本数据及权重值;
(6)将激励机制训练得到的数据输入到BPNN中进行可靠分类诊断。
其中,步骤(2)中的加权核主成分分析法的权重是以不同样本的标签作为权值进行计算的,其中样本共有10个类别,标签的信息值为
Figure DEST_PATH_IMAGE001
,其中lj表示第j个标签信息值,式中
Figure DEST_PATH_IMAGE002
,标签的信息值即为样本的权重值,然后根据该权值信息构造加权核矩阵
Figure DEST_PATH_IMAGE003
,其中
Figure 664654DEST_PATH_IMAGE003
表示i行j列的加权核矩阵,
Figure DEST_PATH_IMAGE004
,并在高斯核函数的基础上构造加权核主成分分析法,用于特征提取。
步骤(4)中,将Wasserstein距离用于计算相似度值,相似度值计算公式如下:
Figure DEST_PATH_IMAGE005
其中
Figure DEST_PATH_IMAGE006
表示新增特征P和现有特征Q两个不同故障特征的相似度值(现有特征包含初始特征和完成新增操作的新增特征),W(P,Q)表示新增特征P和现有特征Q两个不同故障特征的Wasserstein距离,具体计算公式如下:
Figure DEST_PATH_IMAGE007
其中,P(i)和Q(i)分别代表新增特征P的第i个值和现有特征Q的第i个值,
Figure DEST_PATH_IMAGE008
表示新增特征P和现有特征Q的联合分布,
Figure DEST_PATH_IMAGE009
表示新增特征P和现有特征Q组合后所有可能的联合分布的集合,
Figure DEST_PATH_IMAGE010
表示从联合分布
Figure 893379DEST_PATH_IMAGE008
中采样得到新增特征P的第i个值和现有特征Q的第i个值,
Figure DEST_PATH_IMAGE011
表示新增特征P的第i个值与现有特征Q的第i个值之间的距离,
Figure DEST_PATH_IMAGE012
表示样本对距离的期望值,inf表示下界,即在所有可能的联合分布中对期望值取到的下界
Figure DEST_PATH_IMAGE013
就是Wasserstein距离,所以新增特征P和现有特征Q之间的差异性越小,Wasserstein距离越小,则相似度值越大,以此衡量新增特征与现有特征的相似度。
步骤(5)中激励机制训练过程包括下述步骤:
对于得到的新增特征与现有特征的Wasserstein相似度值,选取最大值作为新增特征的相似度值,并根据不同原则判定新增、合并或是暂存该新增特征,在该过程中,使用α代表现有特征中使两对比特征之间相似度有意义的最小相似度阈值(现有特征包含初始特征和完成新增操作的新增特征),使用β代表现有特征中使两对比特征之间相似度有意义的最大相似度阈值,使用b代表最小相似度阈值和最大相似度阈值的平均值,当相似度值大于b时,合并特征并增大该现有特征的权重值;当相似度值在α和b之间时,将新特征加入到现有特征中并赋予初始权值;其余的相似度值代表该新增特征可能为无意义的噪声干扰值,也可能还未找到相似度匹配的特征,将其暂存于一个新的列表中,若再次使用,则继续对其判断,否则在程序运行完毕后将其舍弃,然后根据新增特征增量与合并原则来计算特征的动态权重,用以衡量该特征随时间变化的重要性改变程度,其中阈值
Figure DEST_PATH_IMAGE014
是根据当前情况不断变化的。
为了解决海量、强因果关联数据带来的复杂问题,本专利提出一种基于激励机制的轴承故障诊断方法,使用加权核主成分分析法对样本进行有效特征提取,然后通过计算Wasserstein距离得到相似度,按照相似度的不同程度采用激励机制对初始数据样本和新增数据样本的权重进行动态调整,最后使用BPNN进行分类,以期进一步提高设备故障诊断的准确率和效率。
一、本发明方法的理论依据:
1、ESMD:对原始轴承故障振动信号使用极点对称经验模态分解各频段的能量值得到数据样本。
2、加权核主成分分析法:加权核主成分分析特征提取方法(Weighted KernelPrincipal Component Analysis,WKPCA)是基于核主成分分析特征提取方法(KernelPrincipal Component Analysis,KPCA)的基础上得到的。核主成分分析法是针对主成分分析法无法解决非线性问题而提出的,本发明选择高斯核函数对非线性情况进行实验,通过特征提取保留足够多的信息。但是由于KPCA忽略了样本的标签信息,故在KPCA的基础上,使用与类别信息相关的权值来表示不同类别间的差距,进而提高了故障识别率。
3、Wessertein距离:Wasserstein距离用于衡量两样本之间的距离,相比KL散度(Kullback–Leibler divergence,KLD)和JS散度(Jensen-Shannon divergence,JSD)的优势在于,如果两样本之间没有重叠或者重叠非常少,仍然能反映两个样本之间的远近,而JSD在此情况下是常量,KLD可能无意义,并且避免了KLD不对称的情况,所以Wasserstein距离能够准确衡量故障之间的相似程度。
4、激励机制:对比寿命模型中对数据仅使用一次和遗忘模型中遗忘的数据不再使用,激励机制的优点在于对数据进行可重复使用并动态增大所占权重的同时,可以对不满足判断条件或者由于遗忘而被遗弃的数据进行唤醒以重新对其进行学习,由于最先学习的知识会逐渐遗忘,但最先学习的知识作为基础知识,也是存在部分重要信息的,若完全遗忘,可能会影响分类结果,故针对此种情况,提出激励机制进行训练,由于最先学习的知识随着时间会记忆疲劳甚至逐渐遗忘,但是通过该知识再次出现对记忆进行刺激,可再次进行利用,优化分类结果。在对记忆进行刺激的过程中,对新增样本与已添加样本之间的Wasserstein距离进行计算,距离越小,相似度越大,则该组样本越重要,可据此动态增大该样本所占权重,即该组样本被选用的次数越多,记忆也就越深刻,权重值也就越大;而距离越大,相似度越小,该组的样本越不重要,则缓慢减少该组样本的权重值;当样本权重因缓慢减少而小于某阈值或者样本权重不满足判断条件时,将其暂存于新的列表中,在计算距离过程中若再次使用,则重新对其进行判断,如果满足条件则可以继续使用该组样本,从而实现激励机制,否则当程序运行完毕后进行删除。
5、BPNN算法:BPNN通过对数据进行学习,使数据通过输入层、隐藏层和输出层的训练后实现最终的故障分类。
二、基于激励机制的轴承故障诊断方法设计:
基于激励机制的轴承故障诊断方法工作原理如下:对极点对称经验模态分解后得到的数据采用加权核主成分分析法进行特征提取,使数据变得更加高效,提高后续数据处理的效率;将提取的特征输入到激励机制中进行增量学习,并不断动态调整数据样本、权重值及阈值,增强对样本所包含信息的学习,在保留原始数据信息的基础上不断学习新的知识;最终将激励机制训练得到的数据输入到BPNN中进行轴承故障的可靠分类,方法的操作如图1所示。
1、基于激励机制的轴承故障诊断方法结构
本发明中加权核主成分分析法通过特征提取减少数据样本的维度,提高数据处理的效率。将得到的数据输入到激励机制中进行增量学习,通过计算相似度值动态调整数据样本、权重值及阈值,得到包含信息量最多的数据后输入到BPNN中进行分类。
2、算法具体实现
基于激励机制的轴承故障诊断方法步骤描述如下,流程图如图2所示。
(1)使用ESMD提取10种状态下的振动信号特征;
(2)对得到的故障数据采用WKPCA进行特征提取;
(3)将特征提取后的数据划分为训练数据和测试数据,并将训练数据划分为4组,1组作为初步训练数据集输入到步骤(4)并初始化权重,剩余数据作为增量训练集;
(4)在将增量训练集不断输入的过程中,计算其与初步训练数据集中数据的Wasserstein距离,进而计算相似度值;
(5)根据相似度值的大小进行激励机制的训练,动态调整阈值、样本数据及权重值;
(6)将激励机制训练得到的数据输入到BPNN中进行可靠分类诊断。
采用上述技术方案所产生的有益效果在于:
本发明提出了基于激励机制的轴承故障诊断方法,对增量数据特征提取、激励机制训练及分类三个过程进行处理。该模型通过加权核主成分分析法保留了带有标签信息的有效数据样本,通过计算相似度并依据不同处理准则采用激励机制进行训练后再分类,从而实现了高效的增量学习和准确分类。通过实验分析,将加权核主成分分析法、激励机制与BPNN算法结合在一起,轴承故障诊断的准确率达到90.25%,同时通过实验对比可知本发明的方法优于深度去噪自动编码器(Denoising Auto-encoder,Deep DAE)、深度压缩自动编码器(Contractive Auto-encoder,Deep CAE)、支持向量机(Support Vector Machine,SVM)、人工神经网络(Artificial Neural Network,ANN)、BPNN和小波神经网络(WaveletNeural Network,WNN),能够实现轴承故障的可靠分类。
附图说明
图1是本发明基于激励机制的轴承故障诊断方法结构图;
图2是本发明基于激励机制的轴承故障诊断方法流程图;
图3是本发明使用BPNN进行分类的训练精度和测试精度的对比图;
图4为本发明使用BPNN在不同学习率下的训练精度的对比图;
图5为本发明使用BPNN在不同学习率下的测试精度的对比图;
图6为七种方法的测试精度对比图。
具体实施方式
为更好的理解本发明的技术方案,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明实施例中,一种基于激励机制的轴承故障诊断方法,包括下述步骤:
(1)对深沟球轴承使用电火花加工技术分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,其中故障直径分别为0.007、0.014、0.021英寸(1英寸=2.54厘米),选择电机驱动端振动传感器采集滚动体故障(BF)、内圈故障(IRF)、外圈故障(ORF)和正常状态(N)4种故障类型,再从其中采集007内圈故障、014内圈故障、021内圈故障、007外圈故障、014外圈故障、021外圈故障、007滚动体故障、014滚动体故障、021滚动体故障以及正常样本这10种状态下的振动信号,采样频率为12kHz,共计1,341,856个数据点,并使用ESMD提取振动信号特征;
(2)对得到的故障数据采用WKPCA进行特征提取;
WKPCA是基于KPCA的基础上得到的。KPCA是针对主成分分析法无法解决非线性问题而提出的,本发明选择高斯核函数对非线性情况进行实验,通过特征提取保留足够多的信息。但是由于KPCA忽略了样本的标签信息,故在KPCA的基础上,使用与类别信息相关的权值来表示不同类别间的差距,进而提高了故障识别率。
假定一个高维数据集
Figure DEST_PATH_IMAGE015
,xi表示数据集X的第i个样本,样本数为N,样本共有c个类别,设样本的权值向量为
Figure DEST_PATH_IMAGE016
,ui表示第i个样本xi对应的权值向量,样本的标签信息值为
Figure DEST_PATH_IMAGE017
,其中lj表示第j个标签信息值。样本xi的权值则根据其类别信息确定,如果样本xi属于第j类,则,
Figure DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE019
,可以看出样本的权值信息依赖于样本的类别信息。接下来根据样本的权值信息构造一个加权核矩阵
Figure DEST_PATH_IMAGE020
,其中
Figure DEST_PATH_IMAGE021
表示i行j列的加权核矩阵,
Figure 797750DEST_PATH_IMAGE021
表示i行j列的核矩阵,
Figure DEST_PATH_IMAGE022
是权值与核矩阵之间的自定义函数,(
Figure DEST_PATH_IMAGE023
没有实际意义,与f组合起来(即
Figure DEST_PATH_IMAGE024
)表示自定义函数,具体自定义函数在下方给出),
Figure DEST_PATH_IMAGE025
为权值矩阵中的第i行第j列的权值,且
Figure 98019DEST_PATH_IMAGE025
是根据权值向量ui与向量uj计算所得(具体公式在下方给出)。
根据权值向量ui构造加权的样本xwi,即
Figure DEST_PATH_IMAGE026
,根据加权样本构造加权的核矩阵如下:
Figure DEST_PATH_IMAGE027
其中
Figure DEST_PATH_IMAGE028
表示ui与xi之间自定义的一种映射关系,即
Figure DEST_PATH_IMAGE029
,由于本发明WKPCA选用高斯核函数,故
Figure 833763DEST_PATH_IMAGE003
可转化为:
Figure DEST_PATH_IMAGE030
其中,
Figure DEST_PATH_IMAGE031
表示函数的宽度参数,控制了函数的径向作用范围。从上式中很难建立
Figure 249700DEST_PATH_IMAGE025
、ui和uj之间的一个自定义函数
Figure DEST_PATH_IMAGE032
,其中g和h是自定义参数,为了建立
Figure 329783DEST_PATH_IMAGE025
、ui和uj之间直观的函数关系,构造权值矩阵W,
Figure DEST_PATH_IMAGE033
,其中
Figure 591000DEST_PATH_IMAGE025
Figure DEST_PATH_IMAGE034
其中,
Figure DEST_PATH_IMAGE035
表示第i个样本对应的权值ui与第j个样本对应的权值uj之间距离的平方,通过自定义函数
Figure DEST_PATH_IMAGE036
构造加权核矩阵Kw,公式如下:
Figure DEST_PATH_IMAGE037
其中,
Figure DEST_PATH_IMAGE038
Figure DEST_PATH_IMAGE039
根据上式可知权值对核函数的影响,当
Figure DEST_PATH_IMAGE040
时,样本xi与样本xj属于同一类型,
Figure DEST_PATH_IMAGE041
,此时构造的加权核矩阵等于原始核矩阵K;当
Figure DEST_PATH_IMAGE042
时,此时
Figure 820731DEST_PATH_IMAGE025
是一个大于0的正数,样本xi与样本xj属于不同类型,同时样本间的类别信息被引入到加权核矩阵Kw中。
对Kw进行特征值分解:
Figure DEST_PATH_IMAGE043
,其中,
Figure DEST_PATH_IMAGE044
是特征值
Figure DEST_PATH_IMAGE045
所构成的对角矩阵,其中
Figure DEST_PATH_IMAGE046
表示第i个特征值,
Figure DEST_PATH_IMAGE047
Figure DEST_PATH_IMAGE048
是相应的特征向量
Figure DEST_PATH_IMAGE049
组成的特征矩阵,其中
Figure 63362DEST_PATH_IMAGE049
表示第i个特征向量,将特征值
Figure 348850DEST_PATH_IMAGE046
进行降序排列,然后调整与其对应的特征向量
Figure 617020DEST_PATH_IMAGE049
,并利用Gram-Schmidt正交法得到归一化正交特征向量
Figure DEST_PATH_IMAGE050
,其中
Figure 953455DEST_PATH_IMAGE050
表示第i个正交特征向量。对上述得到的特征值计算其累计贡献率
Figure DEST_PATH_IMAGE051
,其中Ri表示第i个累积贡献率,根据给定的贡献率值s,如果
Figure DEST_PATH_IMAGE052
,则提取t个主成分
Figure DEST_PATH_IMAGE053
,那么在提取出的特征向量上的投影Y由
Figure DEST_PATH_IMAGE054
得到,其中
Figure DEST_PATH_IMAGE055
,所得投影Y即为从原始数据中使用WKPCA特征提取后得到的数据。
(3)将特征提取后的数据划分为训练数据和测试数据,并将训练数据划分为4组,1组作为初步训练数据集输入到步骤(4)并初始化权重,剩余数据作为增量训练集;
(4)在将增量训练集不断输入的过程中,计算其与初步训练数据集中数据的Wasserstein距离,进而计算相似度值;
对于经过加权核主成分分析提取出的新增特征,需要计算其与现有特征的相似度,以选择不同的操作对其进行新增或合并至现有特征中。针对设备故障具有高维复杂的特殊性,采用Wasserstein距离计算相似度值
Figure 819517DEST_PATH_IMAGE006
,相似度值计算公式如下:
Figure 343034DEST_PATH_IMAGE005
其中
Figure 149316DEST_PATH_IMAGE006
表示新增特征P和现有特征Q之间的相似度值,W(P,Q)表示新增特征P和现有特征Q的Wasserstein距离,具体计算公式如下:
Figure 323945DEST_PATH_IMAGE007
其中,P(i)和Q(i)分别代表新增特征P的第i个值和现有特征Q的第i个值,
Figure 190270DEST_PATH_IMAGE008
表示新增特征P和现有特征Q的联合分布,
Figure 699618DEST_PATH_IMAGE009
表示新增特征P和现有特征Q组合后所有可能的联合分布的集合,
Figure 309591DEST_PATH_IMAGE010
表示从联合分布
Figure 338726DEST_PATH_IMAGE008
中采样得到新增特征P的第i个值和现有特征Q的第i个值,
Figure 375953DEST_PATH_IMAGE011
表示新增特征P的第i个值与现有特征Q的第i个值之间的距离,
Figure 874061DEST_PATH_IMAGE012
表示样本对距离的期望值,inf表示下界,即在所有可能的联合分布中对期望值取到的下界
Figure 287725DEST_PATH_IMAGE013
就是Wasserstein距离,所以新增特征P和现有特征Q之间的差异性越小,Wasserstein距离越小,则相似度值越大,以此衡量新增特征与现有特征的相似度。
Wessertein距离相比KLD和JSD的优势在于,如果两样本之间没有重叠或者重叠非常少,仍然能反映两个样本之间的远近,而JSD在此情况下是常量,KLD可能无意义,并且避免了KLD不对称的情况,所以Wasserstein距离能够准确衡量故障之间的相似程度。
(5)根据相似度值的大小进行激励机制的训练,动态调整阈值、样本数据及权重值;
对于得到的新增特征与现有特征的Wasserstein相似度值,选取最大值
Figure 905788DEST_PATH_IMAGE006
作为新增特征P和现有特征Q之间的相似度值,并根据以下原则判定新增或合并该特征:
使用
Figure DEST_PATH_IMAGE056
代表现有特征中使两对比特征之间相似度有意义的最小相似度阈值(现有特征包含初始特征和完成新增操作的新增特征),其取值为
Figure DEST_PATH_IMAGE057
,代表现有特征中特征Q1与特征Q2之间相似度的最小值。使用β代表现有特征中使两对比特征之间相似度有意义的最大相似度阈值,其取值为
Figure DEST_PATH_IMAGE058
,代表现有特征中Q1与特征Q2之间相似度的最大值。使用b代表最小相似度阈值和最大相似度阈值的平均值。可见,相似度阈值
Figure DEST_PATH_IMAGE059
,且随特征的增量与合并,阈值
Figure 18975DEST_PATH_IMAGE014
动态变化。
(1)若
Figure DEST_PATH_IMAGE060
,则表示新增特征与现有特征高度相似,所以采用合并并增大该现有特征的权重值。
(2)若
Figure DEST_PATH_IMAGE061
,则表示新增特征与现有特征均相异,不能使用与现有特征合并的方式代替新增特征,所以将该新增特征增量加入现有特征中;
(3)若
Figure DEST_PATH_IMAGE062
,则表示新增特征与现有特征的相似度低于最小阈值,代表该新增特征是无意义的噪声干扰值或者还未找到相似度匹配的特征,将其暂存于一个新的列表中,若再次使用,则继续对其判断,否则在程序运行完毕后将其舍弃。
然后根据新增特征增量与合并原则来计算特征的动态权重,用以衡量该特征随时间变化的重要性改变程度。由于新增特征与现有特征的相似度能够在一定程度上反映该新增特征对当前模型的重要性,所以对相似度值使用下式归一化处理,并计算其动态权重。
Figure DEST_PATH_IMAGE063
其中,
Figure DEST_PATH_IMAGE064
表示归一化处理后的新增特征P与现有特征Q的相似度值,
Figure DEST_PATH_IMAGE065
表示现有特征中特征Q1与特征Q2之间相似度的最小值,
Figure DEST_PATH_IMAGE066
表示现有特征中Q1与特征Q2之间相似度的最大值。
对原则(1)中采取合并操作合并高度相似的特征,由于其随设备状态变化的过程中频繁出现,具有较重要的作用,应当增加其权重以增强并记住有效特征。其动态权重计算方法如下。
Figure DEST_PATH_IMAGE067
其中,Wi+1表示第i+1次对现有特征Q进行合并操作时赋予的权重,W i 表示第i次合并得到的权重,将W i 与新增特征P和现有特征Q的相似度值相加得到Wi+1,初次合并时i=0,W 0 为初始权值。
对原则(2)中采取新增操作加入现有特征,说明其为随状态数据变化新出现的特征,需要为其赋予初始权值,计算方法如下。
Figure DEST_PATH_IMAGE068
对于原则(3)中不满足前两个条件的新增特征暂存于一个新列表中,针对现有特征中存在与所有新增特征相似度小于阈值α的情况,表明其没有出现在新增特征中,可能随状态数据变化逐渐失效,因此采用下式缓慢降低其权重,计算方法如下。
Figure DEST_PATH_IMAGE069
其中,Wi+1表示第i+1次未在新增特征中出现的现有特征Q的权重,W i 表示第i次未出现时的权重,将W i 与其相似度值做差得到Wi+1,特征Q初次未出现时i=0,W 0 为初始权值。
(6)将激励机制训练得到的数据输入到BPNN中进行可靠分类诊断。
基于激励机制的轴承故障诊断方法的试验验证:
1、数据描述
实验数据来源于美国凯斯西储大学(CWRU)电气工程实验室的轴承状态数据,共计1,341,856个数据点,轴承型号为6205-2RS JEM SKF深沟球轴承。使用电火花加工技术分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,其中故障直径分别为0.007、0.014、0.021英寸(1英寸=2.54厘米)。从电机驱动端振动传感器选择正常状态(N)、内圈故障(IRF)、外圈故障(ORF)和滚动体故障(BF)这四种故障类型,再从其中采集007内圈故障、014内圈故障、021内圈故障、007外圈故障、014外圈故障、021外圈故障、007滚动体故障、014滚动体故障、021滚动体故障以及正常样本这10种状态下的振动信号,并对原始振动信号使用ESMD分解各频段的能量值,对得到的每一类数据样本,随机抽取160个样例作为训练样本,40个样例作为测试样本,每个样例包含1024个样本点,即训练样本集数据点总共为1638400,测试样本集数据点数为409600。具体轴承状态数据样本描述如表1所示:
表1 数据样本的描述
Figure DEST_PATH_IMAGE070
2、实验过程
首先将数据样本采用WKPCA进行特征提取,通过将标签作为权重融入到KPCA中,使其成为有监督的特征提取方法,该过程中,将贡献率超过90%的数据特征提取出来,既保证了有效信息的留存,又为后续实验操作节省了时间。
接下来对特征提取后的特征进行激励机制训练,本发明采用Wasserstein距离计算两个特征之间的相似度,其中参数b表示最小相似度阈值和最大相似度阈值的平均值,由于相似度超过平均相似度值的新增特征其相似度较高,故将其合并至现有特征中,提高该现有特征的权重值;参数α表示现有特征中使两对比特征之间相似度有意义的最小相似度阈值(现有特征包含初始特征和完成新增操作的新增特征),如果相似度值小于α,说明该特征样本可能为无意义的噪声干扰值,也可能还未找到相似度匹配的数据样本,故将其暂存于一个新列表中,直到相似度值满足条件大于b或条件在α与b之间,可重新处理该特征,否则当程序运行到最后删除该列表中的特征,同时缓慢减少相似度小于α的现有特征的权重值;不满足上述两个条件的新增特征则表示该特征是新样本,需将其加入到现有特征中并赋上初始权重值。最后对于所有激励机制训练过的特征的权重值与权重值a进行比较,其中权重值a是现有权重值的平均值,若小于权重值a则进行删除。在实验过程中,通过不断动态调整a、
Figure 315965DEST_PATH_IMAGE014
等参数值以及特征,得到最终的用于分类的特征及其权重值。在对特征进行激励机制训练的过程中,由于不满足适当相似度值和最小权重的特征将被删除,所以经过激励机制的训练后共剩余1194个特征,即1194个数据,且分布均匀,数据分布情况如表2所示,避免了因不同类数据的数量不同对实验结果造成相关影响。
表2 数据分布情况
Figure DEST_PATH_IMAGE071
然后将表2中激励机制训练得到的1194个数据输入到BPNN中进行故障分类,在进行分类实验之前,需要通过实验选取BPNN的学习率和迭代次数这两个参数。首先对迭代次数进行选取,将训练样本和测试样本分别输入到BPNN中进行训练,并不断增大迭代次数,实验结果如图3所示。
由图3可知,随着迭代次数的增加,训练精度和测试精度均不断增加并逐渐收敛,最终在1100次迭代时精度趋于稳定,以防更换参数时1100次迭代后产生变化,将迭代次数设置为2000次。
由于迭代次数确定为2000次,所以接下来对学习率进行选取。将训练样本和测试样本分别输入到BPNN中进行训练,并通过设置不同的学习率对训练精度和测试精度进行观察,得到的结果如图4图5所示。
在迭代次数均设置为2000次的情况下,分别选取不同的学习率进行实验,设置的学习率分别为0.01,0.005,0.001和0.0005,由图4图5可知,学习率为0.01时,训练精度和测试精度早早就收敛了,且精度较低;学习率设置为0.005时,精度明显提高,且迭代次数在500时已趋于稳定;学习率设置为0.001时,精度相比上两个有小幅提升,且1200次迭代后精度也开始收敛;而学习率设置为0.0005时,收敛速度没有学习率为0.001时的速度快,在1600次迭代后趋于稳定,且趋于稳定后的精度相近,故最终将BPNN的参数学习率确定为0.001,迭代次数确定为2000次。
其中,在迭代次数为2000次的情况下,采用上述四种不同学习率进行实验的训练精度和测试精度如表3所示。
表3 精度对比
Figure DEST_PATH_IMAGE072
从表3可知,随着学习率的减少,BPNN的训练精度和测试精度逐渐增加,学习率为0.001和0.0005时,训练精度和测试精度都相同,由于学习率为0.001时收敛速度较快,故最终选取学习率0.001。所以BPNN最终的迭代次数和学习率分别为2000和0.001。
通过增量学习的对比可知本发明的激励机制是有效的增量学习方法,接下来将本发明提出的方法与以下方法进行比较,Deep DAE、Deep CAE、SVM、ANN、BPNN和WNN进行对比以观察本发明所用方法的结合是否对分类结果有所提升,结果如图6所示。
由图6可知,本发明提出的基于激励机制的轴承故障诊断方法相对其他方法来说准确率最高,这是由于其他方法没有对新增数据采用动态调整,使得数据信息无法实现高效利用,故而得到的测试精度偏低。本发明方法的准确率与Deep DAE、Deep CAE、SVM、ANN、BPNN及WNN的准确率相比分别高了6.61%,4.8%,29.80%,37.98%,40.82%及37.65%,其中本发明所提方法的精度高于原始BPNN的精度,主要是在于本发明通过对数据进行特征提取,减少了部分干扰数据,并且在使用激励机制进行增量学习的过程中,对数据信息进行了高效的学习和利用,故而得到的精度较高。因此,本发明所提的加权核主成分分析法和激励机制对故障诊断是有效的,满足数据不断更新的轴承故障诊断的需求。
3、 结论
为了解决工业故障诊断过程中海量、强关联的数据在实验中带来的影响,本发明提出了基于激励机制的故障诊断方法,对增量数据特征提取、激励机制训练及分类三个过程进行处理。该模型通过加权核主成分分析法保留了带有标签信息的有效数据样本,通过计算相似度并依据不同处理准则采用激励机制进行训练后再分类,从而实现了高效的增量学习和准确分类。由实验结果分析可知,通过激励机制进行增量学习可以让数据被更加高效地使用,而将加权核主成分分析法、激励机制与BPNN算法结合在一起,轴承故障诊断的准确率达到了90.25%,通过实验对比可知本发明的方法优于Deep DAE、Deep CAE、SVM、ANN、BPNN及WNN,且本发明准确率比上述方法分别高了6.61%,4.8%,29.80%,37.98%,40.82%及37.65%,故本发明方法能够实现轴承故障的可靠分类。

Claims (3)

1.一种基于激励机制的轴承故障诊断方法,其特征在于,包括下述步骤:
(1)对轴承采集不同故障状态以及正常样本的振动信号,采用极点对称经验模态分解方法提取振动信号特征;
(2)对得到的故障数据采用加权核主成分分析法进行特征提取;
(3)将特征提取后的数据划分为训练数据和测试数据,并将训练数据划分为4组,1组作为初步训练数据集输入到步骤(4)并初始化权重,剩余数据作为增量训练集;
(4)在将增量训练集不断输入的过程中,计算其与初步训练数据集中数据的Wasserstein距离,进而计算相似度值;
(5)根据相似度值的大小进行激励机制的训练,动态调整阈值、样本数据及权重值, 对于得到的新增特征与现有特征的Wasserstein相似度值,选取最大值作为新增特征的相似度值,并根据不同原则判定新增、合并或是暂存该新增特征,在该过程中,使用α代表现有特征中使两对比特征之间相似度有意义的最小相似度阈值,使用β代表现有特征中使两对比特征之间相似度有意义的最大相似度阈值,使用b代表最小相似度阈值和最大相似度阈值的平均值,当相似度值大于b时,合并特征并增大该现有特征的权重值;当相似度值在α和b之间时,将新特征加入到现有特征中并赋予初始权值;其余的相似度值代表该新增特征是无意义的噪声干扰值或者还未找到相似度匹配的特征,将其暂存于一个新的列表中,若再次使用,则继续对其判断,否则在程序运行完毕后将其舍弃,然后根据新增特征增量与合并原则来计算特征的动态权重,用以衡量该特征随时间变化的重要性改变程度,其中阈值α、b、β是根据当前情况不断变化的;
(6)将激励机制训练得到的数据输入到BP神经网络中进行可靠分类诊断。
2.根据权利要求1所述的基于激励机制的轴承故障诊断方法,其特征在于:所述步骤(2)中,加权核主成分分析法的权重是以不同样本的标签作为权值进行计算的,其中样本共有10个类别,标签的信息值为
Figure 894528DEST_PATH_IMAGE001
,其中lj表示第j个标签信息值,式中
Figure 381004DEST_PATH_IMAGE002
,标签的信息值即为样本的权值,然后根据该权值构造加权核矩阵
Figure 875570DEST_PATH_IMAGE003
,其中
Figure 673762DEST_PATH_IMAGE003
表示i行j列的加权核矩阵,
Figure 544766DEST_PATH_IMAGE004
,并在高斯核函数的基础上构造加权核主成分分析法,用于特征提取。
3.根据权利要求1所述的基于激励机制的轴承故障诊断方法,其特征在于:所述步骤(4)中,将Wasserstein距离用于计算相似度值
Figure 885749DEST_PATH_IMAGE005
,相似度值计算公式如下:
Figure 410271DEST_PATH_IMAGE006
其中
Figure 102283DEST_PATH_IMAGE005
表示新增特征P和现有特征Q两个不同故障特征的相似度值,W(P,Q)表示新增特征P和现有特征Q两个不同故障特征的Wasserstein距离,具体计算公式如下:
Figure 511399DEST_PATH_IMAGE007
其中,P(i)和Q(i)分别代表新增特征P的第i个值和现有特征Q的第i个值,
Figure 972467DEST_PATH_IMAGE008
表示新增特征P和现有特征Q的联合分布,
Figure 74416DEST_PATH_IMAGE009
表示新增特征P和现有特征Q组合后所有可能的联合分布的集合,
Figure 112779DEST_PATH_IMAGE010
表示从联合分布
Figure 794427DEST_PATH_IMAGE008
中采样得到新增特征P的第i个值和现有特征Q的第i个值,
Figure 375581DEST_PATH_IMAGE011
表示新增特征P的第i个值与现有特征Q的第i个值之间的距离,
Figure 241906DEST_PATH_IMAGE012
表示样本对距离的期望值,inf表示下界,即在所有可能的联合分布中对期望值取到的下界
Figure 642931DEST_PATH_IMAGE013
就是Wasserstein距离,所以新增特征P和现有特征Q之间的差异性越小,Wasserstein距离越小,则相似度值越大,以此衡量新增特征与现有特征的相似度。
CN202010145254.8A 2020-03-05 2020-03-05 基于激励机制的轴承故障诊断方法 Active CN110987436B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010145254.8A CN110987436B (zh) 2020-03-05 2020-03-05 基于激励机制的轴承故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010145254.8A CN110987436B (zh) 2020-03-05 2020-03-05 基于激励机制的轴承故障诊断方法

Publications (2)

Publication Number Publication Date
CN110987436A CN110987436A (zh) 2020-04-10
CN110987436B true CN110987436B (zh) 2020-06-09

Family

ID=70081456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010145254.8A Active CN110987436B (zh) 2020-03-05 2020-03-05 基于激励机制的轴承故障诊断方法

Country Status (1)

Country Link
CN (1) CN110987436B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114112390B (zh) * 2021-11-23 2024-03-22 哈尔滨工程大学 一种非线性复杂系统早期故障诊断方法
CN114509266B (zh) * 2022-01-05 2023-12-01 东南大学 一种基于故障特征融合的轴承健康监测方法
CN114526915B (zh) * 2022-01-21 2022-12-16 华南理工大学 一种基于滚动轴承特征分布的早期故障时刻点识别方法
CN116720063B (zh) * 2023-05-24 2024-01-26 石家庄铁道大学 基于dtw-cae的滚动轴承一致性退化特征提取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101221213A (zh) * 2008-01-25 2008-07-16 湖南大学 基于粒子群算法的模拟电路故障诊断神经网络方法
CN101305327A (zh) * 2005-10-14 2008-11-12 费舍-柔斯芒特系统股份有限公司 与多元统计分析一起用于过程中的故障检测和隔离及异常情况预防的统计特征

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7328126B2 (en) * 2003-09-12 2008-02-05 Tokyo Electron Limited Method and system of diagnosing a processing system using adaptive multivariate analysis
CN104462846B (zh) * 2014-12-22 2017-11-10 山东鲁能软件技术有限公司 一种基于支持向量机的设备故障智能诊断方法
JP2017071303A (ja) * 2015-10-07 2017-04-13 スズキ株式会社 鞍乗り型車両のアクセルポジションセンサの取り付け構造
CN109094375B (zh) * 2018-07-31 2019-07-26 佛山市飞驰汽车制造有限公司 一种电动汽车的能源系统控制装置及方法
CN109660206B (zh) * 2018-12-20 2020-05-19 福州大学 一种基于Wasserstein GAN的光伏阵列故障诊断方法
CN110414383A (zh) * 2019-07-11 2019-11-05 华中科技大学 基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101305327A (zh) * 2005-10-14 2008-11-12 费舍-柔斯芒特系统股份有限公司 与多元统计分析一起用于过程中的故障检测和隔离及异常情况预防的统计特征
CN101221213A (zh) * 2008-01-25 2008-07-16 湖南大学 基于粒子群算法的模拟电路故障诊断神经网络方法

Also Published As

Publication number Publication date
CN110987436A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110987436B (zh) 基于激励机制的轴承故障诊断方法
CN110414788B (zh) 一种基于相似日和改进lstm的电能质量预测方法
CN105224872B (zh) 一种基于神经网络聚类的用户异常行为检测方法
CN111967343B (zh) 基于简单神经网络和极端梯度提升模型融合的检测方法
CN110006649B (zh) 一种基于改进蚁狮算法和支持向量机的轴承故障诊断方法
CN111814956B (zh) 一种基于多维度二次特征提取的多任务学习的空气质量预测方法
CN109389171B (zh) 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法
CN108399434B (zh) 基于特征提取的高维时间序列数据的分析预测方法
CN114969995A (zh) 一种基于改进麻雀搜索与声发射的滚动轴承早期故障智能诊断方法
CN113095550A (zh) 基于变分递归网络和自注意力机制的空气质量预测方法
CN114399032A (zh) 一种电能表计量误差预测方法及系统
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN111222689A (zh) 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置
CN116738868B (zh) 一种滚动轴承剩余寿命预测方法
CN113225346A (zh) 一种基于机器学习的网络运维态势评估方法
CN112504682A (zh) 基于粒子群优化算法的底盘发动机故障诊断方法及系统
CN113344288A (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN116542701A (zh) 一种基于cnn-lstm组合模型的碳价预测方法及系统
CN117117859A (zh) 基于神经网络的光伏发电功率预测方法及系统
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN113627594B (zh) 基于wgan的一维时序数据增广方法
Cui et al. Intelligent fault quantitative identification via the improved deep deterministic policy gradient (DDPG) algorithm accompanied with imbalanced sample
CN111652264B (zh) 基于最大均值差异的负迁移样本筛选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant