CN114692490A - 清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法 - Google Patents
清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法 Download PDFInfo
- Publication number
- CN114692490A CN114692490A CN202210257494.6A CN202210257494A CN114692490A CN 114692490 A CN114692490 A CN 114692490A CN 202210257494 A CN202210257494 A CN 202210257494A CN 114692490 A CN114692490 A CN 114692490A
- Authority
- CN
- China
- Prior art keywords
- layer
- neural network
- convolutional neural
- training
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012549 training Methods 0.000 claims abstract description 87
- 238000003745 diagnosis Methods 0.000 claims abstract description 75
- 238000012360 testing method Methods 0.000 claims abstract description 54
- 230000001133 acceleration Effects 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000005516 engineering process Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000005352 clarification Methods 0.000 claims abstract description 8
- 238000010183 spectrum analysis Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 64
- 238000010586 diagram Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 22
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 10
- 230000036541 health Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 4
- 230000000644 propagated effect Effects 0.000 claims description 4
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000011049 filling Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 abstract description 5
- 238000005096 rolling process Methods 0.000 description 31
- 238000009826 distribution Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000011068 loading method Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003889 chemical engineering Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005272 metallurgy Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30164—Workpiece; Machine component
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Quality & Reliability (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,首先利用双谱分析技术对旋转机械每种工况的一维振动加速度信号数据进行处理,得到隐含的信息量比一维振动加速度信号更丰富的每种工况振动加速度信号的振动双谱图;然后将每种工况的振动双谱图转换为存储需求更小的二维灰度图,利用增强型超分辨率重建网络对每个灰度图进行清晰化处理以增强特征信息,将清晰化振动双谱灰度图作为训练样本;再利用改进卷积神经网络来学习提取训练样本的有效特征;采用softmax分类器对测试样本进行分类识别,从而确定旋转机械工况类别并同时判断故障的严重程度。实现对旋转机械故障诊断,以提高旋转机械故障诊断的准确性、自适应性。
Description
技术领域
本发明涉及人工智能技术领域,具体的说是一种清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法。
背景技术
近年来,工业系统中的旋转机械日趋大型化、连续化、复杂化、高速化和自动化,这也成为现代工业企业生产的主要特征。工业生产过程的共同点表现在两个方面:一方面是传统方法难以建立精准的物理模型实现监控;另一方面是会不断生成反映旋转机械运行机理和运行状态的海量数据。现代工业系统中旋转机械故障非常普遍,对设备的性能和安全构成了极大的威胁。因此,如何利用这些海量数据来满足工业生产系统日益增长的稳定性和可靠性需求已成为当务之急。随着监测技术和深度学习等分析方法的不断发展,基于数据的故障诊断技术受到了广泛的关注。
现代研究中针对旋转机械的状态检测主流手段是对监测系统获取的一维振动信号进行特征挖掘和模式识别。这些检测方法主要是从时域、频域或时频域角度分析一维振动信号,通过提取信号的统计特征参数或自适应提取信号特征,实现旋转机械故障诊断。然而,对于工业现场作业人员,这些故障诊断方法难以直观认识旋转机械健康状态,降低了方法实施过程中的可行性。此外,旋转机械发生故障之初征兆并不明显,一维振动信号本身的特征频率非常微弱且具有稀疏性,而且受噪声干扰,信号的信噪比很低,导致在恶劣的作业环境中反映旋转机械运行状态和运行机理的振动信号被噪声淹没,增加了挖掘一维振动信号特征信息的难度。
在旋转机械故障诊断领域,研究者们提出了多种解决途径。2019年徐飞等人在文章“基于VMD和PCT的旋转机械故障诊断方法研究”(《组合机床与自动化加工技术》2019年11月第11期96-104)中将VMD分解信号得到的多个模态分量中周期性最明显的模态分量利用PCT获取时频图,通过对时频图的分析实现旋转机械故障诊断。该方法基于参数图形识别设备故障,但诊断结果的判别需要预先已知各类故障的特征频率,方法的实现要求操作者具有扎实的专业知识。2020年周小龙等人在文章“改进的HHT方法及其在旋转机械故障诊断中的应用”(《振动与冲击》2020年第39卷第7期189-195)中提出一种基于EEMEMD和虚假模态函数剔除算法相结合的改进HHT方法,利用EEMEMD获取无模态混叠的IMF分量,并通过虚假模态函数剔除算法剔除噪声干扰成分和迭代误差分量,有效实现了对旋转机械的故障诊断。但该方法是对一维信号的处理,且算法阈值的设置具有人为经验性。2020年赵荣珍等人在文章“基于EEMD与模糊信息熵的旋转机械故障诊断方法”(《兰州理工大学学报》2020年6月第46卷第3期39-44)中利用EEMD分解和模糊信息熵在特征提取方面的优势,构造各类振动信号的特征集合,并采用KNN识别设备故障。该方法适用于小样本数据的故障识别,且算法中特征向量维数的确定需要借助于设计者的经验。2020年王太勇等人在文章“基于KD-DenseNet的旋转机械故障诊断模型”(《振动与冲击》2020年第39卷第16期39-45)中提出一种基于DenseNet的卷积核dropout(KD)智能故障诊断模型,将重叠分段预处理的数据作为模型输入,利用KD-DenseNet实现特征提取与分类。该方法利用旋转机械一维振动信号实现设备故障状态的分类,其数据分段预处理的实现缺乏客观性。2020年蔡长征在文章“数据驱动算法在旋转机械故障诊断中的应用研究”(《机床与液压》2020年12月第48卷第23期218-223)中提出一种基于数据驱动的旋转机械故障诊断方法,利用EMD得到IMF分量,从多域量化角度提取故障信号时域和频域特征,最后利用EMD样本熵实现故障识别。该方法诊断性能的优劣受制于人为特征参数的选择。
基于数据的故障诊断技术的关键是提取隐藏在数据中的特征信息,传统的诊断方法通常需要借助认为设计的特征提取算法,从信号中提取具有代表性的特征。这些过程需要在信号处理和故障诊断中充分利用算法设计人员的经验和知识,故障诊断的准确性和可靠性取决于特征提取的优劣程度,极大地降低了诊断方法的自适应能力。此外,现有的基于一维信号的故障诊断方法缺乏对设备健康状态的直观认识和理解,降低了诊断方法的实用性;设备故障信号本身强度弱和环境噪声干扰因素的存在,增加了对一维信号特征挖掘的难度,这些必然增加了旋转机械故障诊断中出现误诊和漏诊的风险。
发明内容
本发明的目的是提供一种清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,实现对旋转机械故障诊断,以提高旋转机械故障诊断的准确性、自适应性、有效性、可靠性、可理解性和易操作性。
为实现上述目的,本发明所采取的技术方案为:
一种清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,包括以下步骤:
步骤1,利用加速度传感器分别获取旋转机械正常状态和不同故障状态的M种工况的一维时域振动信号,每种工况的一维时域振动信号分别采集N组,其中N≥20,M种信号分别得到N组一维时域振动信号样本,分别记为xMN;
步骤6,建立基于改进卷积神经网络的旋转机械故障诊断模型,采用步骤5的训练样本集对改进卷积神经网络进行训练,将训练样本集中加注标签的样本依次输入由输入层、卷积层、池化层、多尺度卷积层、全局平均池化层和输出层组成的改进卷积神经网络中,最小化由交叉熵损失函数构成的改进卷积神经网络的损失函数,采用有监督逐层训练方法进行逐层训练和调优,得到改进卷积神经网络的连接权重和偏置参数;
步骤8,利用加速度传感器采集待测旋转机械运行时的M种工况的一维时域振动加速度信号数据,并利用双谱分析技术对每种工况的一维时域振动加速度信号数据进行处理,得到每种工况的一维时域振动加速度信号数据的振动双谱图;然后,将每种工况的振动双谱图转换为二维灰度图,并利用增强型超分辨率重建网络对每个灰度图进行清晰化处理,将处理后得到的清晰化振动双谱灰度图作为测试样本;
步骤9,将测试样本作为训练好的改进卷积神经网络的输入,对测试样本进行深度学习,采用确定了连接权重和偏置参数的改进卷积神经网络模型对测试样本进行特征提取,得到测试样本特征;
步骤10,将测试样本特征作为测试样本的匹配特征,将每种工况下的各个训练样本对应的训练样本特征信息作为匹配基准,采用训练好的softmax分类器对测试样本与训练样本进行分类匹配,将与测试样本最为匹配的训练样本所属的工况类别判定为测试样本的工况类别,得到待测旋转机械的故障诊断结果。
优选的,所述步骤2中双谱分析的公式为:
其中,E[·]表示数学期望,{x(i)}表示零均值的三阶平稳随机过程,t1,t2表示任意延时。
优选的,所述步骤5中加注标签为数字或者字符,该数字或者字符表示旋转机械故障所出现的健康状态、故障部位、故障类型及故障等级中的至少一种指标。
优选的,所述步骤6中建立的改进卷积神经网络的交叉熵损失函数为:
其中,JLoss表示交叉熵误差损失函数;m表示输入卷积神经网络的小批量的大小,即每次训练时卷积神经网络的输入样本容量;q为卷积神经网络的输出值,p为目标期望值;c表示输入样本的期望类别,即当输入样本的实际类别为c时,反之,
求解使公式(2)交叉熵损失函数最小的参数来建立卷积神经网络,通过以下公式实现:
步骤6中的改进卷积神经网络的建立又包括以下步骤:
步骤6.1:将卷积神经网络中的标准卷积层替换为深度可分离卷积层;
步骤6.2:采用带参数的ReLU作为改进卷积神经网络的隐藏层激活函数;
步骤6.3:采用RAdam算法对改进卷积神经网络的参数进行优化;
步骤6.4:采用全局平均池化层代替卷积神经网络中的全连接层;
步骤6.5:改进卷积神经网络通过两步来求解公式(3),
步骤6.5.1:将要训练的清晰化双谱灰度图通过输入层输入网络的卷积层,进行特征提取,每一隐藏层的输入是上一层的输出,计算公式如下:
本层的输出特征可以表示为前一层所有卷积运算结果的累加和,计算公式如下所示:
其中,“*”代表卷积运算,卷积运算的公式如下:
步骤6.5.2:将卷积层输出的特征输入到一个下采样层,目的是实现聚合,其聚合公式如下所示:
步骤6.6:对步骤6.5.1所得改进卷积神经网络的最后一层输出,采用有监督逐层训练方法进行逐层训练和调优,具体方式为:
使用前向传播计算权重和偏置:将步骤6.5.1所得的改进卷积神经网络模型的最后一层隐藏层的输出作为输入被逐层传播到输出层,得到预测的分类类别,用链式求导法则计算损失函数对每个权重的梯度,梯度计算公式为:
其中,JLoss表示卷积神经网络的损失函数,W是卷积神经网络的权重,y是中间变量,δ是损失函数JLoss对权重W的偏导数,
在卷积神经网络中,第l层的梯度由如下公式计算:
其中,运算符代表每个元素相乘,δl是损失函数JLoss对第l层权重的偏导数,Wl+1是卷积神经网络的第l+1层的权重,yl是第l层的中间变量,δl+1是损失函数JLoss对第l+1层权重的偏导数,f′(yl)是激活函数的导数,
训练样本的工况标签对应训练样本的实际分类结果,首先,将训练获得的样本的预测输出的分类结果与实际分类结果进行比较得到分类误差;然后,将分类误差逐层反向传播,从而实现对卷积神经网络各层的连接权重参数的调优,连接权重更新的实现公式如下所示:
其中,Wl+1是卷积神经网络的第l+1层的权重,Wl是卷积神经网络的第l层的权重,η为学习率,JLoss表示卷积神经网络的损失函数,δl是损失函数JLoss对第l层权重的偏导数,sl -1是第l-1层的输出,
逐层训练,直至得到改进卷积神经网络最后一层隐藏层的输出对网络各层的连接权重进行调优后,最终确定整个改进卷积神经网络的连接权重和偏置参数。
优选的,所述步骤10采用softmax分类器对测试样本与训练样本进行匹配,其具体方式为:
其中,d表示构成样本的数据点数,Q表示样本的种类数,Li代表训练样本对应的标签,1{·}为示性函数,其值规则为:1{真值表达式}=1,1{假值表达式}=1,θ表示由权重向量W和偏置向量b组成的模型的所有参数向量,θt表示θ的第t列向量;
步骤10.3:将改进卷积神经网络提取的测试样本特征作为不同工况对应的分类决策函数的输入,计算出测试样本特征作为输入量的softmax分类器决策函数的决策值,即其所对应的工况类别判定为测试样本的工况类别,得到待测旋转机械的故障诊断结果。
所述步骤4中增强型超分辨率重建网络为基于单幅图像生成具有真实纹理的图像,生成的图像在细节上具有清晰性且能够减少图像细节重构时产生的伪影的一种深度学习网络。
本发明所述的故障包括单一故障和复合故障,其中单一故障指的是旋转机械某一组件单独出现故障的情形,复合故障指的是旋转机械不同组件或同一组件的不同部位同时出现故障的情形。因此,本发明提出的旋转机械故障诊断方法适用于单一故障诊断、复合故障诊断、以及单一故障和复合故障共存的旋转机械故障诊断。
卷积神经网络(Convolutional Neural Network,简称CNN)本质是一种具有深度结构的前馈型神经网络,有局部连接、权值共享和降采样的结构特点,在图像处理方面表现十分出色。研究表明,由多层非线性映射层组成的深度网络结构比浅层神经网络结构的性能更加优良。因此,卷积神经网络在复杂图像特征提取和复杂分类上有很好的效果和效率。
基于卷积神经网络具备的上述优点,考虑到提高旋转机械各类故障诊断的准确性和诊断方法的可理解性,为了准确、高效的对旋转机械故障分类并确定故障的严重程度,本发明的清晰化振动双谱图和改进卷积神经网络结合的旋转机械故障诊断方法将双谱图和卷积神经网络具备的上述优点加以整合和改进,利用清晰化振动双谱灰度图和改进深度学习网络进行旋转机械工况的分类,实现对旋转机械各类故障的识别和严重程度的确定。
与现有技术相比,本发明的有益效果如下:
1)、本发明所述的旋转机械故障诊断方法,首先利用双谱分析技术对原始一维时域振动信号样本进行处理,得到诊断数据集中每一个样本的双谱图,并构成诊断双谱图集;相比旋转机械一维时域振动数据,双谱图中隐含的特征信息更加丰富,并且该处理过程实现了对样本数据的有效去噪;然后将诊断双谱图集转换为存储需求更小的双谱灰度图集,降低了存储、计算和诊断成本,并且有效提高了特征挖掘的效率。
2)、本发明所述的旋转机械故障诊断方法,利用增强型超分辨率重建网络对双谱灰度图集进行超分辨率重建,得到清晰化的振动双谱灰度图诊断样本集;该处理过程有效增强了隐含在双谱灰度图中的旋转机械健康状态特征信息,为故障特征提取提供了高质量的诊断样本集。
3)、本发明所述的旋转机械故障诊断方法,首先将卷积神经网络中的标准卷积层替换为深度可分离卷积层,提高了网络运算速度和故障诊断效率;然后采用带参数的ReLU函数作为改进卷积神经网络的隐藏层激活函数,解决网络输入数据小于零时梯度消失引起的误差无法反向传播的问题,并加速了网络收敛。此外,采用RAdam算法对改进卷积神经网络的参数进行优化,该算法训练的模型具有快速收敛性和良好的收敛效果。
4)、本发明所述的旋转机械故障诊断方法,故障诊断模型由多层小卷积核两两一组堆叠来替代卷积神经网络中的一个大卷积核组成的卷积层,并在每个卷积层之后连接一个批量归一化层,然后采用全局平均池化层代替卷积神经网络中的全连接层。该模型提高了特征提取的全面性和准确性、减少了网络参数数量、减轻了网络运算负担以及有效防止了过拟合问题的发生。
5)、本发明所述的旋转机械故障诊断方法,利用改进卷积神经网络理论学习算法自适应地完成旋转机械故障诊断所需的特征提取,自动挖掘出隐藏在清晰化双谱灰度图中的丰富状态信息,摆脱了对大量信号处理知识与诊断工程经验的依赖,节省了劳动成本和时间,提高了故障诊断方法的可理解性和易操作性,并且在监测诊断能力和泛化能力方面具有很大的优势。
6)、本发明所述的旋转机械故障诊断方法,采用了softmax分类器对测试样本进行分类识别,通过优化损失函数得到性能优良的softmax分类器。然后利用训练好的softmax分类器计算样本属于各类别的概率来对各类旋转机械故障进行分类。softmax分类器具有强大的泛化能力,其学习过程可以被看成是一个优化寻找最优解的过程。
7)、本发明所述的旋转机械故障诊断方法能够提高旋转机械故障诊断的准确性、自适应性、有效性、可靠性、可理解性和易操作性,为解决旋转机械各类故障诊断问题提供一种新的有效途径,可广泛应用于机械、化工、铁路、冶金、电力、航空等领域的复杂系统中。
附图说明
图1为本发明的实施框图;
图2为本发明对应的原理框图;
图3为旋转机械中常用的LDK UER204型滚动轴承正常状态的原始一维振动加速度信号时域分布图(时域单位为s);
图4为LDK UER204型滚动轴承外圈裂损故障状态的原始一维振动加速度信号时域分布图(时域单位为s);
图5为LDK UER204型滚动轴承内圈和外圈同时磨损故障状态的原始一维振动加速度信号时域分布图(时域单位为s);
图6为旋转机械中常用的6203型滚动轴承正常状态的原始一维振动加速度信号时域分布图(时域单位为s);
图7为6203型滚动轴承内圈点蚀故障状态的原始一维振动加速度信号时域分布图(时域单位为s);
图8为6203型滚动轴承内圈和外圈同时点蚀故障状态的原始一维振动加速度信号时域分布图(时域单位为s);
图9为6203型滚动轴承正常工作状态的双谱灰度图和清晰化双谱灰度图;
图10为6203型滚动轴承故障状态的双谱灰度图和清晰化双谱灰度图;
图11为改进卷积神经网络构架示意图;
图12为反向传播算法实施框图;
图13为LDK UER204型滚动轴承加载运行的测试样本分类结果图;
图14为6203型滚动轴承加载运行的测试样本分类结果图;
具体实施方式
下面以滚动轴承为例结合附图对本发明做进一步详细的说明。
不同型号滚动轴承在不同工况下运行的一维时域振动加速度信号相互之间存在一定的差异,图3至图5分别示出了工业系统中常用的LDK UER204型滚动轴承加载正常运行、外圈裂损故障运行、内圈和外圈同时磨损故障运行工况下的原始一维振动加速度信号时域图(时域单位为s),从图中可以看出LDK UER204型滚动轴承不同信号之间的差异性不明显,难以通过一维时域振动信号来明确判断轴承的健康状态。图6至图8分别示出了工业系统中6203型滚动轴承加载正常运行、内圈点蚀故障运行、内圈和外圈同时点蚀故障运行工况下的原始一维振动加速度信号时域图(时域单位为s),从图中可以看出6203型滚动轴承不同信号之间也是存在差异性的,但差异性并不明显,无法通过一维时域振动信号明确判断轴承的健康状态。因此,难以基于一维时域振动加速度信号数据准确识别轴承工况和确定故障严重程度。
一种清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,具体操作流程如图1、图2所示,包括以下步骤:
步骤1,不同型号的滚动轴承在不同工况运行时,利用加速度传感器分别获取不同型号滚动轴承正常状态和不同故障状态的M种工况的一维时域振动信号,每种工况的一维时域振动信号分别采集N组,其中N≥20,M种信号分别得到N组一维时域振动信号样本,分别记为xMN;
其中,E[·]表示数学期望,{x(i)}表示零均值的三阶平稳随机过程,t1,t2表示任意延时。
图9示出了6203型滚动轴承正常工作状态的双谱灰度图和清晰化双谱灰度图,图10示出了6203型滚动轴承故障状态的双谱灰度图和清晰化双谱灰度图,从图中可以看出,滚动轴承的双谱图中包含了更加丰富的设备健康状态信息,而且不同健康状态的双谱图的差异性比较明显;此外,经过超分辨率重建的清晰化双谱灰度图的质量更高,更有利于轴承的故障特征提取。因此,可以基于不同型号滚动轴承在不同工况下的清晰化双谱灰度图,准确识别轴承的健康状态并判断故障的严重程度。
步骤6,建立基于改进卷积神经网络的旋转机械故障诊断模型,采用训练样本集对改进卷积神经网络进行训练,将训练样本集中加注标签的样本依次输入改进卷积神经网络中,最小化由交叉熵损失函数构成的改进卷积神经网络的损失函数,采用有监督逐层训练方法进行逐层训练和调优,得到改进卷积神经网络的连接权重和偏置参数;
改进卷积神经网络构架示意图如图11所示,从结构可以看出,改进卷积神经网络模型由输入层、卷积层、池化层、多尺度卷积层、全局平均池化层和输出层组成;
改进卷积神经网络的训练方法是反向传播算法,算法示意图如图12所示,算法的原理是利用链式求导法则计算损失函数对每个权重的梯度,根据RAdam自适应优化算法进行权重更新,
步骤6中建立的改进卷积神经网络的交叉熵损失函数为:
其中,JLoss表示交叉熵误差损失函数;m表示输入卷积神经网络的小批量的大小,即每次训练时卷积神经网络的输入样本容量;q为卷积神经网络的输出值,p为目标期望值;c表示输入样本的期望类别,即当输入样本的实际类别为c时,反之,
求解使公式(2)交叉熵损失函数最小的参数来建立卷积神经网络,通过以下公式实现:
步骤6中的改进卷积神经网络的建立又包括以下步骤:
步骤6.1:将卷积神经网络中的标准卷积层替换为深度可分离卷积层;
步骤6.2:采用带参数的ReLU作为改进卷积神经网络的隐藏层激活函数;
步骤6.3:采用RAdam算法对改进卷积神经网络的参数进行优化;
步骤6.4:采用全局平均池化层代替卷积神经网络中的全连接层;
步骤6.5:改进卷积神经网络通过两步来求解公式(3),
步骤6.5.1:将要训练的清晰化双谱灰度图通过输入层输入网络的卷积层,进行特征提取,每一隐藏层的输入是上一层的输出,计算公式如下:
本层的输出特征可以表示为前一层所有卷积运算结果的累加和,计算公式如下所示:
其中,“*”代表卷积运算,卷积运算的公式如下:
步骤6.5.2:将卷积层输出的特征输入到一个下采样层,目的是实现聚合,其聚合公式如下所示:
步骤6.6:对步骤6.5.1所得改进卷积神经网络的最后一层输出,采用有监督逐层训练方法进行逐层训练和调优,具体方式为:
使用前向传播计算权重和偏置:将步骤6.5.1所得的改进卷积神经网络模型的最后一层隐藏层的输出作为输入被逐层传播到输出层,得到预测的分类类别,用链式求导法则计算损失函数对每个权重的梯度,梯度计算公式为:
其中,JLoss表示卷积神经网络的损失函数,W是卷积神经网络的权重,y是中间变量,δ是损失函数JLoss对权重W的偏导数,
在卷积神经网络中,第l层的梯度由如下公式计算:
其中,运算符代表每个元素相乘,δl是损失函数JLoss对第l层权重的偏导数,Wl+1是卷积神经网络的第l+1层的权重,yl是第l层的中间变量,δl+1是损失函数JLoss对第l+1层权重的偏导数,f′(yl)是激活函数的导数,
训练样本的工况标签对应训练样本的实际分类结果,首先,将训练获得的样本的预测输出的分类结果与实际分类结果进行比较得到分类误差;然后,将分类误差逐层反向传播,从而实现对卷积神经网络各层的连接权重参数的调优,连接权重更新的实现公式如下所示:
其中,Wl+1是卷积神经网络的第l+1层的权重,Wl是卷积神经网络的第l层的权重,η为学习率,JLoss表示卷积神经网络的损失函数,δl是损失函数JLoss对第l层权重的偏导数,sl -1是第l-1层的输出,
逐层训练,直至得到改进卷积神经网络最后一层隐藏层的输出对网络各层的连接权重进行调优后,最终确定整个网络的连接权重和偏置参数。
步骤8,利用加速度传感器采集待测滚动轴承运行时的M种工况的一维时域振动加速度信号数据,并利用双谱分析技术对每种工况的一维时域振动加速度信号数据进行处理,得到每种工况的一维时域振动加速度信号数据的振动双谱图;然后,将每种工况的振动双谱图转换为二维灰度图,并利用增强型超分辨率重建网络对每个灰度图进行清晰化处理,将处理后得到的清晰化振动双谱灰度图作为测试样本;
步骤9,将测试样本作为训练好的改进卷积神经网络的输入,对测试样本进行深度学习,采用确定了连接权重和偏置参数的改进卷积神经网络模型对测试样本进行特征提取,得到测试样本特征;
同理,该步骤利用确定好最优连接权重和偏置参数的改进卷积神经网络模型对测试样本进行特征提取,通过将得到的测试样本特征中包含的待测滚动轴承的清晰化双谱灰度图中含有的本质特征与各种工况下的训练样本清晰化双谱灰度图所体现的本质特征进行匹配,实现对待测滚动轴承所属工况类别的识别和故障严重程度的确定;
步骤10,将测试样本特征作为测试样本的匹配特征,将每种工况下的各个训练样本对应的训练样本特征信息作为匹配基准,采用训练好的softmax分类器对测试样本与训练样本进行分类匹配,将与测试样本最为匹配的训练样本所属的工况类别判定为测试样本的工况类别,得到待测滚动轴承的故障诊断结果。
所述的步骤10采用softmax分类器对测试样本与训练样本进行匹配,其具体方式为:
其中,d表示构成样本的数据点数,Q表示样本的种类数,Li代表训练样本对应的标签,1{·}为示性函数,其值规则为:1{真值表达式}=1,1{假值表达式}=1,θ表示由权重向量W和偏置向量b组成的模型的所有参数向量,θt表示θ的第t列向量;
步骤10.3:将改进卷积神经网络提取的测试样本特征作为不同工况对应的分类决策函数的输入,计算出测试样本特征作为输入量的softmax分类器决策函数的决策值,即其所对应的工况类别判定为测试样本的工况类别,得到待测滚动轴承的故障诊断结果。
下面通过实验数据验证,采用本发明所述的旋转机械故障诊断方法按上述流程分别进行两组实验。
实验1:LDK UER204型滚动轴承故障诊断。
LDK UER204型滚动轴承加载运行,轴承工况包括3种:正常运行、轴承外圈裂损故障运行、轴承内圈和外圈同时磨损故障运行,如表1所示。在40个训练样本和10个测试样本的清晰化双谱图条件下,本方法对测试样本的准确率能达到100%,如图所示13,该分类精度能够满足实际应用需求。
表1
实验2:6203型滚动轴承故障诊断。
6203型滚动轴承加载运行,轴承工况包括13种:正常运行、内圈点蚀故障行、内圈和外圈点蚀故障运行等,如表2所示。在130个训练样本和40个测试样本的数据条件下,本方法对测试样本的准确率能达到99%以上,如图所示14,该分类精度能够满足实际应用需求。
表2
综上所述,本发明所述的旋转机械故障诊断方法,利用双谱分析技术对加速度传感器采集的旋转机械一维时域振动信号数据进行处理,得到一维时域振动加速度信号的振动双谱图,在获得隐含丰富特征信息参数图形的同时有效实现信号去噪;将振动双谱图转换为存储需求更小的二维灰度图,降低了存储、计算和诊断成本,提高了特征提取效率;采用增强型超分辨率重建网络对每个灰度图进行清晰化处理,增强了隐含在双谱图中的特征信息,提供了高质量的诊断样本;利用改进卷积神经网络理论学习算法自适应地完成旋转机械故障诊断所需的特征提取,自动挖掘出隐藏在设备清晰化振动双谱图中的丰富信息,摆脱了对大量信号处理知识与设备故障诊断经验的依赖,节省了劳动成本和时间,提高了设备工况的可视性和诊断作业的可理解性,并且在监测诊断性能和泛化性能方面具有优势。与现有技术进行比较,本发明的旋转机械故障诊断方法有效提高了旋转机械各类故障诊断的准确性、自适应性、有效性、可靠性、可理解性和易操作性,为解决旋转机械故障诊断问题提供一种新的有效途径,可广泛应用于机械、化工、冶金、铁路、电力、航空等领域的复杂系统中。
以上的仅是本发明的优选实例。应当指出对于本领域的普通技术人员来说,在本发明所提供的技术启示下,还可以做出其它等同变型和改进,也应视为本发明的保护范围。
Claims (5)
1.一种清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,其特征在于:包括以下步骤:
步骤1,利用加速度传感器分别获取旋转机械正常状态和不同故障状态的M种工况的一维时域振动信号,每种工况的一维时域振动信号分别采集N组,其中N≥20,M种信号分别得到N组一维时域振动信号样本,分别记为xMN;
步骤6,建立基于改进卷积神经网络的旋转机械故障诊断模型,采用步骤5的训练样本集对改进卷积神经网络进行训练,将训练样本集中加注标签的样本依次输入由输入层、卷积层、池化层、多尺度卷积层、全局平均池化层和输出层组成的改进卷积神经网络中,最小化由交叉熵损失函数构成的改进卷积神经网络的损失函数,采用有监督逐层训练方法进行逐层训练和调优,得到改进卷积神经网络的连接权重和偏置参数;
步骤8,利用加速度传感器采集待测旋转机械运行时的M种工况的一维时域振动加速度信号数据,并利用双谱分析技术对每种工况的一维时域振动加速度信号数据进行处理,得到每种工况的一维时域振动加速度信号数据的振动双谱图;然后,将每种工况的振动双谱图转换为二维灰度图,并利用增强型超分辨率重建网络对每个灰度图进行清晰化处理,将处理后得到的清晰化振动双谱灰度图作为测试样本;
步骤9,将测试样本作为训练好的改进卷积神经网络的输入,对测试样本进行深度学习,采用确定了连接权重和偏置参数的改进卷积神经网络模型对测试样本进行特征提取,得到测试样本特征;
步骤10,将测试样本特征作为测试样本的匹配特征,将每种工况下的各个训练样本对应的训练样本特征信息作为匹配基准,采用训练好的softmax分类器对测试样本与训练样本进行分类匹配,将与测试样本最为匹配的训练样本所属的工况类别判定为测试样本的工况类别,得到待测旋转机械的故障诊断结果。
3.根据权利要求1或2所述的清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,其特征在于:所述步骤5中加注标签为数字或者字符,该数字或者字符表示旋转机械故障所出现的健康状态、故障部位、故障类型及故障等级中的至少一种指标。
4.根据权利要求3所述的清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,其特征在于:所述步骤6中建立的改进卷积神经网络的交叉熵损失函数为:
其中,JLoss表示交叉熵误差损失函数;m表示输入卷积神经网络的小批量的大小,即每次训练时卷积神经网络的输入样本容量;q为卷积神经网络的输出值,p为目标期望值;c表示输入样本的期望类别,即当输入样本的实际类别为c时,反之,
求解使公式(2)交叉熵损失函数最小的参数来建立卷积神经网络,通过以下公式实现:
步骤6中的改进卷积神经网络的建立又包括以下步骤:
步骤6.1:将卷积神经网络中的标准卷积层替换为深度可分离卷积层;
步骤6.2:采用带参数的ReLU作为改进卷积神经网络的隐藏层激活函数;
步骤6.3:采用RAdam算法对改进卷积神经网络的参数进行优化;
步骤6.4:采用全局平均池化层代替卷积神经网络中的全连接层;
步骤6.5:改进卷积神经网络通过两步来求解公式(3),
步骤6.5.1:将要训练的清晰化双谱灰度图通过输入层输入网络的卷积层,进行特征提取,每一隐藏层的输入是上一层的输出,计算公式如下:
本层的输出特征可以表示为前一层所有卷积运算结果的累加和,计算公式如下所示:
其中,“*”代表卷积运算,卷积运算的公式如下:
步骤6.5.2:将卷积层输出的特征输入到一个下采样层,目的是实现聚合,其聚合公式如下所示:
步骤6.6:对步骤6.5.1所得改进卷积神经网络的最后一层输出,采用有监督逐层训练方法进行逐层训练和调优,具体方式为:
使用前向传播计算权重和偏置:将步骤6.5.1所得的改进卷积神经网络模型的最后一层隐藏层的输出作为输入被逐层传播到输出层,得到预测的分类类别,用链式求导法则计算损失函数对每个权重的梯度,梯度计算公式为:
其中,JLoss表示卷积神经网络的损失函数,W是卷积神经网络的权重,y是中间变量,δ是损失函数JLoss对权重W的偏导数,
在卷积神经网络中,第l层的梯度由如下公式计算:
其中,运算符代表每个元素相乘,δl是损失函数JLoss对第l层权重的偏导数,Wl+1是卷积神经网络的第l+1层的权重,yl是第l层的中间变量,δl+1是损失函数JLoss对第l+1层权重的偏导数,f′(yl)是激活函数的导数,
训练样本的工况标签对应训练样本的实际分类结果,首先,将训练获得的样本的预测输出的分类结果与实际分类结果进行比较得到分类误差;然后,将分类误差逐层反向传播,从而实现对卷积神经网络各层的连接权重参数的调优,连接权重更新的实现公式如下所示:
其中,Wl+1是卷积神经网络的第l+1层的权重,Wl是卷积神经网络的第l层的权重,η为学习率,JLoss表示卷积神经网络的损失函数,δl是损失函数JLoss对第l层权重的偏导数,sl-1是第l-1层的输出,
逐层训练,直至得到改进卷积神经网络最后一层隐藏层的输出对网络各层的连接权重进行调优后,最终确定整个改进卷积神经网络的连接权重和偏置参数。
5.根据权利要求4所述的清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法,其特征在于:所述步骤10采用softmax分类器对测试样本与训练样本进行匹配,其具体方式为:
其中,d表示构成样本的数据点数,Q表示样本的种类数,Li代表训练样本对应的标签,1{·}为示性函数,其值规则为:1{真值表达式}=1,1{假值表达式}=1,θ表示由权重向量W和偏置向量b组成的模型的所有参数向量,θt表示θ的第t列向量;
步骤10.3:将改进卷积神经网络提取的测试样本特征作为不同工况对应的分类决策函数的输入,计算出测试样本特征作为输入量的softmax分类器决策函数的决策值,即其所对应的工况类别判定为测试样本的工况类别,得到待测旋转机械的故障诊断结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210257494.6A CN114692490A (zh) | 2022-03-16 | 2022-03-16 | 清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210257494.6A CN114692490A (zh) | 2022-03-16 | 2022-03-16 | 清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114692490A true CN114692490A (zh) | 2022-07-01 |
Family
ID=82139424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210257494.6A Pending CN114692490A (zh) | 2022-03-16 | 2022-03-16 | 清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114692490A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117788841A (zh) * | 2024-02-23 | 2024-03-29 | 青岛大学 | 一种基于双谱分析和cnn的永磁电机退磁故障诊断方法 |
CN118013400A (zh) * | 2024-04-08 | 2024-05-10 | 广汽埃安新能源汽车股份有限公司 | 电机故障诊断方法、装置、电子设备和存储介质 |
-
2022
- 2022-03-16 CN CN202210257494.6A patent/CN114692490A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117788841A (zh) * | 2024-02-23 | 2024-03-29 | 青岛大学 | 一种基于双谱分析和cnn的永磁电机退磁故障诊断方法 |
CN117788841B (zh) * | 2024-02-23 | 2024-05-17 | 青岛大学 | 一种基于双谱分析和cnn的永磁电机退磁故障诊断方法 |
CN118013400A (zh) * | 2024-04-08 | 2024-05-10 | 广汽埃安新能源汽车股份有限公司 | 电机故障诊断方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110361176B (zh) | 一种基于多任务特征共享神经网络的智能故障诊断方法 | |
CN111046945B (zh) | 基于组合卷积神经网络的故障类型及损坏程度诊断方法 | |
Wang et al. | Self-supervised signal representation learning for machinery fault diagnosis under limited annotation data | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
Vashishtha et al. | An amended grey wolf optimization with mutation strategy to diagnose bucket defects in Pelton wheel | |
CN114692490A (zh) | 清晰化双谱图和改进卷积神经网络旋转机械故障诊断方法 | |
CN110657984B (zh) | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 | |
CN108304927A (zh) | 基于深度学习的轴承故障模式诊断方法及系统 | |
CN113923104B (zh) | 基于小波神经网络的网络故障诊断方法、设备及存储介质 | |
CN108256556A (zh) | 基于深度信念网络的风力发电机组齿轮箱故障诊断方法 | |
CN114358124B (zh) | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 | |
CN114358123B (zh) | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 | |
CN113869286B (zh) | 一种自适应多任务智能故障诊断系统及故障诊断方法 | |
CN110647830A (zh) | 基于卷积神经网络和高斯混合模型的轴承故障诊断方法 | |
CN111459144A (zh) | 一种基于深度循环神经网络的飞机飞控系统故障预测方法 | |
CN112926644A (zh) | 一种滚动轴承剩余使用寿命预测方法及系统 | |
CN112417766B (zh) | 一种以无故障数据为主的故障诊断方法 | |
CN114118138A (zh) | 一种基于多标签领域自适应模型的轴承复合故障诊断方法 | |
CN114462480B (zh) | 基于非均衡数据集下的多源传感器轧机故障诊断的方法 | |
CN115791174B (zh) | 一种滚动轴承异常诊断方法、系统、电子设备及存储介质 | |
CN114444582A (zh) | 基于卷积神经网络与贝叶斯网络的机械设备故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN114491828A (zh) | 一种基于多门控混合专家多任务学习的复合故障诊断方法 | |
Shi et al. | Intelligent fault diagnosis of rolling mills based on dual attention-guided deep learning method under imbalanced data conditions | |
CN105547705A (zh) | 发动机性能退化趋势预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |