CN116522237A - 一种基于并行卷积神经网络的滚动轴承故障诊断方法 - Google Patents
一种基于并行卷积神经网络的滚动轴承故障诊断方法 Download PDFInfo
- Publication number
- CN116522237A CN116522237A CN202310406829.0A CN202310406829A CN116522237A CN 116522237 A CN116522237 A CN 116522237A CN 202310406829 A CN202310406829 A CN 202310406829A CN 116522237 A CN116522237 A CN 116522237A
- Authority
- CN
- China
- Prior art keywords
- signal
- neural network
- sample signal
- dimensional
- rolling bearing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005096 rolling process Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 44
- 238000003745 diagnosis Methods 0.000 title claims abstract description 43
- 238000005070 sampling Methods 0.000 claims abstract description 80
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 74
- 230000004927 fusion Effects 0.000 claims abstract description 28
- 238000010586 diagram Methods 0.000 claims description 49
- 230000006870 function Effects 0.000 claims description 49
- 238000012549 training Methods 0.000 claims description 45
- 238000000354 decomposition reaction Methods 0.000 claims description 36
- 238000012360 testing method Methods 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 20
- 230000007704 transition Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000036541 health Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 238000013210 evaluation model Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2131—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本公开揭示了一种基于并行卷积神经网络的滚动轴承故障诊断方法,包括:S100:采集待测滚动轴承的原始振动信号Xio(t);S200:对原始振动信号Xio(t)进行预处理,获得预处理后的振动信号Xi(t);S300:对预处理后的振动信号Xi(t)进行第一次重叠采样,以获得第一样本信号xm(t);S400:对预处理后的振动信号进行第二次重叠采样,以获得第二样本信号ym(t);S500:基于第一样本信号xm(t)和第二样本信号ym(t)分别获得待测滚动轴承的一维张量集合和二维张量集合;S600:基于待测滚动轴承的一维张量集合和二维张量集合构建融合数据集并输入训练好的并行卷积神经网络,以实现对待测滚动轴承的故障识别。
Description
技术领域
本公开属于机械故障诊断和信号处理领域,具体涉及一种基于并行卷积神经网络的滚动轴承故障诊断方法。
背景技术
随着工业4.0的不断深入,机电装备正朝着大型化、自动化、智能化、精密化的方向发展。机电装备在运行过程中发生故障而停车会对生产造成极大影响和经济损失。为此,保证机电装备的安全平稳运行具有重要意义,为实现这一目标需要建立准确可靠的健康监测系统。滚动轴承作为机电装备的关键零部件之一,广泛应用于船舶、汽车、风力发电,航空航天等领域。滚动轴承是旋转机械中易损坏部件,在复杂恶劣的工况和交变载荷的作用下经常发生塑性变形、疲劳断裂、点蚀、剥落等故障。滚动轴承故障诊断是保证机电装备正常运行的关键环节,因此,在生产实践中,迫切需要一种高精度,高稳定性的滚动轴承故障诊断方法。
目前,滚动轴承的故障诊断方法主要有传统方法和深度学习方法两大类。传统方法主要以信号时频域分析为主,如快速谱峭度图法、最小熵反褶积法、变分模态分解、小波分解等,使用这些方法对传感器检测到的轴承振动信号进行处理,得到并绘制出轴承振动信号的频域图像,依据滚动轴承的几何参数和运行条件计算出故障频率,并在振动信号的频域图像中找出对应的故障频率基频及其谐波,并与计算得出的理论故障频率进行对比,判断滚动轴承某位置是否存在故障。这些传统故障诊断方法大多是基于信号特征提取和分类器的组合,这类算法设计繁琐复杂,对数学物理知识要求很高,同时需要使用者具有丰富的专家经验对算法处理结果进行判断。这类算法大都有适用的工况场合,在算法使用工况不同,算法参数设置不同的情况下,诊断结果甚至会出现较大的差异,导致传统故障诊断算法的泛化性较差。由于在机电装备运行过程中,滚动轴承存在着较多的不可预知、不可量化测量的因素,传统故障诊断方法存在着一定的局限性。
深度学习方法使用深度学习网络模型来自动化、智能化学习输入网络的参数并进行特征提取,然后网络模型对输入进行分类并判断轴承故障类型。目前常用的用于故障诊断的一维卷积神经网络包括WDCNN等,二维卷积神经网络包括ResNet50等,这些网络通过自主学习信号中的故障特征,可以智能化地完成整个轴承故障诊断过程。以上基于深度学习的滚动轴承故障诊断网络虽然可以自动对信号进行特征提取和故障分类,但如果直接让神经网络学习原始的轴承振动信号,会导致网络难以从振动信号中提取到有效的特征,使网络训练难度增大甚至无法收敛。
发明内容
针对现有技术中的不足,本公开的目的在于提供一种基于并行卷积神经网络的滚动轴承故障诊断方法,该方法通过从原始振动信号提取出的一维特征和二维特征输入并行卷积神经网络,能够有效地避免了振动信号中噪声的干扰,从而能够解决在干扰下振动信号故障诊断不准确的问题。
为实现上述目的,本公开提供以下技术方案:
一种基于并行卷积神经网络的滚动轴承故障诊断方法,包括如下步骤:
S100:采集待测滚动轴承的原始振动信号Xio(t);
S200:对原始振动信号Xio(t)进行预处理,获得预处理后的振动信号Xi(t);
S300:对预处理后的振动信号Xi(t)进行第一次重叠采样,以获得第一样本信号xm(t);
S400:对预处理后的振动信号Xi(t)进行第二次重叠采样,以获得第二样本信号ym(t);
S500:基于第一样本信号xm(t)和第二样本信号ym(t)分别获得待测滚动轴承的一维张量集合和二维张量集合;
S600:基于待测滚动轴承的一维张量集合和二维张量集合构建融合数据集并输入训练好的并行卷积神经网络,以识别待测滚动轴承的故障。
优选的,步骤S200中,所述对原始振动信号Xio(t)进行预处理包括如下步骤:
S201:去除原始振动信号Xio(t)中的直流分量;
S202:对去除直流分量后的原始振动信号Xio(t)进行归一化。
优选的,步骤S201中,通过下式去除原始振动信号Xio(t)中的直流分量:
其中,Xi(t)表示去除直流分量后的原始振动信号,Xio(t)表示原始振动信号,Xio(t)k表示原始振动信号Xio(t)中第k个采样点对应的幅值,len(Xio(t))表示原始振动信号Xio(t)中采样点的个数,io表示原始振动信号Xio(t)的数据序列号,t表示原始振动信号Xio(t)的时间序列。
优选的,步骤S202中,通过下式对去除直流分量后的原始振动信号Xi(t)进行归一化:
且
其中,MIN(Xi(t))表示极小值化处理,σ表示缩放因子,Xi(t)max表示Xi(t)中的最大值,Xi(t)min表示Xi(t)中的最小值。
优选的,步骤S300中,通过采用滑动窗口对预处理后的振动信号进行第一次重叠采样。
优选的,所述滑动窗口的位置通过下式计算:
其中,Ntotal表示预处理后的振动信号Xi(t)的采样点个数,Ntotal[(m-1)(L+step),mL+(m-1)step]表示第(m-1)(L+step)个采样点至mL+(m-1)step个采样点之间的所有采样点,L表示滑动窗口的长度,step表示滑动窗口的步长,xm(t)表示第一样本信号,m表示第一样本信号xm(t)的序号。
优选的,所述预处理后的振动信号Xi(t)的采样点个数通过下式计算:
其中,k表示长度系数,默认取k=2,n表示轴承转速,表示采样间隔,Z表示正整数。
优选的,步骤S500中,所述基于第一样本信号xm(t)获得待测滚动轴承的一维张量集合包括以下步骤:
S501:对第一样本信号xm(t)进行希尔伯特变换,并计算第一样本信号xm(t)的包络信号Am(t);
S502:对第一样本信号xm(t)进行集成经验模态分解,获得分解后的模态分量ui(t),并根据相关系数α对模态分量ui(t)进行重构,得到重构信号Um(t);
S503:对第一样本信号xm(t)进行变分模态分解,获得分解后的模态分量vi(t),并根据相关系数β对模态分量vi(t)进行重构,得到重构信号Vm(t);
S504:将包络信号Am(t)、重构信号Ui(t)和重构信号Vi(t)分别转化为一维信号张量At m(t)、Ut m(t)和Vt m(t),并将相同类别的信号张量在指定维度dim=0进行堆叠,分别获得一维张量集合T1、T2和T3。
优选的,步骤S501中,通过下式对第一样本信号xm(t)进行希尔伯特变换:
其中,em(t)表示第一样本信号xm(t)经过希尔伯特变换后得到的信号,t表示时间,τ表示积分变量,m表示第一样本信号xm(t)的序号。
优选的,步骤S501中,通过以下方式计算第一样本信号xm(t)的包络信号Am(t):
以第一样本信号xm(t)为实部,以希尔伯特变换后的信号em(t)为虚部,构建第m个样本信号xm(t)的解析信号αm(t):
αm(t)=xm(t)+jem(t)
取解析信号αm(t)的幅值作为包络信号Am(t),即
其中,xm(t)表示第一样本信号,em(t)表示第一样本信号xm(t)经过希尔伯特变换后的信号。
优选的,步骤S502中,通过下式对第一样本信号xm(t)进行集成经验模态分解:
其中,ui(t)表示集成经验模态分解后的模态分量,i表示分解得到的第i个模态分量,n表示分解次数,rn(t)表示残差。
优选的,步骤S502中,所述相关系数α通过下式计算:
其中,表示模态分量ui(t)的平均值,/>表示第一样本信号xm(t)的平均值,std表示求标准差运算;
所述重构信号Um(t)由相关系数α>0.4的模态分量ui(t)相加获得,即
其中,t表示有t个相关系数α>0.4的模态分量。
优选的,步骤S503中,通过构建带约束的变分模型对第一样本信号xm(t)进行变分模态分解。
优选的,所述带约束的变分模型表示为:
其中,{vi(t)}表示变分模态分解后的第i个内涵模态分量,I表示分解信号个数,{ωi}表示内涵模态分量对应的中心频率,δ(t)表示狄利克雷函数,*表示卷积运算,xm(t)表示第一样本信号,π表示圆周率,表示求导符号,j表示虚数单位。
优选的,步骤S503中,所述相关系数β通过下式计算:
其中,表示模态分量vi(t)的平均值,/>表示第一样本信号xm(t)的平均值,std表示求标准差运算;
所述重构信号Vm(t)由相关系数β>0.4的内涵模态分量vi(t)相加获得,即
其中,t表示有t个相关系数α>0.4的内涵模态分量。
优选的,步骤S400中,通过采用滑动窗口对归一化后的振动信号进行第二次重叠采样。
优选的,步骤S500中,所述基于第二样本信号ym(t)获得待测滚动轴承的二维张量集合包括以下步骤:
S5001:对第二样本信号ym(t)进行连续小波变换以获取对应的小波系数,并根据小波系数绘制小波时频图;
S5002:绘制马尔科夫变迁场图;
S5003:绘制格拉姆角场图;
S5004:分别将小波时频图、马尔科夫变迁场图和格拉姆角场图转化为二维张量,以获得待测滚动轴承的二维张量集合T4,T5和T6。
优选的,步骤S5001包括如下步骤:
S50011:使用python的小波分析工具包PyWavelets对第二信号样本ym(t)进行连续小波变换,以获得小波系数,具体为:
其中,WT(a,τ)表示小波系数,a表示尺度因子,τ表示时移因子,*表示共轭函数,Ψa,τ(t)表示小波基函数,t表示时间序列;
S50012:根据小波系数的时间序列t、实际频率序列f和小波系数的模abs(WT(a,τ))绘制小波时频图。
优选的,步骤S5001中,使用matplotlib绘图库中的pcolor函数根据小波的时间序列t、实际频率序列f和小波系数的模abs(WT(a,τ))绘制小波时频图。
优选的,所述小波的实际频率序列f通过下式计算:
scalef=Fs wcf
其中,scale表示小波f的尺度序列,Fs表示第二样本信号ym(t)的采样频率,wcf表示小波f的中心频率。
优选的,步骤S5002包括如下步骤:
S50021:基于一阶马尔可夫过程的时间顺序将第二信号样本ym(t)可视化为复杂网络,得到马尔科夫矩阵;
S50022:基于马尔科夫矩阵绘制马尔科夫变迁场图。
优选的,步骤S5003包括如下步骤:
S50031:将笛卡尔坐标系下的第二样本信号ym(t)规范化至区间[-1,1],并转化为极坐标系表示;
S50032:基于第二样本信号ym(t)规范后的极坐标表示并通过三角函数生成格拉姆角场矩阵G;
S50033:基于格拉姆角场矩阵G绘制格拉姆角场图。
优选的,步骤S50032中,所述格拉姆角场矩阵G表示为:
其中,表示第二样本信号ym(t)规范化后的时间序列点xn的极坐标。
优选的,所述并行卷积神经网络包括一维卷积神经网络和二维卷积神经网络,所述一维卷积神经网络包括全连接层、卷积层、批量归一化层、激活函数和池化层;所述二维卷积神经网络采用InceptionV1网络。
优选的,步骤S600中,所述并行卷积神经网络的训练包括如下步骤:
S601:分别采集健康轴承的健康信号和故障轴承的故障信号,再将故障信号根据不同的故障位置和故障程度进行分类,综合健康信号和分类后的故障信号获得原始信号集;
S602:获得原始信号集的一维张量集合和二维张量集合;
S603:将原始信号集的一维张量集合和二维张量集合以及融合数据集标签进行组合,以构建融合数据集,并将融合数据集划分为训练集、验证集和测试集;
S604:预先设置一个较大的损失函数最小值,通过训练集对并行卷积神经网络进行训练,同时,在训练过程中利用验证集对并行卷积神经网络进行验证,每当验证集上的损失函数值小于预先设置的损失函数最小值,且训练集的损失函数仍在下降,令损失函数最小值等于此时验证集上的损失函数值并进行保存,并覆盖保存此时网络的模型参数,当训练结束后获得训练好的并行神经网络;
S605:通过测试集对训练好的并行神经网络进行测试,若测试通过,则获得训练好的并行神经网络;否则需要调整超参数对并行神经网络重新进行训练。
优选的,步骤S605中,通过使用混淆矩阵和t分布-随机邻近嵌入评价模型的分类效果,以判断并行神经网络测试是否通过。
优选的,步骤S604中,在通过训练集对并行神经网络进行训练之前,需要将训练集中的一维信号张量At m(t)、Ut m(t)和Vt m(t)赋予不同权重ρk并通过下式进行合并,以获得一维融合张量xf(t):
xf(t)=ρ1At m(t)+ρ2Ut m(t)+ρ3Vt m(t)
其中,At m(t)为包络信号的张量;Ut m(t)为集成经验模态分解重构信号的张量;Vt m(t)为变分模态分解重构信号的张量。
优选的,所述权重ρk通过下式计算:
其中,ρk为第k类张量对应的权重;kurk为第k类张量对应的峭度;为三种张量的峭度和。
本公开还提供一种基于并行卷积神经网络的滚动轴承故障诊断装置,包括:
采集模块,用于采集待测滚动轴承的原始振动信号Xio(t);
预处理模块,用于对原始振动信号Xio(t)进行预处理,以获得预处理后的振动信号Xi(t);
第一采样模块,用于对预处理后的振动信号Xi(t)进行第一次重叠采样,以获得第一样本信号xm(t);
第二采样模块,用于对预处理后的振动信号Xi(t)进行第二次重叠采样,以获得第二样本信号ym(t);
张量集合获取模块,用于基于第一样本信号xm(t)和第二样本信号ym(t)分别获得待测滚动轴承的一维张量集合和二维张量集合;
诊断模块,用于基于待测滚动轴承的一维张量集合和二维张量集合构建融合数据集并输入训练好的并行卷积神经网络,以识别待测滚动轴承的故障。
本公开还提供一种计算机存储介质,包括:
存储器,用于存储多条计算机指令;
处理器,用于执行计算机指令以实现如前任一所述的方法。
与现有技术相比,本公开带来的有益效果为:
1、本公开不直接使用原始振动信号作为输入,而是采用包络分析提取振动信号的一维故障特征,采用连续小波变换提取振动信号的二维故障特征,将提取出的一维特征和二维特征输入并行卷积神经网络,有效地避免了振动信号中噪声的干扰,并提取出了振动信号中富含故障信息的特征,更好地解决了在干扰下振动信号故障诊断不准确的问题。
2、本公开构建的并行卷积神经网络采用包络谱和小波时频图构建诊断模型,有着诊断准确、故障分类效果好的优点,网络识别故障的准确率可以达到99%以上。
附图说明
图1是本发明一个实施例提供的一种基于并行卷积神经网络的滚动轴承故障诊断方法的流程图;
图2是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的重叠采样示意图;
图3是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的一维卷积神经网络卷积模块的结构示意图;
图4是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的Inception模块示意图;
图5是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的SE-Inception模块示意图;
图6是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的并行卷积神经网络的结构示意图;
图7是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的轴承试验台示意图;
图8是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的不同故障类别的振动信号对应的小波时频图;
图9是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的不同故障类别的振动信号对应的马尔科夫变迁场图;
图10是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的不同故障类别的振动信号对应的格拉姆角场图;
图11是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的混淆矩阵图;
图12是本发明一个实施例的基于并行卷积神经网络的滚动轴承故障诊断方法的t-SNE可视化结果图;
图13是并行卷积神经网络与现有卷积神经网络在训练集上的诊断准确率比对示意图;
图14是并行卷积神经网络与现有卷积神经网络在验证集上的诊断准确率比对示意图。
具体实施方式
下面将参照附图1至图14详细地描述本公开的具体实施例。虽然附图中显示了本公开的具体实施例,然而应当理解,可以通过各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本公开的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本公开的范围。本公开的保护范围当视所附权利要求所界定者为准。
为便于对本公开实施例的理解,下面将结合附图以具体实施例为例做进一步的解释说明,且各个附图并不构成对本公开实施例的限定。
一个实施例中,如图1所示,本公开提供一种基于并行卷积神经网络的滚动轴承故障诊断方法,包括如下步骤:
S100:采集待测滚动轴承的原始振动信号Xio(t);
S200:对原始振动信号Xio(t)进行预处理,获得预处理后的振动信号Xi(t);
S300:对预处理后的振动信号Xi(t)进行第一次重叠采样,以获得第一样本信号xm(t);
S400:对预处理后的振动信号Xi(t)进行第二次重叠采样,以获得第二样本信号ym(t);
S500:基于第一样本信号xm(t)和第二样本信号ym(t)分别获得待测滚动轴承的一维张量集合和二维张量集合;
S600:基于待测滚动轴承的一维张量集合和二维张量集合构建融合数据集并输入训练好的并行卷积神经网络,以识别待测滚动轴承的故障。
上述实施例构成了本公开的完整技术方案。本实施例通过采用包络分析、并通过对集成经验模态分解和变分模态分解的模态分量进行重构,舍弃与原始振动信号的相关系数较小的模态分量,使神经网络有效提取出原始振动信号中的一维故障特征;以及通过采用连续小波变换提取振动信号的二维故障特征,使用马尔科夫变迁场和格拉姆角场提取振动信号的二维空间特征,从而能够有效避免原始振动信号中由噪声造成的干扰,进而能够提高滚动轴承的故障识别准确率。
另一个实施例中,步骤S200中,所述对原始振动信号Xio(t)进行预处理包括如下步骤:
S201:去除原始振动信号Xio(t)中的直流分量;
该步骤中,去除原始振动信号Xio(t)中的直流分量通过下式进行:
其中,Xi(t)表示预处理后的原始振动信号,Xio(t)表示原始振动信号,Xio(t)k表示原始振动信号Xio(t)中第k个采样点对应的幅值,len(Xio(t))表示原始振动信号Xio(t)中采样点的个数,io表示原始振动信号Xio(t)的数据序列号,t表示原始振动信号Xio(t)的时间序列。
S202:对去除直流分量后的原始振动信号Xio(t)进行归一化。
该步骤中,通过下式对去除直流分量后的原始振动信号Xio(t)进行归一化:
其中,
其中,MIN(Xi(t))表示极小值化处理,σ表示缩放因子,Xi(t)max表示Xi(t)中的最大值,Xi(t)min表示Xi(t)中的最小值。
通过对去除直流分量后的原始振动信号Xio(t)进行归一化,能够避免振动信号Xi(t)中的奇异值在训练时对神经网络产生影响,从而加快神经网络的收敛速度。
另一个实施例中,步骤S300中,通过采用滑动窗口对归一化后的振动信号进行第一次重叠采样。
本实施例中,为了增加训练样本数量,需要对归一化后的原始振动信号通过重叠采样以进行数据增强。由于一维故障信号具有时序性和周期性的特点,因此,从归一化后的原始振动信号中采集训练样本时可根据如图2所示进行重叠采样,具体为:使用长度为L的滑动窗口对归一化处理后的原始振动信号进行采样,滑动窗口每次移动步长为step,使通过采样得到的每一段信号与其之后一段信号存在部分重叠,从而得到的第m个重叠采样号片段xm(t)表示为:
其中,Ntotal表示预处理后的振动信号Xi(t)的采样点个数,Ntotal[(m-1)(L+step),mL+(m-1)step]表示第(m-1)(L+step)个采样点至mL+(m-1)step个采样点之间的所有采样点,L表示滑动窗口的长度,step表示滑动窗口的步长,xm(t)表示第一样本信号,m表示第一样本信号xm(t0的序号。
需要说明的是,为保证重叠采样时每个样本至少包含轴承旋转1周的故障特征信息,预处理后的振动信号xi(t)的采样点数N应不少于轴承旋转2周时间内的采样点数。为提高后续快速傅里叶变换的计算效率,样本采样的点数应为2的指数倍。
综上,在重叠采样时预处理后的振动信号Xi(t)的采样点数N应满足:
其中,k表示长度系数,默认取k=2,实际取值可根据情况酌情调整,n表示轴承转速,ΔT表示采样间隔。
另一个实施例中,步骤S500中,所述基于第一样本信号xm(t)获得待测滚动轴承的一维张量集合包括以下步骤:
S501:对第一样本信号xm(t)进行希尔伯特变换,并计算第一样本信号xm(t)的包络信号Am(t);
该步骤中,通过下式对第一样本信号xm(t)进行希尔伯特变换:
其中,em(t)表示第一样本信号xm(t)经过希尔伯特变换后得到的信号,t表示时间,τ表示积分变量,m表示第一样本信号xm(t)的序号;
令重叠采样得到的第一样本信号xm)t)为虚部,希尔伯特变换后得到的信号em(t)为虚部,构建第m个样本信号xm(t)的解析信号αm(t):
αm(t)=xm(t)+jem(t)
进一步的,取解析信号αm(t)的幅值作为包络信号Am(t),其中,xm(t)表示第一样本信号,em(t)表示第一样本信号xm(t)经过希尔伯特变换后的信号。
S502:对第一样本信号xm(t)进行集成经验模态分解,获得分解后的模态分量ui(t),并根据相关系数α对模态分量ui(t)进行重构,得到重构信号Um(t);
该步骤中,通过下式对第一样本信号xm(t)进行集成经验模态分解:
其中,ui(t)表示集成经验模态分解后的模态分量,i表示分解得到的第i个模态分量,n表示分解次数,rn(t)表示残差。
所述相关系数α通过下式计算:
其中,表示模态分量ui(t)的平均值,/>表示第一样本信号xm(t)的平均值,std表示求标准差运算;
所述重构信号Um(t)由相关系数α>0.4的模态分量ui(t)相加获得,即
其中,t表示有t个相关系数α>0.4的模态分量。
需要说明的是,相关系数α反应了模态分量和原始振动信号之间的相关程度,模态分量和原始振动信号的相关系数越小,则二者之间的相关程度越小,可以认为这部分模态分量是原始振动信号中的噪声。一般认为相关系数<0.4为弱相关,因此本实施例选择相关系数>0.4的模态分量进行重构,舍弃了模态分量中与原始振动信号不相关的成分,因此能够避免原始振动信号中由噪声造成的干扰。
S503:对第一样本信号xm(t)进行变分模态分解,获得分解后的模态分量vi(t),并根据相关系数β对模态分量vi(t)进行重构,得到重构信号Vm(t);
该步骤中,通过构建带约束的变分模型对第一样本信号xm(t)进行变分模态分解,所述带约束的变分模型表示为:
其中,{vi(t)}表示变分模态分解后的第i个内涵模态分量,I表示分解信号个数,{ωi}表示内涵模态分量对应的中心频率,δ(t)表示狄利克雷函数,*表示卷积运算,xm(t)表示第一样本信号,π表示圆周率,表示求导符号,j表示虚数单位。
所述相关系数β通过下式计算:
其中,表示模态分量vi(t)的平均值,/>表示第一样本信号xm(t)的平均值,std表示求标准差运算;
所述重构信号Vm(t)由相关系数β>0.4的内涵模态分量vi(t)相加获得,即:
其中,t表示有t个相关系数α>0.4的内涵模态分量。
S504:使用pytorch库中的torch.tensor()函数将包络信号Am(t)、重构信号Ui(t)和重构信号Vi(t)分别转化为一维信号张量At m(t)、Ut m(t)和Vt m(t)(即将数据类型由ndarray变为tensor),并将相同类别的信号张量使用pytorch库中的torch.stack()在指定维度dim=0进行堆叠,分别获得一维张量集合T1、T2和T3。
另一个实施例中,步骤S400中,通过采用滑动窗口对归一化后的振动信号进行第二次重叠采样。
本实施例中,第二次重叠采样与第一次重叠采样方式相同,此处不再赘述。
另一个实施例中,步骤S500中,所述基于样本信号ym(t)获得待测滚动轴承的二维张量集合包括以下步骤:
S5001:对第二样本信号ym(t)进行连续小波变换以获取对应的小波系数,并根据小波系数绘制小波时频图;
该步骤中,绘制小波时频图包括以下步骤:
S50011:选择cmor3-3小波作为基函数,通过使用python的小波分析工具包PyWavelets对第二样本信号ym(t)进行连续小波变换,以获得小波系数。
具体的,通过下式对第二样本信号ym(t)进行连续小波变换:
其中,WT(a,τ)表示小波系数,a表示尺度因子,τ表示时移因子,*表示共轭函数,Ψa,τ(t)表示小波基函数,t表示时间。
需要说明的是,cmor3-3小波具有指数衰减的震荡形式,与滚动轴承发生故障时产生的瞬态冲击衰减成分类似,因此常被用于滚动轴承的故障特征提取,其表达式为:
其中,α为包络因子,fc为小波的中心频率,t表示时间。
S50012:获得第二样本信号ym(t)的小波系数后,通过使用matplotlib绘图库中的pcolor函数并根据小波系数的时间序列t、实际频率序列f和小波系数的模abs(WT(a,τ))绘制小波时频图,进一步的,可将得到的小波时频图转化为3通道RGB、像素值为224×224的三通道真彩图,共7种类别,具体如图8所示。
具体的,上述小波实际频率序列f通过下式计算:
scalef=Fs wcf
其中,scale表示小波f的尺度序列,Fs表示样本信号ym(t)的采样频率,wcf表示小波f的中心频率。
S5002:绘制马尔科夫变迁场图;
该步骤中,绘制马尔科夫变迁场图具体包括以下步骤:
S50021:基于一阶马尔可夫过程的时间顺序将第二信号样本ym(t)可视化为复杂网络,得到马尔科夫矩阵,该矩阵具体示例如下:
其中,ωi,j表示分位箱i转移到分位箱j的频率,x为时序数据,qi,qj表示分位箱。
S50022:基于马尔科夫矩阵并使用pyts库的MarkovTransitionField函数绘制马尔科夫变迁场图,具体如图9所示。
S5003:绘制格拉姆角场图;
该步骤中,绘制格拉姆角场图具体包括如下步骤:
S50031:将笛卡尔坐标系下的第二样本信号ym(t)规范化至区间[-1,1],并转化为极坐标系表示;
S50032:基于第二样本信号ym(t)规范后的极坐标表示并通过三角函数生成格拉姆角场矩阵G;
该步骤中,所述格拉姆角场矩阵G的类型为格拉姆角求和场,具体表示为:
其中,表示第二样本信号ym(t)规范化后的时间序列点xn的极坐标。
S50033:基于格拉姆角场矩阵G并使用pyts库的GramianAngularField函数绘制格拉姆角场图,具体如图10所示。
S5004:使用Torchvision库中的transforms函数分别将小波时频图、马尔科夫变迁场图和格拉姆角场图转化为二维张量,图像单通道的数值范围为[0,255],张量除以255得到归一化二维张量,相同类别的二维图像张量在第0维度进行堆叠,即获得待测滚动轴承的二维张量集合T4,T5,T6。
另一个实施例中,步骤S600中,所述并行卷积神经网络的训练过程包括以下步骤:
S601:分别采集健康轴承的健康信号和故障轴承的故障信号,再将故障信号根据不同的故障位置和故障程度进行分类,综合健康信号和分类后的故障信号获得原始信号集;
该步骤中,本实施例所使用的滚动轴承振动信号来自帕德博恩大学滚动轴承状态监测试验台所采集的信号。轴承试验台如图7所示。试验台由从左到右依次包括电动机、扭矩测量轴、滚动轴承测试模块、飞轮和负载电机。通过将不同损伤类型的滚动轴承安装在轴承测试试验台中,以采集实验数据。该试验台使用的所有测试轴承型号均为6203型号滚动轴承。振动传感器以64KHz的采样频率采集滚动轴承振动信号。每段信号采集4秒钟,轴承振动信号的采样点数约为256000。本实施例统一使用N15_M07_F10工况条件下的轴承振动信号,其具体运行参数如表1所示:
表1工况参数
另外,本实施例选择了3种不同类别的外圈故障振动信号和3种不同类别的内圈故障振动信号,并与正常轴承振动信号构成7种不同状态类别的原始信号集,具体如表2所示:
表2选取的轴承振动信号
S602:获得原始信号集的一维张量集合和二维张量集合;
获得原始信号集后,第一、需要对其进行预处理,以获得预处理信号;第二、需要对预处理信号进行重叠采样以实现数据增强。经计算6203轴承旋转1周的信号采样点数为2560个,为使重叠采样的信号片段包含完整的故障信息,减少FFT计算时间,选定重叠采样的信号采样点数为8192个,重叠采样窗口移动步长为1000,每种类别的原始振动信号重叠采样200次,共获得1400个样本信号;第三,对样本信号做希尔伯特变换获得解析信号,求取解析信号的包络信号;第四、对包络信号做FFT后进行幅值归一化,并取包络谱的单边振幅谱幅值,构建一维张量集合。处理后最终得到1400个采样点数为4096的一维张量;第五、通过对轴承原始振动信号进行重叠采样以实现数据增强。经计算6203轴承旋转1周的信号采样点数为2560个,为使重叠采样的信号片段包含完整的故障信息,选定重叠采样的信号采样点数为5120个,重叠采样窗口移动步长为1000,每种类别的原始振动信号重叠采样200次,共获得1400个样本信号;第六、选择cmor3-3小波作为基函数,对重叠采样的信号片段进行连续小波变换,将得到的小波时频图转化为3通道RGB、像素值为224×224的三通道真彩图,共7种类别,如图8所示;第七、将小波时频图转化为张量并进行归一化处理以构建二维张量集合,最终获得1400个维度大小为3×224×224的二维张量。
S603:将原始信号集的一维张量集合和二维张量集合以及所构建的融合数据集标签进行组合,并使用pytorch库中的Dataset类构建融合数据集,并将融合数据集划分为训练集、验证集和测试集;
该步骤中,原始信号集的一维张量集合以及二维张量集合与前述待测滚动轴承的一维张量集合以及二维张量集合的获得方式相同,此处不再赘述。
此外,融合数据集的标签是通过使用连续型数值变量(从0开始的连续整数)构建的,标签的种类数与滚动轴承状态类别数相同,每个标签对应一个包络谱张量、一个EMMD重构信号张量、一个VMD重构信号张量、一个小波时频图张量、一个马尔科夫变迁场张量以及一个格拉姆角场张量。
S604:预先设置一个较大的损失函数最小值,通过训练集对并行卷积神经网络进行训练,同时,在训练过程中利用验证集对并行卷积神经网络进行验证,每当验证集上的损失函数值小于预先设置的损失函数最小值,且训练集的损失函数仍在下降,令损失函数最小值等于此时验证集上的损失函数值并进行保存,并覆盖保存此时网络的模型参数,当训练结束后获得训练好的并行神经网络;
该步骤中,在利用训练集对并行神经网络进行训练之前,需要将训练集中的一维信号张量At m(t)、Ut m(t)和Vt m(t)赋予不同权重ρk并进行合并(由于包络分析、集成经验模态分解和变分模态分解对于每段信号并不能保证完全且准确地提取出所有故障特征,因此赋予以上三种方式处理后的信号不同的权重并对信号进行合并有助于避免特征提取时发生疏漏。),以获得一维融合张量xf(t),具体通下式进行合并:
xf(t)=ρ1At m(t)+ρ2Ut m(t)+ρ3Vt m(t)
其中,At m(t)为包络信号的张量;Ut m(t)为集成经验模态分解重构信号的张量;Vt m(t)为变分模态分解重构信号的张量。
另外,权重ρk的计算公式为:
其中,ρk为第k类张量对应的权重;kurk为第k类张量对应的峭度;为三种张量的峭度和。
在获得一维融合张量xf(t)后,还需要对其进行傅里叶变换和幅值归一化处理,使其只保留单边振幅谱即可获得每段信号采样点数为的频谱幅值张量序列g(t)。需要说明的是,通过傅里叶变换可以获取频谱特征,以便更好地提取特征,使得故障信号的频域特征相较于时域特征更为明显;通过幅值归一化处理,便于对频谱范围进行限制,从而能够避免奇异值影响并行神经网络收敛。
上述频谱幅值张量序列g(t)表示为:
其中,FFT表示快速傅里叶变换,abs表示取模运算,N为张量所包含的元素个数,表示信号张量xf(t)中第1个元素至第/>个元素之间所有的元素组成的张量序列。
在完成以上处理后,即可获得频谱张量g(t),然后再将频谱张量g(t)和由小波时频图、马尔科夫变迁场图和格拉姆角场图转化的三个二维张量及标签输入并行卷积神经网络中进行训练。
需要说明的是,在训练开始前,需要预先设置网络的最小损失函数值lossmin=103和总训练次数epoch和当前epoch次数k,记录每次训练集完成前向传播和反向传播后,神经网络在训练集损失函数值losstrain_k(k≤epoch)和验证集的损失函数值lossval_k(k≤epoch),并按照下式更新lossmin:
每次lossmin值发生改变时,覆盖保存当前并行卷积神经网络的参数,网络训练完成后即可获得全局最优的并行神经网络模型,否则需要调整网络超参数重新对网络进行训练。其中,该网络使用Adam优化算法更新网络的偏置和权重参数,Adam算法表示为:
mt=β1mt-1+(1-β1)gt
vt=β2vt-1+(1-β2)gt 2
其中,t为时间步长,初始化为0;gt为时间步长为t时的梯度;θ为待更新的参数;为参数θ的随机目标函数;β1,β2分别为一阶矩和二阶矩的指数衰减率;mt为对梯度的一阶矩估计;vt为对梯度的二阶矩估计;/>为对mt的矫正;/>为对vt的矫正;η为学习率;ε为维持数值稳定性而添加的常数。
并行卷积神经网络(PCNN)使用Adam优化算法更新网络的权值参数,Adam算法可用下式表示:
mt=β1mt-1+(1-β1)gt
vt=β2vt-1+(1-β2)gt 2
其中,t为时间步长,初始化为0;gt为时间步长为t时的梯度;θ为待更新的参数;为参数θ的随机目标函数;β1,β2分别为一阶矩和二阶矩的指数衰减率;mt为对梯度的一阶矩估计;vt为对梯度的二阶矩估计;/>为对mt的矫正;/>为对vt的矫正;η为学习率;ε为维持数值稳定性而添加的常数;
并行卷积神经网络(PCNN)使用交叉熵损失函数来计算训练过程中的损失,交叉熵损失函数的表达式如下:
其中,M为类别数,即正常状态与故障状态个数之和;p(xi)为第i类的真实分布(如果判断为该类则为1,否则为0),q(xi)为预测该类的概率。
S605:通过测试集对训练好的并行神经网络进行测试,若测试通过,则获得训练好的并行神经网络;否则需要调整超参数(例如增大学习率、增加网络迭代轮数等),对并行神经网络重新进行训练。
该步骤中,通过使用混淆矩阵评价模型判断并行神经网络测试是否通过,其中,混淆矩阵评价模型具体采用精确率(precision)和召回率作为评价指标:
精确率表示为:
召回率表示为:
其中,TP为真正类的数量,FP为假正类的数量,FN为假负类的数量。
通过使用该模型对网络测试进行判断,当精确率和召回率均超过99%时,则判断网络测试通过,否则需要调整超参数重新训练,直至达标。图11为混淆矩阵评价模型的示意图,该图中,所有状态类别的精确率和召回率均为100%,说明网络模型测试效果良好。
进一步的,还可以通过t分布-随机邻近嵌入(t-SNE)可视化模型的分类结果以对网络进行效果评价,t-SNE将数据点之间的相似性转换为联合概率,并试图最小化低维嵌入数据和高维数据联合概率之间的KL散度。当如图12所示的T-SEN可视化图像中同类型标签分布紧密,不同类别标签边界清晰时,即可认为网络分类效果良好。
另一个实施例中,并行卷积神经网络包括一维卷积神经网络和二维卷积神经网络,其中,如图3所示,一维卷积神经网络除全连接层外,其余层均由卷积层、批量归一化层、激活函数层和池化层构成。
需要说明的是,该一维卷积神经网络的第一层使用大卷积核,以提取待测滚动轴承的一维故障特征,大卷积核是通过深度学习优化得到的,其优点是可以智能化学习面向轴承故障诊断的特征参数,同时去除对诊断没有帮助的特征。为了增强该网络的表达能力,除第一层卷积核大小为128×1外,其余层卷积核大小均为3×1,具体如表3所示:
表3
此外,为了增加网络深度和抑制过拟合现象的发生,该一维卷积神经网络使用了较少的卷积核参数和BN层,最后进行最大池化操作,以提取一维张量特征。
此外,为了增加网络的深度,抑制过拟合现象的发生,卷积模块使用了较少的卷积核参数和BN层,最后进行最大池化操作,提取一维张量特征。
二维卷积神经网络采用InceptionV1网络,该网络的核心为如图4所示的Inception模块,该模块将多个卷积核池化操作放在一起组装成一个网络模块,设计神经网络时,以模块为单位去组装整个网络结构。Inception结构设计了一个稀疏网络结构,但是能够产生稠密的数据,既能增加神经网络表现,实现多尺度特征融合;又能保证计算资源的使用效率。进一步的,为了使得网络实现自适应注意,使神经网络重点关注小波时频图中存在故障特征的部分,本实施例将Inception模块与SENet(Squeeze-and-ExcitationNetworks)相结合(如图5所示),在InceptionV1网络中增加了注意力机制。
Inception模块通过采取以下几个措施使得密集的成分能够近似最优的稀疏结构。首先,在同一层中采用了不同大小的卷积核来提取上一层的特征,并在最后进行拼接。意味着在同一层中网络能感受不同大小的图像局部区域,并对不同尺度的特征进行融合。卷积核大小普遍采用1、3和5,再设定卷积步长为1,只要图像的填充值(padding)分别设置为0、1、2,那么卷积之后便可以得到相同维度的特征,之后便可以将这些特征值直接拼接在一起。此外,由于池化层在很多网络中都起到相当大的作用,因此在Inception模块中也嵌入了这一操作。最后由于神经网络随着深度的增加所提取的特征也逐渐抽象,每个特征涉及到更大的感受区域,因此在网络的深层应该逐渐增加大尺寸卷积核的比例。Inception结构总共有4个分支,输入的特征图并行的通过这四个分支得到四个输出,然后再将这四个输出在深度维度进行拼接,以得到最终输出,因此,Inception模块的结构参数如表4所示:
表4
以上,由一维卷积神经网络和InceptionV1网络就构成了如图6所示的并行卷积神经网络,其中,InceptionV1网络输出的张量,与一维卷积神经网络输出长度的张量进行合并,经过全连接层后输出最终结果。
下面,本公开选择了一维卷积神经网络WDCNN和二维卷积神经网络Resnet50与本公开所提出的并行卷积神经网络进行对比以说明并行卷积神经网络与现有卷积神经网络对于滚动轴承故障诊断的差异性。
具体的,将包络信号张量和连续型数值变量标签(从0开始的连续整数)使用pytorch库中的Dataset类构建7分类的一维数据集;将此数据集划分训练集和验证集,对一维卷积神经网络WDCNN进行训练和评估;
将格拉姆角场图张量和连续型数值变量标签(从0开始的连续整数)使用pytorch库中的Dataset类构建7分类的二维数据集;将此数据集划分训练集和验证集,对二维卷积神经网络Resnet50进行训练和评估。
并行卷积神经网络PCNN使用本公开中的融合数据集进行训练和评估。
三种神经网络均使用adam优化器,学习率设置为1e-5,记录网络在训练集和验证集上的准确率。
此外,以上不同卷积神经网络在验证集上的诊断准确率如图13所示,根据图13,可得各卷积神经网络在验证集上的准确率如表5所示:
表5
网络名称 | WDCNN | ResNet50 | PCNN |
准确率(%) | 93.39 | 99.82 | 99.94 |
此外,以上不同卷积神经网络在验证集上的诊断准确率如图14所示,根据图14,可得各卷积神经网络在验证集上的准确率如表6所示:
表6
网络名称 | WDCNN | ResNet50 | PCNN |
准确率(%) | 87.50 | 75.0 | 99.87 |
三种神经网络在训练集和验证集的准确率表明本公开所提出的并行卷积神经网络相比现有的卷积神经网络,无论是在训练集还是在验证集上,对于待测滚动轴承的故障诊断均获得了最高准确率。
另一个实施例中,本公开还提供一种基于并行卷积神经网络的滚动轴承故障诊断装置,包括:
采集模块,用于采集待测滚动轴承的原始振动信号Xio(t);
预处理模块,用于对原始振动信号Xio(t)进行预处理,以获得预处理后的振动信号Xi(t);
第一采样模块,用于对预处理后的振动信号Xi(t)进行第一次重叠采样,以获得第一样本信号xm(t);
第二采样模块,用于对预处理后的振动信号Xi(t)进行第二次重叠采样,以获得第二样本信号ym(t);
张量集合获取模块,用于基于第一样本信号xm(t)和第二样本信号ym(t)分别获得待测滚动轴承的一维张量集合和二维张量集合;
诊断模块,用于基于待测滚动轴承的一维张量集合和二维张量集合构建融合数据集并输入训练好的并行卷积神经网络,以识别待测滚动轴承的故障。
另一个实施例中,本公开还提供一种计算机存储介质,包括:
存储器,用于存储多条计算机指令;
处理器,用于执行计算机指令以实现如前任一所述的方法。
上述实施例只为说明本公开的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本公开的内容并据以实施,并不能以此限制本公开的保护范围。凡根据本公开精神实质所作的等效变化或修饰,都应涵盖在本公开的保护范围之内。
Claims (30)
1.一种基于并行卷积神经网络的滚动轴承故障诊断方法,包括如下步骤:
S100:采集待测滚动轴承的原始振动信号Xio(t);
S200:对原始振动信号Xio(t)进行预处理,获得预处理后的振动信号Xi(t);
S300:对预处理后的振动信号Xi(t)进行第一次重叠采样,以获得第一样本信号xm(t);
S400:对预处理后的振动信号Xi(t)进行第二次重叠采样,以获得第二样本信号ym(t);
S500:基于第一样本信号xm(t)和第二样本信号ym(t)分别获得待测滚动轴承的一维张量集合和二维张量集合;
S600:基于待测滚动轴承的一维张量集合和二维张量集合构建融合数据集并输入训练好的并行卷积神经网络,以识别待测滚动轴承的故障。
2.根据权利要求1所述的方法,其中,优选的,步骤S200中,所述对原始振动信号Xio(t)进行预处理包括如下步骤:
S201:去除原始振动信号Xio(t)中的直流分量;
S202:对去除直流分量后的原始振动信号Xio(t)进行归一化。
3.根据权利要求2所述的方法,其中,步骤S201中,通过下式去除原始振动信号Xio(t)中的直流分量:
其中,Xi(t)表示去除直流分量后的原始振动信号,Xio(t)表示原始振动信号,Xio(t)k表示原始振动信号Xio(t)中第k个采样点对应的幅值,len(Xio(t))表示原始振动信号Xio(t)中采样点的个数,io表示原始振动信号Xio(t)的数据序列号,t表示原始振动信号Xio(t)的时间序列。
4.根据权利要求1所述的方法,其中,步骤S202中,通过下式对去除直流分量后的原始振动信号Xi(t)进行归一化:
且
其中,MIN(Xi(t))表示极小值化处理,σ表示缩放因子,Xi(t)max表示Xi(t)中的最大值,Xi(t)min表示Xi(t)中的最小值。
5.根据权利要求1所述的方法,其中,步骤S300中,通过采用滑动窗口对预处理后的振动信号进行第一次重叠采样。
6.根据权利要求5所述的方法,其中,所述滑动窗口的位置通过下式计算:
其中,Ntotal表示预处理后的振动信号Xi(t)的采样点个数,Ntotal[(m-1)(L+step),mL+(m-1)step]表示第(m-1)(L+step)个采样点至mL+(m-1)step个采样点之间的所有采样点,L表示滑动窗口的长度,step表示滑动窗口的步长,xm(t)表示第一样本信号,m表示第一样本信号xm(t)的序号。
7.根据权利要求6所述的方法,其中,所述预处理后的振动信号Xi(t)的采样点个数通过下式计算:
其中,k表示长度系数,默认取k=2,n表示轴承转速,表示采样间隔,Z表示正整数。
8.根据权利要求1所述的方法,其中,步骤S500中,所述基于第一样本信号xm(t)获得待测滚动轴承的一维张量集合包括以下步骤:
S501:对第一样本信号xm(t)进行希尔伯特变换,并计算第一样本信号xm(t)的包络信号Am(t);
S502:对第一样本信号xm(t)进行集成经验模态分解,获得分解后的模态分量ui(t),并根据相关系数α对模态分量ui(t)进行重构,得到重构信号Um(t);
S503:对第一样本信号xm(t)进行变分模态分解,获得分解后的模态分量vi(t),并根据相关系数β对模态分量vi(t)进行重构,得到重构信号Vm(t);
S504:将包络信号Am(t)、重构信号Ui(t)和重构信号Vi(t)分别转化为一维信号张量At m(t)、Ut m(t)和Vt m(t),并将相同类别的信号张量在指定维度dim=0进行堆叠,分别获得一维张量集合T1、T2和T3。
9.根据权利要求8所述的方法,其中,步骤S501中,通过下式对第一样本信号xm(t)进行希尔伯特变换:
其中,em(t)表示第一样本信号xm(t)经过希尔伯特变换后得到的信号,t表示时间,τ表示积分变量,m表示第一样本信号xm(t)的序号。
10.根据权利要求9所述的方法,其中,步骤S501中,通过以下方式计算第一样本信号xm(t)的包络信号Am(t):
以第一样本信号xm(t)为实部,以希尔伯特变换后的信号em(t)为虚部,构建第m个样本信号xm(t)的解析信号αm(t):
αm(t)=xm(t)+jem(t)
取解析信号αm(t)的幅值作为包络信号Am(t),即
其中,xm(t)表示第一样本信号,em(t)表示第一样本信号xm(t)经过希尔伯特变换后的信号。
11.根据权利要求8所述的方法,其中,步骤S502中,通过下式对第一样本信号xm(t)进行集成经验模态分解:
其中,ui(t)表示集成经验模态分解后的模态分量,i表示分解得到的第i个模态分量,n表示分解次数,rn(t)表示残差。
12.根据权利要求8所述的方法,其中,步骤S502中,所述相关系数α通过下式计算:
其中,表示模态分量ui(t)的平均值,/>表示第一样本信号xm(t)的平均值,std表示求标准差运算;
所述重构信号Um(t)由相关系数α>0.4的模态分量ui(t)相加获得,即
其中,t表示有t个相关系数α>0.4的模态分量。
13.根据权利要求8所述的方法,其中,步骤S503中,通过构建带约束的变分模型对第一样本信号xm(t)进行变分模态分解。
14.根据权利要求13所述的方法,其中,所述带约束的变分模型表示为:
其中,{vi(t)}表示变分模态分解后的第i个内涵模态分量,I表示分解信号个数,{ωi}表示内涵模态分量对应的中心频率,δ(t)表示狄利克雷函数,*表示卷积运算,xm(t)表示第一样本信号,π表示圆周率,表示求导符号,j表示虚数单位。
15.根据权利要求8所述的方法,其中,步骤S503中,所述相关系数β通过下式计算:
其中,表示模态分量vi(t)的平均值,/>表示第一样本信号xm(t)的平均值,std表示求标准差运算;
所述重构信号Vm(t)由相关系数β>0.4的内涵模态分量vi(t)相加获得,即
其中,t表示有t个相关系数α>0.4的内涵模态分量。
16.根据权利要求1所述的方法,其中,步骤S400中,通过采用滑动窗口对归一化后的振动信号进行第二次重叠采样。
17.根据权利要求1所述的方法,其中,步骤S500中,所述基于第二样本信号ym(t)获得待测滚动轴承的二维张量集合包括以下步骤:
S5001:对第二样本信号ym(t)进行连续小波变换以获取对应的小波系数,并根据小波系数绘制小波时频图;
S5002:绘制马尔科夫变迁场图;
S5003:绘制格拉姆角场图;
S5004:分别将小波时频图、马尔科夫变迁场图和格拉姆角场图转化为二维张量,以获得待测滚动轴承的二维张量集合T4,T5和T6。
18.根据权利要求17所述的方法,其中,步骤S5001包括如下步骤:
S50011:使用python的小波分析工具包PyWavelets对第二信号样本ym(t)进行连续小波变换,以获得小波系数,具体为:
其中,WT(a,τ)表示小波系数,a表示尺度因子,τ表示时移因子,*表示共轭函数,Ψa,τ(t)表示小波基函数,t表示时间序列;
S50012:根据小波系数的时间序列t、实际频率序列f和小波系数的模abs(WT(a,τ))绘制小波时频图。
19.根据权利要求17所述的方法,其中,步骤S5001中,使用matplotlib绘图库中的pcolor函数根据小波的时间序列t、实际频率序列f和小波系数的模abs(WT(a,τ))绘制小波时频图。
20.根据权利要求19所述的方法,其中,所述小波的实际频率序列f通过下式计算:
scalef=Fs wcf
其中,scale表示小波f的尺度序列,Fs表示第二样本信号ym(t)的采样频率,wcf表示小波f的中心频率。
21.根据权利要求17所述的方法,其中,步骤S5002包括如下步骤:
S50021:基于一阶马尔可夫过程的时间顺序将第二信号样本ym(t)可视化为复杂网络,得到马尔科夫矩阵;
S50022:基于马尔科夫矩阵绘制马尔科夫变迁场图。
22.根据权利要求17所述的方法,其中,步骤S5003包括如下步骤:
S50031:将笛卡尔坐标系下的第二样本信号ym(t)规范化至区间[-1,1],并转化为极坐标系表示;
S50032:基于第二样本信号ym(t)规范后的极坐标表示并通过三角函数生成格拉姆角场矩阵G;
S50033:基于格拉姆角场矩阵G绘制格拉姆角场图。
23.根据权利要求22所述的方法,其中,步骤S50032中,所述格拉姆角场矩阵G表示为:
其中,表示第二样本信号ym(t)规范化后的时间序列点xn的极坐标。
24.根据权利要求1所述的方法,其中,所述并行卷积神经网络包括一维卷积神经网络和二维卷积神经网络,所述一维卷积神经网络包括全连接层、卷积层、批量归一化层、激活函数和池化层;所述二维卷积神经网络采用InceptionV1网络。
25.根据权利要求1所述的方法,其中,步骤S600中,所述并行卷积神经网络的训练包括如下步骤:
S601:分别采集健康轴承的健康信号和故障轴承的故障信号,再将故障信号根据不同的故障位置和故障程度进行分类,综合健康信号和分类后的故障信号获得原始信号集;
S602:获得原始信号集的一维张量集合和二维张量集合;
S603:将原始信号集的一维张量集合和二维张量集合以及融合数据集标签进行组合,以构建融合数据集,并将融合数据集划分为训练集、验证集和测试集;
S604:预先设置一个较大的损失函数最小值,通过训练集对并行卷积神经网络进行训练,同时,在训练过程中利用验证集对并行卷积神经网络进行验证,每当验证集上的损失函数值小于预先设置的损失函数最小值,且训练集的损失函数仍在下降,令损失函数最小值等于此时验证集上的损失函数值并进行保存,并覆盖保存此时网络的模型参数,当训练结束后获得训练好的并行神经网络;
S605:通过测试集对训练好的并行神经网络进行测试,若测试通过,则获得训练好的并行神经网络;否则需要调整超参数对并行神经网络重新进行训练。
26.根据权利要求25所述的方法,其中,步骤S605中,通过使用混淆矩阵和t分布-随机邻近嵌入评价模型的分类效果,以判断并行神经网络测试是否通过。
27.根据权利要求25所述的方法,其中,步骤S604中,在通过训练集对并行神经网络进行训练之前,需要将训练集中的一维信号张量At m(t)、Ut m(t)和Vt m(t)赋予不同权重ρk并通过下式进行合并,以获得一维融合张量xf(t):
xf(t)=ρ1At m(t)+ρ2Ut m(t)+ρ3Vt m(t)
其中,At m(t)为包络信号的张量;Ut m(t)为集成经验模态分解重构信号的张量;Vt m(t)为变分模态分解重构信号的张量。
28.根据权利要求27所述的方法,其中,所述权重ρk通过下式计算:
其中,ρk为第k类张量对应的权重;kurk为第k类张量对应的峭度;为三种张量的峭度和。
29.一种基于并行卷积神经网络的滚动轴承故障诊断装置,包括:
采集模块,用于采集待测滚动轴承的原始振动信号Xio(t);
预处理模块,用于对原始振动信号Xio(t)进行预处理,以获得预处理后的振动信号Xi(t);
第一采样模块,用于对预处理后的振动信号Xi(t)进行第一次重叠采样,以获得第一样本信号xm(t);
第二采样模块,用于对预处理后的振动信号Xi(t)进行第二次重叠采样,以获得第二样本信号ym(t);
张量集合获取模块,用于基于第一样本信号xm(t)和第二样本信号ym(t)分别获得待测滚动轴承的一维张量集合和二维张量集合;
诊断模块,用于基于待测滚动轴承的一维张量集合和二维张量集合构建融合数据集并输入训练好的并行卷积神经网络,以识别待测滚动轴承的故障。
30.一种计算机存储介质,包括:
存储器,用于存储多条计算机指令;
处理器,用于执行计算机指令以实现权利要求1至28任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310406829.0A CN116522237A (zh) | 2023-04-17 | 2023-04-17 | 一种基于并行卷积神经网络的滚动轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310406829.0A CN116522237A (zh) | 2023-04-17 | 2023-04-17 | 一种基于并行卷积神经网络的滚动轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116522237A true CN116522237A (zh) | 2023-08-01 |
Family
ID=87396797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310406829.0A Pending CN116522237A (zh) | 2023-04-17 | 2023-04-17 | 一种基于并行卷积神经网络的滚动轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116522237A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117969092A (zh) * | 2024-03-29 | 2024-05-03 | 山东天工岩土工程设备有限公司 | 一种盾构机主轴承的故障检测方法、设备及介质 |
-
2023
- 2023-04-17 CN CN202310406829.0A patent/CN116522237A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117969092A (zh) * | 2024-03-29 | 2024-05-03 | 山东天工岩土工程设备有限公司 | 一种盾构机主轴承的故障检测方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | SuperGraph: Spatial-temporal graph-based feature extraction for rotating machinery diagnosis | |
Wang et al. | A new intelligent bearing fault diagnosis method using SDP representation and SE-CNN | |
Chen et al. | Intelligent fault diagnosis for rotary machinery using transferable convolutional neural network | |
Hakim et al. | A systematic review of rolling bearing fault diagnoses based on deep learning and transfer learning: Taxonomy, overview, application, open challenges, weaknesses and recommendations | |
Li et al. | Gearbox fault diagnosis based on deep random forest fusion of acoustic and vibratory signals | |
Dixit et al. | Intelligent condition-based monitoring of rotary machines with few samples | |
CN109555566B (zh) | 一种基于lstm的汽轮机转子故障诊断方法 | |
CN112183581A (zh) | 基于自适应迁移神经网络的半监督机械故障诊断方法 | |
CN111523081B (zh) | 一种基于增强门控循环神经网络的航空发动机故障诊断方法 | |
CN112294341B (zh) | 一种基于轻量卷积神经网络的睡眠脑电纺锤波识别方法及系统 | |
CN108435819B (zh) | 一种铝型材挤压机能耗异常检测方法 | |
CN113203566A (zh) | 一种基于一维数据增强和cnn的电机轴承故障诊断方法 | |
CN116593157A (zh) | 少样本下基于匹配元学习的复杂工况齿轮故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN116522237A (zh) | 一种基于并行卷积神经网络的滚动轴承故障诊断方法 | |
Li et al. | A novel data-driven fault feature separation method and its application on intelligent fault diagnosis under variable working conditions | |
Zhang et al. | Intelligent machine fault diagnosis using convolutional neural networks and transfer learning | |
Huang et al. | An intelligent compound fault diagnosis method using one-dimensional deep convolutional neural network with multi-label classifier | |
Zhao et al. | A novel deep fuzzy clustering neural network model and its application in rolling bearing fault recognition | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN113865872B (zh) | 基于小波包重构成像和cnn的轴承故障诊断方法 | |
Zhao et al. | Bearing fault diagnosis based on mel frequency cepstrum coefficient and deformable space-frequency attention network | |
Cabrera et al. | Adversarial Fault Detector Guided by One-Class Learning for a Multistage Centrifugal Pump | |
CN113790890A (zh) | 基于小波包分解权值模糊熵与elm的轴承故障分类方法及装置 | |
CN116383661A (zh) | 离心泵故障诊断模型训练方法、故障诊断方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |