CN113111820A - 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置 - Google Patents
基于改进cnn与关系模块的旋转部件故障诊断方法及其装置 Download PDFInfo
- Publication number
- CN113111820A CN113111820A CN202110432723.9A CN202110432723A CN113111820A CN 113111820 A CN113111820 A CN 113111820A CN 202110432723 A CN202110432723 A CN 202110432723A CN 113111820 A CN113111820 A CN 113111820A
- Authority
- CN
- China
- Prior art keywords
- module
- fault
- fault diagnosis
- training
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了基于改进CNN与关系模块的旋转部件故障诊断方法,构建故障诊断元数据集,并按故障类别划分为训练集和测试集;对原数据集样本进行快速傅里叶变换;使用多尺度卷积核、随机池化、空洞卷积三种策略建立由提取模块、融合模块和关系模块组成的卷积神经网络诊断模型;采用元学习方法使用训练集来训练该模型;使用测试集对训练好的模型进行小样本的多分类旋转部件故障诊断。本发明能够通过自适应训练出样本间距离的衡量标准,利用元学习的特点对只有一个标记样本的新故障能够实现其快速诊断,从而解决了传统方法依赖大数据量和长时间训练的问题,切实解决了小样本条件下的新故障跨域诊断的问题。
Description
技术领域
本发明涉及机械设备故障诊断领域,具体涉及一种基于改进CNN与关系模块的旋转部件尤其是旋转机械部件的故障诊断方法及其故障诊断装置。
背景技术
由于现代工业的快速发展,旋转机械被广泛应用于航海、机械、化工等领域。如果关键设备发生故障,会造成难以预计的损失,因此,对于旋转机械的故障诊断具有非常大的意义。现有的深度学习方法广泛应用于旋转机械旋转部件故障诊断领域并取得了很好的效果,然而还面临以下两个问题,(1)大多数机械设备在正常的状态下运行,故障数据相对来说很难获取,但是训练深度学习模型需要大量的标记数据,其次,旋转机械经常在变工况条件运行,这将会导致样本之间的差异性,因此,使用少样本去重新训练模型具有一定的挑战性。(2)在机械运行的过程中新故障的产生是未知的,新故障的判断需要专家进行诊断识别,因此,故障的样本是有限的。当每次有新故障产生时,模型都需要大量数据进行训练这无疑是需要消耗人力和时间。基于此,有必要开展针对由新故障带来的多分类,小样本和跨域问题的机械设备故障诊断的研究。
发明内容
本发明的目的在于克服上述的不足,提供一种基于改进CNN和关系模块的旋转部件故障诊断方法,能够有效地提取故障信息的特征并进行更好的融合,采用关系模块可以对故障类型进行分类,摆脱了传统方法对于样本量大小过于依赖的问题,元学习方法的使用解决了新故障带来的多分类和跨域问题,该故障智能诊断方法具有较高的识别精度。
为了达到上述目的,本发明一种基于改进CNN和关系模块的旋转部件故障诊断方法,包括以下步骤:
步骤一,采集旋转部件在不同故障类型下的振动信号,对获取到的振动信号进行去均值处理,然后进行短时傅里叶变换,得到一维数据,构建故障数据集,并划分为训练集Tr和测试集Te,其中训练集和测试集的故障类别不同;所述去均值处理的表达式如下:
x(n)=x-xmean
式中,x(n)为每条去均值后的样本数据的时域信号;x为获取到的振动信号,xmean为振动信号的均值;
短时傅里叶的计算表达式如下:
式中,x(n)为每个去均值后的样本数据的时域信号;n为每个时频谱图中像素点的个数;
步骤二,建立旋转部件故障诊断模型,所述旋转部件故障诊断模型包括基于多尺度卷积的提取模块、基于随机池化和空洞卷积的融合模块以及用于自适应学习度量的关系模块;其中所述多尺度卷积从左到右的结构具体数学表达式如下:
式中,三个分支的输出为和W1,W2和W3为三个分支相关的权重,和为三个分支相关的偏置权重,f为整流线性激活函数即Relu函数,xl+1为多尺度卷积输出的特征,Concatenate函数为连接函数,是pytorch下的一个内置函数;
空洞卷积感受野的计算表达式如下:k′=k+(k-1)×d
式中,k代表空洞卷积的卷积核的大小,d代表膨胀率,k′代表空洞卷积感受野的大小;
在随机池化中,首先计算每个元素xi的概率pi,根据概率pi选择随机池化区域中的一个位置k的元素xk作为最后的输出,计算表达式如下:
∑pi=1
PS=xk,wherek~P(p1,…pi)
步骤三,对于步骤二建立的旋转部件故障诊断模型,对所述故障诊断模型进行训练,每轮训练需要对步骤一得到的训练集随机抽取故障类别构成子任务作为模型的输入,子任务包括支持集和查询集;
步骤四,利用基于多尺度卷积的提取模块对子任务进行数据特征的提取,获取子任务下每个样本的故障特征信息;
步骤五,通过带有随机池化和空洞卷积的融合模块,利用步骤四提取的数据特征对故障诊断模型进行训练并更新融合模块的网络参数;
步骤六,利用步骤四和步骤五获得的提取模块和融合模块,得到划分好的子任务样本的数据特征,并对其进行特征拼接;
步骤七,通过自适应学习度量方法的关系模块,利用步骤六得到的已拼接的数据特征对故障诊断模型进行训练并更新关系模块的网络参数;
步骤八,对步骤二所建立的旋转部件故障诊断模型的各个子模块使用批归一化方法稳定训练过程;
步骤九,使用训练集的子任务对步骤四、步骤五、步骤六和步骤七的训练过程进行多次迭代,在训练过程中进行测试,在所设置的迭代次数内,取准确率的最大值作为最终的测试准确度;
步骤十,将测试准确度最高时的权重作为测试时提取模块、融合模块和关系模块的网络参数,利用步骤一得到的测试集进行测试,设置多组测试集分别进行测试,以模拟旋转部件故障类别数增加的情况;所述旋转部件故障诊断模型输出为每一条数据对应的不同运行状态的关系距离分数,取最大的关系距离分数作为该条数据的最终标签。
可优选的是,在步骤一中,对数据进行相同长度的分割,对数据进行快速傅里叶变换得到模型的一维输入样本,对输入样本进行去均值处理。
可优选的是,步骤二中的提取模块由两个Inception结构组成,每个Inception结构对特征进行提取。
可优选的是,步骤二中的融合模块由三个空洞卷积层和三个随机池化层构成,每个随机池化层连接于前三个空洞卷积层之后,融合模块用于融合提取模块所提取的特征。
可优选的是,步骤二中的关系模块由两个卷积层、两个池化层和两个全连接层构成卷积神经网络,每个池化层连接在每个卷积层之后,关系网络用来判断该故障特征与所有已标记故障样本特征的距离以确定所属类别。
可优选的是,在步骤三中,训练集和测试集的故障类别不同,每次迭代的子任务是随机抽取的,其类别数目与测试集的类别数目保持一致。迭代变化中的任务指的是N-wayK-shot任务,亦指N分类故障诊断任务。
可优选的是,在步骤四中,多尺度卷积的Inception结构从左至右由四种方法组成,依次是残差结构、1×1的卷积核、串联的1×1与1×3的卷积核和两个串联的1×3的卷积核。
可优选的是,在步骤六中,特征拼接采用连接函数,所述连接函数为Pytorch环境下的集成函数。
可优选的是,带有自适应度量的关系网络通过卷积神经网络判别支持集和查询集不同故障类别数据的关联程度,进而寻找出支持集和查询集关联程度最大的样本数据,并将关联程度最高的故障类别作为最终的识别结果。
本发明的第二方面,提供一种基于前述改进CNN和关系模块的旋转部件故障诊断方法的故障诊断装置,其包括以下模块:提取模块、融合模块和关系模块,其中所述提取模块用于面提取输入样本的数据特征;融合模块用于融合数据特征;关系模块用于评估样本间的距离以确定故障诊断类型。
与现有技术相比,本发明对机械信号进行短时傅里叶变换,得到其一维信号作为输入,使用多尺度卷积建立提取模块,能够有效地挖掘故障样本丰富的信息。利用空洞卷积和随机池化策略构建融合模块,提高输入特征的融合能力。本发明能够通过训练数据自适应地去学习度量样本间距离的衡量标准,无须使用固定的度量距离函数去人为的限定,可以获得较高的故障诊断准确率,从而摆脱了对大量训练数据的依赖性。本发明的测试集的类别可以逐渐增加,以模拟新故障的识别问题,这对于工业的实际应用具有很大的意义。本发明仅使用少量数据去训练,从而得到一个泛化能力强的网络模型。本发明的网络模型无须进行二次训练或多次训练,可以通过已训练好的最优权重直接应用于跨域的故障诊断。
附图说明
图1是基于改进CNN和关系模块的旋转部件故障诊断方法的流程框图。
图2是本发明提供的基于改进CNN与关系模块的元学习旋转部件故障诊断方法的神经网络结构图;
图3是本发明提供的基于改进CNN与关系模块的元学习旋转部件故障诊断方法的流程图;
图4是基于改进CNN与关系模块的元学习旋转部件故障诊断方法在8-way1-shot情况下的状态分类结果图。
具体实施方式
下面将结合附图1-4对本发明的技术方案做详细介绍。
如图1所示,本发明基于改进CNN和关系模块的旋转部件故障诊断方法包括以下步骤:
步骤一,采集旋转部件诸如机械装置中轴承在不同故障类型下的振动信号,对获取到的振动信号进行短时傅里叶变换,得到其一维数据的同时进行去均值处理,对获取到的振动信号进行去均值处理,然后进行短时傅里叶变换,最终得到其一维数据,构建故障数据集,并划分为训练集Tr和测试集Te,其中训练集和测试集的故障类别不同。
步骤二,建立旋转部件故障诊断模型,所述旋转部件故障诊断模型包括基于多尺度卷积的提取模块、基于随机池化和空洞卷积的融合模块和用于自适应学习度量的关系模块。模型使用S型激活函数和均方误差损失函数。
步骤三,对于步骤二建立的旋转部件故障诊断模型,对该模型进行训练。每轮训练需要对步骤一得到的训练集随机抽取故障类别构成子任务作为模型的输入,子任务包括支持集和查询集。
步骤四,利用基于多尺度卷积的提取模块对子任务进行数据特征提取,在提取模块中获取子任务下每个样本的故障特征信息;
步骤五,通过带有随机池化和空洞卷积的融合模块,利用步骤四提取的数据特征对故障诊断模型进行训练并更新融合模块的网络参数;
步骤六,利用步骤四和步骤五获得的提取模块和融合模块,得到划分好的子任务样本的数据特征,并对其进行特征拼接;
步骤七,通过自适应学习度量方法的关系模块,利用步骤六得到的已拼接的数据特征故障诊断模型进行训练并更新关系模块的网络参数;
步骤八,对步骤二所建立的智能故障诊断模型的各个子模块使用批归一化方法防止训练过拟合及稳定训练过程;
步骤九,使用训练集的子任务对步骤四、步骤五、步骤六和步骤七的训练过程进行多次迭代,在训练过程中进行测试,在所设置的迭代次数内,取准确率的最大值作为最终的测试准确度。
步骤十,将测试准确度最高时的权重作为测试时提取模块、融合模块和关系模块的网络参数,利用步骤一得到的测试集进行测试,设置四组多组测试集分别进行测试,以模拟实际工业中旋转部件故障类别数不断增加的情况。旋转部件故障诊断模型输出为每一条数据对应的不同运行状态的关系距离分数,取最大的关系距离分数作为该条数据的最终标签,从而进行故障诊断并输出故障诊断结果。
步骤一中,去均值处理的表达式如下:
x(n)=x-xmean
式中,x(n)为每条去均值后的样本数据的时域信号;x为获取到的振动信号,xmean为振动信号的均值。
使用短时傅里叶变换的计算表达式如下:
式中,x(n)为每条样本数据的时域信号;n为每个时频谱图中像素点的个数。
步骤一中,样本去均值化处理的方法在于对样本的各个像素点减去样本像素点均值,这样可移除共同的部分凸显个体的差异。
步骤二中,提取模块由两个Inception结构组成,每个Inception结构对特征进行提取,Inception结构从左至右依次由残差结构、1×1的卷积核、串联的1×1与1×3的卷积核和两个串联的1×3的卷积核并联组成。两个串联的1×3的卷积核的视野与一个1×5的相同,但是却减少了模型的参数。由此,通过Inception结构的不同的卷积核实现对样本故障信息的多尺度提取。
步骤二中,融合模块由三个空洞卷积层和三个随机池化层构成,每个随机池化层连接于前三个空洞卷积层之后,融合模块用于融合提取模块所提取的特征。内部卷积核大小设置为1×7,膨胀率(空洞卷积的一个超参数)设置为1,通道数设置为48。空洞卷积的作用在于增大感受野尺寸,更大范围内地去融合长尺度特征。随机池化策略利用平均池化和最大池化的优势根据像素点的数值来计算各个像素点的概率,再根据概率值对其进行下采样。在平均的意义上,它类似于平均池化,在局部意义上,它遵循最大池化的准则。空洞卷积感受野的计算表达式如下:
k′=k+(k-1)×d
式中,k代表空洞卷积卷积核的大小,d代表膨胀率,k′代表空洞卷积感受野的大小。
在随机池化中,首先计算每个元素xi的概率pi,根据概率pi选择随机池化区域中的一个位置k的元素xk作为最后的输出,计算表达式如下:
∑pi=1
Ps=xk,wh erek~P(p1,…pi)
步骤二中,关系模块由两个卷积层、两个池化层和两个全连接层构成卷积神经网络,每个池化层连接在每个卷积层之后。卷积层的通道数为48,卷积核尺寸为1×3。关系网络用来判断该故障特征与所有已标记故障样本特征的距离以确定所属类别。
步骤三中,训练集和测试集的故障类别不同,每次迭代的任务子集是随机抽取的,其类别数目与测试集的类别数目保持一致。迭代变化中的任务指的是N-way K-shot任务,亦指N分类故障诊断任务
步骤六中,特征拼接采用连接函数将提取模块和融合模块所提取子任务下的不同故障类型的支持集和查询集的特征拼接起来,作为关系模块的下一步输入。
步骤七中,图2为基于改进CNN与关系模块的元学习旋转部件故障诊断方法的神经网络结构图,直观地给出了输入样本、提取模块、融合模块、关系模块以及故障诊断结果之间的关系。带有自适应度量的关系网络通过卷积神经网络判别支持集和查询集不同故障类别数据的关联程度,进而寻找出支持集和查询集关联程度最大的样本数据,并将关联程度最高的故障类别作为最终的识别结果。
带有自适应度量的关系网络的关联分数的计算结果如下:
式中,xi表示来自于支持集的样本数据,yi表示来自于查询集的样本数据,ri,j表示支持集和查询集的样本的关联程度,取关联程度最大的值最为最终分类结果,为含有多尺度卷积的提取模块和带有随机池化与空洞卷积的融合模块,为提取模块和融合模块的神经网络参数,为自适应度量距离的关系模块,为关系模块的参数,Concatenate为连接函数,C为测试集中的类别数,K为子任务下支持集单个故障类型的样本数。
经过S型函数,输出的关系分数在0到1的范围内。对于相同类别的支持集和查询集样本,其关系分数为1,对于不同类别的支持集和查询集,其关系分数为0.从这一点看,支持集样本和查询集样本的关系分数可以看作一个回归问题。采用最小均方差损失函数来更新网络参数,计算表达式如下:
Adam加速器被用来去更新网络梯度和参数,该方法将惯性保持和环境感知这两个优点集于一身。一方面,Adam加速器记录梯度的一阶矩,即过往梯度与当前梯度的平均,体现了惯性保持,另一方面,Adam加速器还记录梯度的二阶矩,即过往梯度与当前梯度平方的平均,体现了环境感知能力。一阶矩和二阶矩采用指数衰退平均技术,计算表达式为:
mt=β1mt-1+(1-β1)gt
其中,β1和β2为衰减系数,mt为一阶矩,vt为二阶矩。
另外,Adam加速器还考虑了mt,vt在零初始值情况下的偏置矫正,Adam加速器的更新表达式为:
其中,α为学习率;∈为平滑因子,一般取一个微小整数;θt为网络的权重矩阵。
步骤九中,所述的任务子集为N-way K-shot任务,在小样本的测试过程中,K设置为1。
步骤十中,利用训练集训练好的网络参数使用测试集进行测试,训练集和测试集的分类类比可以不同,转速、载荷和运行环境也可以不同。但是训练的过程中,训练集子任务的故障分类数目与测试集所需要的保持一致。当有新的故障发生时,利用专家知识确定故障类型,并将其放入测试集的支持集。当有同样的故障发生时,可以通过快速训练模型,利用仅有一个标签的新故障,就可以实现新故障的快速诊断,从而实现小样本情况下新故障诊断的目的
如图3所示,本发明提供的基于改进CNN与关系模块的元学习旋转部件故障诊断方法的流程图包括:1)收集在不同运行状态下的不同故障类型的振动数据并对其进行快速傅里叶变换;2)将数据划分为训练集和测试集,每一个训练集下有多个任务,每个任务被划分为支持集和查询集;3)多尺度卷积、随机池化、空洞卷积和自适应度量方法被结合用来设计所提出的方法;4)在训练的过程中,任务被随机抽取用于训练模型;5)使用测试集对已经训练好的模型进行测试。具体的实施步骤如下:
1.收集在不同运行状态下的不同故障类型的振动数据并对其进行快速傅里叶变换:
1.1不同故障类型的振动数据来源于帕德博恩大学旋转部件公开数据集。振动数据在驱动系统转速为1500rmp,试验旋转部件的径向力为1000N,传动系的负载扭矩为0.7nm的条件下测得;
1.2训练集中的故障旋转部件是由人为损坏获得,测试集中的故障旋转部件是由加速寿命试验获得;
1.3训练集的详细故障信息如表1所示;
表1训练集故障类型
注释:OR:内圈IR:外圈
1.4测试集的详细故障信息如表2所示;
表2测试集故障信息
注释:OR:外圈IR:内圈S:单次损伤R:反复损伤M:多次损伤
2.将数据划分为训练集和测试集,每一个训练集下有多个任务,每个任务被划分为支持集和查询集;
2.1对于训练集和测试集下的每个任务,每个故障类别的支持集样本大小为1(很少),查询集样本大小为30。
2.2每个样本代表一个信号序列,由1024个经过快速傅立叶变换的点组成。
2.3元学习可以看作是一个K-way C-shot问题,k表示类的数目,c表示故障类的样本数目。本发明为了验证新故障的识别问题,逐渐增加类别数目以模拟现实工业状况。
2.4与故障类型有关的测试集的划分如表3所示
表3测试集旋转部件故障类型
2.5以5-way和6-way为例,6-way比5-way多了一个新故障,但其余故障类型相同。通过故障类别的增加,来模拟实际工业中新故障产生模型识别的问题。
2.6对于6-way 1-shot问题,需要对测试集的6种故障类型进行分类。在训练过程中,每次episode从训练集中的九个类别中抽取六个作为的子任务去训练模型。每五轮episode之后,使用测试集来测试模型。训练过程中的episode设置为150,测试过程中的episode设置为30。对于训练集和测试集,每个任务下支持集中的样本数为6(1×6),查询集中的样本数为180(30×6)。
3.多尺度卷积、随机池化、空洞卷积和自适应度量方法被结合用来设计所提出的方法:
3.1提取模块由两个Inception结构组成,每个Inception结构对特征进行提取,Inception结构从左至右依次由残差结构、1×1的卷积核、串联的1×1与1×3的卷积核和两个串联的1×3的卷积核并联组成。两个串联的1×3的卷积核的视野与一个1×5的相同,但是却减少了模型的参数。由此,通过Inception结构的不同的卷积核实现对样本故障信息的多尺度提取;
3.2融合模块由三个空洞卷积层和三个随机池化层构成,每个随机池化层连接于前两个空洞卷积层之后,融合模块用于融合提取模块所提取的特征。内部卷积核大小设置为1×7,膨胀率(空洞卷积的一个超参数)设置为1,通道数设置为48。空洞卷积的作用在于增大感受野尺寸,更大范围内地去融合长尺度特征。随机池化策略利用平均池化和最大池化的优势根据像素点的数值来计算各个像素点的概率,再根据概率值对其进行下采样。在平均的意义上,它类似于平均池化,在局部意义上,它遵循最大池化的准则。空洞卷积感受野的计算表达式如下:
k′=k+(k-1)×d
式中,k代表空洞卷积的卷积核的大小,d代表膨胀率,k′代表空洞卷积感受野的大小。
在随机池化中,首先计算每个元素xi的概率pi,根据概率pi选择随机池化区域中的一个位置k的元素xk作为最后的输出,计算表达式如下:
∑pi=1
PS=xk,wh erek~P(p1,…pi)
3.3特征拼接采用连接函数将提取模块和融合模块所提取子任务下的不同故障类型的支持集和查询集的特征拼接起来,作为关系模块的下一步输入;
3.4关系模块由两个卷积层、两个池化层和两个全连接层构成卷积神经网络,每个池化层连接在每个卷积层之后。卷积层的通道数为48,卷积核尺寸为1×3。关系网络用来判断该故障特征与所有已标记故障样本特征的距离以确定所属类;
4.在训练的过程中,任务被随机抽取用于训练模型:
4.1训练集和测试集的故障类别不同,每次迭代的任务子集是随机抽取的,其类别数目与测试集的类别数目保持一致。迭代变化中的任务指的是N-way K-shot任务,亦指N分类故障诊断任务;
4.2带有自适应度量的关系网络通过卷积神经网络判别支持集和查询集不同故障类比数据的关联程度,进而寻找出支持集和查询集关联程度最大的样本数据,并将关联程度最高的故障类别作为最终的识别结果。
带有自适应度量的关系网络的关联分数的计算结果如下:
式中,xi表示来自于支持集的样本数据,yi表示来自于查询集的样本数据,ri,j表示支持集和查询集的样本的关联程度,取关联程度最大的值最为最终分类结果,为含有多尺度卷积的提取模块和带有随机池化与空洞卷积的融合模块,为提取模块和融合模块的神经网络参数,为自适应度量距离的关系模块,为关系模块的参数,Concatenate为连接函数,C为测试集中的类别数,K为子任务下支持集单个故障类型的样本数。
4.3经过S型函数,输出的关系分数在0到1的范围内。对于相同类别的支持集和查询集样本,其关系分数为1,对于不同类别的支持集和查询集,其关系分数为0.从这一点看,支持集样本和查询集样本的关系分数可以看作一个回归问题。采用最小均方差损失函数来更新网络参数,计算表达式如下:
4.4Adam加速器被用来去更新网络梯度和参数,该方法将惯性保持和环境感知这两个优点集于一身。一方面,Adam加速器记录梯度的一阶矩,即过往梯度与当前梯度的平均,体现了惯性保持,另一方面,Adam加速器还记录梯度的二阶矩,即过往梯度与当前梯度平方的平均,体现了环境感知能力。一阶矩和二阶矩采用指数衰退平均技术,计算表达式为:
mt=β1mt-1+(1-β1)gt
其中,β1和β2为衰减系数,mt为一阶矩,vt为二阶矩。
另外,Adam加速器还考虑了mt,vt在零初始值情况下的偏置矫正,Adam加速器的更新表达式为:
其中,α为学习率;∈为平滑因子,一般取一个微小整数;θt为网络的权重矩阵。
5.使用测试集对已经训练好的模型进行测试。
5.1通过与七种方法的比较,验证了该方法的有效性。每种方法运行10次,平均故障诊断准确度如表4所示。
表4不同方法的故障诊断准确率比较
注释:多尺度卷积(MCK)不使用多尺度卷积(NMCK)
随机池化(SP)最大池化(MP)平均池化(AP)
空洞卷积(DC)不使用空洞卷积(NDC)
5.2图4为基于改进CNN与关系模块的元学习旋转部件故障诊断方法在8-way 1-shot情况下的状态分类结果图。
本发明的第二方案,提供一种基于前述改进CNN和关系模块的旋转部件故障诊断方法的故障诊断装置,其包括以下模块:提取模块、融合模块和关系模块,其中所述提取模块用于面提取输入样本的数据特征;融合模块用于融合数据特征;关系模块用于评估样本间的距离以确定故障诊断类型。
本发明的方法实现了基于元学习的旋转部件故障诊断方法及其装置,该发明使用较少的数据集就能实现模型的训练,训练出一种自适应的样本度量方法。对于单标记新故障样本,网络能够快速通过元学习方法进行适应并诊断,提高了小样本数据下机械设备的故障诊断能力。
最后需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离发明及所附的权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
以上所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (10)
1.一种基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,包括以下步骤:
步骤一,采集旋转部件在不同故障类型下的振动信号,对获取到的振动信号进行去均值处理,然后进行短时傅里叶变换,得到一维数据,构建故障数据集,并划分为训练集Tr和测试集Te,其中训练集和测试集的故障类别不同;所述去均值处理的表达式如下:
x(n)=x-xmean
式中,x(n)为每条去均值后的样本数据的时域信号;x为获取到的振动信号,xmean为振动信号的均值;
短时傅里叶的计算表达式如下:
式中,x(n)为每个去均值后的样本数据的时域信号;n为每个时频谱图中像素点的个数;
步骤二,建立旋转部件故障诊断模型,所述旋转部件故障诊断模型包括基于多尺度卷积的提取模块、基于随机池化和空洞卷积的融合模块以及用于自适应学习度量的关系模块;其中所述多尺度卷积从左到右的结构具体数学表达式如下:
式中,三个分支的输出为和W1,W2和W3为三个分支相关的权重,和为三个分支相关的偏置权重,f为整流线性激活函数即Relu函数,xl+1为多尺度卷积输出的特征,Concatenate函数为连接函数,是pytorch下的一个内置函数;
空洞卷积感受野的计算表达式如下:k′=k+(k-1)×d
式中,k代表空洞卷积的卷积核的大小,d代表膨胀率,k′代表空洞卷积感受野的大小;
在随机池化中,首先计算每个元素xi的概率pi,根据概率pi选择随机池化区域中的一个位置k的元素xk作为最后的输出,计算表达式如下:
∑pi=1
PS=xk,where k~P(p1,…pi)
步骤三,对于步骤二建立的旋转部件故障诊断模型,对所述故障诊断模型进行训练,每轮训练需要对步骤一得到的训练集随机抽取故障类别构成子任务作为模型的输入,子任务包括支持集和查询集;
步骤四,利用基于多尺度卷积的提取模块对子任务进行数据特征的提取,获取子任务下每个样本的故障特征信息;
步骤五,通过带有随机池化和空洞卷积的融合模块,利用步骤四提取的数据特征对故障诊断模型进行训练并更新融合模块的网络参数;
步骤六,利用步骤四和步骤五获得的提取模块和融合模块,得到划分好的子任务样本的数据特征,并对其进行特征拼接;
步骤七,通过自适应学习度量方法的关系模块,利用步骤六得到的已拼接的数据特征对故障诊断模型进行训练并更新关系模块的网络参数;
步骤八,对步骤二所建立的旋转部件故障诊断模型的各个子模块使用批归一化方法稳定训练过程;
步骤九,使用训练集的子任务对步骤四、步骤五、步骤六和步骤七的训练过程进行多次迭代,在训练过程中进行测试,在所设置的迭代次数内,取准确率的最大值作为最终的测试准确度;
步骤十,将测试准确度最高时的权重作为测试时提取模块、融合模块和关系模块的网络参数,利用步骤一得到的测试集进行测试,设置多组测试集分别进行测试,以模拟旋转部件故障类别数增加的情况;所述旋转部件故障诊断模型输出为每一条数据对应的不同运行状态的关系距离分数,取最大的关系距离分数作为该条数据的最终标签。
2.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,步骤一中,对数据进行相同长度的分割,对数据进行快速傅里叶变换得到模型的一维输入样本,对输入样本进行去均值处理。
3.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,步骤二中的提取模块由两个Inception结构组成,每个Inception结构对特征进行提取。
4.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,步骤二中的融合模块由三个空洞卷积层和三个随机池化层构成,每个随机池化层连接于前三个空洞卷积层之后,融合模块用于融合提取模块所提取的特征。
5.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,步骤二中的关系模块由两个卷积层、两个池化层和两个全连接层构成卷积神经网络,每个池化层连接在每个卷积层之后,关系网络用来判断该故障特征与所有已标记故障样本特征的距离以确定所属类别。
6.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,在步骤三中,训练集和测试集的故障类别不同,每次迭代的子任务是随机抽取的,其类别数目与测试集的类别数目保持一致。迭代变化中的任务指的是N-way K-shot任务,亦指N分类故障诊断任务。
7.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,在步骤四中,多尺度卷积的Inception结构从左至右由四种方法组成,依次是残差结构、1×1的卷积核、串联的1×1与1×3的卷积核和两个串联的1×3的卷积核。
8.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,在步骤六中,特征拼接采用连接函数,所述连接函数为Pytorch环境下的集成函数。
9.根据权利要求1所述的基于改进CNN和关系模块的旋转部件故障诊断方法,其特征在于,带有自适应度量的关系网络通过卷积神经网络判别支持集和查询集不同故障类别数据的关联程度,进而寻找出支持集和查询集关联程度最大的样本数据,并将关联程度最高的故障类别作为最终的识别结果。
10.一种根据权利要求1-9之一所述的基于改进CNN和关系模块的旋转部件故障诊断方法的故障诊断装置,其特征在于,其包括以下模块:提取模块、融合模块和关系模块,其中所述提取模块用于面提取输入样本的数据特征;融合模块用于融合数据特征;关系模块用于评估样本间的距离以确定故障诊断类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110432723.9A CN113111820B (zh) | 2021-04-21 | 2021-04-21 | 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110432723.9A CN113111820B (zh) | 2021-04-21 | 2021-04-21 | 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113111820A true CN113111820A (zh) | 2021-07-13 |
CN113111820B CN113111820B (zh) | 2022-05-13 |
Family
ID=76719137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110432723.9A Active CN113111820B (zh) | 2021-04-21 | 2021-04-21 | 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111820B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569486A (zh) * | 2021-07-30 | 2021-10-29 | 安徽容知日新科技股份有限公司 | 一种工业设备的故障检测方法、计算设备及可读存储介质 |
CN113627317A (zh) * | 2021-08-06 | 2021-11-09 | 安徽工业大学 | 一种基于单样本学习的电机轴承故障诊断方法 |
CN113688875A (zh) * | 2021-07-29 | 2021-11-23 | 中国船舶重工集团公司第七一九研究所 | 工业系统故障识别方法及装置 |
CN114295981A (zh) * | 2022-01-05 | 2022-04-08 | 湖南师范大学 | 一种基于rn网络电流多特征形态识别的电机故障诊断方法 |
CN114417931A (zh) * | 2022-01-21 | 2022-04-29 | 石家庄铁道大学 | 一种基于原型网络的轴承故障诊断方法 |
CN115560274A (zh) * | 2022-10-14 | 2023-01-03 | 慈溪市远辉照明电器有限公司 | 一种易接线型三防灯 |
CN116597167A (zh) * | 2023-06-06 | 2023-08-15 | 中国人民解放军92942部队 | 一种永磁同步电机小样本退磁故障诊断方法、存储介质及系统 |
CN116990648A (zh) * | 2023-09-26 | 2023-11-03 | 北京科技大学 | 基于一维空洞卷积神经网络的故障电弧检测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516305A (zh) * | 2019-07-26 | 2019-11-29 | 西安交通大学 | 基于注意机制元学习模型的小样本下故障智能诊断方法 |
CN111721536A (zh) * | 2020-07-20 | 2020-09-29 | 哈尔滨理工大学 | 一种改进模型迁移策略的滚动轴承故障诊断方法 |
CN111931826A (zh) * | 2020-07-20 | 2020-11-13 | 华南理工大学 | 基于多尺度卷积迁移模型的滚动轴承故障诊断方法和系统 |
CN111964908A (zh) * | 2020-08-17 | 2020-11-20 | 天津大学 | 一种基于mwdcnn的变工况下轴承故障诊断方法 |
CN112084974A (zh) * | 2020-09-14 | 2020-12-15 | 北京工商大学 | 一种基于元学习的多标签滚动轴承故障诊断方法 |
CN112561910A (zh) * | 2020-12-28 | 2021-03-26 | 中山大学 | 一种基于多尺度特征融合的工业表面缺陷检测方法 |
-
2021
- 2021-04-21 CN CN202110432723.9A patent/CN113111820B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516305A (zh) * | 2019-07-26 | 2019-11-29 | 西安交通大学 | 基于注意机制元学习模型的小样本下故障智能诊断方法 |
CN111721536A (zh) * | 2020-07-20 | 2020-09-29 | 哈尔滨理工大学 | 一种改进模型迁移策略的滚动轴承故障诊断方法 |
CN111931826A (zh) * | 2020-07-20 | 2020-11-13 | 华南理工大学 | 基于多尺度卷积迁移模型的滚动轴承故障诊断方法和系统 |
CN111964908A (zh) * | 2020-08-17 | 2020-11-20 | 天津大学 | 一种基于mwdcnn的变工况下轴承故障诊断方法 |
CN112084974A (zh) * | 2020-09-14 | 2020-12-15 | 北京工商大学 | 一种基于元学习的多标签滚动轴承故障诊断方法 |
CN112561910A (zh) * | 2020-12-28 | 2021-03-26 | 中山大学 | 一种基于多尺度特征融合的工业表面缺陷检测方法 |
Non-Patent Citations (4)
Title |
---|
BO ZHAO ET AL.: "Deep multi-scale convolutional transfer learning network: A novel method for intelligent fault diagnosis of rolling bearings under variable working conditions and domains", 《NEUROCOMPUTING》 * |
CHUANJIANG LI ET AL.: "Meta-learning for few-shot bearing fault diagnosis under complex working conditions", 《NEUROCOMPUTING》 * |
SIHAN WANG ET AL.: "Few-Shot Rolling Bearing Fault Diagnosis with Metric-Based Meta Learning", 《SENSORS》 * |
赵小强 等: "使用改进残差神经网络的滚动轴承变工况故障诊断方法", 《西安交通大学学报》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113688875A (zh) * | 2021-07-29 | 2021-11-23 | 中国船舶重工集团公司第七一九研究所 | 工业系统故障识别方法及装置 |
CN113688875B (zh) * | 2021-07-29 | 2024-05-03 | 中国船舶重工集团公司第七一九研究所 | 工业系统故障识别方法及装置 |
CN113569486A (zh) * | 2021-07-30 | 2021-10-29 | 安徽容知日新科技股份有限公司 | 一种工业设备的故障检测方法、计算设备及可读存储介质 |
CN113627317A (zh) * | 2021-08-06 | 2021-11-09 | 安徽工业大学 | 一种基于单样本学习的电机轴承故障诊断方法 |
CN114295981A (zh) * | 2022-01-05 | 2022-04-08 | 湖南师范大学 | 一种基于rn网络电流多特征形态识别的电机故障诊断方法 |
CN114417931A (zh) * | 2022-01-21 | 2022-04-29 | 石家庄铁道大学 | 一种基于原型网络的轴承故障诊断方法 |
CN115560274A (zh) * | 2022-10-14 | 2023-01-03 | 慈溪市远辉照明电器有限公司 | 一种易接线型三防灯 |
CN116597167A (zh) * | 2023-06-06 | 2023-08-15 | 中国人民解放军92942部队 | 一种永磁同步电机小样本退磁故障诊断方法、存储介质及系统 |
CN116597167B (zh) * | 2023-06-06 | 2024-02-27 | 中国人民解放军92942部队 | 一种永磁同步电机小样本退磁故障诊断方法、存储介质及系统 |
CN116990648A (zh) * | 2023-09-26 | 2023-11-03 | 北京科技大学 | 基于一维空洞卷积神经网络的故障电弧检测方法 |
CN116990648B (zh) * | 2023-09-26 | 2023-12-19 | 北京科技大学 | 基于一维空洞卷积神经网络的故障电弧检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113111820B (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113111820B (zh) | 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置 | |
CN111709448B (zh) | 一种基于迁移关系网络的机械故障诊断方法 | |
CN112084974B (zh) | 一种基于元学习的多标签滚动轴承故障诊断方法 | |
CN110132598B (zh) | 旋转设备滚动轴承故障噪声诊断算法 | |
CN110516305B (zh) | 基于注意机制元学习模型的小样本下故障智能诊断方法 | |
CN107066759B (zh) | 一种汽轮机转子振动故障诊断方法及装置 | |
CN112254964A (zh) | 一种基于快速多尺度卷积神经网络的滚动轴承故障诊断方法 | |
CN112633339A (zh) | 轴承故障智能诊断方法、诊断系统、计算机设备及介质 | |
CN114970605A (zh) | 一种多模态特征融合神经网络的制冷设备故障诊断方法 | |
CN114492533B (zh) | 一种变工况轴承故障诊断模型的构建方法及应用 | |
CN112308147A (zh) | 基于多源域锚适配器集成迁移的旋转机械故障诊断方法 | |
CN114564987B (zh) | 一种基于图数据的旋转机械故障诊断方法及系统 | |
CN114118138A (zh) | 一种基于多标签领域自适应模型的轴承复合故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN116702076A (zh) | 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质 | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN113435321A (zh) | 一种主轴轴承状态评估方法、系统、设备及可读存储介质 | |
CN116227586A (zh) | 基于深度残差收缩原型网络的元学习故障诊断方法及装置 | |
CN116168720A (zh) | 一种电机声音异常故障诊断方法、系统、及可存储介质 | |
CN114742122A (zh) | 设备故障诊断方法、装置、电子设备以及存储介质 | |
CN114048787A (zh) | 一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统 | |
CN118312868A (zh) | 基于深度同心孪生网络的船舶主机小样本故障诊断方法 | |
CN110750876B (zh) | 一种轴承数据模型训练及使用方法 | |
CN112069998A (zh) | 基于卷积神经网络的gbdt故障诊断集成方法 | |
CN114818811B (zh) | 一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |