CN116502175A - 一种图神经网络故障诊断方法、装置和存储介质 - Google Patents
一种图神经网络故障诊断方法、装置和存储介质 Download PDFInfo
- Publication number
- CN116502175A CN116502175A CN202310254802.4A CN202310254802A CN116502175A CN 116502175 A CN116502175 A CN 116502175A CN 202310254802 A CN202310254802 A CN 202310254802A CN 116502175 A CN116502175 A CN 116502175A
- Authority
- CN
- China
- Prior art keywords
- neural network
- layer
- fault
- convolution
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 238000003745 diagnosis Methods 0.000 claims abstract description 49
- 238000000605 extraction Methods 0.000 claims abstract description 36
- 238000012360 testing method Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000001133 acceleration Effects 0.000 claims abstract description 15
- 238000009826 distribution Methods 0.000 claims abstract description 10
- 230000004927 fusion Effects 0.000 claims abstract description 10
- 238000011176 pooling Methods 0.000 claims description 40
- 239000011159 matrix material Substances 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 20
- 230000007246 mechanism Effects 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 abstract description 6
- 238000013527 convolutional neural network Methods 0.000 description 15
- 238000002474 experimental method Methods 0.000 description 11
- 238000002679 ablation Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 235000019580 granularity Nutrition 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Abstract
本发明公开了一种图神经网络故障诊断方法、装置和存储介质,其中方法包括:采集旋转机械在不同实验工况下的振动加速度信号,根据振动加速度信号获取样本,并对样本进行标注,获得样本数据集;构建用于识别不同工况故障的多尺度时空信息融合驱动的图神经网络;根据样本数据集对图神经网络进行训练优化;在测试阶段,将不同工况的测试样本输入训练后的图神经网络,输出样本故障的概率分布,获取概率最大的故障为预测样本标签。本发明从多维时序信息特征提取出发,构造单分支下不同尺度大小的卷积核分别对原始振动信号进行不同尺度特征提取,有效克服了现有单尺度结构特征提取不足以及多分支结构计算量大的问题,可广泛应用于机械设备故障诊断领域。
Description
技术领域
本发明涉及机械设备故障诊断领域,尤其涉及一种图神经网络故障诊断方法、装置和存储介质。
背景技术
近年来,随着现代工业技术和机械设备现代化水平的不断发展,旋转机械越来越趋向于复杂化、大型化、高性能、高效率和高自动化发展。然而,旋转机械设备长期工作在高负荷且工况复杂多变等恶劣环境,在工作过程中齿轮、轴承等核心零部件不可避免的会出现磨损、断裂等各种故障,由此引起的旋转机械设备性能不稳定或失效,如果不能及时发现并维修,将会造成巨大的安全隐患和经济损失。有研究表明如果借助故障诊断技术在故障发生的前期提前介入维修,则可以降低故障发生率和维修成本。可见,如何对旋转机械的运行状况进行准确智能诊断是急需解决的问题。因此,开展精确的智能诊断算法研究对保障设备的安全运行和提高生产效率具有重要的意义。
深度学习通常指由多层隐藏层构建的深度神经网络。其基本思想在于模拟人脑的分层结构,通过构建多层非线性变换,对外部输入的数据进行处理,从而可从大量数据中,学习多层次抽象特征以及隐藏结构表示,实现对输入数据的智能识别和预测。因此,基于深度学习的故障诊断方法不需要进行复杂的信号机理分析,通过神经网络自动提取数据的有效特征进行故障诊断及分类,促进了智能故障诊断方法的发展及应用。
随着计算机技术和数据采集技术的发展,工业现场可采集到海量的设备运行数据,推动故障诊断领域进入了智能化时代。然而,旋转机械设备运行工况复杂多变,轻微的条件变化都有可能导致采集的振动信号发生大幅度改变,导致待诊断样本与训练样本的数据分布不同,使得原有故障诊断模型并不完全适用于新的运行工况。若对不同任务分别建立故障诊断模型,不仅耗费时间和人力,还需要充足的故障样本。然而在工业应用中,旋转机械无法带故障长时间运转,每个任务采集和标注故障数据的代价十分高昂。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种图神经网络故障诊断方法、装置和存储介质。
本发明所采用的技术方案是:
一种图神经网络故障诊断方法,包括以下步骤:
采集旋转机械在不同实验工况下的振动加速度信号,根据振动加速度信号获取样本,并对样本进行标注,获得样本数据集;
构建用于识别不同工况故障的多尺度时空信息融合驱动的图神经网络;
根据样本数据集对图神经网络进行训练优化;
在测试阶段,将不同工况的测试样本输入训练后的图神经网络,输出样本故障的概率分布,获取概率最大的故障为预测样本标签;
其中,图神经网络包括多尺度特征提取模块、通道注意力模块、图数据构建模块、图卷积模块以及标签分类模块;
所述多尺度特征提取模块用于对输入信号提取不同尺度的信息;
所述通道注意力模块用于对不同通道的多尺度信息进行建模,在卷积层中加入通道注意力机制,以使网络有选择地增强信息量大的特征,使得后续的处理充分利用这些特征,并对无用的特征进行抑制;
所述图数据构建模块用于引入样本之间的空间信息,
所述图卷积模块用于对空间信息进行建模,提取出融合时空信息的高维特征,
所述标签分类模块用于输出已知类别故障的类别概率。
进一步地,所述根据振动加速度信号获取样本,包括:
从振动加速度信号中截取所有故障类别中包含故障特征频率最少一个周期长度的数据段来构成样本;
其中,样本包括训练样本和测试样本,训练样本和测试样本是不同工况下的样本,两者的数据特征分布不同,但两者的类别空间相同,包含的故障类别数相同。
进一步地,所述多尺度特征提取模块包含多个特征提取单元;其中第一个特征提取单元包括多个大小不同的一维卷积核的卷积层、通道注意力层、批次归一化层、一维池化核的最大池化层,后续的特征提取单元包括单一尺度一维卷积核的卷积层、批次归一化层、一维池化核的最大池化层。
进一步地,所述多尺度特征提取模块的表达式为:
Zl=C(σ(fi(Zl-1)+bl))
其中Zl为第l层的输出,Zl-1为第l-1层的输出,bl为第l层的偏置,fi表示不同尺度的卷积操作,σ为非线性激活函数,C表示不同尺度卷积操作输出的特征在通道维度上的合并操作。
进一步地,所述通道注意力模块具体执行以下步骤:
A1、对多尺度特征提取模块输出的特征图X进行全局最大池化和全局均值池化操作;其中池化操作将每个通道的H*1特征图压缩成1*1的一个数值,该数值包括该通道的全局信息;经过池化后的向量Z1、Z2表示全局特征信息,表达式如下:
Z1、Z2=Fsq(X)
式中,X表示多尺度卷积输出的特征图,Fsq表示全局最大池化和全局均值池化,Z1、Z2表示特征图经过全局最大池化和均值池化的输出;
A2、将向量Z1、Z2通过全连接层进行特征映射输出S1、S2,再将S1、S2相加并激活后输出通道注意力向量S,通道注意力向量S的维度与多尺度特征X的通道维度相等,表达式为:
S=σ(FC(Z1)+FC(Z2))
式中,FC(·)表示共享的全连接层,σ(·)表示Sigmoid激活函数,S表示通道注意力向量;
A3、经过Sigmoid激活操作后,通道注意力向量S中所有的值都被压缩到0到1,将多尺度特征输入X与通道注意力向量S相乘,得到融合通道注意力机制的特征图Y,表达式为:
Y=Fsc(S,X)=ST×X
式中,Fsc(·)表示对X进行scale操作。
进一步地,所述图数据构建模块包括全连接层和特征矩阵与其转置矩阵进行矩阵乘法得到邻接矩阵,邻接矩阵根据top-k排序机制选择每个节点的top-k近邻并将其数值置为1,表示节点之间存在连接边,其余邻接矩阵中的数值置为0,表示节点之间不存在连接边。
进一步地,所述邻接矩阵的表达式为:
式中,是MLP的输出,A是构造的邻接矩阵,/>是稀疏矩阵,里面只有0和1,normalize(·)表示正则化函数,Top表示,k(A)表示。
进一步地,所述图卷积模块包括两个特征提取单元,每个特征提取单元包括图卷积层、批次归一化层;
所述图卷积模块的表达式为:
式中,H0和H1分别为第一层和第二层图卷积学习到的特征表示,A为邻接矩阵,W0和W1是图卷积层可学习参数。
本发明所采用的另一技术方案是:
一种图神经网络故障诊断装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上所述方法。
本发明所采用的另一技术方案是:
一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行如上所述方法。
本发明的有益效果是:本发明从多维时序信息特征提取出发,构造单分支下不同尺度大小的卷积核分别对原始振动信号进行不同尺度特征提取,仅增加少量的计算量就可以提取到时序数据的多尺度故障特征,有效克服了现有单尺度结构特征提取不足以及多分支结构计算量大的问题。
附图说明
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1是本发明实施例中多尺度时空信息融合驱动的图神经网络的示意图;
图2是本发明实施例中多尺度卷积的结构示意图;
图3是本发明实施例中通道注意力机制结构示意图;
图4是本发明实施例中图数据构建的示意图;
图5是本发明实施例中变工况下消融实验对比结果示意图;
图6是本发明实施例中不同诊断模型实验对比结果示意图;
图7是本发明实施例中一种图神经网络故障诊断方法的步骤流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
如图7所示,针对行星齿轮箱在强噪声环境和变工况下故障诊断效果不佳,泛化能力差的问题,本实施例提供一种图神经网络故障诊断方法,该方法首先构建多尺度卷积核对原始时序信号进行不同尺度特征提取以增强其故障特征表达能力;然后再构造通道注意力机制,根据通道特征重要程度,给不同尺度卷积核提取的特征自适应分配不同权重,对特征进行强化;最后对卷积输出的多尺度特征,构造空域下的图数据进行图卷积学习,从而有效利用数据的时序多维信息和空域结构关联信息,实现多尺度下时空域故障信息的深度融合,提高诊断的准确度和模型的泛化性能。该方法具体包括以下步骤:
S1、采集旋转机械在不同实验工况下的振动加速度信号,根据振动加速度信号获取样本,并对样本进行标注,获得样本数据集。
数据集的采集与标定,分别采集旋转机械在不同实验工况下的振动加速度信号,从振动加速度信号中截取一定长度的数据段来构成样本,并进行标注,获得大量不同工况样本数据集{x,y},数据集由样本数据x及其对应标签y构成。
其中,样本包括训练样本和测试样本,训练样本和测试样本是不同工况下的样本,两者的数据特征分布不同,但两者的类别空间相同,包含的故障类别数相同,以验证所提诊断方法对不同工况数据故障诊断的能力。
S2、构建用于识别不同工况故障的多尺度时空信息融合驱动的图神经网络。
参见图1,图神经网络包括:多尺度特征提取模块,通道注意力模块,图数据构建模块,图卷积模块,标签分类模块。其中,多尺度特征提取模块用于对输入信号提取不同尺度的信息,通道注意力模块用于对不同通道的多尺度信息进行建模,在卷积层中加入通道注意力机制可以让网络有选择的增强信息量大的特征,使得后续的处理可以充分利用这些特征,并对无用的特征进行抑制,图数据构建引入样本之间的空间信息,图卷积模块用于对空间信息进行建模,提取出融合时空信息的高维特征,标签分类器用于输出已知类别故障的类别概率。
具体地,多尺度特征提取器采用了多个大小不同的一维卷积核。通道注意力模块通过全局池化保留通道信息,再通过全连接层映射后经过Sigmoid输出各个通道的重要性。图数据构建模块通过计算样本特征之间的余弦相似度,确定样本之间是否存在边。图卷积模块通过图卷积提取样本之间的空间信息用于故障诊断。其中标签分类器输出层采用Softmax输出函数。
参见图2,作为一种可选的实施方式,所构建的多尺度特征提取模块包含多个特征提取单元,第一个单元采包括多个大小不同的一维卷积核的卷积层、通道注意力层、批次归一化层、一维池化核的最大池化层,后续特征提取单元包括单一尺度一维卷积核的卷积层、批次归一化层、一维池化核的最大池化层。多尺度特征提取模块的数学模型如下式:
Zl=C(σ(fi(Zl-1)+bl)) (1)
其中Zl为第l层的输出,Zl-1为第l-1层的输出,bl为第l层的偏置,fi表示不同尺度的卷积操作,σ为非线性激活函数,C表示不同尺度卷积操作输出的特征在通道维度上的合并操作。需要说明的是,本步骤与其他方法不同的地方在于,多尺度卷积实现直接采用不同大小的一维卷积核,区别于其他方法采用不同粗粒度的振动信号,其他方法将输入信号人工分为不同粗粒度信号后输入不同卷积神经网络分支进行特征提取,多尺度特征质量依赖于多尺度粗粒度层划分的好坏,难以自适应与其特征权重进行有效的度量与融合;同时多尺度特征融合在不同分支网络的高维全连接层中进行融合,导致了模型复杂度高,参数量大。
参见图3,作为一种可选的实施方式,所构建的通道注意力模块,注意力机制引导计算资源偏向输入信号中信息量最大的部分,用于深度网络中可以提升性能。通道注意力机制是专门用于对各个通道的关联性进行建模。卷积层的输出没有考虑对各通道的依赖性,在卷积层中加入通道注意力机制可以让网络有选择的增强信息量大的特征,使得后续的处理可以充分利用这些特征,并对无用的特征进行抑制。包括步骤:
步骤1:对多尺度卷积输出的特征图X进行全局最大池化和全局均值池化操作。为了更高效的计算通道注意力特征,要做的就是压缩特征图的空间维度,平均池化和最大池化都可以压缩空间维度,故同时采用两种池化操作,池化操作将每个通道的H*1特征图压缩成1*1的一个数值,这个数值包括了该通道的全局信息。经过池化后的Z1和Z2向量可以表示全局特征信息,所以池化操作既能够减少计算量又不丢失信息量。具体原理如下式:
Z1、Z2=Fsq(X) (2)
其中X表示多尺度卷积输出的特征图,Fsq表示全局最大池化和全局均值池化,Z1、Z2表示特征图经过全局最大池化和均值池化的输出。
步骤2:将Z1、Z2通过全连接层进行特征映射输出S1、S2,Z1、Z2通过同一个全连接层目的在于减少计算量,再将S1、S2相加并激活后输出通道注意力向量S,该向量的维度与多尺度特征X的通道维度相等,S1、S2向量相加目的是综合最大池化和平均池化的作用。表达式如下式:
S=σ(FC(Z1)+FC(Z2)) (3)
其中FC(·)表示共享的全连接层,σ(·)表示Sigmoid激活函数,S表示通道注意力向量。
步骤3:式(3)中,经过Sigmoid激活操作后,S向量中所有的值都被压缩到0到1,数值的具体意义表示多尺度特征X各个通道的重要程度,然后,Fsc(·)将多尺度特征输入X与通道注意力向量S相乘,得到融合通道注意力机制的特征图Y。原理如下式:
Y=Fsc(S,X)=ST×X (4)
参见图4,作为一种可选的实施方式,所构建的图数据构建模块以及图卷积模块,要进行图卷积操作,必须要输入节点特征矩阵X和邻接矩阵A。原始信号通过CNN抽取特征组成节点矩阵X,其抽取的特征图可以描述为下式:
X=CNN(Xinput) (5)
其中Xinput表示小批量样本的输入矩阵。
通过小批量的输入矩阵来构造实例图和获取邻接矩阵A。首先,提取的特征矩阵输入多层感知机(MLP)进行降维,降维后特征与其转置矩阵进行矩阵乘法得到邻接矩阵。最后,根据top-k排序机制选择每个节点的top-k近邻并将其数值置为1,表示节点之间存在连接边。其余邻接矩阵中的数值置为0,表示节点之间不存在连接边。其中MLP降维和Top-k操作是为了降低计算复杂度。邻接矩阵可以通过以下公式获得:
其中是MLP的输出,A是构造的邻接矩阵,/>是稀疏矩阵,里面只有0和1,normalize(·)表示正则化函数。
作为一种可选的实施方式,图卷积模块包括两个特征提取单元,每个特征提取单元包括图卷积层、批次归一化层。进行的图卷积操作由式(7)表示:
式中H0和H1分别为第一层和第二层图卷积学习到的特征表示,A为邻接矩阵,W0和W1是图卷积层可学习参数。
作为一种可选的实施方式,标签分类模块由全连接层构成,标签分类模块的输出层采用Softmax输出函数。
S3、根据样本数据集对图神经网络进行训练优化。
利用步骤S1构建的数据集{x,y},采用传统的监督学习算法和梯度下降法对多尺度特征提取器、图卷积模块以及标签分类器的参数进行训练优化。同时确定模型训练过程中的超参数,如迭代次数、学习率,样本批次(batch)等。
S4、在测试阶段,将不同工况的测试样本输入训练后的图神经网络,输出样本故障的概率分布,获取概率最大的故障为预测样本标签。
在测试阶段,将不同工况测试样本输入到网络模型中,标签分类模块的Softmax输出样本故障的概率分布,取概率最大的故障为预测样本标签。
下面结合附图和具体实施方式对上述方法作进一步详细的说明。
为评估所提方法的性能,采用具有行星轮系结构的风机齿轮箱故障数据集进行实验验证。实验设置为转速(300r/min,480r/min,600r/min,720r/min)和负载(0hp,2hp,4hp)的组合,实验数据由安装在齿轮箱机器人实验平台轴承座上的加速度传感器采集,采样频率为25.6kHz。在该实验中,设置了一组正常模式(Normal)和四组故障模式。失效模式分别为行星齿轮断齿(PG_broken)、行星齿轮裂纹(PG_crack)、太阳轮断齿(SG_broken)、和齿圈故障(RF_left)。
分别选用固定转速改变负载和固定负载改变转速的数据集来进行跨工况实验验证。采用转速为300r/min,负载分别为0hp、2hp和4hp的三个子数据集,分别命名为Load 0、Load 2和Load 4;使用负载为1hp,转速分别为480r/min、600r/min和720r/min的三个字数据集,分别命名为Speed 480、Speed 600和Speed 720。
采用1024大小的滑动窗口采集每个工况各个类别的样本,每个工况包括健康状态共5种故障类型,每种故障采集500个样本,每个工况共2500个样本。变负载工况故障诊断:包括六个故障诊断任务,在每个任务中,模型在一个工况数据集上训练,在另一个工况数据集上测试。实验任务的具体设置如表1。每个任务中,将训练集按照8:2划分为训练集和验证集,模型在训练集上训练,通过验证集挑选出最优模型,最后在测试集上测试模型准确率。
表1
为验证所提模型的有效性,选择故障诊断领域WDCNN、LeNet、LSTM、ResNet、MSCNN模型与所提方法进行对比实验。WDCNN:第一层采用大尺寸卷积核的一维卷积神经网络故障诊断模;LeNet:计算机视觉用于图片分类的经典卷积神经网络,为符合振动信号一维性特点,故采用其一维卷积形式。LSTM:采用长短期记忆神经网络对故障信号进行识别,网络的具体参数设置均与参考文献保持一致。ResNet:采用残差连接的一维卷积神经网络模型;MSCNN:采用多尺度卷积的神经网络模型。文中所有的模型算法都在同一台计算机上运行和比较,该计算机的CPU型号为AMD Ryzen 7 4800H,GPU型号为Geforce RTX 2060。模型采用深度学习框架Pytorch构建,训练采用的优化器为Adam,momentum设置为0.9,weight_dcay设置为0.00001,学习率为0.0001,样本批量设置为64,迭代次数为150次停止训练。
为了客观合理评价不同方法的性能,需要选择合适的评价指标。本文除了选用准确率作为评价指标外,还选用F1分数作为评价指标。F1分数是查准率P和召回率R的调和平均值,是一个综合指标,其数值处于0到1之间,越大表示算法性能越高。其计算公式如下:
其中查准率P表示所有被预测成正样本中,真实为正样本的比例。召回率R表示所有真实为正样本中,被准确预测成正样本的比例。
为验证所提模型结构的有效性和模型在变工况故障诊断有效性。分别设计了消融实验、变负载工况故障诊断和变转速工况故障诊断实验,按照表1实验设置进行消融实验和变负载工况故障诊断实验,为避免偶然性,在每个任务上分别进行5次重复实验。
为验证所提模型各个模块的有效性,将所提方法提出的各个模型进行消融对比,消融实验结果如图5和表2所示,所提模型在所有任务上均达到了最好的诊断精度。通过对比CNN和多尺度CNN模型在6个任务的平均诊断正确率,CNN正确率仅为92.63%,多尺度卷积在几乎不增加模型参数量的情况下,将诊断正确率提升至96.62%,可见多尺度卷积操作可以提高CNN特征提取能力,提取的特征具有更强的故障表征能力,验证了多尺度CNN模块的有效性。通过对比多尺度CNN+注意力模型、多尺度CNN+GCN模型在各与多尺度CNN模型在各个实验任务上的诊断准确率,相对于多尺度CNN,加上注意力机制和GCN都可以提高模型的跨工况诊断能力。表明注意力机制可以有效的对多尺度特征中重要特征赋予大权重,对冗余特征赋予小权重以提高学习效率,从而提高诊断精度。表明GCN能够提取样本之间的空间特征,样本空间特征对诊断准确率具有一定的提升作用。所提方法整合了多尺度CNN、注意力机制提取时间特征的优势和GCN提取空间特征的优势,在6个跨负载工况的诊断任务上都达到了最高的诊断精度,平均正确率为98.85%,平均F1分数为0.986。
表2变负载工况下的消融试验结果
为验证所提模型在变负载工况诊断的有效性,按照表2设置变负载工况诊断任务。所提方法与对比方法在6个诊断任务上的预测精度如图6所示,发现在不同任务下,所提方法与对比方法相比均能取得最好的诊断精度,验证了所提方法在变负载工况故障诊断的有效性。WDCNN在同工况诊断准确率接近100%,但是在变负载工况下平均准确率仅为82.29%,表明该模型的泛化性能较差,难以应用在工况多变的实际生产环境中。MSCNN与所提模型实验结果对比,表明图卷积层可以有效提取样本空间特征,提高模型的诊断精度和泛化性能。所提方法在不同任务上的平均诊断精度为98.85%,同时平均F1分数为0.986,见表3。表明所提方法在不同任务上的泛化性能较好,模型的鲁棒性更强。
表3变负载工况下的对比实验结果
本发明针对在进行不同工况故障诊断时,存在训练数据与测试数据分布不一致,以齿轮箱故障研究对象,通过多尺度时空信息融合驱动的图神经网络,有效改进了不同工况下故障诊断的准确性,提升了工业设备的故障诊断能力。
综上所述,本发明相对于现有技术,至少具有如下优点及有益效果:
(1)本发明从多维时序信息特征提取出发,构造单分支下不同尺度大小的卷积核分别对原始振动信号进行不同尺度特征提取,仅增加少量的计算量就可以提取到时序数据的多尺度故障特征,有效克服了现有单尺度结构特征提取不足以及多分支结构计算量大的问题。
(2)本发明从故障特征的重要程度出发,采用通道注意力机制对提取的多尺度特征进行自适应加权,有效提高模型对不同尺度故障特征的专注度,同时提高计算效率。
(3)本发明从时空域信息融合诊断出发,利用卷积神经网络提取的时间维度特征构造空域下的图数据,并利用图卷积神经网络对时空域特征进行深度融合,有效提高模型的诊断精度和泛化性能。
本发明还提供一种图神经网络故障诊断装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现图7所示方法。
本实施例的一种图神经网络故障诊断装置,可执行本发明方法实施例所提供的一种图神经网络故障诊断方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
本申请实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图7所示的方法。
本实施例还提供了一种存储介质,存储有可执行本发明方法实施例所提供的一种图神经网络故障诊断方法的指令或程序,当运行该指令或程序时,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种图神经网络故障诊断方法,其特征在于,包括以下步骤:
采集旋转机械在不同实验工况下的振动加速度信号,根据振动加速度信号获取样本,并对样本进行标注,获得样本数据集;
构建用于识别不同工况故障的多尺度时空信息融合驱动的图神经网络;
根据样本数据集对图神经网络进行训练优化;
在测试阶段,将不同工况的测试样本输入训练后的图神经网络,输出样本故障的概率分布,获取概率最大的故障为预测样本标签;
其中,图神经网络包括多尺度特征提取模块、通道注意力模块、图数据构建模块、图卷积模块以及标签分类模块;
所述多尺度特征提取模块用于对输入信号提取不同尺度的信息;
所述通道注意力模块用于对不同通道的多尺度信息进行建模,在卷积层中加入通道注意力机制,以使网络有选择地增强信息量大的特征,使得后续的处理充分利用这些特征,并对无用的特征进行抑制;
所述图数据构建模块用于引入样本之间的空间信息,
所述图卷积模块用于对空间信息进行建模,提取出融合时空信息的高维特征,
所述标签分类模块用于输出已知类别故障的类别概率。
2.根据权利要求1所述的一种图神经网络故障诊断方法,其特征在于,所述根据振动加速度信号获取样本,包括:
从振动加速度信号中截取所有故障类别中包含故障特征频率最少一个周期长度的数据段来构成样本;
其中,样本包括训练样本和测试样本,训练样本和测试样本是不同工况下的样本,两者的数据特征分布不同,但两者的类别空间相同,包含的故障类别数相同。
3.根据权利要求1所述的一种图神经网络故障诊断方法,其特征在于,所述多尺度特征提取模块包含多个特征提取单元;其中第一个特征提取单元包括多个大小不同的一维卷积核的卷积层、通道注意力层、批次归一化层、一维池化核的最大池化层,后续的特征提取单元包括单一尺度一维卷积核的卷积层、批次归一化层、一维池化核的最大池化层。
4.根据权利要求3所述的一种图神经网络故障诊断方法,其特征在于,所述多尺度特征提取模块的表达式为:
Zl=C(σ(fi(Zl-1)+bl))
其中Zl为第l层的输出,Zl-1为第l-1层的输出,bl为第l层的偏置,fi表示不同尺度的卷积操作,σ为非线性激活函数,C表示不同尺度卷积操作输出的特征在通道维度上的合并操作。
5.根据权利要求1所述的一种图神经网络故障诊断方法,其特征在于,所述通道注意力模块具体执行以下步骤:
A1、对多尺度特征提取模块输出的特征图X进行全局最大池化和全局均值池化操作;其中池化操作将每个通道的H*1特征图压缩成1*1的一个数值,该数值包括该通道的全局信息;经过池化后的向量Z1、Z2表示全局特征信息,表达式如下:
Z1、Z2=Fsq(X)
式中,X表示多尺度卷积输出的特征图,Fsq表示全局最大池化和全局均值池化;
A2、将向量Z1、Z2通过全连接层进行特征映射输出S1、S2,再将S1、S2相加并激活后输出通道注意力向量S,通道注意力向量S的维度与多尺度特征X的通道维度相等,表达式为:
S=σ(FC(Z1)+FC(Z2))
式中,FC(·)表示共享的全连接层,σ(·)表示Sigmoid激活函数,S表示通道注意力向量;
A3、经过Sigmoid激活操作后,通道注意力向量S中所有的值都被压缩到0到1,将多尺度特征输入X与通道注意力向量S相乘,得到融合通道注意力机制的特征图Y,表达式为:
Y=Fsc(S,X)=ST×X
式中,Fsc(·)表示对X进行scale操作。
6.根据权利要求1所述的一种图神经网络故障诊断方法,其特征在于,所述图数据构建模块包括全连接层和特征矩阵与其转置矩阵进行矩阵乘法得到邻接矩阵,邻接矩阵根据top-k排序机制选择每个节点的top-k近邻并将其数值置为1,表示节点之间存在连接边,其余邻接矩阵中的数值置为0,表示节点之间不存在连接边。
7.根据权利要求6所述的一种图神经网络故障诊断方法,其特征在于,所述邻接矩阵的表达式为:
式中,是MLP的输出,A是构造的邻接矩阵,/>是稀疏矩阵,里面只有0和1,normalize(·)表示正则化函数,Top表示,k(A)表示。
8.根据权利要求1所述的一种图神经网络故障诊断方法,其特征在于,所述图卷积模块包括两个特征提取单元,每个特征提取单元包括图卷积层、批次归一化层;
所述图卷积模块的表达式为:
式中,H0和H1分别为第一层和第二层图卷积学习到的特征表示,A为邻接矩阵,W0和W1是图卷积层可学习参数。
9.一种图神经网络故障诊断装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-8任一项所述方法。
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1-8任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310254802.4A CN116502175A (zh) | 2023-03-15 | 2023-03-15 | 一种图神经网络故障诊断方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310254802.4A CN116502175A (zh) | 2023-03-15 | 2023-03-15 | 一种图神经网络故障诊断方法、装置和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116502175A true CN116502175A (zh) | 2023-07-28 |
Family
ID=87325590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310254802.4A Pending CN116502175A (zh) | 2023-03-15 | 2023-03-15 | 一种图神经网络故障诊断方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116502175A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116893924A (zh) * | 2023-09-11 | 2023-10-17 | 江西南昌济生制药有限责任公司 | 设备故障处理方法、装置、电子设备和存储介质 |
CN117395164A (zh) * | 2023-12-12 | 2024-01-12 | 烟台大学 | 工业物联网的网络属性预测方法及系统 |
CN117540202A (zh) * | 2023-09-13 | 2024-02-09 | 南京林业大学 | 基于多信息融合深度集成网络的故障诊断方法和系统 |
CN117540202B (zh) * | 2023-09-13 | 2024-05-14 | 南京林业大学 | 基于多信息融合深度集成网络的故障诊断方法和系统 |
-
2023
- 2023-03-15 CN CN202310254802.4A patent/CN116502175A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116893924A (zh) * | 2023-09-11 | 2023-10-17 | 江西南昌济生制药有限责任公司 | 设备故障处理方法、装置、电子设备和存储介质 |
CN116893924B (zh) * | 2023-09-11 | 2023-12-01 | 江西南昌济生制药有限责任公司 | 设备故障处理方法、装置、电子设备和存储介质 |
CN117540202A (zh) * | 2023-09-13 | 2024-02-09 | 南京林业大学 | 基于多信息融合深度集成网络的故障诊断方法和系统 |
CN117540202B (zh) * | 2023-09-13 | 2024-05-14 | 南京林业大学 | 基于多信息融合深度集成网络的故障诊断方法和系统 |
CN117395164A (zh) * | 2023-12-12 | 2024-01-12 | 烟台大学 | 工业物联网的网络属性预测方法及系统 |
CN117395164B (zh) * | 2023-12-12 | 2024-03-26 | 烟台大学 | 工业物联网的网络属性预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Intelligent fault diagnosis of rolling bearings under imbalanced data conditions using attention-based deep learning method | |
Zhang et al. | A hybrid attention improved ResNet based fault diagnosis method of wind turbines gearbox | |
Luo et al. | A case study of conditional deep convolutional generative adversarial networks in machine fault diagnosis | |
Ren et al. | A novel model with the ability of few-shot learning and quick updating for intelligent fault diagnosis | |
CN110361176B (zh) | 一种基于多任务特征共享神经网络的智能故障诊断方法 | |
Zhang et al. | A fault diagnosis method based on improved convolutional neural network for bearings under variable working conditions | |
Jiang et al. | Joint label consistent dictionary learning and adaptive label prediction for semisupervised machine fault classification | |
CN110657984B (zh) | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 | |
Li et al. | A novel deep autoencoder and hyperparametric adaptive learning for imbalance intelligent fault diagnosis of rotating machinery | |
Yin et al. | Wasserstein generative adversarial network and convolutional neural network (WG-CNN) for bearing fault diagnosis | |
CN116502175A (zh) | 一种图神经网络故障诊断方法、装置和存储介质 | |
Xu et al. | Attention-based multiscale denoising residual convolutional neural networks for fault diagnosis of rotating machinery | |
CN114970605A (zh) | 一种多模态特征融合神经网络的制冷设备故障诊断方法 | |
Ayodeji et al. | Causal augmented ConvNet: A temporal memory dilated convolution model for long-sequence time series prediction | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN110930378A (zh) | 基于低数据需求的肺气肿影像处理方法及系统 | |
Tong et al. | Bearing fault diagnosis by combining a deep residual shrinkage network and bidirectional LSTM | |
CN116593157A (zh) | 少样本下基于匹配元学习的复杂工况齿轮故障诊断方法 | |
CN116702076A (zh) | 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质 | |
CN114048787B (zh) | 一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统 | |
Zhu et al. | Prediction of bearing remaining useful life based on DACN-ConvLSTM model | |
Du et al. | A remaining useful life prediction method based on time–frequency images of the mechanical vibration signals | |
Li et al. | A novel unsupervised anomaly detection method for rotating machinery based on memory augmented temporal convolutional autoencoder | |
Ge et al. | A deep condition feature learning approach for rotating machinery based on MMSDE and optimized SAEs | |
CN113592071B (zh) | 设备故障识别模型训练、识别方法、系统、装置及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |