CN117892194A - 基于Meta-GraphSage网络的小样本故障诊断方法及系统 - Google Patents
基于Meta-GraphSage网络的小样本故障诊断方法及系统 Download PDFInfo
- Publication number
- CN117892194A CN117892194A CN202410036841.1A CN202410036841A CN117892194A CN 117892194 A CN117892194 A CN 117892194A CN 202410036841 A CN202410036841 A CN 202410036841A CN 117892194 A CN117892194 A CN 117892194A
- Authority
- CN
- China
- Prior art keywords
- graphsage
- meta
- network
- fault diagnosis
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000003745 diagnosis Methods 0.000 title claims abstract description 74
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 19
- 238000001228 spectrum Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 12
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 101100455978 Arabidopsis thaliana MAM1 gene Proteins 0.000 claims 1
- 230000008846 dynamic interplay Effects 0.000 abstract description 4
- 238000004540 process dynamic Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于Meta‑GraphSage网络的小样本故障诊断方法及系统。属于故障诊断技术领域。本发明方法包括故障数据集获取、Meta‑GraphSage故障诊断模型构建、Meta‑GraphSage故障诊断模型训练、故障诊断。其中Meta‑GraphSage故障诊断模型使用改进的GraphSage网络来提取特征以更好的处理邻居节点之间的动态交互和依赖关系;此外,元学习算法通过多个任务训练良好的初始化参数可仅使用少量样本快速准确适应新任务,并在此基础上执行一个或多个梯度调整步骤,以达到仅用少量数据快速适应新任务的目的。
Description
技术领域
本发明涉及故障诊断技术领域,更具体的说是涉及基于Meta-GraphSage网络的小样本故障诊断方法及系统。
背景技术
工业设备的可靠性和有效性对于生产运营至关重要。齿轮箱作为一种常见的传动装置,在工业生产中扮演着重要角色。然而,由于长期使用和恶劣工况等原因容易发生故障,造成经济损失和重大事故。故障诊断是确保设备正常运行和生产效率的关键环节。
在故障诊断领域,由于工程实际中设备通常在正常条件下工作,很少出现故障,实验室获取的完全相同的故障数据成本较高等问题,导致构建包含大量标注数据的训练数据集非常困难,使得实际工业场景中的故障诊断成为典型的小样本问题。
现有的小样本故障诊断方法有基于数据的方法和基于模型的方法。基于数据的方法是指对数据量进行扩充或者提高数据质量。以生成对抗网络(Generative adversarialnetworks,GAN)为代表的数据增强方法是解决小样本问题的经典方法之一。然而,当样本数很小时,这种方法也存在梯度消失、模式崩溃等问题。因此,从数据生成角度看,深度生成模型都需要大量的计算资源,模型难以训练。而且数据生成的效果依赖充足的真实数据,当真实数据不足或特征不明显时,生成效果较差。基于模型的方法大致包括利用正则化避免模型过拟合,利用迁移学习、元学习等设计一个高性能模型等。相较于基于数据的方法从数据源头解决小样本问题,基于模型的方法则致力于从小样本中获得更多的有用信息。然而,基于模型的方法虽然可以解决小样本问题,但是大多都依赖较大的计算资源和训练时间。
图神经网络(Graph Neural Network,GNN)是一种可以解决小样本问题的新型诊断方法。在小样本齿轮箱故障诊断中利用图数据建模有两大优势:(1)图数据包含的信息多于欧式数据,同时包含节点信息和关系信息;(2)在实际的工业过程中传感器信号及其相互关系可以用节点和边的形式表示图数据。虽然GCN在处理图数据方面具有优势,但在小样本故障诊断问题中,GCN容易出现过拟合问题且很难充分利用样本之间的关联关系。
因此如何解决齿轮箱故障样本有限条件下故障诊断模型易出现过拟合,以及传统深度学习对数据依赖性过高的问题,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于Meta-GraphSage网络的小样本故障诊断方法及系统。
为了实现上述目的,本发明采用如下技术方案:
一方面,本发明公开了一种基于Meta-GraphSage网络的小样本故障诊断方法,包括以下步骤:
故障数据集获取:
获取齿轮箱的故障数据集,并将所述故障数据集划分为训练集和测试集;
Meta-GraphSage故障诊断模型构建:
基于模型不可知元学习框架MAML构建Meta-GraphSage故障诊断模型,所述Meta-GraphSage故障诊断模型包括GraphSage网络;
利用门控循环单元作为聚合函数对所述GraphSage网络中的节点状态进行更新;
利用元学习策略对节点状态更新后的GraphSage网络中的网络初始参数进行学习;
Meta-GraphSage故障诊断模型训练:
利用训练集对构建好的Meta-GraphSage故障诊断模型进行训练;
故障诊断:
利用训练好的Meta-GraphSage故障诊断模型进行小样本故障诊断。
进一步地,故障数据集获取步骤中,齿轮箱的故障数据集通过以下步骤获取:
通过快速傅里叶变换将采集到的齿轮箱振动信号转换为包含故障信息的频谱图像,并根据所述频谱图像提取频域特征数据,将所述频域特征数据作为齿轮箱的故障数据集。
进一步地,所述频域特征数据包括,主频和谐波、侧边频率、频谱形状、频谱幅值、以及相位信息。
进一步地,Meta-GraphSage故障诊断模型构建步骤中,所述GraphSage网络通过以下步骤获取:
计算频域特征数据之间的欧几里得距离,并根据欧几里得距离构造频谱样本KNN图;
根据所述频谱样本KNN图中的节点集合和节点之间的连接关系建立GraphSage网络。
进一步地,所述频域特征数据之间的欧几里得距离利用KNN算法表示为:
其中,Lij表示节点和节点/>的距离;/>表示节点/>的第l维特征;hj (l)表示节点/>的第l维特征。
进一步地,Meta-GraphSage故障诊断模型构建步骤中,利用门控循环单元作为聚合函数对所述GraphSage网络中的节点状态进行更新,具体包括以下步骤:
对于目标节点v的k个邻居节点的特征进行聚合,得到聚合后的特征表示:
h_agg_v=GRU(hv,hu1,hu2,...,huk)
其中,{hv,hu1,hu2,...,huk}表示采样到的邻居节点的特征表示;
将目标节点v的特征表示h_v和聚合后的特征表示h_agg_v进行拼接,并将拼接结果输入到多层感知机MLP;
在所述多层感知机MLP中通过多个全连接层的计算将拼接结果映射到新的特征向量h_v'。
进一步地,Meta-GraphSage故障诊断模型构建步骤中,利用元学习策略对节点状态更新后的GraphSage网络中的网络初始参数进行学习,具体包括以下步骤:
获取元学习任务的支持集和查询集;
输入子任务Ti支持集S中所有样本的xi到GraphSage网络,输出向量yi';
利用交叉熵损失函数计算损失并通过梯度下降更新网络参数θ。
进一步地,获取元学习任务的支持集和查询集,具体包括以下步骤:
依据N-way K-shot任务,从训练集或测试集中随机选择N个故障类别;
随机在N个故障类别中选择每个故障类别下的K个样本组成子任务的支持集S={xS,yS},所述支持集作为子任务训练过程中的训练集;
选择每个类别下不同于支持集中K个样本的K'个样本组成子任务的查询集Q={xQ,yQ},所述查询集作为子任务训练过程中的测试集;
其中,xS和yS分别表示支持集的样本数据和样本标签;xQ和yQ分别表示查询集的样本数据和样本标签;下标S表示用于训练Meta-GraphSage故障诊断模型并提供相应损失的反馈,下标Q表示用于评估训练后Meta-GraphSage故障诊断模型的性能。
进一步地,利用交叉熵损失函数计算损失并通过梯度下降更新网络参数θ,具体包括:
第一阶段中,将学习率设置为α,Meta-GraphSage故障诊断模型的初始化参数θ经n(n∈[0,m])步梯度下降更新为
其中,/>表示此时子任务Ti的支持集的损失梯度;α表示梯度下降的学习率;
损失函数在支持集数据S={xS,yS}中的具体数学表示为:
其中,/>为参数/>的内循环网络结构;xS和yS分别表示支持集的样本数据和样本标签;
在经过第m步更新后,Meta-GraphSage网络参数更新为以下表达式:
其中,/>表示前一步的更新参数;
表示表示此时子任务Ti的支持集的损失梯度;θ表示初始化参数;
第二阶段,利用查询集Q={xQ,yQ}再次对模型进行优化,所有查询集任务的总损失值LMeta-GraphSage由下式表示:
其中,LMeta-GraphSage表示故障诊断模型预测值与真实值之间的差距,优化的目标是通过最小化总损失LMeta-GraphSage来找到对于每个子任务来说都适合的模型参数;表示所有任务查询集上的总损失。
另一方面本发明还公开了一种基于Meta-GraphSage网络的小样本故障诊断系统,所述系统包括计算机系统,所述计算机系统在执行时能够实现本发明任意一项所述的基于Meta-GraphSage网络的小样本故障诊断方法。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了基于Meta-GraphSage网络的小样本故障诊断方法及系统,具有以下有益效果:
使用改进的GraphSage网络来提取特征以更好的处理邻居节点之间的动态交互和依赖关系;此外,元学习算法通过多个任务训练良好的初始化参数可仅使用少量样本快速准确适应新任务,并在此基础上执行一个或多个梯度调整步骤,以达到仅用少量数据快速适应新任务的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的方法步骤流程示意图。
图2为本发明提供的数据采集平台示意图。
图3本发明提供的方法效果对比示意图
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例首先公开了一种基于Meta-GraphSage网络的小样本故障诊断方法,整体步骤包括故障数据集获取、Meta-GraphSage故障诊断模型构建、Meta-GraphSage故障诊断模型训练、故障诊断。主要过程如图1所示,具体的上述方法包括:
1)构建齿轮箱的故障数据集D,并划分为训练集Tr和测试集Te;
齿轮箱的故障数据集D={(Xi,Yi)|1≤i≤U},其中,Xi为第i类故障的样本数据,Yi为第i类故障样本的标签集,(Xi,Yi)为第i类故障的故障样本,U表示齿轮箱故障状态类型的数量。
齿轮箱的故障数据集可以通过以下方法得到,通过快速傅里叶变换(FastFourier Transform,FFT)将采集到的齿轮箱振动信号转换为包含故障信息的频谱图像,并根据频谱图像提取频域特征数据,将频域特征数据作为齿轮箱的故障数据集。
频谱图像按照故障类别可以划分为表示不同故障类别的频谱图像,因此,齿轮箱的故障数据集实质上包含有多种不同类别的故障子数据集。
2)构建MAML-GraphSage故障诊断模型,本发明中故障诊断模型是一种基于模型不可知元学习框架(MAML)构建的元学习故障诊断模型,基模型为改进的双层GraphSage网络,由输入层、SAGEConv层、全连接层构成。
首先,对原始信号经快速傅里叶变换(Fast Fourier Transform,FFT)处理获得频域特征,利用欧几里得距离判断所有频谱信号样本之间的邻接关系来构造频谱样本KNN图,能很好的反映样本之间的局部几何性质,KNN算法的距离度量公式可以表示为:
其中,Lij表示节点和节点/>的距离;/>表示节点/>的第l维特征;每个节点代表每个经过FFT的频谱样本。频谱样本KNN图中边的构造可表示为:
Aij=KNN(k,Lij,Ωi),Aij∈A (2)
其中,Ωi={Li1,Li2,...,Lin}是与所有节点的距离集合;k是频谱样本KNN图的超参数;若Lij是Ωi集合中的k个最小值,KNN(·)=1,否则KNN(·)=0。
然后,根据频谱样本KNN图中的节点集合和节点之间的连接关系建立GraphSage网络,并以参数化的函数fθ表示所建立的GraphSage网络,θ为GraphSage网络的参数,步长为α,β。
GraphSage网络是处理非欧域图形数据的一种重要方法,其基本思想是通过学习相邻节点的特征来生成新的更高级别的节点特征。该GraphSage图可以表示为G=(V,E),其中,V是所构造图中的所有节点集合,E是节点之间的连接关系。为了学习节点v的表示它会遍历其K跳邻域中的所有节点。在对节点v进行迭代时,它会聚合v的邻居的当前表示并与v的当前表示/>相连接,然后将其送入全连接层。对于第k次迭代有:
本发明所提出的改进的GraphSage网络将门控循环单元GRU应用于邻居节点的特征聚合过程。具体而言,对于每个节点,可以使用GRU单元来更新当前节点的表示向量,其中输入为当前节点的特征向量和邻居节点的特征向量,输出为当前节点的聚合表示。这样可以通过迭代多轮的GRU更新,逐步传递并聚合邻居节点的信息。GRU的门控机制可以自适应的控制信息的更新和保留,有助于捕捉复杂的图结构中的依赖关系。通过引入GRU作为聚合函数,GraphSage网络可以更好的处理邻居节点之间的动态交互和依赖关系,从而提高表示学习的性能和效果。
将GRU用作消息传递函数以融合半径较远的信息,生成新的节点表示以更新节点的状态,并捕捉节点之间的依赖关系。对于目标节点v的k个邻居节点的特征进行聚合,得到一个新的特征表示如式(5)所示:
h_agg_v=GRU(hv,hu1,hu2,...,huk) (5)
其中,{hv,hu1,hu2,...,huk}表示采样到的邻居节点的特征表示。
之后,将目标节点v的特征表示h_v和聚合后的特征表示h_agg_v拼接起来输入到MLP,通过多个全连接层的计算,将其映射到h_v',这个新的特征向量就是目标节点v的最终表征,如式(6)所示:
h_v'=MLP([h_v,h_agg_v]) (6)
元学习的第t个任务是利用邻接矩阵At和特征矩阵Xt对图Gt的节点进行分类,则节点分类问题的标准双层GraphSage如式(7)所示:
在给定节点Yt标签的情况下,采用交叉熵损失函数来训练,如式(8)所示:
利用元学习策略,即对任务变化敏感的GraphSag网络模型初始参数进行学习,学习fθ的网络初始参数θ,具体步骤如下:
依据N-way K-shot任务,从训练集Tr或测试集Te中随机选择N个故障类别,随机选择N个故障类别中每个类别下的K个样本组成子任务的支持集S={xS,yS},所属支持集指的是子任务的训练集;选择N个故障类别中每个类别下的不同于支持集中K个样本的K'个样本组成子任务的查询集Q={xQ,yQ},所述查询集指的是子任务的测试集。S用于训练故障分类模型并提供相应损失的反馈,Q用于评估训练后模型的性能。其中,xS和yS分别表示支持集的样本数据和样本标签;xQ和yQ分别表示查询集的样本数据和样本标签。
其中,一个元学习任务的具体学习步骤如下:
i.输入子任务Ti支持集S中所有样本的xi到参数为GraphSage网络,输出向量yi';
ii.利用交叉熵损失函数计算损失并通过梯度下降更新网络参数θ;
利用交叉熵损失函数计算损失的方式为:
L(yi',yi)=-yilog yi'-(1-yi)log(1-yi'),yi是xi的真实标签。
重复上述步骤,网络参数由q更新为qi';输入子任务Ti查询集Q中所有样本的xi到参数为qi'的GraphSage网络输出向量yi”。
利用交叉熵损失函数计算子任务Ti的损失
L(yi”,yi)=-yilog yi”-(1-yi)log(1-yi”),yi是xi的真实标签。
重复上述步骤,获取每个子任务Ti的训练损失LTi,并将一个元学习任务中的子任务得到的损失相加得到一个元学习任务的损失。
iii.元训练:在第一阶段中,将学习率设置为α,公式(9)为Meta-GraphSage故障诊断模型的初始化参数θ经n(n∈[0,m])步梯度下降更新为的过程。
其中,是任务Ti的支持集的损失梯度;α表示梯度下降的学习率。公式(10)为损失函数在支持集数据S={xS,yS}中的具体数学表示:
其中,为参数/>的内循环网络结构;xS和yS分别表示支持集的样本数据和样本标签。
根据式(9),在经过第m步更新后,Meta-GraphSage模型参数更新为式(11)
其中,表示前一步的更新参数;/>表示任务Ti的支持集的损失梯度;θ表示初始化参数。
iv.在第二阶段,利用查询集Q={xQ,yQ}再次对第i个任务更新参数后的分类模型进行优化。假设改进的GraphSage网络模型用fθ来表示,当适应新的任务Ti时,在一个或多个梯度下降步骤之后,模型参数被更新到θi',因此用/>表示更新后的模型。结合式(11),所有查询集任务的总损失值LMeta-GraphSage由式(12)表示:
v.其中,LMeta-GraphSage表示模型预测值与真实值之间的差距,优化的目标是通过最小化总损失LMeta-GraphSage来找到对于每个任务来说都适合的模型参数;表示所有任务查询集上的总损失;公式(13)表示用元学习率β更新初始化参数θ:
元训练的过程就是更新基模型GraphSage网络的初始参数的过程。本发明中元学习方法采用的为模型不可知元学习(MAML),其框架由一个内循环结构和外循环结构组成,其中,内循环结构为改进的GraphSage网络,用于提取任务的特征;外循环为元学习器,通过更新内循环模型的初始化参数,学习任务之间的特征。第ii步,就是利用梯度下降反复更新网络初始参数,并利用交叉熵损失函数计算任务的损失,使得损失函数达到很小的值,即在参数附近足够平滑。第iii步第一阶段是利用支持集更新m步后的得到更新参数;第二阶段是利用查询集再次对模型进行优化,计算所有损失值并更新初始参数,之后将参数传递到模型测试阶段。
阶段一和阶段二都属于模型训练过程,其中阶段一是利用支持集对初始化参数更新,阶段二是又利用查询集对GraphSage网络进行优化得到最终的优化参数,并将其传递到模型测试过程进行模型微调。
综上,利用训练集样本训练MAML-GraphSage模型,步骤总结如下:
(1)利用训练集Tr生成Z个训练子任务;
(2)按照上述训练方法训练MAML-GraphSage故障诊断模型,学习GraphSage网络的初始参数。
训练完成后,使用测试集样本验证训练好的MAML-GraphSage模型,具体步骤如下:
(1)利用训练集Tr生成Z'个训练子任务;
(2)采用训练得到的网络初始参数,利用每个测试任务支持集S中所有样本微调GraphSage网络的参数,使其适应新的任务类别;微调过程与上述(3)步骤相同;
(3)将每个测试任务查询集Q中的所有样本输入微调后的GraphSage网络,输出分类结果并计算诊断精度;
(4)对所有测试任务的诊断精度求平均值,作为模型的最终诊断结果。另一方面本发明还公开了一种计算机系统,该计算机系统包含能够实现上述任意一种基于Meta-GraphSage网络的小样本故障诊断方法的计算机程序
下面通过具体的仿真实验来验证本发明的有效性。
首先对仿真实验中的数据集进行介绍:在各种机械系统中,齿轮可能会出现多种类型的故障和模式。从此类系统中收集的振动信号通常用于揭示其健康状况。本发明选用的数据集源自康涅狄格大学采集的齿轮箱数据集。采样平台如图2所示:由电机1、可更换齿轮的二级减速器2、电磁制动器3、加速度计4和转速计5组成。二级减速器2的具体传动示意图如图所示,第一级输入轴201上安装了一个32齿小齿轮和一个80齿齿轮,第二级202由48齿小齿轮和64齿齿轮组成。输入轴6的转速由转速计5测量,齿轮振动信号由加速度计4测量。图2中,7表示输出轴,8表示主轴。
信号通过dSPACE系统(DS1006处理器板,dSPACE公司)记录,采样频率为20KHz。9种不同的齿轮状况被引入到输入轴上的小齿轮,包括健康状态、缺齿、裂纹、剥落和具有5种不同严重程度的破裂尖端。每个样本的采样点数为3600,每个故障类型有104个样本,则共有104*9个样本。具体如表1所示:
表1齿轮箱数据集
实验结果与分析过程如下:
为避免实验结果的偶然性,对所有方法进行了5次重复实验。运行配置为:Python3.7;Pytorch1.6.0;GPU为NVIDIA Tesla K80;CPU为Intel Xeon E5-2678 v3。模型的主要超参数设置如下:迭代次数为200次,并采用Adam优化器,梯度下降优化的学习率α=0.001,元学习器的学习率β=0.01。
为验证所提方法在小样本下的诊断有效性,将所有数据按7:3的比例,划分为每类工况的训练集样本库为73个样本,测试集为31个样本。
每类故障分别选取4种K-shot取值在模型上进行测试,其平均准确率如表2所示:
表2不同K-shot下的平均准确率
从表2中可以看出,用较少的标记数据就可以训练出综合性能较高的模型,随着支持集样本的增多,模型性能逐渐提高,训练时间也有所增加。
为进一步分析不均衡故障样本对模型诊断效果的影响,选取不同K-shot取值在第5次实验下的混淆矩阵测试。混淆矩阵测试效果图中横纵坐标的标签1-9代表9种故障类型,横坐标代表预测标签,纵坐标代表实际标签。在1-shot下的诊断精度为0.9168,在3-shot下的诊断精度为0.9361,在5-shot下的诊断精度为0.9787,在7-shot下的诊断精度为0.9893。实验结果表明,Meta-GraphSage的优越性随支持集中样本的数量而变化,即样本越少,Meta-GraphSage相对于基线的改进越多。这证明了所提方法的优势,即将元学习应用到GNN模型中,以实现少量图学习。
为验证GraphSage网络的有效性,将元学习分别引入到图卷积神经网络(GraphConvolutional Neural Networks,GCN)和图注意力网络(Graph Attention Networks,GAT)进行实验对比,每类故障分别选取4种K-shot取值在模型上进行测试,其平均准确率如表3所示。
表3GNNs实验对比
由表3可知,在小样本场景下,GAT-Meta和GCN-Meta两种方法的效果并不如GraphSage-Meta,原因首先是GraphSage采用了GRU单元作为其聚合函数。GRU的门控机制可以自适应的控制信息的更新和保留,有助于GraphSage网络捕捉复杂图结构中的依赖关系。而本发明从解决小样本场景下故障识别的角度出发,引入元学习来优化GraphSage网络以学习更好的网络参数初始化,并能显著提高元学习范式下的少量节点分类性能。
此外,采用几种较为先进的基于元学习的方法和传统深度学习方法进行比较。其中,基于元学习的方法包括原型网络(prototypical networks,PN)[29]和基于WDCNN的小样本学习模型(WDCNN-Few-shot)[30],传统深度学习方法有基于迁移学习的预训练模型(Pre-trained)[31]和WDCNN[32]方法。表4列出了所提方法与基于元学习的方法和传统深度学习方法在5次实验下的平均准确率。所提方法在1-shot、3-shot、5-shot、7-shot条件下分别达到了0.9023、0.9487、0.9597和0.9826的准确率,在小样本条件下表现出较好的诊断性能。
在所提方法与传统深度学习方法的性能对比中,Pre-trained和WDCNN方法的准确率分别为95.49%和95.23%。明显低于所提方法在5-shot和7-shot条件下的准确率。这是因为传统深度学习方法的训练需要大量的数据,对深度学习模型来说,提取有效的特征是关键。然而,在小样本故障诊断情况下,由于样本数量少,无法得到有效的关联性特征信息,使得传统深度学习方法的准确率较低。实验结果表明,本发明提出的方法可以很好的适应这些问题。
表4小样本方法性能对比
在实际工业中,齿轮箱是在噪声干扰的工作环境中运行。为验证所提方法的鲁棒性,在振动信号中添加-2dB到2dB信噪比(Signal to noise ratio,SNR)的高斯白噪声以达到噪声干扰的效果。信噪比(Signal to Noise Ratio,SNR)计算公式如式(24)所示:
其中,Psignal表示原始信号功率,Pnoise表示高斯噪声功率。
对于基于元学习的方法,以9-way 5-shot分类任务为例,测试模型在不同噪声环境下的识别效果,实验结果如图3所示,从图中可以看出,在2dB条件下,本发明所提方法与WDCNN-Few-shot、PN方法的准确率可达到98.7542%、97.1217%、97.4512%。但随着信噪比值的降低,三种方法的准确率都会下降,但本发明方法依然具有良好的优势。
本发明实施例针对小样本条件下的故障诊断问题,提出一种基于Meta-GraphSage的诊断方法。使用改进的GraphSage网络来提取特征以更好的处理邻居节点之间的动态交互和依赖关系;此外,元学习算法通过多个任务训练良好的初始化参数可仅使用少量样本快速准确适应新任务,并在此基础上执行一个或多个梯度调整步骤,以达到仅用少量数据快速适应新任务的目的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本发明中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本发明所示的这些实施例,而是要符合与本发明所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,包括以下步骤:
故障数据集获取:
获取齿轮箱的故障数据集,并将所述故障数据集划分为训练集和测试集;
Meta-GraphSage故障诊断模型构建:
基于模型不可知元学习框架MAML构建Meta-GraphSage故障诊断模型,所述Meta-GraphSage故障诊断模型包括GraphSage网络;
利用门控循环单元作为聚合函数对所述GraphSage网络中的节点状态进行更新;
利用元学习策略对节点状态更新后的GraphSage网络中的网络初始参数进行学习;
Meta-GraphSage故障诊断模型训练:
利用训练集对构建好的Meta-GraphSage故障诊断模型进行训练;
故障诊断:
利用训练好的Meta-GraphSage故障诊断模型进行小样本故障诊断。
2.根据权利要求1所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,故障数据集获取步骤中,齿轮箱的故障数据集通过以下步骤获取:
通过快速傅里叶变换将采集到的齿轮箱振动信号转换为包含故障信息的频谱图像,并根据所述频谱图像提取频域特征数据,将所述频域特征数据作为齿轮箱的故障数据集。
3.根据权利要求2所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,所述频域特征数据包括,主频和谐波、侧边频率、频谱形状、频谱幅值、以及相位信息。
4.根据权利要求2所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,Meta-GraphSage故障诊断模型构建步骤中,所述GraphSage网络通过以下步骤获取:
计算频域特征数据之间的欧几里得距离,并根据欧几里得距离构造频谱样本KNN图;
根据所述频谱样本KNN图中的节点集合和节点之间的连接关系建立GraphSage网络。
5.根据权利要求4所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,
所述频域特征数据之间的欧几里得距离利用KNN算法表示为:
其中,Lij表示节点和节点/>的距离;/>表示节点/>的第l维特征;hj (l)表示节点/>的第l维特征。
6.根据权利要求1所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,Meta-GraphSage故障诊断模型构建步骤中,利用门控循环单元作为聚合函数对所述GraphSage网络中的节点状态进行更新,具体包括以下步骤:
对于目标节点v的k个邻居节点的特征进行聚合,得到聚合后的特征表示:
h_agg_v=GRU(hv,hu1,hu2,...,huk)
其中,{hv,hu1,hu2,...,huk}表示采样到的邻居节点的特征表示;
将目标节点v的特征表示h_v和聚合后的特征表示h_agg_v进行拼接,并将拼接结果输入到多层感知机MLP;
在所述多层感知机MLP中通过多个全连接层的计算将拼接结果映射到新的特征向量h_v'。
7.根据权利要求1所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,Meta-GraphSage故障诊断模型构建步骤中,利用元学习策略对节点状态更新后的GraphSage网络中的网络初始参数进行学习,具体包括以下步骤:
获取元学习任务的支持集和查询集;
输入子任务Ti支持集S中所有样本的xi到GraphSage网络,输出向量y′i;
利用交叉熵损失函数计算损失并通过梯度下降更新网络参数θ。
8.根据权利要求7所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,获取元学习任务的支持集和查询集,具体包括以下步骤:
依据N-way K-shot任务,从训练集或测试集中随机选择N个故障类别;
随机在N个故障类别中选择每个故障类别下的K个样本组成子任务的支持集S={xS,yS},所述支持集作为子任务训练过程中的训练集;
选择每个类别下不同于支持集中K个样本的K'个样本组成子任务的查询集Q={xQ,yQ},所述查询集作为子任务训练过程中的测试集;
其中,xS和yS分别表示支持集的样本数据和样本标签;xQ和yQ分别表示查询集的样本数据和样本标签;下标S表示用于训练Meta-GraphSage故障诊断模型并提供相应损失的反馈,下标Q表示用于评估训练后Meta-GraphSage故障诊断模型的性能。
9.根据权利要求8所述的一种基于Meta-GraphSage网络的小样本故障诊断方法,其特征在于,利用交叉熵损失函数计算损失并通过梯度下降更新网络参数θ,具体包括:
第一阶段中,将学习率设置为α,Meta-GraphSage故障诊断模型的初始化参数θ经n(n∈[0,m])步梯度下降更新为
其中,/>表示此时子任务Ti的支持集的损失梯度;α表示梯度下降的学习率;
损失函数在支持集数据S={xS,yS}中的具体数学表示为:
其中,/>为参数/>的内循环网络结构;xS和yS分别表示支持集的样本数据和样本标签;
在经过第m步更新后,Meta-GraphSage网络参数更新为以下表达式:
其中,/>表示前一步的更新参数;/>表示表示此时子任务Ti的支持集的损失梯度;θ表示初始化参数;
第二阶段,利用查询集Q={xQ,yQ}再次对模型进行优化,所有查询集任务的总损失值LMeta-GraphSage由下式表示:
其中,LMeta-GraphSage表示故障诊断模型预测值与真实值之间的差距,优化的目标是通过最小化总损失LMeta-GraphSage来找到对于每个子任务来说都适合的模型参数;表示所有任务查询集上的总损失。
10.一种基于Meta-GraphSage网络的小样本故障诊断系统,其特征在于,所述系统包括计算机系统,所述计算机系统在执行时能够实现权利要求1-9任意一项所述的基于Meta-GraphSage网络的小样本故障诊断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410036841.1A CN117892194A (zh) | 2024-01-10 | 2024-01-10 | 基于Meta-GraphSage网络的小样本故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410036841.1A CN117892194A (zh) | 2024-01-10 | 2024-01-10 | 基于Meta-GraphSage网络的小样本故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117892194A true CN117892194A (zh) | 2024-04-16 |
Family
ID=90648472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410036841.1A Pending CN117892194A (zh) | 2024-01-10 | 2024-01-10 | 基于Meta-GraphSage网络的小样本故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117892194A (zh) |
-
2024
- 2024-01-10 CN CN202410036841.1A patent/CN117892194A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | The emerging graph neural networks for intelligent fault diagnostics and prognostics: A guideline and a benchmark study | |
Luo et al. | A case study of conditional deep convolutional generative adversarial networks in machine fault diagnosis | |
Li et al. | Multiscale local features learning based on BP neural network for rolling bearing intelligent fault diagnosis | |
Li et al. | Meta-learning for few-shot bearing fault diagnosis under complex working conditions | |
Yin et al. | Wasserstein generative adversarial network and convolutional neural network (WG-CNN) for bearing fault diagnosis | |
Li et al. | A novel deep autoencoder and hyperparametric adaptive learning for imbalance intelligent fault diagnosis of rotating machinery | |
CN110703057B (zh) | 基于数据增强和神经网络的电力设备局部放电诊断方法 | |
US20220373432A1 (en) | Method for diagnosing and predicting operation conditions of large-scale equipment based on feature fusion and conversion | |
Li et al. | Fault diagnosis of rotating machinery based on combination of Wasserstein generative adversarial networks and long short term memory fully convolutional network | |
Gai et al. | A Parameter‐Optimized DBN Using GOA and Its Application in Fault Diagnosis of Gearbox | |
CN113505655A (zh) | 面向数字孪生系统的轴承故障智能诊断方法 | |
Han et al. | Cross‐machine intelligent fault diagnosis of gearbox based on deep learning and parameter transfer | |
Lv et al. | Deep transfer network with multi-kernel dynamic distribution adaptation for cross-machine fault diagnosis | |
Wu et al. | Distillation-enhanced fast neural architecture search method for edge-side fault diagnosis of wind turbine gearboxes | |
Jiao et al. | A mixed adversarial adaptation network for intelligent fault diagnosis | |
US20230267302A1 (en) | Large-Scale Architecture Search in Graph Neural Networks via Synthetic Data | |
CN102680646A (zh) | 一种不饱和聚酯树脂反应釜中反应物浓度软测量方法 | |
Chen et al. | An effective fault diagnosis approach for bearing using stacked de-noising auto-encoder with structure adaptive adjustment | |
CN115983374A (zh) | 基于优化sa-cacgan的电缆局放数据库样本扩充方法 | |
Rani et al. | Fault detection and isolation using probabilistic wavelet neural operator auto-encoder with application to dynamic processes | |
CN115051929A (zh) | 基于自监督目标感知神经网络的网络故障预测方法及装置 | |
Tao et al. | Planetary gearbox fault diagnosis based on FDKNN-DGAT with few labeled data | |
CN114500004A (zh) | 一种基于条件扩散概率生成模型的异常检测方法 | |
Zhao et al. | A Multifault Diagnosis Method of Gear Box Running on Edge Equipment | |
Liang et al. | Intelligent fault diagnosis of rotating machinery using lightweight network with modified tree‐structured parzen estimators |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |