CN114970715A - 小样本及不平衡数据约束下的变工况故障诊断方法及系统 - Google Patents

小样本及不平衡数据约束下的变工况故障诊断方法及系统 Download PDF

Info

Publication number
CN114970715A
CN114970715A CN202210582774.4A CN202210582774A CN114970715A CN 114970715 A CN114970715 A CN 114970715A CN 202210582774 A CN202210582774 A CN 202210582774A CN 114970715 A CN114970715 A CN 114970715A
Authority
CN
China
Prior art keywords
data
domain
fault diagnosis
fault
target domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210582774.4A
Other languages
English (en)
Inventor
袁宪锋
孙自豪
张承进
傅旭
宋勇
许庆阳
周风余
庞豹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202210582774.4A priority Critical patent/CN114970715A/zh
Publication of CN114970715A publication Critical patent/CN114970715A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • G01M99/005Testing of complete machines, e.g. washing-machines or mobile phones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明属于智能故障诊断领域,提供了小样本及不平衡数据约束下的变工况故障诊断方法及系统,该方法包括:获取待检测设备不同工况下的故障振动数据;将不同工况下的故障振动数据分为源域和目标域数据;基于目标域数据和训练后的故障诊断网络中,得到故障诊断结果;其中,所述故障诊断网络的训练过程包括:将源域和目标域数据分别结合基于胶囊特征构造的图卷积网络进行特征提取得到源域和目标域的特征分布;采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法,对齐源域和目标域的特征分布并输出故障分类结果。使故障诊断方法在小样本及不平衡数据约束下实现良好的故障诊断性能。

Description

小样本及不平衡数据约束下的变工况故障诊断方法及系统
技术领域
本发明属于智能故障诊断领域,尤其涉及小样本及不平衡数据约束下的变工况故障诊断方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
近年来,机械设备向着自动化与智能化方向发展,伴随而来的是机械设备精密度、复杂度和紧密程度越来越高。在复杂的运行环境下,机电设备一旦发生故障,将会带来灾难性的后果。为了保障机械系统高精度与高可靠性运行,机械系统健康管理正在成为一个蓬勃发展的方向。
由于机械系统中机构的复杂性,很难直接使用系统输入输出信号进行故障诊断,通常故障诊断方法是通过在被测机械部件周围安置传感器,监测振动信号,并利用故障诊断算法进行故障诊断。随着深度学习技术的发展,基于数据驱动的故障诊断算法,成为其中一股不可或缺的力量。数据驱动的故障诊断过程可以分为三个主要环节:信号采集、算法设计、故障监测。其中,信号采集阶段得到大量的数据,算法设计阶段设计深度学习算法以达到准确诊断的目的,最后应用算法进行故障监测。
现有的基于深度迁移学习的故障诊断方法已经取得了较好的性能,但仍然存在以下缺陷:
(1)基于深度学习的故障诊断方法通常依赖于大量有标签数据,并且大部分算法的前提是测试数据与训练数据分布相同,目标是提高网络在数据分布相同的条件下的泛化能力。在实际工业生产中,机械设备、工况(负载、转速)、扰动会发生变化,数据的分布特性也会改变,因而领域自适应方法是一个好的解决办法,但是现有的领域自适应方法通常比较单一,不能很好的对齐不同特征分布的数据,这将会严重影响故障诊断方法的性能。
(2)基于深度学习和迁移学习的智能故障诊断模型通常基于大量的监测数据。训练数据越充分,故障诊断模型的性能越好。然而,在实际场景中,机器大部分时间是工作在正常状态下,故障状态较少,采集到的数据大部分是健康状态数据,故障状态数据的量较小;在仿真实验环境中,一方面是模拟故障实验的成本高,另一方面实验模拟的故障与实际情况有一定的偏差。因此,很难建立用于故障诊断模型训练的理想的数据集,小样本及不平衡数据是故障诊断领域普遍存在的问题。
发明内容
为了解决上述背景技术中存在的至少一项技术问题,本发明提供小样本及不平衡数据约束下的变工况故障诊断方法,其设计一种有效的小样本及不平衡数据约束下的故障诊断方法,对故障诊断过程中的特征提取部分进行改进,使故障诊断方法在小样本及不平衡数据约束下实现良好的故障诊断性能。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供小样本及不平衡数据约束下的变工况故障诊断方法,包括如下步骤:
获取待检测设备不同工况下的故障振动数据;
将不同工况下的故障振动数据分为源域和目标域数据;
基于目标域数据和训练后的故障诊断网络中,得到故障诊断结果;其中,所述故障诊断网络的训练过程包括:
将源域和目标域数据分别结合基于胶囊特征构造的图卷积网络进行特征提取得到源域和目标域的特征分布;
采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法,对齐源域和目标域的特征分布并输出故障分类结果。
本发明的第二个方面提供小样本及不平衡数据约束下的变工况故障诊断系统,包括:
数据获取模块,用于获取待检测设备不同工况下的故障振动数据;
数据划分模块,用于将不同工况下的故障振动数据分为源域和目标域数据;
故障诊断模块,用于基于目标域数据和训练后的故障诊断网络中,得到故障诊断结果;其中,所述故障诊断网络的训练过程包括:
将源域和目标域数据分别结合基于胶囊特征构造的图卷积网络进行特征提取得到源域和目标域的特征分布;
采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法,对齐源域和目标域的特征分布。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的小样本及不平衡数据约束下的变工况故障诊断方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的小样本及不平衡数据约束下的变工况故障诊断方法中的步骤。
与现有技术相比,本发明的有益效果是:
本发明通过对不同分布的数据之间的差异进行度量,在减小两个不同分布的数据集差异的同时,学习不同故障数据中蕴含的通用故障特征,并用于不同工况下的故障诊断。利用一种混合的领域自适应方法在训练数据集(源领域)和测试数据集(目标领域)分布不同,并且源领域有标签目标领域无标签或有少量标签的条件下,可以达到很好的效果。
本发明通过设计一种有效的小样本及不平衡数据约束下的故障诊断方法,对故障诊断过程中的特征提取部分进行改进,使故障诊断方法在小样本及不平衡数据约束下实现良好的故障诊断性能。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是小样本及不平衡数据约束下的故障诊断系统框架;
图2是胶囊特征构造关联图;
图3是多感受野图卷积;
图4(a)-图4(b)是重叠采样和无重叠采样的数据划分方式;
图5是不同负载的数据集上的故障诊断结果对比;
图6(a)-图6(c)是t-sne可视化结果。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
最早的故障诊断方法是基于模型的方法,该类方法需要针对机械系统建立精确的模型。虽然基于模型的故障诊断方法可靠性较高,但是对于建模理论要求较高,很多复杂情况难以建立系统模型。随着人工智能技术的发展,智能故障诊断技术发展迅速,智能故障诊断方法一般可以分为基于传统机器学习的方法和基于深度学习的方法。传统的机器学习智能故障诊断方法,如支持向量机、随机森林和贝叶斯分类器等,都需要数据预处理和人工特征提取过程,并且诊断结果很大程度上取决于人工特征提取和选择的质量。
近些年,深度学习在故障诊断领域的应用逐渐增多,基于深度学习的方法可以避免人工特征提取的过程。卷积神经网络作为一种典型的深度学习算法,在故障诊断领域得到了广泛的应用。例如,Jia等人基于深度神经网络,利用频谱信号作为输入,使用三个自动编码器组成诊断模型,提出了一种针对旋转机械的智能故障诊断方法。Wen等人在LeNet-5的基础上,提出了一种新的CNN故障诊断算法,该算法通过信号叠加将振动信号转换成二维灰度图像,再利用CNN进行故障诊断。Zhang等人提出了一种具有一层宽卷积核的深度卷积神经网络,该网络的输入是没有经过预处理的一维原始振动信号,实验结果表明,所提的网络结构具有较好的故障诊断效果。
此外,许多基于二维时频图表示的卷积神经网络方法也得到了很好的应用,例如,Ma等人提出了一种基于AlexNet的方法进行故障诊断:首先,将振动信号转换为二维时频图像;然后,利用所提方法提取二维时频图像的特征;最后,实现的故障分类。Zhang等人提出一种基于时频图像的深度学习方法,使用短时傅里叶变换获取输入图像,引入标度指数线性单位函数和分层正则化获得更好的故障诊断效果。这类方法首先利用傅里叶变换等技术将原始振动信号转化为二维时频图像,然后输入二维图像训练网络,虽然该方法具有较高的准确率,但是数据需要预处理并且利用二维图像训练网络速度较慢。与传统的智能故障诊断方法相比,深度学习方法表现出了优越的性能,然而在工况发生变化的情况下性能较差。迁移学习是将某个领域或任务上学习到的知识应用到不同但相关的领域或任务中的一种思想,已经大量的应用在图像分类等领域。领域自适应技术是一种具有代表性的迁移学习方法,它能够在训练过程中对齐源域和目标域之间的特征分布,同时保持良好的分类结果。深度迁移学习方法可以充分利用深度学习的特征表示能力和迁移学习的知识迁移能力,增强故障诊断模型的特征提取能力和自适应能力。例如,Yan等人提出了基于深度迁移学习的故障诊断方法,促进了迁移学习在故障诊断领域的研究和应用。此外,还进行了大量的故障诊断实验,实验结果表明所提的方法具有良好的性能。An等人利用MMD和多核模型提出了一种故障诊断框架,取得了较高的诊断精度。Wen等人提出了一种基于深度迁移模型的诊断方法,该方法通过稀疏自编码器网络完成特征提取任务,通过MMD最小化特征分布的不一致性,从而完成了领域自适应过程。Li等人提出了一种端到端的方案,该方案结合了双向信号和胶囊网络,将水平和垂直方向的振动信号输入神经网络,可以从不同工作条件下收集的训练样本中学习领域不变特征。为了最小化跨域分布差异,Chen等提出了一种基于迁移学习的多域故障诊断方案,该方案将针对特定任务的编码器网络和领域对抗训练结合起来。为了从原始信号中提取域不变特征,Wang等人提出了一种深度对抗域自适应网络,该网络使用领域对抗训练和瓦瑟斯坦距离对齐不同领域的特征,实现跨域故障诊断。Huang等人提出了一种新的深度对抗胶囊网络,该网络不仅能将复合故障智能地分割成多个单故障,还能通过某一工况下的故障诊断知识推理其他新工况下的故障。与以往的深度学习方法相比,基于领域自适应的深度迁移学习方法能够在工作条件发生变化时保持良好的故障诊断效果。
正如背景技术中提及的技术问题,本发明采用的技术方案如下,包括:
(1)使用合适的方法来对不同分布的数据之间的差异进行度量,在减小两个不同分布的数据集差异的同时,学习不同故障数据中蕴含的通用故障特征,并用于不同工况下的故障诊断。利用一种混合的领域自适应方法在训练数据集(源领域)和测试数据集(目标领域)分布不同,并且源领域有标签目标领域无标签或有少量标签的条件下,可以达到很好的效果。
(2)设计一种有效的小样本及不平衡数据约束下的故障诊断方法,对故障诊断过程中的特征提取部分进行改进,使故障诊断方法在小样本及不平衡数据约束下实现良好的故障诊断性能。
实施例一
如图1所示,本实施例提供小样本及不平衡数据约束下的变工况故障诊断方法,包括如下步骤:
步骤1:获取待检测设备不同工况下的故障振动数据;
步骤2:将不同工况下的故障振动数据分为源域和目标域数据;
步骤3:基于目标域数据和训练后的故障诊断网络中,得到故障诊断结果;其中,所述故障诊断网络的训练过程包括:
将源域和目标域数据分别结合基于胶囊特征构造的图卷积网络进行特征提取得到源域和目标域的特征分布;
采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法对齐域和目标域的特征分布。
作为一种或多种实施例,步骤1中,在待测设备上安装加速度传感器,采集在不同的工作状况下设备正常运行和发生故障时的振动数据。
作为一种或多种实施例,步骤2中,不同工况下的故障数据分别作为源域和目标域,给源域数据添加标签,目标域数据不添加标签。
作为一种或多种实施例,步骤3中,所述基于胶囊特征构造的图卷积网络进行特征提取包括:
将源域和目标域数据结合胶囊编码器提取得到对应数据的胶囊特征;
将故障诊断系统输入的批量数据中的每一个样本的胶囊特征作为关联图中的一个节点,根据邻接矩阵构建关联图中节点以及节点之间的关系,生成关联图;
基于关联图和图卷积网络提取关联图特征。
主要包括如下步骤:
①胶囊编码:输入的批量故障数据经过胶囊编码器提取特征,则胶囊编码器提取的特征为:
Xcaps=Gcaps(Xinput) (1)
其中,Xcaps为批量数据的胶囊特征,Gcaps表示胶囊编码器,维度为(B,L),B为批量数据的大小,L为每个样本的特征尺寸,Xinput为输入的数据。
②关联图生成:关联图构建的具体过程如图2所示,关联图的生成本质上是邻接矩阵的构建,利用胶囊特征构造邻接矩阵过程如式(18)所示:
Figure BDA0003664743880000091
由式(2)可见,将胶囊特征与其转置相乘并标准化得到邻接矩阵A,每个样本的胶囊特征作为关联图中的一个节点,根据邻接矩阵可以构建图中节点以及节点之间的关系。
③胶囊解码:胶囊特征的好坏关系到关联图构建的准确性,进而影响图卷积网络特征提取的效果,因此,加入胶囊解码器,构造胶囊解码损失Ldecode用于优化胶囊特征提取的效果。
Ldecode=L(Xinput,R(Gcaps(Xinput))) (3)
其中,R表示胶囊解码器。
作为一种或多种实施例,所述图卷积网络的构建过程包括:
假设有一个无向图G=(X,E,A),其中,X为n个节点的集合,E为边的集合,邻接矩阵A为:
Figure BDA0003664743880000092
则图上的谱卷积定义为:
gθ x=U((UTg)⊙(UTx))=UgθUTx (5)
其中,U=[U1,U2,…,Un]是傅里叶变换的基,UTg=[θ12,…,θn],gθ=diag(θ)为在傅里叶域中的一个卷积核,gθ=diag(UTg)=diag(θ12,…,θn),⊙是哈达玛积(Hadamardproduct),
Figure BDA0003664743880000101
为节点的信号。
在图卷积网络GCN中,根据无向图G构造傅里叶变换的基,首先通过邻接矩阵A得到拉普拉斯矩阵L:
L=In-D-0.5AD-0.5 (6)
其中,D为度矩阵,对角线位置上的值为
Figure BDA0003664743880000102
In是单位矩阵。
再对拉普拉斯矩阵L进行特征值分解得到傅里叶变换的基U:
L=UΛU-1 (7)
其中,U为L的特征向量组成的矩阵,Λ是由L的特征值组成的对角矩阵。
谱域的卷积核的取值被认为是与特征值相关的函数,通常使用切比雪夫多项式来表示gθ
Figure BDA0003664743880000103
在GCN中,使用1阶切比雪夫多项式表示gθ
Figure BDA0003664743880000104
由式(5),(7),(9)可得到:
Figure BDA0003664743880000105
其中,
Figure BDA0003664743880000106
λmax=2。
为了进一步简化公式(10),令β0=-β1=β,则
Figure BDA0003664743880000107
通过使
Figure BDA0003664743880000111
防止网络传播过程中的梯度消失或梯度爆炸问题,其中
Figure BDA0003664743880000112
最终得到GCN的卷积公式为:
Figure BDA0003664743880000113
其中,β为卷积核的可学习参数。
GCN的前向传播公式可表示为:
Figure BDA0003664743880000114
其中,σ(·)为激活函数,X为卷积邻域内节点的集合,B为卷积核的参数矩阵。
传统卷积神经网络只能处理有规则的空间结构数据,比如图片是规则的二维栅格,语音、文本是规则的一维序列,而这些数据结构能够用一维、二维的矩阵表示。即卷积网络只能处理欧几里得空间的数据,对于非欧空间的不规则数据,卷积网络并不适用。现实生活中有很多数据并不具备规则的空间结构,比如推荐系统、社交网络、分子结构等抽象出的图(Graph)结构数据。图是通过边建立节点之间的连接关系,是一种不规则的数据结构。
在胶囊特征构造关联图之后,使用图卷积网络进一步提取关联图特征。
由式(8)可知,切比雪夫多项式的阶数即谱域卷积核的感受野半径,也就是将中心节点的k阶相邻节点作为卷积的邻域节点。通常,切比雪夫多项式的阶数是固定的,GCN中为一阶切比雪夫多项式。
为了使图卷积网络聚合多种尺度的感受野的节点特征,所述多感受野图卷积网络,如图3所示。
分别使用K=1,2,3三种不同的邻域大小进行图卷积操作,聚合得到的节点特征:
Figure BDA0003664743880000121
其中,
Figure BDA0003664743880000122
表示三种不同大小邻域的图卷积输出,G为多感受野图卷积的输出。
本实施例基于胶囊特征构造图卷积网络(Capsule Feature Constructing GraphConvolution Network,CFCGCN)的方法,由胶囊编码器、胶囊解码器和图特征提取三部分组成,模型参数如表1所示。
表1 CFCGCN特征提取参数
Figure BDA0003664743880000123
作为一种或多种实施例,步骤3中,使用融合最大均值差异和域判别器的领域自适应方法对齐关联图特征,利用分类器进行故障状态识别,具体包括:
其中,融合最大均值差异用于度量两个不同但相关的分布之间的距离,可以用以下公式表示两个分布X和Y的距离:
Figure BDA0003664743880000124
其中,xi和yi分别表示两个不同分布中的数据,n和m为两个分布中样本的数量,φ(·)表示映射函数,H表示将数据映射到再生希尔伯特空间(RKHS)。
MMD的关键是要找到一个映射函数,使得映射后的源域数据和目标域数据之间的平方距离是最小的;
本实施例,所述映射函数可以采用高斯核函数或者线性核函数等。
在实际应用中,由于每个核函数适用于不同的应用场合,并且每个核函数的参数选择对映射的最终性能至关重要,而单一核函数在某些情况下性能表现不好。
为了结合不同核函数的优点,在不同情况下实现良好的性能,采用能最大化双样本测试功率和最小化II型误差的多核最大均值差异(MK-MMD)。
对于MK-MMD来说,通常使用多个核函数的凸组合来提供对于映射函数的有效估计。
多核核函数可定义如下:
Figure BDA0003664743880000131
其中,K表示m个核函数的组合,βu为不同核函数的加权参数。
领域对抗神经网络作为最常用的基于对抗网络的领域自适应方法是由Ganin等人提出的,它的目标是训练特征提取器、域判别器和分类器,特征提取器从输入数据中提取特征,域判别器用来混淆源域和目标域,分类器与域判别器在预测相应的标签的同时对齐源域和目标域分布。
假设源域和目标域数据分别为(xs,ys)和(xt),Gf为特征提取器,D是域判别器,f为分类器,源域标签预测损失和域判别器对抗损失为:
Lc=c(f(G(xs)),ys) (16)
LD=D(G(xs),G(xt)) (17)
其中,标签预测损失使用softmax分类器,判别器使用二元交叉熵损失函数。由于在训练过程中,一方面需要最小化预测损失,让特征提取器和分类器尽可能多的预测真实标签。另一方面,也需要最大化对抗损失,使领域判别器难以区分两个领域的差异。
因此,需要最小化标签预测损失并最大化域判别器对抗损失,DANN目标函数为:
LDANN=c(f(G(xs)),ys)-λDANND(G(xs),G(xt)) (18)
Figure BDA0003664743880000141
其中,λDANN为损失函数的权衡参数,p随着训练过程由0到1线性变化,γ设置为10。
在故障诊断中,领域自适应的目的是对齐不同特征分布的故障数据,实现更加有效的故障诊断。
源域特征
Figure BDA0003664743880000142
和目标域特征
Figure BDA0003664743880000143
具有两个用途:一是输入到混合领域自适应模块进行特征对齐,最大均值差异利用两个特征分布之间的距离构造损失函数LMMD,域判别器使用二元交叉熵函数构造损失函数LDA;二是将源域和目标域特征送入分类器使用softmax进行分类,并计算源域分类损失Lc。最后融合三部分损失函数作为总的目标函数:
LMMD+DANN=Lc+λ(LMMD-LDA) (20)
其中,领域自适应参数
Figure BDA0003664743880000144
γ设定为10,
Figure BDA0003664743880000145
随着训练过程由0~1线性变化。
为了验证本实施例的诊断效果,选取三种不同负载情况下的CWRU数据集进行变工况下的故障诊断实验,如表2所示。重叠采样和无重叠采样的数据划分方式如图4(a)-图4(b)所示。
表2 CWRU数据集
Figure BDA0003664743880000151
CFCGCN和四种对比实验在CWRU三种不同负载的数据集上的故障诊断准确率如图5所示。
由于WDCNN并未使用领域自适应方法对齐不同负载下的特征分布,因而WDCNN使用重叠采样和不使用重叠采样两种情况下故障诊断效果都较差,平均准确率低于90%。CNN+MMD+DA(重叠采样)在WDCNN的基础上加入了MMD+DA的领域自适应方法,在六种迁移情况下故障诊断准确率都有提升,平均准确率达到96.17%。GCN+MMD+DA未使用重叠采样,但使用样本的卷积特征构造图卷积网络,建立了故障样本间的关系,实现了较好的故障诊断效果。除B-A和B-C两种情况,GCN+MMD+DA的故障诊断准确率均高于使用重叠采样的CNN+MMD+DA,平均准确率为97.57%。
CFCGCN+MMD+DA使用样本的胶囊特征构造图卷积网络,既可以建立故障样本内部属性的关系,也可以建立故障样本间的关系。因而CFCGCN+MMD+DA实现了五种方法中最好的故障诊断性能,在六种负载迁移情况下,准确率均为最高,平均准确率达到99.55%。
结果表明,胶囊特征构造的图卷积网络可以建立故障样本内部不同采样端的关系和不同样本间的关系,从而提升小样本及不平衡数据下的故障诊断性能。
为了更好的验证CFCGCN在不同负载的数据集上的故障诊断性能,对C-A(源域C和目标域A)迁移情况下的输入批量数据和特征利用t-sne可视化,结果如图6(a)-图6(c)所示。
由图6(a)可以看出,相同颜色的输入数据点分布散乱,输入的批量数据不具备可分性,尤其是九种故障状态数据混淆严重;源域和目标域数据点相距较远,数据分布明显不同。使用胶囊网络提取到的胶囊特征如图6(b)所示,可以看出,经过胶囊网络特征提取和MMD+DA领域自适应过后的正常状态数据与其他的数据距离明显变远,相同颜色的数据点之间距离明显变小,不同颜色点之间距离明显变远,九种故障数据也具备了一定的可分性。使用CFCGCN特征提取和MMD+DA领域自适应得到的域不变特征可视化结果如图6(c)所示,不同颜色的数据之间几乎没有重叠,数据之间具有了明显的可分性;源域和目标域数据特征之间的距离也明显变小,两种负载下的数据特征对齐效果较好。由此可以看出,CFCGCN可以在小样本及不平衡数据下实现较好的数据特征提取效果,CFCGCN+MMD+DA可以在不同负载的数据集下实现较好的故障诊断性能。
实施例二
本实施例提供小样本及不平衡数据约束下的变工况故障诊断系统,包括:
数据获取模块,用于获取待检测设备不同工况下的故障振动数据;
数据划分模块,用于将不同工况下的故障振动数据分为源域和目标域数据;
故障诊断模块,用于基于目标域数据和训练后的故障诊断网络中,得到故障诊断结果;其中,所述故障诊断网络的训练过程包括:
将源域和目标域数据分别结合基于胶囊特征构造的图卷积网络进行特征提取得到源域和目标域的特征分布;
采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法,对齐源域和目标域的特征分布。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的小样本及不平衡数据约束下的变工况故障诊断方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的小样本及不平衡数据约束下的变工况故障诊断方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.小样本及不平衡数据约束下的变工况故障诊断方法,其特征在于,包括如下步骤:
获取待检测设备不同工况下的故障振动数据;
将不同工况下的故障振动数据分为源域和目标域数据;
基于目标域数据和训练后的故障诊断网络中,得到故障诊断结果;其中,所述故障诊断网络的训练过程包括:
将源域和目标域数据分别结合基于胶囊特征构造的图卷积网络进行特征提取得到源域和目标域的特征分布;
采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法,对齐源域和目标域的特征分布并输出故障分类结果。
2.如权利要求1所述的小样本及不平衡数据约束下的变工况故障诊断方法,其特征在于,所述基于胶囊特征构造的图卷积网络进行特征提取包括:
将源域和目标域数据结合胶囊编码器提取得到对应数据的胶囊特征;
将每个样本的胶囊特征作为关联图中的一个节点,根据邻接矩阵构建关联图中节点以及节点之间的关系,生成关联图;
基于关联图和图卷积网络提取关联图特征。
3.如权利要求2所述的小样本及不平衡数据约束下的变工况故障诊断方法,其特征在于,所述邻接矩阵通过胶囊特征与其转置相乘并标准化后得到。
4.如权利要求1所述的小样本及不平衡数据约束下的变工况故障诊断方法,其特征在于,所述在生成关联图后,采用胶囊解码器构造胶囊解码损失函数优化胶囊特征提取。
5.如权利要求1所述的小样本及不平衡数据约束下的变工况故障诊断方法,其特征在于,所述采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法,对齐源域和目标域的特征分布,包括:
利用源域和目标域的特征分布之间的距离构造第一损失函数;
使用二元交叉熵函数构造第二损失函数;
将源域和目标域的特征分布进行分类,计算源域分类损失;
融合第一损失函数、第二损失函数以及源域分类损失对齐源域和目标域的特征分布。
6.如权利要求5所述的小样本及不平衡数据约束下的变工况故障诊断方法,其特征在于,所述利用源域和目标域的特征分布之间的距离构造第一损失函数,通过寻找根据映射后的源域数据和目标域数据之间的平方距离最小的映射函数。
7.如权利要求1所述的小样本及不平衡数据约束下的变工况故障诊断方法,其特征在于,所述源域数据添加标签,目标域数据不添加标签。
8.小样本及不平衡数据约束下的变工况故障诊断系统,其特征在于,包括:
数据获取模块,用于获取待检测设备不同工况下的故障振动数据;
数据划分模块,用于将不同工况下的故障振动数据分为源域和目标域数据;
故障诊断模块,用于基于目标域数据和训练后的故障诊断网络中,得到故障诊断结果;其中,所述故障诊断网络的训练过程包括:
将源域和目标域数据分别结合基于胶囊特征构造的图卷积网络进行特征提取得到源域和目标域的特征分布;
采用融合最大均值差异和领域对抗神经网络的混合领域自适应方法,对齐源域和目标域的特征分布。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的小样本及不平衡数据约束下的变工况故障诊断方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的小样本及不平衡数据约束下的变工况故障诊断方法中的步骤。
CN202210582774.4A 2022-05-26 2022-05-26 小样本及不平衡数据约束下的变工况故障诊断方法及系统 Pending CN114970715A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210582774.4A CN114970715A (zh) 2022-05-26 2022-05-26 小样本及不平衡数据约束下的变工况故障诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210582774.4A CN114970715A (zh) 2022-05-26 2022-05-26 小样本及不平衡数据约束下的变工况故障诊断方法及系统

Publications (1)

Publication Number Publication Date
CN114970715A true CN114970715A (zh) 2022-08-30

Family

ID=82956248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210582774.4A Pending CN114970715A (zh) 2022-05-26 2022-05-26 小样本及不平衡数据约束下的变工况故障诊断方法及系统

Country Status (1)

Country Link
CN (1) CN114970715A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115544901A (zh) * 2022-11-28 2022-12-30 西南石油大学 一种小样本的稠油工况故障智能识别方法
CN115577245A (zh) * 2022-12-05 2023-01-06 广东工业大学 一种旋转组件rul预测的数据分布平衡方法及系统
CN117131424A (zh) * 2023-10-25 2023-11-28 中国移动通信集团设计院有限公司 一种训练方法、流量检测方法、装置、设备及介质
CN117390411A (zh) * 2023-10-16 2024-01-12 石家庄铁道大学 基于元迁移学习的变工况轴承故障诊断方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115544901A (zh) * 2022-11-28 2022-12-30 西南石油大学 一种小样本的稠油工况故障智能识别方法
CN115544901B (zh) * 2022-11-28 2023-02-21 西南石油大学 一种小样本的稠油工况故障智能识别方法
CN115577245A (zh) * 2022-12-05 2023-01-06 广东工业大学 一种旋转组件rul预测的数据分布平衡方法及系统
CN117390411A (zh) * 2023-10-16 2024-01-12 石家庄铁道大学 基于元迁移学习的变工况轴承故障诊断方法
CN117390411B (zh) * 2023-10-16 2024-03-29 石家庄铁道大学 基于元迁移学习的变工况轴承故障诊断方法
CN117131424A (zh) * 2023-10-25 2023-11-28 中国移动通信集团设计院有限公司 一种训练方法、流量检测方法、装置、设备及介质
CN117131424B (zh) * 2023-10-25 2024-02-20 中国移动通信集团设计院有限公司 一种训练方法、流量检测方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN114970715A (zh) 小样本及不平衡数据约束下的变工况故障诊断方法及系统
Tang et al. Convolutional neural network‐based data anomaly detection method using multiple information for structural health monitoring
US10831577B2 (en) Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model
Zemouri et al. Deep convolutional variational autoencoder as a 2d-visualization tool for partial discharge source classification in hydrogenerators
CN111914883B (zh) 一种基于深度融合网络的主轴轴承状态评估方法及装置
CN108334936A (zh) 基于迁移卷积神经网络的故障预测方法
Wang et al. Graph-based change detection for condition monitoring of rotating machines: Techniques for graph similarity
CN111504676A (zh) 基于多源监控数据融合的设备故障诊断方法、装置及系统
Wang et al. A combination of residual and long–short-term memory networks for bearing fault diagnosis based on time-series model analysis
CN113051822A (zh) 基于图注意力网络与lstm自动编码模型的工业系统异常检测方法
CN112926642B (zh) 一种多源域自适应智能机械故障诊断方法及系统
CN113919540A (zh) 一种生产过程运行状态的监测方法及相关设备
CN115358259A (zh) 一种基于自学习的无监督跨工况轴承故障诊断方法
Zhang et al. Amplitude‐frequency images‐based ConvNet: Applications of fault detection and diagnosis in chemical processes
Chou et al. SHM data anomaly classification using machine learning strategies: A comparative study
CN116292130A (zh) 基于协整分析的风力发电机状态监测系统及其方法
Chen et al. A novel Bayesian-optimization-based adversarial TCN for RUL prediction of bearings
Ge et al. A deep condition feature learning approach for rotating machinery based on MMSDE and optimized SAEs
Jiao et al. Fault diagnosis method for industrial robots based on DBN joint information fusion technology
Gao et al. Semi-supervised small sample fault diagnosis under a wide range of speed variation conditions based on uncertainty analysis
Sun et al. Intelligent fault diagnosis scheme for rolling bearing based on domain adaptation in one dimensional feature matching
CN117493930A (zh) 一种基于对比生成对抗网络的多元时间序列异常检测方法
Jiang et al. Enhancing convolutional neural network deep learning for remaining useful life estimation in smart factory applications
Dervilis et al. Damage detection in carbon composite material typical of wind turbine blades using auto-associative neural networks
Zhao et al. Dimension reduction graph‐based sparse subspace clustering for intelligent fault identification of rolling element bearings

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination