CN113011256A - 基于小样本学习的跨类别故障诊断方法、系统及存储介质 - Google Patents

基于小样本学习的跨类别故障诊断方法、系统及存储介质 Download PDF

Info

Publication number
CN113011256A
CN113011256A CN202110162062.2A CN202110162062A CN113011256A CN 113011256 A CN113011256 A CN 113011256A CN 202110162062 A CN202110162062 A CN 202110162062A CN 113011256 A CN113011256 A CN 113011256A
Authority
CN
China
Prior art keywords
data
component
sample
signal
fault diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110162062.2A
Other languages
English (en)
Other versions
CN113011256B (zh
Inventor
徐娟
史永方
周龙
徐鹏飞
房梦婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202110162062.2A priority Critical patent/CN113011256B/zh
Publication of CN113011256A publication Critical patent/CN113011256A/zh
Application granted granted Critical
Publication of CN113011256B publication Critical patent/CN113011256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Signal Processing (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Image Analysis (AREA)

Abstract

一种基于小样本学习的跨类别故障诊断方法,包括:结合部件A的带标注的历史工作数据建立故障诊断模型;结合部件B的带标注的历史工作数据建立支持集;获得部件B的测试数据,将测试数据与支持集中的标注样本数据配对组成测试样本,通过故障诊断模型判断测试样本中的两个数据是否属于同一信号类别,获得支持集中与测试数据所属信号类别相同的标注样本数据,并获取该标注样本数据关联的信号类别作为测试数据的信号类别。本发明中,采用部件A的历史工作数据训练故障诊断模型,保证了故障诊断模型训练对充足的训练数据进行学习,通过部件B提供包含少量标注样本数据的支持集,保证了通过该故障诊断模型对部件B进行信号类别诊断的可行性。

Description

基于小样本学习的跨类别故障诊断方法、系统及存储介质
技术领域
本发明涉及滚动轴承振动信号处理技术领域,尤其涉及一种基于小样本学 习的跨类别故障诊断方法、系统及存储介质。
背景技术
研究先进的机械故障诊断方法是保障设备与人员安全的重要内容,其中, 轴承是旋转机械中最为重要的机械零件之一,广泛应用于电力、化工、冶金、 航空等各个重要领域,同时轴承也是最容易损坏的元件之一,轴承性能和工况 的好坏会直接影响到整台机器设备的性能,轴承性能和工况的缺陷会导致设备 产生异常振动和噪声,甚至造成设备损坏。因此,对滚动轴承进行故障诊断, 尤其对滚动轴承早期故障的分析,尤为重要。
现有技术中,深度学习理论以其强大的建模和表征能力成为数据驱动的智 能故障诊断领域中最活跃的研究方向之一,基于深度学习的故障诊断框架具有 强大的特征学习能力,能够通过多个隐藏层直接从原始传感器数据中学习分层 表示,并自动选择有利于识别的特征,准确的进行故障分类。但是,基于深度 网络的机械故障诊断的成功取决于以下两个条件:1)海量有标签的故障数据,2) 训练和测试数据类别空间相同。但实际行业中通常会存在更为严重和实际的问 题,即很少或甚至没有故障数据可以提前从目标设备的机械零件收集到故障数 据。
发明内容
为了解决上述现有技术中对于数据采集困难的机械部件的故障诊断难度大 的缺陷,本发明提出了一种基于小样本学习的跨类别故障诊断方法、系统及存 储介质。
本发明采用以下技术方案:
一种基于小样本学习的跨类别故障诊断方法,包括以下步骤:
H1、构建故障诊断模型:获得部件A实际工作条件下的历史工作数据,对 部件A的所述历史工作数据标注信号类别,形成标注数据;构建由两条所述标 注数据组成的样本对,并对样本对中两条标注数据的信号类别的相同与否进行 标注,获得由多个带标注的样本对组成的训练集,并结合训练集进行模型训练 以获得故障诊断模型;
H2、建立支持集S:获得部件B实际工作条件下的历史工作数据,从部件B 的所述历史工作数据中任选部分作为标注样本数据,并将剩余的历史工作数据 作为部件B的测试数据;支持集包含部件B对应的所有信号类别,且每一个信 号类别均关联有对应的标注样本数据;部件A和部件B为非同类部件;
H3、跨类别故障诊断:获得部件B的测试数据,将测试数据与支持集中的 标注样本数据配对组成测试样本,通过故障诊断模型判断测试样本中的两个数 据是否属于同一信号类别,获得支持集中与测试数据所属信号类别相同的标注 样本数据,并获取该标注样本数据关联的信号类别作为测试数据的信号类别。
优选的,步骤H1具体包括以下步骤:
H11、获得部件A实际工作条件下的历史工作数据并建立标注数据集合
Figure BDA0002937026150000021
其中,
Figure BDA0002937026150000022
表示部件A的历史工作数据;
Figure BDA0002937026150000023
Figure BDA0002937026150000024
的标签,表示
Figure BDA0002937026150000025
归属的 信号类别,nA表示DA中的标注数据数量;
H12、构建训练集,训练集中带标注的样本对包含同类样本数据
Figure BDA0002937026150000026
和异类样本数据
Figure BDA0002937026150000027
Figure BDA0002937026150000028
其中,np表示同类样本数据的总数,nd表示异类样本数据的总数,
Figure BDA0002937026150000031
表示标注数据
Figure BDA0002937026150000032
属于同一信号类别,
Figure BDA0002937026150000033
表示标注数据
Figure BDA0002937026150000034
属于不同的信号类别;
H13、获得神经网络模型;
H14、从训练集中选择未被学习过的样本对作为学习对象,将学习对象带入 所述神经网络模型,并计算损失函数;
H15、结合损失函数计算结果对所述神经网络模型进行参数更新,然后返回 步骤H14;
H16、循环步骤H14和H15,对神经网络模型进行多次迭代修正后进行参数 固定,获取参数固定后的神经网络模型作为故障诊断模型。
优选的,步骤H14中,损失函数为:
Figure BDA0002937026150000035
其中,
Figure BDA0002937026150000036
表示所述神经网络模型的第k次迭代训练中所采用的样本 对包含的标注数据,
Figure BDA0002937026150000037
θk表示第k次迭代训练中神经网络模型的当前 参数;当
Figure BDA0002937026150000038
两者标签相同,则yk=1,反之,yk=0;
Figure BDA0002937026150000039
Figure BDA00029370261500000310
表示在第k次迭代训练中所采用的训练样本对
Figure BDA00029370261500000311
对应的激活函 数值;
mr为表示不同信号类别之间距离因子的常数,0<mr<1;α表示相同信号类 别的权重因子,0<α<1;
Figure BDA00029370261500000312
表示L2正则项,其中λ为常数,θi表示神经网 络模型的第i个参数,n为神经网络模型中的参数总个数。
优选的,φ(xi,xj,θ)=sigmoid(FC(D2(xi,xj,θ)));sigmoid表示激活函数,FC表示全连接层,D2(xi,xj,θ)表示样本对(xi,xj)在高维空间中的距离。
优选的,训练集中包含的同类样本数据和异类样本数据数量相等, α=0.5,mr=0.7。
优选的,步骤H2中建立的支持集S中,部件B对应的每一个信号类别均关 联有n个对应的标注样本数据,步骤H3中执行n-shot K-way测试,以获得测 试数据的信号类别。
优选的,步骤H3具体包括:
H31、集合部件B的测试数据建立测试数据集合
Figure BDA0002937026150000041
Figure BDA0002937026150000042
表示部件 B的测试数据,nB表示DB中的测试数据数量;
H32、结合测试数据集合DB和支持集S建立测试集TB
Figure BDA0002937026150000043
Figure BDA0002937026150000044
其中,t表示部件B对应的信号类别数量,n表示各信号类别关联的标注样 本数据数量,
Figure BDA0002937026150000045
表示部件B对应的第j个信号类别中的第i个标注样本数 据,
Figure BDA0002937026150000046
H33、将测试集输入故障诊断模型,获得测试集中各测试数据
Figure BDA0002937026150000047
的信号类别。
优选的,部件B对应的信号类别数量小于部件A对应的信号类别数量。
一种基于深度小样本学习的跨类别故障诊断系统,包括处理器和存储器; 存储器存储有计算机程序,处理器用于在执行计算机程序时实现所述的基于小 样本学习的跨类别故障诊断方法。
一种存储介质,存储有计算机程序,所述计算机程序用于在被执行时实现 所述的基于小样本学习的跨类别故障诊断方法。
本发明的优点在于:
(1)本发明中,通过部件A的采集数据训练故障诊断模型,通过部件B提供 包含少量标注样本数据的支持集,从而通过测试数据与支持集中不同类别的标 注样本数据的结合,组成不同的测试样本,通过故障诊断模型对各测试样本进 行机器标注,以获得与测试数据的信号类别相同的标注样本数据,从而获得该 标注样本数据对应的信号类别作为对测试数据的诊断结果。如此,将信号类别 设置为正常信号和故障信号的故障类型,便将部件B的待识别信号作为测试数据 通过故障诊断模型进行诊断。
(2)本发明中,采用部件A的历史工作数据训练故障诊断模型,避免了部 件B数据采集困难导致难以提供海量训练数据的问题,保证了故障诊断模型训练 对充足的训练数据进行学习,从而保证了模型的精度。同时,通过部件B提供包 含少量标注样本数据的支持集,保证了通过该故障诊断模型对部件B进行信号类 别诊断的可行性。
(3)本发明中定义了参数加权因子α和参数距离因子mr,使类内距离更近, 类间距离更远,从而可以高精度的汇总相同类别的信号,并分离不同类别的信 号。同时,通过权重因子α和样本对在高维空间中的距离的结合,使得该故障诊 断模型具有更加明确的分类边界,从而实现了对损失函数的优化,提高了该故 障诊断模型的泛化能力。
(4)训练集中包含的同类样本数据和异类样本数据数量相等。如此,在对 神经网络模型进行迭代训练过程中,可保证用于训练的同类样本数据与异类样 本数据相接近,从而保证训练完成的故障诊断模型对同类别的数据和不同类别 的数据均能精确识别。
附图说明
图1为本发明提出的一种基于小样本学习的跨类别故障诊断方法流程图。
图2为故障诊断模型的训练方法路程图。
图3为故障诊断执行方法流程图。
图4实施例中部件A1的时域信号数据示意图。
图5实施例中部件A2的时域信号数据示意图。
图6实施例中部件B故障数据示意图。
图7三个诊断任务的测试精度示意图。
具体实施方式
本实施方式提出的一种基于小样本学习的跨类别故障诊断方法,包括以下 步骤:
H1、构建故障诊断模型:获得部件A实际工作条件下的历史工作数据,对 部件A的所述历史工作数据标注信号类别,形成标注数据;构建由两条所述标 注数据组成的样本对,并对样本对中两条标注数据的信号类别的相同与否进行 标注,获得由多个带标注的样本对组成的训练集,并结合训练集进行模型训练 以获得故障诊断模型。如此,该故障诊断模型用于对输入的两条故障数据是否 属于同一信号类别进行诊断。
H2、建立支持集S:获得部件B实际工作条件下的历史工作数据,从部件B 的所述历史工作数据中任选部分作为标注样本数据,并将剩余的历史工作数据 作为部件B的测试数据;支持集包含部件B对应的所有信号类别,且每一个信 号类别均关联有对应的标注样本数据。部件A和部件B为非同类部件。
具体实施时,本步骤中,可对筛选出的标注样本数据进行人工标注,以获 得部件B的信号类别。
H3、跨类别故障诊断:获得部件B的测试数据,将测试数据与支持集中的 标注样本数据配对组成测试样本,通过故障诊断模型判断测试样本中的两个数 据是否属于同一信号类别,获得支持集中与测试数据所属信号类别相同的标注 样本数据,并获取该标注样本数据关联的信号类别作为测试数据的信号类别。
具体实施时,步骤H2中建立的支持集S中,部件B对应的每一个信号类别 均关联有n个对应的标注样本数据,具体可记作:
Figure BDA0002937026150000071
其中,
Figure BDA0002937026150000072
表示标签为
Figure BDA0002937026150000073
的n个相同信号类别的标注样 本数据,1≤q≤t,t为部件B对应的信号类别总数。
具体实施时,如果n=1,则步骤H3中只需要针对测试数据
Figure BDA0002937026150000074
进行一 次one-shot K-way测试,K=t,便可得到测试数据的信号类别;如果n>1,则步 骤H3中需要针对测试数据
Figure BDA0002937026150000075
进行n-shot K-way测试,K=t,以获得测试 数据的信号类别。具体的,步骤H3中需要针对测试数据
Figure BDA0002937026150000076
进行n-shot K-way测试,相当于进行n次one-shot K-way测试,以便针对各测试数据获取 重复次数最多的信号类别作为最终识别结果。
本实施方式中,本实施例中,在进行故障诊断模型的训练时,首先将训练 集TA中的样本对映射到特征空间,得到
Figure RE-GDA0003063491450000077
Figure RE-GDA0003063491450000078
然后根据历史工况数据的特征空间数据集建立基于小 样本学习的跨类别故障诊断模型。
故障诊断模型的建立,具体包括以下步骤:
H11、获得部件A实际工作条件下的历史工作数据,并建立标注数据集合
Figure BDA0002937026150000081
Figure BDA0002937026150000082
表示部件A的历史工作数据;
Figure BDA0002937026150000083
Figure BDA0002937026150000084
的标签,表示
Figure BDA0002937026150000085
归属 的信号类别,nA表示DA中的标注数据数量,标注数据即为带有标签的信号数据,
Figure BDA0002937026150000086
中的数据
Figure BDA0002937026150000087
均为标注数据。值得强调的是,信号类别相同的测试 数据所对应的标签相同。具体的,本实施方式中,
Figure BDA0002937026150000088
其中,Aq表示部件A对应的第q种信号类 别,1≤q≤g,g为部件A对应的信号类别的总数量。
H12、构建训练集,训练集中带标注的样本对包含同类样本数据
Figure BDA0002937026150000089
和异类样本数据
Figure BDA00029370261500000810
Figure BDA00029370261500000811
其中,np表示同类样本数据的总数,nd表示异类样本数据的总数,
Figure BDA00029370261500000812
表示标注数据
Figure BDA00029370261500000813
属于同一信号类别,
Figure BDA00029370261500000814
表示标注数据
Figure BDA00029370261500000815
属于不同的信号类别。
如此,将标注数据
Figure BDA00029370261500000816
的标签记作
Figure BDA00029370261500000817
将标注数据
Figure BDA00029370261500000818
的标签记作
Figure BDA00029370261500000819
Figure BDA00029370261500000820
表示标注数据
Figure BDA00029370261500000821
所带的标签相同,即
Figure BDA00029370261500000822
将标注数据
Figure BDA00029370261500000823
的标签记作
Figure BDA00029370261500000824
将标注数据
Figure BDA00029370261500000825
的标签记作
Figure BDA00029370261500000826
Figure BDA00029370261500000827
表示标注数据
Figure BDA00029370261500000828
所带的标签不同,即
Figure BDA00029370261500000829
H13、获得神经网络模型。
H14、从训练集中选择未被学习过的样本对作为学习对象,将学习对象带入 所述神经网络模型,并计算损失函数。具体的,学习对象从训练集中随机抽取, 以便对所述神经网络模型进行训练。
为了优化网络参数和不同信号类别的分类边界,为相同类别的样本定义参 数加权因子α,以使类内距离更近。类似地,为不同的类定义另一个参数距离 因子mr,以使类间距离更远。
具体的,本实施方式中,损失函数为:
Figure BDA0002937026150000091
其中,
Figure BDA0002937026150000092
表示所述神经网络模型的第k次迭代训练中所采用的故障 数据,
Figure BDA0002937026150000093
θk表示第k次迭代训练中神经网络模型的当前参数,即为第 k-1次迭代训练后的神经网络模型的模型参数;当
Figure BDA0002937026150000094
两者标签相同,则yk=1, 反之,yk=0;mr为表示不同信号类别之间距离因子的常数,0<mr<1;α表示相 同信号类别的权重因子,0<α<1;
Figure BDA0002937026150000095
表示L2正则项,其中λ为常数,θi表 示神经网络模型的第i个参数,n为神经网络模型中的参数总个数。
Figure BDA0002937026150000096
表示在第k次迭代训练中所采用的训练样本对
Figure BDA0002937026150000097
对应的激活函数值。具体的,φ(xi,xj,θ)=sigmoid(FC(D2(xi,xj,θ))); sigmoid表示激活函数,FC表示全连接层;D2(xi,xj,θ)表示样本对(xi,xj)在高 维空间中的距离,θ表示模型参数。即,本实施方式中,
Figure BDA0002937026150000098
基于
Figure BDA0002937026150000101
0<α<1时,必定有
Figure BDA0002937026150000102
Figure BDA0002937026150000103
表示故障诊断模型参数中的 同类权重,
Figure BDA0002937026150000104
表示故障诊断模型参数中的不同类权重,本实施方式中, 通过引入权重因子α增加信号类别的类间的距离,并缩小类内距离,从而可以汇 总相同类别的信号,并分离不同类别的信号。同时,通过权重因子α和样本对在 高维空间中的距离的结合,使得该故障诊断模型具有更加明确的分类边界,从 而实现了对损失函数的优化,提高了该故障诊断模型的泛化能力。
H15、结合损失函数计算结果对神经网络模型进行参数更新,然后返回步骤 H14。
H16、对神经网络模型进行多次迭代修正后,对模型进行参数固定后作为故 障诊断模型。
本实施方式中,为了进一步保证神经网络模型对同类样本数据和异类样本 数据的均衡学习,训练集中包含的同类样本数据和异类样本数据数量相等。如 此,在对神经网络模型进行迭代训练过程中,可保证用于训练的同类样本数据 与异类样本数据相接近,从而保证训练完成的故障诊断模型对同类别的数据和 不同类别的数据均能精确识别。
本实施方式中,步骤H3中,采用步骤H1训练获得的故障诊断模型对部件B 进行故障诊断时,具体包括以下步骤:
H31、结合部件B的测试数据建立测试数据集合
Figure BDA0002937026150000105
Figure BDA0002937026150000106
表示部件 B的测试数据,nB表示DB中的测试数据数量。具体实施时,测试数据集合中的 测试数据不能与支持集中的标注样本数据重合,以避免对故障诊断模型的冗余 测试。
H32、结合测试数据集合DB和支持集S建立测试集TB
Figure BDA0002937026150000111
Figure BDA0002937026150000112
其中,t表示部件B对应的信号类别数量,n表示各信号类别关联的标注样 本数据数量,
Figure BDA0002937026150000113
表示部件B对应的第j个信号类别中的第i个标注样本数 据,
Figure BDA0002937026150000114
H33、将测试集输入故障诊断模型,获得测试集中各测试数据
Figure BDA0002937026150000115
的信 号类别。
本实施方式中,还提出了一种基于深度小样本学习的跨类别故障诊断系统, 包括处理器和存储器;存储器存储有计算机程序,处理器用于在执行计算机程 序时实现上述的基于小样本学习的跨类别故障诊断方法。
本实施方式中,还提出了一种存储介质,其存储有计算机程序,所述计算 机程序用于在被执行时实现上述的基于小样本学习的跨类别故障诊断方法。
以下结合一个具体的实施例,对本发明提供的基于深度小样本学习的跨类 别故障诊断方法做进一步解释。
本实施例中,提供了两种用于构建标注数据集合
Figure BDA0002937026150000116
的部件,分 别为部件A1和部件A2。部件A1、A2为轴承,部件B为齿轮,即部件A1、A2和 B均为旋转机械故障部件。
本实施例中,首先采集部件A在实际情况下的历史工作数据,建立标注数 据集合
Figure BDA0002937026150000121
Figure BDA0002937026150000122
表示部件A的历史工作数据;
Figure BDA0002937026150000123
Figure BDA0002937026150000124
的标签,表 示
Figure BDA0002937026150000125
归属的信号类别。
本实施例中,部件A1为具有EDM(电火花加工)的单点点蚀故障轴承,其对 应的信号类别包括正常信号和故障信号,其中,故障信号由故障直径和故障特 征组成,故障直径包括:0.007、0.014和0.021英寸,故障特征包括:滚动元 件故障(BF),内圈故障(IF)和外圈故障(OF)。如此,部件A关联有正常 信号+9中故障类别一共10个信号类别。本实施例中,部件A1工作状态下的信 号采样频率为12kHz,其对应的10个信号类别的信号波形如图4所示。
部件A2对应的信号类别包括4个,分别:滚动元件故障(BF),内圈故障 (IF)和外圈故障(OF),以及正常信号(N)。部件A1工作状态下的信号采 样频率为128kHz,其对应的4个信号类别采集到的信号波形分别如图5所示。
本实施例中,部件B包括5个信号类别,分别为:运行状况,缺失,剥落, 碎屑和裂纹。部件B工作状态下的信号采样频率为20kHz,其对应的5个信号类 别的信号波形如图4所示。
本实施例中提供了三个跨类别的故障诊断实验,如表1所示。在每个跨类 别诊断任务中,箭头之前的部分表示用于提供标注数据集合的部件MCA,箭头之 后的部分表示用于提供测试集的部件MCB。其中,任务A的标注数据集合包含 10种不同信号类别的历史工作数据,分别位于0.007、0.014和0.021英寸三种 断层尺寸下。任务A的测试集是齿轮数据集,其中包含5种信号类别的标注样 本数据,如表1所示。具体的训练集和测试集数量的设置如表2所示。对于三 种故障任务,每种故障任务分别进行了one-shot和five-shot的训练策略, one-shot表示支持集对于每种信号类别分别设置1个标注样本数据,five-shot 表示支持集对于每种信号类别分别设置5个标注样本数据。其中one-shot90和 five-shot90中的90表示用于训练的训练集中带标注的样本对即学习对象有90 个,以此类推。
表1三种不同的故障诊断任务
Figure BDA0002937026150000131
表2数据集设置
Figure BDA0002937026150000141
本实施例中,结合部件A1或者部件A2构建的训练集记作:TA={p1,p2,…,pnA/4,dnA/4+1,…,dnA/2},其中,
Figure BDA0002937026150000151
表示训练集中 第i个样本对中的两个标注数据
Figure BDA0002937026150000152
属于同一信号类别,
Figure BDA0002937026150000153
表示训练集中第j个样本对中的两个标注数据
Figure BDA0002937026150000154
属于不同的信号类别,nA表示标注数据总数量。本实施方式中,
Figure BDA0002937026150000155
np=nA/4,nd=nA/2,如此,可保证训练集TA的任意两个样本所用的标注数据
Figure BDA0002937026150000156
两两不同,保证训练集所用数据的丰富多样。
本实施例中,在测试阶段,将测试数据和支持集配对以输入模型。在单次K 通测试中,每个信号类别只有一个带标签的数据,因此将单次K通测试中的支 持集S和测试集TB的形式表示定义为:
Figure BDA0002937026150000157
Figure BDA0002937026150000158
本实施例中,针对每一个标签设有5个带标签的数据,以便建立Five-shot K-way测试,每个信号类别都有五个带标签的数据,支持集可以定义为: S={S1、S2、S3、S4、S5},其中S1到S5与One-shot K-way测试相同。 本实施例中,故障诊断模型的构建具体包括以下步骤。即,本实施例中,相当 于对每一个测试数据,建立5次不同的支持集,进行五次类别诊断;最后输出 概率最高的信号类别作为诊断结果。比如5次诊断的信号类别中有3次均为y1, 另外两次不同,则以y1作为诊断结果。
本实施例中,故障诊断模型的构建,具体如下。
第一步:度量样本对的高维特征f(xi)和f(xj)在高维空间中的距离,判断该 样本对是否属于同种信号类别:
D2(xi,xj,θ)=||f(xi,θ),f(xj,θ)||;
第三步:从Siamese网络输出特征向量的距离定义为 φ(xi,xj,θ)=sigmoid(FC(D2(xi,xj,θ))),这取决于它们的输出是完全相似还是完全不 同。
第四步:为了优化网络参数和不同信号类别的分类边界,为相同类别的样 本定义参数加权因子α,以使类别内特征之间的距离更近。类似地,为不同的 类定义另一个参数距离因子mr,以使类间距离更远,从而获得最优分类函数即 损失函数如下所示:
Figure BDA0002937026150000161
其中,
Figure BDA0002937026150000162
表示模型的第k次迭代训练中所采用的故障数据,
Figure BDA0002937026150000163
θk表示第k次迭代训练中模型的当前参数;当
Figure BDA0002937026150000164
两者标签相同, 则yk=1,反之,yk=0;mr为表示不同信号类别之间距离因子的常数,0<mr<1; α表示相同信号类别的权重因子,0<α<1;
Figure BDA0002937026150000165
表示L2正则项,其中λ为常 数,θi表示模型的第i个参数,n为模型中的参数总个数。
本实施例中,采用α=0.5,mr=0.7,具有较高的信号分类精度。
本实施例中,对不同的跨部件诊断结果如图7所示。可以看出,无论是一 个还是五个标注样本数据,所有跨类别故障诊断实验的分类精度均超过53%, 表明该故障诊断模型是有效的。任务A的故障分类准确度高于任务B和任务C。 任务A中的8个实验的最高准确度高达85%。任务C中的分类准确性最低。任 务C中8个实验的最低分类准确度是53.24%。可见,在测试阶段,部件B的信 号类别数据大于部件A的信号类别数量会影响故障诊断模型对部件B的诊断。
此外,在这三个任务中,五杆射击(Five-shot learing)的实验结果通常 比单杆射击(One-shot learing)的实验结果高约5%。例如,在任务A的单次 实验中,故障分类准确度从64.845%增加到79.629%,而在任务A的五次实验 中,故障分类准确度从69.913%增加到85.449%。该结果也是合理的,因为随 着标记样本的数量增加,类别之间的分类边界变得更加明显,从而导致更高的 分类精度。
从图7可以看出,在三个任务的8个实验中,无论是One-shot learing还 是Five-shot learing,随着训练样本数量的增加,测试数据的信号类别诊断的 结果会更好。
以上仅为本发明创造的较佳实施例而已,并不用以限制本发明创造,凡在 本发明创造的精神和原则之内所作的任何修改、等同替换和改进等,均应包含 在本发明创造的保护范围之内。

Claims (10)

1.一种基于小样本学习的跨类别故障诊断方法,其特征在于,包括以下步骤:
H1、构建故障诊断模型:获得部件A实际工作条件下的历史工作数据,对部件A的所述历史工作数据标注信号类别,形成标注数据;构建由两条所述标注数据组成的样本对,并对样本对中两条标注数据的信号类别的相同与否进行标注,获得由多个带标注的样本对组成的训练集,并结合训练集进行模型训练以获得故障诊断模型;
H2、建立支持集S:获得部件B实际工作条件下的历史工作数据,从部件B的所述历史工作数据中任选部分作为标注样本数据,并将剩余的历史工作数据作为部件B的测试数据;支持集包含部件B对应的所有信号类别,且每一个信号类别均关联有对应的标注样本数据;部件A和部件B为非同类部件;
H3、跨类别故障诊断:获得部件B的测试数据,将测试数据与支持集中的标注样本数据配对组成测试样本,通过故障诊断模型判断测试样本中的两个数据是否属于同一信号类别,获得支持集中与测试数据所属信号类别相同的标注样本数据,并获取该标注样本数据关联的信号类别作为测试数据的信号类别。
2.如权利要求1所述的基于小样本学习的跨类别故障诊断方法,其特征在于,步骤H1具体包括以下步骤:
H11、获得部件A实际工作条件下的历史工作数据并建立标注数据集合
Figure RE-FDA0003063491440000011
其中,
Figure RE-FDA0003063491440000012
表示部件A的历史工作数据;
Figure RE-FDA0003063491440000013
Figure RE-FDA0003063491440000014
的标签,表示
Figure RE-FDA0003063491440000015
归属的信号类别,nA表示DA中的标注数据数量;
H12、构建训练集,训练集中带标注的样本对包含同类样本数据
Figure RE-FDA0003063491440000016
和异类样本数据
Figure RE-FDA0003063491440000017
Figure RE-FDA0003063491440000018
Figure RE-FDA0003063491440000021
其中,np表示同类样本数据的总数,nd表示异类样本数据的总数,
Figure RE-FDA0003063491440000022
Figure RE-FDA0003063491440000023
表示标注数据
Figure RE-FDA0003063491440000024
属于同一信号类别,
Figure RE-FDA0003063491440000025
表示标注数据
Figure RE-FDA0003063491440000026
属于不同的信号类别;
H13、获得神经网络模型;
H14、从训练集中选择未被学习过的样本对作为学习对象,将学习对象带入所述神经网络模型,并计算损失函数;
H15、结合损失函数计算结果对所述神经网络模型进行参数更新,然后返回步骤H14;
H16、循环步骤H14和H15,对神经网络模型进行多次迭代修正后进行参数固定,获取参数固定后的神经网络模型作为故障诊断模型。
3.如权利要求2所述的基于小样本学习的跨类别故障诊断方法,其特征在于,步骤H14中,损失函数为:
Figure RE-FDA0003063491440000027
其中,
Figure RE-FDA0003063491440000028
表示所述神经网络模型的第k次迭代训练中所采用的样本对包含的标注数据,
Figure RE-FDA0003063491440000029
θk表示第k次迭代训练中神经网络模型的当前参数;当
Figure RE-FDA00030634914400000210
两者标签相同,则yk=1,反之,yk=0;
Figure RE-FDA00030634914400000211
Figure RE-FDA00030634914400000212
表示在第k次迭代训练中所采用的训练样本对
Figure RE-FDA00030634914400000213
对应的激活函数值;
mr为表示不同信号类别之间距离因子的常数,0<mr<1;α表示相同信号类别的权重因子,0<α<1;
Figure RE-FDA0003063491440000031
表示L2正则项,其中λ为常数,θi表示神经网络模型的第i个参数,n为神经网络模型中的参数总个数。
4.如权利要求3所述的基于小样本学习的跨类别故障诊断方法,其特征在于,φ(xi,xj,θ)=sigmoid(FC(D2(xi,xj,θ)));sigmoid表示激活函数,FC表示全连接层,D2(xi,xj,θ)表示样本对(xi,xj)在高维空间中的距离。
5.如权利要求3所述的基于小样本学习的跨类别故障诊断方法,其特征在于,训练集中包含的同类样本数据和异类样本数据数量相等,α=0.5,mr=0.7。
6.如权利要求1所述的基于小样本学习的跨类别故障诊断方法,其特征在于,步骤H2中建立的支持集S中,部件B对应的每一个信号类别均关联有n个对应的标注样本数据,步骤H3中执行n-shot K-way测试,以获得测试数据的信号类别。
7.如权利要求6所述的基于小样本学习的跨类别故障诊断方法,其特征在于,步骤H3具体包括:
H31、集合部件B的测试数据建立测试数据集合
Figure RE-FDA0003063491440000032
Figure RE-FDA0003063491440000033
表示部件B的测试数据,nB表示DB中的测试数据数量;
H32、结合测试数据集合DB和支持集S建立测试集TB
TB={T1 B...Ti-1 B、Ti B...Tn B}
Figure RE-FDA0003063491440000034
其中,t表示部件B对应的信号类别数量,n表示各信号类别关联的标注样本数据数量,
Figure RE-FDA0003063491440000041
表示部件B对应的第j个信号类别中的第i个标注样本数据,
Figure RE-FDA0003063491440000042
H33、将测试集TB输入故障诊断模型,获得测试集中各测试数据
Figure RE-FDA0003063491440000043
的信号类别。
8.如权利要求6所述的基于小样本学习的跨类别故障诊断方法,其特征在于,部件B对应的信号类别数量小于部件A对应的信号类别数量。
9.一种基于小样本学习的跨类别故障诊断系统,其特征在于,包括处理器和存储器;存储器存储有计算机程序,处理器用于在执行计算机程序时实现如权利要求1-8任一项所述的基于小样本学习的跨类别故障诊断方法。
10.一种存储介质,其特征在于,存储有计算机程序,所述计算机程序用于在被执行时实现如权利要求1-8任一项所述的基于小样本学习的跨类别故障诊断方法。
CN202110162062.2A 2021-02-05 2021-02-05 基于小样本学习的跨类别故障诊断方法、系统及存储介质 Active CN113011256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110162062.2A CN113011256B (zh) 2021-02-05 2021-02-05 基于小样本学习的跨类别故障诊断方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110162062.2A CN113011256B (zh) 2021-02-05 2021-02-05 基于小样本学习的跨类别故障诊断方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN113011256A true CN113011256A (zh) 2021-06-22
CN113011256B CN113011256B (zh) 2022-11-15

Family

ID=76383869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110162062.2A Active CN113011256B (zh) 2021-02-05 2021-02-05 基于小样本学习的跨类别故障诊断方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113011256B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407796A (zh) * 2023-12-15 2024-01-16 合肥工业大学 一种跨部件小样本故障诊断方法、系统和存储介质
CN117493980A (zh) * 2023-12-29 2024-02-02 合肥工业大学 一种集成特征提取和排序因果发现的轴承故障诊断方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104488238A (zh) * 2012-07-23 2015-04-01 思科技术公司 用于网络环境中集群链路聚合控制的系统和方法
CN109766921A (zh) * 2018-12-19 2019-05-17 合肥工业大学 一种基于深度领域自适应的振动数据故障分类方法
CN111275024A (zh) * 2020-03-22 2020-06-12 东北电力大学 含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法
US20200257970A1 (en) * 2019-02-08 2020-08-13 Korea Advanced Institute Of Science And Technology Data processing apparatus by learning of neural network, data processing method by learning of neural network, and recording medium recording the data processing method
CN111695209A (zh) * 2020-05-13 2020-09-22 东南大学 元深度学习驱动的旋转机械小样本健康评估方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104488238A (zh) * 2012-07-23 2015-04-01 思科技术公司 用于网络环境中集群链路聚合控制的系统和方法
CN109766921A (zh) * 2018-12-19 2019-05-17 合肥工业大学 一种基于深度领域自适应的振动数据故障分类方法
US20200257970A1 (en) * 2019-02-08 2020-08-13 Korea Advanced Institute Of Science And Technology Data processing apparatus by learning of neural network, data processing method by learning of neural network, and recording medium recording the data processing method
CN111275024A (zh) * 2020-03-22 2020-06-12 东北电力大学 含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法
CN111695209A (zh) * 2020-05-13 2020-09-22 东南大学 元深度学习驱动的旋转机械小样本健康评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XU J ET AL: "《DC-NNMN:Across Components Fault Diagnosis Based on Deep Few-Shot Learning》", 《HINDAWI》 *
吴昀璞: "《基于孪生卷积网络的高速列车转向架故障辨识》", 《系统仿真学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117407796A (zh) * 2023-12-15 2024-01-16 合肥工业大学 一种跨部件小样本故障诊断方法、系统和存储介质
CN117407796B (zh) * 2023-12-15 2024-03-01 合肥工业大学 一种跨部件小样本故障诊断方法、系统和存储介质
CN117493980A (zh) * 2023-12-29 2024-02-02 合肥工业大学 一种集成特征提取和排序因果发现的轴承故障诊断方法
CN117493980B (zh) * 2023-12-29 2024-03-19 合肥工业大学 一种集成特征提取和排序因果发现的轴承故障诊断方法

Also Published As

Publication number Publication date
CN113011256B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
CN113128561A (zh) 一种机床轴承故障诊断方法
CN111046945B (zh) 基于组合卷积神经网络的故障类型及损坏程度诊断方法
CN111914883B (zh) 一种基于深度融合网络的主轴轴承状态评估方法及装置
CN111340238A (zh) 一种工业系统的故障诊断方法、装置、设备及存储介质
CN110110768B (zh) 基于并行特征学习和多分类器的滚动轴承故障诊断方法
CN112257530B (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN113011256B (zh) 基于小样本学习的跨类别故障诊断方法、系统及存储介质
CN111580506A (zh) 基于信息融合的工业过程故障诊断方法
CN112765890B (zh) 基于动态域适应网络的多工况旋转机械剩余寿命预测方法
CN113378725A (zh) 一种基于多尺度-通道注意力网络的刀具故障诊断方法、设备及存储介质
CN111753891A (zh) 一种无监督特征学习的滚动轴承故障诊断方法
CN114091504A (zh) 一种基于生成对抗网络的旋转机械小样本故障诊断方法
CN115859077A (zh) 一种变工况下多特征融合的电机小样本故障诊断方法
CN115267557B (zh) 一种锂电池电解液泄露故障诊断方法、装置和电子设备
CN112816881A (zh) 电池压差异常检测方法、装置及计算机存储介质
CN114462480A (zh) 基于非均衡数据集下的多源传感器轧机故障诊断的方法
CN116956215A (zh) 一种传动系统故障诊断方法及系统
Di et al. Fault diagnosis of rotating machinery based on domain adversarial training of neural networks
CN113237619B (zh) 变转速旋转机械振动的故障预警方法、装置、设备以及存储介质
CN104499001B (zh) 基于特征子空间优化相对矩阵的铝电解槽况诊断方法
CN117669388A (zh) 故障样本生成方法、装置、计算机介质
CN111783941B (zh) 一种基于概率置信度卷积神经网络的机械设备诊断分类方法
Jianhui et al. New fault diagnosis method for rolling bearing based on PCA
CN116644348A (zh) 基于传递式对抗迁移的跨机械部件故障诊断方法及装置
CN115931318A (zh) 故障智能诊断方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant