CN114444222A - 相似度计算模型、跨类别数据诊断模型、方法和系统 - Google Patents

相似度计算模型、跨类别数据诊断模型、方法和系统 Download PDF

Info

Publication number
CN114444222A
CN114444222A CN202210042911.5A CN202210042911A CN114444222A CN 114444222 A CN114444222 A CN 114444222A CN 202210042911 A CN202210042911 A CN 202210042911A CN 114444222 A CN114444222 A CN 114444222A
Authority
CN
China
Prior art keywords
data
category
model
cross
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210042911.5A
Other languages
English (en)
Inventor
徐娟
罗名辰
吕增威
樊玉琦
丁煦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202210042911.5A priority Critical patent/CN114444222A/zh
Publication of CN114444222A publication Critical patent/CN114444222A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种相似度计算模型、跨类别数据诊断模型、方法和系统;本发明中给出的跨类别数据诊断模型,由相似度计算模型和设定的输出层组成,输出层用于根据相似度计算模型的输出获取每一个测试对象相似度最大的标注样本的类别,并将该类别作为测试对象所属类别。如此,本发明中的跨类别数据诊断模型基于数据在特征向量空间中的相似度对数据进行分类,通用性广,可以有效地将学习到的数据分类知识在不同类别的部件之间进行转移;其中源部件包含大量标注样本,而目标部件的每个故障类别中只有几个标注样本,采用源部件的历史工作数据训练跨类别数据诊断模型,避免了目标部件数据收集困难和标注困难的问题。

Description

相似度计算模型、跨类别数据诊断模型、方法和系统
技术领域
本发明涉及数据类别诊断和机械故障诊断领域,尤其涉及一种相似度计算模型、跨类别数据诊断模型、方法和系统。
背景技术
研究先进的机械故障诊断方法是保障设备与人员安全的重要内容,其中,轴承和齿轮是旋转机械中最为重要的机械零件,广泛应用于电力、化工、冶金、航空等各个重要领域,同时也是最容易损坏的元件,它们的性能和工况的好坏会直接影响到整台机器设备的性能,还会导致设备产生异常振动和噪声,甚至造成设备损坏。因此,对滚动轴承和齿轮进行故障诊断,尤其对它们早期故障的分析,尤为重要。
现有技术中,深度学习理论以其强大的建模和表征能力成为数据驱动的智能故障诊断领域中最活跃的研究方向之一,基于深度学习的故障诊断框架具有强大的特征学习能力,能够通过多个隐藏层直接从原始传感器数据中学习分层表示,并自动选择有利于识别的特征,准确的进行故障分类。但是,在实际工业中,由于故障数据的收集和标注困难,数据集往往比基准数据集要小的多。此外,收集的故障数据可能来自具有不同类别的机械部件,比如轴承和齿轮。在面对少量标记样本和面对新的部件时,深度网络模型的泛化能力不足。
发明内容
为了解决上述现有技术中深度网络模型无法在可供学习的标记样本少的情况下实现跨类别高精度故障诊断的缺陷,本发明提出了一种相似度计算模型、跨类别数据诊断模型、方法和系统。
本发明的目的之一提出了一种相似度计算模型,用于计算数据之间的相似度,以便基于未标注数据和标注数据之间的相似度,为未标注数据分类,以便根据数据分类获知指向部件故障的数据,从而实现故障诊断;该相似度计算模型的训练样本和测试样本可来自不同的部件工作数据,方便了训练样本的收集。
一种相似度计算模型,基于神经网络模型通过样本训练获得;神经网络模型包括快速傅里叶变换模块、第一神经网络和第二神经网络,快速傅里叶变换模块用于获取输入数据的幅值特征,第一神经网络用于根据幅值特征构建输入数据的特征向量,第二神经网络模型用于计算特征向量之间的相似度;
快速傅里叶变换模块的输入为输入数据,其输出为各输入数据对应的幅值特征;第一神经网络的输入为快速傅里叶变换模块的输出,第一神经网络的输出为特征向量;第二神经网络的输入为第一神经网络的输出,第二神经网络模型的输出为测试集中每一个数据与支持集中各数据的相似度;
所述神经网络模型训练所用损失函数L为:
L=β×Lre+(1-β)×Ltr
Figure BDA0003471047410000021
Figure BDA0003471047410000022
其中,β为平衡因子,Lre、Ltr为过度参数;
c表示数据类别数量,k表示样本集S中每一个类别下的数据数量,m表示查询集Q中每一个类别下的数据数量;w、i、j均表示序号;[]+表示取值函数,括号内大于零取本身值,括号内小于零取零;
将样本集S中数据对应的特征向量和查询集Q中数据对应的特征向量记作向量空间Z,fw表示向量空间Z中任一个特征向量,
Figure BDA0003471047410000023
表示向量空间Z中与特征向量fw同一类别且距离最远的特征向量,
Figure BDA0003471047410000024
表示向量空间Z中与特征向量fw不同类别且距离最近的特征向量,||·||2表示欧氏距离,α表示人工设置的超参数;
1(yi==yj)表示过渡参数,如果yi=yj,则1(yi==yj)取1;如果yi≠yj,1(yi==yj)取0;样本集
Figure BDA0003471047410000031
查询集
Figure BDA0003471047410000032
xi、xj表示源部件A实际工况下的历史工作数据,yi、yj分别为数据xi、xj的标签,标签与类别一一对应;
设置源数据集DA用于收集源部件A实际工况下的历史工作数据,样本集S和查询集Q由源数据集DA分割形成,DA=S∪Q,
Figure BDA0003471047410000033
优选的,该模型通过以下步骤训练获得:
S1、从源部件A实际工况下的历史工作数据中获取源数据集DA,源数据集DA中的数据均标注有类别;
S2、将源数据集DA分割为样本集S和查询集Q;
S3、构建神经网络模型;
S4、设置神经网络模型的损失函数L,并结合样本集S、查询集Q和损失函数L训练神经网络模型,获得训练完成的神经网络模型作为相似度计算模型。
优选的,k≤20;0.3≤α≤0.5;0.2≤β≤0.8。
优选的,k=1时,β=0.4;k=3时,β=0.5;k=5时,β=0.2。
优选的,所述类别包括表示部件正常工作的正常类别和表示部件工作异常的故障类别,故障类别包括多个且分别指向不同的故障表征。
本发明的目的之二提出了一种跨类别数据诊断模型,基于未标注数据和标注数据之间的相似度,将未标注数据归入与其相似度最高的标注数据的类别;该跨类别数据诊断模型基于上述的相似度计算模型构建,可用于跨类别信号分类;即可采用通过易于采集源部件A的历史工作数据训练获得的跨类别数据诊断模型实现对不易采集的目标部件B的历史工作数据的分类和故障诊断。
一种跨类别数据诊断模型,包括:所述的相似度计算模型和设定的输出层;相似度计算模型的输入端作为该跨类别数据诊断模型的输入端,用于输入收集标注样本的支持集S’和收集测试样本的测试集T;标注样本和测试样本为同一部件的历史工作数据;
输出层的输入为相似度计算模型的输出,即各测试样本相对于每一个标注样本的相似度;输出层的输出端作为该跨类别数据诊断模型的输出端,用于输出被标注的测试样本,测试样本的标签为与测试对象相似度最大的标注样本的标签。
本发明的目的之三还提出了一种跨类别数据诊断方法,结合该方法可通过上述的跨类别数据诊断模型对与模型训练不同来源的数据进行分类诊断,从而实现跨零部件类别的故障诊断。例如采用该方法可结合轴承工作数据训练跨类别数据诊断模型,并通过该跨类别数据诊断模型对齿轮工作数据进行故障诊断。
一种跨类别数据诊断方法,包括以下步骤:
SB1、获得目标部件B实际工况下的历史工作数据构成目标数据集DB,假设目标数据集DB中的数据可分为
Figure BDA0003471047410000041
个类别,类别空间记作
Figure BDA0003471047410000042
Figure BDA0003471047410000043
表示类别序号,
Figure BDA0003471047410000044
表示第
Figure BDA0003471047410000045
个类别对应的标签,
Figure BDA0003471047410000046
SB2、将目标数据集DB分割为第一数集和第二数集,对第一数集中的数据进行标注,标注后的第一数集作为支持集S',第二数集作为测试集T,
Figure BDA0003471047410000047
Figure BDA0003471047410000048
表示标注后支持集S'中每个类别下的样本数量,n表示测试集T中的样本数量,
Figure BDA0003471047410000049
表示支持集S'中第i个样本xi的标签为
Figure BDA00034710474100000410
Figure BDA00034710474100000411
xj表示测试集中第j个测试样本;
SB3、将支持集S'和测试集T输入所述的跨类别数据诊断模型,获得跨类别数据诊断模型的输出,跨类别数据诊断模型的输出可表示为:
Figure BDA00034710474100000412
Figure BDA00034710474100000413
表示测试样本xj的标签,
Figure BDA00034710474100000414
优选的,所述源部件A和目标部件B均为转动部件。
优选的,支持集S'中每个类别下的标注样本数量
Figure BDA00034710474100000415
与样本集S中每个类别下的标注样本数量k相等。
本发明的目的之四还提出了一种跨类别数据诊断系统,用于承载上述跨类别数据诊断模型,并实现上述跨类别数据诊断方法,以实现跨类别的零部件故障诊断。
一种跨类别数据诊断系统,其特征在于,包括第一存储模块和第二存储模型和处理器,第一存储模型中存储有所述的跨类别数据诊断模型,第二存储模块中存储有计算机程序,所述处理器用于执行所述计算机程序以实现所述的跨类别数据诊断方法。
本发明的优点在于:
(1)本发明提供的相似度计算模型,首先将数据转换为特征向量,然后根据数据对应的特征向量之间的距离计算数据之间的相似度。本发明中,损失函数分为两部分:基于困难三元组构建的第一损失函数,基于关系损失构建的第二损失函数。如此,本发明中自重训练获得的相似度计算模型保证了特征向量构建和特征向量相关度计算的精确,从而保证了对数据之间相似度判定的精确,实现了根据少量的标注数据样本基于数据相似度对数据的精确分类。基于本发明提供的相似度计算模型,可将机械零部件的故障诊断问题转换为根据不同故障类别的样本表征对数据进行分类的问题。
(2)本发明中的相似度计算模型引入了向量空间,根据转换后的特征向量之间的距离计算相似度,其训练可通过少量样本实现,且训练完成的模型可实现跨类别数据相似度的识别。
(3)本发明中,样本集S中的同一类数据不超过20个,实现了少样本学习,降低了模型训练难度。
(4)本发明中,超参数α在数值区间[0.3,0.5]上取值时,获得的跨类别数据诊断模型精度更高,且模型收敛性更好。
(5)本发明中,平衡因子β在0.2到0.8之间取值时,有利于提高跨类别数据诊断模型的精度,说明基于困难三元组损失的关系损失对模型训练效果更佳。具体的,k为样本集S中同类数据数量,当k=1时,β=0.4;k=3时,β=0.5;k=5时,β=0.2,跨类别数据诊断模型泛化性能最佳。
(6)本发明中给出了一种跨类别数据诊断模型,由相似度计算模型和设定的输出层组成,输出层用于根据相似度计算模型的输出获取每一个测试对象相似度最大的标注样本的类别,并将该类别作为测试对象所属类别。如此,本发明中的跨类别数据诊断模型基于数据在特征向量空间中的相似度对数据进行分类,通用性广,可以有效地将学习到的数据分类知识在不同类别的部件之间进行转移;其中源部件包含大量标注样本,而目标部件的每个故障类别中只有几个标注样本,采用源部件的历史工作数据训练跨类别数据诊断模型,避免了目标部件数据收集困难和标注困难的问题。
(7)本发明中,小样本的类别诊断问题被转换为相似度度量问题,而不是单纯的特征加权分类问题。模型训练时将源部件上的数据集分成样本集和查询集,模型测试时目标部件上的数据集分成支持集和测试集,通过组合样本集和查询集的样本,形成一系列元任务,通过对不同元任务的学习,使得跨类别数据诊断模型面对新部件测试样本时,可以借助支持集对其进行有效的故障分类。
(8)本发明中,通过第一损失函数的设置,使得相似度计算模型可机芯特征向量转换时,可拉近同类别的数据的特征向量,拉远不同类别的数据的特征向量,从而提高跨类别数据诊断模型的精度。训练时将样本集和查询集中的特征向量统一到向量空间中,向量空间中每个特征向量依次作为锚点,通过锚点与同类别特征向量的最大距离以及锚点与不同类别特征向量的最小距离来度量对困难样本的识别。然后,结合作为第一损失函数的三元组损失函数,以最小化锚点与同类别特征向量的最大距离之间的距离,并最大化锚点不同类别特征向量的最小距离,这使得模型能够学习到一个良好的故障表征,从而进一步提高数据分类精度。
(9)机械部件的故障诊断,实际上也是以故障特征为类别的数据分类方法,因此,本发明提供的跨类别数据诊断方法,也适用于机械部件的故障诊断,且实现为一种小样本学习的跨类别故障诊断方法。
附图说明
图1为一种相似度计算模型的训练方法流程图;
图2为一种跨类别数据诊断方法流程图;
图3为齿轮试验台内部结构;
图3中图示为:1、转速计;2、电动机;3、加速度计;4、第一级输入轴;5、第二级输入轴;6、磁性制动器;7、输出轴。
图4为表1所示实施例的数据统计图;
图5为α=0.3时任务C2中获得的跨类别数据诊断模型的收敛情况;
图6为α=0.5时任务C2中获得的跨类别数据诊断模型的收敛情况;
所述收敛情况即模型精度与训练次数的对应关系;
图7为任务A1中β取不同值时对跨类别故障分类模型的影响;
图8为任务A2中β取不同值时对跨类别故障分类模型的影响;
图9为任务A3中β取不同值时对跨类别故障分类模型的影响。
具体实施方式
实施例1
本实施例中提供了一种相似度计算模型,该相似度计算模型基于神经网络模型构建,其输入为由标注样本构成的支持集S’和由未标注的测试样本构成的测试集T,其输出为测试集T中各测试样本相对于支持集S’中各标注样本的相似度。
该相似度计算模型包括:快速傅里叶变换模块、第一神经网络和第二神经网络,
参照图1,该相似度计算模的训练包括以下步骤:
S1、从源部件A实际工况下的历史工作数据中获取源数据集DA,源数据集DA中的数据均标注有类别,所述类别包括正常和c-1个故障类别,类别空间记作YA={y1,y2,...,yc};
S2、将源数据集DA分割为样本集
Figure BDA0003471047410000081
和查询集
Figure BDA0003471047410000082
xi、xj表示源部件A实际工况下的历史工作数据,yi、yj分别为数据xi、xj的标签,yi∈YA、yj∈YA,DA=S∪Q,
Figure BDA0003471047410000083
c表示类别数量,k表示样本集S中每个类别下的数据数量,m表示查询集Q中每个类别下的数据数量,i、j表示序数;
S3、构建神经网络模型,神经网络模型包括快速傅里叶变换模块、第一神经网络和第二神经网络;
快速傅里叶变换模块用于将样本集S中的数据和查询集Q中的数据进行快速傅里叶变换以得到幅值特征;
第一神经网络的输入为快速傅里叶变换模块输出的样本集S和查询集Q中各数据对应的幅值特征,其输出为根据幅值特征构建的特征向量;将样本集S中数据xi对应的特征向量记作fi,将查询集Q中数据xj对应的特征向量记作fj;第二神经网络的的输入为特征向量fi和fj,输出为特征向量fi和fj的相似度ri,j
S4、设置神经网络模型的损失函数L,并结合样本集S、查询集Q和损失函数L训练神经网络模型,获得训练完成的神经网络模型作为相似度计算模型。
本实施方式中的神经网络模型训练所用的损失函数L由第一损失函数Ltr和第二损失函数Lre组成。
第一损失函数Ltr基于困难三元组构建,其设置为:
Figure BDA0003471047410000084
其中,c表示数据类别数量,k表示样本集S中每一个类别下的数据数量,m表示查询集Q中每一个类别下的数据数量;[]+表示取值函数,括号内大于零取本身值,括号内小于零取零;
将样本集S中数据对应的特征向量和查询集Q中数据对应的特征向量记作向量空间Z,fw表示向量空间Z中任一个特征向量,
Figure BDA0003471047410000091
表示向量空间Z中与特征向量fw同一类别且距离最远的特征向量,
Figure BDA0003471047410000092
表示向量空间Z中与特征向量fw不同类别且距离最近的特征向量,||·||2表示欧氏距离,α表示人工设置的超参数。
通过上述损失函数Ltr,使得第一神经网络在进行特征向量转换时,可拉近样本集S和查询集Q的并集中属于同一类别的数据对应的特征向量的距离,并拉远样本集S和查询集Q的并集中不属于同一类别的数据对应的特征向量的距离,从而为后续特征向量之间相似度的计算奠定基础。
第二神经网络模型用于计算特征向量之间的相似度。第二神经网络包括关系度量模块Gr和全连接层FC。
关系度量模块Gr用于构建特征向量fi和fj的关系向量gi,j,具体的关系度量模块Gr的输入可采用特征向量fi和fj拼接成的元训练任务concat(fi,fj),即:
gi,j=Gr(concat(fi,fj);θr);
其中,θr表示关系度量模块Gr的网络参数。
全连接层FC用于根据关系向量gi,j计算特征向量记作fi和fj之间的相似度ri,j,即:
Figure BDA0003471047410000093
其中,
Figure BDA0003471047410000094
表示全连接层FC的网络参数;
第二损失函数Lre设置为:
Figure BDA0003471047410000095
其中,c表示数据类别数量,k表示样本集S中每一个类别下的数据数量,m表示查询集Q中每一个类别下的数据数量;1(yi==yj)表示过渡参数,如果yi=yj,则1(yi==yj)取1;如果yi≠yj,1(yi==yj)取0。
具体实施时,样本集S和查询集Q也可以记作如下形式:
Figure BDA0003471047410000101
Figure BDA0003471047410000102
其中xSt-h表示样本集S中第t个类别下的第h个数据,yt表示数据xSt-h的标签;xQu-v表示查询集Q中第u个类别下的第v个数据,yu表示数据xQu-v的标签;1≤t≤c,1≤h≤k,1≤u≤c,1≤v≤m。
结合公式(2)(3),第二神经网络的损失函数Lre也可以写成:
Figure BDA0003471047410000103
1(yt==yu)表示过渡参数,如果yt=yu,则1(yt==yu)取1;如果yt≠yu,1(yt==yu)取0。
通过第二损失函数Lre可确保第二神经网络对特征向量之间的相似度的精确计算。
本实施方式中,损失函数L的计算公式为:
L=β×Lre+(1-β)×Ltr
其中,β为平衡因子。
如此,具体实施时,可根据样本集S中的标注样本和查询集Q中的标注样本结合损失函数L训练相似度计算模型,具体训练时,可设置损失函数L的目标值作为训练结束条件,或者设置循环次数作为训练结束条件。
实施例2:跨类别数据诊断模型
本实施例中的跨类别数据诊断模型由实施例1提供的相似度计算模型和设定的输出层组成,输出层用于根据相似度计算模型的输出获取每一个测试对象相似度最大的标注样本的类别,并将该类别作为测试对象所属类别。即输出层的输入为相似度计算模型的输出,输出层的输出为各测试对象的类别,或者为标注后的测试对象。
如此,通过本实施例中的跨类别数据诊断模型诊断测试数据的类别时,只需要提供少量的标注样本作为支持集,便可通过跨类别数据诊断模型获得测试数据的类别。具体实施时,支持集中每个类别的标注样本数量可在1-20之间取值,例如3或者5等。
参照图2,通过该跨类别数据诊断模型对目标数据集DB进行数据分类时,步骤如下:
SB1、获得目标部件B实际工况下的历史工作数据构成目标数据集DB,假设目标数据集DB中的数据可分为
Figure BDA0003471047410000111
个类别,类别空间记作
Figure BDA0003471047410000112
Figure BDA0003471047410000113
表示类别序号,
Figure BDA0003471047410000114
SB2、将目标数据集DB分割为第一数集和第二数集,对第一数集中的数据进行标注,标注后的第一数集作为支持集S',第二数集作为测试集T,
Figure BDA0003471047410000121
Figure BDA0003471047410000122
表示标注后支持集S'中每个类别下的样本数量,n表示测试集T中的样本数量,
Figure BDA0003471047410000123
表示支持集S'中第i个样本的标签为
Figure BDA0003471047410000124
Figure BDA0003471047410000125
xj表示测试集中第j个测试样本。
具体实施时,支持集还可采用如下表述方式:
Figure BDA0003471047410000126
其中t、h表示序数,
Figure BDA0003471047410000127
xSt-h表示支持集S'中第t个类别下的第h个样本,
Figure BDA0003471047410000128
表示类别。
SB3、将支持集S'和测试集T输入跨类别数据诊断模型,获得跨类别数据诊断模型的输出。具体的,跨类别数据诊断模型的输出可表示为:
Figure BDA0003471047410000129
Figure BDA00034710474100001210
表示测试样本xj的标签,
Figure BDA00034710474100001211
以下结合几个具体的实施例,对本发明提供的跨类别数据诊断模型的精度进行验证,验证结果如下表所示。
表1:十二个跨部件故障诊断任务描述
Figure BDA00034710474100001212
Figure BDA0003471047410000131
表1所示实施例均满足
Figure BDA0003471047410000132
表1中,各源数据集描述如下:
CWRU数据集:该试验台由2HP电机(左),扭矩传感器(中),测力计(右)、电子控制设备和加速度传感器采集振动信号。该试验台使用电火花加工(EDM)技术对轴承设置不同尺寸的单点点蚀故障,故障直径分别为0.007、0.014、0.021英尺。每个故障直径包含四个故障类别:滚动体故障(BF)、内圈故障(IF)、外圈故障(OF)和正常(N)状态。与此同时,故障轴承安装在两个不同的位置,驱动端(DE)和风扇端(FE)。本次试验过程中该CWRU数据集构建80个类别,如表2所示。
表2用CWRU数据集构建出80个类别
Figure BDA0003471047410000133
Figure BDA0003471047410000141
CWRU数据集中,故障状态中的正常N表示未显示故障的工作状态,这里为了便于表述,将滚动体故障(BF)、内圈故障(IF)、外圈故障(OF)和正常(N)同一命名故障状态。
来自实验室自建实验台的轴承数据集:实验室自建实验台采用带柔性联轴器的三相电机控制轴承的转速,并在轴承座上放置加速度传感器采集振动信号。实验室轴承包含五个数据类型:滚动体故障(BF),内圈故障,外圈故障和滚动体外圈复合故障(BOF)和正常状态。实验室中模拟实际工作情况对实验台的振动信号进行采集,采样频率是128kHz。
Uconn大学公开齿轮数据集:齿轮传动试验台中由电动机2控制齿轮的速度。扭矩是由磁性制动器6提供的,可以通过磁性制动器6来调节输入电压。齿轮传动试验台如图3所示,一个32齿小齿轮和一个80齿齿轮安装在第一级输入轴4上。第二级输入轴5包括一个48齿小齿轮和一个64齿齿轮。输入轴的速度由转速计1测量,并且振动信号由加速度计3收集。信号由dSPACE(DS1006处理器板,dSPACE Inc.)记录。采样频率为20kHz。传动装置数据集包含五个故障类别:健康,缺齿,剥落,根裂纹,和碎屑5a,其中5a表示的故障严重程度。
图4为表1对应的统计图。结合表1、图4可知,无论支持集每个类别只包含1个、3个或5个标注样本,所有跨部件故障诊断实验的平均分类精度均超过79.66%,表明该跨类别数据诊断模型是有效的。
图5、图6为相似度计算模型的训练次数和跨类别数据诊断模型的精确度之间的关系,横坐标为训练次数,纵坐标表示精确度。具体的,图5所示为α=0.3时任务C2中获得的跨类别数据诊断模型的收敛情况,图6所示为α=0.5时任务C2中获得的跨类别数据诊断模型的收敛情况,所述收敛情况即模型精度与训练次数的对应关系,可见α=0.5时,训练获得的跨类别数据诊断模型精度更高,且模型收敛性更好。
本实验中关于任务A1、A2和A3做了损失函数平衡因子β的实验,针对不同占比来验证两个损失函数对模型性能的影响,数据统计如下表3、表4、表5所示。
表3:任务A1\A2\A3中模型精度与平衡因子β的对应关系
Figure BDA0003471047410000151
Figure BDA0003471047410000161
图7、图8、图9为表3中的数据表征图,结合表3、图7-图8可知,当β为0时,只有第一损失函数作为优化目标训练获得跨类别数据诊断模型,模型性能具有较差的分类准确率,任务A1中跨类别数据诊断模型的精确度在22%到40%之间波动,任务A2和A3中跨类别数据诊断模型的精确度低于20%,结果表明仅仅依靠第一损失函数(困难三元组损失)是不可行的。当β为1时,只有第二损失函数作为优化目标训练获得的别诊断模型,与只有第一函数作为优化目标相比,精度有大幅增加了55%~65%,直接反映出关系网络在数据分类中的应用潜力。当Task A1中β为0.4,Task A2中β为0.5时,TaskA3中β为0.2时,获得的跨类别数据诊断模型泛化性能最佳,这说明基于困难三元组损失的关系损失可以达到更佳效果。
以上仅为本发明创造的较佳实施例而已,并不用以限制本发明创造,凡在本发明创造的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明创造的保护范围之内。

Claims (10)

1.一种相似度计算模型,其特征在于,基于神经网络模型通过样本训练获得;神经网络模型包括快速傅里叶变换模块、第一神经网络和第二神经网络,快速傅里叶变换模块用于获取输入数据的幅值特征,第一神经网络用于根据幅值特征构建输入数据的特征向量,第二神经网络模型用于计算特征向量之间的相似度;
快速傅里叶变换模块的输入为输入数据,其输出为各输入数据对应的幅值特征;第一神经网络的输入为快速傅里叶变换模块的输出,第一神经网络的输出为特征向量;第二神经网络的输入为第一神经网络的输出,第二神经网络模型的输出为测试集中每一个数据与支持集中各数据的相似度;
所述神经网络模型训练所用损失函数L为:
L=β×Lre+(1-β)×Ltr
Figure FDA0003471047400000011
Figure FDA0003471047400000012
其中,β为平衡因子,Lre、Ltr为过度参数;
c表示数据类别数量,k表示样本集S中每一个类别下的数据数量,m表示查询集Q中每一个类别下的数据数量;w、i、j均表示序号;[]+表示取值函数,括号内大于零取本身值,括号内小于零取零;
将样本集S中数据对应的特征向量和查询集Q中数据对应的特征向量记作向量空间Z,fw表示向量空间Z中任一个特征向量,
Figure FDA0003471047400000013
表示向量空间Z中与特征向量fw同一类别且距离最远的特征向量,
Figure FDA0003471047400000014
表示向量空间Z中与特征向量fw不同类别且距离最近的特征向量,||·||2表示欧氏距离,α表示人工设置的超参数;
1(yi==yj)表示过渡参数,如果yi=yj,则1(yi==yj)取1;如果yi≠yj,1(yi==yj)取0;样本集
Figure FDA0003471047400000021
查询集
Figure FDA0003471047400000022
xi、xj表示源部件A实际工况下的历史工作数据,yi、yj分别为数据xi、xj的标签,标签与类别一一对应;
设置源数据集DA用于收集源部件A实际工况下的历史工作数据,样本集S和查询集Q由源数据集DA分割形成,DA=S∪Q,
Figure FDA0003471047400000023
2.如权利要求1所述的相似度计算模型,其特征在于,该模型通过以下步骤训练获得:
S1、从源部件A实际工况下的历史工作数据中获取源数据集DA,源数据集DA中的数据均标注有类别;
S2、将源数据集DA分割为样本集S和查询集Q;
S3、构建神经网络模型;
S4、设置神经网络模型的损失函数L,并结合样本集S、查询集Q和损失函数L训练神经网络模型,获得训练完成的神经网络模型作为相似度计算模型。
3.如权利要求1所述的相似度计算模型,其特征在于,k≤20;0.3≤α≤0.5;0.2≤β≤0.8。
4.如权利要求3所述的相似度计算模型,其特征在于,k=1时,β=0.4;k=3时,β=0.5;k=5时,β=0.2。
5.如权利要求1所述的相似度计算模型,其特征在于,所述类别包括表示部件正常工作的正常类别和表示部件工作异常的故障类别,故障类别包括多个且分别指向不同的故障表征。
6.一种跨类别数据诊断模型,其特征在于,包括:如权利要求1至5任一项所述的相似度计算模型和设定的输出层;相似度计算模型的输入端作为该跨类别数据诊断模型的输入端,用于输入收集标注样本的支持集S’和收集测试样本的测试集T;标注样本和测试样本为同一部件的历史工作数据;
输出层的输入为相似度计算模型的输出,即各测试样本相对于每一个标注样本的相似度;输出层的输出端作为该跨类别数据诊断模型的输出端,用于输出被标注的测试样本,测试样本的标签为与测试对象相似度最大的标注样本的标签。
7.一种跨类别数据诊断方法,其特征在于,包括以下步骤:
SB1、获得目标部件B实际工况下的历史工作数据构成目标数据集DB,假设目标数据集DB中的数据可分为
Figure FDA0003471047400000031
个类别,类别空间记作
Figure FDA0003471047400000032
Figure FDA0003471047400000033
表示类别序号,
Figure FDA0003471047400000034
表示第
Figure FDA0003471047400000035
个类别对应的标签,
Figure FDA0003471047400000036
SB2、将目标数据集DB分割为第一数集和第二数集,对第一数集中的数据进行标注,标注后的第一数集作为支持集S',第二数集作为测试集T,
Figure FDA0003471047400000037
Figure FDA0003471047400000038
表示标注后支持集S'中每个类别下的样本数量,n表示测试集T中的样本数量,
Figure FDA0003471047400000039
表示支持集S'中第i个样本xi的标签为
Figure FDA00034710474000000310
Figure FDA00034710474000000311
xj表示测试集中第j个测试样本;
SB3、将支持集S'和测试集T输入如权利要求6所述的跨类别数据诊断模型,获得跨类别数据诊断模型的输出,跨类别数据诊断模型的输出可表示为:
Figure FDA00034710474000000312
Figure FDA00034710474000000313
表示测试样本xj的标签,
Figure FDA00034710474000000314
8.如权利要求7所述的跨类别数据诊断方法,其特征在于,所述源部件A和目标部件B均为转动部件。
9.如权利要求8所述的跨类别数据诊断方法,其特征在于,支持集S'中每个类别下的标注样本数量
Figure FDA00034710474000000315
与样本集S中每个类别下的标注样本数量k相等。
10.一种跨类别数据诊断系统,其特征在于,包括第一存储模块和第二存储模型和处理器,第一存储模型中存储有如权利要求8所述的跨类别数据诊断模型,第二存储模块中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求9所述的跨类别数据诊断方法。
CN202210042911.5A 2022-01-14 2022-01-14 相似度计算模型、跨类别数据诊断模型、方法和系统 Pending CN114444222A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210042911.5A CN114444222A (zh) 2022-01-14 2022-01-14 相似度计算模型、跨类别数据诊断模型、方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210042911.5A CN114444222A (zh) 2022-01-14 2022-01-14 相似度计算模型、跨类别数据诊断模型、方法和系统

Publications (1)

Publication Number Publication Date
CN114444222A true CN114444222A (zh) 2022-05-06

Family

ID=81367900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210042911.5A Pending CN114444222A (zh) 2022-01-14 2022-01-14 相似度计算模型、跨类别数据诊断模型、方法和系统

Country Status (1)

Country Link
CN (1) CN114444222A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114593917A (zh) * 2022-03-08 2022-06-07 安徽理工大学 一种基于三元组模型的小样本轴承故障诊断方法
CN114802425A (zh) * 2022-05-09 2022-07-29 中国第一汽车股份有限公司 一种电机输出扭矩确定方法、装置、设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114593917A (zh) * 2022-03-08 2022-06-07 安徽理工大学 一种基于三元组模型的小样本轴承故障诊断方法
CN114802425A (zh) * 2022-05-09 2022-07-29 中国第一汽车股份有限公司 一种电机输出扭矩确定方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
Huo et al. Incipient fault diagnosis of roller bearing using optimized wavelet transform based multi-speed vibration signatures
CN110334764B (zh) 基于集成深度自编码器的旋转机械智能故障诊断方法
Pei et al. Rotating machinery fault diagnosis through a transformer convolution network subjected to transfer learning
CN114444222A (zh) 相似度计算模型、跨类别数据诊断模型、方法和系统
Zhao et al. Multiple-order graphical deep extreme learning machine for unsupervised fault diagnosis of rolling bearing
CN110110768B (zh) 基于并行特征学习和多分类器的滚动轴承故障诊断方法
CN103048133B (zh) 一种基于贝叶斯网络的滚动轴承故障诊断方法
Farokhzad Vibration based fault detection of centrifugal pump by fast fourier transform and adaptive neuro-fuzzy inference system
Du et al. Fault diagnosis of rotating machinery based on 1D–2D joint convolution neural network
CN111259990A (zh) 基于多源信息融合的海水泵故障监测装置与诊断方法
Sun et al. A robust approach of multi-sensor fusion for fault diagnosis using convolution neural network
Zheng et al. An end-to-end CNN-BiLSTM attention model for gearbox fault diagnosis
CN110398362B (zh) 一种机器人rv减速器故障诊断和定位方法
Neupane et al. Deep learning-based bearing fault detection using 2-D illustration of time sequence
CN110196165B (zh) 一种基于K-means聚类和证据推理的旋转机械滚珠轴承故障诊断方法
CN113916535A (zh) 基于时频和cnn的轴承诊断方法、系统、设备及介质
El Kihel et al. Method of Implementing Maintenance 4.0 in Industry-A Case study of an Industrial System
CN111783941B (zh) 一种基于概率置信度卷积神经网络的机械设备诊断分类方法
Hajnayeb et al. Vibration measurement for crack and rub detection in rotors
Luwei Vibration-based fault identification for rotor and ball bearing in rotating machines
Chen et al. A compound fault diagnosis method based on Multi-task Learning with Multi-gate Mixture-of-Experts
Khan et al. Intelligent prediction of multiple defects in rolling element bearing using ANN algorithm
Zhang et al. CNN4GCDD: A one-dimensional convolutional neural network-based model for gear crack depth diagnosis
TWI812305B (zh) 故障診斷系統及故障診斷方法
Dou et al. A fault diagnosis method composed of Gaussian cloud model and domain-invariant features extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination