CN114444222A

CN114444222A - 相似度计算模型、跨类别数据诊断模型、方法和系统

Info

Publication number: CN114444222A
Application number: CN202210042911.5A
Authority: CN
Inventors: 徐娟; 罗名辰; 吕增威; 樊玉琦; 丁煦
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2022-01-14
Filing date: 2022-01-14
Publication date: 2022-05-06

Abstract

本发明提出了一种相似度计算模型、跨类别数据诊断模型、方法和系统；本发明中给出的跨类别数据诊断模型，由相似度计算模型和设定的输出层组成，输出层用于根据相似度计算模型的输出获取每一个测试对象相似度最大的标注样本的类别，并将该类别作为测试对象所属类别。如此，本发明中的跨类别数据诊断模型基于数据在特征向量空间中的相似度对数据进行分类，通用性广，可以有效地将学习到的数据分类知识在不同类别的部件之间进行转移；其中源部件包含大量标注样本，而目标部件的每个故障类别中只有几个标注样本，采用源部件的历史工作数据训练跨类别数据诊断模型，避免了目标部件数据收集困难和标注困难的问题。

Description

相似度计算模型、跨类别数据诊断模型、方法和系统

技术领域

本发明涉及数据类别诊断和机械故障诊断领域，尤其涉及一种相似度计算模型、跨类别数据诊断模型、方法和系统。

背景技术

研究先进的机械故障诊断方法是保障设备与人员安全的重要内容，其中，轴承和齿轮是旋转机械中最为重要的机械零件，广泛应用于电力、化工、冶金、航空等各个重要领域，同时也是最容易损坏的元件，它们的性能和工况的好坏会直接影响到整台机器设备的性能，还会导致设备产生异常振动和噪声，甚至造成设备损坏。因此，对滚动轴承和齿轮进行故障诊断，尤其对它们早期故障的分析，尤为重要。

现有技术中，深度学习理论以其强大的建模和表征能力成为数据驱动的智能故障诊断领域中最活跃的研究方向之一，基于深度学习的故障诊断框架具有强大的特征学习能力，能够通过多个隐藏层直接从原始传感器数据中学习分层表示，并自动选择有利于识别的特征，准确的进行故障分类。但是，在实际工业中，由于故障数据的收集和标注困难，数据集往往比基准数据集要小的多。此外，收集的故障数据可能来自具有不同类别的机械部件，比如轴承和齿轮。在面对少量标记样本和面对新的部件时，深度网络模型的泛化能力不足。

发明内容

为了解决上述现有技术中深度网络模型无法在可供学习的标记样本少的情况下实现跨类别高精度故障诊断的缺陷，本发明提出了一种相似度计算模型、跨类别数据诊断模型、方法和系统。

本发明的目的之一提出了一种相似度计算模型，用于计算数据之间的相似度，以便基于未标注数据和标注数据之间的相似度，为未标注数据分类，以便根据数据分类获知指向部件故障的数据，从而实现故障诊断；该相似度计算模型的训练样本和测试样本可来自不同的部件工作数据，方便了训练样本的收集。

一种相似度计算模型，基于神经网络模型通过样本训练获得；神经网络模型包括快速傅里叶变换模块、第一神经网络和第二神经网络，快速傅里叶变换模块用于获取输入数据的幅值特征，第一神经网络用于根据幅值特征构建输入数据的特征向量，第二神经网络模型用于计算特征向量之间的相似度；

快速傅里叶变换模块的输入为输入数据，其输出为各输入数据对应的幅值特征；第一神经网络的输入为快速傅里叶变换模块的输出，第一神经网络的输出为特征向量；第二神经网络的输入为第一神经网络的输出，第二神经网络模型的输出为测试集中每一个数据与支持集中各数据的相似度；

所述神经网络模型训练所用损失函数L为：

L＝β×L_re+(1-β)×L_tr；

其中，β为平衡因子，L_re、L_tr为过度参数；

c表示数据类别数量，k表示样本集S中每一个类别下的数据数量，m表示查询集Q中每一个类别下的数据数量；w、i、j均表示序号；[]₊表示取值函数，括号内大于零取本身值，括号内小于零取零；

将样本集S中数据对应的特征向量和查询集Q中数据对应的特征向量记作向量空间Z，f_w表示向量空间Z中任一个特征向量，

表示向量空间Z中与特征向量f_w同一类别且距离最远的特征向量，

表示向量空间Z中与特征向量f_w不同类别且距离最近的特征向量，||·||₂表示欧氏距离，α表示人工设置的超参数；

1(y_i＝＝y_j)表示过渡参数，如果y_i＝y_j，则1(y_i＝＝y_j)取1；如果y_i≠y_j，1(y_i＝＝y_j)取0；样本集

查询集

x_i、x_j表示源部件A实际工况下的历史工作数据，y_i、y_j分别为数据x_i、x_j的标签，标签与类别一一对应；

设置源数据集D_A用于收集源部件A实际工况下的历史工作数据，样本集S和查询集Q由源数据集D_A分割形成，D_A＝S∪Q,

优选的，该模型通过以下步骤训练获得：

S1、从源部件A实际工况下的历史工作数据中获取源数据集D_A，源数据集D_A中的数据均标注有类别；

S2、将源数据集D_A分割为样本集S和查询集Q；

S3、构建神经网络模型；

S4、设置神经网络模型的损失函数L，并结合样本集S、查询集Q和损失函数L训练神经网络模型，获得训练完成的神经网络模型作为相似度计算模型。

优选的，k≤20；0.3≤α≤0.5；0.2≤β≤0.8。

优选的，k＝1时，β＝0.4；k＝3时，β＝0.5；k＝5时，β＝0.2。

优选的，所述类别包括表示部件正常工作的正常类别和表示部件工作异常的故障类别，故障类别包括多个且分别指向不同的故障表征。

本发明的目的之二提出了一种跨类别数据诊断模型，基于未标注数据和标注数据之间的相似度，将未标注数据归入与其相似度最高的标注数据的类别；该跨类别数据诊断模型基于上述的相似度计算模型构建，可用于跨类别信号分类；即可采用通过易于采集源部件A的历史工作数据训练获得的跨类别数据诊断模型实现对不易采集的目标部件B的历史工作数据的分类和故障诊断。

一种跨类别数据诊断模型，包括：所述的相似度计算模型和设定的输出层；相似度计算模型的输入端作为该跨类别数据诊断模型的输入端，用于输入收集标注样本的支持集S’和收集测试样本的测试集T；标注样本和测试样本为同一部件的历史工作数据；

输出层的输入为相似度计算模型的输出，即各测试样本相对于每一个标注样本的相似度；输出层的输出端作为该跨类别数据诊断模型的输出端，用于输出被标注的测试样本，测试样本的标签为与测试对象相似度最大的标注样本的标签。

本发明的目的之三还提出了一种跨类别数据诊断方法，结合该方法可通过上述的跨类别数据诊断模型对与模型训练不同来源的数据进行分类诊断，从而实现跨零部件类别的故障诊断。例如采用该方法可结合轴承工作数据训练跨类别数据诊断模型，并通过该跨类别数据诊断模型对齿轮工作数据进行故障诊断。

一种跨类别数据诊断方法，包括以下步骤：

SB1、获得目标部件B实际工况下的历史工作数据构成目标数据集D_B，假设目标数据集D_B中的数据可分为

个类别，类别空间记作

表示类别序号，

表示第

个类别对应的标签，

SB2、将目标数据集D_B分割为第一数集和第二数集，对第一数集中的数据进行标注，标注后的第一数集作为支持集S'，第二数集作为测试集T，

表示标注后支持集S'中每个类别下的样本数量，n表示测试集T中的样本数量，

表示支持集S'中第i个样本x_i的标签为

x_j表示测试集中第j个测试样本；

SB3、将支持集S'和测试集T输入所述的跨类别数据诊断模型，获得跨类别数据诊断模型的输出，跨类别数据诊断模型的输出可表示为：

表示测试样本x_j的标签，

优选的，所述源部件A和目标部件B均为转动部件。

优选的，支持集S'中每个类别下的标注样本数量

与样本集S中每个类别下的标注样本数量k相等。

本发明的目的之四还提出了一种跨类别数据诊断系统，用于承载上述跨类别数据诊断模型，并实现上述跨类别数据诊断方法，以实现跨类别的零部件故障诊断。

一种跨类别数据诊断系统，其特征在于，包括第一存储模块和第二存储模型和处理器，第一存储模型中存储有所述的跨类别数据诊断模型，第二存储模块中存储有计算机程序，所述处理器用于执行所述计算机程序以实现所述的跨类别数据诊断方法。

本发明的优点在于：

(1)本发明提供的相似度计算模型，首先将数据转换为特征向量，然后根据数据对应的特征向量之间的距离计算数据之间的相似度。本发明中，损失函数分为两部分：基于困难三元组构建的第一损失函数，基于关系损失构建的第二损失函数。如此，本发明中自重训练获得的相似度计算模型保证了特征向量构建和特征向量相关度计算的精确，从而保证了对数据之间相似度判定的精确，实现了根据少量的标注数据样本基于数据相似度对数据的精确分类。基于本发明提供的相似度计算模型，可将机械零部件的故障诊断问题转换为根据不同故障类别的样本表征对数据进行分类的问题。

(2)本发明中的相似度计算模型引入了向量空间，根据转换后的特征向量之间的距离计算相似度，其训练可通过少量样本实现，且训练完成的模型可实现跨类别数据相似度的识别。

(3)本发明中，样本集S中的同一类数据不超过20个，实现了少样本学习，降低了模型训练难度。

(4)本发明中，超参数α在数值区间[0.3，0.5]上取值时，获得的跨类别数据诊断模型精度更高，且模型收敛性更好。

(5)本发明中，平衡因子β在0.2到0.8之间取值时，有利于提高跨类别数据诊断模型的精度，说明基于困难三元组损失的关系损失对模型训练效果更佳。具体的，k为样本集S中同类数据数量，当k＝1时，β＝0.4；k＝3时，β＝0.5；k＝5时，β＝0.2，跨类别数据诊断模型泛化性能最佳。

(6)本发明中给出了一种跨类别数据诊断模型，由相似度计算模型和设定的输出层组成，输出层用于根据相似度计算模型的输出获取每一个测试对象相似度最大的标注样本的类别，并将该类别作为测试对象所属类别。如此，本发明中的跨类别数据诊断模型基于数据在特征向量空间中的相似度对数据进行分类，通用性广，可以有效地将学习到的数据分类知识在不同类别的部件之间进行转移；其中源部件包含大量标注样本，而目标部件的每个故障类别中只有几个标注样本，采用源部件的历史工作数据训练跨类别数据诊断模型，避免了目标部件数据收集困难和标注困难的问题。

(7)本发明中，小样本的类别诊断问题被转换为相似度度量问题，而不是单纯的特征加权分类问题。模型训练时将源部件上的数据集分成样本集和查询集，模型测试时目标部件上的数据集分成支持集和测试集，通过组合样本集和查询集的样本，形成一系列元任务，通过对不同元任务的学习，使得跨类别数据诊断模型面对新部件测试样本时，可以借助支持集对其进行有效的故障分类。

(8)本发明中，通过第一损失函数的设置，使得相似度计算模型可机芯特征向量转换时，可拉近同类别的数据的特征向量，拉远不同类别的数据的特征向量，从而提高跨类别数据诊断模型的精度。训练时将样本集和查询集中的特征向量统一到向量空间中，向量空间中每个特征向量依次作为锚点，通过锚点与同类别特征向量的最大距离以及锚点与不同类别特征向量的最小距离来度量对困难样本的识别。然后，结合作为第一损失函数的三元组损失函数，以最小化锚点与同类别特征向量的最大距离之间的距离，并最大化锚点不同类别特征向量的最小距离，这使得模型能够学习到一个良好的故障表征，从而进一步提高数据分类精度。

(9)机械部件的故障诊断，实际上也是以故障特征为类别的数据分类方法，因此，本发明提供的跨类别数据诊断方法，也适用于机械部件的故障诊断，且实现为一种小样本学习的跨类别故障诊断方法。

附图说明

图1为一种相似度计算模型的训练方法流程图；

图2为一种跨类别数据诊断方法流程图；

图3为齿轮试验台内部结构；

图3中图示为：1、转速计；2、电动机；3、加速度计；4、第一级输入轴；5、第二级输入轴；6、磁性制动器；7、输出轴。

图4为表1所示实施例的数据统计图；

图5为α＝0.3时任务C2中获得的跨类别数据诊断模型的收敛情况；

图6为α＝0.5时任务C2中获得的跨类别数据诊断模型的收敛情况；

所述收敛情况即模型精度与训练次数的对应关系；

图7为任务A1中β取不同值时对跨类别故障分类模型的影响；

图8为任务A2中β取不同值时对跨类别故障分类模型的影响；

图9为任务A3中β取不同值时对跨类别故障分类模型的影响。

具体实施方式

实施例1

本实施例中提供了一种相似度计算模型，该相似度计算模型基于神经网络模型构建，其输入为由标注样本构成的支持集S’和由未标注的测试样本构成的测试集T，其输出为测试集T中各测试样本相对于支持集S’中各标注样本的相似度。

该相似度计算模型包括：快速傅里叶变换模块、第一神经网络和第二神经网络，

参照图1，该相似度计算模的训练包括以下步骤：

S1、从源部件A实际工况下的历史工作数据中获取源数据集D_A，源数据集D_A中的数据均标注有类别，所述类别包括正常和c-1个故障类别，类别空间记作Y_A＝{y¹,y²,...,y^c}；

S2、将源数据集D_A分割为样本集

和查询集

x_i、x_j表示源部件A实际工况下的历史工作数据，y_i、y_j分别为数据x_i、x_j的标签，y_i∈Y_A、y_j∈Y_A，D_A＝S∪Q,

c表示类别数量，k表示样本集S中每个类别下的数据数量，m表示查询集Q中每个类别下的数据数量，i、j表示序数；

S3、构建神经网络模型，神经网络模型包括快速傅里叶变换模块、第一神经网络和第二神经网络；

快速傅里叶变换模块用于将样本集S中的数据和查询集Q中的数据进行快速傅里叶变换以得到幅值特征；

第一神经网络的输入为快速傅里叶变换模块输出的样本集S和查询集Q中各数据对应的幅值特征，其输出为根据幅值特征构建的特征向量；将样本集S中数据x_i对应的特征向量记作f_i，将查询集Q中数据x_j对应的特征向量记作f_j；第二神经网络的的输入为特征向量f_i和f_j，输出为特征向量f_i和f_j的相似度r_i,j；

本实施方式中的神经网络模型训练所用的损失函数L由第一损失函数L_tr和第二损失函数L_re组成。

第一损失函数L_tr基于困难三元组构建，其设置为：

其中，c表示数据类别数量，k表示样本集S中每一个类别下的数据数量，m表示查询集Q中每一个类别下的数据数量；[]₊表示取值函数，括号内大于零取本身值，括号内小于零取零；

表示向量空间Z中与特征向量f_w不同类别且距离最近的特征向量，||·||₂表示欧氏距离，α表示人工设置的超参数。

通过上述损失函数L_tr，使得第一神经网络在进行特征向量转换时，可拉近样本集S和查询集Q的并集中属于同一类别的数据对应的特征向量的距离，并拉远样本集S和查询集Q的并集中不属于同一类别的数据对应的特征向量的距离，从而为后续特征向量之间相似度的计算奠定基础。

第二神经网络模型用于计算特征向量之间的相似度。第二神经网络包括关系度量模块G_r和全连接层FC。

关系度量模块G_r用于构建特征向量f_i和f_j的关系向量g^i,j，具体的关系度量模块G_r的输入可采用特征向量f_i和f_j拼接成的元训练任务concat(f_i,f_j)，即：

g^i,j＝G_r(concat(f_i,f_j)；θ_r)；

其中，θ_r表示关系度量模块G_r的网络参数。

全连接层FC用于根据关系向量g^i,j计算特征向量记作f_i和f_j之间的相似度r_i,j，即：

其中，

表示全连接层FC的网络参数；

第二损失函数L_re设置为：

其中，c表示数据类别数量，k表示样本集S中每一个类别下的数据数量，m表示查询集Q中每一个类别下的数据数量；1(y_i＝＝y_j)表示过渡参数，如果y_i＝y_j，则1(y_i＝＝y_j)取1；如果y_i≠y_j，1(y_i＝＝y_j)取0。

具体实施时，样本集S和查询集Q也可以记作如下形式：

其中x_St-h表示样本集S中第t个类别下的第h个数据，y^t表示数据x_St-h的标签；x_Qu-v表示查询集Q中第u个类别下的第v个数据，y^u表示数据x_Qu-v的标签；1≤t≤c,1≤h≤k，1≤u≤c,1≤v≤m。

结合公式(2)(3)，第二神经网络的损失函数L_re也可以写成：

1(y^t＝＝y^u)表示过渡参数，如果y^t＝y^u，则1(y^t＝＝y^u)取1；如果y^t≠y^u，1(y^t＝＝y^u)取0。

通过第二损失函数L_re可确保第二神经网络对特征向量之间的相似度的精确计算。

本实施方式中，损失函数L的计算公式为：

L＝β×L_re+(1-β)×L_tr；

其中，β为平衡因子。

如此，具体实施时，可根据样本集S中的标注样本和查询集Q中的标注样本结合损失函数L训练相似度计算模型，具体训练时，可设置损失函数L的目标值作为训练结束条件，或者设置循环次数作为训练结束条件。

实施例2：跨类别数据诊断模型

本实施例中的跨类别数据诊断模型由实施例1提供的相似度计算模型和设定的输出层组成，输出层用于根据相似度计算模型的输出获取每一个测试对象相似度最大的标注样本的类别，并将该类别作为测试对象所属类别。即输出层的输入为相似度计算模型的输出，输出层的输出为各测试对象的类别，或者为标注后的测试对象。

如此，通过本实施例中的跨类别数据诊断模型诊断测试数据的类别时，只需要提供少量的标注样本作为支持集，便可通过跨类别数据诊断模型获得测试数据的类别。具体实施时，支持集中每个类别的标注样本数量可在1-20之间取值，例如3或者5等。

参照图2，通过该跨类别数据诊断模型对目标数据集D_B进行数据分类时，步骤如下：

个类别，类别空间记作

表示类别序号，

表示支持集S'中第i个样本的标签为

x_j表示测试集中第j个测试样本。

具体实施时，支持集还可采用如下表述方式：

其中t、h表示序数，

x_St-h表示支持集S'中第t个类别下的第h个样本，

表示类别。

SB3、将支持集S'和测试集T输入跨类别数据诊断模型，获得跨类别数据诊断模型的输出。具体的，跨类别数据诊断模型的输出可表示为：

表示测试样本x_j的标签，

以下结合几个具体的实施例，对本发明提供的跨类别数据诊断模型的精度进行验证，验证结果如下表所示。

表1：十二个跨部件故障诊断任务描述

表1所示实施例均满足

表1中，各源数据集描述如下：

CWRU数据集：该试验台由2HP电机(左)，扭矩传感器(中)，测力计(右)、电子控制设备和加速度传感器采集振动信号。该试验台使用电火花加工(EDM)技术对轴承设置不同尺寸的单点点蚀故障，故障直径分别为0.007、0.014、0.021英尺。每个故障直径包含四个故障类别:滚动体故障(BF)、内圈故障(IF)、外圈故障(OF)和正常(N)状态。与此同时,故障轴承安装在两个不同的位置，驱动端(DE)和风扇端(FE)。本次试验过程中该CWRU数据集构建80个类别，如表2所示。

表2用CWRU数据集构建出80个类别

CWRU数据集中，故障状态中的正常N表示未显示故障的工作状态，这里为了便于表述，将滚动体故障(BF)、内圈故障(IF)、外圈故障(OF)和正常(N)同一命名故障状态。

来自实验室自建实验台的轴承数据集：实验室自建实验台采用带柔性联轴器的三相电机控制轴承的转速，并在轴承座上放置加速度传感器采集振动信号。实验室轴承包含五个数据类型:滚动体故障(BF)，内圈故障，外圈故障和滚动体外圈复合故障(BOF)和正常状态。实验室中模拟实际工作情况对实验台的振动信号进行采集，采样频率是128kHz。

Uconn大学公开齿轮数据集：齿轮传动试验台中由电动机2控制齿轮的速度。扭矩是由磁性制动器6提供的，可以通过磁性制动器6来调节输入电压。齿轮传动试验台如图3所示，一个32齿小齿轮和一个80齿齿轮安装在第一级输入轴4上。第二级输入轴5包括一个48齿小齿轮和一个64齿齿轮。输入轴的速度由转速计1测量，并且振动信号由加速度计3收集。信号由dSPACE(DS1006处理器板，dSPACE Inc.)记录。采样频率为20kHz。传动装置数据集包含五个故障类别:健康，缺齿，剥落，根裂纹，和碎屑5a，其中5a表示的故障严重程度。

图4为表1对应的统计图。结合表1、图4可知，无论支持集每个类别只包含1个、3个或5个标注样本，所有跨部件故障诊断实验的平均分类精度均超过79.66％，表明该跨类别数据诊断模型是有效的。

图5、图6为相似度计算模型的训练次数和跨类别数据诊断模型的精确度之间的关系，横坐标为训练次数，纵坐标表示精确度。具体的，图5所示为α＝0.3时任务C2中获得的跨类别数据诊断模型的收敛情况，图6所示为α＝0.5时任务C2中获得的跨类别数据诊断模型的收敛情况，所述收敛情况即模型精度与训练次数的对应关系，可见α＝0.5时，训练获得的跨类别数据诊断模型精度更高，且模型收敛性更好。

本实验中关于任务A1、A2和A3做了损失函数平衡因子β的实验，针对不同占比来验证两个损失函数对模型性能的影响，数据统计如下表3、表4、表5所示。

表3：任务A1\A2\A3中模型精度与平衡因子β的对应关系

图7、图8、图9为表3中的数据表征图，结合表3、图7-图8可知，当β为0时，只有第一损失函数作为优化目标训练获得跨类别数据诊断模型，模型性能具有较差的分类准确率，任务A1中跨类别数据诊断模型的精确度在22％到40％之间波动，任务A2和A3中跨类别数据诊断模型的精确度低于20％，结果表明仅仅依靠第一损失函数(困难三元组损失)是不可行的。当β为1时，只有第二损失函数作为优化目标训练获得的别诊断模型，与只有第一函数作为优化目标相比，精度有大幅增加了55％～65％，直接反映出关系网络在数据分类中的应用潜力。当Task A1中β为0.4,Task A2中β为0.5时,TaskA3中β为0.2时，获得的跨类别数据诊断模型泛化性能最佳，这说明基于困难三元组损失的关系损失可以达到更佳效果。

以上仅为本发明创造的较佳实施例而已，并不用以限制本发明创造，凡在本发明创造的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明创造的保护范围之内。