CN111898095B

CN111898095B - 深度迁移学习智能故障诊断方法、装置、存储介质和设备

Info

Publication number: CN111898095B
Application number: CN202010663794.5A
Authority: CN
Inventors: 李响; 何俊; 欧阳明; 王昕�
Original assignee: Foshan University
Current assignee: Foshan University
Priority date: 2020-07-10
Filing date: 2020-07-10
Publication date: 2024-04-19
Anticipated expiration: 2040-07-10
Also published as: CN111898095A

Abstract

本发明提供了一种深度迁移学习智能故障诊断方法、装置、存储介质和设备。其中，方法包括：获取待识别的目标域数据；将目标域数据输入至故障诊断迁移卷积神经网络模型进行故障判断，得到健康状况标签；故障诊断迁移卷积神经网络模型的训练方法是：将源域样本和目标域样本分别输入故障诊断迁移卷积神经网络模型以提取特征；通过交叉熵损失函数来最小化源域样本上的健康状态分类错误；并通过域自适应模块计算源域样本与目标域样本之间特征的协方差距离；通过迭代优化损失函数对参数进行约束。本发明可减少源域与目标域之间的数据分布差异，达到预测目标域标签的目的，有效提高健康状况标签从源域至目标域的迁移准确性。

Description

深度迁移学习智能故障诊断方法、装置、存储介质和设备

技术领域

本发明涉及故障数据处理技术领域，更具体地说，涉及一种深度迁移学习智能故障诊断方法、装置、存储介质和设备。

背景技术

机械故障诊断对于保障设备安全运行意义重大,因为机械设备一旦出现事故，就将带来巨大的经济损失和人员伤亡。近年来，由于传感器技术和计算能力的飞速发展，故障诊断逐步在工业界与学术界受到重视。在以信号处理为基础的故障诊断研究中，传统的特征提取模式和机器学习分类模式的方法取得了良好的效果；例如使用K最近邻分类算法，支持向量机算法和BP神经网络方法等。但是以上方法都是通过传统信号处理方法提取的特征作为机器学习模型的输入，需要大量的手动特征提取，仍然取决于复杂的信号处理方法,在特征的选择上比较困难。

由于互联网技术的发展,收集到的数据量空前庞大,一些学者开始通过深度学习从输入的监测数据中自动学习特征,同时根据学习到的特征识别状态。JIA提出了一种归一化稀疏声发射方法,从输入的振动数据中学习有意义的特征,基于归一化稀疏自编码器来构造端到端的网络,机型机械故障诊断；Tamilselvan等使用深度置信网络对飞机发动机以及电力变压器进行了健康诊断,JIANG叠置多个RBMS构建基于深度置信网络的诊断模型,在滚动轴承数据集上比传统的诊断模型具有更高的精度；ZHANG设计了一种“第一层宽卷积神经网络(deep convolutional neural networks with wide first-layer kernel，WDCNN)”，并在轴承数据集上取得了不错的效果；ZHAO等基于Reset，开发了动态加权小波系数；与其他深度学习的方法相比，在严重噪声环境下行星齿轮箱的故障诊断中获得了更高的精度。

然而,上述文献对于故障诊断的成功局限于两个条件：1)具有大量的可用的故障信息的标记数据；2)训练数据(源域)和测试数据(目标域)来自相同的概率分布。然而，在现实中很难满足这两个条件。因为，在实际工作中，大多数机械都处于正常状态中，如果发生故障机械也会立即停止。同时，机器从健康状态到发生故障经历的时间比较漫长，这种情况下，获得故障数据将会非常困难。总之，传统的机器学习方法能在智能故障诊断领域取得巨大的成果，极大部分都要归功于可获得的大量的标记数据。在不同工况之间，以及只有少量标记数据的故障诊断方法仍然是一个挑战。

近年来，迁移学习受到机器学习领域的广泛关注，Arnold首次提出了迁移学习的概念，将在机器学习中训练数据与测试数据来自不同分布问题归结为跨域学习问题，对应的解决方案称为domain adaptation(DA)。在域适应中，模型的训练数据属于源域，与训练数据分布不同的测试数据属于目标域。因此，迁移学习具有利用从源域到目标域的知识的能力，并在计算机视觉、文本分类、行为识别、医疗健康等领域取得了重要成就。此外，在故障诊断领域，迁移学习的出现成功，使得收集足够的标记数据是不必要的，这释放了基于机器学习的训练诊断模型的共同假设。其中Lu提出了一种具有域自适应性的新型深度神经网络模型，用于故障诊断。郭等提出了一个新的深度迁移学习方法(DCTLN)，将不同机器之间的数据进行自适应，从而进行故障诊断。li等人使用多个域适应层进行权重分配进行故障诊断。上述文献中都是使用最大均值差异(MMD)度量值作为域适层的附加损失函数。但是MMD用在域适应层的局限在于，在计算积分概率度量(IPM)时，随着样本数量的增加，MMD的计算成本将成倍增加。此外，基于MMD的方法通常是将相同的转换应用于源域与目标域；然而，与对称变化相比，非对称变换往往更加灵活，通常在自适应任务中表现出更好的性能。

发明内容

为克服现有技术中的缺点与不足，本发明的目的在于提供一种深度迁移学习智能故障诊断方法、装置、存储介质和设备；本发明可减少源域与目标域之间的数据分布差异，达到预测目标域标签的目的，有效提高健康状况标签从源域至目标域的迁移准确性。

为了达到上述目的，本发明通过下述技术方案予以实现：一种深度迁移学习智能故障诊断方法，其特征在于：包括：

获取待识别的目标域数据；

将目标域数据输入至故障诊断迁移卷积神经网络模型，通过所述故障诊断迁移卷积神经网络模型对所述目标域数据进行故障判断；其中，所述故障诊断迁移卷积神经网络模型为对初始故障诊断迁移卷积神经网络模型进行训练处理得到的模型；

所述故障诊断迁移卷积神经网络模型为对初始故障诊断迁移卷积神经网络模型进行训练处理得到的模型，是指：获取源域样本和目标域样本；将源域样本和目标域样本分别通过前向传播输入故障诊断迁移卷积神经网络模型，以提取特征；在故障诊断迁移卷积神经网络模型设有域自适应模块；通过交叉熵损失函数来最小化源域样本上的健康状态分类错误；并通过域自适应模块计算源域样本与目标域样本之间特征的协方差距离，以增加源域样本与目标域样本之间特征之间的相似性；通过迭代优化损失函数来对故障诊断迁移卷积神经网络模型的参数进行约束，对故障诊断迁移卷积神经网络模型进行不对训练，直到达到最大迭代次数或损失函数小于设定值。

优选地，所述故障诊断迁移卷积神经网络模型包括特征提取器和健康分类器；其中，特征提取器包括源域特征提取器和目标域特征提取器；源域特征提取器和目标域特征提取器均包括卷积层和池化层；源域特征提取器还包括全连接层1S；目标域特征提取器还包括全连接层1T；所述健康分类器包括与全连接层1S连接的全连接层2S、与全连接层1T连接的全连接层2T，以及与全连接层2S连接的输出层；全连接层1S与全连接层1T之间，以及全连接层2S与全连接层2T之间分别通过域自适应模块连接。

优选地，源域特征提取器包括卷积层和池化层，是指：源域特征提取器包括依次连接的卷积层1S、池化层1S、卷积层2S、卷积层3S、卷积层4S和池化层2S；池化层2S与全连接层1S连接；

目标域特征提取器包括卷积层和池化层，是指：目标域特征提取器包括依次连接的卷积层1T、池化层1T、卷积层2T、卷积层3T、卷积层4T和池化层2T；池化层2T与全连接层1T连接。

优选地，所述对初始故障诊断迁移卷积神经网络模型进行训练处理，是指包括如下步骤：

S1，获取源域样本和目标域样本；其中，源域样本带有健康状况标签；

S2，将源域样本和目标域样本分别通过前向传播输入故障诊断迁移卷积神经网络模型，以提取特征；

S3，通过减少交叉熵损失函数来最小化源域样本上的健康状态分类错误，其公式如下：

其中，m是源域样本的批量大小；j是故障类别；I[·]是指标函数，其取值规则为：I[值为真]＝1，I[值为假]＝0；

S4，计算全连接层1S与全连接层1T特征之间、以及全连接层2S与全连接层2T特征之间的协方差距离：

其中，l₁表示全连接层1S与全连接层1T；l₂表示全连接层2S与全连接层2T；表示矩阵的Frobenius范数；C_S表示源域样本的协方差矩阵；C_T表示目标域样本的协方差矩阵；C_S和C_T计算公式分别如下：

其中，1^T表示元素都为1的列向量的转置；F_S表示源域样本经过全连接层的输出数据；F_T表示目标域样本经过全连接层的输出数据；n_S表示源域样本个数；n_T表示目标域样本个数；

S5，将特征提取器和健康分类器的参数分别设定为θf和θc；计算损失函数：

L(θ_f,θ_c)＝L_c(θ_f,θ_c)+λL_CORAL(θ_f)

S6，基于损失函数和adam算法,更新参数θ_f和θ_c：

其中，η是学习率；

S7，判断是否达到最大迭代次数或损失函数小于设定值：若是，则结束训练；否则跳至步骤S2继续训练。

一种深度迁移学习智能故障诊断装置，其特征在于，包括：

数据输入模块，用于获取待识别的目标域数据；

数据识别模块，用于将目标域数据输入至故障诊断迁移卷积神经网络模型，通过所述故障诊断迁移卷积神经网络模型对所述目标域数据进行故障判断；其中，所述故障诊断迁移卷积神经网络模型为对初始故障诊断迁移卷积神经网络模型进行训练处理得到的模型；

一种存储介质，其特征在于，其中所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述深度迁移学习智能故障诊断方法。

一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现上述深度迁移学习智能故障诊断方法。

与现有技术相比，本发明具有如下优点与有益效果：

1、本发明提出了一种深度迁移学习智能故障诊断方法，用以解决不同工况下的迁移故障诊断问题；首先通过提取特征，随后执行域自适应，减少源域与目标域之间的数据分布差异，达到预测目标域标签的目的；

2、本发明不同于现有使用MMD作为衡量源域与目标域之间的距离，本发明将coral改进作非线性变换直接作用于源域与目标域，使其作为衡量两个域之间相似性的度量方法，有效提高健康状况标签从源域至目标域的迁移准确性。

附图说明

图1是本发明中故障诊断迁移卷积神经网络模型的结构示意图；

图2是本发明故障诊断迁移卷积神经网络模型训练流程图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细的描述。

实施例一

本实施例一种深度迁移学习智能故障诊断方法，包括：

获取待识别的目标域数据；

将目标域数据输入至故障诊断迁移卷积神经网络模型，通过所述故障诊断迁移卷积神经网络模型对所述目标域数据进行故障判断；其中，所述故障诊断迁移卷积神经网络模型为对初始故障诊断迁移卷积神经网络模型进行训练处理得到的模型。

如图1所示，故障诊断迁移卷积神经网络模型包括特征提取器和健康分类器；其中，特征提取器包括源域特征提取器和目标域特征提取器。

源域特征提取器包括依次连接的卷积层1S、池化层1S、卷积层2S、卷积层3S、卷积层4S、池化层2S和全连接层1S；目标域特征提取器包括依次连接的卷积层1T、池化层1T、卷积层2T、卷积层3T、卷积层4T、池化层2T和全连接层1T。健康分类器包括与全连接层1S连接的全连接层2S、与全连接层1T连接的全连接层2T，以及与全连接层2S连接的输出层；全连接层1S与全连接层1T之间，以及全连接层2S与全连接层2T之间分别通过域自适应模块连接。源域输入层与卷积层1S连接，目标域输入层与卷积层1T连接。

所有输入层、卷积层、池化层和全连接层均是一维CNN，各层结构如表1所示。

表1

卷积层是故障诊断迁移卷积神经网络模型的核心，它包含一组可训练的过滤器；其最重要的特点是权值共享(Weights Sharing)，即同一个卷积核将以固定的步长(Stride)遍历一次输入。权值共享减少了卷积层的网络参数，避免了由于参数过多造成的过拟合，并且降低了系统所需内存，减小了计算机的负荷。卷积层的运算公式如下：

其中，表示第l层第j个特征图，M是输入特征图的集合，k表示卷积核，b表示偏置项，f(·)表示非线性激活函数；在经过卷积操作之后，使用激活函数将对每一个卷积输出值进行非线性变换，可以将原本线性不可分的多维特征映射到另一空间，从而增强特征的线性可分性，常用的激活函数为ReLU(Rectified Linear Unit)，其表达式如下：

ReLU(x)＝max(0,x)

池化层(Pooling Layer)进行的是降采样操作，主要目的是减少神经网络参数的同时，保留较主要的特征，防止过拟合，提高模型的泛化能力；其公式如下所示：

其中，表示第l+1层的特征图，/>表示的是池化操作。

全连接层是将前面提取出的特征进行分类，在整个神经网络中起到“分类器”的作用。具体做法为，先将最后一个池化层的输出，铺展成一维的特征向量，作为全连接层的输入；再将输入与输出之间进行全连接，其中隐含层使用的激活函数为ReLU，最后输出层采用的是激活函数是Softmax函数。Softmax函数的目的是将输入的神经元转化为和为1的概率分布，这样做有利于后续的多分类目标函数的建立。全连接层的公式如下所示：

x^l＝f(w^lx^l-1+b^l)

其中，w^l和b^l分别表示全连接层的权重和偏置，f(·)表示非线性激活函数，当第l层为隐藏层时，激活函数为ReLU，当l+1层为输出层时，激活函数为Softmax，其公式如下：

其中，p(y⁽ⁱ⁾＝1|x⁽ⁱ⁾；θ)表示第i个样本的输入x⁽ⁱ⁾属于类别j的概率，θ₁，θ₂，…，是模型的参数，θ表示参数总称，/>表示将概率分布进行归一化，使所有的概率之和为1。

Coral(CORrelationALignment)是一种有效的简单的无监督自适应方法，首先通过需要手动提取数据的特征，其次进行线性变换将源和目标分布的二阶统计量对齐，最后使用SVM算法进行分类。本发明在此基础上对coral方法进行了扩展，将coral改进作非线性变换直接作用于源域与目标域，使其作为衡量两个域之间相似性的度量方法，将其嵌入到卷积神经网络之中，在减少分类损失同时，最小化coral损失，使其在目标域上可以有更好的分类效果。

本发明中，故障诊断迁移卷积神经网络模型通过特征提取器来直接在故障诊断信号中提取特征，交由健康状态分类器基于提取特征来识别正确的健康状态。域自适应模块通过最小化源域与目标域学习到的特征之间的度量距离来实现，采用的是coral方法。通过将coral损失纳入优化目标，从源域与目标域学习到的特征将有较大的相似性，以帮助cnn学习到域不变特征。

本发明具有两个优化对象：(1)最小化源域数据集上的健康状态分类错误；(2)最小化源域与目标域之间的源和目标特征的二阶统计量(协方差)之间的距离。因此，所述故障诊断迁移卷积神经网络模型为对初始故障诊断迁移卷积神经网络模型进行训练处理得到的模型，是指：获取源域样本和目标域样本；将源域样本和目标域样本分别通过前向传播输入故障诊断迁移卷积神经网络模型，以提取特征；在故障诊断迁移卷积神经网络模型设有域自适应模块；通过交叉熵损失函数来最小化源域样本上的健康状态分类错误；并通过域自适应模块计算源域样本与目标域样本之间特征的协方差距离，以增加源域样本与目标域样本之间特征之间的相似性；通过迭代优化损失函数来对故障诊断迁移卷积神经网络模型的参数进行约束，对故障诊断迁移卷积神经网络模型进行不对训练，直到达到最大迭代次数或损失函数小于设定值。

具体地说，如图2所示，包括如下步骤：

其中，1表示元素都为1的列向量；1^T表示元素都为1的列向量的转置；F_S表示源域样本经过全连接层的输出数据；F_T表示目标域样本经过全连接层的输出数据；n_S表示源域样本个数；n_T表示目标域样本个数；

他们的梯度计算如下所示：

L(θ_f,θ_c)＝L_c(θ_f,θ_c)+λL_CORAL(θ_f)

S6，基于损失函数和adam算法,更新参数θ_f和θ_c：

其中，η是学习率；

训练过程完成后，通过域自适应模块可以将源域与目标域之间的分布差异最小化，同时健康状态分类器可以使得目标域中的未标记样本正确分类。

经试验，本发明方法与没有进行域适应的深度学习方法、传统的迁移学习方法、与使用Wasserstein距离作为域适应的迁移学习方法，以及与使用mmd作为域适应的迁移学习方法进行对比，本发明在目标域均具有较其它方法优异的故障判断准确率。

实施例二

为实现实施例一所述的深度迁移学习智能故障诊断方法，本实施例提供一种深度迁移学习智能故障诊断装置，包括：

数据输入模块，用于获取待识别的目标域数据；

实施例三

本实施例一种存储介质，其特征在于，其中所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行实施例一所述的深度迁移学习智能故障诊断方法。

实施例四

本实施例一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现实施例一所述的深度迁移学习智能故障诊断方法。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种深度迁移学习智能故障诊断方法，其特征在于：包括：

获取待识别的目标域数据；

将目标域数据输入至故障诊断迁移卷积神经网络模型，通过所述故障诊断迁移卷积神经网络模型对所述目标域数据进行故障判断，得到健康状况标签；其中，所述故障诊断迁移卷积神经网络模型为对初始故障诊断迁移卷积神经网络模型进行训练处理得到的模型；

所述故障诊断迁移卷积神经网络模型为对初始故障诊断迁移卷积神经网络模型进行训练处理得到的模型，是指：获取源域样本和目标域样本；将源域样本和目标域样本分别通过前向传播输入故障诊断迁移卷积神经网络模型，以提取特征；在故障诊断迁移卷积神经网络模型设有域自适应模块；通过交叉熵损失函数来最小化源域样本上的健康状态分类错误；并通过域自适应模块计算源域样本与目标域样本之间特征的协方差距离，以增加源域样本与目标域样本之间特征之间的相似性；通过迭代优化损失函数来对故障诊断迁移卷积神经网络模型的参数进行约束，对故障诊断迁移卷积神经网络模型进行不对训练，直到达到最大迭代次数或损失函数小于设定值；

所述故障诊断迁移卷积神经网络模型包括特征提取器和健康分类器；其中，特征提取器包括源域特征提取器和目标域特征提取器；源域特征提取器和目标域特征提取器均包括卷积层和池化层；源域特征提取器还包括全连接层1S；目标域特征提取器还包括全连接层1T；所述健康分类器包括与全连接层1S连接的全连接层2S、与全连接层1T连接的全连接层2T，以及与全连接层2S连接的输出层；全连接层1S与全连接层1T之间，以及全连接层2S与全连接层2T之间分别通过域自适应模块连接；

所述对初始故障诊断迁移卷积神经网络模型进行训练处理，是指包括如下步骤：

其中，表示元素都为1的列向量的转置；F_S表示源域样本经过全连接层的输出数据；F_T表示目标域样本经过全连接层的输出数据；n_S表示源域样本个数；n_T表示目标域样本个数；

L(θ_f,θ_c)＝L_c(θ_f,θ_c)+λL_CORAL(θ_f)

S6，基于损失函数和adam算法,更新参数θ_f和θ_c：

其中，η是学习率；

2.根据权利要求1所述的深度迁移学习智能故障诊断方法，其特征在于：源域特征提取器包括卷积层和池化层，是指：源域特征提取器包括依次连接的卷积层1S、池化层1S、卷积层2S、卷积层3S、卷积层4S和池化层2S；池化层2S与全连接层1S连接；

3.一种深度迁移学习智能故障诊断装置，其特征在于，包括：

数据输入模块，用于获取待识别的目标域数据；

L(θ_f,θ_c)＝L_c(θ_f,θ_c)+λL_CORAL(θ_f)

S6，基于损失函数和adam算法,更新参数θ_f和θ_c：

其中，η是学习率；

4.一种存储介质，其特征在于，其中所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行权利要求1或2所述的深度迁移学习智能故障诊断方法。

5.一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现权利要求1或2所述的深度迁移学习智能故障诊断方法。