CN112633362B

CN112633362B - 一种旋转机械自适应故障诊断方法、装置、设备及介质

Info

Publication number: CN112633362B
Application number: CN202011518014.4A
Authority: CN
Inventors: 吴军; 黎国强; 邓超; 徐雪兵; 邵新宇
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2024-03-29
Anticipated expiration: 2040-12-21
Also published as: CN112633362A

Abstract

本发明公开了一种旋转机械自适应故障诊断方法、装置、设备及介质，属于旋转机械故障诊断技术领域，方法包括：收集旋转机械各种状态数据，对状态数据进行标注，并构建训练数据集；构建基于Cap‑net的故障诊断模型，利用训练数据集对模型进行训练；构建基于深度强化学习的自适应学习框架，并初始化自适应学习框架，设计标注方法和奖赏规则；基于建立的自适应学习框架，实现对旋转机械在线数据的诊断和对target网络的更新，获得最终的故障诊断模型；测试故障诊断模型，输出测试结果。如此，本发明不仅实现了旋转机械的在线状态诊断，还实现了故障诊断模型性能的提升，并且降低了模型训练过程中获取和标注数据样本的成本。

Description

一种旋转机械自适应故障诊断方法、装置、设备及介质

技术领域

本发明属于旋转机械故障诊断技术领域，具体涉及一种旋转机械自适应故障诊断方法、装置、设备及介质。

背景技术

旋转机械作为工程领域装备不可或缺的主体或关键部件，关系着矿山、石化、冶金以及发电等国计民生项目的生产效益。然而，在实际运行中旋转机械受恶劣工作环境以及强负荷、连续运转等工作状态的影响，相比于装备中的其他部分，其更易发生一定程度的性能劣化继而引发一系列继发故障，这严重影响装备总体性能，轻则降低装备生产质量，重则造成巨大的经济损失和人员伤亡。因此，针对旋转机械这一典型部件发展智能化故障诊断十分有必要。

近年来，随着深度学习的发展，旋转机械智能故障诊断技术取得了长足发展。一般而言，基于深度学习的旋转机械故障诊断模型多以有监督方式对模型参数进行优化，通过深度挖掘旋转机械状态数据特征，利用全连接神经元对特征和故障模式进行线性和非线性映射，从而实现对旋转机械的故障分类。然而，基于有监督训练而来的故障诊断模型往往具有其内在限制，如：故障诊断模型多依赖于旋转机械的历史数据，只对与历史数据相似的监测数据有较好的识别能力，当工况发生变化时，模型往往会由于泛化能力不足，导致对监测数据的误诊；此外，训练一个优秀的故障诊断模型，需要大量的标注数据样本支撑，然而，数据样本的获取和标注是一项高成本任务。

发明内容

针对现有技术的缺陷和改进需求，本发明提供了一种旋转机械自适应故障诊断方法、系统及存储介质，其目的在于，解决现有故障诊断模型泛化能力不足以及训练故障诊断模型成本高的技术问题。

为实现上述目的，一方面，本发明提供了一种旋转机械自适应故障诊断方法，包括以下步骤：

S1、采集旋转机械的状态数据，并对所述状态数据进行标注，构建训练数据集；

S2、构建基于胶囊神经网络的故障诊断模型，并利用所述训练数据集对胶囊神经网络参数进行优化训练，从而得到训练后的故障诊断模型；

S3、建立基于深度强化学习的自适应学习框架，所述框架包括在线数据环境、target网络、evaluation网络、记忆存储器和在线特征字典；

S4、利用步骤S2中所述训练后的故障诊断模型初始化target网络和evaluation网络；并利用初始化后的evaluation网络对所述训练数据集进行特征向量提取，以初始化在线特征字典；利用初始化后的在线特征字典设计在线数据的标注方法和奖赏规则；

S5、利用不同工况下进行标注和奖赏后的在线数据更新target网络权重，并将更新后的target网络作为最终故障诊断模型。

进一步地，步骤S2中胶囊神经网络包括多个卷积层、多个池化层、多个胶囊层和一个分类层；其中，卷积层用于获取输入层的特征；池化层用于对卷积运算后的结果进行数据降维处理；胶囊层用于将全连接神经网络的每个神经元由标量转换为向量。

进一步地，步骤S2中，利用所述训练数据集对胶囊神经网络参数进行优化训练具体包括：

将所述训练数据样本输入至构建的胶囊神经网络模型中，通过比较模型输出和样本真实标签获取两者之间的差异，形成损失函数；利用反向传播算法不断更新模型网络权重以减小损失函数；

其中，所述损失函数定义如下：

L_c＝T_cmax(0,m⁺-p^c)²+λ(1-T_c)max(0,p_c-m^-)²

上式中，c表示训练数据集中包含的故障类型数目；p^c表示输出的每个故障类型的概率值；T_c为分类指示函数，当p^c概率最大对应的故障类型K与输入数据的真实标签c一致时，T_c＝1，否则T_c＝0；m⁺和m^-分别表示概率上边界和下边界；当概率p^c大于设定的上边界或小于边界时损失函数将被置为0；λ为一个比例系数，用于修改m⁺和m^-比例。

进一步地，步骤S4中，利用初始化后的在线特征字典设计在线数据的标注方法和奖赏规则具体包括：

S41、计算在线特征字典中每一类特征向量与在线数据特征向量的余弦相似度，计算过程如下：

其中，代表第l类特征的第j个特征向量的第i分量；B_i代表标注在线数据的特征向量的第i个分量；similarity^l表示在线数据特征向量与第l类特征的相似度总和；

S42、根据步骤S41计算获得的最大余弦相似度确定在线数据标注；选取最大余弦相似度作为奖赏。

进一步地，步骤S5具体包括：

S51：针对在不同工况的在线数据样本s，利用步骤S41和S42对s进行标注a和奖赏r获得(s,a,r)，并将其存储在记忆存储器中；

S52：利用记忆存储器中(s,a,r)更新target网络权重；在该步骤中，r被引入损失函数中，形成新的损失函数如下：

S53、当更新次数达到设定的自适应学习次数后，最终的target网络即为最终的故障诊断模型。

进一步地，还包括：

S6、将不同工况下的测试样本输入至步骤S5获得的最终故障诊断模型中，根据测试样本的诊断结果，评估经过自适应学习后的故障诊断模型性能。

另一方面，本发明提供了一种旋转机械自适应故障诊断装置，包括：

采集单元，用于采集旋转机械的状态数据，并对所述状态数据进行标注，构建训练数据集；

模型构建模块，用于构建基于胶囊神经网络的故障诊断模型，并利用所述训练数据集对胶囊神经网络参数进行优化训练，从而得到训练后的故障诊断模型；

自适应学习模块，用于建立基于深度强化学习的自适应学习框架，所述框架包括在线数据环境、target网络、evaluation网络、记忆存储器和在线特征字典；

初始化模块，用于利用所述训练后的故障诊断模型初始化target网络和evaluation网络；并利用初始化后的evaluation网络对所述训练数据集进行特征向量提取，以初始化在线特征字典；利用初始化后的在线特征字典设计在线数据的标注方法和奖赏规则；

更新模块，用于利用不同工况下进行标注和奖赏后的在线数据更新target网络权重，并将更新后的target网络作为最终故障诊断模型。

另一方面，本发明提供了一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法的步骤。

另一方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

总体而言，通过本发明所构思的以上技术方案，能够取得以下有益效果：

(1)为突破现有基于深度学习的旋转机械故障诊断限制，本发明提供了一种融合胶囊神经网络(Cap-net)和深度强化学习的旋转机械自适应故障诊断方法。为更好地从状态数据中学习故障特征，在本发明中采用Cap-net作为故障诊断模型，该模型利用可获得的旋转机械状态数据进行优化训练。紧接着，针对训练后的Cap-net在其他未知工况下故障诊断泛化性能不足、精度不高的问题，设计了一种基于深度强化学习的故障诊断自适应框架。在该框架下，不仅实现了旋转机械的在线状态诊断，还实现了故障诊断模型性能的提升。

(2)本发明只需收集少部分标注数据对故障诊断模型进行有监督训练，接着，在监测过程中可利用产生的不带标注数据不断提高模型故障诊断性能和自适应能力。

附图说明

图1为本发明提出的一种旋转机械自适应故障诊断方法流程图；

图2为本发明实例Cap-net的基本结构示意图；

图3为本发明提出的基于深度强化学习的自适应学习框架；

图4为Cap-net训练过程示意图；

图5为本发明实例测试结果图，其中，(a)、(b)、(c)、(d)分别为基于数据集1、2、3、4训练获得Cap-net在四个数据集上的测试精度；

图6为本发明实例与其他方法的故障识别精度对比图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

如图1所示，为本发明提供的一种旋转机械自适应故障诊断方法，包括：

步骤1：收集旋转机械的状态数据，并对这些状态数据进行标注，构建训练数据集；

步骤2：构建基于Cap-net的故障诊断模型；利用上述获得的训练数据集对Cap-net网络参数进行优化，通过不断调整Cap-net超参数(如学习率、训练批次、迭代次数等)，训练获得最优模型；

具体的，基于Cap-net故障诊断模型的训练过程如下：

步骤2.1：构建Cap-net，该网络包括多个卷积层、多个池化层、多个胶囊层和一个分类层，如图2所示。

1.卷积层

卷积层是用来获取输入层的特征。在卷积层中卷积核作为一个特征探测器，通过与输入数据进行卷积计算而得到一个特征层。其数学表达式如下：

上式中：为l层中j通道的特征数据，其是由l层中第j个卷积核对l-1层中所有特征数据进行卷积计算得来的；/>代表第j个卷积核的权重；/>为偏差；*代表卷积运算。

2.池化层

池化层一般连接到卷积层的后面，用来对卷积运算后的结果进行数据降维处理。池化操作步骤为：选定一定大小的池化窗口以一定步幅滑过特征数据；计算窗口与特征数据重叠区域的最大值或平均值将它们作为该区域代表值；拼接所有代表值作为新的特征层。最大值池化的过程表示如下：

上式中，选取的池化窗口大小为k×k；表示池化窗口第j次滑过/>时获得最大值表示。

3.胶囊层

胶囊层作用为将全连接神经网络的每个神经元由标量转换为向量，利用向量的方向信息和大小信息作为特征。一般而言，在胶囊层中存在三个阶段。

第1阶段为，将卷积和池化层处理后的输出数据点u_i与权重矩阵W_ij相乘，获得预测向量u_j|i。公式表达如下：

u_j|i＝W_ij×u_i (3)

第2阶段为，对预测向量u_j|i进行加权求和得到输出向量s_j。其计算公式如下：

式中：c_ij为耦合系数。

第3阶段为，将获得的输出向量s_j进行缩放获得最终的输出向量v_j。缩放方法为对向量进行非线性映射，具体数学表达形式如下：

从上述3个阶段可知，第2阶段中的耦合系数c_ij需要进行求解。这里，动态路由算法被用来对c_ij进行确定，其主要运算过程如下：

b_ij＝b_ij+v_ju_ji (7)

在每次路由运算中，b_ij先被初始化为0，由式(6)计算出耦合系数的初始值，经过前向传播计算出输出向量v_j。然后，基于式(7)来更新c_ij，并通过设定的迭代次数循坏这一过程，以获得一组最优的c_ij。

步骤2.2：对构建的Cap-net进行模型训练。模型训练过程为将训练数据样本输入至构建的Cap-net模型中，通过比较模型输出和样本真实标签获取两者之间的差异，形成损失函数。利用反向传播算法不断更新模型网络权重减小损失函数，这里的损失函数定义如下：

L_c＝T_cmax(0,m⁺-p^c)²+λ(1-T_c)max(0,p_c-m^-)² (8)

上式中：c表示训练数据集中包含的故障类型数目；p^c表示输出的每个故障类型的概率值；T_c为分类指示函数，当p^c概率最大对应的故障类型K与输入数据的真实标签c一致时，T_c＝1，否则T_c＝0；m⁺和m^-分别表示概率上边界和下边界；当概率p^c大于设定的上边界或小于边界时损失函数将被置为0；λ为一个比例系数，用于修改m⁺和m^-比例。

步骤3：建立基于深度强化学习的自适应学习框架。该框架如图3所示，主要包括：在线数据环境、target网络、evaluation网络、记忆存储器和在线特征字典。

具体的，构建自适应学习框架的具体步骤如下：

步骤3.1：建立在线特征字典。利用步骤2中获得的Cap-net模型提取训练数据的特征向量，将特征向量和其对应的标签储存在在线特征字典中。存储形式为标签代表目录，特征代表目录下的内容；

步骤3.2：建立在线数据环境和两个相同结构的神经网络target网络和evaluation网络。其中，在线数据环境为输出旋转机械的在线监测数据；evaluation网络为用来对数据进行特征提取；target网络为进行网络权重更新，获取针对在线数据具有最优故障诊断表现的模型；

步骤3.3：建立具有一定容量的记忆存储器，用来存储在线数据样本及其对应的标注和奖赏；

步骤4：利用步骤2中获得Cap-net模型初始化target网络和evaluation网；并利用初始化后的evaluation网络对所述训练数据集进行特征向量提取，以初始化在线特征字典；利用初始化后的在线特征字典设计在线数据的标注方法和奖赏规则；

具体的，初始化网络和设计标注方法和奖赏规则如下：

步骤4.1：初始化target网络和evaluation网络。为获取步骤2Cap-net模型的故障诊断能力，Cap-net模型的网络参数被用来初始化target网络和evaluation网络。

步骤4.2：针对步骤3.2中未知状态的在线数据，设计针对在线数据的标注方法。标注过程如下：计算在线特征字典中每一类特征向量与在线数据特征向量的余弦相似度，计算过程如下：

由于相似向量具有最大余弦相似度，我们根据式(9)选取具有最大余弦相似度的l作为在线数据潜在标签；

步骤4.3：设计奖赏。针对步骤4.2的标注过程，选取步骤4.2中最大余弦相似度作为奖赏，评价该标注过程；奖赏目的是使得具有相同标签的数据经target网络提取的特征向量具有最大余弦相似度。

步骤5：基于建立的自适应学习框架，利用不同工况下的在线数据更新target网络权重，将更新后的target网络作为最终故障诊断模型；

具体的，在构建的框架下，完成故障诊断模型对不同工况的自适应学习，具体过程如下：

步骤5.1：针对在不同工况的在线数据样本s，利用步骤4.1和4.2对s进行标注a和奖赏r获得(s,a,r)，并将其存储在记忆存储器中。同时，根据标注a将获得的特征向量添加至在线特征字典中。考虑存在错误标注情况，我们设计了在线字典自修剪机制，具体实施过程为，当某一特征向量与这一类标签的其他特征向量的中心距离大于平均值一定倍数n时，则将该特征向量从在线特征字典中剔除。

步骤5.2：利用记忆存储器中(s,a,r)对target网络进行类似步骤2的网络权重更新。在该步骤中，r将被引入至损失函数中，新的损失函数如下：

当上述更新次数达到设定的自适应学习次数后，最终的target网络即为新的故障诊断模型。

步骤6：将不同工况下的测试样本输入至步骤5获得的故障诊断模型，根据测试样本的诊断结果，评估经过自适应学习后的故障诊断模型性能。

本发明另一方面，提供了一种旋转机械自适应故障诊断装置，包括：

上述旋转机械自适应故障诊断装置中各个模块的划分仅用于举例说明，在其他实施例中，可将旋转机械自适应故障诊断装置按照需要划分为不同的模块，以完成上述旋转机械自适应故障诊断装置的全部或部分功能。

上述旋转机械自适应故障诊断装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

本申请实施例中提供的旋转机械自适应故障诊断装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在电子设备的存储器上。该计算机程序被处理器执行时，实现本申请实施例中所描述方法的步骤。

本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质，当所述计算机可执行指令被一个或多个处理器执行时，使得所述处理器执行旋转机械自适应故障诊断方法的步骤。

一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行旋转机械自适应故障诊断方法。

本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)，它用作外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。

为验证本发明公开方法的有效性，使用旋转机械关键部件滚动轴承不同工况下的状态振动数据。所有振动信号均来自一个加速寿命测试实验台。该实验台主要由电动机、扭矩测量轴、滚动轴承试验模块、飞轮和负载电机组成。各种振动信号均来源于型号为336C04的压电式传感器,其采用频率为64kHz。本实验中测试轴承一共存在四种运行工况，工况由电动机转速、加载力矩和径向力组合确定。同时，本实验设计了3种轴承故障类型即，正常、内圈故障和外圈故障。每种故障类型分别测得了256823个振动数据点。每种故障的振动数据点都通过数据扩充技术获得1000个样本，每个样本包含1024个点。其中，前800个样本作为训练样本，后200个样本作为测试样本。因此，每种工况的训练集总共有2400个样本，测试集有600个样本。实验工况和数据集详情如表1所示。

表1轴承运行工况和数据集描述

利用上述滚动轴承数据集验证本发明方法的有效性的具体操作流程如下：

步骤2：构建基于Cap-net的故障诊断模型。本发明所提Cap-net网络结构具体有一个输入层，三层卷积，两层池化，两层胶囊和一个输出层。输入层的输入大小为32×32；卷积层的卷积核个数分别为16、32和32，卷积核大小均为3×3；两层池化层池化窗口大小均为2×2；初级胶囊层采用3厚度为16的二维卷积核将最后一个池化层输出的特征映射为胶囊，初级胶囊大小为16×1，每个胶囊包含16个神经元；数字胶囊大小为2×1。为验证本发明方法的有效性，首先，训练样本和测试样本都通过重构操作转化为二维数据格式；其次，利用数据集1中的训练数据样本训练Cap-net。在训练过程中，学习率为0.0001，训练批次大小为32，优化器为Adam，迭代次数为50。图4显示了Cap-net的训练过程。表2显示了基于数据集1训练获得Cap-net在四个数据集上的测试精度；

表2基于数据集1训练样本训练获得的Cap-net的测试精度

步骤3：建立自适应学习框架。建立与步骤2中Cap-net具有相同结构的target网络和evaluation网络，将记忆存储器设为50；

步骤4：利用步骤2中获得的Cap-net网络参数初始化上述两个网络；利用evaluation网络提取数据集1中训练样本的特征向量用来初始化在线特征字典。

步骤5：分别将数据集2、3、4中的训练数据作为在线数据。将在线数据样本s_i输入步骤4中以获得(s_i,a_i,r_i)，并存储在记忆存储器中。当记忆存储器满了时，利用记忆存储器中所有样本根据式(8)来更新target网络权重。在本试验中，针对每个数据集的学习次数设定为500，自修剪机制参数n设定为1.25。

步骤6：将所有测试数据集输入步骤5后获得的故障诊断模型进行测试。图5显示了经在线自适应学习后获得的故障诊断模型十次验证结果，通过与自适应学习之前的Cap-net模型进行比较发现设计的框架可以提升模型性能。

为了突出本发明方法优秀的故障诊断性能，本发明方法与机器学习方法BaggedTree、支持向量机、KNN以及线性判别器进行了比较。图6展示了它们在所有数据集下的平均测试精度，从结果可以看到本发明方法明显优于其他方法。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种旋转机械自适应故障诊断方法，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于，步骤S2中胶囊神经网络包括多个卷积层、多个池化层、多个胶囊层和一个分类层；其中，卷积层用于获取输入层的特征；池化层用于对卷积运算后的结果进行数据降维处理；胶囊层用于将全连接神经网络的每个神经元由标量转换为向量。

3.如权利要求1或2所述的方法，其特征在于，步骤S2中，利用所述训练数据集对胶囊神经网络参数进行优化训练具体包括：

其中，所述损失函数定义如下：

L_c＝T_cmax(0,m⁺-p^c)²+λ(1-T_c)max(0,p_c-m^-)²

4.如权利要求3所述的方法，其特征在于，步骤S4中，利用初始化后的在线特征字典设计在线数据的标注方法和奖赏规则具体包括：

其中，代表第l类特征的第j个特征向量的第i分量；B_i代表在线数据的特征向量的第i个分量；similarity^l表示在线数据特征向量与第l类特征的相似度总和；

5.如权利要求4所述的方法，其特征在于，步骤S5具体包括：

6.如权利要求1或2所述的方法，其特征在于，还包括：

7.一种旋转机械自适应故障诊断装置，其特征在于，包括：

8.一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。