CN114510968B

CN114510968B - 一种基于Transformer的故障诊断方法

Info

Publication number: CN114510968B
Application number: CN202210072731.1A
Authority: CN
Inventors: 赵志宏; 李春秀; 张然; 杨绍普; 刘克俭; 吴冬冬; 孙诗胜; 顾晓辉
Original assignee: Shijiazhuang Tiedao University
Current assignee: Shijiazhuang Tiedao University
Priority date: 2022-01-21
Filing date: 2022-01-21
Publication date: 2022-09-16
Anticipated expiration: 2042-01-21
Also published as: CN114510968A

Abstract

本发明提供了一种基于Transformer的故障诊断方法，属于故障诊断技术领域。本发明采用了多层Transformer Encoder作为特征提取模块，在Encoder层之间加入Dense连接增强模型特征复用能力，在特征提取模块前加入Dropout层来提高模型的泛化能力，加入多通道卷积神经网络层来进行样本矩阵生成，采用全连接层进行故障分类。本发明采用了Transformer Encoder结构并进行了改进，将其应用在机械设备的故障诊断中，能够很好的提取振动信号之间长时间内的时序特征和全局特征，得到更加准确的故障关系。

Description

一种基于Transformer的故障诊断方法

技术领域

本发明属于故障诊断领域，具体涉及一种基于Transformer的故障诊断方法。

背景技术

随着现代工业、科技、经济的不断发展，工业已经成为衡量一个国家综合实力的重要标准。在现代工业社会中，机械设备是不可或缺的常用部件，在工业生产中起着至关重要的作用，大量的机械设备在运行初期具有良好的稳定性，但是复杂的工作环境和不规则的操作过程影响工业设备的安全，导致机械设备出现异常，它们的性能会随着时间的推移而降低甚至失效。而机械设备的有效维护是维持正常运转的基本要求，防止设备故障产生可以减少财产损失，避免严重事故的发生。因此，在生产过程中，对可靠性、安全性以及降低制造成本的需求，极大的推动了对机械设备故障诊断技术的发展。

随着深度学习的发展，基于卷积神经网络和循环神经网络的故障诊断方法都得到了广泛的应用，并取得较好的故障诊断效果。但是这两种类型的神经网络也有它们自己的缺陷，循环神经网络及其变体仍然不能完全避免长期依赖问题。卷积神经网络卷积核的局部接受域导致需要叠加大量的卷积层，才能获得全局信息，存在缺乏捕捉目标之间的关系、平等处理所有像素点、缺乏针对性等缺点。

发明内容

为了克服上述现有技术存在的不足，本发明提供了一种基于Transformer的故障诊断方法。

为了实现上述目的，本发明提供如下技术方案：

一种基于Transformer的故障诊断方法，包括以下步骤：

获取多个不同故障类型的机械设备振动信号作为数据集；

利用Transformer Encoder搭建特征提取网络；

利用特征提取模块、全连接层网络、两层Dropout网络和两层卷积神经网络搭建故障诊断模型；

利用数据集中的机械设备振动信号对故障诊断模型进行训练；

将待测机械设备振动信号输入训练好的故障诊断模型得到待测机械设备振动信号的分类结果，根据分类结果判断待测机械设备的故障情况。

优选的，利用Transformer Encoder搭建特征提取模块的步骤为：

堆叠三层Encoder网络；

在每层Encoder网络之间加入Dense连接。

优选的，通过下式进行三层Encoder网络Dense连接，

x_m＝H_m([x₀,x₁,…,x_m-1])

式中，x_m为第m层的Encoder网络的输出，[·]为特征拼接函数，H_m为第m层的Encoder网络的特征提取函数。

优选的，搭建Encoder网络的步骤包括：

由多个Self-Attention组成Multi-Head Attention；

Multi-Head Attention与Feed Forward Network作为子层堆叠后残差连接得到Encoder网络。

优选的，所述由多个Self-Attention组成Multi-Head Attention的步骤包括：

利用下式计算Self-Attention,

式中，Q为Query向量、K为Key向量，V为Value向量；K^T为K向量的转置，

为缩放因子；

利用下式计算多个Self-Attention组成的Multi-Head Attention，

MultiHeads(Q,K,V)＝Concat(head₁,...,head_n)W^o

其中，

式中，Q为Query向量,K为Key向量,V为Value向量,head_i为第i个Self-Attention的结果,W^o为权重矩阵,

为Query权重矩阵,

为Key权重矩阵,

为Value权重矩阵，Concat为特征拼接函数。

优选的，所述利用特征提取模块、全连接层网络、两层Dropout网络和两层卷积神经网络搭建故障诊断模型的步骤包括：

将两层Dropout网络分别作为第一层网络和第四层网络；

将两层卷积神经网络分别作为第二层网络和第五层网络；

将特征提取模块作为第三层网络；

将全连接层网络作为第六层网络；

按顺序连接各层网络得到故障诊断模型。

优选的，所述利用机械设备数据集对故障诊断模型进行训练的步骤包括：

通过第一层网络丢弃数据集中的部分数据，将数据集中剩余的数据作为训练集；

将训练集中的数据输入第二层网络生成样本矩阵；

通过第三层网络对样本矩阵进行特征提取得到特征；

通过第四层网络丢弃样本特征中的神经元；

将丢弃过神经元的样本特征通过第五层网络进行融合；

将融合后的样本特征输入第六层网络实现对故障分类，实现对故障诊断模型的训练。

优选的，所述样本矩阵的行列数由第一层神经网络的通道数和特征长度确定。

本发明提供的基于Transformer的故障诊断方法具有以下有益效果：本发明采用Transformer Encoder模块作为模型的特征提取部分，Transformer Encoder可以更好的学习机械设备故障信息长时间内的时序特征和全局特征，得到更加准确的故障关系；模型采用CNN生成样本矩阵作为Encoder模块的输入数据，丰富了样本矩阵的特征信息，也创新性的将Transformer与故障诊断结合；相比于普通卷积神经网络，本发明方法特征提取能力更强，诊断准确率更高。

附图说明

为了更清楚地说明本发明实施例及其设计方案，下面将对本实施例所需的附图作简单地介绍。下面描述中的附图仅仅是本发明的部分实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1的基于Transformer的故障诊断方法的流程图；

图2为本发明实施例1的Multi-Head Attention结构示意图；

图3为本发明实施例1的故障诊断模型的结构示意图；

图4为本发明实施例1的特征提取模块中第一层Encoder数据可视化图；

图5为本发明实施例1的特征提取模块中第二层Encoder数据可视化图；

图6为本发明实施例1的特征提取模块中第三层Encoder数据可视化图；

图7为本发明实施例1的基于Transformer的故障诊断方法的识别准确率变化的曲线图；

图8为本发明实施例1基于Transformer的故障诊断方法的Loss函数变化曲线图。

具体实施方式

为了使本领域技术人员更好的理解本发明的技术方案并能予以实施，下面结合附图和具体实施例对本发明进行详细说明。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

实施例1

参阅图1，本发明提供了一种基于Transformer的故障诊断方法，包括以下步骤：获取多个不同故障类型的机械设备振动信号作为数据集；利用Transformer Encoder搭建特征提取网络；利用特征提取模块、全连接层网络、两层Dropout网络和两层卷积神经网络搭建故障诊断模型；利用数据集中的机械设备振动信号对故障诊断模型进行训练；将待测机械设备振动信号输入训练好的故障诊断模型得到待测机械设备振动信号的分类结果，根据分类结果判断待测机械设备的故障情况。

在本实施例中，利用Transformer Encoder搭建特征提取模块的步骤为：堆叠三层Encoder网络；在每层Encoder网络之间加入Dense连接。

具体的，通过下式进行三层Encoder网络Dense连接，

x_m＝H_m([x₀,x₁,…,x_m-1])

搭建Encoder网络的步骤包括：由多个Self-Attention组成Multi-HeadAttention；Multi-Head Attention与Feed Forward Network作为子层堆叠后残差连接得到Encoder网络。图2展示了本实施例中的Multi-Head Attention的结构。

在本实施例中，由多个Self-Attention组成Multi-Head Attention的步骤包括：

利用下式计算Self-Attention,

为缩放因子。

利用下式计算多个Self-Attention组成的Multi-Head Attention，

MultiHeads(Q,K,V)＝Concat(head₁,...,head_n)W^o

其中，

为Query权重矩阵,

为Key权重矩阵,

为Value权重矩阵，Concat为特征拼接函数。

参阅图3，利用特征提取模块、全连接层网络、两层Dropout网络和两层卷积神经网络搭建故障诊断模型的步骤包括：将两层Dropout网络分别作为第一层网络和第四层网络；将两层卷积神经网络分别作为第二层网络和第五层网络；将特征提取模块作为第三层网络；将全连接层网络作为第六层网络；按顺序连接各层网络得到故障诊断模型。

在本实施例中，利用机械设备数据集对故障诊断模型进行训练的步骤包括：通过第一层网络丢弃数据集中的部分数据，将数据集中剩余的数据作为训练集；将训练集中的数据输入第二层网络生成样本矩阵，其中，样本矩阵的行列数由第二层网络的通道数和特征长度确定；通过第三层网络对样本矩阵进行特征提取得到特征；通过第四层网络丢弃样本特征中的神经元；将丢弃过神经元的样本特征通过第五层网络进行融合；将融合后的样本特征输入第六层网络实现对故障分类，实现对故障诊断模型的训练。

从图4-图6中可以看到机械设备振动信号在特征提取模块中的处理过程其中，图4展示了特征提取模块中第一层Encoder数据可视化图，图5为展示了特征提取模块中第二层Encoder数据可视化图；图6为展示了特征提取模块中第三层Encoder数据可视化图。

图7展示了本发明对于故障的识别情况，从图中可以看出，当训练次数足够多，在实际的测试中，故障识别的准确率非常接近理想化状态。图8展示了本发明的Loss函数变化曲线图，从图8中可以看出，当训练次数足够多时，本发明的实验结果与真实结果非常接近。采用本发明模型在变转速轴承数据集的实验准确率可达到99％以上。

以上实施例仅为本发明较佳的具体实施方式，本发明的保护范围不限于此，任何熟悉本领域的技术人员在本发明披露的技术范围内，可显而易见地得到的技术方案的简单变化或等效替换，均属于本发明的保护范围。

Claims

1.一种基于Transformer的故障诊断方法，其特征在于，包括以下步骤：

获取多个不同故障类型的机械设备振动信号作为数据集；

利用Transformer Encoder搭建特征提取网络，具体包括以下步骤：

堆叠三层Encoder网络；

在每层Encoder网络之间加入Dense连接；

通过下式进行三层Encoder网络Dense连接，

x_m＝H_m([x₀,x₁,…,x_m-1])

式中，x_m为第m层的Encoder网络的输出，[·]为特征拼接函数，H_m为第m层的Encoder网络的特征提取函数；

2.根据权利要求1所述的基于Transformer的故障诊断方法，其特征在于，搭建Encoder网络的步骤包括：

由多个Self-Attention组成Multi-Head Attention；

3.根据权利要求2所述的基于Transformer的故障诊断方法，其特征在于，

所述由多个Self-Attention组成Multi-Head Attention的步骤包括：

利用下式计算Self-Attention,

为缩放因子；

利用下式计算多个Self-Attention组成的Multi-Head Attention，

MultiHeads(Q,K,V)＝Concat(head₁,...,head_n)W^o

其中，

为Query权重矩阵,

为Key权重矩阵,

为Value权重矩阵，Concat为特征拼接函数。

4.根据权利要求1所述的基于Transformer的故障诊断方法，其特征在于，所述利用特征提取模块、全连接层网络、两层Dropout网络和两层卷积神经网络搭建故障诊断模型的步骤包括：

将两层Dropout网络分别作为第一层网络和第四层网络；

将两层卷积神经网络分别作为第二层网络和第五层网络；

将特征提取模块作为第三层网络；

将全连接层网络作为第六层网络；

按顺序连接各层网络得到故障诊断模型。

5.根据权利要求4所述的基于Transformer的故障诊断方法，其特征在于，所述利用机械设备数据集对故障诊断模型进行训练的步骤包括：

将训练集中的数据输入第二层网络生成样本矩阵；

通过第三层网络对样本矩阵进行特征提取得到特征；

通过第四层网络丢弃样本特征中的神经元；

将丢弃过神经元的样本特征通过第五层网络进行融合；

6.根据权利要求5所述的基于Transformer的故障诊断方法，其特征在于，所述样本矩阵的行列数由第二层网络的通道数和特征长度确定。