CN116776086B

CN116776086B - 基于自注意力机制自编码器的信号故障判别方法及装置

Info

Publication number: CN116776086B
Application number: CN202311047756.7A
Authority: CN
Inventors: 陶家晋; 李光; 胡伟飞; 岳海峰; 郭云飞; 李芬; 刘振宇
Original assignee: Taiyuan Heavy Industry Co Ltd
Current assignee: Taiyuan Heavy Industry Co Ltd
Priority date: 2023-08-21
Filing date: 2023-08-21
Publication date: 2023-11-28
Anticipated expiration: 2043-08-21
Also published as: CN116776086A

Abstract

本发明公开了一种基于自注意力机制自编码器的信号故障判别方法及装置，该方法包括：获取历史振动信号数据和待测振动信号数据；对振动信号数据进行预处理，以使振动信号数据的数据维度能够适用于构建的神经网络模型；基于自注意力机制构建神经网络模型，利用预处理后的历史振动信号数据对神经网络模型进行训练；将待测振动信号数据输入训练后的神经网络模型，获取神经网络模型的输出结果；根据输出结果确定待测振动信号数据对应的信号类别。本发明的方法及装置既能够在历史振动信号数据存在故障信号数据的情况下对设备运行状态进行快速、准确诊断，又能够在历史振动信号数据不存在故障信号数据的情况下对设备运行状态进行快速、可靠诊断。

Description

基于自注意力机制自编码器的信号故障判别方法及装置

技术领域

本发明涉及信号处理技术领域，尤其涉及一种基于自注意力机制自编码器的信号故障判别方法及装置。

背景技术

无损检测是复杂设备健康监测中的重要环节和方式，通过对设备状态的监督和分析，能有效预测设备失效发展情况，以及时对设备进行维修和处理，降低不必要的损伤和损失。作为接触式无损检测的主要方法，基于振动信号的故障诊断作为一种主要的接触式无损检测方法，被广泛应用于复杂设备全生命周期的状态监测。

随着机器学习技术和人工智能技术在图像、自然语言等方面的发展，相应的技术也被各个领域借鉴迁移，其中也包括了振动信号分析领域。目前，在利用机器学习技术进行振动信号分析以判别设备是否故障时，需要利用大量的故障信号数据进行模型的训练。然而，在实际工况中，故障设备很难维持持续运行，导致难以采集足够数量的故障信号，并且若使设备长时间在故障状态下运行以采集故障信号，则容易导致设备严重受损，进而造成更大的经济损失。

发明内容

为解决上述现有技术中存在的部分或全部技术问题，本发明提供一种基于自注意力机制自编码器的信号故障判别方法及装置。

本发明的技术方案如下：

第一方面，提供了一种基于自注意力机制自编码器的信号故障判别方法，所述方法包括：

获取历史振动信号数据和待测振动信号数据；

对振动信号数据进行预处理，以使振动信号数据的数据维度能够适用于构建的神经网络模型；

基于自注意力机制构建神经网络模型，利用预处理后的历史振动信号数据对神经网络模型进行训练，其中，若历史振动信号数据仅包括健康振动信号数据，则以历史振动信号数据作为神经网络模型的输入和输出对神经网络模型进行训练，若历史振动信号数据包括健康振动信号数据和故障振动信号数据，则以历史振动信号数据作为神经网络模型的输入，以历史振动信号数据对应的信号类别作为神经网络模型的输出，对神经网络模型进行训练，信号类别包括健康信号和故障信号；

将待测振动信号数据输入训练后的神经网络模型，获取神经网络模型的输出结果；

根据输出结果确定待测振动信号数据对应的信号类别，若历史振动信号数据仅包括健康振动信号数据，则根据输出结果、待测振动信号数据与预设判别阈值之间的关系确定待测振动信号数据对应的信号类别。

在一些可能的实现方式中，对振动信号数据进行预处理，包括：

对振动信号数据进行切片处理和分割处理。

在一些可能的实现方式中，设定：同一批次输入神经网络模型的振动信号数据为维度为（B，N，Tf）的数据X，B表示输入神经网络模型的一批数据包括的振动信号数据数量，T、f和N分别表示在获取振动信号数据时的采样时间、采样频率和采集通道数；

对振动信号数据进行切片处理和分割处理包括：

采用一维卷积神经网络对维度为（B，N，Tf）的数据X进行转换，以使其维度变更为（B，dh，TfN/dh），d表示信号序列嵌入维度，h表示多头注意力的头数；

采用多头注意力机制对信号维度进行分割，以使其维度整合为（B，h，d，H），H=TfN/dh，H表示振动特征长度。

在一些可能的实现方式中，所述神经网络模型包括：

编码器，所述编码器的输入为所述神经网络模型的输入，所述编码器的输出与解码器的输入连接，所述编码器包括串联的多个层级模块；

所述解码器，所述解码器的输出为所述神经网络模型的输出，所述解码器包括串联的多个层级模块；

每个所述层级模块用于对输入数据在特征长度上进行4倍下采样、以及在嵌入维度上进行2倍上采样，所述层级模块包括依次连接的维度变换层和基础模块，所述维度变换层用于对输入数据进行维度嵌入和维度变换操作，所述基础模块用于对所述维度变换层输出的数据进行特征计算；

所述基础模块包括正则化层、自注意力机制模块、一维卷积层和加法模块，第一正则化层的输入与所述维度变换层的输出连接，所述第一正则化层的输出与所述自注意力机制模块的输入连接，所述自注意力机制模块的输出与第一加法模块的输入连接，所述第一加法模块的输入还与所述维度变换层的输出连接，所述第一加法模块的输出与第二正则化层的输入连接，所述第二正则化层的输出与所述一维卷积层的输入连接，所述一维卷积层的输出与第二加法模块的输入连接，所述第二加法模块的输入还与所述第一加法模块的输出连接，所述第二加法模块的输出为所述基础模块的输出，所述正则化层用于对输入数据进行正则化处理，所述自注意力机制模块用于对输入数据进行自注意力计算，所述一维卷积层用于对输入数据进行一维卷积处理，所述加法模块用于对输入数据进行相加处理。

在一些可能的实现方式中，所述自注意力机制模块基于以下方式对输入数据进行自注意力计算：

设置三组不同的全连接层，利用三组全连接层分别对输入数据进行三次不改变数据维度的映射，得到输入数据在三个不同空间的数据表达并分别作为查询数据Q、值数据V和键数据K，利用以下公式进行自注意力加权计算，获取自注意力计算结果；

其中，表示自注意力计算结果，/>表示输入数据对应的信号序列嵌入维度。

在一些可能的实现方式中，在进行自注意力计算时，每次只截取原始数据中的一个预设固定窗口大小的区域进行计算，通过窗口的滑动产生不同位置的数据，将这些数据拼接作为新的输出。

在一些可能的实现方式中，以历史振动信号数据作为神经网络模型的输入和输出对神经网络模型进行训练，包括：

步骤S301，将多个预处理后的历史振动信号数据按批次输入神经网络模型，得到神经网络模型输出的解码数据；

步骤S302，根据输入数据与输入数据对应的解码数据，计算预设损失函数；

步骤S303，判断是否达到预设训练停止条件，若是，则将当前的神经网络模型作为完成训练的神经网络模型，若否，则利用预设损失函数更新神经网络模型的参数，并返回步骤S301。

在一些可能的实现方式中，以历史振动信号数据作为神经网络模型的输入，以历史振动信号数据对应的信号类别作为神经网络模型的输出，对神经网络模型进行训练，包括：

步骤S311，将多个预处理后的历史振动信号数据按批次输入神经网络模型，得到神经网络模型输出的预测信号类别；

步骤S312，根据历史振动信号数据对应的信号类别与历史振动信号数据对应的预测信号类别，计算预设分类损失函数；

步骤S313，判断是否达到预设训练停止条件，若是，则将当前的神经网络模型作为完成训练的神经网络模型，若否，则利用预设损失函数更新神经网络模型的参数，并返回步骤S311。

在一些可能的实现方式中，根据输出结果、待测振动信号数据与预设判别阈值之间的关系确定待测振动信号数据对应的信号类别，包括：

计算神经网络模型输出的解码数据与待测振动信号数据的差值；

判断差值是否不超过预设判别阈值，若是，则判定待测振动信号数据为健康信号，若否，则判定待测振动信号数据为故障信号；

其中，解码数据与待测振动信号数据的差值不超过预设判别阈值表示解码数据与待测振动信号数据在各个维度上的差值均不超过各个维度上的预设判别阈值。

第二方面，还提供了一种基于自注意力机制自编码器的信号故障判别装置，所述装置包括：

数据获取模块，用于获取历史振动信号数据和待测振动信号数据；

数据预处理模块，用于对所述数据获取模块获取的振动信号数据进行预处理，以使振动信号数据的数据维度能够适用于构建的神经网络模型；

神经网络模型构建模块，用于基于自注意力机制构建神经网络模型，并利用所述数据预处理模块预处理后的历史振动信号数据对神经网络模型进行训练；

预测结果获取模块，用于将所述数据获取模块获取的待测振动信号数据输入所述神经网络模型构建模块构建且训练的神经网络模型，获取神经网络模型的输出结果；

信号类别输出模块，用于根据所述预测结果获取模块获取的输出结果确定待测振动信号数据对应的信号类别。

本发明技术方案的主要优点如下：

本发明的基于自注意力机制自编码器的信号故障判别方法基于自注意力机制构建神经网络模型，并根据不同的历史振动信号数据设置不同的判别方式，既能够在历史振动信号数据存在故障信号数据的情况下对设备运行状态进行快速、准确诊断，又能够在历史振动信号数据不存在故障信号数据的情况下对设备运行状态进行快速、可靠诊断。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明一实施例的基于自注意力机制自编码器的信号故障判别方法的流程图；

图2为本发明一实施例的一种神经网络模型的结构示意图；

图3为本发明一实施例的基于自注意力机制自编码器的信号故障判别装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

以下结合附图，详细说明本发明实施例提供的技术方案。

参考图1，第一方面，本发明一实施例提供了一种基于自注意力机制自编码器的信号故障判别方法，该方法包括以下步骤：

步骤S1，获取历史振动信号数据和待测振动信号数据。

本发明一实施例中，在获取历史振动信号数据时，先确定采样时间和采样频率；而后在设备的运行过程中，以确定的采样时间和采样频率采集设备的多通道振动信号，获取历史振动信号数据，重复进行多次采集过程，获取多组历史振动信号数据；或者，从设备的历史运行数据中，以确定的采样时间和采样频率提取设备的多通道振动信号，获取历史振动信号数据，重复进行多次提取过程，获取多组历史振动信号数据。

通常，设备的振动信号有健康振动信号和故障振动信号，健康振动信号为设备正常运行时产生的振动信号，故障振动信号为设备故障运行时产生的振动信号。本发明一实施例中，若在设备使用初期而不存在故障数据时或者设备故障信号数据难以获取时，历史振动信号数据可以仅包括健康振动信号数据，若能够获取设备的故障信号数据，则历史振动信号数据可以包括健康振动信号数据和故障振动信号数据。

其中，采样时间和采样频率根据实际需求具体设置。

进一步地，在获取待测振动信号数据时，根据实际的设备监测需求，以与获取历史振动信号数据时相同的采样时间和采样频率采集监测时刻设备的多通道振动信号，获取待测振动信号数据。

步骤S2，对振动信号数据进行预处理，以使振动信号数据的数据维度能够适用于构建的神经网络模型。

本发明一实施例中，对振动信号数据进行预处理包括：

对振动信号数据进行切片处理和分割处理。

具体地，设定：在获取振动信号数据时的采样时间为T，采样频率为f，采集通道数为N，输入神经网络模型的一批（Batch）数据包括B个振动信号数据，同一批次输入神经网络模型的数据表示维度为（B，N，Tf）的数据X。

基于上述设定，对振动信号数据进行切片处理和分割处理包括：

通过对振动信号数据进行上述预处理，能够使得振动信号数据的数据维度适用于构建的神经网络模型。

本发明一实施例提供的基于自注意力机制自编码器的信号故障判别方法通过对信号数据进行自适应预处理，即在考虑采样频率、采样时长和通道数的情况下进行信号数据归一化和维度变换处理，能够降低信号数据原始概率分布及不同模态的影响，提高该判别方法的自适应性能，确保该判别方法能够适用于多种不同类型的设备、不同类型的采集传感器和不同的数据处理。

步骤S3，基于自注意力机制构建神经网络模型，利用预处理后的历史振动信号数据对神经网络模型进行训练。

参考图2，本发明一实施例中，基于自注意力机制构建的神经网络模型包括：

编码器，编码器的输入为神经网络模型的输入，编码器的输出与解码器的输入连接，编码器包括串联的多个层级模块；

解码器，解码器的输出为神经网络模型的输出，解码器包括串联的多个层级模块；

每个层级模块用于对输入数据在特征长度上进行4倍下采样、以及在嵌入维度上进行2倍上采样，层级模块包括依次连接的维度变换层和基础模块，维度变换层用于对输入数据进行维度嵌入和维度变换操作，基础模块用于对维度变换层输出的数据进行特征计算；

基础模块包括正则化层、自注意力机制模块、一维卷积层和加法模块，第一正则化层的输入与维度变换层的输出连接，第一正则化层的输出与自注意力机制模块的输入连接，自注意力机制模块的输出与第一加法模块的输入连接，第一加法模块的输入还与维度变换层的输出连接，第一加法模块的输出与第二正则化层的输入连接，第二正则化层的输出与一维卷积层的输入连接，一维卷积层的输出与第二加法模块的输入连接，第二加法模块的输入还与第一加法模块的输出连接，第二加法模块的输出为基础模块的输出，正则化层用于对输入数据进行正则化处理，自注意力机制模块用于对输入数据进行自注意力计算，一维卷积层用于对输入数据进行一维卷积处理，加法模块用于对输入数据进行相加处理。

具体地，在上述构建的神经网络模型中，输入神经网络模型的数据依次经过编码器和解码器的处理，得到对应的输出数据。

在上述构建的基础模块中，维度变换层将数据分别输入第一正则化层和第一加法模块，第一正则化层对输入数据进行正则化处理后将数据输出至自注意力机制模块，自注意力机制模块对输入数据进行自注意力计算后将数据输出至第一加法模块，第一加法模块对接收的两组数据进行相加处理后将数据分别输出至第二正则化层和第二加法模块，第二正则化层对输入数据进行正则化处理后将数据输出至一维卷积层，一维卷积层对输入数据进行一维卷积处理后将数据输出至第二加法模块，第二加法模块对接收的两组数据进行相加处理后将数据输出。

本发明一实施例中，正则化处理的具体处理方式根据实际需求具体设置。

进一步地，本发明一实施例中，自注意力机制模块基于以下方式对输入数据进行自注意力计算：

其中，表示自注意力计算结果，/>表示输入数据对应的信号序列嵌入维度，/>为/>函数。

本发明一实施例中，利用上述计算处理方式，可以针对每一个输入特征，在不改变其维度的情况下进行特征重塑和提取。

进一步地，本发明一实施例中，在进行自注意力计算时，每次只截取原始数据中的一个固定窗口大小的区域进行计算，通过窗口的滑动产生不同位置的数据，将这些数据拼接起来作为新的输出。如此，能够加快计算效率。

其中，固定窗口的大小根据实际需求具体设置。

进一步地，本发明一实施例中，利用预处理后的历史振动信号数据对神经网络模型进行训练包括以下步骤：

若历史振动信号数据仅包括健康振动信号数据，则以历史振动信号数据作为神经网络模型的输入和输出对神经网络模型进行训练；

若历史振动信号数据包括健康振动信号数据和故障振动信号数据，则以历史振动信号数据作为神经网络模型的输入，以历史振动信号数据对应的信号类别作为神经网络模型的输出，对神经网络模型进行训练，信号类别包括健康信号和故障信号。

本发明一实施例中，以历史振动信号数据作为神经网络模型的输入和输出对神经网络模型进行训练，进一步包括以下步骤：

步骤S301，将多个预处理后的历史振动信号数据按批次输入神经网络模型，得到神经网络模型输出的解码数据。

本发明一实施例中，将预处理后的历史振动信号数据从神经网络模型的输入端输入，依次经过神经网络模型中各层的参数的处理，并从神经网络模型的输出端输出，神经网络模型输出端输出的信息即为输入数据对应的解码数据。

本发明一实施例中，神经网络模型为待训练模型，模型各层参数为初始化参数，在模型的训练过程中，模型各层参数被不断更新。

步骤S302，根据输入数据与输入数据对应的解码数据，计算预设损失函数。

本发明一实施例中，损失函数根据实际需求具体设置，例如采用均方误差（MSE）损失函数。

其中，采用均方误差损失函数时，损失函数具体表示为：

表示输入神经网络模型的历史振动信号数据量，/>表示神经网络模型输出的历史振动信号数据/>对应的解码数据。

基于设定的损失函数，根据神经网络模型的输入数据与输入数据对应的解码数据，计算损失函数，将损失函数作为神经网络模型的优化指标。

本发明一实施例中，训练停止条件根据实际情况具体设置，例如为训练迭代次数达到设定迭代代数或优化指标达到设定阈值。

进一步地，本发明一实施例中，采用梯度下降法进行神经网络模型的参数的训练更新。

具体地，采用以下公式对神经网络模型的参数进行更新：

其中，表示第/>次迭代时的神经网络模型的参数，/>表示第/>次迭代时的神经网络模型的参数，/>表示优化器，/>表示学习率，/>表示损失函数，/>表示神经网络模型的参数。其中，优化器根据实际情况具体设置，例如为Adam、SGD等，学习率预先设置，用于控制神经网络模型参数更新的速度。

当历史振动信号数据仅包括健康振动信号数据时，利用上述方式对神经网络模型进行训练后，得到的神经网络模型可视为一种自编码器。

本发明一实施例中，以历史振动信号数据作为神经网络模型的输入，以历史振动信号数据对应的信号类别作为神经网络模型的输出，对神经网络模型进行训练，进一步包括以下步骤：

步骤S311，将多个预处理后的历史振动信号数据按批次输入神经网络模型，得到神经网络模型输出的预测信号类别。

本发明一实施例中，将预处理后的历史振动信号数据从神经网络模型的输入端输入，依次经过神经网络模型中各层的参数的处理，并从神经网络模型的输出端输出，神经网络模型输出端输出的信息即为历史振动信号数据对应的预测信号类别。

步骤S312，根据历史振动信号数据对应的信号类别与历史振动信号数据对应的预测信号类别，计算预设分类损失函数。

其中，采用均方误差损失函数时，损失函数具体表示为：

表示输入神经网络模型的历史振动信号数据量，/>表示神经网络模型输出的历史振动信号数据/>对应的预测信号类别，/>表示历史振动信号数据/>对应的信号类别。

基于设定的损失函数，根据输入神经网络模型的历史振动信号数据对应的信号类别与历史振动信号数据对应的预测信号类别，计算损失函数，将损失函数作为神经网络模型的优化指标。

具体地，采用以下公式对神经网络模型的参数进行更新：

当历史振动信号数据包括健康振动信号数据和故障振动信号数据时，利用上述方式对神经网络模型进行训练后，得到的神经网络模型可视为一种分类器。

步骤S4，将待测振动信号数据输入训练后的神经网络模型，获取神经网络模型的输出结果。

具体地，本发明一实施例中，将待测振动信号数据输入训练后的神经网络模型，由神经网络模型输出对应的处理结果。

基于上述训练方式，若历史振动信号数据仅包括健康振动信号数据，则神经网络模型输出的是待测振动信号数据对应的解码数据；若历史振动信号数据包括健康振动信号数据和故障振动信号数据，则神经网络模型输出的是待测振动信号数据对应的预测信号类别。

步骤S5，根据输出结果确定待测振动信号数据对应的信号类别，若历史振动信号数据仅包括健康振动信号数据，则根据输出结果、待测振动信号数据与预设判别阈值之间的关系确定待测振动信号数据对应的信号类别。

本发明一实施例中，当历史振动信号数据包括健康振动信号数据和故障振动信号数据时，神经网络模型输出的是待测振动信号数据对应的预测信号类别，将神经网络模型输出的预测信号类别作为待测振动信号数据对应的信号类别。

当历史振动信号数据仅包括健康振动信号数据时，则根据输出结果、待测振动信号数据与预设判别阈值之间的关系确定待测振动信号数据对应的信号类别。

具体地，根据输出结果、待测振动信号数据与预设判别阈值之间的关系确定待测振动信号数据对应的信号类别，进一步包括以下步骤：

本发明一实施例中，预设判别阈值根据实际需求具体设置。例如可以采用神经网络模型完成训练后基于历史振动信号数据所得到的平均绝对误差的1.5倍作为判别阈值。

本发明一实施例提供的基于自注意力机制自编码器的信号故障判别方法基于自注意力机制构建神经网络模型，并根据不同的历史振动信号数据设置不同的判别方式，既能够在历史振动信号数据存在故障信号数据的情况下对设备运行状态进行快速、准确诊断，又能够在历史振动信号数据不存在故障信号数据的情况下对设备运行状态进行快速、可靠诊断。

参考图3，第二方面，本发明一实施例提供了一种基于自注意力机制自编码器的信号故障判别装置，该装置包括：

数据获取模块100，用于获取历史振动信号数据和待测振动信号数据；

数据预处理模块200，用于对数据获取模块100获取的振动信号数据进行预处理，以使振动信号数据的数据维度能够适用于构建的神经网络模型；

神经网络模型构建模块300，用于基于自注意力机制构建神经网络模型，并利用数据预处理模块200预处理后的历史振动信号数据对神经网络模型进行训练；

预测结果获取模块400，用于将数据获取模块100获取的待测振动信号数据输入神经网络模型构建模块300构建且训练的神经网络模型，获取神经网络模型的输出结果；

信号类别输出模块500，用于根据预测结果获取模块400获取的输出结果确定待测振动信号数据对应的信号类别。

本发明一实施例所提供的一种基于自注意力机制自编码器的信号故障判别装置中各模块为与上述方法步骤对应的装置，能够实现上述任一实施例所述的基于自注意力机制自编码器的信号故障判别方法的所有流程，各个模块的具体工作原理、作用以及实现的技术效果分别与上述实施例所述的基于自注意力机制自编码器的信号故障判别方法对应相同，这里不再赘述。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外，本文中“前”、“后”、“左”、“右”、“上”、“下”均以附图中表示的放置状态为参照。

最后应说明的是：以上实施例仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于自注意力机制自编码器的信号故障判别方法，其特征在于，包括：

获取历史振动信号数据和待测振动信号数据；

根据输出结果确定待测振动信号数据对应的信号类别，若历史振动信号数据仅包括健康振动信号数据，则根据输出结果、待测振动信号数据与预设判别阈值之间的关系确定待测振动信号数据对应的信号类别；

所述神经网络模型包括：

所述基础模块包括正则化层、自注意力机制模块、一维卷积层和加法模块，第一正则化层的输入与所述维度变换层的输出连接，所述第一正则化层的输出与所述自注意力机制模块的输入连接，所述自注意力机制模块的输出与第一加法模块的输入连接，所述第一加法模块的输入还与所述维度变换层的输出连接，所述第一加法模块的输出与第二正则化层的输入连接，所述第二正则化层的输出与所述一维卷积层的输入连接，所述一维卷积层的输出与第二加法模块的输入连接，所述第二加法模块的输入还与所述第一加法模块的输出连接，所述第二加法模块的输出为所述基础模块的输出，所述正则化层用于对输入数据进行正则化处理，所述自注意力机制模块用于对输入数据进行自注意力计算，所述一维卷积层用于对输入数据进行一维卷积处理，所述加法模块用于对输入数据进行相加处理；

所述自注意力机制模块基于以下方式对输入数据进行自注意力计算：

其中，Attention表示自注意力计算结果，d表示输入数据对应的信号序列嵌入维度；

在进行自注意力计算时，每次只截取原始数据中的一个预设固定窗口大小的区域进行计算，通过窗口的滑动产生不同位置的数据，将这些数据拼接作为新的输出。

2.根据权利要求1所述的基于自注意力机制自编码器的信号故障判别方法，其特征在于，对振动信号数据进行预处理，包括：

对振动信号数据进行切片处理和分割处理。

3.根据权利要求2所述的基于自注意力机制自编码器的信号故障判别方法，其特征在于，设定：同一批次输入神经网络模型的振动信号数据为维度为(B，N，Tf)的数据X，B表示输入神经网络模型的一批数据包括的振动信号数据数量，T、f和N分别表示在获取振动信号数据时的采样时间、采样频率和采集通道数；

对振动信号数据进行切片处理和分割处理包括：

采用一维卷积神经网络对维度为(B，N，Tf)的数据X进行转换，以使其维度变更为(B，dh，TfN/dh)，d表示信号序列嵌入维度，h表示多头注意力的头数；

采用多头注意力机制对信号维度进行分割，以使其维度整合为(B，h，d，H)，H＝TfN/dh，H表示振动特征长度。

4.根据权利要求1所述的基于自注意力机制自编码器的信号故障判别方法，其特征在于，以历史振动信号数据作为神经网络模型的输入和输出对神经网络模型进行训练，包括：

5.根据权利要求1所述的基于自注意力机制自编码器的信号故障判别方法，其特征在于，以历史振动信号数据作为神经网络模型的输入，以历史振动信号数据对应的信号类别作为神经网络模型的输出，对神经网络模型进行训练，包括：

6.根据权利要求1所述的基于自注意力机制自编码器的信号故障判别方法，其特征在于，根据输出结果、待测振动信号数据与预设判别阈值之间的关系确定待测振动信号数据对应的信号类别，包括：

7.一种基于自注意力机制自编码器的信号故障判别装置，其特征在于，所述装置包括：

信号类别输出模块，用于根据所述预测结果获取模块获取的输出结果确定待测振动信号数据对应的信号类别；

所述神经网络模型包括：