CN110672343B

CN110672343B - 基于多注意力卷积神经网络的旋转机械故障诊断方法

Info

Publication number: CN110672343B
Application number: CN201910932922.9A
Authority: CN
Inventors: 刘志亮; 王欢; 彭丹丹; 张峻浩; 郝逸嘉
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2019-09-29
Filing date: 2019-09-29
Publication date: 2021-01-26
Anticipated expiration: 2039-09-29
Also published as: CN110672343A

Abstract

本发明公开了一种基于多注意力卷积神经网络的旋转机械故障诊断方法，首先采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号，并根据各个加速度振动信号所对应的故障状态设置故障状态标签，对每个加速度振动信号进行标准化处理，作为训练样本对多注意力卷积神经网络模型进行训练，多注意力卷积神经网络模型包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层，然后采集旋转机械当前的加速度振动信号，送入多注意力卷积神经网络模型进行故障诊断。本发明在卷积神经网络中引入注意力模块，以增强网络对判别性特征和故障冲击信号段的学习，并抑制无关噪声，提高故障诊断性能。

Description

基于多注意力卷积神经网络的旋转机械故障诊断方法

技术领域

本发明属于旋转机械故障诊断技术领域，更为具体地讲，涉及一种基于多注意力卷积神经网络的旋转机械故障诊断方法。

背景技术

旋转机械是工业设备中应用很广泛的一种部件，一旦发生故障，必将导致设备性能恶化，从而带来经济损失，甚至引发安全事故。因此，对旋转机械进行故障诊断具有重要的意义。

近年来，深度学习技术作为一种高效的特征提取和模式识别算法，解决了以往需要人工提取特征的重要难题。因此，基于去噪自编码器，深度信念网络，卷积神经网络等方法的故障诊断研究取得了大量的研究成果。特别地，卷积神经网络(Convolutional NeuralNetwork，CNN)得益于局部权值共享、局部感受野和多卷积核等特点，在旋转机械故障诊断领域取得了显著的成功。

然而，已发表的成果主要侧重于提升CNN的自动特征学习能力，对以下两方面考虑不足。1)CNN技术倾向于学习输入信号的所有特征，无法对故障相关的特征进行针对性地学习，从而造成巨大的资源浪费；2)针对CNN如何学习到具有判别性的特征这个问题，已发表的成果缺乏充分的研究。这些CNN方法仍是“黑箱”模型，这种“黑箱”的性质很大程度上影响了CNN技术在故障诊断领域的发展，因为可解释性在学术研究和工业应用中都非常重要。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于多注意力卷积神经网络的旋转机械故障诊断方法，在卷积神经网络中引入注意力模块，以增强网络对判别性特征和故障冲击信号段的学习，并抑制无关噪声，提高故障诊断性能。

为实现上述发明目的，本发明基于多注意力卷积神经网络的旋转机械故障诊断方法包括以下步骤：

S1：以采样频率f_s采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号x_m[n]，其中m＝1,2,…,M，M表示所采集的加速度振动信号的数量，n＝1,2,…,N，N表示每个加速度振动信号中的采样点数量，从而获取加速度振动信号集X＝{x₁[n],x₂[n],...,x_M[n]}；并根据各个加速度振动信号x_m[n]所对应的故障状态，设置故障状态标签；

S2：对每一个加速度振动信号x_m[n]进行标准化处理，得到信号

S3：构建多注意力卷积神经网络，包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层，其中：

第1层为卷积层，记作C1层，用于对输入信号进行卷积操作；

第2层为联合注意力模块层，记作U1层，用于对C1层输入至U1层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整；

第3层为卷积层，记作C2层，用于对U1层输入至C1层的数据进行卷积操作；

第4层为联合注意力模块层，记作U2层，用于对C2层输入至U2层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整；

第5层为卷积层，记作C3层，用于对U2层输入至C3层的数据进行卷积操作；

第6层为联合注意力模块层，记作U3层，用于对C3层输入至U3层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整；

第7层为卷积层，记作C4层，用于对U3层输入至C4层的数据进行卷积操作；

第8层为联合注意力模块层，记作U4层，用于对C4层输入至U4层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整；

第9层为卷积层，记作C5层，用于对U4层输入至C5层的数据进行卷积操作；

第10层为联合注意力模块层，记作U5层，用于对C5层输入至U5层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整；

第11层为卷积层，记作C6层，用于对U5层输入至C6层的数据进行卷积操作；

第12层为全局平均池化层，记作M1层，用于对C6层输入至M1层的数据进行全局平均池化；

第13层为Softmax层，用于对M1层输入至Softmax层的数据估计得到各个故障状态的概率分布，将最大概率对应的故障状态作为故障诊断结果；

S4：将步骤S2处理得到的各个信号

作为多注意力卷积神经网络模型的输入，对应的故障状态标签作为多注意力卷积神经网络模型的期望输出，对多注意力卷积神经网络模型进行训练；

S5：以相同采样频率f_s采集当前旋转机械的加速度振动信号x_test[n]，采用步骤S2中的相同方法对其进行标准化处理，得到信号

S6：将信号

输入至步骤S4训练好的多注意力卷积神经网络模型中，得到当前滚动轴承的故障诊断结果。

本发明基于多注意力卷积神经网络的旋转机械故障诊断方法，首先采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号，并根据各个加速度振动信号所对应的故障状态设置故障状态标签，对每个加速度振动信号进行标准化处理，作为训练样本对多注意力卷积神经网络模型进行训练，多注意力卷积神经网络模型包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层，然后采集旋转机械当前的加速度振动信号，送入多注意力卷积神经网络模型进行故障诊断。

本发明所提出的多注意力卷积神经网络模型，通过引入注意力模块，使卷积神经网络所提取的特征能够自适应优化，从而增强网络对判别性特征和故障冲击信号段的学习，并抑制无关噪声，提高故障诊断性能。

附图说明

图1是本发明基于多注意力卷积神经网络的旋转机械故障诊断方法的具体实施方式流程图；

图2是本发明中多注意力卷积神经网络的示意图；

图3是本实施例中联合注意力模块层的结构图；

图4是本实施例中轮对轴承试验台的结构示意图；

图5是在本发明中配置不同数量联合注意力模块的故障诊断性能对比图；

图6是本发明中配置不同激励注意力模块的故障诊断性能对比图；

图7是图6两种网络结构中每个激励注意力模块时序权重向量的可视化视图；

图8是本发明中配置不同通道注意力模块的故障诊断性能对比图；

图9是图8两种网络结构中每个通道注意力模块时序权重向量的可视化视图；

图10是本发明中配置不同联合注意力模块的故障诊断性能对比图。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述，以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是，在以下的描述中，当已知功能和设计的详细描述也许会淡化本发明的主要内容时，这些描述在这里将被忽略。

实施例

图1是本发明基于多注意力卷积神经网络的旋转机械故障诊断方法的具体实施方式流程图。如图1所示，本发明基于多注意力卷积神经网络的旋转机械故障诊断方法的具体步骤包括：

S101：采集旋转机械振动信号样本：

以采样频率f_s采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号x_m[n]，其中m＝1,2,…,M，M表示所采集的加速度振动信号的数量，n＝1,2,…,N，N表示每个加速度振动信号中的采样点数量，从而获取加速度振动信号集X＝{x₁[n],x₂[n],...,x_M[n]}。并根据各个加速度振动信号x_m[n]所对应的故障状态，设置故障状态标签。

在实际应用中，为了增加样本数量，可以采集M′个包含N′个采样点的加速度振动信号x_m′[n′]，m′＝1,2,…,M′，n′＝1,2,…,N′，N′＞N，然后采用一个长度为N的滑动窗口，按照预设步长对每个加速度振动信号x_m′[n′]进行滑动分割，将所得到的子信号即作为加速度振动信号x_m[n]。

S102：数据样本标准化：

对每一个加速度振动信号x_m[n]进行标准化处理，得到信号

本实施例中使用z-score标准化方法对每一个加速度振动信号x_m[n]进行标准化；

其中，μ_m是x_m[n]中所有采样点数据的平均值，σ_m是x_m[n]中所有采样点数据的标准差。

S103：构建多注意力卷积神经网络模型：

图2是本发明中多注意力卷积神经网络的示意图。如图2所示，本发明中所构建的多注意力卷积神经网络包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层，下面分别对每个组成部分进行详细说明。

第1层为卷积层，记作C1层，用于对输入信号进行卷积操作。本实施例中卷积层C1层的步长S＝1，卷积核大小为32×1，激动函数采用ReLU函数。

第2层为联合注意力模块层，记作U1层，用于对C1层输入至U1层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整。第3层为卷积层，记作C2层，用于对U1层输入至C1层的数据进行卷积操作。本实施例中C2层的步长S＝2，卷积核大小为16×1，激动函数采用ReLU函数。

第4层为联合注意力模块层，记作U2层，用于对C2层输入至U2层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整。

第5层为卷积层，记作C3层，用于对U2层输入至C3层的数据进行卷积操作。本实施例中C3层的步长S＝2，卷积核大小为9×1，激动函数采用ReLU函数。

第6层为联合注意力模块层，记作U3层，用于对C3层输入至U3层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整。

第7层为卷积层，记作C4层，用于对U3层输入至C4层的数据进行卷积操作。本实施例中C4层的步长S＝2，卷积核大小为6×1，激动函数采用ReLU函数。

第8层为联合注意力模块层，记作U4层，用于对C4层输入至U4层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整。

第9层为卷积层，记作C5层，用于对U4层输入至C5层的数据进行卷积操作。本实施例中C5层的步长S＝4，卷积核大小为3×1，激动函数采用ReLU函数。

第10层为联合注意力模块层，记作U5层，用于对C5层输入至U5层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整。

第11层为卷积层，记作C6层，用于对U5层输入至C6层的数据进行卷积操作。本实施例中C5层的步长S＝2，卷积核大小为3×1，激动函数采用ReLU函数。

第12层为全局平均池化层，记作M1层，用于对C6层输入至M1层的数据进行全局平均池化。本发明采用全局平均池化层来替换传统的全连接层，可以避免全连接层导致的过拟合问题。

第13层为Softmax层，用于对M1层输入至Softmax层的数据估计得到各个故障状态的概率分布，将最大概率对应的故障状态作为故障诊断结果。

在实际应用中，联合注意力模块层的具体结构可以根据实际需要进行设置。图3是本实施例中联合注意力模块层的结构图。如图3所示，本实施例中联合注意力模块层包括串联的激励注意力模块和通道注意力模块，下面分别对两个模块进行说明。

如图3所示，激励注意力模块包括第一卷积模块、第二卷积模块、优化模块和加法器，其中：

第一卷积模块用于对输入的特征Y＝[y¹,y²,…,y^W]进行通道数为1的1×1的卷积操作，y^j表示特征Y中的第j个特性信号，j＝1,2,…,W，W表示特征Y的长度，从而获得特征Y在时序上的投影数据，再将投影数据通过Sigmoid函数处理，将得到的数据作为特征Y对应的W维的时序权重向量s′，并输出至优化模块。

第二卷积模块用于对输入的特征Y聚合局部时序段间的特征信息，即将输入的特征Y通过一个3×3的卷积操作，将所得到的特征Y′输出至优化模块。该模块的主要作用是防止网络对激励冲击信号段的过度聚焦。

优化模块采用时序权重向量s′对特征Y′进行优化，得到优化特征

并输出至加法器。

加法器将特征Y与优化特征Y_s相加，得到特征Y_MAM＝Y+Y_s，并输出至通道注意力模块。

如图3所示，通道注意力模块包括平均池化模块、第一卷积模块、第二卷积模块、优化模块和加法器，其中：

平均池化模块用于对特征Y_MAM每个通道的全局时序信息压缩到一个通道描述符，并生成C维的通道描述符统计向量z，C表示特征Y_MAM的通道数量，也就是特征Y的通道数量。z的第t个元素通过下式进行计算：

其中，y_t(i)表示特征Y_MAM中第i个时序第t个通道的值，t＝1,2,…,C。

第一卷积模块用于对通道描述符统计向量z进行通道数为1的1×1的卷积操作，将得到的数据发送给第二卷积模块，其中激活函数采用ReLU激活函数。

第二卷积模块用于对所接收的数据进行通道数为1的1×1的卷积操作，将得到的数据作为通道特征重校准向量z′发送给优化模块，其中激活函数采用Sigmoid函数，Sigmoid函数用于将输入的激活向量的动态范围压缩到区间[0,1]。第一卷积模块和第二卷积模块实现了一种简单的门机制，可以有效地捕获通道之间的相关性。通道特征重校准向量z′的第i个值用于表示第i个通道的重要性。

优化模块采用通道特征重校准向量z′对特征Y_MAM进行优化，得到优化特征Y^z＝[y^z ₁,y^z ₂,…,y^z _C]＝Y_MAM·z′，，将优化特征Y^z发送给加法器。

加法器将特征Y_MAM与优化特征Y^z相加，得到特征Y_JAM＝Y_MAM+Y^z，最终将特征Y_JAM作为联合注意力模块层的输出。

S104：训练多注意力卷积神经网络模型：

将步骤S102处理得到的各个信号

作为多注意力卷积神经网络模型的输入，对应的故障状态标签作为多注意力卷积神经网络模型的期望输出，对多注意力卷积神经网络模型进行训练。

S105：获取当前旋转机械振动信号：

以相同采样频率f_s采集当前旋转机械的加速度振动信号x_test[n]，采用步骤S102中的相同方法对其进行标准化处理，得到信号

S106：故障诊断：

将信号

输入至步骤S104训练好的多注意力卷积神经网络模型中，得到当前轮对轴承的故障诊断结果。

为了更好地说明本发明的技术效果，采用一个具体实施例对本发明进行试验验证。本次实验验证中以高速列车的轮对轴承为例，采用轮对轴承试验台来模拟轮对轴承的工作过程。图4是本实施例中轮对轴承试验台的结构示意图。如图4所示，本实施例中所采用的轮对轴承故障诊断试验台包括驱动电机、皮带传动系统、垂直加载装置、横向加载装置、两个风扇电机和控制系统。垂直和侧向载荷加载装置的设计用于模拟高速列车实际运行中轮对轴承承载的轴向和侧向的载荷。两个风扇电机可以产生与列车运行方向相反的风。通过两个加速度计确保轮对轴承水平方向和垂直方向的振动都能被检测到，信号的采样频率设置为5120Hz。

本次实验验证中预先加工了12种处于不同故障状态的轮对轴承。表1是本实施例中12种故障状态的状态信息。

表1

本次实验验证中所模拟的轮对轴承不同运行状态包括不同运行速度、不同垂向载荷和轴向载荷工况。在每种故障状态下，设计了五种运行速度：60km/h、90km/h、120km/h、150km/h和180km/h，四种不同的垂向的载荷：56kN、146kN、236kN和272kN，以及两个轴向的负载：0kN和20kN。因此，每种故障状态包括四十种不同的工况。通过对原始采集的加速度振动信号进行数据扩展之后，总共有188088个样本，然后对本发明和对比方法进行4-折交叉验证。

为了说明本发明和对比方法的技术性能，对故障诊断结果采用三种指标进行评价，分别为准确率、召回率和精度，这三种评价指标都是较为常用的指标，其具体计算方式在此不再赘述。

首先，在-6dB的噪声下探索了本发明中联合注意力模块的数量对故障诊断性能的影响。本次实验设置了MACNN-1，MACNN-2……MACNN-6共6种网络结构，其中MACNN代表多注意力卷积神经网络，这些网络的数字编号代表MACNN中联合注意力模块的数量。表2是本发明中配置不同数量联合注意力模块的故障诊断结果表。

结构	精确率	精度	召回率
				MA1DCNN-1	76.64±0.82	74.62±0.98	73.46±1.14
MA1DCNN-2	78.64±1.34	77.05±1.46	75.79±1.31
				MA1DCNN-3	82.86±1.16	82.22±1.48	80.91±1.31
MA1DCNN-4	82.97±0.83	81.87±0.75	81.19±0.73
				MA1DCNN-5	83.21±0.61	82.50±0.52	81.39±0.58
MA1DCNN-6	82.46±1.03	81.67±1.02	80.72±1.23

表2

图5是在本发明中配置不同数量联合注意力模块的故障诊断性能对比图。如表2和图5所示，当联合注意力模块的数量从1增加到5时，网络的诊断性能也随之增加。这说明不同联合注意力模块所产生的优化效果可以在网络中进行积累，从而不断的提升网络的性能。虽然更多的注意力模块会增加网络的参数量，增加计算时间，MACNN-5的诊断准确率、召回率和精度相比MACNN-1分别增加了6.57％、7.88％和7.93％，所以计算速度的略微降低是可以接受的。此外，随着联合注意力模块数量的增加，网络的性能提升大小越来越小。从图5可以看出MACNN-6的诊断性能相比较MACNN-5有略微的降低，这是因为更多注意力模块的采用，会带来过度优化及过拟合的问题。所以本发明中采用了MACNN-5结构。

其次，在-6dB的噪声下，对激励注意力模块的有效性进行了验证，本次实验设置了1DCNN(不使用任何注意力模块)，MA1DCNN-EAM(只使用激励注意力模块)两种网络结构。表3是本发明中配置不同激励注意力模块的故障诊断结果表。

结构	精确率	精度	召回率
				1DCNN	70.46±1.55	68.19±1.74	67.16±1.51
MA1DCNN-EAM	74.90±0.42	73.13±0.32	71.99±0.59

表3

图6是本发明中配置不同激励注意力模块的故障诊断性能对比图。如表3和图6所示，显然MA1DCNN-EAM的故障诊断性能远远好于1DCNN。MA1DCNN-EAM在准确率，召回率和精度三个评价指标中相比1DCNN分别提升了4.44％，4.83％，4.94％。这证明了激励注意力模块可以有效的提高网络的特征学习能力，从而获得更优的诊断结果。为了进一步的理解激励注意力模块的特征学习机制，网络中每一个激励注意力模块中的时序权重向量s′均被输出，图7是图6两种网络结构中每个激励注意力模块时序权重向量的可视化视图。

同时也在-6dB的噪声强度下对通道注意力模块的有效性进行了验证，本次实验设置1DCNN(不使用任何注意力模块)，MA1DCNN-CAM(只使用通道注意力)两种网络结构。表4是本发明中配置不同通道注意力模块的故障诊断结果表。

结构	精确率	精度	召回率
				1DCNN	70.46±1.55	68.19±1.74	67.16±1.51
MA1DCNN-CAM	81.67±0.37	80.69±0.10	79.67±0.45

表4

图8是本发明中配置不同通道注意力模块的故障诊断性能对比图。如表4和图8所示，显然MA1DCNN-CAM相比1DCNN在网络的优化速度，网络的故障诊断性能上都具有巨大的优势。其中，MA1DCNN-CAM在准确率，召回率和精度三个评价指标中相比1DCNN分别提升了11.21％，12.51％和11.9％。这表明，通道注意力模块可以从强噪声中学习出更具判别性的故障特征，从而获得更优的诊断结果。此外，为了理解通道注意力模块的特征学习机制，网络中每一个通道注意力模块中的重校准向量z′均被输出。图9是图8两种网络结构中每个通道注意力模块时序权重向量的可视化视图。同样可以看到，不同的注意力模块中的重校准向量，编码了不同的激活映射之间的相对权重，这样网络可以自适应的增强故障相关的激活映射。

然后，对在-6dB的噪声强度下对联合注意力模块的有效性进行了验证。本次实验设置了1DCNN(不包含任何注意力模块)，MA1DCNN-JAM(包含联合注意力模块)两种网络结构。表5本发明中配置不同联合注意力模块的的故障诊断结果表。

结构	精确率	精度	召回率
				1DCNN	70.46±1.55	68.19±1.74	67.16±1.51
MA1DCNN-JAM	83.21±0.61	82.50±0.52	81.39±0.58

表5

图10是本发明中配置不同联合注意力模块的故障诊断性能对比图。如表5和图10所示，MA1DCNN-JAM在准确率、召回率和精度三个评价指标中相比1DCNN分别提升了12.75％，14.23％和14.31％。这说明联合注意力模块可以有效的提升网络的诊断性能。从表5可以看出联合注意力模块的故障诊断性能同样优于通道注意力模块和激励注意力模块。这说明通道注意力模块和激励注意力模块可以相互促进共同优化，从而提升网络的故障诊断性能。

最后验证本发明(MA1DCNN)和其他对比方法在不同噪声环境下的诊断性能。本次实验验证中设置了五种对比方法，分别是基于2维CNN的Wen-CNN(见文献“L.Wen,X.Li,L.Gao,and Y.Zhang,"Anew convolutional neural network-based data-driven faultdiagnosis method,"IEEE T.Ind.Electron.,65,pp.5990-5998,(2018).”)和ADCNN(见文献“X.Guo,L.Chen and C.Shen,"Hierarchical adaptive deep convolution neuralnetwork and its application to bearing fault diagnosis,"Measurement,93,pp.490-502,(2016).”)，基于1维CNN的WDCNN(见文献“W.Zhang,G.Peng,C.Li,Y.Chen,andZ.Zhang,"A new deep learning model for fault diagnosis with good anti-noiseand domain adaptation ability on raw vibration signals,"Sensors-Basel,17,pp.425-446,(2017).”)，基于多尺度学习的CNN方法：MSCNN(见文献“G.Jiang,H.He,J.Yan,and P.Xie,"Multiscale convolutional neural networks for fault diagnosis ofwind turbine gearbox,"IEEE T.Ind.Electron.,PP,pp.1-12,(2018).”)，与文献“G.F.Bin,J.J.Gao,X.J.Li,and B.S.Dhillon,"Early fault diagnosis of rotatingmachinery based on wavelet packets—Empirical mode decomposition featureextraction and neural network,"Mech.Syst.Signal Pr.,27,pp.696-711,(2012).”中相同结构的4层BPNN。本次实验验证中本发明和五种对比方法的训练策略一致。本次实验验证中设置了3组在不同SNR(-6dB，0dB,6dB)下的实验，分别模拟轮对轴承处在多种不同强度噪声工况下。表6是本次实验验证中本发明和五种对比方法的故障诊断结果评价指标对比表。

表6

如表6所示，本发明的准确率、召回率和精度在所有噪声情况下均优于其他对比方法。特别地，在SNR＝-6dB时，本发明仍然获得了83.21％的诊断准确率，这相比Wen-CNN有几乎10.71％的提升，说明本发明在无任何额外的去噪预处理的情况下，具有较强的抗噪性能。此外随着噪声的增加，故障诊断方法的性能会下降。例如，噪声从0dB变成-6dB，噪声强度相比原始信号增加了3.98倍。Wen-CNN,ADCNN,WDCNN,ResCNN和BPNN的诊断准确率分别下降了22.53％,20.40％,20.68％,21.87％和24.24％。但是本发明仅下降14.42％，这进一步说明本发明相比其他方法具有更强的抗噪性能和故障诊断性能。另一方面，从方差结果看到，本发明在大多数情况下其故障诊断的稳定性优于其他五种对比方法。

尽管上面对本发明说明性的具体实施方式进行了描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

Claims

1.一种多注意力卷积神经网络的旋转机械故障诊断方法，其特征在于，包括以下步骤：

第1层为卷积层，记作C1层，用于对输入信号进行卷积操作；

第10层为联合注意力模块层，记作U5层，用于对C5层输入至U5层的特征的通道特征和时序段给予不同的权重，从不同角度对特征进行自适应调整；联合注意力模块层包括串联的激励注意力模块和通道注意力模块：

激励注意力模块包括第一卷积模块、第二卷积模块、优化模块和加法器，其中：

第一卷积模块用于对输入的特征Y＝[y¹,y²,…,y^W]进行通道数为1的1×1的卷积操作，y^j表示特征Y中的第j个特性信号，j＝1,2,…,W，W表示特征Y的长度，从而获得特征Y在时序上的投影数据，再将投影数据通过Sigmoid函数处理，将得到的数据作为特征Y对应的W维的时序权重向量s′，并输出至优化模块；

第二卷积模块用于对输入的特征Y进行一个3×3的卷积操作，将所得到的特征Y′输出至优化模块；