CN117312948A

CN117312948A - 一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法

Info

Publication number: CN117312948A
Application number: CN202311256137.9A
Authority: CN
Inventors: 汪红星; 朱华; 李华峰
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-09-27
Filing date: 2023-09-27
Publication date: 2023-12-29

Abstract

一种基于多传感器融合和ECA‑CNN的旋转机械故障诊断方法，1）数据采集：采集旋转机械的关键传动部件各种健康状态下的多传感器振动信号；2）数据预处理：对多传感器振动信号进行采样、转换和通道融合，得到具有丰富和全面特征的多通道图像；3）模型搭建：将高效通道注意力引入到卷积神经网络中，构建ECA‑CNN模型；4）模型训练：利用多通道图像样本集训练模型；5）故障诊断：利用训练好的模型对旋转机械进行故障诊断。本发明实现了多传感器振动信号的通道融合；将高效通道注意力引入到卷积神经网络中提高特征学习能力，将注意力集中在更敏感的特征上；构建了具有高计算效率的ECA‑CNN模型，从多传感器融合数据学习具有代表性的故障特征，从而实现故障诊断。

Description

一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法

技术领域

本发明属于旋转机械故障诊断技术领域，具体为一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法。

背景技术

随着现代工业系统的蓬勃发展，旋转机械在智能装备中发挥着不可替代的作用，其安全性受到学术界和工业界的广泛关注。旋转机械的关键传动部件(如轴承、齿轮)在高速、重载等复杂运行环境下不可避免地会出现磨损、腐蚀、变形、裂纹等故障。传动部件的故障直接影响旋转机械的运行可靠性，可能造成重大事故，导致巨大的经济损失甚至人员伤亡。因此，开展旋转机械的故障诊断和预测性维护具有重要的研究价值。

近年来，凭借强大的故障特征学习能力(无需人工设计特征)以及端到端的诊断特性(将原始数据映射到机器健康状态)，深度学习(DL)方法逐渐成为旋转机械故障诊断领域的研究热点。DL方法只有两个步骤：第一步是对原始数据进行采样获得包含样本和标签的集合；第二步是使用集成特征设计、提取和分类的DL模型对样本进行分类。

对于DL的第一步，随着传感和通信技术的快速发展，大量低成本的振动传感器可以部署在旋转机械的不同位置和方向以监测设备的大量运行状态数据。振动数据通常是波形信号(如加速度信号和声学信号)，并且多传感器信号之间故障存在特征的差异。DL模型需要大量包含丰富特征的数据参与训练，因此多传感器信号不仅为基于DL的故障诊断带来了新的生机，也提出了许多应用挑战，如数据闲置和数据滥用等。

对于DL的第二步，各种DL模型，如多层感知器(MLP)、深度信念网络(DBN)、自动编码器(AE)、循环神经网络(RNN)和卷积神经网络(CNN)已被广泛研究并应用于旋转机械故障诊断。特别的，由于CNN更适合处理周期性信号和学习机械振动信号的特征，从这些算法中脱颖而出。虽然基于CNN的故障诊断方法在很多任务上表现出色，但它仍存在以下不足。

(1)大多数的现有方法存在不充分的数据利用，它们仅利用一个位置或方向的传感器信号进行故障诊断，忽略了多传感器信号之间故障特征的差异。这使得模型无法彻底学习到具有代表性的故障特征，限制了诊断性能的进一步提高。

(2)在CNN中，每个卷积核在对应的输入通道上执行独立地卷积运算，并生成特征图(输出通道)。这意味着CNN只对不同通道进行独立处理，忽略了不同通道特征在诊断结果中的重要性。

(3)为了最大限度地提高诊断性能，大多数新开发的模型往往需要复杂的结构和大量的参数，导致计算效率低下和计算资源的浪费。

发明内容

针对上述背景技术中的不足，本发明提出了一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，所提方法有三个主要目的：(1)充分利用多传感器数据；(2)提高CNN的特征学习能力；(3)提高计算效率。

为实现上述目的，本发明采取的技术方案是：

一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，包括如下步骤：

步骤一、数据采集：

采集旋转机械的关键传动部件各种健康状态下的多传感器振动信号；

步骤二、数据预处理：

对多传感器振动信号进行采样、转换和通道融合，得到具有丰富和全面特征的多通道图像；

步骤三、模型搭建：

将高效通道注意力引入到卷积神经网络中，构建ECA-CNN模型；

步骤四、模型训练：

利用多通道图像样本集训练模型；

步骤五、故障诊断：

利用训练好的模型对旋转机械进行故障诊断。

作为本发明进一步改进，步骤一中，在需要诊断的旋转机械传动部件附近的不同位置或方向安装多个传感器，使用数据采集设备采集各种健康状态下的多传感器振动信号；

假设旋转机械的传动部件有c种健康状态，包括正常状态和c-1种故障状态，在一定的工作条件下，由m个传感器采集的振动信号定义如下式：

{X,y}＝{(X_i,y_i)}，i∈[1,c] (1)

其中，{X,y}定义为c种健康状态的信号与标签，X_i、y_i分别表示状态i的信号与标签，X_i ^j表示状态i第j个传感器的信号，X_i ^j(N)表示X_i ^j的第N个信号点。

作为本发明进一步改进，步骤二中，根据样本长度L和滑动步幅S对采集的多传感器信号进行滑动窗口采样，得到的多传感器信号样本集定义如下式：

{x,y}＝{(x_i,y_i)}，i∈[1,c] (4)

其中，{x,y}定义为c种健康状态的信号样本与标签，x_i、y_i分别表示状态i的信号样本与标签，表示状态i第j个传感器的信号样本，/>表示/>的第k个样本；

将采样得到的各传感器信号样本转换为二维灰度图像，长度为L的连续信号段依次填充构造图像的行，构造图像的像素值归一化为0至255之间的整数，对应了灰度图像的像素强度，构造图像的像素值定义如下式：

其中，表示/>的第p个点，max(·)、min(·)分别表示取最大和取最小函数，round(·)表示取整函数；

将转换得到的各传感器信号样本的单通道图像在通道维度上融合为多通道图像，得到的多传感器图像样本集定义如下式：

其中，{x,y}^fusion定义为c种健康状态的多通道图像样本与标签，y_i分别表示状态i的多通道图像样本与标签，/>表示/>的第k个样本，/>表示状态i第m个传感器的第k个单通道图像。

作为本发明进一步改进，步骤三中，所述ECA-CNN模型由多个CNN-ECA块、全局平均池化层GAP、分类层即全连接层FC+Softmax函数依次连接组成，CNN-ECA块的数量根据不同任务需要进行调整；

所述CNN-ECA块由二维卷积层Conv2d、批量归一化层BN、激活层ReLU、二维最大池化层MaxPool2d和ECA模块依次连接组成；

所述二维卷积层Conv2d，如下式所示：

其中，*表示卷积操作，x_i ^l-1表示第l-1层的第i个输入特征图，表示第l层第j个卷积核的权重，/>表示第l层的偏差，/>表示第l层的第j个输出特征图；

所述批量归一化层BN，如下式所示：

其中，h^l＝{h^l(1),…,h^l(N)}表示第l层批量大小为N的输入特征图，h^l(n)＝{h₁ ^l ⁽ⁿ⁾,…,h_k ^l(n)}，表示第l层的第j个输出特征图，u_j、σ_j ²分别表示h_j ^l的均值与方差，ε表示一个很小的常数用于防止方差为0时无效的计算，/>分别表示需要学习的尺度和平移参数；

所述激活层ReLU，如下式所示：

所述二维最大池化层MaxPool2d，如下式所示：

其中，max(·)表示取最大函数，表示第l层的第j个输入特征图，s表示池化大小，/>表示第l层的第j个输出特征图；

所述ECA模块，如下式所示：

ω＝σ(C1D_k(g(X))) (21)

其中，X∈R^C×H×W表示卷积后的特征图，C、H和W分别是特征图的通道数、高度和宽度，g(·)表示全局平均池化GAP操作，ψ(·)表示自适应计算跨通道数量k的函数，C1D_k(·)表示一维卷积操作，σ(·)表示Sigmoid函数，b、γ是常数。

作为本发明进一步改进，步骤四中，多通道图像样本集按照时间序列拆分为训练集、验证集和测试集，使用训练集和验证集训练模型，使用训练好的模型在测试集上预测故障类型来测试模型性能；

多通道图像样本首先输入CNN进行特征学习，然后由ECA模块对学习到的通道特征进行自适应地评分和权重分配，增强与故障信息相关的特征，忽略无关特征，在ECA-CNN模型中，上述操作执行多次，这意味着所需的特征信息被逐层学习，最后，通过全局平均池化层GAP建立特征与结果之间的联系，通过分类层输出故障分类结果；

所述ECA-CNN模型的训练采用多分类交叉熵损失函数来衡量故障分类的性能，如下式所示：

其中，y＝[y₀,…,y_c-1]表示样本标签的独热编码，当样本属于类别i时y_i＝1，否则y_i＝0；p＝[p₀,…,p_c-1]表示模型输出的预测概率，p_i表示样本属于第i类的概率；

所述ECA-CNN模型的训练采用Adam优化算法对模型参数进行更新，Adam算法通过计算梯度的一阶矩估计和二阶矩估计，为不同的模型参数提供独立的自适应学习率，如下式所示：

L(θ)＝min_θL_C (23)

其中，θ表示模型参数，α表示Adam优化算法的学习率，表示误差反向传播求导方式找到的模型参数最优值。

与现有技术相比，本发明的优点在于：(1)实现了多传感器振动信号的通道融合，使多通道融合数据具有丰富和全面的故障特征；(2)将高效通道注意力(ECA)引入到卷积神经网络(CNN)中提高特征学习能力，将注意力集中在更敏感的特征上；(3)构建了具有高计算效率的ECA-CNN模型，从多传感器融合数据学习具有代表性的故障特征，从而实现故障诊断。

附图说明

图1为本发明的方法的流程图；

图2为本发明的方法的多传感器信号的采样过程；

图3为本发明的方法的信号到图像的转换过程；

图4为本发明的方法的多传感器图像的通道融合过程；

图5为本发明的方法的ECA-CNN模型的结构示意图；

图6为本发明的方法的CNN-ECA块的结构示意图；

图7为本发明的方法的ECA模块的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本实施例中，如图1所示，一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，主要包括：步骤一、数据采集：采集旋转机械的关键传动部件(如轴承、齿轮)各种健康状态下的多传感器振动信号；步骤二、数据预处理：对多传感器振动信号进行采样、转换和通道融合，得到具有丰富和全面特征的多通道图像；步骤三、模型搭建：将高效通道注意力(ECA)引入到卷积神经网络(CNN)中，构建ECA-CNN模型；步骤四、模型训练：利用多通道图像样本集训练模型；步骤五、故障诊断：利用训练好的模型对旋转机械进行故障诊断。

步骤一中，在需要诊断的旋转机械传动部件(如轴承、齿轮)附近的不同位置或方向安装多个传感器，使用数据采集设备采集各种健康状态下的多传感器振动信号。

假设旋转机械的传动部件有c种健康状态(正常状态和c-1种故障状态)。在一定的工作条件下，由m个传感器采集的振动信号定义如下式：

{X,y}＝{(X_i,y_i)}，i∈[1,c] (1)

在本实施例中，在行星齿轮箱外壳的X、Y、Z三个方向安装加速度传感器，分别采集轴承和齿轮的多传感器振动信号，包含两种工作条件，即转速-负载分别为20Hz-0V和30Hz-2V。轴承和齿轮在不同工作条件下均有五种健康状态，如下表1所示：

如图2所示，步骤二中，根据样本长度L和滑动步幅S对采集的多传感器信号进行滑动窗口采样，得到的多传感器信号样本集定义如下式：

{x,y}＝{(x_i,y_i)}，i∈[1,c] (4)

其中，{x,y}定义为c种健康状态的信号样本与标签，x_i、y_i分别表示状态i的信号样本与标签，表示状态i第j个传感器的信号样本，/>表示/>的第k个样本。

如图3所示，将采样得到的各传感器信号样本转换为二维灰度图像，长度为L的连续信号段依次填充构造图像的行。构造图像的像素值归一化为0至255之间的整数，对应了灰度图像的像素强度，构造图像的像素值定义如下式：

其中，表示/>的第p个点，max(·)、min(·)分别表示取最大和取最小函数，round(·)表示取整函数。

在本实施例中，样本长度L为1024，这意味着构造图像的边长a为32。

如图4所示，将转换得到的各传感器信号样本的单通道图像在通道维度上融合为多通道图像，得到的多传感器图像样本集定义如下式：

在本实施例中，如图5所示，步骤三中，所述ECA-CNN模型由三个CNN-ECA块、全局平均池化层(GAP)、分类层(全连接层(FC)+Softmax函数)依次连接组成。ECA-CNN模型的详细参数配置如下表2所示：

如图6所示，所述CNN-ECA块由二维卷积层(Conv2d)、批量归一化层(BN)、激活层(ReLU)、二维最大池化层(MaxPool2d)和ECA模块依次连接组成。

所述二维卷积层(Conv2d)，如下式所示：

其中，*表示卷积操作，x_i ^l-1表示第l-1层的第i个输入特征图，表示第l层第j个卷积核的权重，/>表示第l层的偏差，/>表示第l层的第j个输出特征图。

所述批量归一化层(BN)，如下式所示：

其中，h^l＝{h^l(1),…,h^l(N)}表示第l层批量大小为N的输入特征图，h^l(n)＝{h₁ ^l ⁽ⁿ⁾,…,h_k ^l(n)}，y_j ^l(n)表示第l层的第j个输出特征图，u_j、σ_j ²分别表示h_j ^l的均值与方差，ε表示一个很小的常数用于防止方差为0时无效的计算，γ^l _j、β^l _j分别表示需要学习的尺度和平移参数。

所述激活层(ReLU)，如下式所示：

所述二维最大池化层(MaxPool2d)，如下式所示：

其中，max(·)表示取最大函数，表示第l层的第j个输入特征图，s表示池化大小，/>表示第l层的第j个输出特征图。

如图7所示，所述ECA模块，如下式所示：

其中，X∈R^C×H×W表示卷积后的特征图，C、H和W分别是特征图的通道数、高度和宽度，g(·)表示全局平均池化(GAP)操作，ψ(·)表示自适应计算跨通道数量k的函数，C1D_k(·)表示一维卷积操作，σ(·)表示Sigmoid函数，b、γ是常数。

在本实施例中，b＝1、γ＝2。

步骤四中，多通道图像样本集按照时间序列拆分为训练集、验证集和测试集，使用训练集和验证集训练模型，使用训练好的模型在测试集上预测故障类型来测试模型性能。

在本实施例中，两种工作条件每个健康状态均得到1022个多通道图像样本，其中前614个为训练样本，中间204个为验证样本，后204个为测试样本。

多通道图像样本首先输入CNN进行特征学习，然后由ECA模块对学习到的通道特征进行自适应地评分和权重分配，增强与故障信息相关的特征，忽略无关特征。在ECA-CNN模型中，上述操作执行多次，这意味着所需的特征信息被逐层学习。最后，通过全局平均池化层(GAP)建立特征与结果之间的联系，通过分类层(全连接层(FC)+Softmax函数)输出故障分类结果。

其中，y＝[y₀,…,y_c-1]表示样本标签的独热编码，当样本属于类别i时y_i＝1，否则y_i＝0；p＝[p₀,…,p_c-1]表示模型输出的预测概率，p_i表示样本属于第i类的概率。

L(θ)＝min_θL_C (23)

在本实施例中，所述ECA-CNN模型的训练超参数配置如下：Adam优化算法的学习率α为0.001，批量大小为64，迭代次数为100。

在本实施例中，使用不同的子数据集对ECA-CNN模型进行训练与性能测试，包括不同工作条件下的相同数据集、相同工作条件下的相同数据集、相同工作条件下的混合数据集以及完整数据集，并选择四个基于CNN的现有经典模型(2D-CNN、2D-LeNet、2D-ResNet18、2D-BiLSTM)进行对比分析。需要注意的是，所有模型均采用多传感器融合数据和相同的训练策略。此外，为了减少随机性的影响，每个实验均重复五次，将平均值和标准差作为最终实验结果进行分析。对比实验结果如下表3所示：

从表中可以看出，ECA-CNN在每个子数据集上的表现都优于四个对比模型，平均准确率超过99％，标准差也很小。这表明ECA-CNN具有优异的故障诊断性能，并具有良好的适应能力和稳定性。还可以看出，所有模型在轴承数据集上的诊断结果普遍优于在齿轮数据集上的，特别的，ECA-CNN在轴承数据集上的平均准确率均达到了100％。此外，虽然2D-CNN、2D-ResNet18和2D-BiLSTM的诊断结果均不如ECA-CNN，但在多传感器融合数据的帮助下，它们在每个子数据集上的变现还是可以接受的。

在本实施例中，采用参数量(Params)和浮点运算次数(FLOPs)作为模型计算复杂度的评估指标，参数量(Params)是指模型总的参数数量，浮点运算次数(FLOPs)是指模型前向传播过程中的浮点运算次数。通过诊断性能和计算复杂度来反应模型的计算效率，ECA-CNN与四个对比模型在完整数据集上的参数量(Params)和浮点运算次数(FLOPs)如下表4所示：

NoECA-CNN的结构与ECA-CNN相同，只是没有了ECA模块。虽然ECA-CNN的每个CNN-ECA块都包含一个ECA模块，但计算复杂度几乎没有增加，这表明ECA模块具有很低的计算复杂度。ECA-CNN和NoECA-CNN的参数量(Params)只有0.024M，浮点运算次数(FLOPs)只有2.9M，远远小于四种对比模型。ECA-CNN既具有低的计算复杂度又具有优异的故障诊断性能，这表明ECA-CNN的计算效率高。此外，其中，2D-CNN的诊断性能比ECA-CNN稍差，但参数量(Params)和浮点运算次数(FLOPs)比ECA-CNN大得多。

由上述实施例可以看出，本发明是一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法。与现有技术相比，本发明的优点在于：(1)实现了多传感器振动信号的通道融合，使多通道融合数据具有丰富和全面的故障特征；(2)将高效通道注意力(ECA)引入到卷积神经网络(CNN)中提高特征学习能力，将注意力集中在更敏感的特征上；(3)构建了具有高计算效率的ECA-CNN模型，从多传感器融合数据学习具有代表性的故障特征，从而实现故障诊断。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作任何其他形式的限制，而依据本发明的技术实质所作的任何修改或等同变化，仍属于本发明所要求保护的范围。

Claims

1.一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，其特征在于，包括如下步骤：

步骤一、数据采集：

步骤二、数据预处理：

步骤三、模型搭建：

将高效通道注意力引入到卷积神经网络中，构建ECA-CNN模型；

步骤四、模型训练：

利用多通道图像样本集训练模型；

步骤五、故障诊断：

利用训练好的模型对旋转机械进行故障诊断。

2.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，其特征在于，

步骤一中，在需要诊断的旋转机械传动部件附近的不同位置或方向安装多个传感器，使用数据采集设备采集各种健康状态下的多传感器振动信号；

{X,y}＝{(X_i,y_i)}，i∈[1,c] (1)

3.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，其特征在于，

步骤二中，根据样本长度L和滑动步幅S对采集的多传感器信号进行滑动窗口采样，得到的多传感器信号样本集定义如下式：

{x,y}＝{(x_i,y_i)}，i∈[1,c] (4)

4.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，其特征在于，

步骤三中，所述ECA-CNN模型由多个CNN-ECA块、全局平均池化层GAP、分类层即全连接层FC+Softmax函数依次连接组成，CNN-ECA块的数量根据不同任务需要进行调整；

所述二维卷积层Conv2d，如下式所示：

其中，*表示卷积操作，x_i ^l-1表示第l-1层的第i个输入特征图，w^l _ij表示第l层第j个卷积核的权重，表示第l层的偏差，/>表示第l层的第j个输出特征图；

所述批量归一化层BN，如下式所示：

其中，h^l＝{h^l(1),…,h^l(N)}表示第l层批量大小为N的输入特征图，y_j ^l(n)表示第l层的第j个输出特征图，u_j、σ_j ²分别表示h_j ^l的均值与方差，ε表示一个很小的常数用于防止方差为0时无效的计算，/>分别表示需要学习的尺度和平移参数；

所述激活层ReLU，如下式所示：

所述二维最大池化层MaxPool2d，如下式所示：

所述ECA模块，如下式所示：

ω＝σ(C1D_k(g(X))) (21)

5.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法，其特征在于，

步骤四中，多通道图像样本集按照时间序列拆分为训练集、验证集和测试集，使用训练集和验证集训练模型，使用训练好的模型在测试集上预测故障类型来测试模型性能；

所述ECA-CNN模型的训练采用Adam优化算法对模型参数进行更新，Adam算法通过计算梯度的一阶矩估计和二阶矩估计，为不同的模型参数提供独立的自适应学习率，如下式所示：L(θ)＝min_θL_C (23)

θ←Adam(▽_θL_C,θ,α)(24)

其中，θ表示模型参数，α表示Adam优化算法的学习率，▽_θL_C表示误差反向传播求导方式找到的模型参数最优值。