CN117312948A - 一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法 - Google Patents
一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法 Download PDFInfo
- Publication number
- CN117312948A CN117312948A CN202311256137.9A CN202311256137A CN117312948A CN 117312948 A CN117312948 A CN 117312948A CN 202311256137 A CN202311256137 A CN 202311256137A CN 117312948 A CN117312948 A CN 117312948A
- Authority
- CN
- China
- Prior art keywords
- eca
- layer
- cnn
- model
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000004927 fusion Effects 0.000 title claims abstract description 30
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 73
- 230000036541 health Effects 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 21
- 230000005540 biological transmission Effects 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 22
- 238000011176 pooling Methods 0.000 claims description 18
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 230000009347 mechanical transmission Effects 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 description 9
- 238000007667 floating Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005299 abrasion Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
一种基于多传感器融合和ECA‑CNN的旋转机械故障诊断方法,1)数据采集:采集旋转机械的关键传动部件各种健康状态下的多传感器振动信号;2)数据预处理:对多传感器振动信号进行采样、转换和通道融合,得到具有丰富和全面特征的多通道图像;3)模型搭建:将高效通道注意力引入到卷积神经网络中,构建ECA‑CNN模型;4)模型训练:利用多通道图像样本集训练模型;5)故障诊断:利用训练好的模型对旋转机械进行故障诊断。本发明实现了多传感器振动信号的通道融合;将高效通道注意力引入到卷积神经网络中提高特征学习能力,将注意力集中在更敏感的特征上;构建了具有高计算效率的ECA‑CNN模型,从多传感器融合数据学习具有代表性的故障特征,从而实现故障诊断。
Description
技术领域
本发明属于旋转机械故障诊断技术领域,具体为一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法。
背景技术
随着现代工业系统的蓬勃发展,旋转机械在智能装备中发挥着不可替代的作用,其安全性受到学术界和工业界的广泛关注。旋转机械的关键传动部件(如轴承、齿轮)在高速、重载等复杂运行环境下不可避免地会出现磨损、腐蚀、变形、裂纹等故障。传动部件的故障直接影响旋转机械的运行可靠性,可能造成重大事故,导致巨大的经济损失甚至人员伤亡。因此,开展旋转机械的故障诊断和预测性维护具有重要的研究价值。
近年来,凭借强大的故障特征学习能力(无需人工设计特征)以及端到端的诊断特性(将原始数据映射到机器健康状态),深度学习(DL)方法逐渐成为旋转机械故障诊断领域的研究热点。DL方法只有两个步骤:第一步是对原始数据进行采样获得包含样本和标签的集合;第二步是使用集成特征设计、提取和分类的DL模型对样本进行分类。
对于DL的第一步,随着传感和通信技术的快速发展,大量低成本的振动传感器可以部署在旋转机械的不同位置和方向以监测设备的大量运行状态数据。振动数据通常是波形信号(如加速度信号和声学信号),并且多传感器信号之间故障存在特征的差异。DL模型需要大量包含丰富特征的数据参与训练,因此多传感器信号不仅为基于DL的故障诊断带来了新的生机,也提出了许多应用挑战,如数据闲置和数据滥用等。
对于DL的第二步,各种DL模型,如多层感知器(MLP)、深度信念网络(DBN)、自动编码器(AE)、循环神经网络(RNN)和卷积神经网络(CNN)已被广泛研究并应用于旋转机械故障诊断。特别的,由于CNN更适合处理周期性信号和学习机械振动信号的特征,从这些算法中脱颖而出。虽然基于CNN的故障诊断方法在很多任务上表现出色,但它仍存在以下不足。
(1)大多数的现有方法存在不充分的数据利用,它们仅利用一个位置或方向的传感器信号进行故障诊断,忽略了多传感器信号之间故障特征的差异。这使得模型无法彻底学习到具有代表性的故障特征,限制了诊断性能的进一步提高。
(2)在CNN中,每个卷积核在对应的输入通道上执行独立地卷积运算,并生成特征图(输出通道)。这意味着CNN只对不同通道进行独立处理,忽略了不同通道特征在诊断结果中的重要性。
(3)为了最大限度地提高诊断性能,大多数新开发的模型往往需要复杂的结构和大量的参数,导致计算效率低下和计算资源的浪费。
发明内容
针对上述背景技术中的不足,本发明提出了一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,所提方法有三个主要目的:(1)充分利用多传感器数据;(2)提高CNN的特征学习能力;(3)提高计算效率。
为实现上述目的,本发明采取的技术方案是:
一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,包括如下步骤:
步骤一、数据采集:
采集旋转机械的关键传动部件各种健康状态下的多传感器振动信号;
步骤二、数据预处理:
对多传感器振动信号进行采样、转换和通道融合,得到具有丰富和全面特征的多通道图像;
步骤三、模型搭建:
将高效通道注意力引入到卷积神经网络中,构建ECA-CNN模型;
步骤四、模型训练:
利用多通道图像样本集训练模型;
步骤五、故障诊断:
利用训练好的模型对旋转机械进行故障诊断。
作为本发明进一步改进,步骤一中,在需要诊断的旋转机械传动部件附近的不同位置或方向安装多个传感器,使用数据采集设备采集各种健康状态下的多传感器振动信号;
假设旋转机械的传动部件有c种健康状态,包括正常状态和c-1种故障状态,在一定的工作条件下,由m个传感器采集的振动信号定义如下式:
{X,y}={(Xi,yi)},i∈[1,c] (1)
其中,{X,y}定义为c种健康状态的信号与标签,Xi、yi分别表示状态i的信号与标签,Xi j表示状态i第j个传感器的信号,Xi j(N)表示Xi j的第N个信号点。
作为本发明进一步改进,步骤二中,根据样本长度L和滑动步幅S对采集的多传感器信号进行滑动窗口采样,得到的多传感器信号样本集定义如下式:
{x,y}={(xi,yi)},i∈[1,c] (4)
其中,{x,y}定义为c种健康状态的信号样本与标签,xi、yi分别表示状态i的信号样本与标签,表示状态i第j个传感器的信号样本,/>表示/>的第k个样本;
将采样得到的各传感器信号样本转换为二维灰度图像,长度为L的连续信号段依次填充构造图像的行,构造图像的像素值归一化为0至255之间的整数,对应了灰度图像的像素强度,构造图像的像素值定义如下式:
其中,表示/>的第p个点,max(·)、min(·)分别表示取最大和取最小函数,round(·)表示取整函数;
将转换得到的各传感器信号样本的单通道图像在通道维度上融合为多通道图像,得到的多传感器图像样本集定义如下式:
其中,{x,y}fusion定义为c种健康状态的多通道图像样本与标签,yi分别表示状态i的多通道图像样本与标签,/>表示/>的第k个样本,/>表示状态i第m个传感器的第k个单通道图像。
作为本发明进一步改进,步骤三中,所述ECA-CNN模型由多个CNN-ECA块、全局平均池化层GAP、分类层即全连接层FC+Softmax函数依次连接组成,CNN-ECA块的数量根据不同任务需要进行调整;
所述CNN-ECA块由二维卷积层Conv2d、批量归一化层BN、激活层ReLU、二维最大池化层MaxPool2d和ECA模块依次连接组成;
所述二维卷积层Conv2d,如下式所示:
其中,*表示卷积操作,xi l-1表示第l-1层的第i个输入特征图,表示第l层第j个卷积核的权重,/>表示第l层的偏差,/>表示第l层的第j个输出特征图;
所述批量归一化层BN,如下式所示:
其中,hl={hl(1),…,hl(N)}表示第l层批量大小为N的输入特征图,hl(n)={h1 l (n),…,hk l(n)},表示第l层的第j个输出特征图,uj、σj 2分别表示hj l的均值与方差,ε表示一个很小的常数用于防止方差为0时无效的计算,/>分别表示需要学习的尺度和平移参数;
所述激活层ReLU,如下式所示:
所述二维最大池化层MaxPool2d,如下式所示:
其中,max(·)表示取最大函数,表示第l层的第j个输入特征图,s表示池化大小,/>表示第l层的第j个输出特征图;
所述ECA模块,如下式所示:
ω=σ(C1Dk(g(X))) (21)
其中,X∈RC×H×W表示卷积后的特征图,C、H和W分别是特征图的通道数、高度和宽度,g(·)表示全局平均池化GAP操作,ψ(·)表示自适应计算跨通道数量k的函数,C1Dk(·)表示一维卷积操作,σ(·)表示Sigmoid函数,b、γ是常数。
作为本发明进一步改进,步骤四中,多通道图像样本集按照时间序列拆分为训练集、验证集和测试集,使用训练集和验证集训练模型,使用训练好的模型在测试集上预测故障类型来测试模型性能;
多通道图像样本首先输入CNN进行特征学习,然后由ECA模块对学习到的通道特征进行自适应地评分和权重分配,增强与故障信息相关的特征,忽略无关特征,在ECA-CNN模型中,上述操作执行多次,这意味着所需的特征信息被逐层学习,最后,通过全局平均池化层GAP建立特征与结果之间的联系,通过分类层输出故障分类结果;
所述ECA-CNN模型的训练采用多分类交叉熵损失函数来衡量故障分类的性能,如下式所示:
其中,y=[y0,…,yc-1]表示样本标签的独热编码,当样本属于类别i时yi=1,否则yi=0;p=[p0,…,pc-1]表示模型输出的预测概率,pi表示样本属于第i类的概率;
所述ECA-CNN模型的训练采用Adam优化算法对模型参数进行更新,Adam算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的自适应学习率,如下式所示:
L(θ)=minθLC (23)
其中,θ表示模型参数,α表示Adam优化算法的学习率,表示误差反向传播求导方式找到的模型参数最优值。
与现有技术相比,本发明的优点在于:(1)实现了多传感器振动信号的通道融合,使多通道融合数据具有丰富和全面的故障特征;(2)将高效通道注意力(ECA)引入到卷积神经网络(CNN)中提高特征学习能力,将注意力集中在更敏感的特征上;(3)构建了具有高计算效率的ECA-CNN模型,从多传感器融合数据学习具有代表性的故障特征,从而实现故障诊断。
附图说明
图1为本发明的方法的流程图;
图2为本发明的方法的多传感器信号的采样过程;
图3为本发明的方法的信号到图像的转换过程;
图4为本发明的方法的多传感器图像的通道融合过程;
图5为本发明的方法的ECA-CNN模型的结构示意图;
图6为本发明的方法的CNN-ECA块的结构示意图;
图7为本发明的方法的ECA模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本实施例中,如图1所示,一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,主要包括:步骤一、数据采集:采集旋转机械的关键传动部件(如轴承、齿轮)各种健康状态下的多传感器振动信号;步骤二、数据预处理:对多传感器振动信号进行采样、转换和通道融合,得到具有丰富和全面特征的多通道图像;步骤三、模型搭建:将高效通道注意力(ECA)引入到卷积神经网络(CNN)中,构建ECA-CNN模型;步骤四、模型训练:利用多通道图像样本集训练模型;步骤五、故障诊断:利用训练好的模型对旋转机械进行故障诊断。
步骤一中,在需要诊断的旋转机械传动部件(如轴承、齿轮)附近的不同位置或方向安装多个传感器,使用数据采集设备采集各种健康状态下的多传感器振动信号。
假设旋转机械的传动部件有c种健康状态(正常状态和c-1种故障状态)。在一定的工作条件下,由m个传感器采集的振动信号定义如下式:
{X,y}={(Xi,yi)},i∈[1,c] (1)
其中,{X,y}定义为c种健康状态的信号与标签,Xi、yi分别表示状态i的信号与标签,Xi j表示状态i第j个传感器的信号,Xi j(N)表示Xi j的第N个信号点。
在本实施例中,在行星齿轮箱外壳的X、Y、Z三个方向安装加速度传感器,分别采集轴承和齿轮的多传感器振动信号,包含两种工作条件,即转速-负载分别为20Hz-0V和30Hz-2V。轴承和齿轮在不同工作条件下均有五种健康状态,如下表1所示:
如图2所示,步骤二中,根据样本长度L和滑动步幅S对采集的多传感器信号进行滑动窗口采样,得到的多传感器信号样本集定义如下式:
{x,y}={(xi,yi)},i∈[1,c] (4)
其中,{x,y}定义为c种健康状态的信号样本与标签,xi、yi分别表示状态i的信号样本与标签,表示状态i第j个传感器的信号样本,/>表示/>的第k个样本。
如图3所示,将采样得到的各传感器信号样本转换为二维灰度图像,长度为L的连续信号段依次填充构造图像的行。构造图像的像素值归一化为0至255之间的整数,对应了灰度图像的像素强度,构造图像的像素值定义如下式:
其中,表示/>的第p个点,max(·)、min(·)分别表示取最大和取最小函数,round(·)表示取整函数。
在本实施例中,样本长度L为1024,这意味着构造图像的边长a为32。
如图4所示,将转换得到的各传感器信号样本的单通道图像在通道维度上融合为多通道图像,得到的多传感器图像样本集定义如下式:
其中,{x,y}fusion定义为c种健康状态的多通道图像样本与标签,yi分别表示状态i的多通道图像样本与标签,/>表示/>的第k个样本,/>表示状态i第m个传感器的第k个单通道图像。
在本实施例中,如图5所示,步骤三中,所述ECA-CNN模型由三个CNN-ECA块、全局平均池化层(GAP)、分类层(全连接层(FC)+Softmax函数)依次连接组成。ECA-CNN模型的详细参数配置如下表2所示:
如图6所示,所述CNN-ECA块由二维卷积层(Conv2d)、批量归一化层(BN)、激活层(ReLU)、二维最大池化层(MaxPool2d)和ECA模块依次连接组成。
所述二维卷积层(Conv2d),如下式所示:
其中,*表示卷积操作,xi l-1表示第l-1层的第i个输入特征图,表示第l层第j个卷积核的权重,/>表示第l层的偏差,/>表示第l层的第j个输出特征图。
所述批量归一化层(BN),如下式所示:
其中,hl={hl(1),…,hl(N)}表示第l层批量大小为N的输入特征图,hl(n)={h1 l (n),…,hk l(n)},yj l(n)表示第l层的第j个输出特征图,uj、σj 2分别表示hj l的均值与方差,ε表示一个很小的常数用于防止方差为0时无效的计算,γl j、βl j分别表示需要学习的尺度和平移参数。
所述激活层(ReLU),如下式所示:
所述二维最大池化层(MaxPool2d),如下式所示:
其中,max(·)表示取最大函数,表示第l层的第j个输入特征图,s表示池化大小,/>表示第l层的第j个输出特征图。
如图7所示,所述ECA模块,如下式所示:
其中,X∈RC×H×W表示卷积后的特征图,C、H和W分别是特征图的通道数、高度和宽度,g(·)表示全局平均池化(GAP)操作,ψ(·)表示自适应计算跨通道数量k的函数,C1Dk(·)表示一维卷积操作,σ(·)表示Sigmoid函数,b、γ是常数。
在本实施例中,b=1、γ=2。
步骤四中,多通道图像样本集按照时间序列拆分为训练集、验证集和测试集,使用训练集和验证集训练模型,使用训练好的模型在测试集上预测故障类型来测试模型性能。
在本实施例中,两种工作条件每个健康状态均得到1022个多通道图像样本,其中前614个为训练样本,中间204个为验证样本,后204个为测试样本。
多通道图像样本首先输入CNN进行特征学习,然后由ECA模块对学习到的通道特征进行自适应地评分和权重分配,增强与故障信息相关的特征,忽略无关特征。在ECA-CNN模型中,上述操作执行多次,这意味着所需的特征信息被逐层学习。最后,通过全局平均池化层(GAP)建立特征与结果之间的联系,通过分类层(全连接层(FC)+Softmax函数)输出故障分类结果。
所述ECA-CNN模型的训练采用多分类交叉熵损失函数来衡量故障分类的性能,如下式所示:
其中,y=[y0,…,yc-1]表示样本标签的独热编码,当样本属于类别i时yi=1,否则yi=0;p=[p0,…,pc-1]表示模型输出的预测概率,pi表示样本属于第i类的概率。
所述ECA-CNN模型的训练采用Adam优化算法对模型参数进行更新,Adam算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的自适应学习率,如下式所示:
L(θ)=minθLC (23)
其中,θ表示模型参数,α表示Adam优化算法的学习率,表示误差反向传播求导方式找到的模型参数最优值。
在本实施例中,所述ECA-CNN模型的训练超参数配置如下:Adam优化算法的学习率α为0.001,批量大小为64,迭代次数为100。
在本实施例中,使用不同的子数据集对ECA-CNN模型进行训练与性能测试,包括不同工作条件下的相同数据集、相同工作条件下的相同数据集、相同工作条件下的混合数据集以及完整数据集,并选择四个基于CNN的现有经典模型(2D-CNN、2D-LeNet、2D-ResNet18、2D-BiLSTM)进行对比分析。需要注意的是,所有模型均采用多传感器融合数据和相同的训练策略。此外,为了减少随机性的影响,每个实验均重复五次,将平均值和标准差作为最终实验结果进行分析。对比实验结果如下表3所示:
从表中可以看出,ECA-CNN在每个子数据集上的表现都优于四个对比模型,平均准确率超过99%,标准差也很小。这表明ECA-CNN具有优异的故障诊断性能,并具有良好的适应能力和稳定性。还可以看出,所有模型在轴承数据集上的诊断结果普遍优于在齿轮数据集上的,特别的,ECA-CNN在轴承数据集上的平均准确率均达到了100%。此外,虽然2D-CNN、2D-ResNet18和2D-BiLSTM的诊断结果均不如ECA-CNN,但在多传感器融合数据的帮助下,它们在每个子数据集上的变现还是可以接受的。
在本实施例中,采用参数量(Params)和浮点运算次数(FLOPs)作为模型计算复杂度的评估指标,参数量(Params)是指模型总的参数数量,浮点运算次数(FLOPs)是指模型前向传播过程中的浮点运算次数。通过诊断性能和计算复杂度来反应模型的计算效率,ECA-CNN与四个对比模型在完整数据集上的参数量(Params)和浮点运算次数(FLOPs)如下表4所示:
NoECA-CNN的结构与ECA-CNN相同,只是没有了ECA模块。虽然ECA-CNN的每个CNN-ECA块都包含一个ECA模块,但计算复杂度几乎没有增加,这表明ECA模块具有很低的计算复杂度。ECA-CNN和NoECA-CNN的参数量(Params)只有0.024M,浮点运算次数(FLOPs)只有2.9M,远远小于四种对比模型。ECA-CNN既具有低的计算复杂度又具有优异的故障诊断性能,这表明ECA-CNN的计算效率高。此外,其中,2D-CNN的诊断性能比ECA-CNN稍差,但参数量(Params)和浮点运算次数(FLOPs)比ECA-CNN大得多。
由上述实施例可以看出,本发明是一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法。与现有技术相比,本发明的优点在于:(1)实现了多传感器振动信号的通道融合,使多通道融合数据具有丰富和全面的故障特征;(2)将高效通道注意力(ECA)引入到卷积神经网络(CNN)中提高特征学习能力,将注意力集中在更敏感的特征上;(3)构建了具有高计算效率的ECA-CNN模型,从多传感器融合数据学习具有代表性的故障特征,从而实现故障诊断。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (5)
1.一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,其特征在于,包括如下步骤:
步骤一、数据采集:
采集旋转机械的关键传动部件各种健康状态下的多传感器振动信号;
步骤二、数据预处理:
对多传感器振动信号进行采样、转换和通道融合,得到具有丰富和全面特征的多通道图像;
步骤三、模型搭建:
将高效通道注意力引入到卷积神经网络中,构建ECA-CNN模型;
步骤四、模型训练:
利用多通道图像样本集训练模型;
步骤五、故障诊断:
利用训练好的模型对旋转机械进行故障诊断。
2.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,其特征在于,
步骤一中,在需要诊断的旋转机械传动部件附近的不同位置或方向安装多个传感器,使用数据采集设备采集各种健康状态下的多传感器振动信号;
假设旋转机械的传动部件有c种健康状态,包括正常状态和c-1种故障状态,在一定的工作条件下,由m个传感器采集的振动信号定义如下式:
{X,y}={(Xi,yi)},i∈[1,c] (1)
其中,{X,y}定义为c种健康状态的信号与标签,Xi、yi分别表示状态i的信号与标签,Xi j表示状态i第j个传感器的信号,Xi j(N)表示Xi j的第N个信号点。
3.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,其特征在于,
步骤二中,根据样本长度L和滑动步幅S对采集的多传感器信号进行滑动窗口采样,得到的多传感器信号样本集定义如下式:
{x,y}={(xi,yi)},i∈[1,c] (4)
其中,{x,y}定义为c种健康状态的信号样本与标签,xi、yi分别表示状态i的信号样本与标签,表示状态i第j个传感器的信号样本,/>表示/>的第k个样本;
将采样得到的各传感器信号样本转换为二维灰度图像,长度为L的连续信号段依次填充构造图像的行,构造图像的像素值归一化为0至255之间的整数,对应了灰度图像的像素强度,构造图像的像素值定义如下式:
其中,表示/>的第p个点,max(·)、min(·)分别表示取最大和取最小函数,round(·)表示取整函数;
将转换得到的各传感器信号样本的单通道图像在通道维度上融合为多通道图像,得到的多传感器图像样本集定义如下式:
其中,{x,y}fusion定义为c种健康状态的多通道图像样本与标签,yi分别表示状态i的多通道图像样本与标签,/>表示/>的第k个样本,/>表示状态i第m个传感器的第k个单通道图像。
4.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,其特征在于,
步骤三中,所述ECA-CNN模型由多个CNN-ECA块、全局平均池化层GAP、分类层即全连接层FC+Softmax函数依次连接组成,CNN-ECA块的数量根据不同任务需要进行调整;
所述CNN-ECA块由二维卷积层Conv2d、批量归一化层BN、激活层ReLU、二维最大池化层MaxPool2d和ECA模块依次连接组成;
所述二维卷积层Conv2d,如下式所示:
其中,*表示卷积操作,xi l-1表示第l-1层的第i个输入特征图,wl ij表示第l层第j个卷积核的权重,表示第l层的偏差,/>表示第l层的第j个输出特征图;
所述批量归一化层BN,如下式所示:
其中,hl={hl(1),…,hl(N)}表示第l层批量大小为N的输入特征图,yj l(n)表示第l层的第j个输出特征图,uj、σj 2分别表示hj l的均值与方差,ε表示一个很小的常数用于防止方差为0时无效的计算,/>分别表示需要学习的尺度和平移参数;
所述激活层ReLU,如下式所示:
所述二维最大池化层MaxPool2d,如下式所示:
其中,max(·)表示取最大函数,表示第l层的第j个输入特征图,s表示池化大小,/>表示第l层的第j个输出特征图;
所述ECA模块,如下式所示:
ω=σ(C1Dk(g(X))) (21)
其中,X∈RC×H×W表示卷积后的特征图,C、H和W分别是特征图的通道数、高度和宽度,g(·)表示全局平均池化GAP操作,ψ(·)表示自适应计算跨通道数量k的函数,C1Dk(·)表示一维卷积操作,σ(·)表示Sigmoid函数,b、γ是常数。
5.根据权利要求1所述的一种基于多传感器融合和ECA-CNN的旋转机械故障诊断方法,其特征在于,
步骤四中,多通道图像样本集按照时间序列拆分为训练集、验证集和测试集,使用训练集和验证集训练模型,使用训练好的模型在测试集上预测故障类型来测试模型性能;
多通道图像样本首先输入CNN进行特征学习,然后由ECA模块对学习到的通道特征进行自适应地评分和权重分配,增强与故障信息相关的特征,忽略无关特征,在ECA-CNN模型中,上述操作执行多次,这意味着所需的特征信息被逐层学习,最后,通过全局平均池化层GAP建立特征与结果之间的联系,通过分类层输出故障分类结果;
所述ECA-CNN模型的训练采用多分类交叉熵损失函数来衡量故障分类的性能,如下式所示:
其中,y=[y0,…,yc-1]表示样本标签的独热编码,当样本属于类别i时yi=1,否则yi=0;p=[p0,…,pc-1]表示模型输出的预测概率,pi表示样本属于第i类的概率;
所述ECA-CNN模型的训练采用Adam优化算法对模型参数进行更新,Adam算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的自适应学习率,如下式所示:L(θ)=minθLC (23)
θ←Adam(▽θLC,θ,α)(24)
其中,θ表示模型参数,α表示Adam优化算法的学习率,▽θLC表示误差反向传播求导方式找到的模型参数最优值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311256137.9A CN117312948A (zh) | 2023-09-27 | 2023-09-27 | 一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311256137.9A CN117312948A (zh) | 2023-09-27 | 2023-09-27 | 一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117312948A true CN117312948A (zh) | 2023-12-29 |
Family
ID=89273203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311256137.9A Pending CN117312948A (zh) | 2023-09-27 | 2023-09-27 | 一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117312948A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118035766A (zh) * | 2024-04-12 | 2024-05-14 | 太原理工大学 | 基于相似度对抗与对比学习的变工况轴承故障诊断方法 |
-
2023
- 2023-09-27 CN CN202311256137.9A patent/CN117312948A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118035766A (zh) * | 2024-04-12 | 2024-05-14 | 太原理工大学 | 基于相似度对抗与对比学习的变工况轴承故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110361176B (zh) | 一种基于多任务特征共享神经网络的智能故障诊断方法 | |
CN109947086B (zh) | 基于对抗学习的机械故障迁移诊断方法及系统 | |
CN109635677B (zh) | 基于多标签分类卷积神经网络的复合故障诊断方法及装置 | |
CN109655259B (zh) | 基于深度解耦卷积神经网络的复合故障诊断方法及装置 | |
CN112417954B (zh) | 一种面向小样本数据集的轴承故障模式诊断方法及系统 | |
CN111830408A (zh) | 一种基于边缘计算和深度学习的电机故障诊断系统及方法 | |
CN114818774A (zh) | 一种基于多通道自校准卷积神经网络的齿轮箱智能故障诊断方法 | |
Li et al. | Joint attention feature transfer network for gearbox fault diagnosis with imbalanced data | |
CN117312948A (zh) | 一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法 | |
CN111855202A (zh) | 一种齿轮箱故障诊断方法及系统 | |
CN116842379A (zh) | 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 | |
CN114429152A (zh) | 基于动态指数对抗性自适应的滚动轴承故障诊断方法 | |
CN114491828A (zh) | 一种基于多门控混合专家多任务学习的复合故障诊断方法 | |
CN117009916A (zh) | 基于多传感器信息融合与迁移学习的促动器故障诊断方法 | |
CN114444187B (zh) | 一种振动传递大数据与胶囊网络融合的桥梁损伤诊断方法 | |
CN115984263A (zh) | 基于改进型孪生神经网络的螺栓松动检测算法及检测系统 | |
CN114357372A (zh) | 一种基于多传感器数据驱动的飞机故障诊断模型生成方法 | |
CN113984389A (zh) | 一种基于多感受野与改进胶囊图神经网络的滚动轴承故障诊断方法 | |
CN113758709A (zh) | 结合边缘计算和深度学习的滚动轴承故障诊断方法及系统 | |
CN117763494A (zh) | 基于多模态和多尺度融合网络的轴承诊断方法及系统 | |
CN116977708B (zh) | 一种基于自适应聚合可视图的轴承智能诊断方法及系统 | |
CN115640531A (zh) | 一种基于残差学习与注意力机制融合的故障诊断方法 | |
CN117235489A (zh) | 传动系统多源监测数据的图变分自编码特征提取方法 | |
CN114626406A (zh) | 基于类边界特征检测的轴承故障诊断方法及系统 | |
CN113971489A (zh) | 一种基于混合神经网络的剩余使用寿命预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |