CN116595313A - 基于多尺度残差注意力网络的故障诊断方法及系统 - Google Patents
基于多尺度残差注意力网络的故障诊断方法及系统 Download PDFInfo
- Publication number
- CN116595313A CN116595313A CN202310296694.7A CN202310296694A CN116595313A CN 116595313 A CN116595313 A CN 116595313A CN 202310296694 A CN202310296694 A CN 202310296694A CN 116595313 A CN116595313 A CN 116595313A
- Authority
- CN
- China
- Prior art keywords
- convolution
- module
- fault diagnosis
- residual
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 135
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000000284 extract Substances 0.000 claims abstract description 17
- 230000007246 mechanism Effects 0.000 claims description 51
- 238000011176 pooling Methods 0.000 claims description 43
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 230000007774 longterm Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 16
- 238000012549 training Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 13
- 239000013598 vector Substances 0.000 description 12
- 238000012360 testing method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明提供一种基于多尺度残差注意力网络的故障诊断方法及系统,涉及故障诊断技术领域。本发明基于多尺度残差注意力网络构建故障诊断模型,并利用训练后的故障诊断模型进行装备的故障诊断;其中,多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块。本发明的故障诊断方法能从多尺度角度提取设备信号数据中所隐含的特征,同时可以在一定程度上抑制设备信号数据中噪声信号的干扰,相比于传统故障诊断技术,提高了故障诊断的精度和鲁棒性。
Description
技术领域
本发明涉及故障诊断技术领域,具体涉及一种基于多尺度残差注意力网络的故障诊断方法及系统。
背景技术
在新一代信息技术的背景下,高端装备的应用形式越来越多样化,其精度、性能要求也愈来愈高。伴随着信息技术产业的蓬勃发展,装备性能和维修的需求变得十分迫切和重要,尤其在船舶主动力设备、涡轮、齿轮箱等零部件上,一旦出现故障都会导致严重的后果,造成难以估量的损失。
目前,装备故障诊断一般包括三个大的步骤:原始数据采集和处理、对数据进行特征提取(例如,基于专家经验进行手工特征标注等),以及利用相关模型实现故障分类。其中,特征提取和故障分类是影响故障诊断准确率的两个重要步骤。
然而,传统的故障诊断技术在进行特征提取时一般是基于专家经验以及手工进行特征标注,其带有一定的主观性,会导致分类效果差、分类精度低的问题;且目前大量的相关研究工作集中在提取单一的尺度特征,从单一的角度提取信号特征,而机械设备在正常状态下运转时,发生故障时机、故障发生原因或位置等均是随机的,且不同的位置处的损坏所产生的信号在采集时可能会出现耦合等情况,所以单一尺度的特征提取可能会丢失对局部重要特征的关注,同样也会影响分类精度;此外,设备的生产制造以及数据采集过程中时时刻刻存在噪声,而现有的模型抗噪声能力差,泛化性弱,所以利用现有相关模型实现故障分类时,同样会导致分类精度低的问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于多尺度残差注意力网络的故障诊断方法及系统,解决了现有故障诊断技术存在精度低的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明首先提出了一种基于多尺度残差注意力网络的故障诊断方法,所述方法包括:
获取待进行故障诊断的设备的信号数据,并对所述信号数据进行预处理;
构建基于多尺度残差注意力网络的故障诊断模型;所述多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块;其中,所述宽卷积模块包括用空洞卷积代替原有神经网络的小卷积核以提取所述信号数据的长时特征信息;所述多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积;所述残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支;
基于训练后的所述故障诊断模型实现故障诊断。
优选的,所述预处理包括利用滑动窗口技术对所述信号数据进行数据增强。
优选的,所述混合池化策略为对全局最大池化以及全局最小池化进行加权操作。
优选的,所述深度可分离卷积包括通道卷积和点卷积;所述通道卷积根据输入的通道维数决定卷积核的数量,提取与输入通道数相等数量的特征图;所述点卷积利用1x1的卷积核提取特征,卷积核数量设置为欲得到的特征图的数量。
优选的,所述故障诊断模型还包括:分类模块,所述分类模块用于故障诊断结果的分类和输出,且所述分类模块包括自适应平均池化模块和卷积模块。
第二方面,本发明还提出了一种基于多尺度残差注意力网络的故障诊断系统,所述系统包括:
数据获取和处理模块,用于获取待进行故障诊断的设备的信号数据,并对所述信号数据进行预处理;
故障诊断模型获取模块,用于基于多尺度残差注意力网络构建故障诊断模型;所述多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块;其中,所述宽卷积模块包括用空洞卷积代替原有神经网络的小卷积核以提取所述信号数据的长时特征信息;所述多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积;所述残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支;
故障诊断模块,用于基于训练后的所述故障诊断模型实现故障诊断。
优选的,所述数据获取和处理模块进行预处理操作时包括利用滑动窗口技术对所述信号数据进行数据增强。
优选的,所述混合池化策略为对全局最大池化以及全局最小池化进行加权操作。
优选的,所述深度可分离卷积包括通道卷积和点卷积;所述通道卷积根据输入的通道维数决定卷积核的数量,提取与输入通道数相等数量的特征图;所述点卷积利用1x1的卷积核提取特征,卷积核数量设置为欲得到的特征图的数量。
优选的,所述故障诊断模型还包括:分类模块,所述分类模块用于故障诊断结果的分类和输出,且所述分类模块包括自适应平均池化模块和卷积模块。
(三)有益效果
本发明提供了一种基于多尺度残差注意力网络的故障诊断方法及系统。与现有技术相比,具备以下有益效果:
本发明基于多尺度残差注意力网络构建故障诊断模型,并利用训练后的故障诊断模型进行装备的故障诊断;其中,多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块。本发明的故障诊断方法能从多尺度角度提取设备信号数据中所隐含的特征,同时可以在一定程度上抑制设备信号数据中噪声信号的干扰,相比于传统故障诊断技术,提高了故障诊断的精度和鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于多尺度残差注意力网络的故障诊断方法的流程图;
图2为本发明实施例中一种基于多尺度残差注意力网络的故障诊断方法的实施例图;
图3为本发明实施例中原有Res2Net module的结构图;
图4为本发明实施例中多尺度卷积模块的结构图;
图5为本发明实施例中改进前的CBAM注意力机制的结构图;
图6为本发明实施例中改进后的通道注意力机制的结构图;
图7为本发明实施例中改进后的空间注意力机制的结构图;
图8为本发明实施例中残差注意力模块的结构图;
图9为本发明实施例中多尺度残差注意力网络整体结构简图;
图10为本发明实施例中多尺度残差注意力网络的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于多尺度残差注意力网络的故障诊断方法及系统,解决了现有故障诊断技术存在精度低的问题,实现了对装备故障进行高精度诊断,进而提高装备维护保养效率的目的。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
为了解决现有故障诊断技术由于各种原因致使存在精度低的问题,本申请的技术方案基于深度学习提出了一种多尺度残差注意力网络,该网络主要包括宽卷积模块、多尺度模块,以及残差注意力模块。其中,利用宽卷积模块能够提取到采集的装备信号的长时特征;利用多尺度模块对采集的装备信号的不同粒度进行采样,既有全局的、整体的特征,又有局部的详细信息;利用残差注意力模块可以赋予采集的装备信号中重要特征相对大的权重,对于噪声给予相对小的权重,也就是关注信号的主要特征,忽略次要特征也就是噪声的干扰。本申请的技术方案能够有效地解决设备故障诊断的问题,提高了故障诊断的精度,同时具有很高的鲁棒性。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本申请的技术方案包括但不限于对船舶主动力设备、涡轮、齿轮箱等零部件装备的故障诊断,还适用于其它高端装备的故障诊断。为了便于说明,在本申请的以下实施例中,我们以船舶主动力设备的故障诊断为例进行说明。
实施例1:
第一方面,本发明首先提出了一种基于多尺度残差注意力网络的故障诊断方法,参见图1-2,该方法包括:
S1、获取待进行故障诊断的设备的信号数据,并对所述信号数据进行预处理;
S2、构建基于多尺度残差注意力网络的故障诊断模型;所述多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块;其中,所述宽卷积模块包括用空洞卷积代替原有神经网络的小卷积核以提取所述信号数据的长时特征信息;所述多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积;所述残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支;
S3、基于训练后的所述故障诊断模型实现故障诊断。
可见,本实施例基于多尺度残差注意力网络构建故障诊断模型,并利用训练后的故障诊断模型进行装备的故障诊断;其中,多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块。本实施例的故障诊断方法能从多尺度角度提取设备信号数据中所隐含的特征,同时可以在一定程度上抑制设备信号数据中噪声信号的干扰,提高了故障诊断的精度和鲁棒性。
下面结合附图1-10,以及对S1-S3具体步骤的解释,来详细说明本发明一个实施例的实现过程。
S1、获取待进行故障诊断的设备的信号数据,并对所述信号数据进行预处理。
信号数据收集。装备运行过程中,船舶主动力设备因为振动会产生信号,通过加速器安装在船舶主动力设备的各个位置处,这些位置一般是故障点的故障位置,例如轴承中的外圈、内圈、滚动体等容易损坏的位置。采集相应的振动信号,将采集得到的振动信号进行整理分类。
数据增强。考虑到振动信号的数据量不够大,我们需要对原始的振动信号数据进行数据扩充。本实施例采用了滑动窗口技术进行数据增强,在扩充数据集的同时,不影响数据的分类。滑动窗口技术的本质是通过移动窗口进行取样,设置好窗口大小后,从原始信号上进行滑动采样,既保留了原有的数据信号,又增加了数据集样本大小,在小数据集上能够取得显著的效果。
划分数据集。将上述经过数据增强后的信号数据随机划分为训练集和测试集,训练集用来对神经网络中训练,测试集用来测试模型的特性。在本实施例中,训练集和测试集的划分的比例一般是8:2或者7:3,可根据实际需要选择。
S2、构建基于多尺度残差注意力网络的故障诊断模型;所述多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块;其中,所述宽卷积模块包括用空洞卷积代替原有神经网络的小卷积核以提取所述信号数据的长时特征信息;所述多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积;所述残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支。
为了解决现有的故障诊断技术分类精度低的问题,本实施例构建了一种基于多尺度残差注意力网络的故障诊断模型;所述故障诊断模型包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块,即信号数据首先输入宽卷积模块,再到多尺度卷积模块,再到残差注意力机制模块,以完成信号数据的网络特征学习,最后通过分类模块输出故障诊断结果。具体的:
(1)构建宽卷积模块。宽卷积模块包括用空洞卷积代替原有神经网络的小卷积以提取所述信号数据的长时特征信息。
考虑经典的神经网络中大都是小卷积核(类似于3x3,1x1)进行信号数据的提取特征,本实施例提出一种具有扩张宽卷积核的卷积结构,通过稀疏采样从被噪声污染的信号中提取长时相关的多尺度短时特征,并通过滤波操作抑制噪声干扰。宽卷积的核心是通过映射更多的长时相关信息与更大的感受野来提高模型的抗噪能力。在本实施例中使用5×5的空洞卷积代替一般的3×3普通卷积核,将空洞率(dilation)设置为2,那么5×5的空洞卷积核相当于大小为9×9的卷积核,在不增加参数的情况下扩大了感受野。空洞卷积就是在卷积核元素之间加入了dilation-1个元素(空洞),扩大感受野提取信号特征。
(2)构建多尺度卷积模块。多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积。
工业背景下的设备故障信号的特征往往不是单一的,单一尺度下的设备故障诊断模型提取船舶主动力设备的特征往往会造成精度低、鲁棒性差等问题。本实施例为了解决单一尺度特征提取导致模型诊断精度低的问题,拟提出信号的多尺度特征提取,因此设计了改进的Res2block模块,并基于Res2block模块进行改进构建多尺度卷积模块。多尺度卷积模块是将一段信号经过卷积操作后得到一张特征图,也是一个特征向量,该特征信息将被划分为n等份,每一份经过不同的处理。如图3所示,原来的Res2block模块是将特征向量分成4个子特征向量,第一段子特征向量不做处理,第二段子特征向量经过一个大小为3x3的卷积核,得到新的特征向量,第三段子特征向量将与第二段卷积之后的特征向量相加,再经过一个大小为3x3的卷积核的到新特征向量,最后的子特征向量与第三个子特征向量卷积后的结果相加,同样经过3x3的卷积核,最后整合特征信息进行聚合,输送到下一个模块。如图4所示,经过改进的Res2block模块(即多尺度卷积模块)主要包括:第一个方面,将软阈值(soft threshold)函数加入多尺度卷积模块中,目的是删除上一层得到的冗余特征,便于梯度的反向传播。软阈值化是将输入数据朝着零的方向进行收缩的一种函数,经常在信号降噪算法中使用。具体来说,soft threshold的作用是能够将某一个区间范围[-τ,τ]的特征置为0,该分支能够在一定程度上抑制噪声的干扰;第二个方面,考虑第一段子特征向量经过卷积后的结果,将所有的3x3的卷积核都替换为两个深度可分离卷积核。
深度可分离卷积是由通道卷积和点卷积组成,通道卷积是根据输入的通道维数决定卷积核的数量,提取得到与输入通道数相等数量的特征图,而点卷积就是利用1x1的卷积核去提取特征,卷积核数量设置为想要得到的特征图的数量。深度可分离卷积的参数远小于普通卷积的参数,基于该种设置,整体降低了多尺度卷积模块的参数,提高了模型的训练速度,能够避免过拟合。
(3)构建残差注意力模块。残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支。
通过上述多尺度卷积模块解决故障诊断的多尺度特征提取难题后,本实施例另一个重点是为了解决振动信号中含有噪声和其他干扰因素的信号。
实际的工业环境背景下,往往伴随着大量的噪声,也导致了船舶主动力设备振动信号在分析时需要考虑噪声的影响。基于此,本实施例构建残差注意力模块(ResidualAttention module)。残差注意力模块基于CBAM注意力机制进行改进,融合了三种池化操作,使该模块能够关注重要的特征,同时对噪声信号处理,在网络训练中赋予噪声信号更小的权重,从而提高模型的鲁棒性和准确性。
原来的CBAM注意力机制主要是由两个部分组成,一个是通道注意力机制(ChannelAttention),另一个是空间注意力机制(Spatial Attention),如图5所示。通道注意力机制的本质是对于不同的通道赋予不同的权重大小,使模型更加关注于有效的通道信息,针对不同的任务,将分配不同的通道权重,学习到不同通道之间的重要性。而空间注意力机制的本质在于定位目标并进行一些变换或获取权重。残差注意力模块中添加了一种混合池化(Mix pool)策略,该混合池化(Mix pool)策略通过全局最大池化(Global maxpool)以及全局最小池化(Global minpool)进行加权操作。将合池化(Mix pool)策略加入到通道注意力机制当中,可以提取更丰富的特征信息,如图6所示。
此外,如图7-8所示,在设计好通道注意力机制(Channel Attention)和空间注意力机制(Spatial Attention)之后,设置第一、第二两个残差连接分支。第一残差分支是来自输入到残差注意力模块的输入特征,第二个残差连接是来自通道注意力机制(ChannelAttention)和空间注意力机制(Spatial Attention)的点乘结果。通常注意力机制在神经网络当中是起到一个承上启下的作用。在本实施例中,将注意力机制的结果作为残差,即将两者的注意力权重相乘之后作为残差分支输入网络下一层,相当于也学习了注意力所关注的特征信息。该残差策略起到了很好的效果,增强了故障诊断模型的鲁棒性。
基于多尺度残差注意力网络构建故障诊断模型。将上述构建后的宽卷积模块、多尺度卷积模块,以及残差注意力模块三个主要模块进行融合,完成船舶主动力设备的故障诊断模型构建。
本实施例中的故障诊断模型除了宽卷积模块、多尺度卷积模块,以及残差注意力模块三个主要模块之外,还包括分类模块,该分类模块用于故障诊断结果的分类和输出,主要是由一个自适应平均池化模块和卷积模块完成,经过Softmax函数获取各个类别的概率大小,实现故障诊断。具体的,如图9-10所示,将采集的信号输入到宽卷积模块,信号数据经过宽卷积模块,获取第一层特征;第一层特征再到多尺度卷积模块,将第一层特征信息划分为四段子特征信息,分别经过两个深度可分离卷积模块,且前一段的特征信息会加入到下一段的特征信息,让上下文特征联系更加紧密,体现出多个尺度提取信息的特点,通过四段分支提取到的特征,进行特征融合;再将融合后的特征输入到残差注意力机制模块,残差注意力网络先经过通道注意力模块,提取通道注意力特征后传入到空间注意力机制,且将通道注意力权重与空间注意力权重相乘,作为残差分支加入到后续模块的训练当中。信号数据通过上述多尺度残差注意力网络进行网络特征学习后,最后通过分类模块输出故障诊断结果。
S3、基于训练后的所述故障诊断模型实现故障诊断。
当上述故障诊断模型构建好后,为了进一步保证故障诊断结果的精度,首先我们对上述构建的故障诊断模型进行训练后优化。具体的:
(1)故障诊断模型参数设置。实验采用Tesla V100深度学习平台,利用GPU加速训练,设置模型训练次数为100epochs,模型的优化器采用Adam,学习率为0.001,batchsize设置为128,损失函数采用交叉熵损失函数(Cross Entropy Loss),每组实验做10次,避免出现偶然性问题。
(2)模型训练、保存和测试。首先将S1中划分的训练集数据输入到基于多尺度残差注意力网络构建的故障诊断模型中,模型会按照batchsize大小分批处理输入数据,经过模型的训练,根据交叉熵损失函数的大小判断分类效果,由梯度反向传播原理进行模型参数更新,当训练次数达到100次,在此过程中,记录下每次模型分类的精确度,比较大小,保存最优模型。使用测试集数据进行测试,根据测试集精度指标以及损失大小来评价故障诊断模型分类效果的好坏。
(3)故障诊断分类。将测试集数据输入到训练好的基于多尺度残差注意力网络构建的故障诊断模型中,通过精确度、损失大小、混淆矩阵以及F1 scores等评价指标衡量模型分类的效果,当达到预期训练效果后,即可利用优化后的故障诊断模型进行船舶主动力设备的故障诊断。
至此,则完成了本实施例一种基于多尺度残差注意力网络的故障诊断方法的全部流程。
为了验证本实施例一种基于多尺度残差注意力网络的故障诊断方法在进行故障分类时的精度,发明人在凯斯西储大学的CWRU数据集上进行了测试,该数据集是10分类故障检测任务,通过本实施例提出的基于多尺度残差注意力网络的故障诊断模型进行预测分类,实验表明其分类准确度为100%,说明了该模型的有效性,能够应用到实际的高端装备的数据当中,并且通过高斯噪声进行仿真实际背景下的噪声,其结果也能到达97.50%的精确度(当SNR=-4时),说明该模型在信号含噪声的情况下,也能够达到很高故障诊断效果。
此外,将本实施例提出的基于多尺度残差注意力网络的故障诊断模型(Multiscale Residual Attention Network,MRANet)与经典的网络(如MolileNet、VGG、CNN、ResNet、transformer、Unet)进行参数量比较,其比较结果如下表1所示。
表1模型参数对比
模型 | MRANet | MobileNet | VGG | Unet |
参数量 | 10289 | 3215625 | 139357544 | 17302420 |
参见表1可知,本实施例基于多尺度残差注意力网络构建的故障诊断模型在有效提高模型分类精度的同时,参数量也极小,极大降低了训练成本和时间成本,节约了资源和时间成本。
实施例2:
第二方面,本发明还提供了一种基于多尺度残差注意力网络的故障诊断系统,该系统包括:
数据获取和处理模块,用于获取待进行故障诊断的设备的信号数据,并对所述信号数据进行预处理;
故障诊断模型获取模块,用于基于多尺度残差注意力网络构建故障诊断模型;所述多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块;其中,所述宽卷积模块包括用空洞卷积代替原有神经网络的小卷积核以提取所述信号数据的长时特征信息;所述多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积;所述残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支;
故障诊断模块,用于基于训练后的所述故障诊断模型实现故障诊断。
可选的,所述数据获取和处理模块进行预处理操作时包括利用滑动窗口技术对所述信号数据进行数据增强。
可选的,所述混合池化策略为对全局最大池化以及全局最小池化进行加权操作。
可选的,所述深度可分离卷积包括通道卷积和点卷积;所述通道卷积根据输入的通道维数决定卷积核的数量,提取与输入通道数相等数量的特征图;所述点卷积利用1x1的卷积核提取特征,卷积核数量设置为欲得到的特征图的数量。
可选的,所述故障诊断模型还包括:分类模块,所述分类模块用于故障诊断结果的分类和输出,且所述分类模块包括自适应平均池化模块和卷积模块。·
可理解的是,本发明实施例提供的基于多尺度残差注意力网络的故障诊断系统与上述基于多尺度残差注意力网络的故障诊断方法相对应,其有关内容的解释、举例、有益效果等部分可以参照基于多尺度残差注意力网络的故障诊断方法中的相应内容,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
1、本发明基于多尺度残差注意力网络构建故障诊断模型,并利用训练后的故障诊断模型进行装备的故障诊断;其中,多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块。本发明的故障诊断方法可以从多尺度角度提取设备信号数据中所隐含的特征,同时可以在一定程度上抑制设备信号数据中噪声信号的干扰,相比于传统的故障诊断技术,提高了故障诊断的精度和鲁棒性。
2、本发明利用多尺度卷积模块从多个尺度角度提取采集的设备相关数据中的隐藏特征,可以解决传统故障诊断模型仅仅从单一尺度提取故障信号特征而导致特征提取不足,从而致使故障诊断存在精确度低和鲁棒性差的问题。本发明的多尺度模块能够极大地提高故障诊断模型的分类精度,辅助提高了故障诊断整体的精度。
3、本发明中的残差注意力模块能够有效地关注船舶主动力设备等设备振动信号中的噪声信号,从而赋予重要信号更大的权重,赋予噪声信号更小的权重,有效提高了模型的抗噪能力和泛化性。
4、本发明提出的基于多尺度残差注意力网络构建故障诊断模型的参数量远远小于一些经典的网络,在有效提高模型分类精度的同时,极大降低了训练成本和时间成本,节约了资源和时间成本。
5、本发明在振动信号的数据量有限的情况下,基于滑动窗口技术(Slide Window)扩充训练集样本数量,对数据集进行扩充,通过数据增强的技术能够提高故障诊断的分类精度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于多尺度残差注意力网络的故障诊断方法,其特征在于,所述方法包括:
获取待进行故障诊断的设备的信号数据,并对所述信号数据进行预处理;
构建基于多尺度残差注意力网络的故障诊断模型;所述多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块;其中,所述宽卷积模块包括用空洞卷积代替原有神经网络的小卷积核以提取所述信号数据的长时特征信息;所述多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积;所述残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支;
基于训练后的所述故障诊断模型实现故障诊断。
2.如权利要求1所述的方法,其特征在于,所述预处理包括利用滑动窗口技术对所述信号数据进行数据增强。
3.如权利要求1所述的方法,其特征在于,所述混合池化策略为对全局最大池化以及全局最小池化进行加权操作。
4.如权利要求1所述的方法,其特征在于,所述深度可分离卷积包括通道卷积和点卷积;所述通道卷积根据输入的通道维数决定卷积核的数量,提取与输入通道数相等数量的特征图;所述点卷积利用1x1的卷积核提取特征,卷积核数量设置为欲得到的特征图的数量。
5.如权利要求1所述的方法,其特征在于,所述故障诊断模型还包括:分类模块,所述分类模块用于故障诊断结果的分类和输出,且所述分类模块包括自适应平均池化模块和卷积模块。
6.一种基于多尺度残差注意力网络的故障诊断系统,其特征在于,所述系统包括:
数据获取和处理模块,用于获取待进行故障诊断的设备的信号数据,并对所述信号数据进行预处理;
故障诊断模型获取模块,用于基于多尺度残差注意力网络构建故障诊断模型;所述多尺度残差注意力网络包括顺次连接的宽卷积模块、多尺度卷积模块,以及残差注意力模块;其中,所述宽卷积模块包括用空洞卷积代替原有神经网络的小卷积核以提取所述信号数据的长时特征信息;所述多尺度卷积模块包括在原有Res2block模块上使用软阈值函数作为残差分支,同时利用两个深度可分离卷积代替原有Res2block模块中每个分支的常规小卷积;所述残差注意力模块包括在CBAM注意力机制的通道注意力机制中增加混合池化策略,且将增加了混合池化策略的通道注意力机制和空间注意力机制的点乘结果作为第二残差连接分支,同时将所述残差注意力模块的输入直接作为第一残差连接分支;
故障诊断模块,用于基于训练后的所述故障诊断模型实现故障诊断。
7.如权利要求6所述的系统,其特征在于,所述数据获取和处理模块进行预处理操作时包括利用滑动窗口技术对所述信号数据进行数据增强。
8.如权利要求6所述的系统,其特征在于,所述混合池化策略为对全局最大池化以及全局最小池化进行加权操作。
9.如权利要求6所述的系统,其特征在于,所述深度可分离卷积包括通道卷积和点卷积;所述通道卷积根据输入的通道维数决定卷积核的数量,提取与输入通道数相等数量的特征图;所述点卷积利用1x1的卷积核提取特征,卷积核数量设置为欲得到的特征图的数量。
10.如权利要求6所述的系统,其特征在于,所述故障诊断模型还包括:分类模块,所述分类模块用于故障诊断结果的分类和输出,且所述分类模块包括自适应平均池化模块和卷积模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310296694.7A CN116595313A (zh) | 2023-03-23 | 2023-03-23 | 基于多尺度残差注意力网络的故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310296694.7A CN116595313A (zh) | 2023-03-23 | 2023-03-23 | 基于多尺度残差注意力网络的故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116595313A true CN116595313A (zh) | 2023-08-15 |
Family
ID=87597917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310296694.7A Pending CN116595313A (zh) | 2023-03-23 | 2023-03-23 | 基于多尺度残差注意力网络的故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116595313A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117332320A (zh) * | 2023-11-21 | 2024-01-02 | 浙江大学 | 一种基于残差卷积网络的多传感器融合pmsm故障诊断方法 |
-
2023
- 2023-03-23 CN CN202310296694.7A patent/CN116595313A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117332320A (zh) * | 2023-11-21 | 2024-01-02 | 浙江大学 | 一种基于残差卷积网络的多传感器融合pmsm故障诊断方法 |
CN117332320B (zh) * | 2023-11-21 | 2024-02-02 | 浙江大学 | 一种基于残差卷积网络的多传感器融合pmsm故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qian et al. | MobileNetV3 for image classification | |
CN113159051B (zh) | 一种基于边缘解耦的遥感图像轻量化语义分割方法 | |
CN108256482B (zh) | 一种基于卷积神经网络进行分布学习的人脸年龄估计方法 | |
CN112149316A (zh) | 基于改进的cnn模型的航空发动机剩余寿命预测方法 | |
CN110516305B (zh) | 基于注意机制元学习模型的小样本下故障智能诊断方法 | |
CN106980858A (zh) | 一种语言文本检测与定位系统及应用该系统的语言文本检测与定位方法 | |
CN109389171B (zh) | 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法 | |
CN105528638A (zh) | 灰色关联分析法确定卷积神经网络隐层特征图个数的方法 | |
CN112577748A (zh) | 基于强化的轻量级多尺度cnn的滚动轴承故障诊断方法 | |
CN113705424A (zh) | 基于时间卷积降噪网络的演艺装备故障诊断模型构建方法 | |
CN116595313A (zh) | 基于多尺度残差注意力网络的故障诊断方法及系统 | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN114091539A (zh) | 一种多模态深度学习的滚动轴承故障诊断方法 | |
CN112859012A (zh) | 一种基于级联卷积神经网络的雷达欺骗干扰识别方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN114882497A (zh) | 一种基于深度学习算法实现水果分类识别的方法 | |
CN112146880B (zh) | 一种对不同转速下滚动轴承内部结构故障的智能化诊断方法 | |
CN117290771A (zh) | 基于改进辅助分类生成对抗网络的旋转机械故障诊断方法 | |
CN117633588A (zh) | 基于频谱加权和残差卷积神经网络的管道泄漏定位方法 | |
CN111983569A (zh) | 基于神经网络的雷达干扰抑制方法 | |
CN116611580A (zh) | 一种基于多源数据与深度学习的海洋赤潮预测方法 | |
CN116662872A (zh) | 汽车面板精整线轴承类机械故障诊断方法 | |
CN116206203A (zh) | 基于SAR与Dual-EndNet的溢油检测方法 | |
CN114898775B (zh) | 一种基于跨层交叉融合的语音情绪识别方法及系统 | |
CN116451131A (zh) | 一种基于自监督时间卷积网络的雷达脉冲序列识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |