CN116467577A - 基于mtf和改进密集连接网络的风机齿轮箱故障诊断方法 - Google Patents
基于mtf和改进密集连接网络的风机齿轮箱故障诊断方法 Download PDFInfo
- Publication number
- CN116467577A CN116467577A CN202310307368.1A CN202310307368A CN116467577A CN 116467577 A CN116467577 A CN 116467577A CN 202310307368 A CN202310307368 A CN 202310307368A CN 116467577 A CN116467577 A CN 116467577A
- Authority
- CN
- China
- Prior art keywords
- mtf
- gear box
- connection network
- fault
- fault diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000007704 transition Effects 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 230000001133 acceleration Effects 0.000 claims abstract description 5
- 238000011176 pooling Methods 0.000 claims description 43
- 230000006870 function Effects 0.000 claims description 39
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000010586 diagram Methods 0.000 claims description 20
- 230000007246 mechanism Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 13
- 238000013508 migration Methods 0.000 claims description 11
- 230000005012 migration Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 230000009901 attention process Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000009412 basement excavation Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/021—Gearings
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/028—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/70—Wind energy
- Y02E10/72—Wind turbines with rotation axis in wind direction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,包括了以下步骤:利用安装在齿轮箱上的加速度传感器采集齿轮箱不同故障类型采集的故障振动信号数据;采用马尔可夫变迁场原理将采集的一维故障振动信号转化为二维特征图谱;将MTF二维图谱作为输入,故障种类作为输出训练改进密集连接网络模型;最终可以得到风机齿轮箱的智能故障诊断模型,可利用该模型输入实时采集的振动信号进行故障诊断和识别。本发明使用MTF二维图谱作为神经网络的输入,同时采用改进密集连接网络,在强噪声信号下可以自适应识别重要特征,实现风机齿轮箱的精准故障识别。
Description
技术领域
本发明涉及风电机组齿轮箱健康状态监测技术领域,具体涉及一种基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法。
背景技术
风电机组由于长期工作在诸如极端温度、暴雨、暴雪、盐雾等环境下,随着运行时间的增加,叶片、主轴承、齿轮箱、发电机及其他部件的疲劳强度、运行性能等不断下降,引起异常和故障,导致风机不正常运行甚至停机。针对故障部件进行分析,风机齿轮箱在所有故障部件所占比例最高,因此对风机齿轮箱建立故障诊断模型十分重要。
一般针对旋转部件常采用振动信号做为信号源进行故障的分析,在信号采集过程中参杂了强噪音信号,信号本身有具有非线性以及非平稳性的特点,给故障诊断带来了挑战。同时,风电机组由加速度传感器采集的一般为正常状态的振动信号,而故障信号采集样例较少,使得故障诊断模型训练带来了困难。而深度学习技术的发展为这种复杂问题的解决带了解决方案,深度学习的自适应特征学习能力,以及自身深度网络的特殊架构使得其具有更复杂的深层映射挖掘与表达能力,为复杂故障诊断问题提供了新的思路和解决方案。
发明内容
本发明所要解决的技术问题是提供一种基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,利用MTF进行齿轮箱故障类型的信号采集并通过改进型密集连接网络得到风机齿轮箱的智能故障诊断模型,以此模型对齿轮箱的健康状况进行诊断。
为解决上述技术问题,本发明所采用的技术方案是:
基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,故障诊断的步骤为:
Step1、利用安装在齿轮箱上的加速度传感器采集齿轮箱不同故障类型的故障振动信号数据;
Step2、采用MTF模型将Step1中采集的一维故障振动信号转化为二维特征图谱;Step3、将Step2中得到的MTF二维图谱作为输入,故障种类作为输出,训练改进型密集连接网络模型,得到风机齿轮箱的智能故障诊断模型,利用该模型输入实时采集的振动信号进行故障诊断和识别。
上述的Step2中,采用MTF模型将一维故障振动信号转化为二维特征图谱的具体过程为:
将一维振动信号分为L个区域,任意区域上的信号可以映射到对应子域上,定义一个矩阵R使之表示在所有子域中一个子域信号被另一个子域信号跟随的概率,通过计算每个元素的跟随概率矩阵就可以进一步得出迁移概率矩阵T,通过注入时间戳信息,将时间序列与迁移概率矩阵结合,得出MTF矩阵,最后将矩阵元素作为像素输出,完成MTF转换的整个过程。
上述的Step3中,改进型密集连接网络模型在构造中引入注意力机制,通过对特征重用,将深层特征图的特征与浅层特征图进行拼接,最大化的利用样本特征信息,并引入CMAM注意力模块,通过对特征图整体特征信息与局部特征信息的自适应调整以及特征图之间的深层映射关系进行挖掘构造改进型密集连接网络。
上述的CMAM注意力模块分为空间注意力以及通道注意力,注意过程可以概括为:
式中,F为输入特征图,F′为经过通道注意力机制后的输出,F″为经过空间注意力机制后的输出;表示element-wise乘法;
其中,通道注意力机制可以表达为:
其中,Mc(F)为中间特征F的通道注意力权重系数,σ表示sigmoid函数,AvgPool为平均池化,MaxPool为最大池化,W0∈RC/r×C、W1∈RC×C/r代表多层感知机(MLP)权重系数,对于输入是共享的,和/>分别表示通道注意力模块中经平均值池化和最大值池化操作后的特征图;
空间注意力可表达为:
其中,Ms(F)为中间特征F的通道注意力权重系数,AvgPool为平均池化,MaxPool为最大池化,σ表示sigmoid函数,f7×7为7×7大小的卷积核,和/>分别表示空间注意力模块中经平均值池化和最大值池化操作后的特征图。
上述的改进型密集连接网络模型由四个改进密集块和过渡层构成,网络架构由四个不同深度的改进密集块构成,第一个密集块有6个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
第二个密集块有12个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
第三个个密集块有24个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;第四个密集块有16个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
四个密集块采用密集连接的方式,两个密集连接块之间嵌入过渡层,过渡层采用BN-ReLU-Conv(1×1)-avgpool(2×2)结构,在第四个密集块后,采用一个7×7的全局池化层与全连接层实现故障分类。
上述的通道注意力共享的多层神经网络MLP激活函数采用sigmoid函数,其计算公式为:
其中x为输入,f(x)为输出。
上述的四个密集块中每个卷积核后和过渡层所使用的激活函数均采用Relu激活函数,其计算公式为:
f(x)=max(0,x)
其中x为输入,f(x)为输出。
上述的全连接层损失函数采用交叉熵损失函数,其计算公式为:
其中p(xi)和q(xi)分别表示真实概率分布与预测概率分布,H(p,q)表示预测值和真实值的差距。
交叉熵损失函数搭配softmax分类器使用,在全连接层将输出的结果进行处理,使其多个分类的预测值和为1,再通过交叉熵来计算损失,其中,softmax函数计算公式为:
其中xi为模型上一层的输出,作为softmax分类器的输入;输出计算结果Softmax(x)可视为预测结果为真实结果的置信度。
本发明提供的一种基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,具有如下有益效果:
1、基于现有方法直接将故障信号的一维时间序列信号输入神经网络中,没有深度挖掘CNN网络对于图像信号的强大分析能力,采用马尔科夫变迁场(MTF)将一维时间序列转化为二维MTF特征图谱,并且较好的保留了振动信号的时间信息,有利于深度神经网络的特征分析。
2、针对风机齿轮箱故障振动信号被强噪音干扰和非线性的特点,同时兼顾故障样本少的缺陷,提出双重注意力机制,在密集连接网络特征重用的基础上改进了密集块的架构,通过通道注意力机制与时间注意力机制抑制噪声对模型的干扰,提高有用特征的权重,实现了风机齿轮箱的高精度故障诊断。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为本发明整体流程示意图;
图2为本发明实施例一维时序信号通过马尔科夫变迁场转换为二维MTF特征图谱的具体过程。
具体实施方式
以下结合附图和实施例详细说明本发明技术方案。
如图1中所示,基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,故障诊断的步骤为:
Step1、利用安装在齿轮箱上的加速度传感器采集齿轮箱不同故障类型的故障振动信号数据,此数据可从风机CMS系统收集获得;
Step2、采用MTF模型将Step1中采集的一维故障振动信号转化为二维特征图谱;Step3、将Step2中得到的MTF二维图谱作为输入,故障种类作为输出,训练改进型密集连接网络模型,得到风机齿轮箱的智能故障诊断模型,利用该模型输入实时采集的振动信号进行故障诊断和识别。
上述的Step1中,在振动信号提取与原始数据集构建方面,至少取正常振动信号、齿轮箱轴承外圈故障振动信号、齿轮箱轴承内圈故障振动信号,断齿状态下的故障振动信号、点蚀状态下的故障振动信号以及磨损状态下的故障振动信号六种状态下的故障振动信号构成数据集,并采用独热编码的形式对数据集分类标签进行标号,方便后期采用softmax分类器进行故障诊断类型的分类。
上述的Step2中,采用MTF模型将一维故障振动信号转化为二维特征图谱的具体过程为:
将一维振动信号分为L个区域,任意区域上的信号可以映射到对应子域上,定义一个矩阵R使之表示在所有子域中一个子域信号被另一个子域信号跟随的概率,矩阵R的概率公式如下:
ri,j=P(xi∈li丨xi-1∈lj) ; (1)
式中,ri,j为一个子域信号被另一个子域信号跟随的概率,xi、xi51表示两个不同的子域信号;P为映射关系。
其中且ri,j≥0;(2)
通过计算每个元素的跟随概率矩阵就可以进一步得出迁移概率矩阵T,迁移概率矩阵T如下所示:
通过注入时间戳信息,将时间序列与迁移概率矩阵结合,得出MTF矩阵M,矩阵M公式如下:
其中
式(5)中mij表示li向lj发生状态转变的转移概率,即通过考虑时间位置,将包含振幅的幅度值轴上的概率迁移矩阵R扩展到了包含时间轴(时间戳)的M矩阵,其本质是计算了原始振动信号X多步状态转换的多跨度概率迁移矩阵,是一步概率迁移矩阵到多步概率迁移矩阵的拓展。
最后,将M矩阵中的元素对应灰度值匹配到图像像素的一点,将一维包含时间信息的振动信号转化为二维可视化的特征图谱中,完成MTF转换的整个过程,整体MTF特征图谱的构建流程如图2所示。
上述的Step3中,改进型密集连接网络模型的构建中,应按如下步骤实施:Step3.1、将二维MTF特征图谱作为改进密集连接网络的输入;
Step3.2、在网络系统架构中,密集连接网络中密集块采用跨层连接的方式,同时不同层输出特征图采用拼接的方式进行合并,共同进入下一层的输入中,实现了引入从任何层到所有后续层的直接连接。xl表示的是第l层的输出,第l层接收到的是前面l-1层的特征映射[x0,x1,……,xl-1]指的是从第0层到第l-1层中产生的特征映射的连接:
Xl=Hl([x0,x1,...,xl-1])
将H(.)定义为三个连续操作的复合函数:批处理归一化(BN)、校正线性单元(ReLU)、3×3卷积(Conv);因此,相较于传统连接方式有L个连接,密集连接网络则具有个直接的连接;在改进密集连接网络中,密集连接网络一个重要部分是改变特征映射大小的下采样层,为了便于在我们的架构中进行下采样,将网络划分为多个密集连接的密集块,我们将块之间的层设为过渡层,它可以进行卷积和池化,使用的过渡层包括批处理归一化BN层、1×1卷积层和2×2平均池化层;
Step3.3、超参数初始化中,包含批大小,学习率、增长率;最重要的是超参数增长率的设置;如果每个函数H产生k个特征图,那么第l层有k0+k×(l-1)个输入特征图,其中k0是输入层的通道数;每个层都可以访问其块中的所有前面的特征映射,因此,也可以访问网络的“集体知识”;人们可以将特征映射视为网络的全局状态;每一层都添加了k个自己的特征映射,增长率调节了每一层对全局状态贡献的新信息;全局状态一旦被写入,就可以从网络内的任何地方进行访问,而且与传统的网络架构不同,它不需要逐层复制它;虽然每一层只产生k个输出特性映射,但它通常有更多的输入;在每次3×3卷积之前,可以引入1×1卷积作为瓶颈层,以减少输入特征图的数量,既能降维减少计算量,又能融合各个通道的特征,从而提高计算效率;从而H函数的设置为BN-ReLU-Conv(1×1)-BN-ReLU-Conv(3×3)架构;
Step3.4、优选地,为了压缩模型,提高计算效率,可以减少过渡层上的特征映射的数量;如果一个密集块包含m个特征映射,我们让下面的过渡层生成θm个输出特征图,其中0<θ≤1为压缩因子,在改进密集连接网络中可以同时使用θ=0.5的瓶颈层和过渡层;
Step3.5、进一步地,为了让模型拥有更好的抗噪性能和重要特征自适应学习能力,改进型密集连接网络模型在构造中引入注意力机制,CBAM注意力机制模块是一种用于前馈卷积神经网络的简单而有效的注意力模块,其将注意力映射沿特征图的通道与空间两个独立维度进行注入,是一种结合了通道和空间的双重注意力机制模块;
通过对特征重用,将深层特征图的特征与浅层特征图进行拼接,最大化的利用样本特征信息,并引入CMAM注意力模块,通过对特征图整体特征信息与局部特征信息的自适应调整以及特征图之间的深层映射关系进行挖掘构造改进型密集连接网络。
上述的CMAM注意力模块分为空间注意力以及通道注意力,假设输入特征图为:F∈RC×H×W,利用CBAM模块依次推导出一维通道注意图:Mc∈RC×1×1和二维空间注意图:Ms∈R1 ×H×W;总的注意过程可以概括为:
式中,F为输入特征图,F′为经过通道注意力机制后的输出,F″为经过空间注意力机制后的输出;表示element-wise乘法;
在乘法过程中,注意力值会被相应地广播或复制:通道注意力值会沿着空间维度进行广播,反之亦然;
相比于SE-Net只关注通道注意力机制可以取得更好的结果;卷积层输出的结果,会先通过一个通道注意力模块,得到加权结果之后,会再经过一个空间注意力模块,最终进行加权得到结果;特征图经过通道注意力模块时,通道维度不变,压缩空间维度,该模块关注输入图片中有意义的信息;而经过空间注意力模块时,空间维度不变,压缩通道维度,该模块关注的是目标的位置信息;
通道注意力机制为了有效地计算通道注意力,采用压缩输入特征映射的空间维度的方法,将特征图在空间维度的压缩,得到一个一维矢量之后在进行下一步的处理在空间维度上进行压缩时,不仅考虑到了平均值池化还考虑了最大值池化;平均值池化和最大值池化可用来聚合特征映射的空间信息,送到一个共享多层神经网络,压缩输入特征图的空间维数,逐元素求和合并,以产生通道注意力图;由于特征图的每个通道都被认为是一个特定特征的检测捕捉器,因此基于通道的注意力集中在给定输入图像的“什么”是有意义的;
通道注意力机制可以表达为:
其中,Mc(F)为中间特征F的通道注意力权重系数,σ表示sigmoid函数,AvgPool为平均池化,MaxPool为最大池化,W0∈RC/r×C、W1∈RC×C/r代表多层感知机(MLP)权重系数,对于输入是共享的,和/>分别表示通道注意力模块中经平均值池化和最大值池化操作后的特征图;
具体过程为输入特征图F,经过两个并行的最大值池化和平均值池化将C×H×W的特征图变成C×1×1的大小,然后经过一个共享的多层感知机(MLP)结构(卷积层/线性层,Relu激活函数,卷积层/线性层),第一层神经元个数为C/r(r为减少率,超参数之一,一般设为16),激活函数为Relu函数,将通道数压缩为C/r,第二层神经元个数为C,将通道数再扩张回原通道数C,得到两个激活后的结果,将多层感知机(MLP)输出的特征进行基于element-wise的加和操作(将这两个输出结果进行逐元素相加),再接一个sigmoid激活函数得到输出Mc(F)∈RC×1×1(即为通道注意力最终输出结果F′),输出F′再进行基于element-wise的乘法操作乘以最初的输入F,特征图大小变回了C×H×W,完成通道注意力操作,同时生成空间注意力模块需要的输入特征。
与通道注意力模块不同的是,空间注意力模块关注的是信息部分“在哪里”,作为通道注意的补充,利用特征间的空间关系生成空间注意图,其设计理念与通道注意力分支是对称的;为了计算空间注意力,首先沿通道轴应用平均值池化和最大值池化操作,并将它们连起来以生成一个有效的特征描述符,即每个都表示整个通道的平均池化特征和最大池化特征,在所有空间位置上对每个像素的通道信息进行编码。最大池化的操作就是在通道上提取最大值,提取的次数是H×W;平均池化的操作就是在通道上提取平均值,提取的次数也是H×W;从而可以获得一个2通道的特征图Fs avg∈R1×H×W和Fs max∈R1×H×W,每个都表示通道的平均池化特性和最大池化特性,然后利用一个标准的卷积层进行连接和卷积操作,得到二维空间注意力图;
空间注意力可表达为:
其中,Ms(F)为中间特征F的通道注意力权重系数,AvgPool为平均池化,MaxPool为最大池化,σ表示sigmoid函数,f7×7为7×7大小的卷积核,和/>分别表示空间注意力模块中经平均值池化和最大值池化操作后的特征图。
具体过程为将通道注意力模块输出的特征图F′作为本模块的输入特征图;首先做一个基于通道的全局最大值池化和全局平均值池化,得到两H×W×1的特征图,然后将这2个特征图基于通道做Concat操作(通道拼接);然后经过一个7×7卷积操作,降维为1个通道数,即H×W×1。再经过sigmoid激活函数生成空间注意力特征图,即Ms(F);最后将该特征图和该模块的输入特征图做基于element-wise的乘法操作,得到最终生成的特征,大小为C×H×W。
由此,CBAM双重注意力模块构建完成。
将双重注意力模块与密集连接网络结合,改进的密集连接网络的密集块中在每一层3×3卷积后再搭建一层CBAM块,并由此结构改进密集连接网络的密集块结构。
上述的改进型密集连接网络模型由四个改进密集块和过渡层构成,网络架构由四个不同深度的改进密集块构成,第一个密集块有6个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
第二个密集块有12个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;第三个个密集块有24个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;第四个密集块有16个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
四个密集块采用密集连接的方式,两个密集连接块之间嵌入过渡层,过渡层采用BN-ReLU-Conv(1×1)-avgpool(2×2)结构,在第四个密集块后,采用一个7×7的全局池化层与全连接层实现故障分类。
上述的Step3中,将训练集输入搭建好的改进密集连接网络进行训练;设置超参数批大小为128,梯度下降优化算法采用adam随即优化算法:学习率α设置为0.001,一阶矩估计衰减系数β1设置为0.9,二阶矩估计衰减系数β2设置为0.999,平滑项ε设置为1e58,具体迭代公式为:
mt=β1mt-1+(1-β1)gt
其中,t为训练次数;mt和vt分别是对梯度的一阶矩估计和二阶矩估计,可以看作是对期望E[gt]、E[gt 2]的近似;gt为对应每个参数θ计算出的梯度值;和/>是对mt和vt的矫正,这样可以近似为对期望的无偏估计;为防止分母为0,设施平滑项ε。
上述的通道注意力共享的多层神经网络MLP激活函数采用sigmoid函数,其计算公式为:
其中x为输入,f(x)为输出。
上述的四个密集块中每个卷积核后和过渡层所使用的激活函数均采用Relu激活函数,其计算公式为:
f(x)=max(0,x)
其中x为输入,f(x)为输出。
全连接层损失函数采用交叉熵损失函数:
其中p(xi)和q(xi)分别表示真实概率分布与预测概率分布,H(p,q)表示预测值和真实值的差距。
交叉熵损失函数搭配softmax分类器使用,在全连接层将输出的结果进行处理,使其多个分类的预测值和为1,再通过交叉熵来计算损失,其中,softmax函数计算公式为:
其中xi为模型上一层的输出,作为softmax分类器的输入;输出计算结果Softmax(x)可视为预测结果为真实结果的置信度。
当损失函数收敛后完成风机齿轮箱故障诊断模型的建立。可实时对输入的振动信号进行故障的判别。
Claims (8)
1.基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,故障诊断的步骤为:
Step1、利用安装在齿轮箱上的加速度传感器采集齿轮箱不同故障类型的故障振动信号数据;
Step2、采用MTF模型将Step1中采集的一维故障振动信号转化为二维特征图谱;Step3、将Step2中得到的MTF二维图谱作为输入,故障种类作为输出,训练改进型密集连接网络模型,得到风机齿轮箱的智能故障诊断模型,利用该模型输入实时采集的振动信号进行故障诊断和识别。
2.根据权利要求1所述的基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,所述的Step2中,采用MTF模型将一维故障振动信号转化为二维特征图谱的具体过程为:
将一维振动信号分为L个区域,任意区域上的信号可以映射到对应子域上,定义一个矩阵R使之表示在所有子域中一个子域信号被另一个子域信号跟随的概率,通过计算每个元素的跟随概率矩阵就可以进一步得出迁移概率矩阵T,通过注入时间戳信息,将时间序列与迁移概率矩阵结合,得出MTF矩阵,最后将矩阵元素作为像素输出,完成MTF转换的整个过程。
3.根据权利要求1所述的基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,所述的Step3中,改进型密集连接网络模型在构造中引入注意力机制,通过对特征重用,将深层特征图的特征与浅层特征图进行拼接,最大化的利用样本特征信息,并引入CMAM注意力模块,通过对特征图整体特征信息与局部特征信息的自适应调整以及特征图之间的深层映射关系进行挖掘构造改进型密集连接网络。
4.根据权利要求3所述的基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,所述的CMAM注意力模块分为空间注意力以及通道注意力,注意过程可以概括为:
式中,F为输入特征图,F′为经过通道注意力机制后的输出,F″为经过空间注意力机制后的输出;表示element-wise乘法;
其中,通道注意力机制可以表达为:
其中,Mc(F)为中间特征F的通道注意力权重系数,σ表示sigmoid函数,AvgPool为平均池化,MaxPool为最大池化,W0∈RC/r×C、W1∈RC×C/r代表多层感知机(MLP)权重系数,对于输入是共享的,和/>分别表示通道注意力模块中经平均值池化和最大值池化操作后的特征图;
空间注意力可表达为:
其中,Ms(F)为中间特征F的通道注意力权重系数,AvgPool为平均池化,MaxPool为最大池化,σ表示sigmoid函数,f7×7为7×7大小的卷积核,和/>分别表示空间注意力模块中经平均值池化和最大值池化操作后的特征图。
5.根据权利要求3所述的基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,所述的改进型密集连接网络模型由四个改进密集块和过渡层构成,网络架构由四个不同深度的改进密集块构成,第一个密集块有6个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
第二个密集块有12个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
第三个个密集块有24个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;第四个密集块有16个1×1卷积核、3×3卷积核和CBAM模块堆叠结构构成;
四个密集块采用密集连接的方式,两个密集连接块之间嵌入过渡层,过渡层采用BN-ReLU-Conv(1×1)-avgpool(2×2)结构,在第四个密集块后,采用一个7×7的全局池化层与全连接层实现故障分类。
6.根据权利要求4所述的基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,所述的通道注意力共享的多层神经网络MLP激活函数采用sigmoid函数,其计算公式为:
其中x为输入,f(x)为输出。
7.根据权利要求5所述的基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,所述的四个密集块中每个卷积核后和过渡层所使用的激活函数均采用Relu激活函数,其计算公式为:
f(x)=max(0,x);
其中x为输入,f(x)为输出。
8.根据权利要求5所述的基于MTF和改进密集连接网络的风机齿轮箱故障诊断方法,其特征在于,所述的全连接层损失函数采用交叉熵损失函数,其计算公式为:
其中p(xi)和5(xi)分别表示真实概率分布与预测概率分布,H(p,5)表示预测值和真实值的差距。
交叉熵损失函数搭配softmax分类器使用,在全连接层将输出的结果进行处理,使其多个分类的预测值和为1,再通过交叉熵来计算损失,其中,softmax函数计算公式为:
其中xi为模型上一层的输出,作为softmax分类器的输入;输出计算结果Softmax(x)可视为预测结果为真实结果的置信度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310307368.1A CN116467577A (zh) | 2023-03-27 | 2023-03-27 | 基于mtf和改进密集连接网络的风机齿轮箱故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310307368.1A CN116467577A (zh) | 2023-03-27 | 2023-03-27 | 基于mtf和改进密集连接网络的风机齿轮箱故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116467577A true CN116467577A (zh) | 2023-07-21 |
Family
ID=87172692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310307368.1A Pending CN116467577A (zh) | 2023-03-27 | 2023-03-27 | 基于mtf和改进密集连接网络的风机齿轮箱故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116467577A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116858541A (zh) * | 2023-09-01 | 2023-10-10 | 湖南科技大学 | 基于密集特征重用的轴承早期故障诊断方法及系统 |
CN117251680A (zh) * | 2023-10-09 | 2023-12-19 | 石家庄铁道大学 | 轴承故障诊断网络 |
-
2023
- 2023-03-27 CN CN202310307368.1A patent/CN116467577A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116858541A (zh) * | 2023-09-01 | 2023-10-10 | 湖南科技大学 | 基于密集特征重用的轴承早期故障诊断方法及系统 |
CN116858541B (zh) * | 2023-09-01 | 2023-12-01 | 湖南科技大学 | 基于密集特征重用的轴承早期故障诊断方法及系统 |
CN117251680A (zh) * | 2023-10-09 | 2023-12-19 | 石家庄铁道大学 | 轴承故障诊断网络 |
CN117251680B (zh) * | 2023-10-09 | 2024-05-07 | 石家庄铁道大学 | 轴承故障诊断网络 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Intelligent fault diagnosis of rolling bearings under imbalanced data conditions using attention-based deep learning method | |
Xia et al. | Fault diagnosis for rotating machinery using multiple sensors and convolutional neural networks | |
CN113191215B (zh) | 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法 | |
CN116467577A (zh) | 基于mtf和改进密集连接网络的风机齿轮箱故障诊断方法 | |
CN114926746B (zh) | 基于多尺度差分特征注意力机制的sar图像变化检测方法 | |
CN114755745B (zh) | 基于多通道深度残差收缩网络的冰雹天气识别与分类方法 | |
Cao et al. | Domain-adaptive intelligence for fault diagnosis based on deep transfer learning from scientific test rigs to industrial applications | |
CN114972213A (zh) | 一种基于机器视觉的两阶段主板图像缺陷检测及定位方法 | |
CN110022422B (zh) | 一种基于密集连接网络的视频帧序列生成方法 | |
CN114548190B (zh) | 一种基于自适应残差神经网络的风力涡轮机故障诊断方法及装置 | |
CN115508073B (zh) | 基于多尺度注意力的原型适配机械设备故障诊断方法 | |
CN113639993B (zh) | 多模态多任务卷积神经网络的齿轮箱故障诊断方法 | |
CN113935249B (zh) | 基于压缩和激励网络的上层海洋热结构反演方法 | |
CN116010900A (zh) | 基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法 | |
Yu et al. | Remaining useful life prediction of planet bearings based on conditional deep recurrent generative adversarial network and action discovery | |
CN114580288A (zh) | 一种基于dsecjan的智能故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN113361803A (zh) | 基于生成对抗网络的超短期光伏功率预测方法 | |
CN111275751B (zh) | 一种无监督绝对尺度计算方法及系统 | |
CN117233870A (zh) | 一种基于多气象要素的短临降水集合预报及降尺度方法 | |
CN112149355A (zh) | 基于半监督动态反馈堆栈降噪自编码器模型的软测量方法 | |
CN117009916A (zh) | 基于多传感器信息融合与迁移学习的促动器故障诊断方法 | |
Li et al. | A robust fault diagnosis method for rolling bearings based on deep convolutional neural network | |
Han et al. | Online aware synapse weighted autoencoder for recovering random missing data in wastewater treatment process | |
Jia et al. | Rolling bearing fault classification based on stacked denoising auto encoders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |