CN116994041A - 一种基于滑窗处理与注意力机制的故障诊断方法及装置 - Google Patents
一种基于滑窗处理与注意力机制的故障诊断方法及装置 Download PDFInfo
- Publication number
- CN116994041A CN116994041A CN202310863439.6A CN202310863439A CN116994041A CN 116994041 A CN116994041 A CN 116994041A CN 202310863439 A CN202310863439 A CN 202310863439A CN 116994041 A CN116994041 A CN 116994041A
- Authority
- CN
- China
- Prior art keywords
- attention mechanism
- fault diagnosis
- module
- mechanism module
- diagnosis model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007246 mechanism Effects 0.000 title claims abstract description 211
- 238000003745 diagnosis Methods 0.000 title claims abstract description 120
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 title claims abstract description 34
- 238000010586 diagram Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 29
- 239000013598 vector Substances 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 22
- 230000004927 fusion Effects 0.000 claims description 21
- 230000009466 transformation Effects 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 description 12
- 230000001419 dependent effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/62—Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于滑窗处理与注意力机制的故障诊断方法及装置,所述方法包括:构建故障诊断模型,将多传感器数据输入故障诊断模型,基于滑窗处理从属性维和时序维对多维时序数据进行融合以获得输出特征图;将输出特征图分别输入到多种不同的注意力机制模块中;训练故障诊断模型,得到训练好的故障诊断模型;将实时采集的多传感器数据输入训练好的故障诊断模型,进行故障诊断;本发明的优点在于:故障诊断结果较为准确。
Description
技术领域
本发明涉及工业系统/机器的故障诊断技术领域,具体涉及一种基于滑窗处理与注意力机制的故障诊断方法及装置。
背景技术
故障诊断是保障工业活动稳定运行的一项重要技术。近几年来,随着传感器设备在工业场景的广泛部署,工业系统/机器的多源运行数据能够被快速且方便地收集,这促进了数据驱动的故障诊断方法在学术界和工业界的研究和开发。特别地,相比于基于统计分析、浅层机器学习等传统数据驱动方法,基于深度学习的方法极大地提高了故障诊断的性能。
中国专利公开号CN112861443A公开了一种融入先验知识的深度学习故障诊断方法,其通过先验知识的融入,一方面使得深度学习技术能够有针对性地从数据中提取特征,从而使其适用于小数量的故障诊断,另一方面使得深度学习的可解释性增高,从而使其适用于可靠性要求较高的故障诊断。但是上述深度学习方法还存在以下两个技术问题:
1、多源数据融合问题:多传感器收集到的多源数据为深度学习方法的训练提供了数据基础。如何有效融合多源数据中的信息,为深度学习方法训练提供充足且有效的大数据来源;是故障诊断领域面临的一个重要技术问题。
2、多源数据挖掘问题:与单传感器数据相比,融合多传感器的多源数据蕴含着更多维的依赖信息。现有的深度学习方法难以有效挖掘这些多维依赖信息,因此进一步改进现有深度学习方法实现多源数据挖掘是故障诊断领域面临的另一个重要技术问题。
发明内容
本发明所要解决的技术问题在于现有技术基于深度学习的故障诊断方法难以实现多源数据融合以及多源数据挖掘,从而提取的特征不够完善不够准确,导致最终故障诊断结果不够精准。
本发明通过以下技术手段解决上述技术问题的:一种基于滑窗处理与注意力机制的故障诊断方法,所述方法包括:
步骤a:构建故障诊断模型,将多传感器数据输入故障诊断模型,基于滑窗处理从属性维和时序维对多维时序数据进行融合以获得输出特征图;将输出特征图分别输入到多种不同的注意力机制模块中,不同注意力机制模块的权重向量对输出特征图加权得到最终的特征图;
步骤b:调整故障诊断模型的参数,训练故障诊断模型,直到损失函数最小或者达到预设训练轮次时停止训练,得到训练好的故障诊断模型;
步骤c:将实时采集的多传感器数据输入训练好的故障诊断模型,进行故障诊断。
进一步地,所述步骤a包括:
所述故障诊断模型包括第一卷积模块、通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块,所述第一卷积模块接收多传感器数据,第一卷积模块的输出形成输出特征图,输出特征图分别输入到通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块中,通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块分别对第二卷积模块的输出进行加权融合,形成最终的特征图。
更进一步地,所述故障诊断模型还包括第二属性注意力机制模块和第二时间注意力机制模块,第二属性注意力机制模块、第二时间注意力机制模块、第一卷积模块分别接收多传感器数据,第二属性注意力机制模块、第二时间注意力机制模块分别对第一卷积模块的输出进行加权融合,形成输出特征图。
更进一步地,所述第一卷积模块接收多传感器数据之前还包括:
多传感器数据是M维时序数据,对多传感器数据进行滑窗处理,将M维时序数据转换为类图片数据集,类图片数据集作为故障诊断模型的输入量。
更进一步地,所述故障诊断模型中不同注意力机制模块的权重向量的获取方式为:
将输入到不同注意力机制模块的输出特征图进行展平,得到一个一维向量X,通过公式y=s(AX+b)进行非线性变换,其中,y是非线性变换后的向量,A是可学习参数,b是偏置项,s()是任意一种激活函数;
通过公式W=sigmoid(y)获取权重向量,其中,sigmoid()为归一化函数。
更进一步地,所述通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块分别对第二卷积模块的输出进行加权融合,包括:
通道注意力机制模块、第一属性注意力机制模块及第一时间注意力机制模块的权重向量分别为W1、W2、W3,通过公式对第二卷积模块的输出进行加权融合,其中,Fou表示第二卷积模块的输出,/>代表属性方向的逐像素相乘,/>代表时序方向的逐像素相乘,/>代表通道方向的逐像素相乘。
进一步地,所述步骤b中采用故障诊断模型预测的故障概率与实际故障概率之差平方的期望值作为损失函数,其中,实际故障概率在发生故障的时候值为1,不发生故障的时候值为0。
进一步地,所述步骤b中采用Adam学习算法训练故障诊断模型。
本发明还提供一种基于滑窗处理与注意力机制的故障诊断系统,所述系统包括:
模型构建部,用于构建故障诊断模型,将多传感器数据输入故障诊断模型,基于滑窗处理从属性维和时序维对多维时序数据进行融合以获得输出特征图;将输出特征图分别输入到多种不同的注意力机制模块中,不同注意力机制模块的权重向量对输出特征图加权得到最终的特征图;
模型训练部,用于调整故障诊断模型的参数,训练故障诊断模型,直到损失函数最小或者达到预设训练轮次时停止训练,得到训练好的故障诊断模型;
故障诊断部,用于将实时采集的多传感器数据输入训练好的故障诊断模型,进行故障诊断。
进一步地,所述模型构建部还用于:
所述故障诊断模型包括第一卷积模块、通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块,所述第一卷积模块接收多传感器数据,第一卷积模块的输出形成输出特征图,输出特征图分别输入到通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块中,通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块分别对第二卷积模块的输出进行加权融合,形成最终的特征图。
更进一步地,所述故障诊断模型还包括第二属性注意力机制模块和第二时间注意力机制模块,第二属性注意力机制模块、第二时间注意力机制模块、第一卷积模块分别接收多传感器数据,第二属性注意力机制模块、第二时间注意力机制模块分别对第一卷积模块的输出进行加权融合,形成输出特征图。
更进一步地,所述第一卷积模块接收多传感器数据之前还包括:
多传感器数据是M维时序数据,对多传感器数据进行滑窗处理,将M维时序数据转换为类图片数据集,类图片数据集作为故障诊断模型的输入量。
更进一步地,所述故障诊断模型中不同注意力机制模块的权重向量的获取方式为:
将输入到不同注意力机制模块的输出特征图进行展平,得到一个一维向量X,通过公式y=s(AX+b)进行非线性变换,其中,y是非线性变换后的向量,A是可学习参数,b是偏置项,s()是任意一种激活函数;
通过公式W=sigmoid(y)获取权重向量,其中,sigmoid()为归一化函数。
更进一步地,所述通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块分别对第二卷积模块的输出进行加权融合,包括:
通道注意力机制模块、第一属性注意力机制模块及第一时间注意力机制模块的权重向量分别为W1、W2、W3,通过公式对第二卷积模块的输出进行加权融合,其中,Fou表示第二卷积模块的输出,/>代表属性方向的逐像素相乘,/>代表时序方向的逐像素相乘,/>代表通道方向的逐像素相乘。
进一步地,所述模型训练部中采用故障诊断模型预测的故障概率与实际故障概率之差平方的期望值作为损失函数,其中,实际故障概率在发生故障的时候值为1,不发生故障的时候值为0。
进一步地,所述模型训练部中采用Adam学习算法训练故障诊断模型。
本发明的优点在于:
(1)本发明由于多传感器数据是多维度的,通过滑窗处理将原始数据通过属性维和时间维的融合转化为输出特征图,实现了多维度的数据的融合,也即实现多源数据融合,使得提取的特征较为完善,该输出特征图作为后续注意力机制模块的输入,通过多种不同的注意力机制模块实现多传感器的多维依赖关系的挖掘,利用挖掘的多维信息对输出特征图加权得到最终的特征图,使得特征提取的结果考虑多维依赖关系,较为准确,从而最终故障诊断结果较为精准。
(2)本发明为了挖掘多传感器数据中的属性依赖信息、时序依赖信息和通道依赖信息,分别设计了属性注意力机制、时间注意力机制、和通道注意力机制,通过本发明提出的模型,能够很好地融合多源数据,并挖掘多源数据中的丰富信息,能够进一步提升现有基于深度学习故障诊断方法的性能和效率。
附图说明
图1为本发明实施例所公开的一种基于滑窗处理与注意力机制的故障诊断方法中滑窗处理过程示意图;
图2为本发明实施例所公开的一种基于滑窗处理与注意力机制的故障诊断方法中故障诊断模型架构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1和图2所示,一种基于滑窗处理与注意力机制的故障诊断方法,所述方法包括:
S1:构建故障诊断模型,将多传感器数据输入故障诊断模型,基于滑窗处理从属性维和时序维对多维时序数据进行融合以获得输出特征图;将输出特征图分别输入到多种不同的注意力机制模块中,不同注意力机制模块的权重向量对输出特征图加权得到最终的特征图;具体过程如下:
S101、滑窗处理
多传感器数据是M维时序数据,给定M维时序数据S=[s1,…,sM],其中 是一个周期为T的一维时序数据,按以下形式对S进行排列获得矩阵形式的原始数据D
如图1所示,定义一个M*d的窗口,其中0<d<T,并指定该窗口滑动的步长为0<λ<T。在原始数据D上从上至下依次按照步长λ移动窗口,将每次窗口所覆盖的数据记为Xn,并取窗口所覆盖数据最下面一行所对应数据的标签作为Xn的标签yn。通过这种形式,最终能将原始数据(D,Y)转化为类图片数据集类图片数据集作为故障诊断模型的输入量。
滑窗处理的方法属于现有技术,采用的是中国专利公开号CN109814523A公开的基于CNN-LSTM深度学习方法及多属性时序数据的故障诊断方法中的滑窗处理步骤,在此不做赘述。
S102、模型构建
如图2所示,为了挖掘多源数据中的属性依赖、时序依赖、和通道依赖信息,本发明提出了三种注意力机制,分别为属性注意力机制、时间注意力机制和通道注意力机制。
(1)属性注意力机制
给定一个特征图F=[F1,…,FC],其中Fc∈Rd×M,c=1,…,C,属性注意力机制学习一个权重向量W1=[w1,…,wM],其中wm,m=1,…,M,表示属性m在故障诊断中的重要性程度。
(2)时间注意力机制
给定一个特征图F=[F1,…,FC],其中Fc∈Rd×M,c=1,…,C,时间注意力机制学习一个权重向量W2=[w1,…,wd],其中wδ,δ=1,…,d,表示时刻δ在故障诊断中的重要性程度。
(3)通道注意力机制
给定一个特征图F=[F1,…,FC],其中Fc∈Rd×M,c=1,…,C,通道注意力机制学习一个权重向量W3=[w1,…,wC],其中wc,c=1,…,C,表示通道c在故障诊断中的重要性程度。
这三类注意力的学习模型是任意的。本实施例中采用一个全连接层进行学习。学习的过程是与整个故障诊断模型一起进行,具体是在步骤S2中通过调整可学习参数、偏置项、卷积神经网络的学习率等进行模型训练,训练完成以后三种注意力机制中各个参数以及权重向量被固定。三种注意力机制的权重向量的计算公式相同,只是训练过程会导致具体的参数不同,从而得到的权重向量有所不同,权重向量的计算过程如下:
首先,将输入到不同注意力机制模块的输出特征图进行展平,得到一个一维向量X。然后,采用下式进行非线性变换,
y=s(AX+b)
其中,y是非线性变换后的向量,A是可学习参数,b是偏置项,s()是任意一种激活函数,比如可以是ReLU激活函数。最终的权重向量W可通过归一化sigmoid函数获得
W=sigmoid(y)
继续参阅图2,所述故障诊断模型包括第一卷积模块3、通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6及第二卷积模块7,第一卷积模块3接收多传感器数据,第一卷积模块3的输出形成输出特征图,输出特征图分别输入到通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6及第二卷积模块7中,其中,输出特征图记为将输出特征图Fin输入第二卷积模块7得到通道注意力机制模块4、第一属性注意力机制模块5及第一时间注意力机制模块6的权重向量分别为W1、W2、W3,通过公式/>对第二卷积模块7的输出进行加权融合,其中,Fou表示第二卷积模块7的输出,/>代表属性方向的逐像素相乘,代表时序方向的逐像素相乘,/>代表通道方向的逐像素相乘。需要说明的是,通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6可集成到任何传统卷积神经网络的任意层,在本实施例中,通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6可集成在第一卷积模块3或第二卷积模块7的任意层,如图2只是给出了一种实现方式,将其集成在了第二卷积模块7。由于输入层只有一个通道,通道注意力机制无法应用,因此,在第一卷积模块3集成上述三种注意力机制的时候只能集成第一属性注意力机制模块5、第一时间注意力机制模块6,因此,第一卷积模块3的输出结果并没有加权融合通道注意力机制的信息。
通过堆叠上述操作构建一个故障诊断模型。在该模型中,三种注意力机制的应用能够挖掘多源数据中的属性依赖、时序依赖和通道依赖信息。
还需要说明的是,本发明的注意力机制模块、卷积模块均可以采用现有技术,本发明的主要改进点在于各模块之间数据的融合,并不在于每个模块的具体改进,因为各模块的具体结构在此不做赘述,可以采用现有任何常规的注意力机制模块以及卷积模块,只要维度符合本发明图2所标注的维度即可,例如,图2中类似于1*M1*1的表述就是相应模块的维度。图2中表示Attribute attention表示属性注意力机制,Time attention表示时间注意力机制,Convolution表示卷积,Channel attention表示通道注意力机制。
S2:调整故障诊断模型的参数,例如上述三种注意力机制的可学习参数A、偏置项b、第一卷积模块的相关参数以及第二卷积模块的相关参数等,训练故障诊断模型,直到损失函数最小或者达到预设训练轮次时停止训练,得到训练好的故障诊断模型。
需要说明的是,本发明主要改进在于特征提取,构建的故障诊断模型的主要架构也在于特征提取,实际应用中,故障诊断模型还包括分类器,得出最终的特征图以后,将特征图输入到分类器进行分类,从而得出预测的故障概率。
本实施例中对从滑窗处理获得的数据集按一定比例进行训练集和测试机划分。采用故障诊断模型预测的故障概率与实际故障概率之差平方的期望值(也即故障诊断模型预测的故障概率与实际故障概率的均方误差)作为损失函数,其中,实际故障概率在发生故障的时候值为1,不发生故障的时候值为0。采用Adam学习算法训练故障诊断模型。进过特定数量的轮次之后,所构建的模型便能很好的拟合训练数据集中的数据。最后,在测试数据集上采用特定的性能指标对训练好的模型进行测试。
S3:将实时采集的多传感器数据输入训练好的故障诊断模型,进行故障诊断。
通过以上技术方案,本发明基于注意力机制提出了一种挖掘多传感器数据中依赖信息的深度学习模型。为了挖掘多传感器数据中的属性依赖信息、时序依赖信息和通道依赖信息,分别设计了属性注意力机制、时间注意力机制、和通道注意力机制。通过本发明提出的模型,能够很好地融合多源数据,并挖掘多源数据中的丰富信息,能够进一步提升现有基于深度学习故障诊断方法的性能和效率。
实施例2
本发明实施例2与实施例1的区别仅在于故障诊断模型的架构略有不同,实施例1已经说明了通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6可以集成在卷积神经网络的任意层,因此实际应用中还存在这三种注意力机制分别集成在第一卷积模块3和第二卷积模块7的情况,实现多级注意力机制,先经过一次注意力机制融合多源信息并挖掘依赖关系,再经过一次注意力机制再次挖掘,进一步提升特征提取的准确性。具体的,如图2所示,所述故障诊断模型包括第二属性注意力机制模块1、第二时间注意力机制模块2、第一卷积模块3、通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6及第二卷积模块7,所述第二属性注意力机制模块1、第二时间注意力机制模块2、第一卷积模块3分别接收多传感器数据,第二属性注意力机制模块1、第二时间注意力机制模块2分别对第一卷积模块3的输出进行加权融合,形成输出特征图,输出特征图分别输入到通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6及第二卷积模块7中,其中,输出特征图记为将输出特征图Fin输入第二卷积模块7得到/>通道注意力机制模块4、第一属性注意力机制模块5及第一时间注意力机制模块6的权重向量分别为W1、W2、W3,通过公式对第二卷积模块7的输出进行加权融合,其中,Fou表示第二卷积模块7的输出,/>代表属性方向的逐像素相乘,/>代表时序方向的逐像素相乘,/>代表通道方向的逐像素相乘。第二属性注意力机制模块1、第二时间注意力机制模块2分别对第一卷积模块3的输出进行加权融合的方法与上述通道注意力机制模块4、第一属性注意力机制模块5及第一时间注意力机制模块6对第二卷积模块7的输出进行加权融合的方法相同,在此不做赘述。
实施例3
基于实施例1,本发明实施例3还提供一种基于滑窗处理与注意力机制的故障诊断系统,所述系统包括:
模型构建部,用于构建故障诊断模型,将多传感器数据输入故障诊断模型,基于滑窗处理从属性维和时序维对多维时序数据进行融合以获得输出特征图;将输出特征图分别输入到多种不同的注意力机制模块中,不同注意力机制模块的权重向量对输出特征图加权得到最终的特征图;
模型训练部,用于调整故障诊断模型的参数,训练故障诊断模型,直到损失函数最小或者达到预设训练轮次时停止训练,得到训练好的故障诊断模型;
故障诊断部,用于将实时采集的多传感器数据输入训练好的故障诊断模型,进行故障诊断。
具体的,所述模型构建部还用于:
所述故障诊断模型包括第一卷积模块3、通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6及第二卷积模块7,第一卷积模块3接收多传感器数据,第一卷积模块3的输出形成输出特征图,输出特征图分别输入到通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6及第二卷积模块7中,通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6分别对第二卷积模块7的输出进行加权融合,形成最终的特征图。
更具体的,所述故障诊断模型还包括第二属性注意力机制模块1、第二时间注意力机制模块2,所述第二属性注意力机制模块1、第二时间注意力机制模块2、第一卷积模块3分别接收多传感器数据,第二属性注意力机制模块1、第二时间注意力机制模块2分别对第一卷积模块3的输出进行加权融合,形成输出特征图。
更具体的,所述第一卷积模块3接收多传感器数据之前还包括:
多传感器数据是M维时序数据,对多传感器数据进行滑窗处理,将M维时序数据转换为类图片数据集,类图片数据集作为故障诊断模型的输入量。
更具体的,所述故障诊断模型中不同注意力机制模块的权重向量的获取方式为:
将输入到不同注意力机制模块的输出特征图进行展平,得到一个一维向量X,通过公式y=s(AX+b)进行非线性变换,其中,y是非线性变换后的向量,A是可学习参数,b是偏置项,s()是任意一种激活函数;
通过公式W=sigmoid(y)获取权重向量,其中,sigmoid()为归一化函数。
更具体的,所述通道注意力机制模块4、第一属性注意力机制模块5、第一时间注意力机制模块6分别对第二卷积模块7的输出进行加权融合,包括:
通道注意力机制模块4、第一属性注意力机制模块5及第一时间注意力机制模块6的权重向量分别为W1、W2、W3,通过公式对第二卷积模块7的输出进行加权融合,其中,Fou表示第二卷积模块7的输出,/>代表属性方向的逐像素相乘,/>代表时序方向的逐像素相乘,/>代表通道方向的逐像素相乘。
具体的,所述模型训练部中采用故障诊断模型预测的故障概率与实际故障概率之差平方的期望值作为损失函数,其中,实际故障概率在发生故障的时候值为1,不发生故障的时候值为0。
具体的,所述模型训练部中采用Adam学习算法训练故障诊断模型。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述方法包括:
步骤a:构建故障诊断模型,将多传感器数据输入故障诊断模型,基于滑窗处理从属性维和时序维对多维时序数据进行融合以获得输出特征图;将输出特征图分别输入到多种不同的注意力机制模块中,不同注意力机制模块的权重向量对输出特征图加权得到最终的特征图;
步骤b:调整故障诊断模型的参数,训练故障诊断模型,直到损失函数最小或者达到预设训练轮次时停止训练,得到训练好的故障诊断模型;
步骤c:将实时采集的多传感器数据输入训练好的故障诊断模型,进行故障诊断。
2.根据权利要求1所述的一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述步骤a包括:
所述故障诊断模型包括第一卷积模块、通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块,所述第一卷积模块接收多传感器数据,第一卷积模块的输出形成输出特征图,输出特征图分别输入到通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块中,通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块分别对第二卷积模块的输出进行加权融合,形成最终的特征图。
3.根据权利要求2所述的一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述故障诊断模型还包括第二属性注意力机制模块和第二时间注意力机制模块,第二属性注意力机制模块、第二时间注意力机制模块、第一卷积模块分别接收多传感器数据,第二属性注意力机制模块、第二时间注意力机制模块分别对第一卷积模块的输出进行加权融合,形成输出特征图。
4.根据权利要求2所述的一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述第一卷积模块接收多传感器数据之前还包括:
多传感器数据是M维时序数据,对多传感器数据进行滑窗处理,将M维时序数据转换为类图片数据集,类图片数据集作为故障诊断模型的输入量。
5.根据权利要求2所述的一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述故障诊断模型中不同注意力机制模块的权重向量的获取方式为:
将输入到不同注意力机制模块的输出特征图进行展平,得到一个一维向量X,通过公式y=s(AX+b)进行非线性变换,其中,y是非线性变换后的向量,A是可学习参数,b是偏置项,s()是任意一种激活函数;
通过公式W=sigmoid(y)获取权重向量,其中,sigmoid()为归一化函数。
6.根据权利要求2所述的一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块分别对第二卷积模块的输出进行加权融合,包括:
通道注意力机制模块、第一属性注意力机制模块及第一时间注意力机制模块的权重向量分别为W1、W2、W3,通过公式对第二卷积模块的输出进行加权融合,其中,Fou表示第二卷积模块的输出,/>代表属性方向的逐像素相乘,/>代表时序方向的逐像素相乘,/>代表通道方向的逐像素相乘。
7.根据权利要求1所述的一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述步骤b中采用故障诊断模型预测的故障概率与实际故障概率之差平方的期望值作为损失函数,其中,实际故障概率在发生故障的时候值为1,不发生故障的时候值为0。
8.根据权利要求1所述的一种基于滑窗处理与注意力机制的故障诊断方法,其特征在于,所述步骤b中采用Adam学习算法训练故障诊断模型。
9.一种基于滑窗处理与注意力机制的故障诊断系统,其特征在于,所述系统包括:
模型构建部,用于构建故障诊断模型,将多传感器数据输入故障诊断模型,基于滑窗处理从属性维和时序维对多维时序数据进行融合以获得输出特征图;将输出特征图分别输入到多种不同的注意力机制模块中,不同注意力机制模块的权重向量对输出特征图加权得到最终的特征图;
模型训练部,用于调整故障诊断模型的参数,训练故障诊断模型,直到损失函数最小或者达到预设训练轮次时停止训练,得到训练好的故障诊断模型;
故障诊断部,用于将实时采集的多传感器数据输入训练好的故障诊断模型,进行故障诊断。
10.根据权利要求9所述的一种基于滑窗处理与注意力机制的故障诊断系统,其特征在于,所述模型构建部还用于:
所述故障诊断模型包括第一卷积模块、通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块,所第一卷积模块接收多传感器数据,第二属性注意力机制模块、第二时间注意力机制模块分别对第一卷积模块的输出进行加权融合,形成输出特征图,输出特征图分别输入到通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块及第二卷积模块中,通道注意力机制模块、第一属性注意力机制模块、第一时间注意力机制模块分别对第二卷积模块的输出进行加权融合,形成最终的特征图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310863439.6A CN116994041A (zh) | 2023-07-13 | 2023-07-13 | 一种基于滑窗处理与注意力机制的故障诊断方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310863439.6A CN116994041A (zh) | 2023-07-13 | 2023-07-13 | 一种基于滑窗处理与注意力机制的故障诊断方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116994041A true CN116994041A (zh) | 2023-11-03 |
Family
ID=88527632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310863439.6A Pending CN116994041A (zh) | 2023-07-13 | 2023-07-13 | 一种基于滑窗处理与注意力机制的故障诊断方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116994041A (zh) |
-
2023
- 2023-07-13 CN CN202310863439.6A patent/CN116994041A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647716B (zh) | 一种基于复合信息的光伏阵列故障诊断方法 | |
JP2022105263A (ja) | グラフニューラルネットワークに基づくマルチソースタイミングデータ故障診断方法及び媒体 | |
CN112199532B (zh) | 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置 | |
CN111783540B (zh) | 一种视频中人体行为识别方法和系统 | |
CN103942749B (zh) | 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法 | |
CN113806746B (zh) | 基于改进cnn网络的恶意代码检测方法 | |
CN116699297B (zh) | 充电桩检测系统及其方法 | |
CN112738014A (zh) | 一种基于卷积时序网络的工控流量异常检测方法及系统 | |
CN115277888B (zh) | 一种移动应用加密协议报文类型解析方法及系统 | |
CN116306289B (zh) | 一种基于多源域自适应的机电设备跨域剩余寿命预测方法 | |
CN113887642B (zh) | 一种基于开放世界的网络流量分类方法及系统 | |
CN116894180B (zh) | 一种基于异构图注意力网络的产品制造质量预测方法 | |
CN110826810B (zh) | 一种空间推理与机器学习相结合的区域降雨预测方法 | |
CN113807214A (zh) | 基于deit附属网络知识蒸馏的小目标人脸识别方法 | |
CN117078007A (zh) | 一种融合尺度标签的多尺度风控系统及其方法 | |
CN116994041A (zh) | 一种基于滑窗处理与注意力机制的故障诊断方法及装置 | |
CN115664970A (zh) | 基于双曲空间的网络异常点检测方法 | |
CN115879030A (zh) | 一种针对配电网的网络攻击分类方法和系统 | |
CN115131563A (zh) | 一种基于弱监督学习的交互式图像分割方法 | |
CN114358177A (zh) | 一种基于多维度特征紧凑决策边界的未知网络流量分类方法及系统 | |
CN113962432A (zh) | 一种融合三维卷积与轻量卷积门限单元的风电预测方法及系统 | |
Yuan et al. | Deep and spatio-temporal detection for abnormal traffic in cloud data centers | |
CN117612071B (zh) | 一种基于迁移学习的视频动作识别方法 | |
CN117439800B (zh) | 一种网络安全态势预测方法、系统及设备 | |
CN117591813B (zh) | 基于多维特征的复杂装备故障诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |