CN117591813B - 基于多维特征的复杂装备故障诊断方法及系统 - Google Patents
基于多维特征的复杂装备故障诊断方法及系统 Download PDFInfo
- Publication number
- CN117591813B CN117591813B CN202410072338.1A CN202410072338A CN117591813B CN 117591813 B CN117591813 B CN 117591813B CN 202410072338 A CN202410072338 A CN 202410072338A CN 117591813 B CN117591813 B CN 117591813B
- Authority
- CN
- China
- Prior art keywords
- fault
- module
- feature
- output
- head
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 36
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims abstract description 23
- 238000013507 mapping Methods 0.000 claims abstract description 22
- 230000007246 mechanism Effects 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims description 69
- 230000006870 function Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 6
- 244000309464 bull Species 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000008707 rearrangement Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多维特征的复杂装备故障诊断方法及系统,包括获取目标复杂装备的故障数据,进行输入编码映射及位置编码;利用多头注意力机制及多头膨胀卷积串联连接,并结合前馈神经网络获取涵盖全局和局部深层次信息的故障特征;将提取的故障特征进行融合获取多维特征向量;利用分类器获取故障类型概率分数矩阵,输出目标复杂装备的故障诊断结果。本发明融合多头自注意力的全局建模优势和多头膨胀卷积的局部多尺度特征感知优点,建立Transformer模型和多头膨胀卷积相互融合的装备故障诊断模型,实现全局和局部故障特征的全面提取,实现了故障的精准诊断。
Description
技术领域
本发明涉及故障诊断技术领域,更具体的,涉及一种基于多维特征的复杂装备故障诊断方法及系统。
背景技术
在随着科学技术的发展,复杂智能装备的构成装置、精密程度、自动化水平和控制规模越来越高,运行工况也更加苛刻,产生的故障或失效表征形式复杂多变,传统的维护手段已经无法满足复杂装备的运维需求。
近年来,随着传感器和物联网技术的发展,大量的机械设备状态监测数据被存储下来,越来越多的基于数据驱动的方法应用在复杂装备的故障诊断中,然而现有大多数的智能模型在挖掘特征信息方面尚有不足,难以识别有价值的深度特征信息,导致设备故障诊断准确率低下,误判率高。因此,如何在复杂装备的故障诊断中提高数据挖掘的质量与深度,获得更有价值的数据特征是亟需解决的问题之一。
发明内容
为了解决上述技术问题,本发明提出了一种基于多维特征的复杂装备故障诊断方法及系统。
本发明第一方面提供了一种基于多维特征的复杂装备故障诊断方法,包括:
获取目标复杂装备的故障数据,将所述故障数据进行预处理,并进行输入编码映射及位置编码;
利用多头注意力机制及多头膨胀卷积串联连接,并结合前馈神经网络获取涵盖全局和局部深层次信息的故障特征;
将提取的故障特征进行融合获取多维特征向量;
根据所述多维特征向量利用分类器获取故障类型概率分数矩阵,输出目标复杂装备的故障诊断结果。
本方案中,将所述故障数据进行预处理,并进行输入编码映射及位置编码,具体为:
利用传感器获取故障数据进行归一化和滑窗分割样本预处理,将每份样本数据通过扩展操作重构成二维特征图/>,利用卷积操作将所述二维特征图/>分割成若干Patch,经过重新排列输出特征向量/>;
构建可学习的位置编码矩阵,将所述位置编码矩阵通过相加的形式嵌入到中,通过位置编码得到/>。
本方案中,通过特征提取模块获取故障特征,所述特征提取模块为端到端模式,包含全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块;
将位置编码后得到的导入全局特征提取子模块,利用多头注意力机制构建计算每个注意力头的注意力分数,根据所述注意力分数每个注意力头的输出/>;
将所有注意力头的输出进行合并拼接操作,并通过线性变换进行映射,得到最终的多头自注意力输出,将/>经过层标准化后再与输入的/>进行残余连接得到输出全局特征/>。
本方案中,所述局部特征提取子模块由多头膨胀卷积和线性映射层构成,具体为:
将全局特征输入局部特征提取子模块,利用多头机制将全局特征/>的最后一维进行分割,将其输入到多头多尺度膨胀卷积中,分别进行膨胀率为1、2、3的膨胀卷积;
将三种不同尺度的膨胀卷积输出的特征矩阵以均等的权重相加,得到多头输出,将多头输出进行合并拼接操作,并通过线性映射得到,最后进行层归一化和残余连接得到局部特征提取子模块输出的局部特征/>。
本方案中,所述前馈神经网络子模块由两层全连接层和非线性激活组成,将局部特征输入到前馈神经网络子模块进行全连接映射和非线性变换,并经过层归一化和残余连接得到输出/>;
其中,分别表示两层全连接层的权重参数,LN为归一化计算,ReLU为激活函数计算。
本方案中,在特征提取模块中获取全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块的输出,/>,/>,在各子模块后增加输出与原始输入/>的跳跃残连接,最终获取特征提取模块输出/>,作为故障特征。
本方案中,将提取的故障特征进行融合获取多维特征向量;
将特征提取模块的输出输入全局平均池化层,使故障特征融合到一个固定长度的向量,获取多维特征向量/>;
其中,表示/>的第/>行共有/>个特征值,/>表示序列长度,/>表示特征维度大小。
本方案中,利用分类器获取故障类型概率分数矩阵,具体为:
所述分类器由两层线性层和一个非线性激活函数组成,将故障特征融合得到的多维特征向量输出输入到分类器中,经过线性层将多维特征向量转化为故障分类的概率分数矩阵/>,/>为类型数量。
本发明第二部分提供了一种基于多维特征的复杂装备故障诊断系统,包括输入编码与位置编码模块、特征提取模块、特征融合模块和分类器模块;
所述输入编码与位置编码模块,用于故障数据的预处理及预映射,将故障数据复制为二维特征图,分割二维特征图获取预设数量的Patch,并进行位置编码;
所述特征提取模块,用于进行故障特征信息全局和局部的提取,为端到端模式,包含全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块;
所述特征融合模块,用于故障特征的特征融合,合并为综合全局和局部全面信息的特征表示,获取多维特征向量;
所述分类器模块,用于输出故障类型概率分数矩阵,实现复杂装备的故障诊断。
与现有技术相比,本发明的有益效果为:
本方案融合多头自注意力的全局建模优势和多头膨胀卷积的局部多尺度特征感知优点,建立Transformer模型和多头膨胀卷积相互融合的装备故障诊断模型,实现全局和局部故障特征的全面提取,获取有价值的深度特征信息,实现故障的精准诊断;
本方案提出了多头机制和多尺度膨胀卷积并联结合的网络结构,以提取数据中具有层次结构或局部微小的多尺度故障价值特征,在特征提取模块后中增加了跳跃连接,跳跃连接进一步强化了原有信息的作用,有助于缓解深度神经网络中的梯度消失问题。由于Transformer模型为端到端输出的网络,因此特征提取模型的输出是多维特征向量,在特征提取完成后采用全局平均池化进行特征融合,以整合具有全局和局部深层次特征的序列信息,为基于Transformer架构的模型输出提供了新的途径。
附图说明
为了更清楚地说明本发明实施例或示例性中的技术方案,下面将对实施例或示例性描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以按照这些附图示出的获得其他的附图。
图1为本发明基于多维特征的复杂装备故障诊断方法的流程图;
图2为实施例基于多维特征的复杂装备故障诊断方法的示意图;
图3为实施例故障特征融合的示意图;
图4为实施例基于多维特征的复杂装备故障诊断系统的框图;
图5为实施例故障诊断模型进行故障诊断的流程框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1、2示出了实施例基于多维特征的复杂装备故障诊断方法流程图及示意图。
本实施例提供了一种基于多维特征的复杂装备故障诊断方法,包括:
S102,获取目标复杂装备的故障数据,将所述故障数据进行预处理,并进行输入编码映射及位置编码;
S104,利用多头注意力机制及多头膨胀卷积串联连接,并结合前馈神经网络获取涵盖全局和局部深层次信息的故障特征;
S106,将提取的故障特征进行融合获取多维特征向量;
S108,根据所述多维特征向量利用分类器获取故障类型概率分数矩阵,输出目标复杂装备的故障诊断结果。
需要说明的是,利用传感器获取故障数据进行归一化和滑窗分割样本预处理,假设/>为输入数据的特征维度(若是n维数据则/>),/>为滑窗大小即为数据长度(L设置为Patch数量/>的倍数)。以C=1为例则设输入数据大小为/>,经过扩展操作将输入数据复制成一个二维特征图/>,以便于提取数据中二维的特征信息。用卷积核为/>、步长为/>的卷积操作将二维特征图/>划分为/>个同等大小的Patches(每个Patch的大小为/>),卷积输入通道为/>,输出通道设置为/> (可根据不同需求修改),经过重新排列操作输出为/>。由于模型无法识别所分割的Patch原有的位置信息,所以设置一个可学习的位置编码矩阵/>(其大小与/>一致),将该位置编码矩阵通过相加的形式嵌入到/>中,得到/>,传统的位置编码一般依赖于数学函数如正弦余弦函数等,而通过使用可学习的位置编码,使得模型在处理故障数据提取位置信息时更具灵活性。
需要说明的是,通过特征提取模块获取故障特征,所述特征提取模块为端到端模式,包含全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块,每一子模块后都嵌入一个层标准化和残余连接;
将位置编码后得到的导入全局特征提取子模块,其由多头自注意力机制组成,用于提取每个Patch的全局特征信息。将输入的/>的最后一维/>分割成/>个头,在每个头中分别通过三个线性层计算三个值,即查询(/>)、键(/>)、值(/>),超参数中的头数h是一个需要调整的重要参数,通常选择一个适中的值,进行相似度计算将/>点积相乘得到相似度得分,并除以缩放因子/>(/>)进行权重缩放操作,使网络训练更加稳定,然后通过Softmax得到注意力分数/>,再与/>进行点积后得到输出/>:
其中,表示查询(或键)的维度,T为转置操作。
将所有注意力头的输出进行合并拼接操作,并通过线性变换进行映射,得到最终的多头自注意力输出,进入网络下一层即层标准化,指的是对一个中间层的所有神经元进行归一化;
其中,表示第/>层神经的净输入,/>表示均值和方差,/>表示缩放和平移的参数向量,和/>维数相同,/>是为了防止方差为0产生无效计算,LN为归一化计算;
将经过层标准化后再与输入的/>进行残余连接得到输出全局特征/>,残差连接在模型中的反复应用使得每个层都能够保留原始输入的信息,有助于模型的训练稳定性和梯度传播,使得深层网络的训练更加稳定。
需要说明的是,所述局部特征提取子模块由多头膨胀卷积和线性映射层构成,旨在提取具有层次结构或多尺度的局部微小故障特征。将全局特征输入局部特征提取子模块,利用多头机制将全局特征/>的最后一维进行分割成h份,并得到三个向量,其中/>,将其输入到多头多尺度膨胀卷积中,分别进行膨胀率为1、2、3的膨胀卷积,然后将三种不同尺度的膨胀卷积输出的特征矩阵以均等的权重相加起来,得到多头输出,即/>,计算如下:
表示第/>个头经过多尺度膨胀卷积得输出,/>表示二维膨胀卷积操作,/>表示卷积核大小,/>表示膨胀率,/>是第/>个头中第i个卷积核的参数;
将多头输出进行合并拼接操作,并通过线性映射得到,最后进行层归一化和残余连接得到局部特征提取子模块输出的局部特征/>。
需要说明的是,所述前馈神经网络子模块由两层全连接层和非线性激活组成,由于在多头自注意力层中主要进行的是矩阵乘法也就是线性变换,非线性特征表达能力不足,所以使用全连接前馈神经网络层对特征向量进行全连接映射和非线性变换,提高网络表达能力,以便于学习到更加抽象的特征。将局部特征输入到前馈神经网络子模块进行全连接映射和非线性变换,并经过层归一化和残余连接得到输出/>;
其中,分别表示两层全连接层的权重参数,LN为归一化计算,ReLU为激活函数计算。
需要说明的是,为了进一步避免网络参数传递过程中梯度消失和信息丢失的问题,在特征提取模块中获取全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块的输出,/>,/>,在各子模块后增加输出与原始输入/>的跳跃残连接,最终获取特征提取模块输出/>,作为故障特征。
需要说明的是,将全局平均池化在序列维度上执行,如图3所示,输出得到一个融合了每个位置特征的特征向量,即,使得整个序列的故障特征信息被融合到一个固定长度的向量中,为后续的模型输出做准备。将特征提取模块的输出输入全局平均池化层,使故障特征融合到一个固定长度的向量,获取多维特征向量/>;
其中,表示/>的第/>行共有/>个特征值,/>表示序列长度,/>表示特征维度大小。
需要说明的是,所述分类器由两层线性层和一个非线性激活函数组成,将故障特征融合得到的多维特征向量输出输入到分类器中,经过线性层将多维特征向量转化为故障分类的概率分数矩阵/>,/>为类型数量,实现故障诊断分类任务。
根据本发明实施例,获取复杂装备的历史故障数据,将所述历史故障数据利用K-means算法进行聚类,在聚类过程中提取历史故障数据的位置特征,基于所述位置特征获取复杂装备对应的组件,利用大数据方法获取组件的高频故障类别,利用所述高频故障类别对应的出现频次对聚类类簇进行加权,提取聚类结果中类簇的类簇特征,根据所述类簇特征设置类别标签;根据类簇特征分布的相似度、故障对应组件的耦合程度以及故障发生时间获取不同类簇之间关联程度,将所述类簇作为节点,所述关联程度作为边结构对聚类结果进行图表示,获取对应的邻接矩阵,引入图神经网络进行对图表示进行学习,根据所述邻接矩阵对类簇节点进行聚合更新,通过更新后的类簇节点计算节点内积,作为各类簇节点之间的故障关联规则;获取复杂装备当前故障诊断结果后,提取故障类别及与故障组件存在耦合的邻域组件,利用所述故障关联规则获取所述故障类别的高关联故障,判断邻域组件对应高频故障是否与所述高关联故障存在交集,若存在,则根据交集中的故障类别生成邻域组件的故障预警,进行预防性运维。
图4为实施例基于多维特征的复杂装备故障诊断系统的框图。
本实施例提供了一种基于多维特征的复杂装备故障诊断系统4,包括输入编码与位置编码模块41、特征提取模块42、特征融合模块43和分类器模块44;
所述输入编码与位置编码模块41,用于故障数据的预处理及预映射,将故障数据复制为二维特征图,分割二维特征图获取预设数量的Patch,并进行位置编码;
所述特征提取模块42,用于进行故障特征信息全局和局部的提取,为端到端模式,包含全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块;
所述特征融合模块43,用于故障特征的特征融合,合并为综合全局和局部全面信息的特征表示,获取多维特征向量;
所述分类器模块44,用于输出故障类型概率分数矩阵,实现复杂装备的故障诊断。
图5为实施例故障诊断模型进行故障诊断的流程框图。
在本实施例的系统中融合多头自注意力的全局建模优势和多头膨胀卷积的局部多尺度特征感知优点,建立Transformer模型和多头膨胀卷积相互融合的装备故障诊断模型,所述故障诊断模型的训练、评估及测试,具体为:
采集装备的故障数据:采用传感器采集装备的故障数据,可以是振动或压力或温度等数据,确保数据的完整性和可用性。
数据预处理:故障数据多为具有时序性的数据,为了模型实现更好更稳定的效果,先对原始数据进行标准化,并采用滑窗的方式将数据分割成多个训练、验证和测试样本。
模型训练:将预处理后的故障数据输入到故障诊断模型中,进入到输入编码和位置编码模块进行数据在进入模型前的预处理和预映射得到,然后输入到特征提取模块,提取数据中涵盖全局和局部深层次信息的故障特征,经过N个特征提取模块后得到/>,接着进入特征融合模块和分类器模块,最终得到输出/>。训练通过分类损失反向传播进行参数优化,得到最优的网络模型参数。所述损失函数采用交叉熵损失函数,该函数在梯度反向传播过程中能够有效地推动模型参数朝着正确的方向更新,提高模型的准确性和收敛速度。
模型评估:在模型训练过程中,为了检验模型的有效性和稳健性,引入准确度、精确度、召回率、F1 分数作为模型的评价指标,以全面评估模型性能。
模型测试:将测试集或者实际任务中的故障数据输入到具有最优网络参数的模型中,输出诊断结果,实现故障诊断任务。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (4)
1.一种基于多维特征的复杂装备故障诊断方法,其特征在于,包括以下步骤:
获取目标复杂装备的故障数据,将所述故障数据进行预处理,并进行输入编码映射及位置编码;
利用多头注意力机制及多头膨胀卷积串联连接,并结合前馈神经网络获取涵盖全局和局部深层次信息的故障特征;
将提取的故障特征进行融合获取多维特征向量;
根据所述多维特征向量利用分类器获取故障类型概率分数矩阵,输出目标复杂装备的故障诊断结果;
通过特征提取模块获取故障特征,所述特征提取模块为端到端模式,包含全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块;
将位置编码后得到的导入全局特征提取子模块,利用多头注意力机制构建计算每个注意力头的注意力分数,根据所述注意力分数每个注意力头的输出/>;
将所有注意力头的输出进行合并拼接操作,并通过线性变换进行映射,得到最终的多头自注意力输出,将/>经过层标准化后再与输入的/>进行残余连接得到输出全局特征/>;
所述局部特征提取子模块由多头膨胀卷积和线性映射层构成,具体为:
将全局特征输入局部特征提取子模块,利用多头机制将全局特征/>的最后一维进行分割,将其输入到多头多尺度膨胀卷积中,分别进行膨胀率为1、2、3的膨胀卷积;
将三种不同尺度的膨胀卷积输出的特征矩阵以均等的权重相加,得到多头输出,将多头输出进行合并拼接操作,并通过线性映射得到,最后进行层归一化和残余连接得到局部特征提取子模块输出的局部特征/>;
所述前馈神经网络子模块由两层全连接层和非线性激活组成,将局部特征输入到前馈神经网络子模块进行全连接映射和非线性变换,并经过层归一化和残余连接得到输出;
;
其中,分别表示两层全连接层的权重参数,LN为归一化计算,ReLU为激活函数计算;
在特征提取模块中获取全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块的输出,/>,/>,在各子模块后增加输出与原始输入/>的跳跃残连接,最终获取特征提取模块输出/>,作为故障特征;
将提取的故障特征进行融合获取多维特征向量;
将特征提取模块的输出输入全局平均池化层,使故障特征融合到一个固定长度的向量,获取多维特征向量/>;
;
其中,表示/>的第/>行共有/>个特征值,/>表示序列长度,/>表示特征维度大小。
2.根据权利要求1所述的一种基于多维特征的复杂装备故障诊断方法,其特征在于,将所述故障数据进行预处理,并进行输入编码映射及位置编码,具体为:
利用传感器获取故障数据进行归一化和滑窗分割样本预处理,将每份样本数据通过扩展操作重构成二维特征图/>,利用卷积操作将所述二维特征图/>分割成若干Patch,经过重新排列输出特征向量/>;
构建可学习的位置编码矩阵,将所述位置编码矩阵通过相加的形式嵌入到中,通过位置编码得到/>。
3.根据权利要求1所述的一种基于多维特征的复杂装备故障诊断方法,其特征在于,利用分类器获取故障类型概率分数矩阵,具体为:
所述分类器由两层线性层和一个非线性激活函数组成,将故障特征融合得到的多维特征向量输出输入到分类器中,经过线性层将多维特征向量转化为故障分类的概率分数矩阵/>,/>为类型数量。
4.一种基于多维特征的复杂装备故障诊断系统,其特征在于,包括输入编码与位置编码模块、特征提取模块、特征融合模块和分类器模块;
所述输入编码与位置编码模块,用于故障数据的预处理及预映射,将故障数据复制为二维特征图,分割二维特征图获取预设数量的Patch,并进行位置编码;
所述特征提取模块,用于进行故障特征信息全局和局部的提取,为端到端模式,包含全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块;
所述特征融合模块,用于故障特征的特征融合,合并为综合全局和局部全面信息的特征表示,获取多维特征向量;
所述分类器模块,用于输出故障类型概率分数矩阵,实现复杂装备的故障诊断;
将位置编码后得到的导入全局特征提取子模块,利用多头注意力机制构建计算每个注意力头的注意力分数,根据所述注意力分数每个注意力头的输出/>;
将所有注意力头的输出进行合并拼接操作,并通过线性变换进行映射,得到最终的多头自注意力输出,将/>经过层标准化后再与输入的/>进行残余连接得到输出全局特征/>;
所述局部特征提取子模块由多头膨胀卷积和线性映射层构成,具体为:
将全局特征输入局部特征提取子模块,利用多头机制将全局特征/>的最后一维进行分割,将其输入到多头多尺度膨胀卷积中,分别进行膨胀率为1、2、3的膨胀卷积;
将三种不同尺度的膨胀卷积输出的特征矩阵以均等的权重相加,得到多头输出,将多头输出进行合并拼接操作,并通过线性映射得到,最后进行层归一化和残余连接得到局部特征提取子模块输出的局部特征/>;
所述前馈神经网络子模块由两层全连接层和非线性激活组成,将局部特征输入到前馈神经网络子模块进行全连接映射和非线性变换,并经过层归一化和残余连接得到输出;
;
其中,分别表示两层全连接层的权重参数,LN为归一化计算,ReLU为激活函数计算;
在特征提取模块中获取全局特征提取子模块、局部特征提取子模块、前馈神经网络子模块的输出,/>,/>,在各子模块后增加输出与原始输入/>的跳跃残连接,最终获取特征提取模块输出/>,作为故障特征;
将提取的故障特征进行融合获取多维特征向量;
将特征提取模块的输出输入全局平均池化层,使故障特征融合到一个固定长度的向量,获取多维特征向量/>;
;
其中,表示/>的第/>行共有/>个特征值,/>表示序列长度,/>表示特征维度大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410072338.1A CN117591813B (zh) | 2024-01-18 | 2024-01-18 | 基于多维特征的复杂装备故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410072338.1A CN117591813B (zh) | 2024-01-18 | 2024-01-18 | 基于多维特征的复杂装备故障诊断方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117591813A CN117591813A (zh) | 2024-02-23 |
CN117591813B true CN117591813B (zh) | 2024-04-19 |
Family
ID=89911895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410072338.1A Active CN117591813B (zh) | 2024-01-18 | 2024-01-18 | 基于多维特征的复杂装备故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117591813B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118245782B (zh) * | 2024-05-28 | 2024-08-06 | 浙江省白马湖实验室有限公司 | 一种面向绿色甲醇生产过程的双层级故障诊断方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116502135A (zh) * | 2023-03-20 | 2023-07-28 | 北京建筑大学 | 一种轴承故障诊断方法及系统 |
CN116521887A (zh) * | 2023-02-28 | 2023-08-01 | 福建亿榕信息技术有限公司 | 一种基于深度学习的知识图谱复杂问答系统及方法 |
CN116735170A (zh) * | 2023-04-25 | 2023-09-12 | 西北工业大学 | 一种基于自注意力多尺度特征提取的智能故障诊断方法 |
CN116933125A (zh) * | 2023-06-16 | 2023-10-24 | 新奥新智科技有限公司 | 时间序列数据预测方法、装置、设备及存储介质 |
CN117034139A (zh) * | 2023-07-28 | 2023-11-10 | 淮阴工学院 | 一种基于模型融合的化工过程故障诊断方法 |
CN117294617A (zh) * | 2023-10-08 | 2023-12-26 | 中国电信股份有限公司 | 通信网络异常检测方法及装置 |
-
2024
- 2024-01-18 CN CN202410072338.1A patent/CN117591813B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521887A (zh) * | 2023-02-28 | 2023-08-01 | 福建亿榕信息技术有限公司 | 一种基于深度学习的知识图谱复杂问答系统及方法 |
CN116502135A (zh) * | 2023-03-20 | 2023-07-28 | 北京建筑大学 | 一种轴承故障诊断方法及系统 |
CN116735170A (zh) * | 2023-04-25 | 2023-09-12 | 西北工业大学 | 一种基于自注意力多尺度特征提取的智能故障诊断方法 |
CN116933125A (zh) * | 2023-06-16 | 2023-10-24 | 新奥新智科技有限公司 | 时间序列数据预测方法、装置、设备及存储介质 |
CN117034139A (zh) * | 2023-07-28 | 2023-11-10 | 淮阴工学院 | 一种基于模型融合的化工过程故障诊断方法 |
CN117294617A (zh) * | 2023-10-08 | 2023-12-26 | 中国电信股份有限公司 | 通信网络异常检测方法及装置 |
Non-Patent Citations (2)
Title |
---|
《基于域特征融合网络的跨工况下多组件设备寿命预测方法研究》;黄浩、邓耀华等;《电子测量与仪器学报》;20230531;第第37卷卷(第第5期期);189-197 * |
结合注意力机制的双路径语义分割;翟鹏博;杨浩;宋婷婷;余亢;马龙祥;黄向生;;中国图象图形学报;20200812(第08期);1627-1636 * |
Also Published As
Publication number | Publication date |
---|---|
CN117591813A (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | Change detection from synthetic aperture radar images based on channel weighting-based deep cascade network | |
CN117591813B (zh) | 基于多维特征的复杂装备故障诊断方法及系统 | |
CN113657450B (zh) | 基于注意机制的陆战场图像-文本跨模态检索方法及其系统 | |
CN105138973A (zh) | 人脸认证的方法和装置 | |
CN112949740B (zh) | 一种基于多级度量的小样本图像分类方法 | |
CN103714148B (zh) | 基于稀疏编码分类的sar图像检索方法 | |
CN114913379B (zh) | 基于多任务动态对比学习的遥感图像小样本场景分类方法 | |
CN116580257A (zh) | 特征融合模型训练及样本检索方法、装置和计算机设备 | |
CN115761900B (zh) | 用于实训基地管理的物联网云平台 | |
CN115018012B (zh) | 一种高维度特性下的物联网时间序列异常检测方法及系统 | |
CN115311502A (zh) | 基于多尺度双流架构的遥感图像小样本场景分类方法 | |
CN115205712A (zh) | 一种基于孪生网络的无人机巡检图像快速查重方法和系统 | |
CN117690178A (zh) | 一种基于计算机视觉的人脸图像识别方法与系统 | |
CN117593666B (zh) | 一种极光图像的地磁台站数据预测方法及系统 | |
Bond et al. | An unsupervised machine learning approach for ground‐motion spectra clustering and selection | |
CN114936327B (zh) | 元素识别模型的获取方法、装置、计算机设备和存储介质 | |
CN115174421B (zh) | 基于自监督解缠绕超图注意力的网络故障预测方法及装置 | |
Zhang et al. | BiLSTM-TANet: an adaptive diverse scenes model with context embeddings for few-shot learning | |
CN117011219A (zh) | 物品质量检测方法、装置、设备、存储介质和程序产品 | |
CN116124448A (zh) | 用于风电齿轮箱的故障诊断系统及其方法 | |
CN115879030A (zh) | 一种针对配电网的网络攻击分类方法和系统 | |
Chen et al. | LPR‐MLP: A Novel Health Prediction Model for Transmission Lines in Grid Sensor Networks | |
CN117828280B (zh) | 基于物联网的消防信息智能采集及管理方法 | |
CN118504847B (zh) | 基于数字孪生技术的智慧梁场管理方法及系统 | |
CN114898339B (zh) | 驾驶行为预测模型的训练方法、装置、设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |