CN109766921A - 一种基于深度领域自适应的振动数据故障分类方法 - Google Patents
一种基于深度领域自适应的振动数据故障分类方法 Download PDFInfo
- Publication number
- CN109766921A CN109766921A CN201811552321.7A CN201811552321A CN109766921A CN 109766921 A CN109766921 A CN 109766921A CN 201811552321 A CN201811552321 A CN 201811552321A CN 109766921 A CN109766921 A CN 109766921A
- Authority
- CN
- China
- Prior art keywords
- sample
- sample data
- network
- data
- source domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于深度领域自适应的振动数据故障分类方法,包括:构建含有大量样本数据的源域和含有少量样本数据的目标域;利用源域中的样本数据构建一个分类器;根据源域和目标域中的不同领域下的样本数据构造配对样本;构建一个孪生网络,将配对样本作为训练样本输入到所述孪生网络中进行领域适配,并得到配对样本的最终损失函数;对最终损失函数进行优化,并得到训练完成后的故障分类模型。本发明解决了现有的深度网络模型在故障样本数据不足条件下诊断效果差的问题,将深度学习和迁移学习中的领域自适应方法相结合,最大化地利用已有数据,提高了模型的泛化能力,从而获得更好的分类准确度。
Description
技术领域
本发明涉及振动信号的处理及故障分类的技术领域,尤其是一种基于深度领域自适应的振动数据故障分类方法。
背景技术
风力发电设备、航空发动机、高档数控机床等重大机械装备正在朝着大型化、复杂化、高速高精度的方向发展,设备一旦出现事故,将带来巨大的经济损失和人员伤亡。因此,研究先进的机械故障诊断方法对于保障设备安全运行意义重大。
传统的轴承故障诊断方法通常可以分为:特征提取与分类器分类两个部分。其中,基于信号处理技术的特征提取往往针对特定问题,需要诊断专家深入了解机械装备故障机理和掌握信号处理技术,在此基础上,设计特征提取算法提取故障信息的特征。这种做法,对设计人员的技术要求高,难度较大,还有可能造成信息损失。
深度学习具有强大的建模和表征能力,且在语音识别、图像识别等领域的大数据分析上已有突破性进展。深度学习是在深度神经网络的输入端直接输入原始信号,输出端直接输出结果,通过一个深度神经网络即可完成特征提取、特征降维、分类器分类这一整套过程,无需特征提取等预处理环节。这种方式也被称为“端到端”的识别过程。
但是,深度学习与故障诊断相结合时,必须注意到的一个问题是:深度学习模型训练得到的故障分类模型具有准确性和高可靠性的两个基本前提是:训练与测试数据之间独立且分布相同,以及故障样本数量充足。
然而,变工况环境下的机械振动数据往往无法满足以上两个基本前提,这是因为:一、多工况交替的运行环境下,振动数据涵盖了多种设备、不同工况、多源传感器采集的大量健康或故障状况信息,振动数据映射的故障模式不明且多变,因此不确定的振动数据往往意味着训练与测试数据分布不同;二、复杂机械设备的在线监测系统中,海量的正常运行数据与小样本的故障状态数据是其典型特点,即采集到的振动数据虽然是大容量的,但大部分振动数据没有标注,因此针对每种工况下都收集并标记足够多的故障数据是不现实的,不平衡的振动数据往往意味着可用于训练的故障样本不足。
综合上述两点原因,在大容量、不确定、不平衡的振动数据故障诊断中,是可以通过深度学习模型准确表征大容量数据的故障特征,但是,不确定、不平衡的振动数据往往会造成深度学习模型在变工况环境下的泛化能力不足,直接使用训练集上训练得到的深度学习模型进行多工况下的故障分类,导致故障诊断的精度大幅度下降。这给故障诊断的深度学习模型带来了理论上和现实应用的风险,也成为了现有方法存在的主要缺陷。因此,如何让在一种工况下训练出的深度学习模型能够适应不同工况下的故障诊断任务,克服现有深度学习模型无法泛化到与训练数据服从不同概率分布的小样本数据的局限,实现领域自适应的故障特征提取与分类识别,是智能故障诊断必须解决的问题。
发明内容
为了克服上述现有技术中的缺陷,本发明提供一种基于深度领域自适应的振动数据故障分类方法,解决了现有的深度网络模型在故障样本数据不足条件下诊断效果差的问题,将深度学习和迁移学习中的领域自适应方法相结合,最大化地利用已有数据,提高了模型的泛化能力,从而获得更好的分类准确度。
为实现上述目的,本发明采用以下技术方案,包括:
一种基于深度领域自适应的振动数据故障分类方法,先利用样本数据构建故障分类模型,再利用该故障分类模型对待诊断的振动数据进行故障诊断和故障分类;所述构建故障分类模型,包括以下步骤:
S1,获取样本数据,并根据样本数据构建源域Ds和目标域Dt;所述源域DS包括部分样本数据,所述目标域Dt也包括部分样本数据,且所述源域DS中的样本数据与所述目标域Dt中的样本数据不相同;所述源域DS中的样本数据的数量远大于所述目标域Dt中的样本数据的数量;
S2,利用源域Ds中的样本数据构建一个分类器f:X→Y;其中,X表示样本数据的输入空间,Y表示样本数据的类别空间;
S3,对源域Ds和目标域Dt中的样本数据构造配对样本,所述配对样本包括两个样本数据,一个是属于源域Ds中的样本数据,另一个是属于目标域Dt中的样本数据,且该两个样本数据属于不同领域;所述不同领域是指不同工况,即不同的工作环境;
S4,构建一个孪生网络,将配对样本作为训练样本输入到所述孪生网络中,并得到配对样本的最终损失函数;
S5,对最终损失函数进行优化,并根据优化结果更新所述分类器f:X→Y的模型参数,得到训练完成后的故障分类模型。
步骤S1中,
源域
其中,表示源域Ds中的第i个样本数据,表示源域Ds中的第i个样本数据的标记内容即故障类型,且所述源域Ds共包括n个样本数据;i表示第i个,s表示源域;
目标域
其中,表示目标域中Dt的第j个样本数据,表示目标域Dt中的第j个样本数据的标记内容即故障类型,且所述目标域Dt共包括m个样本数据,m<<n;j表示第j个,t表示目标域;
所述源域Ds和所述目标域Dt中的样本数据的输入空间X和类别空间Y均相同,即Xs=Xt,Ys=Yt;其中,Xs、Xt分别表示源域Ds和目标域Dt中的样本数据的输入空间;Ys、Yt分别表示源域Ds和目标域Dt中的样本数据的类别空间;
所述源域Ds和所述目标域Dt中的样本数据的边缘分布不同,即P(Xs)=P(Xt);其中,P(Xs)、P(Xt)分别表示源域Ds和目标域Dt中的样本数据的边缘分布。
步骤S2中,所述分类器f:X→Y的模型为
其中,g:X→Z表示从输入空间到特征子空间的映射;且将该映射g:X→Z的参数记为θg;Z表示特征子空间;
h:Z→Y表示从特征子空间到类别空间的映射;且将该映射h:Z→Y的参数记为θh;
即所述分类器的模型参数包括θg和θh。
步骤S3中,
所述配对样本是一个四元组,用表示;
其中,表示源域Ds中的第i个样本数据;表示目标域Dt中的第j个样本数据;表示源域Ds中的第i个样本数据的标记内容即故障类型;i=1,2,3,…,n,j=1,2,3,…,m;
pij为配对标签,表示此两个样本数据即和的故障类型是否一致,若一致,则pij=0;若不一致,则pij=1。
步骤S4中,所述孪生网络包括两个孪生子网络,分别为第一子网络和第二子网络;其中,所述第一子网络的输入为配对样本中的属于源域Ds的样本数据所述第二子网络的输入为配对样本中的属于目标域Dt的样本数据
该两个孪生子网络的结构相同、参数共享;所述结构相同是指从输入空间到特征子空间的映射g:X→Z相同,即从输入层到特征层的结构相同;所述参数共享是指从输入空间到特征子空间的映射g:X→Z的参数θg共享;
所述第一子网络在从输入空间到特征子空间的映射g:X→Z之后即在特征层之后还连接了一个从特征子空间到类别空间的映射h:Z→Y,该映射h:Z→Y用于对源域Ds的样本数据进行分类。
步骤S4中,所述第一子网络和所述第二子网络均采用结构相同、参数共享的卷积网络完成从输入空间到特征子空间的映射g:X→Z;所述卷积网络的网络架构,从上到下依次为:输入层、卷积层、池化层、卷积层、池化层、弃权层、拉平层、全连接层1、全连接层2,且每一层的输出即为下一层的输入;
所述第一子网络还在全连接层2之后,连接了一个柔性最大值层即softmax层。
步骤S4中,对此孪生网络进行多层适配,所示多层适配是对全连接层1和全连接层2进行适配,具体包括以下步骤:
S41,分别将第一子网络的全连接层1和全连接层2的输出发送至对比损失函数,还分别将第二子网络的全连接层1和全连接层2的输出发送至该对比损失函数,以计算该配对样本的对比损失;
所述对比损失函数Lcontrastive如下式所示:
其中,α为平衡因子,1>α>0;
l=1表示全连接层1,l=2表示全连接层2;表示配对样本在全连接层1的对比损失;表示配对样本在全连接层2的对比损失;
所述配对样本在l层的对比损失即的计算方式如下所示:
其中,Ll S(zl(xs),zl(xt))表示配对样本中的两个样本数据的故障类型一致时的在l层的对比损失;Ll D(zl(xs),zl(xt))表示配对样本中的两个样本数据的故障类型不一致时的在l层的对比损失;pij为配对标签,表示此两个样本数据即和的故障类型和是否一致,若一致,则pij=0;若不一致,则pij=1;
zl(·)表示孪生子网络中的l层的输出;β为设定的阈值,β>0;
S42,将第一子网络的softmax层的输出以及配对样本中的属于源域Ds的样本数据的标记内容发送至交叉熵损失函数以计算该配对样本的交叉熵损失即分类损失;
所述交叉熵损失函数Lclassification即如下式所示:
S43,根据配对样本的对比损失和交叉熵损失,得到配对样本的最终损失函数L,所述配对样本的最终损失函数L如下式所示:
L=Lclassification+Lcontrastive。
步骤S5中,采用Adam优化算法对最终损失函数L进行优化,所述优化是指将该最终损失函数L最小化,得到最终损失函数L最小化时的参数θg和θh;根据最终损失函数L最小化时的参数θg和θh并经过反向传播更新分类器的模型,得到训练完成后的故障分类模型;所述Adam优化算法是一种基于训练数据迭代地更新神经网络权重的一阶优化算法。
故障分类模型训练完成后,待诊断的振动数据直接使用孪生网络中的第一子网络完成从振动数据即原始信号的输入到故障类型的输出,即直接使用孪生网络中的第一子网络完成故障诊断及故障分类。
本发明的优点在于:
(1)本发明解决了现有的深度网络模型在故障样本数据不足条件下诊断效果差的问题,将深度学习和迁移学习中的领域自适应方法相结合,提出一套基于深度自适应网络的振动数据故障诊断方法,充分利用已有数据,来辅助目标领域下的模型训练。
(2)本发明构建了一个孪生网络,并构造配对样本来学习一个领域无关的特征,可以最大化利用已有数据以及提高模型的泛化能力。
(3)本发明通过最小化多个特征层上的对比损失,来进行多层适配,以及使用平衡因子来权衡不同适配层的重要性,从而获得更好的分类准确度。
(4)本发明可以完成目标域中故障样本数据不足的情况下的故障诊断任务,并且根据实验结果可知,本发明的具有较高的识别准确率。
附图说明
图1为本发明的一种基于深度领域自适应的振动数据故障分类方法的整体示意图。
图2为本发明的一种基于深度领域自适应的振动数据故障分类方法的孪生网络示意图。
图3为本发明的一种基于深度领域自适应的振动数据故障分类方法的卷积网络架构图。
图4为本实施例中的不同故障类型的时域振动信号示意图。
图5为本实施例所得到的故障分类模型与传统的直接使用源域样本数据所得到的故障分类模型的分类准确率对比图。
图6为平衡因子取值对分类准确率的影响示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由图1所示,一种基于深度领域自适应的振动数据故障分类方法,先利用样本数据构建故障分类模型,再利用该故障分类模型对从目标设备的传感器中实时获取振动数据进行故障诊断和故障分类。
本发明是先基于源域的样本数据构建出一个分类器,再将深度学习和迁移学习中的领域自适应方法相结合,充分利用已有的样本数据,以辅助在目标域下进行分类器的训练。
由图1所示,所述故障分类模型的构建方式,具体包括以下步骤:
S1,根据样本数据即带标签数据即已知故障类型数据构建源域Ds和目标域Dt;所述源域Ds包括大量样本数据,所述目标域Dt包括少量样本数据;且所述源域DS中的样本数据与所述目标域Dt中的样本数据不相同;
所述源域
其中,表示源域Ds中的第i个样本数据,表示源域Ds中的第i个样本数据的标签内容即故障类型,且所述源域Ds共包括n个样本数据;i表示第i个,s表示源域;
所述目标域
其中,表示目标域Dt中的第j个样本数据,表示目标域Dt中的第j个样本数据的故障类型,且所述目标域Dt共包括m个样本数据,m<<n;j表示第j个,t表示目标域;
所述源域Ds和所述目标域Dt中的样本数据的输入空间X和类别空间Y均相同,即Xs=Xt,Ys=Yt;其中,Xs、Xt分别表示源域Ds和目标域Dt中的样本数据的输入空间;Ys、Yt分别表示源域Ds和目标域Dt中的样本数据的类别空间;
所述源域Ds和所述目标域Dt中的样本数据的边缘分布不同,即P(Xs)=P(Xt);其中,P(Xs)、P(Xt)分别表示源域Ds和目标域Dt中的样本数据的边缘分布。
S2,利用源域Ds中的样本数据构建一个分类器f:X→Y;该分类器f:X→Y模型为
其中,g:X→Z表示从输入空间到特征子空间的映射;且该映射g:X→Z的参数记为θg;Z表示特征子空间;
h:Z→Y表示从特征子空间到类别空间的映射;且该映射h:Z→Y的参数记为θh;
即该分类器的模型参数为θg和θh;
根据该分类器f:X→Y可得到交叉熵损失函数Lclassification,所述交叉熵损失函数Lclassification即如下式所示:
所述交叉熵损失函数Lclassification用于计算样本数据的分类损失;
对该分类器f:X→Y进行训练,传统方式是直接将源域中的样本数据作为训练样本对分类器进行训练,但是由于未进行领域适配,导致训练出的故障分类模型的精准度较低,故本发明采用迁移学习的方式,以提高用于训练分类器的训练样本的数据量,从而提高故障分类模型的精准度。
S3,源域Ds和目标域Dt中的不同领域下的样本数据进行相互迁移,对源域Ds和目标域Dt中的不同领域下的样本数据构造配对样本,所述配对样本包括两个样本数据,一个是属于源域Dt中的样本数据,另一个是属于目标域Dt中的样本数据,且该两个样本数据的领域不同;所述领域不同是指工况不同,即不同的工作环境,例如,不同的转速,不同的故障尺寸;
所述配对样本是一个四元组,用表示;
其中,表示源域Ds中的第i个样本数据;表示目标域Dt中的第j个样本数据;表示源域Ds中的第i个样本数据的故障类型;
pij为配对标签,表示此两个样本数据即和的故障类型和是否一致,若一致,则pij=0;若不一致,则pij=1;
S4,构建一个孪生网络,将配对样本作为训练样本输入到所述孪生网络中,得到最终损失函数。
由图2所示,所述孪生网络包括两个孪生子网络,分别为第一子网络和第二子网络,其中,所述第一子网络的输入为配对样本中的属于源域Ds的样本数据所述第二子网络的输入为配对样本中的属于目标域Dt的样本数据
该两个孪生子网络结构相同、参数共享;所述结构相同是从输入层到特征层这部分区域相同,即从输入空间到特征子空间的映射g:X→Z这部分相同;所述参数共享是指从输入空间到特征子空间的映射g:X→Z的参数θg共享。
所述第一子网络在从输入空间到特征子空间的映射g:X→Z这部分之后即在特征层之后还连接了一个子分类器即从特征子空间到类别空间的映射h:Z→Y,该映射h:Z→Y用于对源域Ds的样本数据进行分类。
将该两个孪生子网络的特征层输出送至对比损失函数,用于计算两个样本数据的特征之间的相似度,根据对比损失函数计算所得到的对比损失即可表征两个样本数据的特征之间的相似度。
将第二子网络的分类输出送至交叉熵损失函数,用于计算样本数据的分类效果,根据交叉熵损失函数计算所得到交叉熵损失即分类损失即可表征样本数据的分类效果。
所述第一子网络和所述第二子网络均采用结构相同、参数共享的卷积网络完成从输入空间到特征子空间的映射g:X→Z。
由图3所示,所述卷积网络的网络架构,从上到下依次为:
输入层,该输入层的维度为1024;
卷积层,该卷积层的卷积核数量为64,卷积核大小为16*1;
池化层,该池化层的大小为2*1;
卷积层,该卷积层的卷积核数量为128,卷积核大小为16*1;
池化层,该池化层的大小为2*1;
弃权层,该弃权层的弃权比例为0.25;
拉平层,用于将上一层的输出即该拉平层的输入拉成一维数据;
全连接层1,该全连接层1的维度为1024;
全连接层2,该全连接层2的维度为512。
其中,每一层的输出即为下一层的输入。
所述第一子网络还在全连接层2之后,连接了一个柔性最大值层即softmax层,且softmax层的维度为4。
图3中的各层和各参数的英文解释含义分别如下表1和表2所示:
Keras层-英文名 | Keras层-中文名 | 分别针对两个孪生子网络进行命名 |
InputLayer | 输入层 | Input_1,Input_2 |
Conv1D | 时序卷积层 | Conv_1,Conv_2 |
MaxPooling1D | 时序最大池化层 | Pool_1,Pool_2 |
Dropout | 弃权层 | Dropout_1,Dropout_2 |
Flatten | 展平层 | Flatten_1 |
Dense | 全连接层 | Dense_1,Dense_2,Out_1,Out_2 |
Lambda | 自定义层 | Distance_1,Distance_2 |
表1
表2
对此孪生网络进行多层适配,具体为对全连接层1和全连接层2进行适配,包括以下步骤:
S41,将第一子网络的全连接层1的输出和全连接层2的输出分别发送至对比损失函数,还将第二子网络的全连接层1的输出和全连接层2的输出分别发送至该对比损失函数,以计算该配对样本的对比损失;
所述对比损失函数Lcontrastive如下式所示:
其中,α为平衡因子,1>α>0;
l=1表示全连接层1,l=2表示全连接层2;表示配对样本在全连接层1的对比损失;表示配对样本在全连接层2的对比损失;
所述配对样本在l层的对比损失即的计算方式如下所示:
其中,Ll S(zl(xs),zl(xt))表示配对样本中的两个样本数据的故障类型一致时的在l层的对比损失;Ll D(zl(xs),zl(xt))表示配对样本中的两个样本数据的故障类型不一致时的在l层的对比损失;pij为配对标签,表示此两个样本数据即和的故障类型和是否一致,若一致,则pij=0;若不一致,则pij=1;
zl(·)表示孪生子网络中的l层的输出;β为设定的阈值,β>0,本实施例中,β=1;
S42,将第一子网络的softmax层的输出发送至交叉熵损失函数,以计算该配对样本的交叉熵损失即分类损失;
所述交叉熵损失函数Lclassification即如下式所示:
其中,从输入空间到特征子空间的映射即g:X→Z的参数记为θg;从特征子空间到类别空间的映射即h:Z→Y的参数记为θh;且θg和θh也是的参数。
S43,根据配对样本的对比损失和交叉熵损失,得到配对样本的最终损失函数L,所述配对样本的最终损失函数L如下式所示:
L=Lclassification+Lcontrastive。
S5,采用Adam优化算法对最终损失函数L进行优化,所述优化是指将该最终损失函数L最小化,将对比损失函数Lcontrastive和交叉熵损失函数Lclassification最小化,得到对比损失函数Lcontrastive和交叉熵损失函数Lclassification最小化时的参数θg和θh;根据最终损失函数L最小化时的参数θg和θh并经过反向传播更新分类模型,得到训练完成后的故障分类模型;
所述Adam优化算法是一种基于训练数据迭代地更新神经网络权重的一阶优化算法,具体可参见现有技术;
分类模型在进行训练时主要包括数据即样本数据的正向传播和反向传播两个部分,所述正向传播是指将数据依次经过卷积层、弃权层、全连接层的处理后送入输出层,每一层的输出都是下一层的输入;所述反向传播是指将模型的输出与模型期望输出之间进行比较,得到二者的误差,通过BP反向传播算法将误差分配到各层,对模型的权重和偏执进行调整,直至满足收敛条件,以得到最终的分类器的模型即故障分类模型。
图1中,最大迭代期数是指最大迭代次数;源域振动信号是指源域的样本数据;目标域振动信号是指目标域的样本数据;初始化参数是指根据源域的样本数据构建分类器的模型参数。
故障分类模型训练完成后,即可认为两个不同领域之间的差异已经消除,又由于孪生网络中的第一子网络即包括从输入空间到特征子空间的映射g:X→Z和从特征子空间到类别空间的映射h:Z→Y,故待诊断的振动数据直接使用孪生网络中的第一子网络完成从振动数据即原始信号的输入到故障类型的输出,即直接使用孪生网络中的第一子网络完成故障诊断及故障分类。
本实施例中:
采用三种不同的故障尺寸0.007、0.014、0.021作为三种不同的工况即三种不同的分布,记为S7、S14、S21。
每种工况下均对应四个不同故障类型即故障类型,分别为:正常N;滚动体故障BF;内圈故障IF;外圈故障OF。且四个不同故障类型的时域振动信号如图4所示。
每种工况下的每个故障类型均选取128个样本数据即带标记数据作为源域DS;每种工况下的每个故障类型均选取3个样本数据即带标记数据作为目标域DT。所述样本数据即为振动信号,且每个样本数据的长度均为1024。
对所述源域DS中的三种工况和所述目标域DT中的三种工况进行相互迁移,可以组成六种迁移任务;
实验数据如下表3所示,六种迁移任务如下表4所示:
表3
表4
如图5所示,将基于本实施例所得到的故障分类模型ours与直接使用源域Ds的样本数据得到的故障分类模型base进行对比。对比发现,由于目标域Dt和源域Ds的数据存在差异,不使用领域适配方法的情况下,直接使用源域Ds的样本数据得到的故障分类模型base,各个迁移任务的分类正确率都很低,说明了该故障分类模型base的泛化能力差;且加入领域适配方法的情况下即本实施例方法,所得到的故障分类模型ours对各个迁移任务的分类正确率都有很大提升,即低泛化能力得到的很大的提升。
如图6所示,考虑不同平衡因子的取值对故障分类模型性能的影响,不同取值的平衡因子的分类正确率不同,其中会存在一个最优值,但是不同的任务即不同的故障类型其对应最优值的取值也不同,当α=0时,相当于仅适配最后一层,从图中可以看出,仅适配最后一层不能得到最优的值。因此,我们使用多层适配并采用平衡因子,以权衡不同层的重要性,实际过程中,通过多次实验得到一个最优取值的平衡因子,从而提高分类准确率。
考虑目标域的样本数量对故障分类模型性能即分类准确率的影响,本实施例中,针对故障尺寸为0.014和0.021的两种工况相互迁移时,取不同样本数量的目标域构建故障分类模型,以判断不同样本数量的目标域对分类准确率的影响,具体的分类准确率如下表5所示:
表5
由表5可知,仅有一个样本的目标域的分类准确率也比没有目标域即没有领域适配时的分类准确率高;且随着目标域的样本数量增加,分类准确率快速提高,几乎可以接近100%。
以上仅为本发明创造的较佳实施例而已,并不用以限制本发明创造,凡在本发明创造的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明创造的保护范围之内。
Claims (9)
1.一种基于深度领域自适应的振动数据故障分类方法,先利用样本数据构建故障分类模型,再利用该故障分类模型对待诊断的振动数据进行故障诊断和故障分类,其特征在于,所述构建故障分类模型,包括以下步骤:
S1,获取样本数据,并根据样本数据构建源域Ds和目标域Dt;所述源域DS包括部分样本数据,所述目标域Dt也包括部分样本数据,且所述源域DS中的样本数据与所述目标域Dt中的样本数据不相同;所述源域DS中的样本数据的数量远大于所述目标域Dt中的样本数据的数量;
S2,利用源域Ds中的样本数据构建一个分类器f:X→Y;其中,X表示样本数据的输入空间,Y表示样本数据的类别空间;
S3,对源域Ds和目标域Dt中的样本数据构造配对样本,所述配对样本包括两个样本数据,一个是属于源域Ds中的样本数据,另一个是属于目标域Dt中的样本数据,且该两个样本数据属于不同领域;所述不同领域是指不同工况,即不同的工作环境;
S4,构建一个孪生网络,将配对样本作为训练样本输入到所述孪生网络中,并得到配对样本的最终损失函数;
S5,对最终损失函数进行优化,并根据优化结果更新所述分类器f:X→Y的模型参数,得到训练完成后的故障分类模型。
2.根据权利要求1所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,步骤S1中,
源域
其中,表示源域Ds中的第i个样本数据,表示源域Ds中的第i个样本数据的标记内容即故障类型,且所述源域Ds共包括n个样本数据;i表示第i个,s表示源域;
目标域
其中,表示目标域中Dt的第j个样本数据,表示目标域Dt中的第j个样本数据的标记内容即故障类型,且所述目标域Dt共包括m个样本数据,m<<n;j表示第j个,t表示目标域;
所述源域Ds和所述目标域Dt中的样本数据的输入空间X和类别空间Y均相同,即Xs=Xt,Ys=Yt;其中,Xs、Xt分别表示源域Ds和目标域Dt中的样本数据的输入空间;Ys、Yt分别表示源域Ds和目标域Dt中的样本数据的类别空间;
所述源域Ds和所述目标域Dt中的样本数据的边缘分布不同,即P(Xs)=P(Xt);其中,P(Xs)、P(Xt)分别表示源域Ds和目标域Dt中的样本数据的边缘分布。
3.根据权利要求2所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,步骤S2中,所述分类器f:X→Y的模型为
其中,g:X→Z表示从输入空间到特征子空间的映射;且将该映射g:X→Z的参数记为θg;Z表示特征子空间;
h:Z→Y表示从特征子空间到类别空间的映射;且将该映射h:Z→Y的参数记为θh;
即所述分类器的模型参数包括θg和θh。
4.根据权利要求3所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,步骤S3中,
所述配对样本是一个四元组,用表示;
其中,表示源域Ds中的第i个样本数据;表示目标域Dt中的第j个样本数据;表示源域Ds中的第i个样本数据的标记内容即故障类型;i=1,2,3,…,n,j=1,2,3,…,m;
pij为配对标签,表示此两个样本数据即和的故障类型是否一致,若一致,则pij=0;若不一致,则pij=1。
5.根据权利要求4所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,步骤S4中,所述孪生网络包括两个孪生子网络,分别为第一子网络和第二子网络;其中,所述第一子网络的输入为配对样本中的属于源域Ds的样本数据所述第二子网络的输入为配对样本中的属于目标域Dt的样本数据
该两个孪生子网络的结构相同、参数共享;所述结构相同是指从输入空间到特征子空间的映射g:X→Z相同,即从输入层到特征层的结构相同;所述参数共享是指从输入空间到特征子空间的映射g:X→Z的参数θg共享;
所述第一子网络在从输入空间到特征子空间的映射g:X→Z之后即在特征层之后还连接了一个从特征子空间到类别空间的映射h:Z→Y,该映射h:Z→Y用于对源域Ds的样本数据进行分类。
6.根据权利要求5所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,步骤S4中,所述第一子网络和所述第二子网络均采用结构相同、参数共享的卷积网络完成从输入空间到特征子空间的映射g:X→Z;所述卷积网络的网络架构,从上到下依次为:输入层、卷积层、池化层、卷积层、池化层、弃权层、拉平层、全连接层1、全连接层2,且每一层的输出即为下一层的输入;
所述第一子网络还在全连接层2之后,连接了一个柔性最大值层即softmax层。
7.根据权利要求6所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,步骤S4中,对此孪生网络进行多层适配,所示多层适配是对全连接层1和全连接层2进行适配,具体包括以下步骤:
S41,分别将第一子网络的全连接层1和全连接层2的输出发送至对比损失函数,还分别将第二子网络的全连接层1和全连接层2的输出发送至该对比损失函数,以计算该配对样本的对比损失;
所述对比损失函数Lcontrastive如下式所示:
其中,α为平衡因子,1>α>0;
l=1表示全连接层1,l=2表示全连接层2;表示配对样本在全连接层1的对比损失;表示配对样本在全连接层2的对比损失;
所述配对样本在l层的对比损失即的计算方式如下所示:
其中,LlS(zl(xs),zl(xt))表示配对样本中的两个样本数据的故障类型一致时的在l层的对比损失;LlD(zl(xs),zl(xt))表示配对样本中的两个样本数据的故障类型不一致时的在l层的对比损失;pij为配对标签,表示此两个样本数据即和的故障类型和是否一致,若一致,则pij=0;若不一致,则pij=1;
zl(·)表示孪生子网络中的l层的输出;β为设定的阈值,β>0;
S42,将第一子网络的softmax层的输出以及配对样本中的属于源域Ds的样本数据的标记内容发送至交叉熵损失函数以计算该配对样本的交叉熵损失即分类损失;
所述交叉熵损失函数Lclassification即如下式所示:
S43,根据配对样本的对比损失和交叉熵损失,得到配对样本的最终损失函数L,所述配对样本的最终损失函数L如下式所示:
L=Lclassification+Lcontrastive。
8.根据权利要求7所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,步骤S5中,采用Adam优化算法对最终损失函数L进行优化,所述优化是指将该最终损失函数L最小化,得到最终损失函数L最小化时的参数θg和θh;根据最终损失函数L最小化时的参数θg和θh并经过反向传播更新分类器的模型,得到训练完成后的故障分类模型;所述Adam优化算法是一种基于训练数据迭代地更新神经网络权重的一阶优化算法。
9.根据权利要求8所述的一种基于深度领域自适应的振动数据故障分类方法,其特征在于,故障分类模型训练完成后,待诊断的振动数据直接使用孪生网络中的第一子网络完成从振动数据即原始信号的输入到故障类型的输出,即直接使用孪生网络中的第一子网络完成故障诊断及故障分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811552321.7A CN109766921B (zh) | 2018-12-19 | 2018-12-19 | 一种基于深度领域自适应的振动数据故障分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811552321.7A CN109766921B (zh) | 2018-12-19 | 2018-12-19 | 一种基于深度领域自适应的振动数据故障分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109766921A true CN109766921A (zh) | 2019-05-17 |
CN109766921B CN109766921B (zh) | 2021-08-03 |
Family
ID=66451386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811552321.7A Active CN109766921B (zh) | 2018-12-19 | 2018-12-19 | 一种基于深度领域自适应的振动数据故障分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109766921B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555060A (zh) * | 2019-09-09 | 2019-12-10 | 山东省计算中心(国家超级计算济南中心) | 基于成对样本匹配的迁移学习方法 |
CN110610230A (zh) * | 2019-07-31 | 2019-12-24 | 国家计算机网络与信息安全管理中心 | 一种台标检测方法、装置及可读存储介质 |
CN110631690A (zh) * | 2019-08-29 | 2019-12-31 | 深圳市广宁股份有限公司 | 基于数字孪生的智能振动检测方法及装置 |
CN110751207A (zh) * | 2019-10-18 | 2020-02-04 | 四川大学 | 基于深度卷积域对抗迁移学习的故障诊断方法 |
CN110907176A (zh) * | 2019-09-30 | 2020-03-24 | 合肥工业大学 | 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法 |
CN111314113A (zh) * | 2020-01-19 | 2020-06-19 | 赣江新区智慧物联研究院有限公司 | 物联网节点故障检测方法、装置、存储介质及计算机设备 |
CN111476307A (zh) * | 2020-04-13 | 2020-07-31 | 河北工业大学 | 一种基于深度领域适应的锂电池表面缺陷检测方法 |
CN111597760A (zh) * | 2020-05-18 | 2020-08-28 | 哈尔滨工业大学(威海) | 一种实现小样本条件下获取气路参数偏差值的方法 |
CN111783335A (zh) * | 2020-06-26 | 2020-10-16 | 北京航空航天大学 | 一种基于迁移学习的少样本结构频响动力学模型修正方法 |
CN111898095A (zh) * | 2020-07-10 | 2020-11-06 | 佛山科学技术学院 | 深度迁移学习智能故障诊断方法、装置、存储介质和设备 |
CN111897416A (zh) * | 2020-06-29 | 2020-11-06 | 山东大学 | 一种基于孪生网络的自适应吹气交互方法及系统 |
CN111914897A (zh) * | 2020-06-30 | 2020-11-10 | 电子科技大学 | 一种基于孪生长短时间记忆网络的故障诊断方法 |
CN112766201A (zh) * | 2021-01-27 | 2021-05-07 | 西北大学 | 基于csi数据的行为跨域识别模型建立、识别方法及系统 |
CN113011256A (zh) * | 2021-02-05 | 2021-06-22 | 合肥工业大学 | 基于小样本学习的跨类别故障诊断方法、系统及存储介质 |
CN113138080A (zh) * | 2021-04-22 | 2021-07-20 | 东北大学 | 基于振动孪生与极限学习的滚动轴承智能故障诊断方法 |
CN113449631A (zh) * | 2021-06-25 | 2021-09-28 | 中南大学 | 图像分类方法及系统 |
CN113469084A (zh) * | 2021-07-07 | 2021-10-01 | 西安电子科技大学 | 基于对比生成对抗网络的高光谱图像分类方法 |
CN113627260A (zh) * | 2021-07-12 | 2021-11-09 | 科大讯飞股份有限公司 | 识别手写汉字的笔顺的方法、系统和计算设备 |
CN113655348A (zh) * | 2021-07-28 | 2021-11-16 | 国网湖南省电力有限公司 | 一种基于深度孪生网络的电力设备局部放电故障诊断方法、系统终端及可读存储介质 |
CN114220016A (zh) * | 2022-02-22 | 2022-03-22 | 山东融瓴科技集团有限公司 | 面向开放场景下的无人机航拍图像的域自适应识别方法 |
CN114241271A (zh) * | 2021-11-16 | 2022-03-25 | 电子科技大学 | 一种多孪生迁移学习融合多信息的机械故障智能诊断方法 |
CN114354195A (zh) * | 2021-12-31 | 2022-04-15 | 南京工业大学 | 一种深度域自适应卷积网络的滚动轴承故障诊断方法 |
CN114740726A (zh) * | 2022-04-22 | 2022-07-12 | 北京大学 | 基于深度最优特征传输的工业过程小样本故障诊断方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180217585A1 (en) * | 2014-12-19 | 2018-08-02 | United Technologies Corporation | Sensor data fusion for prognostics and health monitoring |
CN108398266A (zh) * | 2018-01-22 | 2018-08-14 | 武汉科技大学 | 一种基于集成迁移学习的轴承故障诊断方法 |
CN108414226A (zh) * | 2017-12-25 | 2018-08-17 | 哈尔滨理工大学 | 基于特征迁移学习的变工况下滚动轴承故障诊断方法 |
CN108696379A (zh) * | 2017-04-07 | 2018-10-23 | 南京航空航天大学 | 基于集成学习和smote的蜂窝网络故障诊断系统 |
-
2018
- 2018-12-19 CN CN201811552321.7A patent/CN109766921B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180217585A1 (en) * | 2014-12-19 | 2018-08-02 | United Technologies Corporation | Sensor data fusion for prognostics and health monitoring |
CN108696379A (zh) * | 2017-04-07 | 2018-10-23 | 南京航空航天大学 | 基于集成学习和smote的蜂窝网络故障诊断系统 |
CN108414226A (zh) * | 2017-12-25 | 2018-08-17 | 哈尔滨理工大学 | 基于特征迁移学习的变工况下滚动轴承故障诊断方法 |
CN108398266A (zh) * | 2018-01-22 | 2018-08-14 | 武汉科技大学 | 一种基于集成迁移学习的轴承故障诊断方法 |
Non-Patent Citations (1)
Title |
---|
BO ZHANG ET AL.: "Adversarial adaptive 1-D convolutional neural networks for bearing fault diagnosis under varying working condition", 《ARXIV》 * |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110610230A (zh) * | 2019-07-31 | 2019-12-24 | 国家计算机网络与信息安全管理中心 | 一种台标检测方法、装置及可读存储介质 |
CN110631690A (zh) * | 2019-08-29 | 2019-12-31 | 深圳市广宁股份有限公司 | 基于数字孪生的智能振动检测方法及装置 |
CN110631690B (zh) * | 2019-08-29 | 2022-01-14 | 深圳市广宁股份有限公司 | 基于数字孪生的智能振动检测方法及装置 |
CN110555060B (zh) * | 2019-09-09 | 2023-05-02 | 山东省计算中心(国家超级计算济南中心) | 基于成对样本匹配的迁移学习方法 |
CN110555060A (zh) * | 2019-09-09 | 2019-12-10 | 山东省计算中心(国家超级计算济南中心) | 基于成对样本匹配的迁移学习方法 |
CN110907176B (zh) * | 2019-09-30 | 2021-02-02 | 合肥工业大学 | 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法 |
CN110907176A (zh) * | 2019-09-30 | 2020-03-24 | 合肥工业大学 | 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法 |
CN110751207A (zh) * | 2019-10-18 | 2020-02-04 | 四川大学 | 基于深度卷积域对抗迁移学习的故障诊断方法 |
CN110751207B (zh) * | 2019-10-18 | 2022-08-05 | 四川大学 | 基于深度卷积域对抗迁移学习的故障诊断方法 |
CN111314113A (zh) * | 2020-01-19 | 2020-06-19 | 赣江新区智慧物联研究院有限公司 | 物联网节点故障检测方法、装置、存储介质及计算机设备 |
CN111476307A (zh) * | 2020-04-13 | 2020-07-31 | 河北工业大学 | 一种基于深度领域适应的锂电池表面缺陷检测方法 |
CN111476307B (zh) * | 2020-04-13 | 2023-06-20 | 河北工业大学 | 一种基于深度领域适应的锂电池表面缺陷检测方法 |
CN111597760B (zh) * | 2020-05-18 | 2022-07-22 | 哈尔滨工业大学(威海) | 一种实现小样本条件下获取气路参数偏差值的方法 |
CN111597760A (zh) * | 2020-05-18 | 2020-08-28 | 哈尔滨工业大学(威海) | 一种实现小样本条件下获取气路参数偏差值的方法 |
CN111783335B (zh) * | 2020-06-26 | 2023-02-17 | 北京航空航天大学 | 一种基于迁移学习的少样本结构频响动力学模型修正方法 |
CN111783335A (zh) * | 2020-06-26 | 2020-10-16 | 北京航空航天大学 | 一种基于迁移学习的少样本结构频响动力学模型修正方法 |
CN111897416A (zh) * | 2020-06-29 | 2020-11-06 | 山东大学 | 一种基于孪生网络的自适应吹气交互方法及系统 |
CN111914897A (zh) * | 2020-06-30 | 2020-11-10 | 电子科技大学 | 一种基于孪生长短时间记忆网络的故障诊断方法 |
CN111898095B (zh) * | 2020-07-10 | 2024-04-19 | 佛山科学技术学院 | 深度迁移学习智能故障诊断方法、装置、存储介质和设备 |
CN111898095A (zh) * | 2020-07-10 | 2020-11-06 | 佛山科学技术学院 | 深度迁移学习智能故障诊断方法、装置、存储介质和设备 |
CN112766201A (zh) * | 2021-01-27 | 2021-05-07 | 西北大学 | 基于csi数据的行为跨域识别模型建立、识别方法及系统 |
CN113011256A (zh) * | 2021-02-05 | 2021-06-22 | 合肥工业大学 | 基于小样本学习的跨类别故障诊断方法、系统及存储介质 |
CN113011256B (zh) * | 2021-02-05 | 2022-11-15 | 合肥工业大学 | 基于小样本学习的跨类别故障诊断方法、系统及存储介质 |
CN113138080A (zh) * | 2021-04-22 | 2021-07-20 | 东北大学 | 基于振动孪生与极限学习的滚动轴承智能故障诊断方法 |
CN113449631A (zh) * | 2021-06-25 | 2021-09-28 | 中南大学 | 图像分类方法及系统 |
CN113469084A (zh) * | 2021-07-07 | 2021-10-01 | 西安电子科技大学 | 基于对比生成对抗网络的高光谱图像分类方法 |
CN113627260A (zh) * | 2021-07-12 | 2021-11-09 | 科大讯飞股份有限公司 | 识别手写汉字的笔顺的方法、系统和计算设备 |
CN113655348A (zh) * | 2021-07-28 | 2021-11-16 | 国网湖南省电力有限公司 | 一种基于深度孪生网络的电力设备局部放电故障诊断方法、系统终端及可读存储介质 |
CN113655348B (zh) * | 2021-07-28 | 2023-12-08 | 国网湖南省电力有限公司 | 一种基于深度孪生网络的电力设备局部放电故障诊断方法、系统终端及可读存储介质 |
CN114241271A (zh) * | 2021-11-16 | 2022-03-25 | 电子科技大学 | 一种多孪生迁移学习融合多信息的机械故障智能诊断方法 |
CN114241271B (zh) * | 2021-11-16 | 2023-04-25 | 电子科技大学 | 一种多孪生迁移学习融合多信息的机械故障智能诊断方法 |
CN114354195A (zh) * | 2021-12-31 | 2022-04-15 | 南京工业大学 | 一种深度域自适应卷积网络的滚动轴承故障诊断方法 |
CN114220016A (zh) * | 2022-02-22 | 2022-03-22 | 山东融瓴科技集团有限公司 | 面向开放场景下的无人机航拍图像的域自适应识别方法 |
CN114740726A (zh) * | 2022-04-22 | 2022-07-12 | 北京大学 | 基于深度最优特征传输的工业过程小样本故障诊断方法 |
CN114740726B (zh) * | 2022-04-22 | 2022-10-21 | 北京大学 | 基于深度最优特征传输的工业过程小样本故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109766921B (zh) | 2021-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109766921A (zh) | 一种基于深度领域自适应的振动数据故障分类方法 | |
WO2020244134A1 (zh) | 一种基于多任务特征共享神经网络的智能故障诊断方法 | |
CN110943857B (zh) | 基于卷积神经网络的电力通信网故障分析及定位方法 | |
CN109242049B (zh) | 基于卷积神经网络的给水管网多点漏损定位方法及其装置 | |
CN108898177A (zh) | 一种输电线路走廊地表分类方法、系统、介质及设备 | |
CN107220734A (zh) | 基于决策树的数控车床车削过程能耗预测系统 | |
CN111337256B (zh) | 域不对称因子加权的滚动轴承故障深度局部迁移诊断方法 | |
CN112101085B (zh) | 一种基于重要性加权域对抗自适应的智能故障诊断方法 | |
CN107016405A (zh) | 一种基于分级预测卷积神经网络的害虫图像分类方法 | |
CN110647830B (zh) | 基于卷积神经网络和高斯混合模型的轴承故障诊断方法 | |
CN107169598A (zh) | 一种基于深度学习的天气预测方法及系统 | |
CN109165275B (zh) | 基于深度学习的智能变电站操作票信息智能搜索匹配方法 | |
CN112926641A (zh) | 基于多模态数据的三阶段特征融合旋转机械故障诊断方法 | |
CN111127423B (zh) | 一种基于cnn-bp神经网络算法水稻病虫害识别方法 | |
CN114092832A (zh) | 一种基于并联混合卷积网络的高分辨率遥感影像分类方法 | |
CN108470022A (zh) | 一种基于运维管理的智能工单质检方法 | |
CN112330050A (zh) | 一种基于双层XGBoost考虑多特征的电力系统负荷预测方法 | |
CN113283547B (zh) | 一种基于多任务深度学习的最优潮流计算方法 | |
WO2023019698A1 (zh) | 基于富上下文网络的高光谱图像分类方法 | |
CN111652835A (zh) | 基于深度学习与聚类的输电线路绝缘子缺失的检测方法 | |
CN107808375A (zh) | 融合多种上下文深度学习模型的水稻病害图像检测方法 | |
WO2024087128A1 (zh) | 针对航空发动机剩余使用寿命预测的多尺度混杂注意力机制建模方法 | |
CN112763215B (zh) | 一种基于模块化联邦深度学习的多工况在线故障诊断方法 | |
CN107016440B (zh) | 机械传动故障的多分辨率深度神经网络智能诊断方法 | |
CN116861343A (zh) | 一种轴承故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |