CN114358123A - 一种基于深度对抗迁移网络的广义开放集故障诊断方法 - Google Patents
一种基于深度对抗迁移网络的广义开放集故障诊断方法 Download PDFInfo
- Publication number
- CN114358123A CN114358123A CN202111470692.2A CN202111470692A CN114358123A CN 114358123 A CN114358123 A CN 114358123A CN 202111470692 A CN202111470692 A CN 202111470692A CN 114358123 A CN114358123 A CN 114358123A
- Authority
- CN
- China
- Prior art keywords
- domain
- sample
- target domain
- source domain
- discriminator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000013508 migration Methods 0.000 title claims abstract description 46
- 230000005012 migration Effects 0.000 title claims abstract description 44
- 238000003745 diagnosis Methods 0.000 title claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 31
- 230000009977 dual effect Effects 0.000 claims abstract description 11
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000011478 gradient descent method Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 63
- 238000009826 distribution Methods 0.000 claims description 37
- 230000003042 antagnostic effect Effects 0.000 claims description 25
- 238000012360 testing method Methods 0.000 claims description 23
- 239000004576 sand Substances 0.000 claims description 11
- 238000005315 distribution function Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000001133 acceleration Effects 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 241001504469 Anthus Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000002902 bimodal effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000004901 spalling Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于深度对抗迁移网络的广义开放集故障诊断方法,包括步骤:分别采集旋转机械在某工况下的带有标签样本的原始振动信号,同时从不同的运行工况获得无标签的故障样本,构建源域和目标域样本集;构建具有双加权机制的深度对抗迁移网络,包括特征提取器、领域判别器、非对抗领域判别器和多分类集成学习器;利用源域数据集采用梯度下降法对特征提取器的参数以及多分类集成学习器的参数进行联合优化训练;通过对偶权重进行加权训练;通过计算所得权重值判别数据是否属于新故障类别,输出最终诊断结果。本发明通过深度对抗迁移网络,利用双加权机制减少源域和目标域新故障类别对特征匹配的影响,实现对广义的开放集新故障任务诊断。
Description
技术领域
本发明属于旋转机械智能故障诊断领域,具体涉及一种基于深度对抗迁移网络的广义开放集故障诊断方法。
背景技术
基于深度对抗迁移学习的机械旋转系统故障识别网络,在不同迁移诊断任务中均取得良好的分类效果,为故障诊断的智能化提供了有效的处理方案。在实际应用中,设备损坏前大多没有前兆,使得机械故障产生具有突发性,采集到的故障数据种类较少且可能出现新故障类别,因此目标域所含故障类别通常无法知晓。针对故障的偶发性,可能导致领域迁移问题中源域与目标域的故障类别空间交叉,即两域均含有私有故障类型的情况。而现有方法在进行两域适配时,较容易受到不相干类别样本的影响,有可能产生负迁移问题,导致智能故障诊断模型性能较差。
从智能诊断的角度来看,在工业生产过程中收集异常状态的数据较为困难,并且,复杂的机械系统工作环境恶劣,存在强噪声、变载荷以及多工况等情况,导致故障类别多变,两域的公共故障标签集无法事先知晓。
林京等在中国发明专利“基于部分迁移卷积网络的机械设备智能故障诊断方法”中构建了两个独立的一维卷积神经网络,利用源域数据进行训练,并对目标域数据进行预测,通过获得的样本的标签分布,得到分布权重,对卷积神经网络进行修正,所构建的模型可以迁移大型标签源域数据到小型无标签目标域测试数据。然而上述方法假定,源域数据的标签类别是大于目标域标签类别,并且假定目标域类别是源域类别的一个子类;而实际工业环境中,目标域类别由于无标签,因而可能同时存在与源域相同的共享类别和新的故障类别,因而,表现在源域和目标域不仅有共享的类别,同时各自都有新的故障类别,上述发明无法解决这个对新的故障类别进行诊断。
发明内容
为了解决现有技术存在的问题,本发明设计了一种基于深度对抗迁移网络的广义开放集故障诊断方法,提出深度对抗迁移网络(Deep Adversarial Transfer Network,DATN)。所述方法通过特征提取器,提取源域和目标域数据的高维特征,利用多分类集成学习器学习样本不同类别;并利用领域判别器学习两域的域不变特征,减小两域分布差异,进行特征分布匹配;同时,设计了一种双权重加权判别机制,评估源域样本数据与目标域样本的相似程度,通过双加权训练,有效实现多变工况下的机械设备已知故障诊断和未知故障判别。
为了实现前述发明目的,本发明提供的一种基于深度对抗迁移网络的广义开放集故障诊断方法,包括以下步骤:
步骤1:分别采集机械设备在不同运行工况下的振动加速度信号,并对长的时域信号进行截断来构成样本,基于不同的故障类别进行标注,获得大量的源域样本数据集{xs,ys},包括源域数据xs及其对应标签ys,在不同工况下获取目标域样本数据集{xt},其由不带标签的目标域数据xt构成;
步骤2:构建具有双加权机制的深度对抗迁移网络,包括:特征提取器G、多分类集成学习器领域判别器D和非对抗领域判别器D′,K为分类器的数目,其中,特征提取器G用于从输入数据中提取特征,多分类集成学习器用于对输入数据采用多个不同参数结构的分类器进行分类,从而对同一输入样本获得多个不同的预测结果,领域判别器D用于在对抗训练阶段中对来自源域的样本和目标域样本进行判别,非对抗领域判别器D′用于对来自源域样本和目标域的样本进行二分类,且其不参与对抗训练,其中,所述双加权机制为构建源域权重和目标域权重来分别对深度对抗迁移网络的对偶加权损失函数进行加权;
步骤4:在对抗学习阶段,利用训练的特征提取器G和多分类集成学习器对目标域数据采用集成学习的投票方法进行预测,利用非对抗领域判别器D′对源域数据xs和目标域数据xt进行判别,从而获得训练阶段的源域权重函数ws和目标域权重函数wt,通过获取的对偶权重进行加权训练;
步骤5:在测试阶段,输入测试样本,将获得对应的目标域权重函数与设定的阈值进行对比,判断该样本属于已知故障还是新故障。
进一步地,步骤1中,源域数据是有标签样本,目标域数据是无标签样本,两域的数据特征分布不同,即p(xs)≠q(xt);且两域的类别空间不同Cs≠Ct,并且定义,两者共享的公共类标签集为C=Cs∩Ct,源域享有的私有标签集为目标域享有的私有标签集为
本发明通过构建新颖的深度对抗迁移网络,利用双加权机制对源域和目标域中不同类别的样本进行自适应度量,在域适配阶段,可有效减少源域和目标域新故障类别对特征匹配的影响,实现对广义的开放集新故障任务诊断。
进一步地,步骤2中所构建的特征提取器G,多分类集成学习器领域判别器D,非对抗领域判别器D′,分别都采用了一维卷积神经网络和全连接结构,其中多分类集成学习器可以采用不同的网络结构,同时每个分类器输出层既可采用Softmax也可采用Softmax输出函数,从而进行网络多样性学习;特别的,领域判别器D和非对抗领域判别器D′两者采用不同的结构及参数,输出层都采用Sigmoid输出函数。
式中,Ls表示标准的交叉熵损失函数,ys表示标签样本,Ck(G(xs))表示第k个分类器输出的类别。
式中,Ls表示标准的交叉熵损失函数,ys表示标签样本,Ck(G(xs))表示第k个分类器输出的类别。
同时构建非对抗领域判别器D′,它的目标是要使得源域的样本预测为1,目标域的样本预测为0,量化每个样本的域相似度,其对应的损失函数:
进一步的,构建领域对抗判别器D的用于区分源域和目标域内来自于公共类标签集C的数据,由于源域和目标域都存在异常样本,因此,享有对抗网络损失函数不可用,因此,引入源域权重和目标域权重,对源域样本和目标域样本的相似程度分别进行度量,进而构建对抗网络加权损失函数,可表示为:
式中wt(xt)是目标域权重函数,表示目标域样本属于公共类标签集C的概率。
因而,最终上述三个损失函数的优化过程可以总结为:
进一步地,步骤4对源域权重函数和目标域权重函数进行进一步定义和计算。
对于源域标签集Cs,目标域公共类标签集C及目标域私有标签集预测的不确定性为对于源域样本,由于源域与目标域包含公共类标签集C,若xs,xt∈C,(xs~pc,xt~qc),数据分布pc、qc在一定程度上具有相似性,在训练过程中,网络对目标域样本预测的不确定性较高,则其熵值较大。因此,xs~pC受到xt~qC的预测高熵值的影响,使得值变大。由于源域私有标签集数据与目标域数据没有交集,及因此不受目标域数据的影响,其可靠性较高。故可得 表示目标域中私有标签数据概率输出后所求熵的平均值,表示目标域中公共类标签数据概率输出后所求熵的平均值,表示源域中公共类标签数据概率输出后所求熵的平均值,表示源域中私有类标签数据概率输出后所求熵的平均值,pc和分别表示源域中公共类标签和私有标签数据的概率分布函数,qc和表示目标域中公共类标签和私有标签数据的概率分布函数。
对于源域与目标域标签预测的不确定性,其熵值大小如下所示。
同时,对于源域标签集Cs,目标域公共类标签集C及私有标签集的域相似度大小为由于xs,xt∈C,(xs~pc,xt~qc),两者共用相同的类别标签集,xs~pC相比于在一定程度上更接近于xt~qC,而由于为源域私有类,不受目标域数据的影响,故可得
对于源域与目标域样本的域相似度,其熵值大小如下所示。
根据预测的不确定性及域相似度的分析,目标域的加权计算可以表示为:
其中,由于标签预测的不确定性通过标准的交叉熵函数计算,因此,需进行最大值归一化(log|Cs|),由于两域的公共类标签集C及目标域类别标签集Ct未知,因此采用源域类别标签集Cs进行计算,将数值转换至[0,1]的范围之间。对于ws(x),由于xs,xt∈C,(xs~pc,xt~qc),两者标签类别空间一致,在一定程度上存在相似性。对于源域样本,若xs∈C,由于受到xt~qC的影响,其ws(x)较大,即在进行加权训练时,将源域中属于公共类标签集C的样本赋予较大的权重值,将源域私有类别样本赋予较小值,从而减小源域私有类别的影响。
进一步地,步骤5在于,在网络训练测试过程中,对每个输入样本都进行了权重计算,最终通过建立双高斯分布网络,对每个样本所属类别判定,从而实现已知故障和新故障的诊断。
通过构建多个轴承及齿轮的目标域数据,并对其权重值进行分析,可知目标域样本的权重呈现双峰分布。故对目标域的权重进行探讨分析,可能是由于目标域中含有共享类别及私有类别,由上一节分析可知,目标域中xt∈C,较大;对于 较小,可合理地假设图中左侧峰为目标域中私有类的权重值,右侧峰为目标域中共享类的权重值。因此假设目标域的权值wt是二维的随机变量,维度分别为w1,w2,且每个维度都服从高斯分布,即其中μi,表示wi维度上的期望和方差。因此,将目标域的权值wt分布看作为由两个独立高斯分布叠加而成,故通过双高斯分布拟合找寻两峰高斯分布的均值μ1,μ2,高斯函数和双高斯分布拟所示,
其中,f1(x),f2(x)为两个独立的高斯函数。通过自动选择两峰均值μ1,μ2中较小值,将其设定为网络的权重阈值,即w0=μmin=min(μ1,μ2)。
与现有技术相比,本发明的有益效果至少如下:
1、本发明以一维卷积神经网络为基础结构,以对抗学习技术为关键技术,以双加权学习机制(通过构建源域权重和目标域权重分别对深度对抗迁移网络的对抗损失函数进行加权)为核心,构建了一种端到端的广义域新故障诊断方法,直接实现从网络到输出的已知类故障检测和新故障识别,有效提升了诊断方法的智能性、有效性和鲁棒性。
2、本发明构建了一种新颖的广义域新故障诊断方法,相比现有方法只考虑源域类别空间是目标域类别空间一个子集情况,所提方法,进一步假定源域类别空间还含有私有的类别,更加符合实际的工业情况。
3、本发明构建了一种新颖的多分类集成学习器,相比传统只采用一个单一分类器对网络进行分类,本发明引入集成学习思想,通过训练多个不同参数结构的分类器对不确定具体类别的目标域数据进行判别,并做加权平均,有效的克服了现有单一分类器方法在鲁棒性方面的不足。
4、本发明设计了新颖的具有双加权学习机制的深度对抗迁移网络,通过构建了针对源域异常样本和目标域样本的权重度量函数,自适应度量每个样本的相似程度和可迁移性,有效克服了现有方法只能滤除单一目标域异常样本的不足,提升了该方法的适应范围。
5、在实际工业环境中,通常很容易通过试验、仿真的获得大量的有标签的故障类别样本,然而在实际工业环境中,获取的故障类型大部分是未知的,同时样本比较稀缺,因而,实际工业环境中,很容易出现源域样本(试验、仿真获取)与目标域样本(工业现场获取)存在大的域迁移,同时,源域样本和目标域样本通常容易包含一些共享故障类,同时也容易出现各域都有一些私有类别,本发明构建的网络通过引入迁移学习技术,克服了上述两点问题的局限性,为多变工况下新故障检测提供了一种新颖的解决途径。
附图说明
图1是本发明方法的故障诊断流程图。
图2是本发明方法的特征提取器G的结构示意图。
图3是本发明方法的深度对抗迁移网络的网络框架示意图。
具体实施方式
为了使本发明的技术方案和目的更加的清楚明白,下面结合附图和具体实施步骤对本发明进行详细说明,应当理解,此处所描述的具体实施步骤只用于更好的阐述本发明的应用,但本发明的实施方式所涉及到的技术特征不限于此。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都是本发明保护的范围。
本发明针对两域新故障识别的迁移任务,构建了深度对抗迁移网络,设计源域私有类别的加权策略,同时建立了多个分类器,对输入进行预测,从而获得多个预测结果,通过对多个预测结果进行平均,获得均值输出结果,在一定程度上缓解网络输出置信度过高造成误分类的问题,并利用高斯分布拟合方法自动选定权重阈值,实现对目标域的有效诊断。
请参阅图1,本发明提供的一种基于深度对抗迁移网络(Deep AdversarialTransfer Network,DATN)的无监督旋转机械广义开放集故障诊断方法,该方法包括步骤:
步骤1:数据集采集与构建,分别采集机械设备在不同运行工况下的振动加速度信号,并通过对长的时域信号进行截断来构成样本,基于不同的故障类别进行标注,获得大量的源域样本数据集{xs,ys},源域样本数据集由源域数据xs及其对应标签ys构成。在不同工况下获取目标域样本数据集{xt},其由不带标签的目标域数据xt构成。
在本发明的其中一些实施例中,步骤1中,源域数据是有标签样本,目标域数据是无标签样本,两域的数据特征分布不同,即p(xs)≠q(xt);且两域的类别空间不同Cs≠Ct,并且定义,源域和目标域共享的公共类标签集为C=Cs∩Ct,源域享有的私有标签集为目标域享有的私有标签集为
步骤2:构建具有双加权机制的深度对抗迁移网络,用于对已知类故障和新故障进行检测,包括:特征提取器G,用于提取输入数据的高维特征;多分类集成学习器对输入数据采用多个不同参数结构的分类器进行分类,从而可对同一样本输入获得多个不同的预测结果,K为分类器的数目;领域判别器D,在对抗训练阶段对来自源域的样本和目标域样本进行判别;非对抗领域判别器D′,对来自源域样本和目标域的样本进行二分类,其不参与对抗训练。
在本发明的其中一些实施例中,请参阅图2,步骤2中所构建的特征提取器G由一维卷积神经网络构成。
在本发明的其中一些实施例中,多分类集成学习器领域判别器D和非对抗领域判别器D′均由全连接结构构成,其中多分类集成学习器中的每个学习器可以分别采用不同数目的全连接层数,同时每个分类器输出层既可采用Softmax也可采用Sigmoid输出函数,从而进行网络多样性学习。
在本发明的其中一些实施例中,领域判别器D由一个全连接层构成,而非对抗领域判别器D′由两个全连接层构成,中间嵌入Dropout结构,以减少网络的过拟合风险,并提高其特征学习能力,领域判别器D和非对抗领域判别器D′的输出层均采用Sigmoid输出函数。
步骤3:利用步骤1构建的源域数据集{xs,ys},采用梯度下降法对特征提取器G的参数,以及多分类集成学习器的参数进行联合优化训练。在训练阶段,通过特征提取器将源域与目标域数据映射到高维特征空间中,提取高维特征,利用领域判别器学习两域的域不变特征,以减小两域分布差异。
式中,EG为对应的具有多分类器结构的监督损失函数,Ls表示标准的交叉熵损失函数,ys表示标签样本,Ck(G(xs))表示第k个分类器输出的类别。表示所有源域样本的交叉熵损失平均值,G(xs)表示特征提取器对源域样本提取的高维特征。
构建的非对抗领域判别器D′的目标是要使得源域的样本预测为1,目标域的样本预测为0,量化每个样本的域相似度,其对应的损失函数:
式中,ED′为非对抗领域判别器损失函数,表示非对抗领域判别器获得的所有源域样本输出平均值,D′(G(xs))表示非对抗领域判别器在源域样本输入下的概率输出,表示非对抗领域判别器获得的所有目标域样本输出平均值,D′(G(xt))表示非对抗领域判别器在目标域样本输入下的概率输出,G(xt)表示特征提取器对目标域样本提取的高维特征。
在本发明的其中一些实施例中,构建领域对抗判别器D的用于区分源域和目标域内来自于公共类标签集C的数据,由于源域和目标域都存在异常样本,因此,享有对抗网络损失函数不可用,因此,引入源域权重和目标域权重,对源域样本和目标域样本的相似程度分别进行度量,进而构建对抗网络的对偶加权损失函数Ew,可表示为:
式中,ws(xs)是源域权重函数,wt(xt)是目标域权重函数,表示目标域样本属于公共类标签集C的概率。D(G(xs))表示领域判别器在源域样本输入下的概率输出、D(G(xt))表示领域判别器在目标域样本输入下的概率输出。
因而,最终上述三个损失函数的优化过程可以总结为:
步骤4:在对抗学习阶段,利用训练的特征提取器G和多分类集成学习器对目标域数据采用集成学习的投票方法进行预测,利用非对抗领域判别器D′对源域数据xs和目标域数据xt进行判别,从而获得训练阶段的源域权重函数ws(x)和目标域权重函数wt(x);通过获取的对偶权重进行加权训练。
针对源域和目标域类别标签不对齐:两域各自包含了私有故障类别,对网络共享类适配的干扰,本步骤设计多分类器集成学习器和非对抗领域判别器的权重学习网络,构建对应的对偶加权判别机制,评估目标域样本数据与源域数据的相似程度,从而有效改进故障的分类性能。
在本发明的其中一些实施例中,对于多分类集成学习器对输入样本进行预测,从而获得多个预测结果,通过对多个预测结果进行平均,获得均值输出结果,从而有效避免只使用单一分类器结果对样本进行预测,导致的预测偏差;而所构建的多分类集成学习器充分利用了多个不同学习器的学习知识,通过集成学习的方式,将多个分类器的预测结果进行组合,通过平均投票表决的方式,获得一个最终的预测结果,可明显提高分类器对该样本预测的置信度;对于多分类集成学习器根据输入样本获得类别标签G(x)代表特征提取器对输入样本x提取的特征,Ck(G(x))代表第k个分类器对输入的特征G(x)进行分类,并采用信息熵理论,计算目标域样本的熵值
对于源域标签集Cs,目标域公共类标签集C及目标域私有标签集预测的不确定性为对于源域样本,由于源域与目标域包含公共类标签集C,若xs,xt∈C,(xs~pc,xt~qc),数据分布pc、qc在一定程度上具有相似性,在训练过程中,网络对目标域样本预测的不确定性较高,则其熵值较大。因此,xs~pC受到xt~qC的预测高熵值的影响,使得值变大。由于源域私有标签集数据与目标域数据没有交集,及因此不受目标域数据的影响,其可靠性较高。故可得 表示目标域中私有标签数据概率输出后所求熵的平均值,表示目标域中公共类标签数据概率输出后所求熵的平均值,表示源域中公共类标签数据概率输出后所求熵的平均值,表示源域中私有类标签数据概率输出后所求熵的平均值,pc和分别表示源域中公共类标签和私有标签数据的概率分布函数,qc和表示目标域中公共类标签和私有标签数据的概率分布函数。
对于源域与目标域标签预测的不确定性,其熵值大小如下所示:
同时,对于源域标签集Cs,目标域公共类标签集C及私有标签集的域相似度大小为由于xs,xt∈C,(xs~pc,xt~qc),两者共用相同的类别标签集,xs~pC相比于在一定程度上更接近于xt~qC,而由于为源域私有类,不受目标域数据的影响。故可得 表示多个分类器输出求和后获得的熵值;表示源域中标签数据概率输出后所求熵的平均值;表示源域中公共类标签数据概率输出后所求熵的平均值、表示源域中私有类标签数据概率输出后所求熵的平均值、表示目标域中公共类标签数据概率输出后所求熵的平均值、表示目标域中私有类标签数据概率输出后所求熵的平均值。
对于源域与目标域样本的域相似度,其熵值大小如下所示。
根据预测的不确定性及域相似度的分析,源域和目标域的加权计算可以表示为:
其中,由于标签预测的不确定性通过标准的交叉熵函数计算,因此,需进行最大值归一化(log|Cs|),由于两域的公共类标签集C及目标域类别标签集Ct未知,因此采用源域类别标签集Cs进行计算,将数值转换至[0,1]的范围之间。对于ws(x),由于xs,xt∈C,(xs~pc,xt~qc),两者标签类别空间一致,在一定程度上存在相似性。对于源域样本,若xs∈C,由于受到xt~qC的影响,其ws(x)较大,即 代表源域公共类标签数据下求得的权重、代表源域私有类标签数据下求得的权重,在进行加权训练时,将源域中属于公共类标签集C的样本和私有类的样本自适应赋予相应的权重值,从而减小源域私有类别的影响。最终,网络通过在特征提取器和领域判别器之间插入的一个梯度反转层(GRL层),采用端到端的反向传播方式和梯度下降法,对模型参数进行更新。
步骤5:在测试阶段,输入测试样本,将获得对应的目标域权重函数与设定的阈值进行对比,判断该样本属于已知故障还是新故障。
步骤5中,在网络训练测试过程中,对每个输入样本都进行了权重计算,最终通过建立双高斯分布网络,对每个样本所属类别判定,从而实现已知故障和新故障的诊断。
在本发明的其中一些实施例中,步骤5在于,在网络训练测试过程中,对每个输入样本都进行权重计算,为了有效确定测试阶段目标域权重所要选取的阈值大小,同时避免人工通过经验选取阈值,对专业知识的依赖和导致的“因人而异”问题,本发明通过建立双高斯分布函数,通过对样本的权重值进行双高斯函数拟合获得最优的设定的阈值,根据自适应获取的阈值,所构建的深度对抗迁移网络可以对每个样本所属类别判定,从而实现已知故障和新故障的诊断。
通过构建多个轴承及齿轮的目标域数据,并对其权重值进行分析,可知目标域样本的权重呈现双峰分布。故对目标域的权重进行探讨分析,可能是由于目标域中含有共享类别及私有类别,由于目标域中xt∈C,较大;对于 较小,和分别代表目标域公共类和私有类数据下求得的权重,可获得具有两个波峰的高斯函数图,可以假定第一个峰值为目标域中私有类的权重值,第二个峰值为目标域中共享类的权重值。因此假设目标域的权值wt是二维的随机变量,维度分别为w1,w2,且每个维度都服从高斯分布,即N代表高斯分布;其中μi,表示wi维度上的期望和方差。因此,将目标域的权值wt分布看作为由两个独立高斯分布叠加而成,故通过双高斯分布拟合找寻两峰高斯分布的均值μ1,μ2,高斯函数和双高斯分布拟所示,
其中,f1(x),f2(x)为两个独立的高斯函数。通过自动选择两峰均值μ1,μ2中的较小值,将其设定为深度对抗迁移网络测试阶段的的目标域权重阈值,即w0=μmin=min(μ1,μ2)。A表示高斯分布函数的幅值,xi表示拟合高斯分布的样本值,σ表示高斯分布下样本拟合的标准差;A1和A2分别表示第一个和第二个待拟合的高斯分布函数的幅值,σ1和σ2表示第一个和第二个高斯分布下样本拟合的标准差。
为了对所提的网络模型进行评估,针对不同的齿轮及轴承复合故障状态,采集不同工况下的齿轮数据集进行验证。齿轮箱故障数据采集自汽车传动试验台的五档变速箱,被试齿轮箱为SG135-2汽车变速器。加速度传感器放置于壳体输出轴承座上,设置采样频率为24kHz,输入转速分别设定为1000rpm和1250rpm,输出轴负载情况分别设定为:无负载(0N.m)、50N.m。齿轮箱故障通过线切割机器进行加工,共设置加工了6种不同的健康状况,如表1所示,分别为齿轮正常_内圈正常、齿轮正常_内圈故障、五档断齿_内圈正常、五档断齿_内圈故障、二档剥落_内圈正常、二档剥落_内圈故障。
表1齿轮箱试验变量设置
为了验证所提方法DATN的有效性和优越性,将其与通用领域适配方法CMU及所构建诊断方法(WAN)进行比较。
进行跨转速故障诊断试验:
(1)试验设置
本节针对不同转速构建源域与目标域数据集,对原始振动信号进行切割,对于每种故障状态,每个样本提取2048个数据点,并通过傅里叶变换(FFT)将提取的振动信号变换到频域得到1024个数据点,每个复合故障类型均获取500个信号样本,共设计了3个跨转速的迁移任务,S1表示源域数据集,T1、T2、T3分别表示3个迁移任务所对应的目标域数据集,如表2所示。
表2齿轮箱数据类别设置
表3三种跨转速的迁移学习任务
以试验一为例,S1为源域数据集,包含4中齿轮状态(即类别标签为中1/2/3/4),其振动信号采集自转速/负载为1000rpm/0N.m的工况下;而T1为目标域数据集,包含4种齿轮状态(即类别标签为中1/3/4/5)。源域与目标域的公共标签集C=(1,3,4),源域私有类为目标域的私有类为两域的相似性指数为ξ=0.6。
(2)试验结果分析
为了试验的公平性,各诊断方法的特征提取部分都采用相同的结构。对所构建的三种跨转速的迁移任务进行试验,进行网络性能比较,表4所示为每个迁移任务的总体诊断准确率及H-score值。
表4仅跨转速试验诊断结果
在三个迁移试验中,综合考虑总体分类准确率及H-score值,本发明所提方法DATN取得了最好的结果,三个迁移任务的总体准确率均高于90%,同时其H-score值也达到了三者之最,平均E-sccore值达到了85%。而另外两种比对方法,对于H-score指标,CMU诊断方法的总体效果优于网络WAN,这是由于CMU网络在进行领域迁移时,对目标域样本类别进行类别的同时,对源域样本也采取了一定的分析判别;而对于总体诊断准确率,WAN诊断方法准确率高于CMU,这是由于在构建两域数据集时,目标域私有类别所占比例较小,仅占样本总数的1/4或1/5,因此在进行诊断分类的过程中,若目标域中私有类判别效果较差,对总体诊断准确率较小。本发明所提方法DATN在具有较高的总体分类准确率的同时,对于目标域共享类及私有类的分类精度也是最高的。
对于跨转速的迁移试验,本发明所提诊断方法在各个诊断任务上都具有最佳的诊断性能,且其优势较为明显,表明DATN在进行两域类别交叉的迁移任务时,其采用对抗学习,权值判别,自动选择阈值,可以有效的减小源域中不相干类别的影响,判别目标域新故障类别,从而提高了各方面的诊断精度。
本发明针对在进行不同工况故障诊断时,存在的数据分布不一致、目标域任务带有新故障类别且无标签的问题,以滚动轴承故障研究对象,通过利用深度对抗卷积神经网络,来有效将带标签源域诊断知识迁移到无标签目标域,所提方法有效的改进了工业设备的故障诊断能力。
需要说明的是,虽然已经参照实例对本发明实施进行了详细的阐述,但本领域的技术人员容易理解,在不偏离所附权利要求中所阐述的本发明的精神和原则之内所作的任何修改、替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于深度对抗迁移网络的广义开放集故障诊断方法,其特征在于,包括以下步骤:
步骤1:分别采集机械设备在不同运行工况下的振动加速度信号,并对长的时域信号进行截断来构成样本,基于不同的故障类别进行标注,获得大量的源域样本数据集{xs,ys},包括源域数据xs及其对应标签ys,在不同工况下获取目标域样本数据集{xt},其由不带标签的目标域数据xt构成;
步骤2:构建具有双加权机制的深度对抗迁移网络,包括:特征提取器G、多分类集成学习器领域判别器D和非对抗领域判别器D′,K为分类器的数目,其中,特征提取器G用于从输入数据中提取特征,多分类集成学习器用于对输入数据采用多个不同参数结构的分类器进行分类,从而对同一输入样本获得多个不同的预测结果,领域判别器D用于在对抗训练阶段中对来自源域的样本和目标域样本进行判别,非对抗领域判别器D′用于对来自源域样本和目标域的样本进行二分类,且其不参与对抗训练,其中,所述双加权机制为构建源域权重和目标域权重来分别对深度对抗迁移网络的对偶加权损失函数进行加权;
步骤4:在对抗学习阶段,利用训练的特征提取器G和多分类集成学习器对目标域数据采用集成学习的投票方法进行预测,利用非对抗领域判别器D′对源域数据xs和目标域数据xt进行判别,从而获得训练阶段的源域权重函数ws和目标域权重函数wt,通过获取的对偶权重进行加权训练;
步骤5:在测试阶段,输入测试样本,将获得对应的目标域权重函数与设定的阈值进行对比,判断该样本属于已知故障还是新故障。
2.根据权利要求1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法,其特征在于,领域判别器D包括一个全连接层,领域判别器D的输出层都采用Sigmoid输出函数。
3.根据权利要求1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法,其特征在于,非对抗领域判别器D′包括两个全连接层,中间嵌入Dropout结构,输出层采用Sigmoid输出函数。
5.根据权利要求1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法,其特征在于,步骤2中所述对抗损失函数为:
引入源域权重和目标域权重,对源域样本和目标域样本的相似程度分别进行度量,进而构建对偶加权损失函数Ew,表示为:
式中,EG为对应的具有多分类器结构的监督损失函数,表示所有源域样本的交叉熵损失平均值,Ls表示标准的交叉熵损失函数,ys表示标签样本,Ck(G(xs))表示第k个分类器输出的类别,表示所有源域样本的交叉熵损失平均值,G(xs)表示特征提取器对源域样本提取的高维特征;
构建非对抗领域判别器D′,它的目标是要使得源域的样本预测为1,目标域的样本预测为0,量化每个样本的域相似度,其对应的损失函数:
式中,ED′为非对抗领域判别器损失函数,表示非对抗领域判别器获得的所有源域样本输出的平均值,D′(G(xs))表示非对抗领域判别器在源域样本输入下的概率输出,表示非对抗领域判别器获得的所有目标域样本输出平均值,D′(G(xt))表示非对抗领域判别器在目标域样本输入下的概率输出;
因此,进行联合训练的优化过程为:
9.根据权利要1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法,其特征在于,步骤4在进行加权训练时,将源域中属于公共类标签集C的样本和私有类的样本自适应赋予相应的权重值。
10.根据权利要1-9任一所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法,其特征在于,步骤5中所述设定的阈值的确定方式为:
式中,f(x)为高斯函数,g(x)为双高斯分布,xi表示拟合高斯分布的样本值,μ为高斯分布的均值,目标域的权值wt分布看作为由两个独立高斯分布叠加而成,μ1,μ2分别为两峰高斯分布的均值,A表示高斯分布函数的幅值,σ表示高斯分布下样本拟合的标准差,f1(x),f2(x)为两个独立的高斯函数,A1和A2分别表示第一个和第二个待拟合的高斯分布函数的幅值,σ1和σ2表示第一个和第二个高斯分布下样本拟合的标准差;
选择两峰均值μ1,μ2中的较小值作为设定的阈值,即w0=μmin=min(μ1,μ2)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111470692.2A CN114358123B (zh) | 2021-12-03 | 2021-12-03 | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111470692.2A CN114358123B (zh) | 2021-12-03 | 2021-12-03 | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114358123A true CN114358123A (zh) | 2022-04-15 |
CN114358123B CN114358123B (zh) | 2024-04-26 |
Family
ID=81097290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111470692.2A Active CN114358123B (zh) | 2021-12-03 | 2021-12-03 | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114358123B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114863209A (zh) * | 2022-04-21 | 2022-08-05 | 中国科学技术大学 | 类别比例引导的无监督领域适应建模方法、系统、设备及介质 |
CN116030304A (zh) * | 2023-01-09 | 2023-04-28 | 宁波拾烨智能科技有限公司 | 基于加权判别与多分类器的跨域遥感影像对抗迁移方法 |
CN116150668A (zh) * | 2022-12-01 | 2023-05-23 | 中国矿业大学 | 一种基于双级对齐部分迁移网络的旋转设备故障诊断方法 |
CN116340833A (zh) * | 2023-05-25 | 2023-06-27 | 中国人民解放军海军工程大学 | 基于改进领域对抗式迁移网络的故障诊断方法 |
CN117435916A (zh) * | 2023-12-18 | 2024-01-23 | 四川云实信息技术有限公司 | 航片ai解译中的自适应迁移学习方法 |
CN117892183A (zh) * | 2024-03-14 | 2024-04-16 | 南京邮电大学 | 一种基于可靠迁移学习的脑电信号识别方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376620A (zh) * | 2018-09-30 | 2019-02-22 | 华北电力大学 | 一种风电机组齿轮箱故障的迁移诊断方法 |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
-
2021
- 2021-12-03 CN CN202111470692.2A patent/CN114358123B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376620A (zh) * | 2018-09-30 | 2019-02-22 | 华北电力大学 | 一种风电机组齿轮箱故障的迁移诊断方法 |
CN112183581A (zh) * | 2020-09-07 | 2021-01-05 | 华南理工大学 | 基于自适应迁移神经网络的半监督机械故障诊断方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114863209A (zh) * | 2022-04-21 | 2022-08-05 | 中国科学技术大学 | 类别比例引导的无监督领域适应建模方法、系统、设备及介质 |
CN114863209B (zh) * | 2022-04-21 | 2023-10-20 | 中国科学技术大学 | 类别比例引导的无监督领域适应建模方法、系统、设备及介质 |
CN116150668A (zh) * | 2022-12-01 | 2023-05-23 | 中国矿业大学 | 一种基于双级对齐部分迁移网络的旋转设备故障诊断方法 |
CN116150668B (zh) * | 2022-12-01 | 2023-08-11 | 中国矿业大学 | 一种基于双级对齐部分迁移网络的旋转设备故障诊断方法 |
CN116030304A (zh) * | 2023-01-09 | 2023-04-28 | 宁波拾烨智能科技有限公司 | 基于加权判别与多分类器的跨域遥感影像对抗迁移方法 |
CN116340833A (zh) * | 2023-05-25 | 2023-06-27 | 中国人民解放军海军工程大学 | 基于改进领域对抗式迁移网络的故障诊断方法 |
CN116340833B (zh) * | 2023-05-25 | 2023-10-13 | 中国人民解放军海军工程大学 | 基于改进领域对抗式迁移网络的故障诊断方法 |
CN117435916A (zh) * | 2023-12-18 | 2024-01-23 | 四川云实信息技术有限公司 | 航片ai解译中的自适应迁移学习方法 |
CN117435916B (zh) * | 2023-12-18 | 2024-03-12 | 四川云实信息技术有限公司 | 航片ai解译中的自适应迁移学习方法 |
CN117892183A (zh) * | 2024-03-14 | 2024-04-16 | 南京邮电大学 | 一种基于可靠迁移学习的脑电信号识别方法及系统 |
CN117892183B (zh) * | 2024-03-14 | 2024-06-04 | 南京邮电大学 | 一种基于可靠迁移学习的脑电信号识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114358123B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114358123B (zh) | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 | |
CN112308147B (zh) | 基于多源域锚适配器集成迁移的旋转机械故障诊断方法 | |
CN111458142B (zh) | 基于生成对抗网络和卷积神经网络的滑动轴承故障诊断方法 | |
CN110110768B (zh) | 基于并行特征学习和多分类器的滚动轴承故障诊断方法 | |
CN110070060B (zh) | 一种轴承设备的故障诊断方法 | |
CN110567720A (zh) | 非平衡小样本场景下风机轴承故障深度对抗诊断方法 | |
CN111539152B (zh) | 一种基于两级孪生卷积神经网络的滚动轴承故障自学习方法 | |
CN114048568B (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
CN113375941A (zh) | 高速动车组轴承的开集故障诊断方法 | |
CN112257530B (zh) | 基于盲信号分离和支持向量机的滚动轴承故障诊断方法 | |
CN114358124B (zh) | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 | |
CN114358125B (zh) | 一种基于多源信息深度融合的旋转机械故障自动识别方法 | |
CN111275024A (zh) | 含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法 | |
CN116894187A (zh) | 一种基于深度迁移学习的齿轮箱故障诊断方法 | |
CN113505655A (zh) | 面向数字孪生系统的轴承故障智能诊断方法 | |
CN115905976B (zh) | 基于注意力机制的Highway Bi-LSTM轴承故障诊断方法、系统及设备 | |
CN112364706A (zh) | 一种基于类不平衡的小样本轴承故障诊断方法 | |
CN113887136A (zh) | 一种基于改进GAN和ResNet的电动汽车电机轴承故障诊断方法 | |
CN114118138A (zh) | 一种基于多标签领域自适应模型的轴承复合故障诊断方法 | |
CN114169377A (zh) | 基于g-mscnn的有噪环境中滚动轴承故障诊断方法 | |
CN111310719B (zh) | 一种未知辐射源个体识别及检测的方法 | |
CN115221973A (zh) | 一种基于增强加权异质集成学习的航空轴承故障诊断方法 | |
CN115508073A (zh) | 基于多尺度注意力的原型适配机械设备故障诊断方法 | |
CN116401603A (zh) | 一种基于迁移学习的多模态轴承故障智能诊断方法 | |
CN113109782B (zh) | 一种直接应用于雷达辐射源幅度序列的分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |