CN114358123A

CN114358123A - 一种基于深度对抗迁移网络的广义开放集故障诊断方法

Info

Publication number: CN114358123A
Application number: CN202111470692.2A
Authority: CN
Inventors: 陈祝云; 李巍华; 杨万胜; 夏景演; 王汝艮
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2021-12-03
Filing date: 2021-12-03
Publication date: 2022-04-15
Anticipated expiration: 2041-12-03
Also published as: CN114358123B

Abstract

本发明公开了一种基于深度对抗迁移网络的广义开放集故障诊断方法，包括步骤：分别采集旋转机械在某工况下的带有标签样本的原始振动信号，同时从不同的运行工况获得无标签的故障样本，构建源域和目标域样本集；构建具有双加权机制的深度对抗迁移网络，包括特征提取器、领域判别器、非对抗领域判别器和多分类集成学习器；利用源域数据集采用梯度下降法对特征提取器的参数以及多分类集成学习器的参数进行联合优化训练；通过对偶权重进行加权训练；通过计算所得权重值判别数据是否属于新故障类别，输出最终诊断结果。本发明通过深度对抗迁移网络，利用双加权机制减少源域和目标域新故障类别对特征匹配的影响，实现对广义的开放集新故障任务诊断。

Description

一种基于深度对抗迁移网络的广义开放集故障诊断方法

技术领域

本发明属于旋转机械智能故障诊断领域，具体涉及一种基于深度对抗迁移网络的广义开放集故障诊断方法。

背景技术

基于深度对抗迁移学习的机械旋转系统故障识别网络，在不同迁移诊断任务中均取得良好的分类效果，为故障诊断的智能化提供了有效的处理方案。在实际应用中，设备损坏前大多没有前兆，使得机械故障产生具有突发性，采集到的故障数据种类较少且可能出现新故障类别，因此目标域所含故障类别通常无法知晓。针对故障的偶发性，可能导致领域迁移问题中源域与目标域的故障类别空间交叉，即两域均含有私有故障类型的情况。而现有方法在进行两域适配时，较容易受到不相干类别样本的影响，有可能产生负迁移问题，导致智能故障诊断模型性能较差。

从智能诊断的角度来看，在工业生产过程中收集异常状态的数据较为困难，并且，复杂的机械系统工作环境恶劣，存在强噪声、变载荷以及多工况等情况，导致故障类别多变，两域的公共故障标签集无法事先知晓。

林京等在中国发明专利“基于部分迁移卷积网络的机械设备智能故障诊断方法”中构建了两个独立的一维卷积神经网络，利用源域数据进行训练，并对目标域数据进行预测，通过获得的样本的标签分布，得到分布权重，对卷积神经网络进行修正，所构建的模型可以迁移大型标签源域数据到小型无标签目标域测试数据。然而上述方法假定，源域数据的标签类别是大于目标域标签类别，并且假定目标域类别是源域类别的一个子类；而实际工业环境中，目标域类别由于无标签，因而可能同时存在与源域相同的共享类别和新的故障类别，因而，表现在源域和目标域不仅有共享的类别，同时各自都有新的故障类别，上述发明无法解决这个对新的故障类别进行诊断。

发明内容

为了解决现有技术存在的问题，本发明设计了一种基于深度对抗迁移网络的广义开放集故障诊断方法，提出深度对抗迁移网络(Deep Adversarial Transfer Network,DATN)。所述方法通过特征提取器，提取源域和目标域数据的高维特征，利用多分类集成学习器

学习样本不同类别；并利用领域判别器学习两域的域不变特征，减小两域分布差异，进行特征分布匹配；同时，设计了一种双权重加权判别机制，评估源域样本数据与目标域样本的相似程度，通过双加权训练，有效实现多变工况下的机械设备已知故障诊断和未知故障判别。

为了实现前述发明目的，本发明提供的一种基于深度对抗迁移网络的广义开放集故障诊断方法，包括以下步骤：

步骤1：分别采集机械设备在不同运行工况下的振动加速度信号，并对长的时域信号进行截断来构成样本，基于不同的故障类别进行标注，获得大量的源域样本数据集{x_s,y_s}，包括源域数据x_s及其对应标签y_s，在不同工况下获取目标域样本数据集{x_t}，其由不带标签的目标域数据x_t构成；

步骤2：构建具有双加权机制的深度对抗迁移网络，包括：特征提取器G、多分类集成学习器

领域判别器D和非对抗领域判别器D′，K为分类器的数目，其中，特征提取器G用于从输入数据中提取特征，多分类集成学习器

用于对输入数据采用多个不同参数结构的分类器进行分类，从而对同一输入样本获得多个不同的预测结果，领域判别器D用于在对抗训练阶段中对来自源域的样本和目标域样本进行判别，非对抗领域判别器D′用于对来自源域样本和目标域的样本进行二分类，且其不参与对抗训练，其中，所述双加权机制为构建源域权重和目标域权重来分别对深度对抗迁移网络的对偶加权损失函数进行加权；

步骤3：利用源域数据集{x_s,y_s}，采用梯度下降法对特征提取器G的参数以及多分类集成学习器

的参数进行联合优化训练；

步骤4：在对抗学习阶段，利用训练的特征提取器G和多分类集成学习器

对目标域数据采用集成学习的投票方法进行预测，利用非对抗领域判别器D′对源域数据x_s和目标域数据x_t进行判别，从而获得训练阶段的源域权重函数w^s和目标域权重函数w^t，通过获取的对偶权重进行加权训练；

步骤5：在测试阶段，输入测试样本，将获得对应的目标域权重函数与设定的阈值进行对比，判断该样本属于已知故障还是新故障。

进一步地，步骤1中，源域数据是有标签样本，目标域数据是无标签样本，两域的数据特征分布不同，即p(x_s)≠q(x_t)；且两域的类别空间不同C_s≠C_t，并且定义，两者共享的公共类标签集为C＝C_s∩C_t，源域享有的私有标签集为

目标域享有的私有标签集为

本发明通过构建新颖的深度对抗迁移网络，利用双加权机制对源域和目标域中不同类别的样本进行自适应度量，在域适配阶段，可有效减少源域和目标域新故障类别对特征匹配的影响，实现对广义的开放集新故障任务诊断。

进一步地，步骤2中所构建的特征提取器G，多分类集成学习器

领域判别器D，非对抗领域判别器D′，分别都采用了一维卷积神经网络和全连接结构，其中多分类集成学习器

可以采用不同的网络结构，同时每个分类器输出层既可采用Softmax也可采用Softmax输出函数，从而进行网络多样性学习；特别的，领域判别器D和非对抗领域判别器D′两者采用不同的结构及参数，输出层都采用Sigmoid输出函数。

进一步地，步骤3基于特征提取器G，多分类集成学习器

构建分类损失函数：

式中，L_s表示标准的交叉熵损失函数，y_s表示标签样本，C_k(G(x_s))表示第k个分类器输出的类别。

同时构建非对抗领域判别器D′，它的目标是要使得源域的样本预测为1，目标域的样本预测为0，量化每个样本的域相似度，其对应的损失函数：

进一步的，构建领域对抗判别器D的用于区分源域和目标域内来自于公共类标签集C的数据，由于源域和目标域都存在异常样本，因此，享有对抗网络损失函数不可用，因此，引入源域权重和目标域权重，对源域样本和目标域样本的相似程度分别进行度量，进而构建对抗网络加权损失函数，可表示为：

式中w^t(x_t)是目标域权重函数，表示目标域样本属于公共类标签集C的概率。

因而，最终上述三个损失函数的优化过程可以总结为：

进一步地，步骤4对源域权重函数和目标域权重函数进行进一步定义和计算。

对于多分类集成学习器

根据输入样本获得的类别标签

并采用信息熵理论，计算目标域样本的熵值

对于源域标签集C_s，目标域公共类标签集C及目标域私有标签集

预测的不确定性为

对于源域样本，由于源域与目标域包含公共类标签集C，若x_s,x_t∈C,(x_s～p_c,x_t～q_c)，数据分布p_c、q_c在一定程度上具有相似性，在训练过程中，网络对目标域样本预测的不确定性较高，则其熵值较大。因此，x_s～p_C受到x_t～q_C的预测高熵值的影响，使得

值变大。由于源域私有标签集数据与目标域数据没有交集，及

因此

不受目标域数据的影响，其可靠性较高。故可得

表示目标域中私有标签数据概率输出后所求熵的平均值，

表示目标域中公共类标签数据概率输出后所求熵的平均值，

表示源域中公共类标签数据概率输出后所求熵的平均值，

表示源域中私有类标签数据概率输出后所求熵的平均值，p_c和

分别表示源域中公共类标签和私有标签数据的概率分布函数，q_c和

表示目标域中公共类标签和私有标签数据的概率分布函数。

对于源域与目标域标签预测的不确定性，其熵值大小如下所示。

同时，对于源域标签集C_s，目标域公共类标签集C及私有标签集的域相似度大小为

由于x_s,x_t∈C,(x_s～p_c,x_t～q_c)，两者共用相同的类别标签集，x_s～p_C相比于

在一定程度上更接近于x_t～q_C，而由于

为源域私有类，

不受目标域数据的影响，故可得

对于源域与目标域样本的域相似度，其熵值大小如下所示。

根据预测的不确定性及域相似度的分析，目标域的加权计算可以表示为：

其中，由于标签预测的不确定性通过标准的交叉熵函数计算，因此，需进行最大值归一化(log|C_s|)，由于两域的公共类标签集C及目标域类别标签集C_t未知，因此采用源域类别标签集C_s进行计算，将数值转换至[0,1]的范围之间。对于w^s(x)，由于x_s,x_t∈C,(x_s～p_c,x_t～q_c)，两者标签类别空间一致，在一定程度上存在相似性。对于源域样本，若x_s∈C，由于受到x_t～q_C的影响，其w^s(x)较大，即

在进行加权训练时，将源域中属于公共类标签集C的样本赋予较大的权重值，将源域私有类别样本赋予较小值，从而减小源域私有类别的影响。

进一步地，步骤5在于，在网络训练测试过程中，对每个输入样本都进行了权重计算，最终通过建立双高斯分布网络，对每个样本所属类别判定，从而实现已知故障和新故障的诊断。

通过构建多个轴承及齿轮的目标域数据，并对其权重值进行分析，可知目标域样本的权重呈现双峰分布。故对目标域的权重进行探讨分析，可能是由于目标域中含有共享类别及私有类别，由上一节分析可知，目标域中x_t∈C，

较大；对于

较小，可合理地假设图中左侧峰为目标域中私有类的权重值，右侧峰为目标域中共享类的权重值。因此假设目标域的权值w^t是二维的随机变量，维度分别为w₁，w₂，且每个维度都服从高斯分布，即

其中μ_i，

表示w_i维度上的期望和方差。因此，将目标域的权值w^t分布看作为由两个独立高斯分布叠加而成，故通过双高斯分布拟合找寻两峰高斯分布的均值μ₁，μ₂，高斯函数和双高斯分布拟所示，

其中，f₁(x)，f₂(x)为两个独立的高斯函数。通过自动选择两峰均值μ₁,μ₂中较小值，将其设定为网络的权重阈值，即w⁰＝μ_min＝min(μ₁,μ₂)。

与现有技术相比，本发明的有益效果至少如下：

1、本发明以一维卷积神经网络为基础结构，以对抗学习技术为关键技术，以双加权学习机制(通过构建源域权重和目标域权重分别对深度对抗迁移网络的对抗损失函数进行加权)为核心，构建了一种端到端的广义域新故障诊断方法，直接实现从网络到输出的已知类故障检测和新故障识别，有效提升了诊断方法的智能性、有效性和鲁棒性。

2、本发明构建了一种新颖的广义域新故障诊断方法，相比现有方法只考虑源域类别空间是目标域类别空间一个子集情况，所提方法，进一步假定源域类别空间还含有私有的类别，更加符合实际的工业情况。

3、本发明构建了一种新颖的多分类集成学习器，相比传统只采用一个单一分类器对网络进行分类，本发明引入集成学习思想，通过训练多个不同参数结构的分类器对不确定具体类别的目标域数据进行判别，并做加权平均，有效的克服了现有单一分类器方法在鲁棒性方面的不足。

4、本发明设计了新颖的具有双加权学习机制的深度对抗迁移网络，通过构建了针对源域异常样本和目标域样本的权重度量函数，自适应度量每个样本的相似程度和可迁移性，有效克服了现有方法只能滤除单一目标域异常样本的不足，提升了该方法的适应范围。

5、在实际工业环境中，通常很容易通过试验、仿真的获得大量的有标签的故障类别样本，然而在实际工业环境中，获取的故障类型大部分是未知的，同时样本比较稀缺，因而，实际工业环境中，很容易出现源域样本(试验、仿真获取)与目标域样本(工业现场获取)存在大的域迁移，同时，源域样本和目标域样本通常容易包含一些共享故障类，同时也容易出现各域都有一些私有类别，本发明构建的网络通过引入迁移学习技术，克服了上述两点问题的局限性，为多变工况下新故障检测提供了一种新颖的解决途径。

附图说明

图1是本发明方法的故障诊断流程图。

图2是本发明方法的特征提取器G的结构示意图。

图3是本发明方法的深度对抗迁移网络的网络框架示意图。

具体实施方式

为了使本发明的技术方案和目的更加的清楚明白，下面结合附图和具体实施步骤对本发明进行详细说明，应当理解，此处所描述的具体实施步骤只用于更好的阐述本发明的应用，但本发明的实施方式所涉及到的技术特征不限于此。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都是本发明保护的范围。

本发明针对两域新故障识别的迁移任务，构建了深度对抗迁移网络，设计源域私有类别的加权策略，同时建立了多个分类器，对输入进行预测，从而获得多个预测结果，通过对多个预测结果进行平均，获得均值输出结果，在一定程度上缓解网络输出置信度过高造成误分类的问题，并利用高斯分布拟合方法自动选定权重阈值，实现对目标域的有效诊断。

请参阅图1，本发明提供的一种基于深度对抗迁移网络(Deep AdversarialTransfer Network,DATN)的无监督旋转机械广义开放集故障诊断方法，该方法包括步骤：

步骤1：数据集采集与构建，分别采集机械设备在不同运行工况下的振动加速度信号，并通过对长的时域信号进行截断来构成样本，基于不同的故障类别进行标注，获得大量的源域样本数据集{x_s,y_s}，源域样本数据集由源域数据x_s及其对应标签y_s构成。在不同工况下获取目标域样本数据集{x_t}，其由不带标签的目标域数据x_t构成。

在本发明的其中一些实施例中，步骤1中，源域数据是有标签样本，目标域数据是无标签样本，两域的数据特征分布不同，即p(x_s)≠q(x_t)；且两域的类别空间不同C_s≠C_t，并且定义，源域和目标域共享的公共类标签集为C＝C_s∩C_t，源域享有的私有标签集为

目标域享有的私有标签集为

步骤2：构建具有双加权机制的深度对抗迁移网络，用于对已知类故障和新故障进行检测，包括：特征提取器G，用于提取输入数据的高维特征；多分类集成学习器

对输入数据采用多个不同参数结构的分类器进行分类，从而可对同一样本输入获得多个不同的预测结果，K为分类器的数目；领域判别器D，在对抗训练阶段对来自源域的样本和目标域样本进行判别；非对抗领域判别器D′，对来自源域样本和目标域的样本进行二分类，其不参与对抗训练。

在本发明的其中一些实施例中，针对输入数据为一维信号的特点，构建的特征提取器G、领域判别器D、非对抗领域判别器D′与多分类集成学习器

都采用深度神经网络结构。

在本发明的其中一些实施例中，请参阅图2，步骤2中所构建的特征提取器G由一维卷积神经网络构成。

在本发明的其中一些实施例中，多分类集成学习器

领域判别器D和非对抗领域判别器D′均由全连接结构构成，其中多分类集成学习器

中的每个学习器可以分别采用不同数目的全连接层数，同时每个分类器输出层既可采用Softmax也可采用Sigmoid输出函数，从而进行网络多样性学习。

在本发明的其中一些实施例中，领域判别器D由一个全连接层构成，而非对抗领域判别器D′由两个全连接层构成，中间嵌入Dropout结构，以减少网络的过拟合风险，并提高其特征学习能力，领域判别器D和非对抗领域判别器D′的输出层均采用Sigmoid输出函数。

步骤3：利用步骤1构建的源域数据集{x_s,y_s}，采用梯度下降法对特征提取器G的参数，以及多分类集成学习器

的参数进行联合优化训练。在训练阶段，通过特征提取器将源域与目标域数据映射到高维特征空间中，提取高维特征，利用领域判别器学习两域的域不变特征，以减小两域分布差异。

在本发明的其中一些实施例中，基于特征提取器G和多分类集成学习器

构建分类损失函数：

式中，E_G为对应的具有多分类器结构的监督损失函数，L_s表示标准的交叉熵损失函数，y_s表示标签样本，C_k(G(x_s))表示第k个分类器输出的类别。

表示所有源域样本的交叉熵损失平均值，G(x_s)表示特征提取器对源域样本提取的高维特征。

构建的非对抗领域判别器D′的目标是要使得源域的样本预测为1，目标域的样本预测为0，量化每个样本的域相似度，其对应的损失函数：

式中，E_D′为非对抗领域判别器损失函数，

表示非对抗领域判别器获得的所有源域样本输出平均值，D′(G(x_s))表示非对抗领域判别器在源域样本输入下的概率输出，

表示非对抗领域判别器获得的所有目标域样本输出平均值，D′(G(x_t))表示非对抗领域判别器在目标域样本输入下的概率输出，G(x_t)表示特征提取器对目标域样本提取的高维特征。

在本发明的其中一些实施例中，构建领域对抗判别器D的用于区分源域和目标域内来自于公共类标签集C的数据，由于源域和目标域都存在异常样本，因此，享有对抗网络损失函数不可用，因此，引入源域权重和目标域权重，对源域样本和目标域样本的相似程度分别进行度量，进而构建对抗网络的对偶加权损失函数E_w，可表示为：

式中，w^s(x_s)是源域权重函数，w^t(x_t)是目标域权重函数，表示目标域样本属于公共类标签集C的概率。D(G(x_s))表示领域判别器在源域样本输入下的概率输出、D(G(x_t))表示领域判别器在目标域样本输入下的概率输出。

因而，最终上述三个损失函数的优化过程可以总结为：

式中，

最大化领域判别器，

最小化特征提取器和多分类集成学习器，

最小化非对抗领域判别器。

对目标域数据采用集成学习的投票方法进行预测，利用非对抗领域判别器D′对源域数据x_s和目标域数据x_t进行判别，从而获得训练阶段的源域权重函数w^s(x)和目标域权重函数w^t(x)；通过获取的对偶权重进行加权训练。

针对源域和目标域类别标签不对齐：两域各自包含了私有故障类别，对网络共享类适配的干扰，本步骤设计多分类器集成学习器和非对抗领域判别器的权重学习网络，构建对应的对偶加权判别机制，评估目标域样本数据与源域数据的相似程度，从而有效改进故障的分类性能。

在本发明的其中一些实施例中，对于多分类集成学习器

对输入样本进行预测，从而获得多个预测结果，通过对多个预测结果进行平均，获得均值输出结果，从而有效避免只使用单一分类器结果对样本进行预测，导致的预测偏差；而所构建的多分类集成学习器充分利用了多个不同学习器的学习知识，通过集成学习的方式，将多个分类器的预测结果进行组合，通过平均投票表决的方式，获得一个最终的预测结果，可明显提高分类器对该样本预测的置信度；对于多分类集成学习器

根据输入样本获得类别标签

G(x)代表特征提取器对输入样本x提取的特征，C_k(G(x))代表第k个分类器对输入的特征G(x)进行分类，并采用信息熵理论，计算目标域样本的熵值

预测的不确定性为

因此

不受目标域数据的影响，其可靠性较高。故可得

表示目标域中私有标签数据概率输出后所求熵的平均值，

表示目标域中公共类标签数据概率输出后所求熵的平均值，

表示源域中公共类标签数据概率输出后所求熵的平均值，

表示目标域中公共类标签和私有标签数据的概率分布函数。

对于源域与目标域标签预测的不确定性，其熵值大小如下所示：

在一定程度上更接近于x_t～q_C，而由于

为源域私有类，

不受目标域数据的影响。故可得

表示多个分类器输出求和后获得的熵值；

表示源域中标签数据概率输出后所求熵的平均值；

表示源域中公共类标签数据概率输出后所求熵的平均值、

表示源域中私有类标签数据概率输出后所求熵的平均值、

表示目标域中公共类标签数据概率输出后所求熵的平均值、

表示目标域中私有类标签数据概率输出后所求熵的平均值。

对于源域与目标域样本的域相似度，其熵值大小如下所示。

根据预测的不确定性及域相似度的分析，源域和目标域的加权计算可以表示为：

表示多个分类器对输入样本x预测输出求和后获得的熵值；

代表源域公共类标签数据下求得的权重、

代表源域私有类标签数据下求得的权重，在进行加权训练时，将源域中属于公共类标签集C的样本和私有类的样本自适应赋予相应的权重值，从而减小源域私有类别的影响。最终，网络通过在特征提取器和领域判别器之间插入的一个梯度反转层(GRL层)，采用端到端的反向传播方式和梯度下降法，对模型参数进行更新。

步骤5中，在网络训练测试过程中，对每个输入样本都进行了权重计算，最终通过建立双高斯分布网络，对每个样本所属类别判定，从而实现已知故障和新故障的诊断。

在本发明的其中一些实施例中，步骤5在于，在网络训练测试过程中，对每个输入样本都进行权重计算，为了有效确定测试阶段目标域权重所要选取的阈值大小，同时避免人工通过经验选取阈值，对专业知识的依赖和导致的“因人而异”问题，本发明通过建立双高斯分布函数，通过对样本的权重值进行双高斯函数拟合获得最优的设定的阈值，根据自适应获取的阈值，所构建的深度对抗迁移网络可以对每个样本所属类别判定，从而实现已知故障和新故障的诊断。

通过构建多个轴承及齿轮的目标域数据，并对其权重值进行分析，可知目标域样本的权重呈现双峰分布。故对目标域的权重进行探讨分析，可能是由于目标域中含有共享类别及私有类别，由于目标域中x_t∈C，

较大；对于

较小，

和

分别代表目标域公共类和私有类数据下求得的权重，可获得具有两个波峰的高斯函数图，可以假定第一个峰值为目标域中私有类的权重值，第二个峰值为目标域中共享类的权重值。因此假设目标域的权值w^t是二维的随机变量，维度分别为w₁，w₂，且每个维度都服从高斯分布，即

N代表高斯分布；其中μ_i，

其中，f₁(x)，f₂(x)为两个独立的高斯函数。通过自动选择两峰均值μ₁,μ₂中的较小值，将其设定为深度对抗迁移网络测试阶段的的目标域权重阈值，即w⁰＝μ_min＝min(μ₁,μ₂)。A表示高斯分布函数的幅值，x_i表示拟合高斯分布的样本值，σ表示高斯分布下样本拟合的标准差；A₁和A₂分别表示第一个和第二个待拟合的高斯分布函数的幅值，σ₁和σ₂表示第一个和第二个高斯分布下样本拟合的标准差。

为了对所提的网络模型进行评估，针对不同的齿轮及轴承复合故障状态，采集不同工况下的齿轮数据集进行验证。齿轮箱故障数据采集自汽车传动试验台的五档变速箱，被试齿轮箱为SG135-2汽车变速器。加速度传感器放置于壳体输出轴承座上，设置采样频率为24kHz，输入转速分别设定为1000rpm和1250rpm，输出轴负载情况分别设定为：无负载(0N.m)、50N.m。齿轮箱故障通过线切割机器进行加工，共设置加工了6种不同的健康状况，如表1所示，分别为齿轮正常_内圈正常、齿轮正常_内圈故障、五档断齿_内圈正常、五档断齿_内圈故障、二档剥落_内圈正常、二档剥落_内圈故障。

表1齿轮箱试验变量设置

为了验证所提方法DATN的有效性和优越性，将其与通用领域适配方法CMU及所构建诊断方法(WAN)进行比较。

进行跨转速故障诊断试验：

(1)试验设置

本节针对不同转速构建源域与目标域数据集，对原始振动信号进行切割，对于每种故障状态，每个样本提取2048个数据点，并通过傅里叶变换(FFT)将提取的振动信号变换到频域得到1024个数据点，每个复合故障类型均获取500个信号样本，共设计了3个跨转速的迁移任务，S1表示源域数据集，T1、T2、T3分别表示3个迁移任务所对应的目标域数据集，如表2所示。

表2齿轮箱数据类别设置

表3三种跨转速的迁移学习任务

以试验一为例，S1为源域数据集，包含4中齿轮状态(即类别标签为中1/2/3/4)，其振动信号采集自转速/负载为1000rpm/0N.m的工况下；而T1为目标域数据集，包含4种齿轮状态(即类别标签为中1/3/4/5)。源域与目标域的公共标签集C＝(1,3,4)，源域私有类为

目标域的私有类为

两域的相似性指数为ξ＝0.6。

(2)试验结果分析

为了试验的公平性，各诊断方法的特征提取部分都采用相同的结构。对所构建的三种跨转速的迁移任务进行试验，进行网络性能比较，表4所示为每个迁移任务的总体诊断准确率及H-score值。

表4仅跨转速试验诊断结果

在三个迁移试验中，综合考虑总体分类准确率及H-score值，本发明所提方法DATN取得了最好的结果，三个迁移任务的总体准确率均高于90％，同时其H-score值也达到了三者之最，平均E-sccore值达到了85％。而另外两种比对方法，对于H-score指标，CMU诊断方法的总体效果优于网络WAN，这是由于CMU网络在进行领域迁移时，对目标域样本类别进行类别的同时，对源域样本也采取了一定的分析判别；而对于总体诊断准确率，WAN诊断方法准确率高于CMU，这是由于在构建两域数据集时，目标域私有类别所占比例较小，仅占样本总数的1/4或1/5，因此在进行诊断分类的过程中，若目标域中私有类判别效果较差，对总体诊断准确率较小。本发明所提方法DATN在具有较高的总体分类准确率的同时，对于目标域共享类及私有类的分类精度也是最高的。

对于跨转速的迁移试验，本发明所提诊断方法在各个诊断任务上都具有最佳的诊断性能，且其优势较为明显，表明DATN在进行两域类别交叉的迁移任务时，其采用对抗学习，权值判别，自动选择阈值，可以有效的减小源域中不相干类别的影响，判别目标域新故障类别，从而提高了各方面的诊断精度。

本发明针对在进行不同工况故障诊断时，存在的数据分布不一致、目标域任务带有新故障类别且无标签的问题，以滚动轴承故障研究对象，通过利用深度对抗卷积神经网络，来有效将带标签源域诊断知识迁移到无标签目标域，所提方法有效的改进了工业设备的故障诊断能力。

需要说明的是，虽然已经参照实例对本发明实施进行了详细的阐述，但本领域的技术人员容易理解，在不偏离所附权利要求中所阐述的本发明的精神和原则之内所作的任何修改、替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，包括以下步骤：

的参数进行联合优化训练；

2.根据权利要求1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，领域判别器D包括一个全连接层，领域判别器D的输出层都采用Sigmoid输出函数。

3.根据权利要求1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，非对抗领域判别器D′包括两个全连接层，中间嵌入Dropout结构，输出层采用Sigmoid输出函数。

4.根据权利要求1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，多分类集成学习器

中的每个学习器分别采用不同数目的全连接层数，每个分类器输出层既可采用Softmax也可采用Softmax输出函数。

5.根据权利要求1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，步骤2中所述对抗损失函数为：

引入源域权重和目标域权重，对源域样本和目标域样本的相似程度分别进行度量，进而构建对偶加权损失函数E_w，表示为：

式中，

表示非对抗领域判别器获得的所有源域样本输出平均值，w^s(x_s)是源域权重函数，

表示非对抗领域判别器获得的所有目标域样本输出平均值，w^t(x_t)是目标域权重函数，表示目标域样本属于公共类标签集C的概率，D(G(x_s))表示领域判别器在源域样本输入下的概率输出，D(G(x_t))表示领域判别器在目标域样本输入下的概率输出，G(x_s)表示特征提取器对源域样本提取的高维特征，G(x_t)表示特征提取器对目标域样本提取的高维特征。

6.根据权利要求5所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，步骤3中，基于特征提取器G和多分类集成学习器

构建分类损失函数：

式中，E_G为对应的具有多分类器结构的监督损失函数，

表示所有源域样本的交叉熵损失平均值，L_s表示标准的交叉熵损失函数，y_s表示标签样本，C_k(G(x_s))表示第k个分类器输出的类别，

表示所有源域样本的交叉熵损失平均值，G(x_s)表示特征提取器对源域样本提取的高维特征；

构建非对抗领域判别器D′，它的目标是要使得源域的样本预测为1，目标域的样本预测为0，量化每个样本的域相似度，其对应的损失函数：

式中，E_D′为非对抗领域判别器损失函数，

表示非对抗领域判别器获得的所有源域样本输出的平均值，D′(G(x_s))表示非对抗领域判别器在源域样本输入下的概率输出，

表示非对抗领域判别器获得的所有目标域样本输出平均值，D′(G(x_t))表示非对抗领域判别器在目标域样本输入下的概率输出；

因此，进行联合训练的优化过程为：

式中，

最大化领域判别器，

最小化特征提取器和多分类集成学习器，

最小化非对抗领域判别器。

7.根据权利要1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，步骤4中，多分类集成学习器

对输入样本进行预测，获得多个预测结果，对多个预测结果进行平均，获得均值输出结果。

8.根据权利要1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，步骤4中，所述训练阶段的源域权重函数w^s(x)和目标域权重函数w^t(x)的表达式分别如下：

式中，

为目标域样本的熵值，

为类别标签，

C为目标域公共类标签集，G(x)代表特征提取器对输入样本x提取的特征，C_k(G(x))代表第k个分类器对输入的特征G(x)进行分类。

9.根据权利要1所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，步骤4在进行加权训练时，将源域中属于公共类标签集C的样本和私有类的样本自适应赋予相应的权重值。

10.根据权利要1-9任一所述的一种基于深度对抗迁移网络的广义开放集故障诊断方法，其特征在于，步骤5中所述设定的阈值的确定方式为：

式中，f(x)为高斯函数，g(x)为双高斯分布，x_i表示拟合高斯分布的样本值，μ为高斯分布的均值，目标域的权值w^t分布看作为由两个独立高斯分布叠加而成，μ₁，μ₂分别为两峰高斯分布的均值，A表示高斯分布函数的幅值，σ表示高斯分布下样本拟合的标准差，f₁(x)，f₂(x)为两个独立的高斯函数，A₁和A₂分别表示第一个和第二个待拟合的高斯分布函数的幅值，σ₁和σ₂表示第一个和第二个高斯分布下样本拟合的标准差；

选择两峰均值μ₁,μ₂中的较小值作为设定的阈值，即w⁰＝μ_min＝min(μ₁,μ₂)。