CN117093924A

CN117093924A - 基于域适应特征的旋转机械变工况故障诊断方法

Info

Publication number: CN117093924A
Application number: CN202311131734.9A
Authority: CN
Inventors: 钱孟浩; 董飞; 胡创伟; 郑哲; 刘海盈; 程志友; 宋俊材; 阮瑞
Original assignee: Anhui University
Current assignee: Anhui University
Priority date: 2023-09-04
Filing date: 2023-09-04
Publication date: 2023-11-21

Abstract

本发明公开了一种基于域适应特征的旋转机械变工况故障诊断方法，包括以下步骤：步骤1、获取有标签的源域特征样本集、无标签的目标域特征样本集；步骤2、计算得到特征分类准确率acc、SSIM和FID分数，并以此构建特征量化评估指标Z，通过Z值和设定阈值比较，从源域和目标域中提取出相应特征构建新的特征子集；基于Z计算结果选择相应数据构建源域、目标域特征样本子集；步骤3、对源域、目标域特征样本子集中数据进行联合分布适应；步骤4、采用联合分布适应后的源域中数据对故障诊断分类器进行训练，然后联合分布适应后目标域中的数据输入至训练好的故障诊断分类器中，完成故障诊断。本发明提升了跨域故障识别性能。

Description

基于域适应特征的旋转机械变工况故障诊断方法

技术领域

本发明涉及机械故障诊断方法领域，具体是一种基于域适应特征的旋转机械变工况故障诊断方法。

背景技术

随着机器学习等一系列人工智能方法的快速发展，数据驱动的旋转机械故障诊断方法中，基于人工智能的故障诊断框架逐渐成为研究热点。当前，深度学习方法凭借其强大的隐藏特征挖掘能力，受到许多研究者的关注和研究，并取得了许多研究成果。但是，由于实际工业场景中旋转机械的复杂工况，导致基于深度学习的故障诊断模型面临两方面技术问题：(1)缺少足量的有标签故障样本，实际工业场景中，旋转机械在可变的复杂工况下，不同故障状态下的样本数据缺乏，想获取足量有标签样本的成本非常高。(2)不同工况下，相同故障类别下的样本存在分布差异，导致训练的基于人工智能的故障诊断模型泛化能力弱，应用于实际工况下故障诊断的准确率低。(3)目前，虽然基于深度学习的故障诊断方法因其强大的特征挖掘能力而受到广泛关注和研究，但其存在超参数，高耗时及计算复杂度等缺陷。

基于迁移学习的域适应作为解决上述问题的一个有前景的研究方向，在近年来逐渐被研究人员关注和研究，迁移学习方法能够通过从已有领域(源域：已有工况下带标签故障样本)挖掘学习知识和训练故障诊断模型，对来自不同领域(目标域：变工况下无标签故障样本)的故障样本进行识别分类。

现有技术中，电子测量与仪器学报期刊于2021年5月时间发布的论文《变工况轴承的联合分布适应迁移故障诊断》(作者：刘应东；刘韬；李华；王廷轩)中，公开了一种基于迁移学习和联合分布的轴承故障诊断方法，主要包括四个步骤：

(1)数据集划分。将原始轴承数据按照不同工况划分为训练集、测试集和辅助数据集，其中测试集和辅助数据集为同种工况。

(2)特征提取。对轴承数据进行时域特征提取，并对提取完成的时域特征通过FLDA方法对各个特征进行权重计算。

(3)联合分布自适应。将权重值较大的特征组成的特征向量分别通过PCA、KPCA进行降维学习和通过TCA、JDA进行迁移学习。在数据集划分的基础上，通过在训练集中加入与测试集相同工况的辅助数据集对模型进行辅助训练，测试集保持不变。对比在加入不同比例的辅助数据集的情况下，各方法的分类准确率。

(4)故障识别。最后将学习完成后的源域数据作为训练集，目标域数据作为测试集送入KNN分类器进行诊断分类，比较最终各方法的分类准确率该论文的技术方案中主要存在以下问题：

(A)使用FLDA对各个特征进行权重计算，由于在可迁移特征提取过程中仅使用权重来评价特征的重要性，因此忽视了特征判别能力对跨域故障诊断的影响，导致特征提取的结果不够全面。

(B)JDA能够弥补TCA仅考虑边缘概率分布适应的局限，综合考虑了两种概率分布，进而提升了迁移学习效果。但是对源域和目标域样本进行分布适应的过程中未合理同时考虑域间条件概率分布和边缘分布差异，也未考虑在高维特征空间中减小分布差异过程中存在的特征扭曲问题，导致分布适应效果不佳，影响故障诊断模型的泛化能力性能。

(C)使用KNN分类器进行诊断分类，单一分类器分类效果不佳，故障诊断能力不强。

发明内容

本发明提供了一种基于域适应特征的旋转机械变工况故障诊断方法，以解决现有技术存在的忽视了特征判别能力对跨域故障诊断的影响、分布适应效果不佳的问题。

为了达到上述目的，本发明所采用的技术方案为：

基于域适应特征的旋转机械变工况故障诊断方法，包括以下步骤：

步骤1、获取已有工况带标签的旋转机械振动信号、变工况下无标签的旋转机械振动信号，提取已有工况带标签的旋转机械振动信号的时频域统计特征数据作为有标签的源域特征样本集，提取变工况下无标签的旋转机械振动信号的时频域统计特征数据作为无标签的目标域特征样本集；

步骤2、基于有标签源域特征样本集中的统计特征数据，计算获得源域特征样本集中各统计特征数据的特征分类准确率acc，以表征特征的判别性能；基于源域特征样本集中正常状态下统计特征数据和目标域特征样本集中正常状态下统计特征数据，计算获得各统计特征数据的结构相似性指数SSIM和FID分数，以表征特征的域不变性；

基于上述得到的特征分类准确率acc，SSIM和FID，构建各统计特征数据的特征量化评估指标

然后设定阈值，从源域特征样本集中选择特征量化评估指标Z大于设定阈值的多个时频域统计特征数据构建有标签的源域特征样本子集，以及从目标域特征样本集中选择特征量化评估指标Z大于设定阈值的多个时频域统计特征数据构建无标签的目标域特征样本子集；

步骤3、对步骤2得到的源域特征样本子集、目标域特征样本子集中的时频域统计特征数据进行联合分布适应，得到联合分布适应后的源域特征样本子集、目标域特征样本子集；

步骤4、采用步骤3得到的联合分布适应后的源域特征样本子集中的数据对故障诊断分类器进行训练，然后将步骤3得到的联合分布适应后的目标域特征样本子集中的数据输入至训练好的故障诊断分类器中，通过故障诊断分类器得到目标域的故障诊断结果。

进一步的步骤1中，对已有工况带标签的旋转机械振动信号、变工况下无标签的旋转机械振动信号分别进行小波变换分解、重构后得到重构信号，然后分别基于重构信号提取多种统计参数的时域统计特征，接着分别基于重构信号的希尔伯特包络谱计算结果提取多种统计参数的频域统计特征，由此对应得到已有工况带标签的旋转机械振动信号的时频域统计特征数据、变工况下无标签的旋转机械振动信号的时频域统计特征数据。

进一步的，所述统计参数包括均值、标准差、峭度、能量、能量熵、峰度、脉冲因数、形状因子、偏度、极值、极差、功率谱熵、奇异谱熵、近似熵、样本熵、模糊熵、排列熵、包络熵。

进一步的步骤2中，利用Xgboost分类器计算所述源域特征样本集中每个时频域统计特征数据的特征分类准确率acc。

进一步的，步骤3中进行联合适应分布时，以源域特征样本子集中时频域统计特征数据、目标域特征样本子集中时频域统计特征数据的边缘概率分布之间的最大均值差异、条件概率分布之间的最大均值差异均为最小，作为联合适应分布的总优化目标。

进一步的步骤3中，利用有标签的源域特征样本子集中时频域统计特征数据对stacking集成学习模型进行训练，然后利用训练好的stacking集成学习模型预测所述目标域特征样本子集中时频域统计特征数据的类别标签，获得的类别标签即为目标域特征样本子集的伪标签，基于目标域特征样本子集中的时频域统计特征数据和相应的伪标签，计算得到目标域特征样本子集中时频域统计特征数据的条件概率分布。

进一步的步骤4中，所述故障诊断分类器为SVM分类器。

本发明使用特征分类准确率、FID和SSIM对源域和目标域的时频统计特征数据进行有效的量化评估，然后再利用提出的以边缘概率分布和条件概率分布差异为最小目标的联合分布适应对源域和目标域特征子集进行分布适应，最后使用集成学习分类器进行故障分类诊断，提升了跨域故障识别性能。因此与现有技术相比，本发明的有益效果为：

(1)本发明提出基于特征分类准确率，FID分数，和结构相似性指数的域适应特征选取方法，能够对统计特征进行域适应能力的量化评估，有助于选取更有利于跨不同域的轴承故障诊断的特征数据，有效去除干扰和冗余的特征，提高跨域故障诊断的准确率。

(2)本发明中提出的基于强化域泛化能力的改进联合分布自适应，充分考虑条件概率分布和边缘概率分布差异的同时，由于引入了集成学习，强化了分布差异的适应能力，与经典的基于特征的迁移学习方法(迁移成分分析，联合分布适应等)相比，其降低域间分布差异的能力更优，能够促进故障诊断模型泛化能力的提高。

附图说明

图1是本发明实施例流程框图。

图2是本发明实施例中stacking集成学习器原理图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达到相应技术效果的实现过程能充分理解并据以实施。本发明实施例以及实施例中的各个特征，在不相冲突前提下可以相互结合，所形成的技术方案均在本发明的保护范围之内。

显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

如图1所示，本实施例公开了一种基于域适应特征的旋转机械变工况故障诊断方法，包括以下步骤：

步骤1、获取已有工况带标签的旋转机械振动信号(图1中的工况1下采集的振动信号)、变工况下无标签的旋转机械振动信号(图1中的工况2下采集的振动信号)，提取已有工况带标签的旋转机械振动信号的时频域统计特征数据作为有标签的源域特征样本集，提取变工况下无标签的旋转机械振动信号的时频域统计特征数据作为无标签的目标域特征样本集。

本实施例中，采用双树复小波包变换对旋转机械的工况1下采集的振动信号、工况2下采集的振动信号分别进行处理，实现对对应信号的分解，将得到的终端节点信号分别进行重构获得重构信号，再分别计算重构信号及其希尔伯特包络谱的18种统计参数，进而提取出已有工况带标签的旋转机械振动信号的时域和频域统计特征，以及变工况下无标签的旋转机械振动信号的时域和频域统计特征，并以已有工况带标签的旋转机械振动信号的时频域统计特征数据作为有标签的源域特征样本集，变工况下无标签的旋转机械振动信号的时频域统计特征数据作为无标签的目标域特征样本集。

具体的，对于已有工况带标签的旋转机械振动信号或者变工况下无标签的旋转机械振动信号，为从原始振动信号中有效提取故障特征，采用双树复小波包变换对对应的振动信号进行4层分解，基于第四层的终端节点的重构信号计算18种统计参数(包括均值、标准差、峭度、能量、能量熵、峰度、脉冲因数、形状因子、偏度、极值、极差、功率谱熵、奇异谱熵、近似熵、样本熵、模糊熵、排列熵、包络熵)，提取288种时域统计特征。然后，计算重构信号的希尔伯特包络谱，得到的谱信号用于计算18种统计参数，提取288种频域统计特征。最后，共获得576个统计特征，即有标签的源域特征样本集包含共288种时域统计特征数据和共288种频域统计特征数据，无标签的目标域特征样本集同样包含共288种时域统计特征数据和共288种频域统计特征数据。

步骤2、基于有标签源域特征样本集中的统计特征数据，计算获得源域特征样本集中各统计特征数据的特征分类准确率acc，以表征特征的判别性能；基于源域特征样本集中正常状态下统计特征数据和目标域特征样本集中正常状态下统计特征数据，计算获得各统计特征数据的结构相似性指数SSIM和FID分数，以表征特征的域不变性。

虽然基于小波分析的时频分析方法能够从具有非平稳性的振动信号中提取故障特征，但是会造成特征集维度高，存在干扰和冗余特征，进而影响故障模式识别与分类的准确率。此外，由于旋转机械常工作于复杂工况下，会导致振动信号在不同工况下存在分布差异，且实际故障信号缺乏，进而导致故障诊断效果不佳。

对此，为了减少高维原始特征集中存在的干扰和冗余特征，选取出既有利于故障模式识别与分类且域间分布差异小的特征，故本实施例提出域适应特征选取方法DAFS-AFS。该DAFS-AFS方法从两方面角度对特征进行评价：特征的类别可分性和特征的域不变性。针对类别可分性，采用特征分类准确率acc进行量化评估；对于域不变性，将一维特征数据转换成二维数据，采用结构相似性指数SSIM(Structural Similarity)和FID(FrechetInception Distance)分数FID计算特征在不同域间的相似度，用于表征其域不变性。

具体计算过程说明如下：

(S1)、源域特征样本集中每个时频域统计特征数据的特征分类准确率acc计算。

本实施例中，使用Xgboost分类器计算源域特征样本集中每个时频域统计特征数据的特征分类准确率acc，以表征特征的判别性能，即通过特征分类准确率acc可量化源域特征样本集、目标域特征样本集中统计特征数据的判别能力。

Xgboost分类器是boosting算法的其中一种，Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。在Xgboost分类器训练时，采用源域特征样本集中的时频域统计特征数据作为训练集样本I的数据，记为I＝{(x₁,y₁),(x₂,y₂),...(x_m,y_m)}，其中x_m为训练集样本I中的第m个数据，y_m为x_m的类别标签，并设最大迭代次数为T，损失函数为L_t，正则化系数分别为λ,γ，则Xgboost分类器训练的具体步骤如下：

(a)定义损失函数L_t如公式(1)所示：

公式(1)中，x_i为I中的第i个数据；y_i为x_i的类别标签；f_t-1(x_i)为前t-1个分类器的预测结果；ω_tj为叶子节点权重取值大小；T_t(x_i)为第i个分类器；J为叶子节点的个数；L(y_i,f_t-1(x_i))为常数。

对损失函数L_t进行二阶泰勒展开，得到公式(2)：

其中，g_ti和h_ti分别为是损失函数的一阶和二阶梯度统计。

公式(2)中，L(y_i,f_t-1(x_i))为常数，不会对导数产生影响，由于每个决策树的第j个叶子节点的取值最终会是同一个值，可以进一步化简为公式(3)：

其中，R_tj表示第j个叶子节点的实例集。

令可得公式(4)：

(b)对于训练集样本中的第i个数据计算g_ti，h_ti，有公式(5)、(6)：

(c)基于当前节点尝试分裂决策树，默认分数score＝0，G和H分别为当前节点的一阶、二阶导数之和。

令G_L＝0,H_L＝0，将训练集样本中的数据按特征k的特征值从小到大排列，依次取出第j个特征值对应的样本数据，计算当前样本数据放入左子树后左右子树的一阶、二阶导数和如公式(7)所示：

G_L＝G_L+g_ti,G_R＝G-G_L

H_L＝H_L+h_ti,H_R＝H-H_L (7)，

其中，G_L和H_L为非稀疏值样本数据的一阶和二阶导数之和。

尝试更新最大的分数score如公式(8)所示：

基于最大score对应的划分特征和特征值分裂子树。

如果最大的分数score为0，则当前决策树建立完毕，计算所有叶子区域的ω_tj,得到弱学习器T_t，更新强学习器f_t(x)＝f_t-1(x)+εT_t(x)，其中ε为步长，常取值为0.1，接着进入下一轮弱学习器迭代。如果最大的分数score不是0，则继续尝试分裂决策树。

在决策树建立完毕后，使用决策树建立完毕后的XGBoost分类器计算源域特征样本集中每个时频域统计特征数据的特征分类准确率acc。当计算得到的特征分类准确率acc值越大，表征对应的时频域统计特征数据的类别可分性越高，越有利于分类。

(S2)、每个时频域统计特征数据的结构相似性指数SSIM计算。

结构相似性指数SSIM是一种度量两个给定信号或样本之间结构相似度的度量指标，其根据亮度比较函数、对比度比较函数、结构比较函数确定。其中：

特征样本集的亮度值取自其中所有统计特征数据的平均值。本实施例中，设有标签源域特征样本集为x，x中的时频域统计特征数据为x＝{x₁,x₂,…,x_N}，则有标签源域特征样本集的亮度值μ_x如公式(9)所示：

公式(9)中，x_i为有标签源域特征样本集中第i个时频域统计特征数据，N为特征值的总数。

同理，设无标签目标域特征样本集为y，y中的时频域统计特征数据为y＝{y₁,y₂,…,y_N}，y_i为有标签源域特征样本集中第i个时频域统计特征数据，N为特征值的总数。则无标签目标域特征样本集的亮度值

特征样本集的对比度则取自其中所有统计特征数据的标准差(方差的平方根)。本实施例中，设有标签源域特征样本集的对比度(即有标签源域特征样本集中所有统计特征数据的标准差)为σ_x，则σ_x如公式(10)所示：

同理，设无标签目标域特征样本集的对比度(即无标签目标域特征样本集中所有统计特征数据的标准差)为σ_y，则

设有标签源域特征样本集x、无标签目标域特征样本集y的亮度比较函数为l(x,y)，则亮度比较函数l(x,y)如公式(11)所示：

公式(11)中C₁为常数，保证分母为0时的稳定性。

设有标签源域特征样本集x、无标签目标域特征样本集y的对比度比较函数为c(x,y)，则对比度比较函数c(x,y)如公式(12)所示：

公式(12)中，C₂为常数，保证分母为0时的稳定性。

设有标签源域特征样本集x、无标签目标域特征样本集y的结构比较函数设为s(x,y)，则结构比较函数s(x,y)如公式(13)所示：

公式(13)中，C₃为常数，保证分母为0时的稳定性。，

设有标签源域特征样本集x、无标签目标域特征样本集y的特征样本间协方差为σ_xy，则有公式(14)：

则最终结构相似性指数SSIM如公式(15)所示：

SSIM(x,y)＝[l(x,y)]^α·[c(x,y)]^β·[s(x,y)]^γ (15)，

公式(15)中，α，β，和γ为加权系数，一般取1。

公式(15)最终可简化为如公式(16)所示：

(S3)、每个时频域统计特征数据的FID分数FID计算。

本实施例利用弗朗明歇距离算法(Frechet distance)，分别计算所述源域特征样本集、目标域特征样本集中每个时频域统计特征数据的FID分数FID，FID指标用于表征两个分布直接-的距离，距离越小代表两分布相似度越高，故FID越小越好。FID的计算如公式(17)所示：

按公式(16)得到结构相似性指数SSIM、按公式(17)得到FID分数后，计算作为综合指标，该指标越高表征特征的类别可分性越高，越有利于分类。

最终，得到特征分类准确率acc、结构相似性指数SSIM、FID分数FID后，根据这三个指标，对源域特征样本集、目标域特征样本集中每个时频域统计特征数据分别进行特征量化评估。

具体的，构建各统计特征数据的特征量化评估指标特征量化评估指标Z越大，表征对应的时频域统计特征的可迁移性越强。然后设定阈值，从源域特征样本集中选择特征量化评估指标Z大于设定阈值的多个时频域统计特征数据构建有标签的源域特征样本子集，以及从目标域特征样本集中选择特征量化评估指标Z大于设定阈值的多个时频域统计特征数据构建无标签的目标域特征样本子集。

本实施例中，考虑到源域特征样本集为有标签特征集，标签信息先验可得，目标域特征样本集数据除了正常状态数据外均是无标签数据，目标域特征样本集非先验，标签信息不可得，并且源域特征样本集中的统计特征数据类别与目标域特征样本集中统计特征数据类别相同，均有共288种时域统计特征数据和共288种频域统计特征数据，因此本实施例中利用源域特征样本集得到每类统计特征数据的特征分类准确率acc，然后再计算各统计特征数据的结构相似性指数SSIM和FID分数，最后构建各统计特征数据的特征量化评估指标Z。得到各统计特征数据的Z值后，对其进行降序排列，并设定特征量化评估指标的阈值，从源域特征样本集中选择Z值大于设定阈值的统计特征数据来构建对应的样本子集，以及从目标域特征样本集中选择Z值大于设定阈值的统计特征数据来构建对应的样本子集，用于后续的处理步骤。

步骤3、对步骤2得到的源域特征样本子集、目标域特征样本子集中的时频域统计特征数据进行联合分布适应，得到联合分布适应后的源域特征样本子集、目标域特征样本子集。

本实施例提出改进的联合分布适应(Improved Joint DistributionAdaptation,IJDA)，对源域特征样本子集和目标域特征样本子集进行联合分布适应，以减小分布差异。改进的联合分布适应过程如下：

设有标签的源域特征样本子集设无标签的目标域特征样本子集/>其中：

x_i为第i个样本数据；y_i为第i个样本数据的类别标签；n_S与n_T分别表示源域和目标域样本数。

源域和目标域之间的边缘概率分布和条件概率分布均存在差异，即Q_S(y_S|x_S)≠Q_T(y_T|x_T)和P_S(x_S)≠P_T(x_T)。其中，P_S(W^Tx_S)表示源域特征样本子集中时频域统计特征数据的边缘概率分布，P_T(W^Tx_T)表示目标域特征样本子集中时频域统计特征数据的边缘概率分布，Q_S(y_S|W^Tx_S)表示源域特征样本子集中时频域统计特征数据的条件概率分布，Q_T(y_T|W^Tx_T)表示目标域特征样本子集中时频域统计特征数据的条件概率分布。

IJDA算法的目标是利用D_S和D_T学习得到一个特征映射变换矩阵W，使得经变换后的_PS(W^Tx_S)和P_T(W^Tx_T)之间距离、Q_S(y_S|W^Tx_S)和Q_T(y_T|W^Tx_T)之间距离都尽可能减小。因此，IJDA算法包括两个方面的优化目标：

(A)实现源域特征样本子集和目标域特征样本子集中时频域统计特征数据的边缘概率分布适应，即P_S(W^Tx_S)和P_T(W^Tx_T)之间的最大均值差异MMD最小，优化目标表达式如公式(18)所示：

公式(18)中，X为包含源域和目标域特征样本的数据矩阵；M₀为源域特征样本子集D_S中时频域统计特征数据的边缘概率分布P_S(W^Tx_S)、目标域特征样本子集D_T中时频域统计特征数据的边缘概率分布P_T(W^Tx_T)之间的最大均值差异MMD矩阵。

边缘概率分布之间的最大均值差异MMD矩阵M₀计算如公式(19)所示：

(B)实现源域特征样本子集和目标域特征样本子集中时频域统计特征数据的条件概率分布适应，即Q_S(y_S|W^Tx_S)和Q_T(y_T|W^Tx_T)之间的最大均值差异MMD最小，优化目标表达式如公式(20)所示：

公式(20)中，与/>分别为源域特征样本子集与目标域特征样本子集中第c类样本数；/>和/>分别为源域特征样本子集和目标域特征样本子集中的第c类样本，C为样本总类别数。

M_c为源域特征样本子集D_S中时频域统计特征数据的条件概率分布Q_S(y_S|W^Tx_S)、目标域特征样本子集D_T中时频域统计特征数据的条件概率分布Q_T(y_T|W^Tx_T)之间的最大均值差异MMD矩阵。

条件概率分布之间的最大均值差异MMD矩阵M_c计算如公式(21)所示：

基于上述两方面优化目标，可得改进的联合分布适应总优化目标如公式(22)所示：

公式(22)中，通过c＝0,1,2,…,C实现了对式(18)和(20)两种距离的统一，公式(22)中为正则项，λ是一个权衡参数，W^TXHX^TW＝I为约束条件。由此，得到联合分布适应后的源域特征样本子集、目标域特征样本子集。

仅减少边缘分布的差异并不能保证域之间的整体分布差异的减小，仍需进一步考虑条件分布差异。事实上，最小化条件分布Q_S(y_S|x_S)和Q_T(y_T|x_T)之间的差异对于实现稳健的分布适应至关重要。匹配条件分布是非常重要的，即使通过探索分布的充分统计，因为目标域中没有标记数据，即_QT(yT|xT)不能直接建模计算。大多数方法都需要目标域中的一些标记数据。因此，需要探索目标数据的伪标签，通过将基于有标签的源域数据训练的一些基本分类器应用于无标签的目标域数据，可以很容易地预测伪标签。

本实施例中按照上述思路，基于stacking集成学习器计算条件概率分布中的目标域特征样本子集的伪标签。

如图2所示，集成学习算法是训练一系列基模型，通过某种集成原则将各模型的输出结果进行整合处理，从而获得比单一模型性能更好的一种机器学习方法。Stacking的集成原理是分层组合多种模型，迭代学习上一层模型的分类偏差，提升模型整体性能。Stacking算法可集成不同类型的模型，融合各类模型的分类特性，集成效果往往更好；同时，Stacking的分层结构可以在第1层基模型的基础上进一步学习，训练元模型，最终输出结果。Stacking集成学习模型一般为两层结构，第1层组合多个分类性能较高、差异度较大的基模型，在原始数据集上进行训练，输出各个模型的分类结果；第2层将上一层的输出结果组合成新的数据特征，在新构建的数据集上训练单个元模型，输出分类结果。

本实施例中，利用有标签的源域特征样本子集中时频域统计特征数据对stacking集成学习器进行训练，然后利用训练好的stacking集成学习模型预测所述目标域特征样本子集中时频域统计特征数据的类别标签，获得的类别标签即为目标域特征样本子集的伪标签，基于目标域目标域特征样本子集数据和相应的伪标签，计算得到条件概率分布。

步骤4、采用SVM分类器作为故障诊断分类器，利用步骤3得到的联合分布适应后的源域特征样本子集中的数据对SVM分类器进行训练，然后将步骤3得到的联合分布适应后的目标域特征样本子集中的数据输入至训练好的SVM分类器中，通过SVM分类器得到目标域的故障诊断结果。

以上结合附图详细描述了本发明的优选实施方式，本发明所述的实施例仅仅是对本发明的优选实施方式进行的描述，并非对本发明构思和范围进行限定。在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，这种组合只要其不违背本发明的思想，其同样应当视为本公开所公开的内容。为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内以及不脱离本发明设计思想的前提下，本领域技术人员对本发明的技术方案作出的各种变型和改进，均应落入本发明的保护范围，本发明请求保护的技术内容，已经全部记载在权利要求书中。

Claims

1.基于域适应特征的旋转机械变工况故障诊断方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于域适应特征的旋转机械变工况故障诊断方法，其特征在于，步骤1中，对已有工况带标签的旋转机械振动信号、变工况下无标签的旋转机械振动信号分别进行小波变换分解、重构后得到重构信号，然后分别基于重构信号提取多种统计参数的时域统计特征，接着分别基于重构信号的希尔伯特包络谱计算结果提取多种统计参数的频域统计特征，由此对应得到已有工况带标签的旋转机械振动信号的时频域统计特征数据、变工况下无标签的旋转机械振动信号的时频域统计特征数据。

3.根据权利要求2所述的基于域适应特征的旋转机械变工况故障诊断方法，其特征在于，所述统计参数包括均值、标准差、峭度、能量、能量熵、峰度、脉冲因数、形状因子、偏度、极值、极差、功率谱熵、奇异谱熵、近似熵、样本熵、模糊熵、排列熵、包络熵。

4.根据权利要求1所述的基于域适应特征的旋转机械变工况故障诊断方法，其特征在于，步骤2中，利用Xgboost分类器计算所述源域特征样本集中每个时频域统计特征数据的特征分类准确率acc。

5.根据权利要求1所述的基于域适应特征的旋转机械变工况故障诊断方法，其特征在于，步骤3中进行联合适应分布时，以源域特征样本子集中时频域统计特征数据、目标域特征样本子集中时频域统计特征数据的边缘概率分布之间的最大均值差异、条件概率分布之间的最大均值差异均为最小，作为联合适应分布的总优化目标。

6.根据权利要求5所述的基于域适应特征的旋转机械变工况故障诊断方法，其特征在于，步骤3中，利用有标签的源域特征样本子集中时频域统计特征数据对stacking集成学习模型进行训练，然后利用训练好的stacking集成学习模型预测所述目标域特征样本子集中时频域统计特征数据的类别标签，获得的类别标签即为目标域特征样本子集的伪标签，基于目标域特征样本子集中的时频域统计特征数据和相应的伪标签，计算得到目标域特征样本子集中时频域统计特征数据的条件概率分布。

7.根据权利要求1所述的基于域适应特征的旋转机械变工况故障诊断方法，其特征在于，步骤4中，所述故障诊断分类器为SVM分类器。