CN116127357A

CN116127357A - 一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法

Info

Publication number: CN116127357A
Application number: CN202310104969.2A
Authority: CN
Inventors: 左海维; 周家思; 董飞; 尹洪申; 孙莉
Original assignee: Xuzhou Medical University
Current assignee: Xuzhou Medical University
Priority date: 2023-02-06
Filing date: 2023-02-06
Publication date: 2023-05-16

Abstract

本发明公开了一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法,涉及故障诊断领域，首先，采用双树复小波包变换处理振动数据，提取相应的统计特征；其次，为了提高领域自适应性能，设计了一种自适应聚类指标和最大均值差异的可迁移性评价指标TI，量化了特征的故障可辨别性和域不变性；在此基础上，提出了一种新的流形嵌入判别联合分布自适应方法，在Grassmann流形子空间中进行跨域特征判别联合分布对齐；最后，将经过处理的特征作为随机森林分类器的输入，训练分类器；利用训练好的分类器进行目标域故障状态分类；本发明所提出的跨域故障诊断方法在源域和目标域之间存在类不平衡时，能够获得理想的诊断结果，显著优于经典的基于迁移学习的诊断模型。

Description

一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法

技术领域

本发明涉及故障诊断领域，尤其涉及一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法。

背景技术

电机、轴承等旋转机械广泛应用在工业制造、航空航天、轨道交通、石油化工、汽车制造和风力发电等重要工程领域，在国民经济生产中占有重要地位，研究旋转机械的智能故障诊断方法对于保障设备安全高效运行，避免巨大经济损失和重大安全生产事故具有重要的理论意义和工程价值。

近年来，智能故障诊断方法受到了越来越多的研究者的关注。它们在故障诊断过程中利用人工智能技术，实现智能、自动故障检测。基于机器学习的经典故障诊断方法得到了广泛的研究，但这些方法有一定的局限性，阻碍了在实际工业场景中的应用。基于深度学习的故障诊断方法因其较强的自动特征提取能力而受到越来越多的关注和发展，常用的方法有深度自编码器、深度信念网络、卷积神经网络和深度残差网络等。然而，这些方法同样存在一定的局限性：故障诊断模型仍然遵循训练和测试数据相同分布的假设，这与实际工作条件下数据分布不一致相矛盾；由于训练数据不足，导致基于深度学习的模型故障诊断性能明显下降，且往往需要进行高成本、耗时的参数调优。迁移学习作为一种很有前途的技术，已被广泛用于机械跨域故障诊断。基于迁移学习的故障诊断方法已经成功地实现了跨域故障诊断，但存在三个可能降低域适应性能和跨域诊断精度的问题：(1)现有的跨域故障诊断方法大多是在源域和目标域类平衡的条件下进行的(域的数据类别相同)，这种数据条件在实际工业场景中往往是不现实的，测试数据(从实际工作场景中收集的目标域)不能与训练数据(源域)具有相同的所有类别。(2)在原始特征空间进行分布对齐时，很难克服特征失真，导致域适应性能差。(3)现有的许多基于迁移学习的域自适应方法的分布对齐优化目标只关注增强跨域特征的可迁移性，也忽略了特征的可辨别性，导致分类性能不佳。

针对上述问题，本发明首先提出了一种基于K-means和最大均值差异的特征可迁移性评价方法TFEAM，从原始统计特征集中选择可迁移性能好的特征构成领域适应特征子集。针对现有领域自适应方法的三个局限性，提出了一种领域自适应方法，即流形子空间学习嵌入的判别联合分布对齐(DJME)。最后，将所提出的TFEAM和DJME结合，提出一种新的跨域故障诊断框架TFEAM-DJME。

发明内容

本发明所要解决的技术问题是为了提高旋转机械智能故障诊断方法在实际工业场景中的准确率、泛化能力和稳定性，本发明提供一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，实现旋转机械智能故障诊断方案在类不平衡和训练数据条件匮乏条件下保持良好的诊断准确率。

本发明为解决上述技术问题采用以下技术方案：

一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，具体包含如下步骤：

步骤1，利用双树复小波包变换DTCWPT对原始振动信号进行分解，利用得到的16个终端小波包节点的重构信号提取16个Hilbert包络谱HES；计算16个重构信号和16个HES的11个统计参数，生成一个包含352个统计特征的混合域统计特征集，即原始的统计特征集OSFS；

步骤2，对步骤1构建的原始的统计特征集OSFS中的特征利用最大互信息系数MIC去除冗余特征，得到新的约简特征集NRF；针对NRF中的每个特征，分别利用K-means和MMD构建可迁移指标TI；通过设置可迁移指标TI阈值，选择具有较强领域适应能力的特征组成领域适应特征子集DAFS；

步骤3，将步骤2得到的源域的标记DAFS作为训练集X_S，未标记DAFS作为测试集X_T，并进行DJME处理，在流行子空间上进行跨域特征判别联合分布对齐；

步骤4，采用步骤3中得到的源域标记特征集作为随机森林分类器RF的输入，训练跨域故障诊断模型，训练好的RF用于预测目标域未标记特征集的故障标签。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，所述步骤1具体步骤如下：

步骤1.1，将来自于特定工况下的原始振动信号样本作为源域，其数据集的样本有标签；步骤1.2，将来自不同工况下的原始振动信号样本作为目标域，其数据集的样本无标签，采用源域标记样本对诊断模型进行训练，并使用训练后的模型对目标域进行故障状态分类。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，在步骤1中，对源域和目标域的振动信号进行DTCWPT分解，分解层数设置为4，获取16个终端小波包节点，同时对底层节点系数进行单支小波包重构得到16个单支重构信号，并获取16个重构信号对应的希尔伯特包络谱HES，分别计算16个重构信号与16个HES的11个统计参数，共生成352个统计特征，构成原始统计特征集OSFS。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，在步骤2中，采用MIC去除冗余特征，降低计算复杂度；采用K-means和最大均值差异的可迁移特征选取方法TFEAM对原始统计特征集的特征进行评价，得到可迁移性选择指标TI评价特征的可迁移性，采用降序排序后的TI序列选择原始统计特征集的迁移性能好的特征构成领域适应特征子集DAFS。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，对于步骤1所得到的源域原始统计特征集中的带标签故障特征数据，计算特征之间的互信息系数MIC，减少冗余特征，降低计算的复杂度；利用K-means聚类方法量化特征的可辨别性，将调整的rand指数ARI作为评价特征辨别性指标FDI；采用MMD测量源域与目标域原始统计特征集中正常状态特征分布差异，并将MMD的值作为评价特征域不变性指标DDI；对于得到的每一特征的FDI与DDI，构建可迁移型选择指标TI；对于来自目标域原始特征集的无标签特征数据，直接用排序后的TI序列进行域不变特征选取。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，TFEAM方法的具体步骤如下：

步骤2.1，针对步骤1中得到的源域和目标域OSFS，计算特征之间的最大互信息系数MIC，从而去除冗余特征，得到新的NRF；MIC主要使用互信息MI来量化变量之间的相关程度；给定变量A＝{a_i,i＝1,2,…,n}和B＝{b_i,i＝1,2,…,n}，n是样本数；MI的定义如下：

其中，a和b分别属于A和B，p(a,b)表示联合概率密度；p(a)和p(b)是边际概率密度；给出一组有限有序对D＝{(a_i,b_i),i＝1,2,…,n}；定义一个划分G，一个大小为x×y的网格，将A的取值范围划分为x段，将B的取值范围划分为y段；在得到的每个网格分区内计算A和B之间的MI，因为同一个网格可以划分多种方式，因此选择不同划分方式下的最大值MI(A,B)作为G的MI值；在最大MI的D下定义G方程为

MI^*(D,x,y)＝maxMI(D∣G) (2)

其中，D∣G表示D被G分割；MIC的定义如下：

其中，B(n)是样本量的函数，设B(n)＝n^0.6；当MIC越高时，a和b之间的相关性越强；任何特征f_i和f_j之间的相关性表示为MIC(f_i,f_j)，MIC(f_i,f_j)的值越大，f_i和f_i之间的可替代性越大，即冗余度越大；

步骤2.2，对于NRF中的每一个特征，通过K-means聚类方法量化特征的可辨别性，调整的rand指数ARI作为特征辨别性的量化指标；定义一个特征集有M个特征样本，每个样本包含N种特征；特征集和i-th样本的表示分别是F＝[f₁,f₂,…,f_M]和f_i＝{f_i ¹,f_i ²,…f_I ^N}，i∈[1,M]；第i个样本的第k个特征由f_i ^k表示；所有样本的特征用F^N＝[F¹,F²,…F^N]表示，所有样本的第k个特征集用F^k表示；F^k可以定义为：

通过K-means算法将F^k分类为M聚类分区；计算M个聚类分区的ARI来衡量聚类结果的准确性；给定一组n个对象O＝{o₁,o₂,…o_n}，令P＝{p₁,p₂,…p_n}为通过K-means得到的X的类，并且令Q＝{q₁,q₂,…q_n}是真实的类；ARI的定义如下：

其中，e表示在Q和P中均属于同一类的{o_i,o_j}的数目；f表示在P中不属于同一类的和Q中属于同一类的{o_i,o_j}的数目；g表示在P中属于同一类且在Q中不属于同一类{o_i,o_j}的数目；h表示在Q和P中都不属于同一类的{o_i,o_j}的数目；ARI的取值范围是[0,1]；当ARI的值越高时，聚类性能越好；使用特征的ARI值作为FDI，它量化了故障可辨别性；对于N个特征，可以通过执行K-means算法构造一个FDI序列，{FDI(1),FDI(2),…FDI(N)}；FDI值越高，特征可辨别性越强；

步骤2.3，对于源域和目标域的正常状态特征数据，通过MMD评估同一特征的在不同域的分布差异，MMD的值作为特征域不变性的量化指标；源域和目标域分别表示为D^s＝(x_s,y_s)和D^t＝(x_t,y_t)；MMD的表达式如下：

其中，n_s和n_t分别是源域和目标域中的样本数，H表示再现核希尔伯特空间(RKHS)，f(·)是将特征数据映射到RKHS的映射函数；给定一个特定工作条件下的正常状态特征集f_ns和不同工作条件下的正常状态特征集f_nt，两者都包含M个样本，每个样本由N个特征组成；f_ns和f_nt可以表示如下；

其中，源域和目标域中M样本的n-th特征分别定义为和计算出f_ns和f_nt之间的MMD；当特征之间的MMD较低时，分布差异较小；使用特征的MMD值作为DDI；对于每个特征，获得包含相应MMD值的DDI序列；

步骤2.4，根据从步骤2和步骤3中获得的FDI和DDI，提出了一个新的可迁移性指标TI，用于评估特征的可迁移性；TI的表达式定义为

对于K个特征，得到一个包含K个特征对应的TI值的TI序列，{TI(1),TI(2),…,TI(K)}；TI值越高，特征的可迁移性就越大；进一步利用TI序列选择可迁移的特征，组成领域适应特征子集DAFS，进行后续的域适应。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，在步骤3中，DJME有两个基本步骤：流形子空间学习MSL和判别式联合分布适应DJDA；

DJME的具体步骤如下：

步骤3.1，根据步骤2得到的领域适应特征子集DAFS，采用测地线流核(GFK)，将原始高维特征投影到Grassmann流形子空间中，获取高维特征空间的低维域不变性表示；源域子空间向量v_s和目标域的子空间向量v_t由PCA获得，在(d)中被视为两个点；在两点之间构造测地线流Φ(t)(0≤t≤1)以完成特征映射；映射后定义流形特征为w，w＝Φ(t)^Tx,测地线流核可以描述为两个无限维特征向量和的内积：

其中，G∈R^K×K是通过奇异值分解得到的半正定矩阵；x_i和x_j是两个原始的D维特征向量；等式通过将原始特征映射到无限维子空间，确保分类器最大程度地保持跨域分布的一致性；通过流形学习，获得了新的特征数据集Z_S和Z_T，它们分别是X_S和X_T在Grassmann流行空间的表示；

步骤3.2，采用一种判别式联合分布适应DJDA同时最小化不同域的同一类特征之间的联合概率分布差异，实现可迁移性，同时最大化不同域的不同类特征之间的联合概率分布差异，实现可辨别性；并与传统的MMD自适应方法进行了比较减小源域和目标域之间的分布差异。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，步骤3.2具体实现如下：

步骤3.21，在传统的MMD定义的基础上，引入了联合概率差异(JPD)；给定c＝{1,2,…,C}和分别是X_S和X_T的标签集，C是标签的总数；让P(X|Y)和P(Y)分别是类条件概率和先验概率；根据贝叶斯定律，D_S和D_T之间的JPD表达式如下：

在式中，M_{same_class}测量源域和目标域中相同类特征数据的JPD，M_{different_classes}测量两个域中不同类特征数据的JPD；将JPD的表达方式和传统的MMD定义相比较，虽然理论上是等价的，但是直接定义的JPD和传统的MMD定义的区别在于后者是基于边际概率和后验概率的乘积；式是直接从特征数据中计算出来的，没有近似，因此，它可以将类可辨别性整合到分布差异中；

步骤3.22，基于M_{same_class}和M_{different_classes}，具有分辨型的JPD定义如下：

d_DJPD(D_S,D_T)＝M_{same_class}-μM_{differnent_class} (11)

其中，μ是一个权衡参数，大于0，M_{same_class}和M_{different_classes}分别用于衡量同一类的可迁移性和不同类在域之间的可辨别性；对于M_{same_class}，计算过程如下：

式可以进一步表示为：

其中，根据经验：

同样地,

其中是从源域训练的分类器获得的目标域的伪标签；进一步变换为：

步骤3.23，令源域和目标域的one-hot编码标签矩阵分别为且y_S,1∈R^1×C，

方程可进一步表示为

其中，和表达式如下：

M_{different_classes}的计算步骤如下：

类似地，基于与M_{same_class}相同的推导，可以进一步表示为：

设

其中，Y_S(:,c)是Y_S的第c列，Y_S(:,1)*(C-1)重复Y_S(:,c)C-1次来构造在中的矩阵，由的第1到第C(不包括第1列)列构成；F_S是从已知标签中得到的，是由迭代更新的伪标签获得；因此，A的表达式可以简化为

其中，和的表达式如下：

步骤3.24，基于等式和，具有主成分保留约束和正则化项的DJDA优化目标表示为

其中H＝I-1/n表示中心矩阵，n＝n_S+n_T和X＝[X_S,X_T]，是正则化项，并且应用正则化参数λ以确保优化问题得到明确定义；根据约束优化理论，我们将Φ＝diag(φ₁,φ₂,…,φ_k)∈R^k×k定义为拉格朗日乘数，优化目标的拉格朗日函数可以推导出为

L＝tr(A^T(X(U_min-μU_max)X^T+λI)A)+tr((I-A^TXHX^TA)Φ) (26)

其中，

设置方程可以转换为广义特征分解问题：

(X(U_min-μU_max)X^T+λI)A＝XHX^TAΦ (29)

步骤3.25，，寻找最优域适应矩阵A被简化为求解式的P-最小特征向量，实现用A^TX_S来训练一个适用于A^TX_T的分类器。

作为本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的进一步优选方案，在步骤4中，构建基于TFEAM和DJME的跨域旋转机械故障诊断模型，具体步骤如下：将步骤3中的源域标记特征集作为随机森林分类器的输入，训练分类器f；采用训练后的分类器f预测目标域标记特征集，输出跨域诊断结果，即得到目标域的标签信息

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

本发明基于流行子空间学习和判别联合分布对齐算法相结合的思想，本发明提出了流行嵌入的判别联合分布对齐，将原始特征空间中的高维特征转换到低维流行空间，降低特征失真，并且在低维空间执行判别联合分布对齐，同时增加特征的域不变性和可辨别性；为了进一步提高域自适应性能，在进行域自适应之前，一个关键步骤是选择具有更好的故障可分辨性和域不变性的可转移特征，本发明提出了基于K-means和最大均值差异的迁移特征选择方法，用于量化特征的域不变性能和可辨别性；综上，我们提出了一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，在提升诊断模型准确率的同时，提高模型的泛化能力，让模型部署到实际工业场景中诊断准确率不会出现较大波动。

附图说明

图1是本发明一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法的方法流程图；

图2是本发明TFEAM-DJME整体框架；

图3是本发明特征提取模块结构框图。；

图4是本发明特征过滤模块结构框图；

图5是本发明域适应模块结构框图；

图6是本发明SQI-MFS测试平台；

图7是本发明T1-T4任务中所有比较模型的平均故障诊断准确率。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1和2所示，一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，包括4个过程，具体如下：

过程1.特征提取：

本发明中源域为不同转速下的带标签滚动轴承的振动信号，目标域则为无标签的滚动轴承振动信号。如图3所示，首先利用DTCWPT对原始振动信号进行分解，然后利用得到的16个终端小波包节点进行单支小波包重构，得到16个重构信号并其提取Hilbert包络谱(HES)。分别计算16个重构信号和16个HES的11种统计参数(极差、均值、标准差、峰度、能量、能量熵、偏度、波峰因数、脉冲因数、形状因数和纬度因数)，生成一个包含352个统计特征的混合域统计特征集，即原始统计特征集合OSFS。

过程2.特征选择：

如图4所示，首先采用MIC去除冗余特征，降低计算复杂度；其次采用K-means和最大均值差异MMD的可迁移特征选取方法(TFEAM)对原始统计特征集的特征进行评价，得到可迁移性选择指标TI评价特征的可迁移性，采用降序排序后的TI序列选择原始统计特征集的迁移性能好的特征构成领域适应特征子集DAFS。

优选的，对于步骤1所得到的源域原始统计特征集中的带标签故障特征数据，计算特征之间的互信息系数MIC，减少冗余特征，降低计算的复杂度；利用K-means聚类方法量化特征的可辨别性，将调整的rand指数ARI作为评价特征辨别性指标FDI；采用MMD测量源域与目标域原始统计特征集中正常状态特征分布差异，并将MMD的值作为评价特征域不变性指标DDI。对于得到的每一特征的FDI与DDI，构建可迁移型选择指标TI。对TI序列进行降序排序，TI值越高，表明特征的故障分辨能力与域不变性越高，越有利于领域自适应。对于来自目标域原始特征集的无标签特征数据，直接用排序后的TI序列进行域不变特征选取。

优选的，具体TFEAM方法的步骤如下：

步骤2.1针对步骤1中得到的源域和目标域OSFS，计算特征之间的最大互信息系数MIC，从而去除冗余特征，得到新的NRF。MIC主要使用互信息(MI)来量化变量之间的相关程度。给定变量A＝{a_i,i＝1,2,…,n}和B＝{b_i,i＝1,2,…,n}，n是样本数。MI的定义如下：

其中，a和b分别属于A和B，p(a,b)表示联合概率密度。p(a)和p(b)是边际概率密度。给出一组有限有序对D＝{(a_i,b_i),i＝1,2,…,n}。定义一个划分G，一个大小为x×y的网格，将A的取值范围划分为x段，将B的取值范围划分为y段。在得到的每个网格分区内计算A和B之间的MI，因为同一个网格可以划分多种方式，因此选择不同划分方式下的最大值MI(A,B)作为G的MI值。在最大MI的D下定义G方程为

其中D∣G表示D被G分割。MIC的定义如下：

其中B(n)是样本量的函数，在本文中，我们假设B(n)＝n^0.6。当MIC越高时，a和b之间的相关性越强。任何特征f_i和f_j之间的相关性表示为MIC(f_i,f_j)。MIC(f_i,f_j)的值越大，f_i和f_i之间的可替代性越大，即冗余度越大。

步骤2.2对于NRF中的每一个特征，通过K-means聚类方法量化特征的可辨别性，调整的rand指数(ARI)作为特征辨别性的量化指标。定义一个特征集有M个特征样本，每个样本包含N种特征。特征集和i-th样本的表示分别是F＝[f₁,f₂,…,f_M]和f_i＝{f_i ¹,f_i ²,…f_I ^N}，i∈[1,M]。第i个样本的第k个特征由f_i ^k表示。所有样本的特征用F^N＝[F¹,F²,…F^N]表示，所有样本的第k个特征集用F^k表示。F^k可以定义为：

通过K-means算法将F^k分类为M聚类分区。计算M个聚类分区的ARI来衡量聚类结果的准确性。给定一组n个对象O＝{o₁,o₂,…o_n}，令P＝{p₁,p₂,…p_n}为通过K-means得到的X的类，并且令Q＝{q₁,q₂,…q_n}是真实的类。ARI的定义如下：

其中e表示在Q和P中均属于同一类的{o_i,o_j}的数目；f表示在P中不属于同一类的和Q中属于同一类的{o_i,o_j}的数目；g表示在P中属于同一类且在Q中不属于同一类{o_i,o_j}的数目；h表示在Q和P中都不属于同一类的{o_i,o_j}的数目。ARI的取值范围是[0,1]。当ARI的值越高时，聚类性能越好。因此，使用特征的ARI值作为FDI，它量化了故障可辨别性。对于N个特征，可以通过执行K-means算法构造一个FDI序列，{FDI(1),FDI(2),…FDI(N)}。FDI值越高，特征可辨别性越强。

步骤2.3对于源域和目标域的正常状态特征数据，通过MMD评估同一特征的在不同域的分布差异，MMD的值作为特征域不变性的量化指标。源域和目标域分别表示为D^s＝(x_s,y_s)和D^t＝(x_t,y_t)。MMD的表达式如下：

其中n_s和n_t分别是源域和目标域中的样本数，H表示再现核希尔伯特空间(RKHS)，f(·)是将特征数据映射到RKHS的映射函数。给定一个特定工作条件下的正常状态特征集f_ns和不同工作条件下的正常状态特征集f_nt，两者都包含M个样本，每个样本由N个特征组成。f_ns和f_nt可以表示如下。

其中源域和目标域中M样本的n-th特征分别定义为和基于式，可以计算出f_ns和f_nt之间的MMD。当特征之间的MMD较低时，分布差异较小。因此，使用特征的MMD值作为DDI。对于每个特征，获得包含相应MMD值的DDI序列。

步骤2.4根据从步骤2和3中获得的FDI和DDI，我们提出了一个新的可迁移性指标TI，用于评估特征的可迁移性。TI的表达式定义为

对于K个特征，我们可以得到一个包含K个特征对应的TI值的TI序列，{TI(1),TI(2),…,TI(K)}。TI值越高，特征的可迁移性就越大。因此，进一步利用TI序列选择可迁移的特征，组成领域适应特征子集DAFS，进行后续的域适应。

过程3.域适应：

如图5所示，本发明提出了一个有前途的领域适应思想，即流形子空间学习与判别式联合分布对齐相结合。根据这个想法，研究了一种新的域自适应方法DJME，它在Grassmann流形子空间中执行跨域特征判别联合分布对齐。DJME有两个基本步骤：流形子空间学习(MSL)和判别式联合分布适应(DJDA)。

优选的，具体DJME的步骤如下：

步骤3.1根据步骤2得到的迁移特征子集，采用测地线流核(GFK)，将原始高维特征投影到Grassmann流形子空间中，获取高维特征空间的低维域不变性表示。源域子空间向量v_s和目标域的子空间向量v_t由PCA获得，在(d)中被视为两个点。在两点之间构造测地线流Φ(t)(0≤t≤1)以完成特征映射。映射后定义流形特征为w，w＝Φ(t)^Tx,测地线流核可以描述为两个无限维特征向量和的内积：

其中，G∈R^K×K是通过奇异值分解得到的半正定矩阵；x_i和x_j是两个原始的D维特征向量。等式通过将原始特征映射到无限维子空间，确保分类器最大程度地保持跨域分布的一致性。通过流形学习，获得了新的特征数据集Z_S和Z_T，它们分别是X_S和X_T在Grassmann流行空间的表示。当在原始特征空间中执行分布对齐时，这些新特征可以帮助克服特征失真。

步骤3.2采用一种判别式联合分布适应同时最小化不同域的同一类特征之间的联合概率分布差异，实现可迁移性，同时最大化不同域的不同类特征之间的联合概率分布差异，实现可辨别性。并与传统的MMD自适应方法进行了比较减小源域和目标域之间的分布差异，此方法具体实现如下：

(1)首先，为了实现上述目标，在传统的MMD定义的基础上，引入了联合概率差异(JPD)。给定_c＝{1,2,…,C}和分别是X_S和X_T的标签集，C是标签的总数。让P(X|Y)和P(Y)分别是类条件概率和先验概率。因此，根据贝叶斯定律，D_S和D_T之间的JPD表达式如下：

在式中，M_{same_class}测量源域和目标域中相同类特征数据的JPD，M_{different_classes}测量两个域中不同类特征数据的JPD。将JPD的表达方式和传统的MMD定义相比较，虽然理论上是等价的，但是直接定义的JPD和传统的MMD定义的区别在于后者是基于边际概率和后验概率的乘积。式是直接从特征数据中计算出来的，没有近似，因此，它可以将类可辨别性整合到分布差异中。

(2)基于M_{same_class}和M_{different_classes}，具有分辨型的JPD定义如下：

d_DJPD(D_S,D_T)＝M_{same_class}-μM_{differnent_class} (11)

其中μ是一个权衡参数，大于0，M_{same_class}和M_{different_classes}分别用于衡量同一类的可迁移性和不同类在域之间的可辨别性。对于M_{same_class}，计算过程如下：

式可以进一步表示为：

其中，根据经验：

同样地,

其中是从源域训练的分类器获得的目标域的伪标签。因此，基于式-，式可进一步变换为：

(3)令源域和目标域的one-hot编码标签矩阵分别为且y_S,1∈R^1×C，

因此，方程可以进一步表示为

其中，和表达式如下：

M_{different_classes}的计算步骤如下：

设

其中Y_S(:,c)是Y_S的第c列，Y_S(:,1)*(C-1)重复Y_S(:,c)C-1次来构造在中的矩阵，由的第1到第C(不包括第1列)列构成。因此，F_S是从已知标签中得到的，是由迭代更新的伪标签获得。因此，A的表达式可以简化为

其中，和的表达式如下：

(4)基于等式和，具有主成分保留约束和正则化项的DJDA优化目标表示为

其中H＝I-1/n表示中心矩阵，n＝n_S+n_T和X＝[X_S,X_T]，是正则化项，并且应用正则化参数λ以确保优化问题得到明确定义。根据约束优化理论，我们将Φ＝diag(φ₁,φ₂,…,φ_k)∈R^k×k定义为拉格朗日乘数，优化目标的拉格朗日函数可以推导出为

L＝tr(A^T(X(U_min-μU_max)X^T+λI)A)+tr((I-A^TXHX^TA)Φ) (26)

其中，

设置方程可以转换为广义特征分解问题：

(X(U_min-μU_max)X^T+λI)A＝XHX^TAΦ (29)

最后，寻找最优域适应矩阵A被简化为求解式的P-最小特征向量。我们可以用A^TX_S来训练一个适用于A^TX_T的分类器。

过程4.模式识别：

优选的，在步骤4，构建基于TFEAM和DJME的跨域旋转机械故障诊断模型，具体步骤如下：将步骤3中的源域标记特征集作为随机森林分类器的输入，训练分类器f；采用训练后的分类器f预测目标域标记特征集，输出跨域诊断结果，即得到目标域的标签信息。

1实验数据介绍

为了证明TFEAM-DJME框架的有效性和适应性，实验中使用了SQI-MFS试验台的轴承数据集。试验台如图6所示。我们利用激光加工制作不同故障直径的单点内滚道故障(IF)、外滚道故障(OF)、球故障(BF)。采集两种工况下(电机转速为1200rmp和1500rmp)轴承的振动数据，故障直径为0.05mm。此外，该数据集还包含电机转速为1200rmp和1500rmp时的正常状态(NS)振动数据。加速度传感器位于驱动端，以16khz的采样频率采集振动数据。因此，选取电机转速为1200rmp和1500rmp下4种轴承状态(3种故障状态和1种正常状态)的振动信号进行实验。对于每个轴承状态，从原始振动信号样本中选取60个随机样本，其中30个随机样本作为训练样本，30个作为测试样本。5000个连续的数据点组成一个样本。实验中使用的数据集介绍见表1。表1为1SQI-MFS试验台轴承数据描述.

表1

本例中利用2个电机转速下的轴承振动数据，设置2个故障诊断任务，如表2所示。表2为单故障状态跨域故障诊断任务。

为了进一步验证TFEAM-DJME框架的有效性，设置了2个跨域的轴承多故障状态故障诊断任务，如表3所示。表3为多故障状态跨域故障诊断任务

表2

表3

2实验步骤

本节将TFEAM-DJME应用于2个跨域故障诊断任务。首先，对原始轴承振动信号进行如图3所示的DTCWPT处理，将这些信号分解为不同的小波包节点(wavelet packet nodes,WPNs)。DTCWPT的母小波为“dmey”，分解级别设置为4，将振动信号分解为16个小波包节点。在此基础上，可以得到相应的单支重构信号(SBRS)及其Hilbert包络谱。据此，我们可以计算16个单支重构信号和16个Hilbert包络谱的11个统计参数，生成一个包含352个统计特征的混合域统计特征集，即原始统计特征集(OSFS)。这11个统计参数列于表4。

表4

其次，在得到的OSFS的基础上，进行特征可迁移性评价。对于高维OSFS，采用最大互信息系数(MIC)来减少冗余特征，并获得新的约简特征集(NRF)。然后，对于NRF中的每个特征，分别用K-means和MMD对FDI和DII进行评估。进而得到各特征的TI。假设FDI值越高，特征的可分辨性越大。认为DDI值接近0的特征具有更好的域不变性能。TI值越高的特征具有更好的领域适应能力。因此，可以通过设置TI值的阈值来选择具有较好的域适应能力的特征，并将其用于后续的域适应过程中。

然后，将选择的具有较强领域适应能力的特征组成领域适应特征子集(DAFS)。据此，对源域的标记DAFS和目标域的未标记DAFS进行DJME处理，在流形子空间上进行跨域特征判别联合分布对齐。最后，将DJME得到的源域标记特征集输入到RF分类器中训练跨域故障诊断模型，训练后的RF分类器预测目标域特征集的标记，计算故障诊断准确率。

表5

表6

任务1-4的故障诊断准确率如表5和表6所示。表5为TEEAM-DJME框架获得的轴承故障诊断结果。表6为TEFAM-DJME框架获得的多种故障类型的轴承故障诊断结果。

表5给出了2个任务中4种轴承状态下的最大诊断精度，并列出了由TFEAM确定的对应可转移特征数(transferable feature number,TFN)。对于T1任务，4种轴承状态的故障诊断准确率均可达到100％。在T2任务中，4个轴承状态的最大诊断准确率分别为100％、96.67％、90.00％和96.67％。如表6所示，任务3和任务4的最大诊断准确率可以达到96.67％以上。根据这些实验结果，我们可以进一步验证TFEAM-DJME框架的有效性。在上述实验过程中，DJME采用的参数为:权衡参数μ＝0.5，正则化参数λ＝0.1，DJME处理的特征数据维数为30。RF分类器中使用的参数包括:树的个数为100，类的个数为4。

3与其他方法比较结果

为了进一步验证TFEAM和DJME的优越性和有效性，我们在现有传统领域自适应方法(TCA、JDA和BDA)的基础上设计了一些模型，并将其与TFEAM和DJME进行了比较。这些比较模型列于表7，分别标记为CM1至CM8。此外，为了验证TFEAM的有效性和优越性，设置了基于3种特征选择方法(ARI、MMD和ReliefF)和DJME的3个比较模型，列于表7，分别标记为CM9和CM11。以OSFS-TCA模型为例，在故障诊断模型OSFS-TCA中，对OSFS进行TCA处理，然后将处理后的OSFS进一步输入RF分类器。OSFS-JDA、OSFS-BDA和OSFS-DJME模型的构造与OSFS-TCA模型相似。对于OSFS-TFEAM-TCA模型，表示依次对OSFS进行TFEAM和TCA处理，然后将得到的特征集输入RF分类器。OSFS-TFEAM-JDA和OSFS-TFEAM-BDA模型可以以相同的方式解释。

表7

表8

T1和T2任务中比较模型的实验结果见表8，结果对比如图7所示。在每个任务中，各种比较模型给出的结果是4种轴承状态的平均故障诊断精度。对于CM5、CM6、CM7和CM8，基于各轴承状态的最大精度计算出平均故障诊断精度。这些实验结果显示：

(1)TFEAM-DJME框架获得的诊断模型优于其他比较模型，在T1～T4任务中，4种轴承状态的平均故障诊断准确率分别达到100％、95.84％、100％和98.34％。

(2)将OSFS-DJME(CM4)与OSFS-TCA(CM1)、OSFS-JDA(CM2)和OSFS-BDA(CM3)进行比较，发现CM4获得的T1任务中4种承载状态的诊断准确率分别比CM1、CM2和CM3高10.84％、34.17％和25.84％，证明DJME比TCA、JDA和BDA具有更好的域适应能力。

(3)通过比较OSFS-TCA(CM1)和OSFS-TFEAM-TCA(CM5)、OSFS-JDA(CM2)和OSFS-TFEAM-JDA(CM6)、OSFS-BDA(CM3)和OSFS-TFEAM-BDA(CM7)、OSFS-DJME(CM4)和TFEAM-DJME(CM8)，可以发现采用TFEAM方法可以显著提高基于迁移学习的模型的故障诊断准确率，进一步验证了TFEAM选择的可迁移特征有助于提高跨域诊断性能。以OSFS-TFEAM-TCA(CM5)为例，其在T1和T2任务中的平均故障诊断准确率分别为97.50％和70.83％，比OSFS-TCA(CM1)高24.17％和15.83％。T3和T4任务的平均故障诊断准确率分别为98.33％和94.17％，比OSFS-TCA(CM1)算法高11.66％和19.17％。

(4)将ARI-DJME(CM9)、MMD-DJME(CM10)、Relief-DJME(CM11)与TFEAM-DJME(CM8)进行比较，发现TFEAM-DJME在不同跨域故障诊断任务中的诊断准确率明显高于其他模型，进一步验证了所提TFEAM的有效性和优越性。图6为任务中各模型的平均故障诊断准确率比较。

在上述实验过程中，DJME采用的参数为:权衡参数μ＝0.5，正则化参数λ＝0.1，DJME处理的特征数据维数为30。RF分类器中使用的参数包括:树的个数为100，类的个数为4。TCA中使用的参数包括:自适应后的维数为30，正则化参数λ＝0.1，核类型为“rbf”，“rbf”核的带宽为1.0。JDA中使用的参数包括:自适应后的维数为30，正则化参数λ＝0.1，内核类型为“线性”，迭代次数为10次。BDA中使用的参数包括:自适应后的维数为30，正则化参数λ＝0.1，核类型为“线性”，迭代次数为10次，平衡因子为μ＝0.5。

以上，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：具体包含如下步骤：

2.根据权利要求1所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：所述步骤1具体步骤如下：

3.根据权利要求1所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：在步骤1中，对源域和目标域的振动信号进行DTCWPT分解，分解层数设置为4，获取16个终端小波包节点，同时对底层节点系数进行单支小波包重构得到16个单支重构信号，并获取16个重构信号对应的希尔伯特包络谱HES，分别计算16个重构信号与16个HES的11个统计参数，共生成352个统计特征，构成原始统计特征集OSFS。

4.根据权利要求1所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：在步骤2中，采用MIC去除冗余特征，降低计算复杂度；采用K-means和最大均值差异的可迁移特征选取方法TFEAM对原始统计特征集的特征进行评价，得到可迁移性选择指标TI评价特征的可迁移性，采用降序排序后的TI序列选择原始统计特征集的迁移性能好的特征构成领域适应特征子集DAFS。

5.根据权利要求1所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：对于步骤1所得到的源域原始统计特征集中的带标签故障特征数据，计算特征之间的互信息系数MIC，减少冗余特征，降低计算的复杂度；利用K-means聚类方法量化特征的可辨别性，将调整的rand指数ARI作为评价特征辨别性指标FDI；采用MMD测量源域与目标域原始统计特征集中正常状态特征分布差异，并将MMD的值作为评价特征域不变性指标DDI；对于得到的每一特征的FDI与DDI，构建可迁移型选择指标TI；对于来自目标域原始特征集的无标签特征数据，直接用排序后的TI序列进行域不变特征选取。

6.根据权利要求4所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：TFEAM方法的具体步骤如下：

MI^*(D,x,y)＝maxMI(D∣G)(2)

其中，D∣G表示D被G分割；MIC的定义如下：

步骤2.2，对于NRF中的每一个特征，通过K-means聚类方法量化特征的可辨别性，调整的rand指数ARI作为特征辨别性的量化指标；定义一个特征集有M个特征样本，每个样本包含N种特征；特征集和i-th样本的表示分别是F＝[f₁,f₂,…,f_M]和

第i个样本的第k个特征由f_i ^k表示；所有样本的特征用F^N＝[F¹,F²,…F^N]表示，所有样本的第k个特征集用F^k表示；F^k可以定义为：

其中，源域和目标域中M样本的n-th特征分别定义为

和

计算出f_ns和f_nt之间的MMD；当特征之间的MMD较低时，分布差异较小；使用特征的MMD值作为DDI；对于每个特征，获得包含相应MMD值的DDI序列；

7.根据权利要求4所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：在步骤3中，DJME有两个基本步骤：流形子空间学习MSL和判别式联合分布适应DJDA；

DJME的具体步骤如下：

步骤3.1，根据步骤2得到的领域适应特征子集DAFS，采用测地线流核(GFK)，将原始高维特征投影到Grassmann流形子空间中，获取高维特征空间的低维域不变性表示；源域子空间向量v_s和目标域的子空间向量v_t由PCA获得，在(d)中被视为两个点；在两点之间构造测地线流Φ(t)(0≤t≤1)以完成特征映射；映射后定义流形特征为w，w＝Φ(t)^Tx,测地线流核可以描述为两个无限维特征向量

和

的内积：

8.根据权利要求6所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，步骤3.2具体实现如下：

步骤3.21，在传统的MMD定义的基础上，引入了联合概率差异(JPD)；给定_c＝{1,2,…,C}和

分别是X_S和X_T的标签集，C是标签的总数；让P(X|Y)和P(Y)分别是类条件概率和先验概率；根据贝叶斯定律，D_S和D_T之间的JPD表达式如下：

d_DJPD(D_S,D_T)＝M_{same_class}-μM_{differnent_class} (11)

式可以进一步表示为：

其中，根据经验：

同样地,

其中

是从源域训练的分类器获得的目标域的伪标签；进一步变换为：

步骤3.23，令源域和目标域的one-hot编码标签矩阵分别为Y_S＝[y_S,1；y_S,2；…；y_S,nS]，

且y_S,1∈R^1×C，

方程可进一步表示为

其中，

和

表达式如下：

M_{different_classes}的计算步骤如下：

设

其中，Y_S(:,c)是Y_S的第c列，Y_S(:,1)*(C-1)重复Y_S(:,c)C-1次来构造在

中的矩阵，

由

的第1到第C(不包括第1列)列构成；F_S是从已知标签中得到的，

是由迭代更新的伪标签获得；因此，A的表达式可以简化为

其中，

和

的表达式如下：

其中H＝I-1/n表示中心矩阵，n＝n_S+n_T和X＝[X_S,X_T]，

是正则化项，并且应用正则化参数λ以确保优化问题得到明确定义；根据约束优化理论，我们将Φ＝diag(φ₁,φ₂,…,φ_k)∈R^k×k定义为拉格朗日乘数，优化目标的拉格朗日函数可以推导出为

L＝tr(A^T(X(U_min-μU_max)X^T+λI)A)+tr((I-A^TXHX^TA)Φ)(26)

其中，

设置

方程可以转换为广义特征分解问题：

(X(U_min-μU_max)X^T+λI)A＝XHX^TAΦ(29)

9.根据权利要求1所述的一种基于Grassmann流形子空间嵌入的振动信号域适应诊断方法，其特征在于：在步骤4中，构建基于TFEAM和DJME的跨域旋转机械故障诊断模型，具体步骤如下：将步骤3中的源域标记特征集作为随机森林分类器的输入，训练分类器f；采用训练后的分类器f预测目标域标记特征集，输出跨域诊断结果，即得到目标域的标签信息。