CN115560983A - 一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统 - Google Patents
一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统 Download PDFInfo
- Publication number
- CN115560983A CN115560983A CN202211214916.8A CN202211214916A CN115560983A CN 115560983 A CN115560983 A CN 115560983A CN 202211214916 A CN202211214916 A CN 202211214916A CN 115560983 A CN115560983 A CN 115560983A
- Authority
- CN
- China
- Prior art keywords
- model
- federal
- data
- domain
- rolling bearing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 120
- 238000000034 method Methods 0.000 title claims abstract description 109
- 238000005096 rolling process Methods 0.000 title claims abstract description 92
- 238000013526 transfer learning Methods 0.000 title claims abstract description 28
- 238000000605 extraction Methods 0.000 claims abstract description 22
- 238000013508 migration Methods 0.000 claims description 36
- 230000005012 migration Effects 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 31
- 238000012360 testing method Methods 0.000 claims description 27
- 230000003044 adaptive effect Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 25
- 238000009826 distribution Methods 0.000 claims description 23
- 238000010276 construction Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000006116 polymerization reaction Methods 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 230000008929 regeneration Effects 0.000 claims description 2
- 238000011069 regeneration method Methods 0.000 claims description 2
- 230000006872 improvement Effects 0.000 claims 1
- 230000000379 polymerizing effect Effects 0.000 claims 1
- 238000007906 compression Methods 0.000 abstract description 15
- 230000006835 compression Effects 0.000 abstract description 14
- 238000013528 artificial neural network Methods 0.000 abstract description 5
- 238000004891 communication Methods 0.000 abstract description 5
- 230000009466 transformation Effects 0.000 abstract description 3
- 230000006978 adaptation Effects 0.000 description 29
- 238000002474 experimental method Methods 0.000 description 27
- 238000013527 convolutional neural network Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000012800 visualization Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010892 electric spark Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Acoustics & Sound (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统,涉及滚动轴承故障诊断技术领域。本发明的技术要点包括:对滚动轴承时域振动数据做小波变换得到时频谱图,将先验的有标签公共数据作为源域,多用户无标签孤岛隐私数据作为目标域;引入多表示特征提取结构对原始残差网络进行改进,提取源域和目标域的多表示特征,分别构建多用户本地模型;使用深度神经网络的模型压缩思想改进联邦迁移学习框架中的参数传递策略,增强联邦框架的安全性并降低通信开销;在服务器端构建可用于不同工况下滚动轴承故障诊断的联邦全局模型。本发明无需多用户共享数据即可整合孤岛数据知识,具有较高的准确率和较强的泛化性。
Description
技术领域
本发明涉及滚动轴承故障诊断技术领域,具体涉及一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统。
背景技术
滚动轴承是旋转机械中最为关键的零部件之一,在诸多领域都有着十分广泛的应用。实际中,滚动轴承通常会工作在复杂工况下,这就导致轴承的振动特征也会随着工况的变化而改变[1]。因此,不同工况下滚动轴承故障的有效诊断,能够有效防止事故的发生,对于保证旋转机械的高效、健康运行,具有十分重要的意义[2]。
近年来,深度学习在旋转机械智能故障诊断领域的应用越发广泛,其具有自适应提取数据特征的能力并且能够提供端到端的诊断。文献[3]提出一种多尺度卷积神经网络,实现了滚动轴承在大噪声环境下的故障诊断。文献[4]将采集到的滚动轴承振动信号直接输入双向长短期记忆网络模型,从而自动提取滚动轴承的故障特征并进行诊断。文献[5]提出一种将深度卷积神经网络与改进随机森林算法相结合的方法,可对轴承进行有效的故障诊断。文献[6]提出了首层多尺度卷积核的深度卷积神经网络,利用不同大小的一维卷积核从轴承原始振动信号中提取多尺度特征,实现了轴承健康状态的智能诊断。文献[7]提出一种重叠群稀疏模型并提取滚动轴承的复合故障特征,将其输入到一种新的深度复杂卷积神经网络模型,获得较高的诊断准确率。
在大量有标签训练数据的支撑下,传统深度学习方法具有良好的故障诊断准确率。但由于经济成本与相关法律规定等原因,各个工业用户通常很难收集到足够数量的高质量数据,也通常希望自己的数据留在本地,从而产生了滚动轴承的数据孤岛与数据隐私问题。面对这些问题,基于深度学习的滚动轴承智能诊断方法存在局限性。
文献[8]提出利用联邦学习框架解决传统人工智能方法无法解决的数据隐私和数据孤岛问题。文献[9]提出一种基于联邦学习的分布式训练框架,利用多源电力计量数据对全局模型进行“训练”,实现了联邦学习在电力系统中的应用。文献[10]提出了一种基于联邦学习的故障诊断方法,聚合多用户数据知识建立诊断模型并通过相同工况滚动轴承数据验证了方法的有效性。文献[11]在联邦学习算法的基础上增加了一种动态验证方案,弱化低质量数据对全局模型性能的影响,获得了较高的同工况下轴承故障诊断精度。
将联邦学习框架应用到滚动轴承故障诊断领域能够有效解决轴承的数据孤岛与数据隐私问题,但仍需以多用户轴承数据的特征分布相同且训练数据有标签为前提。这一设定明显不满足工业生产中的轴承工况复杂、有标签数据少的实际情况。
迁移学习具有利用已知知识对其他相似领域问题进行求解的能力,受到了众多相关学者的重视。文献[12]提出将深度置信网络与混合核联合分布适配方法相结合,实现不同工况下的轴承多状态识别。文献[13]将适配层加入残差网络模型,通过域适应方法完成了将实验室环境中的故障诊断知识向实际工程装备的迁移。文献[14]提出了一种基于分类器差异的新型智能诊断框架,在目标域无标签的情况下,在行星齿轮数据和滚动轴承数据上获得了较高的准确率。文献[15]提出了一种基于子领域自适应的深度特征迁移学习方法,并在两个公开的不同工况滚动轴承故障数据集上验证了方法的有效性。
上述深度学习的特征迁移方法能够较好地解决具有分布差异的滚动轴承故障诊断问题。因此,将联邦学习框架与迁移学习思想相结合,实现多用户孤岛隐私数据差异分布下的联邦知识迁移学习,是目前值得深入研究的问题。
文献[16]将域适应技术与联邦学习结合,在保证数据隐私的前提下完成了对脑电图和心电图的分类任务。文献[17]提出一种用于可穿戴医疗的联邦特征迁移学习方法,利用易收集的公共数据构建源域数据集,然后通过域适应方法构建用户个性化模型,提升了可穿戴活动识别的准确率。文献[18]利用特征提取器、重构器和分类器构建本地模型,以对抗学习的方式获取不同客户端的共享特征,实现了滚动轴承全局故障诊断模型的构建。
针对多用户隐私数据故障诊断问题,现有方法大多建立在恒定工况且数据同分布的条件下,而对于多用户数据存在分布差异的问题,现有的方法又无法保证数据隐私性。
发明内容
针对滚动轴承不同工况下振动数据分布差异大、大量有标签数据获取困难、孤岛隐私数据无法集中使用的问题,本发明提出一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统,以实现不同工况下滚动轴承不同故障位置及不同故障程度的故障诊断。
根据本发明的一方面,提供一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法,该方法包括以下步骤:
(1)数据集的构建
选取某工况下公开且已知标签的滚动轴承数据构建源域公共数据集,多个用户利用各自本地无标签的滚动轴承数据分别构建目标域数据集;其中,源域公共数据集和多个目标域数据集的滚动轴承工况互不相同;
(2)本地模型构建
多个用户中的每个用户利用改进的残差网络提取目标域数据集和源域公共数据集中同一样本的不同表示下的多个特征,在多个特征空间内同时进行特征对齐;每个用户的本地模型的目标函数设置为交叉熵分类损失以及不同表示下的条件最大均值差异损失之和;经过一定次数的迭代训练,目标函数收敛,完成每个用户的本地模型的构建;
(3)联邦全局故障诊断模型构建
多个用户中的每个用户的本地模型构建完成后,将压缩处理后的模型参数上传至中央服务器,中央服务器端聚合模型参数并下发给各个用户,各个用户利用聚合后模型参数更新本地模型,上述过程称为一次联邦迭代,经过预定次数的联邦迭代,在服务器端得到最终可用于不同工况下滚动轴承故障诊断的联邦全局模型;
(4)模型测试
将多个用户的测试数据集分别输入联邦全局模型,把模型对测试数据的标签预测结果与真实标签作对比,得出各自的分类准确率;
(5)故障诊断
将滚动轴承待诊断数据输入训练好的联邦全局模型,获取诊断结果。
进一步地,在(2)本地模型构建中所述改进的残差网络的改进之处在于:利用多表示域特征提取结构代替残差网络的全局池化层;所述改进的残差网络使用具有多个子结构h1(.)…hn(.)的多表示域特征提取结构提取数据多表示下的特征:
(h1 og)(X),...,(hn og)(X)
其中,每个子结构由不同数量、不同结构的卷积层池化层构成;o表示复合函数;g表示网络将输入图像由高像素转化为低像素的过程;X表示残差网络的输入数据的集合;n代表子结构数量。
进一步地,在(2)本地模型构建中网络的特征对齐通过最小化域适应损失来实现,基于多表示特征的域适应损失表示为:
进一步地,在(2)本地模型构建中所述条件最大均值差异损失计算公式如下:
其中,给定一个包含ns个有标签样本的源域样本集合和一个包含nt个无标签样本的目标域是与第i个源域样本相对应的标签,分别表示属于源域、目标域中第c类的样本个数,表示对应的样本隶属于源域第c类,表示第j个无标签目标域样本属于目标域第c类,H表示一种具有特征核的再生希尔伯特空间;表示一种将原始的样本数据映射到H的特征映射。
进一步地,在(3)联邦全局故障诊断模型构建中每次联邦迭代过程中,中央服务器端聚合模型参数的聚合方法为联邦平均算法,表示为:
根据本发明的另一方面,提供一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断系统,该系统包括:
数据集构建模块,用于选取某工况下公开且已知标签的滚动轴承数据构建源域公共数据集,多个用户利用各自本地无标签的滚动轴承数据分别构建目标域数据集;其中,源域公共数据集和多个目标域数据集的滚动轴承工况互不相同;
本地模型构建模块,用于多个用户中的每个用户利用改进的残差网络提取目标域数据集和源域公共数据集中同一样本的不同表示下的多个特征,在多个特征空间内同时进行特征对齐;每个用户的本地模型的目标函数设置为交叉熵分类损失以及不同表示下的条件最大均值差异损失之和;经过一定次数的迭代训练,目标函数收敛,完成每个用户的本地模型的构建;
联邦全局故障诊断模型构建模块,用于多个用户中的每个用户的本地模型构建完成后,将压缩处理后的模型参数上传至中央服务器,中央服务器端聚合模型参数并下发给各个用户,各个用户利用聚合后模型参数更新本地模型,上述过程称为一次联邦迭代,经过预定次数的联邦迭代,在服务器端得到最终可用于不同工况下滚动轴承故障诊断的联邦全局模型;
模型测试模块,用于将多个用户的测试数据集分别输入联邦全局模型,把模型对测试数据的标签预测结果与真实标签作对比,得出各自的分类准确率;
故障诊断模块,用于将滚动轴承待诊断数据输入训练好的联邦全局模型,获取诊断结果。
进一步地,所述本地模型构建模块中所述改进的残差网络的改进之处在于:利用多表示域特征提取结构代替残差网络的全局池化层;所述改进的残差网络使用具有多个子结构h1(.)…hn(.)的多表示域特征提取结构提取数据多表示下的特征:
(h1 og)(X),...,(hn og)(X)
其中,每个子结构由不同数量、不同结构的卷积层池化层构成;o表示复合函数;g表示网络将输入图像由高像素转化为低像素的过程;X表示残差网络的输入数据的集合;n代表子结构数量。
进一步地,所述本地模型构建模块中网络的特征对齐通过最小化域适应损失来实现,基于多表示特征的域适应损失表示为:
进一步地,所述本地模型构建模块中所述条件最大均值差异损失计算公式如下:
其中,给定一个包含ns个有标签样本的源域样本集合和一个包含nt个无标签样本的目标域是与第i个源域样本相对应的标签,分别表示属于源域、目标域中第c类的样本个数,表示对应的样本隶属于源域第c类,表示第j个无标签目标域样本属于目标域第c类,H表示一种具有特征核的再生希尔伯特空间;表示一种将原始的样本数据映射到H的特征映射。
进一步地,所述联邦全局故障诊断模型构建模块中每次联邦迭代过程中,中央服务器端聚合模型参数的聚合方法为联邦平均算法,表示为:
本发明的有益技术效果是:
本发明基于联邦学习“数据不动模型动,数据可用不可见”的思想,提出一种联邦特征迁移学习框架以及一种基于联邦多表示域适应的不同工况下滚动轴承故障方法。该方法使用多表示特征提取结构对残差网络进行改进,构建用户本地模型,并改进联邦迁移学习框架中的参数传递策略对本地模型进行压缩,最终实现不同工况下滚动轴承不同故障位置及不同故障程度的故障诊断。本发明能够在多用户轴承数据孤岛隐私分布且部分工况下带标签数据稀缺的情况下,建立有效的故障诊断模型。实验验证,本发明所提方法平均故障诊断准确率可达97.6%,且具有较强的泛化性。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。
图1是联邦学习框架图;
图2是卷积神经网络结构图;
图3是原始残差块结构示意图;
图4是本发明实施例中多表示域适应网络结构图;
图5是本发明实施例一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法的流程框图;
图6是本发明实施例中滚动轴承实验台;
图7是本发明实施例中实验数据的小波谱示意图;
图8是本发明实施例中单一表示域适应网络特征可视化图;
图9是本发明实施例中多表示域适应网络特征可视化图;
图10是本发明实施例中rate值与平均准确率关系图;
图11是本发明方法与单一用户建模对比实验结果图;
图12是本发明实施例中用户1混淆矩阵示意图;
图13是本发明实施例中用户2混淆矩阵示意图;
图14是本发明实施例中工况泛化对比实验结果图;
图15是本发明实施例中NICE轴承对比实验结果图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,在下文中将结合附图对本发明的示范性实施方式或实施例进行描述。显然,所描述的实施方式或实施例仅仅是本发明一部分的实施方式或实施例,而不是全部的。基于本发明中的实施方式或实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式或实施例,都应当属于本发明保护的范围。
本发明实施例提供一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法,下面对该方法进行详细的说明。
1.联邦学习相关理论
1.1联邦学习
联邦学习是一种带有隐私保护、安全加密技术的分布式机器学习框架。旨在通过多方的孤岛数据训练出高性能的联邦学习模型,减少传统人工智能模型训练时,数据隐私泄露和数据量需求过大的弊端,为人工智能模型训练提供了新的思路。联邦学习框架一般如图1所示。从图1可看出,区别于传统机器学习,联邦学习主要有三个特点:各方数据都保留在本地,不泄露隐私也不违反法规;多个用户联合数据建立虚拟的联邦全局模型,共同“富裕”,共同获益;在联邦学习的体系下,各个用户的身份和地位相同。
联邦学习框架中,服务器端最常用的参数聚合方法为联邦平均算法(FederatedAveraging Algorithm,FedAvg),假设共有n个用户参与到联邦学习框架中,则FedAvg可以表示为:
1.2联邦迁移学习
联邦学习虽然理论上打破了传统机器学习的数据孤岛、数据隐私安全等僵局,但在实际应用中仍存在一些不容忽视的问题,比如要求多方用户数据都处在同一分布下。多方用户数据分布差异较大时,直接采用联邦学习框架建模可能会产生比单独训练更差的模型。迁移学习能够将在某个领域或任务上学习到的知识应用到不同但相关的领域或问题中。因此,联邦迁移学习将迁移学习思想与联邦学习框架融合,并为式(2)场景提供解决方案:
其中Si、Sj和Ii、Ij分别代表用户i和用户j的样本空间和特征空间,Di、Dj为用户i和用户j拥有的孤岛隐私数据集。
联邦迁移学习框架能够联合多用户不同分布下的孤岛隐私数据知识建立全局模型,完成“大数据领域向小数据领域的迁移”,最终对目标域中的样本进行标签预测(回归预测)。
1.3模型压缩
联邦学习框架虽然不需要直接上传用户的隐私数据,但训练过程中交互的模型参数也是敏感性信息,需要一定技术增强其隐私性,否则一旦被攻击,攻击者就能利用模型参数推测出有价值的隐私信息[19]。另外,当参与用户过多或需要上传的模型参数量过大时,传输过程产生的网络通信开销有可能大大超出预期[20]。因此,安全性与通信效率也是判定算法整体性能的标准之一。
由于大部分深度神经网络模型在模型训练的过程中,都存在着权重参数冗余的问题,即在所有参数中,对模型性能起到重要作用的,往往只有一部分。因此,利用模型压缩算法的思想,在传输的过程中,只传输用户本地模型的部分参数,即用户在每次模型更新时只上传层内参数变化较大的层的全部参数。一方面随着传输数据量的减少,能够有效降低网络传输的带宽消耗;另一方面,由于只传输了部分参数数据,这样即使攻击者获取了这部分数据,由于没有全局信息也很难利用模型反演攻击来反推出原始数据,从而有效提升了系统的安全性。模型压缩程度由模型层压缩率(rate)决定,如rate=0.95代表只传输此次迭代更新变化较大的前95%的层的参数。
2.改进的残差网络
域适应问题是迁移学习研究的内容之一,能够在无监督的情形下解决特征空间和类别空间一致、特征分布不一致的问题。传统的域适应方法一般对齐单一表示下的特征分布,可能只包含部分信息,例如,仅包含图片的部分饱和度、亮度和色调信息。因此,单一表示的特征提取可能提供的是错误或者扭曲的真实图像[21]。为了使变换后的源域和目标域的特征分布尽可能相似,提取得到更适用于全局的域不变特征,本发明引入多表示特征提取结构对原始残差网络进行改进,提取源域和目标域多表示下的特征,构建用户本地模型。
2.1残差网络与多表示域适应网络
卷积神经网络(Convolution Neural Network,CNN)是一种含有多个隐藏层的人工深层神经网络,有很强的特征提取能力和模式识别的能力[22]。传统CNN由输入层、卷积层、池化层、全连接层和输出层组成,其结构如图2所示。
残差网络(ResNet)是由传统CNN网络发展而来。ResNet保留传统CNN网络主干结构的同时,增加了更深的网络层并且引入长短时记忆网络中的门控机制,在CNN的各个网络层之间加入恒等映射单元,将网络层输入的恒等映射与其非线性变换进行叠加运算。残差块作为残差网络的基本单元,其结构如图3所示。
残差块的输入为z,输出为H(z),残差指的是输出值H(z)与输入值z的差值,即:
f(z)=H(z)-z (3)
由于新增了残差块结构,残差网络的训练过程中,只需要学习多个残差块输入输出之间的差别f(z),从而解决了随着CNN模型层数增加而出现的网络退化现象。模型在反向传播过程中,输入通过恒等映射,直接将信息从残差块的输入端传递到输出端,保证了信息在传递过程中的完整性。
ResNet的输出可简单由三部分表示:g(·),h(·)和s(·)。第一部分g(·)能够将高像素的输入图像转化为低像素图像;第二部分h(·)用于从低像素中提取特征;第三部分s(·)用于将特征表示映射到样本标记空间,作为分类器。因此,ResNet输出y=f(x)可表示为:
y=(sohog)(X) (4)
其中,o表示复合函数,例如((hog)(X)=h(g(X))),X为网络的输入数据x的集合。
多表示域适应网络利用多表示域特征提取结构代替ResNet的全局池化层来提取数据的多表示特征,多表示域适应网络的结构如图4。由图4可以看出,多表示域适应网络使用具有多个子结构h1(.)…hn(.)的多表示特征提取结构提取数据多表示下的特征:
(h1og)(X),...,(hn og)(X) (5)
其中,每个子结构由不同数量、不同结构的卷积层池化层构成;o表示复合函数;g表示网络将输入图像由高像素转化为低像素的过程;X表示残差网络的输入数据的集合;n代表子结构数量。
此时,ResNet的输出y=f(x)可被重新表示为:
y=s([(h1og)(X);...;(hnog)(X)]) (6)
与单一表示下的特征相比,多表示域适应网络提取的特征可以覆盖更多的信息。将源域和目标域的多表示下的特征对齐,理论上可以获得更好的分类效果。网络的特征对齐任务可以通过最小化域适应损失来实现,基于多表示特征的域适应损失:
其中,表示源域和目标域特征分布之间差异的估计量,Xs和Xt分别代表源域输入数据xs和目标域输入数据xt的集合,f表示目标函数。基于式(6)可以将多表示域适应网络的整体损失函数表示为分类损失与域适应损失之和,多表示域适应网络损失函数:
其中,ns表示源域样本数量,J(·,·)代表交叉熵损失函数(分类损失),λ>0是域适应衰减项。
2.2条件最大均值差异
条件分布自适应主要思想是缩小两个领域数据之间的条件概率密度的差异,即:
minPs(ys|xs),Pt(yt|xt) (9)
本发明使用条件最大均值差异(Conditional Maximum Mean Discrepancy,CMMD)作为域适应损失项来度量源域和目标域的分布距离。CMMD的计算公式如式(10)所示:
其中,给定一个包含ns个有标签样本的源域样本集合和一个包含nt个无标签样本的目标域是与第i个源域样本相对应的one-hot标签,表示属于源域、目标域中第c类的样本个数,就表示对应的样本隶属于源域第c类,代表第j个无标签目标域样本属于目标域第c类。H是一种具有特征核的再生希尔伯特空间;表示一种可以将原始的样本数据映射到H的特征映射。
由于目标域不包含有标签样本,模型对于目标域数据预测得到的标签(硬标签)又可能存在错误,因此无法直接计算式(7)。但是,深层神经网络的输出可以等价成一个概率分布:
3.不同工况下滚动轴承故障诊断方法
不同工况条件下,基于联邦多表示域适应的滚动轴承故障诊断方法整体流程框图如图5所示。具体步骤如下:
(1)数据集的构建
选取某工况下公开且已知标签的滚动轴承数据构建源域公共数据集,用户1、用户2利用各自本地无标签的滚动轴承数据分别构建目标域1和目标域2数据集,若存在新用户3,其数据也作为目标域数据。构成源域、目标域数据集的滚动轴承工况互不相同。
(2)本地模型构建
以用户1为例,用户1利用多表示域适应网络提取目标域1和源域数据的多表示下特征,在多个特征空间内同时进行特征对齐,其中,多表示特征是指通过上文的多表示域适应网络提取到的同一样本的不同表示下特征,如一张图片的色调特征、对比度特征等;最后,本地模型1的目标函数设置为交叉熵分类损失以及不同表示下的CMMD损失之和。经过一定次数的迭代训练,目标函数收敛,完成本地模型1的构建。其他用户模型的构建过程同理。
(3)联邦全局故障诊断模型构建
用户本地模型构建完成后,将压缩处理后的模型参数上传至中央服务器,服务器端聚合模型参数并下发给各个用户,用户利用聚合后模型参数更新本地模型。上述过程称为一次联邦迭代,经过预定次数的联邦迭代,在服务器端得到最终可用于不同工况下滚动轴承故障诊断的联邦全局模型。
(4)模型测试
将用户1和用户2的测试数据集分别输入联邦全局模型,把模型对测试数据的标签预测结果与真实标签作对比,得出各自的分类准确率。
(5)故障诊断
用户的工况I或工况II滚动轴承待诊断数据可直接输入现有联邦全局故障诊断模型,得出诊断结果;用户的其他工况滚动轴承待诊断数据,可直接利用现有联邦全局故障诊断模型得出初步诊断结果。若有新的其他工况的待诊断数据,可重新参与到联邦迁移过程中,建立新的全局故障诊断模型后再进行诊断。
4.应用与分析
4.1实验数据集
本发明以不同工况下的6205-2RS深沟球轴承为研究对象,其多种状态的振动信号采集自轴承实验台[23]。滚动轴承实验台如图6所示,主要包含三个部分:电动机、负载、控制电路。其中电动机驱动端安装的加速度传感器以12kHz的采样频率采集滚动轴承多状态振动信号。
实验中轴承的故障特指点蚀故障,是使用电火花机在轴承的内圈、滚动体、外圈三个位置加工产生的。三个故障位置的点蚀直径有0.1778mm、0.3556mm、0.5334mm三种,加上正常状态共有十类状态。为方便后续对实验数据的表述,现对轴承的10类状态进行设定,轴承正常状态设置为N,实验数据中9种故障状态表示方法如表1所示。
表1实验数据表示方法
实验数据在0hp、1hp、2hp和3hp共4种不同的负载下采集获得(1hp≈0.75kW),根据负载的不同,电机的转速在1730rpm-1797rpm之间变化。
轴承运行所处的工况与负载、转速之间的对应关系如表2所示。
表2轴承工况与负载、转速对应关系
数据预处理过程中,以1024点为一个样本的长度,做小波变换,得到实验所用数据集。以0hp的一个OR07样本为例,其小波谱如图7所示。
后续实验中,共设置8个迁移任务,各任务所用数据集对应工况如表3所示。针对滚动轴承数据孤岛隐私问题,特设置公共数据集为1000个样本,用户1、用户2数据集都为100个样本,仅为公共数据集样本数的1/10,测试集为1000个样本。其中,所有数据集都包含滚动轴承的10类状态。
表3各任务所用数据集组成
以任务1为例,源域数据(公共数据集)为工作于A工况的轴承数据,目标域1(用户1)数据集为工作于B工况的轴承数据,目标域2(用户2)数据集为工作于C工况的轴承数据。
本发明所提方法采用ReLU函数作为激活函数,本地模型迭代次数local_epochs设置为100,联邦迭代次数epochs设置为50,学习率lr设置为0.01,并基于以下假设实现:
(1)联邦特征迁移框架共有两个用户端,全局故障诊断模型分类准确率为两个用户将各自的测试集输入全局故障诊断模型得出的准确率的平均值。
(2)所有用户端都有相同的故障诊断任务,即不同的用户端具有相同的标签空间。
(3)不同客户端共享公共数据,但各用户独有的本地隐私数据不共享。
实验使用的硬件环境:CPU型号为Intel Xeon W-2123;内存32GB;GPU型号为NVIDIA GeForce GTX1080Ti。
4.2多表示域适应与单一表示域适应对比实验
为了验证多表示域适应网络能够更好地提取数据的深层特征,将轴承数据分别输入单一表示域适应网络与多表示域适应网络,并利用t-分布邻域嵌入(t-distributionstochastic neighbor embedding,t-SNE)算法对网络所提取的深层特征进行降维可视化操作[24]。以迁移任务1为例,特征可视化效果图如图8、图9所示。
对比观察图8、图9可以得知,多表示域适应网络和单一表示域适应网络所提取的特征,经可视化后均出现了错分现象,但仍有较大差异。单一表示域适应网络提取的样本深层特征在可视化后,在图8的L1到L10区域都存在错分样本、并且类别边界十分模糊。多表示域适应网络提取的深层特征可视化后各类别之间仅在图9的L1、L2区域出现错分现象,类别边界明显。因此,初步判断利用多表示域适应网络构建用户本地模型,可以更好地提取滚动轴承的深层特征,有利于提升联邦全局模型的性能。
为了进一步验证利用多表示域适应网络构建本地模型能够提升联邦全局模型的性能,按照设置的迁移任务,分别利用多表示域适应网络和单一表示域适应网络构建联邦本地模型进行滚动轴承故障诊断实验,结果如表4。
表4故障诊断准确率(%)
对比表4中的故障诊断准确率可知,在大部分迁移任务中,利用多表示域适应构建本地模型得到的联邦全局模型都具有更高的故障诊断准确率,仅有迁移任务6略低。计算8个迁移任务的平均故障诊断准确率可知,多表示域适应高于单一表示域适应约2.3%。这一结果说明利用多表示域适应网络构建本地模型可以更好地学习用户数据和公共数据之间的“共有”特征,提高不同工况下滚动轴承故障诊断的准确率。
4.3不同模型压缩程度对比实验
为了探究模型压缩处理对联邦全局模型故障诊断准确率的影响,采取不同的模型压缩程度进行实验。rate为层压缩率,值越小代表模型压缩程度越高、安全性越强,rate=1.00时,不进行模型压缩处理。实验结果如表5所示。
表5不同rate值的故障诊断准确率(%)
由表5可知,rate=1.00时的故障诊断准确率并非在全部迁移任务中都高于其他4个rate值对应的故障诊断准确率。为了更加直观地表明rate值对联邦全局诊断模型性能的影响,绘制不同rate值与8个迁移任务平均故障诊断准确率的点线图,如图10所示。
从图10中可以清晰地看出,随着rate值的增大,平均故障诊断准确率呈上升趋势。当rate=0.80时,相比于rate=1.00,平均准确率有着明显的降低;当rate=0.85时,平均准确率仅比rate=1.00时低0.1%。也就是说,选取不恰当的层压缩率会对准确率产生不利影响;选取合适的层压缩率,可在保证故障诊断准确率的同时,提升联邦学习框架的安全性并降低通信开销。因此,综合考虑,后续实验中rate值都设置为0.85。
4.4所提方法与单一用户建模对比实验
为验证相比于单一用户直接利用本地孤岛隐私数据与公共数据集构建深度迁移模型的情形,本发明所提方法能有效提高不同工况下滚动轴承的故障诊断准确率,本节将所提方法分别与深度子域适应网络(Deep Subdomain Adaptation Network for ImageClassification,DSAN)、深度适配网络(Deep Adaptation Network,DAN)、域适应神经网络(Domain adaptive Neural Network,DaNN)、动态对抗域适应网络(Dynamic AdversarialAdaptation Network,DAAN)、多表示域适应网络(Multi-representation AdaptationNetwork,MRAN)5种深度特征迁移方法进行对比实验。由于经典的深度特征迁移方法无法直接完成本发明设置的迁移任务。因此,为模拟用户直接利用本地孤岛数据与公共数据构建深度迁移模型的场景,以公共数据集为源域,分别以用户1、用户2数据集为目标域,将两次实验的诊断准确率取平均值作为该任务的准确率。对比结果如图11所示。
由图11的实验结果可以看出,在8个迁移任务中,本发明所提方法的故障诊断准确率均高于单一用户利用其他5种深度特征迁移方法建模的情况,并且所提方法在用户仅拥有少量数据的情况下,平均故障诊断准确率可以达到97.6%。相比于用户单独建模,故障诊断准确率至少有3.2%的提升。
为了更加直观地观察本发明所提方法在不同工况故障诊断问题中的有效性,引入多分类混淆矩阵对诊断结果进行分析。篇幅所限,仅以任务1中的故障诊断结果为例,绘制混淆矩阵如图12、图13所示。由图12可知,在用户1的1000个目标域测试集样本中,只有IR07、B07、OR14的3类故障存在错分现象,共10个错分样本。由图13可知,在用户2的1000个目标域测试样本中只有IR21、B07、B21、OR14的4类故障存在错分现象,共存在8个错分样本。整体来看,大部分故障类型的诊断准确率都达到了100%,存在错分现象的故障类型的诊断准确率最低也有95%。实验表明,相比于不结合联邦框架的深度特征迁移方法,本发明所提出的基于联邦多表示域适应方法可以保护用户数据隐私、聚合多用户孤岛数据知识,有效地解决不同工况下滚动轴承的故障诊断问题。
4.5泛化实验
4.5.1工况泛化实验
为了进一步验证本发明提出的方法可以应对滚动轴承不同的工作环境,训练得到的联邦全局诊断模型可以解决未参与模型训练的其他工况的轴承故障诊断问题。将本发明方法与4.4节中5种深度特征迁移方法进行工况泛化实验对比,工况泛化实验的数据集对应工况如表6所示。泛化数据集只参与模型测试,不参与模型训练,共1000个样本。
表6工况泛化实验数据集组成
按照表6中的实验设置进行实验,结果如图14所示。由图14可知,本发明所提方法在任务9至任务12这4个不同的工况泛化迁移任务中,取得了平均故障诊断准确率95.3%的效果。与其他5种深度迁移学习方法相比,所提方法在所有任务中都取得了更好的故障诊断效果。因此,本发明所提方法可以更好地提取不同工况下轴承的域不变特征,即使待诊断的轴承数据是未参与模型训练的其他工况下数据,也能保证较高的诊断精度。在解决滚动轴承数据孤岛与数据隐私问题的同时,具有较强的泛化性。
4.5.2 NICE轴承数据集泛化实验
为了验证本发明方法在不同数据集上具有较强的泛化性,选择NICE轴承不同工况下数据作为实验数据集,进行滚动轴承故障诊断泛化实验。
NICE轴承数据集共包含E、F、G、H四种工况,每种工况包含轴承的三种状态振动数据:内圈故障(IR)、外圈故障(OR)及正常(N)。实验设置迁移任务与数据工况对应关系如表7。
表7 NICE轴承实验数据集组成
按照表7设置的迁移任务进行实验,结果如图15所示。由图15可以看出,在全部的迁移任务中,本发明所提方法的故障诊断准确率均高于单一用户使用4.4节中5种深度特征迁移方法建模的情况,任务13、任务17的诊断准确率达到了100%,平均故障诊断准确率也有98.9%,相比于用户单独建模至少有3.4%的提升。经过实验验证,本发明所提方法能够有效解决不同工况下NICE轴承的故障诊断问题,进一步证明了本发明所提方法在不同数据集上具有较强的泛化性。
本发明提出将特征迁移学习融入到联邦学习框架中,并引入多表示特征提取结构对原始残差网络进行改进,提取源域和目标域之间更为全面的共有特征,进而构建联邦本地特征迁移学习模型。通过特征可视化与故障诊断准确率,证明了利用多表示域适应网络构建联邦本地模型相比于单一表示域适应网络能够得到性能更好的联邦全局诊断模型。
本发明基于深度学习模型压缩思想,改进传统联邦学习框架的参数传递策略。经实验验证,选取合适的层压缩率不会严重影响全局模型性能。同时,模型压缩后只传输部分本地模型参数,能够降低联邦学习框架的通信开销并进一步保证用户数据的隐私性。
本发明提出了一种基于联邦多表示域适应的不同工况下滚动轴承故障诊断方法,能够在多用户轴承数据孤岛隐私分布且部分工况下带标签数据稀缺的情况下,建立有效的故障诊断模型。实验验证,所提方法平均故障诊断准确率可达97.6%,较本发明对比的单一用户使用其他方法建模的情形,故障诊断准确率提升至少3.2%,证明了方法的有效性。经泛化实验证明,所提方法也具有较强的泛化性。
本发明另一实施例还提出一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断系统,该系统包括:
数据集构建模块,用于选取某工况下公开且已知标签的滚动轴承数据构建源域公共数据集,多个用户利用各自本地无标签的滚动轴承数据分别构建目标域数据集;其中,源域公共数据集和多个目标域数据集的滚动轴承工况互不相同;
本地模型构建模块,用于多个用户中的每个用户利用改进的残差网络提取目标域数据集和源域公共数据集中同一样本的不同表示下的多个特征,在多个特征空间内同时进行特征对齐;每个用户的本地模型的目标函数设置为交叉熵分类损失以及不同表示下的条件最大均值差异损失之和;经过一定次数的迭代训练,目标函数收敛,完成每个用户的本地模型的构建;
联邦全局故障诊断模型构建模块,用于多个用户中的每个用户的本地模型构建完成后,将压缩处理后的模型参数上传至中央服务器,中央服务器端聚合模型参数并下发给各个用户,各个用户利用聚合后模型参数更新本地模型,上述过程称为一次联邦迭代,经过预定次数的联邦迭代,在服务器端得到最终可用于不同工况下滚动轴承故障诊断的联邦全局模型;
模型测试模块,用于将多个用户的测试数据集分别输入联邦全局模型,把模型对测试数据的标签预测结果与真实标签作对比,得出各自的分类准确率;
故障诊断模块,用于将滚动轴承待诊断数据输入训练好的联邦全局模型,获取诊断结果。
本实施例中,优选地,所述本地模型构建模块中所述改进的残差网络的改进之处在于:利用多表示域特征提取结构代替残差网络的全局池化层;所述改进的残差网络使用具有多个子结构h1(.)…hn(.)的多表示域特征提取结构提取数据多表示下的特征:
(h1 og)(X),...,(hn og)(X)
其中,每个子结构由不同数量、不同结构的卷积层池化层构成;o表示复合函数;g表示网络将输入图像由高像素转化为低像素的过程;X表示残差网络的输入数据的集合;n代表子结构数量。
本实施例中,优选地,所述本地模型构建模块中网络的特征对齐通过最小化域适应损失来实现,基于多表示特征的域适应损失表示为:
本实施例中,优选地,所述本地模型构建模块中所述条件最大均值差异损失计算公式如下:
其中,给定一个包含ns个有标签样本的源域样本集合和一个包含nt个无标签样本的目标域是与第i个源域样本相对应的标签,分别表示属于源域、目标域中第c类的样本个数,表示对应的样本隶属于源域第c类,表示第j个无标签目标域样本属于目标域第c类,H表示一种具有特征核的再生希尔伯特空间;表示一种将原始的样本数据映射到H的特征映射。
本实施例中,优选地,所述联邦全局故障诊断模型构建模块中每次联邦迭代过程中,中央服务器端聚合模型参数的聚合方法为联邦平均算法,表示为:
本实施例所述一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断系统的功能可以由前述一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法说明,因此本实施例未详述部分,可参见以上方法实施例,在此不再赘述。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
本发明所援引的文献如下:
[1]CHEN Zhiqiang,DENG Shengcai,CHEN Xudong,et al.Deep neuralnetworks-based rolling bearing fault diagnosis[J].MicroelectronicsReliability,2017,75,327-333.
[2]康守强,邹佳悦,王玉静,等.基于无监督特征对齐的变负载下滚动轴承故障诊断方法[J].中国电机工程学报,2020,40(1):274-281.
[3]许子非,金江涛,李春.基于多尺度卷积神经网络的滚动轴承故障诊断方法[J].振动与冲击,2021,40(18):212-220.
[4]赵志宏,赵敬娇,魏子洋,等.基于BiLSTM的滚动轴承故障诊断研究[J].振动与冲击,2021,40(1):95-101.
[5]XU Gaowei,LIU Min,JIANG Zhuofu,et al.Bearing fault diagnosismethod based on deep convolutional neural network and random forest ensemblelearning[J].Sensors,2019,19(5):1-21.
[6]FU Liangcheng,LI Zhang,TAO Junyong.An improved deep convolutionalneural network with multiscale convolution kernels for fault diagnosis ofrolling bearing[C].IOP Publishing,2021,1043(5):052021.
[7]AN Fengping,WANG Jianrong.Rolling bearing fault diagnosisalgorithm using overlapping group sparse-deep complex convolutional neuralnetwork[J].Nonlinear Dynamics,2022,108:2353-2368.
[8]杨强.联邦学习:人工智能的最后一公里[J].智能系统学报,2020,15(01):183-186.
[9]郑楷洪,肖勇,王鑫,等.一个面向电力计量系统的联邦学习框架[J].中国电机工程学报,2020,40(S1):122-133.
[10]LI Zhinong,LI Zedong,LI Yunlong,et al.An intelligent diagnosismethod for machine fault based on federated learning[J].Applied Sciences,2021,11(24):12117.
[11]ZHANG Wei,LI Xiang,MA Hui,et al.Federated learning for machineryfault diagnosis with dynamic validation and self-supervision[J].Knowledge-Based Systems,2021,213:106679.
[12]KANG Shouqiang,CHEN Weiwei,WANG Yujing,et al.Method of stateidentification of rolling bearings based on deep domain adaptation undervarying loads[J].Measurement&Technology,2020,14(3):303-313.
[13]雷亚国,杨彬,杜兆钧,等.大数据下机械装备故障的深度迁移诊断方法[J].机械工程学报,2019,55(07):1-8.
[14]JIAO Jinyang,ZHAO Ming,LIN Jing.Unsupervised adversarialadaptation network for intelligent fault diagnosis[J].IEEE Transactions onIndustrial Electronics,2019,67(11):9904-9913.
[15]董绍江,朱朋,裴雪武,等.基于子领域自适应的变工况下滚动轴承故障诊断[J].吉林大学学报(工学版),2022,52(02):288-295.
[16]JU Ce,GAO Dashan,MANE R,et al.Federated transfer learning for EEGsignal classification[C].EMBC2020.
[17]CHEN Yiqing,QIN Xin,WANG Jindong,et al.Fedhealth:A federatedtransfer learning framework for wearable healthcare[J].IEEE IntelligentSystems,2020,35(4):83-93.
[18]ZHANG Wei,LI Xiang.Federated transfer learning for intelligentfault diagnostics using deep adversarial networks with data privacy[J].IEEE/ASME Transactions on Mechatronics,2021,27(1):430-439.
[19]SHOKRI R,STRONATI M,SONG Congzheng,et al.Membership inferenceattacks against machine learning models[C].SP 2017.
[20]LI Tian,SAHU A K,TALWALKAr A,et al.Federated learning:challenges,methods,and future directions[J].IEEE Signal Processing Magazine,2020,37(3):50-60.
[21]ZHU Yongchun,ZHUANG Fuzhen,WANG Jindong,et al.Multi-representation adaptation network for cross-domain image classification[J].Neural Networks,2019,119:214-221.
[22]Y,BOTTOU L,BENGIO Y,et al.Gradient-Based learning appliedto document recogniti on[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[23]KENNETH A Loparo.Bearing data center[M/OL].Cleveland:Case WesternReserve University,2013.http://csegroups.case.edu/bearingdatacenter/home.
[24]VAN Der Maaten L,HINTON G.Visualizing data using t-SNE[J].Journalof Machine Learning Research,2008,9(11):2579-2625.
Claims (10)
1.一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法,其特征在于,包括以下步骤:
(1)数据集的构建
选取某工况下公开且已知标签的滚动轴承数据构建源域公共数据集,多个用户利用各自本地无标签的滚动轴承数据分别构建目标域数据集;其中,源域公共数据集和多个目标域数据集的滚动轴承工况互不相同;
(2)本地模型构建
多个用户中的每个用户利用改进的残差网络提取目标域数据集和源域公共数据集中同一样本的不同表示下的多个特征,在多个特征空间内同时进行特征对齐;每个用户的本地模型的目标函数设置为交叉熵分类损失以及不同表示下的条件最大均值差异损失之和;经过一定次数的迭代训练,目标函数收敛,完成每个用户的本地模型的构建;
(3)联邦全局故障诊断模型构建
多个用户中的每个用户的本地模型构建完成后,将压缩处理后的模型参数上传至中央服务器,中央服务器端聚合模型参数并下发给各个用户,各个用户利用聚合后模型参数更新本地模型,上述过程称为一次联邦迭代,经过预定次数的联邦迭代,在服务器端得到最终可用于不同工况下滚动轴承故障诊断的联邦全局模型;
(4)模型测试
将多个用户的测试数据集分别输入联邦全局模型,把模型对测试数据的标签预测结果与真实标签作对比,得出各自的分类准确率;
(5)故障诊断
将滚动轴承待诊断数据输入训练好的联邦全局模型,获取诊断结果。
6.一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断系统,其特征在于,包括:
数据集构建模块,用于选取某工况下公开且已知标签的滚动轴承数据构建源域公共数据集,多个用户利用各自本地无标签的滚动轴承数据分别构建目标域数据集;其中,源域公共数据集和多个目标域数据集的滚动轴承工况互不相同;
本地模型构建模块,用于多个用户中的每个用户利用改进的残差网络提取目标域数据集和源域公共数据集中同一样本的不同表示下的多个特征,在多个特征空间内同时进行特征对齐;每个用户的本地模型的目标函数设置为交叉熵分类损失以及不同表示下的条件最大均值差异损失之和;经过一定次数的迭代训练,目标函数收敛,完成每个用户的本地模型的构建;
联邦全局故障诊断模型构建模块,用于多个用户中的每个用户的本地模型构建完成后,将压缩处理后的模型参数上传至中央服务器,中央服务器端聚合模型参数并下发给各个用户,各个用户利用聚合后模型参数更新本地模型,上述过程称为一次联邦迭代,经过预定次数的联邦迭代,在服务器端得到最终可用于不同工况下滚动轴承故障诊断的联邦全局模型;
模型测试模块,用于将多个用户的测试数据集分别输入联邦全局模型,把模型对测试数据的标签预测结果与真实标签作对比,得出各自的分类准确率;
故障诊断模块,用于将滚动轴承待诊断数据输入训练好的联邦全局模型,获取诊断结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211214916.8A CN115560983A (zh) | 2022-09-30 | 2022-09-30 | 一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211214916.8A CN115560983A (zh) | 2022-09-30 | 2022-09-30 | 一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115560983A true CN115560983A (zh) | 2023-01-03 |
Family
ID=84745833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211214916.8A Pending CN115560983A (zh) | 2022-09-30 | 2022-09-30 | 一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115560983A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115952442A (zh) * | 2023-03-09 | 2023-04-11 | 山东大学 | 基于全局鲁棒加权的联邦域泛化故障诊断方法及系统 |
CN116028509A (zh) * | 2023-03-27 | 2023-04-28 | 合肥工业大学 | 一种基于因果机制的最优工况索引生成方法 |
CN116226784A (zh) * | 2023-02-03 | 2023-06-06 | 中国人民解放军92578部队 | 基于统计特征融合的联邦域适应故障诊断方法 |
CN116992336A (zh) * | 2023-09-04 | 2023-11-03 | 南京理工大学 | 一种基于联邦局部迁移学习的轴承故障诊断方法 |
CN117232577A (zh) * | 2023-09-18 | 2023-12-15 | 杭州奥克光电设备有限公司 | 一种光缆交接箱承载内部监测方法、系统和光缆交接箱 |
CN117785964A (zh) * | 2024-02-28 | 2024-03-29 | 宜宾市万事通网络信息服务有限公司 | 应用于网络服务的数据处理方法及系统 |
-
2022
- 2022-09-30 CN CN202211214916.8A patent/CN115560983A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116226784A (zh) * | 2023-02-03 | 2023-06-06 | 中国人民解放军92578部队 | 基于统计特征融合的联邦域适应故障诊断方法 |
CN115952442A (zh) * | 2023-03-09 | 2023-04-11 | 山东大学 | 基于全局鲁棒加权的联邦域泛化故障诊断方法及系统 |
CN116028509A (zh) * | 2023-03-27 | 2023-04-28 | 合肥工业大学 | 一种基于因果机制的最优工况索引生成方法 |
CN116992336A (zh) * | 2023-09-04 | 2023-11-03 | 南京理工大学 | 一种基于联邦局部迁移学习的轴承故障诊断方法 |
CN116992336B (zh) * | 2023-09-04 | 2024-02-13 | 南京理工大学 | 一种基于联邦局部迁移学习的轴承故障诊断方法 |
CN117232577A (zh) * | 2023-09-18 | 2023-12-15 | 杭州奥克光电设备有限公司 | 一种光缆交接箱承载内部监测方法、系统和光缆交接箱 |
CN117232577B (zh) * | 2023-09-18 | 2024-04-05 | 杭州奥克光电设备有限公司 | 一种光缆交接箱承载内部监测方法、系统和光缆交接箱 |
CN117785964A (zh) * | 2024-02-28 | 2024-03-29 | 宜宾市万事通网络信息服务有限公司 | 应用于网络服务的数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115560983A (zh) | 一种基于联邦特征迁移学习的不同工况下滚动轴承故障诊断方法及系统 | |
Li et al. | Intelligent fault diagnosis of rolling bearings under imbalanced data conditions using attention-based deep learning method | |
Jia et al. | Deep normalized convolutional neural network for imbalanced fault classification of machinery and its understanding via visualization | |
Lu et al. | Deep model based domain adaptation for fault diagnosis | |
CN113988126B (zh) | 一种基于少标签数据特征迁移的滚动轴承故障诊断方法 | |
Su et al. | A novel method based on deep transfer unsupervised learning network for bearing fault diagnosis under variable working condition of unequal quantity | |
CN113723491A (zh) | 一种半监督模型对比迁移的滚动轴承及齿轮故障诊断方法 | |
CN107729993A (zh) | 利用训练样本及折中度量的3d卷积神经网络构建方法 | |
CN115563650A (zh) | 基于联邦学习实现医疗数据的隐私保护系统 | |
CN106295501A (zh) | 基于唇部运动的深度学习身份识别方法 | |
Liu et al. | APSNet: Toward adaptive point sampling for efficient 3D action recognition | |
CN115051929A (zh) | 基于自监督目标感知神经网络的网络故障预测方法及装置 | |
Li et al. | Fabric defect segmentation system based on a lightweight GAN for industrial Internet of Things | |
Wen et al. | Bearing fault diagnosis via fusing small samples and training multi-state siamese neural networks | |
Liu et al. | Data privacy protection: A novel federated transfer learning scheme for bearing fault diagnosis | |
Xu et al. | A progressive fault diagnosis method for rolling bearings based on VMD energy entropy and a deep adversarial transfer network | |
Yang et al. | Blind VQA on 360° video via progressively learning from pixels, frames, and video | |
CN115481215A (zh) | 一种基于时态合作者知识图谱的合作者预测方法和预测系统 | |
Li et al. | Knowledge features enhanced intelligent fault detection with progressive adaptive sparse attention learning for high-power diesel engine | |
CN105809200A (zh) | 一种生物启发式自主抽取图像语义信息的方法及装置 | |
Cui et al. | Multi-layer adaptive convolutional neural network unsupervised domain adaptive bearing fault diagnosis method | |
CN115356599B (zh) | 一种多模态城市电网故障诊断方法及系统 | |
Lei et al. | A novel data augmentation method for steering mechanism fault diagnosis based on variational autoencoding generative adversarial networks with self-attention | |
Zeng et al. | Application of local histogram clipping equalization image enhancement in bearing fault diagnosis | |
Li et al. | Research on fault diagnosis algorithm based on convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |