CN112434602A - 一种基于可迁移共特征空间挖掘的故障诊断方法 - Google Patents
一种基于可迁移共特征空间挖掘的故障诊断方法 Download PDFInfo
- Publication number
- CN112434602A CN112434602A CN202011323670.9A CN202011323670A CN112434602A CN 112434602 A CN112434602 A CN 112434602A CN 202011323670 A CN202011323670 A CN 202011323670A CN 112434602 A CN112434602 A CN 112434602A
- Authority
- CN
- China
- Prior art keywords
- feature
- sample
- encoder
- migratable
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 66
- 238000005065 mining Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 98
- 238000012549 training Methods 0.000 claims abstract description 88
- 230000003044 adaptive effect Effects 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims abstract description 12
- 230000036541 health Effects 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 37
- 239000013598 vector Substances 0.000 claims description 35
- 238000011176 pooling Methods 0.000 claims description 29
- 238000005096 rolling process Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000003137 locomotive effect Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 abstract description 2
- 238000002372 labelling Methods 0.000 description 6
- 238000013508 migration Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明属于机器学习技术领域,公开了一种基于可迁移共特征空间挖掘的故障诊断方法,故障诊断方法的过程包括:对故障诊断的振动序列数据进行移动窗口截取,构建故障诊断训练集和测试集;构建可迁移共特征空间挖掘卷积自编码器;结合领域弱监督损失、领域自适应损失和重建损失训练卷积自编码器;在卷积自编码器训练所的特征表示基础上,构建共特征提取与比较卷积网络;应用三种小样本学习场景对特征提取与比较网络进行训练,获得可迁移共特征故障诊断模型,利用所述故障诊断模型进行故障诊断。
Description
技术领域
本发明属于机器学习技术领域,具体涉及一种基于可迁移共特征空间挖掘的故障诊断方法。
背景技术
随着工业自动化和人工智能领域的迅速发展,越来越多的工业机器人等自动化装置投入到工业生产生活之中。如何对这些工业自动化装备的运行状态进行检测,提早或者及时发现可能的故障,能够有效地避免人员和经济损失。然而,工业机器人和自动化设备类型多样,不同类型的工业机器人和自动化设备具有不同的本体机械结构、驱动系统、传动系统、电气控制系统等,不同系统的故障需要用不同的特征来刻画,同类系统的同类故障特征在不同机器人上也存在表型差异。此外,即使是完全相同类型的工业机器人和自动化设备,也因运行工况、制造误差等使得机器人之间存在差异。工业机器人和自动化设备的组成系统的服役工况、数据衍生机制、数据蕴含特征等差异,导致获取的监测数据集具有高维异构、分布不一等特点,使得跨设备可迁移性检测难以进行,进而影响诊断知识的可迁移性能。因此,亟需建立工业机器人和自动化设备故障共特征智能自适应表征,实现共特征自学习和跨设备故障诊断方法。
工业机器人和自动化设备服役期内长期处于健康运行状态,可采集大量健康状态数据,而各类故障的出现则是偶然的随机的,而且故障类型多样。因此机器人健康状态数据远多于故障数据,导致健康数据重复性高、典型故障数据匮乏,存在严重的数据不平衡问题。此外,工业机器人和自动化设备在长期服役中积累了海量数据,但其中仅有少量数据对应的机器人运行状态已知,导致监测数据的类别标记信息严重缺乏,传统的智能诊断方法难以有效挖掘海量数据中蕴含的有效碎片知识,这在极大程度上限制了智能诊断技术及其相关成果在工业机器人和自动化设备领域的实际应用与落地推广。考虑到工业机器人和自动化设备故障类型繁多,各组成系统之间的故障相互关联,相应诊断任务具有复杂度高、关联性强的特点,如何基于非平衡数据集和工业机器人和自动化设备工作状态共特征空间模型,建立有效的迁移智能故障诊断方法,具有重大意义,同时也极具挑战性。
目前研究已提出了多种迁移学习方法,但仍存在以下待解决的问题:首先,已有研究均局限于同一设备于不同运行工况或测试环境之间的迁移诊断任务,不同设备间的深度迁移诊断存在准确率低的问题;其次,现有迁移诊断方法的有效性基于充分数据假设,即所诊断设备在单一工况或测试环境下可以获取的可用监测数据充足,这与实际生产环境下的装备监测数据特点不符,工业实际中存在故障信息不足、标记信息匮乏等问题,难以适应和满足现有故障智能诊断方法的工程应用需求。
发明内容
为解决现有故障智能诊断方法中存在的问题,本发明的目的在于提供一种基于可迁移共特征空间挖掘的故障诊断方法,本发明中提出了可迁移共特征挖掘卷积自编码器,能够充分利用装备监测过程中获得的大量健康状态数据,以及数据来源的领域信息,有效挖掘不同设备不同故障条件下存在的共特征,并作为共特征提取分枝构建共特征提取与比较网络。本发明中提出的共特征提取与比较网络,结合了前述的共特征提取分枝和独特征提取分枝两部分,可以有效提取数据中存在的共同特征以及显著差异特征,两者组合可以更有效地实现特征分类。
为了实现上述目的,本发明采用如下技术方案:
一种基于可迁移共特征空间挖掘的故障诊断方法,包括以下步骤:
S1:对故障诊断的振动序列数据进行移动窗口截取,构建故障诊断训练集和测试集;
S2:构建基于振动时间序列输入的两层卷积网络两层池化网络组成的编码器,并构建具有跟编码器对称结构的解码器,卷积自编码器和解码器通过全连接层连接;
S3:在所述编码器中引入数据领域类别弱监督信息和领域自适应损失,构建具有可迁移共特征挖掘特性卷积自编码器;
S4:应用S1中获得的训练集和对应的领域类别信息作为弱监督,结合最大均值差异领域自适应损失函数和样本重建损失函数,对S3中构建的可迁移共特征挖掘卷积自编码器进行训练,获得共特征提取网络模型;
S5:构建具有共特征提取模块、独特征提取模块、特征连接模块和特征比较和相似度模块的共特征提取与比较网络;
将S4中所构建的可迁移共特征挖掘卷积自编码器的编码部分作为共特征提取网络,并采用S4的训练结果进行初始化;采用与可迁移共特征挖掘卷积自编码器中的编码器同样结构的网络作为独特征提取网络,并采用随机方法初始化;特征合成采用特征向量直接连接的方式;采用两层卷积层、两层池化层、两层全连接层和一层Softmax层组成特征比较和相似度计算模块;
S6:采用S5中的共特征提取网络和独特征提取网络构成一支特征提取网络分枝,采用共享权值的方式构成两支共特征/独特征提取网络,对两路输入样本进行特征提取,输入到后续的特征连接与比较模块;
S7:采用小样本学习训练方式训练比较网络与S6构成的共特征/独特征提取网络,获得故障诊断模型,利用所述故障诊断模型进行故障诊断。
优选的,S1中,使用CWRU和I/UCR中心的故障诊断数据集中的旋转机械故障数据集作为源域数据;
使用实际火车滚动轴承振动数据作为目标域数据;
对源域数据和目标域数据的振动序列均采用滚动窗口分割的方式采集预设长度的样本,采用不交叉覆盖的方式进行样本截取;
在构建可迁移共特征挖掘卷积自编码器的训练集时,对每个样本标注数据集来源,标注数据集来源时标注来自源域还是目标域,不标注健康状态;在构建共特征提取与比较网络的训练集时,对源域的每个样本标注健康状态,对目标域的样本不标注健康状态。
优选的,所述源域数据为一维振动信号,包含四类健康状态,四类健康状态分别为:健康工况、滚动轴承内环故障、滚动轴承滚珠故障和滚动轴承外环故障;
目标域数据采集于铁路机车轴承转动,由长时间一维振动序列数据点构成,包含与源域数据相同的四种健康状态;
所述样本的长度统一为1×1024。
优选的,训练集和测试集的样本结构保持均衡,即各类健康状态的样本数量保持一致。
优选的,S2中,编码器和解码器均由两个卷积层和两个池化层构成,每个卷积层采用20个特征卷积核,卷积核尺寸为1×3;池化操作采用平均池化,池化窗口尺寸为1×2;编码器与解码器之间采用一个全连接层,神经元数为1024;解码器后连接两个全连接层,两个全连接层的神经元数分别为2048和1024。
优选的,神经元激活函数均采用ReLu,池化层均采用平均池化。
优选的,S3中,在编码器和解码器之间的全连接层学习所得的特征表示层进行弱监督损失和领域自适应损失计算;
其中,弱监督信息采用样本的领域标注,标注样本来源于源域还是目标域,损失函数采用交叉熵,具体如下:
其中,nb表示在批训练时每批训练数据中的样本数量,yi表示样本所来自的真实领域标签,pi表示网络的领域分类结果。
优选的,S4中,对可迁移共特征挖掘卷积自编码器进行训练时,其中样本重建损失函数采用均方误差损失函数,具体如下:
其中nb表示在批训练时每批训练数据中的样本数量,xi是原始的输入样本向量,xrc卷积自编码器的重建样本向量;
最大均值差异最大均值差异领域自适应损失部分采用最大均值差异进行计算,具体如下:
其中,nsb和ntb分别表示每批训练数据中来自源域和目标域的样本数量,f(·)表示再生核希尔伯特空间中的非线性函数,k(·,·)是高斯核函数;
结合领域弱监督损失和领域自适应损失,可迁移共特征挖掘卷积自编码器的最终损失函数为:
其中,θ表示卷积自编码器的参数。
优选的,S6中,采用共特征提取网络和独特征提取网络构成一支特征提取网络分枝,并采用共享权值的方式建立两支特征提取网络分枝,对两路输入样本进行特征提取,在两支特征提取网络中分别进行特征连接合成,输入到后续的特征连接与比较模块;
输入到两个特征提取分枝的样本分别为模板样本和待测样本,每类健康状态的数据均有模板样本,模板样本具有标签,模板样本和待测样本两者所获得的特征向量,输入到特征比较模块后,计算相似程度,将待测样本所获得的相似度分数值进行比较,并归类为分数最高的一类。
优选的,S7中,训练采用小样本学习训练模式,分为3种情景进行训练,包括4-way-1-shot、4-way-5-shot和4-way-10-shot,其中4-way表示健康状态共4类,1-shot表示每类健康状态采用1个模板样本,5-shot和10-shot分别表示每类健康状态采用5个模板样本和10个模板样本。
相对于现有技术,本发明具有以下有益效果:
本发明从多领域共特征空间挖掘的角度出发,采用卷积自编码器与弱监督信息和领域自适应相结合的方式,学习可迁移共特征挖掘网络,进而与独特征挖掘网络构成故障特征提取的两个方面,将共特征和独特征综合利用,并通过小样本学习的方式进行最终的共特征提取与比较网络,属于故障诊断领域中的一种创新。可迁移共特征挖掘卷积自编码器的设计和应用,能够充分利用设备运行过程中易于采集的健康数据,而弱监督信息即领域信息则比健康状态标签更加容易获得,可以有效地进行领域迁移的学习。共特征和独特征的联合应用,能够既考虑到不同数据领域中的公共特征,又考虑到不同类别数据的差异性,能够获得更好的分类效果。本发明的训练方法采取了小样本学习的方法,能够有效地解决故障诊断问题中故障数据匮乏的问题。本发明在多领域故障诊断问题中具有优秀的诊断效果,最优诊断准确率达到了99%以上,证实了本发明中技术的有效性。
附图说明
图1是本发明实施例中基于可迁移共特征空间挖掘的故障诊断方法流程示意图;
图2是本发明实施例中可迁移共特征挖掘卷积自编码器网络结构图;
图3是本发明实施例中共特征提取与比较网络结构图。
具体实施方式
下面结合附图和实施例对本发明的具体实施方式作进一步详细描述。以下实施用于解释本发明,但不用来限制本发明的范围。
参照图1-图3,本发明基于可迁移共特征空间挖掘的故障诊断方法,包括以下步骤:
步骤1:对故障诊断的振动序列数据进行移动窗口截取,构建故障诊断训练集和测试集;
步骤2:构建基于振动时间序列输入的两层卷积网络两层池化网络组成的编码器,并构建具有跟编码器对称结构的解码器,编码器和解码器通过全连接层连接;
步骤3:在步骤2构建的编码器中引入数据领域类别弱监督信息和领域自适应损失,构建具有可迁移共特征挖掘特性的卷积自编码器;
步骤4:应用步骤1中获得的训练集和对应的领域类别信息作为弱监督,结合最大均值差异领域自适应损失函数和样本重建损失函数,对步骤3中构建的具有可迁移共特征挖掘特性的卷积自编码器进行训练,获得共特征提取网络模型;
步骤5:构建具有共特征提取、独特征提取、特征连接和特征比较和相似度计算四个模块的共特征提取与比较网络;
步骤6:采用步骤5中的共特征网络和独特征网络构成一支特征提取网络分枝,采用共享权值的方式构成两支共特征/独特征提取网络,对两路输入样本进行特征提取,输入到后续的特征连接与比较模块;
步骤7:采用4-way-1-shot、4-way-5-shot和4-way-10-shot三种小样本学习训练方式训练步骤6最终构成的共特征特征提取与比较网络,获得故障诊断模型。
所述步骤1中,使用CWRU和I/UCR中心的故障诊断数据集中的旋转机械故障数据集作为源域数据,这些数据均为一维振动信号,包含4类健康状态:即健康工况、滚动轴承内环故障、滚动轴承滚珠故障和滚动轴承外环故障。
区别于传统机械故障诊断方法中目标域也使用实验室条件下收集的数据来构成,本发明使用实际火车滚动轴承振动数据作为目标域数据,有更高的实际应用价值。该数据采集于铁路机车轴承转动,由长时间一维振动序列数据点构成,也包含与源域相同的四种健康状态。
对源域数据和目标域数据的振动序列均采用滚动窗口分割的方式采集样本,样本长度统一为1×1024,采用不交叉覆盖的方式进行样本截取。
在构建可迁移共特征挖掘卷积自编码器的训练集时,对每个样本标注其数据集来源,即标注其来自源域还是目标域,不标注其健康状态;在构建共特征提取与比较网络的训练集时,对源域的每个样本标注其健康状态,对目标域的样本,不标注其健康状态。
所述步骤2中,编码器和解码器结构对称,分别由两个卷积层和两个池化层构成,每个卷积层采用20个特征卷积核,卷积核尺寸为1×3;池化操作采用平均池化,池化窗口尺寸为1×2;编码器与解码器之间采用一个全连接层,神经元数为1024;解码器后连接两个全连接层,神经元数分别为2048和1024。
所述步骤3中,在编码器和解码器之间的全连接层学习所得的特征表示层进行弱监督损失和领域自适应损失计算。
其中,弱监督信息采用样本的领域标注,即样本来源于源域还是目标域,损失函数采用交叉熵:
其中,nb表示在批训练时每批训练数据中的样本数量,yi表示样本所来自的真实领域标签,pi表示网络的领域分类结果。
领域自适应损失函数部分采用最大均值差异进行计算:
其中,nsb和ntb分别表示每批训练数据中来自源域和目标域的样本数量,f(·)表示再生核希尔伯特空间中的非线性函数,k(·,·)是高斯核函数。
所述步骤4中,采用三种损失函数联合对卷积自编码器进行训练,包括上述的领域弱监督损失、领域自适应损失和样本重建损失,其中样本重建损失函数采用均方误差损失函数:
其中xi是原始的输入样本向量,xrc卷积自编码器的重建样本向量。
结合领域弱监督损失和领域自适应损失,卷积自编码器的最终损失函数为:
其中,θ表示卷积自编码器的参数。
所述步骤5中,采用四个模块来构造用于故障诊断分类的共特征提取与比较网络,四个模块包括共特征提取模块、独特征提取模块、特征连接模块、特征比较和相似度计算模块。
将上述所构建的可迁移共特征挖掘卷积自编码器的编码部分作为共特征提取网络,并直接采用步骤4的训练结果对共特征提取网络进行初始化。采用与卷积自编码器中的编码器同样结构的网络作为独特征提取网络,并采用随机方法初始化,以待后续训练。特征合成采用特征向量直接连接的方式,将共特征提取网络获取的特征向量和独特征网络所获取的特征向量通过堆叠方式进行连接,得到故障样本的特征表示向量。采用两层卷积层,两层池化层,两层全连接层,一层Softmax层组成特征比较和相似度计算模块,将样本归类于最相似的样本模板类别。
所述步骤6中,采用共特征网络和独特征网络构成一支特征提取网络分枝,并采用共享权值的方式建立两支特征提取网络分枝,对两路输入样本进行特征提取,在两支特征提取网络中分别进行特征连接合成,输入到后续的特征连接与比较模块。
输入到两个特征提取分枝的样本分别为模板样本和待测样本,每类健康状态的数据均有其模板样本,模板样本具有标签。模板样本和待测样本两者所获得的特征向量,输入到特征比较模块后,计算其相似程度,将待测样本所获得的相似度分数值进行比较,并将其归类为分数最高的一类。
所述步骤7中,对共特征提取与比较网络进行训练,训练采用小样本学习训练模式,分为3种情景进行训练,包括4-way-1-shot、4-way-5-shot和4-way-10-shot,其中4-way表示健康状态共4类,1-shot表示每类健康状态采用1个模板样本,5-shot和10-shot分别表示每类健康状态采用5个模板样本和10个模板样本。共特征提取与比较网络的训练结果模型,可直接应用于不同领域的故障数据分类。在应用过程中,可根据待测数据集能够提供的带标签样本进行微调后使用。若待测数据中无可用带标签数据,则可直接应用。
实施例
本实施例的故障诊断方法的过程包括:对故障诊断的振动序列数据进行移动窗口截取,构建故障诊断训练集和测试集;构建可迁移共特征空间挖掘卷积自编码器;结合领域弱监督损失、领域自适应损失和重建损失训练卷积自编码器;在自编码器训练所的特征表示基础上,构建共特征提取与比较卷积网络;应用三种小样本学习场景对特征提取与比较网络进行训练,获得可迁移共特征故障诊断模型,利用所述故障诊断模型进行故障诊断。
如图1所示,本实施例具体包括以下步骤:
步骤1:对故障诊断的振动时间序列数据进行移动窗口截取,构建故障诊断训练集和测试集。本实施例中包含一个卷积自编码器的训练和一个卷积神经网络的训练,因此需要两部分不同构成的数据集。其中,可迁移共特征挖掘卷积自编码器的训练集包含了多领域的数据以及领域标注,即来自源域的数据标注为1,来自目标域的数据标注为0,无需健康状态的标注。共特征提取与比较卷积神经网络的训练集包含两部分,来自源域的训练集部分具有健康状态标注,来自目标域的训练集部分只有领域标注,无健康状态标注。
本实施例中所采用的数据集有四类健康状态,原始数据均是时间序列的形式,本实施例使用无覆盖滑窗的形式分割振动时间序列,将数据集中的每一序列分割成1024长度的样本。设备健康状态共涉及4类,包括健康运行态加标签0、滚动轴承内环故障加标签1、滚动轴承滚珠故障加标签2和滚动轴承外环故障加标签3,为模拟实际机械故障诊断中数据价值少的问题,本实施例中目标域数据没有标签。测试集由目标域数据的全部样本构成。训练集和测试集的样本结构保持均衡,即各类健康状态的样本数量保持一致。
步骤2:构建基于振动时间序列输入的两层卷积网络两层池化网络组成的编码器,并构建具有跟编码器对称结构的解码器,两者通过全连接层连接,其具体的网络结构如图2所示。编码器和解码器中每个卷积层均采用20个特征卷积核,卷积核尺寸为1×3;池化操作采用平均池化,池化窗口尺寸为1×2;编码器与解码器之间采用一个全连接层,神经元数为1024;解码器后连接两个全连接层,神经元数分别为2048和1024。
步骤3:在步骤2构建的编码器中引入数据领域类别弱监督信息和领域自适应损失,构建具有可迁移共特征挖掘特性的卷积自编码器;
弱监督信息采用样本的领域标注,即样本来源于源域还是目标域,不需要样本的健康状态标注。基于弱监督信息的损失函数采用交叉熵损失:
其中,nb表示在批训练时每批训练数据中的样本数量,yi表示样本所来自的真实领域标签,pi表示网络的领域分类结果。
领域自适应损失函数部分采用最大均值差异进行计算:
其中,nsb和ntb分别表示每批训练数据中来自源域和目标域的样本数量,f(·)表示再生核希尔伯特空间中的非线性函数,k(·,·)是高斯核函数。
步骤4:应用步骤1中获得的训练集和对应的领域类别信息作为弱监督,结合最大均值差异领域自适应损失函数、样本重建损失函数,对步骤3中构建的可迁移共特征挖掘卷积自编码器进行训练,获得共特征提取网络模型。
该可迁移共特征挖掘卷积自编码器采用三种损失函数联合对卷积自编码器进行训练,包括步骤3的领域弱监督损失、领域自适应损失和样本重建损失,其中样本重建损失函数采用均方误差损失函数:
其中xi是原始的输入样本向量,xrc卷积自编码器的重建样本向量。
结合领域弱监督损失和领域自适应损失,卷积自编码器的最终损失函数为:
其中,θ表示卷积自编码器的参数。采用Adam优化算法对网络进行训练。
步骤5:构建具有共特征提取、独特征提取、特征连接、特征比较和相似度计算四个模块的共特征提取与比较网络,网络结构如图3所示。
将步骤4中所构建的可迁移共特征挖掘卷积自编码器的编码部分作为共特征提取网络,并直接采用步骤4的训练结果对共特征提取网络进行初始化。采用与卷积自编码器中的编码器同样结构的网络作为独特征提取网络,并采用随机方法初始化,以待后续训练。特征合成采用特征向量直接连接的方式,将共特征提取网络获取的特征向量和独特征网络所获取的特征向量通过堆叠方式进行连接,得到故障样本的特征表示向量。采用两层卷积层,两层池化层,两层全连接层,一层Softmax层组成特征比较和相似度计算模块,将样本归类于最相似的样本模板类别。其中,神经元激活函数均采用ReLu,池化层均采用平均池化。
步骤6:采用步骤5中的共特征网络和独特征网络构成一支特征提取网络分枝,采用共享权值的方式构成两支共特征/独特征提取网络(如图3所示),对两路输入样本进行特征提取,输入到后续的特征连接与比较模块。
采用共特征网络和独特征网络构成一支特征提取网络分枝,并采用共享权值的方式建立两支特征提取网络分枝,对两路输入样本进行特征提取,在两支特征提取网络中分别进行特征连接合成,输入到后续的特征连接与比较模块。
输入到两个特征提取分枝的样本分别为模板样本和待测样本,每类健康状态的数据均有其模板样本,模板样本具有标签。模板样本和待测样本两者所获得的特征向量,输入到特征比较模块后,计算其相似程度,将待测样本所获得的相似度分数值进行比较,并将其归类为分数最高的一类。
步骤7:采用三种情景的小样本学习训练方式训练步骤6最终构成的共特征特征提取与比较网络,获得故障诊断模型。
对共特征提取与比较网络进行训练,训练采用小样本学习训练模式,分为3种情景进行训练,包括4-way-1-shot、4-way-5-shot和4-way-10-shot,其中4-way表示健康状态共4类,1-shot表示每类健康状态采用1个模板样本,5-shot和10-shot分别表示每类健康状态采用5个模板样本和10个模板样本。具体而言,在三种情景的训练中,分别从训练集中随机获取1、5或10个标注样本作为输入,其所获取的特征向量(1-shot)或者多个特征向量的均值(5-shot和10-shot)作为特征向量模板。在本实施例中有4类故障,因此会计算获得4个特征向量模板。输入样本向量在共享权重分支中获得的特征向量分别与特征向量模板相连接,组成的向量作为输入向量,输入至特征比较模块,计算出输入样本与模板样本之间的相似度值。与输入样本相似度值最大的特征向量模板所属的类别,即为输入样本所属的类别。采用Adam算法进行优化训练,直至收敛,获得共特征提取与比较网络模型。
共特征提取与比较网络的训练结果模型,可直接应用于不同领域的故障数据分类。在应用过程中,可根据待测数据集能够提供的带标签样本进行微调后使用。若待测数据中无可用带标签数据,则可直接应用。
本发明首次提出建立可迁移共特征挖掘卷积神经网络,应用领域标注弱监督信息对卷积自编码器进行训练,从而使得该网络获得的特征具有可迁移性和多领域公共特征挖掘的能力。本发明还首次提出了共特征提取与比较卷积网络,应用共特征、独特征两方面的特征,更加全面地表达数据中所蕴含的信息,并采用特征比较的方式实现分类。其中,基于可迁移共特征挖掘卷积神经网络的训练结果作为共特征提取分枝,并利用相同网络结构的新建分枝在分类训练中获取独特征。共特征和独特征相互连接构成联合特征向量,通过特征比较网络模块实现健康状态分类。与现有的技术相比,本发明具有特征描述能力强、训练速度快、故障数据需求量少、准确率高的特点,可以用于实际的故障诊断工作中。
Claims (10)
1.一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,包括以下步骤:
S1:对故障诊断的振动序列数据进行移动窗口截取,构建故障诊断训练集和测试集;
S2:构建基于振动时间序列输入的两层卷积网络两层池化网络组成的编码器,并构建具有跟编码器对称结构的解码器,卷积自编码器和解码器通过全连接层连接;
S3:在所述编码器中引入数据领域类别弱监督信息和领域自适应损失,构建具有可迁移共特征挖掘特性卷积自编码器;
S4:应用S1中获得的训练集和对应的领域类别信息作为弱监督,结合最大均值差异领域自适应损失函数和样本重建损失函数,对S3中构建的可迁移共特征挖掘卷积自编码器进行训练,获得共特征提取网络模型;
S5:构建具有共特征提取模块、独特征提取模块、特征连接模块和特征比较和相似度模块的共特征提取与比较网络;
将S4中所构建的可迁移共特征挖掘卷积自编码器的编码部分作为共特征提取网络,并采用S4的训练结果进行初始化;采用与可迁移共特征挖掘卷积自编码器中的编码器同样结构的网络作为独特征提取网络,并采用随机方法初始化;特征合成采用特征向量直接连接的方式;采用两层卷积层、两层池化层、两层全连接层和一层Softmax层组成特征比较和相似度计算模块;
S6:采用S5中的共特征提取网络和独特征提取网络构成一支特征提取网络分枝,采用共享权值的方式构成两支共特征/独特征提取网络,对两路输入样本进行特征提取,输入到后续的特征连接与比较模块;
S7:采用小样本学习训练方式训练比较网络与S6构成的共特征/独特征提取网络,获得故障诊断模型,利用所述故障诊断模型进行故障诊断。
2.根据权利要求1所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,S1中,使用CWRU和I/UCR中心的故障诊断数据集中的旋转机械故障数据集作为源域数据;
使用实际火车滚动轴承振动数据作为目标域数据;
对源域数据和目标域数据的振动序列均采用滚动窗口分割的方式采集预设长度的样本,采用不交叉覆盖的方式进行样本截取;
在构建可迁移共特征挖掘卷积自编码器的训练集时,对每个样本标注数据集来源,标注数据集来源时标注来自源域还是目标域,不标注健康状态;在构建共特征提取与比较网络的训练集时,对源域的每个样本标注健康状态,对目标域的样本不标注健康状态。
3.根据权利要求2所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,所述源域数据为一维振动信号,包含四类健康状态,四类健康状态分别为:健康工况、滚动轴承内环故障、滚动轴承滚珠故障和滚动轴承外环故障;
目标域数据采集于铁路机车轴承转动,由长时间一维振动序列数据点构成,包含与源域数据相同的四种健康状态;
所述样本的长度统一为1×1024。
4.根据权利要求1所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,训练集和测试集的样本结构保持均衡,即各类健康状态的样本数量保持一致。
5.根据权利要求1所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,S2中,编码器和解码器均由两个卷积层和两个池化层构成,每个卷积层采用20个特征卷积核,卷积核尺寸为1×3;池化操作采用平均池化,池化窗口尺寸为1×2;编码器与解码器之间采用一个全连接层,神经元数为1024;解码器后连接两个全连接层,两个全连接层的神经元数分别为2048和1024。
6.根据权利要求5所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,神经元激活函数均采用ReLu,池化层均采用平均池化。
8.根据权利要求7所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,S4中,对可迁移共特征挖掘卷积自编码器进行训练时,其中样本重建损失函数采用均方误差损失函数,具体如下:
其中nb表示在批训练时每批训练数据中的样本数量,xi是原始的输入样本向量,xrc卷积自编码器的重建样本向量;
最大均值差异最大均值差异领域自适应损失部分采用最大均值差异进行计算,具体如下:
其中,nsb和ntb分别表示每批训练数据中来自源域和目标域的样本数量,f(·)表示再生核希尔伯特空间中的非线性函数,k(·,·)是高斯核函数;
结合领域弱监督损失和领域自适应损失,可迁移共特征挖掘卷积自编码器的最终损失函数为:
其中,θ表示卷积自编码器的参数。
9.根据权利要求1所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,S6中,采用共特征提取网络和独特征提取网络构成一支特征提取网络分枝,并采用共享权值的方式建立两支特征提取网络分枝,对两路输入样本进行特征提取,在两支特征提取网络中分别进行特征连接合成,输入到后续的特征连接与比较模块;
输入到两个特征提取分枝的样本分别为模板样本和待测样本,每类健康状态的数据均有模板样本,模板样本具有标签,模板样本和待测样本两者所获得的特征向量,输入到特征比较模块后,计算相似程度,将待测样本所获得的相似度分数值进行比较,并归类为分数最高的一类。
10.根据权利要求1所述的一种基于可迁移共特征空间挖掘的故障诊断方法,其特征在于,S7中,训练时分为3种情景进行训练,包括4-way-1-shot、4-way-5-shot和4-way-10-shot,其中4-way表示健康状态共4类,1-shot表示每类健康状态采用1个模板样本,5-shot和10-shot分别表示每类健康状态采用5个模板样本和10个模板样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011323670.9A CN112434602B (zh) | 2020-11-23 | 2020-11-23 | 一种基于可迁移共特征空间挖掘的故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011323670.9A CN112434602B (zh) | 2020-11-23 | 2020-11-23 | 一种基于可迁移共特征空间挖掘的故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112434602A true CN112434602A (zh) | 2021-03-02 |
CN112434602B CN112434602B (zh) | 2023-08-29 |
Family
ID=74693918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011323670.9A Active CN112434602B (zh) | 2020-11-23 | 2020-11-23 | 一种基于可迁移共特征空间挖掘的故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112434602B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113158878A (zh) * | 2021-04-19 | 2021-07-23 | 合肥工业大学 | 一种基于子空间的异构迁移故障诊断方法、系统和模型 |
CN113496061A (zh) * | 2021-03-03 | 2021-10-12 | 安徽大学 | 一种基于迁移学习和流形距离的som网络聚类机电设备轴承故障分析方法 |
CN114120010A (zh) * | 2021-11-22 | 2022-03-01 | 西安交通大学 | 一种多视角多层次工业机器人迁移故障诊断方法 |
CN114136619A (zh) * | 2021-10-27 | 2022-03-04 | 国家能源集团宿迁发电有限公司 | 一种基于卷积自编码的变工况下滚动轴承故障诊断方法 |
CN114548215A (zh) * | 2021-12-31 | 2022-05-27 | 南京熊猫汉达科技有限公司 | 基于空间挖掘卷积自编码的动中通卫通设备故障诊断方法 |
CN115771165A (zh) * | 2022-12-06 | 2023-03-10 | 华中科技大学 | 无故障样本下的工业机器人故障检测与定位方法、系统 |
WO2023071217A1 (zh) * | 2021-10-27 | 2023-05-04 | 中国华能集团清洁能源技术研究院有限公司 | 基于深度迁移学习的多工况流程工业故障检测诊断方法 |
CN117961976A (zh) * | 2024-03-29 | 2024-05-03 | 湖南大学 | 基于生成扩散迁移的装配机器人在线检测方法及装置 |
CN118052154A (zh) * | 2024-04-16 | 2024-05-17 | 中汽研新能源汽车检验中心(天津)有限公司 | 一种少样本数据增强与迁移的电驱动系统故障预测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107958286A (zh) * | 2017-11-23 | 2018-04-24 | 清华大学 | 一种领域适应性网络的深度迁移学习方法 |
CN109492099A (zh) * | 2018-10-28 | 2019-03-19 | 北京工业大学 | 一种基于领域对抗自适应的跨领域文本情感分类方法 |
CN109583342A (zh) * | 2018-11-21 | 2019-04-05 | 重庆邮电大学 | 基于迁移学习的人脸活体检测方法 |
WO2019090023A1 (en) * | 2017-11-03 | 2019-05-09 | General Electric Company | System and method for interactive representation learning transfer through deep learning of feature ontologies |
CN110751207A (zh) * | 2019-10-18 | 2020-02-04 | 四川大学 | 基于深度卷积域对抗迁移学习的故障诊断方法 |
CN110849627A (zh) * | 2019-11-27 | 2020-02-28 | 哈尔滨理工大学 | 一种宽度迁移学习网络及基于宽度迁移学习网络的滚动轴承故障诊断方法 |
CN111476307A (zh) * | 2020-04-13 | 2020-07-31 | 河北工业大学 | 一种基于深度领域适应的锂电池表面缺陷检测方法 |
CN111504644A (zh) * | 2020-04-01 | 2020-08-07 | 西安交通大学 | 基于嵌入区分性的条件对抗域自适应的轴承故障诊断方法 |
CN111709448A (zh) * | 2020-05-20 | 2020-09-25 | 西安交通大学 | 一种基于迁移关系网络的机械故障诊断方法 |
-
2020
- 2020-11-23 CN CN202011323670.9A patent/CN112434602B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019090023A1 (en) * | 2017-11-03 | 2019-05-09 | General Electric Company | System and method for interactive representation learning transfer through deep learning of feature ontologies |
CN107958286A (zh) * | 2017-11-23 | 2018-04-24 | 清华大学 | 一种领域适应性网络的深度迁移学习方法 |
CN109492099A (zh) * | 2018-10-28 | 2019-03-19 | 北京工业大学 | 一种基于领域对抗自适应的跨领域文本情感分类方法 |
CN109583342A (zh) * | 2018-11-21 | 2019-04-05 | 重庆邮电大学 | 基于迁移学习的人脸活体检测方法 |
CN110751207A (zh) * | 2019-10-18 | 2020-02-04 | 四川大学 | 基于深度卷积域对抗迁移学习的故障诊断方法 |
CN110849627A (zh) * | 2019-11-27 | 2020-02-28 | 哈尔滨理工大学 | 一种宽度迁移学习网络及基于宽度迁移学习网络的滚动轴承故障诊断方法 |
CN111504644A (zh) * | 2020-04-01 | 2020-08-07 | 西安交通大学 | 基于嵌入区分性的条件对抗域自适应的轴承故障诊断方法 |
CN111476307A (zh) * | 2020-04-13 | 2020-07-31 | 河北工业大学 | 一种基于深度领域适应的锂电池表面缺陷检测方法 |
CN111709448A (zh) * | 2020-05-20 | 2020-09-25 | 西安交通大学 | 一种基于迁移关系网络的机械故障诊断方法 |
Non-Patent Citations (4)
Title |
---|
XIANG LI ET AL.: "Intelligent cross-machine fault diagnosis approach with deep auto-encoder and domain adaptation", 《NEUROCOMPUTING》 * |
王雪松 等: "基于极限学习机的无监督领域适应分类器", 《控制与决策》 * |
贺敏: "迁移学习在湿式球磨机负荷参数软测量中的研究与应用", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
雷亚国 等: "大数据下机械装备故障的深度迁移诊断方法", 《机械工程学报》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496061A (zh) * | 2021-03-03 | 2021-10-12 | 安徽大学 | 一种基于迁移学习和流形距离的som网络聚类机电设备轴承故障分析方法 |
CN113158878A (zh) * | 2021-04-19 | 2021-07-23 | 合肥工业大学 | 一种基于子空间的异构迁移故障诊断方法、系统和模型 |
CN113158878B (zh) * | 2021-04-19 | 2022-10-28 | 合肥工业大学 | 一种基于子空间的异构迁移故障诊断方法、系统和模型 |
CN114136619A (zh) * | 2021-10-27 | 2022-03-04 | 国家能源集团宿迁发电有限公司 | 一种基于卷积自编码的变工况下滚动轴承故障诊断方法 |
WO2023071217A1 (zh) * | 2021-10-27 | 2023-05-04 | 中国华能集团清洁能源技术研究院有限公司 | 基于深度迁移学习的多工况流程工业故障检测诊断方法 |
CN114120010A (zh) * | 2021-11-22 | 2022-03-01 | 西安交通大学 | 一种多视角多层次工业机器人迁移故障诊断方法 |
CN114120010B (zh) * | 2021-11-22 | 2023-11-03 | 西安交通大学 | 一种多视角多层次工业机器人迁移故障诊断方法 |
CN114548215A (zh) * | 2021-12-31 | 2022-05-27 | 南京熊猫汉达科技有限公司 | 基于空间挖掘卷积自编码的动中通卫通设备故障诊断方法 |
CN115771165A (zh) * | 2022-12-06 | 2023-03-10 | 华中科技大学 | 无故障样本下的工业机器人故障检测与定位方法、系统 |
CN115771165B (zh) * | 2022-12-06 | 2024-06-04 | 华中科技大学 | 无故障样本下的工业机器人故障检测与定位方法、系统 |
CN117961976A (zh) * | 2024-03-29 | 2024-05-03 | 湖南大学 | 基于生成扩散迁移的装配机器人在线检测方法及装置 |
CN118052154A (zh) * | 2024-04-16 | 2024-05-17 | 中汽研新能源汽车检验中心(天津)有限公司 | 一种少样本数据增强与迁移的电驱动系统故障预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112434602B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112434602B (zh) | 一种基于可迁移共特征空间挖掘的故障诊断方法 | |
CN110361176B (zh) | 一种基于多任务特征共享神经网络的智能故障诊断方法 | |
CN111709448B (zh) | 一种基于迁移关系网络的机械故障诊断方法 | |
CN111898634B (zh) | 一种基于深度对抗域自适应的智能故障诊断方法 | |
CN111596604B (zh) | 一种基于数字孪生的工程装备故障智能诊断与自愈控制系统及方法 | |
CN110162018B (zh) | 基于知识蒸馏与隐含层共享的增量式设备故障诊断方法 | |
CN112765768B (zh) | 基于物联网的离散型车间数字溯源方法 | |
CN114429153B (zh) | 基于终身学习的齿轮箱增量故障诊断方法及系统 | |
CN111459144A (zh) | 一种基于深度循环神经网络的飞机飞控系统故障预测方法 | |
Di et al. | Ensemble deep transfer learning driven by multisensor signals for the fault diagnosis of bevel-gear cross-operation conditions | |
CN112257862B (zh) | 一种基于关系网络标记样本扩充的半监督辨识方法 | |
CN109034276A (zh) | 基于bp神经网络的阀体故障诊断方法 | |
CN116415506A (zh) | 一种基于联邦学习的工业机器人故障诊断方法及系统 | |
CN113033772A (zh) | 一种基于联邦学习的多设备状态监测方法 | |
Jamshidi et al. | Socialization of industrial robots: An innovative solution to improve productivity | |
CN115358259A (zh) | 一种基于自学习的无监督跨工况轴承故障诊断方法 | |
CN115859077A (zh) | 一种变工况下多特征融合的电机小样本故障诊断方法 | |
CN115563853A (zh) | 一种基于数字孪生的滚动轴承故障诊断方法 | |
Wang et al. | A graph neural network-based data cleaning method to prevent intelligent fault diagnosis from data contamination | |
Huang et al. | Intelligent fault identification for industrial internet of things via prototype-guided partial domain adaptation with momentum weight | |
Wang et al. | Dynamic load identification method of rock roadheader using multi neural network and evidence theory | |
CN107016440B (zh) | 机械传动故障的多分辨率深度神经网络智能诊断方法 | |
CN116738367A (zh) | 基于多尺度图Transformer的滚动轴承故障诊断方法 | |
CN114548215A (zh) | 基于空间挖掘卷积自编码的动中通卫通设备故障诊断方法 | |
CN116244640A (zh) | 一种基于联邦学习的非平衡轴承故障诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |