CN112884093A - 基于dscrn模型的旋转机械故障诊断方法、设备和存储介质 - Google Patents

基于dscrn模型的旋转机械故障诊断方法、设备和存储介质 Download PDF

Info

Publication number
CN112884093A
CN112884093A CN202110470770.2A CN202110470770A CN112884093A CN 112884093 A CN112884093 A CN 112884093A CN 202110470770 A CN202110470770 A CN 202110470770A CN 112884093 A CN112884093 A CN 112884093A
Authority
CN
China
Prior art keywords
model
dscrn
test set
subclass
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110470770.2A
Other languages
English (en)
Other versions
CN112884093B (zh
Inventor
王凯
王崇荣
王恒
何孟凡
於辉
李彦
赵武
邹成宇
王朋朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202110470770.2A priority Critical patent/CN112884093B/zh
Publication of CN112884093A publication Critical patent/CN112884093A/zh
Application granted granted Critical
Publication of CN112884093B publication Critical patent/CN112884093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Image Analysis (AREA)

Abstract

本申请提出了一种基于DSCRN模型的旋转机械故障诊断方法、设备和存储介质,涉及旋转机械故障诊断技术领域,其中,该方法包括:获取待测试振动信号,并根据所述待测试信号生成测试集;对所述测试集进行预处理,以得到所述测试集中的每一个高维测试样本的低维片段;使用预设的深度子类重构网络DSCRN模型提取所述低维片段的深层特征;根据同属于一个测试样本的片段的所述深层特征生成所述测试样本的特征向量;将所述测试样本的特征向量输入Softmax分类器,并输出相应的故障类别。采用上述方案的本发明可以自适应地学习显著的、鲁棒的故障特征表示,从而更好的表征故障模式。

Description

基于DSCRN模型的旋转机械故障诊断方法、设备和存储介质
技术领域
本申请涉及旋转机械故障诊断技术领域,尤其涉及一种基于DSCRN模型的旋转机械故障诊断方法、设备和存储介质。
背景技术
旋转机械以轴承为例,根据轴承故障模式不同可以把振动信号分为不同的类;根据载荷和转速的不同,同一种故障模式可以分成很多子类。分析CWRU 轴承数据集上的振动信号:(1)同一类别的振动信号间差异很大;(2)不同类别的样本很相似;(3)在同一种故障模式和同一种运转条件下采集得到振动信号,其外观差异显著,表现出巨大的子类内差异。较大的类内和较小的类间变化的振动信号提供了摸棱两可的信息,很容易扭曲深度学习网络参数的更新学习过程。
研究表明,基于机器学习的故障诊断方法主要研究如何从振动信号种高效地提取故障特征,从而提高故障诊断精度。传统的机器学习方法由于其浅层网络学习能力有限往往很难学习到非线性的故障特征表示,如支持向量机(SVM),主成分分析(PCA)等。相比较于浅层网络有限的特征学习能力,深度学习算法通过迭代多层非线性映射能够学习更高水平、更抽象的特征表示。近年来研究表明,深度自编码器(Deep AutoEncoder)在故障诊断领域能够挖掘丰富的故障特征信息而取得良好的诊断性能,正逐渐成为该领域研究重点。如果同一种故障模式下的振动信号具有很好的相似性,这些深度学习方法能够较准确预测故障类型。然而,目前深度学习方法在特征学习阶段仍然面临较大子类间、子类内变化这一巨大挑战待解决。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种基于DSCRN模型的旋转机械故障诊断方法,削弱了子类间差异,间接了增大类间差异,实现了自适应地学习显著的、鲁棒的故障特征表示,从而更好地表征故障模式。
本申请的第二个目的在于提出一种计算机设备。
本申请的第三个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种基于DSCRN模型的旋转机械故障诊断方法,包括:
步骤S100:获取待测试振动信号,并根据所述待测试振动信号生成测试集;
步骤S200:对所述测试集进行预处理,以得到所述测试集中的每一个高维测试样本的低维片段;
步骤S300:使用预设的深度子类重构网络DSCRN模型提取所述低维片段的深层特征;
步骤S400:根据同属于一个测试样本的片段的所述深层特征生成所述测试样本的特征向量;
步骤S500:将所述测试样本的特征向量输入Softmax分类器,并输出相应的故障类别。
本申请削弱了子类间差异,间接了增大类间差异,可以自适应地学习显著的、鲁棒的故障特征表示,从而更好地表征故障模式。
可选地,在本申请的一个实施例中,所述对所述测试集进行预处理,包括以下步骤:
步骤S210:对所述测试集进行切片处理生成新的测试集;
步骤S220:对所述新的测试集进行白化处理。
可选地,在本申请的一个实施例中,所述对所述测试集进行切片处理,包括以下步骤:
步骤S211:将所述测试集归一化压缩至范围[0,1]内;
步骤S212:以重叠的固定长度的窗口顺序切割所述测试集中的每一个高维度的样本,生成低维片段;
步骤S213:在整个所述测试集上划分得到的所有所述低维片段组成所述新的测试集。
可选地,在本申请的一个实施例中,所述对所述新的测试集进行白化处理,具体采用ZCA白化方式,所得到的低维片段表示为:
Figure 174069DEST_PATH_IMAGE001
其中,矩阵F为所述新的测试集,F∈Rd×Q,d表示所述矩阵F包含的数据点个数,R表示实数集,Q表示所述新的测试集上全部片段的数目,F的协方差矩阵为
Figure 374106DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
,ZCA白化后的低维片段通过使用奇异值分解得到∑ f=USV之后得到,U为特征值的正交矩阵,S为特征值的对角矩阵,V=UT
可选地,在本申请的一个实施例中,通过模型训练生成所述预设的深度子类重构网络DSCRN模型,训练后的所述预设的深度子类重构网络DSCRN模型还用于训练所述Softmax分类器,其中,
所述模型训练包括以下步骤:
步骤S310:获取由M个样本组成的训练集;
步骤S320:对所述训练集进行切片处理和白化处理,生成低维片段;
步骤S330:根据类别和运转条件的不同对所述低维片段进行分类,生成对应的子类;
步骤S340:对所述子类进行子类平均生成子类监督信息;
步骤S350:将所述子类和所述子类监督信息输入所述DSCRN模型中进行预训练生成预训练后的DSCRN模型,之后对所述预训练后的DSCRN模型进行微调,完成模型训练。
可选地,在本申请的一个实施例中,DSCRN模型为子类重构网SCRN模型的堆叠,
所述预训练采用逐层贪婪的方式,具体为将所述子类和所述子类监督信息作为第一个SCRN模型的输入,所述第一个SCRN模型学习到的特征表示及其对应的平均向量作为输入以训练所述堆叠中的第二个SCRN模型,以此类推,直至所述堆叠中的所有SCRN模型依次训练完毕,完成预训练。
可选地,在本申请的一个实施例中,对所述预训练后的DSCRN模型进行微调,具体过程为将DSCRN模型的输入层、输出层和所有隐藏层作为一个整体,通过执行深度子类重构来微调所述预训练后的DSCRN模型。
为达上述目的,本发明第二方面实施例提出了一种计算机设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器执行时实现上述基于DSCRN模型的旋转机械故障诊断方法。
为了实现上述目的,本发明第三方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行上述基于DSCRN模型的旋转机械故障诊断方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例一所提供的一种基于深度子类重构网络模型的旋转机械故障诊断方法的流程示意图;
图2为本申请实施例的DCSRN模型的逐层预训练过程图;
图3为本申请实施例的子类重构SCRN的结构图;
图4为本申请实施例的深度子类重构DSCRN的结构图;
图5为本申请实施例的新型深度子类重构网络模型的流程图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于深度子类重构网络模型的旋转机械故障诊断方法和装置。
图1为本申请实施例一所提供的一种基于深度子类重构网络模型的旋转机械故障诊断方法的流程示意图。
如图1所示,该基于深度子类重构网络模型的旋转机械故障诊断方法包括以下步骤:
步骤101,获取待测试振动信号,并根据所述待测试振动信号生成测试集;
步骤102,对所述测试集进行预处理,以得到所述测试集中的每一个高维测试样本的低维片段;
步骤103,使用预设的深度子类重构网络DSCRN模型提取所述低维片段的深层特征;
步骤104,根据同属于一个测试样本的片段的所述深层特征生成所述测试样本的特征向量;
步骤105,将所述测试样本的特征向量输入Softmax分类器,并输出相应的故障类别。
本申请实施例的基于深度子类重构网络模型的旋转机械故障诊断方法,通过以下步骤:
步骤S100:获取待测试振动信号,并根据所述待测试振动信号生成测试集;
步骤S200:对所述测试集进行预处理,以得到所述测试集中的每一个高维测试样本的低维片段;
步骤S300:使用预设的深度子类重构网络DSCRN模型提取所述低维片段的深层特征;
步骤S400:根据同属于一个测试样本的片段的所述深层特征生成所述测试样本的特征向量;
步骤S500:将所述测试样本的特征向量输入Softmax分类器,并输出相应的故障类别。
由此,能够自适应地学习显著的、鲁棒的故障特征表示,从而更好的表征故障模式。
进一步地,在本申请实施例中,所述对所述测试集进行预处理,包括以下步骤:
步骤S210:对所述测试集进行切片处理生成新的测试集;
步骤S220:对所述新的测试集进行白化处理。
进一步地,在本申请实施例中,所述对所述测试集进行切片处理,包括以下步骤:
步骤S211:给定由M个样本组成的测试集{s(i)}i=1 M,将所述测试集归一化压缩至范围[0,1]内;
步骤S212:以重叠的固定长度的窗口顺序切割所述测试集中的每一个高维度的样本s(i)为P个低维的片段{fj (i)}j=1 P,其中fj (i)表示包含有d个数据点的第j个片段;
步骤S213:在整个所述测试集上划分得到的所有所述低维片段组成所述新的测试集,可表示为矩阵F∈Rd×Q,其中d表示矩阵F包含的数据点个数,R表示实数集,Q表示训练集上全部片段的数目。
进一步地,在本申请实施例中,所述对所述新的测试集进行白化处理,具体采用ZCA白化方式,具体地,所述新的测试集F的协方差矩阵为
Figure 898628DEST_PATH_IMAGE004
,其中
Figure 387379DEST_PATH_IMAGE003
。然后使用奇异值分解(Singular Value Decomposition, SVD)得到∑f=USV,其中U为特征值的正交矩阵,S为特征值的对角矩阵,其中V=UT。最终得到的ZCA白化的片段为
Figure 157014DEST_PATH_IMAGE001
,白化的目的是降低片段之间的相关性,同时减少相邻片段之间的冗余信息。
经过所述切片和所述白化处理后,将来自同一个类别的在相同运转条件下得到的片段分到相同的子类中,这些同一个子类的片段期望在特征空间中分享较好的一致性。
进一步地,在本申请实施例中,通过模型训练生成所述预设的深度子类重构网络DSCRN模型提取,训练后的所述预设的深度子类重构网络DSCRN模型还用于训练所述Softmax分类器,其中,
所述模型训练包括以下步骤:
步骤S310:获取由M个样本组成的训练集;
步骤S320:对所述训练集进行所述切片处理和所述白化处理,生成低维片段;
步骤S330:根据类别和运转条件的不同对所述低维片段进行分类,生成对应的子类;
步骤S340:对所述子类进行子类平均生成子类监督信息;
步骤S350:将所述子类和所述子类监督信息输入所述DSCRN模型中进行预训练和微调,完成模型训练。
进一步地,在本申请实施例中,DSCRN模型为子类重构网SCRN模型的堆叠,
所述预训练采用逐层贪婪的方式,具体为将所述子类和所述子类监督信息作为第一个SCRN模型的输入,所述第一个SCRN模型学习到的特征表示及其对应的平均向量作为输入以训练所述堆叠中的第二个SCRN模型,如图2所示,以此类推,直至所述堆叠中的所有SCRN模型依次训练完毕,完成预训练。
下面将结合附图对SCRN和DSCRN进行详细介绍。
符号说明;用X={Xk c={x(i) c,k|i=1,2,3,...,Nk c}|c=1,2,3,...C;k=1,2,3,...KC}表示训练集,其中x(i) c,k表示第c类的第k子类的第i个训练样本且其维度为n,Nk c表示第c类的第k子类中训练样本的数目,C表示训练样本中类别总数,KC表示第c类中子类别总数。用m表示训练集中样本总数,则
Figure 477137DEST_PATH_IMAGE005
。由于整个训练集X中包含C个类,第c类中包含KC个子类,因此第c类的第k子类中训练样本集可表示为{x(i) c,k}i=1 N,用矩阵表示为
Figure 641402DEST_PATH_IMAGE006
。特别强调,当某个类中只有一个子类时,即KC=1,意味着后续讨论的子类等价于该类,如子类重构相当于类重构(CRN)、深度子类重构(DSCRN)相当于深度类重构(DCRN),其中,深度类重构(DCRN)是子类重构(CRN)的堆叠。
子类重构网络(SCRN)结构如图3所示。可以使用均方误差(Mean Squared Error,MSE)来度量子类样本均值与子类样本的重构之间的误差LSUBCLASS,其数学表达式为:
Figure 679765DEST_PATH_IMAGE007
式中
Figure 486047DEST_PATH_IMAGE008
为子类样本均值,表示子类样本簇中心,其可通过平均该子类的全体样本计算得到:
Figure 863939DEST_PATH_IMAGE009
为了防止过拟合,进一步提高 SCRN 模型对未知数据的泛化能力,在 SCRN的目标函数中添加额外的权重正则化项。于是 SCRN的目标函数变为:
Figure 995843DEST_PATH_IMAGE010
式中θ表示SCRN模型的参数合集,μ>0为权衡基本重构项和子类重构项的重要性,λ>0表示正则化参数。参数μ和λ被用于权衡 SCRN 模型代价函数中不同项的重要性。权重正则化项定义为全部权重矩阵的 Frobenius 范数的平方和。
Figure 459185DEST_PATH_IMAGE011
所提出的子类水平的重构LSUBCLASS作为基本重构项LAE的补充,其作用在于减小子类内变化,进一步增强类内相似性。SCRN 模型通过构建新的目标函数,不仅保证了学习特征的重构能力,而且增强了其显著性和鲁棒性。
深度子类重构网络(DSCRN)的结构如图4所示。DSCRN 模型的重构输出能够通过非线性激活函数表示为:
Figure 334737DEST_PATH_IMAGE012
Figure 363873DEST_PATH_IMAGE013
Figure 869941DEST_PATH_IMAGE014
类似的,DSCRN 模型的目标函数是深度基本重构项和深度子类重构项结合而成,这不仅仅保证了学习特征具有较好的重构能力,而且也使得学习特征在更高水平上对子类内变化具有鲁棒性,其数学表达式为:
Figure 617317DEST_PATH_IMAGE015
Figure 234243DEST_PATH_IMAGE016
将整个 DSCRN 模型的输入层、输出层和所有隐藏层视为一个整体,通过求解上述方程对其网络参数进一步微调。为了求解上述优化问题,使用梯度下降算法(GradientDescent, GD)反复地更新网络参数θ直至收敛:
Figure 639858DEST_PATH_IMAGE017
式中η表示一个很小数值的学习率,其具体数值是通过 L-BFGS 优化算法自适应地确定的。
对于所有的隐藏层1≤j≤4,目标函数LDSCRN相对于网络参数θ的梯度通过下列公式计算:
Figure 379144DEST_PATH_IMAGE018
Figure 551499DEST_PATH_IMAGE019
式中:
Figure 768854DEST_PATH_IMAGE020
Z(j)=W(j)H(j-1)+B(j),1≤j≤4
Figure 975844DEST_PATH_IMAGE021
Figure 620452DEST_PATH_IMAGE022
SUM(A,2)表示矩阵A所有列向量之和,运算⊙表示矩阵间对应元素间相乘。偏置矩阵{B(j)}j=1 4是通过按列平铺对应的偏置向量{b(j)}j=1 4得到。式中针对第c类第k子类的一系列符号δc,k (j)、Zc,k (j)、Hc,k (j)
Figure 342421DEST_PATH_IMAGE023
定义如下:
Figure 301149DEST_PATH_IMAGE024
Figure 159384DEST_PATH_IMAGE025
Figure 974893DEST_PATH_IMAGE026
Z(j)=W(j)H(j-1)+B(j),1≤j≤4。
进一步地,在本申请实施例中,对所述预训练后的DSCRN模型进行微调,具体过程为将DSCRN模型的输入层、输出层和所有隐藏层作为一个整体,通过执行深度子类重构来微调所述预训练后的DSCRN模型,经过整体的微调之后,所述DSCRN 模型参数能够进一步被优化,能够将输入数据映射到更好的特征表示上。
如图5所示,为模型训练和模型测试的过程,具体包括:获取待测试振动信号,并根据所述待测试信号生成测试集;对所述测试集进行预处理,以得到所述测试集中的每一个高维测试样本的低维片段;使用预设的深度子类重构网络DSCRN模型提取所述低维片段的深层特征;根据同属于一个测试样本的片段的所述深层特征生成所述测试样本的特征向量;将所述测试样本的特征向量输入Softmax分类器,并输出相应的故障类别。采用上述方案的本发明可以自适应地学习显著的、鲁棒的故障特征表示,从而更好的表征故障模式
本发明的应用实例如下:
以来自凯斯西储大学的CWRU轴承数据集(CWRU采集的是电机驱动端轴承和风扇端轴承的加速度数据,此数据集有四个子数据集,DD(drive end bearing fault and driveend acceleration dataset)、DF (drive endbearing fault and fan end accelerationdataset) 、FD (fan-end bearing fault and drive endacceleration dataset )、FF(fan-end bearing fault and fan end acceleration dataset )为例,说明基于深度子类重构网络模型的旋转机械故障诊断实现方法,同时还分析了浅层网络SCRN的分类性能。
实验设置
本实验中,所有比较方法均采用 sigmoid 函数s(z)=1/[1+exp(-z)]作为非线性激活函数。使用梯度下降算法和L-BFGS算法优化网络参数。对于分类,使用softmax分类器,其权重正则化参数经验地设置为10-5。本实验中,每一个子类的不同比例的样本被选取作为训练集,剩余样本用作测试集评估模型的诊断性能。训练集上的所有片段经过ZCA白化处理,在测试集上也进行相同的预处理。训练集上经过预处理的全部片段用于训练 SCRN 和DSCRN模型。实验中,考虑一种特殊情况,当每一个类中仅仅包含一个子类时,即Kc=1(∀c),SCRN模型退化为 CRN 模型。
将SCRN的各层神经元数设定[250 →200 →250],将DSCRN的各层神经元数设定为[250 →200 →250 →200 →250],参数μ和λ分别设定为100和10-6
对于对比方法的设置:本实验在 CWRU 的四个子数据集上将提出的方法与 AE 变种进行全面比较。
AE:仅仅考虑基本重构项的自编码器。
AE+wd:在自编码器的基本重构项添加一个权重正则化项。
Figure 121841DEST_PATH_IMAGE027
Sparse AE:当隐藏神经元数目少于输入的数目时,自编码神经网络可以达到数据压缩的效果;当隐藏神经元数目较多时,我们仍然可以对隐藏层的神经元加入稀疏性限制来发现输入数据的有趣结构。使用aj (2)(x)来表达在给定输出为x的情况下,自编码神经网络隐藏神经元j的激活度。并将隐藏神经元j在整个训练集上的平均活跃度记为:
Figure 946577DEST_PATH_IMAGE028
Sparse AE 在自编码器上添加稀疏惩罚项,惩罚因子如下:
Figure 862581DEST_PATH_IMAGE029
其中,ρ是稀疏性参数(通常是一个接近于0的值),s2是隐藏层中神经元的数量。该表达式也可以描述为相对熵,记为:
Figure 350456DEST_PATH_IMAGE030
DAE :和自编码器不同的是,降噪自编码(Denoising Autoencoder)的训练过程中,输入的数据有一部分是“损坏”的。DAE就是在Autoencoder的基础之上,为了防止过拟合问题而对输入层的数据加入噪音,使学习得到的编码器具有较强的鲁棒性,从而增强模型的泛化能力。
CAE :Contractive Autoencoder是AE的一个变种,其实就是在AE上加入了一个规则项,它简称CAE。CAE替换了上述AE+wd等式右边的正则项,CAE的目标函数为:
Figure 781437DEST_PATH_IMAGE031
其中Jf(x)是隐含层输出值关于权重的雅可比矩阵,而||Jf(x)||F 2表示的是该雅可比矩阵的F范数的平方:
Figure 81969DEST_PATH_IMAGE032
更具体的表达式为:
Figure 180375DEST_PATH_IMAGE033
最近研究表明,寻找深度学习模型的最优网络结构是一个巨大的挑战。通过经验地网络搜索对AE及其变种的全部超参数进行寻优,以获取最佳的分类性能。对于AE,没有超参数需要调整。对于 AE+wd,最优的权重惩罚项系数从{10-1,10-2,10-3,10-4,10-5,10-6,10-7,10-8}范围搜索得到。对于CAE,收缩惩罚项系数的搜索范围为{0.5,1.5,10,15,20,30}。对于DAE,噪声水平以步长为0.1在区间[0.1,0.9]内搜索。为了避免不同网络结构对特征学习的影响,所有AE变种和所提出的SCRN共享相同的网络结构,各层神经元数设定为[250 →200→250]。
分类性能的比较
(1)不同重叠率下比较:对于每一个样本,以一定的重叠率顺序地切割每一个高维的样本为若干个低维的片段。重叠率定义为:
Figure 72107DEST_PATH_IMAGE034
式中Poverlap和Pfragment分别表示每一个片段和相邻片段重叠部分的长度。
首先,将浅层结构 SCRN 和 CRN 与几种 AE 变种进行比较,以验证目标函数中的子类水平重构项在特征学习过程的优势。实验中随机选取 10%的样本作为训练集,剩余样本作为测试集。容易发现,随着 OLR 的增加,ACA 会越来越高。当 OLR 达到 80%时,所提出的 SCRN 方法比 AE、AE+wd、Sparse AE、DAE 和 CAE 分别提高了大约 60%、40%、10%、20%和30%。在所有不同的OLR 下,所提出的 CRN 和 SCRN 仍然比其他方法至少改善了 10%的分类性能。这些结果表明,与 AE 及其变种相比,所提出的 CRN 和 SCRN 实现了更加优异的分类性能。
然后,为了研究深层结构的分类性能,在不同 OLR 下将深度子类重构DSCRN 和子类重构SCRN 之间,以及深度类重构DCRN 和 类重构CRN 之间的分类性能进行比较,其结果如表1所示,
表1在DD数据集上不同OLR下所提出方法的诊断性能比较
Figure 193647DEST_PATH_IMAGE035
表1在DD 数据集上不同 OLR 下的所提出方法的诊断性能比较,容易发现,在所有不同的 OLR 下,深层模型 DSCRN 和 DCRN比相应的浅层模型 SCRN 和 CRN 的分类性能有显著的改善。主要原因是深层结构的 DSCRN 和 DCRN 通过非线性变换将多个隐藏层堆叠起来,与仅仅只有一个隐藏层的 SCRN 和 CRN 模型相比,更容易建立复杂的非线性映射关系,从而学习到更抽象的、更高水平的特征表示。因此 DCRN 和 DSCRN 模型能够学习更具识别性和鲁棒性的故障特征表示。
(2)不同噪声水平下比较:在 DD 数据集上做实验评估所提出的方法的噪声鲁棒性。在实验中,将不同信噪比(signal-to-noise ratios, SNR)的高斯白噪声加入到原始的振动信号中,SNR 的定义如下:
SNRdb=10log10(Psignal/Pnoise)
式中Psignal和Pnoise分别表示原始信号和噪声的能量。
本实验中,比较了在不同信噪比-4db 至 14db 的噪声环境下所提出的方法与AE变种的故障诊断性能,在所考虑的所有信噪比水平上,所提出的方法的分类性能始终优于所有比较的 AE 变种。特别是 DSCRN 模型明显优于所有比较的 AE 变种。
(3)不同训练样本比例下比较:进一步研究所提出的方法在不同数量的训练样本情况下的诊断表现。本实验中分别随机选取 5%、10%、20%、30%和 40%的样本作为训练集,剩余样本作为测试集。表2为不同训练样本比例下故障分类性能的比较,其中AE为仅仅堪虑基本重构项的自编码器,AE+wd为在自编码器的基本重构项添加一个权重正则化项,Spare AE表示在自编码器上添加稀疏惩罚项,DAE为降噪自编码,CAE为AE的一个变种,具体实现方法为在AE上加入一个规则项,CRN为类重构,SCRN为子类重构,DCRN为深度类重构,DSCRN为深度子类重构,
表2不同训练样本比例下故障分类性能的比较
Figure 360186DEST_PATH_IMAGE036
如表2所示,在不同训练样本比例下,所提出的 CRN、SCRN、DCRN 和 DSCRN 方法明显优于所有比较的方法。
综上所述,实验结果验证了只通过最小化 AE 的基本重构来获取特征表示并不能达到预期的良好分类效果。在保证最小化基本重构误差前提下,进一步增强所学特征表示的显著性和鲁棒性,有利于提高分类性能。本发明提出的SCRN 模型和DSCRN 模型不仅仅使用无监督的基本重构项去学习输入数据的主要结构,而且高效地融入了监督的子类重构去压缩特征空间中类内和子类内的变化。因此,所提出的方法能够充分利用丰富的子类信息来学习更具识别性的特征表示,并且针对较大的子类内和类内变化依然能够保持更强的鲁棒性和可靠性。
为了实现上述实施例,本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述实施例所述的方法。
为了实现上述实施例,本发明还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种基于DSCRN模型的旋转机械故障诊断方法,其特征在于,包括以下步骤:
步骤S100:获取待测试振动信号,并根据所述待测试振动信号生成测试集;
步骤S200:对所述测试集进行预处理,以得到所述测试集中的每一个高维测试样本的低维片段;
步骤S300:使用预设的深度子类重构网络DSCRN模型提取所述低维片段的深层特征;
步骤S400:根据同属于一个测试样本的片段的所述深层特征生成所述测试样本的特征向量;
步骤S500:将所述测试样本的特征向量输入Softmax分类器,并输出相应的故障类别。
2.如权利要求1所述的基于DSCRN模型的旋转机械故障诊断方法,其特征在于,所述对所述测试集进行预处理,包括以下步骤:
步骤S210:对所述测试集进行切片处理生成新的测试集;
步骤S220:对所述新的测试集进行白化处理。
3.如权利要求2所述的基于DSCRN模型的旋转机械故障诊断方法,其特征在于,所述对所述测试集进行切片处理,包括以下步骤:
步骤S211:将所述测试集归一化压缩至范围[0,1]内;
步骤S212:以重叠的固定长度的窗口顺序切割所述测试集中的每一个高维度的样本,生成低维片段;
步骤S213:在整个所述测试集上划分得到的所有所述低维片段组成所述新的测试集。
4.如权利要求2所述的基于DSCRN模型的旋转机械故障诊断方法,其特征在于,所述对所述新的测试集进行白化处理,具体采用ZCA白化方式,所得到的低维片段表示为:
Figure 249824DEST_PATH_IMAGE001
其中,矩阵F为所述新的测试集,F∈Rd×Q,d表示所述矩阵F包含的数据点个数,R表示实数集,Q表示所述新的测试集上全部片段的数目,F的协方差矩阵为
Figure 869024DEST_PATH_IMAGE002
Figure 667216DEST_PATH_IMAGE003
,ZCA白化后的低维片段通过使用奇异值分解得到∑ f=USV之后得到,U为特征值的正交矩阵,S为特征值的对角矩阵,V=UT
5.如权利要求1所述的基于DSCRN模型的旋转机械故障诊断方法,其特征在于,通过模型训练生成所述预设的深度子类重构网络DSCRN模型,所述预设的深度子类重构网络DSCRN模型还用于训练所述Softmax分类器,其中,
所述模型训练包括以下步骤:
步骤S310:获取由M个样本组成的训练集;
步骤S320:对所述训练集进行切片处理和白化处理,生成低维片段;
步骤S330:根据类别和运转条件的不同对所述低维片段进行分类,生成对应的子类;
步骤S340:对所述子类进行子类平均生成子类监督信息;
步骤S350:将所述子类和所述子类监督信息输入所述DSCRN模型中进行预训练生成预训练后的DSCRN模型,之后对所述预训练后的DSCRN模型进行微调,完成模型训练。
6.如权利要求5所述的基于DSCRN模型的旋转机械故障诊断方法,其特征在于,DSCRN模型为子类重构网SCRN模型的堆叠,
所述预训练采用逐层贪婪的方式,具体为将所述子类和所述子类监督信息作为第一个SCRN模型的输入,所述第一个SCRN模型学习到的特征表示及其对应的平均向量作为输入以训练所述堆叠中的第二个SCRN模型,以此类推,直至所述堆叠中的所有SCRN模型依次训练完毕,完成预训练。
7.如权利要求5所述的基于DSCRN模型的旋转机械故障诊断方法,其特征在于,对所述预训练后的DSCRN模型进行微调,具体过程为将DSCRN模型的输入层、输出层和所有隐藏层作为一个整体,通过执行深度子类重构来微调所述预训练后的DSCRN模型。
8.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一所述的基于DSCRN模型的旋转机械故障诊断方法。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的基于DSCRN模型的旋转机械故障诊断方法。
CN202110470770.2A 2021-04-29 2021-04-29 基于dscrn模型的旋转机械故障诊断方法、设备和存储介质 Active CN112884093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110470770.2A CN112884093B (zh) 2021-04-29 2021-04-29 基于dscrn模型的旋转机械故障诊断方法、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110470770.2A CN112884093B (zh) 2021-04-29 2021-04-29 基于dscrn模型的旋转机械故障诊断方法、设备和存储介质

Publications (2)

Publication Number Publication Date
CN112884093A true CN112884093A (zh) 2021-06-01
CN112884093B CN112884093B (zh) 2021-08-31

Family

ID=76040243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110470770.2A Active CN112884093B (zh) 2021-04-29 2021-04-29 基于dscrn模型的旋转机械故障诊断方法、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112884093B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130191161A1 (en) * 2012-01-24 2013-07-25 Vimedicus, Inc. Patient data input and access system that enhances patient care
CN105589696A (zh) * 2015-12-22 2016-05-18 武汉斗鱼网络科技有限公司 一种无阻塞全屏观看视频影像的交互方法及交互装置
CN107991846A (zh) * 2014-06-12 2018-05-04 佳能株式会社 图像形成装置
CN110084148A (zh) * 2019-04-09 2019-08-02 东南大学 一种高压断路器机械故障诊断方法
US20200174654A1 (en) * 2016-07-08 2020-06-04 Mehdi BLANCHARD Gesture-based input command interface, method and system
CN111246098A (zh) * 2020-01-19 2020-06-05 深圳市人工智能与机器人研究院 机器人拍照方法、装置、计算机设备和存储介质
CN111275007A (zh) * 2020-02-24 2020-06-12 山东大学 基于多尺度信息融合的轴承故障诊断方法及系统
WO2020223454A1 (en) * 2019-04-30 2020-11-05 The Regents Of The University Of California Broad-spectrum nanoparticle enabled genomic detection
CN112418277A (zh) * 2020-11-03 2021-02-26 西安电子科技大学 旋转机械零部件剩余寿命预测方法、系统、介质、设备
CN112577747A (zh) * 2020-12-07 2021-03-30 东南大学 一种基于空间池化网络的滚动轴承故障诊断方法
CN112632909A (zh) * 2020-10-30 2021-04-09 中核核电运行管理有限公司 数据对象英文编码方法及装置
CN112629854A (zh) * 2020-11-25 2021-04-09 西安交通大学 一种基于神经网络注意力机制的轴承故障分类方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130191161A1 (en) * 2012-01-24 2013-07-25 Vimedicus, Inc. Patient data input and access system that enhances patient care
CN107991846A (zh) * 2014-06-12 2018-05-04 佳能株式会社 图像形成装置
CN105589696A (zh) * 2015-12-22 2016-05-18 武汉斗鱼网络科技有限公司 一种无阻塞全屏观看视频影像的交互方法及交互装置
US20200174654A1 (en) * 2016-07-08 2020-06-04 Mehdi BLANCHARD Gesture-based input command interface, method and system
CN110084148A (zh) * 2019-04-09 2019-08-02 东南大学 一种高压断路器机械故障诊断方法
WO2020223454A1 (en) * 2019-04-30 2020-11-05 The Regents Of The University Of California Broad-spectrum nanoparticle enabled genomic detection
CN111246098A (zh) * 2020-01-19 2020-06-05 深圳市人工智能与机器人研究院 机器人拍照方法、装置、计算机设备和存储介质
CN111275007A (zh) * 2020-02-24 2020-06-12 山东大学 基于多尺度信息融合的轴承故障诊断方法及系统
CN112632909A (zh) * 2020-10-30 2021-04-09 中核核电运行管理有限公司 数据对象英文编码方法及装置
CN112418277A (zh) * 2020-11-03 2021-02-26 西安电子科技大学 旋转机械零部件剩余寿命预测方法、系统、介质、设备
CN112629854A (zh) * 2020-11-25 2021-04-09 西安交通大学 一种基于神经网络注意力机制的轴承故障分类方法
CN112577747A (zh) * 2020-12-07 2021-03-30 东南大学 一种基于空间池化网络的滚动轴承故障诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHAO MENG 等: "SCRN: A Complex Network Reconstruction Method Based on Multiple Time Series", 《JOURNAL OF CIRCUITS, SYSTEMS, AND COMPUTERS》 *
GANGJIN HUANG等: "Transfer remaining useful life estimation of bearing using depth-wise separable convolution recurrent network", 《MEASUREMENT》 *
侯文擎等: "基于改进堆叠降噪自编码的滚动轴承故障分类", 《机械工程学报》 *
祝道强等: "变负载轴承故障诊断卷积神经网络模型", 《科学技术与工程》 *

Also Published As

Publication number Publication date
CN112884093B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
Li et al. Intelligent rotating machinery fault diagnosis based on deep learning using data augmentation
CN106682688B (zh) 基于粒子群优化的堆叠降噪自编码网络轴承故障诊断方法
Li et al. Multiscale local features learning based on BP neural network for rolling bearing intelligent fault diagnosis
Zhang et al. Deep residual learning-based fault diagnosis method for rotating machinery
Youcef Khodja et al. Rolling element bearing fault diagnosis for rotating machinery using vibration spectrum imaging and convolutional neural networks
Grezmak et al. Interpretable convolutional neural network through layer-wise relevance propagation for machine fault diagnosis
Zhao et al. Improved generative adversarial network for vibration-based fault diagnosis with imbalanced data
CN109582003B (zh) 基于伪标签半监督核局部费舍尔判别分析轴承故障诊断方法
Li et al. A new feature extraction and selection scheme for hybrid fault diagnosis of gearbox
Wong et al. Modified self-organising map for automated novelty detection applied to vibration signal monitoring
Rojas et al. Practical scheme for fast detection and classification of rolling-element bearing faults using support vector machines
CN113988126B (zh) 一种基于少标签数据特征迁移的滚动轴承故障诊断方法
Yang et al. Interpretability of deep convolutional neural networks on rolling bearing fault diagnosis
Ayas et al. A novel bearing fault diagnosis method using deep residual learning network
Zhao et al. Fault Diagnosis of Motor in Frequency Domain Signal by Stacked De-noising Auto-encoder.
CN112906644A (zh) 基于深度迁移学习的机械故障智能诊断方法
CN111353373A (zh) 一种相关对齐域适应故障诊断方法
Plakias et al. A novel information processing method based on an ensemble of Auto-Encoders for unsupervised fault detection
CN112964469A (zh) 一种迁移学习的变负载下滚动轴承在线故障诊断方法
CN113822139A (zh) 一种基于改进1DCNN-BiLSTM的设备故障诊断方法
Zhao et al. A novel deep fuzzy clustering neural network model and its application in rolling bearing fault recognition
Li et al. A novel data-driven fault feature separation method and its application on intelligent fault diagnosis under variable working conditions
CN114169377A (zh) 基于g-mscnn的有噪环境中滚动轴承故障诊断方法
Masood et al. Differential evolution based advised SVM for histopathalogical image analysis for skin cancer detection
Hong et al. Mel Spectrogram-based advanced deep temporal clustering model with unsupervised data for fault diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant