CN113469230A - 一种转子系统深度迁移故障诊断方法、系统及介质 - Google Patents

一种转子系统深度迁移故障诊断方法、系统及介质 Download PDF

Info

Publication number
CN113469230A
CN113469230A CN202110682696.0A CN202110682696A CN113469230A CN 113469230 A CN113469230 A CN 113469230A CN 202110682696 A CN202110682696 A CN 202110682696A CN 113469230 A CN113469230 A CN 113469230A
Authority
CN
China
Prior art keywords
model
wdcnn
training
gas turbine
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110682696.0A
Other languages
English (en)
Other versions
CN113469230B (zh
Inventor
王红军
刘淑聪
钟建琳
唐竟鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN202110682696.0A priority Critical patent/CN113469230B/zh
Publication of CN113469230A publication Critical patent/CN113469230A/zh
Application granted granted Critical
Publication of CN113469230B publication Critical patent/CN113469230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明涉及一种转子系统深度迁移故障诊断方法、系统及介质,其包括:对WDCNN模型进行预训练,获得预先设定的分类效果后,保存整个WDCNN模型,并给予该模型初始权值;将预训练得到的WDCNN模型迁移至源域,对WDCNN模型进行微调,在预先设置标签的燃气轮机正常数据集上进行训练,更新WDCNN模型权重;在目标域中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征;利用SVM对目标域数据集所有的映射特征进行分类,实现燃气轮机的故障识别。本发明能有效提高故障诊断的精度,有利于解决燃气轮机转子系统正常运行数据多、故障数据少而难以形成均衡类别训练模型的问题。

Description

一种转子系统深度迁移故障诊断方法、系统及介质
技术领域
本发明涉及一种机械故障诊断技术领域,特别是关于一种宽卷积神经网络深度迁移向量机转子系统故障诊断方法、系统及介质。
背景技术
燃气轮机作为一种高价值的动力设备,稳定的运行状态、较高的可靠性和安全性、较低的运行和维护成本是用户最关心的问题。转子系统作为整机的核心部分,因其高速、高温、高压、高应力的工作条件,不可避免地会产生一些故障,而一旦产生故障会对机组安全运行造成严重影响。因此,对燃气轮机转子系统进行故障诊断具有重要意义。
随着算法和用于算法验证的开源数据集的发展,迁移学习在解决小样本问题方面展现出了更大的优势。但对于燃气轮机转子系统,因其整机封闭式的设计准则,使得难以直接获取转轴上的振动信息。工程上,一般通过燃气轮机的整机振幅超限预警来提示机器发生故障,进而停机检修。另外,不同型号的燃气轮机往往其故障振动特征的表现形式不同,同型号机组之间也存在获取的正常运行数据多、故障数据少且故障模式较为单一的问题,加之涉及行业保密,难以形成一个通用的完备故障数据库。
因此,卷积神经网络(Convolutional Neural Networks,CNN)虽然已在旋转机械故障诊断中得到了应用,但由于需要大样本训练的特性,面对燃气轮机正常工况数据海量而故障数据缺乏和故障模式不完备等问题,并没有充分发挥自身强大的自主学习能力。另一方面,传统神经网络算法的样本处理对人工专业信号处理和提取特征依赖较大,因此算法能力受限。
发明内容
针对在使用深度学习对燃气轮机转子故障诊断过程中,因振动信号样本中正常运行数据多、故障数据少而使得模型故障诊断准确率低的问题,本发明的目的是提供一种宽卷积神经网络深度迁移向量机转子系统故障诊断方法、系统及介质,其有效提高了故障诊断的精度,有利于解决燃气轮机转子系统正常运行数据多、故障数据少而难以形成均衡类别训练模型的问题。
为实现上述目的,本发明采取以下技术方案:一种转子系统深度迁移故障诊断方法,其包括:步骤1、对WDCNN模型进行预训练,获得预先设定的分类效果后,保存整个WDCNN模型,并给予该模型初始权值;步骤2、将预训练得到的WDCNN模型迁移至源域,对WDCNN模型进行微调,在预先设置标签的燃气轮机正常数据集上进行训练,更新WDCNN模型权重;步骤3、在目标域中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征;步骤4、利用SVM对目标域数据集所有的映射特征进行分类,实现燃气轮机的故障识别。
进一步,所述步骤1中,采用标准轴承的原始振动加速度数据作为输入,预训练WDCNN模型;训练方法包括以下步骤:
步骤1.1、将标准轴承的原始振动加速度数据作为样本,将样本按7:3的比例随机划分为训练集和测试集;
步骤1.2、初始化WDCNN模型的权重,采用训练集数据训练该模型,经过网络的不断迭代训练,误差不断被计算更新;
步骤1.3、采用测试集数据测试模型,当迭代完成后,如果获得了95%以上的分类精度,则保存整个模型;反之,若不满足分类精度要求或没有达到最高迭代次数,则利用反向传播更新权值、阈值和卷积核参数,重新判断是否满足分类精度要求。
进一步,所述步骤2中,将预训练得到的WDCNN模型迁移至源域,并更新权重的方法包括以下步骤:
步骤2.1、将预训练的WDCNN模型导入仅有燃机转子正常数据集的源域,分别采用新的Flatten层和Softmax层替换预训练WDCNN模型的对应层,以识别新的正常的转子数据特征;
步骤2.2、在获得预先设置有标签的燃气轮机转子正常样本数据集后,只冻结WDCNN模型的第一个基础模块,即卷积层的参数不随训练迭代而改变;
步骤2.3、采用预先设置有标签的燃气轮机转子正常样本数据集训练WDCNN模模型,微调第二个基础模块~第五个基础模块;
步骤2.4、判断预测标签和真实标签之间的误差,若误差满足预设精度要求,则保存权值、阈值和卷积核;反之,则利用反向传播对网络进行超参数优化,重新微调第二个基础模块~第五个基础模块,直至满足预设精度要求。
进一步,所述步骤2.3中,完全连接层的权重更新:
Figure BDA0003118956360000021
Figure BDA0003118956360000022
式中,t为迭代次数;η为学习率;Wl为第l层的权重;E为均方误差函数;bl为偏置。
进一步,所述步骤2.3中,卷积层的权重更新:
Figure BDA0003118956360000031
Figure BDA0003118956360000032
式中,t为迭代次数;η为学习率;Wl为第l层的权重;E为均方误差函数;
Figure BDA0003118956360000033
为可训练的卷积核;
Figure BDA0003118956360000034
为第j个特征映射的偏置。
进一步,所述步骤3中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征的方法为:以燃气轮机转子的部分正常样本和故障样本数据集为输入,将源任务中的第一个基础模块至第三个基础模块迁移至目标任务中,建立特征映射模型,将目标域映射到一个新的特征空间,得到目标域数据集所有的映射特征。
进一步,所述迁移方法包括以下步骤:
步骤3.1、将一直被冻结权重的第一个基础模块、被更新权重后的第二个基础模块和第三个基础模块作为特征提取层映射到目标域中;
步骤3.2、采用燃气轮机的部分正常样本数据和故障样本数据作为输入,将卷积层提取的特征向量输入到SVM分类器中进行故障分类。
进一步,在所述预训练模型之前,还设置有数据预处理的步骤。
一种转子系统深度迁移故障诊断系统,其包括预训练模块、权重更新模块、提取模块和分类模块;所述预训练模块,用于对WDCNN模型进行预训练,获得预先设定的分类效果后,保存整个WDCNN模型,并给予该模型初始权值;所述权重更新模块,用于将预训练得到的WDCNN模型迁移至源域,对WDCNN模型进行微调,在预先设置标签的燃气轮机正常数据集上进行训练,更新WDCNN模型权重;所述提取模块,用于在目标域中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征;所述分类模块,利用SVM对目标域数据集所有的映射特征进行分类,实现燃气轮机的故障识别。
一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如上述方法中的任一方法。
本发明由于采取以上技术方案,其具有以下优点:
本发明充分发挥了轴承等公开数据集故障种类齐全、数据样本丰富的优势,使用其预训练模型,并将学习到的权重迁移到燃气轮机转子系统领域中进行故障诊断,精度较高,可以给维修人员提供维修策略或建议,有利于解决燃气轮机转子系统正常运行数据多、故障数据少而难以形成均衡类别训练模型的问题。
附图说明
图1是本发明实施例中的WDCNN模型结构示意图;
图2是本发明实施例中WDCNN模型的预训练流程示意图;
图3是本发明实施例中WDCNN模型迁移流程示意图;
图4是本发明实施例中特征迁移流程示意图;
图5是本发明实施例1中的轴承数据集的精度图;
图6是本发明实施例1中的轴承数据训练集的分类效果示意图;
图7是本发明实施例1中的轴承数据验证集的分类效果示意图;
图8是本发明实施例1中的转子正常数据集的精度图;
图9a是本发明实施例1中的燃气轮机振幅超转频时的振动信号示意图;
图9b是本发明实施例1中的燃气轮机正常时的振动信号示意图;
图9c是本发明实施例1中的燃气轮机振幅超8时的振动信号示意图;
图10是本发明实施例1中的使用Softmax分类器的验证集分类效果示意图;
图11是本发明实施例1中的使用SVM分类器的验证集分类效果示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的一种宽卷积神经网络深度迁移向量机转子系统故障诊断方法,首先,使用典型行业样本数据集预训练第一层宽卷积核深度卷积神经网络(DeepConvolutional Neural Networks with Wide First-layer Kernel,WDCNN)模型,获得训练模型初始的权重。其次,将预训练的模型导入源域,使用新的Flatten层和Softmax层替换对应的旧层,冻结块1,微调块2~块5,采用带标签的燃气轮机转子系统的正常数据集进行训练,更新模型权重。
(在源域中,使用某已知型号的燃气轮机试车测试获得的大量正常运行样本更新前述模型的权重;)在目标域中,以燃气轮机转子的部分正常样本和故障样本数据集为输入,建立特征映射模型,将目标域映射到一个新的特征空间,得到目标域数据集所有的映射特征;然后,使用支持向量机(Support-Vector Machines,SVM)进行分类识别,从而达到燃气轮机转子系统故障识别的目的。试车数据实验结果表明,该方法能够实现96%的识别准确率,验证了将轴承数据集预训练的深度学习模型迁移到燃气轮机转子系统领域进行故障诊断的可行性。下面结合附图和实施例对本发明做进一步的说明。
在本发明的第一实施方式中,提供一种宽卷积神经网络深度迁移向量机转子系统故障诊断方法,如图1所示,其包括以下步骤:
步骤1、对WDCNN模型进行预训练,获得预先设定的分类效果后,保存整个WDCNN模型,并给予该模型初始权值;
在本实施例中,WDCNN模型采用由5个基础模块1~5组成的神经网络,每个基础模块都包括一个卷积层(Convolutional Neural Networks,CNN)、一个批量归一化层(BatchNormalization,BN)、一个激活层(Activation)和一个最大池化层(Max Pooling)。其中,前一个基础模块的输出作为下一个基础模块的输入,由第五个基础模块5将处理的后的数据传输至全连接层(Flatten层),并由全连接层传输至分类层(Softmax层),完成分类,输出分类结果;
其中,第一个基础模块1中的卷积层CNN采用64×1大卷积核、其他基础模块的卷积层均为3×1小卷积核,卷积计算如式(1)所示,该结构的优势在于直接以端到端的方式对输入的一维振动信号进行较好的特征提取,而无需手动统计各种特征。
Figure BDA0003118956360000051
式中,
Figure BDA0003118956360000052
为l层的第j个特征映射;f(g)为激活函数;M为输入特征映射的个数;
Figure BDA0003118956360000053
为l-1层的第i个特征映射;*为卷积操作;
Figure BDA0003118956360000054
为可训练的卷积核;
Figure BDA0003118956360000055
为第j个特征映射的偏置。
步骤2、将预训练得到的WDCNN模型迁移至源域,对WDCNN模型进行微调,在预先设置标签的燃气轮机正常数据集上进行训练,更新WDCNN模型权重;
步骤3、在目标域中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征;
步骤4、利用SVM对目标域数据集所有的映射特征进行分类,实现燃气轮机的故障识别。
上述步骤1中,采用标准轴承的原始振动加速度数据作为输入,预训练WDCNN模型。如图2所示,具体训练方法包括以下步骤:
步骤1.1、将标准轴承的原始振动加速度数据作为样本,将样本按7:3的比例随机划分为训练集和测试集;
步骤1.2、初始化WDCNN模型的权重,采用训练集数据训练该模型,经过网络的不断迭代训练,误差不断被计算更新;
在本实施例中,以近似为0的随机值初始化WDCNN模型的权重。
步骤1.3、采用测试集数据测试模型,当迭代完成后,如果获得了95%以上的分类精度,则保存整个模型,为模型迁移做准备;反之,若不满足分类精度要求或没有达到最高迭代次数,则利用反向传播更新权值、阈值和卷积核参数,重新判断是否满足分类精度要求。
上述步骤2中,如图3所示,将预训练得到的WDCNN模型迁移至源域,并更新权重的方法包括以下步骤:
步骤2.1、将预训练的WDCNN模型导入仅有燃机转子系统正常数据集的源域,为避免已使用的轴承标签对新的转子系统数据集训练的影响,分别采用新的Flatten层和Softmax层替换预训练WDCNN模型的对应层,以识别新的正常的转子数据特征。
步骤2.2、为了充分利用在轴承数据集上预训练WDCNN模型的特征提取功能,在获得预先设置有标签的燃气轮机转子正常样本数据集后,只冻结WDCNN模型的第一个基础模块1,即卷积层的参数不随训练迭代而改变。
步骤2.3、采用预先设置有标签的燃气轮机转子正常样本数据集训练WDCNN模模型,微调第二个基础模块2~第五个基础模块5;
根据公式(2)~(5)更新其余卷积层和完全连接层中的权重:
完全连接层的权重更新:
Figure BDA0003118956360000061
Figure BDA0003118956360000062
卷积层的权重更新:
Figure BDA0003118956360000063
Figure BDA0003118956360000064
式中,t为迭代次数;η为学习率;Wl为第l层的权重;E为均方误差函数;bl为偏置。
步骤2.4、判断预测标签和真实标签之间的误差,若误差满足预设精度要求,则保存权值、阈值和卷积核;反之,则利用反向传播对网络进行超参数优化,重新微调第二个基础模块2~第五个基础模块5,以最大程度地减少了预测标签和真实标签之间的误差,直至满足预设精度要求。
上述步骤3中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征的方法为:经过模型迁移训练后,该模型已具备基本的转子系统数据识别能力;以燃气轮机转子系统的部分正常样本和故障样本数据集为输入,将源任务中的第一个基础模块1至第三个基础模块3(即前三个基础模块)迁移至目标任务中,建立特征映射模型,将目标域映射到一个新的特征空间,得到目标域数据集所有的映射特征。
其中,如图4所示,本实施例中采用的迁移学习在解决小样本问题方面展现出了更大的优势。迁移方法包括以下步骤:
步骤3.1、将一直被冻结权重的第一基础模块、被更新权重后的第二基础模块和第三基础模块作为特征提取层映射到目标域中;
步骤3.2、采用燃气轮机的部分正常样本数据和故障样本数据作为输入,将卷积层提取的特征向量输入到SVM分类器中进行故障分类。
上述实施例中,在预训练模型之前,还设置有数据预处理的步骤。数据预处理方法为:
对采集到的原始振动加速度数据转换为可以打开编辑的txt文档,为了更加方便和快速地读取和存储数据,使用MATLAB软件将txt文档转换为mat文件,依据对数据的时域、频域及时频域分析,最后制成样本并作为模型的输入。
在本发明的第二实施方式中,提供一种宽卷积神经网络深度迁移向量机转子故障诊断系统,其包括:预训练模块、权重更新模块、提取模块和分类模块;
预训练模块,用于对WDCNN模型进行预训练,获得预先设定的分类效果后,保存整个WDCNN模型,并给予该模型初始权值;
权重更新模块,用于将预训练得到的WDCNN模型迁移至源域,对WDCNN模型进行微调,在预先设置标签的燃气轮机正常数据集上进行训练,更新WDCNN模型权重;
提取模块,用于在目标域中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征;
分类模块,利用SVM对目标域数据集所有的映射特征进行分类,实现燃气轮机的故障识别。
在本发明的第三实施方式中,提供一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行如第一实施方式中的任一方法。
实施例1:
以某型双转子燃气轮机为研究对象,其转子系统主要由压气机、涡轮、转轴等组成。低压涡轮通过低压转轴连接低压压气机,高压涡轮通过套在低压转轴上的高压转轴连接高压压气机。
由于燃气轮机复杂且高温的内部环境,业内常采用整机测振的方式,通过在不同位置、角度的多次实验与分析,选取了在低压压气机机匣前端的径向位置上安装一个速度传感器作为前测点,在高压压气机与燃烧室之间机匣径向位置上安装一个速度传感器作为后测点,以及在燃气机内部安装测量高低压转子转速传感器的测试方案。
采集到的燃气轮机转子数据由于软件供应商出于商业保密进行了封装,无法直接获取到原始数据,因此在使用神经网络方法判断燃气轮机转子状态时,需对采集到的燃气轮机整机信号进行数据预处理。
振动速度的有效值(Root Mean Square,RMS)反应了周期内系统的动能,如式(6)所示,可以表示振动的强烈程度,经过企业的实践验证,选取RMS=8作为燃气轮机振动评价上限,超过8的部分判定为超限故障;另外,振幅超过转频的部分也被判断为一种故障类型;其余不超限的部分为正常类型。
Figure BDA0003118956360000081
式中,N为测量次数;X(k)为第k个测量值。
步骤1、轴承数据预训练WDCNN模型
选取凯斯西储大学轴承数据集中0马力(horsepower,HP)下驱动端的10类数据,采样频率12K赫兹,如表1所示,每类数据取700个训练样本,200个验证样本,每个样本长度为2048个点,对WDCNN模型进行训练,获得95%以上的分类精度后,保存整个模型。其中,WDCNN模型的结构参数如表2所示,除第一层卷积层采用了64×1的大卷积核(步长为16×1)外,其他卷积层均采用了3×1的小卷积核(步长为1×1)。为更好的提取一维原始信号的特征,前四层卷积层采用边界补零方式,第五层卷积层和池化层均未采取边界补零。
表1轴承数据样本设置
Figure BDA0003118956360000082
Figure BDA0003118956360000091
表2 WDCNN网络结构设置
Figure BDA0003118956360000092
轴承数据预训练WDCNN的训练与验证精度如图5所示,由图5可知,使用验证集验证模型时,经过8次迭代后就获得了99%的分类识别精度。而且,轴承数据训练集和验证集的分类效果分别如图6和图7所示,模型对训练集中10类数据均达到完全分类,在验证集中,仅将一个滚动体故障(标签为2)错分为正常样本(标签为0)。由此可知,使用轴承预训练的WDCNN模型取得了较好的分类结果。
步骤2、模型迁移
在源域中,为了提高模型对燃气轮机转子数据的泛化能力,依据燃气轮机工作功率的不同将燃气轮机转子正常类型的数据细分为0.1工况、0.35工况、0.6工况、0.8工况和1.0工况。如表3所示,每类工况数据取2100个训练样本,600个验证样本,每个样本长度为2048个点,对预训练的WDCNN模型进行权重更新。为避免燃气轮机转子正常数据集标签与轴承标签的分类冲突,分别使用新的Flatten层和Softmax层替换预训练WDCNN模型的对应层。
表3燃气轮机转子数据样本设置
Figure BDA0003118956360000101
为了充分利用在轴承数据集上预训练WDCNN模型的特征提取功能,冻结第一层卷积层,即第一层卷积层参数不随训练迭代而改变。在训练过程中,首先设置第二层到第五层卷积层的学习速率为0.0001,批大小(batch)设置为128,迭代次数为30。因为第五层卷积层为最后一层卷积层,需从第一层开始训练,为加快训练速度与获得更优效果,经过不同量级的调试,将第五层卷积层的学习率调为0.01。转子正常数据训练与验证精度如图8所示,验证集虽在迭代18次时可能因数据误判出现了较低的识别精度,但在23次迭代后,获得了较为稳定的95%的分类精度结果,证明预训练的WDCNN模型经过权重更新后仍有较好的分类性能。
步骤3、特征迁移
将预训练好的WDCNN模型经过源域燃气轮机转子正常样本训练,微调了网络参数后迁移到目标域对燃气轮机数据进行特征提取,将卷积层提取的特征向量输入到SVM分类器中进行故障分类。在目标域中,使用燃气轮机转子正常样本(0.35工况)、超限(振幅超8)和振幅超转频三种类型的数据,时域图如图9a、图9b、图9c所示。
样本设置如表4所示,每种数据取2100个训练样本,600个验证样本,每个样本长度为2048个点。
表4燃气轮机转子数据样本设置
Figure BDA0003118956360000102
学习率、迭代次数等训练相关参数称为卷积神经网络的超参数,它们影响训练算法的时间和成本,在特征迁移的过程中采用了择优选择的方法,最终选用学习率为0.0001,迭代次数为100,批大小为128。
在故障样本少的在目标任务中,首先使用了Softmax分类器对卷积层提取的特征进行分类,使用验证集验证的分类效果如图10所示,在对超限(标签为0)故障识别中,有163组数据被误认为是振幅超过转频(标签为1),因此,Softmax对两类故障识别的效果较差。
SVM使用部分支持向量做超平面决策,无需依赖全部数据,在解决小样本分类上有着出色的性能,所以将卷积层提取的特征向量输入到SVM分类器中进行故障分类。选用径向基函数(the Radial Basis Function,RBF)做SVM的核函数;gamma参数定义了单个训练示例的影响达到的程度,设置为自动模式,低值表示“远”,高值表示“接近”;参数C权衡了训练示例的正确分类与决策函数裕度的最大化之间的权衡,选取默认值1。分类的混淆矩阵结果如图11所示。
从图11可以看出,使用SVM分类器的模型能够很好地识别转子正常(标签为2)类型;在对超限(标签为0)和振幅超过转频(标签为1)两种故障类型的识别中,仅出现了11组和59组的小概率误判情况,原因可能是一方面两种信号中都存在了噪声干扰,导致分类错误,另一方面都属于整机测振信号,其包含了相似的频率和幅值成分,从而出现分类误判。为了排除试验的随机性,分别进行了10组试验,得到平均训练分类准确率为99%,平均验证分类准确率为96%。
实施例2
在本实施例中,将本发明与其他方法对比实验。
为验证本发明方法的有效性,同样以目标域中燃气轮机转子正常样本(0.35工况)、超限(振幅超8)和振幅超转频三种类型数据样本中的训练集训练CNN和SVM两种经典分类模型,并使用同样的验证集验证模型性能。其中,CNN算法仍包含5层卷积层,但每层均采用3×1小卷积核,卷积核数目除第一层为16外,其余均为32。SVM的参数设置与实施例1中相同。在联合分布适配(Joint Distribution Adaptation,JDA)迁移方法的对比实验中,将燃气轮机转子正常样本(0.35工况)、超限(振幅超8)和振幅超转频三种类型数据样本均分到源域和目标域中,使用JDA方法适配缩减源域数据和目标域数据的差异,将变换后的源域样本归一化后输入到DBN中,并使用验证集验证JDA-DBN模型的分类性能。同时,为避免偶然性,每种方法分别进行10次实验,取10次实验的平均值作为最终实验结果。结果如表5所示,本发明采用的迁移方法比JDA-DBN迁移方法高出了6%的准确率,表明模型经过轴承数据预训练并获得权重后具有更好的特征提取和分类能力。而仅使用SVM时因为其浅层结构,只获得了85%的识别精度,限制了识别率的进一步提升。在仅使用CNN作为模型时,由于故障样本数量的限制,没有充分发挥卷积网络的泛化能力,因此其识别率较迁移方法相比仍然有差距。
表5不同方法的分类效果
Figure BDA0003118956360000121
综上所述,本发明所提出的基于WDCNN-SVM深度迁移学习的燃气轮机转子故障诊断方法相较于其他故障诊断方法具有以下优势:充分发挥了轴承等公开数据集故障种类齐全、数据样本丰富的优势,使用其预训练模型,并将学习到的权重迁移到燃气轮机转子领域中进行故障诊断,精度较高,可以给维修人员提供维修策略或建议,有利于解决燃气轮机转子正常运行数据多、故障数据少而难以形成均衡类别训练模型的问题。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims (10)

1.一种转子系统深度迁移故障诊断方法,其特征在于,包括:
步骤1、对WDCNN模型进行预训练,获得预先设定的分类效果后,保存整个WDCNN模型,并给予该模型初始权值;
步骤2、将预训练得到的WDCNN模型迁移至源域,对WDCNN模型进行微调,在预先设置标签的燃气轮机正常数据集上进行训练,更新WDCNN模型权重;
步骤3、在目标域中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征;
步骤4、利用SVM对目标域数据集所有的映射特征进行分类,实现燃气轮机的故障识别。
2.如权利要求1所述故障诊断方法,其特征在于,所述步骤1中,采用标准轴承的原始振动加速度数据作为输入,预训练WDCNN模型;训练方法包括以下步骤:
步骤1.1、将标准轴承的原始振动加速度数据作为样本,将样本按7:3的比例随机划分为训练集和测试集;
步骤1.2、初始化WDCNN模型的权重,采用训练集数据训练该模型,经过网络的不断迭代训练,误差不断被计算更新;
步骤1.3、采用测试集数据测试模型,当迭代完成后,如果获得了95%以上的分类精度,则保存整个模型;反之,若不满足分类精度要求或没有达到最高迭代次数,则利用反向传播更新权值、阈值和卷积核参数,重新判断是否满足分类精度要求。
3.如权利要求1所述故障诊断方法,其特征在于,所述步骤2中,将预训练得到的WDCNN模型迁移至源域,并更新权重的方法包括以下步骤:
步骤2.1、将预训练的WDCNN模型导入仅有燃机转子正常数据集的源域,分别采用新的Flatten层和Softmax层替换预训练WDCNN模型的对应层,以识别新的正常的转子数据特征;
步骤2.2、在获得预先设置有标签的燃气轮机转子正常样本数据集后,只冻结WDCNN模型的第一个基础模块,即卷积层的参数不随训练迭代而改变;
步骤2.3、采用预先设置有标签的燃气轮机转子正常样本数据集训练WDCNN模模型,微调第二个基础模块~第五个基础模块;
步骤2.4、判断预测标签和真实标签之间的误差,若误差满足预设精度要求,则保存权值、阈值和卷积核;反之,则利用反向传播对网络进行超参数优化,重新微调第二个基础模块~第五个基础模块,直至满足预设精度要求。
4.如权利要求3所述故障诊断方法,其特征在于,所述步骤2.3中,完全连接层的权重更新:
Figure FDA0003118956350000021
Figure FDA0003118956350000022
式中,t为迭代次数;η为学习率;Wl为第l层的权重;E为均方误差函数;bl为偏置。
5.如权利要求3所述故障诊断方法,其特征在于,所述步骤2.3中,卷积层的权重更新:
Figure FDA0003118956350000023
Figure FDA0003118956350000024
式中,t为迭代次数;η为学习率;Wl为第l层的权重;E为均方误差函数;
Figure FDA0003118956350000025
为可训练的卷积核;
Figure FDA0003118956350000026
为第j个特征映射的偏置。
6.如权利要求1所述故障诊断方法,其特征在于,所述步骤3中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征的方法为:以燃气轮机转子的部分正常样本和故障样本数据集为输入,将源任务中的第一个基础模块至第三个基础模块迁移至目标任务中,建立特征映射模型,将目标域映射到一个新的特征空间,得到目标域数据集所有的映射特征。
7.如权利要求6所述故障诊断方法,其特征在于,所述迁移方法包括以下步骤:
步骤3.1、将一直被冻结权重的第一个基础模块、被更新权重后的第二个基础模块和第三个基础模块作为特征提取层映射到目标域中;
步骤3.2、采用燃气轮机的部分正常样本数据和故障样本数据作为输入,将卷积层提取的特征向量输入到SVM分类器中进行故障分类。
8.如权利要求1所述故障诊断方法,其特征在于,在所述预训练模型之前,还设置有数据预处理的步骤。
9.一种转子系统深度迁移故障诊断系统,其特征在于,包括:预训练模块、权重更新模块、提取模块和分类模块;
所述预训练模块,用于对WDCNN模型进行预训练,获得预先设定的分类效果后,保存整个WDCNN模型,并给予该模型初始权值;
所述权重更新模块,用于将预训练得到的WDCNN模型迁移至源域,对WDCNN模型进行微调,在预先设置标签的燃气轮机正常数据集上进行训练,更新WDCNN模型权重;
所述提取模块,用于在目标域中,利用源域训练的卷积层提取燃气轮机的正常和故障数据样本特征;
所述分类模块,利用SVM对目标域数据集所有的映射特征进行分类,实现燃气轮机的故障识别。
10.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如权利要求1至8所述方法中的任一方法。
CN202110682696.0A 2021-06-17 2021-06-17 一种转子系统深度迁移故障诊断方法、系统及介质 Active CN113469230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110682696.0A CN113469230B (zh) 2021-06-17 2021-06-17 一种转子系统深度迁移故障诊断方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110682696.0A CN113469230B (zh) 2021-06-17 2021-06-17 一种转子系统深度迁移故障诊断方法、系统及介质

Publications (2)

Publication Number Publication Date
CN113469230A true CN113469230A (zh) 2021-10-01
CN113469230B CN113469230B (zh) 2023-07-07

Family

ID=77868904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110682696.0A Active CN113469230B (zh) 2021-06-17 2021-06-17 一种转子系统深度迁移故障诊断方法、系统及介质

Country Status (1)

Country Link
CN (1) CN113469230B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114298278A (zh) * 2021-12-28 2022-04-08 河北工业大学 一种基于预训练模型的电工装备性能预测方法
CN115270867A (zh) * 2022-07-22 2022-11-01 北京信息科技大学 一种燃气轮机转子系统改进dqn故障诊断方法及系统
CN116701956A (zh) * 2023-06-07 2023-09-05 江南大学 基于故障属性燃气调压器联合映射零样本故障诊断方法
CN117330315A (zh) * 2023-12-01 2024-01-02 智能制造龙城实验室 一种基于在线迁移学习的旋转机械故障监测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918752A (zh) * 2019-02-26 2019-06-21 华南理工大学 基于迁移卷积神经网络的机械故障诊断方法、设备及介质
US20190339688A1 (en) * 2016-05-09 2019-11-07 Strong Force Iot Portfolio 2016, Llc Methods and systems for data collection, learning, and streaming of machine signals for analytics and maintenance using the industrial internet of things
CN111353373A (zh) * 2019-11-29 2020-06-30 盐城工学院 一种相关对齐域适应故障诊断方法
CN111626345A (zh) * 2020-05-15 2020-09-04 北京航空航天大学 不同轴承设备之间的多阶段深度卷积迁移学习故障诊断方法
CN111898095A (zh) * 2020-07-10 2020-11-06 佛山科学技术学院 深度迁移学习智能故障诊断方法、装置、存储介质和设备
CN112163640A (zh) * 2020-10-30 2021-01-01 北京信息科技大学 基于深度卷积迁移学习行星齿轮箱故障诊断方法及系统
CN112964469A (zh) * 2021-02-28 2021-06-15 哈尔滨理工大学 一种迁移学习的变负载下滚动轴承在线故障诊断方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190339688A1 (en) * 2016-05-09 2019-11-07 Strong Force Iot Portfolio 2016, Llc Methods and systems for data collection, learning, and streaming of machine signals for analytics and maintenance using the industrial internet of things
CN109918752A (zh) * 2019-02-26 2019-06-21 华南理工大学 基于迁移卷积神经网络的机械故障诊断方法、设备及介质
CN111353373A (zh) * 2019-11-29 2020-06-30 盐城工学院 一种相关对齐域适应故障诊断方法
CN111626345A (zh) * 2020-05-15 2020-09-04 北京航空航天大学 不同轴承设备之间的多阶段深度卷积迁移学习故障诊断方法
CN111898095A (zh) * 2020-07-10 2020-11-06 佛山科学技术学院 深度迁移学习智能故障诊断方法、装置、存储介质和设备
CN112163640A (zh) * 2020-10-30 2021-01-01 北京信息科技大学 基于深度卷积迁移学习行星齿轮箱故障诊断方法及系统
CN112964469A (zh) * 2021-02-28 2021-06-15 哈尔滨理工大学 一种迁移学习的变负载下滚动轴承在线故障诊断方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DENGYU XIAO 等: "Transfer learning with convolutional neural networks for small sample size problem in machinery fault diagnosis", 《JOURNAL OF MECHANICAL ENGINEERING SCIENCE》, vol. 233, no. 14, pages 1 - 13 *
YU WANG 等: "Wavelet-Prototypical Network Based on Fusion of Time and Frequency Domain for Fault Diagnosis", 《SENSORS》, pages 1 - 18 *
吴静然 等: "采用多尺度注意力机制的旋转机械故障诊断方法", 《西安交通大学学报》, vol. 54, no. 2, pages 51 - 58 *
唐竞鹏 等: "基于 深度迁移学习的 燃气轮机转子故障诊断方法", 《电子测量与仪器学报》, vol. 35, no. 11, pages 115 - 123 *
陈祝云: "基于深度迁移学习的机械设备智能诊断方法研究", 《中国博士论文全文数据库工程科技Ⅱ辑》, no. 2021, pages 029 - 45 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114298278A (zh) * 2021-12-28 2022-04-08 河北工业大学 一种基于预训练模型的电工装备性能预测方法
CN115270867A (zh) * 2022-07-22 2022-11-01 北京信息科技大学 一种燃气轮机转子系统改进dqn故障诊断方法及系统
CN116701956A (zh) * 2023-06-07 2023-09-05 江南大学 基于故障属性燃气调压器联合映射零样本故障诊断方法
CN116701956B (zh) * 2023-06-07 2023-12-08 唐山市燃气集团有限公司 基于故障属性燃气调压器联合映射零样本故障诊断方法
CN117330315A (zh) * 2023-12-01 2024-01-02 智能制造龙城实验室 一种基于在线迁移学习的旋转机械故障监测方法
CN117330315B (zh) * 2023-12-01 2024-02-23 智能制造龙城实验室 一种基于在线迁移学习的旋转机械故障监测方法

Also Published As

Publication number Publication date
CN113469230B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN113469230B (zh) 一种转子系统深度迁移故障诊断方法、系统及介质
Wu et al. An integrated ensemble learning model for imbalanced fault diagnostics and prognostics
CN106980822B (zh) 一种基于选择性集成学习的旋转机械故障诊断方法
Wang et al. Metric-based meta-learning model for few-shot fault diagnosis under multiple limited data conditions
Saufi et al. Gearbox fault diagnosis using a deep learning model with limited data sample
CN110132598B (zh) 旋转设备滚动轴承故障噪声诊断算法
Chen et al. A meta-learning method for electric machine bearing fault diagnosis under varying working conditions with limited data
Bai et al. Research on feature selection for rotating machinery based on Supervision Kernel Entropy Component Analysis with Whale Optimization Algorithm
Pu et al. Fault diagnosis for wind turbine gearboxes by using deep enhanced fusion network
CN112883994A (zh) 一种均衡分布适配的旋转机械变工况故障诊断方法
CN112113755B (zh) 一种基于深度卷积-峭度神经网络的机械故障智能诊断方法
Zhang et al. Nonlocal sparse model with adaptive structural clustering for feature extraction of aero-engine bearings
CN115187832A (zh) 一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法
CN112257530A (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN112729834B (zh) 一种轴承故障的诊断方法、装置和系统
de Moura et al. Classification of imbalance levels in a scaled wind turbine through detrended fluctuation analysis of vibration signals
CN112393934A (zh) 基于稀疏自编码与极限学习机的风电机组故障诊断方法
CN109359668A (zh) 一种航空发动机多故障并发诊断方法
CN110007660B (zh) 一种火电厂汽轮机组瞬态等效热应力在线软测量方法
Maurya et al. Intelligent hybrid scheme for health monitoring of degrading rotary machines: An adaptive fuzzy c-means coupled with 1-D CNN
Cabrera et al. Adversarial fault detector guided by one-class learning for a multistage centrifugal pump
CN116881841A (zh) 一种基于F1-score多级决策分析的混合模型故障诊断方法
Wu et al. Ensemble recurrent neural network-based residual useful life prognostics of aircraft engines
Joshuva et al. A comparative study for condition monitoring on wind turbine blade using vibration signals through statistical features: a lazy learning approach
Long et al. A customized meta-learning framework for diagnosing new faults from unseen working conditions with few labeled data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant