CN115935277A - 基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法 - Google Patents

基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法 Download PDF

Info

Publication number
CN115935277A
CN115935277A CN202211694853.0A CN202211694853A CN115935277A CN 115935277 A CN115935277 A CN 115935277A CN 202211694853 A CN202211694853 A CN 202211694853A CN 115935277 A CN115935277 A CN 115935277A
Authority
CN
China
Prior art keywords
fault
sample
samples
supercharged boiler
supercharged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211694853.0A
Other languages
English (en)
Inventor
史建新
李国龙
葛坤
王佳琪
苏健
曹元伟
张国磊
李彦军
杨龙滨
孙宝芝
韩洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202211694853.0A priority Critical patent/CN115935277A/zh
Publication of CN115935277A publication Critical patent/CN115935277A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • Y04S10/52Outage or fault management, e.g. fault detection or location

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明属于增压锅炉故障诊断领域,涉及一种基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法,旨在解决增压锅炉故障诊断存在的数据稀缺问题,要点包括获取故障样本;将所述故障样本划分为训练集以及验证集;从所述训练集中随机抽出故障样本,构造一批数量相同的正负样本对;将所述正负样本对分批次输入所述孪生深度网络进行训练;构造验证集以及验证支持集;遍历验证集中的故障样本;获取所述模型的故障诊断准确率等,效果是使得属于小样本、非线性分类的具有数据稀缺的增压锅炉故障诊断得以实现。

Description

基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法
技术领域
本发明属于增压锅炉故障诊断领域,涉及一种基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法。
背景技术
增压锅炉作为蒸汽动力系统的动力源,为整个系统提供高温高压蒸汽。其安全性直接影响到整个系统的正常运行。然而,由于增压锅炉的结构复杂,工作环境恶劣,因此故障发生频率高。如果不能及时发现并排除其故障,有可能造成整个蒸汽动力系统的瘫痪,甚至造成不可挽回的后果。
早期应用于增压锅炉系统的故障诊断技术主要是基于模型和专家知识进行诊断,这些方法依赖于锅炉系统的复杂结构和物理化学过程,而增压锅炉系统设备间耦合参数多、运行工况复杂多样,随着自动化技术的发展,增压锅炉的复杂程度不断提高,导致增压锅炉的故障诊断难度增大。为了能够有效的对增压锅炉系统进行故障诊断,不得不对增压锅炉复杂的结构和物理化学过程进行简化,这限制了模型描述实际锅炉运行和锅炉故障的能力,无法对一些复杂的故障进行有效的诊断。同时,当增压锅炉的结构和物理化学过程发生变化时,基于模型和专家知识的故障诊断方法必须重新构建模型,否则很难有效进行故障诊断。随着计算机科学和人工智能的发展,基于数据驱动的故障诊断技术降低了对人工的依赖,并提高了故障诊断的效率,使其迅速成为故障诊断领域的热点,并在许多方面得到了成功的应用。但是传统的基于数据驱动的故障诊断方法,需要大量的样本来训练模型,而现实中通常无法获得足够的增压锅炉故障样本,不足以训练出可用的故障诊断模型,这制约了基于数据驱动的增压锅炉故障诊断技术的发展。
近年来,基于小样本学习的深度神经网络在解决数据稀缺问题方面取得了巨大进展,并已成为机器学习的一个活跃领域。小样本学习算法所需样本数据少,能够在较为有限的数据样本中表现出较为优秀的分类效果,是解决小样本、非线性分类问题的利器。同时,基于小样本学习算法的故障诊断技术是以数据驱动的,无需了解系统故障机理,而增压锅炉故障数据样本往往较少且成非线性分布,这与小样本学习算法优势不谋而合。
发明内容
为了解决增压锅炉故障诊断存在的数据稀缺问题,在第一方面上,根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型训练方法,所述基于小样本学习的增压锅炉故障诊断模型包括孪生深度网络,所述训练方法S100包括
S101.获取故障样本;
S102.将所述故障样本划分为训练集以及验证集;
S103.从所述训练集中随机抽出故障样本,构造一批数量相同的正负样本对;
S104.将所述正负样本对分批次输入所述孪生深度网络进行训练;
S105.构造验证集以及验证支持集,所述验证集故障样本分配有故障类别标签,所述验证支持集中包括与验证集中相同的N个故障类别,每个故障类别包括K个所述故障样本;
S106.遍历验证集中的故障样本,分别与验证支持集中的故障样本配对,再将配对的故障样本对输入所述孪生深度网络,获取验证集中故障样本的故障类别;
S107.通过所述验证集中故障样本的故障类别,对比验证集故障样本的所述故障类别标签,获取所述模型的故障诊断准确率;
S108.重复步骤S103~S107,直至达到预定的迭代次数或所述模型的故障诊断准确率达到预设值;
S109.将最后一次迭代所获取的模型参数赋予所述模型。
根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型训练方法,所述步骤S11.获取故障样本,具体包括:
S01.对于一个故障类别的故障样本数据文件,设置所述数据文件的故障诊断变量两两之间相关系数阈值T;
S02.计算所有故障诊断变量两两之间的相关系数;
S03.随机挑选出相关系数大于阈值T的一对故障诊断变量A和故障诊断变量B;
S04.分别计算故障诊断变量A、故障诊断变量B与其它故障诊断变量相关系数的平均值α、平均值β;
S05.如果α>β,删除故障诊断变量A,保留故障诊断变量B;否则删除故障诊断变量B,保留故障诊断变量A;
S06.重复步骤S03~S05,直到所有故障诊断变量两两之间的相关系数低于给定阈值T,输出保留故障诊断变量到集合VSn,n对应故障类别,VSn对应某一故障类别的故障诊断变量;
S07.分别在全部N个故障类别的各故障类别的故障样本数据文件上实施步骤S101~S106,获取各故障类别的故障诊断变量,所得为N个故障诊断变量集合VS1,VS2,…,VSN
S08.将N个故障诊断变量集合VS1,VS2,…,VSN合并为一个故障诊断变量集合VSt,并记录每个故障诊断变量在VSt中出现的次数;
S09.根据故障诊断变量在集合VSt中出现的次数,由多到少对故障诊断变量进行排序,根据需求选择出现的次数排在前若干个的故障诊断变量,获取故障诊断通用变量;
S10.抽取出所述故障通用变量的时序数据构成指定维度的故障样本数据。
根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型训练方法,所述步骤S104中所述孪生神经网络输入是具有相同或不同故障类别的故障样本
Figure BDA0004022992230000031
正负样本对,其中i表示第i个批次索引,j表示来自第i个批次的第j个样本对,所述孪生神经网络输出是正负样本对的两个样本相同的概率
Figure BDA0004022992230000032
Figure BDA0004022992230000033
Figure BDA0004022992230000034
其中,sigmoid是激活函数,FC是一个密集的全连接层,f是一维神经网络,
Figure BDA0004022992230000035
是两支一维神经网络f输出向量之间的距离,孪生神经网络的两支一维神经网络f的结构相同并且权重共享。
根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型训练方法,根据本申请一些实施例的所述模型训练过程中采用正则化交叉熵计算损失函数:
Figure BDA0004022992230000036
其中
Figure BDA0004022992230000037
表示一个包括标签长度为M的向量,当故障样本
Figure BDA0004022992230000038
属于同类故障类别,tj=1,否则,为0,λ表示正则化因子,W表示网络权重,所述模型采用Adam算法对反向传播的梯度下降法进行优化。
在第二方面上,根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型的测试方法,所述模型由任一项所述方法训练所得,所述测试方法200包括
S201.构造测试集以及测试支持集,所述测试支持集包含N个已知增压锅炉故障类别和第N+1个未知增压锅炉故障类别,其中,所述测试支持集包含的N个已知增压锅炉故障类别的各所述类别包含K个增压锅炉故障样本,所述第N+1个未知增压锅炉故障类别的初始故障样本是所述N个已知增压锅炉故障类别的平均故障样本;
S202.将测试集中用于测试增压锅炉故障类别的一测试故障样本分别与测试支持集中的增压锅炉故障样本配对,再将配对的故障样本对输入训练的所述模型的孪生深度网络,获取测试集中一测试故障样本属于每类增压锅炉故障类别概率;
测试故障样本属于每类增压锅炉故障类别概率中最大概率值是C:
S2021.当最大概率值C不小于设定值时,所述一测试故障样本属于所述最大概率值C所对应的增压锅炉故障类别,返回步骤S202;
S2022.当最大概率值C小于设定值时,所述一测试故障样本属于未知增压锅炉故障类别,确定所述一测试故障样本的增压锅炉故障类别,指定未知增压锅炉故障类别是所确定的所述增压锅炉故障类别,指定未知增压锅炉故障类别的故障样本是所述一测试故障样本,将未知增压锅炉故障类别归入已知增压锅炉故障类别;
S203.新增一未知增压锅炉故障类别,设置新增的未知增压锅炉故障类别的初始故障样本是已知增压锅炉故障类别的平均故障样本,重复步骤S202~S203,直到测试集全部测试故障样本完成测试。
根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型的测试方法,所述测试方法200中,所述测试支持集包含的N个已知增压锅炉故障类别的各所述类别包含K个增压锅炉故障样本(S1,…,SK),
Figure BDA0004022992230000041
表示一测试故障样本,(x′n+1,yn+1)表示第N+1个未知增压锅炉故障类别的初始故障样本;
所述测试支持集表示为:
S={(x1,y1),....,(xn,yn),(xn+1,yn+1)}                      (4)
所述最大概率值C表示为:
Figure BDA0004022992230000042
其中,xck是支持集中的样本,c是支持集中已知的样本类别,k支持集中已知类别的样本数量。
根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型的测试方法,所述最大概率值C的设定值是0.6。
根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型的测试方法,获取的故障样本的数据是增压锅炉仿真故障样本的数据和/或其他系统仿真故障样本的数据。
根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断模型的测试方法,其他系统仿真故障样本的数据包括电厂热力系统仿真故障样本的数据。
在第三方面上,根据本申请一些实施例的基于小样本学习的增压锅炉故障诊断方法,实施于基于小样本学习的增压锅炉故障诊断模型,所述模型由任一项所述方法训练所得,所述诊断方法包括
S10.将输入的故障数据与模型中支持集中的增压锅炉故障样本配对;
S20.将配对的故障样本对输入所述模型的孪生深度网络,获取故障数据属于每类增压锅炉故障类别概率,其中故障数据属于每类增压锅炉故障类别概率中最大概率值是C:
S201.当最大概率值C不小于设定值时,所述故障数据属于所述最大概率值C所对应的增压锅炉故障类别;
S202.当最大概率值C小于设定值时,所述故障数据属于未知增压锅炉故障类别,设置未知增压锅炉故障类别,未知增压锅炉故障类别的初始故障样本是已知增压锅炉故障类别的平均故障样本;确定所述故障数据的增压锅炉故障类别,指定未知增压锅炉故障类别是所确定的所述增压锅炉故障类别,指定未知增压锅炉故障类别的故障样本是所述故障数据,将未知增压锅炉故障类别归入已知增压锅炉故障类别。
有益效果:
在第一方面,本发明将孪生深度网络应用于增压锅炉故障诊断,且应用后使得属于小样本、非线性分类的具有数据稀缺的增压锅炉故障诊断得以实现。
在第二方面,本发明通过对通用故障诊断变量进行筛选,能够很快找到满足模型训练的变量维度,并且可以保证所有故障样本的变量维度一致,方便模型在训练阶段使用其他热力系统的故障样本进行训练,拓宽训练数据的使用范围,克服增压锅炉故障诊断故障样本少的的缺陷,根据本发明实施例中所记载效果,所获模型能对增压锅炉进行有效故障诊断。
在第三方面,本发明通过对通用故障诊断变量进行筛选,能够获得不同故障类别的多个故障诊断变量集合,进而快速找到满足故障诊断模型需求的能够反应所有故障特征的通用变量集合,实现用最少的变量进行最有效的故障诊断,在保证故障诊断准确度的条件下降低模型冗余度,提升故障诊断模型的诊断效率。
在第四方面,本发明具有不断迭代更新完善的能力。在出现未知故障类别时,模型的支持集会新增故障类别,新增的未知增压锅炉故障类别的初始故障样本是支持集中已知增压锅炉故障类别的平均故障样本,在这种设置下,模型提示要求人工分析故障类型,并将通过人工分析认定的故障数据对应的故障类别赋给新增锅炉故障类别,由此,模型能够不断迭代更新学习新的故障类型,并将故障数据与其对应。
由上述,本发明的技术方案通过孪生深度网络,将小样本学习应用于增压锅炉故障诊断方面,解决了适用过程中拓展训练数据领域的问题,也解决了适用过程中诊断类型局限性的问题。经过适应性改进,一方面使得小样本学习能够通过对其他热力系统或者相似设备的故障数据训练学习,获取区分不同故障特征的先验知识,然后结合增压锅炉有限的监督信息,实现对增压锅炉故障的较为精确的诊断。另一方面使得基于小样本学习增压锅炉故障诊断能够在刚开始允许支持集不完善,但是越使用越贴近目标对象,越契合目标对象。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于小样本学习的增压锅炉故障诊断逻辑结构示意图;
图2为本发明实施例提供的一种基于小样本学习的增压锅炉故障诊断方法流程示意图;
图3(a)为本发明所述方法在30个训练样本下故障诊断精度随测试噪声水平的变化趋势示意图;
图3(b)为本发明所述方法在30个训练样本下故障诊断精度随测试噪声水平的变化趋势示意图;
图4为本发明所述方法的故障诊断精度随训练样本故障类别数的变化趋势示意图。
具体实施方式
下面通过参考附图详细描述本申请的实施例,所述实施例的示例在附图中示出,下面本申请实施例以图所示的逻辑结构为例,一种基于小样本学习的增压锅炉故障诊断方法,所述方法包括:
步骤1.获取模型训练和验证使用的故障样本数据,并对故障样本数据进行异常值剔除、缺失值填充、降噪和归一化处理。
其中,在该步骤中,获取所有故障样本数据时通过获取通用故障诊断变量并对通用故障诊断变量筛选获得,具体的,故障样本数据获取方法具体包括如下步骤:
(1)给定变量两两之间相关系数阈值T。
(2)计算所有变量之间的相关系数。
(3)随机挑选出相关系数大于阈值T的一对变量A和B。
(4)分别对A和B计算其与其它变量相关系数的平均值α,β。
(5)如果α>β,删除变量A,否则删除B。
(6)重复步骤(3)-(5)直到所有变量两两之间的相关系数低于给定阈值T,输出最终剩余的变量到集合VSn,n对应故障类别,VSn对应某一故障类别的故障诊断变量。
(7)在全部N个故障类别的故障样本数据文件上重复步骤(1)-(6),得到所有故障类别下N个故障诊断变量集合VS1,VS2,…,VSN
(8)将N个故障诊断变量集合VS1,VS2,…,VSN合并为1个故障诊断变量集合VSt,并记录每个变量在集合VSt中重复出现的次数。
(9)按照变量在集合VSt中出现的次数由多到少对故障诊断变量进行排序,根据需求选择前若干个出现次数较多的故障诊断变量,组成最终的故障通用变量。
(10)从大数据文件中抽取出故障通用变量的时序数据构成指定维度的故障样本数据。
根据所述方案,故障样本数据获取步骤通过对通用故障诊断变量筛选,一方面可以保证所有故障样本的变量维度保持一致,另一方面还可以快速找到满足故障诊断模型需求的能够反应所有故障特征的通用变量集合。
根据本发明的方案,本发明使用故障通用变量作为故障样本数据基础,能够很快找到满足模型训练的维度,方便模型在训练阶段可以使用其他热力系统的故障样本进行训练,能够拓宽训练数据的使用范围。如下述实施例2训练数据为某电厂热力系统仿真故障样本数据,这种方式能够把训练数据集的数据来源扩展到相似或相近系统的故障样本数据,能够克服增压锅炉故障诊断故障样本少的的缺陷,并且根据本发明实施例中所记载效果,所获模型仍能对增压锅炉进行有效故障诊断。
而本发明通过该方法步骤(7)~(10),能够获得不同故障类别的多个故障诊断变量集合,不同故障诊断变量集合存在一定的重复,或者说是不同故障诊断变量集合存在一定数量相同的变量,本发明欲将相同变量获取得到故障通用变量,然而,在比如取交集的情况下,发明人发现该方法实施所能获得的故障通用变量数量极少,无法胜任训练所需变量数量要求。为此,发明人按照重复变量出现的次数进行排列,根据模型测试结果,兼顾模型诊断准确度和诊断效率,取重复次数较多的变量作为故障通用变量,使用本发明的方法确定的故障通用变量满足了训练所需变量数量要求,并且根据图3和图4所示模型效果,模型仍然具有较高诊断精度。可以理解的,本发明通过上述步骤,可以通过对其他热力系统或者相似设备的故障数据训练学习,获得能够区分不同故障特征的先验知识,然后结合增压锅炉有限的监督信息,就能够实现对增压锅炉故障的较为精确的诊断。
步骤2.将所有故障样本数据划分为训练集、验证集。
步骤3.从训练集中随机抽出故障样本,构造一批数量相同的正负样本对。
步骤4.将训练正负样本对分批次输入为增压锅炉设计好的孪生网络进行训练。
步骤5.构造验证集的验证支持集,支持集中包含与验证集中相同的N个故障类别,每个类别包含K个故障样本,每个故障样本与验证集中的故障样本均不同,在该步骤中,N=2,3,4…,K=1,2,3…,对于每个特定的故障类别,K可以在允许范围内取不同值。
在步骤5中,用于验证的故障样本变量组成与用于训练的样本变量维度相同,变量组成可以不同,但是必须与其对应的验证支持集样本变量组成相同,通过上述的通用故障诊断变量的筛选,可以快速找到满足变量维度和组成要求的验证集和验证样本的通用变量集合。
步骤6.遍历验证集中的故障样本,分别与验证支持集中的样本配对,再将样本对输入孪生网络判断验证集中样本的故障类别。
步骤7.通过对比验证集故障样本原有的故障类别标签,得到基于小样本学习的增压锅炉故障诊断模型的准确率。
步骤8.返回步骤3,重复步骤3-7,直至达到预定的迭代次数或准确率达到预设值。
步骤9.保存模型诊断准确率最高的增压锅炉故障诊断模型参数。
步骤10.构造增压锅炉测试故障样本的测试支持集,其中包含N个已知的测试样本有可能归属的故障类别和第N+1个未知故障类别,每个故障类别包含K个故障样本,每个故障样本与测试集中的故障样本均不同,在该步骤中,N=2,3,4…,K=1,2,3…,对于每一个特定的故障类别,K可以在允许范围内取不同值。
在步骤10中,用于测试的样本变量组成与用于训练的样本变量维度相同,变量组成可以不同,但是必须与其对应的测试支持集样本变量组成相同,通过上述通用故障诊断变量筛选方法可以快速找到满足变量维度和组成要求的测试集和测试样本的通用变量集合。
在步骤10构造测试样本的测试支持集过程中,本发明增加的第N+1个未知故障类别,可以使模型发现新的未知故障类别,对新的故障类别进行分析的结果可以用于改进测试支持集,从而拓展基于小样本学习的增压锅炉故障诊断方法的故障诊断范围和诊断精度。
步骤11.将用于测试的增压锅炉故障样本分别与测试支持集中的样本配对,并将样本对输入训练好的故障诊断模型中,得到测试样本属于每类故障的概率,找出其中最大概率值C,当C≥0.6时,选择对应的故障类别,当C<0.6时,直接归为第N+1个故障类别,这里可根据实际需要将0.6在[0.5~0.95]范围内进行调整。对于C<0.6的情况,需要人为介入分析,分析出故障原因和类别后,用该故障类别的样本替换原来第N+1个故障类别的平均样本,并划归为已知故障类别,然后取1~(N+1)个故障类别的样本平均样本作为第N+2个未知类别的初始样本,如此往复经过多次诊断对支持集进行完善,直到N值稳定不变,这个过程拓展了本发明的故障诊断范围,提高了本发明的诊断能力。
根据所述方案,发明人发现在实际增压锅炉的故障中,现有方法通常是只能对支持集已存在故障类型的故障样本才能识别。然而,增压锅炉未发生过的故障难以得到故障样本,因此,在实际模型测试或使用中,难以更全面提供准确增压锅炉故障诊断,诊断类型在小样本学习方向上具有局限性。
为此,本发明使用步骤10和步骤11,使得模型具有不断迭代学习的能力。在出现没有故障样本的故障数据时,模型支持集会新增故障类别,新增的未知增压锅炉故障类别的初始故障样本是已知增压锅炉故障类别的平均故障样本,在这种设置下,模型提示要求人工分析故障类型,并将通过人工分析认定的故障数据对应的故障类别赋给新增锅炉故障类别,由此,模型能够不断迭代更新学习新的故障类型,并将故障数据与其对应。
因此,由上述,本发明的技术方案通过孪生深度网络,将小样本学习适用在增压锅炉故障诊断方面,解决了适用过程中拓展训练数据领域的问题,也解决了适用过程中诊断类型局限性的问题。经过适应性改进,一方面使得小样本学习能够适用通过对其他热力系统或者相似设备的故障数据训练学习,获取区分不同故障特征的先验知识,然后结合增压锅炉有限的监督信息,实现对增压锅炉故障的较为精确的诊断。另一方面使得基于小样本学习的增压锅炉故障诊断能够在刚开始允许支持集不完善,但是越使用越贴近目标对象,越契合目标对象。
综上,本发明可以准确的对增压锅炉常见的故障进行有效的诊断,从而满足工程的现实需要。
实施例1:作为一种具体示例,训练数据为增压锅炉仿真故障样本数据,所有故障样本变量相同,所述方法包括:
步骤1.获取增压锅炉故障样本仿真数据,并对故障样本数据进行异常值剔除、缺失值填充、降噪和归一化处理。在该步骤中,按照通用故障诊断变量筛选方法,获取增压锅炉故障诊断通用变量集合,最终选择的变量有:饱和蒸汽流量、汽包液位、辅汽轮机蒸汽流量、过热器出口蒸汽压力、炉膛出口烟气流量、经济器进口水压、经济器进口水温、辅汽轮机出汽温度、经济器出口水温、给水流量、辅汽轮机做功、经济器出口水压、炉膛出口烟温、烟气涡轮出口温度、过热蒸汽流量、汽包饱和温度、过热器进口烟温、过热器出口烟温、辅汽轮机进气温度和经济器出口烟温20个参数。
步骤2.将70%的增压锅炉故障样本仿真数据按照6:4的比例划分为训练集、验证集。
步骤3.从训练集中随机抽出故障样本,构造一批数量相同的正负样本对。
步骤4.将训练正负样本对分批次输入为增压锅炉设计好的孪生网络进行训练,在模型训练阶段,孪生网络输入是具有相同或不同类别的
Figure BDA0004022992230000101
样本对,其中i是第i个小批次索引,输出是两个样本相同的概率
Figure BDA0004022992230000102
具体计算过程为:
Figure BDA0004022992230000103
其中,f是1D-CNN神经网络,孪生网络的两支f结构相同并且权重共享,
Figure BDA0004022992230000104
是两支f输出向量之间的距离。
Figure BDA0004022992230000105
其中FC是一个密集的全连接层,sigmoid是激活函数。
训练过程中采用正则化交叉熵计算损失函数,计算公式为:
Figure BDA0004022992230000106
其中
Figure BDA0004022992230000107
是一个包括标签长度为M的向量,当
Figure BDA0004022992230000108
是来自同类的故障样本时,tj=1,否则,为0,其中j是来自第i个小批次的第j个样本对。λ表示正则化因子,W表示网络权重,最后该模型采用Adam算法对反向传播的梯度下降法进行优化。
步骤5.构造验证集的验证支持集Sveri,支持集中包含与验证集中相同的N个故障类别,每个类别包含K个故障样本,支持集中故障样本与验证集中故障样本均不同,在该步骤中,N=2,3,4…,K=1,2,3…。
步骤6.遍历验证集中的故障样本,分别与支持集中的样本配对,再将样本对输入孪生网络判断验证集中样本的故障类别。
步骤7.通过对比验证集故障样本原有的故障标签,得到基于小样本学习的增压锅炉故障诊断模型的准确率。
步骤8.返回步骤3,重复步骤3-7,直至达到预定的迭代次数或准确率达到预设值。
步骤9.保存诊断效果最佳的增压锅炉故障诊断模型参数。
步骤10.从剩余的30%增压锅炉故障样本仿真数据中随机抽出若干样本构造测试样本的测试支持集,其中包含N个已知的测试样本有可能归属的故障类别和第N+1个未知故障类别,每个故障类别包含K个故障样本,每个故障样本与测试集中的故障样本均不同,在该步骤中,N=2,3,4…,K=1,2,3…,对于每个特定故障类别,K可在允许范围内取不同值。
步骤11.从剩余的30%增压锅炉故障样本仿真数据中随机抽出一部分样本作为测试样本,然后将测试样本分别与测试支持集中的样本配对,并将样本对输入训练好的故障诊断模型中,判断增压锅炉未知故障样本所属的故障类别,实现增压锅炉故障诊断。在该步骤中,模型测试过程可分为(N+1)-way 1-shot和(N+1)-way K-shot测试,(N+1)-way K-shot是基于(N+1)-way 1-shot的K次重复。
在(N+1)-way 1-shot测试任务中,给1个测试样本
Figure BDA0004022992230000115
进行分类,并给1个测试支持集S,其中包含N个已知可能类别的样本和第N+1个未知类别的样本,未知类别的初始样本由类别1~N个故障类别的样本取平均获得,用(x′n+1,yn+1)表示。
S={(x1,y1),....,(xn,yn),(xn+1,yn+1)}                      (4)
然后根据测试支持集中最相似的样本对测试样本进行分类,得到测试样本所属类别最大概率
Figure BDA0004022992230000111
Figure BDA0004022992230000112
Figure BDA0004022992230000113
时,选择对应的故障类别,当
Figure BDA0004022992230000114
时,直接归为第N+1个故障类别,并人为介入分析,分析出故障原因和类别后,将其划归为已知故障类别,并替换原来的平均样本,然后取1~(N+1)个故障类别的样本平均样本作为第N+2个未知类别的初始样本,如此往复下去不断丰富支持集,强化模型的故障诊断范围和诊断能力,经过多次诊断并对支持集进行完善,最后N值稳定在10不变,这与模拟的增压锅炉故障类别数相吻合。
在(N+1)-way K-shot测试中,模型被赋予一个由N个已知可能类别和第N+1个未知类别组成的支持集,每个类有K个样本(S1,…,SK)。然后模型确定出测试样本所属类别最大概率和
Figure BDA0004022992230000121
Figure BDA0004022992230000122
Figure BDA0004022992230000123
时,选择对应的故障类别,当
Figure BDA0004022992230000124
时,直接归为第N+1个故障类别,其余过程同上述(N+1)-way 1-shot测试任务。
通过实施例1,本发明对比了训练样本量为30和60两种条件下,不同噪声水平测试环境对1D-CNN算法、小样本学习算法One-shot和Five-shot故障诊断精度的影响,如图3所示。图中信噪比越小表明噪声越大,从图3整体上看,小样本学习方法受噪声环境影响较小,故障诊断精确度在一定的噪声范围内波动较小,并且均高于传统1D-CNN方法。当训练样本量为30时,在噪声水平为-4dB、2dB、8dB和没有噪声时,相比于基准1D-CNN算法,小样本学习方法的精确度分别提高了10.05%、6.53%、5.26%和4.14%;表明小样本学习方法的精确度在样本量较小和噪声较大的测试环境中非常显著。对于现实中有限数据的增压锅炉故障诊断问题,小样本学习方法更能满足实际的应用需求。
实施例2:作为一种具体示例,训练数据为某电厂热力系统仿真故障样本数据,所有故障样本变量相同,所述方法包括:
步骤1.获取某电厂热力系统仿真故障样本数据用于基于小样本学习的增压锅炉故障诊断模型的训练和验证,对故障样本数据进行异常值剔除、缺失值填充、降噪和归一化处理。在该步骤中,通过该通用故障诊断变量筛选方法,获取某电厂热力系统仿真故障样本通用变量集合,取前20个变量,并从原始数据中分离出这20个变量的数据作为增压锅炉故障诊断模型训练和验证的样本。
步骤2.将某电厂热力系统仿真故障样本数据按照6:4的比例划分为训练集、验证集。
步骤3.从训练集中随机抽出故障样本,构造一批数量相同的正负样本对。
步骤4.将训练正负样本对分批次输入为增压锅炉设计好的孪生网络进行训练,在模型训练阶段,孪生网络输入是具有相同或不同类别的
Figure BDA0004022992230000125
样本对,输出是两个样本相同的概率
Figure BDA0004022992230000126
训练过程中采用正则化交叉熵计算损失函数,并采用Adam算法对反向传播的梯度下降法进行优化。
步骤5.构造验证集的验证支持集Sveri,支持集中包含与验证集中相同的N个故障类别,每个类别包含K个故障样本,支持集中故障样本与验证集中的故障样本均不同,在该步骤中,N=2,3,4…,K=1,2,3…。
步骤6.遍历验证集中的故障样本,分别与支持集中的样本配对,再将样本对输入孪生网络判断验证集中样本的故障类别。
步骤7.通过对比验证集故障样本原有的故障标签,得到基于小样本学习的增压锅炉故障诊断模型的准确率。
步骤8.返回步骤3,重复步骤3-7,直至达到预定的迭代次数或准确率达到预设值。
步骤9.保存诊断效果最佳的增压锅炉故障诊断模型参数。
步骤10.获取增压锅炉故障仿真数据,按照通用故障诊断变量筛选方法,获取增压锅炉故障诊断通用变量集合,最终选择的变量有:饱和蒸汽流量、汽包液位、辅汽轮机蒸汽流量、过热器出口蒸汽压力、炉膛出口烟气流量、经济器进口水压、经济器进口水温、辅汽轮机出汽温度、经济器出口水温、给水流量、辅汽轮机做功、经济器出口水压、炉膛出口烟温、烟气涡轮出口温度、过热蒸汽流量、汽包饱和温度、过热器进口烟温、过热器出口烟温、辅汽轮机进气温度和经济器出口烟温20个参数。然后从中抽出若干样本构造测试样本的测试支持集,其中包含N个已知的测试样本有可能归属的故障类别和第N+1个未知故障类别,每个故障类别包含K个故障样本,每个故障样本与测试集中的故障样本均不同,在该步骤中,N=2,3,4…,K=1,2,3…,对于每一个特定的故障类别,K可以在允许范围内取不同值。
步骤11.从获取的增压锅炉故障仿真数据中随机抽出一部分样本作为测试样本,并将测试样本分别与测试支持集中的样本配对,然后将样本对输入训练好的孪生网络中,判断增压锅炉未知故障样本所属的故障类别,实现增压锅炉故障诊断。该步骤后续模型测试过程同实施例1。
通过以上步骤,本发明分别从某电厂热力系统中选择5、7、9、11、13、15种不同类别的故障,每个故障类别选取5个故障样本训练模型,从增压锅炉故障数据中随机抽取1个或者5个样本构建One-shot支持集或Five-shot支持集,对增压锅炉进行故障诊断,这样的实验我们重复做20次。最终得到的结果如图4所示。从图中可以看出,本发明提供一种基于小样本学习的增压锅炉故障诊断方法在一定范围内诊断准确度随训练样本类别增多而提高,当使用15个类别的全部75个故障样本进行训练时,小样本学习的诊断精度超过了80%,表明了本发明可以通过对其他热力系统或者相似设备的故障数据训练学习,获取区分不同故障特征的先验知识,然后结合增压锅炉有限的监督信息,就能够实现对增压锅炉故障的较为精确的诊断。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种基于小样本学习的增压锅炉故障诊断模型训练方法,其特征在于,所述基于小样本学习的增压锅炉故障诊断模型包括孪生深度网络,所述训练方法S100包括
S101.获取故障样本;
S102.将所述故障样本划分为训练集以及验证集;
S103.从所述训练集中随机抽出故障样本,构造一批数量相同的正负样本对;
S104.将所述正负样本对分批次输入所述孪生深度网络进行训练;
S105.构造验证集以及验证支持集,所述验证集故障样本分配有故障类别标签,所述验证支持集中包括与验证集中相同的N个故障类别,每个故障类别包括K个所述故障样本;
S106.遍历验证集中的故障样本,分别与验证支持集中的故障样本配对,再将配对的故障样本对输入所述孪生深度网络,获取验证集中故障样本的故障类别;
S107.通过所述验证集中故障样本的故障类别,对比验证集故障样本的所述故障类别标签,获取所述模型的故障诊断准确率;
S108.重复步骤S103~S107,直至达到预定的迭代次数或所述模型的故障诊断准确率达到预设值;
S109.将最后一次迭代所获取的模型参数赋予所述模型。
2.根据权利要求1所述的基于小样本学习的增压锅炉故障诊断模型训练方法,其特征在于,所述步骤S11.获取故障样本,具体包括:
S01.对于一个故障类别的故障样本数据文件,设置所述数据文件的故障诊断变量两两之间相关系数阈值T;
S02.计算所有故障诊断变量两两之间的相关系数;
S03.随机挑选出相关系数大于阈值T的一对故障诊断变量A和故障诊断变量B;
S04.分别计算故障诊断变量A、故障诊断变量B与其它故障诊断变量相关系数的平均值α、平均值β;
S05.如果α>β,删除故障诊断变量A,保留故障诊断变量B;否则删除故障诊断变量B,保留故障诊断变量A;
S06.重复步骤S03~S05,直到所有故障诊断变量两两之间的相关系数低于给定阈值T,输出保留故障诊断变量到集合VSn,n对应故障类别,VSn对应某一故障类别的故障诊断变量;
S07.分别在全部N个故障类别的各故障类别的故障样本数据文件上实施步骤S101~S106,获取各故障类别的故障诊断变量,所得为N个故障诊断变量集合VS1,VS2,…,VSN
S08.将N个故障诊断变量集合VS1,VS2,…,VSN合并为一个故障诊断变量集合VSt,并记录每个故障诊断变量在VSt中出现的次数;
S09.根据故障诊断变量在集合VSt中出现的次数,由多到少对故障诊断变量进行排序,根据需求选择出现的次数排在前若干个的故障诊断变量,获取故障诊断通用变量;
S10.抽取出所述故障通用变量的时序数据构成指定维度的故障样本数据。
3.根据权利要求1或2所述的基于小样本学习的增压锅炉故障诊断模型训练方法,其特征在于,所述步骤S104中所述孪生神经网络输入是具有相同或不同故障类别的故障样本
Figure FDA0004022992220000021
正负样本对,其中i表示第i个批次索引,j表示来自第i个批次的第j个样本对,所述孪生神经网络输出是正负样本对的两个样本相同的概率
Figure FDA0004022992220000022
Figure FDA0004022992220000023
Figure FDA0004022992220000024
其中,sigmoid是激活函数,FC是一个密集的全连接层,f是一维神经网络,
Figure FDA0004022992220000025
是两支一维神经网络f输出向量之间的距离,孪生神经网络的两支一维神经网络f的结构相同并且权重共享。
4.根据权利要求3所述的基于小样本学习的增压锅炉故障诊断模型训练方法,其特征在于,所述模型训练过程中采用正则化交叉熵计算损失函数:
Figure FDA0004022992220000026
其中
Figure FDA0004022992220000027
表示一个包括标签长度为M的向量,当故障样本
Figure FDA0004022992220000028
属于同类故障类别,tj=1,否则,为0,λ表示正则化因子,W表示网络权重,所述模型采用Adam算法对反向传播的梯度下降法进行优化。
5.一种基于小样本学习的增压锅炉故障诊断模型的测试方法,其特征在于,所述模型由权利要求1-4任一项所述方法训练所得,所述测试方法200包括
S201.构造测试集以及测试支持集,所述测试支持集包含N个已知增压锅炉故障类别和第N+1个未知增压锅炉故障类别,其中,所述测试支持集包含的N个已知增压锅炉故障类别的各所述类别包含K个增压锅炉故障样本,所述第N+1个未知增压锅炉故障类别的初始故障样本是所述N个已知增压锅炉故障类别的平均故障样本;
S202.将测试集中用于测试增压锅炉故障类别的一测试故障样本分别与测试支持集中的增压锅炉故障样本配对,再将配对的故障样本对输入训练的所述模型的孪生深度网络,获取测试集中一测试故障样本属于每类增压锅炉故障类别概率;
测试故障样本属于每类增压锅炉故障类别概率中最大概率值是C:
S2021.当最大概率值C不小于设定值时,所述一测试故障样本属于所述最大概率值C所对应的增压锅炉故障类别,返回步骤S202;
S2022.当最大概率值C小于设定值时,所述一测试故障样本属于未知增压锅炉故障类别,确定所述一测试故障样本的增压锅炉故障类别,指定未知增压锅炉故障类别是所确定的所述增压锅炉故障类别,指定未知增压锅炉故障类别的故障样本是所述一测试故障样本,将未知增压锅炉故障类别归入已知增压锅炉故障类别;
S203.新增一未知增压锅炉故障类别,设置新增的未知增压锅炉故障类别的初始故障样本是已知增压锅炉故障类别的平均故障样本,重复步骤S202~S203,直到测试集全部测试故障样本完成测试。
6.根据权利要求5所述的基于小样本学习的增压锅炉故障诊断模型的测试方法,其特征在于,所述测试方法200中,所述测试支持集包含的N个已知增压锅炉故障类别的各所述类别包含K个增压锅炉故障样本(S1,…,SK),
Figure FDA0004022992220000031
表示一测试故障样本,(x′n+1,yn+1)表示第N+1个未知增压锅炉故障类别的初始故障样本;
所述测试支持集表示为:
S={(x1,y1),....,(xn,yn),(xn+1,yn+1)}                        (4)
所述最大概率值C表示为:
Figure FDA0004022992220000032
其中,xck是支持集中的样本,c是支持集中已知的样本类别,k支持集中已知类别的样本数量。
7.根据权利要求5所述的基于小样本学习的增压锅炉故障诊断模型的测试方法,其特征在于,所述最大概率值C的设定值是0.6。
8.根据权利要求5所述的基于小样本学习的增压锅炉故障诊断模型的测试方法,其特征在于,获取的故障样本的数据是增压锅炉仿真故障样本的数据和/或其他系统仿真故障样本的数据。
9.根据权利要求8所述的基于小样本学习的增压锅炉故障诊断模型的测试方法,其特征在于,其他系统仿真故障样本的数据包括电厂热力系统仿真故障样本的数据。
10.一种基于小样本学习的增压锅炉故障诊断方法,其特征在于,实施基于小样本学习的增压锅炉故障诊断模型,所述模型由权利要求1-4任一项所述方法训练所得,所述诊断方法包括
S10.将输入的故障数据与模型中支持集中的增压锅炉故障样本配对;
S20.将配对的故障样本对输入所述模型的孪生深度网络,获取故障数据属于每类增压锅炉故障类别概率,其中故障数据属于每类增压锅炉故障类别概率中最大概率值是C:
S201.当最大概率值C不小于设定值时,所述故障数据属于所述最大概率值C所对应的增压锅炉故障类别;
S202.当最大概率值C小于设定值时,所述故障数据属于未知增压锅炉故障类别,设置未知增压锅炉故障类别,未知增压锅炉故障类别的初始故障样本是已知增压锅炉故障类别的平均故障样本;确定所述故障数据的增压锅炉故障类别,指定未知增压锅炉故障类别是所确定的所述增压锅炉故障类别,指定未知增压锅炉故障类别的故障样本是所述故障数据,将未知增压锅炉故障类别归入已知增压锅炉故障类别。
CN202211694853.0A 2022-12-28 2022-12-28 基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法 Pending CN115935277A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211694853.0A CN115935277A (zh) 2022-12-28 2022-12-28 基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211694853.0A CN115935277A (zh) 2022-12-28 2022-12-28 基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法

Publications (1)

Publication Number Publication Date
CN115935277A true CN115935277A (zh) 2023-04-07

Family

ID=86697738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211694853.0A Pending CN115935277A (zh) 2022-12-28 2022-12-28 基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法

Country Status (1)

Country Link
CN (1) CN115935277A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117057772A (zh) * 2023-06-30 2023-11-14 东风设备制造有限公司 一种设备故障检测维修实时跟踪展示方法及系统
CN117972535A (zh) * 2024-03-29 2024-05-03 华电电力科学研究院有限公司 风电机组关键部件故障预警方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117057772A (zh) * 2023-06-30 2023-11-14 东风设备制造有限公司 一种设备故障检测维修实时跟踪展示方法及系统
CN117972535A (zh) * 2024-03-29 2024-05-03 华电电力科学研究院有限公司 风电机组关键部件故障预警方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109931678B (zh) 基于深度学习lstm的空调故障诊断方法
CN115935277A (zh) 基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法
CN112288191B (zh) 一种基于多类机器学习方法的海洋浮标寿命预测方法
US7251582B2 (en) Fault diagnosis
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN110609524B (zh) 一种工业设备剩余寿命预测模型及其构建方法和应用
CN106886660A (zh) EEMD‑Hilbert包络谱与DBN相结合的变负载下滚动轴承状态识别方法
CN111814342B (zh) 一种复杂设备可靠性混合模型及其构建方法
CN115618732B (zh) 核反应堆数字孪生关键参数自主优化数据反演方法
CN113111820A (zh) 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置
Hu et al. Optimization configuration of gas path sensors using a hybrid method based on tabu search artificial bee colony and improved genetic algorithm in turbofan engine
CN113255546A (zh) 一种用于飞机系统传感器故障的诊断方法
CN111079348B (zh) 一种缓变信号检测方法和装置
CN116384224A (zh) 一种基于条件化参数动态卷积神经网络的航空发动机寿命预测方法
CN114692507A (zh) 基于堆叠泊松自编码器网络的计数数据软测量建模方法
Roy et al. Deep predictive coverage collection
Duer Expert knowledge base to support maintenance of a radar system
CN111241629B (zh) 基于数据驱动的飞机液压泵性能变化趋势智能预测方法
CN111400964B (zh) 一种故障发生时间预测方法及装置
Simpson et al. Fault isolation in an integrated diagnostic environment
CN114565051B (zh) 基于神经元影响程度的产品分类模型的测试方法
CN115712874A (zh) 基于时间序列特征的热能动力系统故障诊断方法及装置
CN113469977B (zh) 一种基于蒸馏学习机制的瑕疵检测装置、方法、存储介质
CN115564021A (zh) 一种聚酯纤维聚合过程的故障根因排序方法
CN114647231A (zh) 一种数据驱动的工业过程故障检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination