CN116502138A - 一种基于迁移学习的核动力装置并发故障诊断方法及系统 - Google Patents
一种基于迁移学习的核动力装置并发故障诊断方法及系统 Download PDFInfo
- Publication number
- CN116502138A CN116502138A CN202310477078.1A CN202310477078A CN116502138A CN 116502138 A CN116502138 A CN 116502138A CN 202310477078 A CN202310477078 A CN 202310477078A CN 116502138 A CN116502138 A CN 116502138A
- Authority
- CN
- China
- Prior art keywords
- concurrent
- fault
- nuclear power
- power plant
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 173
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000013526 transfer learning Methods 0.000 title claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 137
- 238000012360 testing method Methods 0.000 claims abstract description 94
- 230000008569 process Effects 0.000 claims abstract description 21
- 230000004044 response Effects 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 25
- 238000007781 pre-processing Methods 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 7
- 239000002826 coolant Substances 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- 238000004590 computer program Methods 0.000 description 15
- 238000003860 storage Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 210000005036 nerve Anatomy 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000941 radioactive substance Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种基于迁移学习的核动力装置并发故障诊断方法及系统,构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;利用单发故障训练集对并发故障诊断模型进行预训练,再将单发故障测试集输入训练好的并发故障诊断模型中测试预训练模型的准确率;将并发故障诊断模型中全连接层与分类输出层重置为空白层,利用并发故障训练集对调整后的网络模型进行再训练;将并发故障测试集输入训练好的并发故障诊断模型中,实现核动力装置传感器和执行器并发故障的诊断。本发明能够实现核动力装置稳态和瞬态运行过程中传感器和执行器不同类型、不同程度并发故障的准确在线诊断,为故障缓解和容错控制提供参考。
Description
技术领域
本发明属于核动力装置智能故障诊断技术领域,具体涉及一种基于迁移学习和双向长短期记忆(Bidirectional Long-Short Term Memory,BiLSTM)网络的核动力装置并发故障诊断方法及系统。
背景技术
随着世界核工业的快速发展,核动力装置在民用或军用领域发挥着越来越重要的作用。核动力装置结构复杂而庞大,运行环境复杂多变。为确保核动力装置能够安全稳定运行,往往会部署众多传感器和执行器,用以监测和控制核动力装置。由于核动力装置的传感器和执行器多工作在高温、高压等非常恶劣的环境中,其出现故障的可能性较大。传感器、执行器发生故障可能导致核动力装置的非计划停堆,严重时甚至会导致放射性物质泄漏,严重威胁核动力系统的安全运行。两个及以上同时发生的故障称为并发故障,并发故障特征更加复杂,后果更加严重,诊断更加困难。核动力装置中传感器和执行器众多,并发故障发生的可能性大。因此,核动力装置中的故障尤其是并发故障的识别与诊断对系统的安全稳定运行至关重要。
当前,随着工业大数据时代的到来和传感器技术的发展,传统的故障诊断方法已经无法满足海量数据的诊断需求。基于传统人工经验的故障诊断对于异常工况的诊断能力十分有限,为保证故障工况下机械设备的安全性,可以加强对工作人员的培训,提高他们对突发故障的处理能力。但是这种故障诊断方法需要非常合理的人员配置以及大量的人力消耗,并且不能保证很高的诊断准确率。由此可见,大量的故障数据以及有限的人员配置使得传统的人工故障诊断方法的弊端逐渐显露。而深度学习算法由于其强大的特征提取、非线性映射等能力,在故障诊断领域的应用愈发广泛,包括循环神经网络、卷积神经网络等。相比于传统的基于专家经验故障诊断方法,这些深度学习算法对于大量故障数据的诊断准确率有着极大的提升。
基于深度学习的故障诊断方法通过对信号的特征进行提取以及对不同故障特征的学习,可以拟合出最优的网络权值对信号的特征进行合理的分类,从而实现复杂系统端到端的高效准确故障诊断。并发故障往往存在高质量有标签故障数据较少的问题,而深度学习中迁移学习的方法能够较好地解决小数据量训练的难题,因此深度迁移学习是实现并发故障诊断的重要方法之一。这种智能诊断方法能够解决核动力系统并发故障高质量有标签数据较少的问题,提高了核动力系统的安全性,面对大量的数据或多种并发故障也可以做到快速有效地处理,故障模式识别的准确率也得到了极大的提高。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于迁移学习的核动力装置并发故障诊断方法及系统,用于解决传统诊断方法诊断效率低、诊断效果差和并发故障高质量有标签故障数据较少的技术问题。
本发明采用以下技术方案:
一种基于迁移学习的核动力装置并发故障诊断方法,包括以下步骤:
S1、将核动力装置的响应数据划分为单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集;
S2、对步骤S1得到的单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集进行预处理;
S3、构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;
S4、利用步骤S2得到的单发故障训练集对步骤S3构建的核动力装置并发故障诊断模型进行预训练,再将步骤S2得到的单发故障测试集输入预训练后的核动力装置并发故障诊断模型中,测试核动力装置并发故障诊断模型对核动力装置单发故障的诊断准确率;
S5、对步骤S4预训练后的核动力装置并发故障诊断模型进行调整,将核动力装置并发故障诊断模型的全连接层和输出层重置为空白层;
S6、利用步骤S2得到的并发故障训练集对步骤S5调整后的核动力装置并发故障诊断模型进行再训练,并将步骤S2得到的并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
具体的,步骤S1中,单发故障和并发故障数据集所占比例为8:2,单发故障数据集中训练集和测试集所占比例为8:2,并发故障数据集中训练集和测试集所占比例为8:2。
进一步的,响应数据包括核动力装置在不同位置、类型、程度的传感器和执行器单、并发故障工况及正常工况下的核功率、一回路冷却剂温度以及主蒸汽压力数据。
具体的,步骤S3中,核动力装置并发故障诊断模型包括:
输入层,用于接收经标准化处理后的多维时间序列训练样本;
多层BiLSTM网络,用于提取多维时间序列数据中的特征;
全连接层,用于把多层BiLSTM网络得到的时空特征作为输入值,输出值为能够表示故障种类特征的单维时间序列向量;
Softmax层,用于使用Softmax函数将任意大小一维向量的所有值进行压缩,处理后向量大小不变,所有元素的值为[0,1],并且所有的元素之和为1;
输出层,用于输出结果。
进一步的,多层BiLSTM网络的梯度阈值为2,包含3个BiLSTM层、3个归一化层、3个非线性激活函数和3个丢失层;连接顺序为:BiLSTM层、归一化层、激活函数、丢失层、BiLSTM层、归一化层、激活函数、丢失层、BiLSTM层、归一化层、激活函数和丢失层。
更进一步的,每个BiLSTM层包含200个隐含单元。
具体的,步骤S4中,预训练过程的学习算法采用sgdm,最大周期为2000,最小批数目为126,学习率为0.01,三层丢失层的丢弃率为50%。
具体的,步骤S5中,设置空白全连接层的参数学习率因子为2。
具体的,步骤S6中,再训练过程中的学习算法采用sgdm,最大迭代周期为300,最小批数目为102,学习率为0.001,三层丢失层的丢弃率为5%。
第二方面,本发明实施例提供了一种基于迁移学习的核动力装置并发故障诊断系统,其特征在于,包括:
数据模块,将核动力装置的响应数据划分为单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集;
预处理模块,对数据模块得到的单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集进行预处理;
构建模块,构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;
预训练模块,利用预处理模块得到的单发故障训练集对构建模块构建的核动力装置并发故障诊断模型进行预训练,再将预处理模块得到的单发故障测试集输入预训练后的核动力装置并发故障诊断模型中,测试核动力装置并发故障诊断模型对核动力装置单发故障的诊断准确率;
调整模块,对预训练模块预训练后的核动力装置并发故障诊断模型进行调整,将核动力装置并发故障诊断模型的全连接层和输出层重置为空白层;
诊断模块,利用预处理模块得到的并发故障训练集对调整模块调整后的核动力装置并发故障诊断模型进行再训练,并将预处理模块得到的并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
与现有技术相比,本发明至少具有以下有益效果:
一种基于迁移学习的核动力装置并发故障诊断方法,通过数据标准化的方式对获取的样本数据进行预处理,标准化之后消除数据单位和数量级的影响,只保留其特征,有利于提高交叉熵损失函数在梯度下降求最优解值时的速度,并且可以提高模型在训练时的精准度,构建多层BiLSTM网络的核动力装置并发故障诊断模型;首次提出了将基于迁移学习的深度学习方法应用于核动力装置并发故障诊断,能够准确地识别出具体的故障类型和故障程度,具有较强的泛化能力。
进一步的,采集稳态工况、各类典型瞬态工况下传感器和执行器发生单发故障或并发故障时主要物理热工参数的响应数据,其中单发故障和并发故障的80%左右数据作为训练集,包括在不同时间/位置/类型/程度发生故障时主要物理热工参数的响应数据,训练集和测试集均涵盖了各类故障,保证了训练集的多样性和测试集的全面性。
进一步的,通过实验或仿真方法获取核动力装置不同位置/类型/程度的传感器和执行器单/并发故障工况及正常工况下主要物理热工参数的响应数据,能够利用有限信号的时域特征对核动力装置并发故障时间、类型和程度进行识别。
进一步的,采用多层BiLSTM网络架构,能够有效地对核动力装置传感器和执行器发生故障时主要物理热工参数的响应数据进行时空特征的提取,大大提高了诊断模型的准确率,对网络模型结构进行合理地设置,启发式地选取最优超参数,有利于提高诊断准确率,全连接层可以将提取的特征很好地对应到故障类型,从而实现多种故障类型的高效准确诊断。
进一步的,多层BiLSTM网络模块包含多个BiLSTM网络层,BiLSTM网络层数过多会导致模型过拟合,降低模型泛化能力,层数过少会导致模型欠拟合,而降低模型预测准确度,设置合适的BiLSTM网络层数,使得模型泛化能力与预测准确率达到最优,包含多个归一化层、非线性激活函数和丢失层。归一化层能够加快网络训练和收敛速度,并且可以控制梯度爆炸和防止梯度消失。非线性激活函数对输入的每个元素执行阈值运算,其中任何小于零的值都设置为零,能够在一定程度上缓解过拟合。丢失层以给定的概率将输入元素随机设置为零,有助于防止网络过拟合。
进一步的,BiLSTM网络层包含多个隐含神经单元,隐含神经单元数量过多会导致模型过拟合,降低模型泛化能力,数量过少会导致模型欠拟合,而降低模型预测准确度,设置合适数量的隐含神经单元,使得模型泛化能力与预测准确度达到最优。
进一步的,预训练过程学习率设定为0.01,最大迭代周数设置为2000,通过设置足够多的迭代周期以保证模型在预训练时的损失函数可达到收敛状态。
进一步的,设置空白全连接层的参数学习率因子为2,保证该层学习并发故障特征的速度快于其余网络层,能够利用其余网络层学习到的单发故障特征识别并发故障特征,以实现模型迁移。
进一步的,再训练过程学习率设定为0.001,最大迭代周数设置为300,再训练过程中可基于已学习到的核动力装置传感器和执行器单发故障特征,针对性学习并发故障特征,保证了核动力装置并发故障诊断模型的学习速度、准确率和泛化能力。
可以理解的是,上述第二方面至第三方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
综上所述,本发明通过建立多层BiLSTM网络架构,准确地对核动力装置传感器和执行器的并发故障进行诊断;面对一些未知的故障,预测的结果为与其特征最接近的现有故障,从而达到实时有效地诊断核动力装置传感器和执行器并发故障的目的。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的逻辑流程图;
图2为BiLSTM网络的结构图;
图3为基于三层BiLSTM网络的诊断模型架构图;
图4为某小型压水堆传感器执行器单并发故障信号数据图;
图5为诊断模型在预训练过程中单发故障训练集和测试集的模型训练准确率曲线和模型训练损失曲线;
图6为诊断模型在预训练后对单发故障测试集的混淆矩阵结果图;
图7为诊断模型在再训练过程中并发故障训练集和测试集的模型训练准确率曲线和模型训练损失曲线;
图8为诊断模型在再训练后对并发故障测试集的混淆矩阵结果图;
图9为诊断模型对三类并发故障进行诊断的结果图,其中,(a)为蒸汽压力传感器和给水阀在50s时同时发生恒增益故障的实时诊断结果,(b)为蒸汽压力传感器和给水阀在120s时同时发生恒增益故障的实时诊断结果,(c)为蒸汽压力传感器和给水阀在50s时同时发生恒偏差故障的实时诊断结果,(d)为,蒸汽压力传感器和给水阀在120s时同时发生卡死故障的实时诊断结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
本发明提供了一种基于迁移学习的核动力装置并发故障诊断方法,采集核动力装置在不同位置/类型/程度的传感器和执行器单/并发故障工况及正常工况下的核功率、一回路冷却剂温度、主蒸汽压力等主要物理热工参数的响应数据,并划分得到单发故障训练集和测试集(源数据集)以及并发故障训练集和测试集(目标数据集);对单/并发故障训练集和测试集数据进行标准化等预处理;构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;利用单发故障训练集对该并发故障诊断模型进行预训练,再将单发故障测试集输入训练好的并发故障诊断模型中,测试预训练模型的准确率;采用基于模型的迁移学习方法,将上述并发故障诊断模型中全连接层与分类输出层重置为空白层,利用并发故障训练集对调整后的网络模型进行再训练;将并发故障测试集输入训练好的并发故障诊断模型中,实现核动力装置传感器和执行器并发故障的诊断。本发明能够实现核动力装置稳态和瞬态运行过程中传感器和执行器不同类型、不同程度并发故障的准确在线诊断,为故障缓解和容错控制提供参考。
请参阅图1,本发明一种基于迁移学习的核动力装置并发故障诊断方法,选用核动力装置中数量众多且易出故障的传感器和执行器作为诊断对象,以某一小型压水堆核蒸汽供应系统的传感器和执行器各类工况下单/并发故障数据集作为样本数据,包括蒸汽压力传感器、给水阀和二者并发故障等不同类型不同程度的故障;在该样本数据中选取主要物理热工参数的响应数据进行采样,建立多层BiLSTM网络的核动力装置并发故障诊断模型,准确诊断核动力装置传感器和执行器并发故障的时间/位置/类型/程度,达到核动力装置并发故障高效、准确诊断的目的;具体步骤如下:
S1、采集核动力装置在不同位置/类型/程度的传感器和执行器单/并发故障工况及正常工况下的核功率、一回路冷却剂温度、主蒸汽压力等主要物理热工参数的响应数据,并划分得到单发故障训练集和测试集(源数据集),以及并发故障训练集和测试集(目标数据集),分别用于预训练和再训练过程中的训练和测试;
以蒸汽压力传感器为例,不同类型和不同程度的故障工况包括高/中/低功率水平下各类典型瞬态过程中发生的蒸汽压力传感器故障。
根据上述故障类型,按照不同的故障发生时间采集每种类型故障的多组征兆数据,并且按照约8:2的比例分为单发故障数据集和并发故障数据集,包括单发故障训练集和测试集以及并发故障训练集和测试集;在此基础上,所建立的核动力装置并发故障诊断模型首先使用单发故障训练集进行预训练,再使用并发故障训练集进行再训练,并利用并发故障测试集来评判核动力装置并发故障诊断模型的诊断效果。
S2、对步骤S1中采集到的物理热工参数的响应数据进行预处理及标准化,预处理即将多维时间序列信号处理成所用训练框架能接收的格式;
标准化的方法为:
其中,μ为均值,δ为标准差,/>
经过标准化后,训练集数据的范围被压缩的非常接近,可以在训练时使其快速收敛;标准化之后数据集的结构和数量不变。
S3、构建基于多层BiLSTM网络的核动力装置并发故障诊断模型;
单个LSTM单元包括一个遗忘门ft、一个输入门it和一个输出门ot,每个LSTM单元通过这三个门机制来对前一个时刻的隐含信息ht-1、上一个LSTM单元细胞状态ct-1和当前输入xt进行有选择地筛选,并由tanh函数确定单个LSTM单元的输出:
it=σ(Wi[ht-1,xt]+bi)
ft=σ(Wf[ht-1,xt]+bf)
ct=ftct-1+ittanh(Wc[ht-1,xt]+bc)
ot=σ(Wo[ht-1,xt]+bo)
ht=ottanh(ct)
其中,σ表示sigmoid激活函数,Wi、Wf、Wo和Wc分别表示输入门、遗忘门、输出门和计算单元状态的权重矩阵;bi、bf、bo和bc分别表示输入门、遗忘门、输出门和计算单元状态的偏置项。
请参阅图2,BiLSTM网络由两个信息传递相反的LSTM循环层构成,其中第一层按时间顺序传递信息,第二层按时间逆序传递信息。BiLSTM相比于LSTM具有更加复杂的结构和参数,不仅能够利用“过去”的信息,还能够捕捉“未来”的信息。
请参阅图3,多层BiLSTM网络的核动力装置并发故障诊断模型的架构包括输入层、多BiLSTM网络层、全连接层、Softmax层和输出层;多层网络模型中设置梯度阈值为2,其余的初始权值随机生成,在训练过程中不断优化。
多层BiLSTM网络的核动力装置并发故障诊断模型结构具体如下:
输入层:接收经过标准化处理后12维序列大小为3001的多维时间序列训练样本;
多BiLSTM网络层:包含三个BiLSTM层、三个归一化层、三个非线性激活函数和三个丢失层,按照BiLSTM层、归一化层、非线性激活函数、丢失层、BiLSTM层、归一化层、非线性激活函数、丢失层、BiLSTM层、归一化层、非线性激活函数、丢失层的顺序进行连接。
其中,每个BiLSTM层包含200个隐含单元,用于提取输入信号中隐藏的时间特征。
全连接层:把特征合并层得到的时空特征作为输入值,输出值为能够表示故障种类特征的单维向量;
Softmax层:使用Softmax函数,将任意大小一维向量的所有值进行压缩,处理后向量大小不变,所有元素的值都被压缩到[0,1]之间,并且所有的元素之和为1。
S4、利用步骤S2得到的单发故障训练集对步骤S3构建的核动力装置并发故障诊断模型进行预训练,再将步骤S2得到的单发故障测试集输入预训练得到的并发故障诊断模型中,测试预训练模型对核动力装置单发故障的诊断准确率;
将单发故障训练集输入基于多层BiLSTM网络的核动力装置并发故障诊断模型中进行预训练,由于深层神经网络需要从大量样本中不断地提取特征并优化网络权值参数以达到理想的分类结果,预训练过程的学习算法采用sgdm,网络训练过程中设定最大迭代周期为2000,学习率为0.01,三层丢失层丢弃率为50%。
S5、对步骤S4得到的预训练网络进行调整,将该预训练模型的全连接层和输出层重置为空白层;
设置空白全连接层参数学习率因子为2,保证该网络层学习速度快于其余层的学习速度。
S6、利用步骤S2得到的并发故障训练集对步骤S5调整后的核动力装置并发故障诊断模型进行再训练,并将步骤S2得到的并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
将并发故障训练集输入多层BiLSTM网络的核动力装置并发故障诊断模型中进行再训练,再训练过程的学习算法采用sgdm,训练过程中设定最大迭代周期为300,学习率为0.001,三层丢失层的丢弃率为5%。
本发明再一个实施例中,提供一种基于迁移学习的核动力装置并发故障诊断系统,该系统能够用于实现上述基于迁移学习的核动力装置并发故障诊断方法,具体的,该基于迁移学习的核动力装置并发故障诊断系统包括数据模块、预处理模块、构建模块、预训练模块、调整模块以及诊断模块。
其中,数据模块,将核动力装置的响应数据划分为单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集;
预处理模块,对数据模块得到的单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集进行预处理;
构建模块,构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;
预训练模块,利用预处理模块得到的单发故障训练集对构建模块构建的核动力装置并发故障诊断模型进行预训练,再将预处理模块得到的单发故障测试集输入预训练后的核动力装置并发故障诊断模型中,测试核动力装置并发故障诊断模型对核动力装置单发故障的诊断准确率;
调整模块,对预训练模块预训练后的核动力装置并发故障诊断模型进行调整,将核动力装置并发故障诊断模型的全连接层和输出层重置为空白层;
诊断模块,利用预处理模块得到的并发故障训练集对调整模块调整后的核动力装置并发故障诊断模型进行再训练,并将预处理模块得到的并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于基于迁移学习的核动力装置并发故障诊断方法的操作,包括:
将核动力装置的响应数据划分为单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集;对单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集进行预处理;构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;利用单发故障训练集对核动力装置并发故障诊断模型进行预训练,再将单发故障测试集输入预训练后的核动力装置并发故障诊断模型中,测试核动力装置并发故障诊断模型对核动力装置单发故障的诊断准确率;对预训练后的核动力装置并发故障诊断模型进行调整,将核动力装置并发故障诊断模型的全连接层和输出层重置为空白层;利用并发故障训练集对调整后的核动力装置并发故障诊断模型进行再训练,并将并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(Non-Volatile Memory),例如至少一个磁盘存储器。
可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关基于迁移学习的核动力装置并发故障诊断方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:
将核动力装置的响应数据划分为单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集;对单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集进行预处理;构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;利用单发故障训练集对核动力装置并发故障诊断模型进行预训练,再将单发故障测试集输入预训练后的核动力装置并发故障诊断模型中,测试核动力装置并发故障诊断模型对核动力装置单发故障的诊断准确率;对预训练后的核动力装置并发故障诊断模型进行调整,将核动力装置并发故障诊断模型的全连接层和输出层重置为空白层;利用并发故障训练集对调整后的核动力装置并发故障诊断模型进行再训练,并将并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
依托某小型压水堆核蒸汽供应系统仿真平台,生成各类仿真工况下蒸汽压力传感器和给水阀单/并发故障数据集,包括高、中、低功率水平下稳态工况和各类典型瞬态工况下核功率、一回路冷却剂温度、主蒸汽压力等主要物理热工参数的响应数据。采集核动力装置在不同位置/类型/程度的传感器和执行器单/并发故障工况及正常工况下的核功率、一回路冷却剂温度、主蒸汽压力等主要物理热工参数的响应数据,并划分得到单发故障训练集和测试集,以及并发故障训练集和测试集;
请参阅图4,为本发明在核蒸汽供应系统仿真平台进行采样的样本数据,包括蒸汽压力传感器恒增益故障(故障程度0.7倍)、蒸汽压力传感器恒偏差故障(故障偏差0.3MPa)、蒸汽压力传感器卡死故障、给水阀恒增益故障(故障程度0.7倍)、给水阀恒偏差故障(故障偏差-8%)、给水阀卡死故障、蒸汽压力传感器恒增益故障(故障程度1.3倍)、蒸汽压力传感器恒偏差故障(故障偏差0.5MPa)、给水阀恒增益故障(故障程度1.3倍)、给水阀恒偏差故障(故障偏差8%)、蒸汽压力传感器和给水阀同时发生恒增益故障(故障程度1.1倍)、蒸汽压力传感器和给水阀同时发生恒偏差故障(故障偏差分别为0.4MPa和8%)、蒸汽压力传感器和给水阀同时发生卡死故障、正常工况共14种类型,其中单发故障10种,并发故障3种,除卡死故障外,每类故障在各类工况下和多个故障时间采集数据,卡死故障在各类瞬态工况下和多个故障时间采集数据。为测试核动力装置并发故障诊断模型实时诊断的效果,采集不同故障时间的各类故障数据作为测试集。
根据上述数据故障类型,每种组数据采集3001个数据,信号采集频率为10Hz。其中单发故障数据集和并发故障数据集比例约为8:2,单发故障和并发故障数据集中训练集和测试集约为8:2。搭建好的核动力装置并发故障诊断模型使用单发故障训练集进行预训练,使用并发故障训练集进行再训练,并用并发故障测试集来评判核动力装置并发故障诊断模型的训练效果,使得故障诊断更加精确。
经过标准化后,数据的范围被压缩的非常接近,可以在网络训练时使其快速收敛;标准化之后数据集的结构和数量不变。
分别使用单发故障测试集验证多层BiLSTM网络的核动力装置并发故障诊断模型预训练效果,使用并发故障测试集验证多层BiLSTM网络的核动力装置并发故障诊断模型再训练和诊断效果,并用混淆矩阵对诊断性能进行评估。
通过混淆矩阵对核动力装置并发故障诊断模型的诊断准确率进行评估,诊断准确率等于预测正确数量除以预测正确数量和误诊数量之和,其中混淆矩阵的行、列分别代表通过核动力装置单/并发故障诊断模型预测的故障种类和数据以及实际的故障种类,混淆矩阵中的数字记录了预测正确的数量和误诊的数量以及误诊的类别。
请参阅图5,为核动力装置并发故障诊断模型在预训练过程中的单发故障诊断准确率和交叉熵损失的变化曲线。准确率越接近100%、损失越接近0,分类效果越好。从图中可以看出,随着迭代次数的增加模型在训练集和测试集上的预测准确率呈上升趋势,模型在训练集和测试集上的损失值呈下降趋势,预训练单发故障测试集诊断准确率为98.06%。
请参阅图6,其中斜对角线显示分类正确的数据量,可以直观地评估该模型在测试数据中的诊断性能。从图中可知,所构建的基于BiLSTM网络的故障诊断模型可以准确预测单发故障测试数据集中的大部分数据,能够对核动力装置传感器和执行器单发故障进行准确诊断。
请参阅图7,为核动力装置并发故障诊断模型在再训练过程中的并发故障诊断准确率和交叉熵损失的变化曲线。准确率越接近100%、损失越接近0,分类效果越好。从图中可以看出,随着迭代次数的增加模型在训练集和测试集上的预测准确率呈上升趋势,模型在训练集和测试集上的损失值呈下降趋势,再训练并发故障测试集诊断准确率为92.75%。
请参阅图8,其中斜对角线显示分类正确的数据量,可以直观地评估该模型在测试数据中的诊断性能。从图中可知,所构建的基于BiLSTM网络的故障诊断模型可以准确预测并发故障测试数据集中的大部分数据,能够对核动力装置传感器和执行器并发故障进行准确诊断。
请参阅图9,其中深色曲线表示诊断模型对核动力装置传感器和执行器并发故障的实时诊断结果,浅色曲线表示核动力装置传感器和执行器并发故障实际发生曲线,从图中可以看出核动力装置并发故障诊断模型能够对三类并发故障的故障时间、故障类型实现精确诊断。
综上所述,本发明一种基于迁移学习的核动力装置并发故障诊断方法及系统,以某小型压水堆蒸汽压力传感器和给水阀为验证实例,依托其核蒸汽供应系统仿真平台生成的核动力装置传感器和执行器单/并发故障数据样本,完成训练数据的采样,构建了基于多层BiLSTM网络的故障诊断模型,通过预训练使其能够有效地学习和提取核动力装置传感器和执行器单发故障的数据特征,并通过再训练应用于提取识别核动力装置传感器和执行器并发故障的数据特征,实现核动力装置传感器和执行器并发故障的准确预测,验证了本发明方法能够达到核动力装置传感器和执行器不同时间/位置/类型/程度并发故障准确诊断的目的。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等,需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
Claims (10)
1.一种基于迁移学习的核动力装置并发故障诊断方法,其特征在于,包括以下步骤:
S1、将核动力装置的响应数据划分为单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集;
S2、对步骤S1得到的单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集进行预处理;
S3、构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;
S4、利用步骤S2得到的单发故障训练集对步骤S3构建的核动力装置并发故障诊断模型进行预训练,再将步骤S2得到的单发故障测试集输入预训练后的核动力装置并发故障诊断模型中,测试核动力装置并发故障诊断模型对核动力装置单发故障的诊断准确率;
S5、对步骤S4预训练后的核动力装置并发故障诊断模型进行调整,将核动力装置并发故障诊断模型的全连接层和输出层重置为空白层;
S6、利用步骤S2得到的并发故障训练集对步骤S5调整后的核动力装置并发故障诊断模型进行再训练,并将步骤S2得到的并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
2.根据权利要求1所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,步骤S1中,单发故障和并发故障数据集所占比例为8:2,单发故障数据集中训练集和测试集所占比例为8:2,并发故障数据集中训练集和测试集所占比例为8:2。
3.根据权利要求2所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,响应数据包括核动力装置在不同位置、类型、程度的传感器和执行器单、并发故障工况及正常工况下的核功率、一回路冷却剂温度以及主蒸汽压力数据。
4.根据权利要求1所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,步骤S3中,核动力装置并发故障诊断模型包括:
输入层,用于接收经标准化处理后的多维时间序列训练样本;
多层BiLSTM网络,用于提取多维时间序列数据中的特征;
全连接层,用于把多层BiLSTM网络得到的时空特征作为输入值,输出值为能够表示故障种类特征的单维时间序列向量;
Softmax层,用于使用Softmax函数将任意大小一维向量的所有值进行压缩,处理后向量大小不变,所有元素的值为[0,1],并且所有的元素之和为1;
输出层,用于输出结果。
5.根据权利要求4所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,多层BiLSTM网络的梯度阈值为2,包含3个BiLSTM层、3个归一化层、3个非线性激活函数和3个丢失层;连接顺序为:BiLSTM层、归一化层、激活函数、丢失层、BiLSTM层、归一化层、激活函数、丢失层、BiLSTM层、归一化层、激活函数和丢失层。
6.根据权利要求5所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,每个BiLSTM层包含200个隐含单元。
7.根据权利要求1所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,步骤S4中,预训练过程的学习算法采用sgdm,最大周期为2000,最小批数目为126,学习率为0.01,三层丢失层的丢弃率为50%。
8.根据权利要求1所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,步骤S5中,设置空白全连接层的参数学习率因子为2。
9.根据权利要求1所述的基于迁移学习的核动力装置并发故障诊断方法,其特征在于,步骤S6中,再训练过程中的学习算法采用sgdm,最大迭代周期为300,最小批数目为102,学习率为0.001,三层丢失层的丢弃率为5%。
10.一种基于迁移学习的核动力装置并发故障诊断系统,其特征在于,包括:
数据模块,将核动力装置的响应数据划分为单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集;
预处理模块,对数据模块得到的单发故障训练集和单发故障测试集,以及并发故障训练集和并发故障测试集进行预处理;
构建模块,构建基于多层双向长短期记忆网络的核动力装置并发故障诊断模型;
预训练模块,利用预处理模块得到的单发故障训练集对构建模块构建的核动力装置并发故障诊断模型进行预训练,再将预处理模块得到的单发故障测试集输入预训练后的核动力装置并发故障诊断模型中,测试核动力装置并发故障诊断模型对核动力装置单发故障的诊断准确率;
调整模块,对预训练模块预训练后的核动力装置并发故障诊断模型进行调整,将核动力装置并发故障诊断模型的全连接层和输出层重置为空白层;
诊断模块,利用预处理模块得到的并发故障训练集对调整模块调整后的核动力装置并发故障诊断模型进行再训练,并将预处理模块得到的并发故障测试集输入再训练后的核动力装置并发故障诊断模型中,实现传感器和执行器并发故障诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310477078.1A CN116502138A (zh) | 2023-04-27 | 2023-04-27 | 一种基于迁移学习的核动力装置并发故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310477078.1A CN116502138A (zh) | 2023-04-27 | 2023-04-27 | 一种基于迁移学习的核动力装置并发故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116502138A true CN116502138A (zh) | 2023-07-28 |
Family
ID=87326130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310477078.1A Pending CN116502138A (zh) | 2023-04-27 | 2023-04-27 | 一种基于迁移学习的核动力装置并发故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116502138A (zh) |
-
2023
- 2023-04-27 CN CN202310477078.1A patent/CN116502138A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A directed acyclic graph network combined with CNN and LSTM for remaining useful life prediction | |
Xia et al. | Multi-stage fault diagnosis framework for rolling bearing based on OHF Elman AdaBoost-Bagging algorithm | |
CN113011248B (zh) | 一种基于lstm的核动力装置故障诊断方法 | |
Shao et al. | A Multichannel LSTM‐CNN Method for Fault Diagnosis of Chemical Process | |
Naimi et al. | Fault detection and isolation of a pressurized water reactor based on neural network and k-nearest neighbor | |
CN114462459A (zh) | 一种基于1dcnn-lstm网络模型的液压机故障诊断方法 | |
Peng et al. | A mixed intelligent condition monitoring method for nuclear power plant | |
CN116316591A (zh) | 基于混合双向门控循环的短期光伏功率预测方法及系统 | |
Roverso | Soft computing tools for transient classification | |
CN115374810A (zh) | 基于动态可分离卷积神经网络的故障诊断方法及设备 | |
Choi et al. | Unsupervised learning algorithm for signal validation in emergency situations at nuclear power plants | |
Xu et al. | Global attention mechanism based deep learning for remaining useful life prediction of aero-engine | |
CN111915101A (zh) | 基于lpp-hmm方法的复杂装备故障预测方法及系统 | |
CN116405326A (zh) | 基于区块链的信息安全管理方法及其系统 | |
Shin et al. | Approach to diagnosing multiple abnormal events with single-event training data | |
CN116502138A (zh) | 一种基于迁移学习的核动力装置并发故障诊断方法及系统 | |
Liu et al. | A novel transfer CNN with spatiotemporal input for accurate nuclear power fault diagnosis under different operating conditions | |
Tian et al. | Fault diagnosis for rolling bearings based on recurrence plot and convolutional neural network | |
Li et al. | Fault Diagnosis to Nuclear Power Plant System Based on Time‐Series Convolution Neural Network | |
Xu et al. | A graph convolutional shrinkage network-based fault diagnosis method for industrial process | |
CN114298413A (zh) | 一种水电机组振摆趋势预测方法 | |
Uhrig | Neural networks and their potential application to nuclear power plants | |
Guo et al. | Rolling bearing fault diagnosis based on the combination of improved deep convolution network and gated recurrent unit | |
CN118094343B (zh) | 一种基于注意力机制的lstm机器剩余使用寿命预测方法 | |
Li et al. | An attention-based cnn with batch normalization model for network intrusion detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |