CN117436569A - 基于随机森林的核电设备故障预测和智能标定方法及系统 - Google Patents
基于随机森林的核电设备故障预测和智能标定方法及系统 Download PDFInfo
- Publication number
- CN117436569A CN117436569A CN202311203715.2A CN202311203715A CN117436569A CN 117436569 A CN117436569 A CN 117436569A CN 202311203715 A CN202311203715 A CN 202311203715A CN 117436569 A CN117436569 A CN 117436569A
- Authority
- CN
- China
- Prior art keywords
- equipment
- data
- fault
- nuclear power
- calibration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000012423 maintenance Methods 0.000 claims abstract description 29
- 238000012544 monitoring process Methods 0.000 claims abstract description 25
- 230000008439 repair process Effects 0.000 claims abstract description 20
- 238000005065 mining Methods 0.000 claims abstract description 6
- 230000008859 change Effects 0.000 claims abstract description 5
- 238000003066 decision tree Methods 0.000 claims description 44
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 238000009826 distribution Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 19
- 238000007689 inspection Methods 0.000 claims description 18
- 238000004140 cleaning Methods 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 14
- 230000006378 damage Effects 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000004886 process control Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013138 pruning Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 230000008054 signal transmission Effects 0.000 claims description 4
- 238000004088 simulation Methods 0.000 claims description 4
- 238000011217 control strategy Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 239000004065 semiconductor Substances 0.000 claims 1
- 238000002360 preparation method Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000009413 insulation Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y10/00—Economic sectors
- G16Y10/35—Utilities, e.g. electricity, gas or water
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y40/00—IoT characterised by the purpose of the information processing
- G16Y40/10—Detection; Monitoring
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y40/00—IoT characterised by the purpose of the information processing
- G16Y40/20—Analytics; Diagnosis
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00002—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Power Engineering (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Biomedical Technology (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了基于随机森林的核电设备故障预测和智能标定方法,包括通过部署在核电厂关键设备的传感器实时采集数据,并对数据进行校准和标定;通过对校准和标定后的数据进行分析和挖掘以识别故障特征;使用训练集训练随机森林模型并评估特征的重要性,通过调整模型参数以确定最佳参数组合,并保存最优模型;实时输入新数据至模型以确定设备故障类型;根据设备故障类型给出对应的修复措施;持续监测标定数据的变化情况,并利用新数据不断优化故障预测模型。本发明通过随机森林模型对实时采集的新样本进行判断以快速确定设备的故障类型,并提供相应的修复措施,从而在提高设备的安全性和可靠性的同时,降低了维修成本。
Description
技术领域
本发明涉及电网技术领域,特别是基于随机森林的核电设备故障预测和智能标定方法及系统。
背景技术
当谈及核电厂设备故障预测和标定方法的缺陷时,有两个主要问题需要考虑。首先,现有技术在故障预测方面存在局限性,预测方法基于过去的数据,无法准确预测未来设备故障,特别是面对新情况或突发事件,数据采集和处理限制也会影响预测准确性。其次,标定需要耗费大量时间和资源,有些方法需要停机进行校准,造成生产中断和效率下降,且某些标定方法还需要专业技术人员进行操作,不易获取或成本较高。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于现有的核电设备故障预测和标定方法中存在的局限性和耗时耗资源的问题,提出了本发明。
因此,本发明所要解决的问题在于如何提高核电设备故障预测的准确性,并减少标定过程所需的时间和资源消耗。
为解决上述技术问题,本发明提供如下技术方案:
第一方面,本发明实施例提供了基于随机森林的核电设备故障预测和智能标定方法,其包括通过部署在核电厂关键设备的传感器实时采集核电厂设备运行数据和标定数据,并通过物联网技术将采集到的设备运行数据传输到核电厂的DCS系统;对DCS系统收集到的核电厂标定数据和设备运行数据进行清洗与预处理,并利用线性校准算法对预处理后的数据进行校准和标定;基于校准和标定后的数据进行数据分析和特征挖掘,并通过分析设备运行数据选择与故障类型判断相关的特征;使用训练集训练随机森林模型,评估每个特征的重要性以衡量其在故障类型判断中的贡献程度,并通过迭代调整模型参数来确定最佳参数组合,同时保存训练出的最优随机森林模型;将实时采集的新样本输入至最优随机森林模型,并通过查找模型输出的概率分布向量中的最高概率来确定标定误差导致的设备故障类型;将确定的设备故障类型和相关的标定数据更新至核电厂的数据库中,并在后续的标定管理与维护中根据设备故障类型给出对应的修复措施,同时将修复措施反馈至核电厂设备以确保故障得到及时处理;持续监测标定数据的变化情况,并利用新数据不断优化故障预测模型。
作为本发明所述基于随机森林的核电设备故障预测和智能标定方法的一种优选方案,其中:使用训练集训练随机森林模型包括以下步骤:通过CART算法迭代构建二叉决策树,并使用MVA算法将所有生成并剪枝的二叉决策树组合成随机森林模型;评估每个特征的重要性以衡量其在故障类型判断中的贡献程度;通过迭代调整模型参数来确定最佳参数组合,并保存训练出的最优随机森林模型。
作为本发明所述基于随机森林的核电设备故障预测和智能标定方法的一种优选方案,其中:通过CART算法迭代构建二叉决策树,并使用MVA算法将所有生成并剪枝的二叉决策树组合成随机森林模型包括以下步骤:将校准和标定后的数据划分为训练数据集和验证数据集,并从训练数据集中采用分层采样的方式选取一部分样本作为子样本;使用CART算法计算训练数据集中特征标签的基尼指数以构建CART决策树;对生成的CART决策树进行后剪枝处理,并采用交叉验证方法确定最优决策树;迭代以上步骤以构建多个CART决策树,并使用绝对多数投票法将所有生成并剪枝的CART决策树组合成随机森林模型。
作为本发明所述基于随机森林的核电设备故障预测和智能标定方法的一种优选方案,其中:从训练数据集中采用分层采样的方式选取一部分样本作为子样本包括以下步骤:将校准和标定后的数据划分为训练数据集和验证数据集;将训练数据集进行进一步处理以确保样本的特征分布更加均衡和准确;引入改进的分层采样法来选取训练数据集中的子样本;在每个层级中进行自主采样,即根据需要的样本数量从每个层级中随机选择相应数量的样本以保证每个层级都有足够的代表性样本;重复执行分层采样和自主采样的步骤,直到满足所需的子样本数量;改进的分层采样法包括以下步骤:根据设备的逻辑设备名称、介质和设备型号信息将设备运行数据划分为不同的设备类型层级;在每个设备类型层级中,根据设备的运行范围、输出信号范围和量程信息将数据分为不同的运行状态层级;在每个运行状态层级中,根据设备的制造商和标定精度信息将数据分为不同的制造商层级;在每个制造商层级中,根据设备的制造日期信息将数据划分为不同的制造日期层级。
作为本发明所述基于随机森林的核电设备故障预测和智能标定方法的一种优选方案,其中:使用CART算法计算训练数据集中特征标签的基尼指数以构建CART决策树包括以下步骤:汇总训练数据集中所有的特征,并计算每个特征的基尼指数;对于每个特征,将其可能的取值作为切分点划分数据集为两个子集;对于每个切分点,计算两个子集的基尼指数以衡量子集中类别不纯度的程度;对于每个特征,选择具有最小加权基尼指数的切分点作为此特征的最优切分点,并将该最优特征作为当前节点的划分特征;将当前节点划分为两个子节点,一个子节点包含选择的最优特征的特定取值,另一个子节点包含其他取值;重复上述步骤,接着将剩余的特征分配给子节点,直到达到最大深度或满足其他终止条件;基尼指数的计算公式如下:
其中,k表示在具有m个节点的CART决策树中存在的类别个数,Pmk表示在具有m个节点的CART决策树中类别k所占的比例大小,GIl表示特征xj在节点m分支前的基尼指数,GIr表示特征xj在节点m分支后的基尼指数,K表示总类别个数。
作为本发明所述基于随机森林的核电设备故障预测和智能标定方法的一种优选方案,其中:根据设备故障类型给出对应的修复措施包括以下步骤:若只有一个值为最大概率,则判定最大概率为正常状态还是存在接近的最大概率,若存在接近的最大概率,则将此样本标记为“不确定”,同时立即切换至冷备设备以确保系统正常运行,组建专家技术组对设备进行评估分析以找出不确定因素并进行追溯设备记录,规范执行设备检修和标定流程以确保所有步骤都按照规定进行,重点监控设备的运行状态并持续收集分析数据,仅在标定结果经过多级复核,确保准确无误后才能重新投运设备;若最大概率的值对应的是正常状态,则将此样本标记为“正常”,同时建议保持实时监测和维护以确保系统持续正常运行;若最大概率的值对应的是故障类型,则将此样本标记为“故障”,同时确定概率最大的值所对应的故障类型是传感器错误、信号漂移错误、过程控制错误、设备超限运行、设备间信号不匹配故障还是系统误报警和漏报警故障,若故障类型为传感器错误,则对传感器进行仔细检查以确保传感器的连接正确、供电正常,并且没有明显的损坏或破坏痕迹;若传感器被确认为正常工作但存在偏差或不准确的情况,则进行传感器校准以调整其输出准确性;若传感器经过检查和校准后仍存在问题,则考虑更换传感器;同时检查传感器回路包括连接电缆、接线端子和接地以确保传感器回路没有松动和接触不良,并定期检查传感器的工作状态,同时进行必要的清洁和保养以确保其持续正常运行;若故障类型为过程控制错误,则通过仪表和监控系统检查相关参数和指示是否与预期不符以确定是否存在控制错误;若发现仪表读数与实际情况不符,则对相关仪表进行校准;检查过程控制系统的硬件和软件以确保其正常运行;评估现有的控制策略确定是否需要进行优化或调整;对控制回路进行调试,并检查控制信号的传递和反馈以确保系统中的控制回路正常运行;保持设备的清洁并定期检查控制设备的状态;若故障类型为设备超限运行,则立即停止超限运行的设备以避免进一步损坏或安全风险的发生;尽快确定设备超限运行的根本原因,并与设备操作人员交流确定故障原因;根据故障原因确定必要的维修和替换措施,并修复设备的损坏部分以确保其恢复到正常运行状态;对超限运行事件进行仔细分析以找出事件中存在的问题和薄弱环节;加强设备操作人员的培训和意识提高,确保能够有效应对类似的超限运行情况;改进设备监测系统,增加对设备状态的实时监测和预警功能;若故障类型为设备间信号不匹配故障,则检查设备间信号连接是否正确;使用信号发生器检测信号源的输出信号,并与接收设备的期望信号进行比对;检查相关设备的参数配置以确保信号的传递和处理设置正确;若设备之间存在接口不匹配的问题,则进行接口的调试;若存在设备之间信号类型或电平不匹配的情况,则考虑使用信号转换器或适配器;定期进行设备维护和校准;若系统误报警和漏报警故障,则检查核电厂的报警系统设置,确认报警规则和阈值是否正确设置,确保系统能够准确地检测到异常情况并触发相应的报警;进行传感器的校准和检测设备的维护,若发现传感器或设备异常,则及时修复或更换;验证报警逻辑的正确性,并进行必要的调整和改进以减少误报警和漏报警的发生;定期检查报警系统的运行状态以确保其正常工作;通过对报警系统数据的分析找出误报警和漏报警的主要原因,并制定改进措施;若有2个以上概率相同且均为最大值,则将此样本标记为“并存”,同时制定专项检查方案,重点监测各故障模式特征,通过模拟和测试验证各故障模式,组织专家会诊并制定区隔故障方案,按规程顺序实施检查和诊断,确定实际故障并解除问题隐患;根据设备故障类型匹配对应的修复措施,并重新进行预测,迭代循环,直到随机森林模型输出的概率分布向量中正常状态概率最高为止。
作为本发明所述基于随机森林的核电设备故障预测和智能标定方法的一种优选方案,其中:概率分布向量的长度为7,分别对应6类故障类型和1个正常状态,包括传感器错误、信号漂移错误、过程控制错误、设备超限运行、设备间信号不匹配故障、系统误报警和漏报警故障以及状态正常。
第二方面,本发明实施例提供了基于随机森林的核电设备故障预测和智能标定系统,其包括数据采集模块,用于通过部署在核电厂关键设备的传感器实时采集核电厂设备运行数据和标定数据,并通过物联网技术将采集到的设备运行数据传输到核电厂的DCS系统;数据预处理模块,用于对DCS系统收集到的核电厂标定数据和设备运行数据进行清洗与预处理,并利用线性校准算法对预处理后的数据进行校准和标定;随机森林构建模块,用于使用训练集训练随机森林模型,评估每个特征的重要性以衡量其在故障类型判断中的贡献程度,并通过迭代调整模型参数来确定最佳参数组合,同时保存训练出的最优随机森林模型;故障类型判断模块,用于模型输出的概率分布向量中的最高概率来确定标定误差导致的设备故障类型;修复措施匹配模块,用于根据设备故障类型给出对应的修复措施,同时将修复措施反馈至核电厂设备以确保故障得到及时处理。
第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中:所述计算机程序指令被处理器执行时实现如本发明第一方面所述的基于随机森林的核电设备故障预测和智能标定方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中:所述计算机程序指令被处理器执行时实现如本发明第一方面所述的基于随机森林的核电设备故障预测和智能标定方法的步骤。
本发明有益效果为:本发明结合物联网技术和智能传感器实现了设备数据的自动化采集、传输和实时监测管理;经过数据清洗、预处理、分析和特征挖掘有效探测与故障类型相关的特征以提高故障判断的准确性;采用CART算法、分层采样、后剪枝处理和绝对多数投票法构建随机森林模型以提升模型的准确性、泛化能力、稳定性和抗噪声能力,并减少算法复杂度;通过随机森林模型对实时采集的新样本进行判断以快速确定设备的故障类型,并提供相应的修复措施,从而在提高设备的安全性和可靠性的同时,降低了维修成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。其中:
图1为基于随机森林的核电设备故障预测和智能标定方法的方法流程图。
图2为基于随机森林的核电设备故障预测和智能标定方法的计算机设备图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
实施例1
参照图1~图2,为本发明第一个实施例,该实施例提供了基于随机森林的核电设备故障预测和智能标定方法及系统,包括,
S1:通过部署在核电厂关键设备的传感器实时采集核电厂设备运行数据和标定数据,并通过物联网技术将采集到的设备运行数据传输到核电厂的DCS系统。
具体的,在核电厂关键设备周围部署智能传感器,这些传感器能够实时采集设备的运行数据包括逻辑设备名称、介质、运行范围、输出信号范围、量程、标定精度、安装位置、设备型号编码以及制造商信息;从传感器收集到的运行数据通过以太网技术传输到核电厂的DCS分布式控制系统以实现数据的实时监测和集中管理;同时,通过核电厂数据库采集设备的标定数据包括创建人、标定单状态、上次标定时间、标定结论、绝缘检查、外观检查、密封检查以及接线检查内容。
S2:对DCS系统收集到的核电厂标定数据和设备运行数据进行清洗与预处理,并利用线性校准算法对预处理后的数据进行校准和标定。
S3:基于校准和标定后的数据进行数据分析和特征挖掘,并通过分析设备运行数据选择与故障类型判断相关的特征。
S4:使用训练集训练随机森林模型,评估每个特征的重要性以衡量其在故障类型判断中的贡献程度,并通过迭代调整模型参数来确定最佳参数组合,同时保存训练出的最优随机森林模型。
具体的,包括以下步骤:
S4.1:通过CART算法迭代构建CART决策树,并使用MVA算法将所有生成并剪枝的CART决策树组合成随机森林模型。
具体的,包括以下步骤:
S4.1.1:将校准和标定后的数据划分为训练数据集和验证数据集,并从训练数据集中采用分层采样的方式选取一部分样本作为子样本。
进一步的,将校准和标定后的数据划分为80%训练数据集和20%验证数据集;将训练数据集进行进一步处理以确保样本的特征分布更加均衡和准确;引入改进的分层采样法来选取训练数据集中的子样本;在每个层级中进行自主采样,即根据需要的样本数量从每个层级中随机选择相应数量的样本以保证每个层级都有足够的代表性样本;重复执行分层采样和自主采样的步骤,直到满足所需的子样本数量。
具体的,根据设备的逻辑设备名称、介质和设备型号等信息将设备运行数据划分为不同的设备类型层级,这样的划分可以在数据分析和故障判断时进行设备类型的对比和区分;在每个设备类型层级中,根据设备的运行范围、输出信号范围和量程等信息将数据分为不同的运行状态层级,这样划分能够对具有相似运行条件的设备数据进行集中分析和判断;在每个运行状态层级中,根据设备的制造商和标定精度等信息将数据分为不同的制造商层级,这样划分可以方便在同一批次或同一规格的设备之间进行对比和分析;在每个制造商层级中,根据设备的制造日期等信息将数据划分为不同的制造日期层级,这样细分可以用来检查设备的老化情况和与时间相关的故障模式。
进一步的,通过这样的分层方法,我们可以更有效地组织和分析设备运行数据。
S4.1.2:使用CART算法计算训练数据集中特征标签的基尼指数以构建CART决策树。
进一步的,汇总训练数据集中所有的特征,并计算每个特征的基尼指数;对于每个特征,将其可能的取值作为切分点划分数据集为两个子集;对于每个切分点,计算两个子集的基尼指数以衡量子集中类别不纯度的程度;对于每个特征,选择具有最小加权基尼指数的切分点作为该特征的最优切分点,并将该最优特征作为当前节点的划分特征;将当前节点划分为两个子节点,一个子节点包含选择的最优特征的特定取值,另一个子节点包含其他取值;重复上述步骤,接着将剩余的特征分配给子节点,直到达到最大深度或满足其他终止条件。
具体的,特征xj在某一个CART决策树中基尼指数的计算公式如下:
其中,k表示在具有m个节点的CART决策树中存在的类别个数,Pmk表示在具有m个节点的CART决策树中类别k所占的比例大小,GIl表示特征xj在节点m分支前的基尼指数,GIr表示特征xj在节点m分支后的基尼指数,K表示总类别个数。
S4.1.3:对生成的CART决策树进行后剪枝处理,并采用交叉验证方法确定最优决策树。
具体的,获取未剪枝的CART决策树,并按照自上而下的顺序依次处理每个内部节点;将每个内部节点替换为叶节点,并将叶节点的类别设置为该节点的多数类别;使用验证数据集对整个CART决策树进行测试,并计算准确率指标;在验证集上计算剪枝后的性能是否提升(即与原决策树相比准确率指标是否提高);若性能提升,则执行剪枝操作,并将该节点替换为叶节点,否则保留原有子树,不进行剪枝;迭代执行上述步骤,对每个内部节点进行剪枝操作,直到无法再进一步提高性能或无法进行剪枝为止;通过交叉验证方法在验证数据集上评估每棵剪枝后的决策树,并选择具有最高准确率指标的那棵决策树作为最优CART决策树。
S4.1.4:迭代以上步骤以构建多个CART决策树,并使用绝对多数投票法将所有生成并剪枝的CART决策树组合成随机森林模型。
优选的,将得到的全部最优CART决策树按照绝对多数投票法(即最多票数者票数应超过投票数的二分之一)组合生成随机森林。
S4.2:评估每个特征的重要性以衡量其在故障类型判断中的贡献程度。
具体的,包括以下步骤:
S4.2.1:在训练数据集上训练随机森林模型,并记录模型的原始准确率Acc_y;
S4.2.2:逐步移除随机森林中的一个特征。
具体的,复制随机森林模型,移除其中一个特征,得到新的随机森林模型;在训练数据集上测试新的随机森林模型,并记录准确率Acc_n;计算准确率的变化量Im=Acc_y-Acc_n;归一化Im以使所有特征的Im之和为1。
S4.2.3:重复步骤S4.2.2,移除随机森林中的每个特征,并计算每个特征的Im。
S4.2.4:根据每个特征的Im进行排序,绘制特征重要性排序图,并选取Im较大的特征作为模型优化的方向。
具体的,Im值越大表示此特征对模型判断的贡献越大,重要性越高。
S4.3:通过迭代调整模型参数来确定最佳参数组合,并保存训练出的最优随机森林模型。
具体的,包括以下步骤:
S4.3.1:确定随机森林模型的关键参数包括决策树的最大深度m_depth和随机选择特征的个数m_features。
S4.3.2:设置决策树的最大深度m_depth和随机选择特征的个数m_features的搜索范围。
优选的,m_depth取值范围[10、15、20、25、30],m_features的取值范围为[sqrt、log2、None]。
具体的,对于m_depth,设置的取值范围是[10、15、20、25、30]表示最大决策树深度从10开始,以5为步长,依次搜索到30;对于m_features,sqrt考虑sqrt(n_features)个特征,其中n_features为总特征个数;log2考虑log2(n_features)个特征;None考虑所有特征,相当于m_features=n_features。
S4.3.3:通过网格搜索法迭代调整参数。
具体的,遍历参数取值范围内的所有组合;对每个参数组合,利用训练数据集训练随机森林模型;在验证集上评估模型的准确度指标。
S4.3.4:比较所有参数组合下模型在验证集上的指标,选择指标最优的参数组合作为最佳参数组合。
S4.3.5:用最佳参数组合在训练数据集上重新训练随机森林模型以得到最优随机森林模型,保存训练好的最优随机森林模型。
S5:将实时采集的新样本输入至最优随机森林模型,并通过查找模型输出的概率分布向量中的最高概率来确定标定误差导致的设备故障类型。
需要说明的是,最优随机森林模型输出的概率分布向量的长度为7,分别对应6类故障类型和1个正常状态,包括传感器错误、信号漂移错误、过程控制错误、设备超限运行、设备间信号不匹配故障、系统误报警和漏报警故障以及状态正常。
进一步的,对每个实时采集的新样本,比较概率分布向量中的7个概率值,并确定概率最大的值所对应的故障类型作为该样本的预测故障类型结果,最终确定标定误差导致设备故障的主要类型。
S6:将判断出的设备故障类型和相关的标定数据更新到核电厂的数据库中,并在后续的标定管理与维护中根据模型输出的设备故障类型给出对应的修复措施,同时将修复措施反馈至核电厂设备以确保故障得到及时处理。
需要说明的是,存在接近的最大概率是指模型输出的概率分布向量中,最大概率值与其他概率值接近,两者差值小于预设的容差范围0.05。
需要说明的是,容差范围设为0.05是因为容差范围过大会导致误判,容差范围过大(比如设置为0.1,若最大概率为0.4,次大概率0.35)情况下,会增加不确定判断的样本,导致误判;容差范围过小会导致漏判,相反容差范围过小(比如设置为0.01,那么最大概率必须超过次大概率0.01以上才会判定清楚),会对模型精度要求过高,会过滤掉本应判定清楚的样本,增加未知判断样本,导致漏判;0.05是一个经验值,根据随机森林模型的经验和相关研究,当最大概率和次大概率相差0.05时,可以达到区分确定和不确定的效果,这是一个经验性的值,但在实际应用中根据数据进行调整优化。
若只有一个值为最大概率,则判定最大概率为正常状态还是存在接近的最大概率,若存在接近的最大概率,则将此样本标记为“不确定”,同时立即切换至冷备设备以确保系统正常运行,组建专家技术组对设备进行评估分析以找出不确定因素并进行追溯设备记录,规范执行设备检修和标定流程以确保所有步骤都按照规定进行,重点监控设备的运行状态并持续收集分析数据,仅在标定结果经过多级复核,确保准确无误后才可以重新投运设备;
若最大概率的值对应的是正常状态,则将此样本标记为“正常”,同时建议保持实时监测和维护以确保系统持续正常运行;
若最大概率的值对应的是故障类型,则将此样本标记为“故障”,同时确定概率最大的值所对应的故障类型是传感器错误、信号漂移错误、过程控制错误、设备超限运行、设备间信号不匹配故障还是系统误报警和漏报警故障,
若故障类型为传感器错误,则对传感器进行仔细检查以确保传感器的连接正确、供电正常,并且没有明显的损坏或破坏痕迹;若传感器被确认为正常工作但存在偏差或不准确的情况,则进行传感器校准以调整其输出准确性;若传感器经过检查和校准后仍存在问题,则考虑更换传感器;同时检查传感器回路包括连接电缆、接线端子和接地以确保传感器回路没有松动和接触不良,并定期检查传感器的工作状态,同时进行必要的清洁和保养以确保其持续正常运行。
若故障类型为信号漂移错误,则对受影响的信号进行校准,检查信号传输电缆的连接情况以确保连接牢固和接触良好,同时排除可能引起信号漂移的电缆松动或损坏情况,定期对受影响的仪表和传感器进行清洁和保养以确保其正常工作。
若故障类型为过程控制错误,则通过仪表和监控系统检查相关参数和指示是否与预期不符以确定是否存在控制错误;若发现仪表读数与实际情况不符,则对相关仪表进行校准;检查过程控制系统的硬件和软件以确保其正常运行;评估现有的控制策略确定是否需要进行优化或调整;对控制回路进行调试,并检查控制信号的传递和反馈以确保系统中的控制回路正常运行;保持设备的清洁并定期检查控制设备的状态。
若故障类型为设备超限运行,则立即停止超限运行的设备以避免进一步损坏或安全风险的发生;尽快确定设备超限运行的根本原因,并与设备操作人员交流确定故障原因;根据故障原因确定必要的维修和替换措施,并修复设备的损坏部分以确保其恢复到正常运行状态;对超限运行事件进行仔细分析以找出事件中存在的问题和薄弱环节;加强设备操作人员的培训和意识提高,确保能够有效应对类似的超限运行情况;改进设备监测系统,增加对设备状态的实时监测和预警功能。
若故障类型为设备间信号不匹配故障,则检查设备间信号连接是否正确;使用信号发生器检测信号源的输出信号,并与接收设备的期望信号进行比对;检查相关设备的参数配置以确保信号的传递和处理设置正确;若设备之间存在接口不匹配的问题,则进行接口的调试;若存在设备之间信号类型或电平不匹配的情况,则考虑使用信号转换器或适配器;定期进行设备维护和校准。
若系统误报警和漏报警故障,则检查核电厂的报警系统设置,确认报警规则和阈值是否正确设置,确保系统能够准确地检测到异常情况并触发相应的报警;进行传感器的校准和检测设备的维护,若发现传感器或设备异常,则及时修复或更换;验证报警逻辑的正确性,并进行必要的调整和改进以减少误报警和漏报警的发生;定期检查报警系统的运行状态以确保其正常工作;通过对报警系统数据的分析找出误报警和漏报警的主要原因,并制定改进措施。
若有2个以上概率相同且均为最大值,则将此样本标记为“并存”,同时制定专项检查方案,重点监测各故障模式特征,通过模拟和测试验证各故障模式,组织专家会诊并制定区隔故障方案,按规程顺序实施检查和诊断,确定实际故障并解除问题隐患;
根据设备故障类型匹配对应的修复措施,并重新进行预测,迭代循环,直到随机森林模型输出的概率分布向量中正常状态概率最高为止。
S7:持续监测标定数据的变化情况,并利用新数据不断优化故障预测模型。
具体的,根据设备故障类型匹配对应的修复措施,并重新进行预测,迭代循环,直至随机森林模型输出概率分布向量中为正常状态为止。
进一步的,本实施例还提供基于随机森林的核电设备故障预测和智能标定系统,包括数据采集模块,用于通过部署在核电厂关键设备的传感器实时采集核电厂设备运行数据和标定数据,并通过物联网技术将采集到的设备运行数据传输到核电厂的DCS系统;数据预处理模块,用于对DCS系统收集到的核电厂标定数据和设备运行数据进行清洗与预处理,并利用线性校准算法对预处理后的数据进行校准和标定;随机森林构建模块,用于使用训练集训练随机森林模型,评估每个特征的重要性以衡量其在故障类型判断中的贡献程度,并通过迭代调整模型参数来确定最佳参数组合,同时保存训练出的最优随机森林模型;故障类型判断模块,用于模型输出的概率分布向量中的最高概率来确定标定误差导致的设备故障类型;修复措施匹配模块,用于根据设备故障类型给出对应的修复措施,同时将修复措施反馈至核电厂设备以确保故障得到及时处理。
本实施例还提供一种计算机设备,适用于基于随机森林的核电设备故障预测和智能标定方法的情况,包括存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出的基于随机森林的核电设备故障预测和智能标定方法。
该计算机设备可以是终端,该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的实现基于随机森林的核电设备故障预测和智能标定方法。
综上,本发明结合物联网技术和智能传感器实现了设备数据的自动化采集、传输和实时监测管理;经过数据清洗、预处理、分析和特征挖掘有效探测与故障类型相关的特征以提高故障判断的准确性;采用CART算法、分层采样、后剪枝处理和绝对多数投票法构建随机森林模型以提升模型的准确性、泛化能力、稳定性和抗噪声能力,并减少算法复杂度;通过随机森林模型对实时采集的新样本进行判断以快速确定设备的故障类型,并提供相应的修复措施,从而在提高设备的安全性和可靠性的同时,降低了维修成本。
实施例2
参照图1~图2,为本发明第二个实施例,该实施例提供了基于随机森林的核电设备故障预测和智能标定方法及系统,为了验证本发明的有益效果,通过经济效益计算和仿真实验进行科学论证。
具体的,以某核电厂为例,通过部署在核电厂关键设备周围的智能传感器实时采集设备的运行数据和标定数据,共获取138条,其中部分核电厂设备运行数据如表1所示,部分核电厂设备标定数据表如表2所示。
表1部分核电厂设备运行数据
设备编码 | 设备名称 | 介质 | ... | 标定精度 | 安装位置 |
ND001 | 压力传感器 | 水 | ... | ±0.25% | 1号反应堆A系统 |
ND001 | 温度传感器 | 水 | ... | ±0.5℃ | 1号反应堆C系统 |
ND001 | 流量计 | 水 | ... | ±0.5% | 2号反应堆B系统 |
ND001 | 液位计 | 水 | ... | ±0.1% | 1号反应堆D系统 |
... | ... | ... | ... | ... | ... |
ND138 | 转速计 | 水 | ... | ±1rpm | 2号反应堆E系统 |
表2部分核电厂设备运行数据
设备编码 | 上次标定时间 | 标定人 | 标定结果 | 绝缘检查 | 接线检查 | ... |
ND001 | 2022-06-15 | 张三 | 合格 | 良好 | 良好 | ... |
ND002 | 2022-03-24 | 李四 | 合格 | 良好 | 需要检查 | ... |
ND003 | 2022-01-05 | 王五 | 合格 | 良好 | 良好 | ... |
ND004 | 2022-08-16 | 赵六 | 合格 | 需要检查 | 良好 | ... |
... | ... | ... | ... | ... | ... | ... |
ND138 | 2022-11-24 | 钱七 | 合格 | 良好 | 需要检查 | ... |
进一步的,对采集到的运行数据和标定数据进行清洗,处理异常值和空缺值,并利用线性校准算法对清洗后的数据进行校准,基于校准后的数据,提取特征标定精度、运行范围、输出信号范围、标定结果、绝缘检查、接线检查以及上次标定时间。
进一步的,利用训练集的数据训练随机森林模型得到最优模型参数,其中最大树深度25,特征子集数7,对新采集到的实时数据ND00139进行预测,模型输出概率[0.6,0.1,0.1,0.05,0.05,0.05,0.05],判断为传感器故障,此时对传感器进行仔细检查以确保传感器的连接正确、供电正常,并且没有明显的损坏或破坏痕迹;若传感器被确认为正常工作但存在偏差或不准确的情况,则进行传感器校准以调整其输出准确性;若传感器经过检查和校准后仍存在问题,则考虑更换传感器;同时检查传感器回路包括连接电缆、接线端子和接地以确保传感器回路没有松动和接触不良,并定期检查传感器的工作状态,同时进行必要的清洁和保养以确保其持续正常运行;对ND004进行校准和更换后,新数据输入模型,输出概率[0.9,0.025,...,0.045],判断为正常状态。
更进一步的,本发明与现有技术的对比指标如表3所示。
表3本发明与现有技术的对比指标
对比指标 | 传统方法 | 本发明方法 |
数据传输方式 | 纸质文档 | 物联网技术无线传输 |
数据处理方式 | 人工统计 | 自动清洗和预处理 |
故障预测准确率 | 60% | 95% |
判断故障类型能力 | 五 | 6种故障模式 |
判断时间 | 数小时至数天 | 几秒至几分 |
自动匹配维修措施 | 无 | 有 |
数据迭代优化 | 无 | 持续优化 |
误报警率 | 30% | 4% |
维护成本 | 无明显效果 | 降低30% |
优选的,本发明通过采用智能传感器实时采集设备数据,并利用物联网技术无线传输到核电厂DCS系统,实现了自动的数据清洗和预处理,相比传统的手工记录和纸质文档传输方式,大大提高了数据采集和处理的效率;本发明通过应用随机森林算法建立故障预测模型,可以准确判断6种故障模式,预测准确率达到95%,相比传统方法的60%有很大提升,同时将判断时间从数小时至数天缩短至几秒至几分钟;本发明可以自动匹配对应故障的维修措施,并进行数据持续迭代优化,而传统方法无这些能力;本发明可将误报警率从30%降低到4%,同时可降低30%的维护成本。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.基于随机森林的核电设备故障预测和智能标定方法,其特征在于:包括,
通过部署在核电厂关键设备的传感器实时采集核电厂设备运行数据和标定数据,并通过物联网技术将采集到的设备运行数据传输到核电厂的DCS系统;
对DCS系统收集到的核电厂标定数据和设备运行数据进行清洗与预处理,并利用线性校准算法对预处理后的数据进行校准和标定;
基于校准和标定后的数据进行数据分析和特征挖掘,并通过分析设备运行数据选择与故障类型判断相关的特征;
使用训练集训练随机森林模型,评估每个特征的重要性以衡量其在故障类型判断中的贡献程度,并通过迭代调整模型参数来确定最佳参数组合,同时保存训练出的最优随机森林模型;
将实时采集的新样本输入至最优随机森林模型,并通过查找模型输出的概率分布向量中的最高概率来确定标定误差导致的设备故障类型;
将确定的设备故障类型和相关的标定数据更新至核电厂的数据库中,并在后续的标定管理与维护中根据设备故障类型给出对应的修复措施,同时将修复措施反馈至核电厂设备以确保故障得到及时处理;
持续监测标定数据的变化情况,并利用新数据不断优化故障预测模型。
2.如权利要求1所述的基于随机森林的核电设备故障预测和智能标定方法,其特征在于:所述使用训练集训练随机森林模型包括以下步骤:
通过CART算法迭代构建二叉决策树,并使用MVA算法将所有生成并剪枝的二叉决策树组合成随机森林模型;
评估每个特征的重要性以衡量其在故障类型判断中的贡献程度;
通过迭代调整模型参数来确定最佳参数组合,并保存训练出的最优随机森林模型。
3.如权利要求2所述的基于随机森林的核电设备故障预测和智能标定方法,其特征在于:所述通过CART算法迭代构建二叉决策树,并使用MVA算法将所有生成并剪枝的二叉决策树组合成随机森林模型包括以下步骤:
将校准和标定后的数据划分为训练数据集和验证数据集,并从训练数据集中采用分层采样的方式选取一部分样本作为子样本;
使用CART算法计算训练数据集中特征标签的基尼指数以构建CART决策树;
对生成的CART决策树进行后剪枝处理,并采用交叉验证方法确定最优决策树;
迭代以上步骤以构建多个CART决策树,并使用绝对多数投票法将所有生成并剪枝的CART决策树组合成随机森林模型。
4.如权利要求3所述的基于随机森林的核电设备故障预测和智能标定方法,其特征在于:所述从训练数据集中采用分层采样的方式选取一部分样本作为子样本包括以下步骤:
将校准和标定后的数据划分为训练数据集和验证数据集;
将训练数据集进行进一步处理以确保样本的特征分布更加均衡和准确;
引入改进的分层采样法来选取训练数据集中的子样本;
在每个层级中进行自主采样,即根据需要的样本数量从每个层级中随机选择相应数量的样本以保证每个层级都有足够的代表性样本;
重复执行分层采样和自主采样的步骤,直到满足所需的子样本数量;
所述改进的分层采样法包括以下步骤:
根据设备的逻辑设备名称、介质和设备型号信息将设备运行数据划分为不同的设备类型层级;
在每个设备类型层级中,根据设备的运行范围、输出信号范围和量程信息将数据分为不同的运行状态层级;
在每个运行状态层级中,根据设备的制造商和标定精度信息将数据分为不同的制造商层级;
在每个制造商层级中,根据设备的制造日期信息将数据划分为不同的制造日期层级。
5.如权利要求3所述的基于随机森林的核电设备故障预测和智能标定方法,其特征在于:所述使用CART算法计算训练数据集中特征标签的基尼指数以构建CART决策树包括以下步骤:
汇总训练数据集中所有的特征,并计算每个特征的基尼指数;
对于每个特征,将其可能的取值作为切分点划分数据集为两个子集;
对于每个切分点,计算两个子集的基尼指数以衡量子集中类别不纯度的程度;
对于每个特征,选择具有最小加权基尼指数的切分点作为此特征的最优切分点,并将该最优特征作为当前节点的划分特征;
将当前节点划分为两个子节点,一个子节点包含选择的最优特征的特定取值,另一个子节点包含其他取值;
重复上述步骤,接着将剩余的特征分配给子节点,直到达到最大深度或满足其他终止条件;
所述基尼指数的计算公式如下:
其中,k表示在具有m个节点的CART决策树中存在的类别个数,Pmk表示在具有m个节点的CART决策树中类别k所占的比例大小,GIl表示特征xj在节点m分支前的基尼指数,GIr表示特征xj在节点m分支后的基尼指数,K表示总类别个数。
6.如权利要求1所述的基于随机森林的核电设备故障预测和智能标定方法,其特征在于:所述根据设备故障类型给出对应的修复措施包括以下步骤:
若只有一个值为最大概率,则判定最大概率为正常状态还是存在接近的最大概率,若存在接近的最大概率,则将此样本标记为不确定,同时立即切换至冷备设备以确保系统正常运行,组建专家技术组对设备进行评估分析以找出不确定因素并进行追溯设备记录,规范执行设备检修和标定流程以确保所有步骤都按照规定进行,重点监控设备的运行状态并持续收集分析数据,仅在标定结果经过多级复核,确保准确无误后才能重新投运设备;
若最大概率的值对应的是正常状态,则将此样本标记为正常,同时建议保持实时监测和维护以确保系统持续正常运行;
若最大概率的值对应的是故障类型,则将此样本标记为故障,同时确定概率最大的值所对应的故障类型是传感器错误、信号漂移错误、过程控制错误、设备超限运行、设备间信号不匹配故障还是系统误报警和漏报警故障,
若故障类型为传感器错误,则对传感器进行仔细检查以确保传感器的连接正确、供电正常,并且没有明显的损坏或破坏痕迹;若传感器被确认为正常工作但存在偏差或不准确的情况,则进行传感器校准以调整其输出准确性;若传感器经过检查和校准后仍存在问题,则考虑更换传感器;同时检查传感器回路包括连接电缆、接线端子和接地以确保传感器回路没有松动和接触不良,并定期检查传感器的工作状态,同时进行必要的清洁和保养以确保其持续正常运行;
若故障类型为过程控制错误,则通过仪表和监控系统检查相关参数和指示是否与预期不符以确定是否存在控制错误;若发现仪表读数与实际情况不符,则对相关仪表进行校准;检查过程控制系统的硬件和软件以确保其正常运行;评估现有的控制策略确定是否需要进行优化或调整;对控制回路进行调试,并检查控制信号的传递和反馈以确保系统中的控制回路正常运行;保持设备的清洁并定期检查控制设备的状态;
若故障类型为设备超限运行,则立即停止超限运行的设备以避免进一步损坏或安全风险的发生;尽快确定设备超限运行的根本原因,并与设备操作人员交流确定故障原因;根据故障原因确定必要的维修和替换措施,并修复设备的损坏部分以确保其恢复到正常运行状态;对超限运行事件进行仔细分析以找出事件中存在的问题和薄弱环节;加强设备操作人员的培训和意识提高,确保能够有效应对类似的超限运行情况;改进设备监测系统,增加对设备状态的实时监测和预警功能;
若故障类型为设备间信号不匹配故障,则检查设备间信号连接是否正确;使用信号发生器检测信号源的输出信号,并与接收设备的期望信号进行比对;检查相关设备的参数配置以确保信号的传递和处理设置正确;若设备之间存在接口不匹配的问题,则进行接口的调试;若存在设备之间信号类型或电平不匹配的情况,则考虑使用信号转换器或适配器;定期进行设备维护和校准;
若系统误报警和漏报警故障,则检查核电厂的报警系统设置,确认报警规则和阈值是否正确设置,确保系统能够准确地检测到异常情况并触发相应的报警;进行传感器的校准和检测设备的维护,若发现传感器或设备异常,则及时修复或更换;验证报警逻辑的正确性,并进行必要的调整和改进以减少误报警和漏报警的发生;定期检查报警系统的运行状态以确保其正常工作;通过对报警系统数据的分析找出误报警和漏报警的主要原因,并制定改进措施;
若有2个以上概率相同且均为最大值,则将此样本标记为并存,同时制定专项检查方案,重点监测各故障模式特征,通过模拟和测试验证各故障模式,组织专家会诊并制定区隔故障方案,按规程顺序实施检查和诊断,确定实际故障并解除问题隐患;
根据设备故障类型匹配对应的修复措施,并重新进行预测,迭代循环,直到随机森林模型输出的概率分布向量中正常状态概率最高为止。
7.如权利要求1所述的基于随机森林的核电设备故障预测和智能标定方法,其特征在于:所述概率分布向量的长度为7,分别对应6类故障类型和1个正常状态,包括传感器错误、信号漂移错误、过程控制错误、设备超限运行、设备间信号不匹配故障、系统误报警和漏报警故障以及状态正常。
8.基于随机森林的核电设备故障预测和智能标定系统,基于权利要求1~7任一所述的基于随机森林的核电设备故障预测和智能标定方法,其特征在于:还包括,
数据采集模块,用于通过部署在核电厂关键设备的传感器实时采集核电厂设备运行数据和标定数据,并通过物联网技术将采集到的设备运行数据传输到核电厂的DCS系统;
数据预处理模块,用于对DCS系统收集到的核电厂标定数据和设备运行数据进行清洗与预处理,并利用线性校准算法对预处理后的数据进行校准和标定;
随机森林构建模块,用于使用训练集训练随机森林模型,评估每个特征的重要性以衡量其在故障类型判断中的贡献程度,并通过迭代调整模型参数来确定最佳参数组合,同时保存训练出的最优随机森林模型;
故障类型判断模块,用于模型输出的概率分布向量中的最高概率来确定标定误差导致的设备故障类型;
修复措施匹配模块,用于根据设备故障类型给出对应的修复措施,同时将修复措施反馈至核电厂设备以确保故障得到及时处理。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1~7任一所述的基于随机森林的核电设备故障预测和智能标定方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1~7任一所述的基于随机森林的核电设备故障预测和智能标定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311203715.2A CN117436569A (zh) | 2023-09-18 | 2023-09-18 | 基于随机森林的核电设备故障预测和智能标定方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311203715.2A CN117436569A (zh) | 2023-09-18 | 2023-09-18 | 基于随机森林的核电设备故障预测和智能标定方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117436569A true CN117436569A (zh) | 2024-01-23 |
Family
ID=89557308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311203715.2A Pending CN117436569A (zh) | 2023-09-18 | 2023-09-18 | 基于随机森林的核电设备故障预测和智能标定方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117436569A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933727A (zh) * | 2024-03-15 | 2024-04-26 | 深圳市渐近线科技有限公司 | 基于物联网的工业大数据处理方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107179503A (zh) * | 2017-04-21 | 2017-09-19 | 美林数据技术股份有限公司 | 基于随机森林的风电机组故障智能诊断预警的方法 |
CN110298485A (zh) * | 2019-05-29 | 2019-10-01 | 国电联合动力技术有限公司 | 基于改进深度随机森林算法的变桨系统故障预测方法 |
CN111860576A (zh) * | 2020-06-05 | 2020-10-30 | 温州大学 | 一种基于随机森林的子宫内膜肿瘤分类标记方法 |
US11169288B1 (en) * | 2017-12-07 | 2021-11-09 | Triad National Security, Llc | Failure prediction and estimation of failure parameters |
CN115061453A (zh) * | 2022-06-20 | 2022-09-16 | 华能核能技术研究院有限公司 | 核电厂dcs故障的处理方法、装置、电子设备及存储介质 |
CN116578833A (zh) * | 2023-04-11 | 2023-08-11 | 上海交通大学 | 基于优化随机森林模型的igbt模块老化故障诊断系统 |
-
2023
- 2023-09-18 CN CN202311203715.2A patent/CN117436569A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107179503A (zh) * | 2017-04-21 | 2017-09-19 | 美林数据技术股份有限公司 | 基于随机森林的风电机组故障智能诊断预警的方法 |
US11169288B1 (en) * | 2017-12-07 | 2021-11-09 | Triad National Security, Llc | Failure prediction and estimation of failure parameters |
CN110298485A (zh) * | 2019-05-29 | 2019-10-01 | 国电联合动力技术有限公司 | 基于改进深度随机森林算法的变桨系统故障预测方法 |
CN111860576A (zh) * | 2020-06-05 | 2020-10-30 | 温州大学 | 一种基于随机森林的子宫内膜肿瘤分类标记方法 |
CN115061453A (zh) * | 2022-06-20 | 2022-09-16 | 华能核能技术研究院有限公司 | 核电厂dcs故障的处理方法、装置、电子设备及存储介质 |
CN116578833A (zh) * | 2023-04-11 | 2023-08-11 | 上海交通大学 | 基于优化随机森林模型的igbt模块老化故障诊断系统 |
Non-Patent Citations (1)
Title |
---|
谢葭: "核电阀门的故障预测研究与系统设计实现", 《中国优秀硕士学位论文全文数据库 工程科技II辑》, 15 January 2022 (2022-01-15), pages 040 - 80 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933727A (zh) * | 2024-03-15 | 2024-04-26 | 深圳市渐近线科技有限公司 | 基于物联网的工业大数据处理方法及系统 |
CN117933727B (zh) * | 2024-03-15 | 2024-06-11 | 深圳市渐近线科技有限公司 | 基于物联网的工业大数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9842302B2 (en) | Population-based learning with deep belief networks | |
CN111027615B (zh) | 基于机器学习的中间件故障预警方法和系统 | |
CN112288021A (zh) | 一种医疗废水监测数据质控方法、装置及系统 | |
CN117436569A (zh) | 基于随机森林的核电设备故障预测和智能标定方法及系统 | |
CN117196066A (zh) | 智慧运维信息分析模型 | |
CN116388402B (zh) | 一种应用于变电设备的异常报警分析方法 | |
CN115456107A (zh) | 一种时间序列异常检测系统及方法 | |
CN113342784A (zh) | 一种电网主变设备风险评估的数据库设计方法 | |
CN113987908A (zh) | 基于机器学习方法的天然气管网泄漏预警方法 | |
CN117743909A (zh) | 一种基于人工智能的供热系统故障分析方法及装置 | |
CN109299201B (zh) | 基于两阶段聚类的电厂生产子系统异常监测方法及装置 | |
CN112882898B (zh) | 基于大数据日志分析的异常检测方法、系统、设备及介质 | |
CN117493798A (zh) | 一种气象环境数据分析方法及系统 | |
CN110455370B (zh) | 防汛抗旱远程遥测显示系统 | |
CN117074852A (zh) | 一种配电网电能监测预警管理方法及系统 | |
CN112345972A (zh) | 基于停电事件的配电网线变关系异常诊断方法、装置及系统 | |
CN117154716A (zh) | 一种分布式电源接入配电网的规划方法及系统 | |
CN116932523A (zh) | 一种整合和监管第三方环境检测机构的平台 | |
CN116126807A (zh) | 一种日志分析方法及相关装置 | |
CN115659271A (zh) | 传感器异常检测方法、模型训练方法、系统、设备及介质 | |
CN113836203A (zh) | 一种网络数据化诊断检测分析系统 | |
CN117574180B (zh) | 燃料生产排放系统数据关联性控制管理系统 | |
CN113627088B (zh) | 基于基因编程和数据融合的机器性能退化评估方法及系统 | |
CN117319355B (zh) | 一种检测数字称重仪CANopen编寻址的方法及系统 | |
CN118041678A (zh) | 一种自动化日志合规检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |