CN112380763A - 一种基于数据挖掘的堆内构件可靠性分析系统及方法 - Google Patents
一种基于数据挖掘的堆内构件可靠性分析系统及方法 Download PDFInfo
- Publication number
- CN112380763A CN112380763A CN202011211049.3A CN202011211049A CN112380763A CN 112380763 A CN112380763 A CN 112380763A CN 202011211049 A CN202011211049 A CN 202011211049A CN 112380763 A CN112380763 A CN 112380763A
- Authority
- CN
- China
- Prior art keywords
- data
- reliability
- prediction
- sample
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000007418 data mining Methods 0.000 title claims abstract description 13
- 238000011156 evaluation Methods 0.000 claims abstract description 36
- 230000008569 process Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000009467 reduction Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims abstract description 7
- 238000013528 artificial neural network Methods 0.000 claims abstract description 6
- 230000015654 memory Effects 0.000 claims abstract description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims abstract description 5
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 20
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 230000000694 effects Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 3
- 238000010835 comparative analysis Methods 0.000 claims description 2
- 238000013501 data transformation Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 claims description 2
- 235000019580 granularity Nutrition 0.000 claims description 2
- 230000005055 memory storage Effects 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims description 2
- 239000000306 component Substances 0.000 claims 5
- 230000007787 long-term memory Effects 0.000 claims 2
- 239000008358 core component Substances 0.000 claims 1
- 230000000306 recurrent effect Effects 0.000 claims 1
- 230000036541 health Effects 0.000 abstract description 3
- 238000013461 design Methods 0.000 description 7
- 230000005856 abnormality Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000003466 welding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据挖掘的堆内构件可靠性分析系统及方法,利用监督学习,在建模过程中建立评价指标来衡量模型的优劣,得到评价堆内构件可靠性的两种建模指标;基于确定的堆内构件健康状态评估的指标,对采集到的数据进行降维处理,构建可靠性评价的业务特征;然后基于堆内构件运行状态数据的时序性特点,将当前样本重构为具有时序性的样本集,通过长短时记忆循环神经网络预测方法建立模型框架;模型训练过程则是基于预测目的,选择交叉熵损失函数和Adam优化器,寻找算法模型参数,预测堆内构件的可靠性。本发明具有较高的识别精度和泛化能力,性能好,适用于堆内构件的健康状态识别和可靠性判断。
Description
技术领域
本发明涉及堆内构件的状态识别和故障诊断,特别涉及一种基于数据挖掘的堆内构件可靠性分析系统与方法。
背景技术
压水堆核电站的安全主要取决于一回路的安全。根据核安全法规规定,一回路的所有机械设备及管道均属于核安全1级和抗地震1类。一回路的主设备之一是反应堆压力容器。容器内的各部件称堆内构件。堆内构件主要包括堆芯下部支承构件、堆芯上部支承构件、堆内测量装置等。反应堆运行时,堆内各构件处在高温、高压、有腐蚀、强辐照、强释热率以及多种载荷冲击等恶劣环境中。导致一回路主设备及管系破损的原因较多,如热工水力设计、机械设计、制造、选材、焊接、安装等不合理,以及反应性波动和地震。堆内构件一旦发生振动,会进一步扩大破裂程度。因此,防止堆内构件发生振动就是保证核电站安全可靠地运行的重要环节之一。
日前堆内构件的设计大都依赖于确定论的方法,这往往导致在某些方面设计过于保守,而在另一些方面已有的理论又没有充分考虑到,无法预估到其在复杂的运行条件下可能出现的故障及其风险概率,因而导致堆内构件仍然未满足实际工程的需求。同时,由于堆内构件的零部件众多,失效形式也多样,需要有针对性的分门别类逐一分析,确定相应的可靠性评价指标和方法。
发明内容
为了更好的实现堆内构件健康状态识别和诊断,本发明提供一种基于数据挖掘的堆内构件可靠性分析系统与方法。具体技术方案如下:
一种基于数据挖掘的堆内构件可靠性分析系统,该系统包括:数据预处理模块、堆内构件可靠性评价指标确立模块、可靠性评价特征构建模块、可靠性评价维度解析模块、可靠性预测分析模块,其中:
数据预处理模块,对堆内构件采集的数据进行异常值处理、空值处理、离散化处理和归一化处理;
堆内构件可靠性评价指标确立模块,利用监督学习,在建模过程中建立评价指标来衡量模型的优劣,得到评价堆内构件可靠性评的两种建模指标;
可靠性评价特征构建模块,基于确定的堆内构件可靠性评价指标,对采集到的数据进行降维处理,构建可靠性评价的业务特征;
可靠性评价维度解析模块,基于堆内构件运行状态数据的时序性特点,将当前样本重构为具有时序性的样本集;
可靠性预测分析模块,通过长短时记忆循环神经网络预测方法建立模型框架;模型训练过程则是基于预测目的,选择交叉熵损失函数和Adam优化器,寻找算法模型参数,预测堆内构件的可靠性。
进一步地,所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现。离散化处理和归一化处理,由特征简约和数据变换实现。
进一步地,所述的堆内构件可靠性评价指标确立模块中,两种建模指标包括ROC曲线面积为指标和F值系列指标。
进一步地,所述的ROC曲线是以面积为指标,评估所有分类阈值下模型的整体性能,描述的是正例率(True Positive Rate,TPR)和负利率(False Positive Rate,FPR)之间的关系曲线,其中TPR和FPR是基于二元分类混淆矩阵的计算获得。
进一步地,所述的F值系列指标则是对某一具体分类阈值模型的预测结果进行评估,包括准确率(accuracy)、精确率(precision)、召回率(recall)三个指标。准确率(accuracy)表示在给定的测试数据集中,分类器正确预测的样本数与总样本数之比,其计算公式如(1)所示:
其中,TP表示实际值和预测值同为正例的样本数;FP表示实际值为负例,但被预测为正例的样本数;FN表示实际值为正例,但被预测为负例的样本数;TN表示实际值和预测值同为负例的样本数。
精确率(precision)表示预测为正例的实例中实际为正例的比例,其计算公式如(2)所示:
召回率(recall)关注的是单一类别的预测准确率,度量有多少个正例被预测为正例,其计算公式如(3)所示:
进一步地,所述的可靠性评价特征构建模块中的降维采用的是自动编码器的方法,是深度学习中一种常用的无监督学习模型,误差来源于重构数据与原输入数据的对比,通过无监督学习的方法尽可能复现输入信号。
进一步地,所述的可靠性评价维度解析模块,是基于多维时序序列预测的样本重构方法,分别从数据集和标签集的角度出发,将采集的时间点数据集重构成时间序列样本,将当前状态标签集重构为预测状态标签集,具体实现如式(4)到式(5)所示。
其中,矩阵A表示原带标签的样本集,ai表示第i条样本,ci表示第i条样本对应的标签,m表示维度数量,n表示样本点数量。
其中,矩阵B表示基于时序特点重构的带标签的样本集。参数i和j为输入数据时序长度和预测状态时间点。
进一步地,所述的可靠性预测分析模块中的长短时记忆循环神经网络(LSTM)预测方法,通过在隐藏层中引入记忆存储模块——单元状态(Cell State),并增加输入控制门(input)、忘记控制门(forget)、输出控制门(output),决定在单元状态中被记忆的信息,从而实现长时间记忆功能。
一种基于数据挖掘的堆内构件可靠性分析方法,步骤如下:
1)根据经验初设样本占比和代价敏感学习参数、批量和批次;
2)给定时序长度参数i和预测状态时间间隔参数j的取值范围和取值粒度,确定i和j的取值,并使用交叉组合的方式生成m组数据;
3)依次利用m组i和j的组合值进行基于多维时序序列的样本重构,得到m组输入数据时序长度和预测状态时间间隔均不同的样本集。同时,为保证m组数据建模结果的可比性,需保证不同样本集在预测时间点上的一致性;
4)依次对m组样本集进行建模预测,并对不同模型在测试集上的应用效果进行对比评估,应用效果最优的i和j的组合值即为i和j的参数值;
5)在i、j最优组合的基础上,初设批量p和批次n,给定样本占比和代价敏感学习参数的取值范围,使用网格搜索进行寻优,并通过模型在测试集上的应用效果确定样本占比和代价敏感学习参数的最优组合;
6)在i、j最优组合以及给定样本占比和代价敏感学习参数的最优组合的基础上,给定批量p和批次n的取值范围,使用网格搜索进行寻优,并通过模型在测试集上的应用效果确定p和n的最优组合;
7)根据不同数量的数据子集模型在测试集上应用效果的加权结果,确定最优加权方式以及数据子集个数。
本发明的有益效果主要表现在可以基于一个准确的模型来监测堆内构件的健康运行状态,基于数据挖掘的设计方法全面评估堆内构件的安全程度和经济合理性,失效的可能性大小用概率设计计算,概率设计过程中向各个零部件(局部)合理分配其必须具备的可靠性概率。本发明具有较高的识别精度和泛化能力,预测误差较低,预测效果良好,设计结果既满足了总体要求同时也能改善经济性。
附图说明
图1为基于数据挖掘的堆内构件可靠性分析系统结构示意图。
图2为堆内构件数据的预处理过程图。
图3为堆内构件振动指标预测模型在测试集上应用的准确率结果统计图。
图4为堆内构件振动指标预测模型在同一测试集上应用的异常识别率和异常误判率统计图。
图5为堆内构件可靠性预测模型(p、n)测试集应用的异常识别率和误判率。
具体实施方式
参考附图能更加全面地描述本发明,图上显示本发明的某些实施例,但是并非所有的实施例。实际上,本发明可以以很多不同的形式被体现,不应该把它看作仅限于这里所阐述的实施例,而应该把本发明的实施例看作是为了使本发明公开的内容满足可应用的合法要求而提供的。下面结合说明书附图和具体实现方式对本发明内容作详细说明说明。
图1列出了基于数据挖掘的堆内构件可靠性分析系统各模块的功能以及各模块之间的逻辑关系。
数据预处理模块,对堆内构件采集的数据进行异常值处理、空值处理、离散化处理和归一化处理,为数据的挖掘分析做好了准备;
堆内构件可靠性评价指标确立模块,利用一种监督学习,在建模过程中建立评价指标来衡量模型的优劣,得到评价堆内构件可靠性评的两种建模指标;
可靠性评价特征构建模块,基于确定的堆内构件可靠性评价指标,对采集到的数据进行降维处理,构建可靠性评价的业务特征;
可靠性评价维度解析模块,基于堆内构件运行状态数据的时序性特点,将当前样本重构为具有时序性的样本集;
可靠性预测分析模块,通过长短时记忆循环神经网络(LSTM)预测方法建立模型框架;模型训练过程则是基于预测目的,选择交叉熵损失函数和Adam优化器,寻找算法模型参数,预测堆内构件的可靠性。交叉熵损失函数通过度量预测值的分布和真实值的分布之间的相似性,完成误差计算;Adam优化器是一种基于梯度的优化算法,具有收敛速度快、计算高效、内存占用少等特点。
如图2所示为堆内构件数据的预处理过程图。数据质量对数据挖掘的分析结果有很大影响。获取的堆内构件原始数据中包含了大量属性,存在错误值和异常值,需要对数据进行初步筛选,去除错误值和异常值,确保数据的准确性,并去除与挖掘无关的属性,而且要保证样本数据的多样性和特征信息的完备性。此外,还需要根据算法需求对数据进行处理,使数据满足算法的输入要求。
如图3所示为堆内构件振动指标预测模型在测试集上应用的准确率结果统计图。通过测试样本集准确率的统计,可以大致分析不同i、j取值对结果的影响。通过右侧的不同j值模型准确率对比图,发现不同的i值下均存在j值越大,模型准确率越低的情况。通过底部的不同i值模型准确率对比图,发现j取4s、6s、8s时,i取值较大时,模型准确率高。i、j取值需要进一步根据异常识别率和异常误判率进行确定。
如图4所示为堆内构件振动指标预测模型在同一测试集上应用的异常识别率和异常误判率统计图。左图为异常识别率,右图为异常误判率。基于业务需求,异常识别率较高时且异常误判率较低时模型效果好,则在图4,根据图例,颜色深的i、j值为所求值。
图5为堆内构件可靠性预测模型(p、n)测试集应用的异常识别率和误判率。预测算法模型参数是指批量p和批次n。基于分批训练的原理,不同样本集的批量p和批次n不同。因此,需针对a组训练集分别寻找最优的p、n组合。
设a值为5,选取了5组符合i、j、k’(样本占比,异常类与正常类的比值)、c(代价敏感学习参数)参数值的训练样本。设定p的取值依次为50、100、200、500、1000、2000,设定n为最小值200、最大值3000、以200为差值的等差数列,共有90种组合形式。分别对5组样本完成90组模型训练,寻找90组模型中,测试集应用效果最优的批量p和批次n的参数值。
基于90组不同预测模型在测试集中的应用结果,绘制了样本集的异常识别率和异常误判率关系图如图5所示,以“p_n”的形式标注了部分数据点的p、n值,并以75%的识别率和30%的误判率为依据绘制四象限图。在右下角象限内,批次较小的模型总体性能较优。
在图5标注的两个模型中,模型参数分别为“200_2800”、“100_600”,即以200个样本为一批,训练2800次和以100个样本为一批,训练600次的模型性能较优。任意选择一组结果作为组1样本集预测模型中批量p和批次n的参数值。使用同样的方法确定另外4组样本集的批量p和批次n参数值,结果如表1所示。
表1其他数据子集壳体振动预测模型的批量p和批次n参数值及测试集应用结果
组别 | p值 | n值 | 异常识别率 | 异常误判率 |
组2 | 500 | 1000 | 79.2% | 22.5% |
组3 | 200 | 600 | 79.2% | 24.3% |
组4 | 100 | 1000 | 80.0% | 23.0% |
组5 | 200 | 1600 | 80.8% | 25.0% |
从图5和表1中可以看出预测误差较低,预测值基本能够反映数值的变化趋势,模型的预测效果良好。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (9)
1.一种基于数据挖掘的堆内构件可靠性分析系统,其特征在于,该系统包括:数据预处理模块、堆内构件可靠性评价指标确立模块、可靠性评价特征构建模块、可靠性评价维度解析模块、可靠性预测分析模块,其中:
数据预处理模块,对堆内构件采集的数据进行异常值处理、空值处理、离散化处理和归一化处理;
堆内构件可靠性评价指标确立模块,利用监督学习,在建模过程中建立评价指标来衡量模型的优劣,得到评价堆内构件可靠性的两种建模指标;
可靠性评价特征构建模块,基于确定的堆内构件可靠性评价指标,对采集到的数据进行降维处理,构建可靠性评价的业务特征;
可靠性评价维度解析模块,基于堆内构件运行状态数据的时序性特点,将当前样本重构为具有时序性的样本集;
可靠性预测分析模块,通过长短时记忆循环神经网络预测方法建立模型框架;模型训练过程则是基于预测目的,选择交叉熵损失函数和Adam优化器,寻找算法模型参数,预测堆内构件的可靠性。
2.如权利要求1所述的系统,其特征在于,所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现。离散化处理和归一化处理,由特征简约和数据变换实现。
3.如权利要求1所述的系统,其特征在于,所述的堆内构件可靠性评价指标确立模块中,所述的两种建模指标包括ROC曲线面积为指标和F值系列指标。
4.如权利要求3所述的系统,其特征在于,所述ROC曲线是以面积为指标,评估所有分类阈值下模型的整体性能,描述的是正例率TPR和负利率FPR之间的关系曲线,其中TPR和FPR是基于二元分类混淆矩阵的计算获得。
5.如权利要求3所述的系统,其特征在于,所述F值系列指标则是对某一具体分类阈值模型的预测结果进行评估,包括准确率(accuracy)、精确率(precision)、召回率(recall)三个指标。
准确率表示在给定的测试数据集中,分类器正确预测的样本数与总样本数之比,其计算公式如(1)所示:
其中,TP表示实际值和预测值同为正例的样本数;FP表示实际值为负例,但被预测为正例的样本数;FN表示实际值为正例,但被预测为负例的样本数;TN表示实际值和预测值同为负例的样本数。
精确率表示预测为正例的实例中实际为正例的比例,其计算公式如(2)所示:
召回率关注的是单一类别的预测准确率,度量有多少个正例被预测为正例,其计算公式如(3)所示:
6.如权利要求1所述的系统,其特征在于,所述的可靠性评价特征构建模块中的降维采用的是自动编码器的方法,是深度学习中一种无监督学习模型,误差来源于重构数据与原输入数据的对比,通过无监督学习的方法尽可能复现输入信号。
8.如权利要求1所述的系统,其特征在于,所述的可靠性预测分析模块中的长短时记忆循环神经网络(LSTM)预测方法,通过在隐藏层中引入记忆存储模块——单元状态(CellState),并增加输入控制门(input)、忘记控制门(forget)、输出控制门(output),决定在单元状态中被记忆的信息,从而实现长时间记忆功能。
9.一种基于数据挖掘的堆内构件可靠性分析方法,其特征在于,包括步骤:
1)根据经验初设样本占比和代价敏感学习参数、批量和批次;
2)给定时序长度参数i和预测状态时间间隔参数j的取值范围和取值粒度,确定i和j的取值,并使用交叉组合的方式生成m组数据;
3)依次利用m组i和j的组合值进行基于多维时序序列的样本重构,得到m组输入数据时序长度和预测状态时间间隔均不同的样本集。同时,为保证m组数据建模结果的可比性,需保证不同样本集在预测时间点上的一致性;
4)依次对m组样本集进行建模预测,并对不同模型在测试集上的应用效果进行对比评估,应用效果最优的i和j的组合值即为i和j的参数值;
5)在i、j最优组合的基础上,初设批量p和批次n,给定样本占比和代价敏感学习参数的取值范围,使用网格搜索进行寻优,并通过模型在测试集上的应用效果确定样本占比和代价敏感学习参数的最优组合;
6)在i、j最优组合以及给定样本占比和代价敏感学习参数的最优组合的基础上,给定批量p和批次n的取值范围,使用网格搜索进行寻优,并通过模型在测试集上的应用效果确定p和n的最优组合;
7)根据不同数量的数据子集模型在测试集上应用效果的加权结果,确定最优加权方式以及数据子集个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011211049.3A CN112380763A (zh) | 2020-11-03 | 2020-11-03 | 一种基于数据挖掘的堆内构件可靠性分析系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011211049.3A CN112380763A (zh) | 2020-11-03 | 2020-11-03 | 一种基于数据挖掘的堆内构件可靠性分析系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112380763A true CN112380763A (zh) | 2021-02-19 |
Family
ID=74578285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011211049.3A Pending CN112380763A (zh) | 2020-11-03 | 2020-11-03 | 一种基于数据挖掘的堆内构件可靠性分析系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112380763A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298342A (zh) * | 2021-03-25 | 2021-08-24 | 深圳供电局有限公司 | 一种电力调度指令安全状态的分析方法 |
CN113568368A (zh) * | 2021-07-30 | 2021-10-29 | 北京石油化工学院 | 一种工控数据特征重排序算法的自适应确定方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108231201A (zh) * | 2018-01-25 | 2018-06-29 | 华中科技大学 | 一种疾病数据分析处理模型的构建方法、系统及应用 |
CN108509644A (zh) * | 2018-04-12 | 2018-09-07 | 成都优易数据有限公司 | 一种具备模型预警更新机制的数据挖掘方法 |
CN109766930A (zh) * | 2018-12-24 | 2019-05-17 | 太原理工大学 | 一种基于dcnn模型的矿井机械设备的剩余寿命预测方法 |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
CN110286668A (zh) * | 2019-07-15 | 2019-09-27 | 广东毓秀科技有限公司 | 一种基于大数据的轨交信号系统vim板卡故障预测方法 |
CN110285976A (zh) * | 2019-07-09 | 2019-09-27 | 哈尔滨工业大学(威海) | 基于dbn的多维时序信息驱动航空发动机故障诊断方法 |
CN110941928A (zh) * | 2019-11-26 | 2020-03-31 | 哈尔滨理工大学 | 一种基于dropout-SAE和Bi-LSTM的滚动轴承剩余寿命预测方法 |
CN111563706A (zh) * | 2020-03-05 | 2020-08-21 | 河海大学 | 一种基于lstm网络的多变量物流货运量预测方法 |
-
2020
- 2020-11-03 CN CN202011211049.3A patent/CN112380763A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108231201A (zh) * | 2018-01-25 | 2018-06-29 | 华中科技大学 | 一种疾病数据分析处理模型的构建方法、系统及应用 |
CN108509644A (zh) * | 2018-04-12 | 2018-09-07 | 成都优易数据有限公司 | 一种具备模型预警更新机制的数据挖掘方法 |
CN109766930A (zh) * | 2018-12-24 | 2019-05-17 | 太原理工大学 | 一种基于dcnn模型的矿井机械设备的剩余寿命预测方法 |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
CN110285976A (zh) * | 2019-07-09 | 2019-09-27 | 哈尔滨工业大学(威海) | 基于dbn的多维时序信息驱动航空发动机故障诊断方法 |
CN110286668A (zh) * | 2019-07-15 | 2019-09-27 | 广东毓秀科技有限公司 | 一种基于大数据的轨交信号系统vim板卡故障预测方法 |
CN110941928A (zh) * | 2019-11-26 | 2020-03-31 | 哈尔滨理工大学 | 一种基于dropout-SAE和Bi-LSTM的滚动轴承剩余寿命预测方法 |
CN111563706A (zh) * | 2020-03-05 | 2020-08-21 | 河海大学 | 一种基于lstm网络的多变量物流货运量预测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298342A (zh) * | 2021-03-25 | 2021-08-24 | 深圳供电局有限公司 | 一种电力调度指令安全状态的分析方法 |
CN113568368A (zh) * | 2021-07-30 | 2021-10-29 | 北京石油化工学院 | 一种工控数据特征重排序算法的自适应确定方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Al-Dahidi et al. | Remaining useful life estimation in heterogeneous fleets working under variable operating conditions | |
CN108985335B (zh) | 核反应堆包壳材料辐照肿胀的集成学习预测方法 | |
CN115618732B (zh) | 核反应堆数字孪生关键参数自主优化数据反演方法 | |
CN111738520A (zh) | 一种融合孤立森林与长短期记忆网络的系统负载预测方法 | |
CN112147432A (zh) | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统 | |
CN109472097B (zh) | 一种输电线路在线监测设备故障诊断方法 | |
CN113642754A (zh) | 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法 | |
CN109165242B (zh) | 一种基于熵排序与时空分析的故障诊断及预警方法 | |
CN113343581B (zh) | 基于图马尔可夫神经网络的变压器故障的诊断方法 | |
CN112380763A (zh) | 一种基于数据挖掘的堆内构件可靠性分析系统及方法 | |
CN112116198A (zh) | 数据驱动的流程工业状态感知网络关键节点筛选方法 | |
CN113485863B (zh) | 基于改进生成对抗网络生成异构不平衡故障样本的方法 | |
CN116562114A (zh) | 一种基于图卷积神经网络的电力变压器故障诊断方法 | |
CN114925536A (zh) | 机载系统phm测试性建模与诊断策略优化方法和装置 | |
Wang et al. | A remaining useful life prediction model based on hybrid long-short sequences for engines | |
CN112036087A (zh) | 一种多策略融合的核动力关键设备故障诊断方法及系统 | |
CN110244690B (zh) | 一种多变量工业过程故障辨识方法及系统 | |
CN116431966A (zh) | 一种增量式特征解耦自编码器的堆芯温度异常检测方法 | |
CN109240276A (zh) | 基于故障敏感主元选择的多块pca故障监测方法 | |
CN116306806A (zh) | 故障诊断模型确定方法、装置及非易失性存储介质 | |
CN117076171A (zh) | 一种面向多元时序数据的异常检测及定位方法及装置 | |
Wang et al. | Assessing the Performance Degradation of Lithium‐Ion Batteries Using an Approach Based on Fusion of Multiple Feature Parameters | |
CN114298413B (zh) | 一种水电机组振摆趋势预测方法 | |
CN112052952B (zh) | 基于遗传算法的柴油机故障诊断中监测参数优化选取方法 | |
Najar et al. | Comparative Machine Learning Study for Estimating Peak Cladding Temperature in AP1000 Under LOFW |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |