CN112257942B - 一种应力腐蚀开裂预测方法及系统 - Google Patents

一种应力腐蚀开裂预测方法及系统 Download PDF

Info

Publication number
CN112257942B
CN112257942B CN202011177708.6A CN202011177708A CN112257942B CN 112257942 B CN112257942 B CN 112257942B CN 202011177708 A CN202011177708 A CN 202011177708A CN 112257942 B CN112257942 B CN 112257942B
Authority
CN
China
Prior art keywords
elm
classifier
training
prediction
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011177708.6A
Other languages
English (en)
Other versions
CN112257942A (zh
Inventor
曹逻炜
刘军民
杜玉倩
蔡起衡
李光海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Special Equipment Inspection and Research Institute
Original Assignee
China Special Equipment Inspection and Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Special Equipment Inspection and Research Institute filed Critical China Special Equipment Inspection and Research Institute
Priority to CN202011177708.6A priority Critical patent/CN112257942B/zh
Publication of CN112257942A publication Critical patent/CN112257942A/zh
Application granted granted Critical
Publication of CN112257942B publication Critical patent/CN112257942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)

Abstract

本发明公开一种应力腐蚀开裂预测方法及系统,方法包括:根据训练集确定最优ELM分类器个数m;根据最优ELM分类器个数m、训练集和测试集确定m个分类器;采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;将待测试样本数据输入AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。本发明采用集成学习中的Adaboost算法将m个ELM分类器进行叠加,既提升了AdaELM集成预测分类器的性能,又避免了ELM算法自身的不稳定性,进而以提高应力腐蚀开裂预测的准确性。

Description

一种应力腐蚀开裂预测方法及系统
技术领域
本发明涉及应力腐蚀开裂预测技术领域,特别是涉及一种应力腐蚀开裂预测方法及系统。
背景技术
应力腐蚀开裂(以下简称SCC)是承压类特种设备风险评价中的重要损伤模式,其开裂受材料、应力和介质环境三大因素的共同作用,存在着巨大的事故潜在风险,威胁国民生命和财产安全。根据我国GB/T 30579-2014《承压设备损伤模式识别》规定:当设备暴露在能够导致管道或容器开裂的环境中,例如含氯化物、硫化物、碳酸盐或碱性环境,在受到一定的应力情况下则会很容易发生应力腐蚀开裂现象,进而引发承压设备失效甚至发生事故灾害,具有十分严重的危险性和破坏性。目前,大多数事故风险是可以通过常规检验方法提前预知的,但是SCC作为工业生产中危害较大的一种损伤模式,却无法轻易预知。因此,亟需对应力腐蚀开裂进行预测研究,以便提前应对风险并采取相应策略。
目前,国内外已有部分学者将机器学习算法应用于应力腐蚀开裂预测中,例如传统的SVM支持向量机、三层BP神经网络和EF反馈神经网络模型,结果表明这些模型都有较好的预测效果,证明了用机器学习预测SCC的可行性。但这些传统的算法都存在容易发生过拟合的缺点,且BP神经网络容易陷入局部极值。
发明内容
基于此,本发明的目的是提供一种应力腐蚀开裂预测方法及系统,以提高应力腐蚀开裂预测的准确性。
为实现上述目的,本发明提供了一种应力腐蚀开裂预测方法,所述方法包括:
步骤S1:构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
步骤S2:根据所述历史数据集确定训练集和测试集;
步骤S3:根据所述训练集确定最优ELM分类器个数m;
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
步骤S6:获取待测试样本数据;
步骤S7:将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
可选地,所述根据所述历史数据集确定训练集和测试集,具体包括:
步骤S21:将所述历史数据集划分模型输入数据集和模型输出数据集;
步骤S22:对所述模型输入数据集进行对数变换,获得对数数据集;
步骤S23:对所述对数数据集进行归一化处理,获得归一化数据集;
步骤S24:根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
可选地,所述根据所述训练集和所述测试集确定最优ELM分类器个数,具体包括:
步骤S31:将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
步骤S32:将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
步骤S33:利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
步骤S34:绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
可选地,所述根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器,具体包括:
步骤S41:初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
步骤S42:从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
步骤S43:将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
步骤S44:判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“步骤S45”;如果k小于设定值Q,则令k=k+1,返回“步骤S42”;
步骤S45:选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
步骤S46:基于所述测试集确定第i个ELM分类器对应的权重;
步骤S47:根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
步骤S48:判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“步骤S42”。
可选地,所述基于所述测试集确定第i个ELM分类器对应的权重,具体包括:
步骤S461:将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
步骤S462:将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
步骤S463:根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
本发明还提供一种应力腐蚀开裂预测系统,所述系统包括:
历史数据集构建模块,用于构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
训练集和测试集确定模块,用于根据所述历史数据集确定训练集和测试集;
最优ELM分类器个数确定模块,用于根据所述训练集确定最优ELM分类器个数m;
分类器确定模块,用于根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
AdaELM集成预测分类器确定模块,用于采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
获取模块,用于获取待测试样本数据;
预测模块,用于将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
可选地,所述训练集和测试集确定模块,具体包括:
第一集合划分单元,用于将所述历史数据集划分模型输入数据集和模型输出数据集;
对数变换单元,用于对所述模型输入数据集进行对数变换,获得对数数据集;
归一化处理单元,用于对所述对数数据集进行归一化处理,获得归一化数据集;
第二集合划分单元,用于根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
可选地,所述最优ELM分类器个数确定模块,具体包括:
第一训练单元,用于将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
预测单元,用于将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
准确率确定单元,用于利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
最优ELM分类器个数选取单元,用于绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
可选地,所述分类器确定模块,具体包括:
初始化单元,用于初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
抽样单元,用于从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
第二训练单元,用于将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
第一判断单元,用于判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“选取单元”;如果k小于设定值Q,则令k=k+1,返回“抽样单元”;
选取单元,用于选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
分类器权重确定单元,用于基于所述测试集确定第i个ELM分类器对应的权重;
初始权重确定单元,用于根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
第二判断单元,用于判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“抽样单元”。
可选地,所述分类器权重确定单元,具体包括:
预测子单元,用于将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
错误率确定子单元,用于将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
分类器权重确定子单元,用于根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开一种应力腐蚀开裂预测方法及系统,方法包括:根据训练集确定最优ELM分类器个数m;根据最优ELM分类器个数m、训练集和测试集确定m个分类器;采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;将待测试样本数据输入AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。本发明采用集成学习中的Adaboost算法将m个ELM分类器进行叠加,既提升了AdaELM集成预测分类器的性能,又避免了ELM算法自身的不稳定性,进而以提高应力腐蚀开裂预测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例应力腐蚀开裂预测方法流程图;
图2为本发明实施例应力腐蚀开裂预测过程示意图;
图3为本发明实施例分类器的个数对AdaELM分类准确率的影响示意图;
图4为本发明实施例应力腐蚀开裂预测系统结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种应力腐蚀开裂预测方法及系统,以提高应力腐蚀开裂预测的准确性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1-2所示,本发明公开一种应力腐蚀开裂预测方法,所述方法包括:
步骤S1:构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果。
步骤S2:根据所述历史数据集确定训练集和测试集。
步骤S3:根据所述训练集确定最优ELM分类器个数m。
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器。
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器。
步骤S6:获取待测试样本数据。
步骤S7:将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
下面对各个步骤进行详细论述:
步骤S1:构建历史数据集;所述历史数据集包括温度(Temp)、氯离子浓度(Chlorides)、氧浓度(Oxygen)和应力腐蚀开裂(SCC)的实际分类结果;所述应力腐蚀开裂的实际分类结果包括“0”和“1”;其中,“1”代表已发生应力腐蚀开裂行为,“0”代表未发生应力腐蚀开裂行为。
步骤S2:根据所述历史数据集确定训练集和测试集,具体包括:
步骤S21:将所述历史数据集划分模型输入数据集和模型输出数据集;其中,所述模型输入数据集包括温度、氯离子浓度和氧浓度,所述模型输出数据集包括应力腐蚀开裂的实际分类结果。
步骤S22:对所述模型输入数据集进行对数变换,获得对数数据集,具体计算公式为:
X′=ln(X);
其中,X′表示对数数据集,X表示模型输入数据集。
步骤S23:对所述对数数据集进行归一化处理,获得归一化数据集,具体计算公式为:
其中,X*表示归一化数据集,X′表示对数数据集。
步骤S24:根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集,所述训练集包括:训练输入集X_train和训练输出集Y_train;所述测试集包括:测试输入集X_test和测试输出集Y_test。
具体的,将70%的所述归一化数据集划分为训练输入集X_train,将30%的所述归一化数据集划分为测试输入集X_test,将70%的所述模型输出数据集划分为训练输出集Y_train,将30%的所述模型输出数据集划分为测试输出集Y_test。
步骤S3:根据所述训练集和所述测试集确定最优ELM分类器个数,具体包括:
步骤S31:将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器。
步骤S32:将所述测试输入集输入各所述ELM分类器,获得各所述ELM分类器对应的预测输出集。
步骤S33:利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率。
步骤S34:绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
在一定程度内,ELM分类器越多,模型预测的准确率和精度也就越高,但所消耗的时间和训练成本也就越多。因此,ELM分类器个数的选择需综合准确率和训练效率两方面考虑。
如图3所示,根据训练集绘制出ELM分类器个数与准确率的关系折线图,在训练效率高的前提下,选出对应准确率最高的ELM分类器个数作为最优ELM分类器个数。图3中9次迭代的用时仅为0.29秒,效率最高,因此确定ELM分类器个数为9。
本发明更新样本权重的目的是提高被分类错误的样本的权重,降低分类正确的样本权重,更加关注被分类错误的样本。例如ELM分类器1确定之后,对之前的训练样本权重集D1进行更新,然后用于训练ELM分类器2的过程中。ELM分类器2的选择与ELM分类器1的方法相同,随机建立10个模型,从中挑选出误差最小的作为ELM分类器2,而误差的计算就是被分类错误的样本对应的样本权重之和。所以提高被分类错误样本的权重更有利于找到能将这些之前被错误分类的样本分类正确的模型,因此总结的具体步骤如下:
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器,具体包括:
步骤S41:初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;所述初始权重为总样本个数的均值,具体计算公式为:
其中,wij表示用于训练第i个ELM分类器的第j个训练样本的权值,N表示训练样本的总个数,D1表示用于训练第i个ELM分类器的N个训练样本权重的集合。
步骤S42:从所述训练集中分别有放回地循环随机抽样,获得N个训练样本。
步骤S43:将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器。
步骤S44:判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“S45”;如果k小于设定值Q,则令k=k+1,返回“步骤S42”。本实施例中设定值Q取10。
步骤S45:选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器。
步骤S46:基于所述测试集确定第i个ELM分类器对应的权重,具体包括:
步骤S461:将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果。
步骤S462:将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率,具体公式为:
其中,ti表示第i个ELM分类器未正确分类的个数,N表示测试集中测试样本总个数,εi表示第i个ELM分类器对应的错误率。
步骤S463:根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重,具体公式为:
其中,αi表示第i个ELM分类器对应的权重,εi表示第i个ELM分类器对应的错误率。
步骤S47:根据第i个ELM分类器对应的权重更新各训练样本的初始权重,具体公式为:
其中,表示WiN表示第i个分类器的第N个训练样本的权重,W(i-1)N表示第i-1个分类器的第N个训练样本的权重,αi-1表示第i-1个分类器的权重,yN表示第N个训练样本的实际分类结果,Gi-1(XN)表示第i-1个分类器对第N个训练样本的预测分类结果。Zi-1表示第i-1个分类器的规范化因子。
步骤S48:判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“步骤S42”。
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器,具体计算公式为:
其中,F(x)表示AdaELM集成预测分类器,ai表示第i个ELM分类器对应的权重,Gi(x)表示第i个ELM分类器,m表示最优ELM分类器个数,sign()表示符号函数,
如图4所示,本发明还提供一种应力腐蚀开裂预测系统,所述系统包括:
历史数据集构建模块1,用于构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果。
训练集和测试集确定模块2,用于根据所述历史数据集确定训练集和测试集。
最优ELM分类器个数确定模块3,用于根据所述训练集确定最优ELM分类器个数m。
分类器确定模块4,用于根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器。
AdaELM集成预测分类器确定模块5,用于采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器。
获取模块6,用于获取待测试样本数据。
预测模块7,用于将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
作为一种可选的实施方式,本发明所述训练集和测试集确定模块2,具体包括:
第一集合划分单元,用于将所述历史数据集划分模型输入数据集和模型输出数据集。
对数变换单元,用于对所述模型输入数据集进行对数变换,获得对数数据集。
归一化处理单元,用于对所述对数数据集进行归一化处理,获得归一化数据集。
第二集合划分单元,用于根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
作为一种可选的实施方式,本发明所述最优ELM分类器个数确定模块3,具体包括:
第一训练单元,用于将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器。
预测单元,用于将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集。
准确率确定单元,用于利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率。
最优ELM分类器个数选取单元,用于绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
作为一种可选的实施方式,本发明所述分类器确定模块4,具体包括:
初始化单元,用于初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重。
抽样单元,用于从所述训练集中分别有放回地循环随机抽样,获得N个训练样本。
第二训练单元,用于将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器。
第一判断单元,用于判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“选取单元”;如果k小于设定值Q,则令k=k+1,返回“抽样单元”。
选取单元,用于选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器。
分类器权重确定单元,用于基于所述测试集确定第i个ELM分类器对应的权重。
初始权重确定单元,用于根据第i个ELM分类器对应的权重更新各训练样本的初始权重。
第二判断单元,用于判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“抽样单元”。
作为一种可选的实施方式,本发明所述分类器权重确定单元,具体包括:
预测子单元,用于将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果。
错误率确定子单元,用于将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率。
分类器权重确定子单元,用于根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
本发明采用集成学习中的Adaboost算法将m个ELM分类器进行叠加,既提升了AdaELM集成预测分类器的性能,又避免了ELM算法自身的不稳定性,进而以提高应力腐蚀开裂预测的准确性。
由于在实际工业生产环境中,很难收集与发生应力腐蚀开裂的敏感性相关的环境条件方面的特征数据,进而很难利用收集到的相关文献中的实验数据进行应力腐蚀开裂预测实证研究。本发明收集不同型号的奥氏体不锈钢在不同温度、不同氧浓度和氯离子浓度的水溶液三种场景下的交叉数据,以每种综合数据条件下是否发生应力腐蚀开裂构建ELM分类器。其中,温度条件为60℃~350℃,实验溶液中的氧浓度的变化范围是0.01~1200mg/L,氯离子浓度变化的范围在0.1~1000mg/L,实验材料为两种型号奥氏体不锈钢。
鉴于实际试验中离子浓度会对腐蚀开裂行为产生很大的影响而且不同量纲可能会带来巨大的结果差异,能够严重影响到最终预测结果的准确性,因此在将数据输入神经网络前,提前将应力腐蚀开裂数据进行预处理,即将氧浓度和氯离子浓度都取对数。之后对温度变量、氧浓度和氯离子浓度三项数据进行归一化处理,来减少输入数据的变化幅度,有利于模拟。
同时,对于从数据进行基本统计描述显示,不论是氯离子浓度还是氧浓度对应力腐蚀开裂的影响是正向的,温度与应力腐蚀开裂的敏感性的关系却并非简单的线性关系,这为下文对应力腐蚀开裂敏感性的研究提供了参考。
对应力腐蚀开裂进行预测时,预测分类结果可分为发生应力腐蚀开裂和未发生应力腐蚀开裂。为了更好的评价模型的分类性能,在这个问题中,可以使用准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值、ROC曲线和AUC等指标来度量。其中,准确率表示对应力腐蚀开裂现象的发生与否预测正确的样本与总样本数的比值;精确率指预测会发生应力腐蚀开裂的样本中,实际也确实发生了应力腐蚀开裂的比例,衡量的是分类器的查准率;召回率是指对应力腐蚀开裂现象的发生与否预测正确的所有样本中,正确预测会发生应力腐蚀开裂这一类的样本数所占的比例,衡量的是分类器的查全率;F1值是在精确率和召回率的基础上,考虑对两种评价方法进行整体评价;ROC曲线和AUC值一起共同评价分类器的性能,目的在于使得误差更小的情况下,尽量多的预测承压类特种设备中发生应力腐蚀开裂现象的样本。
分别用逻辑回归(LR)、决策树(DT)、支持向量机(SVM)等机器学习传统的分类模型与加gaussian核函数的ELM分类器在测试集上的结果进行对比,ELM分类器选取隐层神经元个数为20的情况,其结果如表1所示。
表1 ELM分类器与各个分类模型结果对比
随机森林算法RF和梯度提升树算法GBDT都是基于集成思想的分类模型,本发明基于集成学习中的Adaboost算法构建集成AdaELM集成预测分类器,利用测试集采用上述三种方法进行预测,结果如表2所示。
表2 AdaELM分类器与各个集成模型结果对比
由表2中的数据可知,与随机森林RF和梯度提升树GBDT这种同样基于集成思想的分类算法相比,本发明利用Adaboost算法集成多个ELM分类器后获得AdaELM集成预测分类器,预测分类结果会有所提升,在这三种算法中,AdaELM集成预测分类器的预测效果最好,预测准确度高达82.61%,AUC值也高达0.84。从单一的ELM分类器的角度来看,集成后的分类器对测试集的准确度都有所提升:AdaELM集成预测分类器的准确度提升了10.8%,AUC值提升了10.8%。在这三种算法中,最终证实AdaELM分类器的预测效果最好,预测准确度高达82.61%,AUC值也高达0.84,是应力腐蚀开裂预测的最佳分类器。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种应力腐蚀开裂预测方法,其特征在于,所述方法包括:
步骤S1:构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
步骤S2:根据所述历史数据集确定训练集和测试集;
步骤S3:根据所述训练集确定最优ELM分类器个数m;
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
步骤S6:获取待测试样本数据;
步骤S7:将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果;
根据所述历史数据集确定训练集和测试集,具体包括:
步骤S21:将所述历史数据集划分模型输入数据集和模型输出数据集;
步骤S22:对所述模型输入数据集进行对数变换,获得对数数据集;
步骤S23:对所述对数数据集进行归一化处理,获得归一化数据集;
步骤S24:根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集;
根据所述训练集确定最优ELM分类器个数m,具体包括:
步骤S31:将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
步骤S32:将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
步骤S33:利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
步骤S34:绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M;
根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器,具体包括:
步骤S41:初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
步骤S42:从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
步骤S43:将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
步骤S44:判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“步骤S45”;如果k小于设定值Q,则令k=k+1,返回“步骤S42”;
步骤S45:选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
步骤S46:基于所述测试集确定第i个ELM分类器对应的权重;
步骤S47:根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
步骤S48:判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“步骤S42”。
2.根据权利要求1所述的应力腐蚀开裂预测方法,其特征在于,所述基于所述测试集确定第i个ELM分类器对应的权重,具体包括:
步骤S461:将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
步骤S462:将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
步骤S463:根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
3.一种应力腐蚀开裂预测系统,其特征在于,所述系统包括:
历史数据集构建模块,用于构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
训练集和测试集确定模块,用于根据所述历史数据集确定训练集和测试集;
最优ELM分类器个数确定模块,用于根据所述训练集确定最优ELM分类器个数m;
分类器确定模块,用于根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
AdaELM集成预测分类器确定模块,用于采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
获取模块,用于获取待测试样本数据;
预测模块,用于将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果;
所述训练集和测试集确定模块,具体包括:
第一集合划分单元,用于将所述历史数据集划分模型输入数据集和模型输出数据集;
对数变换单元,用于对所述模型输入数据集进行对数变换,获得对数数据集;
归一化处理单元,用于对所述对数数据集进行归一化处理,获得归一化数据集;
第二集合划分单元,用于根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集;
所述最优ELM分类器个数确定模块,具体包括:
第一训练单元,用于将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
预测单元,用于将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
准确率确定单元,用于利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
最优ELM分类器个数选取单元,用于绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M;
所述分类器确定模块,具体包括:
初始化单元,用于初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
抽样单元,用于从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
第二训练单元,用于将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
第一判断单元,用于判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“选取单元”;如果k小于设定值Q,则令k=k+1,返回“抽样单元”;
选取单元,用于选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
分类器权重确定单元,用于基于所述测试集确定第i个ELM分类器对应的权重;
初始权重确定单元,用于根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
第二判断单元,用于判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“抽样单元”。
4.根据权利要求3所述的应力腐蚀开裂预测系统,其特征在于,所述分类器权重确定单元,具体包括:
预测子单元,用于将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
错误率确定子单元,用于将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
分类器权重确定子单元,用于根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
CN202011177708.6A 2020-10-29 2020-10-29 一种应力腐蚀开裂预测方法及系统 Active CN112257942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011177708.6A CN112257942B (zh) 2020-10-29 2020-10-29 一种应力腐蚀开裂预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011177708.6A CN112257942B (zh) 2020-10-29 2020-10-29 一种应力腐蚀开裂预测方法及系统

Publications (2)

Publication Number Publication Date
CN112257942A CN112257942A (zh) 2021-01-22
CN112257942B true CN112257942B (zh) 2023-11-14

Family

ID=74262317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011177708.6A Active CN112257942B (zh) 2020-10-29 2020-10-29 一种应力腐蚀开裂预测方法及系统

Country Status (1)

Country Link
CN (1) CN112257942B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052207A (zh) * 2021-03-10 2021-06-29 中国特种设备检测研究院 基于Hybrid思想的不锈钢环境开裂判别方法及系统
CN113138157B (zh) * 2021-04-08 2022-08-19 北京科技大学 一种铝合金挤压型材应力腐蚀敏感性无损评估方法
CN115879379B (zh) * 2023-02-16 2023-06-06 北京华科仪科技股份有限公司 一种设备的腐蚀智能监测预警方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050380A (zh) * 2014-06-26 2014-09-17 东北大学 一种基于Adaboost-PLS-ELM的LF炉终点温度预报方法
CN104992184A (zh) * 2015-07-02 2015-10-21 东南大学 一种基于半监督极限学习机的多类图像分类方法
WO2016101182A1 (zh) * 2014-12-23 2016-06-30 清华大学 基于贝叶斯网络和极限学习机的区间型指标预报方法
CN106874934A (zh) * 2017-01-12 2017-06-20 华南理工大学 基于加权极限学习机集成算法的污水处理故障诊断方法
WO2017197626A1 (zh) * 2016-05-19 2017-11-23 江南大学 改进人工蜂群优化的极限学习机方法
CN107688825A (zh) * 2017-08-03 2018-02-13 华南理工大学 一种改进型的集成加权极限学习机污水处理故障诊方法
CN111582534A (zh) * 2020-03-09 2020-08-25 华能四川水电有限公司 一种基于极限学习机的水力发电预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050380A (zh) * 2014-06-26 2014-09-17 东北大学 一种基于Adaboost-PLS-ELM的LF炉终点温度预报方法
WO2016101182A1 (zh) * 2014-12-23 2016-06-30 清华大学 基于贝叶斯网络和极限学习机的区间型指标预报方法
CN104992184A (zh) * 2015-07-02 2015-10-21 东南大学 一种基于半监督极限学习机的多类图像分类方法
WO2017197626A1 (zh) * 2016-05-19 2017-11-23 江南大学 改进人工蜂群优化的极限学习机方法
CN106874934A (zh) * 2017-01-12 2017-06-20 华南理工大学 基于加权极限学习机集成算法的污水处理故障诊断方法
CN107688825A (zh) * 2017-08-03 2018-02-13 华南理工大学 一种改进型的集成加权极限学习机污水处理故障诊方法
CN111582534A (zh) * 2020-03-09 2020-08-25 华能四川水电有限公司 一种基于极限学习机的水力发电预测方法

Also Published As

Publication number Publication date
CN112257942A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112257942B (zh) 一种应力腐蚀开裂预测方法及系统
CN109766583B (zh) 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN114757309B (zh) 多物理场监测数据协同融合的工程灾害预警方法及系统
Al Banna et al. Attention-based bi-directional long-short term memory network for earthquake prediction
CN112819207B (zh) 基于相似性度量的地质灾害空间预测方法、系统及存储介质
CN113011796B (zh) 一种基于“层次分析-神经网络”的食用油安全预警方法
CN114169374B (zh) 一种斜拉桥斜拉索损伤识别方法及电子设备
CN109300040A (zh) 基于全媒体大数据技术的海外投资风险评估方法及系统
CN114563150B (zh) 桥梁健康在线检测模块生成方法、检测方法、工具箱及装置
Ye et al. A deep learning-based method for automatic abnormal data detection: Case study for bridge structural health monitoring
Son et al. Integrated framework for estimating remaining useful lifetime through a deep neural network
Liu et al. Defect prediction technology in software engineering based on convolutional neural network
CN112632765B (zh) 一种加权和法与sem法结合的作战能力评估方法
CN115962428A (zh) 一种燃气管网泄漏实时在线智能可解释性监测溯源方法
CN116204825A (zh) 一种基于数据驱动的生产线设备故障检测方法
CN115936773A (zh) 一种互联网金融黑产识别方法与系统
CN114417729A (zh) 一种基于bp神经网络的矿区环境安全预警方法
Meng et al. Prediction of tear propagation path of stratospheric airship envelope material based on deep learning
CN113448840A (zh) 基于预测缺陷率和模糊综合评价模型的软件质量评价方法
Pristyanto et al. Comparison of ensemble models as solutions for imbalanced class classification of datasets
CN117726240B (zh) 一种基于卷积神经网络的质量评价分类方法及系统
CN117726181B (zh) 一种煤矿典型灾害风险异构信息协同融合与分级预测方法
Raj et al. Multiclass Classification and Defect Detection of Surfaces Using Modified-YOLO
CN115691669B (zh) 一种基于量子卷积神经网络的蛋白质结构分类系统
Moballeghtohid et al. Estimating the remaining useful life of equipment based on an optimal deep learning model and cross-correlation based similarity analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant