CN116825253A - 基于特征选择的热轧带钢力学性能预测模型的建立方法 - Google Patents
基于特征选择的热轧带钢力学性能预测模型的建立方法 Download PDFInfo
- Publication number
- CN116825253A CN116825253A CN202310812958.XA CN202310812958A CN116825253A CN 116825253 A CN116825253 A CN 116825253A CN 202310812958 A CN202310812958 A CN 202310812958A CN 116825253 A CN116825253 A CN 116825253A
- Authority
- CN
- China
- Prior art keywords
- rolled strip
- mechanical property
- prediction model
- strip steel
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 229910000831 Steel Inorganic materials 0.000 title claims abstract description 47
- 239000010959 steel Substances 0.000 title claims abstract description 47
- 238000010187 selection method Methods 0.000 claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 238000004140 cleaning Methods 0.000 claims abstract description 10
- 238000010219 correlation analysis Methods 0.000 claims abstract description 6
- 238000005096 rolling process Methods 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 230000002068 genetic effect Effects 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000012352 Spearman correlation analysis Methods 0.000 claims description 3
- 238000001816 cooling Methods 0.000 claims description 3
- 238000010438 heat treatment Methods 0.000 claims description 3
- 238000005098 hot rolling Methods 0.000 claims description 3
- 230000035772 mutation Effects 0.000 claims description 3
- 229910052757 nitrogen Inorganic materials 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 229910052698 phosphorus Inorganic materials 0.000 claims description 3
- 238000010079 rubber tapping Methods 0.000 claims description 3
- 229910052717 sulfur Inorganic materials 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims 1
- 230000008569 process Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000006104 solid solution Substances 0.000 description 2
- 229910000742 Microalloyed steel Inorganic materials 0.000 description 1
- 238000012356 Product development Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005272 metallurgy Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000002436 steel type Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Investigating And Analyzing Materials By Characteristic Methods (AREA)
Abstract
本发明公开了基于特征选择的热轧带钢力学性能预测模型的建立方法,包括以下步骤:S1、数据样本的采集;S2、非线性相关性分析;S3、数据清洗;S4、特征选择;S5、XGBoost力学性能预测模型的建立和模型参数优化;S6、XGBoost模型可解释性分析。本发明采用上述基于特征选择的热轧带钢力学性能预测模型的建立方法,提出一种新的特征选择方法GAMIC,通过嵌入MIC相关分析方法消除特征数据集中的低相关性特征,降低了模型输入参数的维度,提高了模型预测精度、减少模型预测所需要的时间。
Description
技术领域
本发明涉及热轧材料力学性能的预测模型技术领域,特别是涉及基于特征选择的热轧带钢力学性能预测模型的建立方法。
背景技术
热轧带钢具有质量稳定、强度高、韧性优越等特点,因其优异的机械性能而广泛应用于各种工业。热轧带钢的力学性能作为定量指标,对产品质量的评价具有重要意义。建立热轧带钢高精度力学性能预测模型,对产品开发、工艺优化、生产效率提高、降低油耗具有重要的现实意义,可使材料的研发速度大大加快。大量研究表明,热轧钢板的强度受化学成分、轧制参数和工业生产条件的影响显著,现有的简化机理模型难以描述生产工艺变化之间的复杂耦合关系。因此,在不确定条件下建立热轧带钢力学性能的预测模型是一个巨大的挑战。
目前,关于热轧带钢力学性能预测模型开发的专利较多。如公开号CN114386196A的中国专利公开了一种板带力学性能预测准确性评估方法,该方法能够为基于数据驱动的热轧板带力学性能预测提供一种力学性能预测结果准确性评估指标,从而为现场取样提供指导,大幅降低质量异议的风险。公开号CN114219175A的中国专利公开了一种集装箱卷板的力学性能预测方法,该方法通过改进型BP神经网络模型建立力学性能预测模型,对集装箱卷板的七个钢种力学性能进行预测,输出预测值。预测模型模型可自监测、自更新,当预测精度不满足要求时,预测模型进行自动更新。公开号CN110569566A的中国专利公开了一种板带力学性能预测方法,该方法可以解决现有技术所存在的预测模型其预测精度不稳定、泛化能力差,缺少对预测结果的准确性评价的问题。
以上所有专利提到的方法,普遍采用机器学习算法建立热轧钢种力学性能预测模型,并根据所建立的模型预测力学性能。虽然上述机器学习算法可以实现对机械性能的高精度预测。但是,在构建模型的过程中,模型输入的特征子集通常是人为确定的,或者根据传统经验确定的。因此,如何利用数据驱动的方法选择合适的特征子集,目前还缺乏深入研究,也是本领域亟待解决的技术难点之一。
发明内容
本发明的目的是提供一种基于特征选择的热轧带钢力学性能预测模型的建立方法,提出一种新的特征选择方法GAMIC,通过嵌入MIC相关分析方法消除特征数据集中的低相关性特征,降低了模型输入参数的维度,提高了模型预测精度、减少模型预测所需要的时间。
为实现上述目的,本发明提供了基于特征选择的热轧带钢力学性能预测模型的建立方法,包括以下步骤:
S1、数据样本的采集:热轧带钢数据的采集及关键性参数计算;
S2、非线性相关性分析:基于采集的热轧数据,分析各特征参数之间的非线性相关性;
S3、数据清洗:利用孤立森林算法对热轧带钢力学性能预测的异常数据进行清理;
S4、特征选择:将遗传算法和最大互信息系数进行耦合得到GAMIC特征选择算法;
S5、热轧带钢力学性能预测模型的建立和模型参数优化:结合XGBoost集成机器学习算法,并利用步骤S4的GAMIC特征选择方法选择后的特征子集建立热轧带钢力学性能预测模型,采用五折交叉验证和网格搜索方法对热轧带钢力学性能预测模型参数进行自动优化,然后利用测试数据对力学性能预测;
S6、XGBoost模型可解释性分析:利用基于博弈论的SHAP可解释模型对热轧带钢力学性能预测模型进行分析,展示特征变量对力学性能的影响。
优选的,在步骤S1中,热轧带钢数据包括C、Si、Mn、P、S、N、Nb、Ti、Al、Cu、Ni、加热时间(Heat_Time)、固溶温度(SS_Temp)、固溶时间(SS_Time)、出炉温度(DTF)、精轧入口厚度(FEH)、精轧入口温度(FET)、F7轧制速度(FRS)、精轧出口温度(FDT)、卷取温度(CT)、成分厚度(H)、冷却速率(CR)、有效Ti含量(CP_Ti)、析出体积分数(VFP)。
优选的,在步骤S2中,非线性相关性采用Spearman相关性分析方法量化特征变量的非线性程度,计算公式为:
其中,ρ为非线性相关性系数,x,y均为属性变量,R(x)和R(y)分别是x和y的位次,和/>分别是平均位次。
优选的,在步骤S3中,异常数据清理方法是采用孤立森林算法剔除异常数据样本,具体包括:
步骤3.1:利用S1中的数据样本集构建孤立森林预测模型;
步骤3.2:将测试样本带入预测模型中,计算样本数据的异常分数Score,剔除异常分数小于0的样本数据,Score计算公式为:
其中,x为数据样本,ψ为X所在叶子节点中样本的个数,E(h(x))为数据x在孤立森林中各孤立树路径长度h(x)和的平均值;C(ψ)为用ψ条数据记录建立的孤立树的平均路径长度。
优选的,在步骤S4中,特征选择方法是在遗传算法特征选择方法的基础上与最大互信息系数进行耦合,具体包括:
步骤4.1:采用二进制编码方式,对每个样本的特征进行编码,二进制代码每个位的值“0”表示未选择该特征,“1”表示已选择要素;
步骤4.2:随机生成种群数量为50的初始种群;
步骤4.3:评价适应度函数设定为均方根误差;
步骤4.4:群中最好的个体作为父代复制到下一代新种群中,然后对父代种群进行选择、交叉和变异等遗传算子运算,从而繁殖出下一代新种群;
步骤4.5:利用MIC算法检测变量间的非线性相关性,计算每个特征与因变量之间的MIC,选择对因变量影响较大的特征,剔除信息较少的特征;
步骤4.6:当达到最大迭代次数或达到设置的收敛条件时,迭代停止。
优选的,热轧带钢力学性能预测模型的建立和模型参数优化具体的包括:
步骤5.1:通过随机抽样的方式将特征选择后的特征子集按照4:1的比例分为训练数据集和预测数据集;
步骤5.2:采用五折交叉验证和网格搜索方法对XGBoost模型参数进行自动优化,模型参数为:'objective'='reg:squarederror','eta'=0.1,'gamma'=15,'lambda'=12,'alpha'=0.2,'max_depth'=4,num_round=50,然后利用测试数据对力学性能预测。
优选的,在步骤S6中,热轧带钢力学性能预测模型可解释性分析是利用SHAP算法分析特征变量的重要性,具体包括:
步骤6.1:通过计算每个输入特征值的绝对SHAP值的算术平均值来评估特征变量的影响;
步骤6.2:分析每个特征对机械性能的影响的重要性,并对每个特征的影响程度进行了排名。
本发明的有益效果:
1)、在遗传算法特征选择方法的基础上与最大互信息系数进行耦合构建GAMIC特征选择方法,通过GAMIC特征选择方法选择合适的特征子集,模型的输入特征维数从原来的27个减少了13个,减少了模型的训练时间。
2)、GAMIC特征选择方法与3种常用的FS方法和原始数据集相比,GAMIC选择的特征子集分别提高了YS和TS模型的预测精度。
3)、利用SHAP分析力学性能预测模型的可解释性,不仅降低了输入维数,而且特征重要性的顺序与物理冶金规律一致,提高了预测模型的可靠性。
4)、本发明的热轧带钢力学性能预测模型,先消除了信息较少的特征,减少了输入特征参数的数量,然后,利用特征选择后的低维数据和XGBoost集成学习算法,建立了热轧微合金钢力学性能预测模型,结合XGBoost模型,并结合SHAP的强大解释方法,进一步揭示了特征对力学性能的影响。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的流程图;
图2是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的异常值清理结果图;
图3是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的特征选择过程中损失函数收敛过程图;
图4是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的的预测值与实测值的散点图;
图5是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的预测模型可解释性分析图。
具体实施方式
下面结合实施例,对本发明进一步描述。除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明提到的上述特征或具体实例提到的特征可以任意组合,这些具体实施例仅用于说明本发明而不用于限制本发明的范围。
实施例
本发明提出一种新的特征选择方法GAMIC,通过嵌入MIC相关分析方法消除特征数据集中的低相关性特征。基于XGBoost集成学习算法,建立了可靠的预测模型。为了更为清晰地阐述具体实施方案流程,下面通过具体实施流程来进行说明,专利实施流程具体细节如下:
图1是本发明热轧带钢力学性能预测模型的建立方法的流程图,如图1所示,包括以下步骤:
S1、热轧带钢数据的采集及关键性参数计算;
热轧带钢数据包括C、Si、Mn、P、S、N、Nb、Ti、Al、Cu、Ni、加热时间(Heat_Time)、固溶温度(SS_Temp)、固溶时间(SS_Time)、出炉温度(DTF)、精轧入口厚度(FEH)、精轧入口温度(FET)、F7轧制速度(FRS)、精轧出口温度(FDT)、卷取温度(CT)、成分厚度(H)、冷却速率(CR)、有效Ti含量(CP_Ti)、析出体积分数(VFP)。
S2、基于所述的采集的热轧数据,分析各特征参数之间的非线性相关性;对特征变量和力学性能之间的相关性进行分析。
非线性相关性采用Spearman相关性分析方法量化特征变量的非线性程度,计算公式可以表示为:
其中,R(x)和R(y)分别是x和y的位次,和/>分别是平均位次。
S3、利用孤立森林算法对热轧带钢力学性能预测的异常数据进行清理;
图2是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的异常值清理结果图,如图2所示,将异常分数值小于0的共计351组数据剔除。
采用孤立森林算法剔除异常数据样本,具体包括:
步骤S3.1:利用S1中的数据样本集构建孤立森林预测模型;
步骤S3.2:将测试样本带入预测模型中,计算样本数据的异常分数Score,剔除异常分数小于0的样本数据,Score计算公式可以表示为:
其中,E(h(x))为数据x在孤立森林中各孤立树路径长度h(x)和的平均值;C(ψ)为用ψ条数据记录建立的孤立树的平均路径长度,它在这里起到归一化的作用。S4、将遗传算法和最大互信息系数进行耦合得到GAMIC特征选择方法;
图3是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的特征选择过程中损失函数收敛过程图,如图3所示,GAMIC特征选择算法在筛选最佳特征子集过程中迭代次数增加时的损失函数曲线。值得注意的是,当迭代次数达到15次时,损失函数逐渐趋于稳定状态,从而获得最佳特征子集。
GAMIC特征选择方法具体包括:
步骤S4.1:采用二进制编码方式,对每个样本的特征进行编码,二进制代码每个位的值“0”表示未选择该特征,“1”表示已选择要素;
步骤S4.2:随机生成种群数量为50的初始种群;
步骤S4.3:评价适应度函数设定为均方根误差;
步骤S4.4:群中最好的个体作为父代复制到下一代新种群中,然后对父代种群进行选择、交叉和变异等遗传算子运算,从而繁殖出下一代新种群;
步骤S4.5:利用MIC算法检测变量间的非线性相关性,计算每个特征与因变量之间的MIC,选择对因变量影响较大的特征,剔除信息较少的特征,MIC的计算流程如下:
假设给定数据集M={x1,x2,...,xn},n表示样本数,xi和xj之间的互信息系数可以描述为方程:
其中,I(xi,xj)表示xi和xj之间的互信息系数,p(xi,xj)表示为联合分布,p(xi)和p(xj)分别表示为xi和xj的边缘分布。
对于具有有限样本对的给定数据集,二维空间可以分为s×t网格。二维空间中的数据分布可以通过互信息系数计算方程进行定量计算。但是相同的s×t可以通过许多不同的网格划分方法获得,因此有很多互信息系数值。最后,通过以下选择网格归一化的最大互信息系数值作为MIC值。
其中B(n)是网格划分s×t的上限。当B(n)=n0.6时,效果最好。
步骤S4.6:当达到最大迭代次数或达到设置的收敛条件时,迭代停止。
S5、结合XGBoost集成机器学习算法,并利用GAMIC特征选择方法选择后的特征子集建立热轧带钢力学性能预测模型。为了避免模型的过度拟合,获得更好的预测模型,采用五折交叉验证和网格搜索方法对XGBoost模型参数进行自动优化,然后利用测试数据对力学性能预测;
图4是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的的预测值与实测值的散点图,如图4所示,a)屈服强度预测值与实测值的散点图,b)抗拉强度预测值与实测值的散点图;屈服强度的偏差范围在-6%-6%内的精度达到93.4%,抗拉强度的偏差范围在-6%-6%内的精度达到96.3%。
热轧带钢力学性能预测模型是基于XGBoost集成算法建立,具体包括:
步骤S5.1:通过随机抽样的方式将特征选择后的特征子集按照4:1的比例分为训练数据集和预测数据集;
步骤S5.2:采用五折交叉验证和网格搜索方法对XGBoost模型参数进行自动优化,模型参数为:'objective'='reg:squarederror','eta'=0.1,'gamma'=15,'lambda'=12,'alpha'=0.2,'max_depth'=4,num_round=50,然后利用测试数据对力学性能预测,XGBoost建模详细流程如下:
对于XGBoost模型,数学模型的预测值可以用公式可以如下表示:
其中,K是树的总数量,k代表第k棵树,fk表示这棵树上的预测结果,xi是输入的第i个样本,是所有回归树的假设空间。
为了学习模型中使用的函数集,我们需要最小化目标函数。XGBoost模型的目标函数是方程:
其中,表示损失函数,/>表示样本i的预测值;yi表示样本i的实际值。第二项Ω(fk)是第t棵树的模型复杂度,可以定义为方程:
其中,γ叶节点数的正则化参数,T表示叶子结点数量,λ是叶节点权重的正则化参数,wj表示第j个叶的权重。
S6、利用基于博弈论的SHAP可解释模型对热轧带钢力学性能预测模型进行分析,直观地展示了特征变量对力学性能的影响。图5是本发明基于特征选择的热轧带钢力学性能预测模型的建立方法的预测模型可解释性分析图,如图5所示,a)屈服强度预测模型可解释性分析图,b)抗拉强度预测模型可解释性分析图,图中数据表示每个特征变量的SHAP值的绝对平均值,以此作为评价该特征变量的重要性。
力学性能预测模型可解释性分析是利用SHAP算法分析特征变量的重要性,具体包括:
步骤S6.1:通过计算每个输入特征值的绝对SHAP值的算术平均值来评估特征变量的影响;
步骤S6.2:分析每个特征对机械性能的影响的重要性,并对每个特征的影响程度进行了排名。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
Claims (7)
1.基于特征选择的热轧带钢力学性能预测模型的建立方法,其特征在于,包括以下步骤:
S1、数据样本的采集:热轧带钢数据的采集及关键性参数计算;
S2、非线性相关性分析:基于采集的热轧数据,分析各特征参数之间的非线性相关性;
S3、数据清洗:利用孤立森林算法对热轧带钢力学性能预测的异常数据进行清理;
S4、特征选择:将遗传算法和最大互信息系数进行耦合得到GAMIC特征选择算法;
S5、热轧带钢力学性能预测模型的建立和模型参数优化:结合XGBoost集成机器学习算法,并利用步骤S4的GAMIC特征选择方法选择后的特征子集建立热轧带钢力学性能预测模型,采用五折交叉验证和网格搜索方法对热轧带钢力学性能预测模型参数进行自动优化,然后利用测试数据对力学性能预测;
S6、XGBoost模型可解释性分析:利用基于博弈论的SHAP可解释模型对热轧带钢力学性能预测模型进行分析,展示特征变量对力学性能的影响。
2.根据权利要求1所述的基于特征选择的热轧带钢力学性能预测模型的建立方法,其特征在于:在步骤S1中,热轧带钢数据包括C、Si、Mn、P、S、N、Nb、Ti、Al、Cu、Ni、加热时间、固溶温度、固溶时间、出炉温度、精轧入口厚度、精轧入口温度、F7轧制速度、精轧出口温度、卷取温度、成分厚度、冷却速率、有效Ti含量、析出体积分数。
3.根据权利要求1所述的基于特征选择的热轧带钢力学性能预测模型的建立方法,其特征在于:在步骤S2中,非线性相关性采用Spearman相关性分析方法量化特征变量的非线性程度,计算公式为:
其中,ρ为非线性相关性系数,x,y均为属性变量,R(x)和R(y)分别是x和y的位次,和/>分别是平均位次。
4.根据权利要求1所述的基于特征选择的热轧带钢力学性能预测模型的建立方法,其特征在于:在步骤S3中,异常数据清理方法是采用孤立森林算法剔除异常数据样本,具体包括:
步骤3.1:利用S1中的数据样本集构建孤立森林预测模型;
步骤3.2:将测试样本带入预测模型中,计算样本数据的异常分数Score,剔除异常分数小于0的样本数据,Score计算公式为:
其中,X为数据样本,ψ为X所在叶子节点中样本的个数,E(h(x))为数据x在孤立森林中各孤立树路径长度h(x)和的平均值;C(ψ)为用ψ条数据记录建立的孤立树的平均路径长度。
5.根据权利要求1所述的基于特征选择的热轧带钢力学性能预测模型的建立方法,其特征在于:在步骤S4中,特征选择方法是在遗传算法特征选择方法的基础上与最大互信息系数进行耦合,具体包括:
步骤4.1:采用二进制编码方式,对每个样本的特征进行编码,二进制代码每个位的值“0”表示未选择该特征,“1”表示已选择要素;
步骤4.2:随机生成种群数量为50的初始种群;
步骤4.3:评价适应度函数设定为均方根误差;
步骤4.4:群中最好的个体作为父代复制到下一代新种群中,然后对父代种群进行选择、交叉和变异等遗传算子运算,从而繁殖出下一代新种群;
步骤4.5:利用MIC算法检测变量间的非线性相关性,计算每个特征与因变量之间的MIC,选择对因变量影响较大的特征,剔除信息较少的特征;
步骤4.6:当达到最大迭代次数或达到设置的收敛条件时,迭代停止。
6.根据权利要求1所述的基于特征选择的热轧带钢力学性能预测模型的建立方法,其特征在于,热轧带钢力学性能预测模型的建立和模型参数优化具体的包括:
步骤5.1:通过随机抽样的方式将特征选择后的特征子集按照4:1的比例分为训练数据集和预测数据集;
步骤5.2:采用五折交叉验证和网格搜索方法对XGBoost模型参数进行自动优化,然后利用测试数据对力学性能预测。
7.根据权利要求1所述的基于特征选择的热轧带钢力学性能预测模型的建立方法,其特征在于:在步骤S6中,热轧带钢力学性能预测模型可解释性分析是利用SHAP算法分析特征变量的重要性,具体包括:
步骤6.1:通过计算每个输入特征值的绝对SHAP值的算术平均值来评估特征变量的影响;
步骤6.2:分析每个特征对机械性能的影响的重要性,并对每个特征的影响程度进行了排名。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310812958.XA CN116825253B (zh) | 2023-07-03 | 2023-07-03 | 基于特征选择的热轧带钢力学性能预测模型的建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310812958.XA CN116825253B (zh) | 2023-07-03 | 2023-07-03 | 基于特征选择的热轧带钢力学性能预测模型的建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116825253A true CN116825253A (zh) | 2023-09-29 |
CN116825253B CN116825253B (zh) | 2023-11-21 |
Family
ID=88141038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310812958.XA Active CN116825253B (zh) | 2023-07-03 | 2023-07-03 | 基于特征选择的热轧带钢力学性能预测模型的建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116825253B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117572914A (zh) * | 2023-11-17 | 2024-02-20 | 北京科技大学 | 基于可解释性机器学习的lf精炼钢水温度控制方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180260717A1 (en) * | 2017-03-08 | 2018-09-13 | Wuhan University Of Science And Technology | Microalloyed steel mechanical property prediction method based on globally additive model |
WO2020000248A1 (zh) * | 2018-06-27 | 2020-01-02 | 大连理工大学 | 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法 |
CN114897227A (zh) * | 2022-04-26 | 2022-08-12 | 东北大学 | 基于改进随机森林算法的多钢种力学性能预报方法 |
-
2023
- 2023-07-03 CN CN202310812958.XA patent/CN116825253B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180260717A1 (en) * | 2017-03-08 | 2018-09-13 | Wuhan University Of Science And Technology | Microalloyed steel mechanical property prediction method based on globally additive model |
WO2020000248A1 (zh) * | 2018-06-27 | 2020-01-02 | 大连理工大学 | 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法 |
CN114897227A (zh) * | 2022-04-26 | 2022-08-12 | 东北大学 | 基于改进随机森林算法的多钢种力学性能预报方法 |
Non-Patent Citations (2)
Title |
---|
吴俊;柯?挺;任佳;: "参数自动优化的特征选择融合算法", 计算机系统应用, no. 07 * |
颜弋凡;安路达;吕志民;: "基于最大互信息系数属性选择的冷轧产品机械性能预测", 中南大学学报(自然科学版), no. 01 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117572914A (zh) * | 2023-11-17 | 2024-02-20 | 北京科技大学 | 基于可解释性机器学习的lf精炼钢水温度控制方法及装置 |
CN117572914B (zh) * | 2023-11-17 | 2024-04-16 | 北京科技大学 | 基于可解释性机器学习的lf精炼钢水温度控制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116825253B (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112100745B (zh) | 基于lda理论的汽车大梁钢力学性能预测方法 | |
WO2021036546A1 (zh) | 基于有偏估计的近红外定量分析模型构建方法 | |
US20210365784A1 (en) | Method for deriving fault diagnosis rules of blast furnace based on deep neural network | |
CN116825253B (zh) | 基于特征选择的热轧带钢力学性能预测模型的建立方法 | |
CN114897227B (zh) | 基于改进随机森林算法的多钢种力学性能预报方法 | |
CN114678080B (zh) | 转炉终点磷含量预测模型及构建方法、磷含量预测方法 | |
CN108897354B (zh) | 一种基于深度置信网络的铝熔炼过程炉膛温度预测方法 | |
CN108595803A (zh) | 基于递归神经网络的页岩气井生产压力预测方法 | |
CN117312816B (zh) | 一种特种钢材的冶炼效果评估方法及系统 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN108875118A (zh) | 一种高炉铁水硅含量预测模型准确度评价方法和设备 | |
CN115759409A (zh) | 多时间模式注意力机制优化lstm模型的水闸形变预测方法 | |
CN114326639B (zh) | 基于混合注意力卷积神经网络的工业过程性能评估方法 | |
CN113159225B (zh) | 多变量工业过程故障分类方法 | |
CN110415769B (zh) | 基于物理冶金学指导下机器学习的低活化钢的设计方法 | |
Wang et al. | Evolutionary modeling approach based on multiobjective genetic programming for strip quality prediction | |
CN111797574A (zh) | 聚合物分子量分布的集成高斯过程回归模型方法 | |
Gocheva-Ilieva | Using MARS for modeling and predicting tensile strength of low alloy steels | |
CN116108733A (zh) | 一种预测钢材力学性能的方法 | |
Paśko et al. | Bootstrap aggregation technique for evaluating the significance of manufacturing process parameters in the glass industry | |
CN117133390A (zh) | 一种基于进化学习的带钢多指标质量预测方法 | |
Khilari et al. | Analysis of Machine Learning Algorithm to predict Wine Quality | |
Xu et al. | Yield Stress and Elongation Prediction and Process Parameter Optimization of Two C-Mn Steel Based on XGBoost and Non-dominated Sorting Genetic Algorithm-IIization of C-Mn steel based on XGBoost algorithm | |
CN118260632A (zh) | 一种基于Stacking-SSA模型的烧结矿转鼓指数预测方法 | |
CN117298826A (zh) | 基于在线学习融合算法的燃煤电厂脱硫自动控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |