CN110929347A - 一种基于梯度提升树模型的热连轧带钢凸度预测方法 - Google Patents

一种基于梯度提升树模型的热连轧带钢凸度预测方法 Download PDF

Info

Publication number
CN110929347A
CN110929347A CN201911020797.0A CN201911020797A CN110929347A CN 110929347 A CN110929347 A CN 110929347A CN 201911020797 A CN201911020797 A CN 201911020797A CN 110929347 A CN110929347 A CN 110929347A
Authority
CN
China
Prior art keywords
strip steel
convexity
value
variable
continuous rolling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911020797.0A
Other languages
English (en)
Inventor
李广焘
龚殿尧
鲁兴
王振华
张殿华
徐建忠
邸洪双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201911020797.0A priority Critical patent/CN110929347A/zh
Publication of CN110929347A publication Critical patent/CN110929347A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明的一种基于梯度提升树模型的热连轧带钢凸度预测方法,包括:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为热连轧带钢凸度预测模型的输入与输出;在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;按照一定比例将通过预处理获得的最终建模数据划分为训练数据集和测试数据集;基于训练数据集,用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型;采用坐标下降法确定热连轧带钢凸度预测模型的最优参数;基于测试数据集评价所建立的热连轧带钢凸度预测模型的性能。本发明可以精确的预测热连轧带钢的凸度,有助于改善热连轧带钢的大凸度偏差问题。

Description

一种基于梯度提升树模型的热连轧带钢凸度预测方法
技术领域
本发明属于工程与人工智能技术领域,涉及一种基于梯度提升树模型的热连轧带钢凸度预测方法。
背景技术
随着制造业的迅速发展,对优质带钢的需求也在不断增加。热轧带钢的质量指标不仅包括机械性能,还包括几何外观参数。凸度作为带钢非常重要的几何外观参数之一被用于评价带钢的横截面形状。作为许多工业产品的一种主要原材料,极大的热轧带钢凸度偏差将严重影响工业产品的质量,因此,明确热轧带钢凸度的变化规律一直是本领域的研究重点。带钢凸度受轧辊弹性变形、轧辊磨削凸度、轧辊热膨胀、轧辊磨损、带钢力学性能与几何尺寸等因素的影响,因此,带钢凸度的控制精度直接取决于上述因素的计算精度。传统理论方法,包括解析法、影响函数法、有限元法和有限差分法等传统方法已被采用来建立高精度的轧辊变形、热凸度、磨损凸度与带钢变形计算模型。虽然基于传统方法的计算模型已被广泛接受与应用,但由于热轧环境复杂和传统方法本身的局限性(存在条件简化与假设),很难进一步提高带钢凸度的控制精度。
发明内容
为解决上述技术问题,本发明的目的是提供一种基于梯度提升树模型的热连轧带钢凸度预测方法,基于大量实际带钢生产数据和梯度提升树算法建立了高精度热轧带钢凸度预测模型,以改善热轧带钢存在的大凸度偏差问题。
本发明提供一种基于梯度提升树模型的热连轧带钢凸度预测方法,包括如下步骤:
步骤1:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为建立热连轧带钢凸度预测模型的输入与输出;
步骤2:在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;
步骤3:按照一定比例将通过预处理获得的最终建模数据随机划分为训练数据集和测试数据集;
步骤4:基于训练数据集,采用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型;
步骤5:采用坐标下降法确定基于梯度提升树算法的热连轧带钢凸度预测模型的最优参数;
步骤6:基于测试数据集,采用决定系数、平均绝对误差、平均绝对百分误差和均方根误差来评价按照上述步骤建立的基于梯度提升树算法的热连轧带钢凸度预测模型的性能。
在本发明的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤2具体为:
步骤2.1:检查所收集的每一个带钢数据样本是否存在缺失值,如果某一个带钢数据样本存在缺失值,则去除该带钢数据样本;
步骤2.2:将所有变量按照是否与带钢种类有关分为A类与B类,A类变量与带钢种类有关,B类变量与带钢种类无关;
步骤2.3:基于拉依达准则去除含有B类变量的异常值的每个带钢数据样本;
步骤2.4:根据带钢化学成分,尺寸规格将余下的带钢数据样本分成M个类别(C1,…,CJ,…,CM);
步骤2.5:判断类别CJ中的带钢数据样本数是否超过30,如果带钢数据样本数超过30,基于拉依达准则去除含有A类变量的异常值的每个带钢数据样本;如果带钢数据样本数小于30,基于格拉布斯准则去除含有A类变量的异常值的每个带钢数据样本;
步骤2.6:去除采样极不均衡的带钢数据样本获得最终建模带钢数据。
在本发明的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤2.3中的拉依达准则判别式为:
Figure BDA0002247143150000031
其中,
Figure BDA0002247143150000032
是变量E的极值,
Figure BDA0002247143150000033
是变量E的平均值,σ是变量E的方差;
判断变量E的极值
Figure BDA00022471431500000310
是否满足式(1),如果满足式(1)则
Figure BDA0002247143150000034
为变量E中的异常值,去除该带钢数据样本;当变量E的极值不满足式(1),则变量E中的异常值已全部去除,按照该方法去除含有B类变量的异常值的带钢数据样本。
在本发明的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤2.5中格拉布斯准则通过对比计算所得的G值与临界G(n,α)值的大小来判断异常值,其中α为显著水平,G值计算公式为:
Figure BDA0002247143150000035
其中,n是变量F的取值数量,
Figure BDA0002247143150000036
是变量F的第q个值,
Figure BDA0002247143150000037
是变量F的平均值,σ是变量F的方差;
如果变量F的计算G值大于临界G(n,α)值,则
Figure BDA0002247143150000038
为变量F的异常值,去除该带钢数据样本;当变量F的计算G值小于临界G(n,α)值,则变量F中无异常值,基于格拉布斯准则去除带钢数据样本数小于30的类别中含有A类变量的异常值的带钢样本。
在本发明的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤4具体为:
步骤4.1:带钢训练数据集包含N个样本,记作D={(x1,y1),...,(xi,yi),...,(xN,yN)},每个样本包含P个输入变量,记作
Figure BDA0002247143150000039
与一个输出变量为带钢实际凸度,记作yi
步骤4.2:利用k折交叉验证将训练数据集划分成k个互斥子集,k-1个子集被用作训练数据,余下一个子集被用作验证数据,在每个训练过程中,总计得到k组训练和验证数据来训练热连轧带钢凸度的预测模型;
步骤4.3:基于梯度提升树算法的热连轧带钢凸度预测模型表达为:
Figure BDA0002247143150000041
其中,hm(x)是梯度提升树模型中的第m棵回归树;Z是所有回归树的函数空间;εm是步长;NGBDT是回归树数量;
步骤4.4:将基于梯度提升树算法的热连轧带钢凸度预测模型表达式改写为加法模型:
fm(x)=fm-1(x)+εmhm(x) (4)
其中,fm-1(x)是由m-1棵回归树构成的带钢凸度预测模型;fm(x)是在现有的m-1棵回归树中加入一棵新的回归树而得到的带钢凸度预测模型;
步骤4.5:通过最小化损失函数L来构建新的回归树hm(x):
Figure BDA0002247143150000042
步骤4.6:在损失函数的负梯度方向搜索最小损失函数以构建新的回归树,进而建立新的凸度预测模型:
Figure BDA0002247143150000043
其中,步长εm通过线性搜索得到:
Figure BDA0002247143150000044
步骤4.7:在模型训练过程中,均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数平均值MR2、决定系数的方差SR2被用于评价用k组验证数据的预测结果。
在本发明的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤5中的最优参数包括:回归树的数量NGBDT、学习率R、回归树的最大深度MaxGBDTD、回归树节点分裂所需的最小样本数
MinGBDTS、回归树叶节点的最小样本数MinGBDTL、判断回归树节点分裂所涉及的最大特征数MaxGBDTF和子采样率SGBDT
在本发明的基于梯度提升树模型的热连轧带钢凸度预测方法中,所述步骤5具体为:
步骤5.1:首先采用坐标下降法依次初步调节SGBDT、MaxGBDTF、MinGBDTL、MinGBDTS、MaxGBDTD,确定这些参数初始值;当某个参数的最优值被确定,则该参数的最优值将替换其初始值用于其他参数的寻优;
步骤5.2:在高学习率R=0.1~0.2下,计算得出随着NGBDT的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定在高学习率R=0.1~0.2下的最优NGBDT和R;
步骤5.3:计算得出随着MaxGBDTD和MinGBDTS的共同变化用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的MaxGBDTD;MinGBDTS与MinGBDTL有关,MinGBDTS的最优值与MinGBDTL的最优值一起确定;
步骤5.4:计算得出随着MinGBDTS和MinGBDTL的共同变化用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的MinGBDTS和MinGBDTL
步骤5.5:计算得出随着MaxGBDTF的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的MaxGBDTF
步骤5.6:计算得出随着SGBDT的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的子采样率SGBDT
步骤5.7:按照相同的倍数缩小R和增大NGBDT,计算得出随着缩放倍数的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最终的学习率R和回归树的数量NGBDT
本发明一种基于梯度提升树模型的热连轧带钢凸度预测方法,针对热轧环境复杂,强非线性的特点,克服传统方法的局限,基于大量实际生产数据和梯度提升树算法建立了高精度的热连轧带钢凸度预测模型,确立了实际带钢凸度与轧制力、轧辊直径、轧制里程、轧制温度、带钢成分等参数之间的关系,对进一步提高带钢凸度精度具有实际意义。
附图说明
图1为本发明一种基于梯度提升树模型的热连轧带钢凸度预测方法的具体流程;
图2为本发明实施过程中数据预处理的具体流程;
图3为在不同R和NGBDT组合下GBDT带钢凸度预测模型在训练过程中的性能表现;
图4为在不同MaxGBDTD和MinGBDTS组合下GBDT带钢凸度预测模型在训练过程中的性能表现;
图5为在不同MinGBDTS和MinGBDTL组合下GBDT带钢凸度预测模型在训练过程中的性能表现;
图6为在不同MaxGBDTF条件下GBDT带钢凸度预测模型在训练过程中的性能表现;
图7为在不同SGBDT条件下GBDT带钢凸度预测模型在训练过程中的性能表现;
图8为不同R和NGBDT缩放比例下GBDT带钢凸度预测模型在训练过程中的性能表现;
图9为GBDT带钢凸度预测模型在测试集上的预测结果。
具体实施方式
本发明采用梯度提升树并结合大量实际带钢生产数据建立热轧带钢凸度预测模型,确立了带钢凸度与轧制力、轧辊直径、轧制里程、轧制温度、带钢成分等工艺参数之间的关系,这些工艺参数通过影响轧辊变形、轧辊磨损、轧辊热辊胀或带钢变形等因素来改变实际带钢凸度。
下面结合附图和实施例对本发明作进一步详细的说明。
本实施例中,收集某1780mm带钢热连轧产线的实际精轧相关数据用于建立基于梯度提升树算法的热连轧带钢凸度预测模型。该1780mm带钢热轧线的精轧机组由七架轧机(F1~F7)组成。本发明一种基于梯度提升树模型的热连轧带钢凸度预测模型的建立过程如图1所示,具体步骤包括:
表1输入与输出变量
Figure BDA0002247143150000071
Figure BDA0002247143150000081
步骤1:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为建立热连轧带钢凸度预测模型的输入与输出;
具体实施时,将表1中的72个参数作为模型的输入量,实测带钢凸度作为模型的输出量。
步骤2:在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;
具体实施时,在热轧带钢生产现场收集6429组相应输入与输出变量的实际数据用于建立热连轧带钢凸度预测模型。如图2所示,通过对所收集的6429个带钢数据样本进行缺失值与异常值去除和数据均衡获得最终建模数据,处理方法如下:
步骤2.1:检查所收集的每一个带钢数据样本是否存在缺失值,如果某一带钢数据样本据存在缺失值,则去除该带钢数据样本;
步骤2.2:将所有变量按照是否与带钢种类有关分为A类与B类,A类变量与带钢种类有关,B类变量与带钢种类无关;
具体实施时,将NO.,Fb1~Fb7,Ps1~Ps7,Lr,Lr1,Lr2,Lr4,Lr8,Lr15,Dw1~Dw7,Db1~Db7,CT这些变量划入B类,剩余变量划入A类。
步骤2.3:用拉依达准则检测B类变量的异常值,并去除含有B类变量的异常值的每个带钢数据样本。
具体实施时,拉依达准则判别式为:
Figure BDA0002247143150000091
其中,
Figure BDA0002247143150000092
是变量E的极值,
Figure BDA0002247143150000093
是变量E的平均值,σ是变量E的方差;
判断变量E的极值
Figure BDA0002247143150000094
是否满足式(1),如果满足式(1)则
Figure BDA0002247143150000095
为变量E中的异常值,去除该带钢数据样本;当变量E的极值不满足式(1),则变量E中的异常值已全部去除,按照该方法去除含有B类变量的异常值的每个带钢数据样本。
步骤2.4:根据带钢化学成分,尺寸规格将余下所有带钢数据样本分成M个类别(C1,…,CJ,…,CM);具体实施时,M=50。
步骤2.5:判断类别CJ中的带钢数据样本数是否超过30,如果带钢数据样本数超过30,基于拉依达准则去除含有A类变量的异常值的每个带钢数据样本;如果带钢数据样本数小于30,则用格拉布斯准则检测A类变量中的异常值,去除含有A类变量的异常值的每个带钢数据样本;
具体实施时,格拉布斯准则通过对比计算所得的G值与临界G(n,α)值的大小来判断异常值,其中α为显著水平,G值计算公式为:
Figure BDA0002247143150000096
其中,n是变量F的取值数量,
Figure BDA0002247143150000097
是变量F的第q个值,
Figure BDA0002247143150000098
是变量F的平均值,σ是变量F的方差;
临界G(n,α)值参照国标《数据的统计处理和解释——正态样本离群值的判断和处理(GB/T 4883-2008)》给出的格拉布斯检验的临界值表获得。如果变量F的计算G值大于临界G(n,α)值,则
Figure BDA0002247143150000101
为变量F的异常值,去除该带钢数据样本;当变量F的计算G值小于临界G(n,α)值,则变量F中无异常值,基于格拉布斯准则去除带钢数据样本数小于30的类别中含有A类变量的异常值的带钢数据样本。
步骤2.6:去除采样极不均衡的带钢数据样本获得用于最终建模的带钢数据。
具体实施时,最终获得4789个带钢数据样本用于建立带钢凸度预测模型。
表2部分建模数据。
Figure BDA0002247143150000102
步骤3:按照一定比例将预处理过的带钢数据随机划分为训练数据集和测试数据集;
具体实施时,按照9:1的比例随机将4789个带钢数据样本划分为训练数据集和测试数据集。
步骤4:基于训练数据集,采用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型,所述步骤4具体为:
步骤4.1:带钢训练数据集包含N个样本,记作D={(x1,y1),...,(xi,yi),...,(xN,yN)},每个样本包含P个输入变量,记作
Figure BDA0002247143150000111
与一个输出变量为带钢凸度,记作yi
具体实施时,带钢训练数据集包含4310个样本,记作D={(x1,y1),...,(xi,yi),...,(x4310,y4310)},每个样本包含72个输入变量,记作xi=(NO.i,...,Ps1i,...,Db7i)与一个输出变量为实际带钢凸度,记作yi=CTi
步骤4.2:利用k折交叉验证将训练数据集划分成k个互斥子集,k-1个子集被用作训练数据,余下一个子集被用作验证数据,在每个训练过程中,总计得到k组训练和验证数据来训练热连轧带钢凸度的预测模型;
具体实施时,取k=10,利用10折交叉验证将训练数据集划分成10个互斥子集,9个子集被用作训练数据,余下一个被用作验证数据,在每个训练过程中,总计获得了10组训练/验证数据来训练热连轧带钢凸度的预测模型。
步骤4.3:基于梯度提升树算法的热连轧带钢凸度预测模型表达为:
Figure BDA0002247143150000112
其中,hm(x)是梯度提升树模型中的第m棵回归树;Z是所有回归树的函数空间;εm是步长;NGBDT是回归树数量;
步骤4.4:将基于梯度提升树算法的热连轧带钢凸度预测模型表达式改写为加法模型:
fm(x)=fm-1(x)+εmhm(x) (4)
其中,fm-1(x)是由m-1棵回归树构成的带钢凸度预测模型;fm(x)是在现有的m-1棵回归树中加入一棵新的回归树而得到的带钢凸度预测模型;
步骤4.5:通过最小化损失函数L来构建新的回归树hm(x):
Figure BDA0002247143150000121
步骤4.6:在损失函数的负梯度方向搜索最小损失函数以构建新的回归树,进而建立新的凸度预测模型:
Figure BDA0002247143150000122
其中,步长εm通过线性搜索得到:
Figure BDA0002247143150000123
步骤4.7:在模型训练过程中,均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数平均值MR2、决定系数的方差SR2被用于评价用k组验证数据的预测结果。
所述均方根误差的平均值MRMSE根据下式计算:
Figure BDA0002247143150000124
其中,RMSE是均方根误差,表达式为:
Figure BDA0002247143150000125
其中,
Figure BDA0002247143150000126
和yi分别为带钢凸度的预测值和实际值。
所述均方根误差的方差SRMSE根据下式计算:
Figure BDA0002247143150000127
所述决定系数平均值MR2和决定系数的方差SR2分别根据下式计算:
Figure BDA0002247143150000128
Figure BDA0002247143150000129
Figure BDA0002247143150000131
其中,R2是决定系数,
Figure BDA0002247143150000132
为带钢凸度实际值的平均值。
步骤5:采用坐标下降法确定基于梯度提升树算法的热连轧带钢凸度预测模型的最优参数;包括:回归树的数量NGBDT、学习率R、回归树的最大深度MaxGBDTD、回归树节点分裂所需的最小样本数MinGBDTS、回归树叶节点的最小样本数MinGBDTL、判断回归树节点分裂所涉及的最大特征数MaxGBDTF和子采样率SGBDT,所述步骤5具体为:
步骤5.1:首先采用坐标下降法依次初步调节子采样率SGBDT、判断回归树节点分裂所涉及的最大特征数MaxGBDTF、回归树叶节点的最小样本数MinGBDTL、回归树节点分裂所需的最小样本数、MinGBDTS、回归树的最大深度MaxGBDTD,确定这些参数初始值为SGBDT=0.85,MaxGBDTF=60,MinGBDTL=4,MinGBDTS=8,MaxGBDTD=11;当某个参数的最优值被确定,则该参数的最优值将替换其初始值用于其他参数的寻优;
步骤5.2:如图3所示,在学习率R分别取值为0.1,0.15和0.2的条件下,计算得出随着回归树的数量NGBDT的增加用于评价带钢凸度预测模型在训练过程中的性能的均方根误差的平均值MRMSE、均方根误差的方差SRMSE、系数平均值MR2、决定系数的方差SR2的变化情况,基于计算结果确定最优回归树的数量NGBDT为150、学习率R为0.1。
步骤5.3:确定了回归树的数量NGBDT和学习率R的最优组合之后,如图4所示,计算得出随着回归树的最大深度MaxGBDTD和回归树节点分裂所需的最小样本数MinGBDTS的共同变化用于评价带钢凸度预测模型在训练过程中的性能的均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数平均值MR2、决定系数的方差SR2的变化情况,基于计算结果确定最优的回归树的最大深度。
具体实施时,基于计算结果得出11是MaxGBDTD的最优值。MinGBDTS与MinGBDTL有关,MinGBDTS的最优值与MinGBDTL的最优值一起确定。
步骤5.4:确定了最优的回归树的最大深度MaxGBDTD之后,如图5所示,计算得出随着回归树节点分裂所需的最小样本数MinGBDTS和回归树叶节点的最小样本数MinGBDTL的共同变化用于评价带钢凸度预测模型在训练过程中的性能的均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数的平均值MR2、决定系数的方差SR2的变化情况,基于计算结果确定最优的回归树节点分裂所需的最小样本数和回归树叶节点的最小样本数;具体实施时,20和4分别是MinGBDTS和MinGBDTL的最优值。
步骤5.5:确定了最优的回归树节点分裂所需的最小样本数MinGBDTS和回归树叶节点的最小样本数MinGBDTL之后,如图6所示,计算得出随着判断回归树节点分裂所涉及的最大特征数MaxGBDTF的增加用于评价带钢凸度预测模型在训练过程中的性能的均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数的平均值MR2和决定系数的方差SR2的变化情况,基于计算结果确定判断回归树节点分裂所涉及的最大特征数MaxGBDTF的最优值为35;
步骤5.6:确定了最优的判断回归树节点分裂所涉及的最大特征数MaxGBDTF之后,如图7所示,计算得出随着子采样率SGBDT的增加用于评价带钢凸度预测模型在训练过程中的性能的均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数的平均值MR2和决定系数的方差SR2的变化情况,基于计算结果确定子采样率SGBDT的最优值为0.65;
步骤5.7:确定了最佳的子采样率SGBDT之后,如图8所示,按照相同的倍数缩小学习率R、增大回归树的数量NGBDT,计算得出随着缩放倍数的增加用于评价带钢凸度预测模型在训练过程中的性能的均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数的平均值MR2和决定系数的方差SR2的变化情况,基于计算结果确定学习率R和回归树的数量NGBDT的最终值分别为0.0125和1200。
通过上述步骤建立了基于梯度提升树算法的带钢凸度预测模型,具体模型参数如表3所示。
表3基于梯度提升树算法的带钢凸度预测模型的具体参数
Figure BDA0002247143150000151
步骤6:基于测试数据集,采用决定系数R2、平均绝对误差MAE、平均绝对百分误差MAPE和均方根误差RMSE来评价按照上述步骤建立的基于梯度提升树算法的热连轧带钢凸度预测模型的性能。计算结果如表4所示。
其中MAE和MAPE的计算公式如下:
Figure BDA0002247143150000152
Figure BDA0002247143150000153
表4基于梯度提升树算法的热连轧带钢凸度预测模型的评价结果
Figure BDA0002247143150000154
Figure BDA0002247143150000161
如图9所示,利用基于梯度提升树算法的热连轧带钢凸度预测模型在测试集上的预测值与测试集带钢凸度目标值绘制散点图,给出不同绝对误差(AE)范围内GBDT带钢凸度预测模型预测结果的分布情况以进一步评价本发明一种基于梯度提升树模型的热连轧带钢凸度预测方法的预测效果。
以上所述仅为本发明的较佳实施例,并不用以限制本发明的思想,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,包括如下步骤:
步骤1:选择相关热轧带钢的工艺参数、设备参数和带钢参数与实际带钢凸度作为建立热连轧带钢凸度预测模型的输入与输出;
步骤2:在热轧带钢生产现场收集相关原始建模数据并进行预处理,通过去除缺失值、异常值和数据均衡获得最终建模数据;
步骤3:按照一定比例将通过预处理获得的最终建模数据随机划分为训练数据集和测试数据集;
步骤4:基于训练数据集,采用交叉验证建立基于梯度提升树算法的热连轧带钢凸度预测模型;
步骤5:采用坐标下降法确定基于梯度提升树算法的热连轧带钢凸度预测模型的最优参数;
步骤6:基于测试数据集,采用决定系数、平均绝对误差、平均绝对百分误差和均方根误差来评价按照上述步骤建立的基于梯度提升树算法的热连轧带钢凸度预测模型的性能。
2.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤2具体为:
步骤2.1:检查所收集的每一个带钢数据样本是否存在缺失值,如果某一个带钢数据样本存在缺失值,则去除该带钢数据样本;
步骤2.2:将所有变量按照是否与带钢种类有关分为A类与B类,A类变量与带钢种类有关,B类变量与带钢种类无关;
步骤2.3:基于拉依达准则去除含有B类变量的异常值的每个带钢数据样本;
步骤2.4:根据带钢化学成分,尺寸规格将余下的带钢数据样本分成M个类别(C1,…,CJ,…,CM);
步骤2.5:判断类别CJ中的带钢数据样本数是否超过30,如果带钢数据样本数超过30,基于拉依达准则去除含有A类变量的异常值的每个带钢数据样本;如果带钢数据样本数小于30,基于格拉布斯准则去除含有A类变量的异常值的每个带钢数据样本;
步骤2.6:去除采样极不均衡的带钢数据样本获得最终建模带钢数据。
3.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤2.3中的拉依达准则判别式为:
Figure FDA0002247143140000021
其中,
Figure FDA0002247143140000022
是变量E的极值,
Figure FDA0002247143140000023
是变量E的平均值,σ是变量E的方差;
判断变量E的极值
Figure FDA0002247143140000024
是否满足式(1),如果满足式(1)则
Figure FDA0002247143140000025
为变量E中的异常值,去除该带钢数据样本;当变量E的极值不满足式(1),则变量E中的异常值已全部去除,按照该方法去除含有B类变量的异常值的带钢数据样本。
4.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤2.5中格拉布斯准则通过对比计算所得的G值与临界G(n,α)值的大小来判断异常值,其中α为显著水平,G值计算公式为:
Figure FDA0002247143140000026
其中,n是变量F的取值数量,
Figure FDA0002247143140000027
是变量F的第q个值,
Figure FDA0002247143140000028
是变量F的平均值,σ是变量F的方差;
如果变量F的计算G值大于临界G(n,α)值,则
Figure FDA0002247143140000029
为变量F的异常值,去除该带钢数据样本;当变量F的计算G值小于临界G(n,α)值,则变量F中无异常值,基于格拉布斯准则去除带钢数据样本数小于30的类别中含有A类变量的异常值的带钢样本。
5.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤4具体为:
步骤4.1:带钢训练数据集包含N个样本,记作D={(x1,y1),...,(xi,yi),...,(xN,yN)},每个样本包含P个输入变量,记作
Figure FDA0002247143140000031
与一个输出变量为带钢实际凸度,记作yi
步骤4.2:利用k折交叉验证将训练数据集划分成k个互斥子集,k-1个子集被用作训练数据,余下一个子集被用作验证数据,在每个训练过程中,总计得到k组训练和验证数据来训练热连轧带钢凸度的预测模型;
步骤4.3:基于梯度提升树算法的热连轧带钢凸度预测模型表达为:
Figure FDA0002247143140000032
其中,hm(x)是梯度提升树模型中的第m棵回归树;Z是所有回归树的函数空间;εm是步长;NGBDT是回归树数量;
步骤4.4:将基于梯度提升树算法的热连轧带钢凸度预测模型表达式改写为加法模型:
fm(x)=fm-1(x)+εmhm(x) (4)
其中,fm-1(x)是由m-1棵回归树构成的带钢凸度预测模型;fm(x)是在现有的m-1棵回归树中加入一棵新的回归树而得到的带钢凸度预测模型;
步骤4.5:通过最小化损失函数L来构建新的回归树hm(x):
Figure FDA0002247143140000033
步骤4.6:在损失函数的负梯度方向搜索最小损失函数以构建新的回归树,进而建立新的凸度预测模型:
Figure FDA0002247143140000034
其中,步长εm通过线性搜索得到:
Figure FDA0002247143140000041
步骤4.7:在模型训练过程中,均方根误差的平均值MRMSE、均方根误差的方差SRMSE、决定系数平均值MR2、决定系数的方差SR2被用于评价用k组验证数据的预测结果。
6.如权利要求1所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤5中的最优参数包括:回归树的数量NGBDT、学习率R、回归树的最大深度MaxGBDTD、回归树节点分裂所需的最小样本数MinGBDTS、回归树叶节点的最小样本数MinGBDTL、判断回归树节点分裂所涉及的最大特征数MaxGBDTF和子采样率SGBDT
7.如权利要求6所述的基于梯度提升树模型的热连轧带钢凸度预测方法,其特征在于,所述步骤5具体为:
步骤5.1:首先采用坐标下降法依次初步调节SGBDT、MaxGBDTF、MinGBDTL、MinGBDTS、MaxGBDTD,确定这些参数初始值;当某个参数的最优值被确定,则该参数的最优值将替换其初始值用于其他参数的寻优;
步骤5.2:在高学习率R=0.1~0.2下,计算得出随着NGBDT的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定在高学习率R=0.1~0.2下的最优NGBDT和R;
步骤5.3:计算得出随着MaxGBDTD和MinGBDTS的共同变化用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的MaxGBDTD;MinGBDTS与MinGBDTL有关,MinGBDTS的最优值与MinGBDTL的最优值一起确定;
步骤5.4:计算得出随着MinGBDTS和MinGBDTL的共同变化用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的MinGBDTS和MinGBDTL
步骤5.5:计算得出随着MaxGBDTF的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的MaxGBDTF
步骤5.6:计算得出随着SGBDT的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最优的子采样率SGBDT
步骤5.7:按照相同的倍数缩小R和增大NGBDT,计算得出随着缩放倍数的增加用于评价带钢凸度预测模型在训练过程中的性能的MRMSE、SRMSE、MR2和SR2的变化情况,基于计算结果确定最终的学习率R和回归树的数量NGBDT
CN201911020797.0A 2019-10-25 2019-10-25 一种基于梯度提升树模型的热连轧带钢凸度预测方法 Pending CN110929347A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911020797.0A CN110929347A (zh) 2019-10-25 2019-10-25 一种基于梯度提升树模型的热连轧带钢凸度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911020797.0A CN110929347A (zh) 2019-10-25 2019-10-25 一种基于梯度提升树模型的热连轧带钢凸度预测方法

Publications (1)

Publication Number Publication Date
CN110929347A true CN110929347A (zh) 2020-03-27

Family

ID=69849720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911020797.0A Pending CN110929347A (zh) 2019-10-25 2019-10-25 一种基于梯度提升树模型的热连轧带钢凸度预测方法

Country Status (1)

Country Link
CN (1) CN110929347A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111790762A (zh) * 2020-07-30 2020-10-20 武汉科技大学 一种基于随机森林的热轧带钢轧制力设定方法
CN112001439A (zh) * 2020-08-19 2020-11-27 西安建筑科技大学 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备
CN112170501A (zh) * 2020-09-16 2021-01-05 太原理工大学 一种轧辊磨损凸度和热凸度的预测方法
CN112475586A (zh) * 2020-10-12 2021-03-12 广州瑞松智能科技股份有限公司 一种焊接接头强度预测方法
CN112749505A (zh) * 2020-12-16 2021-05-04 太原科技大学 一种机理融合数据的热轧带钢截面形状预测方法
CN112884215A (zh) * 2021-02-02 2021-06-01 国网甘肃省电力公司信息通信公司 一种基于梯度增强树人口预测模型的参数优化方法
CN112949108A (zh) * 2021-01-25 2021-06-11 北京科技大学 热轧高强钢板形缺陷全流程预测方法及图形用户界面
CN113627469A (zh) * 2021-07-01 2021-11-09 北京科技大学 一种基于模糊推理算法的热轧带钢板形凸度预测的方法
CN114021290A (zh) * 2022-01-04 2022-02-08 东北大学 一种基于数据驱动和机理模型融合的板带钢凸度预测方法
CN114916913A (zh) * 2022-05-09 2022-08-19 东北大学 一种便携式睡眠呼吸状态实时监测系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102489524A (zh) * 2011-11-30 2012-06-13 东北大学 一种降低热轧带钢轧制过程能耗的机架负荷分配方法
CN106340016A (zh) * 2016-08-31 2017-01-18 湖南品信生物工程有限公司 一种基于细胞显微镜图像的dna定量分析方法
CN107377634A (zh) * 2017-07-19 2017-11-24 东北大学 一种热轧带钢出口凸度预报方法
CN109558677A (zh) * 2018-11-29 2019-04-02 东北大学 一种基于数据驱动的热轧板凸度预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102489524A (zh) * 2011-11-30 2012-06-13 东北大学 一种降低热轧带钢轧制过程能耗的机架负荷分配方法
CN106340016A (zh) * 2016-08-31 2017-01-18 湖南品信生物工程有限公司 一种基于细胞显微镜图像的dna定量分析方法
CN107377634A (zh) * 2017-07-19 2017-11-24 东北大学 一种热轧带钢出口凸度预报方法
CN109558677A (zh) * 2018-11-29 2019-04-02 东北大学 一种基于数据驱动的热轧板凸度预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QIUSHI LI .ETC: "Determination of corrision types from electrochemical noise by gradient boosting desion tree method", 《INTERNATIONAL JOURNAL OF ELECTROCHEMICAL SCIENCE》, vol. 14, no. 2, pages 1516 - 1528 *
龚殿尧 等: "热轧中宽带钢凸度控制模型开发与应用", 《东北大学学报(自然科学版)》, vol. 38, no. 4, pages 512 - 516 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111790762A (zh) * 2020-07-30 2020-10-20 武汉科技大学 一种基于随机森林的热轧带钢轧制力设定方法
CN111790762B (zh) * 2020-07-30 2022-02-15 武汉科技大学 一种基于随机森林的热轧带钢轧制力设定方法
CN112001439A (zh) * 2020-08-19 2020-11-27 西安建筑科技大学 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备
CN112170501A (zh) * 2020-09-16 2021-01-05 太原理工大学 一种轧辊磨损凸度和热凸度的预测方法
CN112475586A (zh) * 2020-10-12 2021-03-12 广州瑞松智能科技股份有限公司 一种焊接接头强度预测方法
CN112749505B (zh) * 2020-12-16 2023-10-24 太原科技大学 一种机理融合数据的热轧带钢截面形状预测方法
CN112749505A (zh) * 2020-12-16 2021-05-04 太原科技大学 一种机理融合数据的热轧带钢截面形状预测方法
CN112949108A (zh) * 2021-01-25 2021-06-11 北京科技大学 热轧高强钢板形缺陷全流程预测方法及图形用户界面
CN112884215A (zh) * 2021-02-02 2021-06-01 国网甘肃省电力公司信息通信公司 一种基于梯度增强树人口预测模型的参数优化方法
CN113627469A (zh) * 2021-07-01 2021-11-09 北京科技大学 一种基于模糊推理算法的热轧带钢板形凸度预测的方法
CN113627469B (zh) * 2021-07-01 2024-02-09 北京科技大学 一种基于模糊推理算法的热轧带钢板形凸度预测的方法
CN114021290A (zh) * 2022-01-04 2022-02-08 东北大学 一种基于数据驱动和机理模型融合的板带钢凸度预测方法
WO2023130666A1 (zh) * 2022-01-04 2023-07-13 东北大学 一种基于数据驱动和机理模型融合的板带钢凸度预测方法
CN114021290B (zh) * 2022-01-04 2022-04-05 东北大学 一种基于数据驱动和机理模型融合的板带钢凸度预测方法
CN114916913B (zh) * 2022-05-09 2023-01-13 东北大学 一种便携式睡眠呼吸状态实时监测系统及方法
CN114916913A (zh) * 2022-05-09 2022-08-19 东北大学 一种便携式睡眠呼吸状态实时监测系统及方法

Similar Documents

Publication Publication Date Title
CN110929347A (zh) 一种基于梯度提升树模型的热连轧带钢凸度预测方法
CN107377634B (zh) 一种热轧带钢出口凸度预报方法
CN108817103B (zh) 一种轧钢模型钢族层别分类优化方法
CN110569566B (zh) 一种板带力学性能预测方法
CN109647899B (zh) 一种带钢热轧精轧过程中多规格轧件电耗预报方法
WO2023130666A1 (zh) 一种基于数据驱动和机理模型融合的板带钢凸度预测方法
CN109359770B (zh) 一种基于机器学习预测中暑发生的模型及方法
CN112990500B (zh) 基于改进加权灰色关联分析的台区线损分析方法及系统
CN111790762B (zh) 一种基于随机森林的热轧带钢轧制力设定方法
CN110802115B (zh) 基于数据驱动的热连轧精轧入口温度预测方法
CN102357934A (zh) 一种基于橡胶混炼过程的质量监控软测量方法
CN115860211A (zh) 一种基于局部在线建模的铸坯质量预测方法
CN110222825B (zh) 一种水泥成品比表面积预测方法及系统
CN111639111A (zh) 面向调水工程的多源监测数据深度挖掘和智能分析方法
CN114091352A (zh) 基于Elman神经网络的热连轧出口板凸度动态预测方法
CN114117919A (zh) 基于样本协同表示的即时学习的软测量建模方法
CN109920489A (zh) 一种基于Lasso-CCF-CNN的加氢裂化模型及建立方法
CN108665090B (zh) 基于主成分分析与Verhulst模型的城市电网饱和负荷预测方法
CN110648023A (zh) 基于二次指数平滑改进gm(1,1)的数据预测模型的建立方法
CN113780852B (zh) 一种板带轧制过程质量缺陷的诊断方法
CN103406364B (zh) 一种基于改进型偏鲁棒m回归算法的热轧带钢厚度预测方法
CN107273703B (zh) 一种路面使用性能分布情况预测方法
CN107122609A (zh) 一种基于质量特性基因理论的机电产品质量评价方法
CN111931425A (zh) 一种基于rf算法的热轧q355b钢种的性能预测系统
CN116362447A (zh) 一种基于层次分析法的钻井施工难度评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination