CN115138693A - 一种基于分类决策树的热连轧终轧温度预测方法 - Google Patents

一种基于分类决策树的热连轧终轧温度预测方法 Download PDF

Info

Publication number
CN115138693A
CN115138693A CN202210266243.4A CN202210266243A CN115138693A CN 115138693 A CN115138693 A CN 115138693A CN 202210266243 A CN202210266243 A CN 202210266243A CN 115138693 A CN115138693 A CN 115138693A
Authority
CN
China
Prior art keywords
decision tree
data
pruning
model
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210266243.4A
Other languages
English (en)
Inventor
郝学斌
张亮
王世新
沈士杰
刘晓东
李金强
周军锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Handan Iron and Steel Group Co Ltd
Hangang Group Hanbao Iron and Steel Co Ltd
Original Assignee
Handan Iron and Steel Group Co Ltd
Hangang Group Hanbao Iron and Steel Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Handan Iron and Steel Group Co Ltd, Hangang Group Hanbao Iron and Steel Co Ltd filed Critical Handan Iron and Steel Group Co Ltd
Priority to CN202210266243.4A priority Critical patent/CN115138693A/zh
Publication of CN115138693A publication Critical patent/CN115138693A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B37/00Control devices or methods specially adapted for metal-rolling mills or the work produced thereby
    • B21B37/74Temperature control, e.g. by cooling or heating the rolls or the product
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B38/00Methods or devices for measuring, detecting or monitoring specially adapted for metal-rolling mills, e.g. position detection, inspection of the product
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明涉及一种基于分类决策树的热连轧终轧温度预测方法,属于轧钢控制方法技术领域。本发明的技术方案是:将PDI数据发送给精轧过程自动化;根据PDI数据触发精轧模型计算,轧件按照精轧轧制规程开始进行轧制过程;将生产的历史数据归一化;构建分类决策树;当决策树划分数据集遇到终止条件时,决策树停止递归;决策树剪枝,交叉验证,保留较好的拟合精度的同时使模型具有一定泛化能力。本发明的有益效果是:采用决策树分类算法对模型进行优化,对数据集进行深入挖掘,按照特征进行划分,对已构建的模型实现细分,根据数据集分类不同独立进行训练最后统一输出预测结果,进一步解决了神经元网络预测中陷入局部最优的问题,使模型的预测精度大幅提高。

Description

一种基于分类决策树的热连轧终轧温度预测方法
技术领域
本发明涉及一种基于分类决策树的热连轧终轧温度预测方法,属于轧钢控制方法技术领域。
背景技术
在热连轧实际生产中温度控制是热连轧控制中非常重要的一环,温度穿插于整个带钢生产过程中,热轧带钢的尺寸精度和质量指标和温度的控制精度密不可分。生产中需要根据温度来实时调整轧制策略以及工艺参数,因此需要开发先进温度控制系统以保证带钢温度在生产的各个流程中都处于设定范围内。其中终轧温度指的是轧制过程中热轧板带离开精轧机时的温度。终轧温度直接影响轧制的过程因素设定如负荷分配和轧制力设定等,终轧温度过低和过高都会使产品质量出现波动,因此热轧生产过程中的终轧温度预测精度显得尤为重要。
以往的终轧温度控制系统主要依据传统轧制理论而建立的数学模型进行预测,需要对轧制过程进行深入的探求才能建立较为精确的预测模型,这种数学模型可以对热连轧终轧温度进行初步预测,在很长一段时间被应用于轧制生产中。但实际轧制过程非常复杂,传统轧制理论避免不了大量假设和近似处理,因此对终轧温度的计算精度很难进一步提高,预测精度已经满足不了如今产品的需要。并且传统数学模型忽略了终轧温度在轧制中的耦合性、非线性、时变性等特点,也没有自学习功能,无法应对实时变化的轧制过程。因此,传统模型在实际生产中对终轧温度控制精度很难达到现代热轧温度控制的标准,这就给实际生产带来巨大的损失。因此,我们需要找到一种切实有效的方法提高轧制过程中终轧温度预测精度。
发明内容
本发明目的是提供一种基于分类决策树的热连轧终轧温度预测方法,采用决策树分类算法对模型进行优化,对数据集进行深入挖掘,按照特征进行划分,对已构建的模型实现细分,根据数据集分类不同独立进行训练最后统一输出预测结果,进一步解决了神经元网络预测中陷入局部最优的问题,使模型的预测精度大幅提高,有效地解决了背景技术中存在的上述问题。
本发明的技术方案是:一种基于分类决策树的热连轧终轧温度预测方法,包含以下步骤:
步骤1:将PDI数据发送给精轧过程自动化;
步骤2:根据PDI数据触发精轧模型计算,轧件按照精轧轧制规程开始进行轧制过程;
步骤3:将生产的历史数据归一化,使不同量级的数据标准映射到0到1之间;
步骤4:构建分类决策树
步骤4.1:首先从数据集中按照上述方法遍塑最优特征和最优切分点,作为树的根节点,然后根据数据划分点划分数据,将数据集拆分为两个子集;
步骤4.2:如果分类后的子集中数据全属于一类则给子集加上叶子的标签,如果子集中的数据仍可以再分,则把子集当做新的根节点,重新寻找最优特征和最优划分节点对数据集进行分类;
步骤4.3:重复4.1和4.2中的步骤不断对子数据集进行划分,直到所有的子数据集都成为叶子节点,此时停止分类,决策树构建完成;
步骤5:决策树终止条件
当决策树划分数据集遇到以下情况时,决策树停止递归:
在决策树划分进行到某一节点集合中的元素没有特征时,决策树停止递归;
当前决策树节点样本个数小于设定值时,决策树停止递归;
当决策树进行划分时子数据集中数据数量小于设置值时,子数据集返回上一节点,决策树停止递归;
计算每个样本的均方差,当均方差小于设定值时,决策树停止递归;
步骤6:决策树剪枝
采用后剪枝,即先让所有节点正常分裂再对节点进行剪枝操作,使用剪枝损失函数来描述剪枝损失,用T表示节点,用t表示子树,其剪枝损失表达式为:
Cα(t)=C(t)+α|t| (1)
式中,C(t)为预测误差,α为正则系数,|t|为叶子数量;
如果将节点T进行剪枝操作,其损失函数为:
Cα(T)=C(T)+α (2)
对节点进行划分会减小预测误差,增加拟合度,因此有C(t)<C(T),当正则化系数很小趋近于0时,Cα(t)<Cα(T),即不剪枝的损失函数小于剪枝的损失函数,此时模型偏向于于保留叶子;当正则化系数很大时,Cα(t)>Cα(T),剪枝的损失函数小于不剪枝的损失函数,此时模型偏向于剪枝;
步骤7:交叉验证
运用交叉验证方式对生成的决策树进行剪枝处理,找出最佳的正则化系数α,进行良好的剪枝处理,保留较好的拟合精度的同时使模型具有一定泛化能力。
所述步骤1中,PDI数据包括轧件中间坯尺寸数据、成品尺寸数据、钢种名称和化学组成成分。
所述步骤7中,具体方法是联立式(1)和式(2)对正则化系数α进行求解:
Figure BDA0003551921170000041
用式(3)计算出所有节点的正则化系数,将正则化系数按照大小进行排列。从最大的α开始进行验证,最后找到最佳正则化系数值完成对决策树的剪枝。
本发明的有益效果是:采用决策树分类算法对模型进行优化,对数据集进行深入挖掘,按照特征进行划分,对已构建的模型实现细分,根据数据集分类不同独立进行训练最后统一输出预测结果,进一步解决了神经元网络预测中陷入局部最优的问题,使模型的预测精度大幅提高。
附图说明
图1是本发明分类决策树模型示意图;
图2是传统模型温度预测对比图;
图3是本发明分类决策树模型预测对比图。
具体实施方式
为了使发明实施案例的目的、技术方案和优点更加清楚,下面将结合实施案例中的附图,对本发明实施案例中的技术方案进行清晰的、完整的描述,显然,所表述的实施案例是本发明一小部分实施案例,而不是全部的实施案例,基于本发明中的实施案例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施案例,都属于本发明保护范围。
一种基于分类决策树的热连轧终轧温度预测方法,包含以下步骤:
步骤1:将PDI数据发送给精轧过程自动化;
步骤2:根据PDI数据触发精轧模型计算,轧件按照精轧轧制规程开始进行轧制过程;
步骤3:将生产的历史数据归一化,由于经整理后的轧制数据的属性、类型等不相同,不同数据在数值上的差异较大,因此需要再对输入数据进行归一化处理,使不同量级的数据标准映射到0到1之间;
步骤4:构建分类决策树
步骤4.1:首先从数据集中按照上述方法遍塑最优特征和最优切分点,作为树的根节点,然后根据数据划分点划分数据,将数据集拆分为两个子集;
步骤4.2:如果分类后的子集中数据全属于一类则给子集加上叶子的标签,如果子集中的数据仍可以再分,则把子集当做新的根节点,重新寻找最优特征和最优划分节点对数据集进行分类;
步骤4.3:重复4.1和4.2中的步骤不断对子数据集进行划分,直到所有的子数据集都成为叶子节点,此时停止分类,决策树构建完成;
步骤5:决策树终止条件
当决策树划分数据集遇到以下情况时,决策树停止递归:
在决策树划分进行到某一节点集合中的元素没有特征时,决策树停止递归;
当前决策树节点样本个数小于设定值时,决策树停止递归;
当决策树进行划分时子数据集中数据数量小于设置值时,子数据集返回上一节点,决策树停止递归;
计算每个样本的均方差,当均方差小于设定值时,决策树停止递归;
步骤6:决策树剪枝
预剪枝是对当前节点划分前后模型的泛化能力进行评估,通过对比划分前后模型的泛化能力来觉得是否对当前节点进行分裂。但是某些节点虽然当前分裂会导致暂时泛化能力差,但在后续的划分中泛化能力有所提高,预剪枝直接阻止当前节点分裂容易导致模型的欠拟合。
本发明采用后剪枝,即先让所有节点正常分裂再对节点进行剪枝操作,使用剪枝损失函数来描述剪枝损失,用T表示节点,用t表示子树,其剪枝损失表达式为:
Cα(t)=C(t)+α|t| (1)
式中,C(t)为预测误差,α为正则系数,|t|为叶子数量;
如果将节点T进行剪枝操作,其损失函数为:
Cα(T)=C(T)+α (2)
对节点进行划分会减小预测误差,增加拟合度,因此有C(t)<C(T),当正则化系数很小趋近于0时,Cα(t)<Cα(T),即不剪枝的损失函数小于剪枝的损失函数,此时模型偏向于于保留叶子;当正则化系数很大时,Cα(t)>Cα(T),剪枝的损失函数小于不剪枝的损失函数,此时模型偏向于剪枝;
步骤7:交叉验证
运用交叉验证方式对生成的决策树进行剪枝处理,找出最佳的正则化系数α,进行良好的剪枝处理,保留较好的拟合精度的同时使模型具有一定泛化能力。
所述步骤1中,PDI数据包括轧件中间坯尺寸数据、成品尺寸数据、钢种名称和化学组成成分。
所述步骤7中,具体方法是联立式(1)和式(2)对正则化系数α进行求解:
Figure BDA0003551921170000081
用式(3)计算出所有节点的正则化系数,将正则化系数按照大小进行排列。从最大的α开始进行验证,最后找到最佳正则化系数值完成对决策树的剪枝。
在实际应用中,
1、模型结构
将决策树分类模块导入神经网络模型中,优化后的模型首先对数据集进行分类,分为多个数据子集,随后再将数据子集中的数据随机抽取80%作为训练集,余下数据作为测试集。对每个数据子集进行单独训练,迭代训练集中的数据调整BP神经网络模型的权值和偏置量,达到对模型训练的目的,最后用测试集中的数据对模型进行检验,输出预测值。优化后的模型结构如图1所示。
通过决策树对数据的分类,同时将BP神经网络模型拆分为多个子模型,子模型中的参数各自单独进行迭代更新,互不影响,可以对热连轧精轧过程的终轧温度进行更精确的非线性拟合,因此决策树算法有效提高了BP神经网络模型的预测精度。同时由于采用决策树分类对数据进行了更深入的挖掘,将BP神经网络寻优区间减小,减少了BP神经网络陷入局部最优而非全局最优的可能性,优化后模型有效改善了特殊数据预测精度低的情况。
2模型效果评估
模型优化主要是为了解决少数数据预测预测值与真实值偏离较大的问题,通过所构建的决策树对数据特征按照特征进行分类。分类后可以使子数据集的数据不纯度降低,避免预测过程中特殊数据预测精度低的问题。
将优化后的数据绘制拟合图与优化前进行对比,如图2和图3,可以发现优化后的模型拟合图中所描的点更接近于45°标准直线,在误差±20℃分界红线外的点明显减小,在抽取的预测数据中仅有一组数据预测误差略微超过20℃。说明在预测前运用决策树进行分类可以有效提高模型的可靠性。
下表1为优化前后预测数据各项指标的对比。优化后模型预测相对误差在±5℃内比例为53.6%,相对误差在±10℃内比例为83.5%,相对误差在±15℃内比例为95.3%,相对误差在±20℃内比例为99.9%。模型预测的各项指标均有所提升,说明决策树算法优化有一定的效果。
优化后终轧温度预测模型预测误差在10℃以内命中率为83.5%,在15℃以内命中率为95.3%。
表1
Figure BDA0003551921170000091
Figure BDA0003551921170000101

Claims (3)

1.一种基于分类决策树的热连轧终轧温度预测方法,其特征在于包含以下步骤:
步骤1:将PDI数据发送给精轧过程自动化;
步骤2:根据PDI数据触发精轧模型计算,轧件按照精轧轧制规程开始进行轧制过程;
步骤3:将生产的历史数据归一化,使不同量级的数据标准映射到0到1之间;
步骤4:构建分类决策树
步骤4.1:首先从数据集中按照上述方法遍塑最优特征和最优切分点,作为树的根节点,然后根据数据划分点划分数据,将数据集拆分为两个子集;
步骤4.2:如果分类后的子集中数据全属于一类则给子集加上叶子的标签,如果子集中的数据仍可以再分,则把子集当做新的根节点,重新寻找最优特征和最优划分节点对数据集进行分类;
步骤4.3:重复4.1和4.2中的步骤不断对子数据集进行划分,直到所有的子数据集都成为叶子节点,此时停止分类,决策树构建完成;
步骤5:决策树终止条件
当决策树划分数据集遇到以下情况时,决策树停止递归:
在决策树划分进行到某一节点集合中的元素没有特征时,决策树停止递归;
当前决策树节点样本个数小于设定值时,决策树停止递归;
当决策树进行划分时子数据集中数据数量小于设置值时,子数据集返回上一节点,决策树停止递归;
计算每个样本的均方差,当均方差小于设定值时,决策树停止递归;
步骤6:决策树剪枝
采用后剪枝,即先让所有节点正常分裂再对节点进行剪枝操作,使用剪枝损失函数来描述剪枝损失,用T表示节点,用t表示子树,其剪枝损失表达式为:
Cα(t)=C(t)+α|t| (1)
式中,C(t)为预测误差,α为正则系数,|t|为叶子数量;
如果将节点T进行剪枝操作,其损失函数为:
Cα(T)=C(T)+α (2)
对节点进行划分会减小预测误差,增加拟合度,因此有C(t)<C(T),当正则化系数很小趋近于0时,Cα(t)<Cα(T),即不剪枝的损失函数小于剪枝的损失函数,此时模型偏向于于保留叶子;当正则化系数很大时,Cα(t)>Cα(T),剪枝的损失函数小于不剪枝的损失函数,此时模型偏向于剪枝;
步骤7:交叉验证
运用交叉验证方式对生成的决策树进行剪枝处理,找出最佳的正则化系数α,进行良好的剪枝处理,保留较好的拟合精度的同时使模型具有一定泛化能力。
2.根据权利要求1所述的一种基于分类决策树的热连轧终轧温度预测方法,其特征在于:所述步骤1中,PDI数据包括轧件中间坯尺寸数据、成品尺寸数据、钢种名称和化学组成成分。
3.根据权利要求1所述的一种基于分类决策树的热连轧终轧温度预测方法,其特征在于:所述步骤7中,具体方法是联立式(1)和式(2)对正则化系数α进行求解:
Figure FDA0003551921160000031
用式(3)计算出所有节点的正则化系数,将正则化系数按照大小进行排列。从最大的α开始进行验证,最后找到最佳正则化系数值完成对决策树的剪枝。
CN202210266243.4A 2022-03-17 2022-03-17 一种基于分类决策树的热连轧终轧温度预测方法 Pending CN115138693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210266243.4A CN115138693A (zh) 2022-03-17 2022-03-17 一种基于分类决策树的热连轧终轧温度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210266243.4A CN115138693A (zh) 2022-03-17 2022-03-17 一种基于分类决策树的热连轧终轧温度预测方法

Publications (1)

Publication Number Publication Date
CN115138693A true CN115138693A (zh) 2022-10-04

Family

ID=83405639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210266243.4A Pending CN115138693A (zh) 2022-03-17 2022-03-17 一种基于分类决策树的热连轧终轧温度预测方法

Country Status (1)

Country Link
CN (1) CN115138693A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115828650A (zh) * 2023-02-24 2023-03-21 广东仁懋电子有限公司 一种用于实现氮化镓的电路高频封装方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115828650A (zh) * 2023-02-24 2023-03-21 广东仁懋电子有限公司 一种用于实现氮化镓的电路高频封装方法及系统

Similar Documents

Publication Publication Date Title
CN108510006B (zh) 一种基于数据挖掘的企业用电量分析与预测方法
CN106448151B (zh) 一种短时交通流预测方法
CN109978229A (zh) 一种对动力电池组全电芯多点温度及连接点温度进行热失控预测的方法
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN109934408A (zh) 一种基于大数据机器学习进行汽车电池rul预测的应用分析方法
CN110929347A (zh) 一种基于梯度提升树模型的热连轧带钢凸度预测方法
CN112966871B (zh) 基于卷积长短期记忆神经网络的交通拥堵预测方法及系统
CN109647899B (zh) 一种带钢热轧精轧过程中多规格轧件电耗预报方法
CN110782658A (zh) 一种基于LightGBM算法的交通量预测方法
CN101561813A (zh) 一种Web环境下的字符串相似度的分析方法
CN109615124B (zh) 一种基于深度学习的scada主站负荷预测方法
CN110708318A (zh) 基于改进的径向基神经网络算法的网络异常流量预测方法
CN113723010A (zh) 一种基于lstm温度-位移相关模型的桥梁损伤预警方法
CN105631532A (zh) 一种基于模糊决策的神经网络模型电力系统负荷预测方法
CN112818608A (zh) 一种基于改进的粒子群优化算法与支持向量机的中长期径流预报方法
CN115138693A (zh) 一种基于分类决策树的热连轧终轧温度预测方法
CN112149902B (zh) 一种基于客流特征分析的地铁短时进站客流预测方法
CN110245390A (zh) 一种基于rs-bp神经网络的汽车发动机油耗预测方法
CN115860211A (zh) 一种基于局部在线建模的铸坯质量预测方法
CN110059938B (zh) 一种基于关联规则驱动的配电网规划方法
CN114626487A (zh) 基于随机森林分类算法的线变关系校核方法
CN112765894B (zh) 一种基于k-lstm的铝电解槽状态预测方法
CN113361776A (zh) 一种基于用户用电行为聚类的电力负荷概率预测方法
CN110773580B (zh) 一种基于XGBoost算法计算轧制力的方法及系统
CN112990776A (zh) 一种配网设备健康度评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination