CN113011491A - 一种主成分分析协同随机森林的热连轧带钢宽度预测方法 - Google Patents

一种主成分分析协同随机森林的热连轧带钢宽度预测方法 Download PDF

Info

Publication number
CN113011491A
CN113011491A CN202110285167.7A CN202110285167A CN113011491A CN 113011491 A CN113011491 A CN 113011491A CN 202110285167 A CN202110285167 A CN 202110285167A CN 113011491 A CN113011491 A CN 113011491A
Authority
CN
China
Prior art keywords
width
random forest
principal component
steel
component analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110285167.7A
Other languages
English (en)
Inventor
丁敬国
郭锦华
李旭
彭文
孙杰
张殿华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202110285167.7A priority Critical patent/CN113011491A/zh
Publication of CN113011491A publication Critical patent/CN113011491A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Control Of Metal Rolling (AREA)

Abstract

本发明提供一种主成分分析协同随机森林的热连轧带钢宽度预测方法,涉及热连轧轧制过程控制技术领域。该方法首先确定热连轧生产线设备布置形式,并确定温度制度、轧机设备参数及轧制边界条件,根据生产线特征,确定需要采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据;并对采集的实测数据进行标准化处理;然后采用主成分分析法对标准化处理后的数据集进行降维处理及特征选择,并确定进行带钢宽度预测的随机森林宽度预测模型的输入变量;将基于主成分分析降维处理及特征选择后的数据集按照一定的比例划分为训练集与测试集,根据随机森林算法构建并训练随机森林宽度预测模型;并对随机森林宽度预测模型的预测精度进行评估。

Description

一种主成分分析协同随机森林的热连轧带钢宽度预测方法
技术领域
本发明涉及热连轧轧制过程控制技术领域,尤其涉及一种主成分分析协同随机森林的热连轧带钢宽度预测方法。
背景技术
板带宽度是带钢热连轧轧制过程中除厚度、板形等外一项极为重要的质量指标,宽度偏差每减小1mm,成材率就可提高0.1%,宽度精度的好坏严重地影响着带钢产品的质量与产量。良好的宽度精度不仅仅可以提高带钢产品的成材率、降低板带损耗率,更可以帮助热轧用户和后部工序创造优良的生产条件。精确的宽度控制对于带钢的产品质量具有重要意义,改进、寻求更加完善的宽度控制策略,提高带钢宽度控制精度已经成为当前轧钢领域研究的热点。日益激烈的全球竞争和钢铁行业的产能过剩危机对热轧带钢的生产技术和产品质量提出了更高的要求。
传统的热轧带钢宽度预测模型在进一步提高宽度预测精度上已经遇到了瓶颈,为了提高热连轧粗轧带钢宽度尺寸设定精度,国内外学者进行了大量的理论探索,提出了人工神经网络以及引入粒子群、朴素贝叶斯来优化神经网络等宽度预报方法,为板带材宽度尺寸精准控制技术的发展起到了积极的推动作用。但随着人工智能技术的快速发展,当前宽度预报模型已经不能满足当前生产力发展及下游企业对宽度尺寸精度的要求,主要原因是宽度控制过程存在非线性、复杂性、耦合性等特点,且人工神经网络虽已广泛应用于带钢宽度的控制和预测,但仍存在收敛速度慢、网络结构选择随机性大、易陷入局部极小值、网络泛化能力有限等缺点,从而限制了宽度预报精度的进一步提高。这就要求对热连轧粗轧生产过程的宽度预测算法进行探索,研究新的宽度预测控制方法。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种主成分分析协同随机森林的热连轧带钢宽度预测方法,提高热连轧粗轧带钢出口宽度预测精度,进而提高热连轧产品成材率。
为解决上述技术问题,本发明所采取的技术方案是:一种主成分分析协同随机森林的热连轧带钢宽度预测方法,包括以下步骤:
步骤1、确定热连轧生产线设备布置形式,并确定温度制度、轧机设备参数及轧制边界条件,根据生产线特征,确定需要采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据;
所述温度制度,包括:坯料出炉温度和钢板进入粗轧机组前的温度;所述轧机设备参数,包括:轧机最大轧制力、轧机最大力矩、轧机最大功率和轧机刚度;所述轧制边界条件,包括:环境温度、冷却水温度和轧辊温度;
步骤2、将所采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据进行标准化处理;
设定采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据中含有m个样本,每个样本有n个指标,且第i个样本对应的第j个指标为xij,于是构造成一个m×n维的矩阵X:
Figure BDA0002980154120000021
将采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据进行标准化,如下公式所示:
Figure BDA0002980154120000022
其中,
Figure BDA0002980154120000023
为第j个指标的样本均值,
Figure BDA0002980154120000024
为第j个指标的方差,i=1、2、...、m,j=1、2、...、n;得到标准化后的数据符合标准正态分布,即均值为0,方差为1;
将矩阵X中对应的指标变量进行标准化,如下公式所示:
Figure BDA0002980154120000025
其中,
Figure BDA0002980154120000026
为第j个指标变量的标准化数据;
步骤3、采用主成分分析法对标准化处理后的数据集进行降维处理及特征选择,并确定进行带钢宽度预测的随机森林宽度预测模型的输入变量;
步骤3.1、首先计算标准化后的数据集的协方差矩阵R=(rhw)n×n如下公式所示:
Figure BDA0002980154120000027
其中,协方差
Figure BDA0002980154120000028
xh,xw分别指第h,w个指标变量,h=1、2、...、n,w=1、2、...、n;
Figure BDA0002980154120000031
分别为指标变量xh、xw对应的样本平均值;
步骤3.2、计算协方差矩阵R的特征值λ1≥λ2≥...≥λn≥0及对应的特征向量u1,u2,...,un,其中uj=(u1j,u2j,...,unj)T,unj表示第j个特征向量的第n个分量;由n个特征向量组成n个新的指标变量y1,y2,...,yn,如下公式所示:
Figure BDA0002980154120000032
步骤3.3、设定y1是第1主成分,y2是第2主成分,...,yn是第n主成分;计算各主成分yj的贡献率bj及前g个主成分y1,y2,...,yg的累计贡献率αg
Figure BDA0002980154120000033
Figure BDA0002980154120000034
步骤3.4、遵循特征值大于1,累计贡献率在85%~90%范围内的原则选取主成分,并根据所选择的主成分确定降维后的K个特征;并将确定的降维后的K个特征作为进行带钢宽度预测的随机森林宽度预测模型的输入变量;
步骤4、将基于主成分分析降维处理及特征选择后的数据集按照一定的比例划分为训练集与测试集,根据随机森林算法构建并训练随机森林宽度预测模型;
步骤4.1、首先将基于主成分分析降维处理及特征选择后的数据集按照一定的比例切分为训练集S和测试集C;
步骤4.2、采用随机抽样方法在训练样本集S中有放回地重采样,随机抽取s个样本,产生t个子训练集;
步骤4.3、分别对t个子训练集进行训练,生成相应的t个决策树,由此构成随机森林宽度预测模型;针对单棵决策树的叶节点选择属性,先从K个特征中随机提取k个特征作为该决策树的当前节点,并在k个特征中进行最佳分裂选择最优的切分点做左右子树划分;
步骤4.4、让每棵决策树在深度上不断地分枝,直到每棵决策树的叶节点所有特征属性都属于同一范围;在决策树生长过程中,不进行剪枝,使其得到最大限度的生长;将生成的多棵决策树组成随机森林,通过在训练集上的训练,得到随机森林宽度预测模型;
步骤4.5、最后,在测试集上应用训练得到的随机森林宽度预测模型,取所有决策树预测结果的均值作为随机森林宽度预测模型最终的预测结果,即得到热连轧带钢宽度的预测结果;
步骤5、对随机森林宽度预测模型的预测精度进行评估;
采用均方差MSE、平均绝对百分比误差MAPE和拟合决定系数R-squared来衡量随机森林宽度预测模型的准确度;
MSE公式为:
Figure BDA0002980154120000041
MAPE公式为:
Figure BDA0002980154120000042
R-squared的公式为:
Figure BDA0002980154120000043
其中,n表示样本数据的数量;Y(i)
Figure BDA0002980154120000044
分别是第i个样本的测量值和预测值。
采用上述技术方案所产生的有益效果在于:本发明提供的一种主成分分析协同随机森林的热连轧带钢宽度预测方法,具有较好的可行性,实现了热连轧粗轧带钢宽度的高精度预测,应用到实际生产中可以提高成材率、减少损耗、提高企业效益。
附图说明
图1为本发明实施例提供的一种主成分分析协同随机森林的热连轧带钢宽度预测方法的流程图;
图2为本发明实施例提供的热连轧生产线设备布置示意图;
图3为本发明实施例提供的随机森林算法原理结构图;
图4为本发明实施例提供的带钢平均出口宽度不同预测模型的精度值对比图;
图5为本发明实施例提供的带钢平均出口宽度不同预测模型的预测误差频率直方图,其中,(a)为PCA-RF带钢平均出口宽度模型预测误差直方图,(b)为PCA-SVR带钢平均出口宽度模型预测误差直方图,(c)为PCA-KNN带钢平均出口宽度模型预测误差直方图;
图6为本发明实施例提供的PCA-RF各道次出口宽度模型预测误差频率直方图,其中,(a)为PCA-RF带钢第一道次出口宽度模型预测误差频率直方图,(b)为PCA-RF带钢第三道次出口宽度模型预测误差频率直方图,(c)为PCA-RF带钢第五道次出口宽度模型预测误差频率直方图;
图7为本发明实施例提供的PCA-RF各道次出口宽度模型真实值与预测值对照图,其中(a)为PCA-RF带钢第一道次出口宽度模型预测值与真实值对照图,(b)为PCA-RF带钢第三道次出口宽度模型预测值与真实值对照图,(c)为PCA-RF带钢第五道次出口宽度模型预测值与真实值对照图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例以热连轧机生产线为例,使用本发明的主成分分析协同随机森林(即PCA-RF)的热连轧带钢宽度预测方法对带钢换钢种、换规格及换辊后的首块钢出口宽度进行预测。
本实施例中,一种主成分分析协同随机森林的热连轧带钢宽度预测方法,如图1所示,包括以下步骤:
步骤1、确定热连轧生产线设备布置形式,并确定温度制度、轧机设备参数及轧制边界条件,根据生产线特征,确定需要采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据;
所述温度制度,包括:坯料出炉温度和钢板进入粗轧机组前的温度;所述轧机设备参数,包括:轧机最大轧制力、轧机最大力矩、轧机最大功率和轧机刚度;所述轧制边界条件,包括:环境温度、冷却水温度和轧辊温度;
本实施例中,热连轧生产线设备布置形式如图2所示,坯料出炉温度为1200℃,钢板进入精轧机组前的温度为1050℃;确定的轧机设备参数为:轧机最大轧制力是30000kN、轧机最大力矩是2200kN.m、轧机最大功率是3800kW×2,轧机刚度是4800kN/mm;确定的轧制边界条件为:环境温度为30℃,冷却水温度为25℃,轧辊温度为80℃。本施例中基于热连轧生产线,采集带钢宽度在1100mm-1700mm之间的换钢种、换规格及换辊后的首块钢样本作为实测数据集,其中包括983组样本,52个参数特征,如表1所示。本实施例将数据参数分别从板坯、轧件、轧辊、温度、工艺几个类别划分,包括生产各个环节对带钢宽度的影响因素。本实施例中预测目标为换钢种、换规格及换辊后的首块钢平均出口宽度以及带钢第一、三、五道次出口宽度;
表1带钢宽度影响参数及类别
Figure BDA0002980154120000051
Figure BDA0002980154120000061
表中,R表示平辊,E表示立辊,字母后第一位数字表示平辊或立辊的序号,第二位数字表示轧制道次;
步骤2、将所采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据进行标准化处理;
设定采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据中含有m个样本,每个样本有n个指标,且第i个样本对应的第j个指标为xij,于是构造成一个m×n维的矩阵X:
Figure BDA0002980154120000062
将采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据进行标准化,如下公式所示:
Figure BDA0002980154120000063
其中,
Figure BDA0002980154120000064
为第j个指标的样本均值,
Figure BDA0002980154120000065
为第j个指标的方差,i=1、2、...、m,j=1、2、...、n;得到标准化后的数据符合标准正态分布,即均值为0,方差为1;
将矩阵X中对应的指标变量进行标准化,如下公式所示:
Figure BDA0002980154120000066
其中,
Figure BDA0002980154120000067
为第j个指标变量的标准化数据;
本实施例中,为消除量纲影响,对采集的数据进行标准化处理。由于热连轧粗轧过程中带钢宽度主要由立辊、平辊控制,且受到温度影响较大,故将立辊开口度、水平轧制过程的宽展以及降温导致的收缩度直接作为模型的输入项,不再进行主成分分析。故需要进行标准化的数据参数个数为49,样本数量为983,即m=983,n=49,i=1,2,...,983,j=1,2,...,49;
步骤3、采用主成分分析法对标准化处理后的数据集进行降维处理及特征选择,并确定进行带钢宽度预测的随机森林宽度预测模型的输入变量;
步骤3.1、主成分分析,其本质是正交系坐标变换,首先计算标准化后的数据集的协方差矩阵R=(rhw)n×n如下公式所示:
Figure BDA0002980154120000071
其中,协方差
Figure BDA0002980154120000072
xh,xw分别指第h,w个指标变量,h=1、2、...、n,w=1、2、...、n;
Figure BDA0002980154120000073
分别为指标变量xh、xw对应的样本平均值;
步骤3.2、计算协方差矩阵R的特征值λ1≥λ2≥...≥λn≥0及对应的特征向量u1,u2,...,un,其中uj=(u1j,u2j,...,unj)T,unj表示第j个特征向量的第n个分量;由n个特征向量组成n个新的指标变量y1,y2,...,yn,如下公式所示:
Figure BDA0002980154120000074
本实施例中,协方差矩阵R的特征值按从大到小排序分别为:10.858、9.932、6.074、5.096、3.579、2.994、1.796、1.548、1.146、0.944。
步骤3.3、设定y1是第1主成分,y2是第2主成分,...,yn是第n主成分;计算各主成分yj的贡献率bj及前g个主成分y1,y2,...,yg的累计贡献率αg
Figure BDA0002980154120000075
Figure BDA0002980154120000076
步骤3.4、遵循特征值大于1,累计贡献率在85%~90%范围以内,并尽可能接近于85%的原则选取主成分,并根据所选择的主成分确定降维后的K个特征;并将确定的降维后的K个特征作为进行带钢宽度预测的随机森林宽度预测模型的输入变量;
本实施例中,各主成分贡献率bj分别为:22.159、20.269、12.395、10.400、7.305、6.110、3.666、3.160、2.340、1.926;主成分累积贡献率αg分别为:22.159、42.427、54.823、65.222、72.527、78.637、82.303、85.463、87.803、89.729,结果如表2所示;
表2主成分特征值和贡献率
Figure BDA0002980154120000081
根据表2,当主成分数为8时,其特征值为1.548(≥1),主成分累计贡献率为85.463%(≥85%),故选取前八个主成分所包含的信息代替全部数据的信息含量;由成分矩阵选择载荷值≥0.7的指标,提取出20个影响宽度的主要参数,其中包括最大宽度,目标宽度,最小宽度,定宽压力机出口宽度,板坯宽度,来料热态宽度,R2-1实际轧制力、R2-2实际轧制力、R2-3实际轧制力、R2-4实际轧制力、R2-5实际轧制力、R1-1辊缝,R2-1辊缝,R2-3辊缝,定宽压力机辊缝,最大入口温度,R2-4速度,R2-5穿带速度,R2-1压下量,E2-3压下量。将这20项变量与立辊开口度、水平轧制过程的宽展以及降温导致的收缩度同时作为随机森林宽度预测模型的输入项。
步骤4、将基于主成分分析降维处理及特征选择后的数据集按照一定的比例划分为训练集与测试集,根据如图3所示的随机森林算法构建并训练随机森林宽度预测模型;
步骤4.1、首先将基于主成分分析降维处理及特征选择后的数据集按照一定的比例切分为训练集S和测试集C;
本实施例中,按照7:3的比例将降维处理及特征选择后的数据集划分为训练集与测试集,则训练样本集S=688,测试集样本C=295;
步骤4.2、采用Bootstrap随机抽样方法在训练样本集S中有放回地重采样,随机抽取s个样本,产生t个子训练集;
步骤4.3、分别对t个子训练集进行训练,生成相应的t个决策树,由此构成随机森林宽度预测模型;针对单棵决策树的叶节点选择属性,先从K个特征中随机提取k个特征作为该决策树的当前节点,并在k个特征中进行最佳分裂选择最优的切分点做左右子树划分;本实施例中特征数为K=23;
步骤4.4、让每棵决策树在深度上不断地分枝,直到每颗决策树中叶节点的所有特征属性都属于同一范围;在决策树生长过程中,不进行剪枝,使其得到最大限度的生长;将生成的多棵决策树组成随机森林,通过在训练集上的训练,得到随机森林宽度预测模型;
步骤4.5、最后,在测试集上应用训练得到的随机森林宽度预测模型,取所有决策树预测结果的均值作为随机森林宽度预测模型最终的预测结果,即得到热连轧带钢宽度的预测结果;
本实施例中,采用支持向量机回归算法(SVR)、K-最近邻算法(KNN)、随机森林算法(RF)分别建立PCA-SVR、PCA-KNN、PCA-RF带钢平均出口宽度预测模型,通过各个模型的R-squared值、预测误差进行对比验证,验证结果如图4、图5所示,从图可以看出,本发明的PCA-RF模型性能较好,具有较好的可行性。
同时,本实施例应用PCA-RF带钢宽度预测模型分别对带钢第一、三、五道次出口宽度进行预测,如图6、7所示,图6为PCA-RF模型对带钢各道次出口宽度预测误差频率直方图,图7为PCA-RF模型对带钢各道次宽度的预测值与真实值对照图。在线应用结果表明,换钢种、换规格及换辊后首块钢采用PCA-RF模型预测各道次出口宽度预测误差集中在-10mm~10mm之间,其中96%以上的样本点的预测误差在-5mm~5mm之间。
步骤5、对随机森林宽度预测模型的预测精度进行评估;
为评估模型预测值与实际值的偏差大小,本发明采用均方差(mean squarederror,即MSE)、平均绝对百分比误差(mean absolute percent error,即MAPE)和拟合决定系数(coefficient of determination,即R-squared)来衡量随机森林宽度预测模型的准确度。
MSE公式为:
Figure BDA0002980154120000091
MAPE公式为:
Figure BDA0002980154120000092
R-squared的公式为:
Figure BDA0002980154120000101
其中,n表示样本数据的数量;Y(i)
Figure BDA0002980154120000102
分别是第i个样本的测量值和预测值。
为进一步验证PCA-RF模型的预测效果,本发明采用MSE、MAPE、R-squared函数对PCA-RF模型对带钢各道次出口宽度进行预测的预测精度进行评估,如表3所示,结果显示换钢种、换规格及换辊后首块钢各道次出口宽度预测模型的MSE值分布在8~11之间,MAPE值分布在0.1~0.2范围内,R-squared值控制在了99.9%~1范围内。
表3 PCA-RF模型宽度预测误差对照表
模型 MSE MAPE R-squared
第一道次出口宽度 10.99863 0.16439 0.99936
第三道次出口宽度 8.72523 0.15887 0.99949
第五道次出口宽度 8.16790 0.14038 0.99951
综上所述,本发明方法达到了预期成果,可以更精确地预测带钢粗轧的出口宽度,实现了带钢宽度的高精度预测。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (6)

1.一种主成分分析协同随机森林的热连轧带钢宽度预测方法,其特征在于:包括以下步骤:
步骤1、确定热连轧生产线设备布置形式,并确定温度制度、轧机设备参数及轧制边界条件,根据生产线特征,确定需要采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据;
步骤2、将所采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据进行标准化处理;
步骤3、采用主成分分析法对标准化处理后的数据集进行降维处理及特征选择,并确定进行带钢宽度预测的随机森林宽度预测模型的输入变量;
步骤4、将基于主成分分析降维处理及特征选择后的数据集按照一定的比例划分为训练集与测试集,根据随机森林算法构建并训练随机森林宽度预测模型;
步骤5、对随机森林宽度预测模型的预测精度进行评估。
2.根据权利要求1所述的、一种主成分分析协同随机森林的热连轧带钢宽度预测方法,其特征在于:步骤1所述温度制度,包括:坯料出炉温度和钢板进入粗轧机组前的温度;所述轧机设备参数,包括:轧机最大轧制力、轧机最大力矩、轧机最大功率和轧机刚度;所述轧制边界条件,包括:环境温度、冷却水温度和轧辊温度。
3.根据权利要求2所述的、一种主成分分析协同随机森林的热连轧带钢宽度预测方法,其特征在于:所述步骤2的具体方法为:
设定采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据中含有m个样本,每个样本有n个指标,且第i个样本对应的第j个指标为xij,于是构造成一个m×n维的矩阵X:
Figure FDA0002980154110000011
将采集的关于换钢种、换规格及换辊后的首块钢宽度的实测数据进行标准化,如下公式所示:
Figure FDA0002980154110000012
其中,
Figure FDA0002980154110000013
为第j个指标的样本均值,
Figure FDA0002980154110000014
为第j个指标的方差,i=1、2、...、m,j=1、2、...、n;得到标准化后的数据符合标准正态分布,即均值为0,方差为1;
将矩阵X中对应的指标变量进行标准化,如下公式所示:
Figure FDA0002980154110000021
其中,
Figure FDA0002980154110000022
为第j个指标变量的标准化数据。
4.根据权利要求3所述的、一种主成分分析协同随机森林的热连轧带钢宽度预测方法,其特征在于:所述步骤3的具体方法为:
步骤3.1、首先计算标准化后的数据集的协方差矩阵R=(rhw)n×n如下公式所示:
Figure FDA0002980154110000023
其中,协方差
Figure FDA0002980154110000024
xh,xw分别指第h,w个指标变量,h=1、2、...、n,w=1、2、...、n;
Figure FDA0002980154110000025
分别为指标变量xh、xw对应的样本平均值;
步骤3.2、计算协方差矩阵R的特征值λ1≥λ2≥...≥λn≥0及对应的特征向量u1,u2,...,un,其中uj=(u1j,u2j,...,unj)T,unj表示第j个特征向量的第n个分量;由n个特征向量组成n个新的指标变量y1,y2,...,yn,如下公式所示:
Figure FDA0002980154110000026
步骤3.3、设定y1是第1主成分,y2是第2主成分,...,yn是第n主成分;计算各主成分yj的贡献率bj及前g个主成分y1,y2,...,yg的累计贡献率αg
Figure FDA0002980154110000027
Figure FDA0002980154110000028
步骤3.4、遵循特征值大于1,累计贡献率在85%~90%范围内的原则选取主成分,并根据所选择的主成分确定降维后的K个特征;并将确定的降维后的K个特征作为进行带钢宽度预测的随机森林宽度预测模型的输入变量。
5.根据权利要求4所述的、一种主成分分析协同随机森林的热连轧带钢宽度预测方法,其特征在于:所述步骤4的具体方法为:
步骤4.1、首先将基于主成分分析降维处理及特征选择后的数据集按照一定的比例切分为训练集S和测试集C;
步骤4.2、采用随机抽样方法在训练样本集S中有放回地重采样,随机抽取s个样本,产生t个子训练集;
步骤4.3、分别对t个子训练集进行训练,生成相应的t个决策树,由此构成随机森林宽度预测模型;针对单棵决策树的叶节点选择属性,先从K个特征中随机提取k个特征作为该决策树的当前节点,并在k个特征中进行最佳分裂选择最优的切分点做左右子树划分;
步骤4.4、让每棵决策树在深度上不断地分枝,直到每棵决策树的叶节点所有特征属性都属于同一范围;在决策树生长过程中,不进行剪枝,使其得到最大限度的生长;将生成的多棵决策树组成随机森林,通过在训练集上的训练,得到随机森林宽度预测模型;
步骤4.5、最后,在测试集上应用训练得到的随机森林宽度预测模型,取所有决策树预测结果的均值作为随机森林宽度预测模型最终的预测结果,即得到热连轧带钢宽度的预测结果。
6.根据权利要求5所述的一种主成分分析协同随机森林的热连轧带钢宽度预测方法,其特征在于:所述步骤5采用均方差MSE、平均绝对百分比误差MAPE和拟合决定系数R-squared来衡量随机森林宽度预测模型的准确度;
MSE公式为:
Figure FDA0002980154110000031
MAPE公式为:
Figure FDA0002980154110000032
R-squared的公式为:
Figure FDA0002980154110000033
其中,n表示样本数据的数量;Y(i)
Figure FDA0002980154110000034
分别是第i个样本的测量值和预测值。
CN202110285167.7A 2021-03-17 2021-03-17 一种主成分分析协同随机森林的热连轧带钢宽度预测方法 Pending CN113011491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110285167.7A CN113011491A (zh) 2021-03-17 2021-03-17 一种主成分分析协同随机森林的热连轧带钢宽度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110285167.7A CN113011491A (zh) 2021-03-17 2021-03-17 一种主成分分析协同随机森林的热连轧带钢宽度预测方法

Publications (1)

Publication Number Publication Date
CN113011491A true CN113011491A (zh) 2021-06-22

Family

ID=76409034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110285167.7A Pending CN113011491A (zh) 2021-03-17 2021-03-17 一种主成分分析协同随机森林的热连轧带钢宽度预测方法

Country Status (1)

Country Link
CN (1) CN113011491A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822334A (zh) * 2021-08-20 2021-12-21 南京钢铁股份有限公司 轧辊筛选方法、存储介质及系统
CN114880886A (zh) * 2022-07-08 2022-08-09 北京科技大学 基于正交试验的轧机纵向刚度末端分析和维护方法及装置
CN114897227A (zh) * 2022-04-26 2022-08-12 东北大学 基于改进随机森林算法的多钢种力学性能预报方法
CN115106384A (zh) * 2022-05-20 2022-09-27 东北大学 一种基于随机森林的厚板轧制辊缝校正方法
CN116308183A (zh) * 2023-03-23 2023-06-23 黄河勘测规划设计研究院有限公司 水利水电工程人工砂石加工系统关键指标智能设计方法
CN117840232A (zh) * 2024-03-05 2024-04-09 东北大学 一种基于增量学习的热轧过程宽度预测方法
CN117840232B (zh) * 2024-03-05 2024-05-31 东北大学 一种基于增量学习的热轧过程宽度预测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090281981A1 (en) * 2008-05-06 2009-11-12 Chen Barry Y Discriminant Forest Classification Method and System
WO2015062209A1 (zh) * 2013-10-29 2015-05-07 华为技术有限公司 随机森林分类模型的可视化优化处理方法及装置
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN108022001A (zh) * 2017-09-20 2018-05-11 河海大学 基于pca和分位数回归森林的短期负荷概率密度预测方法
WO2020000248A1 (zh) * 2018-06-27 2020-01-02 大连理工大学 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法
CN111950795A (zh) * 2020-08-18 2020-11-17 安徽中烟工业有限责任公司 基于随机森林的松散回潮加水比例的预测方法
CN112287550A (zh) * 2020-10-30 2021-01-29 北京科技大学 基于主成分分析控制器的带钢头部厚差过程参数优化方法
CN112418538A (zh) * 2020-11-30 2021-02-26 武汉科技大学 一种基于随机森林分类的连铸坯夹杂预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090281981A1 (en) * 2008-05-06 2009-11-12 Chen Barry Y Discriminant Forest Classification Method and System
WO2015062209A1 (zh) * 2013-10-29 2015-05-07 华为技术有限公司 随机森林分类模型的可视化优化处理方法及装置
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN108022001A (zh) * 2017-09-20 2018-05-11 河海大学 基于pca和分位数回归森林的短期负荷概率密度预测方法
WO2020000248A1 (zh) * 2018-06-27 2020-01-02 大连理工大学 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法
CN111950795A (zh) * 2020-08-18 2020-11-17 安徽中烟工业有限责任公司 基于随机森林的松散回潮加水比例的预测方法
CN112287550A (zh) * 2020-10-30 2021-01-29 北京科技大学 基于主成分分析控制器的带钢头部厚差过程参数优化方法
CN112418538A (zh) * 2020-11-30 2021-02-26 武汉科技大学 一种基于随机森林分类的连铸坯夹杂预测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822334A (zh) * 2021-08-20 2021-12-21 南京钢铁股份有限公司 轧辊筛选方法、存储介质及系统
CN114897227A (zh) * 2022-04-26 2022-08-12 东北大学 基于改进随机森林算法的多钢种力学性能预报方法
CN115106384A (zh) * 2022-05-20 2022-09-27 东北大学 一种基于随机森林的厚板轧制辊缝校正方法
CN114880886A (zh) * 2022-07-08 2022-08-09 北京科技大学 基于正交试验的轧机纵向刚度末端分析和维护方法及装置
CN116308183A (zh) * 2023-03-23 2023-06-23 黄河勘测规划设计研究院有限公司 水利水电工程人工砂石加工系统关键指标智能设计方法
CN117840232A (zh) * 2024-03-05 2024-04-09 东北大学 一种基于增量学习的热轧过程宽度预测方法
CN117840232B (zh) * 2024-03-05 2024-05-31 东北大学 一种基于增量学习的热轧过程宽度预测方法

Similar Documents

Publication Publication Date Title
CN113011491A (zh) 一种主成分分析协同随机森林的热连轧带钢宽度预测方法
CN107377634B (zh) 一种热轧带钢出口凸度预报方法
CN112100745B (zh) 基于lda理论的汽车大梁钢力学性能预测方法
WO2023130666A1 (zh) 一种基于数据驱动和机理模型融合的板带钢凸度预测方法
CN110929347A (zh) 一种基于梯度提升树模型的热连轧带钢凸度预测方法
CN103745273A (zh) 一种半导体制造过程的多性能预测方法
CN114897227A (zh) 基于改进随机森林算法的多钢种力学性能预报方法
CN111209967A (zh) 一种基于支持向量机的轧制过程板凸度预测方法
Zhang et al. Tool wear model based on least squares support vector machines and Kalman filter
CN111790762B (zh) 一种基于随机森林的热轧带钢轧制力设定方法
CN117131767A (zh) 基于随机森林算法预测热轧四辊轧机工作辊热凸度的方法
CN114077876A (zh) 一种带钢热连轧多模态过程监测方法及装置
CN115815345A (zh) 预测全流程热轧带钢力学性能的机理协同预报方法及系统
CN113177358A (zh) 一种基于模糊细粒度特征提取的水泥质量软测量方法
CN116259379A (zh) 一种热轧带钢形变性能的在线智能预测方法及预测系统
Zhao et al. Prediction of mechanical properties of cold rolled strip based on improved extreme random tree
Hu et al. A novel forecast model based on CF-PSO-SVM approach for predicting the roll gap in acceleration and deceleration process
Song et al. Control strategy of multi-stand work roll bending and shifting on the crown for UVC hot rolling mill based on MOGPR approach
CN112170502A (zh) 一种轧制过程弯辊力的预测方法
CN115169453A (zh) 基于密度聚类协同深度残差网络的热连轧宽度预测方法
Zhao et al. Predicting flatness of strip tandem cold rolling using a general regression neural network optimized by differential evolution algorithm
CN115106384B (zh) 一种基于随机森林的厚板轧制辊缝校正方法
CN111310127B (zh) 基于食品制品品质范围获取原料品质范围的方法及装置
CN117753795B (zh) 一种针对多钢种、多规格热轧产品的前馈控制方法
Liu et al. Prediction and Simulation of cold rolled strip thickness based on PSO-SVM-AdaBoost

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination