CN109280726B - 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法 - Google Patents

一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法 Download PDF

Info

Publication number
CN109280726B
CN109280726B CN201811086634.8A CN201811086634A CN109280726B CN 109280726 B CN109280726 B CN 109280726B CN 201811086634 A CN201811086634 A CN 201811086634A CN 109280726 B CN109280726 B CN 109280726B
Authority
CN
China
Prior art keywords
linear regression
multiple linear
temperature
variable
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811086634.8A
Other languages
English (en)
Other versions
CN109280726A (zh
Inventor
王兵
王惯玉
卢琨
周郁明
代兵
陈鹏
宁芳青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University of Technology AHUT
Original Assignee
Anhui University of Technology AHUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University of Technology AHUT filed Critical Anhui University of Technology AHUT
Priority to CN201811086634.8A priority Critical patent/CN109280726B/zh
Publication of CN109280726A publication Critical patent/CN109280726A/zh
Application granted granted Critical
Publication of CN109280726B publication Critical patent/CN109280726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C21METALLURGY OF IRON
    • C21BMANUFACTURE OF IRON OR STEEL
    • C21B5/00Making pig-iron in the blast furnace
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • CCHEMISTRY; METALLURGY
    • C21METALLURGY OF IRON
    • C21BMANUFACTURE OF IRON OR STEEL
    • C21B2300/00Process aspects
    • C21B2300/04Modeling of the process, e.g. for control purposes; CII
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Materials Engineering (AREA)
  • Organic Chemistry (AREA)
  • Metallurgy (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Manufacturing & Machinery (AREA)
  • Blast Furnaces (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,属于冶金信息处理技术领域。本发明首先进行炉芯死料柱温度目标值DMTgoal的计算,接着对该数据进行处理,对经过处理得到的数据样本做Pearson相关性分析,根据相关性分析的结果初步选取条件变量。再对各条件变量进行Pearson相关性分析,依据相关性分析的结果尽可能选择互相独立的条件变量建立模型。接着通过最小二乘法以及基于AIC的变量筛选准则筛选条件变量,再检验初步多元线性回归方程的拟优合度与回归系数,得到多元线性回归模型。本发明第一次提出使用多元线性回归算法来预测炉芯死料柱温度,可以实现高精度预测未来五天内的炉芯死料柱温度,而且可以实现炉芯死料柱温度的预警功能。

Description

一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的 方法
技术领域
本发明涉及冶金信息处理技术领域,更具体地说,涉及一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法。
背景技术
现代钢铁企业的管理者和生产者总是全力维护高炉生产的长期稳定顺行,以获取钢铁企业的最大效益。而炉缸活性犹如高炉生产的“心脏”,一旦炉缸活性出现问题,破坏高炉稳定顺行,那么带来的损失是非常巨大的。
就目前而言,炉缸活性的量化监测已经成为高炉生产的热点、重点和难点,如何实现对炉缸活性的量化计算,怎样实现对炉缸活性的在线监测,如何在最短的时间内准确的发现炉缸活性的异常变化,从而在最短的时间内恢复炉缸活性,是行业内亟待解决的问题,其根本目的就是要维护高炉生产的长期稳定顺行,确保没有高炉炉缸堆积等恶性生产事故的发生,从而避免造成巨大的经济损失,为降本增效保驾护航。
高炉炉缸活性与炉芯死料柱温度关系密切,良好的炉缸活性要求炉芯死料柱温度在一定的范围内波动,因此炉芯死料柱温度能够表征炉缸活性。但是,炉芯死料柱温度目前无法通过技术手段测得。
国外的Kalevi Raipala于2000年在国际期刊Scandinavian Journal ofMetallurgy上发表了名为Deadman and hearth phenomena in the blast furnace的论文,该论文给出了估计炉缸炉芯死料柱温度的计算公式,通过该公式可以直接计算炉芯死料柱温度来判断炉缸的工作状态,但该论文所公开的死料柱温度计算过程极其繁杂,且该公式的得出纯粹依靠经验,对不同高炉的适用性较差。
经检索,中国专利申请号CN201710107070.0,申请日期为2017年2月27日,发明创造名称为:监测高炉炉缸活性的炉缸工作活跃指数量化方法;该申请案试图定义一种炉缸活性的监测方法。其利用炉芯死料柱温度代替炉缸炉底各层中心热电偶温度均值,由于炉芯死料柱温度能够直接反映死焦堆的温度状态及其变化,从而可以在最短的时间内反映出死焦堆的渗透能力的变化。该方法首先改进了2000年Kalevi Raipala在论文Deadman andhearth phenomena in the blast furnace提出的炉缸炉芯死料柱温度计算公式。在此基础上提出了炉缸工作活跃性指数量化的方法,经实践验证具有良好的效果。但是该方法关键部分,炉芯死料柱温度的计算依然没有摆脱计算过程极其繁杂,提出纯粹依靠经验的弊端。
发明内容
1.发明要解决的技术问题
为了克服大型高炉炉缸炉芯死料柱温度计算繁杂、低效,适应性差且强烈依赖于经验的技术难题,本发明提出了一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法;本发明可以实现在不需要精确计算炉芯死料柱温度的情况下,预测炉芯死料柱温度,使得炉芯死料柱温度的预测第一次脱离了经验公式,解决了炉芯死料柱温度计算低效,适应性差且强烈依赖于经验的技术难题;针对炉芯死料柱温度低温判断问题,本发明所建立的关于炉芯死料柱温度的多元线性回归模型同时还具有低温预警功能,可以实现炉芯死料柱温度的低温预警。
2.技术方案
为达到上述目的,本发明提供的技术方案为:
本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其步骤为:
1)对采集到的数据进行炉芯死料柱温度目标值DMTgoal计算;
2)对目标值进行处理,处理的内容包括目标值填充与目标值异常值删除;
3)分析DMTgoal与目标值处理完成的数据的相关性,并在此基础上初步选取建立多元线性回归模型的条件变量;
4)分析步骤3)中选择出来的条件变量间的相关性并选取建立多元线性回归模型的条件变量;
5)使用最小二乘法以及基于AIC的变量筛选准则筛选条件变量建立多元线性回归模型;
6)对步骤5)中得到的多元线性回归模型进行拟合优度检验与回归系数的检验,然后将模型作用于测试集,验证多元线性回归模型的有效性。
更进一步地,步骤1)所述的炉芯温度目标值的计算公式如下:
Figure BDA0001803310600000021
其中,约束条件为:500≤FR≤530,单位为kg/t;-20≤Δt≤120,单位为℃;30≤Dpcoke≤40,单位为毫米;
式中:DMT为炉芯死料柱温度;tf为理论燃烧温度;Vbosh为炉腹煤气量;D为炉缸直径;FR为燃料比;Δt为炉渣流动性指数;ηCO,C为炉身探针测得的炉中心CO利用率;Dpcoke为炉芯死料柱焦炭尺寸;
当FR=500kg/t,Δt=-20℃,Dpcoke=30mm时,DMT取得最小值DMTmin;当FR=530kg/t,Δt=120℃,Dpcoke=40mm时,DMT取得最大值DMTmax;取DMTmin与DMTmax的均值为目标值,目标值记为DMTgoal
更进一步地,步骤2)所述的目标值填充部分,将一天24小时内,缺失的一个小时数据按照该小时的前一个小时和后一个小时的数据的平均值填充;
目标值异常值删除部分,删除炉芯温度小于1300℃,大于1500℃的炉缸炉芯死料柱温度目标值;删除tf,Vbosh,ηCO,C异常的数据,tf,Vbosh,ηCO,C异常的判断标准为tf,Vbosh,ηCO,C各自的散点图中孤立点的数据。
更进一步地,步骤3)中相关性的分析使用Pearson相关性;当二元数据样本为(x1,y1),(x2,y2),...,(xn,yn),其中,xi为变量x第i个样本的样本值,yi为变量y第i个样本的样本值,n为总样本容量;其相关性系数r定义为:
Figure BDA0001803310600000031
其中,
Figure BDA0001803310600000032
样本的Pearson相关系数的绝对值越大,条件变量与目标值DMTgoal之间的相关性就越强;完成相关性分析后,观察数据中各条件变量与目标值之间的相关系数与是否通过显著性检验,当条件变量的置信度小于0.05时变量通过显著性检验;初步选取与目标值强相关的数据且通过显著性检验的变量作为条件变量来建立多元线性回归模型。
更进一步地,步骤4)中相关性的分析依然使用Pearson相关性;完成相关性分析后,观察条件变量之间的相关性,如两条件变量之间的相关系数高于0.9999,且在步骤3)中得到目标值与该两条件变量之间的相关系数的差值的绝对值小于等于0.0500(0.0500为工程实际中的允许误差范围,这里沿用为阈值),在模型建立之前将其中一变量拒绝出模型,进而确定引入多元回归模型的条件变量。
更进一步地,步骤5)建立的多元线性回归模型为:
yi=β01xi1+...+βpxipi,i=1,...,n
其中,xip是n次不同状态下获得的条件变量,p为条件变量的总样本数,yi为目标变量,ε~N(0,σ2),且εi都是相互独立且服从同一正态分布的随机变量。
更进一步地,步骤5)中多元线性回归模型不含偏差项的估计函数形式为:
Figure BDA0001803310600000033
Figure BDA0001803310600000041
Y是由n次不同状态下获得的目标变量构成的n维向量;X是由n次不同状态下样本的条件变量构成的n×(p+1)阶矩阵;
Figure BDA0001803310600000042
为多元线性回归方程的残差向量,基于残差向量得到σ2的估计为:
Figure BDA0001803310600000043
此时
Figure BDA0001803310600000044
被称为σ2的无偏估计;
多元线性回归方程中涉及很多变量,通过检验某个变量对应的回归系数是否为0,对多元线性回归模型做显著性检验,如果为0就将该变量剔除最终的模型。
更进一步地,步骤5)在条件变量的选择过程中引入AIC准则来选择最优模型,对于建立的多元线性回归模型,AIC的定义为:
Figure BDA0001803310600000045
其中,N为样本中条件变量的个数;
Figure BDA0001803310600000046
是所建立模型包含的自变量个数,Q为所建立模
型包含的自变量个数;在所有备选模型中,使得AIC值最小的模型被视为最优模型。
3.有益效果
采用本发明提供的技术方案,与已有的公知技术相比,具有如下显著效果:
(1)本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,采用的多元线性回归算法建立起的多元线性回归模型在一定程度上表征了炉芯温度与操作参数之间的隐含关系。从而可以基于此方法建立出简单的、精度较高且计算速度快的炉芯温度预测模型,使得炉芯温度的计算可以脱离复杂的经验公式;
(2)本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,在测试集上,由于预测值比实际值有84%的可能性偏小,这意味着该模型具有一定的低温预警功能;
(3)本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,在回归方程的建立中,样本中的异常数据比例较小且不容易发现,本发明仅仅只是从两个方面对异常数据做了简单预处理,但预测结果误差在容许误差范围内。因此,本发明能够有效处理带有少数异常数据的样本,进而进行炉缸炉芯温度的预测。
附图说明
图1为本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法的流程图;
图2为本发明中多元线性回归模型在训练集上的的相对误差;
图3为本发明中多元线性回归模型的预测值与实际值的曲线图;
图4为本发明中多元线性回归模型在测试集上的相对误差图;
图5为本发明中模型在测试集上实际值与预测值的差值示意图。
具体实施方式
为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。
实施例1
结合图1,本实施例的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,对炉缸炉芯温度进行预测的步骤如下:
1)对采集到的数据进行炉芯死料柱温度目标值DMTgoal计算,本实施例的数据源为炼铁厂在2017年10月19日到2018年1月18日的每天内每隔一个小时采集一次操作参数而得到的有缺失的操作参数数据,对炉芯死料柱温度预测的采集到的数据详见表1。
由于直接通过公开的估算公式计算目标值非常复杂,常常需要通过多变量的多次迭代得到,为了简化计算过程,本实施例的炉芯温度目标值计算通过已经公开的炉芯温度计算经验公式变形得到。已经公开的经验估算公式为:
Figure BDA0001803310600000051
Figure BDA0001803310600000052
Δt=tCT-tL-50
式中:DMT为炉芯死料柱温度,单位为℃;tf为理论燃烧温度,由上述公式中tf的表达式给出,单位为℃;Vbosh为炉腹煤气量,单位为m3/min;D为炉缸直径,单位为m;FR为燃料比,单位为kg/t;Δt为炉渣流动性指数,由上述公式中Δt的表达式给出,单位为℃;ηCO,C为炉身探针测得的炉中心CO利用率,单位为%;Dpcoke为炉芯死料柱焦炭尺寸,单位为mm;QRJ为碳素燃烧产生的热量;QRRL为燃料燃烧产生的热量;
Figure BDA0001803310600000053
为碳素燃烧生成CO2释放的热量;
Figure BDA0001803310600000054
为燃料中氢燃烧生成H2O释放的热量;QRF为热风代入的显热;QJ为焦炭带入的物理热;QRL为燃料带入的物理热;QS为鼓风中燃料和水分分解耗热;QF为喷吹燃料分解耗热;QRQT为不完全燃烧条件下煤粉在风口前的反应热;VMQ为风口回旋区煤气量;cMQ为风口回旋区煤气平均比热容;mHF为焦炭和喷吹燃料燃烧产生的灰分;cHF为灰分平均比热容;tCT为高炉出铁温度,单位为℃;tL为炉渣流动温度,单位为℃。
参看表1,采集到的数据当中已经包含了钢厂按照上述tf表达式计算好的tf值,单位为℃,同时也包含了Vbosh值,单位为m3/min以及ηCO,C值,单位为%。钢厂提供的炉缸直径D=14.8米,FR的范围为500至530kg/t,Dpcoke的范围为30至40mm,tCT的范围为1480至1520℃,tL的范围为1350至1450℃。
根据经验公式以及上述数据,在上述DMT的计算公式中,将tf,Vbosh,ηCO,C以及D视为常量,FR,Δt,Dpcoke视为自变量,将DMT的计算公式视为关于FR,Δt,Dpcoke的三元一次方程。又由于这三个自变量有各自的取值范围,则将DMT视为在有约束条件下的关于FR,Δt,Dpcoke的三元一次方程,则有:
Figure BDA0001803310600000061
其中,约束条件为:500≤FR≤530,单位为kg/t;-20≤Δt≤120,单位为℃;30≤Dpcoke≤40,单位为毫米。
在得到上述带有约束条件的关于DMT的三元一次方程后,由于DMT是分别关于FR,Δt,Dpcoke的增函数,当FR=500kg/t,Δt=-20℃,Dpcoke=30mm时,DMT取得最小值DMTmin;当FR=530kg/t,Δt=120℃,Dpcoke=40mm时,DMT取得最大值DMTmax。取DMT nim与DMTmax的均值为目标值,目标值记为DMTgoal
2)对目标值进行处理,处理的内容为目标值填充与目标值异常值删除。
目标值填充部分,将一天24小时内只缺失一个小时的数据按照该小时的前一个小时和后一个小时的数据的平均值填充,共填充4个样本数据。
值得说明的是,数据缺失在数据挖掘中是很常见的,数据缺失的原因可能是系统在采集数据时候没有采集到完整的数据,也有可能是人为原因造成的。表1列出了数据变量,这些变量的具体数值每个小时采集一次,一天有24个小时,那么在一天内就采集到24个同一变量的不同值,同一个小时里采集到的变量值就构成了一个样本,一天内采集到的数据就构成了24个样本。一天内应该有24个样本,如果出现数据缺失情况,为了尽可能的用上数据信息,就需要对这个缺失的样本进行填充。所谓缺失一个样本,其实就是缺失某个小时的表1中所有的变量的具体数值与目标值。这个时刻的前一小时与后一小时的同一变量的不同的数值的均值与目标值的均值填充为缺失时刻的对应的变量值与目标值。比如,某天23时数据缺失,其实缺失的就是表1中所有变量的具体值与目标值,这些变量有理论燃烧温度、炉腹煤气量等和目标值,22时与24时的数据没有缺失,22时与24时的理论燃烧温度、炉腹煤气量等变量值是已知的,取22时与24时的理论燃烧温度的均值作为23时的理论燃烧温度的值。取22时与24时炉腹煤气量的均值作为23时炉腹煤气量的值,依此类推,就将23时缺失的变量数据填充了起来,同时取22时与24时的目标值的均值作为23时的目标值。
目标值异常值删除部分,炉芯温度小于1300℃,大于1500℃炉缸炉芯死料柱温度不可操作,这时会发生炉缸事故,因此删除目标值小于1300℃,大于1500℃的数据。同时,如果tf,Vbosh,ηCO,C异常,目标值也异常,因此删除tf,Vbosh,ηCO,C异常的数据,tf,Vbosh,ηCO,C异常的判断标准为tf,Vbosh,ηCO,C各自的散点图中孤立点的数据。
3)分析DMTgoal与目标值处理完成的数据的相关性。相关性的分析使用Pearson相关性,当二元数据样本为(x1,y1),(x2,y2),...,(xn,yn),其中,xi为变量x第i个样本的样本值,yi为变量y第i个样本的样本值,n为总样本容量。其相关性系数r定义为:
Figure BDA0001803310600000071
其中,
Figure BDA0001803310600000072
样本的Pearson相关系数的绝对值越大,条件变量(目标值处理完成的如表1所示的全部变量视为条件变量)与目标值DMTgoal之间的相关性就越强。在统计学中,一般根据样本Pearson相关系数绝对值大小来划分相关性强度。0.8<|r|≤1,称为高度相关;0.6<|r|≤0.8,称为强相关;0.4<|r|≤0.6,称为中等程度相关;0.2<|r|≤0.4,称为弱相关;|r|≤0.2,称为极弱相关。
完成相关性分析后,观察数据中各条件变量与目标值之间的相关系数与是否通过显著性检验,当条件变量的置信度小于0.05时变量通过显著性检验。选取与目标值强相关(条件变量与目标值的相关性系数的绝对值大于0.6而小于等于0.8)的数据且通过显著性检验的变量作为条件变量来建立多元线性回归模型。按照此原则,初步选取条件变量,选取的条件变量为富氧流量、冷风温度、20.080m炉身静压、20.080m炉身静压_A、20.080m炉身静压_B、26.025m炉身静压_A、26.025m炉身静压_B、26.025m炉身静压_B、下部压差、富氧率、理论燃烧温度这11个变量作为条件变量。
4)分析步骤3)中选择出来的条件变量间的相关性。相关性的分析依然使用Pearson相关性。当二元数据样本为(a1,b1),(a2,b2),...,(an,bn),其中,ai为变量a第i个样本的样本值,bi为变量b第i个样本的样本值,m为总样本容量,其相关性系数g定义为:
Figure BDA0001803310600000081
其中,
Figure BDA0001803310600000082
样本的Pearson相关系数的绝对值越大,条件变量与目标值DMTgoal之间的相关性就越强。在统计学中,一般根据样本Pearson相关系数绝对值大小来划分相关性强度。0.8<|g|≤1,称为高度相关;0.6<|g|≤0.8,称为强相关;0.4<|g|≤0.6,称为中等程度相关;0.2<|g|≤0.4。称为弱相关;|g|≤0.2,称为极弱相关。完成相关性分析后,观察条件变量之间的相关性,发现条件变量富氧流量与条件变量富氧率之间的相关系数高达99.9%,两者均通过显著性检验,且在步骤3)中得到目标值与该两条件变量之间的相关系数的差值的绝对值小于等于0.0500。为了最大程度简化多元线性回归模型,在模型建立之前将变量富氧流量拒绝出模型。进而确定初步引入多元回归模型的条件变量,初步引入多元线性回归模型的条件变量为冷风温度、20.080m炉身静压、20.080m炉身静压_A、20.080m炉身静压_B、26.025m炉身静压_A、26.025m炉身静压_B、26.025m炉身静压_C、下部压差、富氧率、理论燃烧温度这十个条件变量。
5)使用最小二乘法以及基于AIC的变量筛选准则筛选条件变量建立多元线性回归模型。假设xi1,xi2,...,xip,i=1,...,n,是n次不同状态下获得的条件变量。其中,n是第n个条件变量的序列号,yi为目标变量,i=1,...,n,n是第n个条件变量的序列号对应的目标变量的序列号,p为条件变量的总样本数。通过多次独立状态下获得的多个条件变量与目标变量之间的多元线性回归模型可以写成:
yi=β01xi1+...+βpxipi,i=1,...,n
其中,ε~N(0,σ2),即ε服从于均值为0,方差为σ2的正态分布。且εi都是相互独立且服从同一正态分布的随机变量。一般基于训练样本的条件变量的模型写成矩阵表达式:
Y=Xβ+ε
其中,Y是由n次不同状态下获得的目标变量构成的n维向量;X是由n次不同状态下样本的条件变量构成的n×(p+1)阶矩阵;β为条件变量前系数构成的p+1维向量;ε是n维随机误差向量,并且满足E(ε)=0,var(ε)=σ2In。矩阵变量的详细表达式如下:
Figure BDA0001803310600000091
其中β的最小二乘估计为:
Figure BDA0001803310600000092
统计学上已经证明β的最小二乘估计就是β的无偏估计。因此就可以获得多元线性回归方程不含偏差项的估计函数形式为:
Figure BDA0001803310600000093
Figure BDA0001803310600000094
为多元线性回归方程的残差向量,基于残差向量得到σ2的估计为:
Figure BDA0001803310600000095
此时
Figure BDA0001803310600000096
被称为σ2的无偏估计。
通过无偏估计而引入多元线性回归模型的变量太多会使得建立的模型不够稳定。因此,对多元线性回归模型做显著性检验就显得尤为重要,通过对回归系数的显著性检验实现对多元线性回归模型显著性检验是最常见的方式之一。回归系数的显著性检验,主要就是通过检验某个变量对应的回归系数是否为0。如果为0就意味着这个变量就没必要留在最终的模型中。
条件变量之间往往会存在多重共线性,因此多元回归模型的表现往往不够理想。所谓的多重共线性指的就是条件变量之间也存在较强的相关性。而由于多重共线性的存在,可能会导致最终建立的模型里真正对目标变量有影响的条件变量未通过显著性检验而被拒绝出模型。为了减小条件变量之间存在的多重共线性对多元回归模型的影响,在条件变量的选择过程中引入Akaike Information Criterion,即AIC准则来选择最优模型。对于建立了的多元线性回归模型,AIC的定义为:
Figure BDA0001803310600000097
其中,N为样本中条件变量的个数;
Figure BDA0001803310600000098
是所建立模型包含的自变量个数,Q为所建立模型包含的自变量个数。在所有备选模型中,使得AIC值最小的模型被视为最优模型。
基于上述理论,使用2017年10月19日至2018年1月13日这77天的一共1855个样本数据作为训练集得到最优的多元线性回归模型,步骤5)中未通过回归系数检验的条件变量为26.025m炉身静压_A与26.025m炉身静压_C。在进行基于AIC准则的逐步选择法筛选变量过后,26.025m炉身静压_A与26.025m炉身静压_C两个条件变量被拒绝出模型,冷风温度、20.080m炉身静压、20.080m炉身静压_A、20.080m炉身静压_B、26.025m炉身静压_B、下部压差、富氧率、理论燃烧温度等一共8个条件变量被允许进入多元线性回归模型,此时AIC最小,为14040。此时模型的条件变量的回归系数显著性检验均通过,模型为:
DMTgoal=790.5006+0.1252CT+1.3587OP-0.1611DP+0.0836DP_A+0.1349DP_B+0.4048DP_b+0.5430BP+0.1957TT
其中,CT为冷风温度,OP为富氧率,DP为20.080m炉身静压,DP_A为20.080m_A炉身静压,DP_B为20.080m炉身静压-B,DP_b为26.025m炉身静压B,BP为下部压差,TT为理论燃烧温度。
6)将步骤5)中得到的多元线性回归模型作用于测试集(测试集为2018年1月14日至2018.1月18日这5天的100个样本数据)来测试模型之前,对模型进行拟合优度检验与回归系数检验,之后验证多元线性回归模型的有效性。步骤5)中得到的多元回归模型的拟合优度为0.647,且各条件变量均通过回归系数显著性检验。而拟合优度越接近于1,回归方程的拟合度越高。说明该多元回归模型与试验数据有很好的吻合,该模型可以较好的拟合作用。而该模型在训练集上的平均训练误差为0.57%,最大训练误差为3.33%,进一步验证了该模型有很好的拟合作用。将该模型用于样本数为100,相当于5天数据量的测试集上,测试相对误差最高为1.60%。且预测值有84%的可能性将真实值预测为比真实值小。
本实施例对炉芯死料柱温度预测的采集到的数据名称详见表1,包括了理论燃烧温度、炉腹煤气等一共50个变量。本实施例各变量与目标值间的相关性见表2。本实施例在训练集上的相对误差详见图4,由图4中数据可以看出模型在测试集上的平均测试误差为0.57%,测试相对误差最高为1.60%,模型在测试集上具有高精度的预测性能,同时由于建立的模型极为简单,预测时间极为快速。图2为本实施例模型在训练集上的相对误差,可以看出该模型在训练集上的平均训练误差为0.57%,最大训练误差为3.33%,验证了该模型有很好的拟合作用。图3为本实施例炉缸炉芯温度实际值与预测值的曲线图,可以看出预测值与实际值具有较为相同的变化趋势,也证明了本实施例的有效性。图5为本实施例预测值与实际值的差值图,从图中可以看出84(总100)个数据的差值为负值,意味着模型有84%的概率将炉芯死料柱温度往比实际值偏小方向预测,因此模型具有一定的低温预警功能。
表1炉芯死料柱温度预测采集到的数据变量名称表
Figure BDA0001803310600000111
表2采集数据变量与目标值之间的Pearson相关性表
Figure BDA0001803310600000112
以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一。所以,如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (7)

1.一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于,其步骤为:
1)对采集到的数据进行炉芯死料柱温度目标值DMTgoal计算;所述的炉芯温度目标值的计算公式如下:
Figure FDA0003091337140000011
其中,约束条件为:500≤FR≤530,单位为kg/t;-20≤Δt≤120,单位为℃;30≤Dpcoke≤40,单位为毫米;
式中:DMT为炉芯死料柱温度;tf为理论燃烧温度;Vbosh为炉腹煤气量;D为炉缸直径;FR为燃料比;Δt为炉渣流动性指数;ηCO,C为炉身探针测得的炉中心CO利用率;Dpcoke为炉芯死料柱焦炭尺寸;
当FR=500kg/t,Δt=-20℃,Dpcoke=30mm时,DMT取得最小值DMTmin;当FR=530kg/t,Δt=120℃,Dpcoke=40mm时,DMT取得最大值DMTmax;取DMTmin与DMTmax的均值为目标值,目标值记为DMTgoal
2)对目标值进行处理,处理的内容包括目标值填充与目标值异常值删除;
3)分析DMTgoal与目标值处理完成的数据的相关性,并在此基础上初步选取建立多元线性回归模型的条件变量;
4)分析步骤3)中选择出来的条件变量间的相关性并选取建立多元线性回归模型的条件变量;
5)使用最小二乘法以及基于AIC的变量筛选准则筛选条件变量建立多元线性回归模型;
6)对步骤5)中得到的多元线性回归模型进行拟合优度检验与回归系数的检验,然后将模型作用于测试集,验证多元线性回归模型的有效性。
2.根据权利要求1所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤2)所述的目标值填充部分,将一天24小时内,缺失的一个小时数据按照该小时的前一个小时和后一个小时的数据的平均值填充;
目标值异常值删除部分,删除炉芯温度小于1300℃,大于1500℃的炉缸炉芯死料柱温度目标值;删除tf,Vbosh,ηCO,C异常的数据,tf,Vbosh,ηCO,C异常的判断标准为tf,Vbosh,ηCO,C各自的散点图中孤立点的数据。
3.根据权利要求2所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤3)中相关性的分析使用Pearson相关性;当二元数据样本为(x1,y1),(x2,y2),...,(xn,yn),其中,xi为变量x第i个样本的样本值,yi为变量y第i个样本的样本值,n为总样本容量;其相关性系数r定义为:
Figure FDA0003091337140000021
其中,
Figure FDA0003091337140000022
样本的Pearson相关系数的绝对值越大,条件变量与目标值DMTgoal之间的相关性就越强;完成相关性分析后,观察数据中各条件变量与目标值之间的相关系数与是否通过显著性检验,当条件变量的置信度小于0.05时变量通过显著性检验;初步选取与目标值强相关的数据且通过显著性检验的变量作为条件变量来建立多元线性回归模型。
4.根据权利要求3所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤4)中相关性的分析依然使用Pearson相关性;完成相关性分析后,观察条件变量之间的相关性,如两条件变量之间的相关系数高于0.9999,且在步骤3)中得到目标值与该两条件变量之间的相关系数的差值的绝对值小于等于0.0500,在模型建立之前将其中一变量拒绝出模型,进而确定引入多元回归模型的条件变量。
5.根据权利要求4所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤5)建立的多元线性回归模型为:
yi=β01xi1+...+βpxipi,i=1,...,n
其中,xip是n次不同状态下获得的条件变量,p为条件变量的总样本数,yi为目标变量,ε~N(0,σ2),且εi都是相互独立且服从同一正态分布的随机变量。
6.根据权利要求5所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤5)中多元线性回归模型不含偏差项的估计函数形式为:
Figure FDA0003091337140000023
Figure FDA0003091337140000024
Y是由n次不同状态下获得的目标变量构成的n维向量;X是由n次不同状态下样本的条件变量构成的n×(p+1)阶矩阵;
Figure FDA0003091337140000025
为多元线性回归方程的残差向量,基于残差向量得到σ2的估计为:
Figure FDA0003091337140000031
此时
Figure FDA0003091337140000032
被称为σ2的无偏估计;
多元线性回归方程中涉及很多变量,通过检验某个变量对应的回归系数是否为0,对多元线性回归模型做显著性检验,如果为0就将该变量剔除最终的模型。
7.根据权利要求6所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤5)在条件变量的选择过程中引入AIC准则来选择最优模型,对于建立的多元线性回归模型,AIC的定义为:
Figure FDA0003091337140000033
其中,N为样本中条件变量的个数;
Figure FDA0003091337140000034
是所建立模型包含的自变量个数,Q为所建立模型包含的自变量个数;在所有备选模型中,使得AIC值最小的模型被视为最优模型。
CN201811086634.8A 2018-09-18 2018-09-18 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法 Active CN109280726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811086634.8A CN109280726B (zh) 2018-09-18 2018-09-18 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811086634.8A CN109280726B (zh) 2018-09-18 2018-09-18 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法

Publications (2)

Publication Number Publication Date
CN109280726A CN109280726A (zh) 2019-01-29
CN109280726B true CN109280726B (zh) 2021-08-27

Family

ID=65181041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811086634.8A Active CN109280726B (zh) 2018-09-18 2018-09-18 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法

Country Status (1)

Country Link
CN (1) CN109280726B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378064A (zh) * 2019-07-29 2019-10-25 安徽工业大学 一种预测炼铁高炉炉芯死料柱温度的方法
CN110647725A (zh) * 2019-09-20 2020-01-03 武汉轻工大学 基于多元逐步回归的工程测试缺失数据修复方法及系统
CN112254972B (zh) * 2020-10-26 2023-02-24 上海三一重机股份有限公司 挖掘机油温预警方法、装置、服务器及挖掘机
TWI760003B (zh) * 2020-12-10 2022-04-01 中國鋼鐵股份有限公司 石墨化爐之爐芯之升溫歷程的預測方法
CN113139275B (zh) * 2021-03-22 2022-08-19 浙江大学 一种基于多层矿焦比分布模型的高炉炉喉温度估计方法
CN113177303B (zh) * 2021-04-15 2023-09-26 鞍钢股份有限公司 利用高炉透气指数计算2000、3000m3级高炉喷煤利用率的方法
CN116486969B (zh) * 2023-06-25 2023-09-26 广东工业大学 基于遗传算法的材料最优相关性关系获取方法及应用
CN117032120A (zh) * 2023-08-16 2023-11-10 广东超级龙节能环保科技有限公司 集成一体式空压站智能云控制系统及控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899425A (zh) * 2015-05-07 2015-09-09 浙江大学 一种高炉铁水硅含量的变量选择预报方法
CN106755672A (zh) * 2017-02-27 2017-05-31 本钢板材股份有限公司 监测高炉炉缸活性的炉缸工作活跃指数量化方法
CN107368125A (zh) * 2017-09-08 2017-11-21 东北大学 一种基于cbr与rbr并行混合推理的高炉炉温控制系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067828A (zh) * 2007-06-12 2007-11-07 中南大学 焦炉火道温度集成建模与软测量方法
CN102365536B (zh) * 2009-05-01 2014-06-11 富士通株式会社 温度测定系统以及温度测定方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899425A (zh) * 2015-05-07 2015-09-09 浙江大学 一种高炉铁水硅含量的变量选择预报方法
CN106755672A (zh) * 2017-02-27 2017-05-31 本钢板材股份有限公司 监测高炉炉缸活性的炉缸工作活跃指数量化方法
CN107368125A (zh) * 2017-09-08 2017-11-21 东北大学 一种基于cbr与rbr并行混合推理的高炉炉温控制系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Deadman and hearth phenomena in the blast furnace;Kalevi Raipala;《Scandinavian Journal of Metallurgy》;20001231;第39-46页 *
基于数据挖掘的高炉铁水温度建模与预报;李静;《中国优秀硕士学位论文全文数据库电子期刊 工程科技I辑》;20140615;第2014年卷(第6期);参见第B023-95页第2.1节和第3章 *
基于数据驱动多输出ARMAX建模的高炉十字测温中心温度在线估计;周平 等;《自动化学报》;20180331;第44卷(第3期);参见第552-561页第1-2节 *

Also Published As

Publication number Publication date
CN109280726A (zh) 2019-01-29

Similar Documents

Publication Publication Date Title
CN109280726B (zh) 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法
CN116501003B (zh) 一种用于特种钢材冶炼的加工管控方法及系统
CN111639801B (zh) 高炉炉况的评分方法及系统
CN111593155B (zh) 高炉诊断系统及方法
CN110378064A (zh) 一种预测炼铁高炉炉芯死料柱温度的方法
CN102925602B (zh) 高炉操作炉型维护方法
JP2019019385A (ja) 溶銑温度予測方法、溶銑温度予測装置、高炉の操業方法、操業ガイダンス装置、溶銑温度制御方法、及び溶銑温度制御装置
CN111915080A (zh) 一种基于铁水质量约束的原燃料成本最优配比方法
CN111652414A (zh) 一种基于高斯混合模型的滑窗pca高炉异常监测方法
CN109934421B (zh) 一种面向波动炉况的高炉铁水硅含量预测与补偿方法
CN113517037B (zh) 一种数据与知识融合的烧结矿FeO预测方法及系统
CN113962102A (zh) 一种钢铁生产全流程碳排放数字化仿真方法
Wang et al. Creep behavior and life prediction of P91 heat-resistant steel using modified Wilshire model
CN111985682A (zh) 基于神经网络的水煤浆气化炉炉温预测方法
CN113570145A (zh) 一种炼铁高炉炉芯死料柱温度的预测方法
KR101100589B1 (ko) 코크스의 고온 강도 예측방법
CN113962152A (zh) 高钛型高炉内富碱焦炭反应性及反应后强度的计算方法
Rogozhnikov et al. Criteria for Assessing Optimal Distribution of Ore/Coke Ratio Along Blast Furnace Radius
CN118039003A (zh) 基于分布与图卷积的高炉数字孪生系统硅含量预测方法
Qiang et al. The combination prediction of BTP in sintering process based on Bayesian framework and LS-SVM
CN117494531B (zh) 一种基于有限元和XGBoost算法的中碳钢脱碳深度预测方法
CN115952431A (zh) 一种基于大数据的高炉操作炉型自判决方法
Bag ANN based prediction of blast furnace parameters
CN104313213B (zh) 一种高炉冶炼水平分析系统
Tang et al. Evaluation of scheme design of blast furnace based on artificial neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant