CN109280726B

CN109280726B - 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法

Info

Publication number: CN109280726B
Application number: CN201811086634.8A
Authority: CN
Inventors: 王兵; 王惯玉; 卢琨; 周郁明; 代兵; 陈鹏; 宁芳青
Original assignee: Anhui University of Technology AHUT
Current assignee: Anhui University of Technology AHUT
Priority date: 2018-09-18
Filing date: 2018-09-18
Publication date: 2021-08-27
Anticipated expiration: 2038-09-18
Also published as: CN109280726A

Abstract

本发明公开了一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，属于冶金信息处理技术领域。本发明首先进行炉芯死料柱温度目标值DMT_goal的计算，接着对该数据进行处理，对经过处理得到的数据样本做Pearson相关性分析，根据相关性分析的结果初步选取条件变量。再对各条件变量进行Pearson相关性分析，依据相关性分析的结果尽可能选择互相独立的条件变量建立模型。接着通过最小二乘法以及基于AIC的变量筛选准则筛选条件变量，再检验初步多元线性回归方程的拟优合度与回归系数，得到多元线性回归模型。本发明第一次提出使用多元线性回归算法来预测炉芯死料柱温度，可以实现高精度预测未来五天内的炉芯死料柱温度，而且可以实现炉芯死料柱温度的预警功能。

Description

一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法

技术领域

本发明涉及冶金信息处理技术领域，更具体地说，涉及一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法。

背景技术

现代钢铁企业的管理者和生产者总是全力维护高炉生产的长期稳定顺行，以获取钢铁企业的最大效益。而炉缸活性犹如高炉生产的“心脏”，一旦炉缸活性出现问题，破坏高炉稳定顺行，那么带来的损失是非常巨大的。

就目前而言，炉缸活性的量化监测已经成为高炉生产的热点、重点和难点，如何实现对炉缸活性的量化计算，怎样实现对炉缸活性的在线监测，如何在最短的时间内准确的发现炉缸活性的异常变化，从而在最短的时间内恢复炉缸活性，是行业内亟待解决的问题，其根本目的就是要维护高炉生产的长期稳定顺行，确保没有高炉炉缸堆积等恶性生产事故的发生，从而避免造成巨大的经济损失，为降本增效保驾护航。

高炉炉缸活性与炉芯死料柱温度关系密切，良好的炉缸活性要求炉芯死料柱温度在一定的范围内波动，因此炉芯死料柱温度能够表征炉缸活性。但是，炉芯死料柱温度目前无法通过技术手段测得。

国外的Kalevi Raipala于2000年在国际期刊Scandinavian Journal ofMetallurgy上发表了名为Deadman and hearth phenomena in the blast furnace的论文，该论文给出了估计炉缸炉芯死料柱温度的计算公式，通过该公式可以直接计算炉芯死料柱温度来判断炉缸的工作状态，但该论文所公开的死料柱温度计算过程极其繁杂，且该公式的得出纯粹依靠经验，对不同高炉的适用性较差。

经检索，中国专利申请号CN201710107070.0，申请日期为2017年2月27日，发明创造名称为：监测高炉炉缸活性的炉缸工作活跃指数量化方法；该申请案试图定义一种炉缸活性的监测方法。其利用炉芯死料柱温度代替炉缸炉底各层中心热电偶温度均值，由于炉芯死料柱温度能够直接反映死焦堆的温度状态及其变化，从而可以在最短的时间内反映出死焦堆的渗透能力的变化。该方法首先改进了2000年Kalevi Raipala在论文Deadman andhearth phenomena in the blast furnace提出的炉缸炉芯死料柱温度计算公式。在此基础上提出了炉缸工作活跃性指数量化的方法，经实践验证具有良好的效果。但是该方法关键部分，炉芯死料柱温度的计算依然没有摆脱计算过程极其繁杂，提出纯粹依靠经验的弊端。

发明内容

1.发明要解决的技术问题

为了克服大型高炉炉缸炉芯死料柱温度计算繁杂、低效，适应性差且强烈依赖于经验的技术难题，本发明提出了一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法；本发明可以实现在不需要精确计算炉芯死料柱温度的情况下，预测炉芯死料柱温度，使得炉芯死料柱温度的预测第一次脱离了经验公式，解决了炉芯死料柱温度计算低效，适应性差且强烈依赖于经验的技术难题；针对炉芯死料柱温度低温判断问题，本发明所建立的关于炉芯死料柱温度的多元线性回归模型同时还具有低温预警功能，可以实现炉芯死料柱温度的低温预警。

2.技术方案

为达到上述目的，本发明提供的技术方案为：

本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其步骤为：

1)对采集到的数据进行炉芯死料柱温度目标值DMT_goal计算；

2)对目标值进行处理，处理的内容包括目标值填充与目标值异常值删除；

3)分析DMT_goal与目标值处理完成的数据的相关性，并在此基础上初步选取建立多元线性回归模型的条件变量；

4)分析步骤3)中选择出来的条件变量间的相关性并选取建立多元线性回归模型的条件变量；

5)使用最小二乘法以及基于AIC的变量筛选准则筛选条件变量建立多元线性回归模型；

6)对步骤5)中得到的多元线性回归模型进行拟合优度检验与回归系数的检验，然后将模型作用于测试集，验证多元线性回归模型的有效性。

更进一步地，步骤1)所述的炉芯温度目标值的计算公式如下：

其中，约束条件为：500≤FR≤530，单位为kg/t；-20≤Δ_t≤120，单位为℃；30≤D_pcoke≤40，单位为毫米；

式中：DMT为炉芯死料柱温度；t_f为理论燃烧温度；V_bosh为炉腹煤气量；D为炉缸直径；FR为燃料比；Δ_t为炉渣流动性指数；η_CO,C为炉身探针测得的炉中心CO利用率；D_pcoke为炉芯死料柱焦炭尺寸；

当FR＝500kg/t，Δ_t＝-20℃，D_pcoke＝30mm时，DMT取得最小值DMT_min；当FR＝530kg/t，Δ_t＝120℃，D_pcoke＝40mm时，DMT取得最大值DMT_max；取DMT_min与DMT_max的均值为目标值，目标值记为DMT_goal。

更进一步地，步骤2)所述的目标值填充部分，将一天24小时内，缺失的一个小时数据按照该小时的前一个小时和后一个小时的数据的平均值填充；

目标值异常值删除部分，删除炉芯温度小于1300℃，大于1500℃的炉缸炉芯死料柱温度目标值；删除t_f，V_bosh，η_CO,C异常的数据，t_f，V_bosh，η_CO,C异常的判断标准为t_f，V_bosh，η_CO,C各自的散点图中孤立点的数据。

更进一步地，步骤3)中相关性的分析使用Pearson相关性；当二元数据样本为(x₁,y₁),(x₂,y₂),...,(x_n,y_n)，其中，x_i为变量x第i个样本的样本值，y_i为变量y第i个样本的样本值，n为总样本容量；其相关性系数r定义为：

其中，

样本的Pearson相关系数的绝对值越大，条件变量与目标值DMT_goal之间的相关性就越强；完成相关性分析后，观察数据中各条件变量与目标值之间的相关系数与是否通过显著性检验，当条件变量的置信度小于0.05时变量通过显著性检验；初步选取与目标值强相关的数据且通过显著性检验的变量作为条件变量来建立多元线性回归模型。

更进一步地，步骤4)中相关性的分析依然使用Pearson相关性；完成相关性分析后，观察条件变量之间的相关性，如两条件变量之间的相关系数高于0.9999，且在步骤3)中得到目标值与该两条件变量之间的相关系数的差值的绝对值小于等于0.0500(0.0500为工程实际中的允许误差范围，这里沿用为阈值)，在模型建立之前将其中一变量拒绝出模型，进而确定引入多元回归模型的条件变量。

更进一步地，步骤5)建立的多元线性回归模型为：

y_i＝β₀+β₁x_i1+...+β_px_ip+ε_i,i＝1,...,n

其中，x_ip是n次不同状态下获得的条件变量，p为条件变量的总样本数，y_i为目标变量，ε～N(0，σ²)，且ε_i都是相互独立且服从同一正态分布的随机变量。

更进一步地，步骤5)中多元线性回归模型不含偏差项的估计函数形式为：

Y是由n次不同状态下获得的目标变量构成的n维向量；X是由n次不同状态下样本的条件变量构成的n×(p+1)阶矩阵；

令

为多元线性回归方程的残差向量，基于残差向量得到σ²的估计为：

此时

被称为σ²的无偏估计；

多元线性回归方程中涉及很多变量，通过检验某个变量对应的回归系数是否为0，对多元线性回归模型做显著性检验，如果为0就将该变量剔除最终的模型。

更进一步地，步骤5)在条件变量的选择过程中引入AIC准则来选择最优模型，对于建立的多元线性回归模型，AIC的定义为：

其中，N为样本中条件变量的个数；

是所建立模型包含的自变量个数，Q为所建立模

型包含的自变量个数；在所有备选模型中，使得AIC值最小的模型被视为最优模型。

3.有益效果

采用本发明提供的技术方案，与已有的公知技术相比，具有如下显著效果：

(1)本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，采用的多元线性回归算法建立起的多元线性回归模型在一定程度上表征了炉芯温度与操作参数之间的隐含关系。从而可以基于此方法建立出简单的、精度较高且计算速度快的炉芯温度预测模型，使得炉芯温度的计算可以脱离复杂的经验公式；

(2)本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，在测试集上，由于预测值比实际值有84％的可能性偏小，这意味着该模型具有一定的低温预警功能；

(3)本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，在回归方程的建立中，样本中的异常数据比例较小且不容易发现，本发明仅仅只是从两个方面对异常数据做了简单预处理，但预测结果误差在容许误差范围内。因此，本发明能够有效处理带有少数异常数据的样本，进而进行炉缸炉芯温度的预测。

附图说明

图1为本发明的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法的流程图；

图2为本发明中多元线性回归模型在训练集上的的相对误差；

图3为本发明中多元线性回归模型的预测值与实际值的曲线图；

图4为本发明中多元线性回归模型在测试集上的相对误差图；

图5为本发明中模型在测试集上实际值与预测值的差值示意图。

具体实施方式

为进一步了解本发明的内容，结合附图和实施例对本发明作详细描述。

实施例1

结合图1，本实施例的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，对炉缸炉芯温度进行预测的步骤如下：

1)对采集到的数据进行炉芯死料柱温度目标值DMT_goal计算，本实施例的数据源为炼铁厂在2017年10月19日到2018年1月18日的每天内每隔一个小时采集一次操作参数而得到的有缺失的操作参数数据，对炉芯死料柱温度预测的采集到的数据详见表1。

由于直接通过公开的估算公式计算目标值非常复杂，常常需要通过多变量的多次迭代得到，为了简化计算过程，本实施例的炉芯温度目标值计算通过已经公开的炉芯温度计算经验公式变形得到。已经公开的经验估算公式为：

Δ_t＝tCT-tL-50

式中：DMT为炉芯死料柱温度，单位为℃；t_f为理论燃烧温度，由上述公式中t_f的表达式给出，单位为℃；V_bosh为炉腹煤气量，单位为m³/min；D为炉缸直径，单位为m；FR为燃料比，单位为kg/t；Δ_t为炉渣流动性指数，由上述公式中Δ_t的表达式给出，单位为℃；η_CO,C为炉身探针测得的炉中心CO利用率，单位为％；D_pcoke为炉芯死料柱焦炭尺寸，单位为mm；Q_RJ为碳素燃烧产生的热量；Q_RRL为燃料燃烧产生的热量；

为碳素燃烧生成CO₂释放的热量；

为燃料中氢燃烧生成H₂O释放的热量；Q_RF为热风代入的显热；Q_J为焦炭带入的物理热；Q_RL为燃料带入的物理热；Q_S为鼓风中燃料和水分分解耗热；Q_F为喷吹燃料分解耗热；Q_RQT为不完全燃烧条件下煤粉在风口前的反应热；V_MQ为风口回旋区煤气量；c_MQ为风口回旋区煤气平均比热容；m_HF为焦炭和喷吹燃料燃烧产生的灰分；c_HF为灰分平均比热容；t_CT为高炉出铁温度，单位为℃；t_L为炉渣流动温度，单位为℃。

参看表1，采集到的数据当中已经包含了钢厂按照上述t_f表达式计算好的t_f值，单位为℃，同时也包含了V_bosh值，单位为m³/min以及η_CO,C值，单位为％。钢厂提供的炉缸直径D＝14.8米，FR的范围为500至530kg/t，D_pcoke的范围为30至40mm，t_CT的范围为1480至1520℃，t_L的范围为1350至1450℃。

根据经验公式以及上述数据，在上述DMT的计算公式中，将t_f，V_bosh，η_CO,C以及D视为常量，FR，Δ_t，D_pcoke视为自变量，将DMT的计算公式视为关于FR，Δ_t，D_pcoke的三元一次方程。又由于这三个自变量有各自的取值范围，则将DMT视为在有约束条件下的关于FR，Δ_t，D_pcoke的三元一次方程，则有：

其中，约束条件为：500≤FR≤530，单位为kg/t；-20≤Δ_t≤120，单位为℃；30≤D_pcoke≤40，单位为毫米。

在得到上述带有约束条件的关于DMT的三元一次方程后，由于DMT是分别关于FR，Δ_t，D_pcoke的增函数，当FR＝500kg/t，Δ_t＝-20℃，D_pcoke＝30mm时，DMT取得最小值DMT_min；当FR＝530kg/t，Δ_t＝120℃，D_pcoke＝40mm时，DMT取得最大值DMT_max。取DMT _nim与DMT_max的均值为目标值，目标值记为DMT_goal。

2)对目标值进行处理，处理的内容为目标值填充与目标值异常值删除。

目标值填充部分，将一天24小时内只缺失一个小时的数据按照该小时的前一个小时和后一个小时的数据的平均值填充，共填充4个样本数据。

值得说明的是，数据缺失在数据挖掘中是很常见的，数据缺失的原因可能是系统在采集数据时候没有采集到完整的数据，也有可能是人为原因造成的。表1列出了数据变量，这些变量的具体数值每个小时采集一次，一天有24个小时，那么在一天内就采集到24个同一变量的不同值，同一个小时里采集到的变量值就构成了一个样本，一天内采集到的数据就构成了24个样本。一天内应该有24个样本，如果出现数据缺失情况，为了尽可能的用上数据信息，就需要对这个缺失的样本进行填充。所谓缺失一个样本，其实就是缺失某个小时的表1中所有的变量的具体数值与目标值。这个时刻的前一小时与后一小时的同一变量的不同的数值的均值与目标值的均值填充为缺失时刻的对应的变量值与目标值。比如，某天23时数据缺失，其实缺失的就是表1中所有变量的具体值与目标值，这些变量有理论燃烧温度、炉腹煤气量等和目标值，22时与24时的数据没有缺失，22时与24时的理论燃烧温度、炉腹煤气量等变量值是已知的，取22时与24时的理论燃烧温度的均值作为23时的理论燃烧温度的值。取22时与24时炉腹煤气量的均值作为23时炉腹煤气量的值，依此类推，就将23时缺失的变量数据填充了起来，同时取22时与24时的目标值的均值作为23时的目标值。

目标值异常值删除部分，炉芯温度小于1300℃，大于1500℃炉缸炉芯死料柱温度不可操作，这时会发生炉缸事故，因此删除目标值小于1300℃，大于1500℃的数据。同时，如果t_f，V_bosh，η_CO,C异常，目标值也异常，因此删除t_f，V_bosh，η_CO,C异常的数据，t_f，V_bosh，η_CO,C异常的判断标准为t_f，V_bosh，η_CO,C各自的散点图中孤立点的数据。

3)分析DMT_goal与目标值处理完成的数据的相关性。相关性的分析使用Pearson相关性，当二元数据样本为(x₁,y₁),(x₂,y₂),...,(x_n,y_n)，其中，x_i为变量x第i个样本的样本值，y_i为变量y第i个样本的样本值，n为总样本容量。其相关性系数r定义为：

其中，

样本的Pearson相关系数的绝对值越大，条件变量(目标值处理完成的如表1所示的全部变量视为条件变量)与目标值DMT_goal之间的相关性就越强。在统计学中，一般根据样本Pearson相关系数绝对值大小来划分相关性强度。0.8＜|r|≤1，称为高度相关；0.6＜|r|≤0.8，称为强相关；0.4＜|r|≤0.6，称为中等程度相关；0.2＜|r|≤0.4，称为弱相关；|r|≤0.2，称为极弱相关。

完成相关性分析后，观察数据中各条件变量与目标值之间的相关系数与是否通过显著性检验，当条件变量的置信度小于0.05时变量通过显著性检验。选取与目标值强相关(条件变量与目标值的相关性系数的绝对值大于0.6而小于等于0.8)的数据且通过显著性检验的变量作为条件变量来建立多元线性回归模型。按照此原则，初步选取条件变量，选取的条件变量为富氧流量、冷风温度、20.080m炉身静压、20.080m炉身静压_A、20.080m炉身静压_B、26.025m炉身静压_A、26.025m炉身静压_B、26.025m炉身静压_B、下部压差、富氧率、理论燃烧温度这11个变量作为条件变量。

4)分析步骤3)中选择出来的条件变量间的相关性。相关性的分析依然使用Pearson相关性。当二元数据样本为(a₁,b₁),(a₂,b₂),...,(a_n,b_n)，其中，a_i为变量a第i个样本的样本值，b_i为变量b第i个样本的样本值，m为总样本容量，其相关性系数g定义为：

其中，

样本的Pearson相关系数的绝对值越大，条件变量与目标值DMT_goal之间的相关性就越强。在统计学中，一般根据样本Pearson相关系数绝对值大小来划分相关性强度。0.8＜|g|≤1，称为高度相关；0.6＜|g|≤0.8，称为强相关；0.4＜|g|≤0.6，称为中等程度相关；0.2＜|g|≤0.4。称为弱相关；|g|≤0.2，称为极弱相关。完成相关性分析后，观察条件变量之间的相关性，发现条件变量富氧流量与条件变量富氧率之间的相关系数高达99.9％，两者均通过显著性检验，且在步骤3)中得到目标值与该两条件变量之间的相关系数的差值的绝对值小于等于0.0500。为了最大程度简化多元线性回归模型，在模型建立之前将变量富氧流量拒绝出模型。进而确定初步引入多元回归模型的条件变量，初步引入多元线性回归模型的条件变量为冷风温度、20.080m炉身静压、20.080m炉身静压_A、20.080m炉身静压_B、26.025m炉身静压_A、26.025m炉身静压_B、26.025m炉身静压_C、下部压差、富氧率、理论燃烧温度这十个条件变量。

5)使用最小二乘法以及基于AIC的变量筛选准则筛选条件变量建立多元线性回归模型。假设x_i1,x_i2,...,x_ip,i＝1,...,n，是n次不同状态下获得的条件变量。其中，n是第n个条件变量的序列号，y_i为目标变量，i＝1,...,n，n是第n个条件变量的序列号对应的目标变量的序列号，p为条件变量的总样本数。通过多次独立状态下获得的多个条件变量与目标变量之间的多元线性回归模型可以写成：

y_i＝β₀+β₁x_i1+...+β_px_ip+ε_i,i＝1,...,n

其中，ε～N(0，σ²)，即ε服从于均值为0，方差为σ²的正态分布。且ε_i都是相互独立且服从同一正态分布的随机变量。一般基于训练样本的条件变量的模型写成矩阵表达式：

Y＝Xβ+ε

其中，Y是由n次不同状态下获得的目标变量构成的n维向量；X是由n次不同状态下样本的条件变量构成的n×(p+1)阶矩阵；β为条件变量前系数构成的p+1维向量；ε是n维随机误差向量，并且满足E(ε)＝0，var(ε)＝σ²I_n。矩阵变量的详细表达式如下：

其中β的最小二乘估计为：

统计学上已经证明β的最小二乘估计就是β的无偏估计。因此就可以获得多元线性回归方程不含偏差项的估计函数形式为：

令

此时

被称为σ²的无偏估计。

通过无偏估计而引入多元线性回归模型的变量太多会使得建立的模型不够稳定。因此，对多元线性回归模型做显著性检验就显得尤为重要，通过对回归系数的显著性检验实现对多元线性回归模型显著性检验是最常见的方式之一。回归系数的显著性检验，主要就是通过检验某个变量对应的回归系数是否为0。如果为0就意味着这个变量就没必要留在最终的模型中。

条件变量之间往往会存在多重共线性，因此多元回归模型的表现往往不够理想。所谓的多重共线性指的就是条件变量之间也存在较强的相关性。而由于多重共线性的存在，可能会导致最终建立的模型里真正对目标变量有影响的条件变量未通过显著性检验而被拒绝出模型。为了减小条件变量之间存在的多重共线性对多元回归模型的影响，在条件变量的选择过程中引入Akaike Information Criterion，即AIC准则来选择最优模型。对于建立了的多元线性回归模型，AIC的定义为：

其中，N为样本中条件变量的个数；

是所建立模型包含的自变量个数，Q为所建立模型包含的自变量个数。在所有备选模型中，使得AIC值最小的模型被视为最优模型。

基于上述理论，使用2017年10月19日至2018年1月13日这77天的一共1855个样本数据作为训练集得到最优的多元线性回归模型，步骤5)中未通过回归系数检验的条件变量为26.025m炉身静压_A与26.025m炉身静压_C。在进行基于AIC准则的逐步选择法筛选变量过后，26.025m炉身静压_A与26.025m炉身静压_C两个条件变量被拒绝出模型，冷风温度、20.080m炉身静压、20.080m炉身静压_A、20.080m炉身静压_B、26.025m炉身静压_B、下部压差、富氧率、理论燃烧温度等一共8个条件变量被允许进入多元线性回归模型，此时AIC最小，为14040。此时模型的条件变量的回归系数显著性检验均通过，模型为：

DMT_goal＝790.5006+0.1252CT+1.3587OP-0.1611DP+0.0836DP_A+0.1349DP_B+0.4048DP_b+0.5430BP+0.1957TT

其中，CT为冷风温度，OP为富氧率，DP为20.080m炉身静压，DP_A为20.080m_A炉身静压，DP_B为20.080m炉身静压-B，DP_b为26.025m炉身静压B,BP为下部压差，TT为理论燃烧温度。

6)将步骤5)中得到的多元线性回归模型作用于测试集(测试集为2018年1月14日至2018.1月18日这5天的100个样本数据)来测试模型之前，对模型进行拟合优度检验与回归系数检验，之后验证多元线性回归模型的有效性。步骤5)中得到的多元回归模型的拟合优度为0.647，且各条件变量均通过回归系数显著性检验。而拟合优度越接近于1，回归方程的拟合度越高。说明该多元回归模型与试验数据有很好的吻合，该模型可以较好的拟合作用。而该模型在训练集上的平均训练误差为0.57％，最大训练误差为3.33％，进一步验证了该模型有很好的拟合作用。将该模型用于样本数为100，相当于5天数据量的测试集上，测试相对误差最高为1.60％。且预测值有84％的可能性将真实值预测为比真实值小。

本实施例对炉芯死料柱温度预测的采集到的数据名称详见表1，包括了理论燃烧温度、炉腹煤气等一共50个变量。本实施例各变量与目标值间的相关性见表2。本实施例在训练集上的相对误差详见图4，由图4中数据可以看出模型在测试集上的平均测试误差为0.57％，测试相对误差最高为1.60％，模型在测试集上具有高精度的预测性能，同时由于建立的模型极为简单，预测时间极为快速。图2为本实施例模型在训练集上的相对误差，可以看出该模型在训练集上的平均训练误差为0.57％，最大训练误差为3.33％，验证了该模型有很好的拟合作用。图3为本实施例炉缸炉芯温度实际值与预测值的曲线图，可以看出预测值与实际值具有较为相同的变化趋势，也证明了本实施例的有效性。图5为本实施例预测值与实际值的差值图，从图中可以看出84(总100)个数据的差值为负值，意味着模型有84％的概率将炉芯死料柱温度往比实际值偏小方向预测，因此模型具有一定的低温预警功能。

表1炉芯死料柱温度预测采集到的数据变量名称表

表2采集数据变量与目标值之间的Pearson相关性表

以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其特征在于，其步骤为：

1)对采集到的数据进行炉芯死料柱温度目标值DMT_goal计算；所述的炉芯温度目标值的计算公式如下：

当FR＝500kg/t，Δ_t＝-20℃，D_pcoke＝30mm时，DMT取得最小值DMT_min；当FR＝530kg/t，Δ_t＝120℃，D_pcoke＝40mm时，DMT取得最大值DMT_max；取DMT_min与DMT_max的均值为目标值，目标值记为DMT_goal；

2.根据权利要求1所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其特征在于：步骤2)所述的目标值填充部分，将一天24小时内，缺失的一个小时数据按照该小时的前一个小时和后一个小时的数据的平均值填充；

3.根据权利要求2所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其特征在于：步骤3)中相关性的分析使用Pearson相关性；当二元数据样本为(x₁,y₁),(x₂,y₂),...,(x_n,y_n)，其中，x_i为变量x第i个样本的样本值，y_i为变量y第i个样本的样本值，n为总样本容量；其相关性系数r定义为：

其中，

4.根据权利要求3所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其特征在于：步骤4)中相关性的分析依然使用Pearson相关性；完成相关性分析后，观察条件变量之间的相关性，如两条件变量之间的相关系数高于0.9999，且在步骤3)中得到目标值与该两条件变量之间的相关系数的差值的绝对值小于等于0.0500，在模型建立之前将其中一变量拒绝出模型，进而确定引入多元回归模型的条件变量。

5.根据权利要求4所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其特征在于：步骤5)建立的多元线性回归模型为：

y_i＝β₀+β₁x_i1+...+β_px_ip+ε_i,i＝1,...,n

6.根据权利要求5所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其特征在于：步骤5)中多元线性回归模型不含偏差项的估计函数形式为：

令

此时

被称为σ²的无偏估计；

7.根据权利要求6所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法，其特征在于：步骤5)在条件变量的选择过程中引入AIC准则来选择最优模型，对于建立的多元线性回归模型，AIC的定义为：

其中，N为样本中条件变量的个数；

是所建立模型包含的自变量个数，Q为所建立模型包含的自变量个数；在所有备选模型中，使得AIC值最小的模型被视为最优模型。