CN110066895B

CN110066895B - 一种基于Stacking的高炉铁水质量区间预测方法

Info

Publication number: CN110066895B
Application number: CN201910283970.XA
Authority: CN
Inventors: 周平; 刘进进; 谢晋; 柴天佑
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2019-04-10
Filing date: 2019-04-10
Publication date: 2021-01-12
Anticipated expiration: 2039-04-10
Also published as: CN110066895A

Abstract

本发明提出一种基于Stacking的高炉铁水质量区间预测方法，包括：获取高炉原始历史数据，并进行预处理；根据输入输出参数从预处理后的高炉原始历史数据提取样本数据集；建立基于N折模型的Stacking算法铁水质量模型并计算建模误差预测区间；根据N折模型的Stacking算法铁水质量模型对实时采集的高炉数据进行预测，得到预测值和预测区间；本发明可以避免离线化验的滞后性和人工操作带来的不确定性，实现多元铁水质量值和预测区间的同时预报。为现场的操作人员及时准确判断高炉内部运行状态提供了关键指标，同时可以根据工况的变化，利用最新的过程数据更新软测量模型参数，避免了时不变模型的局限性，实用价值很高。

Description

一种基于Stacking的高炉铁水质量区间预测方法

技术领域

本发明属于高炉冶炼自动化控制技术领域，具体涉及一种基于Stacking的高炉铁水质量区间预测方法。

背景技术

高炉是一个在炼铁过程中的大型的对流反应器和热交换器，同时高炉炼铁也是社会发展的一个重要环节。然而高炉内部冶炼环境极其严酷，反应最剧烈的区域温度高达2000多度，压强高达标准大气压的4倍左右，且伴随着固、液、气多相共存的状态，使高炉内部状态难以实时监测，从而难以对高炉进行优化控制。目前，被广泛用来间接反映高炉内部状态的指标为铁水质量参数，综合性的铁水质量指标通常采用Si含量、P含量、S含量和铁水温度来衡量，铁水质量参数的测量一般采用离线化验法，测量结果会滞后1-2小时，因此其结果无法实时的反映高炉内部状态。为了实现对高炉内部运行状态实时全面地监测，就需要建立高炉多元铁水质量参数的在线软测量模型以实现对铁水质量的实时在线软测量，充分利用高炉炼铁过程中可检测的运行数据，建立数据驱动的高炉多元铁水质量在线软测量模型。

专利公开号CN102031319A公开了“一种高炉铁水含硅量的预报方法”，该方法包括数据参数选取及预处理、预测算法、结果输出及操作指导，数据参数选取采用硅含量短期均值、硅含量中期均值、硅含量长期均值、前次铁水对应的风口理论燃烧温度及前次铁水含硫量五个参数，通过神经网络算法对硅含量进行预测。

专利公开号CN101211383A公开了“一种高炉铁水硅含量的特征分析预报方法”，使用引入遗传算法优化的最小二乘支持向量机对高炉铁水中的硅(Si)含量进行预报。该方法通过对原有样本进行指数加权移动平均滤波和归一化预处理对样本数据进行特征提取，建立了高炉铁水硅含量预报的动态递归模型。

专利公开号CN103320559A公开了“一种高炉铁水硫含量预报方法”，以硫S含量短期均值、硫含量中期均值、硫含量长期均值、前次铁水对应的炉渣碱度、前次铁水含硅量、入炉焦炭S含量、入炉煤粉S含量作为铁水含硫预报的输入变量，基于径向基函数神经网络建模技术，预报下一次铁水的含硫量。

上述专利报道的方法以及其他相关文献中的方法均是针对单一铁水质量参数，如铁水温度、Si含量、S含量等，进行软测量的方法，单一的铁水质量参数并不能全面地反映高炉内部复杂的状态，无法为现场的操作人员提供综合性的指导，实际应用价值较低。另外，这些模型只是单一的对铁水质量值进行预测，而在高炉炼铁过程中，由于工矿经常波动，致使这些高炉铁水质量预测模型结果的不确定特征明显，难以表征真实的高炉内部状态，带来实时监测和控制方向性的错误。由此可见，只是单一的针对铁水质量进行预测，在面对炉况不稳定的情况，存在较大不确定性，难以解决高炉炉温精确调控的难题。综上所述，目前国内外还没有专门针对高炉冶炼过程铁水质量参数Si含量、P含量、S含量和铁水温度进行预测值和预测区间的同时预报。

发明内容

针对上述技术不足，本发明提出一种基于Stacking的高炉铁水质量区间预测方法。

一种基于Stacking的高炉铁水质量区间预测方法，具体步骤如下：

步骤1：获取高炉原始历史数据，并进行预处理，包括：对数据统一时间粒度、剔除休风数据和异常数据以及归一化数据，具体包括如下步骤：

步骤1.1：按时间先后顺序对采集的数据进行标注，使用最近邻时间原则，即按照时间的先后顺序，人工进行匹配得到时间粒度一致的高炉炼铁过程的历史数据；

步骤1.2：剔除休风数据和异常数据：剔除休风数据，具体方式为：依据交班记录确定高炉计划检修时间段，剔除此时间段的高炉本体休风数据，休风数据具体指热风炉不向高炉吹风的数据；剔除异常数据，采用拉依达准则，即3σ准则进行异常值的剔除，即数据偏差大于3σ的数据应该剔除；σ为上述筛选出的高炉本体数据的标准差，如下公式所示：

步骤1.3：对高炉数据进行数据归一化处理，得到归一化后的高炉历史数据作为样本数据集，如下公式所示：

其中，x_i、

分别为第i个变量归一化前、后的取值，max(x_i)、min(x_i)分别为第i个变量的最大值、最小值，归一化处理后的数据在如下范围内：x_i∈(-1,1)；

步骤2：获取高炉多元铁水质量指标软测量所需输入输出参数，并根据输入输出参数从预处理后的高炉原始历史数据提取样本数据集；

步骤2.1：根据高炉工艺机理确定需要软测量的高炉铁水质量输出参数为Si(硅)含量y₁(％)、P(磷)含量y₂(％)、S(硫)含量y₃(％)和铁水温度y₄(℃)；

步骤2.2：采取灰色关联性分析的方法，提取前k个关联度最高的高炉本体参数作为软测量的辅助变量，包括：炉腹煤气量u₁(m³)、热风温度u₂(℃)、热风压力u₃(KPa)、富氧率u₄、鼓风湿度u₅(RH)、喷煤量u₆(m³/h)。

步骤2.3：根据过程动态特性，基于上述6个辅助变量，引入非线性自回归模型(NARX),确定如下16个变量为软测量模型的输入变量：

当前时刻炉腹煤气量u₁(t)(m³)；当前时刻热风温度u₂(t)(℃)；当前时刻热风压力u₃(t)(KPa)；当前时刻富氧率u₄(t)；当前时刻鼓风湿度u₅(t)(RH)；当前时刻设定喷煤量u₆(t)(m³/h)；上一时刻Si含量y₁(t-1)(％)；上一时刻P含量y₂(t-1)(％)；上一时刻炉腹煤气量u₁(t-1)(m³)；上一时刻热风温度u₂(t-1)(℃)；上一时刻热风压力u₃(t-1)(KPa)；上一时刻富氧率u₄(t-1)；上一时刻鼓风湿度u₅(t-1)(RH)；上一时刻设定喷煤量u₆(t-1)(m³/h)；上一时刻S含量y₃(t-1)(％)；上一时刻铁水温度y₄(t-1)(℃)；

步骤2.4：根据输入输出参数，从预处理后的高炉原始历史数据中，提取训练数据集，其中，输出参数为离线测量的实际输出，输入参数为在线软测量的历史数据；

步骤3：基于高炉多元铁水质量指标软测量所需输入输出参数，建立基于N折模型的Stacking算法铁水质量模型并计算建模误差预测区间，具体步骤如下：

步骤3.1：建立基于N折模型的Stacking算法铁水质量模型，具体骤步骤如下：

步骤3.1.1：第一层学习器训练数据的切分。

对训练数据集进行k-fold切分为k份，每一分包括k-1个学习集和1个预测集，共进行N次切分；

步骤3.1.2：第一层学习器的训练。

取第N次切分的K-1个学习集，采用随机权神经网络(Random vector functional-link networks,RVFLNs)进行建模，得到模型N，取第N次切分预测集在模型N上进行预测，得到预测结果N，并将所有N次预测结果传递给第二层学习器中；

步骤3.1.3：第二层学习器的训练。

将第一层学习器传递过来的N次预测结果作为第二层学习器的新的训练集，并将步骤2.4所述训练数据集中输出参数作为标签数据，采用随机权神经网络进行建模，得到N折模型的Stacking算法铁水质量模型；

步骤3.2：计算预测区间，具体步骤如下：

步骤3.2.1：基于N折模型的Stacking算法铁水质量模型，由训练集模型的输出真实值和预测值进行做差，得到建模误差集如下所示：

其中e_i为第i个建模误差，y_i为第i个输出真实值，

为第i个模型预测值。

步骤3.2.2：使用核密度估计方法估计出建模误差集的概率分布曲线，这样将具有不确定性的建模误差用确定性的概率密度函数表征。

所述核密度估计的方法如下：

假设z_i∈R,i＝1,…,K为独立同分布随机变量，其所服从分布密度函数为f(z),z∈R，则f(z)的核密度估计

定义为：

其中，φ(·)称为核函数，h_p通常称为窗口宽度或光滑参数，是一个预先人工给定的正数。

利用核密度估计方法对于步骤3.2.1得到的建模误差集{e_i|i＝1,2…K}进行PDF估计，得到估计建模误差概率密度函数Γ_e为：

所述φ(·)核函数的选择：满足以下条件：

a.φ(z)≥0

b.∫φ(z)du＝1

选取高斯核函数，其表式如下：

h_p所述窗口宽度的选择：窗宽h_p设置为h_p＝1.06θK-^1/5，其中θ由min{S,0.746Q}估计，S表示样本标准差，Q为四分位数间距，K为e样本集个数；

步骤3.2.3：由估计出的概率密度函数曲线，得到该曲线符合高斯分布，计算符合设定概率的建模误差区间，该区间即为预测区间，具体步骤如下：

步骤3.2.3.1：通过统计学的方法求取建模误差集的标准差σ₁如下所示：

其中，上式中e_i为第i个建模误差，K为建模误差的个数。

步骤3.2.3.2：定义建模误差正负3倍的标准差作为模型的建模误差的预测区间。

步骤4：根据N折模型的Stacking算法铁水质量模型对实时采集的高炉数据进行预测，得到预测值和预测区间：将获取的实时待测试高炉数据，经过步骤1中进行预处理，经过步骤2获取高炉多元铁水质量指标软测量所需输入输出参数，并根据输入输出参数从预处理后的高炉原始历史数据提取待测试数据，将待测试数据输入到第一层学习器中，得到N个预测值，并且将N个预测值取平均值，将该平均值输入到第二层学习器中，使用训练好的N折模型的Stacking算法铁水质量模型，得到最终的预测值，并根据步骤3.2得到预测区间，输出最终的预测值与预测区间。

有益技术效果：

为了解决传统多元铁水质量参数建模存在预报结果准确度不高和缺乏可信度表征的问题，本发明基于Stacking的高炉铁水质量区间预测模型，为了提高建模数据的质量，对高炉实际数据进行预处理，从而得到高质量的高炉建模数据；为了提高建模的效率，采用灰色关联分析法筛选出与多元铁水质量关联度最强的6个过程变量作为输入变量；为了反映高炉过程的非线性特性，引入非线性自回归模型(NARX)；为了提高多元铁水质量建模的准确性和进一步表征预测结果的可信度，结合Stacking模型和区间预测方法，提出一种基于Stacking的高炉铁水质量区间预测建模算法，用于建立基于数据驱动的多元铁水质量区间预测模型。实现同时对综合性的铁水质量指标，即Si含量、P含量、S含量和铁水温度进行预测值和预测区间的同时预报。基于钢厂常规在线检测设备提供的高炉本体参数在线检测值，本发明可以得出当前时刻多元铁水质量指标的在线软测量值和预测区间，为高炉炼铁过程的优化运行控制提供关键的铁水质量指标。基于工业现场常规的检测设备实时测量得到的高炉本体参数作为模型的输入数据，充分考虑高炉冶炼过程的滞后特性和输入输出变量之间的时序关系，实现了高炉冶炼过程多元铁水质量指标Si含量、P含量、S含量和铁水温度的动态在线软测量。相比于现有的离线人工检测多元铁水质量指标的方法，本方法可避免离线化验的滞后性和人工操作带来的不确定性，实现实时在线准确软测量，为现场的操作人员及时准确判断高炉内部运行状态提供了关键指标。同时本方法可以根据工况的变化，利用最新的过程数据更新软测量模型参数，避免了时不变模型的局限性，实用价值很高。另外本发明方法有助于进一步实现高炉炼铁过程的运行优化控制。

附图说明

图1为本发明实施例的高炉炼铁过程的检测设备配置图；

图2为本发明实施例的一种基于Stacking的高炉铁水质量区间预测方法建模策略图；

图3为本发明实施例的基于Stacking的铁水质量建模过程流程图；

图4为本发明实施例的铁水质量区间预测方法过程流程图；

图5为本发明实施例的基于Stacking的高炉多元铁水质量区间预测结果效果图，其中，(a)为当前时刻硅含量预测值与实际值以及预测区间曲线图；(b)为当前时刻磷含量预测值与实际值以及预测区间曲线图；(c)为当前时刻硫含量预测值与实际值以及预测区间曲线图；(d)为当前时刻铁水温度预测值与实际值以及预测区间曲线图；

图1中：1-高炉，2-热风炉，3-1-第一流量计，3-2-第二流量计，3-3第三流量计，4-温度计，5-压力计，6-湿度计，7-炉腹煤气量测量分析仪，8-富氧率测量分析仪，9-数据采集装置，10-计算机，11-待测试矿石、焦炭及溶剂，12-煤粉喷吹，13-热风，14-富氧冷空气，15-冶炼后的残渣，μ₁-炉腹煤气量参数，μ₂-热风温度测量值，μ₃-热风压力测量值，μ₄-富氧率参数，μ₅-鼓风湿度测量值，μ₆-煤粉喷吹量测量值。

具体实施方式

下面结合附图对本发明的具体实施方式做详细说明。

以柳钢的一个容积为2600m³的炼铁高炉对象为例，应用本发明的基于Stacking的高炉铁水质量区间预测方法。现在的炼铁高炉对象的常规测量系统，如图1所示，包括：高炉1、热风炉2、第一流量计3-1、第二流量计3-2、第三流量计3-3、温度计4、压力计5、湿度计6、炉腹煤气量测分析仪7、富氧率测量分析仪8、数据采集装置9和计算机10；

待测试矿石、焦炭及溶剂11从高炉1入口被放置进入高炉1内部，从高炉1高炉炉腹风口处进行煤粉喷吹12，第一流量计3-1被安装在煤粉喷吹12处，第一流量计3-1分别与数据采集装置9和炉腹煤气量测分析仪7相连接；温度计4被安装在热风炉2的出风口，温度计4与数据采集装置9相连接；压力计5被安装在热风炉2的出风口，压力计5与数据采集装置9相连接；第二流量计3-2、第三流量计3-3和湿度计6被分别安装在热风炉2的入风口，第二流量计3-2分别与炉腹煤气量测分析仪7和富氧率测量分析仪8相连接，第三流量计3-3分别与炉腹煤气量测分析仪7和富氧率测量分析仪8相连接；湿度计6分别与炉腹煤气量测分析仪7和数据采集装置9相连接；炉腹煤气量测分析仪7和富氧率测量分析仪8分别与数据采集装置9相连接；数据采集装置9通过通讯总线与计算机10相连接；

所述高炉1，用于完成高炉冶炼过程，将待测试矿石、焦炭及溶剂11从高炉1的入口被放置进入高炉1内部，在高炉1内部进行冶炼，将冶炼后的残渣15通过高炉1底部排出，冶炼后的残渣包括：铁水和炉渣；在高炉炉腹风口处进行煤粉喷吹12，并用热风炉2向高炉1内输送热风13；

所述热风炉2，将富氧冷空气14输送到热风炉2，通过热风炉2将热风13输送到高炉1内部；

所述第一流量计3-1，被安装在煤粉喷吹12处，用于在线测量煤粉喷吹量，并将煤粉喷吹量测量值μ₆分别传递到炉腹煤气量测分析仪7和数据采集装置9中；

所述第二流量计3-2，被安装在热风炉2的入口处，用于在线测量富氧流量，并将富氧流量测量值分别传递到炉腹煤气量测分析仪7和富氧率测量分析仪8中；

所述第三流量计3-3，被安装在热风炉2的入口处，用于在线测量冷风流量，并将冷风流量测量值分别传递到炉腹煤气量测分析仪7和富氧率测量分析仪8中；

所述温度计4，被安装在热风炉2出口处，用于在线测量热风炉2的热风温度，并将热风温度测量值μ₂传递到数据采集装置9中；

所述压力计5，被安装在热风炉2出口处，用于在线测量热风炉2的热风压力，并将热风压力测量值μ₃传递到数据采集装置中；

所述湿度计6，被安装在热风炉2的入口处，用于在线测量热风炉的鼓风湿度，并将鼓风湿度测量值μ₅分别传递到炉腹煤气量测分析仪7、富氧率测量分析仪8和数据采集装置9中；

所述炉腹煤气量测分析仪7，通过对第一流量计3-1测量的煤粉喷吹量测量值μ₆、第二流量计3-2测量的富氧流量测量值、第三流量计3-3测量的冷风流量测量值以及湿度计测量的鼓风湿度测量值μ₅进行分析，炉腹煤气量测分析仪7计算出炉腹煤气量参数μ₁，并将炉腹煤气量μ₁参数传递到数据采集装置9；

所述富氧率测量分析仪8，通过对第二流量计3-2测量的富氧流量测量值、第三流量计3-3测量的冷风流量测量值、湿度计测量值进行分析，富氧率测量分析仪计算出富氧率参数μ₄，并将富氧率参数μ₄传递到数据采集装置9；

所述数据采集装置9，将第一流量计3-1传递过来的煤粉喷吹量测量值μ₆、炉腹煤气量测分析仪传递过来的炉腹煤气量参数μ₁、温度计4传递过来的热风温度测量值、压力计5传递过来的热风压力测量值μ₃、富氧率测量分析仪8传递过来的富氧率参数μ4以及湿度计6传递过来的鼓风湿度测量值在数据采集装置9中进行预处理，并将预处理后的数据结果传递给计算机10；

所述计算机10，使用数据采集装置9传递过来的预处理后的数据结果并按照时间顺序保存在计算机中采用基于集成学习的高炉铁水质量预测方法进行预测，通过建立均方根误差概率加权集成RVFLNs的多元铁水质量在线预报模型，对多元铁水质量指标进行在线预测，得到多元铁水质量指标预测值。

所述计算机系统装有OPC通讯软件负责计算机与数据采集装置之间进行数据双向通讯。

本实施方式中的炼铁高炉对象安置如下测量系统，包括：

第一流量计型号为HDLWG-06煤粉流量计用于测量煤粉喷吹量；第二流量计型号为A+K平衡流量计用于测量富氧流量；第三流量计为型号LB差压流量计用于测量冷风流量；温度计型号为YHIT红外测温仪用于测量热风温度；压力计型号为harp EJA系列压力变送器用于测量高炉热风系统的热风压力；湿度计型号为JWSK-6CWDA空气湿度传感器用于测量鼓风湿度；

另外，包括如下两个测量分析仪：

炉腹煤气量测量分析仪和富氧率测量分析仪，其中，炉腹煤气量测量分析仪设置如下：

炉腹煤气量＝1.21*冷风流量/60+(2*富氧流量/60)+(44.8*鼓风湿度*(冷风流量/60+(富氧流量/60))/18000)+(22.4*小时喷煤量*1000*煤粉含氢量/12000)；

富氧率测量分析仪设置如下：

富氧率＝((富氧流量*0.98/60+((0.21+(0.29*鼓风湿度/8/100))*冷风流量/60))/(冷风流量/60+(富氧流量/60))-(0.21+(0.29*鼓风湿度/8/100)))*100；

本发明方法可以采用C#高级语言进行软件系统的实现。该软件系统可实现数据显示、查询、软测量结果显示以及查询等功能，可以方便地让操作人员获得其所需要软测量、历史趋势、数据分析等信息。另外，计算机系统上装有OPC通讯软件负责与下位机以及数据采集装置进行数据双向通讯。

本发明利用实际的柳钢2号高炉，现有常规测量设备采集的高炉炼铁过程数据作为建模需要的数据，并能根据新测量的炼铁过程数据块自适应的更新模型参数，能够解决高炉工况时变对模型预测的影响，更加准确的给出指定动态时间区间的多元铁水质量参数的估计值和预测区间，为高炉生产过程的优化操作和稳定顺行运行提供参考，使炼铁厂获得最大的效益。

本实施方式中的基于Stacking的高炉铁水质量区间预测方法，如图2、图4所示，包括：具体步骤如下：

步骤1.2：剔除休风数据和异常数据：剔除休风数据，具体方式为：依据交班记录确定高炉计划检修时间段，剔除此时间段的高炉本体休风数据，休风数据具体指热风炉不向高炉吹风的数据；剔除异常数据，采用拉依达准则，即3_σ准则进行异常值的剔除，即数据偏差大于3σ的数据应该剔除；σ为上述筛选出的高炉本体数据的标准差，如下公式所示：

其中，x_i、

当前时刻炉腹煤气量u₁(t)(m³)；当前时刻热风温度u₂(t)(℃)；当前时刻热风压力u₃(t)(KPa)；当前时刻富氧率u₄(t)；当前时刻鼓风湿度u₅(t)(RH)；当前时刻设定喷煤量u₆(t)(m³/h)；上一时刻Si含量y₁(t-1)(％)；上一时刻P含量y₂(t-1)(％)；上一时刻炉腹煤气量u₁(t-1)(m³)；上一时刻热风温度u₂(t-1)(℃)；上一时刻热风压力u₃(t-1)(KPa)；上一时刻富氧率u₄(t-1)；上一时刻鼓风湿度u₅(t-1)(RH)；上一时刻设定喷煤量u₆(t-1)(m3/h)；上一时刻S含量y₃(t-1)(％)；上一时刻铁水温度y₄(t-1)(℃)；

步骤2.4：并根据输入输出参数，从预处理后的高炉原始历史数据中，提取训练数据集，其中，输出参数为离线测量的实际输出，输入参数为在线软测量的历史数据；

步骤3.1：建立基于N折模型的Stacking算法建立铁水质量模型，具体骤步骤如下：

步骤3.1.1：第一层学习器训练数据的切分。

为了使训练数据存在差异性，防止过拟合现象，对训练数据集进行k-fold切分为k份，每一分包括k-1个学习集和1个预测集，共进行N次切分；

每次取其中k-1份训练，另外的1份用来验证，其中k选为5，也即五折模型。对训练集进行五折模型的划分，其中，模型1学习时，使用前4份数据用于模型的学习，第5份作为模型的测试数据；与此类似，模型2、模型3、模型4、模型5分别使用第4份、第3份、第2份、第1份数据做预测数据，其他四份作为学习数据。这样，既保证了第一层学习器学习数据的差异性，又使得这5个模型的预测值组合正好覆盖训练集所有要预测的值。

基于Stacking的集成模型算法能够提高建模的精度，但是，由于集成模型融合多个模型的特性，则在建模上会牺牲一定的建模速度。因此，为了提高Stacking算法整体的建模速度，选择具有快速建模速度的随机权神经网络(Random vector functional-linknetworks,RVFLNs)为5个子模型进行建模。

步骤3.1.2：第一层学习器的训练。

步骤3.1.3：第二层学习器的训练。

步骤3.2：计算预测区间方法，具体步骤如下：

其中e_i为第i个建模误差，y_i为第i个输出真实值，

为第i个模型预测值。

步骤3.2.2：使用核密度估计方法估计出建模误差的概率分布曲线，这样可以把具有不确定性的建模误差用确定性的概率密度函数表征。

所述核密度估计的方法如下：

假设z_i∈R,i＝1,...,K为独立同分布随机变量，其所服从分布密度函数为f(z),z∈R，则f(z)的核密度估计

定义为：

利用核密度估计方法对于步骤3.2.1得到的建模误差集{e_i|i＝1,2...K}进行PDF估计，得到估计建模误差概率密度函数Γ_e为：

所述φ(·)核函数的选择：满足以下条件：

a.φ(z)≥0

b.∫φ(z)du＝1

选取高斯核函数，其表式如下：

h_p所述窗口宽度的选择：窗宽h_p设置为h_p＝1.06θK-^1/5，其中θ由min{S,0.746Q}估计，S表示样本标准差，Q为四分位数间距，K为建模误差样本集个数；

其中，上式中e_i为第i个建模误差，K为建模误差的个数。其中所求得的多元铁水质量指标[Si]、[P]、[S]、MIT的建模误差的标准差，即σ₁分别为0.0252、0.0028、0.0014、2.6855

步骤3.2.3.2：定义建模误差的预测区间。由于建模误差的概率密度函数近似符合高斯分布，因此，当建模误差的预测区间选为±3σ₁时，建模误差以0.99865的概率落在该区间。而0.99865的概率几乎接近于1，有很高的置信度，所以，本发明定义建模误差正负3倍的标准差作为模型的建模误差的预测区间。其中求得[Si]、[P]、[S]、MIT的建模误差的预测区间，即±3σ₁分别为±0.0756、±0.0084、±0.0042、±8.0565。

步骤4：根据N折模型的Stacking算法铁水质量模型对实时采集的高炉数据进行预测，得到预测值和预测区间：将获取的实时待测试高炉数据，经过步骤1中进行预处理，经过步骤2获取高炉多元铁水质量指标软测量所需输入输出参数，并根据输入输出参数从预处理后的高炉原始历史数据提取待测试数据，将待测试数据输入到第一层学习器中，得到N个预测值，并且将N个预测值取平均值，将该平均值输入到第二层学习器中，使用训练好的N折模型的Stacking算法铁水质量模型，即附图3中的模型6，得到最终的预测值，并根据步骤3.2得到预测区间，输出最终的预测值与预测区间。

从历史数据中采集400组数据作为模型训练样本数据，另取120组数据用于模型测试样本数据，图5为一段时间内基于Stacking的高炉多元铁水质量区间预测结果效果图，其中，其中，(a)为当前时刻硅含量预测值与实际值以及预测区间曲线图；(b)为当前时刻磷含量预测值与实际值以及预测区间曲线图；(c)为当前时刻硫含量预测值与实际值以及预测区间曲线图；(d)为当前时刻铁水温度预测值与实际值以及预测区间曲线图。可以看出多元铁水质量软测量结果具有很高的精度，软测量误差较小且其变化趋势与实际值保持一致，并且实际值都落在预测区间内部，说明了所提基于Stacking的高炉铁水质量区间预测方法的有效性优越性。另外，本发明方法的软测量模型结构简单，模型复杂度低，运算速度快，且测量精度高、泛化能力强，相比于其他已有的铁水质量指标软测量方法具有更高的实用性与优越性。因此本发明是一种低成本的、高效实用的高炉炼铁过程铁水质量多元计量手段。

Claims

1.一种基于Stacking的高炉铁水质量区间预测方法，其特征在于，具体步骤如下：

步骤1.2：剔除休风数据和异常数据：剔除休风数据，具体方式为：依据交班记录确定高炉计划检修时间段，剔除此时间段的高炉本体休风数据，休风数据具体指热风炉不向高炉吹风的数据；剔除异常数据，采用拉依达准则，即3σ准则进行异常值的剔除，即数据偏差大于3σ的数据应该剔除；σ为筛选出的高炉本体数据的标准差，如下公式所示：

其中，x_i、

步骤2.1：根据高炉工艺机理确定需要软测量的高炉铁水质量输出参数为Si(硅)含量y₁，％、P(磷)含量y₂，％、S(硫)含量y₃，％和铁水温度y₄，℃；

步骤2.2：采取灰色关联性分析的方法，提取前k个关联度最高的高炉本体参数作为软测量的辅助变量，包括：炉腹煤气量u₁，m³、热风温度u₂，℃、热风压力u₃，KPa、富氧率u₄、鼓风湿度u₅，RH、喷煤量u₆，m³/h；

当前时刻炉腹煤气量u₁(t)，m³；当前时刻热风温度u₂(t)，℃；当前时刻热风压力u₃(t)，kPa ；当前时刻富氧率u₄(t)；当前时刻鼓风湿度u₅(t)，RH；当前时刻设定喷煤量u₆(t)，m³/h；上一时刻Si含量y₁(t-1)，％；上一时刻P含量y₂(t-1)，％；上一时刻炉腹煤气量u₁(t-1)，m³；上一时刻热风温度u₂(t-1)，℃；上一时刻热风压力u₃(t-1)，KPa；上一时刻富氧率u₄(t-1)；上一时刻鼓风湿度u₅(t-1)，RH；上一时刻设定喷煤量u₆(t-1)，m³/h；上一时刻S含量y₃(t-1)，％；上一时刻铁水温度y₄(t-1)，℃；

步骤3：基于高炉多元铁水质量指标软测量所需输入输出参数，建立基于N折模型的Stacking算法铁水质量模型并计算建模误差预测区间；

步骤3.1.1：第一层学习器训练数据的切分；

步骤3.1.2：第一层学习器的训练；

取第N次切分的K-1个学习集，采用随机权神经网络进行建模，得到模型N，取第N次切分预测集在模型N上进行预测，得到预测结果N，并将所有N次预测结果传递给第二层学习器中；

步骤3.1.3：第二层学习器的训练；

步骤3.2：计算预测区间；步骤3.2所述计算预测区间，具体步骤如下：