CN104915518A

CN104915518A - 一种高炉铁水硅含量二维预报模型的构建方法及应用

Info

Publication number: CN104915518A
Application number: CN201510372889.0A
Authority: CN
Inventors: 蒋朝辉; 董梦林; 桂卫华; 阳春华; 谢永芳
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2015-06-30
Filing date: 2015-06-30
Publication date: 2015-09-16
Anticipated expiration: 2035-06-30
Also published as: CN104915518B

Abstract

本发明涉及一种高炉铁水硅含量二维预报模型的构建方法，包括获得输入变量数据样本集；构建基于bootstrap预测区间方法的高炉铁水硅含量二维预报模型；本发明还涉及所述二维预报模型的应用，包括利用所述硅含量二维预报模型输出预测结果——硅含量的预测值和预测区间；通过对预测结果进行统计分析，计算所述预测区间宽度和所述点预测值可信度之间的关系，最终得到铁水硅含量二维预报结果。本发明不仅提高了硅含量值的预测命中率，且同时评估出每一个硅含量预报结果的可信度，使操作者有选择的参照预报结果，有望进一步提高现场对高炉炉温的调控能力。

Description

一种高炉铁水硅含量二维预报模型的构建方法及应用

技术领域

本发明涉及一种高炉冶炼过程中铁水硅含量二维预报模型的构建方法及应用，属于自动化检测技术领域。

背景技术

高炉炉温是衡量高炉炉况的重要参数，它直接关系到高炉的炉况顺利状况。高炉内部环境的极其恶劣，导致炉况极难控制。如果炉温控制出现问题，炉温“过热”或“过冷”，则容易诱发炉况故障。在实际生产中,由于无法直接测量高炉内铁水的温度,常常用铁水硅含量来间接表征炉温。铁水硅含量是衡量高炉冶炼过程炉况稳定性与铁水质量的重要指标，也是表征高炉热状态及其变化趋势的显著标志，因此准确地预报铁水硅含量对于有效控制高炉炉况稳定性、保障高炉顺行和降低能耗具有重要的意义。

现有的硅含量预测均是单一硅含量值的预测，高炉系统的复杂性使得硅含量的预测较为困难，预测模型的预测结果均存在着命中率不高且没有可信度表征等问题。铁水硅含量预测模型在硅含量数据波动较大时的预测精度较低，整体命中率在绝对误差小于0.1，也一般仅在85％左右。而且目前的关于铁水硅含量的研究中，仅仅有对硅含量预测模型的整体预测结果的评价研究，例如“命中率”、均方根误差，而具体到对于每一炉的硅含量预测结果，还没有任何可信度表征。所以对于硅含量的预测结果，在没有可信度表征的情况下，操作者按照预测结果来调控炉况，可能会出现误操作。

中国专利申请公布号CN 101211383A、申请公布日2013.05.08公开了一种高炉铁水硅含量的特征分析预报方法，该方法以高炉工艺参数为输入变量，采用改进的动态独立成分分析方法对输入变量的样本数据进行特征提取，然后使用经过遗传算法优化地最小二乘法向量的算法建立高炉铁水硅含量预报的动态递推模型，具有普遍的通用性，可获得较好的预报精度，提高高炉铁水硅含量的预报命中率。但该方法的预测模型过于简单，只适合于平稳炉况，在硅含量数据波动较大时无法准确及时地跟踪上硅含量的变化趋势。

中国专利申请公布号CN 102031319A，申请公布日2011.04.27公开了一种高炉铁水硅含量的预报方法，该方法选取硅含量短期均值、硅含量中期均值、硅含量长期均值、前次铁水对应的风口理论燃烧温度及前次铁水含硫量五个参数，通过预测算法对硅含量进行预测。该方法采用的数据少，并能获得较好的预报精度，提高高炉铁水硅含量的预报命中率。但该方法的预测模型采用多元回归模型，对于输入变量与硅含量的非线性关系，不能很好的拟合表征，模型不具有普遍适用性。

有鉴于此，特提出本发明。

发明内容

本发明的目的是提供一种高炉铁水硅含量二维预报模型的构建方法及应用。本发明将bootstrap预测区间方法(即自举法)与基于BP神经网络(即多层前馈神经网络)的铁水硅含量预测方法相结合，构建高炉铁水硅含量的二维预报模型，即在预测下一时刻硅含量值的同时也输出预测值的预测区间，并以预测区间宽度来表征该预测值的可信度，实现铁水硅含量的二维预报——同时预测下一炉硅含量值和该点预测值对应的可信度。本发明方法不仅提高了硅含量值的预测命中率，且同时评估出每一个硅含量预报结果的可信度，使操作者有选择的参照预报结果，有望进一步提高现场对高炉炉温的调控能力。

本发明的目的是通过以下技术方案实现的：一种高炉铁水硅含量二维预报模型的构建方法，包括如下步骤：

S1、获得输入变量数据样本集

包括采集高炉现场影响铁水硅含量变化的变量数据和铁水硅含量数据；通过对所述各个变量与铁水硅含量相关性分析，采用前向选取法确定与铁水硅含量相关性强且数量合适的输入变量数据样本集；采用马氏距离法删除异常数据；再进行归一化处理，得到用于构建所述模型的输入变量数据样本集。

S2、构建基于bootstrap预测区间方法的高炉铁水硅含量二维预报模型

包括将所述输入变量数据样本集随机分为三个样本集：D₁，D₂，D₃；采用bootstrap方法利用所述样本集D₁建立前L个BP神经网络模型，所述L为正整数，；将所述样本集D₂中的输入变量数据样本输入到所述前L个BP神经网络模型，得到L个预测值，利用所述L个预测值和所述样本集D₂进一步建立第L+1个BP神经网络模型；所述前L个BP神经网络模型和所述第L+1个BP神经网络模型共同构成所述高炉铁水硅含量二维预报模型。本发明所述一般L大于等于1000，优选取L＝1000。

本发明还提供一种高炉铁水硅含量的二维预报方法，包括根据上述方法建立高炉铁水硅含量二维预报模型，还包括以下步骤：

S3、利用上述硅含量二维预报模型输出预测结果——硅含量的预测值和预测区间

包括将所述样本集D₃作为测试集，用上述前L个BP神经网络模型进行硅含量预测，得到L个硅含量预测值，这L个硅含量的预测值的平均值即为二维预报模型的硅含量的最终预测值。再通过计算一系列预测值的方差和通过第L+1个BP神经网络估计得噪声方差，构建出硅含量的预测区间。

S4、通过对所述预测结果进行统计分析，验证预测区间宽度表征预测结果可信度的能力，计算预测区间宽度和点预测值可信度之间的关系，实现预测区间宽度正确地表征预测值的可信度，最终得到铁水硅含量二维预报结果，即同时预测硅含量的值和该预测值的可信度。

具体地，所述高炉铁水硅含量二维预报模型的构建方法，包括如下步骤：

S1、获得输入变量数据样本集

具体包括以下步骤：

S11、采集高炉现场影响铁水硅含量变化的变量数据和铁水硅含量数据；

由于高炉内部的复杂物理化学反应，其间接影响铁水硅含量变化的变量有很多，包括上部的布料方式、原料性质，下部的控制参数如风量、风温等。常用的变量数据有富氧率、透气性指数、标准风速、富氧流量、冷风流量、喷煤量、铁水成分、煤气成分、顶压、全压差、热风压力、实际风速、冷风压力、理论燃烧温度、热风温度、鼓风动能、富氧流量、富氧压力、炉腹煤气量等等。表1列出了本发明具体实施方式中的一些候选变量。

S12、通过对所述各个变量与铁水硅含量相关性分析，采用前向选取法确定与铁水硅含量相关性强且数量合适的输入变量数据样本集

对所有采集到的影响铁水硅含量变化的变量与铁水硅含量之间进行相关性分析，根据相关系数的大小进行排序，然后采用前向选取法选取与铁水硅含量相关性强的变量，作为本发明所述模型的输入变量。如果变量个数过多，模型过于复杂，预报模型的命中率会逐渐下降；所以变量个数不宜选取过多，以数量合适为佳。优选地，以预测模型命中率最高点对应的模型输入变量集作为本发明所述二维预报模型的输入变量数据样本集。

具体地，所述S12确定模型输入变量数据样本集包括以下步骤：

S121、计算每个变量与铁水硅含量的相关系数。因考虑到高炉炉温系统是一个大滞后的系统，各个变量对于高炉炉温的影响具有滞后性，所以本发明在滞后0、1、2、3炉次的情况下，分别计算各个变量与铁水硅含量的相关系数。

S122、计算铁水硅含量的自相关系数。因考虑到铁水硅含量具有自相关性，本发明还计算时滞变量(即铁水硅含量)与上一炉和上上炉硅含量的相关系数。

S123、将所述变量按相关系数大小进行排序，采用前向选取法选取与铁水硅含量相关性强且数量合适的输入变量数据样本集。

所述相关系数即Pearson(皮尔逊)相关系数，其计算公式如下：

r = \frac{{NΣx}_{i} y_{i} - {Σx}_{i} {Σy}_{i}}{\sqrt{{NΣx}_{i}^{2} - {({Σx}_{i})}^{2}} \sqrt{{NΣy}_{i}^{2} - {({Σy}_{i})}^{2}}} - - - (1)

公式(1)中：x_i，y_i分别表示需要计算相关性的两个变量，其中y_i表示铁水硅含量；N表示变量的数据长度。

所述步骤S123过程如下：如图2所示，首先，将所述各个变量按照相关系数大小依次加入到输入变量数据样本集，然后分别用来训练单个的BP神经网络(多层前馈神经网络)模型并进行预测，得到最终预测结果的命中率。随着输入变量个数的增加，预测模型的命中率会逐渐上升，然后到达最高点。变量个数过多，模型过于复杂，命中率会逐渐下降。优选以所述BP神经网络模型命中率最高点对应的模型输入变量数据样本集作为本发明所述二维预报模型的输入变量数据样本集。在本发明一个具体实施方式中最终的预测模型的输入变量如表2所示。

表1高炉铁水硅含量预报模型的候选输入变量

注：q^-i表示该变量滞后原输入变量i炉；下同。

表2前项选取法过程中硅含量预测模型命中率变化

S13、剔除异常数据

在采集高炉现场数据过程中，受到高温高压等环境影响或者高炉休风、减风等非正常状况，数据存在异常值。这些异常数据在一定程度上会改变数据的变化趋势，影响模型建立的准确性，因此需要对异常数据进行剔除。将上述经过选取的输入变量数据样本集进行异常值处理，删除那些明显错误的或是波动过大的数据。这些数据的存在会影响训练效果，有可能使得预测模型参数朝着错误的方向调整。。本发明优选采用马氏距离法剔除异常数据。

设总体G为m维总体(考察m个输入变量)，均值向量为μ＝(μ₁,μ₂,…,μ_m)′，协方差阵为Σ＝(σ_ij)，则变量集X＝(x₁,x₂,…,x_m)′与总体G的马氏距离定义为：

d²(X,G)＝(X-μ)′Σ^-1(X-μ) (2)

当马氏距离高于自由度为m的卡方分布时，该样本被认为是一组异常值，予以剔除。

S14、归一化处理；即将所述各输入变量分别归一化处理；

因选取的各输入变量量纲不同、且输入变量之间的数量级相差较大，对模型的收敛速度和复杂度有很大影响，在建模前需要对其分别进行归一化处理，通过数值变换来消除变量间的量纲影响。方法如下：

X = \frac{x - m i n}{m a x - m i n} - - - (3)

其中，X是经过归一化计算后的样本值，X∈[0,1]，x是原始值(即归一化前的样本值)，min和max分别是原始值的最小值和最大值。

经归一化处理后获得所述高炉铁水硅含量二维预报模型的输入变量数据样本集。

为便于理解，本发明对预测区间的数学描述如下：

假设目标值的建模如下：

t_i＝y_i+ε_i；i＝1,2…n (4)

t_i表示第i次的硅含量测量值，共n个，n为正整数，n一般大于等于1000。ε_i表示噪声，也称为期望值为零的误差，它使得测量值t_i偏离真实值y_i；在构建预测区间过程中，假设误差独立同分布；实际上，真实值的估计值通过预测模型获得，因此：

t_{i} - {\hat{y}}_{i} = [y_{i} - {\hat{y}}_{i}] + ϵ_{i} - - - (5)

置信区间只考虑方程(5)右侧的第一项的方差，衡量预测值和真实值y_i之间的不确定性。置信区间表征的是真实值有一定概率落入预测值的周围的程度。相反，预测区间衡量预测值和测量值t_i之间的差异和不确定性，表征测量值有一定概率落入预测值周围的程度。因此，预测区间包含置信区间，相对于置信区间，预测区间对于数据的波动和预测的不确定性反应更为灵敏。

如果方程(5)中的两项独立，关于模型输出的总方差满足：

σ_{i}^{2} = σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2} - - - (6)

其中：由模型的不合理和参数估计误差产生，是反映多个预测值间的离散度的重要指标；为噪声方差，反映了测量的不确定性。基于上述变量估计，得到置信度α＝0.05的预测区间的表达式：

P ({\hat{y}}_{i} - t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}, {\hat{y}}_{i} + t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}) = 1 - α - - - (7)

所述步骤S2具体包括以下步骤：

S21、将所述数据样本集随机分为三个样本集：D₁，D₂,D₃；

S22、采用bootstrap方法利用所述样本集D₁建立前L个BP神经网络模型

采用bootstrap方法对所述样本集D₁进行N次有放回的重抽样，得到一个样本长度为N的子样本训练集D_i1。重复上述步骤L次，即可得到L个子样本训练集L为正整数，一般大于等于1000；用所述L个子样本训练集训练得到前L个BP神经网络模型。

在训练了多个BP神经网络模型的过程中，因BP神经网络个数较多(L一般大于等于1000)导致训练时间较长，为了加快模型训练速度，本发明优选前L个BP神经网络模型采用自适应调整速率附加动量因子方法进行反向传播训练BP神经网络模型，加快模型收敛速度，提高模型训练精度，防止模型陷入局部最优。

S23、第L+1个BP神经网络模型的建立

即将所述样本集D₂中的输入变量数据样本输入到所述前L个BP神经网络模型，得到L个预测值，利用所述L个预测值和所述样本集D₂进一步建立第L+1个BP神经网络模型；具体过程如下：

将上述样本集D₂中的输入变量数据样本分别输入到上述前L个BP神经网络模型，对铁水硅含量进行预测，可得到L个硅含量预测值。真实值y_i可以由所述L个硅含量预测值的平均值来估计，即用所述L个预测值的平均值作为二维预报最终的硅含量预测值

{\hat{y}}_{i} = \frac{1}{L} Σ_{l = 1}^{L} {\hat{y}}_{i}^{l} - - - (8)

其中是第l个BP神经网络输出的第i个测量值对应的预测值。

假设神经网络组合模型是无偏的，那么该模型的泛化误差可以由上述前L个BP神经网络模型的预测输出方差来估计：

σ_{{\hat{y}}_{i}}^{2} = \frac{1}{L - 1} Σ_{l = 1}^{L} {({\hat{y}}_{i}^{l} - {\hat{y}}_{i})}^{2} - - - (9)

主要由神经模型参数初始化的随机性和训练集的不同产生。

置信区间通过方程(9)中的估计值来构建，而构建预测区间，还估计噪声方差由方程(6)可知，计算如下：

σ_{\hat{ϵ}}^{2} = E {{(t - \hat{y})}^{2}} - σ_{\hat{y}}^{2} - - - (10)

由方程(10)可知，残差平方和r_i ²的计算如下：

r_{i}^{2} = m a x ({(t_{i} - {\hat{y}}_{i})}^{2} - σ_{{\hat{y}}_{i}}^{2}, 0) - - - (11)

其中和可由方程(8)和(9)计算得到；残差与对应所述样本集D₂的输入变量数据样本可以构建一个新的样本集：通过数据集训练一个新的神经网络NN_σ，即为第L+1个BP神经网络模型，用来估计未知参数目的是使得硅含量实测样本出现的概率最大。观察样本的概率：

Σ_{i = 1}^{n} P (t_{i} | x_{i}, {NN}_{y}, {NN}_{σ}) - - - (12)

NN_σ神经网络没有采用传统的神经网络的目标函数误差平方和反向传播算法调整权值和阈值，而是引入了最大似然估计方法，即运用极大似然估计原理建立新的目标函数来训练模型。假设误差以为中心呈正态分布，则：

P (t_{i} | x_{i}, {NN}_{y}, {NN}_{σ}) = \frac{1}{\sqrt{2 {πσ}_{{\hat{ϵ}}_{i}}^{2}}} e^{- \frac{r_{i}^{2}}{2 σ_{{\hat{ϵ}}_{i}}^{2}}} - - - (13)

对上式(13)两边取对数，然后忽略不变的常数项，最后可得所需最小化的目标函数：

C_{{NN}_{σ}} = \frac{1}{2} Σ_{1}^{n} [\ln (σ_{{\hat{ϵ}}_{i}}^{2}) + \frac{r_{i}^{2}}{σ_{{\hat{ϵ}}_{i}}^{2}}] - - - (14)

该目标函数可微，所以最小化目标函数的权值调整策略依然可以采用一般的学习算法，例如梯度下降法、共轭梯度法等。

通过计算得到即可计算置信度为ɑ的预测区间：

P ({\hat{y}}_{i} - t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}, {\hat{y}}_{i} + t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}) = 1 - α - - - (15)

本发明所述前L个BP神经网络模型和所述第L+1个BP神经网络模型当达到目标函数小于0.001时模型训练完成。如图3所示，所述模型训练过程如下：

步骤1、采用bootstrap方法对所述样本集D₁进行N次有放回的重抽样，得到一个样本长度为N的子样本训练集D_i1。用所述子样本训练集D_i1训练一个神经网络，通过网络不断的迭代，当达到目标函数小于0.001时结束网络训练，即该模型训练完成。

具体的训练过程如下：

应用美国MatworkS公司开发的MatLab7.0软件，采用BP神经网络(多层前馈神经网络)。以该子样本集中的硅含量测量值为输出值，其他变量为输入值，进行训练和建模，确定隐层神经元数经数值试验(也就是预测精读)，其中训练函数为traingdx(自适应调整速率附加动量因子)，目标函数为模型输出值和真实值的误差平方和，输入层和隐层的训练函数为正切S型函数(tansig)，隐层到输出层为线性函数(Purelin)，按照训练函数调整神经网络隐含层，输出层的权值和阈值，然后计算目标函数，通过网络不断的迭代，当达到目标函数小于0.001时结束网络训练，即该模型已经训练完成。

步骤2、重复上述步骤1L次(L为正整数，一般大于等于1000)，得到前L个已经训练好的BP神经网络模型。

步骤3、用样本集D₂的输入样本输入到所述前L个BP神经网络模型得到n₂×L个硅含量的预测值，每个硅含量的测量值t_i可得到对应的L个预测值由上述方程(8)和方程(9)，可计算得到对应的最终的硅含量预测值和预测方差由上述方程(11)计算可得对应的残差r_i ²。

步骤4、将样本集D₂中的输入样本与组成新的样本集用该样本集用来训练目标函数为公式(14)的第L+1个BP神经网络NN_σ，具体训练过程与前L个BP神经网络的训练过程相同，区别在于该第L+1个BP神经网络的目标函数为公式(14)，而不是模型输出值和硅含量真实值的误差平方和。当目标函数小于0.001时，停止网络训练，即该模型训练完成。

本发明还包括按上述方法所建立的预报模型在高炉铁水硅含量二维预报方面的应用。

进一步，本发明还提供一种高炉铁水硅含量二维预报方法，包括按上述方法建立高炉铁水硅含量二维预报模型，还包括以下步骤：

S3、将所述样本集D₃作为测试集，利用上述硅含量二维预报模型输出预测结果——硅含量的预测值和预测区间；即将所述样本集D₃作为测试集，由所述前L个BP神经网络模型得到硅含量的预测值和预测方差由所述第L+1个神经网络模型得到噪声方差根据构建置信度为ɑ的硅含量的预测区间。

具体过程如下：

将所述样本集D₃中的输入变量数据样本分别输入到所述前L个BP神经网络模型，这样，不同于单一模型预测，所述前L个BP神经网络模型同时对下一组数据进行预测，得到L个硅含量预测值，真实值y_i可以由所述L个硅含量预测值的平均值来估计，即用所述L个预测值的平均值作为二维预报最终的硅含量预测值并作为二维预报模型的最终输出的点预测值：

{\hat{y}}_{i} = \frac{1}{L} Σ_{l = 1}^{L} {\hat{y}}_{i}^{l} - - - (8)

其中是第l个BP神经网络输出的第i个测量值对应的预测值。

根据公式(8)得到硅含量点预测值公式(9)得到预测方差

由所述第L+1个BP神经网络模型得到噪声方差根据构建置信度为ɑ的预测区间：

({\hat{y}}_{i} - t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}, {\hat{y}}_{i} + t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}) = - - - (17) .

S4、通过对所述预测结果进行统计分析，计算所述预测区间宽度和所述预测值可信度之间的关系，实现预测区间宽度正确地表征预测值的可信度，最终得到铁水硅含量二维预报结果，即同时预测硅含量的值和该预测值的可信度。

为了便于分析，建立所述预测区间宽度和所述预测值的可信度之间的关系，本发明给出如下定义：

预测结果可信度建立在准确度的基础上，其取值也介于0与1之间，解决的是“信不信”的问题。一般情况下，预测模型命中率判断的是该预测模型的整体的预测结果可不可信的问题。本发明所述的可信度是指同时输出的单个硅含量量预测值的可信度，以此来判断该预测值是否可信，建立在预测区间宽度和硅含量点预测值的预报误差的关系的基础上。本发明以预测区间宽度表征预测结果的可信度，通过对预测结果进行统计分析，计算预测区间宽度和点预测值可信度之间的关系，验证预测区间宽度表征预测结果可信度的能力，从而得到铁水硅含量二维预报结果。

可信度的计算公式：

P_{R_{j}} = \frac{1}{n_{j}} Σ_{i = 1}^{n_{j}} H_{i} \times 100 % - - - (18)

其中R_j表示预测区间宽度范围，n_j表示预测区间宽度范围R_j内对应的硅含量点预测的个数.表示y_ij ⁽¹⁾的预测值，H(·)是Heavisiside函数，定义为：

如表3所示，预测区间宽度不同，对应点预测的可信度也有着明显的不同，基于后验经验，即通过对预测结果进行统计分析，将预测区间宽度划分为三个区间较为合适。当预测区间宽度在R₃范围内时，给予操作者警示，该硅含量的预测值可信度低，并提示硅含量的波动较大，预测值并没有准确的表现出硅含量的变化趋势。当预测区间宽度在R₁或R₂范围内时，预测结果可信度较高，操作者可以信任该预测值。

本发明的关键点：

1、本发明通过多个变量及时滞变量进行相关性分析，并通过前项选取法获得了数量合适且与铁水硅含量相关性最强的输入变量集。然后采用马氏距离法对获取的高炉铁水硅含量预报模型的输入变量样本数据进行异常值处理，排除了异常干扰，有利于提高模型训练的精度。

2、本发明采用bootstrap预测区间方法，构造多个BP神经网络模型进行硅含量预测，同时获得硅含量的预测值和预测区间上下限。

3、本发明通过预测结果统计分析，验证预测区间宽度和预测值可信度之间的关系，实现预测区间宽度正确地表征预测值的可信度，最终实现高炉铁水硅含量的二维预报——同时预测硅含量的值和该预测值的可信度。

本发明有益效果：1、提高铁水硅含量点预测值的命中率；2、预测区间宽度正确地表征出硅含量点预测值得可信度。

附图说明

图1为本发明高炉铁水硅含量二维预报模型的构建方法流程图。

图2为本发明高炉铁水硅含量二维预报模型的构建方法中前向选取法选取合适的预测模型输入变量流程图。

图3为本发明高炉铁水硅含量二维预报模型的训练过程图。

图4为本发明实施例2高炉铁水硅含量二维预报模型预测结果图。

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。

实施例1

本实施例采用某钢厂2650m³高炉的实际生产数据进行了铁水硅含量的二维预报实验。

一种高炉铁水硅含量二维预报模型的构建方法，具体包括如下步骤：

采集该高炉2013年1月9号到2月19日的850组数据，根据步骤S1方法，通过对所述各个变量与铁水硅含量相关性分析，采用前向选取法确定与铁水硅含量相关性强且数量合适的输入变量数据样本集；变量选取结果如下表3所示，共10个变量作为硅含量二维预报模型的输入变量。然后，采用马氏距离法经过异常值处理，删除掉50组波动较大影响模型训练效果的数据；经过归一化处理最终得到二维预报模型的输入变量数据样本集。同时，选用高炉铁水硅含量为预测目标，即预报模型的输出变量。将800组数据随机分为三个样本集：D₁、D₂、D₃，其中D₁、D₂分别有400组和200组数据；D₃为测试样本集，有200组数据。

采用bootstrap方法对所述样本集D₁进行N次有放回的重抽样，得到一个样本长度为N的子样本训练集D_i1。重复上述步骤L次，L＝1000，即可得到L个子样本训练集用所述L个子样本训练集练得到前L个BP神经网络模型。具体的训练过程如下：应用美国MatworkS公司开发的MatLab7.0软件，采用BP神经网络(多层前馈神经网络)。以该子样本集中的硅含量测量值为输出值，其他变量为输入值，进行训练和建模，确定隐层神经元数经数值试验(也就是预测精读)，其中训练函数为traingdx(自适应调整速率附加动量因子)，目标函数为模型输出值和真实值的误差平方和，输入层和隐层的训练函数为正切S型函数(tansig)，隐层到输出层为线性函数(Purelin)，按照训练函数调整神经网络隐含层，输出层的权值和阈值，然后计算目标函数，通过网络不断的迭代，当达到目标函数小于0.001时结束网络训练，即该模型已经训练完成。重复上述步骤L次，L等于1000，得到前L个已经训练好的BP神经网络模型。该前L个BP神经网络采用自适应调整速率附加动量因子方法改进反向传播算法，加快模型收敛速度，防止模型陷入局部最优。

用所述样本集D₂的输入样本输入到所述前L个BP神经网络模型得到n₂×L个硅含量的预测值，每个硅含量的测量值t_i可得到对应的L个预测值由方程(8)和方程(9)，计算得到对应的最终的硅含量预测值和预测方差由方程(11)计算可得对应的残差r_i ²。

将样本集D₂中的输入样本与组成新的样本集用该样本集用来训练目标函数为公式(14)的第L+1个BP神经网络NN_σ，具体训练过程与前L个BP神经网络的训练过程相同，区别在于该第L+1个BP神经网络的目标函数为公式(14)，而不是模型输出值和硅含量真实值的误差平方和。第L+1个BP神经网络采用自适应调整速率附加动量因子方法改进反向传播算法，加快模型收敛速度，防止模型陷入局部最优。当目标函数小于0.001时，停止网络训练，即该模型训练完成。

所述前L个BP神经网络模型和所述第L+1个BP神经网络模型共同构成所述高炉铁水硅含量二维预报模型。

表3前项选取法过程中硅含量预测模型命中率变化

实施例2

本实施例涉及一种利用实施例1所构建的高炉铁水硅含量二维预报模型进行高炉铁水硅含量二维预报方法，具体为将实施例1中的样本集D₃作为测试样本输入已训练好的模型，得到硅含量的点预测值预测方差噪声方差再根据公式(17)得到最终的预测区间；预测结果如图4所示，二维预报模型的硅含量预测值能很好地跟踪实测值的变化，特别是在实际值波动较大的情况下，预测值也基本能够保持与其相同的变化趋势。然后，根据公式(18)计算得到不同的预测区间宽度范围的预测结果可信度，结果如表4所示。

表4预测区间宽度和点预测结果的可信度关系

从表4可以看出，预测区间宽度不同，相应的点预测结果可信度也有着明显的不同，二者关系紧密。当预测区间宽度大于0.45时，硅含量点预测值的可信度极低，表明预测结果不可信及硅含量数据波动大；当预测区间宽度小于0.3时，硅含量点预测值的可信度高达95％以上，表明此时预测结果可信度很高。如图4和表4所示，预测结果可信度并不是稳定不变的，当数据波动较小时，二维预报模型输出的硅含量预测值能够很好的跟踪实测值，预测精确度较高，预测结果可信度也较高；而当炉况较差时，硅含量数据波动较大，预测值很难及时跟踪实测值的趋势变化，预测的准确度会明显下降，预测结果的可信度也会随之下降。高炉铁水硅含量的二维预报，能在预测硅含量值的同时给出该预测结果的可信度，现场操作人员能依据可信度有选择的相信点预测结果，降低炉温调控过程中的不确定性，有利于提高高炉现场的炉温调控能力和准确性。从表4可见大多炉次趋势预测都准确，表明本实施例预报结果与实际值相吻合，符合实际要求，取得了满意的预报效果。

实施例3

采集该高炉2015年3月2号到3月30日的1150组数据，根据步骤S1方法，通过对所述各个变量与铁水硅含量相关性分析，采用前向选取法确定与铁水硅含量相关性强且数量合适的输入变量数据样本集；变量选取结果如实施例1中的表3所示，共10个变量作为硅含量二维预报模型的输入变量。然后，采用马氏距离法经过异常值处理，删除掉50组波动较大影响模型训练效果的数据；经过归一化处理最终得到二维预报模型的输入变量数据样本集。同时，选用高炉铁水硅含量为预测目标，即预报模型的输出变量。将1100组数据随机分为三个样本集：D₁、D₂、D₃，其中分别有400组和200组数据；D₃为测试样本集，有500组数据。

采用与实施例1相同的方法建立前L个BP神经网络模型和第L+1个BP神经网络模型；其中L＝1000。

计算得到对应的最终的硅含量预测值预测方差和对应的残差r_i ²。

实施例4

本实施例涉及一种利用实施例3所构建的高炉铁水硅含量二维预报模型进行高炉铁水硅含量二维预报方法，具体为将实施例3中的样本集D₃测试样本输入已训练好的模型，得到硅含量的点预测值预测方差噪声方差再根据公式(17)得到最终的预测区间；根据公式(18)计算得到不同的预测区间宽度范围的预测结果可信度，结果如表5所示。

表5预测区间宽度和点预测结果的可信度关系

本实例选用了相对于实例2更多的测试样本，用以验证二维预测模型在实际中的应用效果，结果如表5可知，当预测区间宽度大于0.45时，硅含量点预测值的可信度极低，表明预测结果不可信及硅含量数据波动大；当预测区间宽度小于0.3时，硅含量点预测值的可信度高达95％以上，表明此时预测结果可信度很高。当预测区间宽度在0.3与0.45之间时，预测值得可信度为93.02％，预测结果可信度也较高。同实施例2得到的统计结果一致，说明该二维预报方法的预测结果较为稳定，预测区间宽度可以正确表征预测结果的可信度。

虽然，上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

Claims

1.一种高炉铁水硅含量二维预报模型的构建方法，包括如下步骤：

S1、获得输入变量数据样本集：采集高炉现场影响铁水硅含量变化的变量数据和铁水硅含量数据；通过对所述各个变量与铁水硅含量相关性分析，采用前向选取法确定与铁水硅含量相关性强且数量合适的输入变量数据样本集；采用马氏距离法删除异常数据；再进行归一化处理，得到用于构建所述模型的输入变量数据样本集；

S2、构建基于bootstrap预测区间方法的高炉铁水硅含量二维预报模型：将所述输入变量数据样本集随机分为三个样本集：D₁，D₂，D₃；采用bootstrap方法利用所述样本集D₁建立前L个BP神经网络模型，所述L为正整数；将所述样本集D₂中的输入变量数据样本输入到所述前L个BP神经网络模型，得到L个预测值，利用所述L个预测值和所述样本集D₂进一步建立第L+1个BP神经网络模型；所述前L个BP神经网络模型和所述第L+1个BP神经网络模型共同构成所述高炉铁水硅含量二维预报模型。

2.根据权利要求1所述的高炉铁水硅含量二维预报模型的构建方法，其特征在于，所述确定与铁水硅含量相关性强且数量合适的输入变量数据样本集包括以下步骤：

S121、计算每个变量与铁水硅含量的相关系数；即在滞后0、1、2、3炉次的情况下，分别计算各个变量与铁水硅含量的相关系数；

S122、计算铁水硅含量的自字相关系数；即计算时滞变量与上一炉和上上炉硅含量的相关系数；

S123、将所述变量按相关系数大小进行排序，采用前向选取法选取与铁水硅含量相关性强且数量合适的输入变量集。

3.根据权利要求2所述的高炉铁水硅含量二维预报模型的构建方法，其特征在于，所述步骤S123过程如下：首先，将各个变量按照相关系数大小依次加入到输入变量集，然后分别用来训练单个的BP神经网络模型并进行预测，得到最终预测结果的命中率；以所述BP神经网络模型命中率最高点对应的模型输入变量集作为所述二维预报模型的输入变量集。

4.根据权利要求1-3任一项所述的高炉铁水硅含量二维预报模型的构建方法，其特征在于，所述前L个BP神经网络模型的建立过程包括：采用bootstrap方法对所述样本集D₁进行N次有放回的重抽样，得到一个样本长度为N的子样本训练集D_i1；重复上述步骤L次，即可得到L个子样本训练集所述L为正整数；用所述L个子样本训练集训练得到前L个BP神经网络模型。

5.根据权利要求4所述的高炉铁水硅含量二维预报模型的构建方法，其特征在于，所述前L个BP神经网络模型采用自适应调整速率附加动量因子方法进行反向传播训练BP神经网络模型。

6.根据权利要求1-5任一项所述的高炉铁水硅含量二维预报模型的构建方法，其特征在于，所述第L+1个BP神经网络模型的建立过程包括：

将所述样本集D₂中的输入变量数据样本分别输入到所述前L个BP神经网络模型，得到L个预测值；用所述L个预测值的平均值作为二维预报最终的硅含量预测值

{\hat{y}}_{i} = \frac{1}{L} Σ_{l = 1}^{L} {\hat{y}}_{i}^{l} - - - (8)

其中是第l个BP神经网络输出的第i个测量值对应的预测值；

假设BP神经网络组合模型是无偏的，那么该模型的泛化误差由所述前L个BP神经网络模型的预测输出方差来估计：

σ_{{\hat{y}}_{i}}^{2} = \frac{1}{L - 1} Σ_{l = 1}^{L} {({\hat{y}}_{i}^{l} - {\hat{y}}_{i})}^{2} - - - (9)

根据方程(6)计算噪声方差如下式：

σ_{i}^{2} = σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2} - - - (6)

σ_{\hat{ϵ}}^{2} = E {{(t - \hat{y})}^{2}} - σ_{\hat{y}}^{2} - - - (10)

根据方程(10)计算残差平方和，如下式：

r_{i}^{2} = m a x ({(t_{i} - {\hat{y}}_{i})}^{2} - σ_{{\hat{y}}_{i}}^{2}, 0) - - - (11)

根据方程(8)和(9)计算和

利用残差与对应所述样本集D₂的输入变量数据样本构建一个新的

数据集：通过数据集训练得到第L+1个BP神经

网络模型；所述第L+1个BP神经网络模型的目标函数如下：

C_{{NN}_{σ}} = \frac{1}{2} Σ_{1}^{n} [l n (σ_{{\hat{ϵ}}_{i}}^{2}) + \frac{r_{i}^{2}}{σ_{{\hat{ϵ}}_{i}}^{2}}] - - - (14) .

7.根据权利要求1-6任一项所述的高炉铁水硅含量二维预报模型的构建方法，其特征在于，所述前L个BP神经网络模型和所述第L+1个BP神经网络模型当达到目标函数小于0.001时模型训练完成。

8.一种高炉铁水硅含量的二维预报方法，包括根据权利要求1-7任一项所述方法建立高炉铁水硅含量二维预报模型，其特征在于，还包括以下步骤：

S3、将所述样本集D₃作为测试集，利用所述硅含量二维预报模型输出预测结果——硅含量的预测值和预测区间；

S4、通过对所述预测结果进行统计分析，计算所述预测区间宽度和所述预测值可信度之间的关系，实现预测区间宽度正确地表征预测值的可信度，最终得到铁水硅含量二维预报结果。

9.根据权利要求8所述的高炉铁水硅含量的二维预报方法，其特征在于，所述步骤S3包括：将所述样本集D₃作为测试集，由所述前L个BP神经网络得到硅含量的预测值和预测方差由所述第L+1个BP神经网络得到噪声方差根据构建置信度为ɑ的硅含量的预测区间：

({\hat{y}}_{i} - t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}, {\hat{y}}_{i} + t_{d f}^{1 - \frac{α}{2}} \sqrt{σ_{{\hat{y}}_{i}}^{2} + σ_{{\hat{ϵ}}_{i}}^{2}}) - - - (17) .

10.根据权利要求8-9任一项所述的高炉铁水硅含量的二维预报方法，其特征在于，所述步骤S4可信度的计算公式：

P_{R_{j}} = \frac{1}{n_{j}} Σ_{i = 1}^{n_{j}} H_{i} \times 100 % - - - (18)

其中R_j表示预测区间宽度范围，n_j表示预测区间宽度范围R_j内对应的硅含量点预测的个数.表示的预测值，H(·)是Heavisiside函数，定义为：