CN104267610B - 高精度的高炉冶炼过程异常数据检测及修补方法 - Google Patents

高精度的高炉冶炼过程异常数据检测及修补方法 Download PDF

Info

Publication number
CN104267610B
CN104267610B CN201410435956.4A CN201410435956A CN104267610B CN 104267610 B CN104267610 B CN 104267610B CN 201410435956 A CN201410435956 A CN 201410435956A CN 104267610 B CN104267610 B CN 104267610B
Authority
CN
China
Prior art keywords
data
blast furnace
detection
model
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410435956.4A
Other languages
English (en)
Other versions
CN104267610A (zh
Inventor
张勇
赵哲
刘丕亮
孙采鹰
崔桂梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University of Science and Technology
Original Assignee
Inner Mongolia University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University of Science and Technology filed Critical Inner Mongolia University of Science and Technology
Priority to CN201410435956.4A priority Critical patent/CN104267610B/zh
Publication of CN104267610A publication Critical patent/CN104267610A/zh
Application granted granted Critical
Publication of CN104267610B publication Critical patent/CN104267610B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Manufacture Of Iron (AREA)

Abstract

本发明提供了一种高精度的高炉冶炼过程异常数据检测及修补方法。该方法首先通过全局统计获取相关指标,进而发现可能出现问题的数据的时间点,然后在相关时间点上具体分析数据的斜率变化情况,最终通过局部与全局的两种统计与分析对比达到对异常数据的准确认识。本发明针对高炉数据采用自回归时间序列模型对问题数据进行修补,在模型参数估计上选用收敛速度较快的广义多新息最小二乘算法,给出了样本数据长度、多新息量及模型阶次的选择方法。该发明解决了常规检测方法在高炉过程数据异常值检测时存在的误检,以及均值插补法在对高炉炉温异常数据修补时存在的精度低的问题。本发明还可应用于其他过程数据测检测及修补。

Description

高精度的高炉冶炼过程异常数据检测及修补方法
技术领域
本发明涉及一种高精度的过程记录数据的异常值检测和修补方法,涉及高炉冶炼生产记录数据中的异常值(“缺失值”是异常值的一个特殊情况,故本说明书将“缺失值”也做异常值处理)的检测及修补,同也可用于生物医学,通信,交通,勘探,造纸,化工,冶金等复杂工业过程,航空航天等多种领域的数据异常值的检测及修补。
背景技术
过程数据是系统建模、控制及优化的核心依据,受人为因素、环境及不可抗拒的突发事件等因素影响,过程记录数据存在数据缺失、异常现象。过程数据中异常值的检测及修补,是基于数据驱动的建模、优化及控制的前提,是一类广泛存在于各种工业过程中的普遍性问题。在复杂生产过程智能建模、控制与优化研究领域,针对过程数据中存在的异常值检测及修补问题,常用的方法为3σ检测和均值插补方法(桂卫华,阳春华.复杂有色冶金生产过程智能建模、控制与优化[M].科学出版社,2010:80;李静.基于数据挖掘的高炉铁水温度建模与预报[D].内蒙古科技大学硕士学位论文,2013)。在信息和数据时代,高炉数据的完备性及准确性对于高炉操作的影响是至关重要的,因此,要保障炉况稳定顺行,降低能耗,首先需要做的就是准确的分析和处理高炉数据。常规的检测方法易把重要的或者关键的数据误检甚至误剔除,如高炉在停炉、休风、检修、及开炉时,炉况波动较大,数据变化也大,常规的检测法易将反应高炉暂态变化的关键数据误剔除。常用的增长量推算法、发展速度推算法、平滑法和差值估算法等数据插补方法,对于单点数据的缺失有一定的估算效果,但对于连续数据的缺失,其修补精度往往无法满足建模、优化及控制的需要。自回归时间序列模型是建模时常用的一种方法,在数据修补上受参数训练等约束条件限制鲜有应用,考虑到自回归模型的简单、便捷及运算量小的特点,本发明专利在突破部分约束条件限制的情况下应用自回归时间序列模型对异常数据进行修补。
在复杂的高炉炼铁过程中,过程采集并记录的数据成千上万,其中炉温是最重要的一类数据,也是最具有代表性的一类数据。因此,本发明以高炉炉温为数据主要研究对象,针对常规异常数据的检测及修补方法存在的漏检或误检,修补精度低等问题,提出一种高精度的高炉冶炼过程异常数据检测及修补方法。本发明的提出对于高炉操作,高炉建模、优化及控制,以及更大限度的实现高炉冶炼过程的节能、减排以及性能指标优化具有十分重要的意义。
发明内容
本发明的目的是:针对3σ检测方法在高炉过程数据异常值检测时存在的误检,以及均值插补法在对高炉炉温异常数据修补时存在的精度低的问题,提出一种采用全局与局部相结合的异常数据检测新方法和基于自回归时间序列模型的数据修补新方法。
为了实现上述目的,本发明通过采用全局与局部相统一的思想对3σ检测方法进行改进;在异常数据修补时,采用自回归时间序列模型对异常数据修补,同时考虑到自回归模型在参数训练时存在完备数据稀少的可能性,本发明采用广义最小二乘方法对模型参数训练。
(1)3σ异常值检测新方法:
对于表征高炉炉温的变量,铁水温度[Thm]、铁水硅含量[Si]、铁水硫含量[S]、铁水钛含量[Ti]等高炉过程采样数据。以k表征高炉出铁铁次,L表征采集数据的长度,则样本数据{y(1),y(2),…y(k),…y(L)}为表征炉温([Thm]、[Si]、[S]、[Ti]等)的时间序列。记μ为样本均值:σ2为样本偏差,3σ异常值检测的常规方法对于y(k)值不在μ±3σ区间内的即认为其为异常值,可找到其异常值位置并对其进行剔除。由于高炉在停炉,休风,检修及开炉时,炉况波动较大,数据变化也大,3σ异常值检测的常规方法会对正常数据造成误剔除。如表1,采用3σ异常值检测的常规方法会造成正常的853,854以及855批铁次所对应的铁水温度数据被误剔除。
表1正常的铁水温度数据
针对3σ异常值检测的常规方法对于高炉这种高度复杂过程的不合理性,结合高炉冶炼过程的大惯性和慢时变的特点,引入一种斜率变化与常规3σ准则相互结合来判断炉温超出μ±3σ范围是否由异常值引起的方法。异常值前后时间序列的斜率会发生突变,而正常值的斜率不会突变,或者仅有一方的斜率发生渐变。本发明先用粗尺度对整体数据共性进行认识,计算L组数据的均值μ及偏差σ,并记录可能得异常数据所对应的不同铁次xi,然后在不同的铁次xi附近再细尺度讨论数据斜率的变化特点,最终通过粗细两种尺度对比达到对异常数据的准确认识。
(2)自回归时间序列模型数据修补原理如下:
对于高炉炉温的过程采样异常数据,以xi表征异常铁次,v(xi)为随机白噪声时间序列,则异常数据y(xi)值可由异常数据的前几个时刻数据并依据自回归时间序列模型修复:
y(xi)=a1y(xi-1)+a2y(xi-2)+v(xi),
考虑高炉数据特点,此处y(xi)值可由异常数据的前两个时刻数据并依据二阶自回归模型修复,其中ai(i=1,2)为模型参数,由铁次xi前的正常高炉炉温样本数据{y(1),y(2),…y(xi-1)}训练可得。
本发明适用于高炉冶炼过程异常数据的检测与数据修补,同时本专利的思想可用于存在异常数据的生物医学,通信,勘探,化工过程,航空航天等多种领域的异常数据的检测与修补。
附图说明:
图1为针对表1中正常的铁水温度的记录数据,用本专利方法和常规3σ异常值检测法的对比图;
图2为针对表2的异常数据的检测及修补图;
图3为针对表3中存在人为干预下连续缺失值修补的对比图。
具体实施方式:
下面通过具体的实施对本发明的技术方案做进一步的描述。
具体步骤为:
1、检测L组高炉现场采集的样本数据{y(1),y(2),…y(k),…y(L)}存在的缺失值数目m,缺失值所对应的铁次xi,并记录由缺失值对应铁次所构成的向量M=[x1x2…xm]T
2、计算样本均值及偏差(缺失的数据不参与计算),样本均值:样本偏差:
3、3σ法则对数据{y(1),y(2),…y(k),…y(L)}全局检测,记录数据值在μ±3σ界外的铁次xi,xi即为可能出现异常数据的铁次;然后在xi时刻作局部分析,分别计算|y(xi)-y(xi-1)|与|y(xi+1)-y(xi)|的数值,如果上述差值均大于3σ,但是|y(xi+2)-y(xi+1)|与|y(xi+3)-y(xi+2)|时刻的斜率发生渐变,则铁次xi的记录数值y(xi)仍为正常值,否则,铁次xi的记录数值y(xi)确定为异常值;如果其中一个差值在2σ范围内,则铁次xi的记录数值y(xi)仍为正常值。
4、以异常铁次xi前的Lx组数据{y(xi-Lx),y(xi-Lx-1),…y(xi-2),y(xi-1)}为训练样本。考虑到两高炉异常铁次可能出现的间隔,同时综合考虑计算量、参数估计和修补效果,本发明给出了模型训练数据长度Lx选择范围为50至300间的整数。在两异常铁次间的间隔允许的情况下,如果想取得更好的参数估计和修补效,则数组长度Lx应尽可能大。
5、由于模型训练数据长度Lx有可能接近50,因此本发明对自回归时间序列模型的参数用广义多新息递推最小二乘算法估计系统参数a1,a2:
P-1(k)=P-1(K-1)+Φ(K)ΦT(k),
Y(k)=[y(k)y(k-1)y(k-2)]T
其中为θ(k)参数向量(初始值为:);为信息向量;P(0)=10°I2(I2为单位矩阵)。
6、本专利给出的广义多新息递推最小二乘算法中多新息量维数为3,自回归模型阶次为2,综合计算量和估计效果提供多信息量的可选择范围为3到5间的整数,自回归时间序列模型的阶次为2到3间的整数。如果Lx不受限制,可以足够大,此时要获得更好的计算和估算速度,多新息量和自回归模型阶次应当尽可能接近低值;如果Lx受限制,不够大或者是接近下限,要获取较好的估算效果,多信息量和自回归模型阶次应当尽可能接近高值。
7、由异常值前两个时刻数据,通过回归模型y(xi)=a1y(xi-1)+a2y(xi-2)+v(xi)计算异常或缺失数据,其中,v(xi)为方差为32的随机白噪声时间序列。如果异常值或缺失值是连续出现,可用回归模型滚动修补。
图1为针对表1中正常的铁水温度的记录数据,用本专利方法和常规3σ异常值检测法的对比图,其中三条虚线所界定的区间为μ±3σ的界限,实线为检测和处理后的曲线,*为原始的正常数据点。如图所示,上图为粗细两种尺度相结合的改进型3σ异常值检测法对正常数据的检测及处理,下图为用3σ异常值检测法对数据的检测及剔除,明显看出该专利技术与常规技术在正常数据处理上的不同之处。
表2存在记录失误的铁水温度数据
图2为针对表2的异常数据的检测及修补,其中上图为异常数据的检测及剔除,点画线为原始数据,实线为剔除后的数据曲线图,下图为采用自回归时间序列模型对铁次为536的单点铁水温度数据进行修补后的曲线。
图3为针对表3中存在人为干预下连续缺失值修补的对比图,用本专利提出的数据修复方法和均值修补做对比,虚线为原始正常值,上图的实线为均值修补得到的修补数据,下图实线为用本专利提出的数据修补方法获得的数据修补效果图,明显看出本专利技术能得到较好的数据修补效果。
表3人为干预部分正常铁水温度数据

Claims (5)

1.一种高炉冶炼生产记录数据中异常值的检测及修补方法,其特征在于,所述方法包括以下两个步骤,1)通过对样本离线数据整体统计均值及方差,用常规检测方法发现可能出现问题数据的时间点,然后在具体时间点上局部分析数据的斜率变化,最终通过整体与局部两种统计与分析对比准确确定异常数据;该步骤具体为:针对高炉过程离线采集数据{y(1),y(2),…y(k),…y(L)}的整体与局部统计分析相结合的异常值检测方法,其中k表征高炉出铁铁次,L表征采集数据的长度,具体为:首先,针对所采集的整体过程数据统计均值μ和方差σ2,并记录数据值在μ±3σ界外的铁次xi,xi为疑似出现异常值的时刻;然后在xi时刻作局部分析,分别计算|y(xi)-y(xi-1)|与|y(xi+1)-y(xi)|的数值并记为局部差值,如果上述差值均大于3σ,并且y(xi+2)与y(xi-2)均在μ±3σ界内,则铁次xi的记录数值y(xi)确定为异常值;如果上述差值一方大于3σ,但是|y(xi+2)-y(xi+1)|与|y(xi+3)-y(xi+2)|时刻的斜率发生渐变,则铁次xi的记录数值y(xi)仍为正常值,否则,铁次xi的记录数值y(xi)确定为异常值;记μ为样本均值:σ为样本偏差,3σ异常值检测的常规方法对于y(k)值不在μ±3σ区间内的即认为其为异常值,可找到其异常值位置并对其进行剔除;
2)采用自回归时间序列模型对问题数据进行修补,并用广义多新息最小二乘方法训练模型参数。
2.根据权利要求1所述的检测及修补方法,其特征在于,采用所述自回归时间序列模型对问题数据进行修补的方法,具体为:首先根据实际情况选取异常数据点前面的Lx组数据,并用广义多新息最小二乘方法训练自回归模型y(xi)=a1y(xi-1)+a2y(xi-2)+v(xi),其中xi表征异常铁次,v(xi)为随机白噪声时间序列,y(xi)为异常数据,然后再通过回归模型计算异常或缺失数据。
3.根据权利要求2所述的检测及修补方法,其特征在于,所述模型训练样本数据长度Lx的选择方法,应当考虑两高炉异常铁次可能出现的间隔,同时综合考虑计算量、参数估计和修补效果,最终确定样本数据长度Lx
4.根据权利要求3所述的检测及修补方法,其特征在于,所述模型训练样本数据长度Lx为50至300间的整数,在两高炉异常铁次间的间隔允许的情况下,如果要获得较好的参数估计和修补效果,则数据长度Lx应尽可能大。
5.根据权利要求2所述的检测及修补方法,其特征在于,所述多新息量的可选择范围为3到5间的整数,自回归时间序列模型的阶次为2到3间的整数,如果Lx不受限制,可以足够大,此时要获得更好的计算和估算速度,多新息量和自回归模型阶次应当尽可能接近低值;如果Lx受限制,不够大或者是接近下限,要获取较好的估算效果,多新息量和自回归模型阶次应当尽可能接近高值。
CN201410435956.4A 2014-08-29 2014-08-29 高精度的高炉冶炼过程异常数据检测及修补方法 Expired - Fee Related CN104267610B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410435956.4A CN104267610B (zh) 2014-08-29 2014-08-29 高精度的高炉冶炼过程异常数据检测及修补方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410435956.4A CN104267610B (zh) 2014-08-29 2014-08-29 高精度的高炉冶炼过程异常数据检测及修补方法

Publications (2)

Publication Number Publication Date
CN104267610A CN104267610A (zh) 2015-01-07
CN104267610B true CN104267610B (zh) 2017-05-17

Family

ID=52159138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410435956.4A Expired - Fee Related CN104267610B (zh) 2014-08-29 2014-08-29 高精度的高炉冶炼过程异常数据检测及修补方法

Country Status (1)

Country Link
CN (1) CN104267610B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718432B (zh) * 2016-03-16 2019-02-01 北京睿新科技有限公司 一种用于电网运行设备的信息挖掘与数据质量的校验方法
CN108563217A (zh) * 2018-05-29 2018-09-21 济南浪潮高新科技投资发展有限公司 基于局部和全局统计分析的鲁棒异常检测方法
CN109189768A (zh) * 2018-08-08 2019-01-11 佛山科学技术学院 一种复杂制造过程感知数据预处理方法及装置
CN110378571A (zh) * 2019-06-25 2019-10-25 河海大学 一种基于多新息最小二乘算法的锂电池参数辨识方法
CN110427715B (zh) * 2019-08-08 2022-10-14 内蒙古科技大学 基于时间序列和高炉多维度的炉缸热状态趋势预测的方法
CN111679584B (zh) * 2020-06-23 2022-05-03 武汉钢铁有限公司 一种高炉冶炼的调控方法和装置
CN117290666A (zh) * 2023-10-10 2023-12-26 国网甘肃省电力公司电力科学研究院 一种光伏异常功率数据清洗方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1741526A (zh) * 2005-09-05 2006-03-01 北京启明星辰信息技术有限公司 网络异常流量的检测方法及系统
CN102393303A (zh) * 2011-10-14 2012-03-28 哈尔滨工业大学 一种燃气轮机的排序异常检测方法
CN103150364A (zh) * 2013-03-04 2013-06-12 福建师范大学 一种时间序列特征提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1741526A (zh) * 2005-09-05 2006-03-01 北京启明星辰信息技术有限公司 网络异常流量的检测方法及系统
CN102393303A (zh) * 2011-10-14 2012-03-28 哈尔滨工业大学 一种燃气轮机的排序异常检测方法
CN103150364A (zh) * 2013-03-04 2013-06-12 福建师范大学 一种时间序列特征提取方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
"EMD方法基于AR模型预测的数据延拓与应用";胡劲松,等;《振动、测试与诊断》;20070630;第27卷(第2期);第116-119页 *
"Matlab_AR模型阶数确定";aimeng20130301;《百度文库 http://wenku.baidu.com/view/d464303e8e9951e79b89275a.html》;20140419;第1-7页 *
"基于混沌的异常数据的动态识别与挖掘";王建州,等;《清华大学学报 (自然科学版)》;20051231;第45卷(第S1期);第1753-1756页 *
"基于空间自回归模型的缺失值插补方法";李序颖,等;《数理统计与管理》;20050531;第24卷(第3期);第45-50页 *
"广义最小二乘法";yssam;《百度文库http://wenku.baidu.com/view/3ea7fb1655270722192ef7a1.html》;20101221;第4-27页 *
"拉伊达(Pauta)准则与异常值剔除";张敏,等;《郑州工业大学学报》;19970331;第18卷(第1期);第84-88页 *
"粗大误差四种判别准则的比较和应用";熊艳艳,等;《大学物理实验》;20100228;第23卷(第1期);第66-68页 *
"高炉铁水温度的多元时间序列建模和预测";崔桂梅,等;《钢铁研究学报》;20140430;第26卷(第4期);第33-37页 *

Also Published As

Publication number Publication date
CN104267610A (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
CN104267610B (zh) 高精度的高炉冶炼过程异常数据检测及修补方法
CN109396375B (zh) 一种基于特征向量和层次聚类的结晶器漏钢预报方法
WO2019174142A1 (zh) 一种多模式的退化过程建模及剩余寿命预测方法
CN110066895B (zh) 一种基于Stacking的高炉铁水质量区间预测方法
CN107092582A (zh) 一种基于残差后验的异常值在线检测及置信度评估方法
CN106530715B (zh) 基于模糊马尔可夫过程的路网交通状态预测方法
CN109935280B (zh) 一种基于集成学习的高炉铁水质量预测系统及方法
CN106919784A (zh) 一种基于变权重的盾构隧道服役性能评价方法
CN104731083B (zh) 一种基于自适应特征提取的工业故障诊断方法及应用
US20220091597A1 (en) Analysis system and analysis method
CN105807741A (zh) 一种工业生产流程预测方法
CN107363645A (zh) 基于功率检测的铣床加工过程刀具磨损量预测方法
CN103488561A (zh) 一种在线升级主样本模型的kNN故障检测方法
Feng et al. Endpoint temperature prediction of molten steel in RH using improved case-based reasoning
CN106200624A (zh) 基于交叉分段pca的工业锅炉故障诊断方法
Shang et al. Increment-based recursive transformed component statistical analysis for monitoring blast furnace iron-making processes: An index-switching scheme
Liu et al. Intelligent Prediction and Real-time Monitoring System for Gas Flow Distribution at the Top of Blast Furnace
CN101780488B (zh) 内螺纹冷挤压加工质量在线预测方法
CN111625934B (zh) 一种基于d-s证据理论的退火加热过程的多模态识别方法
CN117312972A (zh) 一种刮板输送机减速器健康状态识别方法
CN106327048A (zh) 一种基于能效基准模型的工业企业能效评估方法
CN108229541B (zh) 一种基于k最近邻算法的岸桥中拉杆应力数据分类方法
WO2024060287A1 (zh) 一种高炉炉温预测方法、终端设备及存储介质
CN116704729A (zh) 一种基于大数据分析的工业窑炉预警系统及方法
CN106679602A (zh) 一种确定高炉铜冷却壁渣皮厚度变化的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Zhang Yong

Inventor after: Zhao Zhe

Inventor after: Liu Piliang

Inventor after: Sun Caiying

Inventor after: Cui Guimei

Inventor before: Zhang Yong

Inventor before: Lan Xiaowen

Inventor before: Liu Piliang

Inventor before: Cui Guimei

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170517

Termination date: 20180829

CF01 Termination of patent right due to non-payment of annual fee