CN104636589A - 一种基于grw-mmmd加权聚类分析的过失误差侦破方法 - Google Patents

一种基于grw-mmmd加权聚类分析的过失误差侦破方法 Download PDF

Info

Publication number
CN104636589A
CN104636589A CN201410638874.XA CN201410638874A CN104636589A CN 104636589 A CN104636589 A CN 104636589A CN 201410638874 A CN201410638874 A CN 201410638874A CN 104636589 A CN104636589 A CN 104636589A
Authority
CN
China
Prior art keywords
mmmd
data
error detection
grw
gross error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410638874.XA
Other languages
English (en)
Inventor
包晶晶
肖冬
高旭阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201410638874.XA priority Critical patent/CN104636589A/zh
Publication of CN104636589A publication Critical patent/CN104636589A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

现场采集的数据由于各种原因不可避免地存在着过失误差,需要对建模数据进行过失误差侦破以保障软测量模型的测量精度。因此,在基于聚类分析的软测量过失误差侦测中,针对不同变量对建模影响程度的不同,提出了基于GRW-MMMD(Grey Relational Weighted-Modified Median Minimum Distance)的过失误差侦破方法,对来自LF精炼炉冶炼过程的相关参数的数据集进行处理。实验和仿真表明,GRW-MMMD方法可以有效的找出数据集中的过失误差,且其实时性好、准确度高、经济可靠。

Description

一种基于GRW-MMMD加权聚类分析的过失误差侦破方法
技术领域
本发明设计了一种基于GRW-MMMD(Grey Relational Weighted-Modified Median Minimum Distance)过失误差侦破方法,实时性好、准确度高、经济可靠。
背景技术
近年来,软测量技术在复杂工业过程中已经得到了广泛的应用。这种技术主要用于解决工业过程中普遍存在的一类难以测量的过程变量的检测问题。软测量技术的核心是建立工业对象的精确可靠的模型。初始软测量模型是通过对过程变量的历史数据进行辨识而得到的。因此无论采用何种方法建立软测量模型,都需要一定数量的建模数据,并且软测量模型的性能在很大程度上要依赖于所获得的建模数据的准确性和有效性.
然而,由于各种原因在现场采集的数据中不可避免的存在误差。在这些误差中,包括随机误差和过失误差。过失误差主要是指在实际过程中,经常由于测量仪表失灵、测量仪表数据传输错误以及操作不稳定等原因造成的测量数据严重失真的情况,使测量数据的测量值和真实值之间存在着显著的差异.
过失误差会对建模带来严重的干扰,在建立软测量建模之前,需要将过失误差数据从模型数据中侦测并且分离出来,这对成功建立精确地软测量模型不可或缺。因此,为了保障模型的精度,通过某种方法,将真实信号从受误差影响的混合信号中分离出来,这个过程被称为过失误差侦破。
发明内容
本发明的内容,是提供一种有效的过失误差侦破方法,运用灰关联分析法判断各变量对工业过程的影响程度,为计算公式加权,从而能够成功剔除主要变量的过失误差,提高数据精确度,为软测量建模打下坚实基础.
针对不同变量对建模影响程度的不同,本发明提出了基于GRW-MMMD加权聚类分析的过失误差侦破方法。已有的MMMD过失误差侦破方法,能有效剔除多变量的过失误差,但该方法中所有变量均取等权重,不能确切找出对建模影响最大的过失数据。因此,本发明在MMMD方法的基础上,运用灰关联分析法为各变量数据加权,定量的度量工业过程中各变量之间的关联程度,从而准确剔除主导变量中的过失误差。实验表明,基于GRW-MMMD方法的过失误差侦破方法相比于原有的等权重的MMMD方法,具有更高的识别精度,能够为下一步的软测量建模提供更加精确可靠的数据信息.
GRW-MMMD过失误差侦破方法:
    基于平均最小距离的聚类算法是一种行之有效的过失误差侦破方法。该方法根据相似性的度量方法,把原始数据聚类成不同的数据类,这样就能方便地把异类点和主体数据分开,从而实现过失误差侦破。MMMD方法将数据集中地数据均考虑进来,使用数据集中的数据与其临近点的距离的中位值作为准则.
    灰色关联度分析法是将研究对象及影响因素的因子值视为一条线上的点,与待识别对象及影响因素的因子值所绘制的曲线进行比较,比较它们之间的贴近度,并分别量化,计算出研究对象与待识别对象各影响因素之间的贴近程度的关联度,通过比较各关联度的大小来判断待识别对象对研究对象的影响程度。GRW-MMMD方法将灰关联分析法得到的各变量关联度作为权重,融入到欧氏距离的计算方法中,更进一步的将主要变量的过失误差快速而有效地剔除掉.
(1)GRW-MMMD方法具体步骤:
①输入样本数据集[x1,x2,...xN]以及灰关联中用到的t=n时刻的输入系列{Xi(n)}和输出序列{Xo(n)};
②确定反应系统行为特征的输出序列和影响系统行为的输入序列并进行标准化处理.
③计算关联系数:对于t=n时刻的输入系列{Xi(n)}和输出序列{Xo(n)}的关联系数为 
其中:λ为分辨系数,0<λ<1;
      n指采取输入输出序列的时刻为t=n时刻
      △min、△max分别表示所有比较序列各个时刻绝对差中的最大值和最小值;
      △io(n)为各输入数列{Xi(n)}曲线上的每一个点与输出数列{Xo(n)}
      曲线上的每一个点的绝对差值.
④求关联度γio,输入变量和输出变量的关联程度数量表示如下:
其中,ξio(n)即为上一步计算的t=n时刻各变量的关联系数
      L表示计算过程中选取的时刻总数
⑤关联度排序,按照计算出的关联度从大到小进行排序.
⑥将所计算的关联度代入作为公式权重,计算数据点到数据中心的“新
欧氏距离”[d1,d2,...,dN];
其中:wk——各变量的关联度
  xi1、xj1——第一组数据中任意两个数据间的距离
  xiN、xjN——第N组数据中任意两个数据间的距离
⑦按新欧几里得距离从小到大排列这些数据点,得到新的向量[ds1,ds2,...,dsN];
⑧根据上个步骤所得到的新欧几里得距离的排列结果,得到距离的中位值dwmmmd;
⑨定义dwmmmd作为分界点,根据数据点到数据中心的距离,将数据集分为两类:
当di>dwmmmd,X为过失误差类;
当di<dwmmmd,X为正确数据类;
⑩结束过失误差侦破.
GRW-MMMD方法流程图如图1所示.
(2)本发明的特点:
①首先运用灰关联分析法准确计算出各变量之间贴近度的关联度,通过比较各关联度的大小来判断变量对工业过程的影响程度.
②作为聚类分析,MMMD算法可以直接面对数据,不必考虑复杂的建模过程,这样作为数据的预处理步骤,可以减少造成数据错误处理的概率.
③将灰关联分析计算所得的各变量关联度作为权重,融入MMMD方法的欧几里得距离计算公式中,得到的“新欧几里得”距离计算公式作为本发明WMMMD方法的改进之处。运用GRW-MMMD方法进行侦破,可以高校剔除主导变量中的过失误差,精确度高,实时性好,经济可靠。
3、GRW-MMMD方法在LF精炼炉冶炼中的应用
    LF是以电弧加热为主要技术特征的炉外精炼方法,包括电极加热系统、合金与渣料加料系统、底透气砖吹氩搅拌系统、喂线系统、炉盖冷却水系统、除尘系统、测温取样系统、钢包及钢包车控制系统等.
本发明以上海宝钢300t LF精炼炉钢水终点温度软测量模型为例,对软测量模型输入数据中的初始温度、合金及渣料吸放热、加热总耗电量和冶炼时间(包含了钢包等待时间)进行侦破,取宝钢300t LF精炼炉2006年6-9月200炉生产数据用于软测量建模.
    图2为仅用MMMD算法侦破的聚类结果图,效果不是很精确;图4为GRW-MMMD算法侦破的聚类结果图,效果还是很理想的。此处用pls建模来具体分析两种方法的效果:图3为基于MMMD法数据修正的强弱学习机的预报效果图,图5为GRW-MMMD方法侦破后的强弱学习机的预报效果图。从这两图中可以清晰看出两种方法对建模数据精确计算的差异。为直观反映这一差异,将各方法之后建模的预报精度列表(表1)如下:
表1  建模预报精度
侦破方法 预报精度
原始数据 13.26%
MMMD 16.79%
GRW-MMMD 22.34%
附图说明
图1是GRW-MMMD算法流程图
图2是MMMD算法侦破聚类图
图3是MMMD法侦破后的强弱学习机的预报效果图
图4是GRW-MMMD算法侦破聚类图
图5是GRW-MMMD法侦破后的强弱学习机的预报效果图。

Claims (2)

1.针对不同变量对建模影响程度的不同,本发明提出了基于GRW-MMMD(Grey Relational Weighted-Modified Median Minimum Distance)的过失误差侦破方法.
已有的MMMD过失误差侦破方法,能有效剔除多变量的过失误差,但该方法中所有变量均取等权重,不能确切找出对建模影响最大的过失数据.
因此,本发明在MMMD方法的基础上,运用灰关联分析法为各变量数据加权,定量的度量工业过程中各变量之间的关联程度,从而准确剔除主导变量中的过失误差.
实验表明,基于GRW-MMMD的过失误差侦破方法相比于原有的等权重MMMD方法,具有更高的识别精度,能够为下一步的软测量建模提供更加精确可靠的数据信息。
2.基于GRW-MMMD的过失误差侦破方法:
假设软测量建模的原始数据矩阵为X(n×m),n代表测量采样次数,m代表测量变量个数.
(1)求取权重w
①确定反应系统行为特征的输出序列和影响系统行为的输入序列并进行标准化处理.
②计算关联系数:对于t=n时刻的输入系列{Xi(n)}和输出序列{Xo(n)}的关联系数为                                                
其中:λ为分辨系数,0<λ<1;△min、△max分别表示所有比较序列各个时刻绝对差中的最大值和最小值;△io(n)为各输入数列{Xi(n)}曲线上的每一个点与输出数列{Xo(n)}曲线上的每一个点的绝对差值.
③求关联度γio,输入变量和输出变量的关联程度数量表示如下:
④关联度排序,按照计算出的关联度从大到小进行排序.
在MMMD方法中,采用新的相似性度量公式,将欧式距离改为如下:
其中:xi1、xj1为第一组数据中任意两个数据间的距离,xiN、xjN为第N组数据中任意两个数据间的距离。
CN201410638874.XA 2014-11-13 2014-11-13 一种基于grw-mmmd加权聚类分析的过失误差侦破方法 Pending CN104636589A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410638874.XA CN104636589A (zh) 2014-11-13 2014-11-13 一种基于grw-mmmd加权聚类分析的过失误差侦破方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410638874.XA CN104636589A (zh) 2014-11-13 2014-11-13 一种基于grw-mmmd加权聚类分析的过失误差侦破方法

Publications (1)

Publication Number Publication Date
CN104636589A true CN104636589A (zh) 2015-05-20

Family

ID=53215330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410638874.XA Pending CN104636589A (zh) 2014-11-13 2014-11-13 一种基于grw-mmmd加权聚类分析的过失误差侦破方法

Country Status (1)

Country Link
CN (1) CN104636589A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103033214A (zh) * 2012-12-18 2013-04-10 重庆科技学院 借助Pearson相关系数实现生产过程主导变量精简化软测量方法
CN103728879A (zh) * 2014-01-20 2014-04-16 华北电力大学 基于最小二乘支持向量机及在线更新的电站锅炉烟气软测量方法
CN103823430A (zh) * 2013-12-09 2014-05-28 浙江大学 智能加权丙烯聚合生产过程最优软测量系统和方法
CN104050277A (zh) * 2014-06-27 2014-09-17 东北大学 一种基于聚类分析的3mad-mmmd过失误差侦破方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103033214A (zh) * 2012-12-18 2013-04-10 重庆科技学院 借助Pearson相关系数实现生产过程主导变量精简化软测量方法
CN103823430A (zh) * 2013-12-09 2014-05-28 浙江大学 智能加权丙烯聚合生产过程最优软测量系统和方法
CN103728879A (zh) * 2014-01-20 2014-04-16 华北电力大学 基于最小二乘支持向量机及在线更新的电站锅炉烟气软测量方法
CN104050277A (zh) * 2014-06-27 2014-09-17 东北大学 一种基于聚类分析的3mad-mmmd过失误差侦破方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ASHISH AGGARWAL等: "asymptotically optimal scalable coding for minimum weighted mean square error", 《DATA COMPRESSION CONFERENCE,2001.PROCEEDINGS.DCC2001》 *
DONALD J.BROWN等: "weighted minimum mean-square distance from independence estimation", 《JOURNAL OF THE ECOMOMETRIC SOCIETY》 *
P.LI等: "grey relational analysis of amine inhibition of mild steel corrosion in acids", 《CORROSION SCIENCE》 *
宋坤等: "基于加权MMMD的软测量数据过失误差侦测", 《计算机工程与设计》 *

Similar Documents

Publication Publication Date Title
CN112036081B (zh) 基于收得率预测的转炉出钢硅锰合金加入量确定方法
CN109359723A (zh) 基于改进正则化极限学习机的转炉终点锰含量预测方法
CN106249724A (zh) 一种高炉多元铁水质量预测控制方法及系统
CN106779384B (zh) 一种基于信息粒度最优分配的钢铁工业高炉煤气长期区间预测方法
CN109935280B (zh) 一种基于集成学习的高炉铁水质量预测系统及方法
CN110739031B (zh) 一种冶金烧结过程的有监督预测方法、装置及存储介质
CN109001979A (zh) 基于懒惰学习的高炉铁水质量自适应鲁棒预测控制方法
CN114897227B (zh) 基于改进随机森林算法的多钢种力学性能预报方法
CN112170501B (zh) 一种轧辊磨损凸度和热凸度的预测方法
CN104267610A (zh) 高精度的高炉冶炼过程异常数据检测及修补方法
Feng et al. Endpoint temperature prediction of molten steel in RH using improved case-based reasoning
CN107299170A (zh) 一种高炉铁水质量鲁棒软测量方法
CN111310348A (zh) 一种基于pso-lssvm的材料本构模型预测方法
CN109226282B (zh) 一种基于物联网的钢板在线固溶的轧后快速冷却方法
CN113177364A (zh) 一种高炉风口回旋区温度软测量建模方法
CN111047103B (zh) 基于多工况模式辨识的烧结过程碳效在线预测方法及设备
CN106203535A (zh) 一种高炉炼铁过程中高炉操作炉型的分类方法
CN102620980B (zh) 一种利用神经网络预报板材成形性能的方法
CN102968644A (zh) 一种氩氧精炼铁合金冶炼终点预测方法
CN111798023B (zh) 一种炼钢烧结生产中综合焦比预测的方法
CN101221437A (zh) 网络信息交换模式下的工业生产全过程优化控制方法
CN116127345B (zh) 基于深度聚类生成对抗网络的转炉炼钢工艺模式设计方法
CN104636589A (zh) 一种基于grw-mmmd加权聚类分析的过失误差侦破方法
Dong et al. Just-in-time learning-based soft sensor for mechanical properties of strip steel via multi-block weighted semisupervised models
CN100371938C (zh) 一种极少新钢种数据样本下的质量设计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150520