CN101545026A - 一种转炉炼钢吹氧量影响因素的权重确定方法 - Google Patents
一种转炉炼钢吹氧量影响因素的权重确定方法 Download PDFInfo
- Publication number
- CN101545026A CN101545026A CN200910011482A CN200910011482A CN101545026A CN 101545026 A CN101545026 A CN 101545026A CN 200910011482 A CN200910011482 A CN 200910011482A CN 200910011482 A CN200910011482 A CN 200910011482A CN 101545026 A CN101545026 A CN 101545026A
- Authority
- CN
- China
- Prior art keywords
- attribute
- cluster
- weight
- blasting amount
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于自动化控制技术领域,涉及一种转炉炼钢生产过程中吹氧量影响因素的权重计算方法。选取影响转炉炼钢吹氧量的因素作为条件属性,并以吹氧量作为决策属性,首先采用模糊c均值(FCM)聚类算法对转炉炼钢连续的属性数据离散化,然后对传统的贝叶斯粗糙集进行改进,在此基础上定义一个γ依赖度函数,并证明出该函数具有随着条件属性的增加而单调递增的性质,最终利用γ依赖度函数的单调特性确定影响吹氧量的各属性权重。本发明完全依赖于数据,避免主观因素的引入,确定合理的吹氧量影响因素的权重,可以更精确地计算吹氧量,对于生产出合格的钢水至关重要。
Description
技术领域
本发明属于自动化控制技术领域,涉及转炉炼钢生产静态模型的建立,特别涉及一种转炉炼钢生产过程中吹氧量影响因素的权重计算方法。
背景技术
转炉炼钢生产是将铁水降碳、升温、降低磷硫等杂质元素含量,获得合格钢水的工业过程。通过顶吹氧气将铁水中的杂质元素氧化,加入造渣材料将杂质从钢水中脱除。供氧制度是转炉炼钢生产中重要的工艺制度之一,供氧的好坏直接影响着终点钢水的质量。转炉中的反应复杂,影响吹氧量的因素很多,并且各因素的影响程度又不相同,给吹氧量的确定带来了很大困难。建立合理的吹氧量计算模型首先需要确定吹氧量各影响因素的权重,然而在实际中,属性权重往往通过专家经验确定,引入了过多的主观因素,影响了模型的精度。因此确定合理的吹氧量影响因素的权重,可以更精确地计算吹氧量,对于生产出合格的钢水至关重要。
转炉炼钢吹氧量影响因素的权重计算是一种确定属性权重的方法。目前,确定属性权重方法主要有:
基于粗糙集理论确定属性的权重(刘盾,胡培,蒋朝哲.一种基于粗集理论的属性权重构造方法[J].系统工程与电子技术,2008,30(8):1481-1484);
将模糊理论和粗糙集理论相结合确定属性的权重(柳炳祥,李海林.基于模糊粗糙集的因素权重分配方法[J].控制与决策,2007,22(12):1437-1440)。
上述两种方法都是基于传统的粗糙集理论确定属性权重,仅利用数据本身提供的信息,无需任何先验的专家知识,避免了主观因素的引入。但传统的粗糙集理论在处理集合间关系时过于严格,容易将有用的信息也剔出掉,不利于决策分析。
发明内容
本发明要解决的技术问题是提供一种转炉炼钢吹氧量影响因素的权重确定方法。
本发明的技术方案为:首先采用模糊c均值(FCM)聚类算法对转炉炼钢连续的属性数据离散化,然后对传统的贝叶斯粗糙集进行改进,在此基础上定义一个γ依赖度函数,并证明出该函数具有随着条件属性的增加而单调递增的性质,最终利用这个性质确定影响吹氧量的属性权重。
具体步骤如下:
步骤1:选取影响转炉炼钢吹氧量的因素作为条件属性,如铁水碳含量、铁水硅含量、钢种等,以吹氧量作为决策属性,采用模糊c均值(Fuzzy C-Means,FCM)聚类算法对连续的属性数据离散化。
FCM聚类算法是基于目标函数的聚类算法,目标函数如下式:
其中,c为分类个数,m为加权指数,n为样本个数,uik为第k个样本对于第i类的隶属度,dik为第k个样本与第i类的典型样本之间的失真度,通常用两个矢量间的距离来衡量。最后使目标函数达到最小值,作为最终的分类结果。
(1)初步选择聚类个数的范围,在每个聚类数的情况下,分别采用模糊c均值聚类算法对连续属性数据聚类;FCM算法步骤具体如下:
A:确定聚类类别数c,2≤c<n,n是数据个数,设定迭代停止阈值ε,初始化聚类原型模式P(0),设置迭代计数器b=0。
B:计算出新的隶属度矩阵U(b+1),矩阵中各元素可以通过下式求出,
如果存在i,k,使得 则 且对l≠k, 并且可以证明各元素对应于各分类的隶属度之和为1。
C:更新聚类原型模式P(b+1),矩阵中各分类的新聚类中心可通过下式计算出来
式中xk为第k条样本数据。
D:如果‖P(b)-P(b+1)‖<ε,则算法停止,否则令b=b+1,转向步骤二继续执行。
(2)将取各聚类数时的聚类结果代入到由Xie和Beni在1991年提出的有效性评价函数中,以使该函数值最小的聚类数作为最佳的聚类数。有效性评价函数具体形式如下;
其中c为聚类个数,N为数据个数,xj为第j条数据,vi为第i个聚类中心,uij为第j条数据对应第i类的隶属度。最后将各条数据划分到其隶属度最大的那个聚类中。
步骤2:计算吹氧量D对影响吹氧量的条件属性集C的依赖度γ(D|C),以及缺失某一条件属性ci的依赖度γ(D|C-{ci});
步骤3:计算各条件属性ci的重要度SIG(ci),具体可以通过下式进行计算;
SIG(ci)=γ(D|C)-γ(D|C-{ci})
步骤4:对各属性重要度进行归一化处理,得到各条件属性的权重w(ci),如下式;
其中步骤2—步骤4是通过改进传统贝叶斯粗糙集模型,提出γ依赖度函数,并证明该函数具有随着条件属性的增加而单调递增的性质。
粗糙集理论(rough set theory,RST)是由波兰学者Pawlak在1982年提出的,仅利用数据本身提供的信息,无需任何先验的专家知识,因此已被广泛应用到实际的决策中。经典的Pawlak粗糙集理论在处理分类关系时过于严格,容易将有用的信息也剔出掉,不利于决策分析。Ziarko等人将概率理论和粗糙集理论相结合提出了变精度粗糙集和贝叶斯粗糙集,在判断集合间隶属关系时,引入了一个不确定度,能够更好的描述集合间的依赖关系,弥补了经典粗糙集的不足,如附图所示。但Ziarko等人提出的理论是只能处理决策属性是二分类的情况,而对决策属性是多分类的情况无能为力,限制了应用范围。
本发明对传统的贝叶斯粗糙集进行改进,将应用范围由二决策类扩展到多决策类,提出了一个衡量属性间依赖程度的γ函数,并证明γ依赖度函数具有随着属性的增加单调递增的性质,进而利用这个性质计算属性权重。设U为有限论域,R是U上的一个等价关系。U按等价关系R进行不可分辨划分U/IND(R),得到R的基本集E=U/IND(R)={E1,E2,...,En},其中Ei是按IND(R)划分得到的等价类,对任意i≠j满足EiI Ej=φ,并且 P为定义在U的子集类构成的σ代数上的概率测度,对U的任意非空子集 都满足0<P(X)<1。设X和Y是U上非空子集,P(X|Y)表示Y发生的条件下X发生的概率,可以反映Y对X的影响程度。
传统的贝叶斯粗糙集模型对于目标集 的正域POS*(X)、负域NEG*(X)和边界域BNR*(X)的定义为:
POS*(X)=U{Ei∈E:P(X|Ei)>P(X)} (5)
NEG*(X)=U{Ei∈E:P(X|Ei)<P(X)} (6)
BNR*(X)=U{Ei∈E:P(X|Ei)=P(X)} (7)
传统的贝叶斯粗糙集可以处理二决策的情况,但不能处理多决策类的情况。设S=(U,R)为一个决策表,其中U为非空的有限论域,是所有样本的集合,R=CUD,且CI D=φ,是非空的等价关系有限集,这里指所有属性的集合,C={c1,c2,...,cs}为条件属性集,D={d}为决策属性。在决策属性是二分类 即有两个目标集的情况下,根据Ziarko提出的传统贝叶斯粗糙集,当Ei∈POS*(X)时, 则 因此任何Ei都不会同时划分到POS*(X)和中。而在决策属性是多分类U/IND(D)={Xj|j=1,2...,m},即有多个目标集的情况下,其中m为按决策属性划分的类别数,Xj为第j个决策类,如果还是按传统贝叶斯粗糙集划分各区域,可能会产生同一个Ei划分到不同决策类的正域中的情况,也就是说在同一个条件下,却产生了多个决策,这与经典Pawlak粗糙集理论相违背。
为了弥补以上的不足,本发明对原始贝叶斯粗糙集进行改进。引入一个评价函数
用该函数来衡量Y对X的影响程度。各决策类Xj的正域POSM(Xj)、负域NEGM(Xj)和边界域BNRM(Xj)定义为:
POSM(Xj)=U{Ei∈E:g(Xj|Ei)=max(g(X1|Ei),...,g(Xm|Ei))>0} (9)
NEGM(Xj)=U{Ei∈E:g(Xj|Ei)=min(g(X1|Ei),..,g(Xm|Ei))<0} (10)
BNRM(Xj)=U{Ei∈E:min(g(X1|Ei),...,g(Xm|Ei))≤g(Xj|Ei) (11)
≤max(g(X1|Ei),...,g(Xm|Ei))}
并定义一个决策D的全局边界域GBNRM(D)为
GBNRM(D)=U{Ei∈E:g(X1|Ei)=g(X2|Ei)=…=g(Xm|Ei)=0} (12)
全局边界域是一种特殊的区域,对于某些决策表可能不存在。
根据改进后的贝叶斯粗糙集的定义,可以得到以下的命题。
命题1:max(g(X1|Ei),...,g(Xm|Ei))≥0,min(g(X1|Ei),...,g(Xm|Ei))≤0,当且仅当Ei∈GBNRM(D)时等号成立,即max(g(X1|Ei),...,g(Xm|Ei))=min(g(X1|Ei),...,g(Xm|Ei))=0。
证明:因为 所以必然存在u,v使得P(Xu|Ei)-P(Xu)≥0,P(Xv|Ei)-P(Xv)≤0。g(Xj|Ei)是在P(Xj|Ei)-P(Xj)的基础上除以一个大于零的分母,不影响最终的符号,因此max(g(X1|Ei),...,g(Xm|Ei))≥0且min(g(X1|Ei),...,g(Xm|Ei))≤0。当Ei∈GBNRM(D)时,对于任意Xj都满足g(Xj|Ei)=0,得到max(g(X1|Ei),...,g(Xm|Ei))=min(g(X1|Ei),...,g(Xm|Ei))=0。
命题2: ,则Ei同时属于每个决策类Xj的边界域BNRM(Xj)。
命题3: ,都划分到某个决策类的正域中,并且同一个Ei不会划分到多个决策类的正域中; 不会划分到任何一个决策类的正域中。
证明:根据命题1可得,对 都存在u使得g(Xu|Ei)=max(g(X1|Ei),...,g(Xm|Ei))>0,并将Ei划分到POSM(Xu)中,由(9)式的定义可知,Ei不会划分到其它决策类的正域中。这个性质也非常符合实际要求,对于一种情况,最终只能对应一种决策。当Ei∈GBNRM(D)时,max(g(X1|Ei),...,g(Xm|Ei))=0,而正域的定义要求其大于0,所以这时Ei不会划分到任何一个决策类的正域中。
为了衡量条件属性集C对决策属性D的影响程度,将C对每个决策类Xj的影响程度求和,定义为D对C依赖度γ(D|C),如(13)式所示
命题4:γ(D|C)可以改写为如下形式:
证明:由贝叶斯定理可得
对于 满足max(g(X1|Ei),...,g(Xm|Ei))=0,则
再根据(9)式定义可得
由命题3可知,对于 不是唯一的划分到某个决策类的正域中,就是划分到GBNRM(D)中,由此可得
命题5:对于 满足如下关系:
γ(D|B)≤γ(D|C) (15)
等号成立的条件是任意决策类Xj满足
证明:设U/IND(B)={F1,F2,..,Fk},并且可以看出每个F1都是由一些Ei组成,即 要证明命题5,只要证明下面不等式成立,
设
因此γ(D|B)≤γ(D|C)成立。也就是说,γ依赖度函数随着条件属性的增加是单调递增的。当 P(Ei|Xr)=max(P(Ei|X1),...,P(Ei|Xm))都成立,这时γ(D|B)=γ(D|C)。可以看出它是在条件属性C的各决策类正域划分的基础上,可能将一些Ei∈GBNRM(D)也划分到某些决策类的正域中。即对于任意决策类Xj满足下式
利用命题5可以进行属性约简,确定属性权重等,下面具体介绍一下属性权重的确定过程。
本发明的有益效果是本发明完全依赖于数据,避免主观因素的引入,确定合理的吹氧量影响因素的权重,可以更精确地计算吹氧量,对于生产出合格的钢水至关重要。
附图说明
附图是贝叶斯粗糙集与经典Pawlak粗糙集的正域对比图。
具体实施方式
以下结合技术方案和附图详细叙述本发明的实施例。
表1为某钢厂150吨转炉实际生产数据,吹氧量是被控制的量,是连续属性,铁水碳含量、铁水硅含量和目标钢种是影响吹氧量的三个因素,其中铁水碳含量和铁水硅含量是连续属性,目标钢种是离散属性。设条件属性集C={c1,c2,c3}分别代表铁水碳含量、铁水硅含量和钢种,决策属性D为吹氧量。
表1 转炉生产数据
采用模糊c均值聚类算法分别对连续条件属性c1、c2和决策属性D进行离散化,分类数选取范围为2~4类,根据(4)式的有效性评价函数确定的最佳分类数分别为3,3,4。对于离散属性c3标记Q235B为1,标记DC01为2。离散化后的结果如表2所示。
表2 离散化后的决策表
按决策属性D进行划分,可得
U/IND(D)={{1,3,10,12,18,20},{2,11,13,14,16},{4,8,17,19},{5,6,7,9,15}}。
按所有条件属性C进行划分,可得
U/IND(C)={{1,20},{2},{3,9},{4,6,13,15,17},{5,7},{8},{10},{11,19},{12.18},{14},{16}}
删除条件属性c1后进行划分,可得
U/IND(C-{c1})={{1,20},{2,16},{3,4,6,9,13,14,15,17},{5,7,11,12,18,19},{8},{10}}
删除条件属性c2后进行划分,可得
U/IND(C-{c2})={{1,4,6,10,13,15,17,20},{2,11,19},{3,9},{5,7,8,16},{12,18},{14}}
删除条件属性c3后进行划分,可得
U/IND(C-{c3})={{1,8,20},{2,14},{3,9},{4,6,13,15,16,17},{5,7,10},{11,19},{12,18}}
根据(13)式计算决策属性D对各条件属性集的依赖度为
γ(D|C)=2.033
γ(D|(C-{c1}))=1.150
γ(D|(C-{c2}))=1.033
γ(D|(C-{c3}))=1.417
进而求得各条件属性的重要度为
SIG(c1)=0.883 SIG(c2)=1.000 SIG(c2)=0.616
归一化得到各条件属性的权重为w1=0.353,w2=0.400,w3=0.247。结果表明铁水硅含量对吹氧量的影响最大,铁水碳含量次之,钢种影响最小。
Claims (2)
1.一种转炉炼钢吹氧量影响因素的权重确定方法,其特征在于包括如下步骤:
步骤1:选择吹氧量的影响因素,对连属性数据离散化:选取影响转炉炼钢吹氧量的因素作为条件属性,以吹氧量作为决策属性;
(1)初步选择聚类个数的范围,在每个聚类数的情况下,分别采用模糊c均值聚类算法对连续属性数据聚类;
(2)将取各聚类数时的聚类结果代入到由Xie和Beni在1991年提出的有效性评价函数中,以使该函数值最小的聚类数作为最佳的聚类数;有效性评价函数具体形式如下;
其中c为聚类个数,N为数据个数,xj为第j条数据,vi为第i个聚类中心,uij为第j条数据对应第i类的隶属度;最后将各条数据划分到其隶属度最大的那个聚类中;
步骤2:计算吹氧量D对影响吹氧量的条件属性集C的依赖度γ(D|C),以及缺失某一条件属性ci的依赖度γ(D|C-{ci});
步骤3:计算各条件属性ci的重要度SIG(ci),具体可以通过下式进行计算;
SIG(ci)=γ(D|C)-γ(D|C-{ci})
步骤4:对各属性重要度进行归一化处理,得到各条件属性的权重w(ci),如下式;
2.根据权利要求1所述的一种转炉炼钢吹氧量影响因素的权重确定方法,其特征在于:选取铁水碳含量、铁水硅含量、钢种作为条件属性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910011482A CN101545026A (zh) | 2009-05-08 | 2009-05-08 | 一种转炉炼钢吹氧量影响因素的权重确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910011482A CN101545026A (zh) | 2009-05-08 | 2009-05-08 | 一种转炉炼钢吹氧量影响因素的权重确定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101545026A true CN101545026A (zh) | 2009-09-30 |
Family
ID=41192402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910011482A Pending CN101545026A (zh) | 2009-05-08 | 2009-05-08 | 一种转炉炼钢吹氧量影响因素的权重确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101545026A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104846150A (zh) * | 2014-02-19 | 2015-08-19 | 宝山钢铁股份有限公司 | 低铝模铸钢冶炼方法 |
CN105488319A (zh) * | 2014-09-19 | 2016-04-13 | 鞍钢股份有限公司 | 一种适于交叉轧制的模型学习方法 |
CN107239660A (zh) * | 2017-06-02 | 2017-10-10 | 北京航空航天大学 | 基于混合整数线性规划的粗糙集模型建立方法和装置 |
CN109447127A (zh) * | 2018-09-29 | 2019-03-08 | 深圳市元征科技股份有限公司 | 数据处理方法及装置 |
CN109726893A (zh) * | 2018-11-27 | 2019-05-07 | 广东石油化工学院 | 一种旋转机械故障数据集属性权重的确定及评价方法 |
-
2009
- 2009-05-08 CN CN200910011482A patent/CN101545026A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104846150A (zh) * | 2014-02-19 | 2015-08-19 | 宝山钢铁股份有限公司 | 低铝模铸钢冶炼方法 |
CN104846150B (zh) * | 2014-02-19 | 2017-03-29 | 宝山钢铁股份有限公司 | 低铝模铸钢冶炼方法 |
CN105488319A (zh) * | 2014-09-19 | 2016-04-13 | 鞍钢股份有限公司 | 一种适于交叉轧制的模型学习方法 |
CN107239660A (zh) * | 2017-06-02 | 2017-10-10 | 北京航空航天大学 | 基于混合整数线性规划的粗糙集模型建立方法和装置 |
CN109447127A (zh) * | 2018-09-29 | 2019-03-08 | 深圳市元征科技股份有限公司 | 数据处理方法及装置 |
CN109726893A (zh) * | 2018-11-27 | 2019-05-07 | 广东石油化工学院 | 一种旋转机械故障数据集属性权重的确定及评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101545026A (zh) | 一种转炉炼钢吹氧量影响因素的权重确定方法 | |
CN114611844B (zh) | 一种转炉出钢过程合金加入量的确定方法和系统 | |
CN110245850B (zh) | 一种考虑时序的烧结过程工况识别方法及系统 | |
CN106022377A (zh) | 一种铁矿烧结料层透气性状态的在线预测方法 | |
CN110598958B (zh) | 一种钢包分级管理分析方法及系统 | |
CN108460213A (zh) | 基于多聚类原型的t-s模型对炉腹煤气量的预测方法及程序 | |
Wu et al. | Neural-network-based integrated model for predicting burn-through point in lead–zinc sintering process | |
CN106777652B (zh) | 一种预测高炉透气性的方法 | |
CN112036081B (zh) | 基于收得率预测的转炉出钢硅锰合金加入量确定方法 | |
CN112541427B (zh) | 一种优质重型废钢的识别和料量评估方法 | |
CN107818408A (zh) | 一种基于标记的硅钢动态质量设计方法 | |
CN108647182A (zh) | 一种证据理论中基于可分配确定度的概率转换方法 | |
CN107341512A (zh) | 一种迁移学习分类的方法及装置 | |
Ai et al. | Shape-weighted bubble size distribution based reagent predictive control for the antimony flotation process | |
CN111047103A (zh) | 基于多工况模式辨识的烧结过程碳效在线预测方法及设备 | |
CN107808221A (zh) | 基于案例匹配的高炉布料参数决策方法 | |
Tian et al. | Deriving hazardous material flow networks: A case study of lead in China | |
Yue et al. | Evaluation strategy and mass balance for making decision about the amount of aluminum fluoride addition based on superheat degree. | |
CN110310286B (zh) | 基于泡沫图像多特征的分层工况感知判别方法 | |
CN115456264B (zh) | 一种中小型转炉的终点碳含量和终点温度预测方法 | |
CN114875196B (zh) | 一种转炉出钢量的确定方法和系统 | |
Dong et al. | Just-in-time learning-based soft sensor for mechanical properties of strip steel via multi-block weighted semisupervised models | |
CN114780619A (zh) | 一种自动工程审价审计数据的异常预警方法 | |
CN113962150A (zh) | 一种烧结混合料粒度预测方法及系统 | |
CN117807760A (zh) | 一种转炉终点碳含量建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090930 |