CN102279839A - 粗糙集扩展模型中近似集动态更新方法 - Google Patents

粗糙集扩展模型中近似集动态更新方法 Download PDF

Info

Publication number
CN102279839A
CN102279839A CN2011102618842A CN201110261884A CN102279839A CN 102279839 A CN102279839 A CN 102279839A CN 2011102618842 A CN2011102618842 A CN 2011102618842A CN 201110261884 A CN201110261884 A CN 201110261884A CN 102279839 A CN102279839 A CN 102279839A
Authority
CN
China
Prior art keywords
overbar
attribute
covering
approximate
cup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102618842A
Other languages
English (en)
Inventor
崔刚
刘永文
付忠传
王秀峰
暴建民
朱东杰
莫毓昌
郝亮
张必英
张策
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN2011102618842A priority Critical patent/CN102279839A/zh
Publication of CN102279839A publication Critical patent/CN102279839A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

粗糙集扩展模型中近似集动态更新方法,它涉及一种近似集动态更新方法。本发明方法为了进一步完善基于覆盖广义粗糙集的理论体系,使其能够更好地应用于实际的需求。本发明方法分析了对象的邻域、边界域与近似集的关系,给出了覆盖粗糙集模型中近似集的增量更新方法。本发明方法给出了当属性集增加或减少时,在覆盖广义粗糙集模型中近似集的动态变化趋势及近似集的动态增量更新方法,不仅适用于单属性增加删除时近似集的增量更新,而且也适用于多个属性变化的情况,通过实例验证了这种方法的可行性,通过实验仿真验证所提出方法的性能,且从给出的实例的实验仿真说明,基于覆盖广义粗糙集理论的动态增量更新方法不但有效,而且在效率上也有所提高。

Description

粗糙集扩展模型中近似集动态更新方法
技术领域
本发明涉及一种近似集动态更新方法。
背景技术
Pawlark提出的粗糙集理论可以处理不确定和不精确性问题,在知识发现、机器学习、决策分析等方面得到了日益广泛的应用[Pawlak Zdzistaw.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356]。为了适应实际应用的需求,许多研究者提出了各种推广的粗糙集模型。如Bonikowski等首先提出了覆盖粗糙集模型,并给出了其基本概念及相关性质[ZbigniewBoinkowski,Edward Bryniarski,Urszula Wybraniedc-Skardowska,Extensions andintentions in the rough set theory[J].Information Science,1998,107:149-167]。Zhu等给出了覆盖粗糙集中约简的概念和方法及相关概念之间的联系[Willam Zhu,Fei-yue Wang.Reduction and axiomization of covering generalized rough sets[J].Information Science,2003,152:217-230;William Zhu.Relationship among basicconcepts in covering-based rough sets[J].Information Sciences,2009,179(14):2478-2486]。陈文等讨论了覆盖粗糙集上近似的定义方法,提出了覆盖粗糙集最小上近似的概念[5]等等。另一方面,人们在基于经典粗糙集及不同的扩展粗糙集模型下的动态知识更新方面做了大量的工作,如Li等实现了多个属性同时增删时粗糙集模型中近似集的增量式更新方法[Li Tianrui,Ruan Da,Greet Wets,et al.A rough set basedcharacteristic relation approach for dynamic attribute generalization in datamining[J].Knowledge-Based Systems,2007,20(2):485-494.],并讨论了属性值变化下经典粗糙集和优势关系粗糙集模型下近似集的动态更新[Chen Hongmei,Li Tianrui,Qiao Shaojie,et al.A rough set based dynamic maintenance approach forapproximations in coarsening and refining attribute valves[J].InternationalJournal of Intelligent System.2010,25(10):1005-1026;季晓岚,李天瑞,邹维丽等.优势关系下属性值粗化细化时近似集分析[J].计算机工程.2010,36(12):33-35]。现有的基于覆盖广义粗糙集的理论体系有待进一步完善。
发明内容
本发明的目的是提供一种粗糙集扩展模型中近似集动态更新方法,以进一步完善基于覆盖广义粗糙集的理论体系,使其能够更好地应用于实际的需求。
本发明方法在已有理论体系的基础上,分析对象的邻域(对象的最小描述的交集)、边界域与近似集的关系,给出了覆盖粗糙集模型中近似集的增量更新方法。
本发明为解决上述技术问题采取的技术方案是:本发明所述的粗糙集扩展模型中近似集动态更新方法是基于以下定义来实现的:
定义1:一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;
Figure BDA0000089272700000021
是信息函数f的值域,而Vα表示值域;
Figure BDA0000089272700000022
表示信息系统的信息函数,fα为属性α的信息函数;
定义2:设U是一有限非空论域,C是U上的一个子集族,若
Figure BDA0000089272700000023
且∪C=U,则称C为论域U的一个覆盖,称元组<U,C>为覆盖近似空间;
定义3:设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
Figure BDA0000089272700000024
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
定义3:设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
Figure BDA0000089272700000025
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
定义5:设U是一有限非空论域,C是U上的一个子覆盖,对于任意的
Figure BDA0000089272700000026
X关于覆盖近似空间<U,C>的下近似C(X)和上近似分别定义为:
C &OverBar; ( X ) = { x &Element; U | &cap; md ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000029
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
neg C ( X ) = ~ C &OverBar; ( X ) ,
bn C ( X ) = C &OverBar; ( X ) - C &OverBar; ( X ) ;
即覆盖粗糙集模型是Pawlak粗糙集模型的推广;
时,称X关于近似空间<U,C>可定义的,否则称为粗糙的;
定义6:设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的
Figure BDA0000089272700000032
x∈X关于属性集B的邻域为:
NB(x)=∩{K∈C;x∈K}
定义7:设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的
Figure BDA0000089272700000033
X关于属性集B的下近似集、上近似集、下边界和上边界分别定义为:
C B &OverBar; ( X ) = { x &Element; U | N B ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000035
&Delta; &OverBar; C B ( X ) = X - C B &OverBar; ( X ) , &Delta; &OverBar; C B ( X ) = C B &OverBar; ( X ) - X
X关于属性集B的正域
Figure BDA0000089272700000038
负域
Figure BDA0000089272700000039
和边界域
Figure BDA00000892727000000310
分别定义为:
pos C B ( X ) = C B &OverBar; ( X ) , neg C B ( X ) = ~ C B &OverBar; ( X ) , bn C B ( X ) = C B &OverBar; ( X ) - C B &OverBar; ( X ) ;
所述方法的具体过程为:
步骤A、属性集变化时近似集的性质分析过程为:
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述;在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确;当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化;下面当属性集变化时对近似集性质进行分析:
设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 &ForAll; x &Element; U , P = { &alpha; 1 , &alpha; 2 , . . . , &alpha; n } &SubsetEqual; A , C P = { K &alpha; 1 1 , K &alpha; 1 2 , . . . , K &alpha; 1 m 1 , . . . K &alpha; i 1 , K &alpha; i 2 , . . . , K &alpha; i m i , . . . , K &alpha; n 1 , K &alpha; n 2 , . . . , . . . , K &alpha; n m n } 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,
Figure BDA00000892727000000317
且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少, N P ( x ) &SubsetEqual; N P - { a } ( x ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) ;
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 C P &SubsetEqual; C P &cup; { a } . &ForAll; x &Element; C P &OverBar; ( X ) , 则有 N P ( x ) &SubsetEqual; X . 由引理1知, N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) , 则有 N P &cup; { a } ( x ) &SubsetEqual; X , 即x∈C P∪{a} (X),所以有 C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) ;
&ForAll; x &Element; C P &cup; { a } &OverBar; ( X ) , 则有
Figure BDA00000892727000000413
N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) ,
Figure BDA00000892727000000415
x &Element; C P &OverBar; ( X ) ; 所以有 C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , bn C P ( X ) &SupersetEqual; bn C P &cup; { a } ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 C P &OverBar; ( X ) &SupersetEqual; C P - { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SubsetEqual; C P - { a } &OverBar; ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 bn C P ( X ) &SubsetEqual; bn C P - { a } ( X ) ;
步骤B、属性集变化时近似集增量更新方法过程:
设覆盖近似空间<U,C>,
Figure BDA00000892727000000436
通过下面的定理来实现X的上、下近似的更新设属性a∈A,
Figure BDA00000892727000000437
Figure BDA00000892727000000438
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
其中
Figure BDA00000892727000000439
设属性集a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) - &Delta; &OverBar; C P - { a } ( X )
设属性a∈A,
Figure BDA00000892727000000442
Figure BDA00000892727000000443
C P &cup; { a } &OverBar; ( X ) = C P &OverBar; ( X ) - Z
其中
设属性集
Figure BDA0000089272700000053
a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P - { a } ( X ) ;
步骤C、具体过程描述为:
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法,那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新;
步骤C1、属性增加时近似集增量更新算法:
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X;
输出:
Figure BDA0000089272700000055
Figure BDA0000089272700000056
具体步骤:
步骤1、计算由属性集
Figure BDA0000089272700000057
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、对于xi∈U,计算N(xi);
步骤3、若xi∈U,且
Figure BDA0000089272700000061
则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4、若xi∈U,且
Figure BDA0000089272700000063
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤6、增加一个新的属性a产生新的覆盖元,合并原来的覆盖构成一个新的覆盖
Figure BDA0000089272700000065
步骤7、重复步骤2、3、4,输出 算法结束;
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X;
输出:
Figure BDA0000089272700000068
Figure BDA0000089272700000069
具体步骤:
步骤1、计算由属性集
Figure BDA00000892727000000610
中单个属性形成的覆盖元,构成U的一个覆盖;
步骤2、对于xi∈U,计算N(xi);
步骤3、若xi∈X,且则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4、若xi∈U,且
Figure BDA00000892727000000613
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤5、增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
步骤6、如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) = &cup; x &Element; X N P ( x ) ,
Figure BDA00000892727000000616
Figure BDA00000892727000000617
转向第8步;
步骤7、如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) &Subset; &cup; x &Element; X N P ( x ) , 如果 N P ( x ) &cap; N { a } ( x ) &SubsetEqual; X ,
Figure BDA00000892727000000620
如果
Figure BDA00000892727000000622
步骤8、输出
Figure BDA00000892727000000623
Figure BDA00000892727000000624
算法结束;
步骤C2、属性减少时近似集动态增量更新算法:
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X;
输出:C P (X),
具体步骤为:
步骤1、计算由属性集
Figure BDA0000089272700000072
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、对于xi∈U,计算N(xi);
步骤3、计算X的上、下近似C P (X),
步骤4、删除一个属性a,构成一个新的覆盖
Figure BDA0000089272700000074
步骤5、重复步骤1、2、3,输出
Figure BDA0000089272700000076
算法结束;
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X;
输出:C P (X),
Figure BDA0000089272700000077
具体步骤:
步骤1、计算由属性集中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、
Figure BDA0000089272700000079
计算NP(x);
步骤3、计算X的上、下近似C P (X),
Figure BDA00000892727000000710
步骤4、删除一个属性a,构成一个新的覆盖
Figure BDA00000892727000000711
步骤5、计算NP-{a}(x),若 &cup; x &Element; X N P - { a } ( x ) = &cup; x &Element; X N P ( x ) , C P ^ &OverBar; ( X ) = C p ( x ) &OverBar; , C P ^ &OverBar; ( X ) = C P &OverBar; ( X ) , 转向步骤7;
步骤6、若 &cup; x &Element; X N P - { a } ( x ) &Superset; &cup; x &Element; X N P ( x ) , C P - { a } ^ &OverBar; ( X ) = { x &Element; N P - { a } ( x ) | N P - { a } ( x ) &SubsetEqual; X } ,
Figure BDA00000892727000000717
步骤7、输出
Figure BDA00000892727000000719
算法结束。
本发明的有益效果是:
本发明方法给出了当属性集增加或减少时,在覆盖广义粗糙集模型中近似集的动态变化趋势及近似集的动态增量更新方法,不仅适用于单属性增加删除时近似集的增量更新,而且也适用于多个属性变化的情况,通过实例验证了这种方法的可行性,通过实验仿真验证所提出方法的性能,且从给出的实例的实验仿真说明,基于覆盖广义粗糙集理论的动态增量更新方法不但有效,而且在效率上也有所提高。
附图说明
图1属性增加时静态更新算法与动态更新算法比较图,图2属性减少时静态更新算法与动态更新算法比较图。
具体实施方式
具体实施方式一:如图1所示,本实施方式所述的粗糙集扩展模型中近似集动态更新方法是基于以下定义来实现的:
定义1:一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;
Figure BDA0000089272700000081
是信息函数f的值域,而Vα表示值域;
Figure BDA0000089272700000082
表示信息系统的信息函数,fα为属性α的信息函数;
定义2:设U是一有限非空论域,C是U上的一个子集族,若且∪C=U,则称C为论域U的一个覆盖,称元组<U,C>为覆盖近似空间;
定义3:设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
Figure BDA0000089272700000084
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域。
结合定义3和定义4,容易得到N(x)=∩md(x);
定义3:设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
Figure BDA0000089272700000085
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
定义5:设U是一有限非空论域,C是U上的一个子覆盖,对于任意的
Figure BDA0000089272700000086
X关于覆盖近似空间<U,C>的下近似C(X)和上近似
Figure BDA0000089272700000087
分别定义为:
C &OverBar; ( X ) = { x &Element; U | &cap; md ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000091
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
neg C ( X ) = ~ C &OverBar; ( X ) ,
bn C ( X ) = C &OverBar; ( X ) - C &OverBar; ( X ) ;
即覆盖粗糙集模型是Pawlak粗糙集模型的推广;
时,称X关于近似空间<U,C>可定义的,否则称为粗糙的;
定义6:设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的
Figure BDA0000089272700000095
x∈X关于属性集B的邻域为:
NB(x)=∩{K∈C;x∈K}
定义7:设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的
Figure BDA0000089272700000096
X关于属性集B的下近似集、上近似集、下边界和上边界分别定义为:
C B &OverBar; ( X ) = { x &Element; U | N B ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000098
&Delta; &OverBar; C B ( X ) = X - C B &OverBar; ( X ) , &Delta; &OverBar; C B ( X ) = C B &OverBar; ( X ) - X
X关于属性集B的正域
Figure BDA00000892727000000911
负域
Figure BDA00000892727000000912
和边界域
Figure BDA00000892727000000913
分别定义为:
pos C B ( X ) = C B &OverBar; ( X ) , neg C B ( X ) = ~ C B &OverBar; ( X ) , bn C B ( X ) = C B &OverBar; ( X ) - C B &OverBar; ( X ) ;
所述方法的具体过程为:
步骤A、属性集变化时近似集的性质分析过程为:
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述;在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确;当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化;下面当属性集变化时对近似集性质进行分析:
设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 &ForAll; x &Element; U , P = { &alpha; 1 , &alpha; 2 , . . . , &alpha; n } &SubsetEqual; A , C P = { K &alpha; 1 1 , K &alpha; 1 2 , . . . , K &alpha; 1 m 1 , . . . K &alpha; i 1 , K &alpha; i 2 , . . . , K &alpha; i m i , . . . , K &alpha; n 1 , K &alpha; n 2 , . . . , . . . , K &alpha; n m n } 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少,
Figure BDA0000089272700000105
(引理1)
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) .
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 C P &SubsetEqual; C P &cup; { a } . &ForAll; x &Element; C P &OverBar; ( X ) , 则有 N P ( x ) &SubsetEqual; X . 由引理1知, N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) , 则有 N P &cup; { a } ( x ) &SubsetEqual; X , 即x∈C P∪{a} (X),所以有 C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) .
&ForAll; x &Element; C P &cup; { a } &OverBar; ( X ) , 则有
Figure BDA00000892727000001017
又由引理1知, N P ( x ) &SupersetEqual; N p &cup; { a } ( x ) , x &Element; C P &OverBar; ( X ) . 所以有 C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) ; (定理1)
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) ; (推论1)
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) ; (推论2)
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , bn C P ( X ) &SupersetEqual; bn C P &cup; { a } ( X ) ; (推论3)
设属性集 P &SubsetEqual; A , a∈P,则 C P &OverBar; ( X ) &SupersetEqual; C P - { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SubsetEqual; C P - { a } &OverBar; ( X ) ; (定理2)
设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) ; (推论4)
设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) ; (推论5)
设属性集 P &SubsetEqual; A , a∈P,则 bn C P ( X ) &SubsetEqual; bn C P - { a } ( X ) ; (推论6)
步骤B、属性集变化时近似集增量更新方法过程:
设覆盖近似空间<U,C>,
Figure BDA00000892727000001040
通过下面的定理来实现X的上、下近似的更新设属性a∈A,
Figure BDA00000892727000001041
Figure BDA00000892727000001042
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
其中(定理3)
设属性集
Figure BDA0000089272700000112
a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) - &Delta; &OverBar; C P - { a } ( X ) (定理4)
设属性a∈A,
Figure BDA0000089272700000114
Figure BDA0000089272700000115
C P &cup; { a } &OverBar; ( X ) = C P &OverBar; ( X ) - Z
其中
Figure BDA0000089272700000117
(定理5)
设属性集
Figure BDA0000089272700000118
a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P - { a } ( X ) ; (定理6)
步骤C、具体过程描述为:
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法(所谓静态增量更新方法是指增加新属性后按照初始求近似集的算法计算),那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新;
步骤C1、属性增加时近似集增量更新算法:
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X。
输出:
Figure BDA0000089272700000121
Figure BDA0000089272700000122
具体步骤:
步骤1、计算由属性集
Figure BDA0000089272700000123
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、对于xi∈U,计算N(xi);
步骤3、若xi∈U,且
Figure BDA0000089272700000124
则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4、若xi∈U,且
Figure BDA0000089272700000126
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤6、增加一个新的属性a产生新的覆盖元,合并原来的覆盖构成一个新的覆盖
步骤7、重复步骤2、3、4,输出
Figure BDA0000089272700000129
Figure BDA00000892727000001210
算法结束。
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X。
输出:
Figure BDA00000892727000001211
Figure BDA00000892727000001212
具体步骤:
步骤1、计算由属性集
Figure BDA00000892727000001213
中单个属性形成的覆盖元,构成U的一个覆盖;
步骤2、对于xi∈U,计算N(xi);
步骤3、若xi∈X,且
Figure BDA00000892727000001214
则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4、若xi∈U,且
Figure BDA00000892727000001216
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤5、增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
步骤6、如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) = &cup; x &Element; X N P ( x ) ,
Figure BDA0000089272700000132
转向第8步;
步骤7、如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) &Subset; &cup; x &Element; X N P ( x ) , 如果 N P ( x ) &cap; N { a } ( x ) &SubsetEqual; X ,
Figure BDA0000089272700000135
如果
Figure BDA0000089272700000136
Figure BDA0000089272700000137
步骤8、输出
Figure BDA0000089272700000138
Figure BDA0000089272700000139
算法结束;
步骤C2、属性减少时近似集动态增量更新算法:
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X;
输出:C P (X),
Figure BDA00000892727000001310
具体步骤为:
步骤1、计算由属性集
Figure BDA00000892727000001311
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、对于xi∈U,计算N(xi);
步骤3、计算X的上、下近似C P (X),
Figure BDA00000892727000001312
步骤4、删除一个属性a,构成一个新的覆盖
Figure BDA00000892727000001313
步骤5、重复步骤1、2、3,输出
Figure BDA00000892727000001314
Figure BDA00000892727000001315
算法结束;
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X。
输出:C P (X),
Figure BDA00000892727000001316
具体步骤:
步骤1计算由属性集
Figure BDA00000892727000001317
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2
Figure BDA00000892727000001318
计算NP(x);
步骤3计算X的上、下近似C P (X),
步骤4删除一个属性a,构成一个新的覆盖
Figure BDA00000892727000001320
步骤5计算NP-{a}(x),若 &cup; x &Element; X N P - { a } ( x ) = &cup; x &Element; X N P ( x ) , C P ^ &OverBar; ( X ) = C P ( x ) &OverBar; , C P ^ &OverBar; ( X ) = C P &OverBar; ( X ) , 转向步骤7;
步骤6若 &cup; x &Element; X N P - { a } ( x ) &Superset; &cup; x &Element; X N P ( x ) , C P - { a } ^ &OverBar; ( X ) = { x &Element; N P - { a } ( x ) | N P - { a } ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000146
步骤7输出
Figure BDA0000089272700000147
Figure BDA0000089272700000148
算法结束。
针对本发明所述方法结合实例及实验数据再进行如下详细阐述:
1、相关知识
定义1[1](信息系统)一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;
Figure BDA0000089272700000149
是信息函数f的值域,而Vα表示值域;
Figure BDA00000892727000001410
表示信息系统的信息函数,fα为属性α的信息函数。
定义2[2]设U是一有限非空论域,C是U上的一个子集族,若
Figure BDA00000892727000001411
且∪C=U,则称C为论域U的一个覆盖,称元组<U,C>为覆盖近似空间。
定义3[2]设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
Figure BDA00000892727000001412
定义4[2]设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域。
结合定义3和定义4,容易得到N(x)=∩md(x)。
例1:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},K1∪K2∪K3=U,所以C={K1,K2,K3}是U的一个覆盖。则称元组<U,C>为覆盖近似空间。
定义3[2]设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
Figure BDA00000892727000001413
例2:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},C={K1,K2,K3},C是U的一个覆盖,则e1,e2,e3,e4,e5,e6,e7,e8关于<U,C>的最小描述分别为:
md(e1)={K1},md(e2)={K1},md(e3)={K1,K2},md(e4)={K3},md(e5)={K3},
md(e6)={K2,K3},md(e7)={K3},md(e8)={K2,K3}。
定义4[2]设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域。
结合定义3和定义4,容易得到N(x)=∩md(x)。
例3:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},C={K1,K2,K3},C是U的一个覆盖,则e1,e3,e6邻域分别为:
md(e1)={K1}={e1,e2,e3,e5,e6},N(e1)=∩md(e1)={K1}={e1,e2,e3,e5,e6};
md(e3)={k1,K2}={{e1,e2,e3,e5,e6},{e3,e6,e8}},N(e3)=∩md(e3)=K1∩K2={e3,e6};
md(e6)={K1,K2,K3},N(e6)=∩md(e6)=K1∩K2∩K3={e6}。
定义5[2]设U是一有限非空论域,C是U上的一个子覆盖,对于任意的
Figure BDA0000089272700000151
X关于覆盖近似空间<U,C>的下近似C(X)和上近似分别定义为:
C &OverBar; ( X ) = { x &Element; U | &cap; md ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000154
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
neg C ( X ) = ~ C &OverBar; ( X ) ,
bn C ( X ) = C &OverBar; ( X ) - C &OverBar; ( X ) .
即覆盖粗糙集模型是Pawlak粗糙集模型的推广。
Figure BDA0000089272700000157
时,称X关于近似空间<U,C>可定义的,否则称为粗糙的。
例4:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},C是U上的一个子覆盖,K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},K4={e5,e7},C={K1,K2,K3,K4},设X={e3,e5,e6,e7},则有
md(e1)={K1},N(e1)={K1}={e1,e2,e3},md(e2)={K1},N(e2)={K1}={e1,e2,e3},
md(e3)={K1,K2},N(e3)=K1∩K2={e3},md(e4)={K3},N(e4)={e4,e5,e6,e7,e8},
md(e5)={K3,K4},N(e5)=K3∩K4={E5,e7},md(e6)={K2,K3},N(e6)=K2∩K3={e6,e8},
md(e7)={K3,K4},N(e7)=K3∩K4={e5,e7},md(e8)={K2,K3},N(e3)=K2∩K3={e6,e8},
X关于覆盖近似空间<U,C>的下近似:
C &OverBar; ( X ) = { x &Element; U | N ( x ) &SubsetEqual; X } = { N ( e 3 ) , N ( e 5 ) , N ( e 7 ) } = { e 3 , e 5 , e 7 } ,
X关于覆盖近似空间<U,C>的上近似:
Figure BDA0000089272700000162
X关于覆盖近似空间<U,C>的边界域:
bn C ( X ) = C &OverBar; ( X ) - C &OverBar; ( X ) = { e 1 , e 2 , e 4 , e 6 , e 8 } ;
X关于覆盖近似空间<U,C>的正域:
posC(X)=C(X)={e3,e5,e7};
X关于覆盖近似空间<U,C>的负域:
定义6设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的
Figure BDA0000089272700000165
x∈X关于属性集B的邻域为:
NB(x)=∩{K∈C;x∈K}
定义7设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的
Figure BDA0000089272700000166
X关于属性集B的下近似集、上近似集、下边界和上边界分别定义为:
C B &OverBar; ( X ) = { x &Element; U | N B ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000168
&Delta; &OverBar; C B ( X ) = X - C B &OverBar; ( X ) , &Delta; &OverBar; C B ( X ) = C B &OverBar; ( X ) - X
X关于属性集B的正域
Figure BDA0000089272700000171
负域
Figure BDA0000089272700000172
和边界域
Figure BDA0000089272700000173
分别定义为:
pos C B ( X ) = C B &OverBar; ( X ) , neg C B ( X ) = ~ C B &OverBar; ( X ) , bn C B ( X ) = C B &OverBar; ( X ) - C B &OverBar; ( X ) .
2、属性集变化时近似集的性质分析
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述。在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确。当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化。下面当属性集变化时对近似集性质进行分析。
引理1设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 &ForAll; x &Element; U , P = { &alpha; 1 , &alpha; 2 , . . . , &alpha; n } &SubsetEqual; A , C P = { K &alpha; 1 1 , K &alpha; 1 2 , . . . , K &alpha; 1 m 1 , . . . K &alpha; i 1 , K &alpha; i 2 , . . . , K &alpha; i m i , . . . , K &alpha; n 1 , K &alpha; n 2 , . . . , . . . , K &alpha; n m n } 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,
Figure BDA00000892727000001710
且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少, N P ( x ) &SubsetEqual; N P - { a } ( x ) .
证明:此引理由定义3-7可直接得到,此处证明略。
定理1设属性a∈A, P &SubsetEqual; A , a &NotElement; P , C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) .
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 C P &SubsetEqual; C P &cup; { a } . &ForAll; x &Element; C P &OverBar; ( X ) , 则有 N P ( x ) &SubsetEqual; X . 由引理1知, N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) , 则有 N P &cup; { a } ( x ) &SubsetEqual; X , 即x∈C P∪{a} (X),所以有 C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) .
&ForAll; x &Element; C P &cup; { a } &OverBar; ( X ) , 则有又由引理1知, N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) ,
Figure BDA00000892727000001725
x &Element; C P &OverBar; ( X ) . 所以有 C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) .
推论1设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) .
证明:定义7知, &Delta; &OverBar; C P ( X ) = X - C P &OverBar; ( X ) , &Delta; &OverBar; C P &cup; { a } ( X ) = X - C P &cup; { a } &OverBar; ( X ) , 又由定理1知, C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , 所以有 &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) .
推论2设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) .
证明:定义7知, &Delta; &OverBar; C P ( X ) = C P &OverBar; ( X ) - X , &Delta; &OverBar; C P &cup; { a } ( X ) = C P &cup; { a } &OverBar; ( X ) - X , 又由定理1知, C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) , 所以有 &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) .
推论3设属性a∈A, P &SubsetEqual; A , a &NotElement; P , bn C P ( X ) &SupersetEqual; bn C P &cup; { a } ( X ) .
证明:边界域的定义可得: bn C P ( X ) = C P &OverBar; ( X ) - C P &OverBar; ( X ) , bn C P &cup; { a } ( X ) = C P &cup; { a } &OverBar; ( X ) - C P &cup; { a } &OverBar; ( X ) , 又由定理1知, C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) , 所以有 bn C P ( X ) &SupersetEqual; bn C P &cup; { a } ( X ) .
定理2设属性集 P &SubsetEqual; A , a∈P,则 C P &OverBar; ( X ) &SupersetEqual; C P - { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SubsetEqual; C P - { a } &OverBar; ( X ) .
证明:证明过程的原理类似于定理1,此处略。
推论4设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) .
证明:证明过程的原理类似于推论1,此处略。
推论5设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) .
证明:证明过程的原理类似于推论2,此处略。
推论6设属性集 P &SubsetEqual; A , a∈P,则 bn C P ( X ) &SubsetEqual; bn C P - { a } ( X ) .
证明:证明过程的原理类似于推论3,此处略。
3、属性集变化时近似集增量更新方法
设覆盖近似空间<U,C>,
Figure BDA00000892727000001825
通过下面的定理来实现X的上、下近似的更新定理3设属性a∈A,
Figure BDA00000892727000001826
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
其中
Figure BDA00000892727000001828
证明:
Figure BDA00000892727000001829
&ForAll; x &Element; C P &cup; { a } &OverBar; ( X ) , 由下近似的定义则有所以一定有 &cup; x &Element; X N P &cup; { a } ( x ) &SubsetEqual; X . 如果 x &NotElement; C P &OverBar; ( X ) &cup; C { a } &OverBar; ( X ) , 则有
Figure BDA00000892727000001834
所以有
Figure BDA00000892727000001835
&cup; x &Element; X N P ( x ) &cap; N { a } ( x ) &SubsetEqual; X 矛盾,所以有x∈Y。所以有 C P &cup; { a } &OverBar; ( X ) &SubsetEqual; C P &OverBar; ( X ) &cup; C { a } &OverBar; ( X ) &cup; Y .
Figure BDA00000892727000001838
因为 C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , C { a } &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , Y &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , 所以有 C P &cup; { a } &OverBar; ( X ) &SupersetEqual; C P &OverBar; ( X ) &cup; C { a } &OverBar; ( X ) &cup; Y . 综上,C P∪{a} (X)=C P (X)∪C {a} (X)∪Y。
定理4设属性集
Figure BDA0000089272700000191
a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) - &Delta; &OverBar; C P - { a } ( X )
证明:由定理2知, C P &OverBar; ( X ) &SupersetEqual; C P - { a } &OverBar; ( X ) , 又由定义7知, C P - { a } &OverBar; ( X ) &cup; &Delta; &OverBar; C P - { a } ( X ) = X , C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P ( X ) = X , 所以有 C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) - ( &Delta; &OverBar; C P - { a } ( X ) - &Delta; &OverBar; C P ( X ) ) , 所以有 C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P ( X ) - &Delta; &OverBar; C P - { a } ( X ) , 由推论4知, &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) , 所以有 C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) - &Delta; &OverBar; C P ( X ) .
定理5设属性a∈A,
C P &cup; { a } &OverBar; ( X ) = C P &OverBar; ( X ) - Z
其中
Figure BDA00000892727000001913
证明: &ForAll; x &Element; C P &cup; { a } &OverBar; ( X ) , 则有x∈NP∪{a}(x)且
Figure BDA00000892727000001916
x &Element; C P &OverBar; ( X ) , 则有x∈NP(x)且
Figure BDA00000892727000001918
由定理1知,
Figure BDA00000892727000001919
又由引理4.1得, N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) , Z = C P &OverBar; ( X ) - C P &cup; { a } &OverBar; ( X ) , 则有
Figure BDA00000892727000001922
所以有, C P &cup; { a } &OverBar; ( X ) = &SubsetEqual; C P &OverBar; ( X ) - Z .
Figure BDA00000892727000001924
&ForAll; x &Element; C P &OverBar; ( X ) - Z , 则有
Figure BDA00000892727000001926
x &NotElement; C P &cup; { a } &OverBar; ( X ) ,
Figure BDA00000892727000001928
矛盾。所以, x &Element; C P &cup; { a } &OverBar; ( X ) , C P &cup; { a } &OverBar; ( X ) &SupersetEqual; C P &OverBar; ( X ) - Z . 综上, C P &cup; { a } &OverBar; ( X ) = C P &OverBar; ( X ) - Z .
定理6设属性集
Figure BDA00000892727000001932
a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P - { a } ( X )
证明:由定理2知, C P - { a } &OverBar; ( X ) &SupersetEqual; C P &OverBar; ( X ) , &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) . 又由定义7知 C P - { a } &OverBar; ( X ) = &Delta; &OverBar; C P - { a } ( X ) &cup; X , X = C P &OverBar; ( X ) - &Delta; &OverBar; C P ( X ) , 所以有 C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; ( &Delta; &OverBar; C P - { a } ( X ) - &Delta; &OverBar; C P ( X ) ) , 所以有 C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P ( X ) &cup; &Delta; &OverBar; C P - { a } ( X ) 由推论5知, &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) , 所以有 C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P - { a } ( X ) .
例5[:设U={x1,x2,x3,x4,x5,x6,x7,x8,x9}为九幢房子,
P={price,color,structure,surrounding}为属性集,“price”取值为{high,middle,low},“color”取值为{good,bad},“structure”取值为{reasonable,ordinary,unreasonable},“surrounding”取值为{quiet,a little noisy,noisy,very noisy}。有四个专家参与评估房子的各种属性状态,分别为{A,B,C,D},四人评估的结果可能各不相同。评估结果如下:
“price”:
A:high={x1,x4,x5,x7},middle={x2,x8},low={x3,x6,x9}
B:high={x1,x2,x4,x7,x8},middle={x5},low={x3,x6,x9}
C:high={x1,x4,x7},middle={x8},low={x2,x3,x5,x6,x9}
D:high={x1,x4,x7},middle={x5},low={x2,x3,x6,x8,x9}
“color”:
A:good={x1,x2,x3,x6},bad={x4,x5,x7,x8,x9}
B:good={x1,x2,x3,x5},bad={x4,x6,x7,x8,x9}
C:good={x1,x2,x3,x4},bad={x5,x6,x7,x8,x9}
D:good={x1,x2,x3},bad={x4,x5,x6,x7,x8,x9}
“structure”:
A:reasonable={x1,x2,x3},ordinary={x4,x5,x6,x7,x8},unreasonable={x9}
B:reasonable={x1,x2,x3},ordinary={x4,x5,x6,x7,x9},unreasonable={x8}
C:reasonable={x1,x2,x3},ordinary={x4,x5,x6,x8,x9},unreasonable={x7}
D:reasonable={x1,x2,x3},ordinary={x4,x5,x6},unreasonable={x7,x8,x9}
“surrounding”:
A:quiet={x1,x2},alittle noisy={x3,x6},noisy={x4,x5,x7},very noisy={x8,x9}
B:quiet={x1,x5},alittle noisy={x2,x3},noisy={x4,x7,x8},very noisy={x6,x9}
C:quiet={x1},alittle noisy={x2,x3},noisy={x4,x7,x8},very noisy={x5,x6,x9}
D:quiet={x1,x2,x4},alittle noisy={x3,x5},noisy={x7,x8},very noisy={x6,x9}
假设每位专家的评估结果具有相同的重要度,如果要全面综合这些意见,我们可以将四个专家给出的某个属性值的所有对象合并在一起,这样就形成了论域U的覆盖,代表四个属性:
“price”Ca
high={x1,x2,x4,x5,x7,x8},middle={x2,x5,x8},low={x2,x3,x5,x6,x8,x9}
“color”Cb
good={x1,x2,x3,x4,x5,x6},bad={x4,x5,x6,x7,x8,x9}
“structure”Cc
reasonable={x1,x2,x3},ordinary={x4,x5,x6,x7,x8,x9},unreasonable={x7,x8,x9}
“surrounding”Cd
quiet={x1,x2,x4,x5},a little noisy={x2,x3,x5,x6},noisy={x4,x5,x7,x8},very noisy={x5,x6,x8,x9}
给定集合X={e1,x3,e5,e8},下面我们讨论增加和删除属性时,关于集合X的下近似和上近似的更新。
1增加一个新的属性
设P={a,b,d},因此有,Cp={Ka1,Ka2,Ka3,Kb1,Kb2,Kd1,Kd2,Kd3,Kd4},NP(x1)={x1,x2,x4,x5},NP(x2)={x2,x5},NP(x3)={x2,x3,x5,x6},NP(x4)={x4,x5},NP(x5)={x5},NP(x6)={x5,x6},NP(x7)={x4,x5,x7,x8},NP(x8)={x5,x8},NP(x9)={x5,x6,x8,x9},C P (X)={x5}, C P &OverBar; ( X ) = U .
i.设属性c∈A,
Figure BDA0000089272700000213
将属性c添加到P,集合X的下近似增量更新如下:
为求C p∪{c} (X),我们首先计算Y和C {c} {X)。
Figure BDA0000089272700000214
N{c}(x)={N{c}(x1),N{c}(x3),N{c}(x5),N{c}(x8)},
NP(x)∩N{c}(x)={NP∪{c}(x1),NP∪{c}(x3),NP∪{c}(x5),NP∪{c}(x8)}。
又因
Figure BDA0000089272700000216
有Y={x3,x5,x8}。
因此,C P∪{c} (X)=CP(X)∪C {c} (X)∪Y={x3,x5,x8}。
ii.设属性c∈A,
Figure BDA0000089272700000217
将属性c添加到P,集合X的上近似增量更新如下:
为求
Figure BDA0000089272700000221
我们首先计算Z。
Figure BDA0000089272700000222
因此, C P &cup; { &gamma; } &OverBar; ( X ) = C P &OverBar; ( X ) - Z = U .
2删除一个属性
设P={a,b,c},
Figure BDA0000089272700000224
因此有,Cp={Ka1,Ka2,Ka3,Kb1,Kb2,Kc1,Kc2,Kc3},NP(x1)={x1,x2},NP(x2)={x2},NP(x3)={x3},NP(x4)={x4,x5},NP(x5)={x5},NP(x6)={x5,x6},NP(x7)={x7,x8},NP(x8)={x8},NP(x9)={x8,x9},C P (X)={x3,x5,x8},
Figure BDA0000089272700000225
i.设属性c∈P,将属性c从P中删除,集合X的下近似更新如下:
为求C p-{c} (X),我们首先计算
Figure BDA0000089272700000226
由于
Figure BDA0000089272700000227
所以有,
C P - { c } &OverBar; ( X ) = C P &OverBar; ( X ) - &Delta; &OverBar; C P - { c } ( X ) = { x 5 } .
ii.设属性c∈P,将属性c从P中删除,集合X的上近似更新如下:
为求
Figure BDA0000089272700000229
我们首先计算
Figure BDA00000892727000002210
由于 &Delta; &OverBar; C P - { c } ( X ) = { x 2 , x 4 , x 6 , x 7 , x 9 } , 所以有,
C P - { c } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P - { c } ( X ) = U .
4、算法思想及其描述
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法(所谓静态增量更新方法是指增加新属性后按照初始求近似集的算法计算),那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新。
4.1属性增加时近似集增量更新算法
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X。
输出:
Figure BDA0000089272700000231
具体步骤:
步骤1计算由属性集
Figure BDA0000089272700000233
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2对于xi∈U,计算N(xi);
步骤3若xi∈U,且
Figure BDA0000089272700000234
则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4若xi∈U,且
Figure BDA0000089272700000236
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤6增加一个新的属性a产生新的覆盖元,合并原来的覆盖构成一个新的覆盖
Figure BDA0000089272700000238
步骤7重复步骤2、3、4,输出
Figure BDA0000089272700000239
Figure BDA00000892727000002310
算法结束。
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X。
输出:
Figure BDA00000892727000002311
Figure BDA00000892727000002312
具体步骤:
步骤1计算由属性集
Figure BDA00000892727000002313
中单个属性形成的覆盖元,构成U的一个覆盖;
步骤2对于xi∈U,计算N(xi);
步骤3若xi∈X,且
Figure BDA00000892727000002314
则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4若xi∈U,且
Figure BDA00000892727000002316
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤5增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
步骤6如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) = &cup; x &Element; X N P ( x ) ,
Figure BDA0000089272700000243
Figure BDA0000089272700000244
转向第8步;
步骤7如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) &Subset; &cup; x &Element; X N P ( x ) , 如果 N P ( x ) &cap; N { a } ( x ) &SubsetEqual; X ,
Figure BDA0000089272700000247
如果
Figure BDA0000089272700000248
Figure BDA0000089272700000249
步骤8输出
Figure BDA00000892727000002410
Figure BDA00000892727000002411
算法结束。
3.算法的性能分析
在当前的信息系统中,论域U中对象的个数用|U|来表示,论域U中属性的个数用|C|来表示,论域U中每个属性值域的个数用来表示,即根据属性的值域可生成该信息系统的覆盖元,这些覆盖元形成关于该属性对于信息系统的一个覆盖,依此类推,该信息系统的所有属性形成的覆盖构成一族覆盖,这一族覆盖包含的覆盖元的个数为
Figure BDA00000892727000002413
当册除某一属性时,采用静态更新的方法对信息系统中对象计算覆盖元的时间复杂度为
Figure BDA00000892727000002414
计算每个对象邻域的时间复杂度为计算近似集的时间复杂度为则整个求近似集的总花费时间复杂度为 O ( | U | &CenterDot; ( | C | &CenterDot; &Sigma; i = 1 | C | | V C i | ) 2 + | C | &CenterDot; &Sigma; i = 1 | C | | V C i | &CenterDot; | U | + | U | &CenterDot; ( | C | &CenterDot; &Sigma; i = 1 | C | | V C i | ) | V C i | ) ,
Figure BDA00000892727000002418
故用静态更新近似集总的时间复杂度为即
Figure BDA00000892727000002419
采用动态更新方法而言,当属性增加之后,该属性值对|U|个对象形成成t个覆盖元构成U的一个覆盖,计算t个覆盖元及|U|个对象的邻域时间复杂度为O(|U|),此时,动态更新近似集总的时间复杂度为
Figure BDA00000892727000002420
下面对两个算法计算等价类的时间复杂度进行比较。由于t<|C|,所以 O ( | U | &CenterDot; t 2 &CenterDot; ( | C | &CenterDot; &Sigma; i = 1 | C | | V C i | + t ) ) < O ( 2 &CenterDot; | U | ( | C | &CenterDot; &Sigma; i = 1 | C | | V C i | ) | V C i | ) . 因此,动态更新算法的时间复杂度远低于静态更算法的时间复杂度。
4.2实验测试及其分析
该章的算法测试实验采用VC#.NET作为编程语言,在Visual Studio 2005开发平台中实现仿真,程序运行环境为:Windows XP操作系统,Intel(R)Pentium Dual CPU处理器,2G内存。静态更新算法和动态更新算法分别对6个数据集进行了实验仿真,验证了属性增加时覆盖广义粗糙集模型中近似集动态更新算法的有效性,这6个数据集均是从UCI数据库中选取的数据集,这些数据集的名称依次为:Ballons DataBases、ZooDataBases、Monk’s Problem、Yeast DataBases、Abalone DataBases、Mushroom DataBases。由于所选取的数据集的属性个数不同、对象集大小的不同,为了更好、更准确地反映动态更新算法的高效性,本次算法测试实验过程中,对于每一个数据集均随机选取对象集的20%作为集合X,从每个数据集中选取4个属性作为原始属性集,然后对每个数据集进行单个属性增加,同时运行两种算法,由于算法的运行时间和当前CPU使用率、及当前内存的使用、及电脑内部的温度都有关,所以同一数据集两种算法同时运行五次,记录每个算法的运行时间求总和取平均值作为每次近似集更新近似集的平均时间。得到如表1所示的静态更新算法和动态更新算法计算近似集的时间比较表。
表1静态更新算法与动态更新算法结果比较
Figure BDA0000089272700000251
覆盖粗糙集模型中,当单个属性增加的时候,静态更新算法与动态更新算法计算近似集运行时间的比较图如图1所示。
由表1和图1可知,当数据集中属性个数选择相同,对象个数较少时,静态更新算法和动态更新算法的效率差不多,耗费的时间都比较少。随着数据集中对象集的个数的增加,动态更新算法的耗费的时间呈缓慢增长趋势,而静态更新算法的消耗的时间却呈较快的速度增长。因此,在大型信息系统中,动态更新算法的效率要明显地高于静态更新算法。原因在于动态环境下当属性增加时,采用静态更新算法计算近似集需要重新计算所有属性的覆盖元,在求每个对象的邻域时又要重复进行覆盖元的比较及求其交集,这个过程会耗费大量重复计算的时间,对于动态更新算法而言,只需要对新增加的属性根据其值求其覆盖元及对象的邻域,且这一过程耗费的时间极少,几乎可以忽略不计,这样就大大提高了效率。因此,对于海量数据的信息系统来说,从时间的角度考虑,采用动态增量更新算法具计算近似集效率明显高于静态更新算法计算近似集。
4.3属性减少时近似集动态增量更新算法
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X。
输出:C P (X),
Figure BDA0000089272700000261
具体步骤:
步骤1计算由属性集
Figure BDA0000089272700000262
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2对于xi∈U,计算N(xi);
步骤3计算X的上、下近似C P (X),
Figure BDA0000089272700000263
步骤4删除一个属性a,构成一个新的覆盖
Figure BDA0000089272700000264
步骤5重复步骤1、2、3,输出
Figure BDA0000089272700000265
Figure BDA0000089272700000266
算法结束。
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X。
输出:C P (X),
Figure BDA0000089272700000267
具体步骤:
步骤1计算由属性集中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2
Figure BDA0000089272700000269
计算NP(x);
步骤3计算X的上、下近似C P (X),
Figure BDA00000892727000002610
步骤4删除一个属性a,构成一个新的覆盖
Figure BDA00000892727000002611
步骤5计算NP-{a}(x),若 &cup; x &Element; X N P - { a } ( x ) = &cup; x &Element; X N P ( x ) , C P ^ &OverBar; ( X ) = C p ( x ) &OverBar; , C P ^ &OverBar; ( X ) = C P &OverBar; ( X ) , 转向步骤7;
步骤6若 &cup; x &Element; X N P - { a } ( x ) &Superset; &cup; x &Element; X N P ( x ) , C P - { a } ^ &OverBar; ( X ) = { x &Element; N P - { a } ( x ) | N P - { a } ( x ) &SubsetEqual; X } ,
Figure BDA0000089272700000271
步骤7输出
Figure BDA0000089272700000272
Figure BDA0000089272700000273
算法结束。
3.算法的性能分析
在当前的信息系统中,论域U中对象的个数用|U|来表示,论域U中属性的个数用|C|来表示,论域U中每个属性值域的个数用
Figure BDA0000089272700000274
来表示,即根据属性的值域可生成该信息系统的覆盖元,这些覆盖元形成关于该属性对于信息系统的一个覆盖,依此类推,该信息系统的所有属性形成的覆盖构成一族覆盖,这一族覆盖包含的覆盖元的个数为
Figure BDA0000089272700000275
当册除某一属性时,采用静态更新的方法对信息系统中对象计算覆盖元的时间复杂度为
Figure BDA0000089272700000276
计算每个对象邻域的时间复杂度为
Figure BDA0000089272700000277
计算近似集的时间复杂度为
Figure BDA0000089272700000278
则整个求近似集的总花费时间复杂度为 O ( | U | &CenterDot; ( ( | C | - 1 ) &CenterDot; &Sigma; i = 1 | C | - 1 | V C i | ) 2 + ( | C | - 1 ) &CenterDot; &Sigma; i = 1 | C | - 1 | V C i | &CenterDot; | U | + | U | &CenterDot; ( ( | C | - 1 ) &CenterDot; &Sigma; i = 1 | C | - 1 | V C i | ) | V C i | ) ,
Figure BDA00000892727000002710
故用静态更新近似集总的时间复杂度为即
Figure BDA00000892727000002711
采用动态更新方法而言,首先对当前要删除的某一属性作标记,该属性值对|U|个对象形成成t个覆盖元构成U的一个覆盖,计算t个覆盖元及|U|个对象的邻域时间复杂度为O(|U|),然后计算删除属性后,对象集的邻域,其时间复杂度为
Figure BDA00000892727000002712
此时,若删除属性后集合X的邻域并集不变,则动态更新近似集总的时间复杂度为
Figure BDA00000892727000002713
下面对两个算法计算等价类的时间复杂度进行比较。由于t<|C|-1,所以
Figure BDA00000892727000002714
因此,动态更新算法的时间复杂度远低于静态更算法的时间复杂度。
4.4实验测试及其分析
静态更新算法和动态更新算法分别对6个数据集进行了实验仿真,验证了属性增加时覆盖广义粗糙集模型中近似集动态更新算法的有效性。本次算法测试实验过程中,对于每一个数据集均随机选取对象集的10%作为集合X,从每个数据集中选取5个条件属性作为原始属性集,然后对每个数据集进行单个属性减少,同一数据集两种算法同时运行五次,记录每个算法的运行时间求总和取平均值作为每次近似集更新近似集的平均时间。得到如表2所示的静态更新算法和动态更新算法计算近似集的时间比较表。
表2静态更新算法与动态更算法结果比较
Figure BDA0000089272700000281
覆盖粗糙集模型中,当单个属性增加的时候,静态更新算法与动态更新算法计算近似集运行时间的比较图如图2所示。
由表2和图2可知,当数据集中属性个数相同,对象个数较少时,静态更新算法动态更新算法的效率差不多,花费的时间代价都比较少。当数据集中对象个数较快增长时,动态更新算法的耗时增长非常缓慢,而静态更新算法的消耗的时间却呈较快的速度增长。因此,动态更新算法更适合于大型的信息系统,其效率明显高于静态更新算法。原因在于动态环境下当属性删除时,采用静态更新算法计算近似集需要重新计算所有属性的覆盖元,在求每个对象的邻域时又要重复进行覆盖元的比较及求其交集,这个过程会耗费大量重复计算的时间,对于动态更新算法而言,不需要对删除属性后的信息系统求剩余的覆盖元,且求对象集的邻域时只需对集合X所包含的对象求其邻域,这样就大大节省了时间,提高了效率。因此,对于海量数据的大型信息系统来说,当信息随着外界变化而动态变化时,求其变化后的近似集采用动态更新算法远远优于采用静态更新算法。
总结:讨论了当属性集增加或减少时,在覆盖广义粗糙集模型中近似集的动态变化趋势及近似集的动态增量更新方法,不仅适用于单属性增加删除时近似集的增量更新,而且也适用于多个属性变化的情况,通过实例验证了这种方法的可行性,通过实验仿真验证所提出方法的性能,且从给出的实例的实验仿真说明,基于覆盖广义粗糙集理论的动态增量更新方法不但有效,而且在效率上也有所提高。
参考文献
[1]Pawlak Zdzistaw.Rough sets[J].International Journal of Computer andInformation Sciences,1982,11(5):341-356.
[2]Zbigniew Boinkowski,Edward Bryniarski,Urszula Wybraniedc-Skardowska,Extensions and intentions in the rough set theory[J].Information Science,1998,107:149-167.
[3]Willam Zhu,Fei-yue Wang.Reduction and axiomization of covering generalizedrough sets[J].Information Science,2003,152:217-230.
[4]William Zhu.Relationship among basic concepts in covering-based rough sets[J].Information Sciences,2009,179(14):2478-2486.
[5]陈文,祝峰,汤建国.覆盖粗糙集上近似的研究[J].广西师范大学学报:自然科学版,2010,28(3):93-97.
[6]Li Tianrui,Ruan Da,Greet Wets,et al.A rough set based characteristicrelation approach for dynamic attribute general ization in data mining[J].Knowledge-Based Systems,2007,20(2):485-494.
[7]Chen Hongmei,Li Tianrui,Qiao Shaojie,et al.A rough set based dynamicmaintenance approach for approximations in coarsening and refining attributevalves[J].International Journal of Intelligent System.2010,25(10):1005-1026.
[8]季晓岚,李天瑞,邹维丽等.优势关系下属性值粗化细化时近似集分析[J].计算机工程.2010,36(12):33-35.

Claims (1)

1.一种粗糙集扩展模型中近似集动态更新方法,所述方法是基于以下定义来实现的:
定义1:一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;
Figure FDA0000089272690000011
是信息函数f的值域,而Vα表示值域;
Figure FDA0000089272690000012
表示信息系统的信息函数,fα为属性α的信息函数;
定义2:设U是一有限非空论域,C是U上的一个子集族,若
Figure FDA0000089272690000013
且∪C=U,则称C为论域U的一个覆盖,称元组<U,C>为覆盖近似空间;
定义3:设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
定义3:设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
Figure FDA0000089272690000015
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
定义5:设U是一有限非空论域,C是U上的一个子覆盖,对于任意的
Figure FDA0000089272690000016
X关于覆盖近似空间<U,C>的下近似C(X)和上近似
Figure FDA0000089272690000017
分别定义为:
C &OverBar; ( X ) = { x &Element; U | &cap; md ( x ) &SubsetEqual; X } ,
Figure FDA0000089272690000019
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
neg C ( X ) = ~ C &OverBar; ( X ) ,
bn C ( X ) = C &OverBar; ( X ) - C &OverBar; ( X ) ;
即覆盖粗糙集模型是Pawlak粗糙集模型的推广;
时,称X关于近似空间<U,C>可定义的,否则称为粗糙的;
定义6:设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的x∈X关于属性集B的邻域为:
NB(x)=∩{K∈C;x∈K}
定义7:设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的
Figure FDA0000089272690000023
X关于属性集B的下近似集、上近似集、下边界和上边界分别定义为:
C B &OverBar; ( X ) = { x &Element; U | N B ( x ) &SubsetEqual; X } ,
Figure FDA0000089272690000025
&Delta; &OverBar; C B ( X ) = X - C B &OverBar; ( X ) , &Delta; &OverBar; C B ( X ) = C &OverBar; B ( X ) - X
X关于属性集B的正域
Figure FDA0000089272690000028
负域和边界域
Figure FDA00000892726900000210
分别定义为:
pos C B ( X ) = C B &OverBar; ( X ) , neg C B ( X ) = ~ C B &OverBar; ( X ) , bn C B ( X ) = C B &OverBar; ( X ) - C B &OverBar; ( X ) ;
其特征在于:所述方法的具体过程为:
步骤A、属性集变化时近似集的性质分析过程为:
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述;在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确;当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化;下面当属性集变化时对近似集性质进行分析:
设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 &ForAll; x &Element; U , P = { &alpha; 1 , &alpha; 2 , . . . , &alpha; n } &SubsetEqual; A , C P = { K &alpha; 1 1 , K &alpha; 1 2 , . . . , K &alpha; 1 m 1 , . . . K &alpha; i 2 , . . . , K &alpha; i m i , . . . , K &alpha; n 1 , K &alpha; n 2 , . . . , . . . , K &alpha; n m n } 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,
Figure FDA0000089272690000031
且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少, N P ( x ) &SubsetEqual; N P - { a } ( x ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) ;
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 C P &SubsetEqual; C P &cup; { a } . &ForAll; x &Element; C P &OverBar; ( X ) , 则有 N P ( x ) &SubsetEqual; X . 由引理1知, N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) , 则有 N P &cup; { a } ( x ) &SubsetEqual; X , 即x∈C P∪{a} (X),所以有 C P &OverBar; ( X ) &SubsetEqual; C P &cup; { a } &OverBar; ( X ) ;
&ForAll; x &Element; C P &cup; { a } &OverBar; ( X ) , 则有
Figure FDA00000892726900000314
N P ( x ) &SupersetEqual; N P &cup; { a } ( x ) ,
Figure FDA00000892726900000316
x &Element; C P &OverBar; ( X ) ; 所以有 C P &OverBar; ( X ) &SupersetEqual; C P &cup; { a } &OverBar; ( X ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , &Delta; &OverBar; C P ( X ) &SupersetEqual; &Delta; &OverBar; C P &cup; { a } ( X ) ;
设属性a∈A, P &SubsetEqual; A , a &NotElement; P , bn C P ( X ) &SupersetEqual; bn C P &cup; { a } ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 C P &OverBar; ( X ) &SupersetEqual; C P - { a } &OverBar; ( X ) , C P &OverBar; ( X ) &SubsetEqual; C P - { a } &OverBar; ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 &Delta; &OverBar; C P ( X ) &SubsetEqual; &Delta; &OverBar; C P - { a } ( X ) ;
设属性集 P &SubsetEqual; A , a∈P,则 bn C P ( X ) &SubsetEqual; bn C P - { a } ( X ) ;
步骤B、属性集变化时近似集增量更新方法过程:
设覆盖近似空间<U,C>,
Figure FDA00000892726900000337
通过下面的定理来实现X的上、下近似的更新
设属性a∈A,
Figure FDA00000892726900000338
Figure FDA00000892726900000339
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
其中
Figure FDA00000892726900000340
设属性集
Figure FDA00000892726900000341
a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) - &Delta; &OverBar; C P - { a } ( X )
设属性a∈A,
Figure FDA0000089272690000041
Figure FDA0000089272690000042
C P &cup; { a } &OverBar; ( X ) = C P &OverBar; ( X ) - Z
其中
Figure FDA0000089272690000044
设属性集
Figure FDA0000089272690000045
a∈P,则
C P - { a } &OverBar; ( X ) = C P &OverBar; ( X ) &cup; &Delta; &OverBar; C P - { a } ( X ) ;
步骤C、具体过程描述为:
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法,那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新;
步骤C1、属性增加时近似集增量更新算法:
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X;
输出:
Figure FDA0000089272690000052
具体步骤:
步骤1、计算由属性集
Figure FDA0000089272690000053
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、对于xi∈U,计算N(xi);
步骤3、若xi∈U,且
Figure FDA0000089272690000054
则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4、若xi∈U,且
Figure FDA0000089272690000056
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤6、增加一个新的属性a产生新的覆盖元,合并原来的覆盖构成一个新的覆盖
Figure FDA0000089272690000058
步骤7、重复步骤2、3、4,输出
Figure FDA0000089272690000059
Figure FDA00000892726900000510
算法结束;
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X;
输出:
Figure FDA00000892726900000511
具体步骤:
步骤1、计算由属性集
Figure FDA00000892726900000513
中单个属性形成的覆盖元,构成U的一个覆盖;
步骤2、对于xi∈U,计算N(xi);
步骤3、若xi∈X,且
Figure FDA00000892726900000514
则将对象xi加入到对象子集X的下近似集中,即 { x i } &DoubleRightArrow; C p ( x ) &OverBar; ;
步骤4、若xi∈U,且
Figure FDA00000892726900000516
则将对象xi加入到对象子集X的上近似集中,即 { x i } &DoubleRightArrow; C P &OverBar; ( X ) ;
步骤5、增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
步骤6、如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) = &cup; x &Element; X N P ( x ) ,
Figure FDA00000892726900000519
Figure FDA00000892726900000520
转向第8步;
步骤7、如果 &cup; x &Element; X ( N P ( x ) &cap; N { a } ( x ) ) &Subset; &cup; x &Element; X N P ( x ) , 如果 N P ( x ) &cap; N { a } ( x ) &SubsetEqual; X , 如果
Figure FDA0000089272690000063
步骤8、输出
Figure FDA0000089272690000065
算法结束;
步骤C2、属性减少时近似集动态增量更新算法:
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X;
输出:C P (X),
Figure FDA0000089272690000066
具体步骤为:
步骤1、计算由属性集
Figure FDA0000089272690000067
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、对于xi∈U,计算N(xi);
步骤3、计算X的上、下近似C P (X),
步骤4、删除一个属性a,构成一个新的覆盖
Figure FDA0000089272690000069
步骤5、重复步骤1、2、3,输出
Figure FDA00000892726900000610
Figure FDA00000892726900000611
算法结束;
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X;
输出:C P (X),
Figure FDA00000892726900000612
具体步骤:
步骤1、计算由属性集
Figure FDA00000892726900000613
中单个属性形成的覆盖元,构成U的一个覆盖CP
步骤2、
Figure FDA00000892726900000614
计算NP(x);
步骤3、计算X的上、下近似C P (X),
Figure FDA00000892726900000615
步骤4、删除一个属性a,构成一个新的覆盖
Figure FDA00000892726900000616
步骤5、计算NP-{a}(x),若 &cup; x &Element; X N P - { a } ( x ) = &cup; x &Element; X N P ( x ) , C P ^ &OverBar; ( X ) = C p ( x ) &OverBar; , C P ^ &OverBar; ( X ) = C P &OverBar; ( X ) , 转向步骤7;
步骤6、若 &cup; x &Element; X N P - { a } ( x ) &Superset; &cup; x &Element; X N P ( x ) , C P - { a } ^ &OverBar; ( X ) = { x &Element; N P - { a } ( x ) | N P - { a } ( x ) &SubsetEqual; X } ,
Figure FDA0000089272690000071
步骤7、输出
Figure FDA0000089272690000072
Figure FDA0000089272690000073
算法结束。
CN2011102618842A 2011-09-06 2011-09-06 粗糙集扩展模型中近似集动态更新方法 Pending CN102279839A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102618842A CN102279839A (zh) 2011-09-06 2011-09-06 粗糙集扩展模型中近似集动态更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102618842A CN102279839A (zh) 2011-09-06 2011-09-06 粗糙集扩展模型中近似集动态更新方法

Publications (1)

Publication Number Publication Date
CN102279839A true CN102279839A (zh) 2011-12-14

Family

ID=45105294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102618842A Pending CN102279839A (zh) 2011-09-06 2011-09-06 粗糙集扩展模型中近似集动态更新方法

Country Status (1)

Country Link
CN (1) CN102279839A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064908A (zh) * 2012-12-18 2013-04-24 北京讯鸟软件有限公司 一种通过内存快速去重名单的方法
CN107391660A (zh) * 2017-07-18 2017-11-24 太原理工大学 一种用于子话题划分的诱导划分方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064908A (zh) * 2012-12-18 2013-04-24 北京讯鸟软件有限公司 一种通过内存快速去重名单的方法
CN103064908B (zh) * 2012-12-18 2016-03-16 北京讯鸟软件有限公司 一种通过内存快速去重名单的方法
CN107391660A (zh) * 2017-07-18 2017-11-24 太原理工大学 一种用于子话题划分的诱导划分方法
CN107391660B (zh) * 2017-07-18 2021-05-11 太原理工大学 一种用于子话题划分的诱导划分方法

Similar Documents

Publication Publication Date Title
Zhao et al. A hybrid method of dynamic cooling and heating load forecasting for office buildings based on artificial intelligence and regression analysis
Lin et al. Short-term power prediction for photovoltaic power plants using a hybrid improved Kmeans-GRA-Elman model based on multivariate meteorological factors and historical power datasets
Wu et al. The impact of urbanization on carbon emissions in developing countries: a Chinese study based on the U-Kaya method
CN104534507B (zh) 一种锅炉燃烧优化控制方法
Han et al. Energy saving of buildings for reducing carbon dioxide emissions using novel dendrite net integrated adaptive mean square gradient
WO2023201552A1 (en) County-wide photovoltaic prediction method based on cluster division and data enhancement
CN111754037A (zh) 区域终端集成供能系统长期负荷混合预测方法
Yongsheng et al. A Short‐Term Power Output Forecasting Model Based on Correlation Analysis and ELM‐LSTM for Distributed PV System
CN108398982A (zh) 一种局部阴影下光伏阵列的最大功率跟踪方法
CN108984830A (zh) 一种基于模糊网络分析的建筑能效评价方法及装置
Sun et al. The Impact of Multi-Dimensional Urbanization on China's Carbon Emissions Based on the Spatial Spillover Effect.
CN102279839A (zh) 粗糙集扩展模型中近似集动态更新方法
Li et al. Improvement for energy efficiency and control characteristics in variable air volume system using in-situ sensor calibration method based on autoencoder
Wang et al. A multicriteria evaluation and cascaded optimization framework for integrated energy system of steel industry
Guo et al. Based on ANN and many-objective optimization to improve the performance and economy of village houses in Chinese cold regions
CN107846039A (zh) 考虑风速相关性的集群风电并网建模分析方法及系统
CN104408531B (zh) 一种多维多阶段复杂决策问题的均匀动态规划方法
Xiong et al. Evaluation method for energy saving effect of passive ultra low energy consumption buildings based on fuzzy grey clustering method
de Wilde et al. Energy modelling
Zhang et al. Energy economy and energy structure optimization countermeasures based on big data mining
Zhan et al. Dual-objective building retrofit optimization under competing priorities using Artificial Neural Network
Bilal et al. Energy Efficient Buildings in the Industry 4.0 Era: A Review
Gao et al. The Application of Particle Swarm Optimization in Neural Networks
Wu et al. A Multi-Objective Optimization Model for Sustainable Building Design Using Genetic Algorithm and Fuzzy Set Theory
Yingzi et al. Forecast of power generation for grid-connected photovoltaic system based on Pawlak Attribute Importance Algorithm of Rough Sets

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111214