CN102279839A - 粗糙集扩展模型中近似集动态更新方法 - Google Patents
粗糙集扩展模型中近似集动态更新方法 Download PDFInfo
- Publication number
- CN102279839A CN102279839A CN2011102618842A CN201110261884A CN102279839A CN 102279839 A CN102279839 A CN 102279839A CN 2011102618842 A CN2011102618842 A CN 2011102618842A CN 201110261884 A CN201110261884 A CN 201110261884A CN 102279839 A CN102279839 A CN 102279839A
- Authority
- CN
- China
- Prior art keywords
- overbar
- attribute
- covering
- approximate
- cup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
粗糙集扩展模型中近似集动态更新方法,它涉及一种近似集动态更新方法。本发明方法为了进一步完善基于覆盖广义粗糙集的理论体系,使其能够更好地应用于实际的需求。本发明方法分析了对象的邻域、边界域与近似集的关系,给出了覆盖粗糙集模型中近似集的增量更新方法。本发明方法给出了当属性集增加或减少时,在覆盖广义粗糙集模型中近似集的动态变化趋势及近似集的动态增量更新方法,不仅适用于单属性增加删除时近似集的增量更新,而且也适用于多个属性变化的情况,通过实例验证了这种方法的可行性,通过实验仿真验证所提出方法的性能,且从给出的实例的实验仿真说明,基于覆盖广义粗糙集理论的动态增量更新方法不但有效,而且在效率上也有所提高。
Description
技术领域
本发明涉及一种近似集动态更新方法。
背景技术
Pawlark提出的粗糙集理论可以处理不确定和不精确性问题,在知识发现、机器学习、决策分析等方面得到了日益广泛的应用[Pawlak Zdzistaw.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356]。为了适应实际应用的需求,许多研究者提出了各种推广的粗糙集模型。如Bonikowski等首先提出了覆盖粗糙集模型,并给出了其基本概念及相关性质[ZbigniewBoinkowski,Edward Bryniarski,Urszula Wybraniedc-Skardowska,Extensions andintentions in the rough set theory[J].Information Science,1998,107:149-167]。Zhu等给出了覆盖粗糙集中约简的概念和方法及相关概念之间的联系[Willam Zhu,Fei-yue Wang.Reduction and axiomization of covering generalized rough sets[J].Information Science,2003,152:217-230;William Zhu.Relationship among basicconcepts in covering-based rough sets[J].Information Sciences,2009,179(14):2478-2486]。陈文等讨论了覆盖粗糙集上近似的定义方法,提出了覆盖粗糙集最小上近似的概念[5]等等。另一方面,人们在基于经典粗糙集及不同的扩展粗糙集模型下的动态知识更新方面做了大量的工作,如Li等实现了多个属性同时增删时粗糙集模型中近似集的增量式更新方法[Li Tianrui,Ruan Da,Greet Wets,et al.A rough set basedcharacteristic relation approach for dynamic attribute generalization in datamining[J].Knowledge-Based Systems,2007,20(2):485-494.],并讨论了属性值变化下经典粗糙集和优势关系粗糙集模型下近似集的动态更新[Chen Hongmei,Li Tianrui,Qiao Shaojie,et al.A rough set based dynamic maintenance approach forapproximations in coarsening and refining attribute valves[J].InternationalJournal of Intelligent System.2010,25(10):1005-1026;季晓岚,李天瑞,邹维丽等.优势关系下属性值粗化细化时近似集分析[J].计算机工程.2010,36(12):33-35]。现有的基于覆盖广义粗糙集的理论体系有待进一步完善。
发明内容
本发明的目的是提供一种粗糙集扩展模型中近似集动态更新方法,以进一步完善基于覆盖广义粗糙集的理论体系,使其能够更好地应用于实际的需求。
本发明方法在已有理论体系的基础上,分析对象的邻域(对象的最小描述的交集)、边界域与近似集的关系,给出了覆盖粗糙集模型中近似集的增量更新方法。
本发明为解决上述技术问题采取的技术方案是:本发明所述的粗糙集扩展模型中近似集动态更新方法是基于以下定义来实现的:
定义1:一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;是信息函数f的值域,而Vα表示值域;表示信息系统的信息函数,fα为属性α的信息函数;
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
即覆盖粗糙集模型是Pawlak粗糙集模型的推广;
当时,称X关于近似空间<U,C>可定义的,否则称为粗糙的;
NB(x)=∩{K∈C;x∈K}
所述方法的具体过程为:
步骤A、属性集变化时近似集的性质分析过程为:
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述;在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确;当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化;下面当属性集变化时对近似集性质进行分析:
设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 则 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少,
设属性a∈A, 则
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 设 则有 由引理1知, 则有 即x∈C P∪{a} (X),所以有
设属性a∈A, 则
设属性a∈A, 则
设属性a∈A, 则
设属性集 a∈P,则
设属性集 a∈P,则
设属性集 a∈P,则
设属性集 a∈P,则
步骤B、属性集变化时近似集增量更新方法过程:
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
设属性集a∈P,则
其中
步骤C、具体过程描述为:
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法,那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新;
步骤C1、属性增加时近似集增量更新算法:
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X;
具体步骤:
步骤2、对于xi∈U,计算N(xi);
步骤7、重复步骤2、3、4,输出 算法结束;
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X;
具体步骤:
步骤2、对于xi∈U,计算N(xi);
步骤3、若xi∈X,且则将对象xi加入到对象子集X的下近似集中,即
步骤5、增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
步骤C2、属性减少时近似集动态增量更新算法:
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X;
输出:C P (X),
具体步骤为:
步骤2、对于xi∈U,计算N(xi);
步骤3、计算X的上、下近似C P (X),
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X;
具体步骤:
步骤1、计算由属性集中单个属性形成的覆盖元,构成U的一个覆盖CP;
步骤5、计算NP-{a}(x),若 则 转向步骤7;
本发明的有益效果是:
本发明方法给出了当属性集增加或减少时,在覆盖广义粗糙集模型中近似集的动态变化趋势及近似集的动态增量更新方法,不仅适用于单属性增加删除时近似集的增量更新,而且也适用于多个属性变化的情况,通过实例验证了这种方法的可行性,通过实验仿真验证所提出方法的性能,且从给出的实例的实验仿真说明,基于覆盖广义粗糙集理论的动态增量更新方法不但有效,而且在效率上也有所提高。
附图说明
图1属性增加时静态更新算法与动态更新算法比较图,图2属性减少时静态更新算法与动态更新算法比较图。
具体实施方式
具体实施方式一:如图1所示,本实施方式所述的粗糙集扩展模型中近似集动态更新方法是基于以下定义来实现的:
定义1:一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;是信息函数f的值域,而Vα表示值域;表示信息系统的信息函数,fα为属性α的信息函数;
定义2:设U是一有限非空论域,C是U上的一个子集族,若且∪C=U,则称C为论域U的一个覆盖,称元组<U,C>为覆盖近似空间;
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域。
结合定义3和定义4,容易得到N(x)=∩md(x);
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
即覆盖粗糙集模型是Pawlak粗糙集模型的推广;
当时,称X关于近似空间<U,C>可定义的,否则称为粗糙的;
NB(x)=∩{K∈C;x∈K}
所述方法的具体过程为:
步骤A、属性集变化时近似集的性质分析过程为:
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述;在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确;当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化;下面当属性集变化时对近似集性质进行分析:
设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 则 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少,(引理1)
设属性a∈A, 则
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 设 则有 由引理1知, 则有 即x∈C P∪{a} (X),所以有
设属性a∈A, 则 (推论1)
设属性a∈A, 则 (推论2)
设属性a∈A, 则 (推论3)
设属性集 a∈P,则 (定理2)
设属性集 a∈P,则 (推论4)
设属性集 a∈P,则 (推论5)
设属性集 a∈P,则 (推论6)
步骤B、属性集变化时近似集增量更新方法过程:
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
其中(定理3)
步骤C、具体过程描述为:
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法(所谓静态增量更新方法是指增加新属性后按照初始求近似集的算法计算),那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新;
步骤C1、属性增加时近似集增量更新算法:
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X。
具体步骤:
步骤2、对于xi∈U,计算N(xi);
步骤6、增加一个新的属性a产生新的覆盖元,合并原来的覆盖构成一个新的覆盖
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X。
具体步骤:
步骤2、对于xi∈U,计算N(xi);
步骤5、增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
步骤C2、属性减少时近似集动态增量更新算法:
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X;
具体步骤为:
步骤2、对于xi∈U,计算N(xi);
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X。
具体步骤:
步骤3计算X的上、下近似C P (X),
步骤5计算NP-{a}(x),若 则 转向步骤7;
针对本发明所述方法结合实例及实验数据再进行如下详细阐述:
1、相关知识
定义1[1](信息系统)一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;是信息函数f的值域,而Vα表示值域;表示信息系统的信息函数,fα为属性α的信息函数。
定义4[2]设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域。
结合定义3和定义4,容易得到N(x)=∩md(x)。
例1:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},K1∪K2∪K3=U,所以C={K1,K2,K3}是U的一个覆盖。则称元组<U,C>为覆盖近似空间。
例2:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},C={K1,K2,K3},C是U的一个覆盖,则e1,e2,e3,e4,e5,e6,e7,e8关于<U,C>的最小描述分别为:
md(e1)={K1},md(e2)={K1},md(e3)={K1,K2},md(e4)={K3},md(e5)={K3},
md(e6)={K2,K3},md(e7)={K3},md(e8)={K2,K3}。
定义4[2]设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域。
结合定义3和定义4,容易得到N(x)=∩md(x)。
例3:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},C={K1,K2,K3},C是U的一个覆盖,则e1,e3,e6邻域分别为:
md(e1)={K1}={e1,e2,e3,e5,e6},N(e1)=∩md(e1)={K1}={e1,e2,e3,e5,e6};
md(e3)={k1,K2}={{e1,e2,e3,e5,e6},{e3,e6,e8}},N(e3)=∩md(e3)=K1∩K2={e3,e6};
md(e6)={K1,K2,K3},N(e6)=∩md(e6)=K1∩K2∩K3={e6}。
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
即覆盖粗糙集模型是Pawlak粗糙集模型的推广。
例4:设U={e1,e2,e3,e4,e4,e5,e6,e7,e8},C是U上的一个子覆盖,K1={e1,e2,e3},K2={e3,e6,e8},K3={e4,e5,e6,e7,e8},K4={e5,e7},C={K1,K2,K3,K4},设X={e3,e5,e6,e7},则有
md(e1)={K1},N(e1)={K1}={e1,e2,e3},md(e2)={K1},N(e2)={K1}={e1,e2,e3},
md(e3)={K1,K2},N(e3)=K1∩K2={e3},md(e4)={K3},N(e4)={e4,e5,e6,e7,e8},
md(e5)={K3,K4},N(e5)=K3∩K4={E5,e7},md(e6)={K2,K3},N(e6)=K2∩K3={e6,e8},
md(e7)={K3,K4},N(e7)=K3∩K4={e5,e7},md(e8)={K2,K3},N(e3)=K2∩K3={e6,e8},
X关于覆盖近似空间<U,C>的下近似:
X关于覆盖近似空间<U,C>的上近似:
X关于覆盖近似空间<U,C>的边界域:
X关于覆盖近似空间<U,C>的正域:
posC(X)=C(X)={e3,e5,e7};
X关于覆盖近似空间<U,C>的负域:
NB(x)=∩{K∈C;x∈K}
2、属性集变化时近似集的性质分析
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述。在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确。当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化。下面当属性集变化时对近似集性质进行分析。
引理1设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 则 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少,
证明:此引理由定义3-7可直接得到,此处证明略。
定理1设属性a∈A, 则
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 设 则有 由引理1知, 则有 即x∈C P∪{a} (X),所以有
推论1设属性a∈A, 则
证明:定义7知, 又由定理1知, 所以有
推论2设属性a∈A, 则
证明:定义7知, 又由定理1知, 所以有
推论3设属性a∈A, 则
证明:边界域的定义可得: 又由定理1知, 所以有
定理2设属性集 a∈P,则
证明:证明过程的原理类似于定理1,此处略。
推论4设属性集 a∈P,则
证明:证明过程的原理类似于推论1,此处略。
推论5设属性集 a∈P,则
证明:证明过程的原理类似于推论2,此处略。
推论6设属性集 a∈P,则
证明:证明过程的原理类似于推论3,此处略。
3、属性集变化时近似集增量更新方法
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
证明:由定理2知, 又由定义7知, 所以有 所以有 由推论4知, 所以有
定理5设属性a∈A, 则
证明:由定理2知, 又由定义7知 所以有 所以有 由推论5知, 所以有
例5[:设U={x1,x2,x3,x4,x5,x6,x7,x8,x9}为九幢房子,
P={price,color,structure,surrounding}为属性集,“price”取值为{high,middle,low},“color”取值为{good,bad},“structure”取值为{reasonable,ordinary,unreasonable},“surrounding”取值为{quiet,a little noisy,noisy,very noisy}。有四个专家参与评估房子的各种属性状态,分别为{A,B,C,D},四人评估的结果可能各不相同。评估结果如下:
“price”:
A:high={x1,x4,x5,x7},middle={x2,x8},low={x3,x6,x9}
B:high={x1,x2,x4,x7,x8},middle={x5},low={x3,x6,x9}
C:high={x1,x4,x7},middle={x8},low={x2,x3,x5,x6,x9}
D:high={x1,x4,x7},middle={x5},low={x2,x3,x6,x8,x9}
“color”:
A:good={x1,x2,x3,x6},bad={x4,x5,x7,x8,x9}
B:good={x1,x2,x3,x5},bad={x4,x6,x7,x8,x9}
C:good={x1,x2,x3,x4},bad={x5,x6,x7,x8,x9}
D:good={x1,x2,x3},bad={x4,x5,x6,x7,x8,x9}
“structure”:
A:reasonable={x1,x2,x3},ordinary={x4,x5,x6,x7,x8},unreasonable={x9}
B:reasonable={x1,x2,x3},ordinary={x4,x5,x6,x7,x9},unreasonable={x8}
C:reasonable={x1,x2,x3},ordinary={x4,x5,x6,x8,x9},unreasonable={x7}
D:reasonable={x1,x2,x3},ordinary={x4,x5,x6},unreasonable={x7,x8,x9}
“surrounding”:
A:quiet={x1,x2},alittle noisy={x3,x6},noisy={x4,x5,x7},very noisy={x8,x9}
B:quiet={x1,x5},alittle noisy={x2,x3},noisy={x4,x7,x8},very noisy={x6,x9}
C:quiet={x1},alittle noisy={x2,x3},noisy={x4,x7,x8},very noisy={x5,x6,x9}
D:quiet={x1,x2,x4},alittle noisy={x3,x5},noisy={x7,x8},very noisy={x6,x9}
假设每位专家的评估结果具有相同的重要度,如果要全面综合这些意见,我们可以将四个专家给出的某个属性值的所有对象合并在一起,这样就形成了论域U的覆盖,代表四个属性:
“price”Ca:
high={x1,x2,x4,x5,x7,x8},middle={x2,x5,x8},low={x2,x3,x5,x6,x8,x9}
“color”Cb:
good={x1,x2,x3,x4,x5,x6},bad={x4,x5,x6,x7,x8,x9}
“structure”Cc:
reasonable={x1,x2,x3},ordinary={x4,x5,x6,x7,x8,x9},unreasonable={x7,x8,x9}
“surrounding”Cd:
quiet={x1,x2,x4,x5},a little noisy={x2,x3,x5,x6},noisy={x4,x5,x7,x8},very noisy={x5,x6,x8,x9}
给定集合X={e1,x3,e5,e8},下面我们讨论增加和删除属性时,关于集合X的下近似和上近似的更新。
1增加一个新的属性
设P={a,b,d},因此有,Cp={Ka1,Ka2,Ka3,Kb1,Kb2,Kd1,Kd2,Kd3,Kd4},NP(x1)={x1,x2,x4,x5},NP(x2)={x2,x5},NP(x3)={x2,x3,x5,x6},NP(x4)={x4,x5},NP(x5)={x5},NP(x6)={x5,x6},NP(x7)={x4,x5,x7,x8},NP(x8)={x5,x8},NP(x9)={x5,x6,x8,x9},C P (X)={x5},
为求C p∪{c} (X),我们首先计算Y和C {c} {X)。
N{c}(x)={N{c}(x1),N{c}(x3),N{c}(x5),N{c}(x8)},
NP(x)∩N{c}(x)={NP∪{c}(x1),NP∪{c}(x3),NP∪{c}(x5),NP∪{c}(x8)}。
因此,C P∪{c} (X)=CP(X)∪C {c} (X)∪Y={x3,x5,x8}。
因此,
2删除一个属性
设P={a,b,c},因此有,Cp={Ka1,Ka2,Ka3,Kb1,Kb2,Kc1,Kc2,Kc3},NP(x1)={x1,x2},NP(x2)={x2},NP(x3)={x3},NP(x4)={x4,x5},NP(x5)={x5},NP(x6)={x5,x6},NP(x7)={x7,x8},NP(x8)={x8},NP(x9)={x8,x9},C P (X)={x3,x5,x8},
i.设属性c∈P,将属性c从P中删除,集合X的下近似更新如下:
ii.设属性c∈P,将属性c从P中删除,集合X的上近似更新如下:
4、算法思想及其描述
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法(所谓静态增量更新方法是指增加新属性后按照初始求近似集的算法计算),那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新。
4.1属性增加时近似集增量更新算法
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X。
具体步骤:
步骤2对于xi∈U,计算N(xi);
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X。
具体步骤:
步骤2对于xi∈U,计算N(xi);
步骤5增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
3.算法的性能分析
在当前的信息系统中,论域U中对象的个数用|U|来表示,论域U中属性的个数用|C|来表示,论域U中每个属性值域的个数用来表示,即根据属性的值域可生成该信息系统的覆盖元,这些覆盖元形成关于该属性对于信息系统的一个覆盖,依此类推,该信息系统的所有属性形成的覆盖构成一族覆盖,这一族覆盖包含的覆盖元的个数为当册除某一属性时,采用静态更新的方法对信息系统中对象计算覆盖元的时间复杂度为计算每个对象邻域的时间复杂度为计算近似集的时间复杂度为则整个求近似集的总花费时间复杂度为 即故用静态更新近似集总的时间复杂度为即采用动态更新方法而言,当属性增加之后,该属性值对|U|个对象形成成t个覆盖元构成U的一个覆盖,计算t个覆盖元及|U|个对象的邻域时间复杂度为O(|U|),此时,动态更新近似集总的时间复杂度为下面对两个算法计算等价类的时间复杂度进行比较。由于t<|C|,所以 因此,动态更新算法的时间复杂度远低于静态更算法的时间复杂度。
4.2实验测试及其分析
该章的算法测试实验采用VC#.NET作为编程语言,在Visual Studio 2005开发平台中实现仿真,程序运行环境为:Windows XP操作系统,Intel(R)Pentium Dual CPU处理器,2G内存。静态更新算法和动态更新算法分别对6个数据集进行了实验仿真,验证了属性增加时覆盖广义粗糙集模型中近似集动态更新算法的有效性,这6个数据集均是从UCI数据库中选取的数据集,这些数据集的名称依次为:Ballons DataBases、ZooDataBases、Monk’s Problem、Yeast DataBases、Abalone DataBases、Mushroom DataBases。由于所选取的数据集的属性个数不同、对象集大小的不同,为了更好、更准确地反映动态更新算法的高效性,本次算法测试实验过程中,对于每一个数据集均随机选取对象集的20%作为集合X,从每个数据集中选取4个属性作为原始属性集,然后对每个数据集进行单个属性增加,同时运行两种算法,由于算法的运行时间和当前CPU使用率、及当前内存的使用、及电脑内部的温度都有关,所以同一数据集两种算法同时运行五次,记录每个算法的运行时间求总和取平均值作为每次近似集更新近似集的平均时间。得到如表1所示的静态更新算法和动态更新算法计算近似集的时间比较表。
表1静态更新算法与动态更新算法结果比较
覆盖粗糙集模型中,当单个属性增加的时候,静态更新算法与动态更新算法计算近似集运行时间的比较图如图1所示。
由表1和图1可知,当数据集中属性个数选择相同,对象个数较少时,静态更新算法和动态更新算法的效率差不多,耗费的时间都比较少。随着数据集中对象集的个数的增加,动态更新算法的耗费的时间呈缓慢增长趋势,而静态更新算法的消耗的时间却呈较快的速度增长。因此,在大型信息系统中,动态更新算法的效率要明显地高于静态更新算法。原因在于动态环境下当属性增加时,采用静态更新算法计算近似集需要重新计算所有属性的覆盖元,在求每个对象的邻域时又要重复进行覆盖元的比较及求其交集,这个过程会耗费大量重复计算的时间,对于动态更新算法而言,只需要对新增加的属性根据其值求其覆盖元及对象的邻域,且这一过程耗费的时间极少,几乎可以忽略不计,这样就大大提高了效率。因此,对于海量数据的信息系统来说,从时间的角度考虑,采用动态增量更新算法具计算近似集效率明显高于静态更新算法计算近似集。
4.3属性减少时近似集动态增量更新算法
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X。
具体步骤:
步骤2对于xi∈U,计算N(xi);
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X。
具体步骤:
步骤1计算由属性集中单个属性形成的覆盖元,构成U的一个覆盖CP;
步骤5计算NP-{a}(x),若 则 转向步骤7;
步骤6若 则
3.算法的性能分析
在当前的信息系统中,论域U中对象的个数用|U|来表示,论域U中属性的个数用|C|来表示,论域U中每个属性值域的个数用来表示,即根据属性的值域可生成该信息系统的覆盖元,这些覆盖元形成关于该属性对于信息系统的一个覆盖,依此类推,该信息系统的所有属性形成的覆盖构成一族覆盖,这一族覆盖包含的覆盖元的个数为当册除某一属性时,采用静态更新的方法对信息系统中对象计算覆盖元的时间复杂度为计算每个对象邻域的时间复杂度为计算近似集的时间复杂度为则整个求近似集的总花费时间复杂度为 即故用静态更新近似集总的时间复杂度为即采用动态更新方法而言,首先对当前要删除的某一属性作标记,该属性值对|U|个对象形成成t个覆盖元构成U的一个覆盖,计算t个覆盖元及|U|个对象的邻域时间复杂度为O(|U|),然后计算删除属性后,对象集的邻域,其时间复杂度为此时,若删除属性后集合X的邻域并集不变,则动态更新近似集总的时间复杂度为下面对两个算法计算等价类的时间复杂度进行比较。由于t<|C|-1,所以因此,动态更新算法的时间复杂度远低于静态更算法的时间复杂度。
4.4实验测试及其分析
静态更新算法和动态更新算法分别对6个数据集进行了实验仿真,验证了属性增加时覆盖广义粗糙集模型中近似集动态更新算法的有效性。本次算法测试实验过程中,对于每一个数据集均随机选取对象集的10%作为集合X,从每个数据集中选取5个条件属性作为原始属性集,然后对每个数据集进行单个属性减少,同一数据集两种算法同时运行五次,记录每个算法的运行时间求总和取平均值作为每次近似集更新近似集的平均时间。得到如表2所示的静态更新算法和动态更新算法计算近似集的时间比较表。
表2静态更新算法与动态更算法结果比较
覆盖粗糙集模型中,当单个属性增加的时候,静态更新算法与动态更新算法计算近似集运行时间的比较图如图2所示。
由表2和图2可知,当数据集中属性个数相同,对象个数较少时,静态更新算法动态更新算法的效率差不多,花费的时间代价都比较少。当数据集中对象个数较快增长时,动态更新算法的耗时增长非常缓慢,而静态更新算法的消耗的时间却呈较快的速度增长。因此,动态更新算法更适合于大型的信息系统,其效率明显高于静态更新算法。原因在于动态环境下当属性删除时,采用静态更新算法计算近似集需要重新计算所有属性的覆盖元,在求每个对象的邻域时又要重复进行覆盖元的比较及求其交集,这个过程会耗费大量重复计算的时间,对于动态更新算法而言,不需要对删除属性后的信息系统求剩余的覆盖元,且求对象集的邻域时只需对集合X所包含的对象求其邻域,这样就大大节省了时间,提高了效率。因此,对于海量数据的大型信息系统来说,当信息随着外界变化而动态变化时,求其变化后的近似集采用动态更新算法远远优于采用静态更新算法。
总结:讨论了当属性集增加或减少时,在覆盖广义粗糙集模型中近似集的动态变化趋势及近似集的动态增量更新方法,不仅适用于单属性增加删除时近似集的增量更新,而且也适用于多个属性变化的情况,通过实例验证了这种方法的可行性,通过实验仿真验证所提出方法的性能,且从给出的实例的实验仿真说明,基于覆盖广义粗糙集理论的动态增量更新方法不但有效,而且在效率上也有所提高。
参考文献
[1]Pawlak Zdzistaw.Rough sets[J].International Journal of Computer andInformation Sciences,1982,11(5):341-356.
[2]Zbigniew Boinkowski,Edward Bryniarski,Urszula Wybraniedc-Skardowska,Extensions and intentions in the rough set theory[J].Information Science,1998,107:149-167.
[3]Willam Zhu,Fei-yue Wang.Reduction and axiomization of covering generalizedrough sets[J].Information Science,2003,152:217-230.
[4]William Zhu.Relationship among basic concepts in covering-based rough sets[J].Information Sciences,2009,179(14):2478-2486.
[5]陈文,祝峰,汤建国.覆盖粗糙集上近似的研究[J].广西师范大学学报:自然科学版,2010,28(3):93-97.
[6]Li Tianrui,Ruan Da,Greet Wets,et al.A rough set based characteristicrelation approach for dynamic attribute general ization in data mining[J].Knowledge-Based Systems,2007,20(2):485-494.
[7]Chen Hongmei,Li Tianrui,Qiao Shaojie,et al.A rough set based dynamicmaintenance approach for approximations in coarsening and refining attributevalves[J].International Journal of Intelligent System.2010,25(10):1005-1026.
[8]季晓岚,李天瑞,邹维丽等.优势关系下属性值粗化细化时近似集分析[J].计算机工程.2010,36(12):33-35.
Claims (1)
1.一种粗糙集扩展模型中近似集动态更新方法,所述方法是基于以下定义来实现的:
定义1:一个信息系统以四元组S=(U,A,V,f)表示,其中,U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;A={α|α∈A}称为属性集;是信息函数f的值域,而Vα表示值域;表示信息系统的信息函数,fα为属性α的信息函数;
定义3:设<U,C>为覆盖近似空间,x∈U,则定义x关于<U,C>的最小描述为:
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
定义4:设<U,C>为覆盖近似空间,对任意x∈U,N(x)=∩{K∈C;x∈K}称为x的邻域;
结合定义3和定义4,容易得到N(x)=∩md(x);
X关于近似空间<U,C>的正域posC(X),负域negC(X)和边界域bnC(X)分别定义为:posC(X)=C(X),
即覆盖粗糙集模型是Pawlak粗糙集模型的推广;
当时,称X关于近似空间<U,C>可定义的,否则称为粗糙的;
定义6:设覆盖近似空间<U,C>,U是一有限非空论域,C是由属性集B生成的覆盖元所构成的U上的一个子覆盖,对于任意的x∈X关于属性集B的邻域为:
NB(x)=∩{K∈C;x∈K}
其特征在于:所述方法的具体过程为:
步骤A、属性集变化时近似集的性质分析过程为:
在覆盖粗糙集中,一个覆盖表示知识库中的某种知识,覆盖元代表知识粒,由覆盖生成的集合逼近则代表基于知识库对某事物的刻画和描述;在信息系统中,根据对象的属性值生成覆盖元,所有的属性生成的覆盖元放在一起,构成论域U上的一个覆盖,属性集元素个数越多,则覆盖元个数越多,由覆盖生成的集合逼近则对某事物的刻画和描述越精确;当属性集变化时,由属性构成的覆盖发生变化,近而影响对给定的集合的上、下近似集及边界域的变化;下面当属性集变化时对近似集性质进行分析:
设<U,C>是一个覆盖近似空间,即U是一个非空有限集合。A是U的属性集,对于 则 构成的U一个覆盖,向属性集P添加一个属性a,C{a}={Ka1,Ka2,…,Kas},则CP∪{a}=CP∪C{a}仍是U的一个覆盖,此时有,且有NP∪{a}(x)=NP(x)∩N{a}(x)。相反,若从P中删除一个属性,则覆盖元减少,
设属性a∈A, 则
证明对于属性集P,其构成的覆盖为CP,对于属性集P∪{a},其构成的覆盖为CP∪{a}=CP∪C{a},且 设 则有 由引理1知, 则有 即x∈C P∪{a} (X),所以有
设属性a∈A, 则
设属性a∈A, 则
设属性a∈A, 则
设属性集 a∈P,则
设属性集 a∈P,则
设属性集 a∈P,则
设属性集 a∈P,则
步骤B、属性集变化时近似集增量更新方法过程:
C P∪{a} (X)=C P (X)∪C {a} (X)∪Y
步骤C、具体过程描述为:
当属性增加时,信息系统关于新增属性会形成新的覆盖元,这些覆盖元构成论域的一个覆盖,那么新增属性所形成的覆盖元与原来属性所形成的覆盖元合并在一起也构成论域的一族覆盖。对于近似集的更新,如果是采用静态增量更新方法,那么,系统会把所有的覆盖元合并在一起从新计算给定集合的上近似集、下近似集,会花费很多时间和空间去重复计算,为了节省时间和空间,以便更及时地去更新信息,则宜采用动态的更新方法,因为在属性增加时,增加了新的覆盖元,根据上近似集、下近似的定义及求解原理知,上近似集、下近似是所包含对象的最小描述的交集,那么所包含对象的最小描述的交集即对象的邻域。属性增加,对于给定集合中所包含的对象的邻域的并集形成一种分解,如果增加属性后集合X所包含的对象集的邻域的并集大小没有改变,那么说明添加的属性对集合X的上近似集、下近似集没有影响,即集合X的上近似集、下近似集大小不变;如果增加属性后集合X所包含的对象集的邻域的并集发生了变化,则说明添加属性后对集合X的上近似集、下近集产生了影响,即集合X的上近似集、下近似集发生了变化,此时根据对象的邻域与近似集的关系,利用动态增量更新方法对近似集进行增量更新效率更高。当某一属性删除时,由删除该属性后所形成的覆盖元随之减少,分析属性删除后,集合X所包含的对象集的邻域的并集是否发生了变化,如果对象的邻域的并集保持原大小,则说明属性删除对集合X的上近似集、下近似集并没有产生影响,则集合X的上近似集、下近似集的大小保持不变;如果删除某一属性后对于给定集合中所包含的对象的邻域变大,此时,可以利用对象的邻域、集合的边界域与近似集的关系,利用近似集动态增量更新算法进行更新;
步骤C1、属性增加时近似集增量更新算法:
1.静态新增属性算法描述:
输入:S=(U,A,V,f),X;
具体步骤:
步骤2、对于xi∈U,计算N(xi);
2.动态增量更新算法描述:
输入:S=(U,A,V,f),X;
具体步骤:
步骤2、对于xi∈U,计算N(xi);
步骤5、增加一个新的属性a产生新的覆盖元,构成一个新的覆盖,计算N{a}(x);
步骤C2、属性减少时近似集动态增量更新算法:
1.静态删除属性算法描述:
输入:S=(U,A,V,f),X;
具体步骤为:
步骤2、对于xi∈U,计算N(xi);
步骤3、计算X的上、下近似C P (X),
2.动态删除属性增量更新算法:
输入:S=(U,A,V,f),X;
具体步骤:
步骤5、计算NP-{a}(x),若 则 转向步骤7;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102618842A CN102279839A (zh) | 2011-09-06 | 2011-09-06 | 粗糙集扩展模型中近似集动态更新方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102618842A CN102279839A (zh) | 2011-09-06 | 2011-09-06 | 粗糙集扩展模型中近似集动态更新方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102279839A true CN102279839A (zh) | 2011-12-14 |
Family
ID=45105294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102618842A Pending CN102279839A (zh) | 2011-09-06 | 2011-09-06 | 粗糙集扩展模型中近似集动态更新方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102279839A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064908A (zh) * | 2012-12-18 | 2013-04-24 | 北京讯鸟软件有限公司 | 一种通过内存快速去重名单的方法 |
CN107391660A (zh) * | 2017-07-18 | 2017-11-24 | 太原理工大学 | 一种用于子话题划分的诱导划分方法 |
-
2011
- 2011-09-06 CN CN2011102618842A patent/CN102279839A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064908A (zh) * | 2012-12-18 | 2013-04-24 | 北京讯鸟软件有限公司 | 一种通过内存快速去重名单的方法 |
CN103064908B (zh) * | 2012-12-18 | 2016-03-16 | 北京讯鸟软件有限公司 | 一种通过内存快速去重名单的方法 |
CN107391660A (zh) * | 2017-07-18 | 2017-11-24 | 太原理工大学 | 一种用于子话题划分的诱导划分方法 |
CN107391660B (zh) * | 2017-07-18 | 2021-05-11 | 太原理工大学 | 一种用于子话题划分的诱导划分方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | A hybrid method of dynamic cooling and heating load forecasting for office buildings based on artificial intelligence and regression analysis | |
Lin et al. | Short-term power prediction for photovoltaic power plants using a hybrid improved Kmeans-GRA-Elman model based on multivariate meteorological factors and historical power datasets | |
Wu et al. | The impact of urbanization on carbon emissions in developing countries: a Chinese study based on the U-Kaya method | |
CN104534507B (zh) | 一种锅炉燃烧优化控制方法 | |
Han et al. | Energy saving of buildings for reducing carbon dioxide emissions using novel dendrite net integrated adaptive mean square gradient | |
WO2023201552A1 (en) | County-wide photovoltaic prediction method based on cluster division and data enhancement | |
CN111754037A (zh) | 区域终端集成供能系统长期负荷混合预测方法 | |
Yongsheng et al. | A Short‐Term Power Output Forecasting Model Based on Correlation Analysis and ELM‐LSTM for Distributed PV System | |
CN108398982A (zh) | 一种局部阴影下光伏阵列的最大功率跟踪方法 | |
CN108984830A (zh) | 一种基于模糊网络分析的建筑能效评价方法及装置 | |
Sun et al. | The Impact of Multi-Dimensional Urbanization on China's Carbon Emissions Based on the Spatial Spillover Effect. | |
CN102279839A (zh) | 粗糙集扩展模型中近似集动态更新方法 | |
Li et al. | Improvement for energy efficiency and control characteristics in variable air volume system using in-situ sensor calibration method based on autoencoder | |
Wang et al. | A multicriteria evaluation and cascaded optimization framework for integrated energy system of steel industry | |
Guo et al. | Based on ANN and many-objective optimization to improve the performance and economy of village houses in Chinese cold regions | |
CN107846039A (zh) | 考虑风速相关性的集群风电并网建模分析方法及系统 | |
CN104408531B (zh) | 一种多维多阶段复杂决策问题的均匀动态规划方法 | |
Xiong et al. | Evaluation method for energy saving effect of passive ultra low energy consumption buildings based on fuzzy grey clustering method | |
de Wilde et al. | Energy modelling | |
Zhang et al. | Energy economy and energy structure optimization countermeasures based on big data mining | |
Zhan et al. | Dual-objective building retrofit optimization under competing priorities using Artificial Neural Network | |
Bilal et al. | Energy Efficient Buildings in the Industry 4.0 Era: A Review | |
Gao et al. | The Application of Particle Swarm Optimization in Neural Networks | |
Wu et al. | A Multi-Objective Optimization Model for Sustainable Building Design Using Genetic Algorithm and Fuzzy Set Theory | |
Yingzi et al. | Forecast of power generation for grid-connected photovoltaic system based on Pawlak Attribute Importance Algorithm of Rough Sets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20111214 |