CN102306190A - 粗糙集中属性集变化时规则集动态更新方法 - Google Patents
粗糙集中属性集变化时规则集动态更新方法 Download PDFInfo
- Publication number
- CN102306190A CN102306190A CN201110255897A CN201110255897A CN102306190A CN 102306190 A CN102306190 A CN 102306190A CN 201110255897 A CN201110255897 A CN 201110255897A CN 201110255897 A CN201110255897 A CN 201110255897A CN 102306190 A CN102306190 A CN 102306190A
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- decision
- attribute
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
粗糙集中属性集变化时规则集动态更新方法,它涉及一种规则集动态更新方法。本发明方法从近似集动态变化角度来讨论决策规则集的动态变化规律,同时也提出了在条件属性集和决策属性集同时变化时决策规则集的变化规律,并给出了条件属性增加、删除时决策规则集动态增量更新方法。技术要点:针对动态决策信息系统中属性集变化时,分析了动态规则的变化趋势,提出了属性集变化时动态规则更新算法,并通过实例验证了其正确性。以后的主要工作通过实验仿真测试规则增量更新算法的性能,以及分析扩展粗糙集模型下属性集变化时规则集的动态变化及规则增量更新,辅助各应用领域做出更好的决策。
Description
技术领域
本发明涉及一种规则集动态更新方法。
背景技术
随着网络信息技术的快速发展,各个领域的数据急剧膨胀,在决策信息系统中,数据集也随着外部信息世界的变化而不断发生变化。当属性增加、删除时,会引起对象的分类变化,进而引起近似集的变化,相应地,对决策规则产生一定的影响。规则的动态更新是粗糙集领域中的研究热点。其中一个方面的工作是根据区分矩阵、核进行规则的动态更新,如杨明提出的一种基于改进差别矩阵的核增量式更新算法[一种基于改进差别矩阵的属性约简增量式更新算法[J].计算机学报,2007,30(5):815-822];在集值粗糙集模型中邹维丽等提出了近似集的动态增量更新方法[邹维丽,陈红梅,胡成祥等.集值粗糙集模型的近似集增量更新方法研究[J].广西师范大学学报(自然科学版),2009,27(3):96-99];胡成祥等提出了基于限制容差关系的近似集增量更新方法[胡成祥,李天瑞,邹维丽等.基于限制容差关系的粗糙集模型中近似集增量更新方法研究[J].西南民族大学学报(自然科学版),2009,35(3):480-484];陈红梅等研究了在变精度模型下对象变化时近似集增量更新方法[Chen H.M.,LiT.R.Dynamic maintenance methods forapproximations based variable precision rough set[C].2010 3rdInternational Conference on Advanced Computer Theory and Engineering(ICACTE 2010),Chengdu,China.2010:269-274];季晓岚等对优势关系下属性值粗化细化时近似集性质进行了分析[季晓岚,李天瑞,邹维丽等.优势关系下属性值粗化细化时近似集分析[J].计算机工程.2010,36(12):33-35]。刘伟斌等在特性关系粗糙集下属性值粗化细化时对近似集增量更新方法进行了研究[刘伟斌,李天瑞,邹维丽等.特性关系粗糙集下属性值粗化细化时近似集增量更新方法研究[J].计算机科学.2010,37(6):248-251];吕国英、钱宇华等基于动态粒度原理,提出双向近似的概念,并将其应用于决策表中决策规则的获取[吕国英,钱宇华等.动态粒度下的粗糙集双向近似[J].计算工程与应用.2009,45(4):165-168];属性增加或删除时,在属性集变化情形下,关于决策规则集变化趋势以及规则集更新研究很少。钱宇华、梁吉业等研究了属性个数增减、属性取值改变对知识粒度变化的影响,并建立了知识粒度与规则确信度之间的动态关系[钱宇华,梁吉业等.决策表决策规则与知识粒度[J].电脑开发与应用,2006,19(3):27-29.]。其主要思想是从规则的确信度的角度来研究决策规则集的动态变化情况。
发明内容
本发明的目的是提供一种粗糙集中属性集变化时规则集动态更新方法,从近似集动态变化角度来讨论决策规则集的动态变化规律,同时也提出了在条件属性集和决策属性集同时变化时决策规则集的变化规律,并给出了条件属性增加、删除时决策规则集动态增量更新方法。
本发明为解决上述技术问题采取的技术方案是:本发明所述的粗糙集中属性集变化时规则集动态更新方法基于以下定义来实现的:
并且X的R-下近似也称为正区域,记为posR(X);
定义2:设给定一个论域U和论域U上的一个等价关系R,以及论域U的一个划分π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R;其中子Xi(i=1,2,…,n)是划分π(U)的等价类;π(U)的R下近似和上近似分别为:
定义3:一个决策信息系统以四个元组T=(U,C∪D,V,f)表示,其中U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;C∪D:C={α|α∈C}称为条件属性集,每个αi∈C(1≤j≤m)称为C的一个简单属性;D={d|d∈D}称为决策系统属性集,且 是信息函数f的值域,而Vα表示值域;表示决策系统的信息函数,fα为属性α的信息函数;
定义4:设T=(U,C∪D,V,f)是一个决策信息系统,令Xi和Yi分别代表U/(C)与U/(D)中的各个等价类,des(Xi)表示对等价类的描述,即等价类Xi对于各条件属性值的特定取值;des(Yi)表示对等价类的描述,即等价类Yi对于各决策属性值的特定取值,则决策规则如下:
定义5:给定决策信息系统T=(U,C∪D,V,f),Xi∈U/IND(C),Yi∈U/IND(D),有
当μ(Xi,Yi)=1时,rij是确定性规则;当0<μ(Xi,Yj)<1时,rij是不确定规则,或者说是近似规则。μ(Xi,Yj)可解释为论域中给定对象属于Xi时,该对象属于Yj的概率;
在粗糙集模型中不可分辨类或等价类被看作是基本粒,任意给定的一个属性子集都可以诱导出对象集上的一个等价关系。一般来说,从细粒度层次到粗粒度层次的转换可以通过减少该属性子集中的元素来实现,而通过向该属性子集增添新的属性则可以实现从粗粒度层次到细粒度层次的转换:
对论域U,设α1,α2,…αt是属性集, 若 则有
对论域U,设α1,α2,…αt是属性集, 是属性α1,α2,…,αt-1,αt决定的元素等价类,若 则有
知识的粗化细化能够表达出知识分辨能力的变化;
所述方法的具体过程为:
A1、当属性增加删除时近似集的变化情况时:
A11、属性增加是对知识的细化,以下引理成立:
设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R。其中,子集Xi(i=1,2,…,n)是划分π(U)的等价类。属性r为新增加的属性(知识细化),π(U)的近似集的变化情况为: R′(π(U)), 分别表示知识细化后近似分类的上、下近似;(引理1)
由此可以得出,在粗糙集模型下,当属性增加时下近似集基数及上近似集基数是不减;
A12、属性删除是对知识的粗化,以下引理成立:
设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分(或称完备分类)π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R;其中子集Xi(i=1,2,…,n)是划分π(U)的等价类;R中的属性r删除(知识粗化),π(U)的近似集的变化情况为: (引理2)
R′(π(U)),分别表示知识粗化后近似分类的上、下近似;
可以得出,在粗糙集模型下,当属性删除时下近似集基数及上近似集基数是不增的;
A2、当属性增加删除时决策规则集变化分析
当属性增加删除时可能会起引近似集的变化,由粗糙集理论的基本概念知,通过近似集可以得到决策规则集,所以近似集的变化势必引起决策规则集的变化;
在决策信息系统中T=(U,C∪D,V,f),当按条件属性形成等价类精确包含在按决策属性集形成的等价类中,对应着确定性规则,即下近似集对应着决策系统的确定性规则,边界域对应着不协调决策系统的不确定性规则;
设L={l1,l2,…,lm}是决策表T=(U,C∪D,V,f)的确定性决策规则集,在属性集增加或删除单个属性或多个属性后,确定性决策规则集变化为L′={l′1,l′2,…,l′n}。在决策信息系统中,属性集变化时决策规则集的变化分为以下三种情况讨论:
A21、条件属性集变化,决策属性集不变;
A22、条件属性集不变,决策属性集变化;
A23、条件属性集和决策属性集同时变化:
以上表明,在决策信息系统中,当条件属性集增加,决策属性集减少时,确定性规则集基数是不减的;当决策属性集增加,条件属性集减少时,确定性规则集基数是不增的;当条件属性集与决策属性集同时变化时,依几种不同的情况规则集呈不同的变化;
步骤B、当属性增加、删除时决策规则集增量更新方法:
单属性决策信息系统中,利用近似集的增量来实现条件属性增加、删除时决策规则集的更新过程为:
在决策系统T=(U,C∪D,V,f)中,U是论域,C是条件属性集,D是决策属性,V为论域的属性值。设属性集B对U的划分所形成的等价类为EB={EB1,EB2,…,EBn},决策属性d∈D对U的划分所形成的等价类为Ed={Ed1,Ed2,…,Edm},Ed关于条件属性集B的上近似集和下近似集分别用 表示。条件属性集B添加一个属性a后的上近似集和下近似集分别用 表示;从条件属性集B删除一个属性b后的上近似集和下近似集分别用 表示。ΔAprB(Ed)表示属性集变化后下近似集的增量,表示属性集变化后上近似集的增量。决策规则集用表示,设rik:des(Ei)→des(Ej)表示为新增规则;
B1、条件属性增加时决策规则集增量更新算法:
输入T=(U,C∪D,V,f),现有决策规则集M,新增属性a;
输出更新后的决策规则集M′;
步骤1、计算Apr B (Ed),
步骤7输出更新后的决策规则集M′,算法结束;
B2、条件属性删除时决策规则集增量更新算法:
输入 T=(U,C∪D,V,f),现有决策规则集M,删除属性b;
输出 更新后的决策规则集M′;
步骤3、若 则决策规则集M不变;
步骤7输出更新后的决策规则集M′,算法结束。
本发明的有益效果是:
针对动态决策信息系统中属性集变化时,分析了动态规则的变化趋势,提出了属性集变化时动态规则更新算法,并通过实例验证了其正确性。以后的主要工作通过实验仿真测试规则增量更新算法的性能,以及分析扩展粗糙集模型下属性集变化时规则集的动态变化及规则增量更新,辅助各应用领域做出更好的决策。
具体实施方式
具体实施方式一:本实施方式所述的粗糙集中属性集变化时规则集动态更新方法基于以下定义来实现的:
并且X的R-下近似也称为正区域,记为posR(X);
定义2:设给定一个论域U和论域U上的一个等价关系R,以及论域U的一个划分π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R;其中子Xi(i=1,2,…,n)是划分π(U)的等价类;π(U)的R下近似和上近似分别为:
定义3:一个决策信息系统以四个元组T=(U,C∪D,V,f)表示,其中U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;C∪D:C={α|α∈}称为条件属性集,每个αj∈C(1≤j≤m)称为C的一个简单属性;D={d|d∈D}称为决策系统属性集,且 是信息函数f的值域,而Vα表示值域;表示决策系统的信息函数,fα为属性α的信息函数;
定义4:设T=(U,C∪D,V,f)是一个决策信息系统,令Xi和Yj分别代表U/(C)与U/(D)中的各个等价类,des(Xi)表示对等价类的描述,即等价类Xi对于各条件属性值的特定取值;des(Yj)表示对等价类的描述,即等价类Yj对于各决策属性值的特定取值,则决策规则如下:
rij:des(Xi)→des(Yj),
定义5:给定决策信息系统T=(U,C∪D,V,f),Xi∈U/IND(C),Yj∈U/IND(D),有
当μ(Xi,Yj)=1时,rij是确定性规则;当0<μ(Xi,Yj)<1时,rij是不确定规则,或者说是近似规则。μ(Xi,Yj)可解释为论域中给定对象属于Xi时,该对象属于Yj的概率;
在粗糙集模型中不可分辨类或等价类被看作是基本粒,任意给定的一个属性子集都可以诱导出对象集上的一个等价关系。一般来说,从细粒度层次到粗粒度层次的转换可以通过减少该属性子集中的元素来实现,而通过向该属性子集增添新的属性则可以实现从粗粒度层次到细粒度层次的转换:
对论域U,设α1,α2,…αt是属性集, 是属性α1,α2,…,αt-1,αt决定的元素等价类,若 则有
知识的粗化细化能够表达出知识分辨能力的变化;
所述方法的具体过程为:
A1、当属性增加删除时近似集的变化情况时:
A11、属性增加是对知识的细化,以下引理成立:
设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R。其中,子集Xi(i=1,2,…,n)是划分π(U)的等价类。属性r为新增加的属性(知识细化),π(U)的近似集的变化情况为: R′(π(U)), 分别表示知识细化后近似分类的上、下近似;(引理1)
由此可以得出,在粗糙集模型下,当属性增加时下近似集基数及上近似集基数是不减;
A12、属性删除是对知识的粗化,以下引理成立:
设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分(或称完备分类)π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R。其中子集Xi(i=1,2,…,n)是划分π(U)的等价类。R中的属性r删除(知识粗化),π(U)的近似集的变化情况为: (引理2)
可以得出,在粗糙集模型下,当属性删除时下近似集基数及上近似集基数是不增的;
A2、当属性增加删除时决策规则集变化分析
当属性增加删除时可能会起引近似集的变化,由粗糙集理论的基本概念知,通过近似集可以得到决策规则集,所以近似集的变化势必引起决策规则集的变化;
在决策信息系统中T=(U,C∪D,V,f),当按条件属性形成等价类精确包含在按决策属性集形成的等价类中,对应着确定性规则,即下近似集对应着决策系统的确定性规则,边界域对应着不协调决策系统的不确定性规则。
设L={l1,l2,…,lm}是决策表T=(U,C∪D,V,f)的确定性决策规则集,在属性集增加或删除单个属性或多个属性后,确定性决策规则集变化为L′={l′1,l′2,…,l′n}。在决策信息系统中,属性集变化时决策规则集的变化分为以下三种情况讨论:
A21、条件属性集变化,决策属性集不变;
证明:根据定义5及定理1可知,当条件属性增加,即知识细化时,由其条件属性划分的等价类增加,此时有[X]C′是[X]C的一个分解。由粗糙集理论的下近似集的概念知,在决策信息系统中,集合的下近似集和确定性决策规则相对应,其变化相一致,又由于可得即进而得出证毕。同理,容易得证,当条件属性减少,决策属性D不变时有,
A22、条件属性集不变,决策属性集变化;
A23、条件属性集和决策属性集同时变化:
证明:证明过程的原理结合定理3和定理6证明思路即可得证,此处略。
证明:设Z=[X]C∩[X]D是属性集变化前条件属性集C的等价类[x]c被包含在决策属性集D的等价类[x]D的集合,根据定义6及定理1可知,当条件属性和决策属性同时增加,即知识细化时,由其条件属性和决策属性划分的等价类均减少,此时有 [X]C是[X]C′的分解,[X]D′是[X]D的分解,Z′=[X]C′∩[X]D′,若所有条件属性集C的等价类[x]c被包含在决策属性集D的等价类[x]D的集合元素减少,则有又由于 可得, 即 进而得出 证毕。
证明:证明过程的原理与定理6类似,此处略。
以上表明,在决策信息系统中,当条件属性集增加,决策属性集减少时,确定性规则集基数是不减的;当决策属性集增加,条件属性集减少时,确定性规则集基数是不增的;当条件属性集与决策属性集同时变化时,依几种不同的情况规则集呈不同的变化;
步骤B、当属性增加、删除时决策规则集增量更新方法:
单属性决策信息系统中,利用近似集的增量来实现条件属性增加、删除时决策规则集的更新过程为:
在决策系统T=(U,C∪D,V,f)中,U是论域,C是条件属性集,D是决策属性,V为论域的属性值。设属性集B对U的划分所形成的等价类为EB={EB1,EB2,…,EBn},决策属性d∈D对U的划分所形成的等价类为Ed={Ed1,Ed2,…,Edm},Ed关于条件属性集B的上近似集和下近似集分别用 表示。条件属性集B添加一个属性a后的上近似集和下近似集分别用 表示;从条件属性集B删除一个属性b后的上近似集和下近似集分别用表示。ΔAprB(Ed)表示属性集变化后下近似集的增量,表示属性集变化后上近似集的增量。决策规则集用表示,设rik:des(Ei)→des(Ej)表示为新增规则;
B1、条件属性增加时决策规则集增量更新算法:
输入T=(U,C∪D,V,f),现有决策规则集M,新增属性a;
输出 更新后的决策规则集M′;
步骤7输出更新后的决策规则集M′,算法结束;
B2、条件属性删除时决策规则集增量更新算法:
输入 T=(U,C∪D,V,f),现有决策规则集M,删除属性b;
输出 更新后的决策规则集M′;
步骤1、计算
步骤3、若 则决策规则集M不变;
步骤7输出更新后的决策规则集M′,算法结束。
针对本发明方法结合例子进行说明:
1、相关知识
定义1[2](集合的下近似和上近似)给定知识库(近似空间)K=(U,S),其中U为论域,S表示论域U上等价关系簇,给定论域U上的一个等价关系R∈IND(K),则定义子集(概念或信息粒)关于知识R上的下近似和上近似分别为
并且X的R-下近似也称为正区域,记为posR(X)。
定义2[2](近似分类的上近似和下近似)设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分(或称完备分类)π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R。其中子集Xi(i=1,2,…,n)是划分π(U)的等价类。π(U)的R下近似和上近似分别为
定义3[2](决策信息系统)一个决策信息系统以四个元组T=(U,C∪D,V,f)表示,其中U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;C∪D:C={α|α∈C}称为条件属性集,每个αj∈C(1≤j≤m)称为C的一个简单属性;D={d|d∈D}称为决策系统属性集,且 是信息函数f的值域,而Vα表示值域;表示决策系统的信息函数,fα为属性α的信息函数。
定义4[1](决策规则)设T=(U,C∪D,V,f)是一个决策信息系统,令Xi和Yj分别代表U/(C)与U/(D)中的各个等价类,des(Xi)表示对等价类的描述,即等价类Xi对于各条件属性值的特定取值;des(Yj)表示对等价类的描述,即等价类Yj对于各决策属性值的特定取值,则决策规则如下:
定义5[1](规则的确定因子)给定决策信息系统T=(U,C∪D,V,f),Xi∈U/IND(C),Yj∈U/IND(D),有
当μ(Xi,Yj)=1时,rij是确定性规则;当0<μ(Xi,Yj)<1时,rij是不确定规则,或者说是近似规则。μ(Xi,Yj)可解释为论域中给定对象属于Xi时,该对象属于Yj的概率。
2、知识粗化细化
在粗糙集模型中不可分辨类或等价类被看作是基本粒,任意给定的一个属性子集都可以诱导出对象集上的一个等价关系。一般来说,从细粒度层次到粗粒度层次的转换可以通过减少该属性子集中的元素来实现,而通过向该属性子集增添新的属性则可以实现从粗粒度层次到细粒度层次的转换。
知识的粗化细化能够表达出知识分辨能力的变化。
3当属性集变化时所引起的决策规则集的变化
3.1当属性增加删除时近似集的变化情况
(1)属性增加是对知识的细化,以下引理成立
引理1设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R。其中,子集Xi(i=1,2,…,n)是划分π(U)的等价类。属性r为新增加的属性(知识细化),π(U)的近似集的变化情况为: R′(π(U)), 分别表示知识细化后近似分类的上、下近似。
由此可以得出,在粗糙集模型下,当属性增加时下近似集基数及上近似集基数是不减的。
(2)属性删除是对知识的粗化,以下引理成立
引理2设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分(或称完备分类)π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R。其中子集Xi(i=1,2,…,n)是划分π(U)的等价类。R中的属性r删除(知识粗化),π(U)的近似集的变化情况为:
可以得出,在粗糙集模型下,当属性删除时下近似集基数及上近似集基数是不增的。
3.2当属性增加删除时决策规则集变化分析
当属性增加删除时可能会起引近似集的变化,由粗糙集理论的基本概念知,通过近似集可以得到决策规则集,所以近似集的变化势必引起决策规则集的变化。
在决策信息系统中T=(U,C∪D,V,f),当按条件属性形成等价类精确包含在按决策属性集形成的等价类中,对应着确定性规则,即下近似集对应着决策系统的确定性规则,边界域对应着不协调决策系统的不确定性规则。
设L={l1,l2,…,lm}是决策表T=(U,C∪D,V,f)的确定性决策规则集,在属性集增加或删除单个属性或多个属性后,确定性决策规则集变化为L′={l′1,l′2,…,l′n}。在决策信息系统中,属性集变化时决策规则集的变化分为以下三种情况讨论:
(1)条件属性集变化,决策属性集不变。
证明:根据定义5及定理1可知,当条件属性增加,即知识细化时,由其条件属性划分的等价类增加,此时有[X]C′是[X]C的一个分解。由粗糙集理论的下近似集的概念知,在决策信息系统中,集合的下近似集和确定性决策规则相对应,其变化相一致,又由于可得即进而得出证毕。同理,容易得证,当条件属性减少,决策属性D不变时有,
(2)条件属性集不变,决策属性集变化。
(3)条件属性集和决策属性集同时变化。
证明:证明过程的原理结合定理3和定理6证明思路即可得证,此处略。
证明:设Z=[X]C∩[X]D是属性集变化前条件属性集C的等价类[x]c被包含在决策属性集D的等价类[x]D的集合,根据定义6及定理1可知,当条件属性和决策属性同时增加,即知识细化时,由其条件属性和决策属性划分的等价类均减少,此时有 [X]C是[X]C′的分解,[X]D′是[X]D的分解,Z′=[X]C′∩[X]D′若所有条件属性集C的等价类[x]c被包含在决策属性集D的等价类[x]D的集合元素减少,则有又由于 可得, 即 进而得出 证毕。
证明:证明过程的原理与定理6类似,此处略。
以上表明,在决策信息系统中,当条件属性集增加,决策属性集减少时,确定性规则集基数是不减的;当决策属性集增加,条件属性集减少时,确定性规则集基数是不增的;当条件属性集与决策属性集同时变化时,依几种不同的情况规则集呈不同的变化。
下面的实例是条件属性集和决策属性集同时减少时决策规则集的变化情况,其它实例不再一一列举。
例1表1[5]是一个决策表。决策表由8个对象,4个条件属性,4个决策属性组成。
表1决策表
解:决策表的论域U={1,2,…,8},得
(1)设初条件属性集C1={α1,α2,α3,α4},决策属性集D={d1,d2,d3,d4},πC(U)={X1,X2,X3,X4,X5},|πc(U)|=5,其中,X1={1,3},X2={2,4},X3={5},X4={6},X5={7,8}。
πD(U)={Y1,Y2,Y3,Y4,Y5,Y6},其中Y1={1},Y2={2},Y3={3},Y4={4},Y5={5,6},Y6={7,8},rc(D)=πC(U),|rc(D)|=3,|dv|=0。
|dv|=0,则决策信息系统为协调决策信息系统,只存在有确定性规则。
确定性规则确定性决策规则集ri(d)条数:k=|r c(D)|=3。
(2)当从条件属性集C1中删除属性元素α2,从决策属性集D中删除属性元素d2,此时C2={α1,α2,α4},D={d1,d3,d4},则πc(U)={X1,X2,X3,X4},其中X1={1,3},X2={2,4},X3={5,6},X4={7,8}。
πD(U)={Y1,Y2,Y3,Y4,Y5,Y6},其中Y1={1},Y2={2},Y3={3},Y4={4},Y5={5,6},Y6={7,8},rc(D)={Z1,Z2},|rc(D)|=2,其中Z1={5,6},Z2={7,8}。
dv=πc(U)-rc(D)={W1,W2},|dv|=2,W1={1,3},W2={2,4}。
0<|dv|<|πc(U)|,则决策信息系统为不协调决策信息系统,既存在有确定性规则,又有不确定性规则。
确定性规则及不确定性规则不再一一列出。
从例1看到,当条件属性集和决策属性集同时减少时,且下近似集相比属性集变化前是增加时,确定性规则集是减少的。同时也看到,随着属性的增加或删除实例中的不确定性规则集变化不定,是没有规律可循的。
综上,在决策信息系统中,当属性增加删除时会引起近似集和边界域的变化,对于下近似集的变化会引起确定性的规则集的规律性变化,边界域对应不确定性规则集,由于属性的增加或删除都有可能引起协调性决策信息系统和非协调性决策信息系统之间的转换,所以说属性集的变化对边界域的变化没有一定的规律可循,从而也不能进一步得出当属性增加删除时不确定性规则集的变化趋势。
4、当属性增加、删除时决策规则集增量更新方法
下面只讨论单属性决策信息系统中,利用近似集的增量来实现条件属性增加、删除时决策规则集的更新。
在决策系统T=(U,C∪D,V,f)中,U是论域,C是条件属性集,D是决策属性,V为论域的属性值。设属性集B对U的划分所形成的等价类为EB={EB1,EB2,…,EBn},决策属性d∈D对U的划分所形成的等价类为Ed={Ed1,Ed2,…,Edm},Ed关于条件属性集B的上近似集和下近似集分别用 表示。条件属性集B添加一个属性a后的上近似集和下近似集分别用 表示;从条件属性集B删除一个属性b后的上近似集和下近似集分别用 表示。ΔAprB(Ed)表示属性集变化后下近似集的增量,表示属性集变化后上近似集的增量。决策规则集用表示,设rik:des(Ei)→des(Ej)表示为新增规则。
4.1条件属性增加时决策规则集增量更新算法
输入 T=(U,C∪D,V,f),现有决策规则集M,新增属性a。
输出 更新后的决策规则集M′。
步骤7输出更新后的决策规则集M′,算法结束。
4.2条件属性删除时决策规则集增量更新算法
输入 T=(U,C∪D,V,f),现有决策规则集M,删除属性b。
输出 更新后的决策规则集M′。
步骤3若 则决策规则集M不变;
步骤7输出更新后的决策规则集M′,算法结束。
下面只对条件属性增加时决策规则集的更新举例如下,条件属性删除时决策规则集的更新不再列出。
例2:表2是关于某些病人的决策表,U={e1,e2,…,e8},条件属性集C={α,β,γ},决策属性D={d}。
U/{α}={{e1,e2,e3},{e4,e5,e6,e7,e8}};U/{α,β}={{e1,e2,e3},{e4,e6,e8},{e5,e7}};
U/{α,β,γ}={{e1},{e2},{e3},{e4},{e6,e8},{e5,e7}};U/{d}={{e2,e3,e6,e7},{e1,e4,e5,e8}}。
表2(决策表)
r11:des(EB1)→des(Ed1),(头痛,是)且(肌肉痛,是)→(流感,否)规则的确定性因子为0.5。
r12:des(EB1)→des(Ed2),(头痛,是)且(肌肉痛,是)→(流感,是)规则的确定性因子为0.5。
r21:des(EB2)→des(Ed1),(头痛,否)且(肌肉痛,是)→(流感,否)规则的确定性因子为0.5。
r22:des(EB2)→des(Ed2),(头痛,否)且(肌肉痛,是)→(流感,是)规则的确定性因子为0.5。
r31:des(EB3)→des(Ed1),(头痛,否)且(肌肉痛,否)→(流感,否)规则的确定性因子为0.5。
r32:des(EB3)→des(Ed2),(头痛,否)且(肌肉痛,否)→(流感,是)规则的确定性因子为0.5。
设属性γ∈C,将属性γ添加到B,决策规则集更新如下:
r21:des(EB2)→des(Ed1),(头痛,否)且(肌肉痛,是)且(体温,很高)→(流感,否)规则的确定性因子为0.5。
r22:des(EB2)→des(Ed2),(头痛,否)且(肌肉痛,是)且(体温,很高)→(流感,是)规则的确定性因子为0.5。
(头痛,是)且(肌肉痛,是)且(体温,正常)→(流感,否)。
(头痛,是)且(肌肉痛,是)且(体温,高)→(流感,是)。
(头痛,是)且(肌肉痛,是)且(体温,很高)→(流感,是)。
(头痛,否)且(肌肉痛,是)且(体温,正常)→(流感,否)。
(头痛,否)且(肌肉痛,是)且(体温,很高)→(流感,否)规则的确定性因子为0.5。
(头痛,否)且(肌肉痛,是)且(体温,很高)→(流感,是)规则的确定性因子为0.5。
总结:针对动态决策信息系统中属性集变化时,分析了动态规则的变化趋势,提出了属性集变化时动态规则更新算法,并通过实例验证了其正确性。以后的主要工作通过实验仿真测试规则增量更新算法的性能,以及分析扩展粗糙集模型下属性集变化时规则集的动态变化及规则增量更新,辅助各应用领域做出更好的决策。
Claims (1)
1.一种粗糙集中属性集变化时规则集动态更新方法:所述方法基于以下定义来实现的:
并且X的R-下近似也称为正区域,记为posR(X);
定义2:设给定一个论域U和论域U上的一个等价关系R,以及论域U的一个划分π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R;其中子Xi(i=1,2,…,n)是划分π(U)的等价类;π(U)的R下近似和上近似分别为:
定义3:一个决策信息系统以四个元组T=(U,C∪D,V,f)表示,其中U:U={x1,x2,...,xn}为对象的非空有限集合,称为论域;C∪D:C={α|α∈}称为条件属性集,每个αj∈C(1≤j≤m)称为C的一个简单属性;D={d|d∈D}称为决策系统属性集,且 是信息函数f的值域,而Vα表示值域;表示决策系统的信息函数,fα为属性α的信息函数;
定义4:设T=(U,C∪D,V,f)是一个决策信息系统,令Xi和Yj分别代表U/(C)与U/(D)中的各个等价类,des(Xi)表示对等价类的描述,即等价类Xi对于各条件属性值的特定取值;des(Yj)表示对等价类的描述,即等价类Yj对于各决策属性值的特定取值,则决策规则如下:
定义5:给定决策信息系统T=(U,C∪D,V,f),Xi∈U/IND(C),Yj∈U/IND(D),有
当μ(Xi,Yj)=1时,rij是确定性规则;当0<μ(Xi,Yj)<1时,rij是不确定规则,或者说是近似规则。μ(Xi,Yj)可解释为论域中给定对象属于Xi时,该对象属于Yj的概率;
在粗糙集模型中不可分辨类或等价类被看作是基本粒,任意给定的一个属性子集都可以诱导出对象集上的一个等价关系。一般来说,从细粒度层次到粗粒度层次的转换可以通过减少该属性子集中的元素来实现,而通过向该属性子集增添新的属性则可以实现从粗粒度层次到细粒度层次的转换:
对论域U,设α1,α2,…αt是属性集, 若 则有
对论域U,设α1,α2,…αt是属性集, 是属性α1,α2,…,αt-1,αt决定的元素等价类,若 则有
知识的粗化细化能够表达出知识分辨能力的变化;
其特征在于:所述方法的具体过程为:
A1、当属性增加删除时近似集的变化情况时:
A11、属性增加是对知识的细化,以下引理成立:
设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R。其中,子集Xi(i=1,2,…,n)是划分π(U)的等价类。属性r为新增加的属性(知识细化),π(U)的近似集的变化情况为: R′(π(U)), 分别表示知识细化后近似分类的上、下近似;(引理1)
由此可以得出,在粗糙集模型下,当属性增加时下近似集基数及上近似集基数是不减;
A12、属性删除是对知识的粗化,以下引理成立:
设给定一个论域U和论域U上的一个等价关系(知识)R,以及论域U的一个划分(或称完备分类)π(U)={X1,X2,…,Xn}∈∏(U),且这个划分独立于R;其中子集Xi(i=1,2,…,n)是划分π(U)的等价类;R中的属性r删除(知识粗化),π(U)的近似集的变化情况为: (引理2)
R′(π(U)),分别表示知识粗化后近似分类的上、下近似;
可以得出,在粗糙集模型下,当属性删除时下近似集基数及上近似集基数是不增的;
A2、当属性增加删除时决策规则集变化分析
当属性增加删除时可能会起引近似集的变化,由粗糙集理论的基本概念知,通过近似集可以得到决策规则集,所以近似集的变化势必引起决策规则集的变化;
在决策信息系统中T=(U,C∪D,V,f),当按条件属性形成等价类精确包含在按决策属性集形成的等价类中,对应着确定性规则,即下近似集对应着决策系统的确定性规则,边界域对应着不协调决策系统的不确定性规则;
设L={l1,l2,…,lm}是决策表T=(U,C∪D,V,f)的确定性决策规则集,在属性集增加或删除单个属性或多个属性后,确定性决策规则集变化为L′={l′1,l′2,…,l′n}。在决策信息系统中,属性集变化时决策规则集的变化分为以下三种情况讨论:
A21、条件属性集变化,决策属性集不变;
A22、条件属性集不变,决策属性集变化;
A23、条件属性集和决策属性集同时变化:
以上表明,在决策信息系统中,当条件属性集增加,决策属性集减少时,确定性规则集基数是不减的;当决策属性集增加,条件属性集减少时,确定性规则集基数是不增的;当条件属性集与决策属性集同时变化时,依几种不同的情况规则集呈不同的变化;
步骤B、当属性增加、删除时决策规则集增量更新方法:
单属性决策信息系统中,利用近似集的增量来实现条件属性增加、删除时决策规则集的更新过程为:
在决策系统T=(U,C∪D,V,f)中,U是论域,C是条件属性集,D是决策属性,V为论域的属性值。设属性集B对U的划分所形成的等价类为EB={EB1,EB2,…,EBn},决策属性d∈D对U的划分所形成的等价类为Ed={Ed1,Ed2,…,Edm},Ed关于条件属性集B的上近似集和下近似集分别用 表示。条件属性集B添加一个属性a后的上近似集和下近似集分别用 表示;从条件属性集B删除一个属性b后的上近似集和下近似集分别用 表示。ΔAprB(Ed)表示属性集变化后下近似集的增量,表示属性集变化后上近似集的增量。决策规则集用表示,设rik:des(Ei)→des(Ej)表示为新增规则;
B1、条件属性增加时决策规则集增量更新算法:
输入 T=(U,C∪D,V,f),现有决策规则集M,新增属性a;
输出 更新后的决策规则集M′;
步骤7输出更新后的决策规则集M′,算法结束;
B2、条件属性删除时决策规则集增量更新算法:
输入:T=(U,C∪D,V,f),现有决策规则集M,删除属性b;
输出:更新后的决策规则集M′;
步骤3、若 则决策规则集M不变;
步骤6、若则将决策规则rjk:des(EBj)→des(Edk)更新为
步骤7输出更新后的决策规则集M′,算法结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110255897A CN102306190A (zh) | 2011-08-31 | 2011-08-31 | 粗糙集中属性集变化时规则集动态更新方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110255897A CN102306190A (zh) | 2011-08-31 | 2011-08-31 | 粗糙集中属性集变化时规则集动态更新方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102306190A true CN102306190A (zh) | 2012-01-04 |
Family
ID=45380052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110255897A Pending CN102306190A (zh) | 2011-08-31 | 2011-08-31 | 粗糙集中属性集变化时规则集动态更新方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102306190A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462020A (zh) * | 2014-10-21 | 2015-03-25 | 西南交通大学 | 一种基于知识粒度的矩阵增量约简方法 |
CN105306438A (zh) * | 2015-09-17 | 2016-02-03 | 杭州安恒信息技术有限公司 | 基于模糊粗糙集的网络安全态势评估方法 |
CN107463707A (zh) * | 2017-08-18 | 2017-12-12 | 北京语言大学 | 一种决策表下近似不变的局部属性约简定义及方法 |
CN109408481A (zh) * | 2018-11-06 | 2019-03-01 | 北京字节跳动网络技术有限公司 | 日志采集规则的更新方法、装置、电子设备及可读介质 |
CN109542949A (zh) * | 2018-11-07 | 2019-03-29 | 太原理工大学 | 一种基于形式向量的决策信息系统知识获取方法 |
CN109800384A (zh) * | 2018-12-28 | 2019-05-24 | 西安交通大学 | 一种基于粗糙集信息决策表的基本概率赋值计算方法 |
CN110288095A (zh) * | 2019-06-12 | 2019-09-27 | 太原理工大学 | 一种基于形式向量的不一致决策信息系统规则提取方法 |
CN110543628A (zh) * | 2018-05-29 | 2019-12-06 | 南京大学 | 一种规则约束下的文本信息质量度量方法 |
US10831733B2 (en) | 2017-12-22 | 2020-11-10 | International Business Machines Corporation | Interactive adjustment of decision rules |
CN114638550A (zh) * | 2022-05-12 | 2022-06-17 | 国网江西省电力有限公司电力科学研究院 | 一种储能电站配置方案的指标筛选方法及系统 |
CN114822720A (zh) * | 2022-04-26 | 2022-07-29 | 华东交通大学 | 一种基于粗糙集增量药物优化方法 |
-
2011
- 2011-08-31 CN CN201110255897A patent/CN102306190A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462020B (zh) * | 2014-10-21 | 2017-07-07 | 西南交通大学 | 一种基于知识粒度的矩阵增量约简方法 |
CN104462020A (zh) * | 2014-10-21 | 2015-03-25 | 西南交通大学 | 一种基于知识粒度的矩阵增量约简方法 |
CN105306438A (zh) * | 2015-09-17 | 2016-02-03 | 杭州安恒信息技术有限公司 | 基于模糊粗糙集的网络安全态势评估方法 |
CN105306438B (zh) * | 2015-09-17 | 2018-04-24 | 杭州安恒信息技术股份有限公司 | 基于模糊粗糙集的网络安全态势评估方法 |
CN107463707A (zh) * | 2017-08-18 | 2017-12-12 | 北京语言大学 | 一种决策表下近似不变的局部属性约简定义及方法 |
US10831733B2 (en) | 2017-12-22 | 2020-11-10 | International Business Machines Corporation | Interactive adjustment of decision rules |
CN110543628A (zh) * | 2018-05-29 | 2019-12-06 | 南京大学 | 一种规则约束下的文本信息质量度量方法 |
CN109408481A (zh) * | 2018-11-06 | 2019-03-01 | 北京字节跳动网络技术有限公司 | 日志采集规则的更新方法、装置、电子设备及可读介质 |
CN109542949B (zh) * | 2018-11-07 | 2022-04-12 | 太原理工大学 | 一种基于形式向量的决策信息系统知识获取方法 |
CN109542949A (zh) * | 2018-11-07 | 2019-03-29 | 太原理工大学 | 一种基于形式向量的决策信息系统知识获取方法 |
CN109800384A (zh) * | 2018-12-28 | 2019-05-24 | 西安交通大学 | 一种基于粗糙集信息决策表的基本概率赋值计算方法 |
CN110288095A (zh) * | 2019-06-12 | 2019-09-27 | 太原理工大学 | 一种基于形式向量的不一致决策信息系统规则提取方法 |
CN114822720A (zh) * | 2022-04-26 | 2022-07-29 | 华东交通大学 | 一种基于粗糙集增量药物优化方法 |
CN114822720B (zh) * | 2022-04-26 | 2024-03-26 | 华东交通大学 | 一种基于粗糙集增量药物优化方法 |
CN114638550A (zh) * | 2022-05-12 | 2022-06-17 | 国网江西省电力有限公司电力科学研究院 | 一种储能电站配置方案的指标筛选方法及系统 |
CN114638550B (zh) * | 2022-05-12 | 2022-10-11 | 国网江西省电力有限公司电力科学研究院 | 一种储能电站配置方案的指标筛选方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102306190A (zh) | 粗糙集中属性集变化时规则集动态更新方法 | |
Qian et al. | Converse approximation and rule extraction from decision tables in rough set theory | |
Chen et al. | Modeling growth curve of fractal dimension of urban form of Beijing | |
CN112988774B (zh) | 一种基于大数据采集的用户信息更新方法及信息服务器 | |
Xu et al. | Time-aware graph embedding: A temporal smoothness and task-oriented approach | |
Jiang et al. | Message clustering based matrix factorization model for retweeting behavior prediction | |
Moraitis et al. | Relative magnetic field line helicity | |
US10444062B2 (en) | Measuring and diagnosing noise in an urban environment | |
Li et al. | Quasi-likelihood inference for self-exciting threshold integer-valued autoregressive processes | |
CN102880834A (zh) | 一种保持数据数字特征的隐私信息保护方法 | |
Liu et al. | feGRASS: Fast and effective graph spectral sparsification for scalable power grid analysis | |
CN107463624A (zh) | 一种基于社交媒体数据进行城市兴趣域识别的方法及系统 | |
CN109145633A (zh) | 轨迹数据隐私保护方法、电子设备、存储介质及系统 | |
Rahim | Educational Data Mining (EDM) on the use of the internet in the world of Indonesian education | |
CN102779288A (zh) | 一种基于场理论的本体分析方法 | |
Kang et al. | Integration of cloud and big data analytics for future smart cities | |
Andreoli et al. | Inference for the neighbourhood inequality index | |
Zhao | R Reference Card for Data Mining | |
Peng et al. | Unsupervised Multiplex Graph Learning with Complementary and Consistent Information | |
Zibulevsky | Speeding-up convergence via sequential subspace optimization: Current state and future directions | |
Leavitt | Randomization-based, Bayesian inference of causal effects | |
Lei et al. | Research on the improved FCM cluster method in the hotspots analysis on web | |
Hapsari et al. | Fractional Gradient Based Optimization for Nonlinear Separable Data | |
Gu et al. | Multi-granulation rough sets in multi-scale information systems | |
Lu et al. | Data Matrix Completion Based on Pattern Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120104 |