CN103870879B - 基于不可区分关系的计算机辅助决策系统知识选择方法 - Google Patents
基于不可区分关系的计算机辅助决策系统知识选择方法 Download PDFInfo
- Publication number
- CN103870879B CN103870879B CN201410141422.0A CN201410141422A CN103870879B CN 103870879 B CN103870879 B CN 103870879B CN 201410141422 A CN201410141422 A CN 201410141422A CN 103870879 B CN103870879 B CN 103870879B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- count
- target
- decision
- collection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于不可区分关系的计算机辅助决策系统知识选择方法,其特征在于:计算机包含有中央处理器和存储器,且将计算机与数据采集设备相连接,数据采集设备采集到的数据是监测目标的一组属性值和目标类别,其中属性值为连续型或离散型;所述的存储器中保存目标数据库、知识集合库、基础知识库、会话模块和问题处理模块;所述的中央处理器对所述的存储器进行控制并执行以下步骤:步骤1、构建目标数据库;步骤2、确认决策问题;步骤3、构建知识集合库;步骤4、知识选择;步骤5、更新基础知识库。
Description
技术领域
本发明涉及一种计算机辅助决策的信息处理、分析和管理领域,特别是一种针对计算机智能辅助决策系统进行知识匹配判别和筛选的评估方法。
背景技术
在计算机智能辅助决策领域,目前学术界已经提出了多种知识粒度计算模型。其中最主要的是模糊集、粗糙集和商空间理论。模糊集模型是Zadeh根据模糊集理论提出的,用模糊数学的方法对有关粒度计算的方法和理论进行研究。粗糙集模型是由Pawlak在20世纪80年代初提出的。商空间理论是由我国的张拔、张铃提出的。在商空间模型理论下,概念用子集来表示,不同粒度的概念表现为不同粒度的子集,一簇概念构成了空间的一个划分,称为商空间。然而,上述理论方法尚不足以描述不同知识粒度对辅助决策的支撑力度和程度,因此影响了计算机智能辅助决策系统中知识在辅助决策任务中灵活和高效的应用。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于不可区分关系的计算机辅助决策系统知识选择方法。
为了解决上述技术问题,本发明公开了一种基于不可区分关系的计算机辅助决策系统知识选择方法:首先,分别针对辅助决策任务中的决策属性和计算机智能辅助决策系统知识集合构建相应的不可区分关系集合;接着,在知识和决策属性的匹配判断过程中逐步生成决策属性支撑矢量,定量化地描述知识和决策属性的匹配程度;然后,根据决策属性支撑矢量判断并剔除对决策属性判断冗余的知识;最后,输出支撑决策属性判定的优化知识集合及其中各知识的决策属性支撑矢量,并用其构建基础知识库。
本发明计算机包含有中央处理器和存储器,且将计算机与数据采集设备相连接,数据采集设备采集到的数据是监测目标的一组属性值和目标类别,其中属性值为连续型(参见:《统计学》,贾俊平,清华大学出版社,应用统计学系列教材,2006)或离散型(参见:《统计学》,贾俊平,清华大学出版社,应用统计学系列教材,2006);
所述的存储器中保存目标数据库、知识集合库、基础知识库、会话模块和问题处理模块;所述的中央处理器对所述的存储器进行控制并执行以下步骤:
步骤1、构建目标数据库:将数据采集设备获取的数据进行离散化(参见:《数据挖掘基础教程》,西蒙(作者),范明(译者),牛常勇(译者),机械工业出版社,2009)后存入目标数据库;目标数据库表示为三元组S=(U,C,d),其中U表示目标集合,且U不为空,C={c1,c2,...,cm}表示目标属性集,由c1、c2、……、cm共m个属性组成,d表示目标类别,目标数据库中的每一条记录对应一个目标x,包括目标x的m个目标属性的取值f(x,c1)、f(x,c2)、…和f(x,cm),以及其类别f(x,d);
步骤2、确认决策问题:通过会话模块由用户确认决策问题是否目标数据库中的目标类别判定问题,确认后会话模块将目标类别判定问题传送给问题处理模块;
步骤3、构建知识集合库:根据目标数据库中的目标属性集C,由问题处理模块枚举出满足长度限制δ的n条知识,K1,K2,…,Kn,构成知识集合Ω,即Ω={K1,K2,...,Kn},|Ω|=n,其中每条知识Ki,1≤i≤n,是目标属性集C的子集,即且每条知识Ki的长度不大于δ,即|Ki|≤δ;将知识集合Ω存入知识集合库,并根据属性映射建立目标数据库与知识集合库的对应关系;
步骤4、知识选择:设定阈值门限为α,α取值范围为0<α≤1;问题处理模块基于不可区分关系从知识集合Ω选择出支撑目标类别d判定的由p条知识,K1,K2,...,Kp,共同组成的优化知识集合KS,即KS={K1,K2,...,Kp},优化知识集合KS是知识集合Ω的子集,即同时计算出优化知识集合KS中各知识Ku的类别判定支撑矢量Su,1≤u≤p;
步骤4包括以下步骤:
步骤4.1,构建目标类别不可区分关系集合:根据辅助决策任务中的目标类别d构建目标集合U上的不可区分关系集合U/IND(d),不可区分关系集合U/IND(d)中各元素是一个基于目标类别d的等价类Xd,且每个等价类Xd是目标集合U的一个子集,即U/IND(d)={Xd(1),Xd(2),...}={Xd}且每个等价类Xd中任意两个目标的类别均相同,即f(xr,d)=f(xs,d);
步骤4.2,构建知识集合的不可区分关系集合:针对知识集合Ω={K1,K2,...,Kn}中各条知识Ki,1≤i≤n,分别构建其不可区分关系集合U/IND(Ki),集合U/IND(Ki)中的各元素是一个基于知识Ki的等价类XKi,即U/IND(Ki)={XKi(1),XKi(2),...}={XKi},每个等价类XKi均是目标集合U的一个子集,即使得等价类XKi中任意两个目标xa和xb在知识Ki中任意属性c的取值均相同,即f(xa,c)=f(xb,c);
步骤4.3,初始化决策计数变量:将决策计数变量countd初始化为1;
步骤4.4,判断决策计数变量:判断决策计数变量countd是否小于等于目标类别不可区分关系集合的大小|U/IND(d)|,如果是继续步骤4.5,否则跳至步骤4.14;
步骤4.5,初始化知识计数变量:将知识计数变量countK初始化为1;
步骤4.6,判断知识计数变量:判断知识计数变量countK是否小于等于知识数目n,如果是并且对应知识Kv(v=countK)的决策属性支撑矢量不存在,则初始化知识Kv的决策属性支撑矢量,维度等于不可区分关系集合U/IND(d)大小,表示为零向量Sv={0,0,...,0}|U/IND(d)|;如果是继续步骤4.7,否则跳至步骤4.13;
步骤4.7,初始化匹配比例标志和等价计数变量:初始化匹配比例标志Per为零,初始化等价计数变量countI为1;
步骤4.8,判断等价计数变量:判断等价计数变量countI是否小于等于不可区分关系集合U/IND(Kv)的大小|U/IND(Kv)|,如果是继续步骤4.9,否则跳至步骤4.11;
步骤4.9,等价类匹配判别:获取知识集合Ω中第countK个知识Kv(v=countK)的第countI个等价类XKv(countI),将等价类XKv(countI)与目标类别d的不可区分关系集合U/IND(d)中第countd个等价类Xd(countd)进行比较,根据匹配阈值门限α计算两个等价类的匹配目标集合mapset和非匹配目标集合unmapset,匹配目标集合mapset为等价类XKv(countI)与等价类Xd(countd)的共有目标集合,非匹配目标集合unmapset为等价类XKv(countI)除去匹配目标集合后剩余目标的集合,计算过程如公式(1)和(2)分别所示:
mapset=XKv(countI)∩Xd(countd) (1)
unmapset=XKv(countI)-mapset (2)
如果匹配目标集合大小|mapset|>0且满足|unmapset|/|mapset|≤1-α,按公式(3)递增匹配比例标志Per,增加值为匹配目标集合目标数目与等价类Xd(countd)目标数目的比值,其中|Xd(countd)|表示等价类Xd(countd)中目标数目:
Per=Per+|mapset|/|Xd(countd)| (3);
步骤4.10,更新等价计数变量:将等价计数变量countI增加1,即countI=countI+1,返回步骤4.8;
步骤4.11,知识匹配判别:如果匹配比例标志Per≥α,判断知识Kv(v=countK)与类别d的第countd个等价类Xd(countd)相匹配,并更新知识Kv(v=countK)的决策属性支撑矢量Sv的第countd位为匹配比例标志Per,否则,判断知识Kv与类别d的第countd个等价类Xd(countd)不匹配;
步骤4.12,更新知识计数变量:将知识计数变量countK增加1,即countK=countK+1,返回步骤4.6;
步骤4.13,更新决策计数变量:将决策计数变量countd更新为countd=countd+1,返回步骤4.4;
步骤4.14,剔除冗余知识:针对知识集合Ω中各知识Ki(1≤i≤n)及其决策属性支撑矢量Si,判断是否存在另一条知识Kj(1≤j≤n且j≠i)的决策属性支撑矢量Sj在所有位置q(1≤q≤|U/IND(d)|)上的取值均大于等于决策属性支撑矢量Si,即满足Sj[q]≥Si[q],其中|U/IND(d)|表示不可区分关系集合U/IND(d)的大小,如果是判断知识Ki冗余,将知识Ki从知识集合Ω中剔除,即Ω=Ω-Ki;
步骤4.15,输出优化知识集合:输出从知识集合Ω中选择出的p条知识及其对应决策属性支撑矢量构建优化知识集合KS={(Ku,Su)}1≤u≤p;
步骤5、更新基础知识库:如果选择出的优化知识集合KS不为空,将优化知识集合KS作为类别d判定的知识存入所述基础知识库。
本发明步骤4.1、4.2中,目标类别的不可区分关系集合以及知识集合的不可区分关系集合中的元素均是目标集合U的子集。转化为不可区分关系集合的目的是为了便于比较各知识粒度对目标类别,即决策属性,支撑的程度。
本发明步骤4.3、4.4中,决策计数变量countd用于标识当前比较的目标类别的不可区分关系集合中的元素,取值范围在1和|U/IND(d)|之间。
本发明步骤4.5、4.6中,知识计数变量countK用于标识当前比较的知识集合Ω中的知识Kv(v=countK),取值范围在1和n之间。
本发明步骤4.7中,匹配比例标志Per用于标识知识集合Ω中的当前知识Kv(v=countK)与目标类别d的不可区分关系集合中的当前元素(即等价类Xd(countd))之间的匹配程度。等价计数变量countI用于标识当前知识Kv(v=countK)正在进行比较的元素,即等价类XKv(countI),取值范围在1和|U/IND(Kv)|之间。
本发明步骤4.9中,将第countK个知识Kv(v=countK)的第countI个等价类XKv(countI)与目标类别不可区分关系集合U/IND(d)中第countd个等价类Xd(countd)进行匹配,匹配结果保存在匹配比例标志Per中。匹配阈值门限α越高,对匹配的要求越严格,门限α越低,对匹配的要求越宽松,一般设置为0.8。
本发明步骤4.11中,根据匹配阈值门限α和最终计算得出的匹配比例标志Per,更新当前知识Kv(v=countK)对应的决策属性支撑矢量Sv的第countd个元素的取值。在完全匹配的情况下,决策属性支撑矢量Sv的第countd位元素值为1。
本发明步骤4.14中,根据决策属性支撑矢量对计算机智能辅助决策系统知识集合Ω中各知识的冗余性进行判断,冗余的知识将不被用于决策属性的判断,这有利于提高知识集合的简洁性和针对辅助决策任务的自动选择能力。
本申请与授权专利“一种基于信息挖掘的智能决策支持构造方法”一样均属于智能辅助决策系统的知识发现方法。但是,不同数据适用的知识发现方法是有较大差异的,并且不同知识发现方法挖掘出的知识也是各不相同的,知识的结构、形式也有巨大差异。而上述授权专利并未指明其方法适用的数据特点,也未明确其具体采用的知识发现算法,其指出的三类知识发现机制,Web挖掘、KDD挖掘和领域专家知识产生的知识是异构的、难以相互融合、甚至难以用数据库存储的。本发明的知识发现方法,数据定义明确、方法清晰、知识结构统一,便于存储和管理。
有益效果:本发明的显著优点为(1)根据决策属性支撑矢量直观和量化的评估了计算机智能辅助决策系统中知识和决策属性的支撑和匹配程度,并筛选了系统中冗余的知识,提高了知识利用的有效程度;(2)根据决策属性支撑矢量能够直接比较计算机智能辅助决策系统知识集合中不同知识在支撑辅助决策任务时的差别和强弱,能够更好地给决策者提供有效建议;(3)实现方法工程化——即本发明的输出结果在相同参数设置条件下是固定的、可重复实现的,不需要探索庞大的知识空间,计算成本较低,具有较低的时空复杂度,具有良好的工程应用前景,较易工程实现。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明工作流程图。
图2为本发明步骤4工作流程图。
具体实施方式
本发明针对计算机辅助决策任务中普遍存在的计算机系统存储信息爆炸,而计算机智能辅助决策系统难以自动筛选出合适的知识以支撑信息决策的问题,提出了一种基于不可区分关系的计算机辅助决策系统知识选择方法:分别针对辅助决策任务中的决策属性和计算机智能辅助决策系统知识集合构建相应的不可区分关系集合;接着,在知识和决策属性的匹配判断过程中逐步生成决策属性支撑矢量,定量化地描述知识和决策属性的匹配程度;然后,根据决策属性支撑矢量判断并剔除对决策属性判断冗余的知识;最后,输出支撑决策属性判定的优化知识集合及其中各知识的决策属性支撑矢量,并用其构建基础知识库。本发明的主要贡献如下:首先有助于对计算机智能辅助决策系统知识的选择;其次,本发明提出了一种新型的基于决策属性支撑矢量的决策属性匹配判断量化指标和模型;另外,本发明有助于实现知识的标准化管理。本发明可以应用于支撑任何领域的计算机辅助决策任务,如识别多种辐射源目标类型、判别传感器网络监控目标的类型、预测火山活动的类型、预测药物对病人的医疗效果等。
具体而言,本发明公开了一种基于不可区分关系的计算机辅助决策系统知识选择方法:分别针对辅助决策任务中的决策属性和计算机智能辅助决策系统知识集合构建相应的不可区分关系集合;接着,在知识和决策属性的匹配判断过程中逐步生成决策属性支撑矢量,定量化地描述知识和决策属性的匹配程度;然后,根据决策属性支撑矢量判断并剔除对决策属性判断冗余的知识;最后,输出支撑决策属性判定的优化知识集合及其中各知识的决策属性支撑矢量,并用其构建基础知识库。
如图1所示,本发明包括以下步骤:开始、构建目标数据库、确认决策问题、构建知识集合库、知识选择、更新基础知识库,最后结束。
1、一种基于不可区分关系的计算机辅助决策系统知识选择方法,其特征在于:计算机包含有中央处理器和存储器,且将计算机与数据采集设备相连接,数据采集设备采集到的数据是监测目标的一组属性值和目标类别,其中属性值为连续型或离散型;
所述的存储器中保存目标数据库、知识集合库、基础知识库、会话模块和问题处理模块;所述的中央处理器对所述的存储器进行控制并执行以下步骤::
步骤1、构建目标数据库:将数据采集设备获取的数据进行离散化后存入目标数据库;目标数据库表示为三元组S=(U,C,d),其中U表示目标集合,且U不为空,C={c1,c2,...,cm}表示目标属性集,由c1、c2、……、cm共m个属性组成,d表示目标类别,目标数据库中的每一条记录对应一个目标x,包括目标x的m个目标属性的取值f(x,c1)、f(x,c2)、…和f(x,cm),以及其类别f(x,d);
步骤2、确认决策问题:通过会话模块由用户确认决策问题是否目标数据库中的目标类别判定问题,确认后会话模块将目标类别判定问题传送给问题处理模块;
步骤3、构建知识集合库:根据目标数据库中的目标属性集C,由问题处理模块枚举出满足长度限制δ的n条知识,K1,K2,…,Kn,构成知识集合Ω,即Ω={K1,K2,...,Kn},|Ω|=n,其中每条知识Ki,1≤i≤n,是目标属性集C的子集,即且每条知识Ki的长度不大于δ,即|Ki|≤δ;将知识集合Ω存入知识集合库,并根据属性映射建立目标数据库与知识集合库的对应关系;
步骤4、知识选择:设定阈值门限为α,α取值范围为0<α≤1;问题处理模块基于不可区分关系从知识集合Ω选择出支撑目标类别d判定的由p条知识,K1,K2,...,Kp,共同组成的优化知识集合KS,即KS={K1,K2,...,Kp},优化知识集合KS是知识集合Ω的子集,即同时计算出优化知识集合KS中各知识Ku的类别判定支撑矢量Su,1≤u≤p;
步骤4包括以下步骤:
步骤4.1,构建目标类别不可区分关系集合:根据辅助决策任务中的目标类别d构建目标集合U上的不可区分关系集合U/IND(d),不可区分关系集合U/IND(d)中各元素是一个基于目标类别d的等价类Xd,且每个等价类Xd是目标集合U的一个子集,即U/IND(d)={Xd(1),Xd(2),...}={Xd}且每个等价类Xd中任意两个目标的类别均相同,即f(xr,d)=f(xs,d);
步骤4.2,构建知识集合的不可区分关系集合:针对知识集合Ω={K1,K2,...,Kn}中各条知识Ki,1≤i≤n,分别构建其不可区分关系集合U/IND(Ki),集合U/IND(Ki)中的各元素是一个基于知识Ki的等价类XKi,即U/IND(Ki)={XKi(1),XKi(2),...}={XKi},每个等价类XKi均是目标集合U的一个子集,即使得等价类XKi中任意两个目标xa和xb在知识Ki中任意属性c的取值均相同,即f(xa,c)=f(xb,c);
步骤4.3,初始化决策计数变量:将决策计数变量countd初始化为1;
步骤4.4,判断决策计数变量:判断决策计数变量countd是否小于等于目标类别不可区分关系集合的大小|U/IND(d)|,如果是继续步骤4.5,否则跳至步骤4.14;
步骤4.5,初始化知识计数变量:将知识计数变量countK初始化为1;
步骤4.6,判断知识计数变量:判断知识计数变量countK是否小于等于知识数目n,如果是并且对应知识Kv(v=countK)的决策属性支撑矢量不存在,则初始化知识Kv的决策属性支撑矢量维度等于不可区分关系集合U/IND(d)的大小,表示为零向量Sv={0,0,...,0}|U/IND(d)|;如果是继续步骤4.7,否则跳至步骤4.13;
步骤4.7,初始化匹配比例标志和等价计数变量:初始化匹配比例标志Per为零,初始化等价计数变量countI为1;
步骤4.8,判断等价计数变量:判断等价计数变量countI是否小于等于不可区分关系集合U/IND(Kv)的大小|U/IND(Kv)|,如果是继续步骤4.9,否则跳至步骤4.11;
步骤4.9,等价类匹配判别:获取知识集合Ω中第countK个知识Kv(v=countK)的第countI个等价类XKv(countI),将等价类XKv(countI)与目标类别d的不可区分关系集合U/IND(d)中第countd个等价类Xd(countd)进行比较,根据匹配阈值门限α计算两个等价类的匹配目标集合mapset和非匹配目标集合unmapset,匹配目标集合mapset为等价类XKv(countI)与等价类Xd(countd)的共有目标集合,非匹配目标集合unmapset为等价类XKv(countI)除去匹配目标集合后剩余目标的集合,计算过程如公式(1)和(2)分别所示:
mapset=XKv(countI)∩Xd(countd) (1)
unmapset=XKv(countI)-mapset (2)
如果匹配目标集合大小|mapset|>0且满足|unmapset|/|mapset|≤1-α,按公式(3)递增匹配比例标志Per,增加值为匹配目标集合目标数目与等价类Xd(countd)目标数目的比值,其中|Xd(countd)|表示等价类Xd(countd)中目标数目:
Per=Per+|mapset|/|Xd(countd)| (3);
步骤4.10,更新等价计数变量:将等价计数变量countI增加1,即countI=countI+1,返回步骤4.8;
步骤4.11,知识匹配判别:如果匹配比例标志Per≥α,判断知识Kv(v=countK)与类别d的第countd个等价类Xd(countd)相匹配,并更新知识Kv(v=countK)的决策属性支撑矢量Sv的第countd位为匹配比例标志Per,否则,判断知识Kv与类别d的第countd个等价类Xd(countd)不匹配;
步骤4.12,更新知识计数变量:将知识计数变量countK增加1,即countK=countK+1,返回步骤4.6;
步骤4.13,更新决策计数变量:将决策计数变量countd更新为countd=countd+1,返回步骤4.4;
步骤4.14,剔除冗余知识:针对知识集合Ω中各知识Ki(1≤i≤n)及其决策属性支撑矢量Si,判断是否存在另一条知识Kj,1≤j≤n且j≠i,其决策属性支撑矢量Sj在所有位置q,1≤q≤|U/IND(d)|,其取值均大于等于决策属性支撑矢量Si,即满足Sj[q]≥Si[q],其中|U/IND(d)|表示不可区分关系集合U/IND(d)大小,如果是判断知识Ki冗余,将知识Ki从知识集合Ω中剔除,即Ω=Ω-Ki;
步骤4.15,输出优化知识集合:输出从知识集合Ω中选择出的p条知识及其对应决策属性支撑矢量构建优化知识集合KS={(Ku,Su)}1≤u≤p;
步骤5、更新基础知识库:如果选择出的优化知识集合KS不为空,将优化知识集合KS作为类别d判定的知识存入所述基础知识库,最后结束流程。
本发明步骤4.1、4.2中,目标类别的不可区分关系集合以及知识集合的不可区分关系集合中的元素均是目标集合U的子集。转化为不可区分关系集合的目的是为了便于比较各知识粒度对目标类别,即决策属性,支撑的程度。
本发明步骤4.3、4.4中,决策计数变量countd用于标识当前比较的目标类别的不可区分关系集合中的元素,取值范围在1和|U/IND(d)|之间。
本发明步骤4.5、4.6中,知识计数变量countK用于标识当前比较的知识集合Ω中的知识Kv(v=countK),取值范围在1和n之间。
本发明步骤4.7中,匹配比例标志Per用于标识知识集合Ω中的当前知识Kv(v=countK)与目标类别d的不可区分关系集合中的当前元素(即等价类Xd(countd))之间的匹配程度。等价计数变量countI用于标识当前知识Kv(v=countK)正在进行比较的元素,即等价类XKv(countI),取值范围在1和|U/IND(Kv)|之间。
本发明步骤4.9中,将第countK个知识Kv(v=countK)的第countI个等价类XKv(countI)与目标类别不可区分关系集合U/IND(d)中第countd个等价类Xd(countd)进行匹配,匹配结果保存在匹配比例标志Per中。匹配阈值门限α越高,对匹配的要求越严格,门限α越低,对匹配的要求越宽松,一般设置为0.8。
本发明步骤4.11中,根据匹配阈值门限α和最终计算得出的匹配比例标志Per,更新当前知识Kv(v=countK)对应的决策属性支撑矢量Sv的第countd个元素的取值。在完全匹配的情况下,决策属性支撑矢量Sv的第countd位元素值为1。
本发明步骤4.14中,根据决策属性支撑矢量对计算机智能辅助决策系统知识集合Ω中各知识的冗余性进行判断,冗余的知识将不被用于决策属性的判断,这有利于提高知识集合的简洁性和针对辅助决策任务的自动选择能力。
下面通过两个实施案例来说明本发明的基于不可区分关系的计算机辅助决策系统知识选择方法。
实施例1:
假设目标数据库为三元组S=(U,C,d),其中U表示目标集合,由10个目标x1,x2,...,x10组成,即U={x1,x2,...,x10},C={c1,c2,c3,c4}表示目标属性集,由4个属性组成,d表示目标类别,目标数据库中的每一条记录对应一个目标xi(1≤i≤10),包括目标xi的4个属性的取值f(x,c1)、f(x,c2)、…和f(x,c4),以及其目标类别f(xi,d)。同时,假设知识集合库中现有知识集合Ω={K}中仅有1条知识K,即|Ω|=n=1,且假设知识K={c1,c2};且假设阈值门限为α=0.9。目标数据库如下表所示。根据步骤4.1~4.13计算知识K的决策属性支撑矢量。
表1目标数据库
步骤4.1,构建目标类别不可区分关系集合:根据目标类别d构建不可区分关系集合U/IND(d),集合U/IND(d)中的每个元素是一个基于目标类别d的等价类Xd,U/IND(d)={{x1,x2,x3},{x4,x5,x6},{x7,x8,x9,x10}},各等价类Xd中任意两个目标对应目标类别d相同。例如,第一个等价类Xd(1)={x1,x2,x3}中任意两个目标对应目标类别d均为1,即f(x1,d)=f(x2,d)=f(x3,d)=1。
步骤4.2,构建知识集合的不可区分关系集合:根据知识集合Ω={K}中的知识K构建不可区分关系集合U/IND(K),集合U/IND(K)中的每个元素是一个基于知识K的等价类XK。针对知识K={c1,c2}构建的不可区分关系集合为:U/IND(K)={{x1,x2,x3},{x4,x5,x6},{x7,x8},{x9,x10}}。
步骤4.3,初始化决策计数变量:将决策计数变量countd初始化为1。
步骤4.4,判断决策计数变量:判断决策计数变量countd小于目标类别不可区分关系集合的大小|U/IND(d)|=3,继续步骤4.5。
步骤4.5,初始化知识计数变量:将知识计数变量countK初始化为1。
步骤4.6,判断知识计数变量:判断知识计数变量countK等于n=1,初始化知识K的决策属性支撑矢量S=(0,0,0),继续步骤4.7。
步骤4.7,初始化匹配比例标志和等价计数变量:将匹配比例标志Per初始化为零,将等价计数变量countI初始化为1。
步骤4.8,判断等价计数变量:判断等价计数变量countI小于知识K的不可区分关系集合大小|U/IND(K)|=4,继续步骤4.9。
步骤4.9,等价类匹配判别:获取知识K的第1(countI=1)个等价类XK(1),即集合{x1,x2,x3},与目标类别不可区分关系集合U/IND(d)中第1(countd=1)个等价类Xd(1),即集合{x1,x2,x3}进行比较,计算两等价类的匹配目标集合和非匹配目标集合
mapset=XK(countI)∩Xd(countd)={x1,x2,x3},
因为|unmapset|/|mapset|=0≤1-α,更新匹配比例标志Per=0+3/3=1。
步骤4.10,更新等价计数变量:将等价计数变量countI增加1,即countI=countI+1=2,返回步骤4.8。
步骤4.8,判断等价计数变量:判断等价计数变量countI小于知识K的不可区分关系集合大小|U/IND(K)|=4,继续步骤4.9。
步骤4.9,等价类匹配判别:获取知识K的第2(countI=2)个等价类XK(2),即集合{x4,x5,x6},与目标类别不可区分关系集合U/IND(d)中第1(countd=1)个等价类Xd(1),即集合{x1,x2,x3}进行比较,计算两等价类的匹配目标集合和非匹配目标集合
unmapset=XK(countI)-mapset={x1,x2,x3},
因为匹配目标集合大小|mapset|=0,继续步骤4.10。
步骤4.10,更新等价计数变量:将等价计数变量countI增加1,即countI=countI+1=3,返回步骤4.8。
步骤4.8,判断等价计数变量:判断等价计数变量countI小于知识K的不可区分关系集合的大小|U/IND(K)|=4,继续步骤4.9。
步骤4.9,等价类匹配判别:获取知识K的第3(countI=3)个等价类XK(3),即集合{x7,x8},与目标类别不可区分关系集合U/IND(d)中第1(countd=1)个等价类Xd(1),即集合{x1,x2,x3}进行比较,匹配目标集合大小|mapset|=0,继续步骤4.10。
步骤4.10,更新等价计数变量:将等价计数变量countI增加1,即countI=countI+1=4,返回步骤4.8。
步骤4.8,判断等价计数变量:判断等价计数变量countI等于知识K不可区分关系集合大小|U/IND(K)|=4,继续步骤4.9。
步骤4.9,等价类匹配判别:获取知识K的第4(countI=4)个等价类XK(4),即集合{x9,x10},与目标类别不可区分关系集合U/IND(d)中第1(countd=1)个等价类Xd(1),即集合{x1,x2,x3}进行比较,满足|unmapset|/|mapset|=∞>1-α,继续步骤4.10。
步骤4.10,更新等价计数变量:将等价计数变量countI增加1,即countI=countI+1=5,返回步骤4.8。
步骤4.8,判断等价计数变量:判断等价计数变量countI大于知识K不可区分关系集合大小|U/IND(K)|=4,跳至步骤4.11。
步骤4.11,知识匹配判别:因为匹配比例标志Per≥α,判断知识K与类别d的第1(countd=1)个等价类Xd(1)相匹配,并更新决策属性支撑矢量S={0,0,0}的第1位为匹配比例标志Per,即S=(1,0,0)。
同理,可以设置知识K第2和第3位的数值,最终得到的知识K的决策属性支撑矢量为S=(1,1,1)。
实施例2:
假设在实施案例1中的目标数据库(表1)基础上,存在知识集合Ω={K1,K2,K3},其中知识K1={c1,c2},知识K2、K3为新增的,且K2={c3},K3={c4},首先根据步骤4.1~4.13生成的3条知识的不可区分关系集合以及决策属性支撑矢量,假设阈值门限为α=0.7,再根据步骤4.14~4.15,输出最终的优化知识集合。
针对第1条知识K1={c1,c2}构建的不可区分关系集合为:U/IND(K1)={{x1,x2,x3},{x4,x5,x6},{x7,x8},{x9,x10}}。针对第2条知识K2={c3}构建的不可区分关系集合为:U/IND(K2)={{x1,x2,x3,x4},{x5,x6,x7},{x8,x9,x10}};针对第3条知识K3={c4}构建的不可区分关系集合为:U/IND(K3)={{x1,x2,x6,x8},{x3,x4,x5,x7,x9,x10}}。根据步骤4.1~4.13生成的不可区分关系集合以及决策属性支撑矢量如表2所示:
表2决策属性支撑矢量
步骤4.14,剔除冗余知识:针对知识K2、K3及其分别对应的决策属性支撑矢量S2、S3,存在知识K1,对应决策属性支撑矢量S1,在决策属性支撑矢量所有位置q(1≤q≤3)上,满足S2[q]≤S1[q]和S3[q]≤S1[q],因此判断知识K2和K3冗余。
步骤4.15,输出优化知识集合:输出最终优化知识集合KS={(K1,S1)}。
目前学术界已经提出了多种知识粒度计算模型。其中最主要的是模糊集、粗糙集和商空间理论。模糊集模型是Zadeh根据模糊集理论提出的,用模糊数学的方法对有关粒度计算的方法和理论进行研究。粗糙集模型是由Pawlak在20世纪80年代初提出的。商空间理论是由我国的张拔、张铃提出的。在商空间模型理论下,概念用子集来表示,不同粒度的概念表现为不同粒度的子集,一簇概念构成了空间的一个划分,称为商空间。然而,上述理论方法尚不足以描述不同知识粒度对计算机智能辅助决策系统的支撑力度和程度,因此影响了知识在计算机辅助决策上的灵活和高效应用。
总的来说,本发明主要针对辅助决策任务中普遍存在的计算机系统存储信息爆炸,而计算机智能辅助决策系统难以自动筛选出合适的知识以支撑信息决策的问题,提出了一种基于不可区分关系的计算机辅助决策系统知识选择方法。本发明首先有助于对计算机智能辅助决策系统中知识的选择,针对决策任务能够筛除冗余的知识;其次,本发明提出了一种新型的基于决策属性支撑矢量的量化指标和模型;同时,本发明有助于计算机智能辅助决策系统知识集合整体的辅助决策支撑能力的优化。本发明可以应用于支撑任何领域的计算机辅助决策任务,如识别多种辐射源目标类型、判别传感器网络监控目标的类型、预测火山活动的类型、预测药物对病人的医疗效果等。
本发明提供了一种基于不可区分关系的计算机辅助决策系统知识选择方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (3)
1.一种基于不可区分关系的计算机辅助决策系统知识选择方法,其特征在于:计算机包含有中央处理器和存储器,且将计算机与数据采集设备相连接,数据采集设备采集到的数据是监测目标的一组属性值和目标类别,其中属性值为连续型或离散型;
所述的存储器中保存目标数据库、知识集合库、基础知识库、会话模块和问题处理模块;所述的中央处理器对所述的存储器进行控制并执行以下步骤:
步骤1、构建目标数据库:将数据采集设备获取的数据进行离散化后存入目标数据库;目标数据库表示为三元组S=(U,C,d),其中U表示目标集合,且U不为空,C={c1,c2,...,cm}表示目标属性集,由c1、c2、......、cm共m个属性组成,d表示目标类别,目标数据库中的每一条记录对应一个目标x,包括目标x的m个目标属性的取值f(x,c1)、f(x,c2)、...和f(x,cm),以及其类别f(x,d);
步骤2、确认决策问题:通过会话模块由用户确认决策问题是否为目标数据库中的目标类别判定问题,确认后会话模块将目标类别判定问题传送给问题处理模块;
步骤3、构建知识集合库:根据目标数据库中的目标属性集C,由问题处理模块枚举出满足长度限制δ的n条知识,K1,K2,...,Kn,构成知识集合Ω,即|Ω|=n,其中每条知识Ki,1≤i≤n,是目标属性集C的子集,即且每条知识Ki的长度不大于δ,即|Ki|≤δ;将知识集合Ω存入知识集合库,并根据属性映射建立目标数据库与知识集合库的对应关系;
步骤4、知识选择:设定阈值门限为α,α取值范围为0<α≤1;问题处理模块基于不可区分关系从知识集合Ω选择出支撑目标类别d判定的由p条知识,K1,K2,...,Kp,共同组成的优化知识集合KS,即KS={K1,K2,...,Kp},优化知识集合KS是知识集合Ω的子集,即同时计算出优化知识集合KS中各知识Ku的类别判定支撑矢量Su,1≤u≤p;
步骤5、更新基础知识库:如果选择出的优化知识集合KS不为空,将优化知识集合KS作为类别d判定的知识存入所述基础知识库。
2.根据权利要求1所述的一种基于不可区分关系的计算机辅助决策系统知识选择方法,其特征在于:步骤4包括以下步骤:
步骤4.1,构建目标类别不可区分关系集合:根据辅助决策任务中的目标类别d构建目标集合U上的不可区分关系集合U/IND(d),不可区分关系集合U/IND(d)中各元素是一个基于目标类别d的等价类Xd,且每个等价类Xd是目标集合U的一个子集,即U/IND(d)={Xd(1),Xd(2),...}={Xd}且每个等价类Xd中任意两个目标的类别均相同,即f(xr,d)=f(xs,d);
步骤4.2,构建知识集合的不可区分关系集合:针对知识集合Ω={K1,K2,...,Kn}中各条知识Ki,1≤i≤n,分别构建其不可区分关系集合U/IND(Ki),集合U/IND(Ki)中的各元素是一个基于知识Ki的等价类XKi,即U/IND(Ki)={XKi(1),XKi(2),...}={XKi},每个等价类XKi均是目标集合U的一个子集,即使得等价类XKi中任意两个目标xa和xb在知识Ki中任意属性c的取值均相同,即f(xa,c)=f(xb,c);
步骤4.3,初始化决策计数变量:将决策计数变量countd初始化为1;
步骤4.4,判断决策计数变量:判断决策计数变量countd是否小于等于目标类别不可区分关系集合的大小|U/IND(d)|,如果是继续步骤4.5,否则跳至步骤4.14;
步骤4.5,初始化知识计数变量:将知识计数变量countK初始化为1;
步骤4.6,判断知识计数变量:判断知识计数变量countK是否小于等于知识数目n,如果是并且对应知识Kv的决策属性支撑矢量不存在,v=countK,则初始化知识Kv的决策属性支撑矢量,维度等于不可区分关系集合U/IND(d)大小,表示为零向量Sv={0,0,...,0}|U/IND(d)|;如果是继续步骤4.7,否则跳至步骤4.13;
步骤4.7,初始化匹配比例标志和等价计数变量:初始化匹配比例标志Per为零,初始化等价计数变量countI为1;
步骤4.8,判断等价计数变量:判断等价计数变量countI是否小于等于不可区分关系集合U/IND(Kv)的大小|U/IND(Kv)|,如果是继续步骤4.9,否则跳至步骤4.11;
步骤4.9,等价类匹配判别:获取知识集合Ω中第countK个知识Kv的第countI个等价类XKv(countI),将等价类XKv(countI)与目标类别d的不可区分关系集合U/IND(d)中第countd个等价类Xd(countd)进行比较,根据匹配阈值门限α计算两个等价类的匹配目标集合mapset和非匹配目标集合unmapset,匹配目标集合mapset为等价类XKv(countI)与等价类Xd(countd)的共有目标集合,非匹配目标集合unmapset为等价类XKv(countI)除去匹配目标集合后剩余目标的集合,计算过程如公式(1)和(2)分别所示:
mapset=XKv(countI)∩Xd(countd) (1)
unmapset=XKv(countI)-mapset (2)
如果匹配目标集合大小|mapset|>0且满足|unmapset|/|mapset|≤1-α,按公式(3)递增匹配比例标志Per,增加值为匹配目标集合目标数目与等价类Xd(countd)目标数目的比值,其中|Xd(countd)|表示等价类Xd(countd)中目标数目:
Per=Per+|mapset|/|Xd(countd)| (3);
步骤4.10,更新等价计数变量:将等价计数变量countI增加1,即countI=countI+1,返回步骤4.8;
步骤4.11,知识匹配判别:如果匹配比例标志Per≥α,判断知识Kv与类别d的第countd个等价类Xd(countd)相匹配,并更新知识Kv的决策属性支撑矢量Sv的第countd位为匹配比例标志Per,否则,判断知识Kv与类别d的第countd个等价类Xd(countd)不匹配;
步骤4.12,更新知识计数变量:将知识计数变量countK增加1,即countK=countK+1,返回步骤4.6;
步骤4.13,更新决策计数变量:将决策计数变量countd更新为countd=countd+1,返回步骤4.4;
步骤4.14,剔除冗余知识:针对知识集合Ω中各知识Ki决策属性支撑矢量Si,1≤i≤n,判断是否存在另一条知识Kj,1≤j≤n且j≠i,其决策属性支撑矢量Sj在所有位置q1≤q≤|U/IND(d)|,其取值均大于等于决策属性支撑矢量Si,即满足Sj[q]≥Si[q],1≤q≤|U/IND(d)|,其中|U/IND(d)|表示不可区分关系集合U/IND(d)的大小,如果是判断知识Ki冗余,将知识Ki从知识集合Ω中剔除,即Ω=Ω-Ki;
步骤4.15,输出优化知识集合:输出从知识集合Ω中选择出的p条知识及其对应决策属性支撑矢量构建优化知识集合KS={(Ku,Su)}1≤u≤p。
3.根据权利要求2所述的一种基于不可区分关系的计算机辅助决策系统知识选择方法,其特征在于,针对目标类别不可区分关系集合中每一元素均设置匹配比例标志,匹配程度越高,设置匹配比例标志越接近1;匹配程度越低,设置匹配比例标志越接近0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410141422.0A CN103870879B (zh) | 2014-04-09 | 2014-04-09 | 基于不可区分关系的计算机辅助决策系统知识选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410141422.0A CN103870879B (zh) | 2014-04-09 | 2014-04-09 | 基于不可区分关系的计算机辅助决策系统知识选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103870879A CN103870879A (zh) | 2014-06-18 |
CN103870879B true CN103870879B (zh) | 2016-08-17 |
Family
ID=50909392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410141422.0A Active CN103870879B (zh) | 2014-04-09 | 2014-04-09 | 基于不可区分关系的计算机辅助决策系统知识选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103870879B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874007A (zh) * | 2017-02-23 | 2017-06-20 | 李庆亮 | 一种辅助决策逻辑规则创建方法、辅助决策方法及系统 |
CN112347532B (zh) * | 2020-11-06 | 2024-06-14 | 北京机械设备研究所 | 电缆敷设序列确定方法、装置及计算机设备 |
CN115829061B (zh) * | 2023-02-21 | 2023-04-28 | 中国电子科技集团公司第二十八研究所 | 一种基于历史案例和经验知识学习的应急事故处置方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844566A (ja) * | 1994-05-26 | 1996-02-16 | Meidensha Corp | 知識処理システム |
CN1428696A (zh) * | 2001-12-29 | 2003-07-09 | 杨炳儒 | 基于双库协同机制的kdd*新系统 |
CN1435780A (zh) * | 2003-03-04 | 2003-08-13 | 杨炳儒 | 一种Web挖掘系统的构造方法 |
CN1435781A (zh) * | 2003-02-24 | 2003-08-13 | 杨炳儒 | 一种基于信息挖掘的智能决策支持构造方法 |
-
2014
- 2014-04-09 CN CN201410141422.0A patent/CN103870879B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844566A (ja) * | 1994-05-26 | 1996-02-16 | Meidensha Corp | 知識処理システム |
CN1428696A (zh) * | 2001-12-29 | 2003-07-09 | 杨炳儒 | 基于双库协同机制的kdd*新系统 |
CN1435781A (zh) * | 2003-02-24 | 2003-08-13 | 杨炳儒 | 一种基于信息挖掘的智能决策支持构造方法 |
CN1435780A (zh) * | 2003-03-04 | 2003-08-13 | 杨炳儒 | 一种Web挖掘系统的构造方法 |
Non-Patent Citations (2)
Title |
---|
基于多决策值等价类的属性约简;张冬雯等;《计算机工程与设计》;20130331;第34卷(第3期);全文 * |
基于广义不可区分关系的决策表约简;秦克云等;《西华大学学报》;20130731;第32卷(第4期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103870879A (zh) | 2014-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Peng et al. | A hybrid data mining approach on BIM-based building operation and maintenance | |
Yang et al. | Multi-objective low-carbon disassembly line balancing for agricultural machinery using MDFOA and fuzzy AHP | |
Chen et al. | Identifying and visualizing technology evolution: A case study of smart grid technology | |
CN106373025A (zh) | 基于离群点检测的用电信息采集系统实时防窃电监测方法 | |
CN107633050A (zh) | 一种基于大数据分析用电行为判定窃电概率的方法 | |
CN105550714A (zh) | 一种异构网络环境中告警信息的聚类融合方法 | |
CN109977132B (zh) | 一种基于无监督聚类模式的学生异常行为模式分析方法 | |
Zhang et al. | Preselection via classification: A case study on evolutionary multiobjective optimization | |
CN106600103A (zh) | 面向规划计划决策的统计数据模型构建方法 | |
CN103559562A (zh) | 电网智能运行系统及其实现方法 | |
CN103870879B (zh) | 基于不可区分关系的计算机辅助决策系统知识选择方法 | |
CN106067079A (zh) | 一种基于bp神经网络的灰霾预测的系统和方法 | |
CN106153114A (zh) | 一种远程控制楼宇智能化监控系统 | |
CN107104951A (zh) | 网络攻击源的检测方法和装置 | |
CN108920609A (zh) | 基于多维度分析的电力实验数据挖掘方法 | |
CN112576312B (zh) | 智能化综采工作面电液控支架数据收集及处理方法 | |
CN108710990A (zh) | 基于同期数据的线变台户多级线损分析方法及系统 | |
CN105005852A (zh) | 一种基于图像分析的宿舍环境智能监测系统 | |
CN110379036A (zh) | 变电站智能巡检识别方法、系统、装置及存储介质 | |
Wang et al. | Ordered visibility graph weighted averaging aggregation operator: A methodology based on network analysis | |
CN103914482B (zh) | 基于cmdb的集中监控事件影响性确定方法 | |
CN106526425A (zh) | 基于智能电表实采数据的低电压诊断方法 | |
Liu | An integrated fuzzy time series forecasting system | |
CN110148290B (zh) | 智能感知矿山安全生产预警与防控监管信息化大数据系统 | |
CN106447207A (zh) | 一种基于大数据分析的绿色建筑预评价系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |