CN103870879B

CN103870879B - 基于不可区分关系的计算机辅助决策系统知识选择方法

Info

Publication number: CN103870879B
Application number: CN201410141422.0A
Authority: CN
Inventors: 徐欣; 易侃; 周方; 张金锋
Original assignee: CETC 28 Research Institute
Current assignee: CETC 28 Research Institute
Priority date: 2014-04-09
Filing date: 2014-04-09
Publication date: 2016-08-17
Anticipated expiration: 2034-04-09
Also published as: CN103870879A

Abstract

本发明公开了一种基于不可区分关系的计算机辅助决策系统知识选择方法，其特征在于：计算机包含有中央处理器和存储器，且将计算机与数据采集设备相连接，数据采集设备采集到的数据是监测目标的一组属性值和目标类别，其中属性值为连续型或离散型；所述的存储器中保存目标数据库、知识集合库、基础知识库、会话模块和问题处理模块；所述的中央处理器对所述的存储器进行控制并执行以下步骤：步骤1、构建目标数据库；步骤2、确认决策问题；步骤3、构建知识集合库；步骤4、知识选择；步骤5、更新基础知识库。

Description

基于不可区分关系的计算机辅助决策系统知识选择方法

技术领域

本发明涉及一种计算机辅助决策的信息处理、分析和管理领域，特别是一种针对计算机智能辅助决策系统进行知识匹配判别和筛选的评估方法。

背景技术

在计算机智能辅助决策领域，目前学术界已经提出了多种知识粒度计算模型。其中最主要的是模糊集、粗糙集和商空间理论。模糊集模型是Zadeh根据模糊集理论提出的，用模糊数学的方法对有关粒度计算的方法和理论进行研究。粗糙集模型是由Pawlak在20世纪80年代初提出的。商空间理论是由我国的张拔、张铃提出的。在商空间模型理论下，概念用子集来表示，不同粒度的概念表现为不同粒度的子集，一簇概念构成了空间的一个划分，称为商空间。然而，上述理论方法尚不足以描述不同知识粒度对辅助决策的支撑力度和程度，因此影响了计算机智能辅助决策系统中知识在辅助决策任务中灵活和高效的应用。

发明内容

发明目的：本发明所要解决的技术问题是针对现有技术的不足，提供一种基于不可区分关系的计算机辅助决策系统知识选择方法。

为了解决上述技术问题，本发明公开了一种基于不可区分关系的计算机辅助决策系统知识选择方法：首先，分别针对辅助决策任务中的决策属性和计算机智能辅助决策系统知识集合构建相应的不可区分关系集合；接着，在知识和决策属性的匹配判断过程中逐步生成决策属性支撑矢量，定量化地描述知识和决策属性的匹配程度；然后，根据决策属性支撑矢量判断并剔除对决策属性判断冗余的知识；最后，输出支撑决策属性判定的优化知识集合及其中各知识的决策属性支撑矢量，并用其构建基础知识库。

本发明计算机包含有中央处理器和存储器，且将计算机与数据采集设备相连接，数据采集设备采集到的数据是监测目标的一组属性值和目标类别，其中属性值为连续型（参见：《统计学》，贾俊平，清华大学出版社，应用统计学系列教材，2006）或离散型（参见：《统计学》，贾俊平，清华大学出版社，应用统计学系列教材，2006）；

所述的存储器中保存目标数据库、知识集合库、基础知识库、会话模块和问题处理模块；所述的中央处理器对所述的存储器进行控制并执行以下步骤：

步骤1、构建目标数据库：将数据采集设备获取的数据进行离散化（参见：《数据挖掘基础教程》，西蒙（作者），范明（译者），牛常勇（译者），机械工业出版社，2009）后存入目标数据库；目标数据库表示为三元组S=(U,C,d)，其中U表示目标集合，且U不为空，C={c₁,c₂,...,c_m}表示目标属性集，由c₁、c₂、……、c_m共m个属性组成，d表示目标类别，目标数据库中的每一条记录对应一个目标x，包括目标x的m个目标属性的取值f(x,c₁)、f(x,c₂)、…和f(x,c_m)，以及其类别f(x,d)；

步骤2、确认决策问题：通过会话模块由用户确认决策问题是否目标数据库中的目标类别判定问题，确认后会话模块将目标类别判定问题传送给问题处理模块；

步骤3、构建知识集合库：根据目标数据库中的目标属性集C，由问题处理模块枚举出满足长度限制δ的n条知识，K₁，K₂，…，K_n，构成知识集合Ω，即Ω={K₁,K₂,...,K_n}，|Ω|=n，其中每条知识K_i，1≤i≤n，是目标属性集C的子集，即且每条知识K_i的长度不大于δ，即|K_i|≤δ；将知识集合Ω存入知识集合库，并根据属性映射建立目标数据库与知识集合库的对应关系；

步骤4、知识选择：设定阈值门限为α，α取值范围为0<α≤1；问题处理模块基于不可区分关系从知识集合Ω选择出支撑目标类别d判定的由p条知识，K₁,K₂,...,K_p，共同组成的优化知识集合KS，即KS={K₁,K₂,...,K_p}，优化知识集合KS是知识集合Ω的子集，即同时计算出优化知识集合KS中各知识K_u的类别判定支撑矢量S_u，1≤u≤p；

步骤4包括以下步骤：

步骤4.1，构建目标类别不可区分关系集合：根据辅助决策任务中的目标类别d构建目标集合U上的不可区分关系集合U/IND(d)，不可区分关系集合U/IND(d)中各元素是一个基于目标类别d的等价类X_d，且每个等价类X_d是目标集合U的一个子集，即U/IND(d)={X_d(1),X_d(2),...}={X_d}且每个等价类X_d中任意两个目标的类别均相同，即f(x_r,d)=f(x_s,d)；

步骤4.2，构建知识集合的不可区分关系集合：针对知识集合Ω={K₁,K₂,...,K_n}中各条知识K_i，1≤i≤n，分别构建其不可区分关系集合U/IND(K_i)，集合U/IND(K_i)中的各元素是一个基于知识K_i的等价类X_Ki，即U/IND(K_i)={X_Ki(1),X_Ki(2),...}={X_Ki}，每个等价类X_Ki均是目标集合U的一个子集，即使得等价类X_Ki中任意两个目标x_a和x_b在知识K_i中任意属性c的取值均相同，即f(x_a,c)=f(x_b,c)；

步骤4.3，初始化决策计数变量：将决策计数变量count_d初始化为1；

步骤4.4，判断决策计数变量：判断决策计数变量count_d是否小于等于目标类别不可区分关系集合的大小|U/IND(d)|，如果是继续步骤4.5，否则跳至步骤4.14；

步骤4.5，初始化知识计数变量：将知识计数变量count_K初始化为1；

步骤4.6，判断知识计数变量：判断知识计数变量count_K是否小于等于知识数目n，如果是并且对应知识K_v(v=count_K)的决策属性支撑矢量不存在，则初始化知识K_v的决策属性支撑矢量，维度等于不可区分关系集合U/IND(d)大小，表示为零向量S_v={0,0,...,0}_|U/IND(d)|；如果是继续步骤4.7，否则跳至步骤4.13；

步骤4.7，初始化匹配比例标志和等价计数变量：初始化匹配比例标志Per为零，初始化等价计数变量count_I为1；

步骤4.8，判断等价计数变量：判断等价计数变量count_I是否小于等于不可区分关系集合U/IND(K_v)的大小|U/IND(K_v)|，如果是继续步骤4.9，否则跳至步骤4.11；

步骤4.9，等价类匹配判别：获取知识集合Ω中第count_K个知识K_v（v=count_K）的第count_I个等价类X_Kv(count_I)，将等价类X_Kv(count_I)与目标类别d的不可区分关系集合U/IND(d)中第count_d个等价类X_d(count_d)进行比较，根据匹配阈值门限α计算两个等价类的匹配目标集合mapset和非匹配目标集合unmapset，匹配目标集合mapset为等价类X_Kv(count_I)与等价类X_d(count_d)的共有目标集合，非匹配目标集合unmapset为等价类X_Kv(count_I)除去匹配目标集合后剩余目标的集合，计算过程如公式(1)和(2)分别所示：

mapset=X_Kv(count_I)∩X_d(count_d) (1)

unmapset=X_Kv(count_I)-mapset (2)

Per=Per+|mapset|/|X_d(count_d)| (3)；

步骤4.10，更新等价计数变量：将等价计数变量count_I增加1，即count_I=count_I+1，返回步骤4.8；

步骤4.11，知识匹配判别：如果匹配比例标志Per≥α，判断知识K_v(v=count_K)与类别d的第count_d个等价类X_d(count_d)相匹配，并更新知识K_v(v=count_K)的决策属性支撑矢量S_v的第count_d位为匹配比例标志Per，否则，判断知识K_v与类别d的第count_d个等价类X_d(count_d)不匹配；

步骤4.12，更新知识计数变量：将知识计数变量count_K增加1，即count_K=count_K+1，返回步骤4.6；

步骤4.13，更新决策计数变量：将决策计数变量count_d更新为count_d=count_d+1，返回步骤4.4；

步骤4.14，剔除冗余知识：针对知识集合Ω中各知识K_i(1≤i≤n)及其决策属性支撑矢量Si，判断是否存在另一条知识K_j(1≤j≤n且j≠i)的决策属性支撑矢量S_j在所有位置q（1≤q≤|U/IND(d)|）上的取值均大于等于决策属性支撑矢量S_i，即满足S_j[q]≥S_i[q]，其中|U/IND(d)|表示不可区分关系集合U/IND(d)的大小，如果是判断知识K_i冗余，将知识K_i从知识集合Ω中剔除，即Ω=Ω-K_i；

步骤4.15，输出优化知识集合：输出从知识集合Ω中选择出的p条知识及其对应决策属性支撑矢量构建优化知识集合KS={(K_u,S_u)}_1≤u≤p；

步骤5、更新基础知识库：如果选择出的优化知识集合KS不为空，将优化知识集合KS作为类别d判定的知识存入所述基础知识库。

本发明步骤4.1、4.2中，目标类别的不可区分关系集合以及知识集合的不可区分关系集合中的元素均是目标集合U的子集。转化为不可区分关系集合的目的是为了便于比较各知识粒度对目标类别，即决策属性，支撑的程度。

本发明步骤4.3、4.4中，决策计数变量count_d用于标识当前比较的目标类别的不可区分关系集合中的元素，取值范围在1和|U/IND(d)|之间。

本发明步骤4.5、4.6中，知识计数变量count_K用于标识当前比较的知识集合Ω中的知识K_v(v=count_K)，取值范围在1和n之间。

本发明步骤4.7中，匹配比例标志Per用于标识知识集合Ω中的当前知识K_v(v=count_K)与目标类别d的不可区分关系集合中的当前元素（即等价类X_d(count_d)）之间的匹配程度。等价计数变量count_I用于标识当前知识K_v(v=count_K)正在进行比较的元素，即等价类X_Kv(count_I)，取值范围在1和|U/IND(K_v)|之间。

本发明步骤4.9中，将第count_K个知识K_v(v=count_K)的第count_I个等价类X_Kv(count_I)与目标类别不可区分关系集合U/IND(d)中第count_d个等价类X_d(count_d)进行匹配，匹配结果保存在匹配比例标志Per中。匹配阈值门限α越高，对匹配的要求越严格，门限α越低，对匹配的要求越宽松，一般设置为0.8。

本发明步骤4.11中，根据匹配阈值门限α和最终计算得出的匹配比例标志Per，更新当前知识K_v(v=count_K)对应的决策属性支撑矢量S_v的第count_d个元素的取值。在完全匹配的情况下，决策属性支撑矢量S_v的第count_d位元素值为1。

本发明步骤4.14中，根据决策属性支撑矢量对计算机智能辅助决策系统知识集合Ω中各知识的冗余性进行判断，冗余的知识将不被用于决策属性的判断，这有利于提高知识集合的简洁性和针对辅助决策任务的自动选择能力。

本申请与授权专利“一种基于信息挖掘的智能决策支持构造方法”一样均属于智能辅助决策系统的知识发现方法。但是，不同数据适用的知识发现方法是有较大差异的，并且不同知识发现方法挖掘出的知识也是各不相同的，知识的结构、形式也有巨大差异。而上述授权专利并未指明其方法适用的数据特点，也未明确其具体采用的知识发现算法，其指出的三类知识发现机制，Web挖掘、KDD挖掘和领域专家知识产生的知识是异构的、难以相互融合、甚至难以用数据库存储的。本发明的知识发现方法，数据定义明确、方法清晰、知识结构统一，便于存储和管理。

有益效果：本发明的显著优点为（1）根据决策属性支撑矢量直观和量化的评估了计算机智能辅助决策系统中知识和决策属性的支撑和匹配程度，并筛选了系统中冗余的知识，提高了知识利用的有效程度；（2）根据决策属性支撑矢量能够直接比较计算机智能辅助决策系统知识集合中不同知识在支撑辅助决策任务时的差别和强弱，能够更好地给决策者提供有效建议；（3）实现方法工程化——即本发明的输出结果在相同参数设置条件下是固定的、可重复实现的，不需要探索庞大的知识空间，计算成本较低，具有较低的时空复杂度，具有良好的工程应用前景，较易工程实现。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明，本发明的上述和/或其他方面的优点将会变得更加清楚。

图1为本发明工作流程图。

图2为本发明步骤4工作流程图。

具体实施方式

本发明针对计算机辅助决策任务中普遍存在的计算机系统存储信息爆炸，而计算机智能辅助决策系统难以自动筛选出合适的知识以支撑信息决策的问题，提出了一种基于不可区分关系的计算机辅助决策系统知识选择方法：分别针对辅助决策任务中的决策属性和计算机智能辅助决策系统知识集合构建相应的不可区分关系集合；接着，在知识和决策属性的匹配判断过程中逐步生成决策属性支撑矢量，定量化地描述知识和决策属性的匹配程度；然后，根据决策属性支撑矢量判断并剔除对决策属性判断冗余的知识；最后，输出支撑决策属性判定的优化知识集合及其中各知识的决策属性支撑矢量，并用其构建基础知识库。本发明的主要贡献如下：首先有助于对计算机智能辅助决策系统知识的选择；其次，本发明提出了一种新型的基于决策属性支撑矢量的决策属性匹配判断量化指标和模型；另外，本发明有助于实现知识的标准化管理。本发明可以应用于支撑任何领域的计算机辅助决策任务，如识别多种辐射源目标类型、判别传感器网络监控目标的类型、预测火山活动的类型、预测药物对病人的医疗效果等。

具体而言，本发明公开了一种基于不可区分关系的计算机辅助决策系统知识选择方法：分别针对辅助决策任务中的决策属性和计算机智能辅助决策系统知识集合构建相应的不可区分关系集合；接着，在知识和决策属性的匹配判断过程中逐步生成决策属性支撑矢量，定量化地描述知识和决策属性的匹配程度；然后，根据决策属性支撑矢量判断并剔除对决策属性判断冗余的知识；最后，输出支撑决策属性判定的优化知识集合及其中各知识的决策属性支撑矢量，并用其构建基础知识库。

如图1所示，本发明包括以下步骤：开始、构建目标数据库、确认决策问题、构建知识集合库、知识选择、更新基础知识库，最后结束。

1、一种基于不可区分关系的计算机辅助决策系统知识选择方法，其特征在于：计算机包含有中央处理器和存储器，且将计算机与数据采集设备相连接，数据采集设备采集到的数据是监测目标的一组属性值和目标类别，其中属性值为连续型或离散型；

所述的存储器中保存目标数据库、知识集合库、基础知识库、会话模块和问题处理模块；所述的中央处理器对所述的存储器进行控制并执行以下步骤：：

步骤1、构建目标数据库：将数据采集设备获取的数据进行离散化后存入目标数据库；目标数据库表示为三元组S=(U,C,d)，其中U表示目标集合，且U不为空，C={c₁,c₂,...,c_m}表示目标属性集，由c₁、c₂、……、c_m共m个属性组成，d表示目标类别，目标数据库中的每一条记录对应一个目标x，包括目标x的m个目标属性的取值f(x,c₁)、f(x,c₂)、…和f(x,c_m)，以及其类别f(x,d)；

步骤4包括以下步骤：

步骤4.6，判断知识计数变量：判断知识计数变量count_K是否小于等于知识数目n，如果是并且对应知识K_v(v=count_K)的决策属性支撑矢量不存在，则初始化知识K_v的决策属性支撑矢量维度等于不可区分关系集合U/IND(d)的大小，表示为零向量S_v={0,0,...,0}_|U/IND(d)|；如果是继续步骤4.7，否则跳至步骤4.13；

mapset=X_Kv(count_I)∩X_d(count_d) (1)

unmapset=X_Kv(count_I)-mapset (2)

Per=Per+|mapset|/|X_d(count_d)| (3)；

步骤4.14，剔除冗余知识：针对知识集合Ω中各知识K_i(1≤i≤n)及其决策属性支撑矢量S_i，判断是否存在另一条知识K_j，1≤j≤n且j≠i，其决策属性支撑矢量S_j在所有位置_q，1≤_q≤|U/IND(d)|，其取值均大于等于决策属性支撑矢量S_i，即满足S_j[q]≥S_i[q]，其中|U/IND(d)|表示不可区分关系集合U/IND(d)大小，如果是判断知识K_i冗余，将知识K_i从知识集合Ω中剔除，即Ω=Ω-K_i；

步骤5、更新基础知识库：如果选择出的优化知识集合KS不为空，将优化知识集合KS作为类别d判定的知识存入所述基础知识库，最后结束流程。

下面通过两个实施案例来说明本发明的基于不可区分关系的计算机辅助决策系统知识选择方法。

实施例1：

假设目标数据库为三元组S=(U,C,d)，其中U表示目标集合，由10个目标x₁,x₂,...,x₁₀组成，即U={x₁,x₂,...,x₁₀}，C={c₁,c₂,c₃,c₄}表示目标属性集，由4个属性组成，d表示目标类别，目标数据库中的每一条记录对应一个目标x_i（1≤i≤10），包括目标x_i的4个属性的取值f(x,c₁)、f(x,c₂)、…和f(x,c₄)，以及其目标类别f(x_i,d)。同时，假设知识集合库中现有知识集合Ω={K}中仅有1条知识K，即|Ω|=n=1，且假设知识K={c₁,c₂}；且假设阈值门限为α=0.9。目标数据库如下表所示。根据步骤4.1～4.13计算知识K的决策属性支撑矢量。

表1目标数据库

步骤4.1，构建目标类别不可区分关系集合：根据目标类别d构建不可区分关系集合U/IND(d)，集合U/IND(d)中的每个元素是一个基于目标类别d的等价类X_d，U/IND(d)={{x₁,x₂,x₃},{x₄,x₅,x₆},{x₇,x₈,x₉,x₁₀}}，各等价类X_d中任意两个目标对应目标类别d相同。例如，第一个等价类X_d(1)={x₁,x₂,x₃}中任意两个目标对应目标类别d均为1，即f(x₁,d)=f(x₂,d)=f(x₃,d)=1。

步骤4.2，构建知识集合的不可区分关系集合：根据知识集合Ω={K}中的知识K构建不可区分关系集合U/IND(K)，集合U/IND(K)中的每个元素是一个基于知识K的等价类X_K。针对知识K={c₁,c₂}构建的不可区分关系集合为：U/IND(K)={{x₁,x₂,x₃},{x₄,x₅,x₆},{x₇,x₈},{x₉,x₁₀}}。

步骤4.3，初始化决策计数变量：将决策计数变量count_d初始化为1。

步骤4.4，判断决策计数变量：判断决策计数变量count_d小于目标类别不可区分关系集合的大小|U/IND(d)|=3，继续步骤4.5。

步骤4.5，初始化知识计数变量：将知识计数变量count_K初始化为1。

步骤4.6，判断知识计数变量：判断知识计数变量count_K等于n=1，初始化知识K的决策属性支撑矢量S=(0,0,0)，继续步骤4.7。

步骤4.7，初始化匹配比例标志和等价计数变量：将匹配比例标志Per初始化为零，将等价计数变量count_I初始化为1。

步骤4.8，判断等价计数变量：判断等价计数变量count_I小于知识K的不可区分关系集合大小|U/IND(K)|=4，继续步骤4.9。

步骤4.9，等价类匹配判别：获取知识K的第1（count_I=1）个等价类X_K(1)，即集合{x₁,x₂,x₃}，与目标类别不可区分关系集合U/IND(d)中第1（count_d=1）个等价类X_d(1)，即集合{x₁,x₂,x₃}进行比较，计算两等价类的匹配目标集合和非匹配目标集合

mapset=X_K(count_I)∩X_d(count_d)={x₁,x₂,x₃}，

因为|unmapset|/|mapset|=0≤1-α，更新匹配比例标志Per=0+3/3=1。

步骤4.10，更新等价计数变量：将等价计数变量count_I增加1，即count_I=count_I+1=2，返回步骤4.8。

步骤4.9，等价类匹配判别：获取知识K的第2（count_I=2）个等价类X_K(2)，即集合{x₄,x₅,x₆}，与目标类别不可区分关系集合U/IND(d)中第1（count_d=1）个等价类X_d(1)，即集合{x₁,x₂,x₃}进行比较，计算两等价类的匹配目标集合和非匹配目标集合

unmapset=X_K(count_I)-mapset={x₁,x₂,x₃}，

因为匹配目标集合大小|mapset|=0，继续步骤4.10。

步骤4.10，更新等价计数变量：将等价计数变量count_I增加1，即count_I=count_I+1=3，返回步骤4.8。

步骤4.8，判断等价计数变量：判断等价计数变量count_I小于知识K的不可区分关系集合的大小|U/IND(K)|=4，继续步骤4.9。

步骤4.9，等价类匹配判别：获取知识K的第3（count_I=3）个等价类X_K(3)，即集合{x₇,x₈}，与目标类别不可区分关系集合U/IND(d)中第1（count_d=1）个等价类X_d(1)，即集合{x₁,x₂,x₃}进行比较，匹配目标集合大小|mapset|=0，继续步骤4.10。

步骤4.10，更新等价计数变量：将等价计数变量count_I增加1，即count_I=count_I+1=4，返回步骤4.8。

步骤4.8，判断等价计数变量：判断等价计数变量count_I等于知识K不可区分关系集合大小|U/IND(K)|=4，继续步骤4.9。

步骤4.9，等价类匹配判别：获取知识K的第4（count_I=4）个等价类X_K(4)，即集合{x₉,x₁₀}，与目标类别不可区分关系集合U/IND(d)中第1（count_d=1）个等价类X_d(1)，即集合{x₁,x₂,x₃}进行比较，满足|unmapset|/|mapset|=∞>1-α，继续步骤4.10。

步骤4.10，更新等价计数变量：将等价计数变量count_I增加1，即count_I=count_I+1=5，返回步骤4.8。

步骤4.8，判断等价计数变量：判断等价计数变量count_I大于知识K不可区分关系集合大小|U/IND(K)|=4，跳至步骤4.11。

步骤4.11，知识匹配判别：因为匹配比例标志Per≥α，判断知识K与类别d的第1（count_d=1）个等价类X_d(1)相匹配，并更新决策属性支撑矢量S={0,0,0}的第1位为匹配比例标志Per，即S=(1,0,0)。

同理，可以设置知识K第2和第3位的数值，最终得到的知识K的决策属性支撑矢量为S=(1,1,1)。

实施例2：

假设在实施案例1中的目标数据库（表1）基础上，存在知识集合Ω={K₁,K₂,K₃}，其中知识K₁={c₁,c₂}，知识K₂、K₃为新增的，且K₂={c₃}，K₃={c₄}，首先根据步骤4.1～4.13生成的3条知识的不可区分关系集合以及决策属性支撑矢量，假设阈值门限为α=0.7，再根据步骤4.14～4.15，输出最终的优化知识集合。

针对第1条知识K₁={c₁,c₂}构建的不可区分关系集合为：U/IND(K₁)={{x₁,x₂,x₃},{x₄,x₅,x₆},{x₇,x₈},{x₉,x₁₀}}。针对第2条知识K₂={c₃}构建的不可区分关系集合为：U/IND(K₂)={{x₁,x₂,x₃,x₄},{x₅,x₆,x₇},{x₈,x₉,x₁₀}}；针对第3条知识K₃={c₄}构建的不可区分关系集合为：U/IND(K₃)={{x₁,x₂,x₆,x₈},{x₃,x₄,x₅,x₇,x₉,x₁₀}}。根据步骤4.1～4.13生成的不可区分关系集合以及决策属性支撑矢量如表2所示：

表2决策属性支撑矢量

步骤4.14，剔除冗余知识：针对知识K₂、K₃及其分别对应的决策属性支撑矢量S₂、S₃，存在知识K₁，对应决策属性支撑矢量S₁，在决策属性支撑矢量所有位置q（1≤q≤3）上，满足S₂[q]≤S₁[q]和S₃[q]≤S₁[q]，因此判断知识K₂和K₃冗余。

步骤4.15，输出优化知识集合：输出最终优化知识集合KS={(K₁,S₁)}。

目前学术界已经提出了多种知识粒度计算模型。其中最主要的是模糊集、粗糙集和商空间理论。模糊集模型是Zadeh根据模糊集理论提出的，用模糊数学的方法对有关粒度计算的方法和理论进行研究。粗糙集模型是由Pawlak在20世纪80年代初提出的。商空间理论是由我国的张拔、张铃提出的。在商空间模型理论下，概念用子集来表示，不同粒度的概念表现为不同粒度的子集，一簇概念构成了空间的一个划分，称为商空间。然而，上述理论方法尚不足以描述不同知识粒度对计算机智能辅助决策系统的支撑力度和程度，因此影响了知识在计算机辅助决策上的灵活和高效应用。

总的来说，本发明主要针对辅助决策任务中普遍存在的计算机系统存储信息爆炸，而计算机智能辅助决策系统难以自动筛选出合适的知识以支撑信息决策的问题，提出了一种基于不可区分关系的计算机辅助决策系统知识选择方法。本发明首先有助于对计算机智能辅助决策系统中知识的选择，针对决策任务能够筛除冗余的知识；其次，本发明提出了一种新型的基于决策属性支撑矢量的量化指标和模型；同时，本发明有助于计算机智能辅助决策系统知识集合整体的辅助决策支撑能力的优化。本发明可以应用于支撑任何领域的计算机辅助决策任务，如识别多种辐射源目标类型、判别传感器网络监控目标的类型、预测火山活动的类型、预测药物对病人的医疗效果等。

本发明提供了一种基于不可区分关系的计算机辅助决策系统知识选择方法，具体实现该技术方案的方法和途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

1.一种基于不可区分关系的计算机辅助决策系统知识选择方法，其特征在于：计算机包含有中央处理器和存储器，且将计算机与数据采集设备相连接，数据采集设备采集到的数据是监测目标的一组属性值和目标类别，其中属性值为连续型或离散型；

步骤1、构建目标数据库：将数据采集设备获取的数据进行离散化后存入目标数据库；目标数据库表示为三元组S＝(U,C,d)，其中U表示目标集合，且U不为空，C＝{c₁,c₂,...,c_m}表示目标属性集，由c₁、c₂、......、c_m共m个属性组成，d表示目标类别，目标数据库中的每一条记录对应一个目标x，包括目标x的m个目标属性的取值f(x,c₁)、f(x,c₂)、...和f(x,c_m)，以及其类别f(x,d)；

步骤2、确认决策问题：通过会话模块由用户确认决策问题是否为目标数据库中的目标类别判定问题，确认后会话模块将目标类别判定问题传送给问题处理模块；

步骤3、构建知识集合库：根据目标数据库中的目标属性集C，由问题处理模块枚举出满足长度限制δ的n条知识，K₁，K₂，...，K_n，构成知识集合Ω，即|Ω|＝n，其中每条知识K_i，1≤i≤n，是目标属性集C的子集，即且每条知识K_i的长度不大于δ，即|K_i|≤δ；将知识集合Ω存入知识集合库，并根据属性映射建立目标数据库与知识集合库的对应关系；

步骤4、知识选择：设定阈值门限为α，α取值范围为0＜α≤1；问题处理模块基于不可区分关系从知识集合Ω选择出支撑目标类别d判定的由p条知识，K₁,K₂,...,K_p，共同组成的优化知识集合KS，即KS＝{K₁,K₂,...,K_p}，优化知识集合KS是知识集合Ω的子集，即同时计算出优化知识集合KS中各知识K_u的类别判定支撑矢量S_u，1≤u≤p；

2.根据权利要求1所述的一种基于不可区分关系的计算机辅助决策系统知识选择方法，其特征在于：步骤4包括以下步骤：

步骤4.1，构建目标类别不可区分关系集合：根据辅助决策任务中的目标类别d构建目标集合U上的不可区分关系集合U/IND(d)，不可区分关系集合U/IND(d)中各元素是一个基于目标类别d的等价类X_d，且每个等价类X_d是目标集合U的一个子集，即U/IND(d)＝{X_d(1),X_d(2),...}＝{X_d}且每个等价类X_d中任意两个目标的类别均相同，即f(x_r,d)＝f(x_s,d)；

步骤4.2，构建知识集合的不可区分关系集合：针对知识集合Ω＝{K₁,K₂,...,K_n}中各条知识K_i，1≤i≤n，分别构建其不可区分关系集合U/IND(K_i)，集合U/IND(K_i)中的各元素是一个基于知识K_i的等价类X_Ki，即U/IND(K_i)＝{X_Ki(1),X_Ki(2),...}＝{X_Ki}，每个等价类X_Ki均是目标集合U的一个子集，即使得等价类X_Ki中任意两个目标x_a和x_b在知识K_i中任意属性c的取值均相同，即f(x_a,c)＝f(x_b,c)；

步骤4.6，判断知识计数变量：判断知识计数变量count_K是否小于等于知识数目n，如果是并且对应知识K_v的决策属性支撑矢量不存在，v＝count_K，则初始化知识K_v的决策属性支撑矢量，维度等于不可区分关系集合U/IND(d)大小，表示为零向量S_v＝{0,0,...,0}_|U/IND(d)|；如果是继续步骤4.7，否则跳至步骤4.13；

步骤4.9，等价类匹配判别：获取知识集合Ω中第count_K个知识K_v的第count_I个等价类X_Kv(count_I)，将等价类X_Kv(count_I)与目标类别d的不可区分关系集合U/IND(d)中第count_d个等价类X_d(count_d)进行比较，根据匹配阈值门限α计算两个等价类的匹配目标集合mapset和非匹配目标集合unmapset，匹配目标集合mapset为等价类X_Kv(count_I)与等价类X_d(count_d)的共有目标集合，非匹配目标集合unmapset为等价类X_Kv(count_I)除去匹配目标集合后剩余目标的集合，计算过程如公式(1)和(2)分别所示：

mapset＝X_Kv(count_I)∩X_d(count_d) (1)

unmapset＝X_Kv(count_I)-mapset (2)

Per＝Per+|mapset|/|X_d(count_d)| (3)；

步骤4.10，更新等价计数变量：将等价计数变量count_I增加1，即count_I＝count_I+1，返回步骤4.8；

步骤4.11，知识匹配判别：如果匹配比例标志Per≥α，判断知识K_v与类别d的第count_d个等价类X_d(count_d)相匹配，并更新知识K_v的决策属性支撑矢量S_v的第count_d位为匹配比例标志Per，否则，判断知识K_v与类别d的第count_d个等价类X_d(count_d)不匹配；

步骤4.12，更新知识计数变量：将知识计数变量count_K增加1，即count_K＝count_K+1，返回步骤4.6；

步骤4.13，更新决策计数变量：将决策计数变量count_d更新为count_d＝count_d+1，返回步骤4.4；

步骤4.15，输出优化知识集合：输出从知识集合Ω中选择出的p条知识及其对应决策属性支撑矢量构建优化知识集合KS＝{(K_u,S_u)}_1≤u≤p。

3.根据权利要求2所述的一种基于不可区分关系的计算机辅助决策系统知识选择方法，其特征在于，针对目标类别不可区分关系集合中每一元素均设置匹配比例标志，匹配程度越高，设置匹配比例标志越接近1；匹配程度越低，设置匹配比例标志越接近0。